基于Q-学习的进化博弈决策模型

摘要：

基于Q-强化学习算法,建立了进化博弈中代理人的决策模型.考虑到强化学习算法不需要建立环境模型,可以用于不完全、不确定信息问题中,将Q-强化学习算法引入到进化博弈中,研究了进化博弈中的两种Q-学习决策模型:单代理人Q-学习决策模型和多代理人Q-学习决策模型,并针对不同结构的进化博弈选择不同的决策模型和算法进行了讨论.仿真算例的结果说明基于Q-学习的决策模型能指导代理人学习、选择最优策略.

关键词：进化博弈强化学习算法 Q-学习决策模型

作者: 刘伟兵王先甲

作者单位: 武汉大学系统工程研究所,武汉 430072 武汉大学系统工程研究所,武汉 430072 武汉科技大学理学院,武汉 430081

会议类型: 国内会议

会议名称: 中国系统工程学会第十五届年会

会议地点: 南昌

会议语种:中文

页码: 205-210

在线出版日期: 2008-10-22（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于Q-学习的进化博弈决策模型