会议专题

基于Q-学习的进化博弈决策模型

基于Q-强化学习算法,建立了进化博弈中代理人的决策模型.考虑到强化学习算法不需要建立环境模型,可以用于不完全、不确定信息问题中,将Q-强化学习算法引入到进化博弈中,研究了进化博弈中的两种Q-学习决策模型:单代理人Q-学习决策模型和多代理人Q-学习决策模型,并针对不同结构的进化博弈选择不同的决策模型和算法进行了讨论.仿真算例的结果说明基于Q-学习的决策模型能指导代理人学习、选择最优策略.

进化博弈 强化学习算法 Q-学习 决策模型

刘伟兵 王先甲

武汉大学系统工程研究所,武汉 430072 武汉大学系统工程研究所,武汉 430072 武汉科技大学理学院,武汉 430081

国内会议

中国系统工程学会第十五届年会

南昌

中文

205-210

2008-10-22(万方平台首次上网日期,不代表论文的发表时间)