基于Q-学习的进化博弈决策模型
基于Q-强化学习算法,建立了进化博弈中代理人的决策模型.考虑到强化学习算法不需要建立环境模型,可以用于不完全、不确定信息问题中,将Q-强化学习算法引入到进化博弈中,研究了进化博弈中的两种Q-学习决策模型:单代理人Q-学习决策模型和多代理人Q-学习决策模型,并针对不同结构的进化博弈选择不同的决策模型和算法进行了讨论.仿真算例的结果说明基于Q-学习的决策模型能指导代理人学习、选择最优策略.
进化博弈 强化学习算法 Q-学习 决策模型
刘伟兵 王先甲
武汉大学系统工程研究所,武汉 430072 武汉大学系统工程研究所,武汉 430072 武汉科技大学理学院,武汉 430081
国内会议
南昌
中文
205-210
2008-10-22(万方平台首次上网日期,不代表论文的发表时间)