多人扩展式博弈问题中的虚拟遗憾最小化算法研究

摘要：

本文对多人扩展式博弈问题中虚拟遗憾最小化算法展开研究.针对该算法基于二人零和博弈的前提假设的应用局限性,提出了将其扩展应用于多人博弈问题的方法.本文给出了虚拟遗憾最小化算法在多人非合作零和博弈条件下的收敛性及收敛的纳什均衡偏移阈值证明.基于一种简化的德州扑克游戏——Pinea pple Poker,利用其三人非合作博弈的性质作为实验平台,提出了虚拟遗憾最小化方法在多人博弈问题中的应用及训练方法.最后,本文通过与Q-Learning和MCTS算法实现系统的比对实验验证了本文的研究成果的有效性.

关键词：多人扩展式博弈虚拟遗憾最小化算法纳什均衡

作者: 张加佳刘宏钱涛

作者单位: 北京大学深圳研究生院信息工程学院,广东深圳518055 深圳市逸风网络科技有限公司,广东深圳518055

会议类型: 国内会议

会议名称: 第十二届中国智能机器人大会

会议地点: 哈尔滨

会议语种:中文

页码: 534-539

在线出版日期: 2017-10-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

多人扩展式博弈问题中的虚拟遗憾最小化算法研究