强化学习研究进展及其在电脑围棋的应用

摘要：

在取得电脑围棋突破的AlphaGo系统中,强化学习起到了重要作用.本报告简要介绍国内外强化学习的研究进展,重点关注强化学习中的状态表示、奖赏设计、策略搜索、终身学习以及在电脑围棋上的应用,并展望未来的发展趋势.

关键词：电脑围棋强化学习状态表示奖赏设计策略搜索终身学习

作者: 俞扬高阳

作者单位: 南京大学计算机科学与技术系,南京 CCF人工智能与模式识别专业委员会

会议类型: 国内会议

会议地点: 太原

会议语种:中文

页码: 239-262

在线出版日期: 2016-10-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题