强化学习研究进展及其在电脑围棋的应用
在取得电脑围棋突破的AlphaGo系统中,强化学习起到了重要作用.本报告简要介绍国内外强化学习的研究进展,重点关注强化学习中的状态表示、奖赏设计、策略搜索、终身学习以及在电脑围棋上的应用,并展望未来的发展趋势.
电脑围棋 强化学习 状态表示 奖赏设计 策略搜索 终身学习
俞扬 高阳
南京大学计算机科学与技术系,南京 CCF人工智能与模式识别专业委员会
国内会议
太原
中文
239-262
2016-10-01(万方平台首次上网日期,不代表论文的发表时间)