会议专题

强化学习研究进展及其在电脑围棋的应用

在取得电脑围棋突破的AlphaGo系统中,强化学习起到了重要作用.本报告简要介绍国内外强化学习的研究进展,重点关注强化学习中的状态表示、奖赏设计、策略搜索、终身学习以及在电脑围棋上的应用,并展望未来的发展趋势.

电脑围棋 强化学习 状态表示 奖赏设计 策略搜索 终身学习

俞扬 高阳

南京大学计算机科学与技术系,南京 CCF人工智能与模式识别专业委员会

国内会议

CCF2015-2016中国计算机科学技术发展报告会

太原

中文

239-262

2016-10-01(万方平台首次上网日期,不代表论文的发表时间)