会议专题

一种适合MMOG的强化学习方法

提出了一种适合MMOG的强化学习算法,算法中NPC(Non PlayerCharacter)选择的策略是基于对其他NPC选择的策略的信任基础上,不同于现有的大部分算法是基于对行动的信任上。 该算法只记录NPC学习失败的情况,由于失败的情况要比成功的情况少很多,历史知识空间会显著降低,有效地提高了算法的效率;同时,该算法使用历史记录来对NPC学习的动作进行评估,进一步提高了算法的效率。最后,通过坦克大战游戏进行仿真,验证了这种学习算法是一种高效、快速的学习方法,并且该算法可以很好地适用于MMOG中NPC学习问题。

MMOG 强化学习 Q学习 策略信任

王洪彦

沈阳航空工业学院 计算机学院,沈阳 110136

国内会议

第五届中国软件工程大会

北京

中文

276-278

2008-11-15(万方平台首次上网日期,不代表论文的发表时间)