会议专题

基于CMAC网络强化学习的群控电梯调度方法

群控电梯调度系统是一个高维连续状态空间、动态离散事件系统.本文介绍了强化学习以学习到最优策略为目标,通过函数估计解决连续状态空间问题,将CMAC网络的强化学习函数估计技术应用与电梯群控系统,实验表明它能有效地减少乘客等待时间,提高电梯调度的性能,并相比基于BP神经网络的强化学习电梯调度算法具有更优的性能.

群控电梯调度 强化学习 函数估计 神经网络 CMAC网络

胡景凯 高阳

南京大学软件新技术国家重点实验室,210093

国内会议

第十一届中国人工智能学术年会

武汉

中文

472-476

2005-09-20(万方平台首次上网日期,不代表论文的发表时间)