基于CMAC网络强化学习的群控电梯调度方法
群控电梯调度系统是一个高维连续状态空间、动态离散事件系统.本文介绍了强化学习以学习到最优策略为目标,通过函数估计解决连续状态空间问题,将CMAC网络的强化学习函数估计技术应用与电梯群控系统,实验表明它能有效地减少乘客等待时间,提高电梯调度的性能,并相比基于BP神经网络的强化学习电梯调度算法具有更优的性能.
群控电梯调度 强化学习 函数估计 神经网络 CMAC网络
胡景凯 高阳
南京大学软件新技术国家重点实验室,210093
国内会议
武汉
中文
472-476
2005-09-20(万方平台首次上网日期,不代表论文的发表时间)