基于强化学习的出租车路线规划方法
出租车是人们日常生活中最常见的交通工具之一.近年来,随着打车软件的普及,越来越多的人从事出租车行业.如何在错综复杂的城市路线中选择最优路线一直是众多司机所考虑的问题,因为这关系收益的最大化.强化学习是一种试错学习,它在已有知识的基础上通过不断地尝试各种动作,得到相应的奖惩来不断地修正策略,最终找出最优策略.强化学习通过与环境的交互来找出能够得到最大奖励的策略,其中最常用的强化学习算法就是Q学习以及它的改进算法SARSA.通过对一种简单模拟路线的仿真实验,验证了两种算法在出租车路线规划应用中的可行性,并对其性能进行了分析.
出租车 路线规划 Q学习 SARSA算法
徐国权 罗倩 郭鹏飞
北京信息科技大学信息与通信工程学院 北京100101
国内会议
中国计算机用户协会网络应用分会2016年第二十届网络新技术与应用年会
杭州
中文
194-197,208
2016-11-01(万方平台首次上网日期,不代表论文的发表时间)