一种基于Q学习的任务调度算法的改进研究
本文针对协同工作中的任务调度问题,提出了一种改进的基于模拟退火的Q学习算法。该算法通过引入模拟退火,并结合贪婪策略,以及在状态空间上的筛选判断,显著地提高了收敛速度,缩短了执行时间。最后与其它文献中相关算法的对比分析,验证了本改进算法的有效性。
任务调度 Q学习 强化学习 模拟退火 协同工作 贪婪策略
杜琳 石慧 刘晓平
合肥工业大学计算机与信息学院,安徽合肥 230009
国内会议
南宁
中文
236-240
2009-07-17(万方平台首次上网日期,不代表论文的发表时间)