会议专题

基于强化学习的多成品率衰变设备预防维修策略

在制造系统的生产过程中,生产设备状态的衰变会降低产品的质量水平,导致多成品率质量问题.本文针对此类多成品率衰变设备,建立半马氏决策问题模型,用产品质检信息作为系统的观测状态,考虑两类检测误差及收益和成本参数,通过一种基于平均收益率的强化学习算法——SMART算法,学习对应每组系统质量状态的最优维修策略,从而最大化系统的平均收益率.通过算例分析,在不同的衰变模式和检测误差水平下,比较了基于SMART算法的预防维修策略和定期预防维修策略.

制造系统 多成品率衰变设备 预防维修 半马氏决策问题模型 强化学习算法

杨智 祁超

华中科技大学系统工程研究所,湖北武汉430074

国内会议

第十一届全国青年系统科学与管理科学学术会议暨第七届物流系统工程学术研讨会

武汉

中文

404-411

2011-09-24(万方平台首次上网日期,不代表论文的发表时间)