分批补料发酵过程多目标优化的分布式强化学习策略

摘要：

发酵过程优化问题通常包含有互相冲突的多重优化目标,另外反应本身具有诸多复杂性。提出一种基于Pareto的分布式Q学习多目标策略,用以求解赖氨酸分批补料发酵过程流加速率轨迹的Pareto最优解&该策略中，学习算法和Pareto排序法将结合来产生非支配解集，并使之逼近真实的Pareto前沿＃利用奖赏机制来描述多重目标之间的关系,并同时使用多组含有随机初始值的agent共同作用改善搜索能力。将所提出的方法应用于赖氨酸分批补料发酵过程的优化中，并与粒子群优化进行了对比,验证策略的性能。

关键词： Q学习算法多目标优化赖氨酸分批补料发酵

作者: 李大字宋天恒靳其兵谭天伟

作者单位: 北京化工大学信息科学与技术学院北京化工大学生命科学与技术学院,北京 100029

会议类型: 国内会议

会议名称: 第二十二届中国过程控制会议

会议地点: 南京

会议语种:中文

页码: 255-259

在线出版日期: 1900-01-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

分批补料发酵过程多目标优化的分布式强化学习策略