基于内省推理的多agent在线学习新方法

(0)

摘要：

多agent环境下agent的最优策略取决于其他agent的策略,这使得学习目标不易被清晰的定义.基于客观观察行为建模的方法并不保证学习策略最终收敛.本文提出了基于内省推理方法的多智能体环境下智能体高效在线学习方法,将基于对手模型的客观观察行为与基于换位思考推理的主观意图推测结合起来.仿真结果证实了算法在电子市场定价中的有效性.

关键词：多智能体在线学习内省推理学习策略

作者: 韩伟王成道陈优广

作者单位: 华东师范大学计算机系,上海,20062

会议类型: 国内会议

会议名称: 2005年中国模糊逻辑与计算智能联合学术会议

会议地点: 深圳

会议语种:中文

页码: 115-120

在线出版日期: 2005-04-16（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于内省推理的多agent在线学习新方法