会议专题

基于模糊强化学习的电子市场动态定价

本文以电子市场智能定价问题为研究背景,提出了基于模糊推理的多智能体强化学习算法(FI-MARL)。在马尔科夫博弈学习框架下,将领域知识初始化为一个模糊规则集合,智能体基于模糊规则选择动作,并采用强化学习来强化模糊规则。该方法有效融合了应用背景的领域知识,充分利用了样本信息并降低了学习空间维数,从而增强了在线学习性能。在电子市场定价的对比实验中,智能体在合作还是竞争的问题上表现出较为长远的智能行为,提高了平均定价收益。

电子市场 商品定价 机器学习 模糊推理 定价收益

韩伟

南京财经大学信息工程学院 南京 210046

国内会议

第七届中国管理科学与工程论坛

武汉

中文

1-8

2009-11-27(万方平台首次上网日期,不代表论文的发表时间)