会议专题

重复性混合策略博弈的学习

在博弈中,每个参与人都尽量使自己的期望效用最大化,如何做到期望效用最大化取决于参与人认为其对手将如何行动,博弈学习就是研究如何形成这些预期.本文主要研究Ishibuchi”4”提出的企业选择市场模型,并且采用混合策略进行学习,属于重复性同时行动博弈.学习算法的调整过程通过假设每一阶段参与人选择一种相对于前一阶段是最优反应的策略而得到.重复性基于混合策略的企业选择市场模型的学习算法使用投入的市场数目作为参数,通过实验表明,学习算法使平均效用得到了提高.

重复博弈 混合策略 博弈学习 企业 市场 学习算法

孔怡青 陈岩

江南大学,信息学院,无锡,214122 复旦大学,管理学院,上海,200433

国内会议

信息系统协会中国分会第一届学术年会

北京

中文

519-523

2005-11-04(万方平台首次上网日期,不代表论文的发表时间)