会议专题

一种基于教学模型的协同训练方法

  在很多实际问题中,很容易得到大量未标记数据而较难获取数据的标记;所以半监督学习在过去的十多年中得到了很大的关注。基于不一致性的半监督学习是其中一种十分重要的风范,主要表现为生成多个分类器从而在每一轮中互相对未标记数据进行标记来增大训练数据集,协同训练是其代表方法。至今为止,大部分协同训练方法在选择未标记示例来增加训练集的时候只考虑预测学习器的置信度,而忽视了另一个学习器的需求。本文受到真实教学系统的启发,提出了一种针对协同训练的教学模型TaLe,其中预测学习器被看作“教”者,而另一方被视为“学”者。针对协同训练双方特定的差异性条件,本文基于教学模型给出了一种新的协同训练方法CoSnT,同时考虑了“教”的置信度和“学”的需求度。直观上来讲,这一新方法能够加快协同训练的收敛速度。通过实验测试发现CoSnT不仅在收敛效率上,在性能上也优于标准的协同训练算法(只考虑置信度)和CoS算法(只考虑需求度)。

半监督学习 不一致性 协同训练 教学模型TaLe CoSnT 置信度 需求度

胡菊花 姜远 周志华

南京大学 计算机软件新技术国家重点实验室,江苏 南京 210046

国内会议

第四届中国Agent理论与应用学术会议

长春

中文

1-7

2012-08-04(万方平台首次上网日期,不代表论文的发表时间)