多示例学习中的包生成策略研究
在多示例学习中,训练样本是由多个示例组成的包,包是有概念标记的,但示例本身却没有概念标记。如果一个包中至少包含一个正例,则该包是一个正包,否则即为反包。学习的目的是预测新包的类别。由于多示例学习具有独特的性质,目前被认为是一种新的学习框架。而以往的工作重心主要放在多示例学习算法上,而忽略了分包这一重要的过程。本文比较了一些以往的分包策略并提出了一种新的文本分包的策略,并在文本数据和图像数据上分别作了大量实验,结果显示分包策略的不同在很大程度上能影响多示例学习算法的精度。并在实验结果的基础上提出了一些好的分包策略与学习算法的搭配。
示例学习算法 包生成策略
郏夹 曾繁江 周志华
南京大学 计算机软件新技术国家重点实验室,江苏 南京 210046
国内会议
长春
中文
1-6
2012-08-04(万方平台首次上网日期,不代表论文的发表时间)