会议专题

面向多源垃圾信息过滤的直推式迁移学习算法

由于电子邮件、即时聊天、手机短信等信息交互中的垃圾信息影响正常的信息交流,因此多源垃圾信息过滤成为了目前信息过滤领域的研究重点。许多经典的垃圾信息过滤算法都是针对某种应用而言,很难适应多源垃圾信息过滤的新问题。本文提出了一种面向多源垃圾信息过滤的直推式迁移学习算法,其基本思想是采用迁移学习算法,把已有的过滤方法、标注语料用到新的信息过滤问题当中,解决那些没有标注样本的垃圾信息过滤问题。迁移学习时采用直推式学习算法充分利用未标注样本包含的知识。通过与经典算法实验比较,验证了本算法能够获得更好的效果,并且从实验数据分析得到了若干有益的结论,为进一步的研究奠定了基础。

信息过滤 多源垃圾信息 迁移学习 直推式学习

刘伍颖 王挺 罗准辰

国防科技大学计算机学院 湖南长沙 410073

国内会议

2008中国计算机大会

西安

中文

32-42

2008-09-25(万方平台首次上网日期,不代表论文的发表时间)