基于背景知识和主动学习的文本挖掘技术研究

摘要：

为了达成好的文本分类和文本挖掘效果,往往需要使用大量的标志数据.然而数据标志不但操作复杂,而且成本昂贵.为此,本文在基于支持向量机的分类技术框架下,在文本分类和文本挖掘中引入了未标志数据,具体的执行通过基于背景知识和基于主动学习两种方法展开.实验结果表明,基于背景知识的文本挖掘方法在基线分类器性能较强的情况下可以发挥优秀的文本挖掘性能,而基于主动学习的文本挖掘方法可以在一般的情况下就改善文本挖掘的性能指标.

关键词：文本挖掘支持向量机主动学习背景知识

作者: 符保龙

作者单位: 柳州职业技术学院,广西柳州,545006

会议类型: 国内会议

会议名称: 2012年第二届全国现代制造集成技术学术会议

会议地点: 武汉

会议语种:中文

页码: 1-9

在线出版日期: 2012-11-10（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于背景知识和主动学习的文本挖掘技术研究