基于背景知识和主动学习的文本挖掘技术研究

为了达成好的文本分类和文本挖掘效果,往往需要使用大量的标志数据.然而数据标志不但操作复杂,而且成本昂贵.为此,本文在基于支持向量机的分类技术框架下,在文本分类和文本挖掘中引入了未标志数据,具体的执行通过基于背景知识和基于主动学习两种方法展开.实验结果表明,基于背景知识的文本挖掘方法在基线分类器性能较强的情况下可以发挥优秀的文本挖掘性能,而基于主动学习的文本挖掘方法可以在一般的情况下就改善文本挖掘的性能指标.
文本挖掘 支持向量机 主动学习 背景知识
符保龙
柳州职业技术学院,广西 柳州,545006
国内会议
武汉
中文
1-9
2012-11-10(万方平台首次上网日期,不代表论文的发表时间)