基于多特征融合的中文关键词提取方法
关键词提取技术是文本分类、文本聚类、信息检索等技术的基础,在自然语言处理领域有着非常广泛的应用。本文结合传统关键词提取方法的特点,提出一种基于多特征融合的中文关键词提取方法。该方法通过结合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。
多特征 特征融合 关键词提取
张建娥
榆林学院图书馆 陕西省榆林市崇文路榆林学院,陕西榆林 719000
国内会议
云南腾冲
中文
209-214
2012-11-26(万方平台首次上网日期,不代表论文的发表时间)