会议专题

文本分类中一种基于词类间概率分布的特征选择算法

特征选择在文本自动分类中扮演了比较关键的角色,本文在词的类间概率分布基础上,使用分布函数的区分度和相似度,将噪声词的去除和保留词的聚类相结合,提出了一种新的文本特征选择算法,实验结果表明,该算法具有较好的性能效果.

文本分类 特征提取 类间分布 词聚类 区分度 相似度

邢昊 张凌

华南理工大学信息网络工程研究中心(广州)

国内会议

全国搜索引擎和网上信息挖掘学术讨论会

北京

中文

94-98

2003-03-01(万方平台首次上网日期,不代表论文的发表时间)