会议专题

基于粗糙集理论和BP神经网络的文本自动分类方法研究

结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法.首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类.这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点.试验结果表明,与朴素贝叶斯、SVM、kNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本.

文本分类 粗糙集 神经网络 属性约简 VSM

白如江 王效岳

山东理工大学,图书馆,山东,淄博,255049

国内会议

第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)

济南

中文

70-75

2006-07-21(万方平台首次上网日期,不代表论文的发表时间)