基于粗糙集理论和BP神经网络的文本自动分类方法研究
结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法.首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类.这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点.试验结果表明,与朴素贝叶斯、SVM、kNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本.
文本分类 粗糙集 神经网络 属性约简 VSM
白如江 王效岳
山东理工大学,图书馆,山东,淄博,255049
国内会议
第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)
济南
中文
70-75
2006-07-21(万方平台首次上网日期,不代表论文的发表时间)