基于模糊-粗糙集的文本分类方法

摘要：

在文本分类过程中,类别之间的重叠以及标志类别属性的不足会导致类别的边界之间出现模糊不确定性和粗糙不确定性,而传统的k-近邻方法无法解决这一问题;同时,在传统的k-近邻方法以及其他一些改进的k-近邻方法中,最优k值的选取需要通过训练得到.文中借助模糊-粗糙集理论来改进传统的k-近邻方法,并使用基于距离的邻域空间,以不经训练地确定适宜每个待分类文本的k值,最后将所提方法和其他一些k-近邻方法进行了实验比较,结果表明模糊-粗糙集方法能够在一定程度上提高分类的精度和召回率.

关键词：文本分类 k近邻分类模糊-粗糙集

作者: 付雪峰王明文

作者单位: 江西师范大学计算机信息工程学院(江西南昌)

会议类型: 国内会议

会议名称: 第二届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2004)

会议地点: 广州

会议语种:中文

页码: 73-76

在线出版日期: 2004-11-12（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于模糊-粗糙集的文本分类方法