基于模糊数学规划的文本分类方法

摘要：

文本分类一直是智能科学研究中的重要问题，它将未分类文本划分到相关的类别。然而,实际应用中的文本往往会与多个类别相关,因此,不能单纯地仅将其划分到一个类别。本文针对这类问题，提出了基于模糊数学规划思想的分类方法,在预设的分类规则及参数的基础上,将文本散列到多个类别中,并给出其相关程度。该方法适用于对难以进行单一分类的文本,如跨专业领域的文本、新闻文本等进行分类。实验验证了该方法在处理综合类型文本方面的出色表现；同时,利用支持向量机和向量空间法,也证明了该方法在处理特征比较单一的文本方面,效果也没有降低太多,仍在可以接受的范围类。此外,该方法还可以挖掘出多个类别最容易产生交集的领域。

关键词：智能科学数据挖掘文本分类模糊规划计算机数学

作者: 张颖王文杰黄瑞史忠植

作者单位: 中国科学院研究生院 100049

会议类型: 国内会议

会议名称: 中国人工智能学会第12届全国学术年会

会议地点: 哈尔滨

会议语种:中文

页码: 272-277

在线出版日期: 2007-11-20（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于模糊数学规划的文本分类方法