会议专题

基于模糊数学规划的文本分类方法

文本分类一直是智能科学研究中的重要问题,它将未分类文本划分到相关的类别。然而,实际应用中的文本往往会与多个类别相关,因此,不能单纯地仅将其划分到一个类别。 本文针对这类问题,提出了基于模糊数学规划思想的分类方法,在预设的分类规则及参数的基础上,将文本散列到多个类别中,并给出其相关程度。该方法适用于对难以进行单一分类的文本,如跨专业领域的文本、新闻文本等进行分类。实验验证了该方法在处理综合类型文本方面的出色表现;同时,利用支持向量机和向量空间法,也证明了该方法在处理特征比较单一的文本方面,效果也没有降低太多,仍在可以接受的范围类。此外,该方法还可以挖掘出多个类别最容易产生交集的领域。

智能科学 数据挖掘 文本分类 模糊规划 计算机数学

张颖 王文杰 黄瑞 史忠植

中国科学院研究生院 100049

国内会议

中国人工智能学会第12届全国学术年会

哈尔滨

中文

272-277

2007-11-20(万方平台首次上网日期,不代表论文的发表时间)