基于模糊数学规划的文本分类方法
文本分类一直是智能科学研究中的重要问题,它将未分类文本划分到相关的类别。然而,实际应用中的文本往往会与多个类别相关,因此,不能单纯地仅将其划分到一个类别。 本文针对这类问题,提出了基于模糊数学规划思想的分类方法,在预设的分类规则及参数的基础上,将文本散列到多个类别中,并给出其相关程度。该方法适用于对难以进行单一分类的文本,如跨专业领域的文本、新闻文本等进行分类。实验验证了该方法在处理综合类型文本方面的出色表现;同时,利用支持向量机和向量空间法,也证明了该方法在处理特征比较单一的文本方面,效果也没有降低太多,仍在可以接受的范围类。此外,该方法还可以挖掘出多个类别最容易产生交集的领域。
智能科学 数据挖掘 文本分类 模糊规划 计算机数学
张颖 王文杰 黄瑞 史忠植
中国科学院研究生院 100049
国内会议
哈尔滨
中文
272-277
2007-11-20(万方平台首次上网日期,不代表论文的发表时间)