会议专题

基于遗传算法的中文WEB文档分类研究

文档分类是管理大规模文档信息的一种有效方法,而文档属性选择是文档分类性能的关键.本文分别使用互信息法和遗传算法进行文档属性选择,并用KNN算法进行分类性能比较.初步实验结果表明遗传算法方法是可行、有效的.

文档分类 文档属性选择 N-gram信息 互信息法 遗传算法 KNN算法

胡江滔 周水庚 周傲英

复旦大学计算机系统数据库研究中心(上海)

国内会议

第18届全国数据库学术会议

南宁

中文

113-116

2001-05-01(万方平台首次上网日期,不代表论文的发表时间)