会议专题

一种文档聚类新方法

该文提出一种文档聚类新方法。其基本思想是利用数据挖掘,发现文档库中针对文档或词的关联规则,然后利用超图划分算法对关联规则超图进行划分,从而实现文档聚类。文中给出了两种具体的实现算法:一种是利用倒排文件进行文档关联规则挖掘;另一种则是基于文档向量模型实现词(组)关联规则发现。

关联规则 文档聚类 向量模型 倒排文件 超图划分

周水庚 孙敬宇 胡运发

大学计算机科学系,上海(国际)数据库研究中心

国内会议

第十六届全国数据库学术会议

兰州

中文

334~339

1999-08-01(万方平台首次上网日期,不代表论文的发表时间)