一种中文网页的聚类算法
本文提出了一种考虑网页内容与网页之间链接的新聚类算法.在给出了一种新的网页表示方法后,着重讨论了网页间距离度量的方法.然后提出了一种新的聚类算法对网页进行聚类.在给定聚类半径后,任何网页可以通过比较其与聚类中心的距离决定其类别的归属.实验表明该算法不仅具有较高的聚类精确度,而且具有较高的聚类效率,较适合于Internet网上数据量大的特点.
中文网页 聚类算法 网页内容
李晓黎 史忠植
中国科学院计算技术研究所,北京,10080
国内会议
中国科学院计算技术研究所第六届计算机科学与技术研究生学术讨论会
大连
中文
445-450
2000-07-01(万方平台首次上网日期,不代表论文的发表时间)