会议专题

基于空间覆盖关系相似性度量的层次聚类算法

鉴于传统的基于距离的相似性度量不适用于高维的、包含混合类型的数据集,本文提出一种新颖的基于空间覆盖思想的相似性度量方法,它利用数据在多维空间中的相互覆盖关系来衡量数据之间的相似性,并在此基础上实现了基于该相似性度量的层次聚类算法PCHC.该算法适用于高维数据集,能够对任意形状的簇进行聚类,无论对于数值型属性,分类型属性还是二值属性的数据都是一个有效的聚类方法.在一些公共数据集上的实验结果也验证了本方法的有效性。

空间覆盖 相似性度量 层次聚类 混合类型数据集 PCHC

陈红 郭躬德 黄彧 黄添强

福建师范大学数学与计算机科学学院,福州 350007;福建师范大学网络安全与密码技术重点实验室,福州 350007

国内会议

第八届中国Rough集与软计算、第二届中国Web智能、第二届中国粒计算联合会议(CRSSC-CWI-CGrC”2008)

北京

中文

258-261

2008-08-01(万方平台首次上网日期,不代表论文的发表时间)