基于空间覆盖关系相似性度量的层次聚类算法
鉴于传统的基于距离的相似性度量不适用于高维的、包含混合类型的数据集,本文提出一种新颖的基于空间覆盖思想的相似性度量方法,它利用数据在多维空间中的相互覆盖关系来衡量数据之间的相似性,并在此基础上实现了基于该相似性度量的层次聚类算法PCHC.该算法适用于高维数据集,能够对任意形状的簇进行聚类,无论对于数值型属性,分类型属性还是二值属性的数据都是一个有效的聚类方法.在一些公共数据集上的实验结果也验证了本方法的有效性。
空间覆盖 相似性度量 层次聚类 混合类型数据集 PCHC
陈红 郭躬德 黄彧 黄添强
福建师范大学数学与计算机科学学院,福州 350007;福建师范大学网络安全与密码技术重点实验室,福州 350007
国内会议
第八届中国Rough集与软计算、第二届中国Web智能、第二届中国粒计算联合会议(CRSSC-CWI-CGrC”2008)
北京
中文
258-261
2008-08-01(万方平台首次上网日期,不代表论文的发表时间)