高维数据聚类中相似性度量方法的研究
将低维空间中的相似性度量方法应用于高维空间时,由于高维数据存在着稀疏性和空空间现象的特点,高维数据对象之间距离的对比性不复存在。研究适合于高维空间的相似性度量方法已成为高维数据挖掘的主要方向之一。通过对传统相似性度量方法在高维空间中的不适应性进行了分析和总结,在基于维度的思想之上,结合特征选择算法,提出一种新的高维数据的相似性度量方法,并且对其有效性进行分析。通过数值仿真实验, 论证了该相似性度量方法在高维数据聚类中的合理性和有效性。
高维数据 相似性度量 特征选择 数据聚类
潘国涛 黄德才
浙江工业大学计算机学院,杭州,中国,310023
国内会议
澳门
中文
63-67
2011-07-22(万方平台首次上网日期,不代表论文的发表时间)