一种基于数据分布差异度的子空间聚类算法
随着聚类技术应用范围的不断扩大,传统的聚类方法已不能满足对高维数据的分析要求.对高维数据的聚类分析,要求算法不仅要发现簇,而且还要发现存在簇的子空间.使用子空间聚类策略,通过数据分布差异度的概念来描述子空间上数据分布的密集性,提出了一种新的子空间聚类算法SCDDD.该算法能够满足对高维数据的聚类分析要求,而且能够发现任意形状的簇.实验结果表明算法的聚类精度较高,算法时间随相关维度的增加基本呈线性增长.最后将SCDDD算法应用于一个真实的数据集Food,我们发现了有趣的簇和存在这些簇的子空间.
高维数据 子空间聚类 簇序 数据分布差异度 SCDDD算法 数据集Food
徐玉峰 周丽华 肖清
云南大学信息学院 昆明 650091
国内会议
桂林
中文
101-106
2008-10-24(万方平台首次上网日期,不代表论文的发表时间)