一个用于高维数据聚类的通用框架模型
在很多领域中,由于数据挖掘的数据集通常有较高的维度.现有大多数聚类算法在较低维度虽然效果很好,但是,维度较高时,性能就会大打折扣,因为它们的复杂度随着维度的增加而成指数级增长.为了解决这个问题,我们提出了一个用于高维数据聚类的通用框架模型.一般常用的聚类算法,与该模型结合之后,就能够有效地用于高维数据的聚类分析.在该模型中,把高维聚类分解成若干个一维聚类或者二维聚类.每个阶段只考虑其中一个维度或者两个维度.经过多个阶段的聚类,来实现高维数据的聚类分析.这样,普通的低维聚类算法就能够用来处理高维数据集.此外,由于在每一次聚类过程中只考虑其中一个维度或两个维度,那么不同类型的属性就可以用不同的聚类算法来处理,从而对混合型的数据集也能够很好地进行聚类分析.最后,我们通过实验对该模型进行了验证.
数据挖掘 聚类 高维数据集 聚类框架模型
赵艳厂 宋俊德
北京邮电大学电子工程系(北京)
国内会议
武汉
中文
418-423
2002-12-01(万方平台首次上网日期,不代表论文的发表时间)