会议专题

一个用于高维数据聚类的通用框架模型

在很多领域中,由于数据挖掘的数据集通常有较高的维度.现有大多数聚类算法在较低维度虽然效果很好,但是,维度较高时,性能就会大打折扣,因为它们的复杂度随着维度的增加而成指数级增长.为了解决这个问题,我们提出了一个用于高维数据聚类的通用框架模型.一般常用的聚类算法,与该模型结合之后,就能够有效地用于高维数据的聚类分析.在该模型中,把高维聚类分解成若干个一维聚类或者二维聚类.每个阶段只考虑其中一个维度或者两个维度.经过多个阶段的聚类,来实现高维数据的聚类分析.这样,普通的低维聚类算法就能够用来处理高维数据集.此外,由于在每一次聚类过程中只考虑其中一个维度或两个维度,那么不同类型的属性就可以用不同的聚类算法来处理,从而对混合型的数据集也能够很好地进行聚类分析.最后,我们通过实验对该模型进行了验证.

数据挖掘 聚类 高维数据集 聚类框架模型

赵艳厂 宋俊德

北京邮电大学电子工程系(北京)

国内会议

中国计算机学会网络与数据通信学术会议

武汉

中文

418-423

2002-12-01(万方平台首次上网日期,不代表论文的发表时间)