一种基于密度单元的聚类算法
随着信息技术的迅速发展,需要分析和管理的数据量迅速增大,这种趋势必然地渗透到了聚类分析领域。聚类分析是数据挖掘技术中重要的组成部分,从技术角度讲,它的主要目的是将数据空间中的数据点划分到若干个类中,其中将距离相近的数据点划分到相同的类中,而将距离较远的数据点划分到不同的类中。本文提出一种新颖而高效的聚类算法 SECDU(Self-Expanded Clustering Algorithm based on DensityUnits)。算法首先将数据空间等分为若干个密度单元,再根据数据点的位置将其划分到所属的密度单元中,然后针对密度单元进行聚类。聚类首先产生在数据最密集的区域,然后向周围低密度区域延伸。聚类在延伸的过程中体积逐渐增大,密度逐渐减小,直到聚类的密度达到一个事先规定的限度时为止。算法在保留原有数据分布特性的前提下利用密度单元对数据进行压缩,在保证具有较好效果的前提下大幅度地提高了聚类的速度。
聚类分析 密度单元 数据空间
陈衡岳 于勇前 王国仁 乔百友
东北大学信息与工程学院 沈阳110004
国内会议
武汉
中文
2005-10-13(万方平台首次上网日期,不代表论文的发表时间)