会议专题

利用高斯分布生成数据对聚类算法的比较

聚类是数据挖掘中的一个重要研究课题,是数据挖掘的核心技术。聚类算法已被广泛深入的研究,其间产生了许多不同的聚类算法,这些算法适用于特定的问题及用户。为了更好的使用这些算法,人们已经提出了很多评价算法好坏的标准。从另外一个角度来评价聚类算法-利用分布间的覆盖率对算法进行比较。基于覆盖率和分布的几何特性可以生成高斯分布数据集,然后利用数据集来测试得到不同算法的适用性。

数据挖掘 聚类算法 覆盖率

孙浩军 孔令俊 刘志辉

河北大学数学与计算机学院 河北保定 071002

国内会议

2007年首届仪表、自动化与先进集成技术大会

重庆·云南丽江

中文

404-408

2007-12-07(万方平台首次上网日期,不代表论文的发表时间)