会议专题

基于数值型和分类型混合属性数据集的聚类算法研究

介绍了数值型和分类型属性的概念以及处理分类型属性的方法,详细探讨了一种处理分类型和数值型的混合型属性数据集的算法(k-pmtotypes);在此算法的基础上,提出了一种基于分组选择法确定初始点的改进算法;并使用实际数据集对改进算法进行了测试,用详尽的数据证明改进算法的正确性和较强的可伸缩性,最后指出了聚类分析技术的进一步研究的方向.

数值型 分类型 混合型属性数据集 分组选择法 k-prototypes 聚类算法

曹露燕 蒋晓云 孟凡荣

中国矿业大学计算机学院,江苏 徐州 221008

国内会议

2006年全国数学技术应用科学学术论坛

昆明

中文

209-214

2006-03-01(万方平台首次上网日期,不代表论文的发表时间)