会议专题

基于最优二叉树原理的自动聚类的设计

本文以最优二叉树理论为基础,根据特征项加权形成辅助样本,并借助辅助样本和著名的Euclidean距离,提出自动聚类算法,克服了传统聚类形状单一,难以合并和分解等问题,从而提高了聚类质量。在计算聚类样本的相似度时,比一般统计模型考虑更丰富的信息(数值,非数值及混合型),并用熵理论和最优二叉树的层次来正确地选择合并或分解问题,进行自动动态聚类。第2部分是基于最优二叉树的自动聚类算法,第3部分是聚类结果的评价,第4部分是试验和算法分析,第5部分是讨论。

自动聚类 最优二叉树理论 聚类质量

康海燕 李彦芳 张锋 刘小明

北京理工大学信息学院计算机系,北京,100081;河北农业大学信息学院,保定,071001 石家庄经济学院公共管理学院,石家庄,050031 北京理工大学信息学院计算机系,北京,100081

国内会议

第二十一届中国数据库学术会议

厦门

中文

222-224

2004-10-14(万方平台首次上网日期,不代表论文的发表时间)