核密度估计及其在聚类算法构造中的应用
本文通过对核密度估计理论及其快速分箱核近似方法的讨论,给出分箱近似密度估计相对于核密度估计的均方误差界,提出基于网格数据重心的分箱核近似方法,在不改变计算复杂度的条件下,基于网格数据重心的分箱核近似密度函数计算可以有效地降低近似误差,这一思想方法对于构造高效大规模数据聚类分析算法具有指导意义,揭示了基于网格上密度函数近似的聚类算法与核密度估计理论之间的关系。
核密度估计 分箱规则 聚类算法 数理统计 数据集 密度函数 数据挖掘
李存华 孙志挥 陈耿 胡云
东南大学计算机科学与工程系,南京,210018;淮海工学院计算机科学系,连云港,222005 东南大学计算机科学与工程系,南京,210018
国内会议
厦门
中文
106-113
2004-10-14(万方平台首次上网日期,不代表论文的发表时间)