一种高效的基于排序二叉树的数据流挖掘算法
数据流挖掘分类技术是数据挖掘领域非常具有挑战性的工作.VFDT利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决策树的问题;VFCTc改进了VFDT,使其能够处理连续属性。基于VFDT和VFDTc,我们设计并实现了一种基于排序二叉树的高效算法CFDT-BSTree.该算法解决了VFDTc中存在的问题,提高了样本动态插入和最佳划分节点选取的速度,从而提高了分类速度.实验结果表明,VFDT-BSTree在保持决策树大小和分类精度不变的基础上,执行时间相比VFDT平均减少32.25%,比VFDTc平均减少24.96%.
排序二叉树 连续属性 数据挖掘 挖掘算法 分类速度
何昭青
湖南第一师范学院信息技术系,湖南,长沙,410205;国防科技大学计算机学院,湖南,长沙,410073
国内会议
西安
中文
151-154
2008-09-19(万方平台首次上网日期,不代表论文的发表时间)