最大目标频繁模式挖掘算法研究
传统的频繁模式挖掘算法往往会得到成百上千的结果模式,面对繁多的频繁模式用户通常要经过”二次挖掘”才能得到有用的目标模式,怎样根据用户需求直接挖掘用户感兴趣的目标模式是本文的研究目标.本文在FP-树的基础上设计了紧缩的、非冗余的TFP-树,它能有效过滤与目标模式无关的项和事务,而仅保留与目标模式相关的信息,缩小TFP-树的大小规模.同时根据TFP-树的规律和特点,我们设计了最大目标频繁模式挖掘算法,算法的结果模式具有以下两个特点:(1)满足用户需求的目标模式;(2)最大模式.我们的实验结果验证了TFP-树算法是有效的,而且显著改善了FP-树算法的性能.
数据挖掘 频繁模式 最大目标频繁模式 TFP-树 FP-树 机器学习
李清勇 秦亮曦 施智平 史忠植
中科院计算所智能信息处理重点实验室(北京);中国科学院研究生院(北京)
国内会议
北京
中文
3-9
2003-11-01(万方平台首次上网日期,不代表论文的发表时间)