频繁模式溯源
数据起源是关于数据来源、转换和更新过程的研究。基于频繁模式挖掘的性质和特点,提出了FP+树来记录频繁模式来源。给出了频繁模式溯源的相关理论和证明,根据不同追溯机制提出了三种频繁模式溯源方法,并对方法的正确性和执行代价给出了理论证明和推导。在进行频繁模式挖掘时,在不增加额外负担的情况下实现了频繁模式溯源。针对条件FP+树结构特点和频繁模式性质,提出了采用α-剪枝求解条件FP+树的投影操作,加快了频繁模式挖掘和数据溯源的执行效率。实验结果显示,采用基于FP+树的频繁模式溯源方法,可以高效地实现频繁模式溯源,并且条件FP+树的α-剪枝策略的有效性得到验证。
数据库 频繁模式 挖掘算法 α-剪枝策略
WANG Bin 王斌 LIU Xiangyu 刘向宇 YANG Xiaochun 杨晓春 WANG Guoren 王国仁
School of Information Science and Engineering, Northeastern University, Shenyang 110819, China 东北大学信息科学与工程学院,沈阳110819
国内会议
合肥
中文
684-697
2012-10-01(万方平台首次上网日期,不代表论文的发表时间)