会议专题

流数据中一种高效剪枝的频繁序列挖掘算法

序列模式挖掘就是在时序数据库中挖掘相对时间或其他模式出现频率高的模式.序列模式发现是最重要的数据挖掘任务之一,并有着广阔的应用前景.针对静态数据库,序列模式挖掘已经被深入的研究.近年来,出现了一种新的数据形式:数据流.针对基于数据流的序列模式挖掘的研究还不是十分深入.提出一个有效的基于数据流的挖掘频繁序列模式的算法SSPM,利用到2个数据结构(F-list和Ta-tree)来处理基于数据流的序列模式挖掘的复杂性问题.SSPM的优点是可以最大限度地降低负正例的产生,实验表明SSPM具有较高的准确率.

频繁序列 数据流挖掘 高效剪枝 挖掘算法 时序数据库

何星星 谢伙生

福州大学数学与计算机学院 福州 350002

国内会议

NDBC2009第26届中国数据库学术会议

南昌

中文

439-445

2009-10-15(万方平台首次上网日期,不代表论文的发表时间)