会议专题

基于位置链表挖掘Web点击流序列模式

序列模式挖掘是数据挖掘的重要研究课题之一,并有着广阔的应用前景.近年来,很多应用引入了新的数据形式——数据流.数据流中的数据源源不断地高速地产生,这使数据流中的序列模式挖掘成为数据挖掘领域的一个新的有挑战的问题.本文提出了一个单遍扫描快速挖掘Web点击流时间敏感滑动窗口序列模式的CSP-SW算法,该算法利用页面的位置链表结构和序列的比特表示快速地实现候选序列支持度的计算,从而快速挖掘出滑动窗口内的频繁序列模式.实验表明CSP-SW算法具有较高的时间和空间效率.

Web点击流 位置链表 序列模式 数据挖掘 CSP-SW算法

孙金涛 谢伙生

福州大学数学与计算机学院福州 350108

国内会议

2010年亚太青年通信与技术学术会议

昆明

中文

466-470

2010-07-01(万方平台首次上网日期,不代表论文的发表时间)