会议专题

基于垂直FP树的并行频繁项集挖掘

随着数据量的快速增长、数据存储的分散化程度不断提高.对并行分布式数据挖掘算法的需求越来越迫切.文章提出了一种基于垂直FP树的分布式频繁项集挖掘算法DVFP.DVFP采用一种称为垂直FP树(VFP)的格式来存放数据,并同时采用数据并行和任务并行的策略.文章还提出了一种新的序列化方法来对VFP树进行编码,大大减少了处理节点间的通信开销.实验验证DVFP算法在灵活性和处理时间上与现有的分布式算法相比具有较大优势.

数据处理 频繁项集挖掘算法 垂直FP树 序列化方法

徐杰 李云 刘博 张晓斌

扬州大学信息工程学院 扬州 225127

国内会议

第五届江苏计算机大会

江苏淮安

中文

12-15

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)