挖掘频繁闭序列的并行算法研究

频繁闭序列挖掘时数据挖掘中的一个重要方向.为了提高挖掘效率,作者提出了基于分布内存的频繁闭序列的并行挖掘算法PFCSeq,该算法采用任务划分与数据划分相结合的策略,各处理机异步计算全局频繁闭序列候选集,整个过程中必须的通信只需两次,极大减少了通信开销,同时由于动态负载平衡策略的运用,有效平衡了处理机间的计算时间.分析及实验表明,该算法对挖掘长模式、大数据集有着良好的可扩展性和加速比.
序列模式 频繁闭序列 投影树 并行算法 数据挖掘
李庆华 马传香
华中科技大学计算机科学学院,430074 华中科技大学计算机科学学院,430074;湖北大学数学与计算机科学学院,430062
国内会议
深圳
中文
450-454
2005-04-16(万方平台首次上网日期,不代表论文的发表时间)