会议专题

基于Map/Reduce集群上的模式空间划分的序列模式挖掘

  通过模式空间划分将基于Map/Reduce处理数据集与候选序列模式集的多对多的对应关系的问题转化为处理数据集与以频繁1—序列为基的各子模式空间的多对多的对应关系问题,大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸导致的单一Map节点的瓶颈问题。通过三轮的Map/Reduce任务,实现了模式空间和过滤规则的建立,并在此基础上实现了各子模式空间上独立地进行序列模式的挖掘。通过充分利用整个模式空间的全局特征及各子模式空间的个性特征,设计了优化的非递归挖掘算法,减少了前缀投影库构造次数及对构造的投影库的扫描次数,从而提高了挖掘阶段的效率。

数据挖掘 序列模式 空间划分 云计算

LIU Qian 刘骞 CHEN Ming 陈明

Department of Computer Science and Technology, China University of Petroleum, Beijing 102249 中国石油大学计算机科学与技术系,北京102249

国内会议

2012全国开放式分布与并行计算学术年会

宁波

中文

149-151,156

2012-09-26(万方平台首次上网日期,不代表论文的发表时间)