基于MapReduce的并行知识约简算法模型研究
粗糙集理论中知识约简是数据挖掘应用中知识获取的重要步骤.经典的知识约简算法是一次性将小数据集装入内存中进行知识约简来提高约简算法效率,无法处理海量数据.通过深入剖析基于正区域的、基于差别矩阵的和基于信息熵的知识约简算法中的可并行化操作,提出了基于MapReduce的并行知识约简算法模型,并在Hadoop平台上进行了相关实验.实验结果表明该知识约简算法模型可以处理海量数据集.
MapReduce Rough set Knowledge reduction Data parallel Task parallel
钱进 苗夺谦 张泽华 张志飞
同济大学计算机科学与技术系 上海201804 同济大学嵌入式系统与服务计算教育部重点实验室 上海201804
国内会议
第十二届中国Rough集与软计算学术会议、第六届中国Web智能学术研讨会及第六届中国粒计算学术研讨会联合学术会议
合肥
中文
139-139
2012-10-13(万方平台首次上网日期,不代表论文的发表时间)