海量数据环境下改进Apriori算法研究
智能电网计算环境拥有大量生产数据、管理数据、实时和非实时数据的信息平台,在这样的海量数据环境下,挖掘关联规则的经典Apriori算法存在着明显的性能瓶颈.对Apriori算法进行分析后,设计使用了MapReduce编程模型实现Apriori算法的并行化,并通过增加辅助表和属性列以及在候选项集生成过程中改进并行策略的方法,进一步提高挖掘效率.仿真实验表明,改进后的Apriori算法在海量数据环境下能有效降低算法执行时间,提升数据挖掘效率。
智能电网 数据挖掘 Apriori算法 运行效率
郑伟 谭刚 刘钰然 赵津
国网重庆市电力公司信息通信分公司,重庆,401123 华北电力大学信息与网络管理中心,河北,保定,071003
国内会议
武汉
中文
1-5
2015-11-17(万方平台首次上网日期,不代表论文的发表时间)