基于Hadoop的海量共现矩阵生成方法

摘要：

海量数据的处理分析是当前信息处理技术的热点之一，本文介绍了开源并行系统Hadoop的体系结构以及基于Hadoop的MapReduce编程框架，并在Hadoop基础上提出了一种通过多重MapReduce操作，实现海量共现矩阵的生成方法。

关键词：共现矩阵开源软件海量数据处理编程框架

作者: 杨代庆张智雄

作者单位: 中国科学院国家科学图书馆,北京 100080 中国科学院研究生院, 北京 100049 中国科学院国家科学图书馆,北京 100080

会议类型: 国内会议

会议地点: 北京

会议语种:中文

页码: 231-237

在线出版日期: 2009-03-11（万方平台首次上网日期，不代表论文的发表时间）

会议专题