会议专题

基于Hadoop的海量共现矩阵生成方法

海量数据的处理分析是当前信息处理技术的热点之一,本文介绍了开源并行系统Hadoop的体系结构以及基于Hadoop的MapReduce编程框架,并在Hadoop基础上提出了一种通过多重MapReduce操作,实现海量共现矩阵的生成方法。

共现矩阵 开源软件 海量数据处理 编程框架

杨代庆 张智雄

中国科学院国家科学图书馆,北京 100080 中国科学院研究生院, 北京 100049 中国科学院国家科学图书馆,北京 100080

国内会议

第二届“数字图书馆与开放源码软件(DLIB & OSS 2009)”学术研讨会

北京

中文

231-237

2009-03-11(万方平台首次上网日期,不代表论文的发表时间)