基于Hadoop的海量共现矩阵生成方法
海量数据的处理分析是当前信息处理技术的热点之一,本文介绍了开源并行系统Hadoop的体系结构以及基于Hadoop的MapReduce编程框架,并在Hadoop基础上提出了一种通过多重MapReduce操作,实现海量共现矩阵的生成方法。
共现矩阵 开源软件 海量数据处理 编程框架
杨代庆 张智雄
中国科学院国家科学图书馆,北京 100080 中国科学院研究生院, 北京 100049 中国科学院国家科学图书馆,北京 100080
国内会议
第二届“数字图书馆与开放源码软件(DLIB & OSS 2009)”学术研讨会
北京
中文
231-237
2009-03-11(万方平台首次上网日期,不代表论文的发表时间)