会议专题

面向数据密集型计算Hadoop 及其应用研究

当前的数据密集型计算需要处理PB级数据集和GB级数据流,面临着大规模数据管理、复杂计算环境管理、可扩展计算平台等方面的难题。Hadoop是一种易扩展的分布式计算架构,能将廉价PC节点联合起来提供大型计算服务—其HDFS提供大规模存储管理,其Map-Reduce并行框架为用户提供容易使用的并行编程模式。本文研究了Hadoop架构并探讨了在数据密集型计算中的应用。

高性能计算 分布式计算 数据管理 数据存贮

孙兆玉 袁志平 黄宇光

江南计算技术研究所 无锡 214083

国内会议

2008年全国高性能计算机学术年会

无锡

中文

486

2008-10-30(万方平台首次上网日期,不代表论文的发表时间)