面向数据密集型计算Hadoop 及其应用研究
当前的数据密集型计算需要处理PB级数据集和GB级数据流,面临着大规模数据管理、复杂计算环境管理、可扩展计算平台等方面的难题。Hadoop是一种易扩展的分布式计算架构,能将廉价PC节点联合起来提供大型计算服务—其HDFS提供大规模存储管理,其Map-Reduce并行框架为用户提供容易使用的并行编程模式。本文研究了Hadoop架构并探讨了在数据密集型计算中的应用。
高性能计算 分布式计算 数据管理 数据存贮
孙兆玉 袁志平 黄宇光
江南计算技术研究所 无锡 214083
国内会议
无锡
中文
486
2008-10-30(万方平台首次上网日期,不代表论文的发表时间)