一种基于海量信息处理的云存储模型研究

摘要：

　　提出了一种云环境下海量数据组织与资源共享的存储总模型，该模型包括：结构化、半结构化及其非结构化数据与资源的对应存储方法；能兼顾海量大小数据文件处理的分布式文件系统THDFS；云数据库系统设计模型THClOUdDB；云环境下强于MapReduce弱于SQL，以Hadoop++为基础的一种针对互联网海量数据文件处理且具有语义计算效能的计算模型THMapReduce；针对THDFS及其THClOUdDB的具有语义效能的智能挖掘分析工具THBI；最后以“清华通”为案例分析了该模型平台的具体应用。

关键词：海量信息处理云存储模型分布式文件系统云数据库系统

作者: 张桂刚李超张勇邢春晓

作者单位: 清华大学信息技术研究院北京 100084 清华大学信息科学国家实验室北京100084

会议类型: 国内会议

会议名称: 2011年第17届全国信息存储技术大会(IST 2011)

会议地点: 济南

会议语种:中文

页码: 32-36

在线出版日期: 2011-11-18（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种基于海量信息处理的云存储模型研究