会议专题

一种基于海量信息处理的云存储模型研究

  提出了一种云环境下海量数据组织与资源共享的存储总模型,该模型包括:结构化、半结构化及其非结构化数据与资源的对应存储方法;能兼顾海量大小数据文件处理的分布式文件系统THDFS;云数据库系统设计模型THClOUdDB;云环境下强于MapReduce弱于SQL,以Hadoop++为基础的一种针对互联网海量数据文件处理且具有语义计算效能的计算模型THMapReduce;针对THDFS及其THClOUdDB的具有语义效能的智能挖掘分析工具THBI;最后以“清华通”为案例分析了该模型平台的具体应用。

海量信息处理 云存储模型 分布式文件系统 云数据库系统

张桂刚 李超 张勇 邢春晓

清华大学信息技术研究院北京 100084 清华大学信息科学国家实验室 北京100084

国内会议

2011年第17届全国信息存储技术大会(IST 2011)

济南

中文

32-36

2011-11-18(万方平台首次上网日期,不代表论文的发表时间)