会议专题

基于UIMAAS的文本挖掘系统的性能分析与评估

本文基于大规模文本数据挖掘平台UIMA AS设计了文本挖掘系统MTMS.该系统针对分布式存储的海量数据,系统内部组件采用松耦合的通讯方式,同时各部件并行处理,大大提高了系统的吞吐率.为提高MTMS数据处理速度,本文从文本挖掘和UIMA AS两个方面对MTMS的性能进行了分析,解决了目前未对采用JMS通信机制实现的分布式文本挖掘系统进行性能分析的问题.实验表明,通过对相应瓶颈问题进行解决,在MTMS并行粒度N<18时,随着N的增加,该系统处理速度呈线性增长.

文本挖掘系统 性能评估 体系架构 运行效率

蒋子海 周斌 吴泉源

国防科学技术大学计算机学院 长沙 410073

国内会议

第25次全国计算机安全学术交流会

杭州

中文

113-118

2010-09-17(万方平台首次上网日期,不代表论文的发表时间)