会议专题

分布式环境下重叠分块FM-index算法的设计

随着网络和数据库发展,数据急剧增长,对信息检索提出了挑战。压缩查询技术实现了在压缩状态下查询文件,其中压缩查询索引FM-index是该领域的一种先进的算法。但FM-index在建立索引时却要消耗很大的内存。而重叠分块FM-index方法在内存空间的占用上得到了改进,但是对于GB级以上的数据,性能上还需进一步改进。以重叠分块的FM-index和网格计算技术为基础,通过对参数及结果传递的各种方案比较,结合重叠分块FM-index和网格计算的特点,给出了设计并具体实现算法,同时分析了性能的改进。

重叠分块FM-index 分布式系统 网格计算

胡正坤 梁军 鲍泓

北京联合大学信息技术研究所信息学院 北京 100101 北京联合大学电信实训基地 北京 100101

国内会议

中国计算机用户协会网络应用分会2008年网络新技术与应用研讨会

青岛

中文

85-87,100

2008-10-01(万方平台首次上网日期,不代表论文的发表时间)