分布式环境下重叠分块FM-index算法的设计
随着网络和数据库发展,数据急剧增长,对信息检索提出了挑战。压缩查询技术实现了在压缩状态下查询文件,其中压缩查询索引FM-index是该领域的一种先进的算法。但FM-index在建立索引时却要消耗很大的内存。而重叠分块FM-index方法在内存空间的占用上得到了改进,但是对于GB级以上的数据,性能上还需进一步改进。以重叠分块的FM-index和网格计算技术为基础,通过对参数及结果传递的各种方案比较,结合重叠分块FM-index和网格计算的特点,给出了设计并具体实现算法,同时分析了性能的改进。
重叠分块FM-index 分布式系统 网格计算
胡正坤 梁军 鲍泓
北京联合大学信息技术研究所信息学院 北京 100101 北京联合大学电信实训基地 北京 100101
国内会议
中国计算机用户协会网络应用分会2008年网络新技术与应用研讨会
青岛
中文
85-87,100
2008-10-01(万方平台首次上网日期,不代表论文的发表时间)