教育资源网格的分布式Top-k全文检索算法
为了满足教育资源网格用户的资源检索需求,考虑教育资源网格的节点组织模式和资源分布特点,提出了一种基于单维语义向量组的分布式Top-k全文检索算法。该算法通过改进经典的VSM模型,利用教育资源网格中管理节点构建单维语义向量组,资源节点直接计算文档资源和检索向量的全局语义相关度,结合文档本身质量进行Top-k评分,实现了在分布式环境下的全文信息检索;提出一种结合检索向量语义相关度和节点属性的Top-k阈值策略,在保证检索结果有效性的前提下,提高了分布式Top-k检索的效率。实验表明,该算法具有较高的查全率、查准率、正确率以及较高的检索效率。
教育资源网格 单维语义向量组 全文检索算法 节点组织模式 资源分布特点 全局语义相关度 阈值策略
刘方爱 邢长明 陈坤
山东师范大学 信息科学与工程学院,济南,250014 山东省分布式计算机软件新技术重点实验室, 济南,250014 山东财经大学,济南,250014 山东师范大学 信息科学与工程学院,济南,250014
国内会议
2011年全国高性能计算学术年会(HPC china2011)
济南
中文
1-8
2011-10-26(万方平台首次上网日期,不代表论文的发表时间)