基于语义关联的RDF关键字并行查询方法
目前存在RDF图数据关键字查询研究主要集中在构造包含查询关键字的最小树/子图的图搜索算法,忽略了RDF数据间关联的语义信息,此外集中式处理方式也难以适应不断增长的RDF数据的查询要求.本文提出了一种基于语义关联的RDF关键字并行查询方法KPQRSA(Keyword parallel query over RDF data based on semantic association),结合本体OWL和概率模型设计评分函数来度量语义关联度,分布式数据库Hbase作为存储媒介,利用MapReduce计算框架并行查询:在Map阶段查询关键字节点得到语义关联密切的子簇,在Reduce阶段执行连接操作,并构造一系列关联的联通簇作为查询结果.实验验证,KPQRSA算法有助于提高查询结果的内容与关键字的相关度,保证结果的查准率,同时分布式存储和并行计算查询具有较好的可扩展性.
关键字查询 语义关联 资源描述框架 分布式存储 并行计算
陈双 汪璟玢
福州大学数学与计算机科学学院 福州福建中国350108
国内会议
福州
中文
1-6
2015-12-11(万方平台首次上网日期,不代表论文的发表时间)