会议专题

文本检索中旬法信息的有效利用研究

虽然已有的研究表明,相对于词袋模型,利用词项依存关系能够显著的提高检索性能,但不同的词项依存关系却缺乏系统的横向比较。为此,在文档表达上,本文比较了利用近邻信息和句法信息定义的词项依存关系的性能;在查询表达上,对利用不同层次的句法信息所定义的词项依存关系的性能进行了比较。为了系统地比较这些词项依存关系对检索性能的影响,本文在语言模型基础上,以平滑为思路,提出了一个能方便融入这两类词项依存关系的检索模型。在TREC语料上的实验表明,句法关系较统计近邻关系有比较明显的提高。同时在查询表达上,完全的句法信息比部分的短语信息能更进一步的提高检索效果。

文本检索 词项依存 句法分析

丁凡 王斌 白硕 刘宜轩 李亚楠

中国科学院计算技术研究所 北京 100080;中国科学院研究生院 北京100080 中国科学院计算技术研究所 北京 100080 中国科学院计算技术研究所 北京 100080;上海证券交易所 上海 200120 中国科学院计算技术研究所 北京 100080;中国科学院研究生院 北京 100080

国内会议

第三届全国信息检索与内容安全学术会议

苏州

中文

508-515

2007-11-01(万方平台首次上网日期,不代表论文的发表时间)