会议专题

词汇与中心词的距离信息对问句相似度匹配的影响

在问答式信息检索中引入基于frequently askedquestions(FAQ)的辅助模块满足常见问题的回答是一种有效的手段,其中关键问题是用户提出的问句与FAQ中问句的相似度比较,找出FAQ中最相近的问句,并返回对应的答案,作为对用户问题的解答.该文设计实现了一种FAQ辅助模块,并试图发现词汇与中心词的距离信息对于问句相似度匹配的词汇权重的影响.使用两组不同的测试集进行评测,实验表明,采用词汇与中心词的距离信息计算问句相似度,其影响能力弱于文档频率的作用,但是在相似度阈值0.5的情况下,两种方法均没有错误判断。

词汇权重 问句相似度匹配 问答式信息检索 距离信息

闫宏飞 陈翀

北京大学,信息科学技术学院,北京,100871

国内会议

第三届全国搜索引擎和网上信息挖掘学术研讨会

北京

中文

1873-1877

2005-09-26(万方平台首次上网日期,不代表论文的发表时间)