会议专题

问答社区中回答质量的评价方法研究

问答社区已经成为网络信息获取的一种重要渠道,但其中信息质量分布差异较大。本文研究了问答社区中回答质量的评价方法。具体考察了百度知道的问答社区环境,并对其构建了大规模的语料数据。针对百度知道的特点,文本提出的基于时序的特征、基于问题粒度的特征和基于百度知道社区用户的特征,从更多的角度对回答质量进行评价。利用分类学习的框架,本文综合了新设计的三方面特征和经典的文本特征、链接特征,对高质量和非高质量的回答进行分类。基于大规模问答语料的实验表明,在文本特征与链接特征的基础上,基于时序与基于问题粒度的特征能够有效地提高回答质量的评估效果。另外也发现,根据本文的回答质量评价框架做出的质量评分能够有效地预测最佳答案。

问答社区 回答质量评价 链接特征 百度知道

孔维泽 刘奕群 张敏 马少平

智能技术与系统国家重点实验室,清华信息科学与技术国家实验室(筹),清华大学计算机系,北京,100084

国内会议

第六届全国信息检索学术会议

黑龙江镜泊湖

中文

215-222

2010-08-12(万方平台首次上网日期,不代表论文的发表时间)