会议专题

基于博客背景的博客倾向性检索归一化策略

近年来,越来越多的研究者关注博客倾向性检索。它的目标是检索出不仅与特定查询主题相关而且具有对该主题有评论的博文单元(包括博义及其评论),并依据倾向性强度(即,度量博丈对特定查询的强弱)进行排序。目前大多数研究工作仅仅通过单个博文单元对查询主题的倾向性强弱对博文进行排序。然而,因为博客是博主表达自己观点情感的媒介,所以博主的个性风格能够很大程度上影响着倾向性强度。例如,乐观的博主往往用褒义程度比较强的倾向词来赞美某一事件,而悲观的博主则往往用褒贬程度比较弱的倾向词。因此,同样一个倾向词对于不同的博主所表达的倾向性强弱不一样,不能忽略博主因素,而仅仅使用单一的博文单元获取倾向性评分,否则会带来倾向性评分带来较大偏差。为此,本文首先分析博主背景因素对倾向性评分的影响并建立博主背景模型,然后提出一个基于博主背景的博客倾向性检索归一化策略,最后使用该策略对基于概率推理的博客倾向性检索算法进行归一化。实验结果表明,基于博主背景的倾向性榆索归一化策略能够更加合理地对博主单元进行排序。

博客倾向性检索 博主背景 归一化策略

廖祥文 许洪波 钟尚平

福州大学数学与计算机科学学院,福州,350108 中国科学院计算技术研究所,北京,100190

国内会议

第五届全国信息检索学术会议CCIR2009

上海

中文

288-297

2009-11-14(万方平台首次上网日期,不代表论文的发表时间)