一种基于社会性标注的网页排序算法
社会性标注作为一种新的资源管理和共享方式,吸引为数众多的用户参与其中。由此产生的大量社会性标注数据成为网页质量评价的一个新维度。本文研究如何利用社会性标注改进网页检索性能,提出一种有机结合网页和用户的查询相关性与互增强关系的网页排序算法。首先利用网页和用户的相关标签,基于统计主题模型为网页和用户建模,计算查询相关性。然后利用二部图模型刻画网页和用户问的互增强关系,并利用标注内容与网页和用户语言模型的匹配程度为互增强关系赋予权重。最后结合查询相关性和互增强关系,以迭代方式同时计算网页和用户的重要性。实验结果表明,与目前的代表性算法FolkRank,SocialPageRank和SPEAR相比,该算法在MAP和NDCG两个评价指标上均有明显提高。
社会性标注 网页质量 网页排序算法
刘凯鹏 方滨兴
计算机信息内容安全国家重点实验室,哈尔滨工业大学,哈尔滨 150001 计算机信息内容安全国家重点实验室,哈尔滨工业大学,哈尔滨 150001 信息安全研究中心,中国科学院计算技术研究所,北京 100190
国内会议
上海
中文
252-261
2009-11-14(万方平台首次上网日期,不代表论文的发表时间)