基于改进Pairwise损失函数的排序学习方法

摘要：

排序学习是当前机器学习与信息检索交叉领域的研究热点。它利用机器学习方法自动地构造排序模型，用于排序新的数据。Pairwise方法是一类重要的排序学习方法，它以偏序文档对作为训练样例，通过判断不同文档与查询的相关性大小关系来为文档排序。由于pairwise 方法不考虑单个文档的相关性大小，若对文档对内两个文档的相关性均预测错误，则会导致连锁反应并影响最终排序性能；为解决该问题，本文分别基于单层神经网络和双层神经网络的RankNet算法，加入pointwise损失函数进行优化，并分别使用梯度下降算法和反向传播算法训练网络权重值，得到排序模型。在OHSUMED数据集上的实验结果表明，加入pointwise损失函数有助于改善pairwise方法的排序性能。

关键词：信息检索排序学习损失函数 Pairwise RankNet算法神经网络

作者: 吴佳金杨志豪林原林鸿飞

作者单位: 大连理工大学信息检索研究室,大连,116024

会议类型: 国内会议

会议名称: 第六届全国信息检索学术会议

会议地点: 黑龙江镜泊湖

会议语种:中文

页码: 96-103

在线出版日期: 2010-08-12（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于改进Pairwise损失函数的排序学习方法