会议专题

基于改进Pairwise损失函数的排序学习方法

排序学习是当前机器学习与信息检索交叉领域的研究热点。它利用机器学习方法自动地构造排序模型,用于排序新的数据。Pairwise方法是一类重要的排序学习方法,它以偏序文档对作为训练样例,通过判断不同文档与查询的相关性大小关系来为文档排序。由于pairwise 方法不考虑单个文档的相关性大小,若对文档对内两个文档的相关性均预测错误,则会导致连锁反应并影响最终排序性能;为解决该问题,本文分别基于单层神经网络和双层神经网络的RankNet算法,加入pointwise损失函数进行优化,并分别使用梯度下降算法和反向传播算法训练网络权重值,得到排序模型。在OHSUMED数据集上的实验结果表明,加入pointwise损失函数有助于改善pairwise方法的排序性能。

信息检索 排序学习 损失函数 Pairwise RankNet算法 神经网络

吴佳金 杨志豪 林原 林鸿飞

大连理工大学信息检索研究室,大连,116024

国内会议

第六届全国信息检索学术会议

黑龙江镜泊湖

中文

96-103

2010-08-12(万方平台首次上网日期,不代表论文的发表时间)