基于改进Pairwise损失函数的排序学习方法
排序学习是当前机器学习与信息检索交叉领域的研究热点。它利用机器学习方法自动地构造排序模型,用于排序新的数据。Pairwise方法是一类重要的排序学习方法,它以偏序文档对作为训练样例,通过判断不同文档与查询的相关性大小关系来为文档排序。由于pairwise 方法不考虑单个文档的相关性大小,若对文档对内两个文档的相关性均预测错误,则会导致连锁反应并影响最终排序性能;为解决该问题,本文分别基于单层神经网络和双层神经网络的RankNet算法,加入pointwise损失函数进行优化,并分别使用梯度下降算法和反向传播算法训练网络权重值,得到排序模型。在OHSUMED数据集上的实验结果表明,加入pointwise损失函数有助于改善pairwise方法的排序性能。
信息检索 排序学习 损失函数 Pairwise RankNet算法 神经网络
吴佳金 杨志豪 林原 林鸿飞
大连理工大学信息检索研究室,大连,116024
国内会议
黑龙江镜泊湖
中文
96-103
2010-08-12(万方平台首次上网日期,不代表论文的发表时间)