应用数据填充缓解稀疏问题实现个性化推荐

协同过滤是到目前为止最成功和应用最广泛的推荐技术,然而,由于用户-项目矩阵极端稀疏导致推荐不精确.针对该问题,本文提出了三种数据填充方法和两种推荐策略.对评分矩阵中未评分数据的三种数据填充方法是:(1)采用行和列数据的加权平均值填充;(2)采用行和列数据的众数的平均值填充;(3)采用行和列数据的中位数的平均值填充.一种推荐策略是直接用填充数据作为预测评分进行推荐;另一种推荐策略是将填充数据后的评分矩阵作为伪评分矩阵应用Pearson相关相似性进行协同过滤推荐.采用GroupLens数据集进行的实验结果表明:上述几种推荐策略均可有效地缓解评分数据稀疏性问题,提高推荐精确度.从平均的预测精确度来看,直接采用三种填充数据作为预测评分进行推荐比传统的基于Pearson相关相似性的协同过滤推荐算法分别提高了3.76%、6.46%和7.63%.;而将填充数据后的评分矩阵作为伪评分矩阵应用Pearson相关相似性进行协同过滤推荐则比传统的基于Pearson相关相似性的协同过滤推荐算法分别提高了6.57%、6.52%和7.60%.
个性化推荐系统 协同过滤 数据填充 推荐策略
Xia Jian-xun 夏建勋 Wu Fei 吴非 Xie Chang-sheng 谢长生
Wuhan National Laboratory for Optoelectronics, Hubei Wuhan 430074;School of Computer Science and Tec 武汉国家光电实验室 湖北 武汉 430074;华中科技大学计算机科学与技术学院 湖北 武汉 430074;湖北工程学院计算机与信息科学学院 湖北 孝感 432000 Wuhan National Laboratory for Optoelectronics, Hubei Wuhan 430074;Key Laboratory of Data Storage Sys 武汉国家光电实验室 湖北 武汉 430074;信息存储系统教育部重点实验室 湖北 武汉 430074;华中科技大学计算机科学与技术学院 湖北 武汉 430074
国内会议
无锡
中文
475-479
2012-07-12(万方平台首次上网日期,不代表论文的发表时间)