基于海量搜索历史数据的用户兴趣模型
针对互联网搜索引擎环境中,基于海量搜索历史数据分析用户兴趣的问题,提出一种改进的用户兴趣模型.该模型根据用户搜索的历史数据,结合向量空间模型(VSM)和TF-IDF算法,递归地回溯出用户兴趣权重列表.为解决用户兴趣变化和时间性能的问题,该模型引入时间遗忘机制进行动态更新,并在Hadoop分布式系统架构下利用MapReduce分布式编程模型进行实现.实验结果表明,改进的用户兴趣模型的查准率和召回率都能达到50%,具有较好的可行性和可用性.
用户兴趣模型 历史数据 信息共享 服务功能
詹天晟 陈德华 乐嘉锦 王梅
东华大学 计算机科学与技术学院,上海 201620
国内会议
湖北襄阳
中文
126-129,139
2014-09-27(万方平台首次上网日期,不代表论文的发表时间)