基于日志分析的搜索引擎查询结果缓存研究
缓存是有效减少响应时间和系统负载的关键技术,是搜索引擎系统结构研究的重要领域之一。通过对搜狗搜索引擎在近1个月内约1 500万条用户查询日志进行分析和研究,针对查询结果缓存,从查询局部性、缓存策略、缓存容量、工作负载周期性等方面进行分析。分析表明,混合缓存策略以及提高缓存容量相结合的技术能有效提高搜索引擎系统性能。
信息检索 搜索引擎 查询日志 性能优化 缓存
马宏远 王斌
中国科学院计算技术研究所北京 100190 中国科学院研究生院北京 100049 中国科学院计算技术研究所北京 100190
国内会议
济南
中文
224-228
2011-11-18(万方平台首次上网日期,不代表论文的发表时间)