会议专题

搜索引擎的反作弊技术研究

网页作弊已经成为搜索引擎面临的一个重大挑战,作弊者利用各种作弊技术来骗取虚假排名.为了对付网页作弊也出现了很多反作弊的技术.当前主要的反作弊技术可以分为基于网页特征分析,基于网页链接分析和检测隐藏技术的方法.当前,大部分搜索引擎的反作弊主要用基于链接分析的方法,同时也结合使用基于内容特征分析和对付隐藏作弊技术的方法,并且还用人工手段来提高反作弊的效果。商业利益的诱惑会让搜索引擎很难从根本上消除网页作弊,作弊和反作弊的斗争将是一个反复和长期的过程。在对付网页作弊上取得了不错的效果,然而这个领域还有许多问题值得继续深入探讨:(1)作弊技术会不断的更新和改进,一所以如何发现和检测新类型的作弊技术是一个长期而艰巨的问题。目前对于一些最新出现的隐藏技术Trackback spam,Tag spam等还没有找到很好的自动检测办法。(2)基于链接分析的方法仍然需要继续深入研究.例如:如何确定不同类型链接的权重。(3)从用户体验方面考虑,反作弊技术在提高效果的前提下一定要提高处理效率。如何应对大规模网页的高效处理是整个系统中每个环节都需要考虑的关键问题。

计算机网络 网页作弊 搜索引擎 反作弊技术

申文明 梁一平 周小平

广西大学 计算机与电子信息学院,广西 南宁 530004

国内会议

2009年中国高校通信类院系学术研讨会

南宁

中文

98-102

2009-09-18(万方平台首次上网日期,不代表论文的发表时间)