一种有效的自动识别与过滤噪链的方法
目前基于链接关系的排序算法在互联网搜索引擎中起着至关重要的作用。这类算法的提出是以”链接即投票”的假设为前提的.但是随着互联网商业化发展十几年来,这种假设已经不是万能的了.网页之间不再是”投票”关系,有各种各样其他角色的链接(即噪链)充斥其中,噪链的存在降低了基于链接的排序算法的准确性,如何识别和处理噪链是当今国外研究的热点.根据噪链本身的分布特性,提出了一种只基于链接关系就能自动识别和过滤噪链的方法,并进行了详细的真实数据集实验验证,结果表明该方法对噪链的识别和过滤非常有效,而且提高了基于链接关系的排序算法的准确性。
搜索引擎 自动识别 排序 过滤噪链 互联网
褚静波 王轶彤 汪卫
复旦大学计算机与信息技术系 上海 200433
国内会议
桂林
中文
258-264
2008-10-24(万方平台首次上网日期,不代表论文的发表时间)