基于视觉的Web页面切割算法(VIPS)在搜索引擎中的应用
提出了VIPS(Vision-based Page Segmentation)算法,充分利用了Web页面的布局特征,利用Web页面的视觉提示,并结合DOM树对给定网页提取语义结构,可以进一步提高搜索结果对用户查询条件的相关性,并在网页去噪方面得到应用,实验证明,该算法具有优越性.
语义分割 搜索引擎 网页去噪
姜华 朱敏 陈斌
华东师范大学,计算中心,上海,200062
国内会议
第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)
济南
中文
30-33
2006-07-21(万方平台首次上网日期,不代表论文的发表时间)