基于htmlparser的搜索引擎信息抽取系统设计与实现
信息抽取是搜索引擎中的核心组成部分,发挥着举足轻重的作用。伴随着互联网信息的爆炸式发展,传统的搜索引擎已经不能满足人们的需要。大量有针对性作用的搜索引擎应运而生。Htmlparser是一个对html解析的库,主要用于改造或提取html。它能超高速解析html。HtmlParser主要靠Node、
信息抽取 搜索引擎 htmlparser 数据过滤 排序
孟红 钟华
北京城市学院人工智能研究所,北京,100083
国内会议
黑龙江镜泊湖
中文
122-126
2010-08-12(万方平台首次上网日期,不代表论文的发表时间)