会议专题

一种提高搜索引擎检索速度的HTML解析方法

目前大部分搜索引擎采用全文索引,而它们的预处理方法几乎保留了HTML文件中所有的信息,这不但降低了解析的速度,而且搜索到大量的无关项,本文针对这一情况提出了一种解析HTML部分重要信息的方法,这样能够减少无关项,提高搜索引擎的解析速度,从而提高了检索速度.

标准搜索 目录搜索 HTML解析

刘中华 刘兴伟

西华大学,计算机科学与数理学院,成都,610039

国内会议

中国科学院计算技术研究所第八届计算机科学与技术研究生学术讨论会

大连

中文

235-238

2004-07-01(万方平台首次上网日期,不代表论文的发表时间)