搜索引擎中的信息存储技术
网络已经成为世界上最大的数字图书馆,目前网上信息数量仍在急剧膨胀,无用信息占有比例愈来愈大,而且网络传输速度较慢,由于网页的存储结构直接影响着查询质量和查询速度,因此网络信息的存储方式亟需改进.本文针对网络信息固有的特点提出一种新的文档存储结构,改进了搜索引擎的性能.其中主要包括信息的自动分类,网页相关度的计算,垃圾信息以及重复信息的过滤等技术.
信息存储 智能代理 信息过滤 文本分析 搜索引擎
宋聚平 王永成
上海交通大学计算机科学与工程系(上海)
国内会议
上海
中文
716-720
2000-10-01(万方平台首次上网日期,不代表论文的发表时间)