会议专题

面向主题的WWW信息挖掘系统

WWW规模的飞速发展对普通搜索引擎覆盖一切的目标提出了挑战.对于关注具体主题的用户,普通搜索引擎并不完全适用.近年来聚焦于单一主题的WWW检索逐渐受到重视,本文在此基础上结合数据挖掘技术提出一种面向主题的WWW信息挖掘框架,不仅能够在有限的软硬件和网络资源条件下,实时高效地完成主题相关的网页的收集,更重要的是能够对检索到的主题相关网页进行分析,最大限度的对主题进行挖掘,这是普通搜索引擎所不具备的.

搜索引擎 主题 爬行器 权威页面 HUB页面

余晨 顾毓清

中科院软件所,北京,100080

国内会议

中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会

四川广元

中文

515-521

2002-07-13(万方平台首次上网日期,不代表论文的发表时间)