面向用户和领域本体的Web信息采集系统
针对传统搜索引擎不能满足用户个性化专业化需求的特性,提出了一种既面向用户又面向领域本体的搜索策略,设计了一个本体支持的Web信息采集系统.该系统通过在网站模式的网页配置文件中记录网页本体信息,来阐明网页如何与领域本体相关.为了满足用户的个性化需求,在爬虫内部设计了用户定义的优先对列.实验证明该系统提高了页面查询的精确率和召回率.
搜索引擎 网络信息采集系统 用户需求 个性化技术 优先对列
张素智 李宝燕 樊得强
郑州轻工业学院计算机与通信工程学院,河南郑州,450002
国内会议
郑州
中文
230-236
2010-11-12(万方平台首次上网日期,不代表论文的发表时间)