会议专题

基于本体的网站栏目主题判定方法研究

主题爬虫是主题搜索引擎的核心部分,针对现有主题爬虫在描述主题概念中存在的不精确、不完善以及出现”主题漂移”的现象,并且它们大都只关注与主题的相关性,导致陷入Web空间中的某些局部子空间,造成主题资源覆盖度不高和效率低下.本文在分析了主题爬虫的原理和主题网站的特点之后,提出了一种基于本体的网站栏目主题判定方法,以农业网站为模型数据源,通过实验对农业网站下相应主题栏目信息的全部获取来评估可行性.

本体论 主题爬虫 网站栏目 主题判定

王洋 康丽 程新荣

中国农业大学信息与电气工程学院,北京 100083

国内会议

中国农业工程学会电气信息与自动化专委会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会

北京

中文

1-4

2010-10-29(万方平台首次上网日期,不代表论文的发表时间)