会议专题

基于Ontology自动学习技术和粒度计算的中文网页搜索

随着Internet的快速发展,Web页面以指数级的速度膨胀,给信息的有效检索带来了严峻的挑战.目前已提出多种搜索方法来提高检索工具的智能性,以达到更高的查准率和查全率.主要的两种方法是:(1)信息分类方法(2)信息过滤方法. 目前数据挖掘中的很多技术已被广泛地应用于WEB信息检索中.如支持向量机(SVM)、神经网络、粗糙集等方法.自从Tim Berners-Lee提出语义Web以来便得到了广泛的应用.特别是Ontology作为语义Web中的一个要件,它不仅能对概念进行严格的定义而且还能定义概念之间丰富的关系.本文尝试首先利用Ontology自动学习技术从词-文档矩阵中抽象出概念的集合,然后再利用粒度计算的相关理论减小搜索的时间复杂度. 本文的组织结构是:首先对网页进行分类,然后再根据用户提出的查询问题进行切词,利用Ontology自动学习技术,形成概念,建立中文Ontology.最后采用商空间中的保真原理和保假原理进行搜索方式的改进,提出新的搜索算法。

Ontology 自动学习 粒度计算 中文网页搜索 Web页面 信息过滤 数据挖掘

周广城 梁久祯

浙江师范大学数理与信息工程学院,金华,321004

国内会议

第六届中国Rough集与软计算学术研讨会(CRSSC”2006)

浙江金华

中文

111-113,142

2006-10-30(万方平台首次上网日期,不代表论文的发表时间)