会议专题

基于多Web信息源的主题概念网络获取

Wikipedia一方面能够提供关于特定百科条目的概念性描述;另一方面,也通过分类系统将这些百科条目组织成一个概念网络.它对信息的广泛覆盖和有效组织使其成为了自动化知识获取的常用信息源.然而,仅仅依靠Wikipedia自身的信息,还不足以准确地刻画其内部概念间的关联性知识,而这是符号化知识表述的一个重要组成部分.因此,提出了一种基于多Web信息源的主题概念网络获取方法.它以Wikipedia的分类系统为基础,同时利用搜索引擎收集相关的Web信息作为关联性知识验证和发现的参照系,并通过集成信息检索和自然语言处理等领域的方法,实现了以给定的主题词为核心,在Wikipedia分类系统对应的概念网络中获取面向该主题的概念网络,同时网络内的概念间关系得到识别和标注.基于不同领域的主题词进行了实验,对实验结果的经验性评估展示了所荻取的主题概念网络既能满足面向主题的要求,其内部的概念关联性知识又具备了一定的精度要求.

知识工程 主题概念网络 信息检索 自然语言处理 多Web信息源

许焱 金芝 李戈 魏强

中国科学院数学与系统科学研究院 北京 100190;中国科学院大学 北京 100049 中国科学院数学与系统科学研究院 北京 100190;高可信软件技术教育部重点实验室(北京大学) 北京 100871 高可信软件技术教育部重点实验室(北京大学) 北京 100871

国内会议

2013年中国计算机学会人工智能会议

北京

中文

1843-1854

2013-07-31(万方平台首次上网日期,不代表论文的发表时间)