会议专题

ORIGO:一种基于数字化图书馆资源的本体学习方法

领域本体的匮乏制约了语义Web的发展。本文提出了一种与语言无关的无监督的领域本体学习方法ORI-GO,从数字化图书馆的文档中自动获取领域的概念和关系,主要包括同义关系和上下位关系。首先通过统计分析发现术语,然后利用概念语义距离和共现分析计算概念间的关联度,再使用关联规则和句法模式精炼相关关系,通过概念聚类算法获取上下位关系,最后利用启发式规则对候选本体进行修剪和合并,得到最终的领域本体。实验结果表明,这样的学习策略具有较好的实用性。

本体学习 聚类 语言学上下文 数字化图书馆 ORIGO 启发式规则

徐惠 高志强 陆青健 朱万颖

东南大学软件学院 南京 210096 东南大学计算机科学与工程学院 南京 210096 江苏蓝深远望系统集成有限公司 无锡 214002

国内会议

2008年中国信息技术与应用学术论坛

成都

中文

55-57

2008-04-01(万方平台首次上网日期,不代表论文的发表时间)