会议专题

中文叙词表本体概念间等同关系自动构建研究

中文叙词表本体(OntoThesaurus)是一种新型的、同时具备叙词表和本体特征的知识组织系统。其配套系统“中文叙词表本体共建共享系统”(OTCSS)采用的共建方法是依靠一种机器辅助的人工构建方法(类似于WIKI)。这种方式的好处是修订意见准确率高、修订内容完整等,但是也存在修订信息时效性不稳定的缺点,其成功还需要依赖网络用户的大量参与。本文提出了中文叙词表本体中等同关系的自动构建方案。其中,基于web搜索引擎的模式匹配算法,对OntoThesaurus叙词概念的覆盖率达到91%;基于《知网》义原词频的词汇等同关系识别算法,比原算法在准确性上提高了8%,达到了78%的准确率

叙词表 本体 OntoThesaurus 等同关系 自动构建 《知网》 相似度 模式匹配

方圆 曾新红

深圳大学计算机与软件学院 深圳 518060 深圳大学图书馆 深圳 518060 深圳大学计算机与软件学院 深圳 518060

国内会议

数字图书馆高层论坛2010年年会

北京

中文

76-86

2010-11-17(万方平台首次上网日期,不代表论文的发表时间)