会议专题

基于DCC的术语定义标注语料库研究

本文介绍了一个基于动态流通语料库(DCC)的术语释义信息标注语料库和针对语料库建设所开发的辅助软件系统。语料库建设过程分为如下几个步骤:原始语料收集、标记集确定、语料标注和辅助软件开发等几部分.在标注语料库中标出的内容有术语和它的定义或解释性语句,本文还对标注结果进行了介绍。本研究所产生的语料资源可作为术语提取和定义识别的训练语料和测试语料,也可作为专业领域知识本体构建的结构化知识来源.

术语定义识别 定义标注 语料库建设 动态流通语料库 辅助软件系统

王强军 张普

河北大学人文学院 北京语言大学应用语言学研究所

国内会议

第七届中文信息处理国际会议

武汉

中文

281-285

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)