会议专题

基于DCC动态流通语料库的中文组织名监测与研究

本研究以中国主流报纸动态流通语料库DCC(Dynamiccirculating corpus)为研究平台,选取2002-2006年六份主流报纸作为中文组织名监测研究的专用语料库,最终形成一个中文组织名数据知识库。监测和研究结果对于中文组织名识别、现代汉语专名研究、缩略语研究、组织和行业动态监测、组织名使用规范等都具有重要意义。进行分词标注系统识别准确率和错误原因的实验。 发现分词系统将组织名标注为ORG和AORG的标注规律,设计并实现一个机器辅助人工中文组织名校对系统。

动态流通语料库 中文组织名 语言监测 分词标注

陈慧 张普

北京语言大学应用语言学研究所 北京 10083

国内会议

第九届全国计算语言学学术会议

大连

中文

491-496

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)