基于DCC动态流通语料库的中文组织名监测与研究
本研究以中国主流报纸动态流通语料库DCC(Dynamiccirculating corpus)为研究平台,选取2002-2006年六份主流报纸作为中文组织名监测研究的专用语料库,最终形成一个中文组织名数据知识库。监测和研究结果对于中文组织名识别、现代汉语专名研究、缩略语研究、组织和行业动态监测、组织名使用规范等都具有重要意义。进行分词标注系统识别准确率和错误原因的实验。 发现分词系统将组织名标注为ORG和AORG的标注规律,设计并实现一个机器辅助人工中文组织名校对系统。
动态流通语料库 中文组织名 语言监测 分词标注
陈慧 张普
北京语言大学应用语言学研究所 北京 10083
国内会议
大连
中文
491-496
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)