会议专题

基于语料统计的以”不”开头双字分词不一致研究

大规模语料库中分词不一致现象普遍存在,并影响语料库的建设质量.在对熟语料进行分析统计的基础上,着重研究以”不”开头的双字结构,深入分析该结构分词不一致的产生原因.从全新的角度以集合的概念进行详细分类,并得出造成组合型歧义和分词变异的一系列原因.

分词不一致 组合型歧义 分词变异 语料统计 语料库

程月 季娜 洪鹿平

南京师范大学文学院,南京,210046

国内会议

第三届学术计算语言学研讨会

沈阳

中文

297-302

2006-08-15(万方平台首次上网日期,不代表论文的发表时间)