中文文本兼类词的标注技术
语料库词性自动标注是语言信息处理中的基础课题。实践表明,造成汉语的词性标注准确率不高、难以实用化的最重要的因素是软件的兼类词鉴别能力差。作者以大规模的真实中文文本中反映的语言事实力依据,采用概率统计和基于规则相结合的混合方法,对汉语的语料进行了标注试验,取得了较为满意的效果。
兼类词 词性自动标注 同现概率 基于规则的方法
温锁林
大学中文系(太原)
国内会议
北京
中文
194~199
1998-09-01(万方平台首次上网日期,不代表论文的发表时间)
兼类词 词性自动标注 同现概率 基于规则的方法
温锁林
大学中文系(太原)
国内会议
北京
中文
194~199
1998-09-01(万方平台首次上网日期,不代表论文的发表时间)