会议专题

中文文本兼类词的标注技术

语料库词性自动标注是语言信息处理中的基础课题。实践表明,造成汉语的词性标注准确率不高、难以实用化的最重要的因素是软件的兼类词鉴别能力差。作者以大规模的真实中文文本中反映的语言事实力依据,采用概率统计和基于规则相结合的混合方法,对汉语的语料进行了标注试验,取得了较为满意的效果。

兼类词 词性自动标注 同现概率 基于规则的方法

温锁林

大学中文系(太原)

国内会议

1998中文信息处理国际会议

北京

中文

194~199

1998-09-01(万方平台首次上网日期,不代表论文的发表时间)