会议专题

基于统计的汉语词性标注规则的获取技术

规则库的建立是基于规则的词性标注方法的基础.本文介绍了一种基于统计的汉语词性标注规则的获取方法.文中运用统计方法从已经标注好词性的30万语料中自动获取规则,并通过测试语料检验规则的正确性.将获取的规则用于词性标注系统中,标注的正确率有了明显提高.

词性标注 语料库 统计 词性标注规则 词性兼类

张丽静 黄德根

大连理工大学计算机系

国内会议

2001全国软件技术研讨会

大连

中文

144-147

2001-07-01(万方平台首次上网日期,不代表论文的发表时间)