基于统计的汉语词性标注规则的获取技术
规则库的建立是基于规则的词性标注方法的基础.本文介绍了一种基于统计的汉语词性标注规则的获取方法.文中运用统计方法从已经标注好词性的30万语料中自动获取规则,并通过测试语料检验规则的正确性.将获取的规则用于词性标注系统中,标注的正确率有了明显提高.
词性标注 语料库 统计 词性标注规则 词性兼类
张丽静 黄德根
大连理工大学计算机系
国内会议
大连
中文
144-147
2001-07-01(万方平台首次上网日期,不代表论文的发表时间)
词性标注 语料库 统计 词性标注规则 词性兼类
张丽静 黄德根
大连理工大学计算机系
国内会议
大连
中文
144-147
2001-07-01(万方平台首次上网日期,不代表论文的发表时间)