一种新的基于规则的多音字自动注音方法
本文统计了大量正确标音的语料,结果表明220个多音字的出现频度占总频度的99﹪以上.本文针对这220个多音字,提出了一种新的基于规则的多音字自动注音的方法.该方法首先对语句中的多音字进行预分类,然后基于8项特征提取规则,并进行自动注音.文中研究分析了读音与词性的关系,提出了韵律功能词性的概念,改善了繁琐的词性信息.文末给出了含有韵律功能词性的多音字处理方法的测试结果,并与其他方法进行比较,实践表明,该方法提高了多音字注意的正确率.
字音转换 多音字 韵律短语 韵律功能词性 特征提取
郑敏 蔡莲红
清华大学计算机科学与技术系(北京)
国内会议
北京
中文
238-243
2004-08-01(万方平台首次上网日期,不代表论文的发表时间)