会议专题

一种新的基于规则的多音字自动注音方法

本文统计了大量正确标音的语料,结果表明220个多音字的出现频度占总频度的99﹪以上.本文针对这220个多音字,提出了一种新的基于规则的多音字自动注音的方法.该方法首先对语句中的多音字进行预分类,然后基于8项特征提取规则,并进行自动注音.文中研究分析了读音与词性的关系,提出了韵律功能词性的概念,改善了繁琐的词性信息.文末给出了含有韵律功能词性的多音字处理方法的测试结果,并与其他方法进行比较,实践表明,该方法提高了多音字注意的正确率.

字音转换 多音字 韵律短语 韵律功能词性 特征提取

郑敏 蔡莲红

清华大学计算机科学与技术系(北京)

国内会议

第二届全国学生计算语言学研讨会

北京

中文

238-243

2004-08-01(万方平台首次上网日期,不代表论文的发表时间)