会议专题

基于最大熵模型的多音字消歧

字音转换是语音合成系统必不可少的模块,而多音字消歧则是字音转换的核心问题。本文选择了33 个常见常错的多音字作为研究对象,使用最大熵模型来辨析多音字的读音。在特征选择方面,本文比较了不同领域的多种关键词选择的方法,采用似然比来提取关键词。本文还对比了最大熵模型与决策树算法在多音字消歧上的表现,实验结果表明,最大熵模型的性能要优于决策树算法。

字音转换 多音字 最大熵模型 决策树 语音合成系统

刘方舟 施勤 陶建华

中国科学院自动化研究所,模式识别国家重点实验室,100080 IBM 中国研究中心,100083

国内会议

第九届全国人机语言通讯学术会议

安徽黄山

中文

2007-10-21(万方平台首次上网日期,不代表论文的发表时间)