汉语语音合成系统可用性研究

摘要：

目前,语音合成技术已经从人类的”理想”、”构建和谐社会”必不可少的手段,具体化为社会生活中方方面面的应用.对于汉语语音合成技术来说,是不是已经接近或达到了应用目标,是本文探讨的主题.文中简要报告了2004年在中国人民大学信息学院进行的汉语语音合成系统的评估实验结果,以此分析了汉语语音合成系统的可用性.评估采用主观印象评测(MOS)方法,选择了当前有代表性的五个汉语语音合成系统;从模块诊断评估和整体自然度评估评两个大的方面,测试了音节缺陷度、句子语义理解缺陷度及语句自然度测试和短文自然度四个方面.评估结果表明:目前的汉语语音合成系统虽然在儿化音等语音现象上还存在一定的问题,但在句子层面上都有能力躲避常见的语义陷阱;由于合成系统都是采用的拼接合成技术,合成系统的自然度大体都达到4分上下的水平,初步达到实用要求,都可以进入语音产品市场.

关键词：主观印象评测汉语语音合成系统拼接合成技术模块诊断评估整体自然度评估

作者: 许洁萍吕士楠闫俐

作者单位: 中国人民大学信息学院计算机系,北京,100872 中国科学院声学研究所,北京,100080

会议类型: 国内会议

会议名称: 第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议(第一届全国和谐人机环境联合学术大会)

会议地点: 昆明

会议语种:中文

页码: 429-435

在线出版日期: 2005-10-26（万方平台首次上网日期，不代表论文的发表时间）

会议专题

汉语语音合成系统可用性研究