汉语语音合成系统可用性研究
目前,语音合成技术已经从人类的”理想”、”构建和谐社会”必不可少的手段,具体化为社会生活中方方面面的应用.对于汉语语音合成技术来说,是不是已经接近或达到了应用目标,是本文探讨的主题.文中简要报告了2004年在中国人民大学信息学院进行的汉语语音合成系统的评估实验结果,以此分析了汉语语音合成系统的可用性.评估采用主观印象评测(MOS)方法,选择了当前有代表性的五个汉语语音合成系统;从模块诊断评估和整体自然度评估评两个大的方面,测试了音节缺陷度、句子语义理解缺陷度及语句自然度测试和短文自然度四个方面.评估结果表明:目前的汉语语音合成系统虽然在儿化音等语音现象上还存在一定的问题,但在句子层面上都有能力躲避常见的语义陷阱;由于合成系统都是采用的拼接合成技术,合成系统的自然度大体都达到4分上下的水平,初步达到实用要求,都可以进入语音产品市场.
主观印象评测 汉语语音合成系统 拼接合成技术 模块诊断评估 整体自然度评估
许洁萍 吕士楠 闫俐
中国人民大学信息学院计算机系,北京,100872 中国科学院声学研究所,北京,100080
国内会议
第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议(第一届全国和谐人机环境联合学术大会)
昆明
中文
429-435
2005-10-26(万方平台首次上网日期,不代表论文的发表时间)