电话对话语音的实时鲁棒识别技术的研究
电话对话语音具有通信环境多变、说话人差异明显和自然口语化现象严重的特点,本文通过整合鲁棒特征提取、声学模型补偿、语言模型补偿等一系列鲁棒识别技术,设计并搭建了一面向电话对话语音的识别系统.该系统在2005年863评测采用的一小时电话语音数据集进行了实验.其字错误率相比于基线系统相对降低30.6%.同时,为了加快识别速度,在采用自主开发的经优化的单遍解码器的基础上,通过在系统级速度优化方面采用快速预解码策略,在不损失系统识别精度的情况下将系统总耗时从1.86倍实时下降到110倍实时.
Conversational telephone speech recognition Robust Real-time
邵健 赵庆卫 颜永红
浙江大学计算机学院,杭州310027 中科院声学所中科信利语音实验室,北京100091
国内会议
北京
中文
690-695
2009-10-01(万方平台首次上网日期,不代表论文的发表时间)