基于语音样本的口语电话语音关键词检出算法的改进研究
以语音样本作为输入,实现口语电话语音的关键词检出是本文的目的。文中提出的通过建立音素混淆网络进行扩展的算法,提高了由语音样本转化成声学模型序列的效果,扩展了基于语音样本方法的应用范围。实验结果显示,在说话人无关、口语化电话语音关键词检出任务中,每个关键词获得10个左右的随机样本时,其检出性能与专家知识注音的结果相当,取得了比较好的实用效果。
语音样本 关键词 检出算法 音素混淆网络
孟猛 梁家恩 徐波
中科院自动化研究所数字内容技术研究中心 北京 100080 中科院自动化研究所数字内容技术研究中心 北京 100080 中科院自动化研究所模式识别国家重点实验室 北京 100080
国内会议
苏州
中文
209-211,215
2007-12-07(万方平台首次上网日期,不代表论文的发表时间)