基于语音样本的口语电话语音关键词检出算法的改进研究

摘要：

以语音样本作为输入，实现口语电话语音的关键词检出是本文的目的。文中提出的通过建立音素混淆网络进行扩展的算法，提高了由语音样本转化成声学模型序列的效果，扩展了基于语音样本方法的应用范围。尤其在说话人无关、口语化电话语音的情况下，取得了比较好的实用效果。实验结果显示，在说话人无关、口语化电话语音关键词检出任务中，每个关键词获得10个左右的随机样本时，其检出性能与专家知识注音的结果相当。

关键词：关键词检出基于样本音素混淆网络电话语音

作者: 孟猛梁家恩徐波

作者单位: 中科院自动化研究所数字内容技术研究中心,北京 100080 中科院自动化研究所数字内容技术研究中心,北京 100080;中科院自动化研究所模式识别国家重点实验室,北京 100080

会议类型: 国内会议

会议名称: 第三届全国信息检索与内容安全学术会议

会议地点: 苏州

会议语种:中文

页码: 764-770

在线出版日期: 2007-11-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于语音样本的口语电话语音关键词检出算法的改进研究