一种高效的语音关键词检索系统

摘要：

本文针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统，可以高效地从大量语音数据中检索出感兴趣的文本信息，从而达到为国家安全服务的日的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆盖率的拼音图，在这一过程中通过若干次的无监督最大似然线性回归自适应算法渐次提高拼音图的质量。检索阶段响应用户的频繁查询，只需在拼音图中查找出与关键词拼音匹配的拼音串，并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选。实验表明：系统具有较高的召回率和正确率，且检索阶段仅需0.01倍实时，可以满足快速检索的需要。

关键词：语音数据关键词检索声学识别

作者: 罗骏欧智坚

作者单位: 清华大学电子工程系,北京 100084

会议类型: 国内会议

会议名称: 2005全国网络与信息安全技术研讨会

会议地点: 北京

会议语种:中文

页码: 121-128

在线出版日期: 2005-08-30（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种高效的语音关键词检索系统