会议专题

多功能语音/音频信息检索系统的研究与实现

语音/音频是一种重要的信息载体.本文描述了如何综合运用语音识别、说话人识别等技术,实现一个多功能语音/音频信息检索系统,能够从语音/音频库中检索(searching)出感兴趣的信息.感兴趣的语音/音频信息呈现出不同的形式,可以是关键词,或者关键说话人,或者关键音频.本文提出了一个两阶段系统框架,介绍了如何在这样的两阶段系统框架下统一实现三项不同形式的语音/音频信息检索,描述了每一项检索功能的实现方法.实验表明,系统在检索性能和速度上都能达到一个较高的水平.

信息检索 关键词检测 说话人检测 音频检测

欧智坚 罗骏 谢达东 赵贤宇 林晖 王作英

清华大学电子工程系(北京)

国内会议

全国网络与信息安全技术研讨会”2004

北京

中文

106-112

2004-08-01(万方平台首次上网日期,不代表论文的发表时间)