会议专题

一个面向海量视音频应用的快速关键音检索系统

数字媒体技术的快速发展,使得对海量视音频信息进行高效检索的需求越来越广泛和迫切。本文介绍的关键音检索系统,融合了语音处理技术和信息检索技术,能够对海量音频信息进行快速的检索,找到检索词发音的准确位置,为语音内容自动检索提供了新的手段。该系统采用音素矩阵的索引和检索算法,构建在自主研发的并行计算平台之上,具有高准确率、稳定可靠和海量处理能力等优点。实验数据表明,该系统在检索准确度、速度和存储等方面均达到了实用的要求。

语音处理 关键词检测 并行计算 多媒体信息检索

高鹏 梁家恩 王晓瑞 徐波

中国科学院自动化所 数字内容技术研究中心,北京 100080 中国科学院自动化所,数字内容技术研究中心,北京 100080;中国科学院自动化所,模式识别国家重点实验室,北京100080

国内会议

第三届全国信息检索与内容安全学术会议

苏州

中文

771-776

2007-11-01(万方平台首次上网日期,不代表论文的发表时间)