会议专题

一种快速说话人搜索算法

随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用.Index和Simulation,以很小的代价,极大的提高了说话人识别的速度,从而使说话人搜索成为可能。具体而言,就是采用两遍搜索策略,首先通过建立索引,在索引空间,比较索引间的欧氏距离,粗略的筛选出一定量的候选说话人目标;然后在此基础上,通过更精细的Simulation模型匹配,找出最佳的识别结果。实验结果显示我们的方法能以很小的代价,显著的提高说话人识别的速度。

说话人识别 说话人搜索 两遍搜索

朱磊 江杰 郑榕 徐波

中科院自动化研究所 数字内容技术研究中心,北京 10086 中科院自动化研究所,数字内容技术研究中心,北京 10086,中科院自动化研究所,模式识别国家重点实验室,北京 10086

国内会议

第三届全国信息检索与内容安全学术会议

苏州

中文

777-782

2007-11-01(万方平台首次上网日期,不代表论文的发表时间)