一种快速说话人搜索算法

摘要：

随着音频数据的不断增加，说话人识别已经变得越来越困难。本文提出了一种新颖的方法，在已有的说话人识别系统(GMM-UBM系统)的基础上，综合利用.Index和Simulation，以很小的代价，极大的提高了说话人识别的速度，从而使说话人搜索成为可能。具体而言，就是采用两遍搜索策略，首先通过建立索引，在索引空间，比较索引间的欧氏距离，粗略的筛选出一定量的候选说话人目标；然后在此基础上，通过更精细的Simulation模型匹配，找出最佳的识别结果。实验结果显示我们的方法能以很小的代价，显著的提高说话人识别的速度。

关键词：说话人识别说话人搜索两遍搜索

作者: 朱磊江杰郑榕徐波

作者单位: 中科院自动化研究所数字内容技术研究中心,北京 10086 中科院自动化研究所,数字内容技术研究中心,北京 10086,中科院自动化研究所,模式识别国家重点实验室,北京 10086

会议类型: 国内会议

会议名称: 第三届全国信息检索与内容安全学术会议

会议地点: 苏州

会议语种:中文

页码: 777-782

在线出版日期: 2007-11-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种快速说话人搜索算法