说话人分割聚类研究进展
说话人分割聚类是近几年新兴起的语音信号处理研究方向,它主要研究如何确定连续语流中多说话人起止时间的位置,并标出每个语音段对应的说话人.这项研究对自动语音识别、多说话人识别和基于内容的音频分析等都具有重要的意义.根据说话人分割和聚类实现过程不同,本文从异步策略和同步策略的角度回顾了十年来国内外研究的主流算法、技术和代表系统,对比了不同代表系统在近几年NIST富信息转写评测的结果,最后讨论了目前还存在的问题,并对未来的发展进行了展望.
语音信号 说话人 分割聚类系统 贝叶斯信息判决
马勇 鲍长春
北京工业大学电子信息与控制工程学院语音与音频信号处理研究室,北京 100124;江苏师范大学物理与电子工程学院,徐州 221009 北京工业大学电子信息与控制工程学院语音与音频信号处理研究室,北京 100124
国内会议
哈尔滨
中文
1190-1199
2013-10-01(万方平台首次上网日期,不代表论文的发表时间)