会议专题

一种基于背景模型的自适应的对话语流切分方法

本文提出了一种无需先验知识的基于背景模型分段自适应的说话人建模方法,并用于对话语流的切分.该方法首先构建能够描述整体样本语音(包括混合语音)的高斯模型,然后”有效”选择语音段并运用MAP自适应算法产生新的说话人初始模型,最后采用自适应迭代的方式,重复切分语音段和训练模型,最终获得所需的两个说话人的模型.实验结果表明,在人工组合的语流上,样本基本能够被正确切分,对于自然语流,无噪语音的样本,在保证某一方正确率在97%以上的时候,另一方能达到90%以上的正确率,而含噪语音的样本其切分正确率也在85%以上.

背景模型 自适应迭代 语流切分 建模方法

符铁砚 邓就庆 胡起秀 徐光祐

清华大学计算机科学与技术系人机交互与媒体集成研究所

国内会议

第十二届全国多媒体技术学术会议

贵州

中文

265-272

2003-09-01(万方平台首次上网日期,不代表论文的发表时间)