LPC及F0参数组合基于GMM电话语音说话人识别
该文报告了组合LPC参数以及基频F0的高斯混合模型(GMM)电话语音说话人自动识别技术的实验研究结果。该研究在基线试验中GMM使用16混合共分散对角矩阵,特征量为LPC倒谱系数。而在开发系统测试中分别利用语音的全发话区间和有声区间两部分参数增加基频参数进行试验,并给出实验比较结果。在50人电话通话开放集自动切分语音流实验中正确识别率为76.97%,而提案方法为80.29%,改善率为3.32%。接近人工切分语音流时的识别率82. 34%。
电话语音 语音识别 倒频系数 基频参数 高斯混合分布模型
伊·达瓦 吾守尔·斯拉木 匂坂芳典
新疆大学信息科学与工程学院,新疆乌鲁木齐 830014 新疆多语种技术重点实验室,新疆乌鲁木齐 830014 早稻田大学大学院国际情报通信研究科,日本,东京,169-0051 新疆大学信息科学与工程学院,新疆乌鲁木齐 830014 新疆多语种技术重点实验室,新疆乌鲁木齐 830014 早稻田大学大学院国际情报通信研究科,日本,东京,169-0051
国内会议
呼和浩特
中文
105-109
2011-07-29(万方平台首次上网日期,不代表论文的发表时间)