针对目标语种检出的对数域音素后验概率特征优化

在传统语种识别中,特征研究的目标在于提取各个语种间的语言鉴别性信息.但在安全领域应用中,常常只对某一特定语种感兴趣,这就要求特征能够最大限度的体现目标语种与其他语种间的差异.为了解决这个问题,本文对在语种识别任务中取得优秀性能的对数域音素后验概率特征进行优化,来提高目标语种检出任务的性能.应用F比方法来分析特征向量每一维对目标语种检出的贡献大小.在本文方法中,首先利用音素识别器来估计帧级的音素后验概率;然后将其变换到对数域;接着根据特征向量每一维F比的值,通过加权的方式来优化特征;最后,利用主成分分析方法来去除特征相关性,并降低其维数.在美国国家标准技术署2007年语种识别测试集上的实验显示,在高斯混合模型-支持向量机系统上,相比于应用原特征的结果,本文优化后的特征在等错率指标上取得了显著的提升.
语种识别 目标检出 对数域 音素后验概率 加权优化 F比方法
张健 袁庆升 包秀国 周若华 颜永红
中国科学院信息工程研究所;中国科学院声学研究所 中国科学院信息工程研究所;国家计算机网络应急技术处理协调中心 中国科学院声学研究所
国内会议
武汉
中文
259-263
2015-05-26(万方平台首次上网日期,不代表论文的发表时间)