多话者环境下说话人辨识听觉线索研究
在多个说话人语音以及复杂的声环境中,辨识和跟踪某一个说话人的语音并提取语音信息,是语音识别技术走向应用面临的重要课题和难题。本文介绍了清浊音和不同元音等所含音质特征信息的测定,结果表明:语音信号中,含有说话人音质特征信息的音素主要是元音及浊辅音,清辅音中几乎不含有音质信息。而不同的元音所携带的信息量也是不等的,与该元音发音在日常语言环境中出现概率的信息熵成正比。同时,信息熵的计算分析还表明,在说话人识别过程中,大脑会将连续变化的发音分解成基本音素单元进行判断。
多话者环境 说话人辨识 语音识别 音质特征 信息熵 听觉线索
罗海风 龙长才
华中科技大学物理学院,武汉,430074
国内会议
长沙
中文
235-236
2009-10-16(万方平台首次上网日期,不代表论文的发表时间)