会议专题

多话者环境下说话人辨识听觉线索研究

在多个说话人语音以及复杂的声环境中,辨识和跟踪某一个说话人的语音并提取语音信息,是语音识别技术走向应用面临的重要课题和难题。本文介绍了清浊音和不同元音等所含音质特征信息的测定,结果表明:语音信号中,含有说话人音质特征信息的音素主要是元音及浊辅音,清辅音中几乎不含有音质信息。而不同的元音所携带的信息量也是不等的,与该元音发音在日常语言环境中出现概率的信息熵成正比。同时,信息熵的计算分析还表明,在说话人识别过程中,大脑会将连续变化的发音分解成基本音素单元进行判断。

多话者环境 说话人辨识 语音识别 音质特征 信息熵 听觉线索

罗海风 龙长才

华中科技大学物理学院,武汉,430074

国内会议

中国声学学会2009年青年学术会议

长沙

中文

235-236

2009-10-16(万方平台首次上网日期,不代表论文的发表时间)