利用基频帧间差识别声调的方法
本文提出了一种利用基频帧间差进行模式分类进而判断汉语普通话四个声调的方法,并且使用这种方法对连续语句进行了识别实验,总体上来看,应用了利用基频帧间差直接进行声调识别的方法后,汉语四个声调判定的准确率达到了90%以上。其中阴平和去声的识别率相对较高,这是由于去声的声调模式在连续语流中没有太多的改变。而阳平和上声的识别率却相对较低,这是由于在三字词和连续语句的情况下,阳平和上声都会出现不同与双字词时的变调情况,这种变调情况影响了识别结果。下一步工作是完善变调情况的识别。
声调识别 汉语普通话 基频帧间差 基音检测算法
王星 刘亚丽 谢凌云
中国传媒大学传播声学研究所,北京,100024
国内会议
中国声学学会第八届全国会员代表大会暨2014年全国声学学术会议
北京
中文
325-327
2014-11-01(万方平台首次上网日期,不代表论文的发表时间)