多媒体网络语音音调数据特征智能识别方法
利用传统方法对多媒体网络语音音调数据特征进行识别,存在识别准确性低,识别速度慢的问题.针对上述问题,提出一种新的多媒体网络语音音调数据特征智能识别方法.该方法分为三部分:第一对输入的多媒体网络语音音调数据进行预处理,包括数据转换、预加重、分帧加窗和端点检测等4步;第二提取预处理数据特征参数,包括基音频率、共振峰、mel倒谱系数;第三利用GMM-SVM模型在提取到的特征参数基础上进行智能识别.结果表明:利用本方法对多媒体网络语音音调数据特征进行智能识别,与基于人工神经网络的语音特征识别方法和基于蚁群算法特征选择的语音识别方法相比,平均正确识别率提高8.3%和12.4%,平均所用时间减少0.7s和1.24s,识别速度加快.
多媒体网络 语音音调 特征提取 智能识别
周挺 杨荣
西安航空职业技术学院,西安710089
国内会议
四川绵阳
中文
132-135
2019-10-01(万方平台首次上网日期,不代表论文的发表时间)