一种基于背景声音识别的社会情境感知方法
随着社会需求的不断扩大及技术的不断发展,人们之间的社会交互也越来越多。理解社会交互特征并能感知用户所处的社会情境语义(如在开会、在上课),对于促进和辅助用户社会活动具有重要意义。本文从背景声音的角度对社会交互进行理解,目的是通过对背景声音差异性特征的提取,识别用户所处的社会情境。我们提出了一种基于背景声音识别的社会情境感知方法,该方法采用Mel frequency cepstral coefficients (MFCCs,即Mel 频率倒谱系数)分析声音信号,路径搜索限制和搜索过滤的改进Dynamic Time Warping (DTW)算法作为识别器。通过对11 种社会情境背景声音的采集和识别,证明本算法能有效识别用户所处的社会情境,且其运算效率与识别率比传统DTW 算法有提高。
社会情境感知 背景声音识别 Mel频率倒谱系数 DTW 算法
杨曜 郭斌 於志文
西北工业大学软件与微电子学院,西安710072 西北工业大学计算机学院,西安710072
国内会议
第21届全国多媒体技术、第8届全国普适计算、第8届全国人机交互联合学术会议
广州
中文
1-8
2012-11-23(万方平台首次上网日期,不代表论文的发表时间)