会议专题

用于哼唱识别精确匹配的线性伸缩动态规划算法

本文提出一种用于哼唱识别精确匹配的线性伸缩动态规划算法。该算法将哼唱旋律切割成句子,对每一句子线性伸缩匹配同时在句子层次进行动态规划获得最优路径。该算法更有效利用了哼唱语音的分段特性并克服了动态规划在长路径时可能丢失全局最优路径的缺点。在5223首歌曲数据库上同等条件下该算法正确率相比线性伸缩、动态规划及递归匹配分别提高10.5”%”、6.0”%”和2.8”%”。该算法具有更高准确率和更小时间复杂度,是一种更有效的精确匹配算法。

检索机 哼唱识别 递归匹配 线性伸缩 动态规划

曹文晓 刘轶 郑方 蒋丹宁 秦勇

清华大学信息技术研究院语音和语言技术中心,清华大学计算机系,北京 100086 IBM中国研究中心,北京 100094

国内会议

第十届全国人机语音通讯学术会议

乌鲁木齐

中文

1-6

2009-08-14(万方平台首次上网日期,不代表论文的发表时间)