会议专题

英语口语重复修正检错中语法网络和搜索过滤算法研究

  本文针对口语重复修正检错这一计算机辅助语言学习中的难点,提出一种基于音节WFST网络的容错对齐和搜索过滤算法。该算法将对齐后识别结果中邻近匹配词所对应的脚本建立上述语法网络进行二次识别下的容错对齐,得到的候选reparandum 和repair 作为搜索过滤的查询和模板。最终,重复修正检错结果由搜索过滤算法的置信度决定。为此,本文提出了基于顺序假设的k-difference 算法和基于随机假设的n-gram算法。实验表明,不使用二次容错对齐时,以音节为建模单元的多n-gram 混合搜索过滤取得了相对最优的结果;使用二次容错对齐时,能够获得F-measure3-4个点的进一步提升。

语言学习 语音识别 音节容错 数理语言学

黄申 李宏言 王士进 徐波

中国科学院 自动化所研究所 数字内容技术研究中心,北京 100190

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-6

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)