会议专题

电话语音数据库的收集和标注

数据库的收集和标注对于开发出适用于特定领域的、高水平的人机口语对话系统是非常重要的.本文主要介绍了口语对话系统——EasyFlight中数据库收集和标注的第一阶段工作,同时对数据中存在的特有的汉语口语语言现象做出了分析.EasyFlight是一个航班查询订票系统,它针对的是电话语音.由于电话信道的特殊性,必须重新训练声学模型.该数据库的主要目的就是为声学模型提供训练数据,同时为语言理解模块的设计提供领域知识支持,也为对话管理中的应答生成提供参考.

电话语音数据库 人机口语对话系统 数据库收集 数据库标准

孙辉 徐明星 燕鹏举 吴文虎

清华大学计算机科学与技术系,智能技术与系统国家重点实验室

国内会议

第六届全国人机语音通讯学术会议

深圳

中文

325-328

2001-11-20(万方平台首次上网日期,不代表论文的发表时间)