会议专题

口语对话语音语料库CADCC和其语音研究

口语对话和朗读语篇的差别表现在句法、副语言学现象、音段和韵律等许多方面,这给口语对话的标注带来新的课题.本文介绍自然口语对话语音语料库CADCC(Chinese Annotated Dialogue and Conversation Corpus)和其文字转写、音段以及韵律标注.CADCC包括两个子库:电话对话库set1和口语对话语篇库set2.其标注内容包括篇章话题、话轮、韵律和音段的标注.音段标注采用SAMPA-C标注系统,韵律标注采用C-ToBI标注系统.本文还报告了标注结果,如篇章话题的长度,口语话轮出现的模式,插入和叠接现象,韵律结构和朗读语篇的差异等等.

口语对话语音语料库 语音学标注

李爱军 殷治纲 王茂林 徐波 宗成庆

中国社会科学院语言研究所 中国科学院自动化研究所

国内会议

第五届全国现代语音学术会议

北京

中文

317-322

2001-08-30(万方平台首次上网日期,不代表论文的发表时间)