HSK动态口语语料库的标注研究
本文介绍以HSK的高等考试的口试资料为资源,建立一个主要为语法研究和对外汉语教学服务的口语语料库—HSK动态口语语料库。HSK口语语料库的标注建立在语料转写的基础之上,遵循真实性、科学性和全面性的原则。标注过程中只标示偏误,不改动原文,尽量保持学习者的语言原貌。为了便于电脑软件的识别,所有的标注代码都采用国际通用代码—置标语言(XML)进行赋码。标注的范围包括拼音层和汉字层两个层面。拼音层标注的内容包括声、韵、调的偏误标注。汉字层标注的内容包括字、词、句、篇章等层次的标注。
汉语水平考试 动态口语 语料库 标注规则
王之岭 杨雯
北京语言大学汉语水平考试中心
国内会议
湘潭
中文
322-327
2011-10-22(万方平台首次上网日期,不代表论文的发表时间)