会议专题

HSK动态口语语料库的标注研究

本文介绍以HSK的高等考试的口试资料为资源,建立一个主要为语法研究和对外汉语教学服务的口语语料库—HSK动态口语语料库。HSK口语语料库的标注建立在语料转写的基础之上,遵循真实性、科学性和全面性的原则。标注过程中只标示偏误,不改动原文,尽量保持学习者的语言原貌。为了便于电脑软件的识别,所有的标注代码都采用国际通用代码—置标语言(XML)进行赋码。标注的范围包括拼音层和汉字层两个层面。拼音层标注的内容包括声、韵、调的偏误标注。汉字层标注的内容包括字、词、句、篇章等层次的标注。

汉语水平考试 动态口语 语料库 标注规则

王之岭 杨雯

北京语言大学汉语水平考试中心

国内会议

第七届全国语言文字应用学术研讨会

湘潭

中文

322-327

2011-10-22(万方平台首次上网日期,不代表论文的发表时间)