会议专题

口语文本语料库检索系统的建立与功能呈现

汉语中介语语料库是近年来新兴的、引起多方关注的一个研究方向.它的建设,推动了语言学、应用语言学及对外汉语教学等领域的相关本体、非本体的多项研究,作用日益突显,已为越来越多的人所认识.同时,人们对汉语中介语语料库的需求与要求也在不断增加.语料库的出现在一定意义上改变了汉语教学研究的传统思考方式.基于语料库的真实数据的研究使研究者发现了一些未被关注到或者未被发现的语言新现象,得出的新结论具有较强的创新性、真实性和时代性;基于语料库所做的相关研究提高了整个汉语教学研究的水平.为了得到这些满足各种需求的真实数据,就需要在已有的语料库基础上完善检索功能,为使用者提供更多的便利.本文拟用基于字表的索引和基于词表的索引设计实现一个基于带标记的全文检索算法的语料库检索系统.语料库则选取基于”HSK动态口语语料库”中音频文件转换后形成的文本信息(生语料或者经过标注的都可以,满足不同需求),进行初步的单机版计算机软件系统的构建.在该系统中,用户可以进行常规的检索,也可以进行各类信息的检索,或者尝试模式匹配的检索.同时该系统还提供相关统计信息、检索结果的保存以及其他辅助功能.语料库的背景信息也力争更加完善和全面.

对外汉语教学 中介语 口语语料库 检索系统

李航

北京语言大学汉语水平考试中心

国内会议

第二届汉语中介语语料库建设与应用国际学术讨论会

北京

中文

119-134

2012-08-01(万方平台首次上网日期,不代表论文的发表时间)