濒危语言吕苏语口语语料库的研究与构建
濒危语言口语语料库建立的目的是系统地保存近乎消失的濒危语言,留存濒危语言的生命力与地方文化,并且支持对其进行学习与研究。濒危语言口语语料库保存的内容主要包括原始声音文件、国际音标标注、汉语对译标注以及汉语翻译标注。以濒危语言吕苏语为范例,系统地研究与建立濒危语言口语语料库,并对吕苏语标注语料实现了自动分词与关键词提取的功能,为后续建立通用濒危语言语料库提供了一个范例。
濒危语言 口语语料库 吕苏语
操镭 尹蔚彬 孙沁瑶 王志 于重重 李道玮
北京工商大学 计算机与信息工程学院,北京 100048 中国社会科学院 民族学与人类研究所,北京 100081 四川大学 历史文化学院 成都 610064
国际会议
第五届自然语言处理与中文计算会议(NLPCC-ICCPOL2016)
昆明
中文
1-9
2016-12-02(万方平台首次上网日期,不代表论文的发表时间)