西双版纳傣文语料库的建设
随着少数民族语言信息化的发展,少数民族信息化已由字处理向语言处理转变,我国少数民族语言中,蒙、藏、维吾尔、朝鲜语以及彝语等有传统文字的民族都建立了语料库,目前唯独傣语没有语料库.2009年10月,西双版纳傣族自治州建立了第一个西双版纳傣文网站,该网站是一个多语网站,包括新傣文、老傣文、汉文、英文和泰文;主要包括12个方面内容:贝叶文化、傣乡资讯、东盟之窗、科技动态、旅游资讯、民族宗教、农业之窗、社会论坛、社会新闻、生活常识、文化生活、重要新闻;基本涵盖了傣族社会生活方方面面.其中贝叶文化、傣乡资讯、农业之窗、重要新闻、民族宗教五个板块占语料量的70%左右。西双版纳网站的开通,使傣族语言信息化成为可能。以西双版纳傣文网的新傣文语料为基础,建立了第一个傣语语料库。语料时间段2009年10月一2011年11月共两年,采取了分段处理、逐步累积的方式,语料总音节数727923个。
少数民族语言 傣文 语料库 功能模块
戴红亮 高廷丽
教育部语用所 中国社会科学院研究生院
国内会议
湘潭
中文
279-283
2011-10-22(万方平台首次上网日期,不代表论文的发表时间)