会议专题

基于格助词和接续特征的藏文自动分词方案

本文结合藏文各类形态特征,首次提出了一种基于格助词和接续特征(BCCF,Based on Case-auxiliary word and Continuous Feature)的书面藏文自动分词方案.其总体技术特点是:在格助词、接续特征、字性知识库以及词典支持下,进行逐级定位的确定性分词.初步测试表明:这一方案在发现和消除切分歧义、解决未登录词问题,进而在提高藏文分词精度方面具有很高的实用价值.

格助词 接续特征 藏文分词 自动分词方案 切分难点

陈玉忠 李保利 俞士汶 兰措吉

北京大学计算语言研究所(北京) 青海师范大学(西宁)

国内会议

第一届学生计算语言学研讨会

北京

中文

98-105

2002-08-01(万方平台首次上网日期,不代表论文的发表时间)