基于格助词和接续特征的藏文自动分词方案
本文结合藏文各类形态特征,首次提出了一种基于格助词和接续特征(BCCF,Based on Case-auxiliary word and Continuous Feature)的书面藏文自动分词方案.其总体技术特点是:在格助词、接续特征、字性知识库以及词典支持下,进行逐级定位的确定性分词.初步测试表明:这一方案在发现和消除切分歧义、解决未登录词问题,进而在提高藏文分词精度方面具有很高的实用价值.
格助词 接续特征 藏文分词 自动分词方案 切分难点
陈玉忠 李保利 俞士汶 兰措吉
北京大学计算语言研究所(北京) 青海师范大学(西宁)
国内会议
北京
中文
98-105
2002-08-01(万方平台首次上网日期,不代表论文的发表时间)