会议专题

蒙古文词语切分在自动词性标注中的应用

本文首先介绍了蒙古文附加成分的切分方法,然后描述了改进的蒙古文自动词性标注系统的总体结构,最后以规模为95万词的语料库作为训练语料,对5万词的测试文本进行了一级标注,封闭测试标注准确率和排歧准确率分别为97.9%和85.9%,开放测试标注准确率和排歧准确率分别为97.6%和85.5%。

隐马尔可夫模型 蒙古文词语切分 蒙古文词性标注 Viterbi算法

艳红 王斯日古楞

内蒙古师范大学计算机与信息工程学院 呼和浩特 010022

国内会议

第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会

乌鲁木齐

中文

83-86

2010-06-27(万方平台首次上网日期,不代表论文的发表时间)