会议专题

维吾尔语词性标注方法研究

本文将维吾尔语附加成分的特点与概率统计的方法相结合。用词性概率与词汇概率混合的一阶HMM模型作为词性标注问题的语言模型,并采用RTF方法对概率参数进行估计。并运用viterbi算法以句子为单位进行词性标注。实验证明这种方法能在维吾尔语词性标注中取得很好的效果。虽然实验的过程中取得了一些突破性的成绩,但是标注的正确率还有待提高。在将来的研究中,还要进一步完善模型参数,从而进一步提高维吾尔语词性标注的正确率。

维吾尔语 词性标注 语言模型 参数估计

陈鹏 古丽拉·阿东别克 伊力亚尔·加尔木哈买提 张玉华

新疆大学信息科学与工程学院 乌鲁木齐 830046

国内会议

中国科协第六届青年学术年会卫星会议-新疆第六届青年学术年会暨首届博士生论坛

新疆克拉玛依

中文

426-429

2006-11-01(万方平台首次上网日期,不代表论文的发表时间)