会议专题

基于最大熵的维吾尔语词性标注模型

最大熵模型能够充分利用多个任意的特征。本文中提出基于最大熵模型的维吾尔语词性标注方法。本文中主要的工作是选出对兼类词和未登录词词性标注有较大贡献的特征。作为黏着语言,维吾尔语单词为表达语法功能而附加词缀。本文中,除了前后单词的词性和词形之外,把前后单词的最后词缀作为特征使用。实验结果表明,前后单词的最后词缀对兼类词和未登录词的词性标注有着明显的提高,模型准确率到达96.58%。

维吾尔语 词性标注 最大熵 特征提取

帕里旦·吐尔逊 艾山·吾买尔尔 吐尔根·依布拉音 早克热·卡德尔 阿力木江·艾沙

新疆大学软件学院,新疆,乌鲁木齐 830046 新疆多语种信息技术重点实验室,新疆 乌鲁木齐 830046 新疆大学信息科学与工程学院,新疆,乌鲁木齐 830046 新疆多语种信息技术重点实验室,新疆 乌鲁木齐 830046 新疆大学网络中心,新疆,乌鲁木齐 830046 新疆多语种信息技术重点实验室,新疆 乌鲁木齐 830046

国内会议

第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会

乌鲁木齐

中文

17-20

2010-06-27(万方平台首次上网日期,不代表论文的发表时间)