会议专题

哈萨克语词构形附加成分的切分研究及实现

本文研究了哈萨克语自动词法分析中的构形附加成分的切分和词干提取问题。系统首先对待切分词使用有限状态自动机进行分析。如果成功则将输出作为切分结果,否则再使用双向全切分和词法分析相结合的改进方法来进行切分。与双向切分和全切分算法相比较,该方法提高了词干提取的正确率和切分速度。同时,本文在词干表的搜索中首次采用了改进的29逐字母二分词典查询机制来提高了词干提取的效率。

构形附加成分切分 有限状态自动机 双向匹配 全切分 哈萨克语 自动词法

达吾勒.阿布都哈依尔 古丽拉.阿东别克

新疆大学信息科学与工程学院 新疆,乌鲁木齐 830046

国内会议

第二届全国少数民族青年自然语言处理学术研讨会

合肥

中文

180-184

2008-10-07(万方平台首次上网日期,不代表论文的发表时间)