基于Web的民文信息检索中维、哈、柯文关键词的预处理
基于Web的信息检索中,用户希望的是得到与关键词(key words)相关的,准确而全面的搜索结果,而基于Web的民文信息检索中深入研究本民族语言特征并对搜索关键词进行一些必要的预处理对民文搜索引擎搜索结果的准确性,全面性是非常重要的。本文介绍了维吾尔文,哈萨克文和柯尔克孜文的语言特征并较深入的研究了维吾尔文,哈萨克文和柯尔克孜文关键词的预处理技术,包括对关键词的检错与纠错,同化(弱化)处理,词根切分技术等。
民文信息检索 词根切分技术 同化处理 关键词检错 关键词纠错 语言特征
吐尔地·托合提 维尼拉·木沙江 艾斯卡尔·艾木都拉
新疆大学信息科学与工程学院,乌鲁木齐,830046
国内会议
武汉
中文
313-316
2007-10-13(万方平台首次上网日期,不代表论文的发表时间)