维、哈、柯文搜索引擎中自动分类技术的应用研究
本文在传统搜索引擎基础上,结合网页自动分类技术,对基于分类的维、哈、柯多语种信息检索进行了研究。文中提出了一种改进的特征选择算法,并建立了一个维吾尔文网页分类系统,搜集了大量的维文语料进行分类实验。结果表明,使用改进的特征选择方法能够有效提高分类的准确度。最后,将网页分类技术运用到维、哈、柯文搜索引擎中,实现了具有自动分类功能的多语种信息检索系统。
自动分类 特征选择 信息检索 搜索引擎
王珍 维尼拉·木沙江 赵丽红
新疆大学信息科学与工程学院,新疆,乌鲁木齐 830046 新疆多语种信息技术重点实验室,新疆,乌鲁木齐 830046 新疆多语种信息技术重点实验室,新疆,乌鲁木齐 830046 新疆大学信息科学与工程学院,新疆,乌鲁木齐 830046 新疆大学信息科学与工程学院,新疆,乌鲁木齐 830046 新疆多语种信息技术重点实验室,新疆,乌鲁木齐 830046
国内会议
第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会
乌鲁木齐
中文
106-110
2010-06-27(万方平台首次上网日期,不代表论文的发表时间)