会议专题

研究维吾尔文Web文档聚类算法设计与实现

随着网络信息量的迅速增长,传统的搜索引擎技术也只能为用户提越来越长的检索结果列表。用户不得不从中进行按照自己标准的二次检索.浪费了时间和效率.针对这问题,据挖掘领域中的聚类技术引入网络信息搜索中(Web聚类技术),以解决搜索引擎结果集不便于用户浏览问题为目的。本论文分析维吾尔语的词法特点,选择适合维吾尔文文本聚类的牲,构造可展后缀树,选择基类,合并基类,把维吾尔文网页按相似度分成不同的类并形成类标签。

聚类 后缀树 STC STCI

买买提依明·哈斯木 维尼拉·木沙江

新疆大学信息科学与工程学院,新疆,乌鲁木齐 830046 新疆多语种信息技术重点实验室,新疆,乌鲁木齐 830046

国内会议

第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会

乌鲁木齐

中文

137-140

2010-06-27(万方平台首次上网日期,不代表论文的发表时间)