在查询反馈中改善文档聚类效果的策略研究

在信息检索的查询反馈处理中,可以利用聚类方法进行文档进而扩展查询条件”1”.这时被选择进行聚类的文档集合一般是小规模的,并且由于信息检索有限的性能,文档之间可能出现非常接近、一定程度上相似、基本无关等多种情况.本文针对信息检索的查询反馈处理中文档集合的这些特性,分析了使用聚类算法处理小规模文档集合面临的特殊问题,提出了在文档归并和孤立点分离基础上进行聚类的策略,取得了较好的聚类结果.
文档归并 孤立点 查询反馈 信息检索 文档聚类
李文波 孙乐
中国科学院软件研究所开放系统与中文信息处理中心(北京)
国内会议
上海
中文
204-211
2004-11-01(万方平台首次上网日期,不代表论文的发表时间)