基于互信息的粗糙集信息检索模型
在信息检索过程中,由于文档中存在大量的多义和近义现象,导致不确定性出现,这将影响检索的性能.为此采用基于互信息的粗糙集理论来处理这类不确定性问题.首先计算训练文档集中的词之间的互信息,对互信息做模糊聚类来构造词之间的等价关系,然后借助于该等价关系提出并实现了一个以粗糙集上下近似为基础的信息检索模型,通过实验的测试,该模型能够提高信息检索的效率.
互信息 模糊聚类 粗糙集 信息检索
付雪峰 刘邱云 王明文
南昌工程学院,计算机科学与技术系,江西,南昌,330099 江西师范大学,数学与信息科学学院,江西,南昌,330022 江西师范大学,计算机信息工程学院,江西,南昌,330022
国内会议
第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)
济南
中文
116-119
2006-07-21(万方平台首次上网日期,不代表论文的发表时间)