会议专题

基于隐含语义索引和粗糙集的文本检索

通过对文本集的词-文档矩阵进行奇异值分解(SinguIar Value Decomposition,SVD),提取K-秩近似矩阵近似表征原词-文档矩阵,左右奇异向量分别为词向量和文档向量,在此基础上进行文本分类和其它各档处理,这就是隐含语义索引技术.本文对此问题进行了研究.该文利用查询向量和各文本向量之间的夹角余弦表示相似程度,寻找和用户查询最相似的文档集合,并按相似度的高低排列,将相似度大于用户预先设定的阈值的文档返回给用户。

隐含语义索引 粗糙集 文本检索 文档矩阵 奇异值分解

蒋红 梁久祯

浙江师范大学数理与信息工程学院,金华,321004

国内会议

第六届中国Rough集与软计算学术研讨会(CRSSC”2006)

浙江金华

中文

155-157

2006-10-30(万方平台首次上网日期,不代表论文的发表时间)