会议专题

基于分解的向量空间模型的Web新闻信息检索

在分析了传统向量空间检索模型的不足的基础上,给出了一种利用分解的向量空间模型进行Web新闻信息检索的方法.该方法没有使用传统向量空间模型中的单个向量,而是按照语义将特征词划分为4个组(人物,时间,地点,内容)并形成4个向量空间,每个空间进行独立的权重计算和相似度计算.而且将报道中的时间信息标准化,利用地理知识将报道中的地点特征词扩充,并利用这些信息进行检索.实验证明这些方法是有效的.

信息检索 向量空间模型 时间 地点 人物 内容

王卫东 宋丹 宋人杰

东北电力大学,计算机系,吉林,吉林,132012 大连理工大学,计算机科学与工程系,辽宁,大连,116024

国内会议

第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)

济南

中文

135-138

2006-07-21(万方平台首次上网日期,不代表论文的发表时间)