基于主题词迭代提取的信息检索算法
为了让用户从海量知识信息中精确、快速地获取到感兴趣的信息内容,综合考虑文档的头部信息(标题、摘要、关键词)和重点主体内容,采用基于主题词迭代提取的信息检索算法,使得主题词的提取在兼顾效率的同时准确率达到83﹪以上,主题信息检索的性能也随之增加.实验结果表明,在文档查询词频和倒排文档频率(TF-IDF)的基础上对候选主题词相关度权值的计算进行合理化调整,并利用所提出的主题词迭代提取算法,主题信息检索的有效性将显著增加.
主题词 迭代提取 信息检索
赵英环 郭贵锁
北京理工大学信息科学技术学院(北京)
国内会议
第二届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2004)
广州
中文
77-80
2004-11-12(万方平台首次上网日期,不代表论文的发表时间)