基于向量空间模型的文本过滤系统

摘要：

文本过滤指的是从大量的文本数据流中寻找满足特定用户需求的文本的过程.本文首先从任务、测试主题、语料库和评测指标等方面介绍了文本检索领域最权威的国际评测会议——文本检索会议(TREC)及其中的文本过滤项目;然后详细地描述了我们提出的基于向量空间模型的文本过滤系统,该系统参加了2000年举行的第九次文本检索会议的评测,取得了很好的成绩,其中自适应过滤和批过滤的平均准确率分别为26.5﹪和31.7﹪,在来自多个国家的15个系统中名列前茅.

关键词：文本检索文本过滤向量空间模型

作者: 黄萱菁夏迎炬吴立德

作者单位: 复旦大学计算机系(上海)

会议类型: 国内会议

会议名称: 中国中文信息学会二十周年学术会议

会议地点: 北京

会议语种:中文

页码: 215-225

在线出版日期: 2001-11-11（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于向量空间模型的文本过滤系统