基于向量空间模型的文本过滤系统
文本过滤指的是从大量的文本数据流中寻找满足特定用户需求的文本的过程.本文首先从任务、测试主题、语料库和评测指标等方面介绍了文本检索领域最权威的国际评测会议——文本检索会议(TREC)及其中的文本过滤项目;然后详细地描述了我们提出的基于向量空间模型的文本过滤系统,该系统参加了2000年举行的第九次文本检索会议的评测,取得了很好的成绩,其中自适应过滤和批过滤的平均准确率分别为26.5﹪和31.7﹪,在来自多个国家的15个系统中名列前茅.
文本检索 文本过滤 向量空间模型
黄萱菁 夏迎炬 吴立德
复旦大学计算机系(上海)
国内会议
北京
中文
215-225
2001-11-11(万方平台首次上网日期,不代表论文的发表时间)