基于子话题分治匹配的新事件检测1
新事件检测是话题检测与跟踪领域的一项重要研究,其任务是实时监控新闻报道流并从中识别新话题。现有方法将话题和报道描述为单一结构的特征向量进行匹配,造成子话题问互为噪声并形成错误语义,从而误导新话题的识别。针对这一缺陷,本文提出基于子话题分治匹配的新事件检测方法,将话题和报道划分为不同子话题,根据相关子话题的比例关系和分布关系建立新话题识别模型。实验在TDT4和TDT5中获得显著改进,最小检测错误代价为0.4061,相应漏检率为0.1859。
新事件检测 话题检测 报道 子话题
洪宇 张宇 范基礼 刘挺 李生
哈尔滨工业大学 计算机科学与技术学院 信息检索研究室,哈尔滨 150001
国内会议
苏州
中文
707-715
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)