基于关键词元的话题内事件检测
各种媒体每天有大量的新闻报道产生,需要一种自动化的分析方法将新闻以一种更加清晰的组织形式展示给用户。大多已有工作将新闻划分成平面的话题,然而一个话题并非仅仅是简单的新闻集合,而是由一系列的事件所组成的。由于话题内的事件之问往往非常相似,导致话题内的事件检测精确度较差。为了克服以上问题,本文提出了词元委员会的方法,首先挖掘每个事件的核心词元,随后利用事件的核心词元进行事件检测。在LDC的两个数据集上的实验结果显示,本文提出的事件检测方法可以显著的改善已有方法的效果。
事件检测 关键词元 话题 核心词元
张阔 李涓子 吴刚
清华大学计算机系,北京 100084
国内会议
苏州
中文
9-15
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)