基于热传导模型的更新摘要算法
更新摘要假设在用户已经读过某话题的一些相关文档的情况下,对新来的该话题相关文档集合自动生成摘要。可以看出,它除了要解决传统的面向话题的多文档摘要的两个要求(话题相关性和信息多样性)之外,还要求应对用户对信息新颖性的需求。本文为更新摘要提出了一个新的基于热传导模型的抽取式摘要算法。具体而言,该算法通过设置句子网络上的热传导模型中的边界条件,自然地利用句子与话题之间的关系,新句子和旧句子之间的关系,以及已选句子和待选句子之间的关系,为更新摘要找出话题相关、信息多样且内容新颖的句子。因此,该方法能够在一个统一的模型中同时解决更新摘要所要应对的三个主要问题。在TAC09数据集上的进行了实验,ROUGE评价指标上的实验结果表明,该方法与参加TAC09更新摘要任务的表现最好的抽取式方法性能相当,且显著地优于其他基准方法。
更新摘要 多文档摘要 热传导模型 抽取式摘要 ROUGE评价
杜攀 郭嘉丰 张瑾 程学旗
中国科学院计算技术研究所网络重点实验室,北京,100190
国内会议
黑龙江镜泊湖
中文
457-464
2010-08-12(万方平台首次上网日期,不代表论文的发表时间)