会议专题

动态多文档自动摘要研究

框架下,本文针对事件发展的动态性提出了一种先进行文档过滤再进行摘要抽取的方法,其中文档过滤的原则为:体现出当前文档集合与历史文档的区别,并提取反映当前文档集合主题的语句.根据文档过滤的原则,引入语句的相似度计算,着重考虑了命名实体及词性对结果的影响。在2007年的文档理解会议(Document Understanding Conference,DUC),利用该方法反馈的评测结果以及我们自己的实验数据显示这种方法对于捕获事件发展的动态性是有效的。

动态多文档 自动摘要抽取 语句相似度计算 命名实体 词性 文档过滤

张煜 李素建 欧阳佑

北京大学计算语言学研究所

国内会议

第七届中文信息处理国际会议

武汉

中文

520-525

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)