一种面向查询的多文档文摘句选择策略
针对面向查询的多文档自动文摘,本文提出了一种多特征融合的文摘句选择策略。首先通过计算句子与查询在语义层面上的相似度,获取句子与查询的关联特征,然后运用构建的语义网络图挖掘句子的全局关联特征,并综合句子的这两方面特征,对其重要度进行评估。最后利用MMR技术,挑选文摘句。实验表明:对主题相对集中的文档集合,该方法以10%的压缩率生成的文摘效果较好;对子主题较多且与查询比较相关的文档集合,以20%的压缩率生成的文摘效果较好。
多特征融合 文摘句 句子挖掘 多文档文摘 语义网络图
邵伟 何婷婷 胡珀 肖华松
华中师范大学计算机科学系 武汉 430079 国家语言资源监测与研究中心网络媒体分中心 武汉 430079
国内会议
大连
中文
637-642
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)