一种话题敏感的抽取式多文档摘要方法
抽取式摘要的核心问题在于合理地建模句子,正确地判断句子重要性.本文提出一种计算句子话题重要性的方法,通过分析句子与话题的语义关系,判断句子是否描述话题的重要信息.针对自动摘要任务缺乏参考摘要作为训练数据的问题,本文提出一种基于排序学习的半监督训练框架,利用大规模未标注新闻语料训练模型.在DUC2004多文档摘要任务上的实验结果表明,本文提出的话题重要性特征能够作为传统启发式特征的有效补充,改进摘要质量.
文本自动摘要 卷积神经网络 排序学习
应文豪 李素建 穗志方
北京大学 计算语言学教育部重点实验室,北京市 100871
国内会议
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
南京
中文
1-10
2017-10-13(万方平台首次上网日期,不代表论文的发表时间)