基于引文上下文的学术文本自动摘要技术研究
学术文本自动摘要是指对于给定学术文献,自动地抽取其核心内容,以提高用户撰写和阅读文献的效率.目前基于文本词频对句子重要性排序的自动摘要技术无法从语义层面揭示学术文本的核心内容.本文在已有研究的基础上,引入引文上下文内容特征,并通过构建支持向量回归模型,综合考虑自动摘要系统中的各个特征对句子权重的影响,重新对句子重要性进行排序.基于WE-ROUGE的评测表明,相比于传统基于词频统计和图模型的方法,本文提出的算法能够有效提升自动摘要的准确度.
学术文本 自动摘要 引文上下文 支持向量回归 词向量
黄永 陈海华
武汉大学信息管理学院 武汉 430072
国内会议
武汉
中文
1-9
2016-07-01(万方平台首次上网日期,不代表论文的发表时间)