会议专题

基于超图的文本摘要与关键词协同抽取研究

文本摘要和关键词抽取是自然语言处理领域的两个重要研究课题,它们均以生成描述文本主旨内容的精简信息为目标.尽管这两个任务目标相似,但它们通常被作为两个独立的问题分别研究,而较少考虑其彼此间的自然关联性.尽管已有学者提出了基于图模型的协同抽取方法,该方法同时考虑了句子与句子、词与词、句子与词之间的各种关系,以迭代强化的方式同时生成文本摘要和关键词,但现有模型大多仅限于表达句子与词之间的各种二元关系,而忽视了不同文本单元间潜在的若干重要的高阶关系.鉴于此,本文提出了一种新的基于超图的协同抽取方法.该方法以句子作为超边,以词作为结点构建超图,在一个统一的超图模型下同时利用句子与词之间的高阶信息来生成摘要和关键词.在NLPCC2015面向微博的新闻文本摘要任务数据集上的实验结果验证了本文所提方法的可行性和有效性.

文本摘要 关键词 协同抽取方法 超图模型

莫鹏 胡珀 黄湘冀 何婷婷

华中师范大学计算机学院,湖北省武汉市 430079

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-8

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)