基于框架的汉语篇章结构生成和篇章关系识别

摘要：

针对汉语篇章分析的三个任务:篇章单元切割、篇章结构生成和篇章关系识别,本文提出引入框架语义进行分析研究.首先基于框架构建了汉语篇章连贯性描述体系以及相应语料库,然后抽取句首、依存句法、短语结构、目标词、框架等特征,分别训练基于最大熵的篇章单元间有无关系分类器和篇章关系分类器,最后采用贪婪算法自下向上生成篇章结构树.实验证明,框架语义可以有效切割篇章单元,并且框架特征可以有效提升篇章结构以及篇章关系的识别效果.

关键词：自然语言处理汉语篇章分析篇章结构生成篇章关系识别贪婪算法

作者: 苏娜吕国英李茹王智强柴清华

作者单位: 山西大学计算机与信息技术学院,山西太原030006 山西大学计算机与信息技术学院,山西太原030006;山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006 山西大学外国语学院,山西太原030006

会议类型: 国内会议

会议名称: 中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

会议地点: 广州

会议语种:中文

页码: 1-12

在线出版日期: 2015-11-13（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于框架的汉语篇章结构生成和篇章关系识别