会议专题

基于框架的汉语篇章结构生成和篇章关系识别

针对汉语篇章分析的三个任务:篇章单元切割、篇章结构生成和篇章关系识别,本文提出引入框架语义进行分析研究.首先基于框架构建了汉语篇章连贯性描述体系以及相应语料库,然后抽取句首、依存句法、短语结构、目标词、框架等特征,分别训练基于最大熵的篇章单元间有无关系分类器和篇章关系分类器,最后采用贪婪算法自下向上生成篇章结构树.实验证明,框架语义可以有效切割篇章单元,并且框架特征可以有效提升篇章结构以及篇章关系的识别效果.

自然语言处理 汉语篇章分析 篇章结构生成 篇章关系识别 贪婪算法

苏娜 吕国英 李茹 王智强 柴清华

山西大学计算机与信息技术学院,山西 太原030006 山西大学计算机与信息技术学院,山西 太原030006;山西大学计算智能与中文信息处理教育部重点实验室,山西 太原030006 山西大学外国语学院,山西 太原030006

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-12

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)