会议专题

英汉《小王子》AMR语义图结构的对比分析

AMR是国际上一种新的句子抽象语义表示方法,有着接近于中间语言的表示能力,其研发者已经建立了英文《小王子》等AMR语料库.AMR与以往的句法语义表示方法的最大不同在于两个方面,首先突破了树结构,转而采用图结构;其次允许添加原句之外的概念节点来表示隐含的语义.本文针对汉语特点,在制定中文AMR标注规范的基础上,标注完成了中文版《小王子》的AMR语料库,标注一致性的Smatch值为0.83.统计结果显示,英汉双语含图结构句子具有很高的相关性,且含有图的句子比例高达40%左右,额外添加的概念节点则存在较大差异.最后讨论了AMR在汉语句子语义表示以及跨语言对比方面的优势.

抽象语义表示 语义图 自然语言处理 英语 汉语

李斌 闻媛 卜丽君 薛念文

南京师范大学文学院,江苏省南京市210097 布兰迪斯大学计算机系,美国沃尔瑟姆市02453

国内会议

第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD-2016)

烟台

中文

1-9

2016-10-14(万方平台首次上网日期,不代表论文的发表时间)