一种结合BaseNP识别的汉语概率句法分析改进模型

摘要：

基本短语,尤其是基本名词短语(BaseNP)一直是句法分析中需要特殊处理的一种结构。准确地识别基本短语不仅有助于降低句法分析的复杂度,提高效率;而且还能起到消歧的作用,从而改善句法分析的结果。本文在Collins概率句法分析模型中引进单独的基本名词短语识别,并对BaseNP的概念进行一系列的扩展,深入研究了基于不同层次概念的BaseNP对句法分析的影响。在此基础上,利用改进的Collins句法分析模型进行中文的句法分析实验,实验结果表明,BaseNP的识别可以缩短分析时间35％,提高F值0.74个百分点,交叉括号平均减少12.5％.

关键词：概率模型汉语句法基本短语名词短语句法分析

作者: 何亮戴新宇周俊生陈家骏

作者单位: 南京大学计算机软件新技术国家重点实验室江苏省南京市210093 南京大学计算机软件新技术国家重点实验室江苏省南京市 210093H 南京大学计算机软件新技术国家重点实验室江苏省南京市 210093 南京师范大学计算机科学系江苏省南京市 210097 南京大学计算机软件新技术国家重点实验室江苏省南京市 210093

会议类型: 国内会议

会议名称: 第九届全国计算语言学学术会议

会议地点: 大连

会议语种:中文

页码: 89-95

在线出版日期: 2007-08-06（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种结合BaseNP识别的汉语概率句法分析改进模型