会议专题

一种结合BaseNP识别的汉语概率句法分析改进模型

基本短语,尤其是基本名词短语(BaseNP)一直是句法分析中需要特殊处理的一种结构。准确地识别基本短语不仅有助于降低句法分析的复杂度,提高效率;而且还能起到消歧的作用,从而改善句法分析的结果。本文在Collins概率句法分析模型中引进单独的基本名词短语识别,并对BaseNP的概念进行一系列的扩展,深入研究了基于不同层次概念的BaseNP对句法分析的影响。在此基础上,利用改进的Collins句法分析模型进行中文的句法分析实验,实验结果表明,BaseNP的识别可以缩短分析时间35%,提高F值0.74个百分点,交叉括号平均减少12.5%.

概率模型 汉语句法 基本短语 名词短语 句法分析

何亮 戴新宇 周俊生 陈家骏

南京大学计算机软件新技术国家重点实验室 江苏省 南京市210093 南京大学计算机软件新技术国家重点实验室 江苏省南京市 210093H 南京大学计算机软件新技术国家重点实验室 江苏省南京市 210093 南京师范大学计算机科学系 江苏省南京市 210097 南京大学计算机软件新技术国家重点实验室 江苏省南京市 210093

国内会议

第九届全国计算语言学学术会议

大连

中文

89-95

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)