会议专题

基于树核函数的中文语义角色标注研究

目前使用特征方法进行语义角色标注研究已经遇到发展瓶颈,性能难以进一步提高;而基于核函数的方法可以充分利用特征方法无法表示的结构化信息,有进一步研究的空间。本文使用SVM提供的卷积树核函数构造了—个中文语义角色标注系统,该系统以依存关系作为标注单元进行中文语义角色标注。本文重点描述了通过不同的裁剪方法来获得依存树的结构化信息,裁剪后的依存树分别为最短路径树和最小树。在中文ProDBank和NomBank的转换语料上的实验结果表明:使用最小树能得到系统的最佳性能,在动词性谓词和名词性谓词上分别获得82.87,76.40的F1值。

语义角色标注 树核 依存关系

王步康 王红玲 袁晓虹 周国栋

苏州大学计算机科学与技术学院 江苏 苏州 215006 江苏省计算机信息处理技术重点实验室,江苏 苏州 215006

国内会议

第五届全国青年计算语言学研讨会(YWCL 2010)

武汉

中文

36-42

2010-10-11(万方平台首次上网日期,不代表论文的发表时间)