会议专题

基于支持向量机的中文指代消解

本文提出了一种基于支持向量机(SVM)的中文名词短语的指代消解方法,并给出具体实现系统,在ACE2005中文语料上对所有的名词短语进行消解.测试得到的F值为63.3%.本文系统分析了SVM中不同核函数对分类结果的影响以及每一个特征对指代消解的贡献,并详细考察实验结果的错误分布。经实验发现,同位语、别名和字符串匹配这三个特征的贡献最大.指代遗漏是本系统出现最多的错误,主要原因是目前的特征不足,不能有效解决相应指代.

指代消解 支持向量机 核函数 特征向量 中文语料 字符串匹配

谭魏璇 孔芳 王海东 周国栋

苏州大学计算机科学与技术学院,江苏,苏州,215006 江苏省计算机信息处理技术重点实验室,江苏,苏州,215006

国内会议

2009中国计算机大会

天津

中文

907-914

2009-10-23(万方平台首次上网日期,不代表论文的发表时间)