根节点解析和词性标注体系对中文依存关系解析的影响
我们已经提出一种考虑远距离依存关系的确定性中文依存关系解析方法,较好地解决了有些相互依存的词距离较远,使用传统的确定性解析方法难以解析的问题。但是自底向上的确定性依存关系解析没有考虑整句信息。本文构建了根节点解析器,为依存关系解析提供句子依存结构信息。实验采用哈尔滨工业大学的依存关系语料库,结果表明引入根节点解析器后根节点与依存关系解析精度均得到较大的提高。为提供更准确的学习特征,本文基于隐马尔可夫模型细化了语料库的词性标注体系,从而进一步提高了依存关系解析器的解析性能。
中文依存关系 解析性能 Nivre算法 支持向量机 根节点解析 词性标注体系 语料库
周惠巍 杨亚歌 黄德根
大连理工大学计算机科学与工程系,116024
国内会议
武汉
中文
89-95
2007-10-13(万方平台首次上网日期,不代表论文的发表时间)