会议专题

汉语虚词相关的短语边界在句法分析中的应用研究

句法分析是根据给定的语法,自动地推导出句子语法结构,即句子所包含的句法单元和这些句法单元之间的关系。句法分析是自然语言处理的基本问题之一,它是机器翻译、舆情分析和自动文摘等应用系统的基础,句法分析的准确性直接影响应用系统的效果。本文通过在构建汉英双语树库的工作中发现,包含虚词成分的短语边界错误能够影响到句法分析结果,因此本文使用基于规则、CRF 模型和CNN 模型进行虚词相关的短语边界识别研究.针对CTB8.0 的实验结果表明,基于CNN 模型的短语边界识别效果最好,平均准确率达到了75.63%.本文另外提出了一种基于虚词相关的短语边界的句法分析模型Phrase_Based Parser,在CTB8.0 上的句法分析结果的平均准确率达到了80.78%.

汉语虚词 短语边界识别 句法分析 双语树库

冯晓波 穆玲玲 昝红英 张坤丽

郑州大学信息工程学院 河南 郑州 450001

国内会议

第十二届全国机器翻译研讨会

乌鲁木齐

中文

38-46

2016-08-25(万方平台首次上网日期,不代表论文的发表时间)