基于层次模型的中文句法分析

摘要：

本文实现了一种基于循序渐进方式的中文句法分析。在每步处理过程中，优先识别出容易识别的组块，这样，将提供更有利的上下文信息进行复杂组块识别。在标注过程中，采用的是BIESO标记方式，并利用最大熵模型预测标记的概率。基于正确的分词结果，在宾州中文树库测试集Section271-300上得到的F值性能为83.07％(＜=40 words)和78.99％(＜=100 words)。

关键词：中文句法分析层次模型最大熵模型

作者: 李军辉周国栋朱巧明钱培德

作者单位: 苏州大学计算机科学与技术学院苏州 215006

会议类型: 国内会议

会议名称: 第三届全国信息检索与内容安全学术会议

会议地点: 苏州

会议语种:中文

页码: 814-820

在线出版日期: 2007-11-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于层次模型的中文句法分析