基于层次模型的中文句法分析
本文实现了一种基于循序渐进方式的中文句法分析。在每步处理过程中,优先识别出容易识别的组块,这样,将提供更有利的上下文信息进行复杂组块识别。在标注过程中,采用的是BIESO标记方式,并利用最大熵模型预测标记的概率。基于正确的分词结果,在宾州中文树库测试集Section271-300上得到的F值性能为83.07%(<=40 words)和78.99%(<=100 words)。
中文句法分析 层次模型 最大熵模型
李军辉 周国栋 朱巧明 钱培德
苏州大学计算机科学与技术学院 苏州 215006
国内会议
苏州
中文
814-820
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)