统计和规则相结合的汉语最长名词短语自动识别

摘要：

本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法。首先使用条件随机场模型进行标注识别,再结合最长名词短语的边界信息和内部结构信息对错误识别结果进行后处理。实验结果表明,本文提出的统计和规则相结合的自动识别方法是有效的,开放测试结果F值达到了90.2％。

关键词：汉字处理短语识别条件随机场数理语言学

作者: 代翠周俏丽蔡东风

作者单位: 沈阳航空工业学院知识工程中心,辽宁沈阳 110034

会议类型: 国内会议

会议地点: 太原

会议语种:中文

页码: 76-82

在线出版日期: 2008-07-23（万方平台首次上网日期，不代表论文的发表时间）

会议专题