统计和规则相结合的汉语最长名词短语自动识别
本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法。首先使用条件随机场模型进行标注识别,再结合最长名词短语的边界信息和内部结构信息对错误识别结果进行后处理。实验结果表明,本文提出的统计和规则相结合的自动识别方法是有效的,开放测试结果F值达到了90.2%。
汉字处理 短语识别 条件随机场 数理语言学
代翠 周俏丽 蔡东风
沈阳航空工业学院知识工程中心,辽宁 沈阳 110034
国内会议
太原
中文
76-82
2008-07-23(万方平台首次上网日期,不代表论文的发表时间)