统计和规则相结合的中文机构名称识别

摘要：

本文机构名称是专名的一种,量大且层出不穷,因而大多不能收入词典,这便给自然语言处理,尤其是机器翻译和机器理解带来很大困扰.本文将统计和规则两种方法结合起来,建立了中文机构名称的识别模型.系统闭式精确率和召回率分别达92.5﹪和92﹪,开式精确率和召回率分别达88.5﹪和76.6﹪.

关键词：中文机构名称单词频度双词同现频度专名自动识别识别模型

作者: 张艳丽黄德根张丽静杨元生

作者单位: 大连理工大学计算机系

会议类型: 国内会议

会议地点: 太原

会议语种:中文

页码: 233-239

在线出版日期: 2001-08-04（万方平台首次上网日期，不代表论文的发表时间）

会议专题