会议专题

统计和规则相结合的中文机构名称识别

本文机构名称是专名的一种,量大且层出不穷,因而大多不能收入词典,这便给自然语言处理,尤其是机器翻译和机器理解带来很大困扰.本文将统计和规则两种方法结合起来,建立了中文机构名称的识别模型.系统闭式精确率和召回率分别达92.5﹪和92﹪,开式精确率和召回率分别达88.5﹪和76.6﹪.

中文机构名称 单词频度 双词同现频度 专名自动识别 识别模型

张艳丽 黄德根 张丽静 杨元生

大连理工大学计算机系

国内会议

全国第六届计算语言学联合学术会议

太原

中文

233-239

2001-08-04(万方平台首次上网日期,不代表论文的发表时间)