统计和规则相结合的中文机构名称识别
本文机构名称是专名的一种,量大且层出不穷,因而大多不能收入词典,这便给自然语言处理,尤其是机器翻译和机器理解带来很大困扰.本文将统计和规则两种方法结合起来,建立了中文机构名称的识别模型.系统闭式精确率和召回率分别达92.5﹪和92﹪,开式精确率和召回率分别达88.5﹪和76.6﹪.
中文机构名称 单词频度 双词同现频度 专名自动识别 识别模型
张艳丽 黄德根 张丽静 杨元生
大连理工大学计算机系
国内会议
太原
中文
233-239
2001-08-04(万方平台首次上网日期,不代表论文的发表时间)