一种基于可信度的人名识别方法

摘要：

专名识别是中文自动分词的重要任务.本文分析了目前流行的基本语料库和统计语言模型(SLM)的专名识别方法中存在的问题,同时以人名识别为例,在规则和统计相结合的基础上,提出了一种基于可信度的人名识别方法.从我们对《人民日报》1998年1月、2000年12月(共约379万字)语料的开放测试结果来看,基于可信度的人名识别方法比SLM方法识别效果有较大的提高,同时比基于规则和知识库的分词系统具有更好的扩充性.

关键词：自动分词人名识别统计语言中文自动分词语料库

作者: 罗智勇宋柔荀恩东

作者单位: 北京工业大学计算机学院(北京);北京语言大学语言信息处理研究所(北京) 北京语言大学语言信息处理研究所(北京)

会议类型: 国内会议

会议名称: 第二届全国学生计算语言学研讨会

会议地点: 北京

会议语种:中文

页码: 52-57

在线出版日期: 2004-08-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种基于可信度的人名识别方法