基于统计的中文姓名提取方法

摘要：

随着自然语言处理的发展,文本中专有名词尤其是姓名的提取变得越来越重要了.本文介绍了使用统计方法,通过隐马尔可夫模型来提取中文姓名的方法,此方法能够从大量的文本资料中自动学习姓名,并且与中文分词很好地结合.实验结果表明,与基于规则的方法相比,基于统计的方法在兼顾准确率与召回率的同时能够获得更好的识别效果.

关键词：中文姓名提取方法语言处理统计方法专有名词识别语言模型

作者: 刘俊张益肇

作者单位: 澳大利亚墨尔本大学计算机科学与软件工程系微软中国研究院

会议类型: 国内会议

会议名称: 第六届全国人机语音通讯学术会议

会议地点: 深圳

会议语种:中文

页码: 63-66

在线出版日期: 2001-11-20（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于统计的中文姓名提取方法