会议专题

基于统计的中文姓名提取方法

随着自然语言处理的发展,文本中专有名词尤其是姓名的提取变得越来越重要了.本文介绍了使用统计方法,通过隐马尔可夫模型来提取中文姓名的方法,此方法能够从大量的文本资料中自动学习姓名,并且与中文分词很好地结合.实验结果表明,与基于规则的方法相比,基于统计的方法在兼顾准确率与召回率的同时能够获得更好的识别效果.

中文姓名提取方法 语言处理 统计方法 专有名词识别 语言模型

刘俊 张益肇

澳大利亚墨尔本大学计算机科学与软件工程系 微软中国研究院

国内会议

第六届全国人机语音通讯学术会议

深圳

中文

63-66

2001-11-20(万方平台首次上网日期,不代表论文的发表时间)