会议专题

基于姓氏优先级的中文姓名自动识别

该文针对姓名样本库和姓名语料库统计姓氏的各种概率信息,得到了姓氏的三组数据 X(i)、Y(i)、Z(i),分别表示姓氏的常用程度、姓氏字的常用程度、该姓氏字在真实文本中成为真姓氏的概率。利用这三组数据,我们提出了基于姓氏优先级的中文姓名识别方法。基于本文开发的中文姓名识别系统在实验中召回率和准确率分别为 80.61﹪、89.27﹪,达到了一定的实用性。

中文姓名识别 未登录词识别 姓氏优先级

余祖波 高庆狮 方淼

大连理工大学计算机系,大连116023 大连理工大学计算机系,大连116023;北京科技大学智能语言研究所,北京100080

国内会议

2005中国计算机大会

武汉

中文

2005-10-13(万方平台首次上网日期,不代表论文的发表时间)