基于姓氏优先级的中文姓名自动识别
该文针对姓名样本库和姓名语料库统计姓氏的各种概率信息,得到了姓氏的三组数据 X(i)、Y(i)、Z(i),分别表示姓氏的常用程度、姓氏字的常用程度、该姓氏字在真实文本中成为真姓氏的概率。利用这三组数据,我们提出了基于姓氏优先级的中文姓名识别方法。基于本文开发的中文姓名识别系统在实验中召回率和准确率分别为 80.61﹪、89.27﹪,达到了一定的实用性。
中文姓名识别 未登录词识别 姓氏优先级
余祖波 高庆狮 方淼
大连理工大学计算机系,大连116023 大连理工大学计算机系,大连116023;北京科技大学智能语言研究所,北京100080
国内会议
武汉
中文
2005-10-13(万方平台首次上网日期,不代表论文的发表时间)