会议专题

通用模型与领域模型相结合的手写体汉字识别后处理

基于Markov模型的后处理是提高手写体汉字识别正确率的有效手段.但由于模型的建立依赖于所使用的语料库,当处理对象与语料库所属的领域有明显差别时,后处理效果会明显下降.本文从通用模型与领域模型相结合的角度,探讨了专业文献识别中的后处理问题,给出了通用模型与领域模型相结合的方法,经测试,对于计算机类专业文献,平均识别率达到了96.6﹪,比单纯使用通用模型提高了2.2个百分点.

后处理 语言模型 汉字识别 手写体

马少平 智能技术与系统国家重点实验室 姜哲 智能技术与系统国家重点实验室 夏莹 智能技术与系统国家重点实验室

清华大学计算机系

国内会议

863计划智能计算机主题学术会议

北京

中文

412-417

2001-02-01(万方平台首次上网日期,不代表论文的发表时间)