通用模型与领域模型相结合的手写体汉字识别后处理

摘要：

基于Markov模型的后处理是提高手写体汉字识别正确率的有效手段.但由于模型的建立依赖于所使用的语料库,当处理对象与语料库所属的领域有明显差别时,后处理效果会明显下降.本文从通用模型与领域模型相结合的角度,探讨了专业文献识别中的后处理问题,给出了通用模型与领域模型相结合的方法,经测试,对于计算机类专业文献,平均识别率达到了96.6﹪,比单纯使用通用模型提高了2.2个百分点.

关键词：后处理语言模型汉字识别手写体

作者: 马少平智能技术与系统国家重点实验室姜哲智能技术与系统国家重点实验室夏莹智能技术与系统国家重点实验室

作者单位: 清华大学计算机系

会议类型: 国内会议

会议名称: 863计划智能计算机主题学术会议

会议地点: 北京

会议语种:中文

页码: 412-417

在线出版日期: 2001-02-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

通用模型与领域模型相结合的手写体汉字识别后处理