通用模型与领域模型相结合的手写体汉字识别后处理
基于Markov模型的后处理是提高手写体汉字识别正确率的有效手段.但由于模型的建立依赖于所使用的语料库,当处理对象与语料库所属的领域有明显差别时,后处理效果会明显下降.本文从通用模型与领域模型相结合的角度,探讨了专业文献识别中的后处理问题,给出了通用模型与领域模型相结合的方法,经测试,对于计算机类专业文献,平均识别率达到了96.6﹪,比单纯使用通用模型提高了2.2个百分点.
后处理 语言模型 汉字识别 手写体
马少平 智能技术与系统国家重点实验室 姜哲 智能技术与系统国家重点实验室 夏莹 智能技术与系统国家重点实验室
清华大学计算机系
国内会议
北京
中文
412-417
2001-02-01(万方平台首次上网日期,不代表论文的发表时间)