基于HMM识别器的连续手写汉字切分方法
本文提出一种适用于非受限领域连续中文手写的字符切分算法。首先利用无切分策略的汉字识别器估计初始字符边界,字符切分问题转化为提高识别器区分力问题。在进行模型训练时,采用嵌入式B-W算法估计模型;只需输入手写行和它对应的标记文字序列,不必提供每个字符的边界信息。识别结果由Viterbi算法输出,同时包含有字符的边界估计。然后通过分析投影直方图进一步精化切分路线。字符切分和识别两方面的对比实验,均证实了方法的有效性。
字符切分 连续手写汉字 汉字识别 隐马尔科夫模型
苏统华 张田文 黄虎杰
哈尔滨工业大学计算机学院,哈尔滨 150001
国内会议
北京
中文
306-313
2007-12-11(万方平台首次上网日期,不代表论文的发表时间)