会议专题

一种重叠书写中文手写句子实时识别方法

  本文提出了一种针对重叠书写的中文手写句子实时识别方法.采用切分和识别集成的字符串识别框架,首先用支持向量机判断新输入的笔划是否属于新的笔划块,并对笔划块进行合并得到候选字符,进而用单字分类器对候选字符进行识别得到候选类别,形成一个候选切分-识别网格.每当提笔时间大于设定的阈值时,系统假设字符串输入完毕,并对候选切分-识别网格进行最优路径搜索得到句子识别结果.本文方法充分地利用了笔划块的几何信息,针对重叠书写的特点,设计了有效的几何模型加入到路径评价函数中,并结合单字分类器和语言模型,提高了字符切分和识别正确率.在生成的联机中文重叠书写字符串样本上进行测试,得到了91.55%的字符正确率,表明了本文方法的有效性.

重叠书写 实时识别 过切分 几何模型

吕彦飞 黄琳琳 王大寒 刘成林

北京航空航天大学自动化科学与电气工程学院,北京 100191 北京交通大学电子信息工程学院,北京 100044 中国科学院自动化研究所模式识别国家重点实验室,北京 100190

国内会议

“文字与信息”学术研讨会

北京

中文

93-100

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)