会议专题

一种基于多尺度滑动窗梯度特征及深度神经网络的印刷体汉字识别方法

本文提出了一种基于用于多字体印刷体汉字的多尺度滑动窗梯度直方图特征提取方法,并结合深度神经网络对印刷体汉字进行识别.该方法针对梯度直方图的空间关系,使用可伸缩的滑动窗口对图像进行分割,在不同尺度上获取文字的特征信息,从而有效融合汉字的全局特征和局部分块特征.实验采用5层深度神经网络对国标一级3,755类印刷体汉字进行分类,并应用Dropout技术防止训练过拟合,提高网络的泛化能力.对100种字体的文字识别实验的准确率达到98.2g%,明显优于传统的一些方法,表明了本文方法的有效性.

印刷体汉字 识别技术 多尺度滑动窗梯度特征 深度神经网络

潘炜深 金连文 冯子勇

华南理工大学电子与信息学院,广州中国510641

国内会议

第十届和谐人机环境联合学术会议

北京

中文

1-6

2014-09-13(万方平台首次上网日期,不代表论文的发表时间)