医学影像中的文本检测与识别
为获取医学影像中的文本信息,提出了一种新的文本检测与识别办法.首先使用同态滤波与Laplacian-Sobel Product(LSP)进行文本增强,并通过形态学方法实现文本行定位;然后提出了一种基于边缘纵向投射曲线的无监督分割算法进行字符分割;最后设计了符合医学影像中文本特征的卷积神经网络(CNN)进行字符识别,并基于部分人工标定的图像,随机生成整个训练样本集.为克服繁衍训练样本与真实样本之间的偏差,采用了类别平衡加权的迁移学习方法对模型进行校正,并利用识别得到的置信度进行文本行验证.在包含1000张影像的数据集上进行测试.实验结果表明,相比当前常用方法,本文方法取得了更好的检测识别效果.
医学影像 图像识别 字符分割 卷积神经网络 迁移学习
郜鹏宇 夏思宇 杨彬 张俊康
东南大学复杂工程系统测量与控制教育部重点实验室,南京 210096
国内会议
哈尔滨
中文
181-186
2017-10-01(万方平台首次上网日期,不代表论文的发表时间)