会议专题

汉字笔画的自动提取

  提出了一种适用于字库创作和书法自动生成的汉字笔画自动提取的方法.首先采用骨架段分配到的最近邻轮廓线像素点的个数来检测模糊区域.然后根据每个模糊区域的子笔画段间的方向变化,宽度变化和贝塞尔拟合误差来训练支持向量机模型的参数,以此指导笔画段的连接与延展,得到输入图像的候选笔画集合.接着应用模糊数学的方法描述笔画属性和笔画间的关系,分别对参考字符和输入字符建立属性关系图.在这基础上借助启发式搜索算法对参考图和输入图进行匹配,建立对应关系.最后根据最近邻分配和最近不交叉原则获得提取到的每个输入笔画的骨架对应的轮廓线.实验结果表明,本文提出的模糊区域检测算法比常用的最大圆规则更有效.针对GB2312中6763个宋体汉字的笔画匹配准确率达到了97.4%,而且轮廓提取的结果很好地保留了笔画的风格.

模糊区域检测 子笔画连续性分析 笔画轮廓提取

李红梅 贾文华 易天旸 连宙辉 肖建国

北京大学计算机科学技术研究所,100871

国内会议

“文字与信息”学术研讨会

北京

中文

35-42

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)