会议专题

基于动态学习方法的中文古籍识别

古籍识别的难点之一就是样本的收集与训练问题。由于古籍的特殊性,很难收集大量的样本,一交地学习和训练。该文提出一种动态的样本学习与训练方法,在古籍识别的过程中,边整理,边训练,边识别,以动态滚动的方式,逐步地完善识别字典。该方法在《四库全书》的识别中得到了应用,经初步测试,首选识别率为94.7℅,十选累计识别率为98.8℅。

汉字识别 古籍识别 动态学习

马少平 姜哲 黄宇

清华大学计算机系(北京),清华大学智能技术与系统国家重点实验室(北京) 北方交通大学(北京)

国内会议

第7届中国机器学习学术会议

南京

中文

255~258

2000-11-01(万方平台首次上网日期,不代表论文的发表时间)