基于动态学习方法的中文古籍识别

摘要：

古籍识别的难点之一就是样本的收集与训练问题。由于古籍的特殊性，很难收集大量的样本，一交地学习和训练。该文提出一种动态的样本学习与训练方法，在古籍识别的过程中，边整理，边训练，边识别，以动态滚动的方式，逐步地完善识别字典。该方法在《四库全书》的识别中得到了应用，经初步测试，首选识别率为94.7℅，十选累计识别率为98.8℅。

关键词：汉字识别古籍识别动态学习

作者: 马少平姜哲黄宇

作者单位: 清华大学计算机系(北京),清华大学智能技术与系统国家重点实验室(北京) 北方交通大学(北京)

会议类型: 国内会议

会议名称: 第7届中国机器学习学术会议

会议地点: 南京

会议语种:中文

页码: 255～258

在线出版日期: 2000-11-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于动态学习方法的中文古籍识别