基于持征与学习的中文文本的自动校对方法

摘要：

现有的中文自动校对方法使用字、词或词类的n元语言模型。它们的问题在：仅使用某种局部语言现象的统计特征，导致处理能力足，多种语言模型没有合一。该文设计实现了一个基于特征的中文自动校对方法。该方法综合考虑了中文文本中字词和词局部语言特征以及长距离的语义特征，并且采用Winnow方法进行特征学习。评估实验表明该方法召回率达到85℅，准确率达到41℅，订正率达到51℅。性能比目前常用的词的N元模型方法有明显的提高。

关键词：自然语言处量拼写检查自动校对方法中文文本校对

作者: 张磊鲁明羽周明黄昌宁

作者单位: 清华大学计算机科学与技术系(北京) 微软中国研究院(北京)

会议类型: 国内会议

会议名称: 第三届全球智能控制与自动化大会

会议地点: 合肥

会议语种:中文

页码: 2744～2748

在线出版日期: 2000-06-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于持征与学习的中文文本的自动校对方法