基于持征与学习的中文文本的自动校对方法
现有的中文自动校对方法使用字、词或词类的n元语言模型。它们的问题在:仅使用某种局部语言现象的统计特征,导致处理能力足,多种语言模型没有合一。该文设计实现了一个基于特征的中文自动校对方法。该方法综合考虑了中文文本中字词和词局部语言特征以及长距离的语义特征,并且采用Winnow方法进行特征学习。评估实验表明该方法召回率达到85℅,准确率达到41℅,订正率达到51℅。性能比目前常用的词的N元模型方法有明显的提高。
自然语言处量 拼写检查 自动校对方法 中文文本校对
张磊 鲁明羽 周明 黄昌宁
清华大学计算机科学与技术系(北京) 微软中国研究院(北京)
国内会议
合肥
中文
2744~2748
2000-06-01(万方平台首次上网日期,不代表论文的发表时间)