会议专题

基于快速模糊词匹配算法的中文自动校对方法

本文首先提出一种快速的中文模糊词匹配算法,该自满能实现中文自动校中模糊匹配的概念。在此算法基础上实现了基于相似词集代换和语言模型评分对方法。与张照煌的基于相似字集代换的自动校对方法相比,该方法最大的改进就是能够检查并纠正加字、减字、和字串替换等错误。另外,英文的自动校对有明显的“非词”错误和“真词”错误两个分工明确层次,而中文文本校对一直提出这样清晰的层次结构。快速模糊词匹配算法能比较好地解决中文文中的“非词”错误,有利于中文校对系统“非词”错误和“真词”两层结构的实现。

中文文本校对 模糊词匹配 自然语言处理 拼写订正 自动校对方法

张磊 孙茂松 周明 黄昌宁

清华大学计算机科学与技术系(北京) 微软中国研究院(北京)

国内会议

第三届全球智能控制与自动化大会

合肥

中文

2739~2743

2000-06-01(万方平台首次上网日期,不代表论文的发表时间)