基于DFA的蒙古文自动校对算法
随着蒙古文信息处理和电子出版业的迅猛发展,文本校对的工作量大大增加,自动校对已成为一个亟待解决的课题。本文首先分析了蒙古文电子文本中存在的错误类型,出错原因以及常用的查错纠错方法,然后根据蒙古文特有的书写习惯和编码特点提出一种基于有限状态自动机的校对算法。该算法采用了常用的基于词典和规则的校对方法,但用有限状态自动机组织词典数据和规则后大大提高了算法的响应速度。在扩建蒙古文语料库的过程中试用该算法后发现与基于字符串比较的词典查找相比在速度上提高了99%以上,在实时校对中对单个词的响应时间在0.2毫秒以内。
蒙古文 自动校对算法 词法分析器 DFA 信息处理 字符串比较
斯·劳格劳
内蒙古大学蒙古学学院,呼和浩特,010021
国内会议
合肥
中文
195-200
2008-10-07(万方平台首次上网日期,不代表论文的发表时间)