一种基于中文的多模式匹配算法
基于AC算法,根据中文字符存储格式特点,提出一种快速的基于中文的多模式匹配算法。针对AC算法无法跳跃不必要匹配字符的缺点,本文引入跳跃表,构建跳跃函数,通过查询跳跃表,快速计算出跳跃函数值,实现跳跃式匹配。由于中文字符编码格式各不相同,单字符长度长短不一,本文采取字符拆分匹配的方法,将长度不一的单个字符拆分为若干个单字节单位进行匹配。通过对不同数目
多模式匹配 跳跃函数 中文字符 编码格式
侯整风 张谷原
合肥工业大学计算机科学与信息学院 合肥 230009
国内会议
北京
中文
83-86
2011-04-01(万方平台首次上网日期,不代表论文的发表时间)