会议专题

基于双数组的逆向匹配分词算法在保密技术检查中的应用初探

保密部门需要加强网络保密检查,通过搜索涉密信息及时发现和阻止泄密行为.信息搜索需要用到中文分词技术,对于输入的一段中文,高效、准确进行中文分词,有助于提高搜索涉密信息的效率和准确性.为提高分词准确率及分词速度,在双数组的词典结构基础上,提出一个基于双数组的逆向匹配分词算法,该算法结合了双数组和逆向匹配的优点,在词典结构上继承了TRIE索引树逐字匹配的特点,能节省空间,提高查询效率.实验结果表明,这种结合了双数组逆序词典结构和逆向匹配的中文分词算法具有较高的分词准确率及分词速度.

保密技术 信息搜索 中文分词技术 逆向匹配分词算法 双数组

李铭佳 霍林

广西壮族自治区国家保密局技术检查处 广西大学计算机与电子信息学院

国内会议

第二十四届全国信息保密学术会议(IS2014)

吉林

中文

116-122

2014-09-16(万方平台首次上网日期,不代表论文的发表时间)