会议专题

对整词二分自动分词机制的改进

本文研究了中文分词技术,改进了传统的整词二分分词机制,设计了一种按照词的字数分类组织的新的词典结构,该词典更新和添加更加方便,并根据此词典结构提出了相应的快速分词算法。通过对比实验表明,与传统的整词二分、逐字二分和TRIE索引树分词方法相比,该分词方法分词速度更快.

自然语言处理 中文分词技术 词典法分词 字数分类组织 快速分词算法

王虎 王潜平

中国矿业大学计算机科学与技术学院,江苏,徐州,221008

国内会议

第七届中文信息处理国际会议

武汉

中文

57-61

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)