对整词二分自动分词机制的改进
本文研究了中文分词技术,改进了传统的整词二分分词机制,设计了一种按照词的字数分类组织的新的词典结构,该词典更新和添加更加方便,并根据此词典结构提出了相应的快速分词算法。通过对比实验表明,与传统的整词二分、逐字二分和TRIE索引树分词方法相比,该分词方法分词速度更快.
自然语言处理 中文分词技术 词典法分词 字数分类组织 快速分词算法
王虎 王潜平
中国矿业大学计算机科学与技术学院,江苏,徐州,221008
国内会议
武汉
中文
57-61
2007-10-13(万方平台首次上网日期,不代表论文的发表时间)