一种改进的基于PATRICIA树的汉语自动分词词典机制
分词词典机制是影响自动分词的重要因素,而查找速度是衡量一个词典好坏的重要标准.文中分析比较了现有的几种典型的词典机制,并在此基础上提出了一种新的词典机制,即在PATRICIA tree的基础上加入Hash机制,从而在明显提高查找速度的同时,降低了构造和维护词典的复杂度.
分词词典机制 PATRICIA树 自动分词 汉语
马哲 姚敏
浙江大学计算机系(浙江杭州)
国内会议
第二届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2004)
广州
中文
28-31
2004-11-12(万方平台首次上网日期,不代表论文的发表时间)