会议专题

一种改进的基于PATRICIA树的汉语自动分词词典机制

分词词典机制是影响自动分词的重要因素,而查找速度是衡量一个词典好坏的重要标准.文中分析比较了现有的几种典型的词典机制,并在此基础上提出了一种新的词典机制,即在PATRICIA tree的基础上加入Hash机制,从而在明显提高查找速度的同时,降低了构造和维护词典的复杂度.

分词词典机制 PATRICIA树 自动分词 汉语

马哲 姚敏

浙江大学计算机系(浙江杭州)

国内会议

第二届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2004)

广州

中文

28-31

2004-11-12(万方平台首次上网日期,不代表论文的发表时间)