中文分词的设计与实现
本文对现有的中文分词系统进行了简要的分析和评价,结合复旦分词系统的框架研究得出了一种新的中文分词切实可行的框架。框架包括分词预处理、词典匹配分词、歧义词和新词识别、歧义词处理四个过程。
中文分词系统 软件设计 分词预处理 匹配分词 新词识别 歧义词处理
WA Dazhen 王大震 CHEN Rong 陈蓉
Hubei University of Technology, Wuhan 430068 湖北工业大学,武汉,430068
国内会议
黄山
中文
340-345
2008-08-02(万方平台首次上网日期,不代表论文的发表时间)