基于字的分词方法的实验研究

摘要：

本文采用了目前汉语分词领域中一种优秀的分词方法-基于字的分词方法,通过实验的方式量化地探讨了在这一方法中不同的特征模板对于词表词和未登录词识别所起的作用。结果显示,各种特征模板大的添加可以在一定程度上提高分词精度,但是在这一分词方法中起决定作用的仍然是上下文中的词例信息。

关键词：中文信息处理中文分词汉语分词分词精度

作者: 陈晓靳光瑾黄昌宁

作者单位: 教育部语用所 100010 微软亚洲研究院 100080

会议类型: 国内会议

会议地点: 大连

会议语种:中文

页码: 52-57

在线出版日期: 2007-08-06（万方平台首次上网日期，不代表论文的发表时间）

会议专题