会议专题

基于字的分词方法的实验研究

本文采用了目前汉语分词领域中一种优秀的分词方法-基于字的分词方法,通过实验的方式量化地探讨了在这一方法中不同的特征模板对于词表词和未登录词识别所起的作用。结果显示,各种特征模板大的添加可以在一定程度上提高分词精度,但是在这一分词方法中起决定作用的仍然是上下文中的词例信息。

中文信息处理 中文分词 汉语分词 分词精度

陈晓 靳光瑾 黄昌宁

教育部语用所 100010 微软亚洲研究院 100080

国内会议

第九届全国计算语言学学术会议

大连

中文

52-57

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)