会议专题

新词语自动识别方法研究

本文在加工过的网上文本语料统计的基础上,首先用N元递增分步算法,获取含新词语的汉字串:经过初筛选,建立新词语候选词库;最后以构词法为依据,对剩余词条进行新词语的识别.封闭测试:召回率为97﹪,准确率为85﹪以上.

新词语识别 自动分词 中文信息处理

郑家恒 李文花

山西大学计算机科学系

国内会议

全国第六届计算语言学联合学术会议

太原

中文

187-192

2001-08-04(万方平台首次上网日期,不代表论文的发表时间)