基于组块分析技术的中文机构名称识别

摘要：

针对中文机构名称自动识别提出了简化的一体化N最佳层叠模型,该模型实现了从汉语切分、词性标注、组块分析一直到机构名称的自动识别.N最佳层叠方法既能够在一定程度上抑制前一个阶段的错误在后面的传播,又大大地缩小了搜索空间.在实验过程中依次加入启发信息和机构名称缩写处理,使得实验结果有显著提高.在IEER99测试集上,中文机构名称识别的最终准确率和召回率分别为92.31％和81.01％.

关键词：组块分析中文机构名称识别 N最佳层叠模型启发信息自动识别

作者: 尹继豪樊孝忠赵攀超于江德

作者单位: 北京理工大学,计算机科学技术学院,北京,100081 中国电子设备系统工程公司,北京,100041 北京理工大学,计算机科学技术学院,北京,100081;安阳师范学院计算机科学系,河南,安阳,455000

会议类型: 国内会议

会议名称: 第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06)

会议地点: 哈尔滨

会议语种:中文

页码: 466-470

在线出版日期: 2006-08-05（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于组块分析技术的中文机构名称识别