基于组块分析技术的中文机构名称识别
针对中文机构名称自动识别提出了简化的一体化N最佳层叠模型,该模型实现了从汉语切分、词性标注、组块分析一直到机构名称的自动识别.N最佳层叠方法既能够在一定程度上抑制前一个阶段的错误在后面的传播,又大大地缩小了搜索空间.在实验过程中依次加入启发信息和机构名称缩写处理,使得实验结果有显著提高.在IEER99测试集上,中文机构名称识别的最终准确率和召回率分别为92.31%和81.01%.
组块分析 中文机构名称识别 N最佳层叠模型 启发信息 自动识别
尹继豪 樊孝忠 赵攀超 于江德
北京理工大学,计算机科学技术学院,北京,100081 中国电子设备系统工程公司,北京,100041 北京理工大学,计算机科学技术学院,北京,100081;安阳师范学院计算机科学系,河南,安阳,455000
国内会议
第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06)
哈尔滨
中文
466-470
2006-08-05(万方平台首次上网日期,不代表论文的发表时间)