会议专题

一种两阶段的中文命名实体识别方法

本文提出了针对中文命名实体识别任务的两阶段方法。第一阶段应用条件随机场模型检测实体边界;第二阶段应用最大熵模识别实体类型。相对于同时进行边界检测和类型识别的传统一阶段方法,两阶段大大减小了条件随机场训练的计算复杂性(缩短了训练时间,减小内存消耗,生成模型更小)。SIGHAN 2006 MSRA和CityU封闭测试的结果显示,二阶段较一阶段仅仅损失1%的性能,却将计算复杂性降低80%以上.

中文命名 实体识别 条件随机场模型 计算复杂性 最大熵模识别

何楠 毛新年 董远 王海拉

北京邮电大学信息工程学院,北京,100876 北京法国电信研发中心有限公司,北京,100876 北京邮电大学信息工程学院,北京,100876;北京法国电信研发中心有限公司,北京,100876

国内会议

第七届中文信息处理国际会议

武汉

中文

420-426

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)