会议专题

基于分级最大熵模型的实体名识别

提出了一种基于分级最大熵模型的中文实体名识别方法。首先在第一级最大熵模型中完成无嵌套的实体名的识别,然后再在第二级最大熵模型中完成复杂地名和机构名的识别。该模型的每一层都包括训练和识别两个部分,训练部分利用特征模板从语料中抽取特征,再利用最大熵方法对特征进行训练;识别部分利用训练得到的参数进行实体名识别。采用人民日报的数据进行实验,验证了该方法比传统最大熵模型和多层隐马模型的识别效果好。

实体名识别 最大熵 分级模型 特征模板 多层隐马模型

胡桂兰 蔡晓春

电子工程学院 合肥 230037

国内会议

2009年西南地区网络与信息系统学术年会

成都

中文

253-255,317

2009-08-12(万方平台首次上网日期,不代表论文的发表时间)