基于分级最大熵模型的实体名识别
提出了一种基于分级最大熵模型的中文实体名识别方法。首先在第一级最大熵模型中完成无嵌套的实体名的识别,然后再在第二级最大熵模型中完成复杂地名和机构名的识别。该模型的每一层都包括训练和识别两个部分,训练部分利用特征模板从语料中抽取特征,再利用最大熵方法对特征进行训练;识别部分利用训练得到的参数进行实体名识别。采用人民日报的数据进行实验,验证了该方法比传统最大熵模型和多层隐马模型的识别效果好。
实体名识别 最大熵 分级模型 特征模板 多层隐马模型
胡桂兰 蔡晓春
电子工程学院 合肥 230037
国内会议
成都
中文
253-255,317
2009-08-12(万方平台首次上网日期,不代表论文的发表时间)