基于多层次特征集成的中文实体指代识别
实体指代识别(Entity Mention Detection, EMD)是识别文本中对实体的指代(Mention)的任务,包括专名、普通名词、代词指代的识别。本文提出一种基于多层次特征集成的中文实体指代识别方法,利用条件随机场模型的特征集成能力,综合使用字符、拼音、词及词性、各类专名列表、频次统计等各层次特征提高识别性能。本文利用流水线框架,分三个阶段标注实体指代的各项信息。基于本方法的指代识别系统参加了2007年自动内容抽取(ACE07)中文EMD评测,系统的ACE Value值名列第二。
实体指代识别 多任务标注 条件随机场模型 多层次特征 特征集成
张海雷 曹菲菲 陈文亮 任飞亮 王会珍 朱靖波
东北大学软件与理论研究所自然语言处理实验室 沈阳 110004
国内会议
大连
中文
485-490
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)