一种开放式中文命名实体识别的新方法
本文研究开放式中文命名实体识别问题。针对传统命名实体识别方法具有训练语料标注困难,自适应能力不强等缺点,研究人员提出了开放式的命名实体识别。但由于汉语的特殊性,使得开放式中文命名实体识别的相关研究很少,效果也不理想。本文提出了一种开放式中文命名实体识别方法,模拟语言习得的过程,从句子结构出发,通过分类器得到含有命名实体的碎片序列,进而从中抽取出命名实体。实验结果表明,该方法可以较好地从不限领域的中文文本中抽取不限类别的命名实体。
开放式 命名实体识别 中文文本
齐振宁 赵军 杨帆
中国科学院自动化研究所模式识别国家重点试验室,北京,100190
国内会议
上海
中文
587-595
2009-11-14(万方平台首次上网日期,不代表论文的发表时间)