生物医学命名实体识别的特征选取与评价
本文研究的主要目的是针对生物医学命名实体的特点开发使用有效的特征集合,并结合使用不同的信息资源,以提高基于特征的机器学习方法识别生物医学命名实体的性能。本文详细分析了各种特征包括局部特征、全文特征及外部资源特征对基于条件随机域模型的生物医学命名实体识别系统的贡献。系统使用JNLPBA语料作为评测语料,获得了72.0%的F测度值,实验结果证明本文针对生物医学领域命名实体特点而选择的特征对于识别任务是非常有效的。
命名实体识别 特征选择 机器学习 条件随机域 生物医学命名 命名识别
王浩畅 赵铁军 李艳
哈尔滨工业大学计算机与技术学院 哈尔滨 150001 辽河油田公司勘探开发研究院 盘锦 124010
国内会议
大连
中文
534-539
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)