SVM与错误驱动学习相结合的生物实体识别方法
本文介绍了一种SVM和基于转换的错误驱动学习相结合的生物实体识别方法。该方法首先通过抽取较为丰富的特征集合如单词特征、词性特征和词形特征等,使用GENLA语料对SVM分类器进行训练,然后使用训练后的SVM分类器进行生物文本中命名实体的识别。为进一步提高识别的效果,该方法利用基于转换的错误驱动学习方法对SVM的标注结果进行校正,转换规则较好地挖掘出生物学文本中的语言现象,进一步提高运用SVM方法得到的结果。
支持向量机 错误驱动学习 生物学实体识别 命名实体 文本挖掘
黄浩炜 王挺 陈火旺
国防科学技术大学计算机学院,湖南 长沙 410073
国内会议
大连
中文
540-545
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)