蛋白质相互作用有向关系抽取的特征选择
蛋白质相互作用关系抽取是蛋白质知识网络构建的必要前提,对生物医学领域的研究具有十分重要的意义。本文使用了基于SVM的方法,从生物医学文献中抽取蛋白质相互作用的有向关系。首先针对蛋白质关系的特点,抽取了几组合理有效的特征集合,并根据句法分析的结果设计了依存句法特征集合,有效地改善了蛋白质关系抽取的效果。在此基础上,围绕蛋白质相互作用的关联词抽取特征,判断了蛋白质相互作用的方向,为蛋白质知识网和生物实体关系网的构建提供了更为充分的信息。本文在LLL05语料上进行了实验,取得了较好的效果。实验结果表明,依存句法特征集合对关系抽取具有重要影响;围绕关联词抽取的特征集合对关系判断是十分有效的。最后,本文分析了不同特征对实验结果的影响,明确了下一步的研究方向。
支持向量机 生物实体关系 蛋白质相互作用 实体关系方向
刘培磊 李满生 王挺
国防科学技术大学计算机学院,湖南 长沙,410073
国内会议
上海
中文
552-561
2009-11-14(万方平台首次上网日期,不代表论文的发表时间)