会议专题

一种模板与图核融合的蛋白质关系抽取方法

随着生物医学文献的急剧增加,从文本中自动抽取蛋白质的相互作用关系,成为文本挖掘领域研究中的重要方向。目前主流的蛋白质关系抽取方法大多侧重于提取句子的结构化特征信息,对句中词信息没有进行深入发掘,特别是对复杂长难句的处理时间消耗大。本文提出了一种新的模板方法,利用两类句法分析器生成结构化句子,从中找到存在特定意义的模板序列,通过模板快速匹配句子。本方法能够同图核方法进行有效融合,解决图核方法难以处理复杂长难句的不足,提高实验效率。本方法在AIMed 语料上使用十倍交叉验证的F 值达到了63.1%。

蛋白质关系抽取 模板 图核融合 句法分析器 生物医学文献

刘昊 王健 林鸿飞

大连理工大学计算机科学与技术学院,大连,116023

国内会议

第六届全国信息检索学术会议

黑龙江镜泊湖

中文

539-546

2010-08-12(万方平台首次上网日期,不代表论文的发表时间)