利用词表示和深层神经网络抽取蛋白质关系
蛋白质关系抽取是生物医学信息抽取领域的重要分支.目前研究中,基于特征和核函数方法的蛋白质关系抽取已被充分研究,并且达到了很高的F-值,通过改进特征和核函数进一步优化实例表示变得十分困难.本文结合词表示和深层神经网络,提出了一种实例表示模型.该模型能够充分利用词表示的语义表示能力和深层神经网络的表示优化能力;同时引入主成分分析和特征选择进行特征优化,并且通过比较多种传统的分类器,寻找适合蛋白质关系抽取的分类器.该方法在AIMed语料、BioInfer语料和HPRD50语料上的F-值分别取得了70.5%、82.2%和80.0%,在蛋白质关系抽取任务上达到了目前最好的抽取水平.
生物医学 蛋白质关系抽取 词表示 深层神经网络
李丽双 蒋振超 万佳 黄德根
大连理工大学计算机科学和技术学院,辽宁大连116023
国内会议
第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD-2016)
烟台
中文
1-11
2016-10-14(万方平台首次上网日期,不代表论文的发表时间)