基于文本挖掘的基因-药物-不良反应关系提取及网络构建
目的:通过从两个生物医学文献集合中识别并提取基因-药物和药物-不良反应实体及关系,构建基因-药物-不良反应关系网络,进而推测基因表达与药物不良反应之间的可能关联. 方法:从PUBMED获取文献集合,采用结合多种特征的条件随机场模型进行药物、不良反应、基因三种实体的命名实体识别.提取同句共现的药物-不良反应对和药物-基因对,对于每个关系待定的对根据频次、主题词关联、关键动词关联、与已知关系共现等构建变量,进行logistic回归分析,以预测得分为基础构建药物-ADR矩阵和药物-基因矩阵,进而获得基因-不良反应矩阵;借助网络分析和聚类分析等对三者关系进行解读验证。 结果:本研究共提取了7772个药物-不良反应对和4313个药物-基因对,预测到60226个潜在的基因-ADR关联.部分预测结果可通过网络-聚类-通路分析解释,并可在文献/数据库中得到验证. 结论:本研究构建的基因-药物-不良反应网络可以为推测潜在受药物作用的基因表达与药物不良反应之间的可能关联提供参考.
生物医学文献集合 基因-药物-不良反应 关系提取 网络构建 文本挖掘
隋明爽 崔雷
中国医科大学医学信息学院 沈阳110122
国内会议
中华医学会医学信息学分会第十二届全国医学信息教育可持续发展学术研讨会暨第三届全国医学信息学研究生论坛
南宁
中文
33-43
2017-07-26(万方平台首次上网日期,不代表论文的发表时间)