会议专题

识别多个大型反应网络共有模式的快速算法

多个蛋白质网络的对比分析是一种非常有效的识别跨生物体的共有反应模式和功能的工具。开发高效的多个蛋白质反应网络对比算法具有很大的挑战性。已有的几个识别多个蛋白质反应网络的共有模式的工具为分析蛋白质反应网络打下了基础。现有的多个蛋白质对比分析工具使用了局部或全局匹配方法,但在运行速度、正确性和通用性上存在局限性。针对此种情况,本文设计了一种快速而正确的识别多个蛋白质网络共有模式的新算法——HopeMap-M,旨在提供跨网络的最大化匹配,提高正确性和处理大规模数据的速度。观察到真正跨生物种类的同族组在数量上相对于所有蛋白质的数量来讲比较少,本文选择一个不同于现有工具的方式,其用三步实现:从跨生物种类的极其相近的同族组开始,再应用一个通用的评分系统找到全局的共有反应区域,最后用已知的多个功能标注确认结果的正确性。本文设计的表达多个蛋白质反应网络的新方法其,主要算法与对比的蛋白质反应网络的总同族组数呈线性复杂度,这与现有的呈指数增长或数量巨大的表达方法不同。该算法非常高效,能够在几分钟内完成同时分析10个反应网络(共十多万个蛋白质和上百万反应数)。对比已有的工具,该方法比较快捷,具有线性复杂度,在特异性和敏感度方面都非常正确。

多个反应网络 共有模式 跨生物体 快速识别算法 蛋白质网络

田文洪 陈安龙

电子科技大学计算机学院软件学院 成都 610054

国内会议

第九届中国Rough集与软计算、第三届中国Web智能、第三届中国粒计算联合会议(CRSSC-CWI-CGrC’2009)

石家庄

中文

195-197,228

2009-08-01(万方平台首次上网日期,不代表论文的发表时间)