氨基酸理化性质驱动的人工神经网络(Phys—Chem ANN)及在酶工程研究的应用
在蛋白质工程(酶工程)研究中,预测定点突变酶的生物活性是一个重要的研究课题,对提高实验效率,降低实验成本有重要帮助。本文介绍我们新近发展的基于氨基酸理化性质的“物理-化学人工神经网络”(Phys-Chem ANN)及在酶工程中的应用。在生物信息学中广泛使用的“人工神经网络”(Artificial Neural Network:ANN)是以生物体的神经系统(或人的大脑)为模板建立起来的,缺乏物理和化学的理论基础,因而无法对其计算和预测结果给出有物理和化学意义的解释。理化人工神经网络(Phys—Chem ANN )是依据物理化学的基本原理,结合蛋白质的结构特征建立起来的。在理化人工神经网络中,隐蔽层不再是没有真实意义的虚拟的“神经元”,而是蛋白质的结构单元:氨基酸残基(和/或结构域)。理化人工神经网络共有三个层次,输入层是氨基酸的理化性质参数;隐蔽层是在生物活性中起重要作用的氨基酸位点,输出层是蛋白质完成的生物功能。这三个层次组成了一个有反馈功能和机器学习能力的网络。在三个层次间,依据物理化学的原理。建立了以氨基酸理化性质为参量的线性自由能公式,用以表达蛋白质的生物活性。在线性自由能公式中,理化人工神经网络的三个层次由两组系数相连接,一组是活性氨基酸的理化性质的权重因子,另一组是活性氨基酸位点的权重因子。我们发展了一种“迭代的双最小二乘”(IDLS)算法,在训练集里迭代地和交替地解两组系数,建立起预测模型。该模型可用于预测其它变异蛋白质的生物活性。与同类方法相比,理化人工神经网络法不仅有较强预测能力,还可以对预测结果给出有物理化学意义的解释。有助于提高酶工程实验的效率,减少盲目性。
理化性质 氨基酸 酶工程 甘油脱水酶 人工神经网络
黄日波 杜奇石 蒙建宗 周国城
广西科学院,大理路98号,南宁,广西 530004 广西亚热带资源保护与利用重点实验室,广西大学,南宁,广西 530004 广西亚热带资源保护与利用重点实验室,广西大学,南宁,广西 530004 Gordon Life Science Institute,San Diego,California 92130,USA 广西亚热带资源保护与利用重点实验室,广西大学,南宁,广西 530004 Gordon Life Science Institute,San Diego,California 92130,USA
国内会议
天津
中文
48-54
2008-06-01(万方平台首次上网日期,不代表论文的发表时间)