会议专题

基于氨基酸构象分类和神经网络技术的蛋白质二级结构预测研究

本文主要针对从蛋白质数据库(Protein Data Bank,PDB)中选取的340条蛋白质序列(共96,921个氨基酸)及其相应的二级结构进行统计分析,根据不同氨基酸在蛋白质三态二级结构(A1pha-螺旋,Beta-折叠片,Coil无规则区)中的出现频率,把20种不同的氨基酸分成起始子(Beginner),断裂子(Breaker)和中性子(Natural)三类,并结合神经网络技术,利用该构象分类信息和多序列联配(Multiple Sequence Alignment,MSA)信息来构建训练样本,进行蛋白质二级结构的预测,模拟结果显示用这种方法训练的神经网络获得了较好的预测精度。

构象分类 神经网络 二级结构 蛋白质

黄德双 张广政

中科院合肥智能机械研究所智能计算实验室,合肥,230031 中科院合肥智能机械研究所智能计算实验室,合肥,230031 中国科学技术大学自动化系,合肥,230031

国内会议

2003年中国科协“生物信息学与进化计算”青年科学家论坛

北京

中文

109-116

2003-11-28(万方平台首次上网日期,不代表论文的发表时间)