会议专题

利用神经网络和一致结构序列预测蛋白质二级结构

从PDB数据库提取出441组蛋白质序列集,其中每组均含有较长的公共子序列.利用蛋白质的公共子序列作为网络的输入,一致二级结构序列作为神经网络的预期输出,对其三态的预测精度进行了研究.实验证明,该序列信息可用来提高蛋白质二级结构的预测精度.从每组中提取一条蛋白质序列,对这441条序列进行9倍交叉验证,若应用一致结构序列信息则得到的三态预测精度为72.68﹪,对应的三态的相关性系数分别为0.62,0.55,0.54;但若不采用一致结构序列,则得到的三态预测精度为71.03﹪,对应的三态的相关性系数分别为0.60,0.54,0.52。

神经网络 一致结构序列 最长公共子串 蛋白质二级结构 蛋白质序列集

李小妹 王能超

华中科技大学计算机科学与技术学院,武汉,430074

国内会议

2005第一届中国分类技术与应用研讨会(CSCA)

北京

中文

320-324

2005-09-23(万方平台首次上网日期,不代表论文的发表时间)