会议专题

基于支持向量机的DNA结合残基的预测

许多蛋白质通过与DNA分子相互作用而实现其功能,例如基因的调控与修复等。本文中我们从氨基酸的物化特征、残基的二级结构信息、蛋白质序列的进化信息等13种特征中选取出最优的特征组合:蛋白质残基的PI值、最低自由能、蛋白质序列的二级结构和进化信息--位置特异性打分矩阵值(PSSMs)。然后利用支持向量机(SVM)方法预测蛋白质序列中的DNA结合位点。其预测的准确率达到80.48%,敏感性72.88%,特异性81.60%,Matthew相关系数为0.418。同时,我们还利用了随机森林的(RF)方法,其预测效果与SVM方法相近,说明了我们使用的最优的特征组合在预测DNA结合位点时具有很好的效果。

DNA结合位点 支持向量机 物化特征组合 氨基酸 预测功能

伍洪涛 吴建盛 孙啸

东南大学生物电子学国家重点实验室,江苏南京,210096

国内会议

2007中国计算机大会

苏州

中文

920-927

2007-10-18(万方平台首次上网日期,不代表论文的发表时间)