基于GMM核的LS-SVM真核启动子模型
真核启动子是生物信息学理论研究的方向之一,由于真核启动子DNA序列结构复杂、数据量巨大,启动子序列辨识一直是一个难点.首先对真核启动子序列寡核苷酸位置分布特征进行高斯混合模型建模,能够将出现频率少但重要的基序提取出来.再将高斯混合模型作为真核启动子最小二乘支持向量机分类器中的核函数,将最小二乘支持向量机模型简化为最小二乘模型,计算量减少.辨识结果表明,该算法的辨识精度优于贝叶斯辨识算法,和RBF核LS-SVM相比,辨识精度基本相同,建模时间略有缩短.
生物信息学 真核启动子 寡核苷酸 位置分布 高斯混合模型 最小二乘支持向量机
郭烁 袁德成 郭娲
沈阳化工大学信息工程学院,辽宁沈阳100142 国网辽宁省电力有限公司铁岭供电公司人力资源部,辽宁铁岭112000
国内会议
呼和浩特
中文
4662-4666
2013-08-01(万方平台首次上网日期,不代表论文的发表时间)