K-split Lasso:有效的肿瘤特征基因选择方法
随着DNA微阵列技术的出现,大量关于不同肿瘤的基因表达谱数据集被发布到网络上,从而使得对肿瘤特征基因选择和亚型分类的研究成为生物信息学领域的热点。基于Lasso方法提出了K-split Lasso特征选择方法,其基本思想是将数据集平均划分为K份,分别使用Lasso方法对每份进行特征选择,而后将选择出来的每份特征子集合并,重新进行特征选择,得到最终的特征基因。实验采用支持向量机作为分类器,结果表明K-split Lasso方法减少了冗余特征,提高了分类精度,具有良好的稳定性。由于每次计算的维数降低,K-split Lasso方法解决了计算开销过大的问题,并在一定程度上解决了“过拟合”问题。因此K-split Lasso方法是一种有效的肿瘤特征基因选择方法。
肿瘤基因 表达谱数据 特征选择 支持向量机 微阵列技术
ZHANG Jing 张靖 HU Xuegang 胡学钢 ZHANG Yuhong 张玉红 SHI Wanfeng 施万锋
School of Computer and Information, Hefei University of Technology, Hefei 230009, China 合肥工业大学计算机与信息学院,合肥230009
国内会议
合肥
中文
1136-1143
2012-10-01(万方平台首次上网日期,不代表论文的发表时间)