会议专题

基于基因芯片数据的肿瘤特征基因筛选及癌型识别研究

在医学领域,确定癌症的种类以及癌症的不同阶段,对于选择相应的临床治疗方式极为重要,基因微阵列实验中的基因表达数据为癌症诊断和预测提供了新的手段。首先运用支持向量机方法,对癌症样本和正常样本的分类进行了比较和分析,找到了区分正常样本和癌症的较好的分类方法,作用到特定的胃癌数据中准确率达到90%。在此基础上,针对同一基因芯片实验平台采集的4中不同癌型和正常样本数据,使用改进的relief算法进行分类计算,然后利用两两冗余算法去掉冗余基因,提取出了具有较好分类效能的癌症标志基因,找到了区分不同癌型的较好的分类方法,最后,针对这些特征基因进行了表达聚类的热图分析,在一定程度上具有临床和生物学意义。在冗余分析过程中由于去除了大部分基因而导致特征基因在冗余处理前后所富集到的通路产生了差别。而且最终保留的特征基因越少,所富集到的通路也越少,毕竟生物学通路的富集建立在基因数量的基础之上。但由于功能层面和系统生物学领域的分析可以通过转录组学、代谢组学和蛋白质组学等多种组学共同来研究界定,而不仅限于基因表达值这一个角度,故而本文中仅就此问题予以提出并作为未来的研究工作。相信随着生物芯片技术、数据处理算法和生物信息学领域的进一步改进和完善,人们对不同癌型间特征基因的识别及利用将会更具有现实意义。

肿瘤特征基因 分类方法 基因芯片 冗余分析

宋学坤 余孝顺 张佩江 李要婷 肖少冲 霍亚会 刘勤 胡洋涛 胡猛 姜慧敏 庞如雪

河南中医学院信息技术学院

国内会议

第二届中国中医药信息大会

北京

中文

265-272

2015-08-01(万方平台首次上网日期,不代表论文的发表时间)