会议专题

六种差异基因筛选方法及筛选效果的比较

对基因表达数据的分析,其重要任务之一是筛选差异表达基因,即通过比较正常和疾病状态下基因转录及表达的差异,研究疾病的发生机理、进行疾病的早期诊断及治疗。差异基因筛选方法有多种,各种差异基因筛选方法处理由基因芯片获得的微阵列数据的过程基本相同,即先计算表达每一个基因的组间差异的统计量,然后按统计量的绝对值大小进行排序,可以认为排位越靠前的基因其组间差异为真实差异基因的概率较大;也可以将计算所得统计量以0为界分为两部分,然后按其绝对值大小分别排序,大于0的部分排序靠前的基因与小于0的部分排序靠前的基因可分别认为是上调/下调或下调/上调基因。本文在简要介绍6种差异基因筛选方法的基础上,采用计算机模拟实验的方法,针对不同类型的数据对其进行比较和研究。与其他研究相比,本文主要进行了以下几点改进:一是在相同条件下对六种方法进行比较:二是通过选择不依赖样本分布的ROC曲线下面积AUC值对变量的组间差异进行设置,增强了不同类型数据筛选结果间的可比性;三是以真实基因芯片实验数据为基础产生模拟实验的噪声数据,使模拟结果更接近真实情况。

卫生统计学 基因表达数据 基因筛选 差异筛选方法

赵发林 刘艳 李康

哈尔滨医科大学卫生统计学教研室

国内会议

2007年中国卫生统计学术大会

西安

中文

84-92

2007-08-01(万方平台首次上网日期,不代表论文的发表时间)