多步骤决策树方法在基因表达数据上的应用研究
基因芯片技术得到的基因表达谱数据具有维数高、噪声大、样本量小、非线性等特点,目前用于高维组学数据的变量筛选方法主要有单变量筛选和多变量筛选,然而,任何一种分析方法都有其局限性,如其适用范围和分析重点不同.为此,可以把不同的分析方法结合在一起,对数据进行分析,以得到更为丰富和可靠的结果.本文在ClarLynda等提出的多步骤分析策略的基础上,给出了一种新的多步骤决策树分析方法,通过比较多步骤决策树、SAM和随机森林在卵巢癌基因组学数据上的判别效果,研究多步骤决策树在基因组学数据分析中的应用.
医学统计学 基因组学 数据分析 多步骤决策树
马李冰 侯艳 李贞子 李康
哈尔滨医科大学卫生统计学教研室
国内会议
天津
中文
384-384
2016-07-26(万方平台首次上网日期,不代表论文的发表时间)