基于线粒体SNP的疾病人群分类方法研究
本文提出了一种基于线粒体SNP位点分析的疾病人群分类方法。采用基于关键字树的多序列比对算法将线柱体DNA对齐,通过卡方统计量和信息含量差值筛选获取与疾病关联的显著性线粒体SNP位点集合作为分类特征,使用k*算法生成有效分类器对未知人群序列进行有效疾病分类。与目前基于基因组序列的分类方法相比,本文算法能够减少比对及关联分析中的信息丢失,提高了疾病人群序列的分类准确率,节省了个性化医疗成本。在帕金森症病人数据集上的实验证明了本方法的有效性。
线粒体 疾病人群 分类方法 基因组序列 关联分析 帕金森症
王峻 郭茂祖 邹权
哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨,150001
国内会议
天津
中文
739-746
2009-10-23(万方平台首次上网日期,不代表论文的发表时间)