会议专题

基于混合取样和文献轮廓的白血病基因资料分类研究

  本文在介绍白血病类型与其文献关系的基础上,通过Cancer Gene Census、PubMed和gene2pubmed中的数据构建白血病分类数据集,该数据集是个不平衡分类数据集,也是本文的研究对象。接着在介绍已有不平衡数据分类方法的基础上,分析不平衡训练集取样存在的问题,并构建了混合采样分类方法。然后把白血病分类的多类问题转化成二类问题,并使用ROC和AUC对该方法进行评价。之后使用混合采样等8种分类方法对白血病不平衡数据集进行分类和测试,通过对比分析验证了混合采样分类方法的分类效果和分类稳定性。最后对本文的工作进行总结并对后续的工作进行了展望。

白血病 混合取样 文献轮廓 基因资料 不平衡数据集 决策树

吴清强

厦门大学软件学院,361005

国内会议

2011年全国知识组织与知识链接学术交流会

杭州

中文

83-104

2011-11-17(万方平台首次上网日期,不代表论文的发表时间)