会议专题

基于重采样技术在医学不平衡数据分类中的应用研究

目前流行的分类算法(如决策树、神经网络)都是基于类分布均衡的假设,以高总体准确度为目标.如在肿瘤的诊断中,将99%的个体诊断为健康,便可达到99%的准确度,但这种分类算法并无任何实际意义.医学中患者的数量远远小于健康个体,在医疗诊断中病人误诊为健康与健康个体误诊为病人付出的代价是不同的,因此,准确的识别出病人更加重要.那么,如何增加患者的识别率,同时兼顾健康个体的准确度,是亟待解决的分类问题.本文以代谢综合征为例,从数据处理角度出发,采用重采样技术平衡数据后,用BP神经网络、C4.5决策树分类体检中的代谢综合征患者.

体格检查 不平衡数据 数据处理 重采样技术

闫慈 阿拉依·阿汗 张伟文 曹明芹

新疆医科大学公共卫生学院

国内会议

2017年中国卫生统计学学术年会

武汉

中文

171-171

2017-08-22(万方平台首次上网日期,不代表论文的发表时间)