基于数据挖掘的HIV感染者CD4细胞计数预测模型
目的:探索利用数据挖掘技术预测CD4+T淋巴细胞计数<350个/μL和<500个/μL的可能性和效果,从而为CD4+T淋巴细胞计数预测模型的选取提供参考依据. 方法:收集345名HIV感染男男性接触者的2837例总淋巴细胞计数、血红蛋白、血小板计数、白细胞计数和红细胞计数,分别建立基于Logistic回归、线性判别分析、决策树、反向传播多层感知机和径向基函数神经网络的预测模型,并对预测效果进行10折交叉验证.利用敏感度、特异度、阳性预测值、阴性预测值和受试者操作特征(ROC)曲线下面积对5种预测模型的性能进行评价. 结果:上述5种模型预测CD4<350个/μL的ROC曲线下面积(Az)分别为0.698、0.697、0.706、0.746和0.745,预测CD4<500个/μL的Az值分别为0.735、0.737、0.724、0.707和0.714,均高于单独使用总淋巴细胞计数(Az值分别为0.657和0.691)进行预测的效果. 结论:数据挖掘模型在预测CD4+T淋巴细胞计数方面具有一定水平,不同模型在完成不同预测任务时表现出了不同性能.
艾滋病病毒感染者 CD4细胞 数据挖掘 预测模型
陈婕卿 朱碧云 陈卉 黄晓婕
首都医科大学生物医学工程学院 北京100069;首都医科大学公共卫生与家庭医学学院 北京100069 首都医科大学生物医学工程学院 北京100069 首都医科大学附属北京佑安医院感染科 北京100069
国内会议
北京
中文
455-460
2012-12-01(万方平台首次上网日期,不代表论文的发表时间)