会议专题

决策树技术在农村儿童保健研究中的应用

目的:探讨决策树技术在农村儿童保健研究中的应用。 方法:从项目数据库中提取出3000例研究对象的资料,分别建立基于Gini杂质函数的CART算法决策树模型和Logistic回归模型来分析影响儿童贫血的因素。 结果:决策树模型中训练集和验证集的误分率为21.2%、21.9%,Root ASE为0.399、0.404,低于Logistic回归模型的22.6%、23.2%和0.4ll、0.414,决策树模型ROC曲线下面积大于Logistic模型,选择决策树模型分析本资料;决策树模型共筛选出9个影响儿童贫血的重要因素,并按影响因素间的相对重要性进行排序,其中母亲是否贫血是最重要的影响因素;产生了15条用于分类和预测的规则。 结论:决策树模型可以有效的筛选出影响因素,同时还可对影响因素定义分界点,分析变量间复杂的交互作用,为儿童保健研究的资料分析提供了一种新的思路。

决策树 误分率 农村儿童保健 项目数据库 回归模型

马玉刚 毕育学 颜虹 邓立娜

西安交通大学医学院流行病与卫生统计学教研室

国内会议

2007年中国卫生统计学术大会

西安

中文

144-150

2007-08-01(万方平台首次上网日期,不代表论文的发表时间)