会议专题

条件logistic回归与logitboost算法在建立先天性心脏病概率预测模型中的结合应用

目的:从众多由专业知识初选出的与先天性心脏病发生有联系的研究因素中筛选出危险因素,同时建立适合网络实现的先天性心脏病发生率的预测咨询模型,为课题成果的网络化奠定基础。 方法:采用了1:2配比设计的病例对照研究,对72名病例儿童和144名对照儿童的亲生父亲和(或)母亲,采用统一的调查表就51个研究因素进行现场调查,使用了单因素条件Logistic回归分析筛选研究因素,多因素条件Logistic逐步回归分析进一步筛选变量并建立最优模型,应用Logitboost算法建立疾病发生率的预测模型。 结果:按α=0.10标准,用单因素Logistic回归分析从51个研究因素中筛选出23个有统计学意义的可疑危险因素,经过数据结构分析、相关因素分组分析、变量共线性诊断,最终筛选出16个变量进入多元Logistic逐步回归分析,最终筛选出与先天性心脏病发生有关的危险因素7个,各变量间不存在交互作用,它们是:母亲学历,出生时缺氧或窒息、孕12周内感冒、本胎孕前妊娠次数、孕早期感染史、孕3个月内B超检查、孕生活事件精神刺激,并建立了logitboost概率预测模型。 结论:利用条件logistic回归与logitboost算法,在探索先天性心脏病危险因素的同时,解决了配比设计资料的概率预测问题,建立了logitboost预测模型。

先天性心脏病 数据挖掘 咨询模型 回归分析 最优模型

陈广 陈景武 王金才

潍坊医学院预防医学系 261042

国内会议

2007年中国卫生统计学术大会

西安

中文

431-437

2007-08-01(万方平台首次上网日期,不代表论文的发表时间)