纵向研究非随机缺失数据分析
在实际临床试验中,常常会出现缺失数据.数据缺失有各种形式:譬如在临床试验中患者中途退出试验研究,或者在某些时间点没有进行检查,或者患者不情愿回答某些项目.这些缺失的原因也许与患者的病情有关,也许无关.有若干种处理不完全数据的统计方法.第一种方法是在分析不完全数据时,丢掉不完全观测的个体,仅保留完全观测的个体进行分析,我们称这种方法为完全数据分析方法.大部分统计软件(比如SAS,SPSS等)是采用这种方法分析不完全数据.第二种方法是利用完全数据和不完全数据一同进行统计分析,但是将缺失数据视为随机缺失,也就是说,是否缺失与结果值的大小无关.例如,患者因为家中有事少检查了几次,或者患者因为与病情无关的其他原因离开了医院.缺失也可能是因为与病情无关的原因,比如检查费用过高,而拒绝检查.这种方法也称为可忽略缺失机制的统计推断方法,因为它忽略了缺失数据的模型.与第一种方法比较,这种方法可以减小偏差,并能够提高统计推断的精度.第三种方法也是利用所有完全数据和不完全数据进行统计分析,但是可以将缺失数据视为非随机缺失的,也就是说,可以认为是否缺失与结果值的大小有关系,称为不可忽略缺失机制.例如,患者因为病情过重或病情好转认为不必检查而拒绝检查,或者因为自认为基本康复而离开医院,或者出现副作用而退出试验.这种缺失数据的发生使得统计分析变得很复杂.本文将举例说明采用第一种方法和第二种方法分析这种不完全数据的话,可能会造成偏倚.
临床试验 非随机缺失数据 统计方法 统计推断 结果值
耿直 葛丹丹
北京大学数学科学学院,北京,100871
国内会议
烟台
中文
24-27
2005-07-28(万方平台首次上网日期,不代表论文的发表时间)