基于数据挖掘流程的Logistic回归方法——在亚健康人群分类及其临床特征分析中的应用
本文应用基于数据挖掘流程的logistic回归方法建模,对亚健康状态的人群进行分类并分析其临床特征.对亚健康状态流行病学调查数据进行统计分析,采用从数据理解到数据准备和变量筛选再到选择logistic回归建模的数据挖掘流程,确定最终的回归方程,从而得到亚健康状态的判别方程及其临床特征.建立了两种logistic回归模型,在此基础上还应用数据挖掘的思想对回归方程做进一步的测试,得到了分类准确率较高的验证,提示亚健康的主要临床特征表现为躯体的疲劳、睡眠不实、记忆力和工作效率下降、饮食二便失调,心理的空虚感和情绪易怒等.该方法在注重利用回归方程来判断和解释影响因素方面以及在自变量较多,使用传统意义的logistic回归建模可能出现共线性的情况方面,有很大的优越性.
数据挖掘 logistic回归 相关系数 聚类分析 亚健康 人群分类
刘保延 何丽云 谢雁鸣 李霞 匡宏波 易丹辉
中国中医科学院,北京,100700 中国人民大学统计学院,北京,100872
国内会议
北京
中文
197-202
2006-01-01(万方平台首次上网日期,不代表论文的发表时间)