会议专题

知识发现在2型糖尿病数据处理中的应用研究

将知识发现理论引入到2型糖尿病发病相关因素数据处理中,从大量实测数据中识别出有效的、潜在的、有用的、可理解的发病规律.方法:根据2型糖尿病数据的特点,选用数据挖掘C4.5算法对17072条有效的整群抽样横断面健康调查数据进行决策树分类.结果:通过训练模型给出糖尿病患病与滞的决策分类树,该决策树可以直观地给出发病相关因素的不同层次的相对影响,经实验测试结果对于未患病的正确识别率为92.05﹪,对于患病的正确识别率为80.90﹪.结论:决策分类树结果同目前认识的高危因素率为80.90﹪.结论:决策分类树结果同目前认识的高危因素趋于一致,说明数据挖掘C4.5算法适用于用于2型糖尿病的发病相关因素数据分析处理,是2型糖尿病数据处理的一种新方法,其在疾病的宏观控制中有着广阔的应用前景.

2型糖尿病 知识发现 数据挖掘 决策分类树 数据处理

罗森林 张铁梅 成华 曾平 陈峰 韩怡文

北京理工大学一院5系信息对抗技术教研室 卫生部北京老年医学研究所 中科院计算机所 南京医科大学生物医学统计系

国内会议

2004中国卫生信息技术交流大会

广州

中文

87-90

2004-11-01(万方平台首次上网日期,不代表论文的发表时间)