会议专题

R-C4.5决策树模型及其在临床医疗数据挖掘中的应用

提出了一种健壮有效的决策树改进模型R-C4.5及其简化版本.该决策树模型基于著名的C4.5决策树模型,但在属性的选取和分枝策略上进行了有效改进.在R-C4.5算法中,通过合并分类效果差的分枝,有效避免了碎片等问题.该模型的简化版本在数据预处理阶段完成.实验证明,R-C4.5决策树模型及其简化版本在提高测试属性选择度量的可解释性、减少空枝和无意义分枝及过度拟合等方面有显著的提高.还将改进的R-C4.5算法应用到临床医疗领域,预测病人住院期,发现其分析结果可被管理者更好理解和接受,从而帮助医疗组织更好地规划管理医疗资源,达到优化资源配置的目的。

决策树模型 R-C4.5 C4.5 分类 临床医疗 数据挖掘 分枝策略 属性选取

刘鹏 姚正

上海财经大学信息管理与工程学院,上海,200433

国内会议

2005第一届中国分类技术与应用研讨会(CSCA)

北京

中文

96-101

2005-09-23(万方平台首次上网日期,不代表论文的发表时间)