基于随机森林对变量选择的探讨
随机森林(RF)被广泛用于数据分类和回归问题,随机森林算法是Leo Breiman在2001年提出的.本文主要针对变量选择的两个经典问题进行分析.第一个是找到重要变量为解释变量,第二个是更加严格地去设计一个好的预测模型.其贡献主要是基于随机森林对变量的重要性指标提供一些见解,并且使用随机森林的重要性为解释变量的排名提出一个策略,逐步提升变量引入策略.
数据处理 变量选择 随机森林 引入策略
向永靖 何沿平 郁钟铭
贵州民族大学理学院,贵阳550025
国内会议
贵阳
中文
127-135
2016-12-18(万方平台首次上网日期,不代表论文的发表时间)