不均衡故障诊断数据上的特征选择
不均衡数据在实际应用中广泛存在,它们已对机器学习领域构成了一个挑战,如何有效处理不均衡数据也成为目前的一个新的研究热点.在故障诊断数据集中,故障样本数通常比非故障样本数要少很多,由此引发了数据不均衡问题下故障诊断的问题.以往的研究很少关注这种数据不均衡问题对故障诊断的影响.此外,在故障数据集中有一些冗余甚至是不相关的特征,这些特征降低了学习器的泛化能力.为解决这类问题,提出了一种基于嵌入式特征选择的EasyEnsemble算法来解决故障诊断中的数据不均衡问题.在UCI数据集和柴油发动机数据集上的实验结果表明新算法提高了分类器在不均衡数据集上的分类性能和预报能力.
特征选择 不均衡数据集 集成学习 故障诊断 柴油发动机 机器学习
刘天羽 李国正 尤鸣宇
上海电机学院,电气学院,上海,200240 同济大学,控制科学与工程系,上海,201804
国内会议
徐州
中文
924-927
2009-05-01(万方平台首次上网日期,不代表论文的发表时间)