会议专题

云环境下动车组故障数据挖掘研究与应用

动车组作为一种高速、安全的铁路客运设备,在运营过程中难免发生故障.动车组的故障数据具有快速、多源、异构和动态的特点,数据的复杂性也越来越高.针对动车组故障数据的特点,传统的数据挖掘算法不能满足应用的要求.为解决这些问题,将传统的数据挖掘算法与目前流行的云计算平台Hadoop结合,把海量的动车组故障数据关联规则挖掘任务分解到集群中的多台计算机上并行处理.改进了挖掘过程中集群负载平衡算法,提高了计算机硬件的利用率.改进了传统Apriori算法中在”连接步”的算法,减少了计算量,提高了动车组故障数据挖掘的速度.最后通过不同大小的故障数据集对系统进行测试,分析了在不同节点数、不同支持度情况下数据挖掘系统的性能.

动车组 云环境 故障数据挖掘 集群负载平衡算法

胡辉 张骏温

北京交通大学计算机与信息技术学院 北京 100044

国内会议

中国计算机用户协会网络应用分会2014年第十八届网络新技术与应用年会

昆明

中文

413-416,448

2014-11-01(万方平台首次上网日期,不代表论文的发表时间)