会议专题

基于MapReduce的KNN分类算法的改进在动车组中的应用

KNN分类算法是数据挖掘中常用的算法,其缺点是其近邻的确定根据欧氏距离来计算,很可能产生偏差.针对这一问题,提出了相似度算法和欧氏距离算法相结合的方法,减少了可能出现的偏差,同时实现了MapReduce的并行化.动车组运维实验表明,该算法提高了分类的准确率和效率.

动车组 数据挖掘 K近邻分类算法 MapReduce框架

郭明亮 张骏温

北京交通大学计算机与信息技术学院 北京 100044

国内会议

中国计算机用户协会网络应用分会2014年第十八届网络新技术与应用年会

昆明

中文

445-448

2014-11-01(万方平台首次上网日期,不代表论文的发表时间)