基于MapReduce的KNN分类算法的改进在动车组中的应用
KNN分类算法是数据挖掘中常用的算法,其缺点是其近邻的确定根据欧氏距离来计算,很可能产生偏差.针对这一问题,提出了相似度算法和欧氏距离算法相结合的方法,减少了可能出现的偏差,同时实现了MapReduce的并行化.动车组运维实验表明,该算法提高了分类的准确率和效率.
动车组 数据挖掘 K近邻分类算法 MapReduce框架
郭明亮 张骏温
北京交通大学计算机与信息技术学院 北京 100044
国内会议
中国计算机用户协会网络应用分会2014年第十八届网络新技术与应用年会
昆明
中文
445-448
2014-11-01(万方平台首次上网日期,不代表论文的发表时间)