会议专题

基于Hadoop的局部支持向量机

随着物联网、云计算等技术的不断发展,产生的数据也以爆炸式的速度不断增长,如何在大数据中进行挖掘和分析成为了当前学术界研究的热点Hadoop分布式计算也因此逐渐成为了大数据挖掘和分析的主要技术支持向量机则是一种应用比较广泛的数据挖掘方法,局部支持向量机是在支持向量机的基础上引入局部学习算法的一种有效的分类算法但是,局部支持向量机需要为每个测试样本分别构造分类器,在大数据上进行分类的时间复杂度较高,分类效率比较低针对上述问题,结合Hadoop并行计算平台,提出了基于Hadoop的局部支持向量机算法本文对局部支持向量机进行了两方面的改进:第一是将计算测试样本的k近邻并行化,第二是将训练模型并行化通过测试实验,结果表明:基于Hadoop的局部支持向量机能够有效降低分类时间,且在分类精度上与局部支持向量机基本保持一致。

数据处理 支持向量机 分类算法 计算精度

崔文斌 温孚江 牟少敏 浩庆波

山东农业大学信息科学与工程学院,山东泰安271018 山东农业大学农业大数据研究中心,山东泰安271018 山东农业大学信息科学与工程学院,山东泰安271018;山东农业大学农业大数据研究中心,山东泰安271018

国内会议

第二届CCF大数据学术会议

北京

中文

1-7

2014-12-01(万方平台首次上网日期,不代表论文的发表时间)