大规模InfiniBand网络自学习的故障诊断方法

针对大规模数据中心网络中如何有效监控网络异常事件、发现网络性能瓶颈和潜在故障点等问题,在深入分析InfiniBand(IB)网络的特性,引入了特征选取策略和增量学习策略的基础土,提出了一种面向大规模IB网络增量学习的故障诊断方法IL-Bayes,该方法以贝叶斯分类方法为基础,加入增量学习机制,能够有效提高故障分类精度.在天河2真实的网络环境下,对算法的诊断精度和误诊率进行了验证,结果表明1L-Bayes算法具有较高的故障分类精度和较低的误诊率.
数据中心网络 故障诊断 特征选取 增量学习
胡银辉 陈琳
国防科学技术大学计算机学院,长沙410073
国内会议
兰州
中文
3092-3096
2015-08-10(万方平台首次上网日期,不代表论文的发表时间)