大规模机群系统日志的多维失效分析

大规模机群因其良好的易构建性和可扩展性,已广泛应用于科学计算和商业应用中。通过分析大规模机群系统中的日志,可以预测失效、侦测失效、定位故障根源,提高系统和应用的可靠性和可用性。本文提出了一种基于图挖掘的多维失效分析方法来分析多源的系统日志,以获得更加完整和 准确的失效知识。通过曙光4000A高性能计算机系统中系统日志的多维失效分析,实验结果证明了这种方法的有效性。
计算机群 系统日志 失效分析 图挖掘技术
周伟 詹剑锋 刘旭 孟丹
中国科学院计算技术研究所国家智能计算机研究开发中心 北京 100190;中国科学院计算机系统结构重点实验室 北京 100190;中国科学院研究生院 北京 100049 zhouwei@ncic.ac. 中国科学院计算技术研究所国家智能计算机研究开发中心 北京 100190;中国科学院计算机系统结构重点实验室 北京 100190
国内会议
无锡
中文
486
2008-10-30(万方平台首次上网日期,不代表论文的发表时间)