Internet中基于K-Means的远程服务器工作状态的聚类研究
在Internet数据集成环境中,服务器的工作状态卣接影响到执行查询的时间费用,确定服务器工作状态在计算查询费用的过程中起着非常重要的作用。本文采用样本查询的方法,利用聚类分析中的K-Means方法,划分出远程服务器的各个工作状态,并确定了相应的查询响应时间,结合远程服务器数据查询的特点,采用多元回归模型,建立基于服务器工作状态的查询费用预测模型。通过在实际环境中,对一组远程服务器和客户端进行的实际测试,通过对比估算费用与实际测试费用之间的最大误差为26%,最小误差7.4%,大多数误差率在10%左右,而这样的误差在广域网环境下是可以接受的。
远程服务器 工作状态 K-Means方法 聚类分析 查询费用模型 多元回归分析
郁松 樊晓平 廖志芳
中南大学软件学院,长沙 410075 中南大学信息科学与工程学院,长沙 410083
国内会议
昆明
中文
773-776
2008-07-01(万方平台首次上网日期,不代表论文的发表时间)