数据流中基于负载卸除的决策分析
许多流数据源,例如网络化(通信工程、入侵检测、传感器网络)和金融服务(套汇、金融监控)等都容易产生尖峰脉冲.尖峰脉冲出现时,最大负荷量将远远超过标准负载,这时提供一个全面的数据流监测系统来处理最大负荷通常是不切实际的.然而,在多数监测背景下,监测应用程序在高负荷突发时能顺利地履行其作用是最为关键的.这时就会产生这样一个问题:就是当数据到达的速率以不可预知的形式增加时,会出现资源短缺问题,这将导致在对数据处理的过程中产生一段等待时间.为了避免出现延迟的情况,数据流管理系统必须以一种可控制的方式卸除一些负载.因此,负载卸除可以这样定义:当对资源的需求超过系统能力时,从系统中撤销过量的负载,这种过程就是负载卸除.由于负载卸除是通过撤销数据来减少对资源的需求,它是以牺牲查询结果的准确度为代价的.负载卸除的主要目标就是:在一定的精确度内,使得这种牺牲代价达到最小.本文阐述了一些解决方案,并对它们的简洁草图进行了分析。 本文首先考察了Au-rora系统中的一种能按当前负载的需求动态地在查询计划中插人和删除撤销操作符。它具有两种类型的撤销:第一种类型以一种随机化的方式撤销一部分元组,第二种类型的撤销是基于元组内容的重要性。其负载卸除处理由三个基本的决策组成,即负载卸除的时间,地点及负载卸除的数量。本文对其有效的解决方案进行了分析,并进一步说明这些解决方案能够以响应品质中最小化的降级将系统恢复到有效的运行范围之内。
数据流 负载卸除 数据处理 延迟 Au-rora系统
郑广寰 林锦贤
福州大学数学与计算机科学学院网络与信息中心,福州,350002
国内会议
第六届中国Rough集与软计算学术研讨会(CRSSC”2006)
浙江金华
中文
162-165
2006-10-30(万方平台首次上网日期,不代表论文的发表时间)