会议专题

流数据立方体中的高效分阶回归算法

近年来,在诸多行业数据大量以流数据的形式出现,例如电信公司关于通话记录的数据。这些数据充分表现着流数据的两个典型特征:1.数据以流的形式到来而非静态的存储;2.数据到来的速度很快。以AT&T公司为例,他们每天收集到100Gb的数据,也就是说,每秒有多于1M的数据到来。这种数据量和速度对流数据管理系统设置了很大的挑战。本文采取分划渐进策略提出“分阶回归”作为多项式回归的一种替代算法来进行趋势分析,还证明了用分阶回归替代多项式回归的合理性。

流数据 分划渐进策略 分阶回归 多项式回归 数据管理

张铭 柳超 郑闽睿

北京大学信息科学与技术学院网络与信息系统研究所

国内会议

中国计算机用户协会网络分会2003年年会

海南三亚

中文

83-91

2003-12-03(万方平台首次上网日期,不代表论文的发表时间)