FSC--利用频繁项集挖掘估算视图大小
本文通过采样确定模型的参数,并将其推广到整个数据集进行估算,提出了一种视图估算的新方法FSC,引入了频繁项集挖掘的思想,在扫描两次数据库后可以得到cube中所有视图大小的估算值,实验证明,与同类算法相比,FSC的精度有较大地提高,特别是针对倾斜度较大的数据集。
视图估算 频繁项集 均匀分布 数据倾斜度 数据挖掘
邹远娅 周皓峰 王晨 汪卫 施伯乐
复旦大学计算机与信息技术系,上海,200433
国内会议
厦门
中文
64-70
2004-10-14(万方平台首次上网日期,不代表论文的发表时间)