一种两阶段的满足差分隐私的频繁项集挖掘算法
频繁项集挖掘是一项重要的数据挖掘任务,具有广泛的应用.然而,如果输入数据集中包含用户敏感信息,直接发布或分享挖掘结果可能会造成严重的个人隐私泄露.为了解决上述问题,提出了一种两阶段的满足差分隐私的频繁项集挖掘算法(记为TPFIM).在算法的第一阶段中,为了发现数据集中的频繁项集,提出了一种基于指数机制的频繁项集确定方法.在算法的第二阶段中,为了计算所发现的频繁项集的噪音支持度,提出了一种基于网格的噪音支持度计算方法.分析结果表明所提出的算法满足ε-差分隐私.实验结果表明,与现有算法相比,所提出的算法可以获得更好的数据效用.
频繁项集 数据挖掘 差分隐私 指数机制 噪音支持度
程祥 肖恪 唐朋 苏森
北京邮电大学网络与交换技术国家重点实验室,北京100876
国内会议
西安
中文
40-45
2016-06-24(万方平台首次上网日期,不代表论文的发表时间)