大数据模式分解的隐私保护研究
现有的大多数隐私保护技术往往忽略了敏感属性不同取值和准标识符属性之间存在的特殊关联,并且各领域对数据隐私保护的多方面要求,使得发布的匿名数据需要满足复合隐私约束。对近似敏感属性值和复合隐私约束进行分析,提出了基于大数据模式分解和聚类分析的隐私保护算法。给出了聚类敏感属性值保护相似值方法,设置不同权重的敏感属性,保留重要的属性。使用三维不规则结构矩阵的效用矩阵,来获取精度较高的匿名数据,实现匿名数据的模式分解。在真实数据集上的大量实验结果表明,该算法的数据精确率、尝据纠错率都有明显提升,近似攻击率降低。
数据安全 隐私保护 逻辑结构 聚类算法 模式分解
LI Ning 李宁 ZHU Qing 朱青
Department of Computer Science, School of Information, Renmin University of China, Beijing 100872, C 中国人民大学信息学院计算机系,北京100872
国内会议
合肥
中文
961-973
2012-10-01(万方平台首次上网日期,不代表论文的发表时间)