一种面向聚类的对数螺线数据扰动方法
面向挖掘应用的隐私保护数据发布要求对数据集进行隐藏的同时维持数据的挖掘可用性,数据扰动是解决该问题的有效方法。现有的面向聚类的数据扰动方法难以兼顾原始数据个体隐私和维持数据聚类可用性,对此提出了一种基于对数螺线的隐私保护数据干扰方法。通过构建面向聚类的隐私保护数据扰动模型,利用对数螺线对原始数据进行扰动隐藏,维持原始数据的邻域关系稳定,实现数据集聚类可用性的有效维护;进一步提出多重对数螺线扰动的策略,提高隐私保护强度。理论分析和实验结果表明:文中方法能够有效地避免数据隐私泄露,同时维持数据的聚类可用性。
数据挖掘 隐私保护 数据扰动方法 对数螺线
HUANG Mao-Feng 黄茂峰 NI Wei-Wei 倪巍伟 WANG Jia-Jun 王佳俊 SUN Fu-Lin 孙福林 CHONG Zhi-Hong 崇志宏
School of Computer Science&Engineering, Southeast University, Nanjing 211189 东南大学计算机科学与工程学院 南京 211189
国内会议
合肥
中文
2275-2282
2012-10-01(万方平台首次上网日期,不代表论文的发表时间)