会议专题

基于聚类的高效k-匿名化算法

KACA算法是一种较好的基于局部重编码的k-匿名化算法,它产生的匿名化微数据的信息损失少,数据可用性高.但该算法的效率低,不适合匿名化规模很大的微数据.为解决该问题,将高效的聚类算法——c-mocles算法——与KACA算法结合,提出了c-mocles-KACA算法.该算法首先采用c-modes算法将整个数据集划分为较大的类,然后采用KACA算法来分别k-匿名化这些类中元组数大于2k-1的类.实验表明,c-modes-KACA算法产生的信息损失量与KACA算法相近,效率却比KACA算法高得多.

高效k-匿名化算法 KACA算法 信息损失 数据库 聚类

于娟 韩建民 郭腾芳 夏赞珠

浙江师范大学数理与信息工程学院 浙江金华 321004

国内会议

NDBC2009第26届中国数据库学术会议

南昌

中文

105-111

2009-10-15(万方平台首次上网日期,不代表论文的发表时间)