会议专题

高效隐私保护频繁模式挖掘算法研究

阐述了隐私保护数据挖掘的目标,即在获取有效的数据挖掘结果的同时,满足用户对隐私保护的要求.针对个体用户及组织用户的隐私保护,论述了不同的方法,并归纳出隐私保护数据挖掘中所采用的两种主流算法.改进了高效隐私保护关联规则挖掘算法(EMASK)中需要完全的数据库扫描并且进行多次比较操作的弊端,提出了基于粒度计算的高效隐私保护频繁模式挖掘算法(BEMASK).该算法将关系数据表转换成面向机器的关系模型,数据处理被转换成粒度计算的方式,计算频繁项集变成了计算基本颗粒的交集.特别是数据的垂直Bitmap表示,在保证准确性不降低的情况下,一方面减少了I/O操作的次数,另一方面较大地提高了效率.

数据挖掘 隐私保护 频繁模式挖掘算法 知识粒度

程舒通 徐从富 但红卫

浙江大学计算机科学与技术学院 杭州310027;杭州广播电视大学信息工程学院 杭州310012 浙江大学计算机科学与技术学院 杭州310027

国内会议

2014湖北省计算机学会学术年会

宜昌

中文

194-198

2014-10-31(万方平台首次上网日期,不代表论文的发表时间)