高效隐私保护频繁模式挖掘算法研究
阐述了隐私保护数据挖掘的目标,即在获取有效的数据挖掘结果的同时,满足用户对隐私保护的要求.针对个体用户及组织用户的隐私保护,论述了不同的方法,并归纳出隐私保护数据挖掘中所采用的两种主流算法.改进了高效隐私保护关联规则挖掘算法(EMASK)中需要完全的数据库扫描并且进行多次比较操作的弊端,提出了基于粒度计算的高效隐私保护频繁模式挖掘算法(BEMASK).该算法将关系数据表转换成面向机器的关系模型,数据处理被转换成粒度计算的方式,计算频繁项集变成了计算基本颗粒的交集.特别是数据的垂直Bitmap表示,在保证准确性不降低的情况下,一方面减少了I/O操作的次数,另一方面较大地提高了效率.
数据挖掘 隐私保护 频繁模式挖掘算法 知识粒度
程舒通 徐从富 但红卫
浙江大学计算机科学与技术学院 杭州310027;杭州广播电视大学信息工程学院 杭州310012 浙江大学计算机科学与技术学院 杭州310027
国内会议
宜昌
中文
194-198
2014-10-31(万方平台首次上网日期,不代表论文的发表时间)