会议专题

满足均匀分布的不确定数据关联规则挖掘算法

云计算为大数据提供了展示和共享的平台为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则的挖掘提供便利条件首先,依据泛化值之间可能的相交或包含关系,将泛化值进行分层聚类,为了保存与不确定数据集挖掘相关的重要信息,给出了构建不确定频繁模式树的算法,在此基础上,提出了频繁项集挖掘子算法(data mining algorithm for uncertain frequent item sets,UFI-DM)和关联规则生成子算法(algorithm forgenerating association rules,GAR),分别用于挖掘频繁项集和生成关联规则,最后,通过理论分析和实验比对,论证了算法的可行性和有效性.

不确定数据 频繁项集挖掘子算法 关联规则生成子算法 精度控制

陈爱东 刘国华 费凡 周宇 万小妹 貟慧

东华大学计算机科学与技术学院 上海 201600

国内会议

第30届中国数据库学术会议

哈尔滨

中文

186-195

2013-08-16(万方平台首次上网日期,不代表论文的发表时间)