分布式数据库约束性关联规则挖掘算法
提出了分布式环境下挖掘约束性关联规则的有效算法(DMARC),该算法采用改进的FP-树结构作为存储结构,可节省三分之一的树空间;利用被约束子树(用3个很小的数组表示)进行频繁项集的挖掘,而不生成条件频繁模式树或候选项集,可有效降低网络传输代价低.该算法对各站点数据库用约束条件进行压缩后,构建FP-树并进行被约束子树的挖掘,并将满足约束条件的被约束子树传输到中心站点集中进行全局频繁项集的挖掘,可快速挖掘出约束性关联规则.实验表明,该算法执行效率高,随着数据库规模的增大,算法的扩展性能好.
数据挖掘 分布式数据库 关联规则 项约束 被约束子树
宋宝莉 覃征
西安交通大学,计算机科学与技术系,西安,710049 西安交通大学,计算机科学与技术系,西安,710049;清华大学,信息科学技术学院,北京,100084
国内会议
河北保定
中文
816-819
2006-10-21(万方平台首次上网日期,不代表论文的发表时间)