数据挖掘的关联规则研究

摘要：

在超市数据上进行关联规则挖掘是R.Agrawal和R.Srihant在文中”5”中首先提出来的,从此出现了众多求关联规则的算法,所求的频繁项目集都依赖于用户给定的阈值,如著名的Apriori算法.用支持度来度量频繁项目集有一定的缺陷,对于最小支持度和最小可信度的选取有很大的主观任意性.如何给定阈值是一个困难的问题,如果阈值给得太大则可能得不到结果,如果阈值给得太小则会因为频繁集的元素过多而增加算法的时间复杂度.本文通过分析数据库中的数据特征来计算阈值,提出了关注项目集的概念,同时给出了求关注项目集的算法.

关键词：数据挖掘关联规则关注项目集

作者: 赵家刚林毓材夏幼明顾震宇杨秀国徐声远

作者单位: 西南林学院计科系(昆明) 云南师范大学计信学院(昆明)

会议类型: 国内会议

会议名称: 第三届中国Rough集与软计算机学术研讨会

会议地点: 重庆

会议语种:中文

页码: 137-138,145

在线出版日期: 2003-05-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

数据挖掘的关联规则研究