会议专题

数据挖掘的关联规则研究

在超市数据上进行关联规则挖掘是R.Agrawal和R.Srihant在文中”5”中首先提出来的,从此出现了众多求关联规则的算法,所求的频繁项目集都依赖于用户给定的阈值,如著名的Apriori算法.用支持度来度量频繁项目集有一定的缺陷,对于最小支持度和最小可信度的选取有很大的主观任意性.如何给定阈值是一个困难的问题,如果阈值给得太大则可能得不到结果,如果阈值给得太小则会因为频繁集的元素过多而增加算法的时间复杂度.本文通过分析数据库中的数据特征来计算阈值,提出了关注项目集的概念,同时给出了求关注项目集的算法.

数据挖掘 关联规则 关注项目集

赵家刚 林毓材 夏幼明 顾震宇 杨秀国 徐声远

西南林学院计科系(昆明) 云南师范大学计信学院(昆明)

国内会议

第三届中国Rough集与软计算机学术研讨会

重庆

中文

137-138,145

2003-05-01(万方平台首次上网日期,不代表论文的发表时间)