频繁项集挖掘算法Apriori的改进研究
本文针对用于频繁项集挖掘的传统的Apriori算法具有多次扫描数据库、效率较低的缺点,本文给出了一种基于向量运算的改进的Apriori算法,首先扫描一次数据库,用向量表示1-项集,并对1-项集计数,获得频繁1项集,然后产生候选2-项集,并利用向量运算获得2-项集的向量表示并计数,产生频繁2项集,以此类推,直到所有的频繁项集都被发现,中间已有的事物压缩方法被使用压缩数据库减少计算量.最后通过实验与对比分析验证了该方法具有较高的效率.
数据挖掘 Apriori算法 频繁项集 向量运算
王洪利 冯玉强
哈尔滨工业大学管理学院,哈尔滨,150001
国内会议
成都
中文
94-99
2005-10-21(万方平台首次上网日期,不代表论文的发表时间)