基于Apriori算法的XML频繁子树挖掘
在数据处理中,具有复杂结构的图和树占的比重越来越大.本文借鉴了对图、树集上进行的数据挖掘,突破了把XML文档当作Web数据、文本数据挖掘的局限,提出了基于Apriori算法的XML频繁子树挖掘算法ABXTM.该算法以大OLRT树表示XML文档,通过利用子树的深度优先遍历码、线性子树的最右结点扩展法和非线性子树的错位扩展法,减少了候选子树的产生,提高了算法的效率.本文还从理论和实验上证明了算法的可行性和有效性.
Apriori算法 频繁子树 数据挖掘 XML
张仕 赖会霞
福建师范大学计算机科学系,福州,350007;上海交通大学计算机科学系,上海,200030 福建师范大学计算机科学系,福州,350007
国内会议
沈阳
中文
19-23
2005-09-01(万方平台首次上网日期,不代表论文的发表时间)