基于Apriori算法的XML频繁子树挖掘

摘要：

在数据处理中,具有复杂结构的图和树占的比重越来越大.本文借鉴了对图、树集上进行的数据挖掘,突破了把XML文档当作Web数据、文本数据挖掘的局限,提出了基于Apriori算法的XML频繁子树挖掘算法ABXTM.该算法以大OLRT树表示XML文档,通过利用子树的深度优先遍历码、线性子树的最右结点扩展法和非线性子树的错位扩展法,减少了候选子树的产生,提高了算法的效率.本文还从理论和实验上证明了算法的可行性和有效性.

关键词： Apriori算法频繁子树数据挖掘 XML

作者: 张仕赖会霞

作者单位: 福建师范大学计算机科学系,福州,350007;上海交通大学计算机科学系,上海,200030 福建师范大学计算机科学系,福州,350007

会议类型: 国内会议

会议名称: 第二届全国Web信息系统及其应用会议(WISA2005”)

会议地点: 沈阳

会议语种:中文

页码: 19-23

在线出版日期: 2005-09-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于Apriori算法的XML频繁子树挖掘