会议专题

XML在Web数据挖掘中的应用

在Internet上有海量的数据,并且Web数据所具有的半结构化特性使得Web数据挖掘更加复杂,已有的一些Web数据挖掘技术难以很好地解决这些问题。而XML语言既可以作为一种中间数据格式,又可以用来定义一致的数据结构,为Web数据挖掘提供了一种新的解决方法。本文分析了XML文档的数据结构,提出了一种对原始HTML文档进行分析并转换成XML文档的Web数据挖掘模式。

Web数据 数据挖掘 XML语言 HTML文档 模式分析

董俊 卢海涛

燕山大学信息科学与工程学院 秦皇岛 066004

国内会议

第五届全国数字博物馆与文化自然遗产数字化及保护研讨会

苏州

中文

169-171

2007-12-07(万方平台首次上网日期,不代表论文的发表时间)