XML在Web数据挖掘中的应用
在Internet上有海量的数据,并且Web数据所具有的半结构化特性使得Web数据挖掘更加复杂,已有的一些Web数据挖掘技术难以很好地解决这些问题。而XML语言既可以作为一种中间数据格式,又可以用来定义一致的数据结构,为Web数据挖掘提供了一种新的解决方法。本文分析了XML文档的数据结构,提出了一种对原始HTML文档进行分析并转换成XML文档的Web数据挖掘模式。
Web数据 数据挖掘 XML语言 HTML文档 模式分析
董俊 卢海涛
燕山大学信息科学与工程学院 秦皇岛 066004
国内会议
苏州
中文
169-171
2007-12-07(万方平台首次上网日期,不代表论文的发表时间)