多源Web对象与关系数据的集成
研究将异构的半结构化Web对象集成到关系数据库中。提出了一种改进的用于标记序列数据的条件随机域模型,该模型可以联合学习带标记的训练样例和无标记的关系数据库记录,从而减少了对繁琐的手工标记样本的依赖。所提出的序列数据标记模型可以用来解决Web源数据模式与关系数据模式的匹配问题。使用来自多个领域的大量的Web网页进行了实验,结果表明所提出的方法是有效的。
Web数据集成 模式匹配 条件随机域
黄健斌 姬红兵 孙鹤立
西安电子科技大学电子工程学院 陕西西安 710071 西安电子科技大学计算机学院 陕西西安 710071 西安电子科技大学电子工程学院 陕西西安 710071 西安交通大学计算机科学与技术系 陕西西安 710049
国内会议
西安
中文
362-365
2006-09-01(万方平台首次上网日期,不代表论文的发表时间)