会议专题

复杂数据上的实体识别技术研究

  复杂数据当前有着广泛的应用,有效地使用复杂数据需要对其质量进行管理。实体识别是数据质量管理的基本操作,用于在数据集合中发现同一实体的不同描述,其在数据质量管理中可以用于错误检测、不一致数据发现等。由于包含复杂的结构信息,复杂数据上的实体识别与传统文本和关系数据上的实体识别不同,带来了新的技术上的挑战。本文介绍了复杂数据上实体识别的概念和应用,分别讨论了XML数据、图数据和复杂网络上实体识别技术的原理,最后展望了未来的研究方向。

数据管理 复杂数据 数据质量 实体识别技术

王宏志 樊文飞

哈尔滨工业大学计算机科学与技术学院哈尔滨 150001 哈尔滨工业大学计算机科学与技术学院哈尔滨 150001;爱丁堡大学信息学院 英国爱丁堡 EH8 9AB

国内会议

第28届中国数据库学术会议

上海

中文

1843-1852

2011-10-21(万方平台首次上网日期,不代表论文的发表时间)