会议专题

众包数据管理研究进展与趋势

很多复杂的数据管理和分析任务难以通过自动处理方式完成,而利用人类的认知能力可以帮助解决这些”机器难”任务,例如,实体解析、情感分析和图像识别.众包数据管理就是借助互联网大众来解决这类复杂的数据处理和分析任务.众包数据管理已经受到了学术界和工业界的广泛关注.众包数据管理有三个关键问题:质量控制:由于互联网大众(工人)可能返回错误答案,因此需要有效的策略来处理工人答案,以获得高质量的结果;代价控制:众包不是免费的,代价控制的目的是减少花销;延迟控制:对比计算机处理任务的时间,工人完成任务花费时间较长,因此需要考虑任务的延迟控制.对于众包任务设计、众包数据操作和复杂众包查询的查询优化,目前已经有大量研究结果可用来解决这三个问题.本文综述了国内外众包数据管理的相关研究,并给出了众包数据管理今后的研究工作重点.

众包数据管理 质量控制 代价控制 延迟控制

李国良 冯建华 周立柱

清华大学计算机系,北京 CCF数据库专业委员会

国内会议

CCF2015-2016中国计算机科学技术发展报告会

太原

中文

114-160

2016-10-01(万方平台首次上网日期,不代表论文的发表时间)