会议专题

利用深层网络爬虫的地表覆盖样本采集--以人造覆盖为例

目前,地表覆盖样本采集主要是利用野外实地调查和目视解译高分辨率影像图等方法,其采集周期长且成本昂贵,导致地表覆盖数据产品验证困难,特别是大区域地表覆盖数据产品的验证。 针对以上问题,本文借鉴Foody提出的以网络志愿者图片信息为地表覆盖样本的思想,提出采用深层网络爬虫技术挖掘网络信息中海量的、以文本形式存在的地表覆盖要素数据,并验证了其作为地表覆盖样本的可能性。为此,本文基于JavaScript脚本引擎设计开发了面向人造覆盖类别的深层网络爬虫,并以辽宁、北京、天津、山东和上海为实验区域验证了全球30m地表覆盖2010基准年的人造覆盖类别数据产品。实验证明,利用深层网络爬虫采集的网络地表覆盖文本数据可以作为地表覆盖样本,其准确率与第三方单位完成的初步精度评估相当,其样本采集周期较短,平均1秒采集0.59个,并且成本低廉,为实现自动化、短周期化和低成本化的地表覆盖样本采集提供了新的途径。

计算机网络 地表覆盖样本 信息采集 网络爬虫

侯东阳 陈斐 陈军 武昊 胡菊菊

中国矿业大学环境与测绘学院,江苏,徐州,221116;国家基础地理信息中心,北京,100036 国家基础地理信息中心,北京,100036;中南大学,地球科学与信息物理学院,湖南,长沙,410083 国家基础地理信息中心,北京,100036

国内会议

中国地理信息科学2014学术年会

徐州

中文

170-177

2014-10-11(万方平台首次上网日期,不代表论文的发表时间)