会议专题

面向规划编制的网络数据获取与整合方法研究

传统规划工作常常受制于城市数据的缺乏.在大数据的发展背景下如何获取更多城市数据,服务规划编制工作?这是一个新的机遇与挑战.本文首先分析规划数据特点以及规划编制所面临的数据困境,然后讨论网络数据的作用和发展状况,确定了以此为突破口的研究思路,随后介绍网络数据获取与整合技术路线与方法。 规划工作很关注人、地和房的信息。本文介绍房产数据的获取案例,首先确定数据源头。房产数据广泛存在于房地产中介公司、主管政府机构和新闻门户等网站之中。中介所掌握的基础信息较为翔实,更新速度快,当然在房价等方面也存在着弄虚作假的情况;政府主要发布各类审批的监管信息;门户通常是对多家中介数据的汇总。因为数据源较多,所以可以采集多家数据进行交叉验证,例如链家、安居客的数据。 明确目标后,针对工作和数据源的特点与要求确定采集的内容。案例采集基本信息,包括小区名称、总户数、停车位、容积率、总建筑面积和小区地址等。分析网站的结构并制定抽取规则,最后利用火车采集器进行数据的采集,得到房产数据的列表。由于这类数据质量较好,主要完成地址匹配和坐标转换即可。利用百度的地址匹配服务对数据所含的小区地址进行空间化处理,最终得到成果数据。

城市建设 规划编制 数据处理 信息采集

吴运超 崔浩 王赛 王浩然 崔真真

北京市城市规划设计研究院,北京 100045 北京城垣数字科技有限责任公司,北京 100045

国内会议

第十七届中国科协年会

广州

中文

1-6

2015-05-23(万方平台首次上网日期,不代表论文的发表时间)