会议专题

基于地址要素逆向对齐的莱文斯坦匹配算法研究

随着互联网和大数据时代的到来,存储的数据越来越多,需要转化成信息和知识的要求也日益明显.在城市中,地名地址数据是非常常见的,地址是用来表达地理空间位置的重要方式,基于位置的服务(Location Based Services,LBS)已经在悄悄的改变人们的生活和工作方式,越来越多的行业也开始引入GIS拓展其应用,如卫生部门开始利用收集到的疾病数据和地址数据进行疾病制图空间分析为政府和社会公众提供服务和决策.地理匹配是在城市空间定位和空间分析中有很好的应用前景。在地址匹配过程中,匹配算法直接影响地址匹配的效率和准确度,地址匹配是依据一定的匹配策略比对地址字符串和数据库中的标准字符串,地址匹配通常用相似度来衡量匹配的效果和准确度,相似度是用来度量个体之间的相似性和差异性的指标值,相似度有时候计算不方便,可以用相似距离来代替,相似距离越大,相似度越低;相似距离越小,相似度越高。基于地址要素逆向对齐的莱文斯坦距离地址匹配算法是根据特定的输入数据属性值和属性值在参考数据集的匹配给出最佳的地址记录,地址匹配是地理编码中最为复杂最为重要的部分。地址匹配关键的处理过程包括输入数据的形式和语法与参考数据集兼容的标准化和规范化。改进的地址匹配算法在匹配效率和准确度方面得到了一定的提升,为社会经济、人口数据的空间化提供了新的方法,深圳市医学信息中心利用该方法深圳市疾病制图和空间分析应用中取得了良好的效果。

地理信息系统 空间定位 莱文斯坦匹配算法 地址要素 逆向对齐

胡涛 杜清运

武汉大学 资源与环境科学学院

国内会议

2015全国博士生学术论坛(测绘科学与技术)

武汉

中文

1-3

2015-10-31(万方平台首次上网日期,不代表论文的发表时间)