基于条件随机场的中文地址要素识别研究
地址编码是联系空间信息和社会经济信息的桥梁,也是基础地理信息平台的基础.由于中文地址的复杂性和不规范性,使得国外成熟的地址编码技术无法在国内直接推广使用.地址要素识别是地址编码的基础性工作,它是地址标准化的第一步,具有重要的研究意义.以宁海县地理编码数据库建设与更新为研究背景,利用条件随机场模型进行中文地址要素识别的研究.结合宁海县实际情况,通过统计的方法确定上下文窗口的宽度,抽象出地址要素的原子特征和复合特征,并从横向和纵向两个方向测试了条件随机场模型识别中文地址要素的性能。实验表明,条件随机场的性能相较基于规则的方法具有明显优势。
地理编码数据库 地址要素识别 条件随机场模型
黄炳耀
宁海县规划设计院,宁海315600
国内会议
杭州
中文
107-112
2015-12-01(万方平台首次上网日期,不代表论文的发表时间)