多源建筑地址数据标准化建设与应用——以南昌市为例

江西地名研究

关注我们,获取更多地名资讯

摘要:地名地址数据是新型智慧城市时空基础设施之一,其成果作为城市政务信息共享交换的重要载体,在政府各行业专题地理信息应用建设中发挥着关键的纽带作用。本文在调查分析的基础上,提出地名地址数据建设方法,并以南昌市为例,介绍城市建筑地址生产、多源地址数据标准化、建立地址数据库、地址数据管理与更新机制。最终建成统一标准、覆盖全面、现势性良好的地名地址数据,并通过对外提供地址数据接入,在全市各委办局和相关部门进行推广应用,实现城市精细化管理,提升南昌市地理信息公共服务能力和水平。

关键词:标准建筑地址;智慧城市;地名地址;地理信息

0

引言

在中国,随着智慧城市建设的快速发展,政府各部门相继对地址数据建设管理工作做出部署。为此,国家自然资源部要求开展地名地址数据建设,为智慧城市建设提供数据基础。地名地址数据被广泛用于房屋管理、公共安全管理、地理信息管理、配送物流管理等诸多领域。各相关行业积累了大量地址数据,并建立了满足各自业务需求的地址库。但是,现有的地址信息在描述规则、存储格式、数据质量及现势性等方面各不相同,导致资源难以共享。因此,有必要建设统一标准的地名地址库,将各部门地址数据进行关联,降低数据冗余,实现信息共享和业务协同,提升管理效率。针对地名地址数据存在的问题,很多学者开展了关于地名地址数据建设的研究,当前的研究主要集中在地址编码、标准地址库建设、地址解析和匹配、地址服务应用等方面,对于数据更新的研究相对不足。

地名地址库首次建设固然重要,但要想长期发挥作用,还须建立有效且便于实施的信息化管理应用服务平台和更新维护管理制度。本文主要研究建筑地址标准化、数据采集建库流程、管理应用平台及数据更新维护办法等内容,并以南昌市为例,通过实践验证其建设思路的可行性,为类似项目的生产、建设、管理与应用提供一定参考。

1

现状分析

地名地址是自然、人文地理位置的结构化描述,是城市管理中最直接、可形象化感知的一类数据,其与民政、公安、房管、自然资源管理等工作密不可分。民政部门是标准地名管理单位,负责区域内地名的命名、更名的审核、报批、发布工作,南昌市第二次全国地名普查成果约3万条,数据空间位置精度较好,可用于地名的核验。公安部门负责沿街门牌发放和户籍登记管理工作,全市警用地址530万余条,数据空间位置精度较低,存在命名不规范等问题,但由于其数据量大,可作为地名地址库建设的主要来源。房管部门在房屋权属管理和测绘量算过程中会对房屋的楼栋号、单元号、房号等信息进行采集录入,其楼栋单元房号信息较完备和准确,能精准快速地定位到一个颗粒度更细的地址。自然资源部门在不动产业务办理中需实现房屋落宗落幢,其空间位置精度最准确,但目前覆盖面积较小。

总体而言,南昌市地址数据在建设管理过程中存在以下问题:①部门间存在信息共享壁垒,各部门都积累了满足自身业务需求的地名地址数据;②数据标准不统一,各部门间地址格式与命名方式各不相同,同一个地理位置上的地址表述千差万别,给数据应用推广带来不利影响;③地名地址管理“九龙治水”,民政管理行政区划、道路、小区等地名,公安管理门牌号,房管管理楼栋房号,造成了谁都能管、谁都难管的尴尬局面;④更新周期较长,无法满足各部门对地址数据时效性的要求;⑤未建立地址数据与建筑地理实体间的关联,无法充分发挥地址数据在政务信息融合中的作用。

2

标准地址数据建设

2.1建设思路

在对地名地址现状分析的基础上,基于民政、公安、自然资源等部门需求制定统一的地名地址数据标准,对各部门存量地名地址数据进行汇聚和标准化治理,形成初始库。为保证数据的准确与时效性,本文提出采用外业地址调查核实手段,对治理的初始库进行外调核实,清理无效地名地址;将地址与建筑地理实体关联,实现“有房就有址”的目标;通过建立全市统一的建筑地址库,保证全市使用同一套标准的地名地址数据,从源头上破解涉房、涉址信息共享难、管理难的问题。同时,为实现第一时间发现变化的地名地址信息,通过建立地名地址数据协同更新机制,实现对地名地址数据主动式更新,基于统一地址数据服务支撑平台驱动,实现对地址数据的全生命周期闭环式管理。本文地址数据建设应用路线如图1所示。

2.2关键技术

2.2.1 基于多级地址模型技术实现标准地址数据管理

本文采用多层级地址模型,旨在尽可能完整地把人类在生产、生活中对于空间位置的描述语言转换成结构化、规范化语言,并实现地理定位。多层级地址模型通过地理实体、地址要素、地址三个层次来表达,使得地址要素在标准地址规范的约束下,按照特定规则和次序排列,按需组合形成最终的标准地址。

2.2.2 利用多源异构数据融合技术实现统一标准地址库的建立

基于地址模型和地名地址数据规范对不同来源的地址数据进行汇聚、清洗与融合。利用Python脚本、地址规则对地址文本结构的完整性、冗余性、规范性进行分析,对问题地址进行自动化识别,通过预处理、标准化处理、数据审核等内业工艺流程,对错、漏、重地址数据进行统一治理。通过对多源异构存量地址数据的融合,实现全市统一地址库的建立。

2.2.3 利用大数据挖掘分析技术实现数据质量与工效的提升

通过大数据匹配算法对大量不同来源地址数据进行数据挖掘分析,可实现自动化筛选和获取更精准的门楼址信息,以AOI(兴趣面)为例,通过对AOI进行聚类、AOI区域筛选,低精楼栋聚类、楼栋二次聚类排序、楼栋坐标异常剔除等过程,可获取高精楼栋坐标和门楼址信息,通过新技术的引入降低大量人工外业核实工作量,提升了整体工效。

2.3地址数据标准化

为做好地名地址数据采集、处理、建库、更新和共享交换工作,在遵循国家、行业和地方颁布的标准的基础上,充分结合实际使用需求,提出标准地名地址数据建设模型。

2.3.1 地址要素分类

地址要素是构成地址最小语义单元,通常也是某个地理实体的名称。根据实际需要,地址要素层级分类基本涉及八类:行政区、街路巷、社区(或行政村、工业园)、住宅小区(或自然村、标识性地物名)、门址、楼名、单元、户室。另外,根据南昌市地名特点,地址要素还可包含开发管理区,如高新区、经开区和湾里管理局等。

2.3.2 地址分级与构成

地址是由一组非空的地址要素组成,可采用巴科斯范式定义为:

建筑地址∶∶=<行政区域><基本区域><局部点位置>,其中:

行政区域∶∶=<省><市><县><乡>

基本区域∶∶=[开发管理区][社区]<{[街路巷][住宅小区]|[自然村]|[标识性地物名]}>

局部点位置∶∶=[门址][楼名][单元号][户室号]

其中,∶∶=表示“被定义为”;<>代表必选项;[]内为可选项;|代表或者,表示符号左右元素二选一;{}为集合符号。

通过对地址要素间逻辑关系的梳理与标准化,有助于数据采集部门和应用部门间开展地名地址信息交换与共享。

2.3.3 地址编码

建筑地址编码方式设计为:

标准地址编码=行政区划码+开发管理区码+街路巷码+住宅小区码+门址码+门址通名+楼址码+楼址通名+单元码+单元通名+室号码+室号通名。

(1)行政区划码:采用省、市、县、乡四级行政区域名称代码,共9位数字唯一指代;

(2)开发管理区码:按流水号编码,代码长度设为1,无开发区补0表示;

(3)街路巷码:最小政区内街路巷顺序码,代码长度设为3,从01~999。该编码方式体现了基本区域地址要素与行政区域地址要素的关联,建立了不同层级地址的约束;

(4)住宅小区码:小区、自然村或标识性地物,可以被“街路巷码+门址号+门址通名”唯一指代,以降低数据冗余。例如,“红谷中大道1568号”代表名为“红谷凯旋”的小区;

(5)局部点位码:采用“楼址码+楼址通名+单元码+单元通名+室号码+室号通名”编码。

将标准地址按上述方式编码,可获得唯一标识地址编码,以便地址管理与地址匹配。

2.3.4 标准地址表设计

地名地址数据库表是存储按照一定规则进行结构化表述的规范地址,数据表字段可包括地址标识码、地址编码、地址名称、地名别名、采集时间、启用时间、停用时间、所属建筑编码、数据来源、坐标位置等。

2.4标准地址库建设

标准地址库建设经历以下四个阶段:

(1)准备阶段:包括人员及设备调配、数据资料收集与分析、方案编写与评审、人员培训等各项准备工作;

(2)数据汇聚治理:包括收集各部门现有地名地址数据,利用数据清洗软件对数据进行组织重构、去重与分类,通过标准化治理步骤,形成统一的地址内业初始库;

(3)外业调查采集:包括调查底图制作、外业实地调查核实、坐标与属性信息采集、外业照片拍摄等。采集内容与深度因需求有所不同,居住区采集到户室号,同时对门址缺失的进行预编门牌号,强制采集门牌号和街路巷名,栋号或楼名;

(4)内业整理入库:包括属性录入、内业检查、对象化构建、入库检查、数据导入、建筑物地理实体挂接等工作。

2.5应用平台建设

依托治理后的标准地名地址数据,建设统一的地址应用平台,改变业务登记地址信息由“填”为“选”的方式,通过“选择”让业务地址登记具有规范化地址描述,从源头解决地址信息输入不规范的问题。通过平台提供地址数据的接入、地址数据的处理、地址实时服务接口以及数据管理维护功能,实现城市精细化管理与综合服务能力的提升。

目前,南昌市主要在市场监管、公安、不动产登记中心等部门进行了地址应用服务,将市场监管局约16万条法人地址坐落信息等非空间化的文本信息通过该平台进行匹配,实现企业法人在地图上的显示与管理,同时将地址数据与不动产关联,推进了信息协同,有效提升了业务处置能力,取得了良好的应用成效。

3

业务协同更新机制建设

地名地址数据服务的时效性一直是用户关注的重点,持续提升数据更新效率、加快数据更新速度对于更好地满足各类应用需求至关重要。目前地名地址数据更新采用的方法主要有外业调绘采集法、移动GIS采集法、泛在更新法、地址匹配更新法等,这些方法都存在投入高、现势性差等问题。通过对地名地址数据建设管理现状的分析与梳理,可从地名地址数据日常业务管理入手,从源头上解决地名地址数据更新问题。

本文提出“业务协同更新”+“年度更新”相结合的更新模式。其中“业务协同更新”指的是通过地名地址申请单位在地名报批、门牌号申领、不动产产权办理流程中,触发地名地址相关业务办理,从而实现对现有标准地名地址数据的更新,并由不动产落幢落宗过程获取标准地址对应的空间位置坐标信息,从而实现基于业务协同办理对地址库主动式更新。“年度更新”则采用外业配合多源数据融合方式,对发展变化快的区域进行一年一度的整体更新。

4

结束语

地名地址数据作为重要的基础地理信息数据资源,是最常用的社会公共信息之一,与人们的日常生活出行息息相关,在城市社会治理、公众信息服务等众多领域发挥着日益重要的作用。通过对地名地址数据建设管理的研究,按照“统一标准——数据建设——平台应用——机制保障”的基本思路,总结出了城市建筑地址数据建设管理的完整解决方案,可为城市社会治理和新型智慧城市建设提供技术支持。

作者:冯金福

来源:《工程勘察》2022年第8期

选稿:宋柄燃

编辑:刘 言

校对:杜佳玲

审订:王玉风

责编:杜佳玲

(由于版面有限,文章注释内容请参照原文)

往期精彩推送

微信扫码加入

中国地名研究交流群

QQ扫码加入

江西地名研究交流群

欢迎来稿!欢迎交流!

转载请注明来源:“江西地名研究”微信公众号