GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

第6章空间数据采集与处理

整个地理信息系统就是围绕着空间数据的采集、处理、存储、分析和表现而展开的,因此空间数据来源、采集手段、生成工艺、数据质量都直接影响到地理信息系统应用的潜力、成本和效率。本章首先介绍数据源及其基本特征,同时概述空间数据采集与处理的基本流程;在此基础上,分别介绍空间数据和属性数据的采集方式,数据编辑、数学基础变换以及数据重构等数据处理的原理与方法;然后讲解了数据质量评价与控制相关理论,最后简述了数据入库的主要流程。

6.1概述

空间数据的准确、高效的获取是GIS健壮运行的基础。空间数据的来源多种多样,包括地图数据、野外实测数据、空间定位数据、摄影测量与遥感图像、多媒体数据等等。不同的数据有不同的采集方法,能够获取的空间数据也不尽相同,这其中涉及到:①数据源的选择;②采集方法的确定;③数据的进一步编辑与处理,包括错误消除、数学基础变换、数据结构与格式的重构、图形的拼接、拓扑的生成、数据的压缩、质量的评价与控制等等,保证采集的各类数据符合数据入库及空间分析的需求;④数据入库,让采集的空间数据统一进入空间数据库。本章将系统介绍数据采集与处理过程所涉及的理论方法和关键技术。

6.1.1数据源分类

GIS数据源比较丰富,类型多种多样,通常可以根据数据获取方式或数据表现形式进行分类(图6.1)。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

根据数据获取方式可以分为:①地图数据。地图是传统的空间数据存储和表达的方式,数据丰富且具有很高的精度。国家基本比例尺系列地形图以及各类专题地图,经过数字化处理,是GIS最重要的数据源之一;②遥感影像数据。随着航空、航天和卫星遥感技术的发展,遥感影像数据以其现时性强等诸多优点迅速成为GIS的主要数据源之一。摄影测量技术可以从立体像对中获取地形数据,对遥感影像的解译和判读还可以得到诸如土地利用类型图、植被覆盖类型等等诸多数据信息;③实测数据。各种野外、实地测量数据也是GIS常用的获取数据的方式。实测数据具有精度高、现势性强等优点,可以根据系统需要灵活地进

行补充。④共享数据。地理信息系统发展的过程中,产生了大量的数据信息。经过格式转换,许多数据、信息在不同的系统中是可以重复利用的。因此,很多时候有必要进行数据共享以降低系统成本和防止资源浪费。同时,通信、网络技术的高度发达,为地理信息共享提供了高效可行的通道。⑤其他数据。通过其他方式获取的数据。

按照数据的表现形式还可以将数据分为数字化数据、多媒体数据及文本资料数据。

6.1.2数据源特征

1. 地图数据

各种类型的地图是目前GIS 最常见的数据源。地图是地理数据的传统描述形式,是具有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富,图上实体间的空间关系直观,而且实体的类别或属性可以用各种不同的符号加以识别和表示。不同种类的地图,其研究的对象不同,应用的部门、行业不同,所表达的内容也不同。主要包括普通地图和专题地图两类。普通地图是以相对平衡的详细程度表示地球表面上的自然地理和社会经济要素,主要表达居民地、交通网、水系、地貌、境界、土质和植被等。其中大比例尺地形图具有较高的几何精度,真实反映区域地理要素的特征。专题地图着重反映一种或少数几种专题要素,如地质、地貌、土壤、植被和土地利用等原始资料。通常以地图作为GIS 数据源时可将地图内容分解为点、线和面三类基本要素,然后以特定的编码方式进行组织和管理。此外,地图是经过系列制图综合的产物,在GIS 趋势分析、模式分析等方面具有非常重要的作用。

在应用地图数据时应注意以下几点:

(1)地图存储介质的缺陷。由于地图多为纸质,在不同的存放条件下存在不同程度的变形,具体应用时,须对其进行纠正。

(2)地图现势性较差。传统地图更新周期较长,造成现存地图的现势性不能完全满足实际需要。

(3)地图投影的转换。使用不同投影的地图数据进行交流前,须先进行地图投影的转换。

2. 遥感影像数据

遥感影像(航空、卫星)数据是GIS 中一个极其重要的信息源(图6.2,图6.3)。通过遥感影像可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影像还可以取得周期性的资料,这些都为GIS 提供了丰富的信息。每种遥感影像都有其自身的成像规律、变

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

形规律,所以在应用时要注意影像的纠正、影像的分辨率、影像的解译特征等方面的问题。

3.

实测数据

图6.3 航空影像局部

图6.2 卫星遥感影像局部

实测数据主要指各种野外实验、实地测量所得数据,它们通过转换可直接进入GIS的空间数据库以用于实时分析和进一步应用。其中,GPS点位数据、地籍测量数据等通常具有较高的精度和较好的现势性,是GIS的重要数据来源。

4.统计数据

许多部门和机构都拥有不同领域如人口、自然资源等方面的大量统计资料、国民经济的各种统计数据,这些常常也是GIS的数据源,尤其是属性数据的重要来源。统计数据一般都是和一定范围内的统计单元或观测点联系在一起,因此采集这些数据时,要注意包括研究对象的特征值、观测点的几何数据和统计资料的基本统计单元。当前,在很多部门和行业内,统计工作已经在很大程度上实现了信息化,除以传统的表格方式提供使用外,已建立起各种规模的数据库,数据的建立、传送、汇总已普遍使用计算机。各类统计数据可存储在属性数据库中与其它形式的数据一起参与分析。表6.1为一统计图表,记录不同地区不同月份的气温递减率。

表6.1 各地气温递减率/℃/100m(据伍光和,2000)

地区测站高度差(m) 1月4月7月10月

天山南坡阿克苏—阿合奇883 0.03 0.57 0.59 0.31

天山北坡乌鲁木齐—小渠子1266 -0.40 0.50 0.74 0.40

祁连山北坡玉门镇—玉门市800 -0.03 0.49 0.50 0.26

贺兰山区银川—贺兰山1789 0.29 0.59 0.64 0.50

5.共享数据

目前,随着各种专题图件的制作和各种GIS系统的建立,直接获取数字图形数据和属性数据的可能性越来越大。GIS数据共享已成为地理信息系统技术的一个重要研究内容,已有数据的共享也成为GIS获取数据的重要来源之一。但对已有数据的采用需注意数据格式的转换和数据精度、可信度的问题。

6.多媒体数据

由多媒体设备获取的数据(包括声音、录像等)也是GIS的数据源之一,目前其主要功能是辅助GIS的分析和查询,可通过通讯口传入GIS的空间数据库中。

7.文本资料数据

各种文字报告和立法文件在一些管理类的GIS系统中,有很大的应用,如在城市规划管理信息系统中,各种城市管理法规及规划报告在规划管理工作中起着很大的作用。在土地资源管理、灾害监测、水质和森林资源管理等专题信息系统中,各种文字说明资料对确定专题内容的属性特征起着重要的作用。在区域信息系统中,文字报告是区域综合研究不可缺少的参考资料。文字报告还可以用来研究各种类型地理信息系统的权威性、可靠程度和内容的完整性,以便决定地理信息的分类和使用。文字说明资料也是地理信息系统建立的主要依据,须认真加以研究,准确送入计算机系统,使搜集资料更加系统化。

对于一个多用途的或综合型的系统,一般都要建立一个大而灵活的数据库,以支持其非常广泛的应用范围。而对于专题型和区域型统一的系统,则数据类型与系统功能密切相关。

6.1.3空间数据采集与处理的基本流程

不同的数据源,有不同的采集与处理方法,总体上讲,空间数据的采集与处理包含图6.4所示的基本内容。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

1. 数据源的选择

地理信息系统可用的数据源多种多样,进行选择时,应注意从以下几个方面考虑:①是否能够满足系统功能的要求;②所选数据源是否已有使用经验。如果传统的数据源可用的话,就应避免使用其他它的陌生数据源。一般情况下,当两种数据源的数据精度差别不大时,宜采用有使用经验的传统数据源;③系统成本。因为数据成本占GIS 工程成本的70%甚至更多,所以数据源的选择对于系统整体的成本控制来说至关重要。 2. 采集方法的确定

根据所选数据源的特征,选择合适的采集方法。如图6.4所示,地图数据的采集,通常采用扫描矢量化的方法;影像数据包括航空影像数据和卫星遥感影像两类,对于它们的采集与处理,已有完整的摄影测量、遥感图像处理的理论与方法;实测数据指各类野外测量所采集的数据,包括平板仪测量,一体化野外数字测图、空间定位测量(如GPS 测量)等;统计数据可采用扫描仪输入作为辅助性数据,也可直接用键盘输入;已有的数字化数据通常可通过相应的数据交换方法转换为当前系统可用的数据;多媒体数据通常也是以数据交换的形式进入系统;文本数据可用键盘直接输入。 3. 数据的编辑与处理

各种方法所采集的原始空间数据,都不可避免地存在着错误或误差,属性数据在建库输入时,也难免会存在错误,所以对图形数据和属性数据进行一定的检查、编辑是很有必要的。不同系统对图形的数学基础、数据结构等可能会有不同的要求,往往需要进行数学基础、数据结构的转换。此外,根据系统分析功能的要求,需要对数据进行图形拼接、拓扑生成等处理。如果考虑到存储空间和系统运行效率,往往需要对数据进行一定程度的压缩。 4. 数据质量控制与评价

无论何种数据源,使用何种方法进行采集,都不可避免地存在各种类型的误差,而且误差会在数据处理及系统的各个环节之中累计和传播。对于数据质量的控制和评价是系统有效运行的重要保障和系统分析结果可靠性的前提条件之一。 5. 数据入库

数据入库就是按照空间数据管理的要求,把采集和处理的成果数据导入到空间数据库中。

图6.4 空间数据采集的基本内容

6.2数据采集

数据采集就是运用各种技术手段,通过各种渠道收集数据的过程。服务于地理信息系统的数据采集工作包括两方面内容:空间数据的采集和属性数据的采集,它们在过程上有很多不同,但也有一些具体方法是相通的。空间数据采集的方法主要包括野外数据采集、现有地图数字化、摄影测量方法、遥感图像处理方法等。属性数据采集包括采集及采集后的分类和编码,主要是从相关部门的观测、测量数据、各类统计数据、专题调查数据、文献资料数据等渠道获取。此外,遥感图像解译也是获取属性数据的重要渠道。本节将对空间数据和属性数据的采集作系统介绍。

6.2.1 空间数据采集

1. 野外数据采集

野外数据采集是GIS 数据采集的一个基础手段。对于大比例尺的城市地理信息系统而言,野外数据采集更是主要手段。

(1)平板测量

平板测量获取的是非数字化数据。虽然现在已不是GIS 野外数据获取的主要手段,但由于它的成本低、技术容易掌握,少数部门和单位仍然在使用。平板仪测量包括小平板测量和大平板测量,测量的产品都是纸质地图。在传统的大比例尺地形图的生产过程中,一般在野外测量绘制铅笔草图,然后用小笔尖转绘在聚酯薄膜上,之后可以晒成蓝图提供给用户使用。当然也可以对铅笔草图进行手扶跟踪或扫描数字化使平板测量结果转变为数字数据。

(2)全野外数字测图

全野外数据采集设备是全站仪加电子手簿或电子平板配以相应的采集和编辑软件,作业分为编码和无码两种方法。数字化测绘记录设备以电子手簿为主。还可采用电子平板内外业一体化的作业方法,即利用电子平板(便携机)在野外进行碎部点展绘成图。

全野外数据采集测量工作包括图根控制测量、测站点的增补和地形碎部点的测量。采用

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

全站仪进行观测(图6.5),用电子手簿记录观测数据或经计算后的测点坐标。每一个碎部点的记录,通常有点号、观测值或坐标,除此以外还有与地图符号有关的编码以及点之间的连接关系码。这些信息码以规定的数字代码表示。信息码的输入可在地形碎部测量的同时进行,即观测每一碎部点后按草图输入碎部点的信息码。地图上的地理名称及其它各种注记,除一部分根据信息码由计算机自动处理外,不能自动注记的需要在草图上注明,在内业通过人机交互编辑进行注记。

全野外空间数据采集与成图分为三个阶段:数据采集、数据处理和地图数据输出。数

据采集是在野外利用全站仪等仪器测量特征点,并计算其坐标,赋予代码,明确点的连接关系和符号化信息。再经编辑、符号化、整饰等成图,通过绘图仪输出或直接存储成电子数据。数据采集和编码是计算机成图的基础,这一工作主要在外业完成。内业进行数据的图形处理,在人机交互方式下进行图形编辑,生成绘图文件,由绘图仪绘制地图。

通常工作步骤为:先布设控制导线网,然后进行平差处理得出导线坐标,再采用极坐标法、支距法或后方交会法等,获得碎部点三维坐标。

(3)空间定位测量

图6.5 全野外数字测图

空间定位测量也是GIS 空间数据的主要数据源。目前,常用的空间定位系统主要有美国的全球定位系统(Global Positioning System ,GPS ),俄罗斯的GLONASS 全球导航卫星系

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

统,以及欧洲的伽利略(GALILEO )导航卫星系统。我国的北斗导航卫星系统也在逐步完善之中,它必将给我国用户提供快速、高精度的定位服务,也必将给我国范围内GIS 空间数据提供更为丰富、高效的空间定位数据。

GPS 自其建立以来,因其方便快捷和较高的精度,迅速在各个行业和部门得到了广泛的应用。

它从一定程度上改变了传统野外测绘的实施方式,并成为GIS 数据采集的重要手段,在许多应用型GIS 中都得到了应用,如车载导航系统。GPS 有3个组成部分:卫星、控制系统和用户。现在

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

共有24颗卫星在距离地面大约20183km 的轨道高

度上以每日绕地两周的速度运行着。6条轨道按轨道面夹角60o间距分开。每条轨道与赤道面的

交角为50o,每条轨道上有4颗卫星。每颗卫星发射两种频率的无线电波用于定位。第一频率L1,位于1575.42MH Z ;第二频率L2,位于1227.6 MH Z 。载波频率由两种伪码和一条导航消息调制而成,载波频率及其调制由星上原子钟控制。

测距交会确定点位是卫星定位测量的基本原理。应用测距后方交会原理,可由三个以上地面已知点(控制站)交会出卫星的位置,反之利用三个以上卫星的已知空间位置又可交会出地面未知点(用户接收机)的位置。如图6.6,GPS 卫星发射测距信号和导航电文,用户用GPS 接收机在某一时刻i 同时接收到三颗GPS 卫星信号,测量出测站P 到三颗GPS 卫星的

距离S 1、S 2、S 3,并计算出该时刻GPS 卫星的空间坐标为(X j 、Y j 、Z j

),j=1,2,3。用距离交会法解算出测站P 的位置(Xp 、Yp 、Zp ),其理论观测方程式为:

S 12=(Xp-X 1)2+(Yp-Y 1)2(Zp-Z 1)2 S 22=(Xp-X 2)2+(Yp-Y 2)2(Zp-Z 2)2 S 32=(Xp-X 3)2+(Yp-Y 3)2(Zp-Z 3)2

因此,利用GPS 卫星导航定位时,必须同时跟踪至少三颗以上的卫星。为保证解算结果的可靠性,实际测量时,通常获取至少四颗星的信号。 2. 地图数字化

地图数字化是指根据现有纸质地图,通过手扶跟踪或扫描矢量化的方法,生产出可在计算机上进行存储、处理和分析的数字化数据。

(1)手扶跟踪数字化

早期,地图数字化所采用的工具是手扶跟踪数字化仪。这种设备是利用电磁感应原理,当使用者在电磁感应板上移动游标到图件的指定位置,按动相应的按钮时,电磁感应板周围的多路开关等线路可以检测出最大信号的位置,从而得到该点的坐标值。这种方式数字化的速度比较慢,工作量大,自动化程度低,数字化精度与作业员的操作有很大关系,所以目前已基本上不再采用。

(2)扫描矢量化

目前,地图数字化一般采用扫描矢量化的方法。根据地图幅面大小,选择合适规格的扫描仪,对纸质地图扫描生成栅格图像。然后在经过几何纠正之后,即可进行矢量化。其工作流程如图6.7。

S 3 S 2

S 1 P 图6.6 GPS 空间定位测量原理

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

化工作速度较快、效率较高,但是由于软件智能化水平有限,其结果仍然需要再进行人工检查和编辑。屏幕鼠标跟踪方法其作业方式与数字化仪基本相同,仍然是手动跟踪,但是数字化的精度和工作效率得到了显著的提高。

扫描获得的是栅格数据,数据量比较大。除此之外,扫描获得的数据还存在着噪声和中间色调像元的处理问题。噪声是指不属于地图内容的斑点污渍和其它模糊不清的东西形成的像元灰度值。噪音范围很广,没有简单有效的方法能加以完全消除,有的软件能去除一些小的脏点,但有些地图内容如小数点等和小的脏点很难区分。对于中间色调像元,则可以通过选择合适的阈值选用一些软件等来处理,如Photoshop。

常使用GIS软件如MapInfo、Arc/Info、GeoStar、Super Map等对扫描所获取的栅格数据进行屏幕跟踪矢量化并对矢量化结果数据进行编辑和处理。

3.摄影测量方法

摄影测量技术曾经在我国基本比例尺地形图生产过程中扮演了重要角色,我国绝大部分1:1万和1:5万基本比例尺地形图使用了摄影测量方法。随着数字摄影测量技术的推广,在GIS空间数据采集的过程中,摄影测量也起着越来越重要的作用。

(1)摄影测量原理

摄影测量包括航空摄影测量和地面摄影测量。地面摄影测量一般采用倾斜摄影或交向摄影,航空摄影一般采用垂直摄影。摄影机镜头中心垂直于聚焦平面(胶片平面)的连线称为相机的主轴线。航测上规定当主轴线与铅垂线方向的夹角小于3°时为垂直摄影。摄影测量通常采用立体摄影测量方法(立体摄影测量的原理如图6.8所示)采集某一地区空间数据,对同一地区同时摄取两张或多张重叠的像片,在室内的光学仪器上或计算机内恢复它们的摄影方位,重构地形表面,即把野外的地形表面搬到室内进行观测。航测上对立体覆盖的要求是当飞机沿一条航线飞行时相机拍摄的任意相邻两张像片的重叠度(航向重叠)不少于55%-65%

(2)数字摄影测量的数据处理流程

A C

M

D C A

M

数字摄影测量一般指全数字摄影测量,它是基于数字影像与摄影测量的基本原理,应用计算机技术、数字影像处理、影像匹配、模式识别等多学科的理论与方法,提取所摄对象用数字方式表达的集合与物理信息的摄影测量方法。

数字摄影测量是摄影测量发展的全新阶段,与传统摄影测量不同的是,数字摄影测量所处理的原始影像是数字影像。数字摄影测量继承立体摄影测量和解析摄影测量的原理,同样需要内定向、相对定向和绝对定向。不同的是数字摄影测量直接在计算机内建立立体模型。由于数字摄影测量的影像已经完全实现了数字化,数据处理在计算机内进行,所以可以加入许多人工智能的算法,使它进行自动内定向、自动相对定向、半自动绝对定向。不仅如此,还可以进行自动相关、识别左右像片的同名点、自动获取数字高程模型,进而生产数字正射影像。还可以加入某些模式识别的功能,自动识别和提取数字影像上的地物目标。图 6.9为数字摄影测量系统VirtuoZo数据采集的作业流程,可以说明数字摄影测量数据采集的一般流程。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

4.遥感图像处理

通常所称的遥感影像数据指的是卫星遥感影像,其信息获取方式与航空像片不同。遥感成像基本原理可以表示如图6.10所示。

地面接受太阳辐射,地表各类地物对其反射的特性各不相同,搭载在卫星上的传感器捕捉并记录这种信息,之后将数据传输回地面,然后从所得数据。经过一系列处理过程,可得到满足GIS需求的数据。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

遥感数据的处理与具体的数据类型(卫星影像、雷达影像)、存储介质等因素相关。遥

感数据处理的主要内容见表6.2。

6.2 遥感数据处理的主要内容

遥感数据处理

再生 校正

图像重建 图像复原 辐射量校正 几何校正 镶嵌

变换

灰度信息变换 空间信息变换 几何信息变换 数据压缩

分类

总体测定(earning) 分类(classification)

区域分割 匹配

基本处理流程包括(图6.11):

图6.10 遥感原理示意图

(1)观测数据的输入:采集的数据包括模拟数据和数字数据两种,为了把像片等模拟

数据输入到处理系统中,必须用胶片扫描仪等进行A /D 变换。对数字数据来说,因为数据多记录在特殊的数字记录器 (HDDT 等) 中,所以必须转换到一般的数字计算机都可以读出的CCT(Computer Compatible Tape)等通用载体上。

(2)再生、校正处理:对于进入到处理系统的观测数据,首先进行辐射量失真及几何畸变的校正,对于SAR 的原始数据进行图像重建;其次,按照处理目的进行变换、分类,或者变换与分类结合的处理。

(3)变换处理:变换处理意味着从某一空间投影到另一空间上,通常在这一过程中观测数据所含的一部分信息得到增强。因此,变换处理的结果多为增强的图像。

(4)分类处理:分类是以特征空间的分割为中心的处理,最终要确定图像数据与类别之间的对应关系。因此,分类处理的结果多为专题图的形式。

(5)处理结果的输出:处理结果可分为两种情况,一种是经D /A 变换后作为模拟数据输出到显示装置及胶片上;另一种是作为地理信息系统等其他处理系统的输入数据而以数字数据输出。

6.2.2 属性数据的采集

属性数据即空间实体的特征数据,一般包括名称、等级、数量、代码等多种形式,属性数据的内容有时直接记录在栅格或矢量数据文件中,有时则单独输入数据库存储为属性文件,通过关键码与图形数据相联系。

属性数据一般采用键盘输入。输入的方式有两种:一种是对照图形直接输入;另一种是预先建立属性表输入属性,或从其它统计数据库中导入属性,然后根据关键字与图形数据自动连接。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

遥感器

图6.11 遥感数据的基本处理流程

1.属性数据的来源

国家资源与环境信息系统规范在“专业数据分类和数据项目建议总表”中,将数据分为社会环境、自然环境和资源与能源三大类共14小项,并规定了每项数据的内容及基本数据来源。

(1)社会环境数据

社会环境数据包括城市与人口、交通网、行政区划、地名、文化和通信设施五类。这几类数据可从人口普查办公室、外交部、民政部、国家测绘局,以及林业、文化、教育、卫生、邮政等相关部门获取。

(2)自然环境

自然环境数据包括地形数据、海岸及海域数据、水系及流域数据、基础地质数据五类。这些数据可以从国家测绘局、海洋局、水利水电部以及地质、矿产、地震、石油等相关部门和结构获取。

(3)资源与能源

资源与能源数据包括土地资源相关数据、气候和水热资源相关数据、生物资源相关数据、矿产资源相关数据、海洋资源相关数据五类。这几类数据可从中国科学院、国家测绘局及农、林、气象、水电、海洋等相关部门获取。

2.属性数据的分类

空间数据的分类,是根据系统的功能以及相应的国际、国家和行业空间信息分类规范和标准,将具有不同空间特征和语义的空间要素区别开来的过程,是为了在空间数据的逻辑结构上将数据组织为不同的信息层并标识空间要素的类别。

空间数据一般采用线分类法对空间实体进行分类,即将分类对象按选定的空间特征和语义信息作为分类划分的基础,逐次地分成相应的若干个层级的类目,并排列成一个有层次的,逐级展开的分类体系。同级类之间是并列关系,下级类与上级类间存在着隶属关系,同级类不重复、不交叉。从而将地理空间的空间实体组织为一个层级树,因此也称作层级分类法。

我国《国土基础地理信息数据分类与代码》(GB/T 13923-1992)将地球表面的自然和社会基础信息分为9个大类,分别为测量控制点、水系、居民地、交通、管线与垣栅、境界、地形与土质、植被和其他类,在每个大类下又依次细分为小类、一级和二级类,如图 6.12所示。

3.属性数据的编码

属性数据的编码是指确定属性数据的代码的方法和过程。代码是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。编码的直接产物就是代码,而分类分级则是编码的基础。

对于要直接记录到栅格或矢量数据文件中的属性数据,则必须先对其进行编码,将各种属性数据变为计算机可以接受的数字或字符形式,便于GIS 存储管理。属性数据编码一般要基于以下几个原则:①编码的系统性和科学性;②编码的一致性和唯一性。③编码的标准化和通用性;④编码的简捷性。⑤编码的可扩展性。

(1)属性数据编码方案的制定

在属性数据分类编码的过程中,应力求规范化、标准化,有可遵循标准的尽量依标准。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

标准:

①列出全部制图对象清单;

②制定对象分类、分级原则和指标,将制图对象进行分类、分级; ③拟定分类代码系统;

④代码及其格式。设定代码使用的字符和数字、码位长度、码位分配等; ⑤建立代码和编码对象的对照表。这是编码最终成果档案,是数据输入计算机进行编码的依据。

国土基础地理信息

测量控制点

水系

居民地 交通 管线和垣栅 境界

地形与土质 植被 其他

平面控制点

高程控制点 其他控制点

… … …

铁路 公路 铁路和公路 主要构筑物

航运 港口 空运

… …

高速公路

一级公路 二级公路 三级公路

四级公路 等外公路 普通公路 专用公路 城市道路 …

城市快速路 城市主干道 城市次干道 城市支线 城市其他路

… … … … … … … …

… … …

图6.12 国土基础地理信息分类体系

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.13 河流类型的层次分类编码方案

属性的科学分类体系无疑是GIS中属性编码的基础。目前,较为常用的编码方法有层次分类编码法与多源分类编码法两种基本类型。

(2)层次分类编码法

层次分类编码法是按照分类对象的从属和层次关系为排列顺序的一种代码,它的优点是能明确表示出分类对象的类别,代码结构有严格的隶属关系。图6.13以河流类型的编码为例,说明层次分类编码法所构成的编码体系。

(3)多源分类编码法

又称独立分类编码法,是指对于一个特定的分类目标,根据诸多不同的分类依据分别进行编码,各位数字代码之间并没有隶属关系。表6.4以河流为例说明了属性数据多源分类编码法的编码方法。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

50米在表中表示为:11454。由此可见,该种编码方法一般具有较大的信息载量。有利于对于

空间信息的综合分析。

在实际工作中,也往往将以上两种编码方法结合使用,以达到更理想的效果。

6.3数据编辑

由于各种空间数据源本身的误差,以及数据采集过程中不可避免的错误,使得获得的空间数据不可避免的存在各种错误。为了“净化”数据,满足空间分析与应用的需要,在采集完数据之后,必须对数据进行必要的检查,包括空间实体是否遗漏、是否重复录入某些实体、图形定位是否错误、属性数据是否准确以及与图形数据的关联是否正确等。数据编辑是数据处理的主要环节,并贯穿于整个数据采集与处理过程。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

6.3.1 图形数据编辑

空间数据采集过程中,人为因素是造成图形数据错误的主要原因。如数字化过程中手的抖动,两次录入之间图纸的移动,都会导致位置不准确,并且在数字化过程中,难以实现完全精确的定位。常见的数字化错误是线条连接过头和不及两种情况。此外,在数字化后的地图上,经常出现的错误有以下几种(图6.14):

(1)伪节点(Pseudo Node):当一条线没有一次录入完毕时,就会产生伪结点。伪节点使一条完整的线变成两段。

(2)悬挂节点(Dangling Node):当一个节点只与一条线相连接,那么该节点称为悬挂节点。悬挂节点有过头和不及、多边形不封闭、节点不重合等几种情形。

(3)碎屑多边形(Sliver Polygon):碎屑多边形也称条带多边形。因为前后两次录入同一条线的位置不可能完全一致,就会产生碎屑多边形,即由于重复录入而引起。另外,当用不同比例尺的地图进行数据更新时也可能产生。

(4)不正规的多边形(Weird Polygon):在输入线的过程中,点的次序倒置或者位置不准确会引起不正规的多边形。在进行拓扑生成时,会产生碎屑多边形。

上述错误—般会在建立拓扑的过程中发现。其它图形数据错误,包括遗漏某些实体、重复录入某些实体、图形定位错误等的检查一般可采用如下方法进行:

(1)叠合比较法,把成果数据打印在透明材料上,然后与原图叠合在一起,在透光桌上仔细的观察和比较。叠合比较法是空间数据数字化正确与否的最佳检核方法,对于空间数

据的比例尺不准确和空间数据的变形马上就可以观察出来。如果数字化的范围比较大,分块数字化时,除检核一幅(块)图内的差错外,还应检核已存入计算机的其它图幅的接边情况;

(2)目视检查法,指在屏幕上用目视检查的方法,检查一些明显的数字化误差与错误;

(3)逻辑检查法,根据数据拓扑一致性进行检验,如将弧段连成多边形,数字化节点误差的检查等。

对于检查出的错误,对图形数据编辑是通过向系统发布编辑命令(多数是窗口菜单)用光标激活来完成的。编辑命令主要有增加数据、删除数据和修改数据三类。编辑的对象是点元、线元、面元及目标,编辑工作的完成主要利用GIS的图形编辑功能(表6.5)来完成。

表6.5 地理信息系统的图形编辑功能

点编辑线编辑面编辑目标编辑

删除移动拷贝旋转追加水平对齐垂直对齐

删除

移动

拷贝

追加

旋转(改向)

剪断

光滑

求平行线

弧段加点

弧段删点

弧段移动

删除弧段

移动弧段

插入弧段

剪断弧段

删除目标

旋转目标

拷贝目标

移动目标

放大目标

缩小目标

开窗口

6.3.2 属性数据编辑

属性数据校核包括两部分:

(1)属性数据与空间数据是否正确关联,标识码是否唯一,不含空值。

(2)属性数据是否准确,属性数据的值是否超过其取值范围等。

对属性数据进行校核很难,因为不准确性可能归结于许多因素,如观察错误、数据过时和数据输入错误等等。属性数据错误检查可通过以下方法完成:

(1)首先可以利用逻辑检查,检查属性数据的值是否超过其取值范围,属性数据之间或属性数据与地理实体之间是否有荒谬的组合。在许多数字化软件中,这种检查通常使用程序来自动完成。例如有些软件可以自动进行多边形结点的自动平差,属性编码的自动查错等。

(2)把属性数据打印出来进行人工校对,这和用校核图来检查空间数据准确性相似。

对属性数据的输入与编辑,一般在属性数据处理模块中进行。但为了建立属性描述数据与几何图形的联系,通常需要在图形编辑系统中设计属性数据的编辑功能,主要是将一个实体的属性数据连接到相应的几何目标上,亦可在数字化及建立图形拓扑关系的同时或之后,对照一个几何目标直接输入属性数据。一个功能强的图形编辑系统可提供删除、修改、拷贝属性等功能。

6.4 数学基础变换

每一个地理信息系统所包含的空间数据都应具有同样的地理数学基础,包括坐标系统、地图投影等。扫描得到的图像数据和遥感影像数据往往会有变形,与标准地形图不符,这时需要对其进行几何纠正。当在一个系统内使用不同来源的空间数据时,它们之间可能会有不同的投影方式和坐标系统,需要进行坐标变换使它们具有统一的空间参照系统。统一的数学基础是运用各种分析方法的前提。

6.4.1 几何纠正

由于如下原因,使扫描得到的地形图数据和遥感数据存在变形,必须加以纠正。

(1)地形图的实际尺寸发生变形;

(2)在扫描过程中,工作人员的操作会产生一定的误差,如扫描时地形图或遥感影像没被压紧、产生斜置或扫描参数的设置不恰当等,都会使被扫入的地形图或遥感影像产生变形,直接影响扫描质量和精度;

(3)遥感影像本身就存在着几何变形;

(4)地图图幅的投影与其它资料的投影不同,或需将遥感影像的中心投影或多中心投影转换为正射投影等。

(5)扫描时受扫描仪幅面大小的影响,有时需将一幅地形图或遥感影像分成几块扫描,

这样会使地形图或遥感影像在拼接时难以保证精度。

对扫描得到的图像进行纠正,主要是建立要纠正的图像与标准的地形图或地形图的理论数值或纠正过的正射影像之间的变换关系,消除各类图形的变形误差。目前,主要的变换函数有:仿射变换、双线性变换、平方变换、双平方变换、立方变换、四阶多项式变换等,具体采用哪一种,则要根据纠正图像的变形情况、所在区域的地理特征及所选点数来决定。

1.地形图的纠正

对地形图的纠正,一般采用四点纠正法或逐网格纠正法。

四点纠正法,一般是根据选定的数学变换函数,输入需纠正地形图的图幅行、列号、地形图的比例尺、图幅名称等,生成标准图廓,分别采集四个图廓控制点坐标来完成。

逐网格纠正法,是在四点纠正法不能满足精度要求的情况下采用的。这种方法和四点纠正法的不同点就在于采样点数目的不同,它是逐方里网进行的,也就是说,对每一个方里网,都要采点。

具体采点时,一般要先采源点(需纠正的地形图),后采目标点(标准图廓),先采图廓点和控制点,后采方里网点。

2.遥感影像的纠正

遥感影像的纠正,一般选用和遥感影像比例尺相近的地形图或正射影像图作为变换标准,选用合适的变换函数,分别在要纠正的遥感影像和标准地形图或正射影像图上采集同名地物点。

具体采点时,要先采源点(影像),后采目标点(地形图)。选点时,要注意选点的均

匀分布,点不能太多(图6.15)。如果在选点时没有注意点位的分布或点太多,这样不但不

能保证精度,反而会使影像产生变形。另外选点时,点位应选由人工建筑构成的并且不会

移动的地物点,如渠或道路交叉点、桥梁等,尽量不要选河床易变动的河流交叉点,以免

点的移位影响配准精度。

1

1

2

2

3 3

4 4

图6.15 遥感影像纠正选点示例

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.16 坐标变换方法

6.4.2 坐标变换

采集完毕的数据,由于原始数据来自不同的空间参考系统,或者数据输入时是一种投影,输出是另外一种投影,造成同一空间区域的不同数据,它们的空间参考有时并不相同,为了空间分析和数据管理,经常需要进行坐标变换,统一到同一空间参考系下。坐标变换的实质是建立两个空间参考系之间点的一一对应关系。常用的坐标变换的方法如图6.16所示。

1.投影变换

投影变换必须已知变换前后的两个空间参考的投影参数,然后利用投影公式的正解和反解算法,推算变化前后两个空间参考系之间点的一一对应函数关系。投影变换是坐标变换中精度最高的变换方法。但是,有时在一些特殊情况下,即便知道变换前后的两个空间参考的投影参数、投影方式,投影变换的正解和反解很难直接推求,此时往往采用投影变换的综合

算法(参见第2章具体内容)。 2. 仿射变换

仿射变换是在不同的方向上进行不同的压缩和扩张,可以将球变为椭球,将正方形变为平行四边形,如图6.17所示。其公式为:

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

F EY DX Y C

BY AX X ++=++='

' (6.1) 仿射变换要求最少三个位移关联点。 3. 相似变换

相似变换是由一个图形变换为另一个图形,在改变的过程中保持形状不变(大小可以改变)。在二维坐标变换过程中,经常遇到的是平移、旋转和缩放三种基本的相似变换操作。

(1)平移

平移是将图形的一部分或者整体移动到笛卡尔坐标系中另外的位置,如图6.18所示,其变换公式为:

y x

T Y Y T X X +=+=''

(6.2)

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

(2)旋转

在地图投影变换中,经常要应用旋转操作,如图6.19所示。实现旋转操作要用到三角函数,假定顺时针旋转角度为θ,其公式为:

θθθ

θcos sin sin cos ''Y X Y Y X X +-=+= (6.3)

(3)缩放

缩放操作可用于输出大小不同的图形,如图6.20,其公式为:

图6.18 平移

图6.19 旋转

图6.17 仿射变换

y x

YS Y XS X =='' (6.4)

4. 橡皮拉伸

橡皮拉伸缩通过坐标几何纠正来修正缺陷。主要针对几何变形,通常发生在原图上。它们可能由于在地图编绘中的配准缺陷、缺乏大地控制或其它各种原因产生。

如图6.21所示,原图层(实心线)被纠正成更精确的目标(虚线)。类似于变换,位

移关联点在橡皮伸缩中被用于确定要素移动的位置。

目前,大多数GIS 软件是采用正解变换法来完成不同投影之间的转换,并直接在GIS 软件中提供常见投影之间的转换。

6.4.3 栅格数据重采样

重采样是栅格数据空间分析中处理栅格分辨率匹配问题的常用数据处理方法。进行空间分析时,用来分析的数据资料由于来源不同,经常要对栅格数据进行何纠正、旋转、投影变换等处理,在这些处理过程中都会产生重采样问题(图6.22)。因此重采样在栅格数据的处理中占有重要地位。下面介绍三种常用的重采样方法。

图6.21 橡皮筋变换示意图

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.20 图形缩放

(6.5)

1. 1. 最邻近像元法

直接取与P (x ,y )点位置最近像元N 的值作为该点的采样值,即: I (P ) = I (N ) N 为最近点,其坐标值为

x N = INT (x + 0.5)

y N = INT (y + 0.5)

INT 表示取整。 2. 双线性插值法

根据最邻近的四个数据点,确定一个双线性多项式:

???

???????

??=y a a a a x Z 1)1(1110

0100

(6.6)

当四个数据为正方形排列时,设边长为1,内插点相对于A 点的坐标为dx 、dy ,则有

D C B A p Z L dy

L dx Z L dy L dx Z L dx L dy Z L dy L dx Z ??-+??+??-+?-?-

=)1()1()1()1( (6.7)

3. 双三次卷积法

当推广到双三次多项式时,采用分块方式,每一分块可以定义出一个不同的多项式曲面,

当n 次多项式与其相邻分块的边界上所有n-1次导数都连续时,称之为样条函数。

在数据点为方格网的情况下,采用三次曲面来描述格网内的内插值时,待定点内插值Zp 为:

?????

?

??????????????????=323332

31

30

23222120131211100302010032

1)1(y y y a a a a a a a a a a a a a a a a x x x

Z p (6.8)

样条函数可用于精确的局部内插(即通过所有的已知采样点)。由于采用分块技术,每次只采用少量已知数据点,故内插运算速度很快,此外由于保留了局部微特征,在视觉上也有令人满意的效果。

6.5 数据重构

数据重构主要包括数据结构的转换和数据格式转换。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

通用的空间数据结构有栅格和矢量

原始栅格数据 采样栅格数据

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.22 栅格数据重采样

两种,在地理信息系统中,它们之间的相互转换是经常性的。GIS在其发展过程中,出现了很多研究机构和企业,它们所使用的数据格式往往不尽相同。为了实现相互之间的数据和资源共享,需要对数据格式进行转换。

6.5.1 数据结构转换

1.矢量数据向栅格数据的转换

许多数据如行政边界、交通干线、土地利用类型、土壤类型等通常都是以矢量的方式存储在计算机中。在一些特殊的空间分析中,如多层数据的复合分析,用矢量数据实现的比较复杂,相比之下利用栅格数据模式进行处理则容易得多。因此它们的叠置复合分析更需要把其从矢量形式转变为栅格形式。

矢量数据的基本坐标是直角坐标X、Y,其坐标原点一般取图的左下角。栅格数据的基本坐标是行和列(i,j),其坐标原点一般取图的西南角。两种数据变换时,令直角坐标X和Y分别与行与列平行,按确定的栅格大小采样。由于矢量数据的基本要素是点、线、面,因而只要实现点、线、面的转换,各种线划图形的变换问题基本上都可以得到解决。点的转换原理很简单,只需要计算出点所在的栅格行列号即可。线的转换基本原理是计算出线所经过的所有栅格,然后将其赋予线的属性值。面的转换要复杂一些。在矢量结构中,多边形面用组成面边界的线段表示,而在栅格结构中,整个面域所在的栅格单元都要用属性值充填。因此,要完成面域的栅格化,首先需要完成多边形边界线段的栅格化;然后,用面域属性值充填。所以,矢量的面域向栅格转换又称为多边形填充。常用的多边形填充算法有内部点扩散法、射线法、扫描线法。

2.栅格数据向矢量数据的转换

栅格向矢量转换处理的目的,是为了将栅格数据分析的结果,通过矢量绘图装置输出,或者为了数据压缩的需要,将大量的面状栅格数据转换为由少量数据表示的多边形边界。转换的另一个主要目的是为了能将自动扫描仪获取的栅格数据加入矢量形式的数据库。栅格向矢量转换的过程比较复杂,通常有两种情况:一种本身为遥感影像或已栅格化的分类图在矢量化前首先要做边界提取,然后将它处理成近似线划图的二值图像(二值图),最后才能将它转换成矢量数据(矢量数据);另一种情况通常是从原来的线划图扫描得到的栅格图,二值化后的线划宽度往往占据多个栅格,这时需要进行细化处理后才能矢量化。处理流程如图6.23。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.23 栅格转矢量流程

矢量化的过程如下:

①从图幅西北角开始,按顺时针或逆时针方向,从起始点开始,根据八个邻域进行搜索,依次跟踪相邻点,找出线段经过的栅格。

②将栅格(i,j)坐标变成直角坐标(X,Y)。

③生成拓扑关系,对于矢量表示的边界弧段,判断其与原图上各多边形的空间关系,形成完整的拓扑结构,并建立与属性数据的联系。

④去除多余点及曲线圆滑:由于搜索是逐个栅格进行的,必须去除由此造成的多余点记录以减少冗余。搜索结果曲线由于栅格精度的限制可能不够圆滑,需要采用一定的插补算法进行光滑处理。常用的算法有线性叠代法、分段三次多项式插值法、正轴抛物线平均加权法、斜轴抛物线平均加权法、样条函数插值法等。

6.5.2 数据格式转换

不同的数据生产者在获取空间数据采用的数据采集平台不同,地理几何数据和属性数据存储方式和表现方法各不相同。不论何种平台,地理几何数据可以归结为至少包括点、线、面三种要素,但在地图符号化的表现方式上,以及空间关系的组织各不相同,不能简单地进行转换使用。属性数据的组织虽然也各不相同,但一般都采用表的形式,只要找到对应的字段映射关系就可实现转换,相对几何数据更易于实现在不同平台下的相互转换。数据格式转换是GIS获取空间数据、共享空间数据的常用手段。

实现数据交换的模式大致有四种,即外部数据交换模式、直接数据访问模式、数据互操作模式和空间数据共享平台模式。后三种数据交换模式提供了较为理想的数据共享模式,但是对大多数普通用户而言,外部数据交换模式在具体应用中更具可操作性和现实性,与现实的技术、资金条件更相符。数据转换可直接利用软件商提供的交换文件(如DXF ,MIF ,E00等) ,也可以采用中介文件转换方式,即在数据加工平台软件支持下,把空间数据连同属性数据按自定义的格式输出为一文本文件,作为中介文件,该数据文件的要素和结构符合相应的数据转换标准,然后在GIS平台下开发数据接口程序,读入该文件,自动生成基础地理信息系统支持的数据格式。

数据转换的内容包括空间数据、属性数据、拓扑信息以及相应的元数据和数据描述信息。根据数据转换的程度、数据分层和编码对应情况,数据转换可以分为三类:(1)分层和编码原则都不同的数据转换。在数据转换过程中,系统最大限度地保证空间数据和属性数据的转入,并把相应的分层和编码转换过来。

(2)分层不同,编码原则相同的数据转换。两者数据编码原则是一致的,为空间数据和数据描述信息的相互转换提供了有利条件。

(3)分层不同,编码方案完全一致的数据转换。除描述信息外,两者数据质量和数据情况是完全一致的。

实现数据转换的方法多种多样,一般可以通过以下三种途径实现。

(1)外部数据交换方式

外部数据交换方式是目前空间转换的主要方式。大部分商用GIS软件定义了外部数据交换文件格式,一般为ASCII码文件,如ArcInfo的EOO,MapInfo的MID,AutoCAD的DXF等。如图6.24所示,从系统A的内部数据转换到系统B,如果B系统能够直接读A系统的交换文件,则从A的内部文件转换到A的交换文件,即转换两次即可;否则还需要从A的外部交换文件到B的外部交换文件,即转换三次。

二次转换

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

三次转换

图6.24 通过外部交换文件的数据转换方式

(2)标准空间数据交换标准方式

这种方式是采用一种空间数据的转换标准来实现空间数据格式转换,尽量减少空间数据格式交换造成的信息损失,使之更加科学化与标准化。许多国家和国际组织制定了空间数据交换标准,例如美国国家空间数据协会(NSDI,National Spatial Data Institute)制定了统一的空间数据格式规范SDTS,包括几何坐标、投影、拓扑关系、属性数据、数据字典,也包括栅格和矢量等不同空间数据格式的转换标准。根据SDTS,目前有许多GIS软件提供了标准的空间数据交换格式,如ArcInfo的SDTSIMPORT和SDTSEXPORT模块等,可供其他系统调用。有了空间数据交换的标准格式后,每个系统都提供读写这一标准格式空间数据的程序,避免了大量的编程工作,而且数据转换只需两次,如图6.25所示。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

(3)空间数据的互操作方式

空间数据的互操作方式是基于公共接口的数据融合方式。接口相当于一种规程,它是大家都遵守并达成统一的标准。在接口中不仅要考虑数据格式和数据处理,而且还要提供对数据处理采用的协议,各个系统通过公共接口相互联系,而且允许各自系统内部数据结构和数据处理各不相同。例如,OGC (Open GIS Consortium )为数据互操作制定了统一的规范,从而使一个系统同时支持不同的空间数据格式成为可能。Open GIS 的思想是将空间数据的转换变成一次转换或者不进行转换,实现不同GIS 软件系统之间空间数据的互操作。如图6.26所示,从系统A 到系统B 只需一次转换。空间数据的互操作是实现异构空间数据库数

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

在数据转换的过程中,数据格式的不一致实质上是空间数据模型的定义不一致。因此,

基于语义的数据格式转换也是一种非常有前景的转换方法。基于语义层次上的空间数据转换,除了数据结构的转换外,更重要的是对语义数据模型的转换和操作,更注重数据所蕴含的知识背景。语义转换与传统数据转换有着很大的不同。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

如图6.27

所示,语义转换就像一个宽宽的管道把两个数据集连接起来,数据转换双方可以自由地进行数据的转换与共享。语义转换,就像一个引擎,通过要素操作语言,不仅可以对输入数据也可以对输出数据进行数据的重定义。因为在语义转换的背后存在一个丰富的数据转换模型,它具有内部一致性和外部可扩展性。

图6.28 基于语义数据转换模型示意图

如图6.28所示,数据模型A 和数据模型B 可以自由映射到数据转换模型中,而这种映射不是基于最低数据转换标准的映射机,也就是说不是基于公共要素的映射。在这种映射中,针对输入、输出数据,数据转换模型提供了一系列的方法来实现数据模型之间的定义和转换。这种功能使得数据的转入方和数据的转出方之间可以自由地变换,并且可以继续使用各自独立的系统和数据格式。

数据转换模型

数据模型A

其它数据模型

B

图6.25 通过标准格式完成不同系统的数据转换

图6.26 通过Open GIS 的空间数据交换 图6.27 语义转换概念示意图

在数据转换模型中的映射不仅能够实现高度的定制,而且这种映射是双向的。数据转换模型是基于语义层次建立的一种数据的转换机制和规则。数据转换模型不仅考虑到了各个数据源的空间数据模型及空间数据组织方式,而且更重要的是侧重于语义的继承及丰富程度。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.29 语义层次转换示意图

语义层次转换如图6.29所示。

基于语义层次上的空间数据转换,除了数据结构的转换外,更重要的是对语义数据模型的转换和操作。基于语义层次上的空间数据转换在考虑数据模型的基础上,引入语义信息,如元数据、转换的规则与规范、转换的机制与原则等,来解决模型之间的冲突,即数据转换器通过语义的继承和丰富来生产出符合用户要求的数据。

数据转换模型在逻辑上可分为许多的模型单元。针对各个不同格式的数据源,将这些模型单元有机地组合形成不同的模型块。

基于组件思想的数据转换模型留有很大的扩展空间,是一种可伸缩的、开放的数据转换模型。这样,以此模型为支持的转换共享功能也就具有了很强的伸缩性,可以根据不同的数据转换共享的需要对数据转换模型进行丰富,进而便于在异构空间数据转换共享平台构建时进行功能的配置和扩充。

6.6 图形拼接

在相邻图幅的边缘部分,由于原图本身的数字化误差,使得同一实体的线段或弧段的坐标数据不能相互衔接,或是由于坐标系统、编码方式等不统一,需进行图幅数据边缘匹配处理。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.30 图幅拼接

图幅的拼接总是在相邻两图幅之间进行的,如图6.30所示。要将相邻两图幅之间的数据集中起来,就要求相同实体的线段或弧的坐标数据相互衔接,也要求同一实体的属性码相同,因此必须进行图幅数据边缘匹配处理。具体步骤如下:

1.逻辑一致性的处理

由于人工操作的失误,两个相邻图幅的空间数据库在接合处可能出现逻辑裂隙,如一个多边形在一幅图层中具有属性A,而在另一幅图层中属性为B。此时,必须使用交互编辑的方法,使两相邻图斑的属性相同,取得逻辑一致性。

2.识别和检索相邻图幅

将待拼接的图幅数据按图幅进行编号,Array编号有2位,其中十位数指示图幅的横向顺

序,个位数指示纵向顺序(图 6.31),并记

录图幅的长宽标准尺寸。因此,当进行横向

图幅拼接时,总是将十位数编号相同的图幅

数据收集在一起;进行纵向图幅拼接时,是

将个位数编号相同的图幅数据收集在一起。

其次,图幅数据的边缘匹配处理主要是针对

跨越相邻图幅的线段或弧而言的。为了减少

数据容量,提高处理速度,一般只提取图幅

边界2cm范围内的数据作为匹配和处理的目标,同时要求图幅内空间实体的坐标数据已经进行过投影转换。

3.相邻图幅边界点坐标数据的匹配

相邻图幅边界点坐标数据的匹配采用追踪拼接法。只要符合下列条件,两条线段或弧段即可匹配衔接:相邻图幅边界两条线段或弧段的左右码各自相同或相反;相邻图幅同名边界点坐标在某一允许值范围内(如土O.5mm)。

匹配衔接时是以一条弧或线段作为处理的单元,因此,当边界点位于两个结点之间时,须分别取出相关的两个结点,然后按照结点之间线段方向一致性的原则进行数据的记录和存

储。

4.相同属性多边形公共边界的删除

当图幅内图形数据完成拼接后,相邻图斑会

有相同属性。此时,应将相同属性的两个或多个

相邻图斑组合成一个图斑,即消除公共边界,并

对共同属性进行合并(图6.32)。

多边形公共界线的删除,可以通过构成每一

面域的线段坐标链,删去其中共同的线段,然后

重新建立合并多边形的线段链表。

对于多边形的属性表,除多边形的面积和周长需重新计算外,其余属性保留其中之一图斑的属性即可。

6.7 拓扑生成

在图形修改完毕后,需要对图形要素建立正确的拓扑关系。目前,大多数GIS软件都提供了完善的拓扑关系生成功能。正如拓扑的定义所描述的,建立拓扑关系时只需要关注实体之间的连接、相邻关系,而节点的位置、弧段的具体形状等非拓扑属性则不影响拓扑的建立过程。

1.点线拓扑关系的建立

点线拓扑关系的建立方法有两种方案。一种是在图形采集和编辑中实时建立,此时有两个文件表,一个记录结点所关联的弧段,一个记录弧段两端点的结点。如图6.33所示,已经数字化了两条弧段A1 、A2,涉及3个结点,当从N2 出发数字化第三条弧段A3时,起始结点首先根据空间坐标,寻找它附近是否存在已有的结点或弧段,若存在结点,则弧段A3不产生新的起结点号,而将N2作为它的起结点。当它到终结点时,进行同样的判断和处理,由于A2的终结点不能匹配到现有结点,因而产生一个新结点。将新弧段和新结点分别填入弧段表中,同时在结点表一栏的N2的记录添加N2所关联的新弧段A3。同理在数字化的弧段A4时,由于起结点和终结点都匹配到原有的结点,所以不需创建新结点记录,只是创建一个新的弧段记录,然后在原来的N3和N4结点关联的弧段记录中分别增加这一条弧段号A4。

建立结点弧段拓扑关系的第二种方案是在图形采集与编辑之后,系统自动建立拓扑关系。其基本思想与前面类似,在执行过程中逐渐建立弧段与起终结点和结点关联的弧段表。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

弧段-结点表结点-弧段表

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

弧段-结点表结点-弧段表

弧段-结点表结点-弧段表图6.32 相同属性多边形公共边界的删除

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.33 结点与弧段拓扑关系的实时建立

2.多边形拓扑关系的建立

多边形有三种情况:独立多边形,它与其他多边形没有共同边界,如独立房屋,这种多边形可以在数字化过程中直接生成,因为它仅涉及一条封闭的弧段;具有公共边界的简单多边形,在数据采集时,仅输入了边界弧段数据,然后用一种算法自动将多边形的边界聚合起来,建立多边形文件;第三种是嵌套的多边形,除了要按第二种方法自动建立多边形外,还要考虑多边形内的多边形(也称作内岛)。

首先进行结点匹配(snap)。如图6.34所示的3条弧段的端点A、B、C本来应该是同一结点,但由于数字化误差,三点坐标不完全一致,造成他们之间不能建立关联关系。因此,以任一弧段的端点为圆心,以给定容差为半径,产生一个搜索圆,搜索落入该搜索圆内的其他弧段的端点,若有,则取这些端点坐标的平均值作为结点位置,并代替原来各弧段的端点

坐标。

建立结点—弧段拓扑关系。在结点匹配的基础上,对产生的结点进行编号,并产生两个文件表,一个记录结点所关联的弧段,另一个记录弧段两端的结点(图6.35)。

多边形的自动生成。多边形的自动生成实际上就是建立多边形与弧段的关系,并将弧段关联的左右多边形填入弧段文件中。建立多边形拓扑关系时,必须考虑弧段的方向性,即弧段沿起结点出发,到终结点结束,沿该弧段前进方向,将其关联的两个多边形定义为左多边

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

形和右多边形。多边形拓扑关系是从弧段文件出发建立的。

图6.34 结点匹配示意图

a) 三个没有吻合在一起的弧段端点b) 经结点匹配处理后产生的同一结点

图6.35 结点与弧段拓扑关系的建立

弧段—结点表结点—弧段表

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

1

在建立多边形拓扑关系之前,首先将所有弧段的左、右多边形都置为空,并将已经建立的结点—弧段拓扑关系中各个结点所关联的弧段按方位角大小排序。方位角是指从x 轴按逆时针方向量至结点与它相邻的该弧段上后一个(或前一个)顶点的连线的夹角(图6.36)。建立多边形拓扑关系的算法如下:

从弧段文件中得到第一条弧段,以该弧段为起始弧段,并以顺时针方向为搜索方向,若起终点号相同,则这是一条单封闭弧段,否则根据前进方向的结点号在结点—弧段拓扑关系表中搜索下一个待连接的弧段。由于与每个结点有关的弧段都已按方位角大小排过序,则下一个待连接的弧段就是它的后续弧段。如图6.35所示,假如从A 4开始,其起结点为N 4,终结点为N 3,在结点N 3上,连接的弧段分别为A 4、A 6、A 2, 则后续弧段为A 6,沿A 6向前追踪,其下一结点为N 2, N 2连接的弧段为A 6、A 5、A 3,后续弧段为A 5,A 5的下一结点为N 4,回到弧段追踪的起点,形成一个弧段号顺时针排列的闭合的多边形,该多边形——弧段的拓扑关系表建立完毕。在多边形建立过程中,将形成的多边形号逐步填入弧段——多边形关系表的左、右多边形内。

对于嵌套多边形,需要在建立简单多边形以后或建立过程中,采用多边形包含分析方法判别一个多边形包含了哪些多边形,并将这些内多边形按逆时针排列。 3. 网络拓扑关系的建立

在输入道路、水系、管网、通讯线路等信息时,为了进行流量、连通性、最佳线路分析,需要确定实体间的连接关系。网络拓扑关系的建立主要是确定结点与弧段之间的拓扑关系,这一工作可以由GIS 软件自动完成,其方法与建立多边形拓扑关系时相似,只是不需要建立多边形。但在一些特殊情况下,两条相互交叉的弧段在交点处不一定需要结点,如道路交通中的立交桥,在平面上相交,但实际上不连通,这时需要手工修改,将在交叉处连通

的节点删除(图6.37)。

6.8 数据压缩

数据压缩是指从取得的数据集合中抽取一个子集,这个子集作为一个新的信息源,在规定的精度范围内最好地逼近原集合,而又取得尽可能大的压缩比。 1. 栅格数据的压缩

栅格数据的压缩是指栅格数据量的减少,这是与栅格数据结构密切相关的话题。其压缩技术有游程长度编码、块状编码、四叉树法等,详见第四章。 2. 矢量数据的压缩

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.36 在结点处弧段按方位角大小排序

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.37 删除不需要的节点

矢量数据压缩的目的是删除冗余数据,减少数据的存储量,节省存储空间,加快后继处

理的速度。压缩的主要任务是根

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

据线性要素中心轴线和面状要素的边界线的特征,减少弧段矢量坐标串中顶点的个数(结点不能去除),常用的压缩方法有如下几种。 (1)间隔取点法

每隔规定的距离取一点,或者每隔k 个点取一点,但首末点一定要保留。如图6.38所示,弧

段由顶点序列{P 1,P 2,…P n }构成,D 临为临界距离。首先保留弧段的起始点P 1,再计算P 2点与 P 1点之间的距离D 21,若D 21≧D 临,则保留第P 2点,否则舍去P 2点。依此方法,逐一比较相邻两点间的距离,以确定需要舍弃的点。

(2)垂距法和偏角法

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

这两种方法是按照垂距或偏角的限差选取符合或超过限差的点。如图6.39所示,P 2点

的垂距和偏角小于限差,应舍弃;P 3点的垂距和偏角大于限差,应保留。

(3)分裂法(Douglas-Peucker 法)

这种方法试图保持曲线走向,并允许用户规定合理的限差。其步骤为: ①把曲线首末两端点连成一条直线; ②计算曲线上每一点与直线的垂直距离。若所有这些距离均小于限差,则将直线两端点间的各点全部舍去。

③若上一步条件不满足,则保留含有最大垂足距离的点,将原曲线分成两段曲线,再递归地重复使用分裂法。

6.9 数据质量评价与控制

空间数据是地理信息系统最基本和最重要的组成部分,也是一个地理信息系统项目中成本比重最大的部分。数据质量的好坏,关系到分析过程的效率高低,及至影响着系统应用分析结果的可靠程度和系统应用目标的真正实现。因此,对数据质量的评价与控制就显得尤为重要。

6.9.1 空间数据质量的相关概念

与空间数据质量相关的几个概念分别是: 1. 误差(Error )

简而言之,误差表示数据与其真值之间的差异。误差的概念是完全基于数据而言的,没有包含统计模型在内,从某种程度上讲,它只取决于量测值,因为真值是确定的。如测量地面某点高程为1002.4m ,而其真值为1001.3m ,则该数据误差为0.9m 。

P

34

P

34

图6.39 垂距法和偏角法

图6.38 间隔取点法

P

n

14D 临

误差与不确定性有着不同的含义。在上例中,认为量测值(1002.4m )与误差(0.9m )都是确定的。也就是说,存在误差,但不存在不确定性。不确定性指的是“未知或未完全知”,因此,不确定性是基于统计的推理、预测。这样的预测即针对未知的真值,也针对未知的误差。

2. 准确度(Accuracy )

准确度是量测值与真值之间的接近程度。它可以用误差来衡量。仍以前问所述某点高程为例,如果以更先进量测方式测得其值为1002.1m ,则此量测方式比前一种方式更为准确,亦即其准确度更高。 3. 偏差(Bias )

与误差不同,偏差基于一个面向全体量测值的统计模型,通常以平均误差来描述。 4. 精密度(Precision )

精密度指在对某个量的多次量测中,各量测值之间的离散程度。可以看出,精密度的实质在于它对数据准确度的影响,同时在很多情况下,它可以通过准确度而得到体现,故常把二者结合在一起称为精确度,简称精度。精度通常表示成一个统计值,它基于一组重复的监测值,如样本平均值的标准差。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.40中,离中心圆圆心距离越近,表示越高的准确度(Accuracy )。图中,A 组量测值中,只有一个距离圆心较近,准确度相对较高,整体值比较分散,说明这一组数据偏差大、精密度较差;B 组量测值偏差不大但精密度较低,数据整体准确度较低;C 组值偏差较大,虽具有较高的精密度,整体准确度仍较低;D 组值偏差较小且具有很高的精密度,数据整体准确性较高。

5. 不确定性(uncertainty )

不确定性是指对真值的认知或肯定的程度,是更广泛意义上的误差,包含系统误差、偶然误差、粗差、可度量和不可度量误差、数据的不完整性、概念的模糊性等。在GIS 中,用于进行空间分析的空间数据,其真值一般无从量测,空间分析模型往往是在对自然现象认识的基础上建立的,因而空间数据和空间分析中倾向于采用不确定性来描述数据和分析结果的质量。

此外,GIS 数据的规范化和标准化直接影响地理信息的共享,而地理信息共享又直接影响到GIS 的经济效益和社会效益。为了解决利用已有数据资源,并为今后数据共享创造条件,各国都在努力开展标准化研究工作。国家制定的规范和标准是信息资源共享的基础,不但有利于国内信息交流,也有利于国际信息交流。但是目前空间数据的标准化仍然存在不少问题,还缺乏统一的标准和规范,各部门间也缺乏必要的联系和协调,对空间数据科学的分类和统计缺乏严格的定义,直接导致建立的各类信息系统之间数据杂乱,难以相互利用,信息得不到有效的交流和共享。为使数据库和信息系统能向各级政府和部门提供更好的信息服

A 组量测值

B 组量测值

C 组量测值

D 组量测值

图6.40 数据质量相关概念示意图

务,实现数据共享,数据的规范化和标准化刻不容缓。

6.9.2 空间数据质量评价

1.评价指标

数据质量是数据整体性能的综合体现,而空间数据质量标准是生产、应用和评价空间数据的依据。为了描述空间数据质量,许多国际组织和国家都制定了相应的空间数据质量标准和指标(表6.6)。空间数据质量指标的建立必须考虑空间过程和现象的认知、表达、处理、再现等全过程。

从实用的角度来讨论空间数据质量,空间数据质量指标应包括以下几个方面:

(1)完备性:要素、要素属性和要素关系的存在和缺失。完备性包括两个方面的具体指标:①多余:数据集中多余的数据;②遗漏:数据集中缺少的数据。

(2)逻辑一致性:对数据结构、属性及关系的逻辑规则的依附度(数据结果可以是概念上的、逻辑上的或物理上的)。包括四个具体指标:①概念一致性:对概念模式规则的符合情况;②值域一致性:值对值域的符合情况;③格式一致性:数据存储同数据集的物理结构匹配程度;④拓扑一致性:数据集拓扑特征编码的准确度。

(3)位置准确度:要素位置的准确度。包括三个具体指标:①绝对或客观精度:坐标值与可以接受或真实值的接近程度;②相对或内在精度:数据集中要素的相对位置和其可以接受或真实的相对位置的接近程度;③格网数据位置精度:格网数据位置值同可以接受或真实值的接近程度。

(4)时间准确度:要素时间属性和时间关系的准确度。包括三个具体指标:①时间量测准确度:时间参照的正确性(时间量测误差报告);②时间一致性:事件时间排序或时间次序的正确性;③时间有效性:时间上数据的有效性。

(5)专题准确度:定量属性的准确度;定性属性的正确性;要素的分类分级以及其他关系。包括四个具体指标:①分类分级正确性:要素被划分的类别或等级,或者他们的属性与论域(例如,地表真值或参考数据集)的比较;②非定量属性准确度:非定量属性的正确性;③定量属性准确度:定量属性的准确度;④对于任意数据质量指标可以根据需要建立其它的具体指标。

表6.6 不同标准中的质量指标和质量参数

STDS(1992)ICA(1996)CEN/TC287(1997)ISO/TC211(1997)

数据渊源数据渊源数据渊源数据总揽(数据渊源、

(潜在的)用途

数据目的、数据用途)

分辨率分辨率分辨率

几何精度几何精度几何精度数据精度

属性精度属性精度属性精度专题精度

完整性完整性完整性完整性

逻辑一致性逻辑一致性逻辑一致性逻辑一致性

语义精度元数据质量

时态精度时态精度时态精度

数据同质性

数据测试和一致性

2.评价方法

空间数据质量评价方法分直接评价和间接评价两种。直接评价方法是对数据集通过全面检测或抽样检测方式进行评价的方法,又称验收度量。间接评价方法是对数据的来源和质量、

生产方法等间接信息进行数据集质量评价的方法,又称预估度量。这两种方法本质区别是面向的对象不同,直接评价方法面对的是生产出的数据集,而间接评价方法则面对的是一些间接信息,只能通过误差传播的原理,根据间接信息估算出最终成品数据集的质量。

(1)直接评价法

直接评价法又分为内部和外部两种。内部直接评价方法要求对所有数据仅在其内部对数据集进行评价。例如在属于拓扑结构的数据集中,为边界闭合的拓扑一致性做的逻辑一致性测试所需要的所有信息。外部直接评价法要求参考外部数据对数据集测试。例如对数据集中道路名称做完整性测试需要另外的道路名称原始性资料。

(2)间接评价法

间接评价法是一种基于外部知识的数据集质量评价方法。外部知识可包括但不限定数据质量综述元素和其他用来生产数据集的数据集或数据的质量报告。本方法只是推荐性的,仅在直接评价方法不能使用时使用。在下列几种情况下,见解评价法是有效的:使用信息中记录了数据集的用法;数据日志信息记录了有关数据集生产和历史的信息;用途信息描述了数据集生产的用途。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

6.9.3 空间数据的误差源及误差传播

空间数据的误差包括随机误差、系统误差以及粗差。数据是通过对显示世界中的实体进行解译、量测、数据输入、空间数据处理以及数据表示而完成的。其中每一个过程均有可能产生误差,从而导致相当数量的误差积累。图6.41表示出GIS 中数据的误差源及误差的传播过程。

图中,GIS 的各类空间数据源本身都会有误差存在,这种误差会一直传播到GIS 的分析结果中。在对数据进行输入时,会由于采样方法、仪器设备等的固有误差以及一些无法避免的因素造成新的误差,这些误差会随着数据进入空间数据库。GIS 对数据库中数据的处理和分析过程也会产生误差,并传播到处理、分析结果数据中。

总之,空间数据的误差源蕴涵在整个GIS 运行的每个环节,并且往往会随系统的运行不断传播,使得GIS 空间数据的误差分析相当复杂,甚至在某些环节没有任何方式可对其进行分析。

数据源及产生过程 GIS 中的误差源

图6.41 GIS 中数据的误差源

6.9.4 误差类型分析

空间数据误差包括几何误差、属性误差、时间误差和逻辑误差四大类。其中又以图形几何误差和属性误差对数据质量影响最大。本节分别对此两类误差进行解释和分析

1.几何误差

几何误差即空间数据在描述空间实体时,在几何属性上的误差。此处以地图数字化采集为例,分析其误差来源及累计过程(表6.7)。

表6.7 地图数字化几何误差

误差类型具体内容

地形图本身的误差1)地形图的位置误差

2)地形图的属性误差

3)时间误差

4)逻辑不一致性误差

5)不完整性误差

数据转换和处理的误差1)数字化误差

2)格式转换误差

3)不同GIS系统间数据转换误差

应用分析时的误差

1)数据层叠加时的冗余多边形

2)数据应用时,由应用模型引进的误差

从上表可以了解误差分布特点、误差源、和处理方法、产生误差的特点。

2.属性误差

属性数据可以分为命名、次序、间隔和比值四种类型。间隔和比值的属性数据误差可以用点误差的分析方法进行分析评价。此处主要讨论命名和次序这类定性、也是离散型的数据误差评价方法。多数专题图都用命名或次序表现,如人口分布图、土地利用图、地质图等的内容主要为命名数据,而反映坡度、土壤侵蚀度等一般是次序数据。如将土壤侵蚀度分为若干级,级数即为次序数据。考察空间任意点处定性属性数据与其真实的状态是否一致,只有对或错两种可能。因此可以用遥感分类中常用的准确度评价方法来评价定性数据的属性误差。

定性属性数据的准确度评价方法比较复杂,它受属性变量的离散值(如类型的个数),每个属性值在空间上分布和每个同属性地块的形态和大小,检测阳电的分布和选取,以及不同属性值在特征上的相似程度等多种因素的影响。因此本书对此暂不做详细介绍,读者可参阅相关参考文献。

6.9.5 空间数据质量的控制

空间数据质量控制是指在GIS建设和应用过程中,对可能引入误差的步骤和过程加以控制,对这些步骤和过程的一些指标和参数予以规定,对检查出的错误和误差进行修正,以达到提高系统数据质量和应用水平的目的。在进行空间数据质量控制时,必须明确数据质量是一个相对的概念,除了可度量的空间和属性误差外,许多质量指标是难以确定的。因此空

间数据质量控制主要是针对其中可度量和可控制的质量指标而言的。数据质量控制是个复杂的过程,要从数据质量产生和扩散的所有过程和环节入手,分别采取一定的方法和措施来减少误差。

1.空间数据质量控制的方法

空间数据质量控制常见的方法有以下几种:

(1)传统的手工方法

质量控制的手工方法主要是将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其它比较方法。

(2)元数据方法

数据集的元数据中包涵了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量的状况和变化。

(3)地理相关法

用空间数据的地理特征要素自身的相关性来分析数据的质量。例如,从地表自然特征的空间分布着手分析,山区河流应位于微地形的最低点,因此,叠加河流和等高线两层数据时,若河流的位置不在等高线的汇水线上且不垂直相交,则说明两层数据中必有一层数据有质量问题,如不能确定哪层数据有问题时,可以通过将他们分别与其它质量可靠的数据层叠加来进一步分析。因此,可以建立一个有关地理特征要素相关关系的知识库,以备各空间数据层之间地理特征要素的相关分析之用。

2.空间数据生产过程中的质量控制

数据质量控制应体现在数据生产和处理的各个环节。下面仍以地图数字化生成空间数据过程为例,介绍数据质量控制的措施。

(1)数据源的选择

由于数据处理和使用过程的每一个步骤都会保留甚至加大原有误差,同时可能引入新的数据误差,因此,数据源的误差范围至少不能大于系统对数据误差的要求范围。

所以对于大比例尺地图的数字化,原图应尽量采用最新的二底图,即使用变形较小的薄膜片基制作的分版图,以保证资料的现势性和减少材料变形对数据质量的影响。

(2)数字化过程的数据质量控制

主要从数据预处理、数字化设备的选用、对点精度、数字化限差和数据精度检查等环节出发。

①数据预处理

主要包括对原始地图、表格等的整理、誊清或清绘。对于质量不高的数据源,如散乱的文档和图面不清晰的地图,通过预处理工作不但可减少数字化误差,还可提高数字化工作的效率。对于扫描数字化的原始图形或图像,还可采用分版扫描的方法,来减小矢量化误差。

②数字化设备的选用

主要按手扶数字化仪、扫描仪等设备的分辨率和精度等有关参数进行挑选,这些参数应不低于设计的数据精度要求。一般要求数字化仪的分辨率达到0.025mm,精度达到0.2mm;对扫描仪的分辨率则不低于300DPI(dots per inch)。

③数字化对点精度(准确性)

数字化对点精度是指数字化时数据采集点与原始点重合的程度。一般要求数字化对点误差小于0.1mm。

④数字化限差

数字化时各种最大限差规定为:曲线采点密度2mm、图幅接边误差0.2mm、线划接合距离0.2mm、线划悬挂距离0.7mm。对于接边误差的控制,通常当相邻图幅对应要素间距离小于0.3mm时,可移动其中一个要素以使两者接合;当这一距离在0.3mm与0.6mm之间时,两要素各自移动一半距离;若距离大于0.6mm,则按一般制图原则接边,并作记录。

⑤数据的精度检查

主要检查输出图与原始图之间的点位误差。一般要求,对直线地物和独立地物,这一误

差应小于0.2mm;对曲线地物和水系,这一误差应小于0.3mm;对边界模糊的要素应小于0.5mm。

6.10 数据入库

6.10.1 数据入库流程

空间数据系统包含多种数据类型,每种数据都有其各自的特点和用途,但作为空间数据库管理部门从数据管理和数据集成的角度来看,在空间数据库系统中,所有数据按照管理属性可分为三个子据库(图6.42)。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.42 空间数据库系统基本结构

(1)向用户提供的现势性最好的成果数据;

(2)被更新下来的成果数据(称为历史数据);

(3)为了实现对成果数据在线检索查询、分析应用而建立的工作运行数据库。

每种数据的采集工作虽然是分散由各数据单位按照相应的生产技术规定来完成的,但数据库建库工作一般由一个专门的机构来统一组织实施。空间数据库建库就是经过一系列的转换,对采集和处理后的成果数据进行统一的组织和管理。空间数据建库是一个复杂的工程,涉及到空间数据库的建库方案设计、环境准备、数据生产、数据入库、安全设置、数据库维护等多方面的内容,一般流程如图6.43所示。各个环节具体实现已有许多的专著,这里主要对GIS数据的入库作以详细说明。

入库流程一般在数据库建库设计阶段就基本确定,不同数据源,不同的空间数据库库体,它们在具体的入库过程中,需要完成的工作各不相同,但通常包括图6.43所示的主要工作:首先,对待入库数据进行全面质量检查。包括资料完整性检查、数据完整性检查、数据正确性检查,并完成检查报告。如果质量不合格,则将数据返回生产单位进行修改,修改后重新进行质量检查直至满足入库要求方可进入下一步。第二,对检查合格的数据进行整理。包括以下工作:①按数据组织规则建立数据文件存储目录;②按数据命名规则对成果数据统一命名;③文件资料数字化;④根据入库内容对数据字典及元数据进行相应更新;⑤将成果数据存入指定目录。最后,将数据入库,完成全部入库工作。

GIS课件第6章 空间数据采集与处理-海洋仪器网资料库

图6.43 数据入库流程图

6.10.2 元数据及其作用

1.元数据与元数据的作用

元数据的英文名称是“Metadata”,它是关于数据的数据。在地理空间信息中用于描述地理数据集的内容、质量、表示方式、空间参考、管理方式以及数据集的其他特征,它是实现地理空间信息共享的核心标准之一。元数据的主要作用是:

(1)帮助用户了解和分析数据

元数据提供丰富的引导信息,以及由纯数据得到的分析、综述和索引等。根据元数据提供的信息,用户可对空间数据库进行浏览、检索、研究、分析,了解数据的基本情况和数据的可用性,获取方法等方法内容。

(2)空间数据质量控制

不论是统计数据还是空间数据都存在数据精度问题,影响空间数据精度的原因主要有两个方面:一是源数据的精度,一是数据加工处理工程中精度质量的控制情况。空间数据质量控制内容包括:①有准确定义的数据字典,以说明数据的组成,各部分的名称,表征的内容等;②保证数据逻辑科学地集成,如植被数据库中不同亚类的区域组合成大类区,这要求数据按一定逻辑关系有效的组合;③有足够的说明数据来源、数据的加工处理工程、数据释译的信息。通过按一定的组织结构集成到数据库中构成数据库的元数据信息系统可以实现

上述功能。

(3)在数据集成中的应用

元数据记录了数据格式、空间坐标体系、数据的表达形式、数据类型、数据使用软硬件环境、数据使用规范、数据标准等信息。这些信息在数据集成的一系列处理中,如数据空间匹配、属性一致化处理、数据交换等方面是必需的。

(4)数据存贮和功能实现

元数据系统用于数据库的管理,可以实现数据库设计和系统资源利用方面开支的合理分配,避免数据的重复存贮,并可以高效查询检索分布式数据库中任何物理存贮的数据。减少用户查寻数据库及获取数据的时间,从而降低数

2.元数据实例

美国联邦地理数据委员会(Federal Geographical DataCommittee, FGDC)于1994年8月FGDC通过并发布第一版地理空间数据的元数据内容标准(CSDGM,Content standard for digital geospatial metadata)。该标准获得了行业较为广泛的认可,成为具有普遍应用价值的元数据标准。著名地理信息系统软件ArcGIS也支持该标准。FGDC于1997发布了了第二版CSDGM。

CSDGM说明一组数字地理空间数据的元数据的信息内容,提供与元数据有关的术语和定义,说明哪些元数据元素是必需的、可选的、重复出现的,或者是按CSDGM产生规则编码的。CSDGM是参照文件,它说明当用户在评价数据集的用途、获得该数据或有效使用数据时,需要知道的事情。

第二版的CSDGM包含7个主要子集和3个次要子集(见表6.8),共有460个元数据实体(含复合实体)和元素。

表6.8 FGDC元数据标准的主要内容

主要子集次要子集

标识信息引用文献(引证)信息

数据质量信息时间信息

空间数据组织信息联系信息

空间参照系统信息

实体和属性信息

发行信息

元数据参考信息

元数据元素是元数据的关键术语,是其最基本的单元。一个元数据元素说明地理空间数据的某一方面特征。按数据库语言,它们是填入数据的“字段”。一个或若干个元数据元素组成元数据实体。复合实体则由元数据实体、元数据元素和/或其他复合实体构成。每个元数据元素、实体或复合实体均需说明其名称、定义、类型、值域、简称等特征信息。元数据子集是由若干元素、简单的或复合的元数据实体组成的集合。

CSDGM标准规定了三种性质的子集、实体和元素。这三种性质是:必需的,即必需提供的信息;一定条件下必需的,即如果正在建立的元数据包含某子集、某个实体,或某个元素说明的特征,则必需提供的信息;可选的,即该信息是可选的,由用户决定是否将其包含在元数据文件中。

专业术语

正解反解卷积二值化语义数据模型拓扑误差偏差不确定性分辨率元数据

分享到:
原文链接:,转发请注明来源!
「GIS课件第6章 空间数据采集与处理-海洋仪器网资料库」评论列表

发表评论