四川师范大学地信概论(3- 空间数据模型)90分以上版本

第三章 空间数据模型
地理空间 →空间数据→空间信息
数据模型→数据结构→空间分析
空间数据(Spatial Data)是各种地理特征和现象间关系的数字化表示。
包括:空间位置、属性特征及时域特征。
空间信息(Spatial Information)是有关地理实体和地理现象的性质、特征和运动状态的表征和一-切有用的知识,它是对表达地理特征与地理现象之间关系的地理数据的解释。
地理信息系统特殊的空间数据模型决定了地理信息系统特殊的空间数据结构和特殊的数据编码,也决定了地理信息系统具有特色的空间数据管理方法和系统的空间数据分析功能,成为地理学研究和资源管理的重要工具。
地理空间中的空间对象
◆可精密观测的自然对象(如建筑物边界)
◆受采样限制的自然对象(如河流的边界)
◆受定义限制的自然对象(如植被覆盖率大小)
◆不规则的人为对象(行政区、TIN)
◆规则的人为对象(栅格、立方体)

3.1地理空间与空间抽象
3.1.1地理空间与空间实体

地理空间 (geographic space) 是地球表面及近地表空间,是地球上大气圈、水圈、生物圈、岩石圈和土壤圈交互作用的区域,地球上最复杂的物理过程、化学过程、生物过程和生物地球化学过程就发生在该区域。
地理空间中的这些空间事物或地理现象就代表了现实世界;而地理信息系统即是人们通过对各种各样的地理现象的观察抽象、综合取舍,编码和简化,以数据形式存入计算机内进行操作处理,从而达到对现实世界规律进行再认识和分析决策的目的。
地理空间实体及其基本特征
地理空间实体是对复杂地理事物和现象进行简化抽象得到的结果,简称空间实体,它们的一个典型特征是与一定的地理空间位置有关,都具有一定的几何形态,分布状况以及彼此之间的相互关系。空间实体具有4个基本特征:空间位置特征、属性特征、时间特征和空间关系特征。
空间位置特征:是表示空间实体在一定的坐标系中的空间位置或几何定位,通常采用地理坐标的经纬度、空间直角坐标、平面直角坐标和极坐标等来表示。空间位置特征也称为几何特征,包括空间实体的位置、大小、形状和分布状况等。
属性特征:也称为非空间特征或专题特征,是与空间实体相联系的、表征空间实体本身性质的数据或数量,如实体的类型、语义、定义、量值等。属性通常分为定性和定量两种,定性属性包括名称、类型、特性等;定量属性包括数量、等级等。
时间特征:是指空间实体随着时间变化而变化的特性。空间实体的空间位置和属性相对于时间来说,可能会存在空间位置和属性同时变化的情况,如旧城区改造中,房屋密集区拆迁新建商业中心;也存在空间位置和属性独立变化的情况,即实体的空间位置不变,但属性发生变化,如土地使用权转让,或者属性不变而空间位置发生变化,如河流的改道。
空间关系特征:在地理空间中,空间实体一般都不是独立存在的,而是相互之间存在着密切的联系。这种相互联系的特性就是空间关系。空间关系包括拓扑关系(topological spatial relation)、顺序关系(order spatial relation)和度量关系(metric spatial relation)等。
3.1.2 空间认识和抽象
GIS对现实世界的抽象
GIS作为对地理空间事物和现象进行描述、表达和分析的计算机系统,首先必须将现实世界描述成计算机能理解和操作的数据形式。
数据模型是对现实世界进行认知、简化和抽象表达,并将抽象结果组织成有用、能反映现实世界真实状况数据集的桥梁,是地理信息系统的基础。
由于地理空间事物和现象的复杂性和人们认识地理空间在观念或方法上的不同,地理信息系统对空间实体的抽象方式也存在一定的差别。
ISO模式
国际标准化组织(ISO)的地理信息标准化技术委员会(TC211)制定了对地理空间认知的概念模式。规范以数据管理和数据交换为目的的地理信息基本语义和结构,准确描述地理信息,规范管理地理数据,促进人们对地理空间信息有一个统一的认知和一致的使用方法,促进地理信息系统的互操作性。
基本思路:确定地理空间领域——建立概念模式(概念建模)——构成既方便人们认知又适合计算机解释、处理和实现的模型。
为了简单、明晰地描述GIS抽象过程,我们通过分析研究,归纳为三个层次来进行抽象,如图所示。
空间抽象的三个层次

概念(数据)模型(conceptual model):是地理空间中地理事物与现象的抽象概念集,是地理数据的语义解释,从计算机系统的角度来看,它是系统抽象的最高层。
基本原则:语义表达能力强,作为用户与GIS软件之间交流的形式化语言,应易于用户理解(如ER模型);独立于具体计算机实现;尽量与系统的逻辑数据模型保持统一的表达形式,不需要任何转换,或者容易向逻辑数据模型转换。
逻辑(数据)模型(logical model):是 GIS 描述概念模型中实体及其关系的逻辑结构,是系统抽象的中间层,是用户通过 GIS(计算机系统)看到的现实世界地理空间。
原则:考虑用户易理解,又要考虑易于物理实现,易于转换成物理数据模型。通常所称的空间数据模型其实是空间数据的逻辑模型。
物理(数据)模型(physical model):是概念模型在计算机内部具体的存储形式和操作机制,即在物理磁盘上如何存放和存取,是系统抽象的最底层。
在逻辑数据模型和物理数据模型间,空间数据结构用于对逻辑数据模型描述的数据进行合理的组织,是逻辑数据模型映射为物理数据模型的中间媒介。
3.2数据概念模型
概念模型只能体现地理空间的某一方面。
3.2.1 对象模型
对象数据模型(object data model):简称对象模型,也称作要素(feature)模型,将研究的整个地理空间看成一个空域,地理现象和空间实体作为独立的对象分布在该空域中。按照其空间特征分为点、线、面、体4种基本对象,对象也可能与其他对象构成复杂对象,并且与其他分离的对象保持特定的关系,如点、线、面、体之间的拓扑关系。每个对象对应着一组相关的属性以区分各个不同的对象。
对象模型的适用
对象模型强调地理空间中的单个地理现象。任何现象,不论大小,只要能从概念上与其相邻的其他现象分离开来,都可以被确定为一个对象。对象模型一般适合于对具有明确边界的地理现象进行抽象建模,如建筑物、道路、公共设施和管理区域等人文现象以及湖泊、 河流、岛屿和森林等自然现象,因为这些现象可被看作是离散的单个地理对象。传统的地图是以对象模型进行地理空间抽象和建模的典型实例。
对象模型的基本表达方式
对象模型把地理现象当作空间要素(feature)或空间实体(entity)。
一个空间要素必须同时符合三个条件:
①可被标识;②在观察中的重要程度;③有明确的特征且可被描述。

3.2.2 场模型
场数据模型(field data model):简称场模型,也称作域模型,是把地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表温度、土壤湿度、地形高度以及大面积空气和水域的流速和方向等。
根据不同的应用,场可以表现为二维或三维。一个二维场就是在二维空间R2中任意给定的一个空间位置上,都有一个表现某现象的属性值,即A=f (x,y)。一个三维场是在三维空间R3中任意给定一个空间位置上,都对应一个属性值,即A=f (x,y,z)。一些现象如大气污染的空间分布本质上是三维的,但为了便于表达和分析,往往采用二维空间来表示。
在不考虑时间变化时,二维空间场一般采用6种具体的场数据模型来描述:
规则分布的点
不规则分布的点
规则矩形区
不规则多边形区
不规则三角形区
等值线
3.2.3 网络模型
网络数据模型(network data model):简称网络模型,与对象模型的某些方面相同,都是描述不连续的地理现象,不同之处在于它需要考虑通过路径相互连接多个地理现象之间的连通情况。网络是由欧氏空间中的若干点及它们之间相互连接的线(段)构成,亦即在地理空间中,通过无数“通道”互相连接的一组地理空间位置。现实世界许多地理事物和现象可以构成网络,如公路、铁路、通信线路、 管道、自然界中的物质流、能量流和信息流等,都可以表示成相应的点之间的连线,由此构成现实世界中多种多样的地理网络
网络模型与对象模型
由于网络是由一系列节点和环链组成的,从本质上看与对象模型没有本质的区别。按照基于对象的观点,网络模型也可以看成对象模型的一个特例,它是由点对象和线对象之间的拓扑空间关系构成的。因此,也可将网络模型归于对象数据模型中。但是,从地理现象的概念模型的模型功能视角出发,对象模型强调离散地理实体的表达,场模型强调连续地理现象的表达,而网络模型则强调地理对象之间的交互作用。
网络模型的应用
基于网络数据模型,可以解决路径选择、设施布局优化、资源分配、空间相互作用和引力分析等问题。结合复杂网络的引力模型,可用于理解某点或区域的人流、物流和资金流的流动,典型的问题,如人们总是选择距离较近、交通较为便捷的商场去购物,但可能更愿意去较远地方的著名医院去看病就医。
3.2.4 时空模型
时空数据模型(spatio-temporal data model):简称时空模型,主要用于表达地理现象或实体的特征或相互关系随时间变化的动态过程和静态结果。在时空数据模型中,空间、时间和属性构成了地理现象或对象的三个基本要素。
现实世界中几乎所有对象都会在一定的时间尺度上发生变化,随着时空数据采集技术的不断提升,尤其是大数据技术的发展,可获取空间数据的时间特征越来越容易,时空数据模型的表达、管理和分析方法已经成为GIS领域的研究热点。同时,时空数据模型也是时态GIS(Temporal GIS, TGIS)的核心内容。
地理现象的变化的三种形式
基于时空数据模型的空间、时间和属性三要素,可以将特定地理现象的变化分为三种形式。这里以人的出行行为数据为例,说明三种形式的变化。
属性不变而空间位置变化:对于一个人的个体行为轨迹,个体没有发生变化,但所处位置会随着时间发生变化
属性变化而空间位置不变:地铁乘客刷卡数据,其刷卡记录分布在固定数量的地铁站点上,是属性(特定站点的刷卡数量)随时间变化,而位置却不发生变化的情况;
属性和空间位置均变化:对于出租车乘客,乘客上下车的位置具有多种可能性,特定位置上下车的乘客数量也不定,属于随着时间的变化,空间位置和属性均变化的情况。
时空棱柱模型
时空棱柱(space-time prism)的时空制约模型又是时间地理学的重要分析工具,它是对具有时空特征的行为轨迹定量化表达的典型方法。在此模型中,活动个体的活动数量和空间位置受到多种因素的制约。例如,在24小时的时间内,晚上休息的时间和白天工作的时间具有一定的稳定性和周期性。
基于时空棱柱的时空数据模型仅对随时间移动的地理对象的时空路径进行表达,因此,它属于离散型时空数据模型。
时空立方体模型
时空立方体(space-time cube)模型 :以三维的欧几里德空间为基础,以x–y 轴为二维空间,采用z轴表示时间维度(T 轴),并以指定边长的立方体作为最小划分单元,立方体在x -y 方向上的长度作为二维空间的单位距离,立方体在T轴方向上的长度表示单位时间,单位时间可以是用户自定义的任何时间单位,如1年、1天或1小时等。由于以z轴为时间轴的时空立方体模型被所有的单位立方体所占据,这意味着在任何位置的任何时间,都可以找到与之对应的单位立方体。因此,它属于连续型时空数据模型。
优点在于能够同时处理空间维度和时间维度,从而实现数据的历史状态重建、时空变化跟踪及发展态势预测等功能,随着时空大数据的可获取性越来越强,更是将时空数据模型的研究与应用推向了一个新的阶段。
3.2.5 多维数据模型
多维数据模型(multidimensional data model):一般指数据维度多于两个维度的三维数据模型或更多维度的数据模型。地理信息系统中的多维数据模型通常用于表达某种地理现象或实体的属性或相互关系在特定的区域内不仅随着时间变化,而且其变化还随着其他属性变化而发生改变的问题。
多维模型对时空数据的组织方式
在特定区域内,随时间变化的温度可以使用三维模型构建。但如果温度随着时间和海拔高度两个变量发生变化,则需要使用更多维度的模型进行表达,如果用x –y 表示二维空间,h 表达高程,t 表示时间,则温度的表达式为:Tem=F(x , y , h , t),这就需要构建四维模型来表达。
多维模型的范畴
在空间数据模型中,如果时间和高程等变量只是作为对象的属性,而不是维度而存在,则不能称之为多维数据。这里的多维是指两个维度以上的空间数据模型。有时候,不同的划分视角,概念数据模型的分类也各不相同。网络模型中提到可以将其视为特殊的对象模型,与此类似,如果将基于X -Y 和Z(Z代表高程)的三维数据模型中的Z 替换为时间轴,也可以将其划分为时空数据模型,因此,既可以将时空立方体数据模型视为时空数据模型,也可以看作特殊的多维数据模型。
3.2.6 概念模型的选择
两种基本概念模型
从GIS概念模型的发展历程和本质特征出发,对象观点和场观点构成了地理学家用地图思考世界的基本观点,因此对象模型和场模型是GIS中两种最基本的概念数据模型。
无论是基本的概念模型,还是其他概念模型(网络模型、时空模型和多维模型),模型的选择取决于要解决的问题,甚至同一个问题的应用目的不一样,也可能采用不同的概念模型。
基本概念模型的选择
对于一个空间应用来说,到底采用对象模型还是场模型进行空间建模,则主要取决于应用要求和习惯。对于现状不定的现象,例如火灾、洪水和危险物泄漏,当然采用边界不固定的场模型进行建模。场模型通常用于具有连续空间变化趋势的现象,如海拔、温度、土壤变化等。其实在遥感领域,主要利用卫星和飞机上的传感器收集地表数据,此时场模型是占主导地位的。对象模型一般用于具有明确边界和独立地理现象的建模,如道路、地块的征税和使用权等方面的建模。
两种基本模型的集成
对象和场可以在多种水平上共存,即在许多情况下需要采用对象模型和场模型的集成。 对象模型和场模型各有长处, 应该恰当地综合应用这两种模型对地理现象进行抽象建模。不论是在空间数据的概念建模中,或是在GIS的数据结构设计中,还是GIS的应用中,都会遇到这两种模型的集成问题。
例如,如果采集降雨数据的各个点在空间上很分散且分布无规律,而且这些采集点还有各自的特征,那么,一个包含两个属性——采集数据点位置(对象)和平均降雨量(场)的概念模型,也许更适合于对区域降雨现象特性变化的描述。
主要的空间数据概念模型有哪些?各有什么特征?
组成部分:对象模型、场模型、网络模型
关系:不同空间概念模型是指从不同的角度进行地理空间认知和抽象;每个模型都只是反映对象的一一个侧面:对象模型和场模型在-定条件下需要集成。
对象模型特征:强调地理空间中的单个离散地理现象。任何现象,不论大小,只要能从概念上与其相邻的其他现象分离开来,都可以被确定为一个对象。其空间特征分为点、线、面、体4种基本对象,对象也可能与其他对象构成复杂对象,并且与其他分离的对象保持特定的关系,如点、线、面、体之间的拓扑关系。每个对象对应着一组相关的属性以区分各个不同的对象。对象模型一般适合于对具有明确边界的地理现象进行抽象建模。
场模型特征:强调连续地理现象的表达。把地理空间中的现象作为连续的变量或体来看待,通过属性特征表示。根据不同的应用,场可以表现为二维或三维。一个二维场就是在二维空间R2中任意给定的一个空间位置上,都有一个表现某现象的属性值,即A=f (x,y)。一个三维场是在三维空间R3中任意给定一个空间位置上,都对应一个属性值,即A=f (x,y,z)。一些现象如大气污染的空间分布本质上是三维的,但为了便于表达和分析,往往采用二维空间来表示。
网络模型: 强调地理对象之间的交互作用,即要素流动性。描述不连续的地理现象, 需要考虑通过路径相互连接多个地理现象之间的连通情况。
3.3 空间数据逻辑模型
空间数据逻辑模型作为概念模型向物理模型转换的桥梁,根据概念模型确定的空间信息内容,以计算机能理解和处理的形式具体地表达空间实体及其关系。针对对象模型和场模型两类概念模型,一般采用:矢量数据模型、栅格数据模型、矢量一栅格一体化数据模型、镶嵌数据模型、面向对象数据模型。另外,还有三维空间数据模型、时间数据模型等。
3.3.1 逻辑数据模型的设计
构建空间逻辑数据模型的根本目的是定义人们所认识的现实世界中的各种地理实体的集合,提取感兴趣的属性并对地理实体之间的关系进行描述。尽管逻辑数据模型并不关心如何对其进行物理实现,但在设计空间逻辑数据模型的过程中,必须在所采用的数据库框架下展开。在空间数据的逻辑建模过程中,可以将其划分为实体属性的逻辑建模、实体关系的逻辑建模和实体行为的逻辑建模。
实体属性的逻辑建模之非空间属性逻辑建模
属性是对象的性质。对地理实体属性的逻辑建模主要包括非空间属性逻辑建模、几何属性建模和约束性条件建模等。任何地理实体对象都是通过一个或多个属性特征进行描述。在建模过程中,通常只提取感兴趣的属性特征。地理实体特征的提取和抽象,是逻辑数据模型设计的主要内容之一。
实体属性的逻辑建模之约束性条件逻辑建模
除此之外,属性还具有一定的约束性条件,通常称之为属性域,属性域可以是数值范围,也可以是一个有效值的列表。例如,房屋的高度一般不能是负数且在一定的数值范围内,建筑物的材质一般也在几个特定的材质类型范围内。
实体关系的逻辑建模
现实世界中,地理实体间存在着各种各样的关系。理清这些关系是有必要的,因为只有这样,当一个对象被修改时,相关的对象才可以发生相应的变动。例如,当某段管道拆除时,管道上的阀门也会被移除。地理实体之间的关系可以定义为一般关系、空间关系和拓扑关系。
实体关系的逻辑建模之一般关系
一般关系是明确定义的关系。空间数据主要通过空间关系和拓扑关系定义不同地理对象之间的关系,但是,有时候两个地理对象之间,或者地理对象与某些属性之间,并不存在明确的空间或拓扑关系,这就需要通过一般关系进行定义。一般关系主要包括一对一、一对多和多对多三种关系进行描述。
实体关系的逻辑建模之宗地举例
农户与宗地属于一般关系中的一对多关系,农户和居住区之间存在多对多的关系。
以上所述一般关系不涉及空间关系,而地块和地块之间、道路和道路之间则分别存在邻接拓扑关系和网络拓扑关系。针对特定问题进行逻辑建模时,必须明确定义各种逻辑关系和空间关系。
实体行为的逻辑建模
地理实体行为的逻辑建模主要用于定义实体本身或实体之间的交互关系和约束关系,这些“行为”都遵循一定的规则。例如,在水文建模中,水往低处流;在交通路网建模时,车必须在道路上行驶。简单的地理实体行为,通过基本的约束条件、相互关系等实现。更为复杂的特征则通过扩展标准特征或自定义特征实现。例如,某条道路只能向北单行;某种污染物的扩散受风向的影响沿着西北方向扩散速度更快。
相比非空间数据的逻辑建模,空间数据对地理实体或地理现象形态的表达、空间关系的确定无疑增加了逻辑建模的复杂性,也使空间数据的逻辑建模极具特殊性。因此,在空间数据逻辑建模过程中,除了遵循传统的建模范式外,还必须充分考虑空间数据模型自身的逻辑规则。
3.3.2 逻辑数据模型的表示
UML建模方法
标准的逻辑数据模型设计通常使用实体-关系图表达。目前,使用最为广泛的是基于UML(统一建模语言)的设计方法。很多空间数据库趋向于使用对象关系型数据库模型(或直接称之为面向对象数据模型),而UML正是一种适用于表达面向对象模型的表示方法。例如,主流的ArcObject和SuperMap Object等GIS组件式开发均采用UML表达数据逻辑模型。对象关系数据模型应用面向对象方法描述空间实体及其相互关系,特别适合于采用对象模型抽象和建模的空间实体的表达。
面向对象技术概述
面向对象技术的核心是对象(object)和类(class)。
对象是指地理空间的实体或现象,是系统的基本单位。如多边形地图上的一个结点或一条弧段是对象,一条河流或一个宗地也是一个对象。
一个对象是由描述该对象状态的一组数据和表达它的行为的一组操作(方法)组成的。例如,河流的坐标数据描述了它的位置和形状,而河流的变迁则表达了它的行为。每个对象都有一个唯一的标识号(object-ID)作为识别标志。
类是具有部分系统属性和方法的一组对象的集合,是这些对象的统一抽象描述,其内部也包括属性和方法两个主要部分。类是对象的共性抽象,对象则是类的实例(instance)。
属于同一类的所有对象共享相同的属性和方法,但也可具有类之外的自身特有的属性和方法。类的共性抽象构成超类(super-class),类成为超类的一个子类,表示为“is-a”的关系。一个类可能是某些类的超类,也可能是某个类的子类,从而形成类的“父子”关系。
面向对象方法将对象的属性和方法进行封装(encapsulation),还具有分类(classification)、概括(generalization)、聚集(aggregation)、联合(association)等对象抽象技术以及继承(inheritance)和传播(propagation)等强有力的抽象工具。
面向对象技术的抽象工具
(1)分类(classification)。把具有部分相同属性和方法的实体对象进行归类抽象的过程。如将城市管网中的供气管、给水管、有线电视电缆等都作为类。
(2)概括(generalization)。把具有部分相同属性和方法的类进一步抽象为超类的过程,如将供水管线、供热管线等概括为“管线”这一超类,它具有各类管线所共有的“材质”、“管径”等属性,也有“检修”等操作。
(3)联合( association )。把一组属于同一类中的若干具有部分相同属性的对象组合起来,形成一个新的集合对象的过程。集合对象中的个体对象称作它的成员对象,表示为“is a member of”的关系。联合不同于概括,概括是对类的进一步抽象得到超类,而联合是对类中的具体对象进行合并得到新的对象。例如在供水管线类中,某些管线进行了防腐处理,则可把它们联合起来构成“防腐供水管类”。
(4)聚集( aggregation )。聚集是把一组属于不同类中的若干对象组合起来,形成一个更高级别的复合对象的过程。复合对象中的个体对象称作它的组件对象,表示为“is a part of”的关系。如将地籍权属界线与内部建筑物聚集为“宗地”类。
(5)继承( inheritance )。继承是一种服务于概括的语义工具。在上述概括的概念中,子类的某些属性和操作来源于它的超类。例如饭店类是建筑物类的子类,它的一些操作如显示和删除对象等,以及一些属性如房主、地址、建筑日期等是所有建筑物共有的,所以仅在建筑物类中定义它们,饭店类则继承这些属性和操作。继承有单一继承和多方继承。单一继承是指子类仅有一个直接的父类,而多方继承允许多于一个直接父类。多方继承的现实意义是子类的属性和操作可以是多个父类的属性和操作的综合。地理空间实体表达中,经常会遇到多方继承的问题。
多方继承以交通和水系为例。
(6)传播( propagation)。传播是作用于联合和聚集的语义工具,它通过一种强制性的手段将子对象的属性信息传播给复杂对象。就是说,复杂对象的某些属性值不单独描述,而是从它的子对象中提取或派生。例如,一个多边形的位置坐标数据,并不直接表达,而是在弧段和结点中表达,多边形仅提供一种组合对象的功能和机制,借助于传播的工具可以得到多边形的位置信息。这一概念可以保证数据库的一致性,因为独立的属性值仅存储一次,不会因空间投影和几何变换而破坏它的一致性。
OGC空间数据逻辑模型
基于以上面向对象思想,OGC(Open GIS Consortium)组织给出了适合于二维空间实体及其关系表达的面向对象空间数据逻辑模型,并以UML(Unified Modeling Language)语言表示。
面向对象方法之宗地实例

在实际地理空间对象描述和表达中对空间实体进行“概括”“聚集”“联合”等处理,可得到复杂地理对象的逻辑数据模型。例如,在城市地籍管理中,将宗地多边形类和内部包括的建筑物多边形聚集为“宗地”类。
农户与宗地属于一般关系中的一对多关系,农户和居住区之间存在多对多的关系。
以上所述一般关系不涉及空间关系,而地块和地块之间、道路和道路之间则分别存在邻接拓扑关系和网络拓扑关系。针对特定问题进行逻辑建模时,必须明确定义各种逻辑关系和空间关系。

人们与现实世界的交互是丰富多彩的,地理实体属性的逻辑建模还需要考虑建模对象的几何特征。例如对建筑物的建模,通常使用多边形表示,然而,这并不是唯一的建模方式,必须根据建模的目标选择合理的表达方式。
3.3.3 物理数据模型
物理数据模型是在逻辑数据模型的基础上,考虑各种具体的技术实现因素,进行数据库体系结构设计,真正实现数据在数据库中的存放。常规数据的物理数据模型的内容包括确定所有的表和列,定义外键用于确定表之间的关系,基于用户的需求可能进行范式化等内容。然而,对于空间数据,还必须考虑空间数据存储结构,以及空间关系的表达和存储方式。在物理实现上的考虑,可能会导致物理数据模型和逻辑数据模型有较大的不同。物理数据模型的目标是指定如何用数据库模式来实现逻辑数据模型,以及真正地保存数据。空间数据结构的设计属于对空间逻辑数据模型的具体实现,也可以说数据结构是概念模型的物理实现,详见第四章。
3.3 空间数据与空间关系
3.4.1 空间数据类型及其表示

1、空间数据类型
地理信息中的数据来源和数据类型很多,概括起来主要有以下四种:
(1)几何图形数据。来源于各种类型的地图和实测几何数据。几何图形数据不仅反映空间实体的地理位置,还要反映实体间的空间关系。
(2)像素数据。主要来源于卫星遥感、航空遥感和摄影测量等。
(3)属性数据。来源于实测数据,文字报告,或地图中的各类符号说明,以及从遥感影像数据通过解释得到的信息等。
(4)元数据。对空间数据进行推理、分析和总结得到的关于数据的数据,如数据来源、数据权属、数据产生的时间、数据精度、数据分辨率、数据比例尺、地理空间参考基准、数据转换方法等。
2、几何图形数据的表示方法
几何图形数据是空间数据的常用表示方法之一。这些不同类型的数据都可抽象表示为点、线、面、体等基本的图形要素。
几何图形数据的表示方法之点与线、面与体
(1)点(point)
又称元素(element)或者象元(pixel),是一个数据点,具有一对(x,y)坐标和至少一个属性。
点既可以是一个标识空间点状实体,如水塔,也可以是标记点,仅用于特征的标注和说明,或作为面域的内点用于标明该面域的属性,或是线的起点、终点或交点,则称为结点(node)。
注记点:用于定位注记
内点;用于负载多边形的属性,存在于多边形内
角点、节点(Vertex):表示线段和弧段上的连接点
结点(Node):表示线的起点和终点
(2)线(line)
具有相同属性点的轨迹,有一个坐标序列表示,坐标对序列与线的开头有关,线上每个点不多于2个邻点。
线的起点和终点表明了线的方向。道路、河流、地形线、区域边界等均属于线状地物可抽象为线。线上各点具有相同的公共属性并至少存在一个属性。当线连接两个结点时,也称作弧段(arc)或链(link)。
(3)面(area)
是线包围的有界连续的具有相同属性值的面域,或称为多边形(polygon)。多边形可以嵌套,被多边形包含的多边形称为岛。
是具有相同属性的点的轨迹,以(x,y)坐标对的集合表示,坐标对的排列顺序不影响面的形态,内部点可有多余3个的邻点,面内点具有至少一个相同属性。
(4)体(multipatch):体数据主要用于表示三维地理对象。例如三维的建筑物,三维道 路等,均可以通过体要素表示。
空间的点、线、面可以按一定的地理意义组成区域(region),有时称为一个覆盖(coverage),或数据平面(data plane)。各种专题图在GIS中都可以表示为一个数据平面。扩展至三维空间,可以通过点、线、面和体综合表示。
空间数据类型的划分
在空间几何图形数据中,点是最为基本的几何图形要素,其他类型的几何图形要素都是基于点数据构建。因此,基本的几类几何图形数据之间可以实现互相转换。按照维度划分,一般而言,点属于0维的数据,线属于1维数据,面则属于2维数据,而体则属于3维数据。这是根据数据科学的标准对数据维度进行划分。
点与线
点数据使用坐标进行存储。在二维平面上,某点P可以存储为P(x , y ),如果点数据含有高程信息,则可以存储为P(x , y , z )。从这个意义上讲,前者属于二维点要素,后者则属于三维点要素。
线要素实际上是由多个点连接后的结果。如果一条线上的所有节点都是二维点,则会构建二维线要素。如果都是三维节点,则会生成三维线要素。三维线的构建本质上是由点的高程属性及点的序列关系所决定的。
线、面和体
闭合的线可以构建面,如果面中包含三维的线,则可以构建三维矢量面。至少三条直线可以构建一个面。基于多个面可以构建多面体。一般而言,封闭的多面体较为常用。如图(c)和(d)所示为基于面构建的不同多面体。在图(c)中,面A1,A2,A3,A4,A5共同构建了一个封闭的五面体。
影像数据特征及表示方法
影像数据又称之为像素数据,是另外一种表示空间数据的常用表达形式。日常生活中的各类图片均属于像素数据,像素数据的最小分割单元通常称之为像元。像素数据的基本特征包括像元的大小、像元空间分辨率与空间比例尺的关系、像元的取值方法等几个方面。理解以上三个方面,有助于理解影像数据的表示方法和基本特征。
像元大小
像元大小决定了影像数据所表达对象的详细程度,像元一般是用相同宽度和高度的方格表示。如图所示,一个面对象可以采用不同像元大小的像素数据表示,像元越小,则表达越为精细。
影像数据的空间分辨率与比例尺
影像数据的空间分辨率是指像元大小所表示的在地面上覆盖面积的尺寸。因此,如果一个像元的覆盖面积为 5m x 5 m,则分辨率为 5 m。影像的分辨率越高,像元大小越小,从而详细程度便越高。这和比例尺相反。比例尺越小,显示的细节越少。
左侧影像的比例尺 (1∶50 000)比右侧影像的比例尺 (1 ∶ 2 500) 小;但是,数据的空间分辨率(像元大小)相同。
左侧影像中所使用的数据的空间分辨率比右侧影像的低。这表示左侧影像中数据的像元大小比右侧影像数据的大,但其中显示的比例尺却相同
像元的取值
像素单元取值是唯一的,但由于受到栅格大小的限制,栅格单元中可能会出现多个地物。在决定栅格单元值时应尽量保持其真实性,要确定该单元的属性取值,可根据需要选用取像元的中心点的值或是从像元的整体区域取值。
3.4.2 空间关系
何为空间关系?空间关系在描述空间实体特征中的意义何在?
空间关系:是指地理空间实体之间相互作用的关系。
意义:空间关系是对地理实体之间存在的拓扑关系、顺序关系、度量关系的描述。是GIS能够进行复杂空间分析的重要原因。
空间关系主要有:
(1)拓扑空间关系:用来描述实体间的相邻、连通、包含和相交等关系;
(2)顺序空间关系:用于描述实体在地理空间上的排列顺序,如实体之间前后、上下、左右和东、南、西、北等方位关系;
(3)度量空间关系:用于描述空间实体之间的距离远近等关系。
对空间关系的描述是多种多样的,有定量的,也有定性的,有精确的,也有模糊的。各种空间关系的描述也非绝对独立,而是具有一定联系。对空间关系的描述和表达,是GIS能够进行复杂空间分析的重要原因。
空间拓扑关系
地图上的拓扑关系是指图形在保持连续状态下的变形(缩放、旋转和拉伸等),但图形关系不变的性质。地图上各种图形的形状、大小会随图形的变形而改变,但是图形要素间的邻接关系、关联关系、包含关系和连通关系保持不变。俗称的拓扑关系是绘在橡皮上的图形关系,或者说拓扑空间中不考虑距离函数。
如图所示,设N1,N2,…为结点;A1,A2…为线段(弧段);P1,P2,…为面(多边形):
(1)邻接关系。空间图形中同类元素之间的拓扑关系。例如多边形之间的邻接关系P1与P2、P4,P4与P1、P2等;结点之间的邻接关系N1与N2、N3等;
(2)关联关系。空间图形中不同类元素之间的拓扑关系。例如结点与弧段的关联关系N1与A1、A2、A3; N2与A1、A6、A7等;弧段与多边形的关联关系A1与P1, A2与P1等;弧段与
结点的关联关系A1与N1、N2,A2与N1、N3等;多边形与弧段的拓扑关联关系P1与A1 、 A2 、A7,P4与A2 、A3、A5、A4等。
(3)包含关系。空间图形中不同类或同类但不同级元素之间的拓扑关系。例如多边形P4中包含P3。
(4)连通关系。空间图形中弧段之间的拓扑关系。例如A1与A2 、A6和A7连通。
由于上述拓扑关系中,有些关系可以通过其他关系得到,所以在实际描述空间关系时,一般仅将其中的部分关系表示出来,而其余关系则隐含其中,如连通关系可以通过结点与弧段以及弧段与结点的关联关系得到。如果要将结点、弧段、面块相互之间主要拓扑关系表达出来,可以组成四个关系表。即表3.1,表3.2,表3.3和表3.4。例如表3.3对于网络分析非常重要,而对于主要表达面状目标的GIS系统来说则可以省略。表3.1中,弧段前的负号表示面域中含有岛;表3.2中弧段的始结点和终结点给出了弧段的方向;表3.4中,弧段的左邻面和右邻面为沿弧段前进方向左、右两侧的多边形,由弧段的方向确定;P0为多边形外围的虚多边形编号。
除了在逻辑上定义结点、弧段和多边形来描述图形要素的拓扑关系外,不同类型的空间实体间也存在着拓扑关系。分析点、线、面三种类型的空间实体,它们两两之间存在着分离、相邻、重合、包含或覆盖、相交5种可能的关系
空间实体间的拓扑关系
(1)点-点关系。点实体和点实体之间之间只存在相离和重合两种关系。如两个分离的村庄,变压器与电线杆在投影至平面空间上重合。
(2)点-线关系。 点实体和线实体间存在着相邻、相离和包含三种关系。如水闸和水渠相邻;道路与学校相离;里程碑包含在高速公路中。
(3)点-面关系。点实体与面实体间存在着相邻、相离和包含三种关系。如水库与多个泄洪闸门相邻,闸门位于水库的边界上;公园与远处的电视发射塔相离;耕地含有输电杆
(4)线-线关系。线实体与线实体间存在着相邻、相交、相离、包含、重合关系。如供水主干管道与次干管道相邻(连通);铁路和公路平面相交;国道和高速公路相离;河流中包含通航线;道路与沿道路铺设的管线在平面上重合。
(5)线-面关系。线实体与面实体间存在着相邻、相交、相离、包含关系。如水库与上游及下游河流相邻;跨湖泊的通讯光纤与湖泊相交;远离某乡镇区域的高速公路;在某县境内的干渠等。
(6)面-面关系。面实体与面实体间存在着相邻、相交、相离、包含、重合关系。例如地籍中相邻的两块宗地;土地利用图斑与地层类型图斑相交;某县域内包含多个乡镇;宗地与建筑物底面重合等。
空间拓扑关系的意义
空间数据的拓扑关系,对数据处理和空间分析具有重要的意义:
(1)拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何坐标关系有更大的稳定性,不随投影变换而变化。
(2)利用拓扑关系有利于空间要素的查询,例如,某条铁路通过哪些地区,某县与哪些县邻接。又如分析某河流能为哪些地区的居民提供水源,某湖泊周围的土地类型及对生物、栖息环境作出评价等。
(3)可以根据拓扑关系重建地理实体。例如根据弧段构建多边形,实现道路的选取,进行最佳路径的选择等。
因此在描述空间数据的逻辑模型时,通常将拓扑空间关系作为一个主要的内容。
顺序空间关系是基于空间实体在地理空间的分布,采用上下、左右、前后、东南西北等方向性名词来描述。同拓扑空间关系的形式化描述类似,也可以按点-点、点-线、点-面、线-线、线-面和面-面等多种组合来考察不同类型空间实体间的顺序关系。
由于顺序空间关系必须是在对空间实体间方位进行计算后才能得出相应的方位描述,而这种计算非常复杂。实体间的顺序空间关系的构建目前尚没有很好的解决方法,另外随着空间数据的投影、几何变换,顺序空间关系也会发生变化,所以在现在的GIS中,并不对顺序空间关系进行描述和表达。
从计算的角度来看,点-点顺序关系只要计算两点连线与某一基准方向的夹角即可。同样,在计算点实体与线实体、点实体与面实体的顺序空间关系时,只要将线实体和面实体简化至其中心,并将其视为点实体,按点-点顺序关系进行计算。但这种简化需要判断点实体是否落入线实体或面实体内部。而且这种简化的计算在很多情况下会得出错误的方位关系,如点与呈月牙型的面的顺序关系。
在计算线-线、线-面和面-面实体间的顺序关系时,情况变得异常复杂。当实体间的距离很大时,此时实体的大小和形状对它们之间的顺序关系没有影响,则可将其转化为点,其顺序关系则转化为点-点之间的顺序关系。但当它们之间距离较小时,则难以计算。
度量空间关系
度量空间关系主要指空间实体间的距离关系。也可以按照拓扑空间关系中建立点-点、点-线、点-面、线-线、线-面和面-面等不同组合来考察不同类型空间实体间的度量关系。距离的度量可以是定量的,如按欧几里德距离计算得出A实体距离B实体500m,也可以应用与距离概念相关的概念如远近等进行定性地描述。与顺序空间关系类似,距离值随投影和几何变换而变化。建立点-点的度量关系容易,建立点-线和点-面的度量关系较难,而线-线、线-面和面-面的度量关系更为困难,涉及大量的判断和计算。在GIS中,一般也不明确描述度量空间关系。

    原文作者:是金子总会发光的hhhh
    原文地址: https://blog.csdn.net/youthhahhah/article/details/122658935
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞