【干货】地理信息系统考研重点知识点汇总,23GIS考研必备资料(8)
第3章 空间数据处理
3.1 复习笔记
一、空间数据的变换
空间数据的变换即空间数据坐标系的变换。其实质是建立两个坐标系坐标点之间的一一对应关系,包括几何纠正和投影转换。
1.几何纠正
(1)几何纠正的概念
几何纠正是为了实现对数字化数据的坐标系转换和图纸变形误差的纠正。GIS软件一般都具有仿射变换、相似变换和二次变换等几何纠正功能。
(2)仿射变换
①仿射变换的作用
仿射变换可以对坐标数据在x和Y方向进行不同比例的缩放,同时进行扭曲、旋转和平移。
②仿射变换的特性
仿射变换具有直线变换后仍为直线,平行线变换后仍为平行线,不同方向上的长度比发生变化的特性。
③待定系数的计算

2.地图投影及其转换
(1)地图投影的基本原理
地图投影就是依据一定的数学法则,将不可展开的地表曲面映射到平面上或可展开成平面的曲面上,最终在地表面点和平面点之间建立一一对应的关系。在实践中是采用经度、纬度表示的地球表面上的点位与平面直角坐标或极坐标表示的平面上的点位,通过一定的数学关系式建立起对应的联系。
(2)地图投影的类型
①按变形的性质
地图投影分为等角投影、等面积投影和任意投影。
②按投影面与地球的相对位置关系
地图投影分为正轴投影、斜轴投影和横轴投影等。
③按投影面的形状
地图投影分为圆锥投影、圆柱投影和方位投影等。
④按投影面和地球的空间逻辑关系
地图投影分为相切和相割两类投影。
(3)高斯-克吕格投影
①高斯-克吕格投影的原理
高斯一克吕格投影是等角横切椭圆投影,从几何意义上来看,就是假想用一个椭圆柱横向套在地球椭球外面,并与某一子午线相切,椭圆柱的中心轴位于地球椭球的赤道上。按高斯一克吕格投影所规定的条件,将中央经线两侧一定经差范围内的经纬线投影到椭圆柱面上,并将此椭圆柱面展为平面,即得高斯-克吕格投影。
②高斯-克吕格投影规定的条件
a.中央经线和赤道投影后为互相垂直的直线,且为投影的对称轴; b.投影具有等角性质;
c.中经线投影后保持长度不变。
③高斯-克吕格投影的特点
a.线上有形,中央线影后保持长不变;
b.除中央经线上的长度比为1外,其他任何点上长度比均大于1:
c.同一条线上,离中央经线越远,变形越大,最大值位于投影带的边缘; d.在同一条经线上,纬度越低,变形越大,变形最大值位于赤道上; e,投影属于等角性质,故没有角度变形,面积比为长度比的平方; f,长度比的等变形线平行于中央子午线。
(4)墨卡托投影
①墨卡托投影的原理
假设地球被围在一个空的圆柱里,其标准纬线与圆柱相切。然后假想地球中心有一盏灯,把球面上的形状投影到圆柱面上,再把圆柱体展开,即得墨卡托投影。墨卡托投影是一种“等角正切圆柱投影”。
②墨卡托投影的特点
a.没有角度变形,由每一点向各方向的长度比相等;
b.经纬线都是平行直线,且相交成直角,经线间隔相等,纬线间隔从标准纬线向两极逐渐增大:
c,长积形明显,标准纬线无变形,从标准纬线向两极变形逐渐增大:
d,在地图上保持方向和角度的正确。因为它具有各个方向均等扩大的特性,保持了方向和相互位置关系的正确。
(5)UTM 投影
①UTM 投影的原理
UTM 投影属干横轴等角割圆柱投影,圆柱割地球千两条等高圈上,投影后两条制线上没有变形,中央经线上长度比0.9996。UTM投影可以改善高斯一克吕格投影。两条割线即等高圈上没有任何变形,离开这两条割线越远则变形越大,在两条割线以内长度变形为负值,在两条割线以外长度变形为正值。
②UTM 投影在应用中的特征;
a.将世界划分为 60 个投影带,带号为1,2,3,…,60连续编号,每带经差为6°;
b.经度自180°W和174°W之间为起始带,且连续向东计算,带的编号系统与1:100万比例尺地图有关规定是一致的。
(6)兰勃特投影
①兰勃特投影的原理
设想用一个圆锥正割于球面两条标准纬线,应用等角条件将地球面投影到圆锥面上,然后沿圆锥一条母线剪开,展开即为兰勃特投影平面。
②兰勃特投影的特点
a.角度没有变形;
b.两条标准纬线上没有任何变形;
c.等变形线和纬线一致,即同一条纬线上的变形处处相等;
d.在同一经线上,两标准纬线外侧为正变形(长度比大干1),而两标准纬线之间为角变形(长度比小干1).变形比较均匀,变形绝对值也比较小:
e.同一纬线上等经差的线段长度相等,两条纬线间的经纬线长度处处相等。
(7)阿尔伯斯投影
阿尔伯斯(Albers)投影是一种正轴等面积割圆锥投影,与兰勃特投影属于同一投影族。我国大部分省区图以及大多数这一比例尺的地图也多采用兰勃特投影和阿尔伯斯投影。
(8)地图投影转换
①地图投影转换的概念
地图投影转换主要研究从一种地图投影变为另一种地图投影的理论和方法。其实质是建立两平面之间点的一一对应关系。
②投影转换的方式
a.正解变换
通过建立一种投影变换为另一种投影的严密或近似的解析关系式,直接由一种投影的数字化坐标变换到另一种投影的直角坐标;
b.反解变换
即由一种投影的坐标反解出地理坐标,然后将地理坐标代入另一种投影的坐标公式中,从而实现由一种投影的坐标到另一种投影坐标的变换。
②投影转换的方法
a.解析变换
在获得原数据与新数据的投影公式的情况下,运用正解法或反解法求出原投影坐标与新投影坐标之间的精确表达式;
b.数值变换
在原数据投影公式未知时,或不易求得原数据和新数据两投影间解析关系式的情况下,可以采用多项式来拟合它们间的关系,主要包括插值法、有限差分法、有限元法、待定系数法等。
c.解析-数值变换
当新数据投影已知,而原数据投影公式不知道的情况下,可以先由原数据投影反解出某些投影点的地理坐标,再代入已知的新数据投影公式中进行计算,便可实现两投影间的变换。
二、空间数据结构的转换
数据重构指数据从一种格式到另一种格式的转换,矢量数据结构与栅格数据结构是GIS常用的两种数据结构,但它们各有不同的优点和缺点,

1.由矢量向栅格的转换
矢量向栅格转换处理是把点 线或面的矢量数据,转换成对应的栅格数据,称为栅格化。栅格化可以分别针对点、线和面来进行。
(1)点的栅格化
设矢量坐标点(x,Y),转换后的栅格单元行列值为(i,J),则有:

式中:方括号表示取整数运算。
(2)线的栅格化
①线的栅格化的原理
线的栅格化分解成对组成折线的每一个线段的栅格化。对于一条线段的栅格化,先使用点栅格化的方法,材格化线段的两个端点,然后再栅格化线段中间的部分。
②线段中间部分的栅格化
设线段两端点坐标分别为(x,Y)和(xzY),栅格化后的单元行列值分别为(L,J))和(IJ)。则:行数差:/=1-列数差:J=J-J1分两种情况来处理:列数差大于行数差J>/的情况及行数差大于列数差/>AJ的情况,运用扫描线算法实现。
a.列数差大于行数差时
当列数差大于行数差的时候,平行于Y轴做每条N的中心线,称为扫描线。求每一条扫描线与线段的交点,按点的栅格化方法将交点转为栅格坐标。设:X…为每列的中心扫描线的横坐标,(x,Y)和(xY2)为线段的两个端点坐标,则交点坐标为:

b.行数差大于列数差时
当行数差大干列数差的时候,平行干x轴做每一行的中心扫描线。求每一条扫描线与线段的交点,按点的栅格化方法将交点转为栅格坐标。设:Ym为每行的中心扫描线的纵坐标,则交点坐标为:

(3)面的栅格化
①基于弧段数据的栅格化基于弧段数据的栅格化是针对拓扑结构的矢量数据,具体方法步骤如下;
方法步骤; a.对栅格化的范围按行或者按列作中心扫描线,对其中的任一条扫描线,求与所有矢量多边形的边界弧段的交点,记录其坐标,并用点的栅格化方法求出交点的栅格坐标行列值;
b.根据弧段的左右多边形信息判断并记录交点左右多边形的数值;
c通过对一行所有交点按其坐标x值从小到大进行排序,并参照左右多边形配对情况,逐段生成栅格数据,直到全部扫描线都完成从矢量向栅格的转换为止。
②基于多边形数据的栅格化
基于多边形数据的栅格化是针对实体结构的多边形关量数据。它是以非拓扑的实体多边形作为栅格化的处理单元,将一个多边形的内部栅格单元赋予多边形的属性值,具体实现方法包括;内点填充法、边界代数法和包含检验法等。
a.内点填充法
按线的栅格化方法把多边形的边界栅格化,在多边形的内部找一点作为内点,从该点出发,向外填充多边形区域,直到边界为止。
b.边界代数法
沿着多边形实体的边界环绕多边形一圈,当向上环绕的时候,把边界左边一行中所有的格单元的数值都减去属性值;当向下环绕的时候,把边界左边一行中所有的栅格单元的数值都加上属性值,则多边形外部的栅格正负数值抵消,而多边形内部的栅格被赋予属性值。
c.包含检验法
对每个栅格单元,逐个判定其是否包含在某个实体多边形之内,若包含在某个多边形之内,则将多边形的属性值赋给该栅格单元。“点在多边形内”的判定可以通过检验夹角之和的方法或铅垂线法来实现。
2.由栅格向矢量的转换
(1)矢量化的目的
栅格数据结构向矢量数据结构的转换即矢量化,其目的是将扫描仪获取的图像栅格数据存入矢量形式的空间数据库,并将栅格数据进行数据压缩,将面状栅格数据转换为由矢量数据表示的多边形边界。
(2)基于图像数据的矢量化方法
图像数据是不同灰阶的影像,通过扫描仪按一定的分辨率进行扫描采样,得到不同灰度值表示的数据。因为关量只能允许横断面保持一个栅格的宽度,需要对图像数据进行一值化、细化和跟踪等矢量化步验。
①二值化
线画图形扫描后产生图像栅格数据,这些数据是按从0~255的不同灰度值量度的。为将256级不同的灰度压缩到2个灰度形成二值图,要在最大与最小灰度之间定义阈值,根据公式使灰度图像二值化。
②细化
细化是消除线画横断面栅格数的差异,使得每一条线只保留代表其轴线或周围轮廓线位置的单个栅格的宽度。细化可分为“剥皮法”和“骨架法”两大类。剥皮法的实质是从曲线的边缘开始,每次剥掉等于一个栅格宽的一层,直到最后留下彼此连通的由单个栅格点组成的图形。
③跟踪
跟踪的目的是将细化处理后的栅格数据转换为从节点出发的线段或闭合的线条,并以矢量形式存储线段的坐标。跟踪时,从起始点开始,根据八个邻域进行搜索下一个相邻点的位置,记录坐标,直到完成全部栅格数据的矢量化。
(3)栅格数据的矢量化方法
栅格数据的矢量化针对栅格数据中的多边形进行,其步骤如下:
①在栅格数据中搜索多边形边界弧段相交处的节点位置,这些节点通常是相邻栅格单元不相同的属性值个数大于等于 3 的栅格处;
②从搜索出的节点里任选一个作为起始跟踪节点,顺着栅格单元属性值不同的两个栅格单元之间进行多边形边界弧段的跟踪,记录每一步跟踪的坐标,直到另一个节点为止;
③重复上述过程,做到所有的边界弧段都被生成;
④将跟踪得到的弧段数据连接组织成多边形,即完成多边形栅格数据的矢量化。
三、多元空间数据的融合
1.遥感与GIS 数据的融合
遥感与GIS数据的融合有利于增强多重数据的复合能力,改善遥感信息提取的及时性和可靠性,便于利用遥感影像辅助GIS空间数据的获取与更新,有效地提高各类数据的使用率。遥感与GIS数据的融合的方法主要表现为遥感影像与数字线画图(DLG)的融合、遥感影像与数字地形模型(DEM)的融合及遥感影像与数字栅格图(DRG)的融合这三种形式。
2.不同格式数据的融合
不同格式数据的融合主要有基于转换器的数据融合、基于数据标准的数据融合、基于公共接口的数据融合、基于直接访问的数据融合这几种方法:。
四、空间数据的压缩与重分类
1.空间数据的压缩
(1)数据压缩的概念
空间数据压缩,即从空间坐标数据集合中抽取一个子集,使这个子集在规定的精度范围内最好地逼近原集合,而又取得尽可能大的压缩比,乐缩比表示信息载体减少的程度。
(2)数据压缩的必要性
空间数据往往具有巨大的数据量,不采取数据压缩技术,整个系统在存储空间和处理时间上都将承受巨大的压力。随着处理空间数据的比例尺发生变化,同样也存在数据压缩的需要。
(3)基于矢量的压缩
基干矢量的压缩通常是对线状实体上占的数量的压缩。其中最常用的是道格拉斯一佩克算法,该算法的原理
是:
①拟定一个阈值,然后生成一条连接折线首尾节点的直线段,并计算原始折线上的点到直线段的垂直距离。
②假如所有折线上的点到直线段的距离都小于预先设定的阈值,这条直线段就被用来代替原来的那条折线。
③假如有些点的距离大干阈值,距离最远的那一点保留,并将原折线分成两段。对两段折线重复上述过程,最后保留下来的点就是经过数据压缩的折线。
(3)基于栅格的压缩
栅格数据的压缩可以采用游程编码和四叉树编码等方法。
2.空间数据的重分类
当需要进行特定的数据分析时,常常需要先对从数据库中提取的数据作属性的重新分类和空间图形的化简,以构成数据新的使用形式。经过属性的重新分类,相邻的多边形可能具有相同的某一属性,因此,在空间几何图形上,这些多边形的共同边界需要删除。这些多边形之间界限的删除,可以先将相邻多边形分解为边界弧段,删去其中相同的弧段,然后重新组合弧段形成新的多边形。
五、空间数据的内插方法
1.空间数据内插的概念
通过已知点或多边形分区的数据,推求任意点或多边形分区数据的方法称为空间数据的内插。根据已知占和已知多边形分区数据的不同,将空间数据内插分为点的内插和多边形分区的内插。
2.点的内插
点的内插是用来建立具有连续变化特征现象的数值方法。建立数字高程模型的点的内插方法可以分为表3-2所示的几个类型。其建立一般包括数据取样、数据内插和数据精度分析等步骤。

(1)数据取样
数据取样可以先从现有地形图的等高线上进行。当按一定间隔的格网取样时,取一个二次曲线来代表地面相应部分的曲线,而用间隔中点的线性内插值与二次曲线内插值所得的断面高程的差异来判断格网密度是否恰当。高程差异的数值要在数字高程模刑精度要求的限度之内,否则要缩短格网间距。对地形变化显著的地方,要辅以地形特征点位数据点,以提高数据点控制地面形态特征的能力。
(2)数据内插
插值运算是要选择一个合理的数学模刑,利用已知点的数据求出插值函数的待定系数。它通常采用局部分块内插法和逐点内插法两种方式。
①分块内插法
分块内插法是把整个内插空间划成若干分块,并对各分块求出各自的曲面函数来刻画曲面形态。分块内插法分为线性内插法、双线性多项式内插法和二元样条函数内插法等方法。
a.线性内插法
线性内插法将已知数据点连成三角网的形式,利用三个已知数据点确定三角形形成的空间平面,进而求出内插点在平面中的高程值;
b.双线性多项式内插法
双线性多项式内插点是在已知数据点规律分布时,使用最靠近内插点的四个已知数据点组成一个四边形,确定内插点的高程;
c.二元样条函数内插法
二元样条函数内插法是在分块插值区用双三次多项式模拟地表面,测定高程
②逐点内插法
逐点内插法则是以插值点为中心,定义一个局部函数去拟合周围的数据点,数据点的范围随插值点位置的变化而变化。逐点内插法分为移动拟合法、加权平均法和克里金法。
a.移动拟合法
移动拟合法是指对每一个待插值点用一个多项式曲面拟合改点附近的表面,进而计算出该点的高程。取待插值点P为圆心,R为半径的圆(称为搜索圆)内各数据点来计算多项式的待定系数,需要考虑采用多大面积范围内的数据点来计算待插值点的数值及选择多少数据点参加计算两个问题,为此采用动态搜索圆的方法,其计算搜索圆的半径R的公式为:

b.加权平均法
加权搜索法是移动拟合法的特例,在使用搜索圆寻找附近数据点的方法上和移动拟合法相同,但它在计算数据点的高程时,使用加权平均值代替误差方程求解出的曲面函数。定权时,由于考虑到不同的数据点相对于待插值点的距离不同,对待招值点的高程影响程度不同,一般采用反比距离加权。
c.克里金法
克里金方法是基于被插值的某要素可以被当做一个区域化的变量来看待的假设,所谓区域化的变量就是介于完全随机的变量和完全确定的变量之间的一种变量,彼此离得近的点之间有某种程度上的空间相关性,而相隔比较远的点之间在统计上看是相互独立无关的。克里金法即建立在一个预先定义的协方差模型的基础上通过线性回归方法把估计值的方差最小化的一种插值方法。
(3)数据精度分析
数据精度分析是为了有效地判定空间内插结果的精度是否符合实际的要求。根据高程数据精度的评价标准,其允许误差应小于原始数据比例尺笔高距的1/3。若符合该条件,即认为所建立的数字高程模型满足精度要求,可以作为数字地形模型分析的依据。
3.区域的内插
(1)区域的内插的概念
区域的内播是根据一组多边形分区的己知数据来推求同一地区另一组多边形分区未知数据的内插方法。设一组已知数据的分区称为源区,需要内插的另一组分区称为目标区,则根据源区的数据来推求目标区的数据。
(2)区域的内插的方法。
①叠置法
叠置法是将目标区叠置在源区上,首先确定两者面积的交集a然后利用下式算出目标区各个分区t的内插值

式中:t为目标区各个分区的序号;
s 为源区各个分区的序号;
u为分区s的已知统计数据;
as为t区与s区相交的面积;
o为s区的面积。
②比重法
比重法是根据平滑密度函数的原理,将源区的统计数据从同性质改变为非同性质,而非同性质代表着一般社会经济现象的普遍特点。比重法的内插算法过程包括:
a.在源区上叠置一张网格,网格尺寸的大小应保证具有足够的内插精度; b.将源区各个分区的平均人口数赋予相应分区的各个格网点;
c.按公式Z=(Z1+Z1+Z+Z)/4计算相邻的四个格网点的平均值;
d.将各个分区的格网占值相加,设为U’计算其系数n=11/U’并将各个格网点值乘以P,得到调整后的各个分区的格网点值:
e.此过程继续下去,直到U’与U的值很相近,或者相应分区的格网点值比较一致时,便可计算目标区的内插值。
六、空间拓扑关系的编辑
拓扑数据结构最重要的特征是具有拓扑编辑的功能,拓扑编辑功能包括多边形连接编辑和节点连接编辑。
1.多边形连接编辑
对多边形P进行编辑时,算法过程为:
(1) 从弧段文件中,找出与当前编辑的多边形p相关的所有记录:
(2) 在找出的记录中,检查当前编辑的多边形P所处的位置;
(3)从经过代码位置转换的记录中,任取一个起始节点作为起点,顺序连接各个节点,必要时可对记录的前后顺序作调整,使得连接的节点能自行封闭,即N→N→N一N
注意,如果依照上述顺序连接的节点不能自行闭合,或者出现记录缺损或记录多金等情况,则表示弧段文件有错,必须改正后才能进行连接编辑。
2.节点连接编辑
对节点N进行编辑时,算法过程为:
(1)从弧段文件中,找出与当前编辑的节点N.相关的所有记录:
(2)在找出的记录中,检查当前编辑的节点N:所在的位置:如果N处在起始节点位置,将之与处于终止节点位置的节点号相交换,同时也将该记录的多边形号位置作相应的交换;反之,如果当前编辑的节点N处于终止节点位置,则该记录的所有数据项顺序不做改变;
(3)从经过代码位置转换的记录中,任取一个左多边形作为起点,顺序连接各个多边形,同样,必要时可对记录的前后顺序作调整,使得连接的多边形能首尾呼应,即:P→P;→PP。
注意,如果依照上述顺序连接的多边形不能首尾呼应,或者出现记录缺损或记录多余等情况,同样也表示弧段文件有错,必须改正出错的记录。直到所有节点都经过编辑和改正,才能将该弧段文件用于数据库的建立。

如果文章对你有帮助的话,也请你帮我2个忙吧 (*╹▽╹*)
给这篇文章一键三连吧,对我很重要啦~
关注一下我 @新中地职业培训学校,听说现在关注的,以后都是尊贵的老粉啦!
获取更多GIS开发相关课程资源V:gis0329