欢迎光临散文网 会员登陆 & 注册

空间内插方法分类

2023-06-18 08:50 作者:仿真资料吧  | 我要投稿

1.1 空间内插方法比较

论文链接:空间内插方法比较 - 百度文库 (baidu.com)

(1)空间内插目标:

ü 缺值估计:估计某一点缺失的观测数据以提高数据密度;

ü 内插等值线:以等值线的形式直观地显示数据的空间分布;

ü 数据格网化:把无规则分布的空间数据内插为规则分布的空间数据集,如规则矩形格网、三角网等。

(2)相关方法介绍如下

1.1.1 几何方法

是最简单的空间内插方法。几何方法基于“地理学第一定律”的基本假设,即邻近的区域比距离远的区域更相似。

优点:是计算开销少,具有普适性,不需要根据数据的特点对方法加以调整。当样本数据的密度足够大时,几何方法一般能达到满意的精度。

问题是:无法对误差进行理论估计。最常用的几何方法有泰森多边形(最近距离法)和反距离加权方法。

(1)泰森多边(最近距离法)

泰森多边形用于生成“领地”或控制区域。实际上,尽管泰森多边形产生于气候学领域,它却特别适合于专题数据的内插,因为它生成专题与专题之间明显的边界,不会有不同级别之间的中间现象。

泰森多边形的算法:未采样点的值等于与它距离最近的采样点的值。

(2)反距离加权方法

反距离加权法是最常用的空间内插方法之一。它认为与未采样点距离最近的若千个点对未采样点值的贡献最大,其贡献与距离成反比。


1.1.2 统计方法

常用方法:趋势面、多元回归方法;

其基本假设是,一系列空间数据相互相关,预测值的趋势和周期是与它相关的其它变量的函数。

统计方法的优点是计算开销不大,有一定的理论基础,能够对误差作出整体上的估计。但是,数据采样的时候要注意,如果采样过程不能反映出表面变化的重要因素,如周期性和趋势,则内插一定不能取得好的效果上。

1.1.2.1 趋势面

趋势面法可通过全局多项式插值法将由数学函数(多项式)定义的平滑表面与输入采样点进行拟合。趋势表面会逐渐变化,并捕捉数据中的粗尺度模式。

在概念上,趋势插值法类似于取一张纸将其插入各凸起点之间(凸起到一定高度)。下图展示的是从平缓山丘采集而来的一组高程采样点。使用的纸张为洋红色。

                   

平整的纸张无法完全覆盖包含山谷的地表。但如果将纸张略微弯曲,覆盖效果将会好一些。为数学公式添加一个项也可以达到类似的效果,即平面的弯曲。平面(纸张无弯曲)是一个一阶多项式(线性)。二阶多项式(二次)允许一次弯曲,三阶多项式(三次)允许两次弯曲,依此类推。使用此工具最多允许12次弯曲(十二阶多项式)。下图在概念上展示出一个与山谷拟合的二阶多项式。

 

纸张几乎无法穿过各实际测量点,从而使趋势插值法成为不精确的插值器。有些测量点位于纸张上方,而其他点则位于纸张下方。但是,如果将测量点高出纸张的距离相加,并将测量点低于纸张的距离也相加,得到的这两个和值应该相近。以洋红色表示的表面是通过最小二乘回归拟合得到的结果。该生成表面将使凸起点与纸张之间的平方差最小化。


1.1.2.2 多元回归

在各种统计方法中,使用较多的是回归分析,其特点是不需要分布的先验知识(不需要知道分布趋势是啥)多元回归在数学形式上与趋势面很相似,但是它们又有着显著的不同。

在趋势面方法中,模型的拟合严格地遵从自常数、一次、二次、立方等的顺序,主要的问题是确定模型的次数,因此,趋势面分析有内在的多重共线性问题:

而在多元回归中,尽管也存在多重共线性,但它并非内在的,可以通过逐步回归解决,因此,相对于趋势面的选择次数,多元回归的核心问题是选择变量主成分分析等方法有助于选择变量和区分模型。


1.1.3 空间统计方法

空间统计方法以Kriging及其各种变种(Cokriging等)为代表,其基本假设是建立在空间相关的先验模型之上的。

先验分布(知识):根据一般的经验认为随机变量应该满足的分布。先验分布是你瞎猜参数服从啥分布。

假定空间随机变量具有二阶平稳(一阶矩是均值,二阶中心距是方差),或者是服从空间统计的本征假设。

则它具有这样的性质:距离较近的采样点比距离远的采样点更相似,相似的程度、或空间协方差(在概率论和统计学中,协方差是一种两个变量如何相关变化的度量,而协方差函数或核函数,描述一个随机过程或随机场中的空间上的协方差)的大小,是通过点对的平均方差度量的。

空间统计内插的最大优点:是以空间统计学作为其坚实的理论基础,可以克服内插中误差难以分析的问题,能够对误差做出逐点的理论估计;它也不会产生回归分析的边界效应(一般来说,边界是众多信息汇聚的地方,它具有异质性,是变化的所在,容易产生特殊的现象,受到人们的关注,这就是通常所说的边界效应)。

缺点:复杂,计算量大,尤其是变异函数(变异函数是方差除以距离的函数)是几个标准变异函数模型的组合时,计算量很大;另一个缺点是变异函数需要根据经验人为选定。

1.1.3.1 Kriging

Kriging模型是一种通过已知试验点信息来预测未知试验点上响应的无偏估计模型,无偏估计是用样本统计量来估计总体参数时的一种无偏推断。估计量的数学期望等于被估计参数的真实值,则称此估计量为被估计参数的无偏估计,即具有无偏性,是一种用于评价估计量优良性的准则。

内插的第一步是根据样本找到适合的变异函数理论模型。最常用的变异函数模型有:nugget、球面、指数、高斯、阻尼正弦、幂和线形模型其中,前几种模型在一定的范围内达到极大方差,而线形模型的方差增长没有极限。

变异函数的形式是内插质量的关键。需要注意的是,由于不同的区域有不同的空间模式,因而也就有不同的变异函数。而空间内插都有一个隐含的假定,即空间是连续的,因此,在选择变异函数模型之前,检查数据以确定空间连续性是十分必要的。

1.1.3.2 Cokriging

内插的基本原理与Kriging相同,但它通过考虑一个以上变量而优化估计;内插由于考虑了变量之间的关系而得到改善。

Cokriging内插包括以下过程:

1、确定多个观测值之间空间相关的特征;

2、借助于变异函数和交叉变异函数(cross variogram),对相关建模;

3、利用这些函数估计内插值。

1.1.4 函数方法

傅里叶级数、样条函数、双线性内插、立方卷积法等。

是使用函数逼近曲面的一种方法。函数方法在空间内插领域大多用于一些特殊场合,如利用高密度的高程数据产生等高线、为提高格网数据的空间分辨率而内插数据等。对于利用有限的观测数据进行缺值预测和内插格网,函数方法多不适合,因为它难以满足内插的精度,也难以估计误差。

函数方法的特点:不需要对空间结构的预先估计、不需要做统计假设。

缺点:难以对误差进行估计,点稀时效果不好。

1.1.4.1 傅里叶级数

适合周期性数据序列。

1.1.4.2 样条函数

适合于非常平滑的表面,一般要求有连续的一阶和二阶导数:它适合于根据很密的点内插等值线,特别是从不规则三角网(TIN)内插等值线。样条函数的缺点是难以对误差进行估计,点稀时效果不好。

样条函数的种类很多,最常用的有B样条、张力样条1和薄盘样条等。

1.1.4.3 双线性内插

双线性内插法是使用邻近4个点的像元值,按照其距内插点的距离赋予不同的权重,进行线性内插。该方法具有平均化的低通滤波效果,边缘受到平滑作用,而产生一个比较连贯的输出图像,其缺点是破坏了原来的像元值,在后来的波谱识别分类分析中,会引起一些问题。

双线性内插和立方卷积法都主要用于网格数据的内插,一般很少用于根据离散数据内插空间分布。它使用与待估计网格距离最近的4个网格值,线性内插获得新的网格值。

双线性内插方法的优点:数据重采样后的结果较为平滑,没有阶跃效应,同时具有较高的精度。

缺点:网格被平均化低频滤波的效果;边缘被平滑,有些极值丢失了。

1.1.4.4 立方卷积法

立方卷积插值又叫双三次插值,是对双线性插值的改进,是一种较为复杂的插值方式,它不仅考虑到周围四个直接相邻像素点灰度值的影响,还考虑到它们灰度值变化率的影响,此法利用待采样点附近16个像素点的灰度值作三次插值进行计算,还用到三次多项式S(w)。

优点:采样结果的统计信息(均值和方差)与原数据的相似程度比其他采样方法高。

缺点:数据值被改变,显著改变了网格尺寸。

1.1.5 随机模拟方法

随机模拟是指把某一现实的或抽象的系统的某种特征或部分状态,用另一系统(称为模拟模型)来代替或模拟。为了解决某问题,把它变成一个概率模型的求解问题,然后产生符合模型的大量随机数,对产生的随机数进行分析从而求解问题,这种方法叫做随机模拟方法。

常用的随机模拟方法有高斯过程、马尔科夫过程、蒙特卡罗方法、人工神经网络方法等。

其基本假设与空间统计方法不同,随机模拟认为地理空间具有非平稳性(在空间分析中,观测数据一般按照给定的地理位置作为采样单元进行采样,随着地理位置的变化,变量间的关系或者结构会发生改变),是空间异质的。它通过空间分布现象的可选的、等概率的、数值表达来对空间不确定性建模。对应不确定性,可以接受可选的多个答案。与空间统计方法不同,随机模拟方法不是产生唯一的估计结果,它产生一系列可选的结果,它们都与实际数据一致,而且相关模型将它们联系起来。

(1)优点:定义了各种随机变量之间的空间相关,这类相关可以根据相邻数据把高度不确定性的先验分布更新为低不确定性的后验分布。

先验分布:这个对先验信息进行加工获得的分布今后称为先验分布。先验信息,即是抽样(试验)之前有关统计问题的一些信息。一般来说,先验信息来源于经验和历史资料。先验信息在日常生活和工作中是很重要的。

举例:一位常饮牛奶加茶的妇女声称,她能辨别先倒进杯子里的是茶还是牛奶。对此做了10次试验,她都正确地说出了。

(2)缺点:建模困难,计算量大。

1.1.5.1 蒙特卡罗方法

蒙特卡罗方法是一类基于概率的方法的统称,不是特指一种方法。

蒙特卡罗方法也成统计模拟方法,是指使用随机数(或者更常见的伪随机数)来解决很多计算问题的方法。他的工作原理就是两件事:不断抽样、逐渐逼近。


1.1.5.2 高斯过程回归

高斯过程是概率论和数理统计中随机过程的一种,是多元高斯分布的扩展,被应用于机器学习、信号处理等领域。

在概率论和统计学中,高斯过程(Gaussian process,GP)是观测值出现在一个连续域(例如时间和空间)的随机过程。在高斯过程中,连续输入空间中每一点都是与一个正态分布的随机变量相关联。高斯过程的分布是所有(无限多个)随机变量的联合分布,或者说是多个正态分布的集合。正因如此,它是连续域(例如时间和空间)上的函数分布。

高斯分布(正态分布)是一个常见的连续概率分布。正态分布的数学期望值或期望值等于位置参数,决定了分布的位置。

一个均值函数和协方差函数可以定义一个高斯过程,并且一个高斯过程的有限维度的子集都服从一个多元高斯分布。

 

同时,高斯过程的协方差函数就是其核函数。605项目下图所示:

 

核函数是高斯过程的核心,它决定了一个高斯过程的性质。核函数在高斯过程中起衡量任意两个点之间的“距离”的作用。不同的核函数有不同的衡量方法,得到的高斯过程的性质也不一样。最常用的一个核函数为高斯核函数,也就是径向基函数RBF。

1.1.6 确定性模拟

假设变量的空间分布受物理定律控制,因此,可以使用物理模型或半经验、半物理的模型模拟空间分布。对于这一类内插,常常是使用有限的观测值获得一些必须的经验参数,再把这些参数代入到物理模型之中。

优点即它的确定性,它不依赖或很少依赖观测样本。但空间准确性有待商榷。


1.1.7 综合方法

是以上几种方法的综合,并分别用统计方法、谱函数、人工神经网络和随机过程建模描述相应的成分。

本文比较了主要的空间内插方法,分析了各种方法的假设、适用范围、算法和优缺点,并且重点介绍了空间统计方法。必须指出,对于众多的空间内插方法而言,没有绝对最优的空间内插方法,只有特定条件下的最优方法。因此,必须依据数据的内在特征,依据对数据的空间探索分析,经过反复实验选择最优的空间内插方法。同时,应对内插结果做严格的检验。


空间内插方法分类的评论 (共 条)

分享到微博请遵守国家法律