欢迎光临散文网 会员登陆 & 注册

RegEM程序包的使用注意事项

2023-07-02 12:37 作者:我是水怪的哥  | 我要投稿

由于GNSS观测时受到接收机故障或者环境因素的干扰会使得在数据解算中出现异常,导致获得的GNSS时间序列出现缺失。若缺失数据比例过大,则在时间域上对坐标序列建模时必然影响参数(尤其是测站速度)估计的精度;而在频率域上对其进行谱分析时,则会导致混频现象。因此,在对GPS时间序列进行分析之前,必须要进行数据预处理,其中一个非常重要的过程就是插值,通过对缺失数据插补以获得均匀采样的时间序列 (Griffiths and Ray, 2015)。本文使用气象学中广泛使用的方法调整最大似然法(Regularized EM algorithm, RegEM)用于插值缺失的数据。该方法最早由Schneider (2001)提出,该方法以岭回归方法实现回归正则化及参数估计,利用交叉检验实现给定精度的时空矩阵插值。

程序包可以在github下载:https://github.com/tapios/RegEM

程序的输入:2-D数组,其中行为观测时段,列为站点。而且缺失数据需要用NaN替代,具体数据格式如下:

而且同一行不能全是NaN,即出现如下的情况:

本人设置的程序基本输入格式

由于我们读取的GNSS代码缺失数据,其观测时间不是连续的,这意味着在绘制的时间序列上是没有办法看出缺失值的,我们需要将时间均一化。

下面我提供一个可以计算每日时间采样的程序:

输入起始的年和结束的年,即可得到每日采样的时间序列。比如为2006-2020,得到的时间序列为:

接着将对应时间采样的数据赋值到均匀采样的时间序列中,不对应的数据赋值为NaN。接着就可以作为RegEM的输入数据。


RegEM程序包的使用注意事项的评论 (共 条)

分享到微博请遵守国家法律