欢迎光临散文网 会员登陆 & 注册

拓端tecdat|R语言基于Bootstrap的线性回归预测置信区间估计方法

2021-07-18 14:15 作者:拓端tecdat  | 我要投稿

原文链接:http://tecdat.cn/?p=21625 

原文出处:拓端数据部落公众号

我们知道参数的置信区间的计算,这些都服从一定的分布(t分布、正态分布),因此在标准误前乘以相应的t分值或Z分值。但如果我们找不到合适的分布时,就无法计算置信区间了吗?幸运的是,有一种方法几乎可以用于计算各种参数的置信区间,这就是BootsTRAP 法。

本文使用BOOTSTRAP来获得预测的置信区间。我们将在线性回归基础上讨论。

这是一个单点预测。当我们想给预测一个置信区间时,预测的置信区间取决于参数估计误差。

预测置信区间

让我们从预测的置信区间开始

蓝色值是通过在我们的观测数据库中重新取样获得的可能预测值。值得注意的是,在残差正态性假设下(回归线的斜率和常数估计值),置信区间(90%)如下所示:

在这里,我们可以比较500个生成数据集上的值分布,并将经验分位数与正态假设下的分位数进行比较,

可以看出,经验分位数与正态假设下的分位数是可以比较的。

感兴趣变量的可能值

现在让我们看看另一种类型的置信区间,关于感兴趣变量的可能值。这一次,除了提取新样本和计算预测外,我们还将在每次绘制时添加噪声,以获得可能的值。

在这里,我们可以(首先以图形方式)比较通过重新取样获得的值和在正态假设下获得的值,

数值上给出了以下比较

这一次,右侧有轻微的不对称。显然,我们不能假设高斯残差,因为有更大的正值,而不是负值。考虑到数据的性质,这是有意义的(制动距离不能是负数)。

然后开始讨论在供应中使用回归模型。为了获得具有独立性,有人认为必须使用增量付款的数据,而不是累计付款。

可以创建一个数据库,解释变量是行和列。

然后,我们可以从基于对数增量付款数据的回归模型开始,该模型基于对数正态模型

这与链式梯度法的结果略有不同,但仍然具有可比性。我们也可以尝试泊松回归(用对数链接)

预测结果与链式梯度法得到的估计值吻合。克劳斯·施密特(Klaus Schmidt)和安吉拉·温什(Angela Wünsche)于1998年在链式梯度法、边际和最大似然估计中建立了与最小偏差方法的联系。

最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标


拓端tecdat|R语言基于Bootstrap的线性回归预测置信区间估计方法的评论 (共 条)

分享到微博请遵守国家法律