拓端tecdat|R语言基于Bootstrap的线性回归预测置信区间估计方法

2021-07-18 14:15 作者:拓端tecdat 0人读过 | 我要投稿

原文链接：http://tecdat.cn/?p=21625

原文出处：拓端数据部落公众号

我们知道参数的置信区间的计算，这些都服从一定的分布(t分布、正态分布），因此在标准误前乘以相应的t分值或Z分值。但如果我们找不到合适的分布时，就无法计算置信区间了吗？幸运的是，有一种方法几乎可以用于计算各种参数的置信区间，这就是BootsTRAP 法。

本文使用BOOTSTRAP来获得预测的置信区间。我们将在线性回归基础上讨论。

这是一个单点预测。当我们想给预测一个置信区间时，预测的置信区间取决于参数估计误差。

预测置信区间

让我们从预测的置信区间开始

蓝色值是通过在我们的观测数据库中重新取样获得的可能预测值。值得注意的是，在残差正态性假设下（回归线的斜率和常数估计值），置信区间（90%）如下所示：

在这里，我们可以比较500个生成数据集上的值分布，并将经验分位数与正态假设下的分位数进行比较，

可以看出，经验分位数与正态假设下的分位数是可以比较的。

感兴趣变量的可能值

现在让我们看看另一种类型的置信区间，关于感兴趣变量的可能值。这一次，除了提取新样本和计算预测外，我们还将在每次绘制时添加噪声，以获得可能的值。

在这里，我们可以（首先以图形方式）比较通过重新取样获得的值和在正态假设下获得的值，

数值上给出了以下比较

这一次，右侧有轻微的不对称。显然，我们不能假设高斯残差，因为有更大的正值，而不是负值。考虑到数据的性质，这是有意义的（制动距离不能是负数）。

然后开始讨论在供应中使用回归模型。为了获得具有独立性，有人认为必须使用增量付款的数据，而不是累计付款。

可以创建一个数据库，解释变量是行和列。

然后，我们可以从基于对数增量付款数据的回归模型开始，该模型基于对数正态模型

这与链式梯度法的结果略有不同，但仍然具有可比性。我们也可以尝试泊松回归（用对数链接）

预测结果与链式梯度法得到的估计值吻合。克劳斯·施密特（Klaus Schmidt）和安吉拉·温什（Angela Wünsche）于1998年在链式梯度法、边际和最大似然估计中建立了与最小偏差方法的联系。

最受欢迎的见解

1.R语言多元Logistic逻辑回归应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归（PLSR）和主成分回归（PCR）

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归，Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI，NRI指标

标签：

拓端tecdat|R语言基于Bootstrap的线性回归预测置信区间估计方法

原文链接：http://tecdat.cn/?p=21625

原文出处：拓端数据部落公众号

预测置信区间

感兴趣变量的可能值