学习笔记:多元线性回归 MLR
今天从论文中看到一个multivariate regression (MLR) 多元线性回归的方法,在地下水影响因素中做了MLR
什么是多元线性回归 (MLR)?
多元线性回归 (MLR),也称为多元回归,是一种使用多个解释变量来预测响应变量结果的统计技术。多元线性回归的目标是对解释(自变量)变量和响应(因)变量之间的线性关系进行建模。从本质上讲,多元回归是普通最小二乘 (OLS) 回归的扩展,因为它涉及多个解释变量。
多元线性回归的公式和计算


多元线性回归告诉了我们什么
简单线性回归是一种函数,它允许分析师或统计学家根据有关另一个变量的已知信息对一个变量进行预测。线性回归仅在具有两个连续变量(自变量和因变量)时使用。自变量是用于计算因变量或结果的参数。多元回归模型扩展到多个解释变量。
多元回归模型基于以下假设:
因变量和自变量之间存在线性关系
自变量之间的相关性不太高
yi观测值是从总体中独立随机选择的
残差应呈正态分布,均值为 0,方差σ
决定系数(R 平方)是一个统计指标,用于衡量结果变异中有多少可以用自变量的变异来解释。R2总是随着向 MLR 模型添加的预测变量越多而增加,即使预测变量可能与结果变量无关。
因此,R2本身不能用于识别哪些预测变量应包含在模型中,哪些预测变量应被排除。R2只能介于 0 和 1 之间,其中 0 表示任何自变量都无法预测结果,1 表示可以在没有自变量误差的情况下预测结果。
在解释多元回归的结果时,β系数在保持所有其他变量不变的情况下是有效的(“所有其他条件都相等”)。多元回归的输出可以水平显示为方程,也可以垂直显示为表格形式。
如何使用多元线性回归的示例
例如,分析师可能想知道市场走势如何影响(XOM)的价格。在这种情况下,他们的线性方程将以标准普尔500指数的值作为自变量或预测因子,将XOM的价格作为因变量。
实际上,多个因素预测事件的结果。例如,一个物品的价格走势不仅仅取决于整个市场的表现。其他预测因素,如石油价格、利率和石油期货的价格走势,可能会影响 XOM 的价格和其他石油公司的股价。为了理解存在两个以上变量的关系,使用了多元线性回归。
多元线性回归 (MLR) 用于确定多个随机变量之间的数学关系。换句话说,MLR 检查多个自变量如何与一个因变量相关。一旦确定每个自因子来预测因变量,就可以使用有关多个变量的信息来创建对它们对结果变量的影响水平的准确预测。该模型以直线(线性)的形式创建关系,该关系最接近所有单个数据点。
参考上面的 MLR 方程,在我们的示例中:
yi = 因变量 - XOM 的价格
xi1= 利率
xi2= 油价
xi3= 标准普尔500指数的价值
xi4= 石油期货价格
B0= 时间零处的 y 截距
B1=回归系数,用于测量 xi1变化时因变量的单位变化 - 利率变化时 XOM 价格的变化
B2= 系数值,用于测量 xi2变化时因变量的单位变化 - 油价变化时 XOM 价格的变化
最小二乘估计 - B0、B1、B2...Bp—通常由统计软件计算。回归模型中可以包含尽可能多的变量,其中每个自变量都用一个数字 - 1,2,3,4...p进行区分。多元回归模型允许分析人员根据提供的多个解释变量的信息预测结果。
尽管如此,该模型并不总是完全准确的,因为每个数据点可能与模型预测的结果略有不同。残值E是实际结果和预测结果之间的差值,包含在模型中以解释这种细微变化。
假设我们通过统计计算软件运行 XOM 价格回归模型,返回以下输出:
分析师将这一产出解释为,如果其他变量保持不变,如果市场上的石油价格上涨 1%,XOM 的价格将上涨 7.8%。该模型还显示,在利率上升1%之后,XOM的价格将下降1.5%。R2表示,埃克森美孚股价变动的86.5%可以用利率、油价、石油期货和标准普尔500指数的变化来解释。
线性回归和多元回归的区别
普通线性平方 (OLS) 回归比较因变量在某些解释变量发生变化的情况下的响应。但是,因变量很少只能用一个变量来解释。在这种情况下,分析师使用多元回归,尝试使用多个自变量来解释因变量。多元回归可以是线性的,也可以是非线性的。
多元回归基于因变量和自变量之间存在线性关系的假设。它还假设自变量之间没有主要相关性。
是什么使多元回归倍数?
多元回归考虑多个解释变量对某些感兴趣的结果的影响。它评估当模型中的所有其他变量保持常量时,这些解释变量或自变量对因变量的相对影响。
为什么使用多元回归而不是简单的 OLS 回归?
因变量很少只用一个变量来解释。在这种情况下,分析师使用多元回归,尝试使用多个自变量来解释因变量。但是,该模型假设自变量之间没有主要相关性。
我可以手动进行多元回归吗?
这不太可能,因为多元回归模型很复杂,当模型中包含更多变量或要分析的数据量增加时,多元回归模型会变得更加复杂。要运行多元回归,您可能需要在 Excel 等程序中使用专门的统计软件或函数。
多元回归是线性的是什么意思?
在多元线性回归中,模型计算最佳拟合线,以最小化所包含的每个变量的方差,因为它与因变量相关。因为它适合一条线,所以它是一个线性模型。还有涉及多个变量的非线性回归模型,例如逻辑回归、二次回归和概率模型。
多元回归模型如何在金融中使用?
任何查看多个变量的计量经济学模型都可能是多个变量。因子模型比较两个或多个因子,以分析变量与结果性能之间的关系。Fama 和 French Three-Factor Mod就是这样一个模型,它通过在 CAPM 中的市场风险因素中添加规模风险和价值风险因素(它本身就是一个回归模型)来扩展资本资产定价模型 (CAPM)。通过包括这两个额外的因素,该模型针对这种表现优异的趋势进行了调整,这被认为使其成为评估经理绩效的更好工具。

总说,个人理解就是建立一个多元函数!