机器学习经典算法:时间序列ARIMA模型

平稳性:要求序列的均值和方差不发生明显变化。
分为严平稳(白噪声)和弱平稳,一般要求达到弱平稳。即期望与相关系数(依赖性)不变:未来某时刻的t值Xt就要依赖于它的过去信息,所以需要依赖性。
方法:差分法-时间序列在t与t-1时刻的差值(差分阶数越高一般越平稳,最多二阶)
ARIMA模型
自回归模型AR:描述当前值与历史值之间的关系,必须满足平稳性、自相关性(自相关系数<0.5则不宜采用)。

移动平均模型(MA):关注AR中的误差项的累加。

自回归移动平均模型(ARMA):AR与MA结合。

其中,p(AR的阶数) q(MA的阶数)都需指定。
ARIMA(p,d,q):


如何确定p q值
自相关函数ACF

Pk的取值范围[-1,1]
偏自相关函数PACF


ARIMA建模流程:
一、将序列平稳(差分法确定d)
二、p和q阶数确定:ACF与PACF
三、调用模型ARIMA(p,d,q)
参数选择
模型评估的指标:选择最简单的模型
AIC赤池信息准则
BIC贝叶斯信息准则 越低越好
即k(模型参数个数)越小越好,L(极大似然估计)越大越好。
