数学建模算法培训:偏最小二乘回归分析
原理请参考:司守奎 《数学建模算法与应用》,国防工业出版社,2015.9.
培训内容:
MATLAB面向对象设计的思路
数据的存储与提取
矩阵的运算
原理到算法的设计思想
辩证看待,存在不足之处,多反思。打字和公式不易,此处多省略。
测试案例:
例1:假设随机生成回归方程系数,根据自变量组数据X生成因变量组数据Y,并对Y添加噪声。
由于随机生成系数和多变量组拟合数据,故存在一定的随机性。结果:
从R2可知,自变量组对因变量组拟合效果非常好。如果不对Y添加噪声,则R2均为1,求解的回归系数original_coeff与随机生成的初始系数c1是一致的。本例随机化系数c1为
算法得到的回归方程系数为
可视化,如图1所示。在这个预测图上,如果所有点都能在图的对角线附近均匀分布,则方程的拟合值与原值差异很小,这个方程的拟合效果就是满意的。图1可见所有点基本上在一条线上,拟合效果非常好。

例2. Linnerud数据,X为身体特征指标,Y为训练指标,数据如下表所示:

程序执行及其结果如下
其中自变量对跳高y3拟合效果很差,弯曲y2拟合效果最好。可视化效果如图2所示:

例3. 下列数据是2个因变量和6个自变量。请用偏最小二乘回归建立方程组,并预测最后四个数的因变量值。

结果如下:
可视化效果如图3所示,自变量对y1的拟合效果要好于y2,其数值点基本在直线上下均匀分布。从R2也可以看出,其解释度为90.75%。
