MATLAB实现偏最小二乘回归PLS
偏最小二乘回归分析
偏最小二乘回归是回归分析方法的一种,其可以进行多对多线性回归建模,特别当两组变量的个数很多,且都存在多重相关性,而观测数据的数量(样本量)又较少时,用偏最小二乘回归建立的模型具有传统的经典回归分析等方法所没有的优点。
偏最小二乘回归分析在建模过程中集中了主成分分析、典型相关分析和线性回归分析方法的特点,因此在分析结果中,除了可以提供一个更为合理的回归模型外,还可以同时完成一些类似于主成分分析和典型相关分析的研究内容,提供一些更丰富、深入的信息。
2、基于目标优化的PLS模型的计算
2.1 PLS的准则函数
准则函数通俗的讲就是提取主元时所按照的准则,与PCA不同,PLS在提取主元时考虑的不仅是能最大程度概括自变量空间的数据信息,还应该考虑自变量主元对于因变量变化的解释作用。因此J.Hinkle提出的新的残差平方和指标:

下面就是对这个式子的各种变换,具体推导过程比较复杂,但最终这个式子就等价于,
确定权值向量wi和ci使满足:


代码实现
将以下数据保存到txt文件中,命名为pz.txt,作为分析的对象。
191 36 50 5 162 60
189 37 52 2 110 60
193 38 58 12 101 101
162 35 62 12 105 37
189 35 46 13 155 58
182 36 56 4 101 42
211 38 56 8 101 38
167 34 60 6 125 40
176 31 74 15 200 40
154 33 56 17 251 250
169 34 50 17 120 38
166 33 52 13 210 115
154 34 64 14 215 105
247 46 50 1 50 50
193 36 46 6 70 31
202 37 62 12 210 120
176 37 54 4 60 25
157 32 52 11 230 80
156 33 54 15 225 73
138 33 68 2 110 43

