11.12验证性因素分析--学习日志
一、验证与探索分析的比较
区别:
假设上:验证性因素分析
1、公共因素之间可以相关也可以无关
2、观测变量可以只受一个或几个公共因素的影响,而不受所有公共因素影响
3、特俗因素间可以相关,还可以出现不存在误差因素的观测变量
4、公共因素和特殊因素间相互独立(同)
5、观测变量与潜变量之间的关系事先假定
6、潜在变量的个数在数据分析之前确定
7、模型通常要求可识别
共同点
1、主要目的都是浓缩数据
2、都可以实现简化数据、降维的目的
3、均假设公共因素与特殊因素相互独立
4、前提均为观测变量之间存在一定的相关,且存在潜在结构
验证性因素分析:是协方差结构模型的特殊情况(测量模型部分)。是对已有的理论模型与数据拟合程度的一种验证,必须明确指明公共因素的个数、观测变量的个数、观测变量和公共因素之间的关系、观测变量和特殊因素之间的关系以及特殊因素之间的关系。
二、图示、模型及基本步骤
图示
使用路径图反映变量与潜在因素(潜变量)的关系。
定义潜变量、观测变量、因素载荷、因素之间的关系、误差项(p175)
模型
一般:一个观测变量只受一个公共因素的影响(p175)
一个观测变量同时受多个潜变量的影响—多质多法模型(MMMT)
基本步骤(p175)
三、模型的确定和识别
模型确定:
分析前,需要根据一定的理论假设,定义观测变量和潜变量之间的关系,潜变量之间的关系,以及误差项之间的关系。(注意:先考虑模型理论上的合理性)
确定模型时,分别考虑:1、存在多少个因素2、每个因素分别影响哪些观测变量3、如果有两个或多个因素,因素之间的关系如何4、特殊因素(或测量误差)之间的关系如何
注意:1、观测变量的单维性;交叉载荷缺乏结构效度2、误差项相关损害结构效度
模型识别:
定义:指判断模型参数是否有唯一解,即模型的协方差方程中自由估计的参数是否有唯一满足方程的值。分为不可识别(多个解)、恰好识别(唯一解)和超识别(可取不同值)三种情况。其中恰好识别、超识别统称可以识别。
条件:
1、必要条件:T准则
模型中自由参数的个数不能超过协方差矩阵的元素数。(模型自由度大于等于0,即元素数-参数个数大于等于0)
2、一般情况下的充分条件
三指标准则:一道题只测一个潜变量;一个因素至少有三个或以上的指标变量;测量误差之间相互独立
二指标准则:一道题只测一个潜变量;一个因素至少有两个或以上的指标变量;测量误差之间相互独立,至少有两个因素存在相关
3、复杂模型的充分条件(p180)
四、数据收集和参数估计
数据收集
1、测量的量尺:不需要再分析之前统一题目的量尺(可以直接处理这些包含不同记分点的数据)
2、设定潜变量量尺:
分析前固定潜变量量尺,两种方法:1、对每个潜变量,固定一条路径的因素载荷为1;
2、固定潜变量的方差为1.(通常还将特殊因素对观测变量的影响系数固定为1)
参数估计
方法:未加权最小二乘法(USL)、广义最小二乘法(GLS)、极大似然法(ML)、工具变量法、两阶段最小平方法、加权最小平方法,对角加权平方最小法和贝叶斯法。
极大似然法是验证性因素分析中最常用到的参数估计的方法。
但是极大似然法和广义最小二乘法都要求变量总体服从多元正态分布。
不符合时,用加权最小平方法。
注意:当模型能够识别,出现无法得到参数估计结果的情况——估计不能收敛
估计不能收敛:参数估计过程经过反复迭代之后,参数值的改变仍然大于预先设定的标准,无法得到最后参数估计的结果。
五、模型评价与修正
评价:对模型和数据间是否拟合进行评价。拟合指数:反映由实际数据衍生出来的样本期望协方差矩阵E与样本实际协方差矩阵S差异的一个总指标。
标准(标准的具体比较p185-186)
1、绝对拟合指数:比较观测的与期望的方差和协方差,即测量绝对的模型拟合
1)拟合优度卡方统计量:一般希望不显著,表明模型与数据的差异不显著,从而接受定义的模型(p>0.5)
2)拟合优度指数和调整的拟合优度指数:GFI/AGFI p>0.9
3)近似误差均方根:RMSEA<0.05,且CI上限<0.08,p>0.05拟合较好
2、相对拟合指数:比较一个模型与另一个模型的相对拟合情况
1)比较拟合指数(CFI)、递增拟合指数(IFI)、标准拟合指数(NFI)、非标准拟合指数(TLI/NNFI)
>0.9,表示拟合较好
2)信息标准指数:AIC,CAIC,ECVI数值越小越好,但具体多小却没有标准
3)比较具有嵌套关系的两个模型,来决定哪个更优。
嵌套关系:两个模型中,其中一个模型是在另一个模型基础上加上一定的限制得到,一个模型自由度是另一个模型自由度的子集。具体用似然比检验,进行两模型拟合程度的差异性检验,如果差异显著,则说明加入限定的模型拟合明显变差。
注意:所有参数估计应该得到合理的解释,在合理取值范围
其次,应该考虑等价模型,选取简单的模型
最主要,应该是从理论上对模型加以合理的解释。
评价一个模型时,必须检查多个拟合指数。
采用极大似然法进行估计时,NFI/TLI具有较好稳定性。
模型修正
模型选取遵循省俭原则:两个模型同样吻合时,选简单的一个。
模型修正可以根据因素载荷值的大小,考虑删除载荷小的题目;考察有交叉载荷的题目,考虑删除,结合修正指数进行模型修改。
修正指数:(Mplus提供)当大于4时,通常认为在模型中自由估计该路径能够显著提高模型的拟合程度。(当样本量增大时,修正指数会偏大。
嵌套模型比较
嵌套模型:模型B估计参数少于模型A,且模型B的所有自由参数时模型A内同类参数的一部分,就称模型B嵌套与模型A。在路径图中,模型B的路径图可以通过模型A的路径图去掉部分得到。嵌套模型的拟合可以做统计检验比较。
B进行了更多参数限定,其卡方值和自由度一定比A大。
如果B的卡方值显著增大,则说明限定条件不成立,拒绝模型B中参数限定;反之,B限定条件成立。(一般适用于基于极大似然估计得到的模型拟合的卡方值)
六、应用
效度检验
1结构效度:通过数据与理论假设模型之间的吻合程度表示以表示测验结构效度的高低。
一般来说,还要考察因素载荷,标准化的因素载荷应高于0.5,理想下应高于0.7.
2区分效度:指不同潜变量之间存在区别的程度,如果潜变量的区分效度高,则说明这个潜变量是独特的,包含了其他变量不能测量的东西。
两种方式
1)将两个本来有相关的潜变量合并为一个,然后使用这个新的模型来拟合数据,与原模型比较拟合度,如果原模型显著高于新模型,则不能合并。
2)计算两个因素各自的平均变异解释比例,并分别与两个因素的标准化相关系数的平方根比较。如果平均变异解释比例高于标准化相关系数平法,则具有较好区分度。
信度检验
信度:可以的定义为公共因素与观测变量相关的平方,他表示一个观测变量的总方差中,能够由公共因素解释的方差的比例。(还有测量误差、系统误差,所以得到的信度往往时新都估计的下限)
计算构想信度:等于潜变量的所有观测变量的标准化载荷平方除以它与误差方差的和。应大于0.6
等价性检验
在量表测量时,当观测变量和潜在特质之间的关系在相比较的各个组之间等同时,就称该量表具备测量等价性(p189)

