结构方程模型在综合评价应用中的问题和对策

时间:2023-06-06 18:30:10 公文范文 来源:网友投稿

摘要:文章在总结近年来文献成果的基础上,通过分析两类结构方程模型的理论本质,指出了这两种方法在综合评价实践中的问题,并给出正确运用这两类方法进行综合评价的建议。文章认为,基于协方差分析的结构方程模型(CB-SEM)适用于评价多个指标的相关结构。而基于偏最小二乘的结构方程模型(PLSPM)适用于构建综合指数进行综合评价。

关键词:协方差分析;偏最小二乘;结构方程模型;综合评价

一、 引言

近年来,综合评价方法有了更多的发展。更为复杂的统计模型被引入到综合评价领域,其中,结构方程模型就是最近几年经常被用于综合评价的新方法之一。结构方程模型是潜变量模型与路径分析模型的结合,可以分析不能被直接观测的潜在概念间的关系,因而在社会学、心理学、教育学、市场研究等学科中有着独特优势。从参数估计的角度分,有两种类型,一种基于方差-协方差分析(CB-SEM),另一种基于偏最小二乘(PLSPM)。通过查阅近几年的文献发现,两类方法的综合评价研究都有不少成果。例如,前者的文献涉及的领域有:医学(刘享辉等,2009;刘岭等,2009),教育(周平红等,2011;王理峰,2012),管理(任飏等,2007;谷晓燕,2009),经济发展(高文杰和高旭,2010;张瑛和王惠文,2008),竞争力评价(易丽蓉,2006;罗玉波和王玉翠,2013)等等。后者涉及的领域有:医学(杨威和张拓红,2012),教育(孙继红等,2010),管理(莫一魁和沈旅欧,2009;鲜思东和彭作祥,2011;林盛,刘金兰和韩文秀,2005;关子明等2009,区晶莹等,2011),经济发展(阮敬和纪宏,2006)等等。可见,两类方法在综合评价应用的领域有很多交叉。并且,从目前的研究成果可以看出,两类方法进行综合评价的方式也基本类似,都通过设计指标体系,建立理论模型,然后计算综合指数得分实现综合评价。但是,从统计学方法论角度而言,这两类方法的除了目标都是路径模型之外,没有任何内容上的交叉(吴喜之,2013),因此模型的实质和解释都有很大差异。为此笔者认为,在综合评价实践中,两类方法不能用相似的方式应用,但是如何区分对待?目前为止,鲜有文献对此问题做出明确回答。本文将围绕该问题,结合结构方程模型理论要点和综合评价要求,分析如何正确使用这两类结构方程模型进行综合评价,并给出建议。

二、 两类结构方程模型的理论要点

虽然两类结构方程模型在理论上有差别,但是在实际建模中,都需要事先设计指标体系,设定理论模型,才能进行估计。指标体系和理论模型的设定由实际问题的理论背景支撑,模型的估计有现成的软件,例如CB-SEM的常用软件有AMOS,而PLSPM则有smartPLS等,因此,应用这两类方法正确与否的关键在于对模型估计的理解。为此我们分析两类结构方程模型参数估计的理论要点。

1. CB-SEM的参数估计。CB-SEM由结构模型和测量模型组成,分别刻画潜变量与潜变量之间的关系,潜变量与可测变量之间的关系。建模时,需要对可测变量划分为不同的组,每组对应一个潜变量,并且设定好潜变量与可测变量以及潜变量与潜变量之间的关系。关于模型的表达式参见易丹辉(2008)。关于模型的参数估计,有很多种方法,在实际应用中常见的估计方法为似然方法,其拟合函数为:

FML=ln|?撞(?兹)|+tr(S?撞-1(?兹))-ln|S|-(p+q)

这里的p和q分别为内生可测变量和外生可测变量的个数。还有一些其他方法,如未加权最小二乘,拟合函数为:

FULS=■tr[(S-?撞(?兹))2]

以及使得拟合函数

FGLS=■tr{[(S-?撞(?兹))W-1]2}

最小的广义最小二乘方法。此外,还有利用工具变量的两步最小二乘等。其中,S为总体协方差矩阵,用样本协方差矩阵代替。?撞(?兹)为模型预测值的协方差矩阵,含有未知参数?兹,这些方法最终都可以归结为?撞(?兹)与S尽可能接近的原理,即协方差矩阵的重复问题。如果模型是正确的,协方差矩阵就可以被准确地重复出来,这是CB-SEM参数估计的出发点和核心。

我们指出两点需要注意的地方:

(1)由模型产生的协方差矩阵?撞(?兹)重复的是总体协方差矩阵S,但是在实际应用中,总体协方差矩阵不可能知道,为此实际中的S是样本协方差矩阵。这就导致了代替的合理性问题,即样本协方差矩阵能在多大程度上反映总体协方差矩阵呢?这个问题很难回答,但是如果样本量不够的话,代表性一定不好。这就要求在实际中使用大样本,使得样本协方差矩阵能够更好地刻画总体协方差矩阵。

(2)可测变量的总体协方差矩阵刻画了各变量间的相关关系,因此,?撞(?兹)对总体协方差矩阵的重复本质上是用总体协方差矩阵去考察模型所设定的不同组可测变量间关系的合理性,如果参数通过显著性检验和合理性检验,就认为模型设定的关系得到了总体信息的验证。这意味着CB-SEM首先是一种验证性的方法,验证的是模型设定的结构。本质上是各可测变量间的相关关系。为此需要注意,CB-SEM只是刻画了不同组可测变量间的相关结构,并通过潜变量具体表达。至于各组可测变量能在多大程度上被对应的潜变量刻画,该方法并不能回答。

2. PLSPM的参数估计。相比CB-SEM,PLSPM完全是另外一套逻辑,为了分析其特点,我们通过分析其参数估计过程入手。PLSPM的参数估计由迭代算法完成,分为两个部分,第一部分是利用一系列最小二乘和加权运算进行迭代,得到潜变量的估计值,第二部分利用第一部分的结果得到路径模型中的载荷系数和路径系数。这两部分中,第一部分是核心。

具体而言,首先要分划好可测变量的归属,一个潜变量对应一组可测变量。假设有Q个潜变量?孜1,…,?孜Q,第j个潜变量对应的可测变量为Xj=(xj1,…,xjpj)′,j=1,…,Q。则有xjh=?姿jh?孜j+?着jh(h=1,2,…,pj)或者?孜j=?撞pjh=1wjhxjh+?着j,前者为反映型(Reflective),系数为载荷;后者为反映型(Formative),系数为权重,选择何种形式需要根据实际问题决定,这种反映可测变量与潜变量关系的模型为测量模型。其次要设定好潜变量与潜变量之间的关系结构,即?孜i=?撞j≠i?茁ij?孜j+vij。这部分模型称为结构模型,模型中的系数为路径系数。潜变量的得分(即潜变量的估计值)是进行综合评价的关键,对其估计通过迭代实现。由三大步骤组成:

外部逼近:

Yj∝■wjhxjh

Yj是?孜j的外部逼近估计量,∝表示左边是右边的标准化,Wj=(wj1,…,wjpj)′是外部权重。

内部逼近:

Zj∝■ejiYi

其中,i:i?圮j表示与第j个潜变量直接有关的潜变量的下标。eji是内部权重,有三种不同的形式(Tenenhaus M 2005)。

更新权重:

内部权重由潜变量间的结构决定,迭代过程中需要更新的是外部权重,当测量模型为反映型时,对于xjh,其新权重为以Zj为自变量,xjh为因变量的一元线性回归系数,但由于Zj被标准化,因此有wjh=cov(xjh,Zj)

当测量模型为构成型时,新的权重以Zj为因变量,与之对应的可测变量xjh为自变量的多元线性回归的回归系数,即

Wj=(Xj′Xj)-1Xj′Zj

上述步骤反复迭代,直到权重变化不大,就认为收敛,得到最终的权重估计值,潜变量的得分就是可测变量的加权平均值。

通过上述对迭代过程的描述,我们也得到两点关于PLSPM的认识:

(1)在PLSPM框架下,没有涉及总体协方差矩阵。迭代过程完全基于样本信息展开。事实上,Dijkstra. T(1983)证明,PLSPM的迭代本质上是不动点的迭代算法,具体为:

反映型:Wj∝?撞i:j?圮ieji·SjiWi,其中Wj′SjjWj=1;

构成型:Wj∝S-1jj?撞i:j?圮ieji·SjiWi,其中Wj′SjjWj=1

其中,Sji为第j组可测变量与第i组可测变量的样本协方差矩阵,Sjj是第j组可测变量的样本方差矩阵。

因此,PLSPM挖掘的是样本信息,对样本量的要求没有CB-SEM高。

(2)PLSPM的迭代过程本质上通过一系列的最小二乘(OLS)实现,因此不必假定分布。另外,PLSPM的迭代事实上是不断逼近某个潜变量估计值的过程。每次迭代都适用最小二乘,追求潜变量与可测变量间的距离最小化。因此是寻找最能刻画可测变量的潜变量的过程。而不是CB-SEM那样验证可测变量间相关关系的过程。这意味着两种方法的目的很不一样。

三、 综合评价中实践中的问题和评述

将结构方程模型引入综合评价领域的优势已经被很多学者认同,这是因为,在综合评价实践中很多方法都面临一个共同的问题:很多方法没有考虑到指标变量之间的相关关系,因此,当所选择的指标变量集合中存在严重的多重相关性时,很可能会夸大系统中某些特征的作用,从而得到不合理的评估结论。王惠文和付凌晖(2004),张瑛和王惠文(2008)都认为结构方程模型可以解决这样的问题。但是目前很多研究都利用结构方程模型构建综合指数实现综合评价,将两种理论上存在差异的方法以类似的方式进行综合评价,笔者认为需要推敲其合理性。为此我们提出:CB-SEM和PLSPM是否都可以通过构建综合指数实现综合评价?

下面回答这个问题。我们有以下结论:

1. CB-SEM不能用于构建综合指数。

首先我们要明确综合评价的要义,苏为华(2005)指出,综合评价需要将多个因素和指标综合起来,因此,综合方法构成了评价的基本模型。为此,利用综合指数进行综合评价时,对指数的基本要求是能够概括多个指标各方面的信息。

当利用结构方程模型构建综合指数时,这个要求就变成:首先,每个潜变量是否在某种准则下对其对应的可测变量进行了概括。其次,这些潜变量是否反映了各组可测变量的多重相关性。对于CB-SEM而言,其参数估计方法决定了该方法构建的综合指数只能反映各组可测指标的多重相关性。这是因为其参数估计依据的优化准则本质上都是使得由模型得到协方差矩阵逼近总体协方差矩阵。如果模型是正确的,那么总体协方差矩阵就能被准确地重复出来(易丹辉,2008),所以,模型正确是指正确反映了各组可测变量的协方差结构,即它们的多重相关性。但是每组可测变量对应的潜变量是否将可测变量的信息进行了充分的概括,我们是不知道的。利用这样的潜变量得分作为综合指数不能反映真实情况。事实上,在实际应用中,利用CB-SEM分析数据时,我们只需要知道一个样本协方差矩阵就可以利用软件估计。言下之意,我们不用去关心可测指标如何取值,量纲如何等综合评价中关键的问题,只要协方差矩阵相同,即使具体指标完全不同也可以得到相同的估计结果,这个事实反过来说明CB-SEM构建综合指数是值得商榷的。

2. PLSPM可以构建综合指数。与CB-SEM不同,PLSPM的参数估计是从潜变量在平方损失角度下概括可测变量的角度出发的,其迭代过程由最小二乘和加权运算构成,本质上是在xjh=?姿jh?孜j+?着jh(h=1,2,…,pj)或者?孜j=?撞pjh=1wjhxjh+?着j中,使得?撞j?撞hE(?着2jh)最小或者?撞jE(?着2j)最小,且结合各潜变量之间的关系不断迭代实现的参数估计。为此,利用PLSPM得到的潜变量得分是在平方损失意义下对各组可测变量的概括,符合构建综合指数的基本要求。相对CB-SEM,PLSPM更适合构建综合指数进行综合评价。但是需要注意的是,PLSPM的最小化准则是最小化平方损失,虽然在统计学中,这是一种十分常用的方法。例如线性回归模型、主成分分析、因子分析等都是如此,但是是否适用于综合评价需要根据实际问题。关于这个问题的讨论是多元统计方法应用于综合评价的共同问题,苏为华(2000)曾详细讨论。

3. 两类方法适用性评述。前面已经支出,CB-SEM不适合构建综合指数,但是不意味着这个方法在综合评价时就一无是处。通过分析其参数估计的实质,我们认为,CB-SEM适合考察多组可测指标间的多重相关性。如果只是通过相关系数,只能很粗略地知道多个可测变量之间的相关结构。但是通过CB-SEM可以更细致地考察多个可测指标间的复杂结构关系。PLSPM可以用来构建综合指数,但其参数估计方法决定了其不能像CB-SEM那样从整体上对所有可测指标的相关结构进行考察,为此有学者认为,两种方法是互补的(邱皓政,2011)。笔者认为,这种相辅相成性是由于两种方法处理的问题本质上是不一样的,实际应用中可以将两种方法结合起来一起使用,可能效果更好,但目前在学术界没有看到这方面的研究。

另外,前面分析也指出两类方法对于样本和分布的要求是不同的。PLSPM不需要大样本和分布假定,这被很多人认为是CB-SEM不具备的优势。笔者认为,进行综合评价从统计学角度讲是利用已有样本信息,去推测为止的信息,本质上是预测的过程。因此建议,无论用哪一种方法,都尽量使用大样本,才能得到更加可信的结果。

四、 结论和建议

本文通过分析两类结构方程模型(CB-SEM和PLSPM)的参数估计理论,明确了两种方法是两种不同的方法。结合综合评价的要求,我们有以下结论:

1. CB-SEM的参数估计过程决定了该方法不适用构建综合指数,因为其中的潜变量在多大程度上概括了对应的可测变量是不清楚的;

2. CB-SEM适用于评价多组可测指标的多重相关性,利用该方法可以得到多个可测指标间细致的相关结构的刻画;

3. 相比CB-SEM,PLSPM更适合用于构建综合指数进行综合评价。因为,这个方法是基于平方损失下最大化概括可测指标信息实现潜变量得分估计的。符合综合评价的基本要求。

4. PLSPM没有从整体上直接对多个可测指标的多重相关性进行刻画,为此从适用性上,评价多个可测指标的相关结构不如CB-SEM合适。从这个意义上讲,两种方法是互补的。

在实际进行综合评价时,我们建议,首先需要明确实际问题的侧重,如果侧重评价多重相关结构,就推荐使用CB-SEM,如果需要构建综合指数,就使用PLSPM。

参考文献:

1. 高文杰,高旭.基于SEM的我国重要城市现代化水平综合评价模型研究.数学的实践与认识,2010,(18):56-64.

2. 谷晓燕.基于结构方程模型的岗位评价研究.中国管理科学,2009,(2):146-151.

3. 关子明,常文兵,王薇.基于结构方程模型的银行员工绩效考核方法.经济论坛,2009,(2):108-109.

4. 刘岭,程迪祥,陈洪,易东.结构方程模型在综合评价中的应用.自动化与仪器仪表,2010,(2):74-75.

5. 刘亨辉,王建生,周脉耕,王骏,王黎君,胡以松,王玉英,葛辉,杨功焕.结构方程模型在中国居民自报健康状况评价中的应用.中国健康教育,2009,(5):333-337.

6. 罗玉波,王玉翠.结构方程模型在竞争力评价中的应用综述.技术经济与管理研究,2013,(3):21-24.

7. 林盛,刘金兰,韩文秀.基于PLS-结构方程的顾客满意度评价方法.系统工程学报,2005,(6):653-656.

8. 莫一魁,沈旅欧.城市公交系统公众评价的偏最小二乘通径模型.深圳大学学报(理工版),2009,(4):436-440.

9. 区晶莹,张淞琳,俞守华.基于偏最小二乘通径模型的农民工信息能力综合评价.农业系统科学与综合研究,2011,(4):495-501.

10. 阮敬,纪宏.基于PLS结构方程模型的中国西部地区经济发展综合评价.统计教育,2006,(8):4-7.

11. 孙继红,杨晓江,缪榕楠.我国高等教育发展统计特征的PLS通径模型分析.数理统计与管理,2010,(2):362-371.

基金项目:国家自然科学基金(项目号:11361019);广西自然科学基金重点项目(项目号:2013GXNSFDA019001)。

作者简介:斯介生,中国人民大学统计学院博士生;肖宏伟,中国人民大学经济学博士,国家信息中心经济预测部助理研究员;蒋远营,中国人民大学统计学院博士生,桂林理工大学理学院副教授。

收稿日期:2014-09-22。

推荐访问:方程 对策 综合评价 模型 结构