3 PLS

CHOICE BETWEEN COVARIANCEAND VARIANCE-BASED SEM
Since the introduction of covariance-based structural Kể từ khi giới thiệu mô hình phương trình cấu trúc
equation modeling (SEM) by Jöreskog in 1973, this dựa trên hiệp phương sai (SEM) bởi Jöreskog vào
technique has been received with considerable interest năm 1973, kỹ thuật này đã được các nhà nghiên cứu
among empirical researchers. However, the thực nghiệm đón nhận với sự quan tâm đáng kể. Tuy
predominance of LISREL, certainly the most well- nhiên, ưu thế của LISREL, chắc chắn là công cụ nổi
known tool to perform this kind of analysis, has led to tiếng nhất để thực hiện loại phân tích này, đã dẫn đến
the fact that not all researchers are aware of thực tế là không phải tất cả các nhà nghiên cứu đều
alternative techniques for SEM, such as partial least biết về các kỹ thuật thay thế cho SEM, chẳng hạn như
squares (PLS) analysis. Therefore, the objective of phân tích một phần bình phương nhỏ nhất (PLS). Do
this article is to provide an easily comprehensible đó, mục tiêu của bài viết này là cung cấp một phần
introduction to this technique, which is particularly giới thiệu dễ hiểu về kỹ thuật này, đặc biệt phù hợp
suited to situations in which constructs are measured với các tình huống trong đó các cấu trúc được đo
by a very large number of indicators and where lường bởi một số lượng rất lớn các chỉ số và khi các
maximum likelihood covariance-based SEM tools công cụ SEM dựa trên hiệp phương sai đạt đến giới
reach their limit. Because this article is intended as a hạn của chúng. Bởi vì bài viết này nhằm mục đích
general introduction, it avoids mathematical details as giới thiệu chung, nó tránh các chi tiết toán học càng
far as possible and instead focuses on a presentation xa càng tốt và thay vào đó tập trung vào phần trình
of PLS, which can be understood without an in-depth bày PLS, có thể hiểu được mà không cần kiến thức
knowledge of SEM. chuyên sâu về SEM.
First-generation techniques, such as regression-based Các kỹ thuật thế hệ thứ nhất, chẳng hạn như các
approaches (e.g., multiple regression analysis, phương pháp tiếp cận dựa trên hồi quy (ví dụ: phân
discriminant analysis, logistic regression, analysis of tích hồi quy bội số, phân tích phân biệt, hồi quy
variance) and factor or cluster analysis, belong to the logistic, phân tích phương sai) và phân tích nhân tố
core set of statistical instruments which can be used to hoặc cụm, thuộc bộ công cụ thống kê cốt lõi có thể
either identify or confirm theoretical hypothesis based được sử dụng để xác định hoặc xác nhận giả thuyết lý
on the analysis of empirical data. Many researchers in thuyết dựa trên việc phân tích dữ liệu thực nghiệm.
various disciplines have applied one of these method Nhiều nhà nghiên cứu trong các lĩnh vực khác nhau
stogenerate findings that have significantly shaped the đã áp dụng một trong những phát hiện tổng hợp của
way we see the world today, such as Spearman’s phương pháp này đã định hình đáng kể cách chúng ta
(1904) work on general intelligence for psychology nhìn thế giới ngày nay, chẳng hạn như công trình của
(factor analysis), Hofstede’s (1983) publication on Spearman (1904) về trí thông minh chung cho tâm lý
cross-cultural differences for sociology (factor and học (phân tích nhân tố), công bố của Hofstede (1983)
cluster analysis), and Altman’s (1968) article on trên cross- khác biệt văn hóa cho xã hội học (phân
forecasting corporate bankruptcy for management tích nhân tố và cụm), và bài báo của Altman (1968) về
research (discriminant analysis). dự báo phá sản doanh nghiệp cho nghiên cứu quản lý
(phân tích phân biệt đối xử).
However, a common factor for all these methods is Tuy nhiên, một yếu tố chung cho tất cả các phương
that they share three limitations, namely, (a) the pháp này là chúng có chung ba hạn chế, đó là (a) công
postulation of a simple model structure (at least in the nhận cấu trúc mô hình đơn giản (ít nhất là trong
case of regression-based approaches); (b) the trường hợp phương pháp tiếp cận dựa trên hồi quy);
assumption that all variables can be considered as (b) giả định rằng tất cả các biến có thể được coi là có
observable; and (c) the conjecture that all variables thể quan sát được; và (c) phỏng đoán rằng tất cả các
are measured without error, which may limit their biến được đo lường mà không có sai số, điều này có
applicability in some research situations. thể hạn chế khả năng áp dụng của chúng trong một số
tình huống nghiên cứu.
Where the first assumption, the postulation of a simple would seem … relatively artificial and inconsequential” (p.
model structure (i.e., one dependent and several 91).
independent variables) is concerned, Jacoby (1978) stated
Khi có liên quan đến giả định đầu tiên, định đề về cấu trúc
that “we live in a complex, multivariate world [and that]
mô hình đơn giản (tức là, một phụ thuộc và một số biến
studying the impact of one or two variables in isolation,
độc lập), Jacoby (1978) tuyên bố rằng “chúng ta đang sống cứu tác động của một hoặc hai biến riêng biệt, sẽ có vẻ…
trong một thế giới phức tạp, đa biến [và điều đó] nghiên tương đối giả tạo và không quan trọng ”(trang 91).
Although model building always implies omitting Mặc dù việc xây dựng mô hình luôn ngụ ý bỏ qua một
some aspect of reality (Shugan, 2002), this số khía cạnh của thực tế (Shugan, 2002), giả định về
assumption of regression-based approaches may be cách tiếp cận dựa trên hồi quy này có thể quá hạn chế
too limiting for an analysis of more complex and đối với việc phân tích các tình huống phức tạp hơn và
more realistic situations. This becomes, for example, thực tế hơn. Ví dụ, điều này trở nên đặc biệt rõ ràng
especially obvious when one wants to investigate the khi một người muốn điều tra tác động tiềm tàng của
potential effect of mediating or moderating variables các biến trung gian hoặc kiểm duyệt (để biết định
(for a detailed definition of these two terms, see Baron nghĩa chi tiết về hai thuật ngữ này, xem Baron &
& Kenny, 1986) on the relationship between one or Kenny, 1986) đối với mối quan hệ giữa một hoặc
more dependent and independent variables, which nhiều biến phụ thuộc và độc lập, có thể dẫn đến một
may result in some dependent variables influencing số biến phụ thuộc ảnh hưởng đến các biến phụ thuộc
other dependent variables. khác.
With respect to the second limitation, the assumption Đối với hạn chế thứ hai, giả định rằng tất cả các biến
that all variables can beconsidered as observable, có thể được coi là có thể quan sát được, McDonald
McDonald (1996) stressed that a variable can be (1996) nhấn mạnh rằng một biến có thể được gọi là có
called observable “if and only if its value can be thể quan sát được “nếu và chỉ khi giá trị của nó có thể
obtained by means of a real-world sampling thu được bằng một thí nghiệm lấy mẫu trong thế giới
experiment” (p. 239). Therefore, any variable that thực” ( trang 239). Do đó, bất kỳ biến nào không
does not correspond directly to anything observable tương ứng trực tiếp với bất kỳ thứ gì có thể quan sát
must be considered as unobservable (Dijkstra, 1983). được phải được coi là không thể quan sát được
This definition makes it obvious that only a handful of (Dijkstra, 1983). Định nghĩa này cho thấy rõ ràng
relevant variables, such as age and gender, can be rằng chỉ một số ít các biến có liên quan, chẳng hạn
considered as observable, whereas “the effects and như tuổi và giới tính, có thể được coi là có thể quan
properties of molecules, processes, genes, viruses, and sát được, trong khi “các tác động và đặc tính của phân
bacteria are usually observed only indirectly” (S. tử, quá trình, gen, vi rút và vi khuẩn thường chỉ được
Wold, 1993, p. 138) quan sát gián tiếp” (S . Wold, 1993, trang 138)
Regarding the conjecture of variables measured Về việc phỏng đoán các biến được đo lường không có
without error, one has to bear in mind that each sai số, người ta phải nhớ rằng mỗi quan sát trong thế
observation of the real world is accompanied by a giới thực đều đi kèm với một sai số đo lường nhất
certain measurement error, which may comprise two định, có thể bao gồm hai phần (Bagozzi, Yi, &
parts (Bagozzi, Yi, & Philipps, 1991): (a) random Philipps, 1991): (a) ngẫu nhiên lỗi (ví dụ: do thứ tự
error (e.g., caused by the order of items in a của các mục trong bảng câu hỏi hoặc sự mệt mỏi của
questionnaire or respondent fatigue; Heeler & Ray, người trả lời; Heeler & Ray, 1972) và (b) lỗi hệ thống,
1972) and (b) systematic error, such as method chẳng hạn như phương sai của phương pháp (tức là
variance (i.e., variance attributable to the phương sai quy cho phương pháp đo lường hơn là cấu
measurement method rather than the construct of trúc quan tâm; Bagozzi và cộng sự, 1991). Do điểm số
interest; Bagozzi et al., 1991). Because the observed quan sát được của một mục luôn là tổng của ba phần,
score of an item is therefore always the sum of three đó là điểm thực của biến số, lỗi ngẫu nhiên và lỗi hệ
parts, namely, the true score of the variable, random thống (Churchill, 1979), các kỹ thuật thế hệ thứ nhất,
error, and systematic error (Churchill, 1979), first- nói một cách chính xác, chỉ áp dụng được khi có
generation techniques are, strictly speaking, only không phải là một thành phần lỗi có hệ thống hay
applicable when there is neither a systematic nor a ngẫu nhiên - một tình huống hiếm gặp trong thực tế.
random error component—a rare situation in reality.
To overcome these limitations of first-generation techniques, simultaneous modeling of relationships among multiple
more and more authors started using structural equation independent and dependent constructs (Gefen, Straub, &
modeling (SEM) as an alternative. Compared to regression- Boudreau, 2000).
based approaches, which analyze only one layer of linkages
between independent and dependent variables at the same time, Để khắc phục những hạn chế này của các kỹ thuật thế hệ thứ
SEM, as a second-generation technique, allows the nhất, ngày càng nhiều tác giả bắt đầu sử dụng mô hình phương
trình cấu trúc (SEM) như một giải pháp thay thế. So với các
phương pháp tiếp cận dựa trên hồi quy, chỉ phân tích một lớp hóa đồng thời các mối quan hệ giữa nhiều cấu trúc độc lập và
liên kết giữa các biến độc lập và phụ thuộc cùng một lúc, SEM, phụ thuộc (Gefen, Straub, & Boudreau, 2000).
với tư cách là một kỹ thuật thế hệ thứ hai, cho phép mô hình
Therefore, one no longer differentiates between Do đó, người ta không còn phân biệt giữa các biến
dependent and independent variables but distinguishes phụ thuộc và độc lập mà phân biệt giữa các biến tiềm
between the exogenous and endogenous latent ẩn ngoại sinh và nội sinh, biến trước đây là các biến
variables, the former being variables which are not không được giải thích bởi mô hình mặc nhiên (nghĩa
explained by the postulated model (i.e. act always as là luôn hoạt động như các biến độc lập) và biến sau là
independent variables) and the latter being variables các biến được giải thích bởi các mối quan hệ có trong
that are explained by the relationships contained in the mô hình. (Diamantopoulos, 1994, trang 108)
model. (Diamantopoulos, 1994, pp. 108)
Additionally, SEM enables the researcher to construct Ngoài ra, SEM cho phép nhà nghiên cứu xây dựng
unobservable variables measured by indicators (also các biến không thể quan sát được đo lường bằng các
called items, manifest variables, or observed chỉ số (còn gọi là mục, biến biểu hiện hoặc đo lường
measures) as well as to explicitly model measurement quan sát) cũng như mô hình hóa sai số đo lường rõ
error for the observed variables (Chin, 1998a), and ràng cho các biến quan sát (Chin, 1998a), và do đó nó
hence it overcomes the limitations of first-generation khắc phục được các hạn chế của các kỹ thuật thế hệ
techniques described earlier and consequently gives thứ nhất được mô tả trước đó và do đó mang lại cho
the researcher the flexibility to “statistically test a nhà nghiên cứu sự linh hoạt để “kiểm tra thống kê các
priori substantive/theoretical and measurement giả định về cơ bản / lý thuyết và đo lường trước dựa
assumptions against empirical data (i.e. confirmatory trên dữ liệu thực nghiệm (tức là phân tích xác nhận)”
analysis)” (Chin, 1998a, p. vii). (Chin, 1998a, p. vii).
In general, there are two approaches to estimating the Nói chung, có hai cách tiếp cận để ước tính các tham
parameters of an SEM, namely, the covariance-based số của SEM, đó là, cách tiếp cận dựa trên hiệp
approach and the variance-based (or components- phương sai và cách tiếp cận dựa trên phương sai (hoặc
based) approach. Covariance-based SEM, in dựa trên thành phần). Đặc biệt, SEM dựa trên hiệp
particular, has received high prominence during the phương sai đã nhận được sự nổi bật cao trong vài thập
last few decades and, “to many social science kỷ qua và “đối với nhiều nhà nghiên cứu khoa học xã
researchers, the covariance-based procedure is hội, thủ tục dựa trên hiệp phương sai đồng nghĩa với
tautologically synonymous with the term SEM” thuật ngữ SEM” (Chin, 1998b, trang 295). Mặc dù có
(Chin, 1998b, p. 295). Although there are several một số công cụ khác nhau có thể được sử dụng để
different tools that can be used to perform this kind of thực hiện loại phân tích này, chẳng hạn như EQS,
analysis, such as EQS, AMOS, SEPATH, and AMOS, SEPATH và COSAN, chương trình LISREL
COSAN, the LISREL program developed by Jöreskog do Jöreskog phát triển năm 1975 đã trở thành chương
in 1975 became the most popular oneand, trình phổ biến nhất và do đó, thuật ngữ LISREL đôi
consequently, the term LISREL is sometimes used as a khi được sử dụng như một từ đồng nghĩa với SEM
synonym for covariance-based SEM. dựa trên hiệp phương sai.
The focus of this article is to give an introduction to based SEM, given the specific assumptions and
the other side of the coin, variance-based SEM, and to limitations of each of these methods.
present partial least squares (PLS) analysis as one
Trọng tâm của bài viết này là giới thiệu mặt khác của
technique from this group in more detail. In contrast
đồng xu, SEM dựa trên phương sai và trình bày phân
to articles already published in this area (e.g., Cassel,
tích bình phương nhỏ nhất (PLS) từng phần như một
Hackl, & Westlund, 1999; Dijkstra, 1983; Garthwaite,
kỹ thuật từ nhóm này chi tiết hơn. Trái ngược với các
1994), our focus is on an easily understandable
bài báo đã được xuất bản trong lĩnh vực này (ví dụ:
presentation of this topic, accessible to beginners
Cassel, Hackl, & Westlund, 1999; Dijkstra, 1983;
without extensive knowledge of statistics in general or
Garthwaite, 1994), trọng tâm của chúng tôi là trình
SEM in particular. Additionally, we try to answer the
bày dễ hiểu về chủ đề này, có thể tiếp cận được với
question under which circumstances a researcher
người mới bắt đầu không có kiến thức sâu rộng về
might want to prefer variance-based over covariance-
thống kê nói chung hoặc SEM nói riêng. Ngoài ra,
chúng tôi cố gắng trả lời câu hỏi trong trường hợp nào các giả định và hạn chế cụ thể của từng phương pháp
mà nhà nghiên cứu có thể muốn thích dựa trên này.
phương sai hơn SEM dựa trên hiệp phương sai, với
For this purpose, our article is structured as follows: Với mục đích này, bài viết của chúng tôi có cấu trúc
In the next section, we provide a short introduction to như sau: Trong phần tiếp theo, chúng tôi cung cấp
theories, SEM, and the measurement of unobservable một giới thiệu ngắn về lý thuyết, SEM và việc đo
variables as necessary background to understanding lường các biến không thể quan sát làm nền tảng cần
the fundamentals behind SEM. We then proceed to thiết để hiểu các nguyên tắc cơ bản đằng sau SEM.
the main topic of this article, an introduction to PLS Sau đó, chúng tôi chuyển sang chủ đề chính của bài
analysis, explaining the basics of this technique as viết này, giới thiệu về phân tích PLS, giải thích những
well as statistical assumptions and limitations điều cơ bản của kỹ thuật này cũng như các giả định
associated with it. The article concludes with some thống kê và các hạn chế liên quan đến nó. Bài báo kết
recommendations regarding the suitability of PLS for thúc với một số khuyến nghị về tính phù hợp của PLS
SEM, focusing particularly on situations in which đối với SEM, đặc biệt tập trung vào các tình huống
covariance-based SEM might not be appropriate. trong đó SEM dựa trên hiệp phương sai có thể không
phù hợp.
THEORIES, SEM, AND INDICATORS
As indicated in the beginning of this article, SEM can Như đã chỉ ra ở phần đầu của bài viết này, SEM có
be (and often is) used to test (and consequently to thể được (và thường được) sử dụng để kiểm tra (và do
either support or reject) theoretical assumptions with đó hỗ trợ hoặc bác bỏ) các giả định lý thuyết với dữ
empirical data. It is therefore essential to have a sound liệu thực nghiệm. Do đó, điều cần thiết là phải hiểu rõ
understanding of the structure of theories to về cấu trúc của các lý thuyết để hiểu các thành phần
understand the different components of a structural khác nhau của một mô hình phương trình cấu trúc.
equation model.
According to Bagozzi and Philipps (1982), a theory Theo Bagozzi và Philipps (1982), một lý thuyết có thể
may contain three different types of concepts: (a) chứa ba loại khái niệm khác nhau: (a) khái niệm lý
theoretical concepts that “are abstract, unobservable thuyết “là những thuộc tính hoặc thuộc tính trừu
properties or attributes of a social unit of entity” (p. tượng, không thể quan sát được của một đơn vị xã hội
465); (b) empirical concepts which “refer to của thực thể” (trang 465); (b) các khái niệm thực
properties or relations whose presence or absence in a nghiệm “đề cập đến các thuộc tính hoặc quan hệ mà
given case can be inter-subjectively ascertained, under sự hiện diện hoặc vắng mặt trong một trường hợp nhất
suitable circumstances, by direct observations” định có thể được xác định một cách chủ quan, trong
(Bagozzi & Philipps, 1982, p. 465); and (c) derived các trường hợp thích hợp, bằng các quan sát trực tiếp”
concepts, which are unobservable (like theoretical (Bagozzi & Philipps, 1982, trang 465); và (c) các khái
concepts) but “unlike theoretical concepts … must be niệm có nguồn gốc, không thể quan sát được (như các
tied directly to empirical concepts” (Bagozzi & khái niệm lý thuyết) nhưng “không giống như các
Philipps, 1982, p. 465). Additionally, there are three khái niệm lý thuyết… phải gắn trực tiếp với các khái
possible types of relationship that link these concepts: niệm thực nghiệm” (Bagozzi & Philipps, 1982, trang
(a) nonobservational hypotheses, which link 465). Ngoài ra, có ba loại mối quan hệ có thể có liên
theoretical concepts with other theoretical concepts; kết các khái niệm này: (a) các giả thuyết không quan
(b) theoretical definitions, which connect theoretical sát, liên kết các khái niệm lý thuyết với các khái niệm
and derived concepts; and (c) correspondence rules, lý thuyết khác; (b) các định nghĩa lý thuyết, kết nối
which link theoretical or derived to empirical các khái niệm lý thuyết và suy ra; và (c) các quy tắc
concepts and serve “to provide empirical significance tương ứng, liên kết lý thuyết hoặc suy ra các khái
to theoretical terms” (Bagozzi, 1984, p. 17). niệm thực nghiệm và phục vụ “để cung cấp ý nghĩa
thực nghiệm cho các thuật ngữ lý thuyết” (Bagozzi,
1984, trang 17).
Using this framework, it is possible to construct are unobservable (latent) variables, and empirical
search model thatre present sa certain theory, simply concepts into indicators, which are linked by a set of
by converting theoretical and derived concepts into hypotheses (representing either nonobservational
hypotheses, theoretical definitions, or correspondence thành các biến không quan sát được (tiềm ẩn) và các
rules). khái niệm thực nghiệm thành các chỉ số, được liên kết
bởi một tập hợp các giả thuyết (đại diện cho hoặc
Sử dụng khuôn khổ này, có thể xây dựng mô hình tìm
không quan sát giả thuyết, định nghĩa lý thuyết hoặc
kiếm trình bày một lý thuyết nhất định, đơn giản bằng
quy tắc tương ứng).
cách chuyển đổi các khái niệm lý thuyết và suy ra
This model can then be represented graphically by a Mô hình này sau đó có thể được biểu diễn bằng đồ thị
path diagram (also called an arrow scheme; see Figure bằng một sơ đồ đường dẫn (còn được gọi là sơ đồ mũi
1), which shows how the various elements relate to tên; xem Hình 1), cho thấy các phần tử khác nhau liên
one another (Diamantopoulos, 1994). quan với nhau như thế nào (Diamantopoulos, 1994).
Based on the path diagram (and using Figure 1 as an Dựa trên sơ đồ đường dẫn (và sử dụng Hình 1 làm ví
example), it is then possible to set up three sets of dụ), sau đó có thể thiết lập ba bộ phương trình, có thể
equations, which can be used to describe the được sử dụng để mô tả mối quan hệ giữa các tham số
relationships between the different parameters of the khác nhau của mô hình nghiên cứu.
research model.
The first set relates the indicators of the exogenous Tập hợp đầu tiên liên hệ các chỉ số của các biến ngoại
variables (x) to their associated measurement error () sinh (x) với sai số đo lường liên quan của chúng ()
and the latent exogenous variables (): và các biến ngoại sinh tiềm ẩn ():
FIGURE 1 Relationship between theory and path HÌNH 1 Mối quan hệ giữa lý thuyết và sơ đồ đường đi / sơ đồ
diagram/arrow scheme (Bagozzi & Philipps, 1982; mũi tên (Bagozzi & Philipps, 1982; Diamantopoulos, 1994). η
Diamantopoulos, 1994). η (eta) = latent endogenous variable; ξ (eta) = biến nội sinh tiềm ẩn; ξ (xi) = biến ngoại sinh tiềm ẩn
(xi) = latent exogenous (i.e., independent) variable; ζ (zeta) = (tức là độc lập); ζ (zeta) = thuật ngữ xáo trộn ngẫu nhiên; γ
random disturbance term; γ (gamma) = path coefficient; ϕ (phi) (gamma) = hệ số đường đi; ϕ (phi) mối quan hệ phi nhân quả
noncausal relationship between two latent exogenous variables; giữa hai biến ngoại sinh tiềm ẩn; y = chỉ số của các biến nội
y= indicators of endogenous variables; ε(epsilon) = sinh; ε (epsilon) = sai số đo lường đối với các chỉ số của
measurement errors for indicators of endogenous variable; biến nội sinh; λy (lambda y) = tải các chỉ số của biến nội
λy(lambda y) = loadings of indicators of endogenous sinh; x = các chỉ số của biến nội sinh; δ (delta) = sai số
variable; x= indicators of endogenous variable; δ(delta) đo lường đối với các chỉ số của biến ngoại sinh; λx =
= measurment errors for indicators of exogenous variable; (lambda x) tải các chỉ số của biến ngoại sinh
λx= (lambda x) loadings of indicators of exogenous variable
The second set describes the relationship between the Bộ thứ hai mô tả mối quan hệ giữa các chỉ số của các
indicators of the endogenous variables (y), their biến nội sinh (y), sai số đo lường liên quan của chúng
associated measurement error (ε), and the latent (ε) và các biến nội sinh tiềm ẩn (η):
endogenous variables (η ):
Finally, the last set deals with the relationship Cuối cùng, tập hợp cuối cùng đề cập đến mối quan hệ
between the latent endogenous (η) and exogenous (ξ) giữa biến nội sinh tiềm ẩn (η) và biến ngoại sinh (ξ):
variables:
In contrast to the equations just formulated, the Ngược lại với các phương trình vừa lập, thuật ngữ
random disturbance terms ζ do not reflect nhiễu ngẫu nhiên ζ không phản ánh sai số đo mà được
measurement error but are known as “errors in gọi là "sai số trong phương trình" và "phản ánh nhiễu
equations” and “reflect random disturbances (i.e. they ngẫu nhiên (nghĩa là chúng chỉ ra rằng các biến nội
indicate that the endogenous variables are not sinh không được giải thích hoàn hảo bởi các biến độc
perfectly explained by the independent variables)” lập)" (Diamantopoulos, 1994, trang 110).
(Diamantopoulos, 1994, p. 110).
By using matrix algebra, these three sets of equations Bằng cách sử dụng đại số ma trận, ba bộ phương trình
can also be written in the following way: này cũng có thể được viết theo cách sau:
This results in a set of theoretical equations (Equation Điều này dẫn đến một tập hợp các phương trình lý
3), representing nonobservational hypotheses and thuyết (Phương trình 3), đại diện cho các giả thuyết
theoretical definitions, and measurement equations không quan sát và định nghĩa lý thuyết, và các
(Equations 1 and 2), representing correspondence phương trình đo lường (Phương trình 1 và 2), đại diện
rules (Bagozzi & Philipps, 1982). The theoretical cho các quy tắc tương ứng (Bagozzi & Philipps,
equations are then also referred to as the structural 1982). Các phương trình lý thuyết sau đó còn được
model, whereas the measurement equations build the gọi là mô hình cấu trúc, trong khi các phương trình đo
measurement model, and both combined can be lường xây dựng mô hình đo lường và cả hai kết hợp
subsumed by the term structural equation model. này có thể được gộp lại bằng thuật ngữ mô hình
phương trình cấu trúc.
As Bagozzi (1984) emphasized, there are three but either imply empirical concepts or can be inferred
different types of unobservable variables: (a) variables from observations (e.g., attitudes, which might be
that are unobservable in principle (e.g., theoretical reflected in evaluations); and (c) unobservable
terms); (b) variables that are unobservable in principle variables that are defined in terms of observables.
Because none of these types can be measured directly, được nhưng bao hàm các khái niệm thực nghiệm hoặc
the researcher needs to measure indicators instead, có thể được suy ra từ các quan sát (ví dụ: thái độ, có
which cover different facets of the unobservable thể được phản ánh trong các đánh giá); và (c) các biến
variable. In general, indicators can be split into two không quan sát được được xác định theo nghĩa có thể
groups: (a) reflective indicators that depend on the quan sát được. Bởi vì không có loại nào trong số này
construct and (b) formative ones (also known as có thể được đo lường trực tiếp, thay vào đó, nhà
cause measures) that cause the formation of or nghiên cứu cần phải đo lường các chỉ số, các chỉ số
changes in an unobservable variable (Bollen & này bao gồm các khía cạnh khác nhau của biến không
Lennox, 1991). thể quan sát được. Nói chung, các chỉ số có thể được
chia thành hai nhóm: (a) các chỉ số phản ánh phụ
Như Bagozzi (1984) đã nhấn mạnh, có ba loại biến số
thuộc vào cấu trúc và (b) các chỉ số hình thành (còn
không thể quan sát khác nhau: (a) các biến số không
được gọi là các biện pháp nguyên nhân) gây ra sự
thể quan sát về nguyên tắc (ví dụ, các thuật ngữ lý
hình thành hoặc thay đổi trong một biến không thể
thuyết); (b) các biến về nguyên tắc không thể quan sát
quan sát được (Bollen & Lennox, 1991).
Written in mathematical terms (see Figure 2), this Được viết bằng thuật ngữ toán học (xem Hình 2), sự
difference becomes obvious. Whereas reflective khác biệt này trở nên rõ ràng. Trong khi các chỉ số
indicators can be expressed as a function of their phản ánh có thể được biểu thị dưới dạng một hàm của
associated latent variables, such as các biến tiềm ẩn liên quan của chúng, chẳng hạn như
or, by using matrix algebra, hoặc, bằng cách sử dụng đại số ma trận,
formative indicators are not influenced by but các chỉ số hình thành không bị ảnh hưởng bởi nhưng
influence the latent variables, so that ảnh hưởng đến các biến tiềm ẩn, do đó
Consequently, if the unobservable can be considered and Zaltman (1993) operationalized the unobservable
as giving “rise to something observed,” as is the case variable “timeliness” by the following three reflective
when, for example, the unobservable describes a indicators: (a) accommodation of last-minute requests,
personality trait or attitude, reflective indicators (b) punctuality in meeting deadlines, and (c) speed of
should be used. For example, Moorman, Deshpandeé, returning phone calls. In contrast, formative indicators
are appropriate if constructs “are perceived as Deshpandeé và Zaltman (1993) đã vận hành biến
explanatory combinations of indicators” (Fornell & không thể quan sát được “tính kịp thời” bằng ba chỉ số
Bookstein, 1982, p. 442), such as the unobservable phản ánh sau: (a) mức độ đáp ứng các yêu cầu vào
variable “life stress,” which can be considered as a phút cuối, (b) đúng giờ trong thời hạn họp và (c) tốc
combination of formative indicators such as job loss, độ của gọi lại cuộc điện thoại. Ngược lại, các chỉ số
divorce, a recent accident, and death in the family hình thành phù hợp nếu các cấu trúc “được coi là sự
(Chin & Newsted, 1999). kết hợp giải thích của các chỉ số” (Fornell &
Bookstein, 1982, trang 442), chẳng hạn như biến
Do đó, nếu cái không thể quan sát được có thể được
không thể quan sát được “căng thẳng cuộc sống”, có
coi là “làm nảy sinh một cái gì đó được quan sát”,
thể được coi là sự kết hợp của các chỉ số hình thành
chẳng hạn như trường hợp khi cái không thể quan sát
chẳng hạn như mất việc làm, ly hôn, một tai nạn gần
được mô tả một đặc điểm tính cách hoặc thái độ, thì
đây và cái chết trong gia đình (Chin & Newsted,
nên sử dụng các chỉ báo phản ánh. Ví dụ, Moorman,
1999).
This leads to one major difference between formative and Điều này dẫn đến một sự khác biệt lớn giữa các chỉ số
reflective indicators: Whereas reflective indicators should hình thành và phản ánh: Trong khi các chỉ số phản
have a high correlation (as they are all dependent on the ánh phải có mối tương quan cao (vì chúng đều phụ
same unobservable variable), formative indicators of the thuộc vào cùng một biến không quan sát được), các
same construct can have positive, negative, or zero
chỉ số hình thành của cùng một cấu trúc có thể có mối
correlation with one another (Hulland, 1999), which means
tương quan dương, âm hoặc bằng không với một khác
that a change in one indicator does not necessarily imply a
similar directional changein others (Chin, 1998a). In the (Hulland, 1999), có nghĩa là sự thay đổi trong một chỉ
examples given earlier,a person who is considered more số không nhất thiết phải ngụ ý đến những người thay
timely than another is expected to accommodate last- đổi hướng tương tự (Chin, 1998a). yêu cầu thường
minute requests more often and to be more punctual in xuyên hơn và đúng giờ hơn trong các cuộc họp và trả
meetings and to return phone calls more promptly. On the lời các cuộc gọi điện thoại kịp thời hơn. Mặt khác,
other hand, a higher degree of life stress does not imply mức độ căng thẳng trong cuộc sống cao hơn không có
that a person has become unemployed, got divorced, and nghĩa là một người trở nên thất nghiệp, ly hôn và mất
lost his or her parents all at the same time—one of these cha mẹ cùng một lúc — chỉ một trong những sự kiện
events alone may be sufficient to increase stress. này thôi cũng đủ làm tăng căng thẳng.
PLS ANALYSIS: BASIC IDEA AND UNDERLYING ASSUMPTIONS
As highlighted in the beginning of this article, there Như đã nhấn mạnh trong phần đầu của bài viết này,
are two approaches to estimate the parameters of an có hai cách tiếp cận để ước tính các tham số của SEM,
SEM, that is, the covariance-based approach and the đó là, cách tiếp cận dựa trên hiệp phương sai và cách
variance-based approach. tiếp cận dựa trên phương sai.
The covariance-based approach “attempts to minimize might want to prefer variance-based over covariance-
the difference between the sample covariances and based SEM.
those predicted by the theoretical model. …
Phương pháp dựa trên hiệp phương sai “cố gắng giảm
Therefore, the parameter estimation process attempts
thiểu sự khác biệt giữa hiệp phương sai mẫu và những
to reproduce the covariance matrix of the observed
giá trị được dự đoán bởi mô hình lý thuyết. … Do đó,
measures” (Chin & Newsted, 1999, p. 309). Because
quá trình ước lượng tham số cố gắng tái tạo ma trận
of the popularity of covariance-based SEM, there is a
hiệp phương sai của các phép đo được quan sát
wide variety of articles that provide an introduction to
”(Chin & Newsted, 1999, trang 309). Do sự phổ biến
this technique, and because a detailed description of
của SEM dựa trên hiệp phương sai, có rất nhiều bài
that method goes beyond the scope of this article, the
báo cung cấp phần giới thiệu về kỹ thuật này và bởi vì
reader is referred to Diamantopoulos (1994) for an
mô tả chi tiết về phương pháp đó nằm ngoài phạm vi
excellent and easily understandable presentation of
của bài viết này, người đọc được tham khảo
covariance-based SEM and LISREL. We come back
Diamantopoulos (1994) để có một bản trình bày xuất
to some points related to this approach later, when we
sắc và dễ hiểu về SEM và LISREL dựa trên hiệp
highlight the circumstances under which a researcher
phương sai. Chúng ta quay lại một số điểm liên quan
đến cách tiếp cận này sau, khi chúng ta làm nổi bật dựa trên phương sai hơn SEM dựa trên hiệp phương
các trường hợp mà nhà nghiên cứu có thể muốn thích sai.
Unlike covariance-based SEM, PLS, first introduced Không giống như SEM dựa trên hiệp phương sai,
by H. Wold (1975) under the name NIPALS PLS, lần đầu tiên được giới thiệu bởi H. Wold (1975)
(nonlinear iterative partial least squares), focuses on với tên NIPALS (bình phương nhỏ nhất từng phần lặp
maximizing the variance of the dependent variables lại phi tuyến), tập trung vào việc tối đa hóa phương
explained by the independent ones instead of sai của các biến phụ thuộc được giải thích bởi các
reproducing the empirical covariance matrix. Like any biến độc lập thay vì tái tạo ma trận hiệp phương sai
SEM, a PLS model consists of a structural part, which thực nghiệm . Giống như bất kỳ SEM nào, mô hình
reflects the relationships between the latent variables, PLS bao gồm một phần cấu trúc, phản ánh mối quan
and a measurement component, which shows how the hệ giữa các biến tiềm ẩn và một thành phần đo lường,
latent variables and their indicators are related; but it cho biết các biến tiềm ẩn và các chỉ số của chúng có
also has a third component, the weight relations, liên quan như thế nào; nhưng nó cũng có một thành
which are used to estimate case values for the latent phần thứ ba, quan hệ trọng số, được sử dụng để ước
variables (Chin & Newsted, 1999). tính giá trị trường hợp cho các biến tiềm ẩn (Chin &
Newsted, 1999).
In contrast to covariance-based SEM, which estimates Ngược lại với SEM dựa trên hiệp phương sai, ước
first model parameters and then case values (i.e., tính các tham số mô hình đầu tiên và sau đó là giá trị
estimated values for each latent variable in each data trường hợp (tức là giá trị ước tính cho mỗi biến tiềm
set) by regressing them onto the set of all indicators ẩn trong mỗi tập dữ liệu) bằng cách hồi quy chúng
(Dijkstra, 1983), PLS starts by calculating case vào tập hợp tất cả các chỉ số (Dijkstra, 1983), PLS bắt
values. For this purpose, the “unobservable variables đầu bằng cách tính các giá trị trường hợp. Vì mục
are estimated as exact linear combinations of their đích này, “các biến không thể quan sát được ước tính
empirical indicators” (Fornell & Bookstein, 1982, p. là sự kết hợp tuyến tính chính xác của các chỉ số thực
441), and PLS treats these estimated proxies as nghiệm của chúng” (Fornell & Bookstein, 1982, p.
perfect substitutes for the latent variables (Dijkstra, 441), và PLS coi các proxy ước tính này là sự thay thế
1983). The weights used to determine these case hoàn hảo cho các biến tiềm ẩn (Dijkstra, 1983). Các
values are estimated so that the resulting case values trọng số được sử dụng để xác định các giá trị trường
capture most of the variance of the independent hợp này được ước tính sao cho các giá trị trường hợp
variables that is useful for predicting the dependent kết quả nắm bắt được hầu hết phương sai của các biến
variable (Garthwaite, 1994). This is based on the độc lập hữu ích cho việc dự đoán biến phụ thuộc
implicit assumption that all measured variance of the (Garthwaite, 1994). Điều này dựa trên giả định ngầm
variables in the model is useful variance that should định rằng tất cả các phương sai đo được của các biến
be explained (Chin, Marcolin, & Newsted, 1996). trong mô hình là phương sai hữu ích cần được giải
Using these weights, it is then possible to determine thích (Chin, Marcolin, & Newsted, 1996). Sử dụng
a value for each unobservable variable, simply by các trọng số này, sau đó có thể xác định giá trị cho
calculating a weighted average of its indicators. This từng biến không thể quan sát được, đơn giản bằng
results in a model in which all unobservable variables cách tính giá trị trung bình có trọng số của các chỉ số
are approximated by a set of case values and that can, của nó. Điều này dẫn đến một mô hình trong đó tất cả
therefore, be estimated by a set of simple, first- các biến không thể quan sát được xấp xỉ bởi một tập
generation, ordinary least squares regressions. hợp các giá trị trường hợp và do đó, có thể được ước
Consequently, the basic idea of PLS is quite tính bằng một tập hợp các hồi quy bình phương nhỏ
straightforward: First, the weight relations, which link nhất thông thường, thế hệ thứ nhất, đơn giản. Do đó, ý
the indicators to their respective unobservable tưởng cơ bản của PLS khá đơn giản: Thứ nhất, các
variables, are estimated. quan hệ trọng số, liên kết các chỉ số với các biến
không quan sát được tương ứng của chúng, được ước
tính.
Second, case values for each unobservable variable regression equations to determine the parameters for
are calculated, based on a weighted average of its the structural relations (Fornell & Bookstein, 1982).
indicators, using the weight relations as an input.
Finally, these case values are used in a set of
Thứ hai, các giá trị trường hợp cho mỗi biến không thể trong một tập hợp các phương trình hồi quy để xác định
quan sát được, dựa trên giá trị trung bình có trọng số của các tham số cho các quan hệ cấu trúc (Fornell &
các chỉ số của nó, sử dụng các quan hệ trọng số làm đầu Bookstein, 1982).
vào. Cuối cùng, các giá trị trường hợp này được sử dụng
This explanation makes it obvious that the most crucial Giải thích này cho thấy rõ ràng rằng phần quan trọng
part of a PLS analysis is the estimation of the weight nhất của phân tích PLS là ước tính các quan hệ trọng
relations. Of course, it would be easier simply to assume số. Tất nhiên, sẽ dễ dàng hơn nếu đơn giản là giả định
equal weights for all indicators, but this approach has two trọng số bằng nhau cho tất cả các chỉ số, nhưng cách
disadvantages: First, there is no theoretical rationale for all
tiếp cận này có hai nhược điểm: Thứ nhất, không có
indicators to have the same weighting. Because it can be
cơ sở lý thuyết để tất cả các chỉ số có cùng trọng số.
assumed that the resulting parameter estimates of the
structural model depend on the type of weighting used, at Bởi vì có thể giả định rằng các ước lượng tham số kết
least as long as the number of indicators is not excessively quả của mô hình cấu trúc phụ thuộc vào loại trọng số
large (McDonald, 1996), the (exogenous) assumption of được sử dụng, ít nhất là miễn là số lượng chỉ số không
equal weights makes the results highly arbitrary. Second, quá lớn (McDonald, 1996), giả định (ngoại sinh) về
as Chin, Marcolin, and Newsted (2003b) stressed, such a các trọng số bằng nhau làm cho kết quả rất tùy ý. Thứ
procedure does not take into account the fact that some hai, như Chin, Marcolin và Newsted (2003b) đã nhấn
indicators may be more reliable than others and should, mạnh, quy trình như vậy không tính đến thực tế là
therefore, receive higher weights. một số chỉ số có thể đáng tin cậy hơn những chỉ số
khác và do đó, nên nhận được trọng số cao hơn.
Consequently, PLS uses a more complex, two-step Do đó, PLS sử dụng một quy trình ước lượng hai
estimation process to determine the weights (wi): bước phức tạp hơn để xác định trọng số (wi): Đầu
First, it starts with an outside approximation, in which tiên, nó bắt đầu với một phép gần đúng bên ngoài,
case values for each latent variable (e.g. η 2 in Figure trong trường hợp đó các giá trị cho mỗi biến tiềm ẩn
1) are estimated, based on a weighted average of their (ví dụ: η 2 trong Hình 1) được ước tính, dựa trên trên
respective indicators (e.g., XXXXX). The weights mức trung bình có trọng số của các chỉ số tương ứng
used to calculate this aggregation are determined in a của chúng (ví dụ: XXXXX). Các trọng số được sử
manner similar to a principal-components analysis for dụng để tính toán tổng hợp này được xác định theo
reflective or regression analysis for formative cách tương tự như phân tích các thành phần chính để
indicators (Cassel, Hackl, & Westlund, 1999). In the phân tích phản xạ hoặc hồi quy cho các chỉ số hình
next step, the inside approximation, improved case thành (Cassel, Hackl, & Westlund, 1999). Trong bước
values are determined as a weighted average of tiếp theo, giá trị xấp xỉ bên trong, giá trị trường hợp
neighboring latent variables (e.g., XXXXX). For this cải tiến được xác định dưới dạng trung bình có trọng
process, there are three different weighting schemes số của các biến tiềm ẩn lân cận (ví dụ: XXXXX). Đối
available (centroid, factor, and path weighting với quá trình này, có sẵn ba sơ đồ trọng số khác nhau
scheme; for a detailed description, see Lohmöller, (sơ đồ trọng số centroid, hệ số và đường dẫn; để biết
1989), but one can demonstrate that the choice mô tả chi tiết, xem Lohmöller, 1989), nhưng người ta
between them has only a minor impact on the final có thể chứng minh rằng sự lựa chọn giữa chúng chỉ có
results. Using this second estimate of the case values, tác động nhỏ đến kết quả cuối cùng . Sử dụng ước
the weight relations are modified (e.g., XXXXX) and lượng thứ hai này của các giá trị trường hợp, các quan
the process of inside and outside approximation starts hệ trọng số được sửa đổi (ví dụ, XXXXX) và quá
from the beginning again and is repeated until trình xấp xỉ bên trong và bên ngoài bắt đầu lại từ đầu
convergence of the case values is achieved (Cassel et và được lặp lại cho đến khi đạt được sự hội tụ của các
al., 1999). giá trị trường hợp (Cassel và cộng sự, 1999 ).
Hence, being a limited information approach (Dijkstra, Gaussian classical linear ordinary least squares) regression
1983), PLS has the advantage that it “involves no model (see, e.g., Gujarati, 1995), the most important
assumptions about the population or scale of assumption is predictor specification (Chin & Newsted,
measurement” (Fornell & Bookstein, 1982, p. 443) and 1999). This requirement states that the systematic part of
consequently works without distributional assumptions and the linear regression must be equal to the conditional
with nominal, ordinal, and interval scaled variables. expectation of the dependent variable (for a mathematical
However, one has to bear in mind that PLS, like any formulation, see H. Wold, 1975) and can be considered as
statistical technique, also re quires certain assumptions to fulfilled in most cases. Furthermore, by using a Monte
be fulfilled. Beyond those known from the standard (i.e., Carlo simulation, Cassel et al. (1999) showed that PLS is
quite robust with regard to several inadequacies (e.g. những điều đã biết từ mô hình hồi quy chuẩn (tức là bình
skewness or multicollinearity of the indicators, phương nhỏ nhất tuyến tính thông thường cổ điển
misspecification of the structural model) and that the latent Gaussian) (xem, ví dụ, Gujarati, 1995), giả định quan trọng
variable scores always conform to the true values. nhất là đặc tả của dự đoán (Chin & Newsted, 1999). Yêu
cầu này nói rằng phần hệ thống của hồi quy tuyến tính phải
Do đó, là một phương pháp tiếp cận thông tin hạn chế
bằng kỳ vọng có điều kiện của biến phụ thuộc (đối với
(Dijkstra, 1983), PLS có lợi thế là nó “không liên quan đến
công thức toán học, xem H. Wold, 1975) và có thể được
các giả định về dân số hoặc quy mô đo lường” (Fornell &
coi là thỏa mãn trong hầu hết các trường hợp. Hơn nữa,
Bookstein, 1982, trang 443) và do đó hoạt động mà không
bằng cách sử dụng mô phỏng Monte Carlo, Cassel et al.
có giả định phân phối và với các biến định mức, thứ tự và
(1999) đã chỉ ra rằng PLS khá mạnh đối với một số điểm
theo khoảng tỷ lệ. Tuy nhiên, người ta phải ghi nhớ rằng
bất cập (ví dụ độ lệch hoặc đa cộng tuyến của các chỉ số,
PLS, giống như bất kỳ kỹ thuật thống kê nào, cũng đòi hỏi
sự sai lệch của mô hình cấu trúc) và rằng điểm số tiềm ẩn
một số giả định nhất định phải được thực hiện. Ngoài
luôn phù hợp với giá trị thực.
However, there is also another side of the coin, Tuy nhiên, cũng có một mặt khác của đồng tiền, đó là
namely, the problem of consistency at large. In vấn đề về tính nhất quán nói chung. Nói chung, một
general, a consistent estimator can be described as công cụ ước lượng nhất quán có thể được mô tả là
“one that converges in probability to the value of the “một công cụ hội tụ xác suất thành giá trị của tham số
parameter being estimated as the sample size được ước tính khi kích thước mẫu tăng lên”
increases” (McDonald, 1996, p. 248). (McDonald, 1996, trang 248).
However, because the case values for the latent Tuy nhiên, vì các giá trị trường hợp cho các biến tiềm
variables in PLS are aggregates of manifest variables ẩn trong PLS là tổng hợp của các biến biểu hiện có
that involve measurement error, they must be liên quan đến sai số đo lường, chúng phải được coi là
considered as inconsistent (Fornell & Cha, 1994). không nhất quán (Fornell & Cha, 1994). Do đó, “hệ
Therefore, “the path coefficients estimated through số đường dẫn được ước tính thông qua PLS hội tụ trên
PLS converge on the parameters of the latent-variable các tham số của mô hình biến tiềm ẩn [chỉ] vì cả kích
model [only] as both the sample size and the number thước mẫu và số lượng chỉ số của mỗi biến tiềm ẩn
of indicators of each latent variable become infinite” đều trở nên vô hạn” (McDonald, 1996, trang 248) —a
(McDonald, 1996, p. 248)—a problem known under vấn đề được biết đến dưới thuật ngữ nhất quán nói
the term consistency at large. Hence in all real-life chung. Do đó, trong tất cả các tình huống thực tế,
situations, in which both the number of cases in the trong đó cả số trường hợp trong mẫu và số lượng chỉ
sample and the number of indicators per latent báo trên mỗi biến tiềm ẩn sẽ là hữu hạn, PLS có xu
variable will be finite, PLS tends to underestimate the hướng đánh giá thấp mối tương quan giữa các biến
correlations between the latent variables and tiềm ẩn và đánh giá quá thấp tải (tức là, các tham số
overestimate the loadings (i.e., the parameters of the của mô hình đo lường; Dijkstra, 1983). Chỉ khi số
measurement model; Dijkstra, 1983). Only when the lượng trường hợp trong mẫu và số lượng chỉ báo trên
number of cases in the sample and the number of mỗi biến tiềm ẩn tăng lên đến vô cùng thì các giá trị
indicators per latent variable increase to infinity do trường hợp biến tiềm ẩn mới tiếp cận giá trị thực và
the latent variable case values approach the true vấn đề này biến mất (Lohmöller, 1989).
values and this problem disappears (Lohmöller,
1989).
CHOICE BETWEEN COVARIANCEAND LỰA CHỌN GIỮA MÙA DỰA TRÊN
VARIANCE-BASED SEM COVARIANCEAND
Given this problem of consistency at large, one might Do vấn đề về tính nhất quán này nói chung, người ta
question the suitability of PLS and by right ask why a có thể đặt câu hỏi về tính phù hợp của PLS và đặt câu
technique that cannot guarantee one of the key hỏi ngay tại sao một kỹ thuật không thể đảm bảo một
features of any statistical model, namely, consistency trong những đặc điểm chính của bất kỳ mô hình thống
of estimators, should be presented to the reader of a kê nào, cụ thể là tính nhất quán của các công cụ ước
statistics journal at all. lượng, nên được trình bày cho người đọc thống kê. tạp
chí nào cả.
The answer to this question is that PLS comes into its Câu trả lời cho câu hỏi này là PLS chủ yếu đi vào các
own principally in situations in which covariance- tình huống trong đó các công cụ SEM dựa trên hiệp
based SEM tools reach their limit, namely, when the phương sai đạt đến giới hạn của chúng, cụ thể là khi
number of indicators per latent variable becomes số lượng chỉ báo trên mỗi biến tiềm ẩn trở nên quá
excessively large. lớn.
As stated earlier, the goal of covariance-based SEM Như đã nêu trước đó, mục tiêu của SEM dựa trên hiệp
is to determine the matrix of model parameters Φ in phương sai là xác định ma trận của các tham số mô
such a way that the resulting covariance matrix hình Φ theo cách sao cho ma trận hiệp phương sai
predicted by the theoretical model Σ(Φ) is as close as được dự đoán bởi mô hình lý thuyết Σ (Φ) càng gần
possible to the sample covariance matrix . For this, với ma trận hiệp phương sai mẫu  càng tốt. Đối với
one needs to define a discrepancy function F(, Σ), điều này, người ta cần xác định một hàm sai lệch F
which “takes on a value of zero only when S = Σ and (, Σ), hàm này “chỉ nhận giá trị bằng 0 khi S = Σ và
otherwise is positive, increasing as the difference ngược lại là dương, tăng khi sự khác biệt giữa S và Σ
between S and Σ increases” (MacCallum, Browne, & tăng lên” (MacCallum, Browne, & Sugawara, 1996,
Sugawara, 1996, p. 132). Given that the sample trang 132). Cho rằng ma trận hiệp phương sai mẫu
covariance matrix is based on p measured indicators, dựa trên p chỉ số đo được, hàm thường được sử dụng
the most commonly used such function is the normal- nhất là hàm khả năng xảy ra tối đa theo lý thuyết
theory maximum likelihood function, defined as thông thường, được định nghĩa là
(MacCallum et al., 1996).

Regarding the number of indicator sperlatent variable Về số lượng biến sperlatent của chỉ báo p, nhà nghiên
p, the researcher should try to identify as many of cứu nên cố gắng xác định bao nhiêu biến trong số
them aspossible, since “no serious work on path chúng là không thể chấp nhận được, vì “không có
models…can be done without using a very large công việc nghiêm túc nào về mô hình đường dẫn… có
number of indicators for each attribute” (McDonald, thể được thực hiện mà không sử dụng một số lượng
1996, p. 267). For example, the work of Marsh, Hau, rất lớn các chỉ số cho mỗi thuộc tính” (McDonald,
Balla, and Grayson (1998) gave an indication that 1996, trang 267). Ví dụ, công trình của Marsh, Hau,
more indicators per latent variable lead to fewer Balla và Grayson (1998) đã chỉ ra rằng nhiều chỉ số
improper solutions and more stable results, and hơn trên mỗi biến tiềm ẩn dẫn đến ít giải pháp không
similar findings were generated by Nasser and phù hợp hơn và kết quả ổn định hơn, và những phát
Wisenbaker (2003). Although in some areas, such as hiện tương tự cũng được tạo ra bởi Nasser và
management research, researchers rarely have more Wisenbaker (2003). Mặc dù trong một số lĩnh vực,
than a handful of indicators per unobservable variable chẳng hạn như nghiên cứu quản lý, các nhà nghiên
to their disposition (Baumgartner & Homburg, 1996), cứu hiếm khi có nhiều hơn một số ít các chỉ số cho
there are also disciplines in which this number can be mỗi biến không thể quan sát được đối với định vị của
very large, as many as 500 indicators per latent họ (Baumgartner & Homburg, 1996), cũng có những
variable or more. For example, Bookstein, Sampson, lĩnh vực mà con số này có thể rất lớn, tới 500 các chỉ
Streissguth, and Barr (1996) analyzed the influence of số cho mỗi biến tiềm ẩn trở lên. Ví dụ, Bookstein,
prenatal alcohol exposure on neurobehavioural Sampson, Streissguth và Barr (1996) đã phân tích ảnh
functioning by using 474 indicators to measure the hưởng của việc tiếp xúc với rượu trước khi sinh đối
latter construct. Another area in which this might be với chức năng vi khuẩn thần kinh bằng cách sử dụng
applicable is that of functional magnetic resonance 474 chỉ số để đo lường cấu trúc sau này. Một lĩnh vực
imaging studies in which brain functions (e.g., khác mà điều này có thể được áp dụng là nghiên cứu
remembrance, addiction) are analyzed by using a hình ảnh cộng hưởng từ chức năng trong đó các chức
“surrogate” hemodynamic response as an indicator for năng của não (ví dụ, ghi nhớ, nghiện) được phân tích
neuronal response (for an introduction into functional bằng cách sử dụng phản ứng huyết động “thay thế”
magnetic resonance imaging, see Parry & Matthews, như một chỉ báo cho phản ứng tế bào thần kinh (để
2000).
giới thiệu về từ chức năng chụp cộng hưởng, xem Parry & Matthews, 2000).
However, in these cases, the sample covariance Tuy nhiên, trong những trường hợp này, ma trận hiệp
matrix can easily reach a size that is difficult to handle phương sai mẫu có thể dễ dàng đạt đến kích thước
with conventional computer systems because based on khó xử lý với các hệ thống máy tính thông thường vì
p measured indicators the sample covariance matrix dựa trên p chỉ số đo được, ma trận hiệp phương sai
has p(p + 1)/2 distinct elements (i.e., p2 elements in của mẫu có p (p + 1) / 2 phần tử riêng biệt (tức là p2
total, excluding [p2 – p]/2 in the upper or lower phần tử tổng cộng, không bao gồm [p2 - p] / 2 trong
triangular matrix). ma trận tam giác trên hoặc dưới).
Using the example of a simple SEM with q = 5 latent Sử dụng ví dụ về SEM đơn giản với q = 5 biến tiềm
variables (similar to the one in Figure 1), each ẩn (tương tự như trong Hình 1), mỗi biến được đo
measured by 200 indicators, this results in bằng 200 chỉ số, kết quả là
200q (200q + 1)/2,
or 500,500 distinct elements of the sample covariance matrix. hoặc 500.500 phần tử riêng biệt của ma trận hiệp phương sai
mẫu.
Additionally, and probably more seriously, the Ngoài ra, và có lẽ nghiêm trọng hơn, sức mạnh thống
statistical power of such a model would be so large kê của một mô hình như vậy sẽ lớn đến mức thực tế
that it would in fact be impossible to apply any kind không thể áp dụng bất kỳ loại kiểm tra phù hợp nào
of fit test to judge overall model quality. để đánh giá chất lượng tổng thể của mô hình.
Using the preceding example, the minimum sample Sử dụng ví dụ trước, kích thước mẫu tối thiểu Nmin
size Nmin to estimate such a model would be để ước tính một mô hình như vậy sẽ là
Nmin = 200q, Nmin = 200q
or 1,000, as it is a necessary condition that the number hoặc 1.000, vì đây là điều kiện cần để số lượng trường
of cases at least exceeds the number of indicators, hợp ít nhất vượt quá số lượng chỉ số, vì nếu không thì
because otherwise the input matrix is not definite ma trận đầu vào không xác định (Marsh và cộng sự,
(Marsh et al., 1998). Additionally, the number of 1998). Ngoài ra, số bậc tự do có thể được xác định là
degrees of freedom can be determined as
df = [200q (200q + 1)/2] – 2 × 200q – k,
where k is the number of parameters in the structural trong đó k là số lượng tham số trong mô hình cấu trúc
model to be estimated because in the measurement được ước tính vì trong mô hình đo lường, mỗi chỉ số
model each indicator is associated with two được liên kết với hai tham số: (a) sai số đo (hoặc δ
parameters: (a) measurement error (either δ or ε) and hoặc ε) và (b) tải trên biến tiềm ẩn liên quan ( hoặc λx
(b) a loading on the associated latent variable (either hoặc λy). Trong trường hợp mô hình tương tự như mô
λx or λy). In the case of a model similar to the one hình trong Hình 1, mô hình kết cấu có k = 13 tham số
shown in Figure 1, the structural model has k = 13 được ước lượng, dẫn đến df = 498,487. Do đó, sức
parameters to be estimated, resulting in df = 498,487. mạnh thống kê để kiểm tra sự phù hợp của mô hình
Hence, the statistical power for the test of model fit dựa trên sai số trung bình-bình phương của phép xấp
based on root-mean-square error of approximation xỉ bằng cách sử dụng α = 0,05, ε0 = 0,05 và εa = 0,08
using α = .05, ε0 = 0.05, and εa = 0.08 (see (xem MacCallum và cộng sự, 1996, để biết thêm chi
MacCallum et al., 1996, for details), would be 1.0000. tiết), sẽ là 1,0000. Do đó, người ta có thể có thể phát
Therefore, one would probably be able to detect hiện lỗi làm tròn đến vị trí thứ 10 và mô hình sẽ có
rounding errors to the 10th place and the model would khả năng bị lỗi ngay cả với dữ liệu mô phỏng.
be likely to fail even with simulated data.
On the other hand, the problem of consistency at large parameters of the path model” (McDonald, 1996).
would no longer be an issue in PLS because “with a The PLS composite model would be very close to the
sufficiently large number of indicators, the choice of underlying factor model, and the distinction between
weights ceases to have any influence on the linear composites and underlying factors would
become vanishingly small. Therefore, the researcher bất kỳ ảnh hưởng nào đến các tham số của mô hình
would be well advised to use PLS instead of đường dẫn” (McDonald, 1996 ). Mô hình tổng hợp
covariance-based SEM in such situations. PLS sẽ rất gần với mô hình nhân tố cơ bản và sự khác
Recapitulating these arguments by using the words of biệt giữa vật liệu tổng hợp tuyến tính và các nhân tố
S. Wold (1993), H. Wold’s son, one can say that “the cơ bản sẽ trở nên rất nhỏ. Do đó, nhà nghiên cứu nên
natural domain for LV [latent variable] models such sử dụng PLS thay vì SEM dựa trên hiệp phương sai
as PLS … is where the number of ‘significant’ LV’s trong các tình huống như vậy. Tóm tắt lại những lập
is small, much smaller than the number of measured luận này bằng cách sử dụng các từ của S. Wold
variables … and than the number of observations.” (p. (1993), con trai của H. Wold, người ta có thể nói rằng
137). “miền tự nhiên cho các mô hình LV [biến tiềm ẩn]
như PLS… là nơi số lượng LV 'đáng kể' là nhỏ , nhỏ
Mặt khác, vấn đề về tính nhất quán nói chung sẽ
hơn nhiều so với số lượng biến được đo lường… và
không còn là vấn đề trong PLS vì “với một số lượng
so với số lượng quan sát. ” (tr. 137).
đủ lớn các chỉ số, việc lựa chọn trọng số không còn có
SUMMARY AND OUTLOOK
There are many additional points regarding PLS that Có nhiều điểm bổ sung liên quan đến PLS đáng được
deserve mention, we discuss briefly two of them in the đề cập, chúng ta sẽ thảo luận ngắn gọn về hai điểm
following paragraphs. For example, another situation trong số đó trong các đoạn sau. Ví dụ, một tình huống
in which PLS might be preferable to LISREL are khác trong đó PLS có thể được ưu tiên hơn LISREL là
cases in which constructs are measure dprimarily by các trường hợp trong đó các cấu trúc được đo lường
formativein dicators. This may be acommon chủ yếu bằng chất làm mờ formativein. Đây có thể là
occurrencein managerial research, as the work of sự xuất hiện phổ biến trong nghiên cứu quản lý, vì
Jarvis, MacKenzie, and Podsakoff (2003) gave an công trình của Jarvis, MacKenzie, và Podsakoff
indication that managerial constructs might be (2003) đã đưa ra một chỉ dẫn rằng cấu trúc quản lý có
reflected better by formative than by reflective thể được phản ánh tốt hơn bằng hình thức hơn là bằng
indicators. các chỉ số phản ánh.
As MacCallum and Browne (1993) showed, the Như MacCallum và Browne (1993) đã chỉ ra, sự
predominance of formative indicators may lead to chiếm ưu thế của các chỉ báo hình thành có thể dẫn
severe (identification) problems, implied covariances đến các vấn đề nghiêm trọng (nhận dạng), các hiệp
of zero among some indicators, and/or the existence phương sai ngụ ý bằng 0 giữa một số chỉ số và / hoặc
of equivalent models in covariance-based SEM. PLS, sự tồn tại của các mô hình tương đương trong SEM
in contrast, does not create problems with respect to dựa trên hiệp phương sai. Ngược lại, PLS không tạo
analyzing formative indicators and can therefore be ra các vấn đề về phổ phân tích các chỉ số hình thành
used for models with either reflective, formative ,or và do đó có thể được sử dụng cho các mô hình có
both types of indicators (Fornell&Bookstein,1982). phản xạ, định dạng hoặc cả hai loại chỉ thị (Fornell &
Bookstein, 1982).
One more area in which PLS is typically sizes. Although a detailed discussion of this point can
recommended is that of situations in which the sample only be made for each individual model based on
size is small. For covariance-based SEM, it is statistical power analysis, a Monte Carlo simulation
generally advisable that the “sample size should performed by Chin and Newsted (1999) indicated that
exceed 100 observations regardless of other data PLS can be performed with a sample size as low as
characteristics to avoid problematic solutions and 50, and H. Wold even “analysed 27 variables using
obtain acceptable fit concurrently” two latent constructs with a data set consisting of ten
(Nasser&Wisenbaker,2003,p.754), and many cases” (Chin, Marcolin, & Newsted, 2003a, Appendix
researcher seven recommend aminimum sample size A, p. 5). However, given the problem of consistency
of 200 cases (e.g., Marsh et al., 1998) to avoid results at large, the question of whether such results are
that cannot be interpreted, such as negative variance actually of any usability is very difficult to answer.
estimates (i.e., Heywood cases) or correlations
Một lĩnh vực nữa mà PLS thường được khuyến nghị
greater than one (i.e., improper solutions; Dillon,
là các tình huống trong đó cỡ mẫu nhỏ. Đối với SEM
Kumar, & Mulani, 1987). PLS, on the other hand, is
dựa trên hiệp phương sai, thông thường khuyến nghị
applicable even under conditions of very small sample
rằng “kích thước mẫu nên vượt quá 100 quan sát bất thảo luận chi tiết về điểm này cho từng mô hình riêng
kể các đặc điểm dữ liệu khác để tránh các giải pháp có lẻ dựa trên phân tích công suất thống kê, nhưng một
vấn đề và đồng thời có được sự phù hợp có thể chấp mô phỏng Monte Carlo được thực hiện bởi Chin và
nhận được” (Nasser & Wisenbaker, 2003, p.754), và Newsted (1999) chỉ ra rằng PLS có thể được thực hiện
nhiều nhà nghiên cứu bảy khuyến nghị aminimum cỡ với cỡ mẫu thấp tới 50 và H Wold thậm chí còn “đã
mẫu 200 trường hợp (ví dụ, Marsh và cộng sự, 1998) phân tích 27 biến bằng cách sử dụng hai cấu trúc tiềm
để tránh các kết quả không thể giải thích được, chẳng ẩn với một tập dữ liệu bao gồm mười trường hợp”
hạn như ước tính phương sai âm (ví dụ, trường hợp (Chin, Marcolin, & Newsted, 2003a, Phụ lục A, trang
Heywood) hoặc các tương quan lớn hơn một (tức là 5). Tuy nhiên, với vấn đề về tính nhất quán nói chung,
các giải pháp không phù hợp; Dillon, Kumar, & câu hỏi liệu các kết quả như vậy có thực sự có thể sử
Mulani, 1987). Mặt khác, PLS có thể áp dụng ngay cả dụng được hay không là rất khó trả lời.
trong điều kiện cỡ mẫu rất nhỏ. Mặc dù chỉ có thể
In summary, we hope that this article helps give Tóm lại, chúng tôi hy vọng rằng bài viết này sẽ giúp
readers a first impression about PLS analysis, the người đọc có ấn tượng đầu tiên về phân tích PLS, các
assumptions underlying this approach, and the giả định cơ bản của phương pháp này và những ưu
advantages it has compared to traditional covariance- điểm của nó so với SEM dựa trên hiệp phương sai
based SEM in certain situations. For additional truyền thống trong một số tình huống nhất định. Để
information, readers are referred to H. Wold’s (1975) biết thêm thông tin, độc giả được tham khảo bài trình
first presentation of PLS, Lohmöller’s (1989) bày đầu tiên của H. Wold’s (1975) về PLS, cuộc thảo
extensive discussion of this approach, and luận sâu rộng của Lohmöller’s (1989) về cách tiếp
MacDonald’s (1996) article regarding path analysis cận này và bài báo của MacDonald’s (1996) về phân
with composite variables. Readers who plan to use tích đường dẫn với các biến tổng hợp. Độc giả có kế
PLS for their own research are referred to PLS Graph hoạch sử dụng PLS cho nghiên cứu của riêng họ
(Chin, 2001), a freely available software tool with an được tham khảo PLS Graph (Chin, 2001), một công
intuitive graphical user interface. cụ phần mềm miễn phí có sẵn với giao diện người
dùng đồ họa trực quan.

3 PLS

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

3 PLS

Uploaded by

Copyright:

Available Formats

CHOICE BETWEEN COVARIANCEAND VARIANCE-BASED SEM

(MacCallum et al., 1996).

You might also like