You are on page 1of 12

79

ACCIN PSICOLGICA, junio 2015, vol. 12, n. 1, 79-90. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

ANLISIS FACTORIAL CONFIRMATORIO.


RECOMENDACIONES SOBRE MNIMOS
CUADRADOS NO PONDERADOS EN FUNCIN
DEL ERROR TIPO I DE JI-CUADRADO Y
RMSEA

CONFIRMATORY FACTOR ANALYSIS.


RECOMMENDATIONS FOR UNWEIGHTED
LEAST SQUARES METHOD RELATED TO CHI-
SQUARE AND RMSEA TYPE I ERROR

M. A. MORATA-RAMREZ1, FRANCISCO P. HOLGADO-TELLO1,


ISABEL BARBERO-GARCA1 Y GONZALO MENDEZ2

Resumen grado de asimetra de la distribucin de respuestas


(simtrica, asimtrica moderada y severa) y tamao
muestral (100, 150, 250, 450, 650, 850) de los modelos
En Psicologa, para obtener evidencias sobre validez de simulados. Segn los principales resultados, el ndice C2
constructo mediante Anlisis Factorial Confirmatorio es muestra siempre un error Tipo I mayor que RMSEA, con
habitual trabajar con variables ordinales que presentan independencia de los factores experimentales analizados.
asimetra. En este estudio de simulacin se analiza el Finalmente, se discuten diferentes alternativas de accin
comportamiento del mtodo de Mnimos Cuadrados no y se presentan futuras lneas de investigacin.
Ponderados (ULS) en escalas tipo Likert con base en los
ndices 2 de razn de verosimilitud (C2) y RMSEA. Palabras clave: Anlisis Factorial Confirmato-
Para ello, se han manipulado cuatro factores rio; mtodo ULS; escalas Likert; error Tipo I; ndice
experimentales: el nmero de factores o dimensiones (2, 2 de razn de verosimilitud; RMSEA.
3, 4, 5, 6), nmero de puntos de respuesta (3, 4, 5, 6),

Correspondencia: Francisco Pablo Holgado Tello. Universidad Nacional de Educacin a distancia.


Email: pfholgado@psi.uned.es
1
Universidad Nacional de Educacin a Distancia (UNED)
2
Universidad Complutense de Madrid

Recibido: 09 de abril de 2015


Aceptado: 24 de mayo de 2015

80
ACCIN PSICOLGICA, junio 2015, vol. 12, n.o12, 79-90. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

Abstract ajuste del modelo especificado tenga lugar una mayor o


menor aproximacin a la realidad emprica medida me-
In order to obtain evidences about construct validity diante los ndices globales de bondad de ajuste.
through Confirmatory Factor Analysis in Social Scienc-
es, working with skewed ordinal variables has been La normalidad multivariable de las variables observa-
usual. In this simulation study the performance of Un- das es un requisito para el uso de AFC mencionado por
weighted Least Squares (ULS) method in Likert scales Mulaik (1972) que se puede incumplir en escalas tipo
according to Likelihood Ratio Test (C2) and RMSEA Likert (Flora y Curran, 2004). En este sentido, la asime-
indices is analysed through Type I error. For this pur- tra en la distribucin de las variables observadas es uno
pose, four experimental factors have been manipulated: de los principales aspectos que distorsionan este supuesto
the number of factors or dimensions (2, 3, 4, 5, 6), the (Coenders y Saris, 1995). Precisamente, el mtodo de
number of response points (3, 4, 5, 6), the degree of estimacin de Mxima Verosimilitud (ML), que precisa
skewness of the responses distribution (symmetric, de normalidad multivariada, es el que se utiliza en la
moderately and severely asymmetric) and the sample mayora de Anlisis Factoriales Confirmatorios (Brown,
size (100, 150, 250, 450, 650, 850) of the simulated 2006).
models. According to the main results, C2 index always
shows a bigger Type I error than RMSEA, regardless of Otro de los supuestos para el uso del AFC, menciona-
the experimental factors analysed. Finally, different do por Mulaik (1972), establece que tanto las variables
action alternatives are discussed and future research latentes como observadas han de ser continuas. Sin em-
lines are presented. bargo, las escalas tipo Likert asumen que el constructo
latente es de naturaleza continua pero las variables obser-
Keywords: Confirmatory Factor Analysis; vadas que lo representan siguen una escala de medida
ULS method; Likert scales; Type I error; Likeli- ordinal (Coenders y Saris, 1995; DiStefano 2002; Flora y
hood Ratio Test; RMSEA. Curran, 2004). A pesar de ello, lo habitual ha sido tratar
las variables observadas como si tambin fueran conti-
nuas (Cea, 2004). As, el mtodo de estimacin de M-
xima Verosimilitud (ML) ha tenido un uso muy extendi-
Introduccin do (Ryu, 2011) pero, al ser necesario que los datos se
midan de acuerdo con una escala de medida de intervalo,
El anlisis factorial es el mtodo ms aplicado para quedara desaconsejado su uso cuando se utilizan escalas
obtener evidencias sobre validez de constructo, dado tipo Likert (Brown, 2006; Flora y Curran, 2004). Ade-
que informa sobre la estructura interna de los instrumen- ms, los mtodos de estimacin de parmetros que, como
tos de medida (Zumbo, 2007). ML, asumen que las variables observadas estn medidas
de acuerdo con una escala de medida de intervalo, basan
Grosso modo, en el Anlisis Factorial Confirmatorio sus clculos en la matriz de correlacin de Pearson (Hol-
(AFC) inicialmente se especifica e identifica el modelo. gado, Chacn, Barbero y Vila, 2010). A este respecto,
Tras la recogida de datos, se estiman los parmetros y, a Jreskog y Srbom (1996a) proponen, como alternativa
continuacin, se evala el ajuste del modelo. Si el mo- al uso de correlaciones de Pearson, recurrir a correlacio-
delo presenta un ajuste adecuado, se podr utilizar para nes policricas. Estas permiten superar los problemas que
evaluar e interpretar los parmetros. En caso contrario, conllevan su uso, ya analizados por Johnson y Creech
se modificar el modelo y de nuevo se iniciar el proce- (1983) y OBrien (1985) y tratados posteriormente en
so (Batista y Coenders, 2000; Barbero, Vila y Holgado, diferentes estudios (e.g., Coenders y Saris, 1995; Holga-
2011; Catena, Ramos y Trujillo, 2003; Fadlelmula, do et al., 2010).
2011).
Elegir el mtodo adecuado en la fase del AFC de es-
El AFC exige el cumplimiento de ciertos supuestos timacin de parmetros influir en gran medida en la fase
que, en su mayora, entran en contradiccin con la natu- posterior de evaluacin el ajuste del modelo terico espe-
raleza de los datos que habitualmente se obtienen en cificado. A este respecto, ante las dificultades que plantea
Psicologa mediante el uso de escalas tipo Likert (DiSte- el uso de escalas tipo Likert, se puede recurrir al mtodo
fano, 2002). La falta de coherencia entre las caractersti- de Mnimos Cuadrados no Ponderados (en ingls, Un-
cas del instrumento de recogida de datos -en este caso, weighted Least Squares o ULS). Se trata de un mtodo de
los cuestionarios con escalas tipo Likert- y los requisitos estimacin de parmetros para el que no est establecido
de uso del AFC cobra importancia en la fase del AFC de que las variables observadas deban seguir una distribu-
estimacin de parmetros al elegir el mtodo adecuado, cin determinada, que est recomendado para variables
pues de l depender en gran medida que al evaluar el categricas y que se basa en la matriz de correlaciones

81

ACCIN PSICOLGICA, junio 2015, vol. 12, n.o1, 79-92. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

policricas (Batista y Coenders, 2000; Bollen, 1989; ecuaciones estructurales. A la hora de determinar la bon-
Brown, 2006; Schumacker y Lomax, 1996). Adems del dad de ajuste tiene en cuenta los grados de libertad, por lo
mtodo ULS, cuando se manejan variables ordinales que este ndice es sensible al nmero de parmetros que
tambin se tienen en cuenta otros mtodos alternativos. estima el modelo (Barbero et al., 2011; Byrne, 1998; Cea,
Entre ellos, se puede destacar el mtodo RULS que, de 2004). En este sentido, los valores de RMSEA decrecen
acuerdo con Yang-Wallentin, Jreskog y Luo (2010), es conforme aumenta el nmero de grados de libertad o el
una variante robusta del mtodo ULS. Al igual que este tamao muestral (McCallum, Browne y Sugawara, 1996;
ltimo, RULS tambin trabaja con una matriz de corre- Kline, 2011). En general, valores en RMSEA menores de
laciones policricas, si bien estas correlaciones son el .05 indican un buen ajuste y los valores comprendidos
punto de partida para obtener posteriormente la matriz entre .05 y .08 un ajuste razonable (Browne y Cudeck,
de covarianzas asintticas AC que interviene en su ma- 1993).
triz W de distribucin libre. El programa LISREL pro-
porciona una serie de ndices 2 de razn de verosimili- En resumen, al llevar a cabo un AFC es preciso que
tud, entre los cuales aparece C3 (Jreskog, 2004), cono- haya consistencia entre los mtodos de estimacin y el
cido como estadstico 2 escalado de Satorra-Bentler instrumento de medida para que los modelos tericos
(Batista y Coenders, 2000) y cuyos ltimos desarrollos propuestos reproduzcan las relaciones entre las variables
corresponden a trabajos como los de Satorra y Bentler de un constructo con la mayor fidelidad posible. En rela-
(2010). Este ndice C3 es uno de los recursos disponi- cin con ello y dado los escasos estudios en los que se ha
bles cuando se manejan variables categricas o bien las analizado el error Tipo I y comportamiento de RMSEA
variables dependientes no siguen la distribucin normal cuando se usa ULS, este estudio de simulacin tiene co-
(Finney y DiStefano, 2013). A su vez, esta matriz AC mo objetivo analizar cmo afectan una serie de factores
tambin es el foco de atencin de estudios como el de experimentales que caracterizan los modelos tericos
Jennrick y Satorra (2014). (nmero de factores, nmero de puntos de respuesta,
grado de asimetra de la distribucin de respuestas a los
Adems de las aportaciones de Yang-Wallentin et al. tems y tamao muestral) sobre los valores del ndice de
(2010), cabe destacar tambin estudios acerca de RULS razn de verosimilitud 2 y de RMSEA.
como el de Savalei y Rhemtulla (2013). Entre los mto-
dos de estimacin de informacin limitada se cuenta con
una variante de RULS: el 3S-RULS (Katsikatsou, Mtodo
Moustaki, Yang-Wallentin y Jreskog, 2012), as como
tambin con un mtodo que frente a ML muestra buen Se manipularon 4 factores experimentales: (a) nmero
comportamiento ante errores de especificacin de los de factores o variables latentes, (b) nmero de puntos de
modelos: el 2SLS (Jung, 2013). respuesta, (c) grado de asimetra de la distribucin de las
respuestas a los tems, y (d) tamao muestral.
En cuanto a la fase de evaluacin del ajuste del mo-
delo del AFC, para conocer en qu grado hay una mayor El nmero de factores presentaba cinco niveles expe-
o menor aproximacin del modelo terico a la realidad rimentales (2, 3, 4, 5 y 6). Las factores guardaban una
emprica se dispone de una amplia variedad de ndices. relacin ortogonal entre ellos, es decir, no estaban corre-
Entre ellos, cabe destacar el ndice de razn de verosi- lacionados. Para cada factor se simularon tres tems, con
militud 2, procedente del mtodo ML, que es el nico el propsito de que pudieran ser identificados estadsti-
que aporta una prueba de significatividad estadstica camente. En este contexto, hay escalas de regulacin
(Cea, 2004; Ryu, 2011). El rechazo de la hiptesis nula emocional como el CERQ (Garnefski y Kraaij, 2007) que
a partir de un valor 2 significativo (p < .05) implica presentan un reducido nmero de tems (4) para medir
que el modelo terico propuesto es inadecuado, por lo cada una de sus nueve dimensiones. Tambin se encuen-
que es necesario especificarlo de nuevo (Batista y tran escalas con slo tres tems en psicologa de las orga-
Coenders, 2000; Cea, 2004). nizaciones (Holgado, Chacn, Barbero y Sanduvete,
2006).
Dadas las limitaciones del ndice de razn de vero-
similitud por su sensibilidad al tamao muestral y por Las saturaciones factoriales de los tems siempre eran
fundamentarse en la distribucin central de 2 (Bollen, las mismas en todos los factores, es decir, .9, .8 y .7 para
1989; Byrne, 1998), se recomienda complementar sus el primer, segundo y tercer tem, respectivamente. Los
resultados con otros ndices de bondad de ajuste. En este tems se generaron segn una distribucin normal N(0,
contexto, el ndice RMSEA o Error cuadrtico medio de 1). A continuacin, estas respuestas se categorizaron de
aproximacin por grado de libertad est reconocido acuerdo con una escala tipo Likert de 3, 4, 5 y 6 puntos,
como uno de los ms informativos de los modelos en es decir, el nmero de puntos de respuesta qued configu-

82
ACCIN PSICOLGICA, junio 2015, vol. 12, n.o12, 79-90. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

rado con cuatro niveles experimentales. Las escalas tipo Anlisis de datos
Likert se categorizaron de tal modo que: (a) se mantu-
viera simtrica la distribucin de las respuestas a todos
los tems, (b) la distribucin de respuestas presentara El error Tipo I se obtuvo calculando el porcentaje de
asimetra moderada en todos los tems o (c) la distribu- veces que se rechaza la hiptesis nula del ndice de razn
cin de respuestas presentara asimetra severa en todos de verosimilitud 2 en modelos especificados correcta-
los tems. De esta forma el grado de asimetra presenta- mente. A este respecto se ha considerado el valor nominal
ba tres niveles experimentales: asimetra = 0, asimetra del 5%, que en la prctica se traduce en una probabilidad
= 1 (o moderada) y asimetra = 2 (o severa). inferior a .05. Cabe recordar que al utilizar el mtodo
ULS el programa LISREL denomina a este valor 2 co-
Para categorizar las escalas Likert, siguiendo a Bo- mo C2, tambin conocido como Normal Theory Weigh-
llen y Barb (1981), el continuum se dividi en intervalos ted Least Squares Chi-Square (Jreskog, 2004). Por otra
iguales desde z = -3 a z = 3 con el fin de calcular los parte, para plantear la hiptesis nula respecto al ndice
umbrales de la condicin en la que la distribucin de RMSEA se ha determinado que se acepten los modelos
respuestas a todos los tems fuera simtrica (asimetra = tericos cuando su valor es inferior a .08. As, dentro de
0). Para distribuciones asimtricas los umbrales se cal- los modelos aceptados se incluyen tambin aquellos que
cularon, de acuerdo con Muthn y Kaplan (1985), de presentan, siguiendo a Browne y Cudeck (1993), un ajus-
manera que las observaciones se acumularan en uno de te razonable.
los extremos de los puntos de respuesta conforme el
grado de asimetra se incrementara. La mitad de las
variables de cada factor se categorizaron con la misma Resultados
asimetra positiva y el resto de variables con la misma
asimetra negativa con el propsito de simular factores
Influencia del nmero de factores
de dificultad. Finalmente, el tamao muestral presentaba
seis valores experimentales: 100, 150, 250, 450, 650 y
En la Tabla 1 se presenta un anlisis del error Tipo I
850 sujetos.
en C2 y en RMSEA segn el nmero de factores de los
modelos tericos a prueba. Adems, en la tabla se indica
La combinacin de los cuatro factores experimenta-
la media y desviacin tpica de la probabilidad asociada a
les (nmero de factores, nmero de puntos de respuesta,
C2 y RMSEA para cada uno de los niveles del factor.
asimetra de los tems y tamao muestral) produjo 360
condiciones experimentales (5x4x3x6) que se replicaron Como se puede ver en la Tabla 1, el valor porcentual
en 500 ocasiones. Para ello, estas replicaciones se reali- del error Tipo I aumenta a medida que lo hace el nmero
zaron mediante la versin 2.12.0 del programa R (R de factores. Concretamente, la probabilidad de rechazar
Development Core Team, 2010), que invocaba sucesi- un modelo correcto se eleva del 58.9% para modelos con
vamente a PRELIS 2.0 (Jreskog y Srbom, 1996b) dos factores al 93.9% para modelos con seis factores. Por
para la generacin de las correspondientes matrices de tanto, se deduce que a medida que crece el nmero de
datos de acuerdo con la especificaciones resultantes de factores se observa una tendencia decreciente en la acep-
la combinacin de las condiciones experimentales. Para tacin de modelos mediante el ndice 2 de razn de ve-
cada matriz generada se obtena la matriz de correlacio- rosimilitud. As, de aceptar el 41.1% de modelos con 2
nes policricas. factores se desciende al 6.1% con seis factores. Esta ten-
dencia es coherente con las medias obtenidas respecto al
Una vez obtenidas las matrices de correlaciones para nmero de factores. De esta forma, cuando el nmero de
cada matriz de datos generada bajo las especificaciones factores es dos, el valor medio de la probabilidad asocia-
concretas de los factores experimentales, se ejecut el da a C2 es .145 mientras que, a medida que aumentan los
correspondiente Anlisis Factorial Confirmatorio suce- factores del modelo terico, la probabilidad asociada a
sivamente, es decir, hasta 500 veces (uno por cada repli- C2 va disminuyendo.
cacin). Al igual que en el caso anterior, se utiliz la
versin 2.12.0 del programa R (R Development Core En cuanto al ndice RMSEA, el valor porcentual del
Team, 2010), que invocaba sucesivamente a LISREL error Tipo I se mantiene en valores en torno al 35-37%
8.8 (Jreskog y Srbom, 1996a). aproximadamente. Consecuentemente, se constata que el
porcentaje de aceptacin de los modelos se sita hacia el
Para facilitar la gestin y compilacin de ficheros de 62-64%, independientemente del nmero de factores que
ndices de ajuste se gener un programa especfico en presenten. Por su parte, las medias de RMSEA se man-
lenguaje JAVA. tienen estables independientemente del nmero de facto-
res.

83

ACCIN PSICOLGICA, junio 2015, vol. 12, n.o1, 79-92. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

Tabla 1

Influencia del nmero de factores

Factores Media Desv. tp. Error Tipo I (%)


2 .145 .233 58.9
3 .069 .164 78.0
4 .039 .122 86.4
C2
5 .023 .090 90.9
6 .014 .067 93.9
Total .058 .155
2 .078 .071 37.6
3 .075 .058 35.5
4 .077 .056 36.2
RMSEA
5 .079 .056 36.5
6 .078 .056 35.9
Total .077 .060
Nota. Media: Valor medio de la probabilidad asociada a cada ndice de bondad de ajuste. Desv. Tpica: Desviacin
tpica de la probabilidad asociada a cada ndice de bondad de ajuste. Error Tipo I (%): Porcentaje de modelos con
2
buen ajuste que son rechazados. C2: ndice de razn de verosimilitud obtenido para el mtodo ULS. RMSEA: Error
cuadrtico medio de aproximacin por grado de libertad.
te a modelos con seis puntos baja al 70.5%. En otras pa-
Influencia del nmero de puntos de respuesta labras, con un mayor nmero de puntos de respuesta
disminuye la probabilidad de rechazar un modelo. As, el
En la Tabla 2 se presentan los resultados relativos al porcentaje de modelos aceptados va ascendiendo confor-
nmero de puntos de respuesta de los modelos. me lo hace el nmero de puntos de respuesta, siendo
dicho porcentaje del 7.4% para tales modelos con tres
Al utilizar el ndice 2 de razn de verosimilitud, el puntos de respuesta y del 29.5% para modelos con seis
error Tipo I desciende a medida que los modelos teri- puntos. En este contexto, conforme crece el nmero de
cos presentan un mayor nmero de puntos de respuesta. puntos de respuesta los valores medios de la probabilidad
As, mientras el porcentaje de aceptacin de los modelos asociada a C2 tambin experimentan un incremento. As,
con tres puntos de respuesta es 92.6%, el correspondien- dichos valores pasan de .021 para modelos con tres pun-
tos de respuesta a .099 para modelos con seis puntos.

Tabla 2

Influencia del nmero de puntos de respuesta

Error Tipo I
Puntos de respuesta Media Desv. tp.
(%)
3 .021 .091 92.6
4 .041 .128 86.2
C2 5 .072 .169 76.9
6 .099 .198 70.5
Total .058 .155
3 .095 .069 48.3
4 .084 .062 39.6
RMSEA 5 .069 .052 31.1
6 .061 .048 26.3
Total .077 .060
Nota. Media: Valor medio de la probabilidad asociada a cada ndice de bondad de ajuste. Desv. Tpica: Desviacin
tpica de la probabilidad asociada a cada ndice de bondad de ajuste. Error Tipo I (%): Porcentaje de modelos con
2
buen ajuste que son rechazados. C2: ndice de razn de verosimilitud obtenido para el mtodo ULS. RMSEA: Error
cuadrtico medio de aproximacin por grado de libertad.

84
ACCIN PSICOLGICA, junio 2015, vol. 12, n.o12, 79-90. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

Tabla 3

Influencia del grado de asimetra

Asimetra Media Desv. tp. Error Tipo I (%)


0 .140 .220 57.3
1 .028 .105 90
C2
2 .006 .046 97.5
Total .058 .155
0 .041 .029 10.7
1 .074 .042 36.3
RMSEA
2 .117 .072 62.1

Total .077 .060


Nota. Media: Valor medio de la probabilidad asociada a cada ndice de bondad de ajuste. Desv. Tpica: Desviacin
tpica de la probabilidad asociada a cada ndice de bondad de ajuste. Error Tipo I (%): Porcentaje de modelos con
2
buen ajuste que son rechazados. C2: ndice de razn de verosimilitud obtenido para el mtodo ULS. RMSEA: Error
cuadrtico medio de aproximacin por grado de libertad.
Con RMSEA, cuanto mayor es el nmero de puntos aceptados con distribuciones simtricas al 10 % cuando la
de respuesta, menor ser la probabilidad de cometer el distribucin de respuestas de los modelos tericos presen-
error Tipo I. Concretamente, el porcentaje de modelos ta asimetra moderada. Asimismo, cabe sealar que los
rechazados desciende del 48.3% para modelos con tres valores medios de la probabilidad asociada a C2 dismi-
puntos de respuesta al 26.3% de modelos que tienen seis nuyen conforme aumenta la asimetra de la distribucin
puntos. Por esta razn hay una tendencia creciente en la de respuestas. Concretamente, de .140 para distribuciones
cantidad de modelos aceptados conforme aumenta el simtricas se pasa a .006 para distribuciones con asime-
nmero de puntos de respuesta. As, se puede deducir tra severa.
que se acepta el 51.7% de estos modelos con 3 puntos
de respuesta y el 73.7% de modelos con 6 puntos. Por su Por lo que respecta al ndice RMSEA, el error Tipo I
parte, la tendencia mostrada por las medias de RMSEA va aumentando con el grado de asimetra, siendo del
es descendente a medida que se cuenta con ms puntos 10.7% y del 62.1% para modelos tericos con distribu-
de respuesta. cin simtrica y asimtrica severa, respectivamente. Por
tanto, se deduce un descenso en el porcentaje de acepta-
Influencia del grado de asimetra cin de los modelos, que desciende del 89.3% para mode-
los con distribucin simtrica al 37.9% para modelos con
La Tabla 3 muestra los resultados obtenidos en rela- asimetra severa en su distribucin de respuestas. Igual-
cin con el grado de asimetra de la distribucin de res- mente, se observan incrementos en el valor medio de
puestas a todos los tems que presentan los modelos RMSEA, a medida que aumenta la asimetra de la distri-
tericos. bucin de respuestas.

En relacin con el grado de asimetra de la distribu-


cin de respuestas, el ndice 2 de razn de verosimili- Influencia del tamao muestral
tud muestra que el error Tipo I aumenta a medida que
tambin se incrementa la asimetra de la distribucin de La Tabla 4 muestra los resultados relacionados con el
las respuestas, especialmente cuando la distribucin de tamao muestral de los modelos tericos.
los modelos pasa de ser simtrica (siendo su porcentaje
de rechazo del 57.3%) a tener asimetra moderada (con En cuanto al ndice 2 de razn de verosimilitud la
un porcentaje de rechazo del 90%). En otras palabras, a elevada probabilidad de cometer el error Tipo I permane-
medida que aumenta el grado de asimetra, es ms pro- ce estable hacia el 80-82%, con independencia del tama-
bable rechazar un modelo torico. En este sentido, el o muestral de los modelos tericos a prueba. En relacin
ndice 2 tiene mal comportamiento, disminuyendo el con ello, no se observa consecuentemente relacin entre
porcentaje de aceptacin de tales modelos a medida que el tamao muestral y el porcentaje de aceptacin de los
el grado de asimetra es mayor. Puede deducirse as un modelos, que oscila entre el 17% y el 19% aproximada-
descenso muy acentuado al pasar del 42.7% de modelos mente. La estabilidad en los resultados tambin queda

85

ACCIN PSICOLGICA, junio 2015, vol. 12, n.o1, 79-92. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

Tabla 4

Influencia del tamao muestral

Muestra Media Desv. tp. Error Tipo I


(%)
100 .056 .151 81.7
150 .056 .152 82.3
250 .057 .155 82.1
C2 450 .058 .156 81.7
650 .061 .156 80.6
850 .060 .158 81.1
Total .058 .155
100 .133 .087 74.5
150 .106 .058 65.7
250 .079 .042 46.4
RMSEA 450 .059 .035 23.3
650 .046 .023 6.6
850 .043 .029 4.4
Total .077 .060
Nota. Media: Valor medio de la probabilidad asociada a cada ndice de bondad de ajuste. Desv. Tpica: Desviacin tpica
de la probabilidad asociada a cada ndice de bondad de ajuste. Error Tipo I (%): Porcentaje de modelos con buen ajuste
2
que son rechazados. C2: ndice de razn de verosimilitud obtenido para el mtodo ULS. RMSEA: Error cuadrtico
medio de aproximacin por grado de libertad.

reflejada en los valores medios de probabilidad asociada Anova Multivariante de los factores manipulados.
a C2, que oscilan entre .056 y .061. Efectos principales y de interaccin.
Por otra parte, para RMSEA se observa una dismi- Finalmente, con el objetivo de determinar la influen-
nucin en el error Tipo I a medida que el nmero de cia de los factores manipulados sobre los ndices de ajus-
sujetos de los modelos es mayor. De hecho, mientras te, se realiz un Anova Multivariante en el que las varia-
que para muestras con 100 sujetos se rechaza el 74.5% bles independientes fueron el nmero de factores, el n-
de modelos, para 450 sujetos este porcentaje disminuye mero de categoras, la asimetra y el tamao muestral y
al 23.3%. Para muestras con 650 y 850 sujetos el por- las variables dependientes fueron las probabilidades del
centaje de rechazo de modelos tericos contina dismi- valor Chi-Cuadrado C2 y el ndice de ajuste RMSEA (ver
nuyendo, pues sus valores son del 6.6% y 4.4%, respec- Tabla 5). Dado el elevado nmero de replicaciones reali-
tivamente. De ah puede deducirse que el porcentaje de zado, es de esperar que todos los efectos fueran significa-
aceptacin de los modelos mediante RMSEA va incre- tivos. Por ello, se us la eta cuadrado parcial como medi-
mentndose conforme aumenta el tamao de la muestra, da del tamao del efecto. Cohen (1988) establece que un
de manera que se acepta ms de la mitad de modelos tamao del efecto igual o superior a 0.14 es suficiente-
tericos a partir de 250 sujetos. En cuanto a los valores mente grande como para ser tenido en cuenta; por el con-
medios de la probabilidad asociada al ndice RMSEA, trario, tamaos iguales o inferiores a 0.01 son pequeos y
puede observarse que se da una disminucin en tales valores en torno a 0.06 son medianos. As, nos centrare-
valores a medida que se incrementa el tamao muestral. mos en aquellos efectos cuyo tamao sea igual o superior
De esta manera, mientras que para muestras de 100 a 0.14.
sujetos se obtiene un valor medio de .133, para muestras Tal y como se observa en la Tabla 5, no encontramos
de 850 sujetos tal valor ha disminuido a .043. un efecto relevante para el nmero de factores y s para el
nmero de categoras en RMSEA (2 = .144), el grado de
asimetra para C2 (2 = .186) y RMSEA (2 = .516) y,
tal y como cabra esperar, el tamao muestral afecta sig-
nificativamente a RMSEA (2 = .536).


86
ACCIN PSICOLGICA, junio 2015, vol. 12, n.o12, 79-90. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

Tabla 5

Anova Multivariante. Efectos principales y de interaccin

Suma de Eta al
Variable Media
Fuente cuadrados gl F Significacin cuadrado
dependiente cuadrtica
tipo III parcial
C2 396.656 4 99.164 6616.689 .000 .129
Factores
RMSEA .536 4 .134 144.500 .000 .003
C2 152.541 3 50.847 3392.751 .000 .054
Categoras
RMSEA 27.846 3 9.282 10016.355 .000 .144
C2 611.444 2 305.722 20399.212 .000 .186*
Simetra
RMSEA 177.206 2 88.603 95611.980 .000 .516*
C2 1.438 5 .288 19.195 .000 .001
Muestra
RMSEA 191.385 5 38.277 41305.083 .000 .536*
Factores * cate- C2 25.110 12 2.092 139.620 .000 .009
goras RMSEA 5.242 12 .437 471.391 .000 .031
Factores * sime- C2 199.355 8 24.919 1662.735 .000 .069
tra RMSEA .479 8 .060 64.654 .000 .003
Categoras * C2 172.814 6 28.802 1921.821 .000 .060
simetra RMSEA 1.082 6 .180 194.614 .000 .006
Factores * cate- C2 29.206 24 1.217 81.197 .000 .011
goras * simetra RMSEA 3.489 24 .145 156.888 .000 .021
Factores * C2 1.790 20 .089 5.971 .000 .001
muestra RMSEA 2.829 20 .141 152.653 .000 .017
Categoras * C2 1.271 15 .085 5.652 .000 .000
muestra RMSEA 9.055 15 .604 651.395 .000 .052
Factores * cate- C2 3.872 60 .065 4.306 .000 .001
goras * mues-
tra RMSEA 6.278 60 .105 112.905 .000 .036
Simetra * C2 1.572 10 .157 10.491 .000 .001
muestra RMSEA 40.657 10 4.066 4387.305 .000 .197*
Factores * sime- C2 1.915 40 .048 3.195 .000 .001
tra * muestra RMSEA 1.372 40 .034 37.010 .000 .008
Categoras * C2 1.275 30 .043 2.836 .000 .000
simetra * mues-
tra RMSEA 2.116 30 .071 76.117 .000 .013
Factores * cate- C2 5.111 117 .044 2.915 .000 .002
goras * simetra
* muestra RMSEA 4.487 117 .038 41.380 .000 .026
C2 2684.584 179128 .015
Error
RMSEA 165.996 179128 .001
C2 4907.381 179485
Total
RMSEA 1713.805 179485
Nota. Segn Cohen (1988) un tamao del efecto igual o superior a 0.14 es suficientemente grande como para ser
tenido en cuenta, tamaos iguales o inferiores a 0.01 son pequeos y valores en torno a 0.06 son medianos.

Descriptivamente, tal y como se ha visto anterior- Si bien los efectos principales son interesantes, y al
mente, el ndice RMSEA aumenta conforme crece el menos a nivel descriptivo se han visto en las tablas ante-
grado de asimetra, de tal manera que solamente son riores, los de interaccin no son menos. En este sentido,
rechazados los modelos con asimetra severa. Por otro slo hay un efecto de interaccin relevante para la com-
lado, a medida que aumenta el tamao muestral binacin de los niveles de simetra en funcin del tamao
RMSEA disminuye significativamente. muestral que afecta a RMSEA (2 = .197).


87

ACCIN PSICOLGICA, junio 2015, vol. 12, n.o1, 79-92. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

En este sentido, cuanto menor es el tamao muestral muestral del modelo torico sea el mayor posible.
del modelo mayor es el valor de RMSEA. El valor de No obstante, debemos ser cautelosos con la conclu-
RMSEA aumenta en un nivel parecido entre los diferen- sin anterior, pues en el clculo del ndice RMSEA inter-
tes tamaos muestrales conforme aumenta el grado de vienen los grados de libertad y el tamao muestral. En
asimetra, excepto para tamaos muestrales pequeos este sentido, cuanto mayor sea el tamao muestral y los
que aumenta en mayor medida que el resto cuando la grados de libertad del modelo terico a prueba, menor
asimetra es mayor. Esta relacin se describe en la Figu- ser el valor de RMSEA y, por consiguiente, el ajuste
ra 1. Como se puede observar, segn este ndice de ajus- ser mayor (Kline, 2011; MacCallum, et al., 1996). Por
te se aceptaran los modelos con distribucin de res- tanto, para interpretar los resultados obtenidos mediante
puestas simtrica, los modelos de 450 a 850 sujetos RMSEA habra que atender a la complejidad del modelo,
cuya distribucin tiene asimetra moderada (los modelos indicada por los grados de libertad (Byrne, 1998).
de 250 sujetos se encuentran prximos al punto de corte Respecto a lo anterior, una de las limitaciones del pre-
de .08) y los modelos de 450 a 850 sujetos con asimetra sente estudio es el no haber tenido en cuenta la influencia
severa en la distribucin de respuestas. de la interaccin entre diferentes factores experimentales
sobre el error Tipo I cometido. As, en la Tabla 3 se ob-
serva que cuando la distribucin de respuestas de las
variables observadas pasa de ser simtrica a tener asime-
Discusin tra moderada, la probabilidad de rechazar los modelos
tericos a prueba sufre un incremento, mucho ms mar-
De acuerdo con los resultados, el error Tipo I que cado para C2. En este sentido, se constata que el test del
muestra el ndice C2 es siempre mayor que el de ndice 2 de razn de verosimilitud, dado que procede del
RMSEA para cualquiera de los factores experimentales mtodo ML, es tambin sensible al hecho de que la dis-
analizados. En el caso concreto del tamao muestral, se tribucin de las variables observadas se encuentre aleja-
hace patente la sensibilidad del estadstico de ajuste 2 das de la distribucin normal multivariable (Schumacker
hacia dicho factor experimental, la cual da lugar a que y Lomax, 1996; Ryu, 2011) aunque tambin sera intere-
cuando se trabaja con muestras grandes se tienda a re- sante conocer la influencia mutua entre, por ejemplo,
chazar los modelos tericos propuestos (Bollen, 1989; grado de asimetra y tamao muestral. En relacin con
Hu y Bentler, 1995). De hecho, para cualquiera de los ello, otra de las limitaciones del presente estudio relacio-
tamaos muestrales analizados, con el ndice 2 de ra- nadas con el anlisis del grado de asimetra radica en que
zn de verosimilitud se rechaza aproximadamente el debera haberse tenido en cuenta tambin la curtosis,
80% de modelos a prueba. En cambio, con el ndice como sealan Wright y Herrington (2011).
RMSEA el porcentaje de rechazo de los modelos dismi-
nuye a medida que se incrementa el nmero de sujetos. Otro aspecto que debe tenerse presente acerca del n-
Por tanto, de acuerdo con RMSEA, para cometer el dice 2 de razn de verosimilitud es el hecho de que di-
menor error Tipo I parece recomendable que el tamao cho ndice se basa en la distribucin central de 2. Esto


Figura 1. Efecto de la simetra por tamao muestral sobre RMSEA

88
ACCIN PSICOLGICA, junio 2015, vol. 12, n.o12, 79-90. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

significa que se asume un ajuste perfecto del modelo de factores y el grado de asimetra. No obstante, empeora
terico propuesto, es decir, que se mantiene la hiptesis cuando crece el nmero de puntos de respuesta de la es-
nula de la prueba estadstica vinculada a dicho ndice de cala.
ajuste (Byrne, 1998). En la prctica, cualquier pequeo
desajuste del modelo propuesto unido a un tamao 3. De acuerdo con RMSEA, se aceptan modelos
muestral elevado va a incrementar la probabilidad de tericos cuyo tamao muestral oscila entre 450 y 850
que tal modelo sea rechazado (Barbero et al., 2011). En sujetos, con independencia del grado de asimetra que
este punto caber recordar que la potencia de la prueba presente la distribucin de respuestas. Sin embargo, es
2 se interpreta como la probabilidad de descubrir res- necesario que dicha distribucin sea simtrica para que se
tricciones incorrectas o parmetros que deban ser aadi- acepten los modelos con muestras a partir de 100 sujetos.
dos en el modelo (Batista y Coenders, 2000). En rela-
cin con ello, Fadlelmula (2011) indica que la acepta- En cualquier caso, es necesario obtener informacin
cin o el rechazo de la hiptesis nula para determinar si complementaria acerca de la potencia del estudio para
un modelo tiene buen ajuste se interpreta de manera determinar si el modelo terico propuesto encaja con los
diferente de acuerdo con el nivel de potencia. Conse- datos empricos.
cuentemente, sera interesante incorporar el estudio de
la potencia en futuros trabajos de simulacin donde se
comparen modelos mal especificados con modelos bien
especificados. En esta lnea, en el estudio de Nestler Referencias
(2013) se comparan entre s diferentes mtodos de esti-
macin aplicados a modelos cuyos tems son de res-
puesta dicotmica. Barbero, M. I., Vila, E. y Holgado, F. P. (2011). In-
troduccin bsica al anlisis factorial [Basic in-
En cuanto al mtodo de estimacin utilizado en el troduction to factor analysis]. Madrid, Espaa:
presente estudio, ULS contribuye a que los resultados UNED.
del ndice RMSEA no estn distorsionados aunque el
tamao muestral sea elevado (Simsek y Noyan, 2012). Batista, J. M. y Coenders, G. (2000). Modelos de
ecuaciones estructurales [Structural equation mo-
En resumen, cuando se utiliza ULS hay que tener en dels]. Madrid, Espaa: La Muralla.
cuenta que cuando los modelos presenten muchas di-
mensiones latentes, las variables de respuesta tengan Bollen, K. A. (1989). Structural equations with latent
pocos puntos de respuesta y sean asimtricas es proba- variables. New York: Wiley.
ble que, aunque el modelo sea correcto, sea rechazado
segn C2. Por otro lado, cuando los tems presenten Bollen, K. A. y Barb, K. H. (1981). Pearson's r and
pocos puntos de respuesta, sean asimtricos y el tamao coarsely categorized measures. American Socio-
muestral sea reducido, es probable que RMSEA aconse- logical Review, 46(2), 232-239. doi:
je rechazar el modelo aun cuando sea correcto. Un as- 10.2307/2094981
pecto a destacar es que, si bien las dimensiones simula-
das estaban incorrelacionadas, en mbitos como la Psi- Brown, T. A. (2006). Confirmatory factor analysis for
cologa es frecuente que los conceptos medidos guarden applied research. New York: Guildford Press.
una relacin oblicua, esto es, estn relacionados entre s,
compartiendo algn porcentaje de variabilidad. Browne, M. W. y Cudeck, R. (1993). Alternative
Por dar algunas recomendaciones prcticas que de- ways of assessing model fit. En K. A. Bollen y J.
beran ser tenidas en cuenta a la hora de interpretar S. Long (Eds.), Testing structural equation models
RMSEA y C2 en funcin del modelo que se est eva- (pp. 136-162). Newbury Park, CA: Sage.
luando, podemos indicar que:
Byrne, B. M. (1998). Structural equation modeling
1. RMSEA es un ndice de ajuste que funciona co- with LISREL, PRELIS, and SIMPLIS: Basic Con-
rrectamente independientemente del nmero de factores cepts, applications and programming. Londres,
y que mejora conforme aumentan el nmero de puntos UK: Lawrence Erlbaum Associates.
de respuesta de la escala y el tamao muestral. Sin em-
bargo, a mayor asimetra, empeora su comportamiento. Catena, A., Ramos, M. M. y Trujillo, H. M. (2003).
Anlisis multivariado. Un manual para investiga-
2. C2 es relativamente independiente del nmero dores [Multivariate analysis. A handbook for re-
de sujetos y mejora conforme se incrementa el nmero searchers]. Madrid, Espaa: Biblioteca Nueva.

89

ACCIN PSICOLGICA, junio 2015, vol. 12, n.o1, 79-92. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

ing polychoric correlations. European Journal of


Cea, M. A. (2004). Anlisis multivariable. Teora y Psychological Assessment, 22(4), 268-279. doi:
prctica en la investigacin social [Multivariate 10.1027/1015-5759.22.4.268
analysis. Theory and practice in social research].
Madrid, Espaa: Sntesis. Holgado, F. P., Chacn, S., Barbero, I. y Vila, E.
(2010). Polychoric versus Pearson correlations in
Cohen, J. (1988). Statistical power analysis for the exploratory and confirmatory factor analysis of or-
behavioral sciences (2 Ed.). New Jersey: La- dinal variables. Quality and Quantity, 44(1), 153-
wrence Erlbaum Associates. 166. doi: 10.1007/s11135-008-9190-y

Coenders, G., y Saris, W. E. (1995). Categorization Hu, L. y Bentler, P. M. (1995). Evaluating model fit.
and measurement quality. The choice between En R. H. Hoyle (Ed.), Structural equation model-
Pearson and Polychoric correlations. En W. E. ing: Concepts, issues, and applications (pp. 76-
Saris y . Mnnich (Eds.), The Multitrait- 99). Thousand Oaks, CA: Sage.
Multimethod approach to evaluate measurement
instruments (pp. 125-144). Budapest, Hungra: Jennrich, R. y Satorra. A. (2014). The nonsingularity
Etvs University Press. of in covariance structure analysis of nonnormal
data. Psychometrika, 79(1), 51-59. doi:
DiStefano, C. (2002). The impact of categorization 10.1007/s11336-013-9353-1
with confirmatory factor analysis. Structural
Equation Modeling, 9(3), 327-346. doi: Johnson, D. R. y Creech, J. C. (1983). Ordinal
10.1207/S15328007SEM0903_2 measures in multiple indicator models: A simula-
tion study of categorization error. American Socio-
Fadlelmula, F. K. (2011). Assessing power of struc- logical Review, 48, 398-407. doi:
tural equation modeling studies: A meta-analysis. 10.2307/2095231
Educational Research Journal, 1(3), 37-42.
Jreskog, K. G. y Srbom, D. (1996a). LISREL 8: Us-
Flora, D. B. y Curran, P. J. (2004). An empirical er's reference guide. Chicago: Scientific Software
evaluation of alternative methods of estimation International.
for confirmatory factor analysis with ordinal data.
Psychological Methods, 9(4), 466-491. doi: Jreskog, K. G. y Srbom, D. (1996b). PRELIS 2:
10.1037/1082-989X.9.4.466 User's reference guide. Chicago: Scientific Soft-
ware International.
Garrido, L. E. (2012). Dimensionality assessment of
ordinal variables: An evaluation of classic and Jreskog, K. G. (2004). On Chi-Squares for the inde-
modern methods (Tesis doctoral). Universidad pendence model and fit measures in LISREL. Re-
Autnoma de Madrid, Madrid. cuperado de
http://www.ssicentral.com/lisrel/techdocs/ftb.pdf
Finney, S. J. y DiStefano, C. (2013). Nonnormal and
categorical data in structural equation modeling. Jung, S. (2013). Structural equation modeling with
En G. R. Hancock y R. O. Mueller (Eds.). Struc- small sample sizes using two-stage ridge least-
tural equation modeling: A second course (2 squares estimation. Behavior Research Methods,
Ed.) (pp. 439-492). Greenwich, CT: Information 45(1), 75-81. doi: 10.3758/s13428-012-0206-0
Age Publishing.
Katsikatsou, M., Moustaki, I., Yang-Wallentin, F. y
Garnefski, N. y Kraaij, V. (2007). The Cognitive Jreskog, K. G. (2012). Pairwise likelihood esti-
Emotion Regulation Questionnaire: Psychometric mation for factor analysis models with ordinal da-
features and prospective relationships with de- ta. Computational Statistics and Data Analysis,
pression and anxiety in adults. European Journal 56(12), 4243-4258. doi:
of Psychological Assessment, 23(3), 141-149. 10.1016/j.csda.2012.04.010
doi: 10.1027/1015-5759.23.3.141
Kline, R. B. (2011). Principles and practice of struc-
Holgado, F. P., Moscoso, S., Barbero, M. I. y San- tural equation modeling (3 Ed.). New York: The
duvete, S. (2006). Training Satisfaction Rating Guilford Press.
Scale: Development of a measurement model us-

90
ACCIN PSICOLGICA, junio 2015, vol. 12, n.o12, 79-90. ISSN: 1578-908X http://dx.doi.org/10.5944/ap.12.1.14362

Liu, X. S. (2012). Implications of statistical power Schumacker, R. E. y Lomax, R. G. (1996). A begin-


for confidence intervals. British Journal of Mat- ners guide to structural equation modeling. New
hematical and Statistical Psychology, 65(3), 427- Jersey: Lawrence Erlbaum Associates.
437. doi: 10.1111/j.2044-8317.2011.02035.x
Simsek, G. G. y Noyan, F. (2012). Structural equation
McCallum, R. C., Browne, M. W. y Sugawara, H. modeling with ordinal variables: a large sample
M. (1996). Power analysis and determination of case study. Quality and Quantity, 46 (5), 1571-
sample size for covariance structure modeling. 1581. doi:10.1007/s11135-011-9467-4
Psychological Methods, 1(2), 130-149. doi:
10.1037/1082-989X.1.2.130 Wright, D. B. y Herrington (2011). Problematic
standard errors and confidence intervals for skew-
Mulaik, S. A. (1972). The foundations of factor ness and kurtosis. Behavior Research Methods, 43,
analysis (Vol. 88). New York: McGraw-Hill. 8-17. doi: 10.3758/s13428-010-0044-x

Muthn, B. y Kaplan, D. (1985). A comparison of Yang-Wallentin, F., Jreskog, K. G. y Luo, H. (2010).


some methodologies for the factor analysis of Confirmatory factor analysis of ordinal variables
non-normal Likert variables. British Journal of with misspecified models. Structural Equation
Mathematical and Statistical Psychology, 38(2), Modeling, 17 (3), 392-423. doi:
171-189. doi: 10.1111/j.2044- 10.1080/10705511.2010.489003
8317.1985.tb00832.x
Zumbo, B. D. (2007). Validity: Foundational Issues
Nestler, S. (2013). A Monte Carlo study comparing and Statistical Methodology. En C.R. Rao y S.
PIV, ULS and DWLS in the estimation of di- Sinharay (Eds.), Handbook of Statistics, Vol. 26:
chotomous confirmatory factor analysis. British Psychometrics, (pp. 45-79). Amsterdam: Elsevier
Journal of Mathematical and Statistical Psychol- Science.
ogy, 66(1), 127-143. doi: 10.1111/j.2044-
8317.2012.02044.x

OBrien, R. M. (1985). The relationship between or-


dinal measures and their underlying values: Why
all the disagreement? Quality and Quantity, 19,
265-277. doi: 10.1007/BF00170998

R Development Core Team (2010). R: A language


and environment for statistical computing 2.12.0.
Viena, Austria: R Foundation for Statistical
Computing.

Ryu, E. (2011). Effects of skewness and kurtosis on


normal-theory based maximum likelihood test
statistic in multilevel structural equation model-
ing. Behavior Research Methods, 43(4), 1066-
1074. doi: 10.3758/s13428-011-0115-7

Satorra, A., y Bentler, P. M. (2010). Ensuring posi-


tiveness of the scaled difference Chi-square test
statistic. Psychometrika, 75(2), 243-248. doi:
10.1007/s11336-009-9135-Y

Savalei, V. y Rhemtulla, M. (2013). The perfor-


mance of robust test statistics with categorical da-
ta. British Journal of Mathematical and Statisti-
cal Psychology, 66(2), 201-223. doi:
10.111/j.2044-8317.2012.02049.x

You might also like