You are on page 1of 88

Introduccin al

Anlisis factorial confirmatorio


Lectura bsica:
Cap. 13 del texto

Ampliacin:
Brown, T. A. (2006). Confirmatory Factor Analysis for Applied Research. New York: The Guilford
Press.



Programas: LISREL, AMOS, EQS, Mplus
2





1.) AFE versus AFC
2.) Aplicaciones


3
tems del EPQ-R (neuroticismo)
Z1. Su estado de nimo sufre altibajos con frecuencia?
Z2. Se siente a veces desdichado sin motivo?
Z3. A menudo se siente solo?
Z4. Es usted una persona sufridora?
Z5. Se inquieta por cosas terribles que podran suceder?
Z6. Se siente intranquilo por su salud?
z1 z2 z3 z4 z5 z6
Z1 1 .529 .352 .294 .210 .146
Z2 1 .420 .259 .216 .086
Z3 1 .307 .240 .132
Z4 1 .276 .218
Z5 1 .271
Z6 1
4
MUCHAS
SOLUCIONES
POSIBLES
F1 F2 z1 z2 z3 z4 z5 z6
Z1 ? ?
r*\r
Z1 .529 .352 .294 .210 .146
Z2 ? ? Z2 .526 .420 .259 .216 .086
Z3 ? ? Z3 .364 .419 .307 .240 .132
Z4 ? ? Z4 .277 .275 .271 .276 .218
Z5 ? ? Z5 .230 .205 .241 .288 .271
Z6 ? ? Z6 .133 .084 .161 .231 .251
Resid
ual
Z1
Z2 .003
Z3 -.012 .001
Z4 .017 -.016 .036
Z5 -.021 .011 -.001 -.012
Z6 .014 .002 -.029 -.013 .021
Minimizar diferencias entre la matriz de
correlaciones observada y la reproducida
1 factor?
2 factores?
3 factores?
5
Matriz de correlaciones entre los factores
1.000 .473
.473 1.000
Factor
1
2
1 2
Mtodo de extracci n: Mxi ma verosi mi l itud.
Metodo de rotacin: Normal i zaci n Obl i mi n con Kai ser.
Anlisis Factorial Exploratorio
Matriz de configuracin.
a
.628 .064
.866 -.121
.453 .185
.189 .424
.073 .505
-.078 .509
z1 (al ti baj os)
z2 (desdi chado)
z3 (solo)
z3 (sufri dora)
z5 (cosas terri bl es)
z6 (salud)
1 2
Factor
Mtodo de extracci n: Mxi ma verosi mi l itud.
Metodo de rotacin: Normal i zaci n Obl i mi n con Kai ser.
La rotacin ha convergi do en 5 i teraci ones.
a.
Su estado de nimo sufre altibajos con
frecuencia?
Se siente a veces desdichado sin motivo?
A menudo se siente solo?
Es usted una persona sufridora?
Se inquieta por cosas terribles que podran
suceder?
Se siente intranquilo por su salud?
z
1
= .628 * F
1
+ .064 * F
2
+ E
1
z
2
= .866 * F
1
- .121 * F
2
+ E
2
z
3
= .453 *F
1
+ .185 * F
2
+ E
3
z
4
= .189 * F
1
+ .424 * F
2
+ E
4
z
5
= .073 * F
1
+ .505 * F
2
+ E
5
z
6
= .078 * F
1
+ .509 * F
2
+ E
6
) min(
1
2
2
1
2
1
1
2
2
2
1
J J J
J
j
j
J
j
j
J
j
j j
= = =


o

6
z
3

F
1

z
1

E
1

E
3

z
2

E
2

z
4

E
4

z
5

E
5

z
6

E
6

F
2

Modelo exploratorio
Cuantos factores?
Criterio para la Rotacin?
DATOS MODELO

REPRESENTACIN:
7
z
3

F
1

z
1

E
1

E
3

z
2

E
2

z
4

E
4

z
5

E
5

z
6

E
6

F
2

Modelo confirmatorio
MODELODATOS
Factor
1
Factor
2
Z
1
0.694 0
Z
2
0.736 0
Z
3
0.565 0
Z
4
0 0.590
Z
5
0 0.520
Z
6
0 0.383
r
F1F2
=0.631
8
z
3

F
1

z
1

E
1

E
3

z
2

E
2

z
4

E
4

z
5

E
5

z
6

E
6

F
2

Modelo exploratorio:
Modelo inicial
DATOSMODELO
Factor
1
Factor
2
Z
1
0 0
Z
2
X 0
Z
3
X X
Z
4
X X
Z
5
X X
Z
6
X X
r
F1F2
= 0
9
AFE versus AFC
Similitudes

- Tcnica de reduccin de dimensionalidad: Se buscan (pocos)
factores comunes que expliquen la matriz de var-cov, S.
- Muchos procedimientos (p.e., de estimacin) son comunes a AFE y
AFC.

Diferencias

- No explora la relacin entre variables o constructos, sino que las
contrasta:
- Se supone un nmero concreto de factores comunes y qu variables
empricas (indicadores) los miden.
- Se supone la existencia o no de relacin entre los factores.
- Se pueden establecer correlaciones entre los trminos de error.
- No es necesario un mtodo de rotacin.

10
Ventajas del modelo confirmatorio (I)
Permite evaluar el ajuste estadstico de
nuestros modelos tericos fijando:

Nmero de factores
tems que saturan en cada factor
Especificando errores de medida
correlacionados
11
Ventajas del modelo confirmatorio (II)
x
3

F
1

x
1

E
1

E
3

x
2

E
2

x
4

E
4

x
5

E
5

x
6

E
6

F
2

-

Contraste de hiptesis de invarianza de parmetros a
travs de sexo, pas, nivel educativo, (tests

tems DIF-)
- Anlisis de las estructuras de medias

x
3

F
1

x
1

E
1

E
3

x
2

E
2

x
4

E
4

x
5

E
5

x
6

E
6

F
2

=
Grupo 1 Grupo 2

12
Modelo confirmatorio
Modelos complejos: Anlisis factorial de 2 orden, modelos
con errores correlacionados
Ventajas del modelo confirmatorio (III)
13
-
Obtencin de la correlacin entre constructos (similar a la correccin por atenuacin). Validacin de constructo, mostrando la validez
convergente de los indicadores que se espera que estn asociados, y la discriminante (no correlacin de los que se espera que no
correlacionen).

Ventajas del modelo confirmatorio (Iv)
14
-
Tratamiento de los efectos de mtodo: por
ejemplo, los tems directos e inversos en los
cuestionarios. En AFE salen como factores
espreos, no sustantivos.

Ventajas del modelo confirmatorio (V)
15


- Evaluacin psicomtrica de tests:


- Enfoque alternativo a TRI anlisis factorial para
datos categricos

- Modelo logstico de 2 parmetros

- Modelo de respuesta graduada.

- modelos multidimensionales de TRI

- Nuevas medidas de fiabilidad


Ventajas del modelo confirmatorio (VI)
Representacin de los modelos

17
Se representan mediante diagramas causales o path diagrams:
Tipos de variables:

OBSERVABLES:

LATENTES: Muy importante el concepto
de factor latente!



F1
x2
x1
x3
x1
Representacin de modelos
18
Tipos de relaciones (siempre lineales):
FLECHAS BIDIRECCIONALES:
Covarianzas o correlaciones


FLECHAS UNIDIRECCIONALES:
Pesos no estandarizados
o pesos estandarizados

x1
F1
x1
x2
E1
E2
19
EXOGENAS: Variables que el modelo NO
intenta explicar (ninguna flecha las apunta)
ENDOGENAS: Variables que en el modelo se
intentan explicar. Toda variable endogena
tiene un error.
F1
x1

x2
x3
e1

e2

e3

20
Objetivo cuando se genera un
modelo confirmatorio:
Generar un modelo que sea compatible
con la matriz de varianzas-covarianzas
entre todas las variables.

Las varianzas y covarianzas son funcin
de los parmetros del modelo.
21
Ingredientes del modelo
Para especificar el modelo, hay que fijar:

1) Nmero de factores comunes.
2) Relaciones entre las xs y los factores comunes.
3) Si existe o no covariacin entre los factores comunes
(y entre cuales).
4) Si existe o no covariacin entre los factores nicos (y
entre cuales).

Ecuaciones del modelo

23
Anlisis
Factorial
(1 factor)

Matriz de varianzas-covarianzas reproducida
2
41 31
2
21 11
2 2 2
42
2
2 2 2
11
2
1 4 3
2 1
4 1 4
1 1 1
...
...
F x x
F x x
e F x
e F x
o o
o o
o o o
o o o
=
=
+ =
+ =
4 1 41 4
3 1 31 3
2 1 21 2
1 1 11 1
e F x
e F x
e F x
e F x
+ =
+ =
+ =
+ =

x
1
x
2
e
1
x
3
e
2
e
3
F1

11

21

31
1
1
1
o
e1
2
o
e2
2

o
e3
2
x
4
e
4
o
e4
2
1

41
o
F1
2
Modelo:
Ecuaciones:
x
1
x
2
x
3
x
4
x
1
100
x
2
16 100
x
3
24 24 100
x
4
28 28 42 100
24
Anlisis
Factorial
(1 factor)

2
1
2 2
11
11
2
1
2 2
11
1 1 11
2
1
2
1
2
11
1 1 11 1 1 11 1 1
2
1
1 1 1
1
2
2
) )( (
e F
F e e F
x
N
e F
N
e
N
F
N
e F e F
N
x x
o o
o o o


o
+
= + +
= + +
=
+ +
= =


1 1 11 1
e F x + =

x
1
x
2
e
1
x
3
e
2
e
3
F1

11

21

31
1
1
1
o
e1
2
o
e2
2

o
e3
2
x
4
e
4
o
e4
2
1

41
o
F1
2
2
1
2 2
11
2
1 1
e F x
o o o + =
Path analysis (Anlisis de Senderos)
26
Anlisis
Factorial
(1 factor)

2
21 11
21 11
2
21 11
1 1 21 2 1 11 2 1
2
1 21 11
2 1 21 1 1 11 2 1
1
1 1 1 2 2 1 1
2 1
) )( (
F
F e F e e e F
x x
N
e F
N
e F
N
e e
N
F
N
e F e F
N
x x
o
o o o o


o
= + + +
= + + +
=
+ +
= =


2 1 21 2
1 1 11 1
e F x
e F x
+ =
+ =


x
1
x
2
e
1
x
3
e
2
e
3
F1

11

21

31
1
1
1
o
e1
2
o
e2
2

o
e3
2
x
4
e
4
o
e4
2
1

41
o
F1
2
2
21 11
1 2 1
F x x
o o =
Path analysis (Anlisis de Senderos)
Identificacin del modelo

Ecuaciones e incognitas
x+u=1
y+v=1
x*y=0.24
-----
x+u=1
y+v=1
z+w=1
x*y=0.25
z*y=0.24
z*x=0.24
-----
x+u=1
y+v=1
z+w=1
t+r=1
x*y=0.25
z*y=0.24
z*x=0.24
t*x=0
t*y=0
t*z=0


Infinitas soluciones

Identificacin


Ajuste.
30
es estimable el modelo?
Datos o ecuaciones disponibles (p(p+1)/2)
Elementos de la matriz de varianzas-covarianzas





Parmetros a estimar (t):






- 10 ecuaciones
- 9 parmetros
2 2 2 2 2
41 31 21 11
4 3 2 1 1
, , , , , , , ,
e e e e F
o o o o o


Parmetros del modelo: t
- Pesos libres entre las variables
exgenas y las endogenas
- Varianzas/covarianzas entre las
variables exgenas
No son parmetros del modelo:
-Varianzas y Covarianzas de las
variables endgenas
4 3 4 2 3 2
4 1 3 1 2 1 4 3 2 1
, ,
, , , , , , ,
2 2 2 2
x x x x x x
x x x x x x x x x x
o o o
o o o o o o o
31
Mtrica del factor latente
2
41 31
2
21 11
2 2 2
41
2
2 2 2
11
2
1 4 3
1 2 1
4 1 4
1 1 1
...
...
F x x
F x x
e F x
e F x
o o
o o
o o o
o o o
=
=
+ =
+ =
1
*
1
4F F =
( )
( )
2
*
*
41
*
31
2
*
*
21
*
11
2 2
*
2
*
41
2
2 2
2
*
11
2
1 4 3
1 2 1
4 1 4
1
*
1
1
...
...
F x x
F x x
e F x
e
F
x
o o
o o
o o o
o o o
=
=
+ =
+ =
4
4
1 *
1
2 2 2
1
*
j
j
F
F

o o
=
=
32
Mtrica del factor latente
41 31 21 11
2
, , ,
1
1

o =
F
) ( ), ( ), ( ), (
1
11
41
*
41
11
31
*
31
11
21
*
21
2
11
2
*
11
*

= = = =
=
F
) ( ), ( ), ( ), (
1
21
41
*
41
21
31
*
31
21
11
*
11
2
21
2
*
21
*

= = = =
=
F
7 , 6 , 4 , 4
41 31 21 11
= = = =
33
Anlisis
Factorial
(1 factor)

Matriz de varianzas-covarianzas reproducida
4 1 41 4
3 1 31 3
2 1 21 2
1 1 11 1
e F x
e F x
e F x
e F x
+ =
+ =
+ =
+ =

x
1
x
2
x
3
x
4
x
1
100
x
2
16 100
x
3
24 24 100
x
4
28 28 42 100
x
1
x
2
e
1
x
3
e
2
e
3
F1

11

21

31
1
1
1
o
e1
2
o
e2
2

o
e3
2
x
4
e
4
o
e4
2
1

41
o
F1
2
Modelo:
Restricciones:

- Fijar un peso
factorial a 1
- Fijar la varianza
del factor a 1
34
es estimable el modelo?
Datos o ecuaciones disponibles (p(p+1)/2)
Elementos de la matriz de varianzas-covarianzas: 10

Parmetros a estimar (t): 8




Grados de libertad: 2
Gl=(p(p+1)/2)-t

< 0: Modelo no identificado, hay ms incgnitas que ecuaciones
0: Modelo saturado o exactamente identificado. Solucin nica. Reproduce
exactamente la matriz de varianzas-covarianzas
>0: Modelo sobreidentificado. Si hay ms ecuaciones que incgnitas no hay
una solucin exacta. Buscaremos aquella solucin que haga lo ms
parecidas posibles la matriz de varianzas-covarianzas observada y la
reproducida.
2 2 2 2 2
41 31 21 11
4 3 2 1 1
, , , , , , , , 1
e e e e F
o o o o o =
SINTAXIS MPLUS
(MATRIZ DE VARIANZAS-COVARIANZAS)
x
1
x
2
e
1
x
3
e
2
e
3
F1
1
1

.1.5

1
1
1
84
84

64

x
4
e
4
51

1
1.75

75 . 1
5 . 1
1
1
16
41
31
21
11
2
1
=
=
=
=
=

o
F
51
64
84
84
2
4
2
3
2
2
2
1
=
=
=
=
e
e
e
e
o
o
o
o
Parmetros obtenidos (sin estandarizar):
16

MODEL RESULTS

Estimates S.E. Est./S.E. Std(**) StdYX(*)

F BY
X1 1.000 0.000 0.000 4.000 0.400
X2 1.000 0.417 2.398 4.000 0.400
X3 1.500 0.536 2.799 6.000 0.600
X4 1.750 0.640 2.734 7.000 0.700

Variances
F 16.000 9.707 1.648 1.000 1.000

Residual Variances
X1 84.000 13.285 6.323 84.006 0.840
X2 84.000 13.285 6.323 83.999 0.840
X3 64.000 14.206 4.505 63.995 0.640
X4 51.000 16.272 3.135 51.010 0.510
RESULTADOS MPLUS
- Coeficientes de la ecuacin de regresin (cambios de x en funcin de cambios en F).
Por ejemplo, 4 puntos de cambio en F (una DT) llevan a 4 puntos de cambio en X1.
- Varianza de los errores de pronstico. La varianza de X1 es 100 (en la poblacin
general). Sin embargo, para gente igualada en F la varianza de X1 es 84.
Significacin
estadstica
2
e
o

38
Matriz de varianzas-covarianzas reproducida
x
1
x
2
x
3
x
4
x
1
100
x
2
16 100
x
3
24 24 100
x
4
28 28 42 100
x
1
x
2
x
3
x
4
x
1
100
x
2
16 100
x
3
24 24 100
x
4
28 28 42 100
OBSERVADA
REPRODUCIDA SEGN LOS
PARMETROS DEL MODELO
RESIDUOS (observada estimada)
x
1
x
2
x
3
x
4
x
1
0
x
2
0 0
x
3
0 0 0
x
4
0 0 0 0
2
21 11
2 2 2
11
2
2 1
1 1
F x x
e F x
o o
o o o
=
+ =
75 . 1
5 . 1
1
1
16
41
31
21
11
2
=
=
=
=
=

o
F
51
64
84
84
2
4
2
3
2
2
2
1
=
=
=
=
e
e
e
e
o
o
o
o
MODEL RESULTS

Estimates S.E. Est./S.E. Std(**) StdYX(*)


F BY
X1 1.000 0.000 0.000 4.000 0.400
X2 1.000 0.417 2.398 4.000 0.400
X3 1.500 0.536 2.799 6.000 0.600
X4 1.750 0.640 2.734 7.000 0.700

Variances
F 16.000 9.707 1.648 1.000 1.000



Residual Variances
X1 84.000 13.285 6.323 84.000 0.840
X2 84.000 13.285 6.323 84.000 0.840
X3 64.000 14.206 4.505 64.000 0.640
X4 51.000 16.272 3.135 51.000 0.510
RESULTADOS MPLUS:
- Coeficientes de la ecuacin de regresin estandarizados
- Varianza de los errores de pronstico (unicidades)
Correlaciones
(si las variables
exgenas son
independientes)









unicidades

x
F
F
o
o
o = =
* * *
2
e
o
2
2
2
*
2 2
* *
x
e
e e e
o
o
o o o = =
40
x
1
z
2
e
1
x
3
e
2
e
3
F1
.4
.4

.6

1
1
1
.84
.84

.64

z
4
e
4
.51

1
.7

75 . 1
5 . 1
1
1
16
41
31
21
11
2
=
=
=
=
=

o
F
51
64
84
84
2
4
2
3
2
2
2
1
=
=
=
=
e
e
e
e
o
o
o
o
7 .
10
4
75 . 1
6 .
10
4
5 . 1
4 .
10
4
1
4 .
10
4
1
1
*
41
*
31
*
21
*
11
2
= =
= =
= =
= =
=

o
F
Parmetros obtenidos (sin estandarizar):
Parmetros obtenidos (estandarizados):
51 . 0
100
51
64 . 0
100
64
84 . 0
100
84
84 . 0
100
84
2
2
2
2
*
4
*
3
*
2
*
1
= =
= =
= =
= =
e
e
e
e
o
o
o
o
1

Para obtener el parmetro
estandarizado se multiplica por la
desviacin tpica de la variable
exgena y se divide por la
desviacin tpica de la variable
endogena
Matriz de correlaciones reproducida
OBSERVADA
REPRODUCIDA SEGN LOS
PARMETROS DEL MODELO
RESIDUOS
x
1
x
2
x
3
x
4
x
1
0
x
2
0 0
x
3
0 0 0
x
4
0 0 0 0
zx
1
zx
2
zx
3
zx
4
zx
1
1
zx
2
.16 1
zx
3
.24 .24 1
zx
4
.28 .28 .42 1
zx
1
zx
2
zx
3
zx
4
zx
1
1
zx
2
.16 1
zx
3
.24 .24 1
zx
4
.28 .28 .42 1
) 1 (
) 1 ( 1
*
21
*
11
2
*
2 *
11
2
2 1 2 1
1 1
o
o o
= =
+ = =
x x x x
e x
7 .
6 .
4 .
4 .
*
41
*
31
*
21
*
11
=
=
=
=

51 . 0
64 . 0
84 . 0
84 . 0
2
2
2
2
*
4
*
3
*
2
*
1
=
=
=
=
e
e
e
e
o
o
o
o
xy
F X
r B =
=
1 1
*
11

42
Modelo no identificado

1

x
1

x
2

e
1

e
2



Con dos indicadores, 3 datos: las dos varianzas y la
covarianza.
En el ejemplo habra que estimar: 1 lambda (la otra se fija una
a 1, para fijar la escala), la varianza del factor comn, las
varianzas de los 2 factores nicos (la covarianza entre ellos se
ha fijado a cero) (4 parmetros). Luego gl = -1.

p
q
0.24=p*q
10-9=1
10-8=2
p
q
p
q
r
s
Puede ocurrir que los grados de libertad
no sean negativos y, sin embargo, que
el modelo no tenga solucin:
- Falta de Falta de
identificacin identificacin
parcial emprica

10-8=2 10-9=1
p
q
p
q
z
45
Modelo en ecuaciones
(2 factores)
5 2 52 5
4 2 42 4
3 2 32 1 31 3
2 1 21 2
1 1 11 1
e x
e x
e x
e x
e x
+ =
+ =
+ + =
+ =
+ =





x
1
x
2
x
3
x
4
x
5
e
1
e
2
e
3
e
4
e
5

11

21

32

42

52
1
1
1
1
1

31
(
(
(
(
(
(

(
(
(
(
(
(

55
44
33
22
11
22 21
12 11
52
42
32 31
21
11
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0
0
0
0
u
u
u
u
u
| |
| |

(
(
(
(
(
(

2
5 54 53 52 51
45
2
4 43 42 41
35 34
2
3 32 31
25 24 23
2
2 21
15 14 13 12
2
1
o o o o o
o o o o o
o o o o o
o o o o o
o o o o o
Pesos factoriales
Varianzas-Covarianzas entre
factores latentes
Varianzas-Covarianzas entre
errores
Varianzas-Covarianzas tericas
(
(
(
(
(
(

55 54 53 52 51
45 44 43 42 41
35 34 33 32 31
25 24 23 22 21
15 14 13 12 12
o o o o o
o o o o o
o o o o o
o o o o o
o o o o o
(
(
(
(
(
(

+
+
+ + + + + + +
+
+
=
(
(
(
(
(
(

55 22
2
52 22 42 52 22 32 52 21 21 52 21 11 52
22 52 42 44 22
2
42 22 32 42 21 21 42 21 11 42
22 32 52 21 31 52 22 32 42 21 31 42 33 12 32 31 22
2
32 11
2
31 21 32 21 11 31 21 21 32 11 11 31 11
12 52 21 12 42 21 12 32 21 22 11
2
21 11 11 21
12 52 11 12 42 11 12 32 11 11 21 11 11 11
2
11
2
5 54 53 52 51
45
2
4 43 42 41
35 34
2
3 32 31
25 24 23
2
2 21
15 14 13 12
2
1
2
u | | | | |
| u | | | |
| | | | u | | | | | | |
| | | u | |
| | | | u |
o o o o o
o o o o o
o o o o o
o o o o o
o o o o o
48
x
1
x
2
x
3
x
4
x
5
e
1
e
2
e
3
e
4
e
5

2
21 11 52 51
| o =
49
x
1
x
2
x
3
x
4
x
5
e
1
e
2
e
3
e
4
e
5

2
22 32 52 12 31 52 53
| | o + =
50
x
1
x
2
x
3
x
4
x
5
e
1
e
2
e
3
e
4
e
5

2
33 21 31 32 22
2
32 11
2
31
2
3
2 u | | | o + + + =
51
Identificacin del modelo
15 ecuaciones: (5*6)/2

12 parmetros: 6 lambdas (), 1 covarianza entre factores comunes (
ij
), 2 varianzas de
los factores comunes (
ii
), 5 varianzas de los factores nicos (
ii
) [Para fijar la
escala, se fijan a 1 bien las dos varianzas de los factores comunes o bien una
lambda de cada factor comn]

Luego, tendramos 15 12 = 3 grados de libertad.



x
1
x
2
x
3
x
4
x
5
e
1
e
2
e
3
e
4
e
5

11

21

32

42

52
1
1
1
1
1

31
Covariances/Correlations/Residual Correlations
X1 X2 X3 X4 X5
________ ________ ________ ________ ________
X1 100.000
X2 36.000 100.000
X3 38.000 40.000 100.000
X4 13.000 25.000 46.000 100.000
X5 13.000 10.000 48.000 53.000 100.000
MODEL RESULTS

Estimates S.E. Est./S.E. Std StdYX

F1 BY
X1 5.854 1.223 4.787 5.854 0.588
X2 6.089 1.240 4.912 6.089 0.612
X3 4.850 1.222 3.970 4.850 0.487

F2 BY
X3 4.764 1.128 4.222 4.764 0.479
X4 7.004 1.069 6.552 7.004 0.704
X5 7.492 1.079 6.943 7.492 0.753

F2 WITH
F1 0.340 0.157 2.168 0.340 0.340

Variances
F1 1.000 0.000 0.000 1.000 1.000
F2 1.000 0.000 0.000 1.000 1.000

Residual Variances
X1 64.733 13.288 4.872 64.733 0.654
X2 61.932 13.611 4.550 61.932 0.626
X3 37.086 10.160 3.650 37.086 0.375
X4 49.953 11.311 4.416 49.953 0.505
X5 42.870 11.788 3.637 42.870 0.433
u
|

Cuando los predictores estn correlacionados los


pesos estandarizados no son correlaciones de
Pearson son correlaciones semi-parciales

r
F1F2

1
1
1
F1
F2
X3
E
x3
F2
2
,
32
2 1
2 1 3 1 3 2
3
'
2
1
F F
F F x F x F
x F
r
r r r

= =
r
x3F1

1
32

Cambios en X3, en funcin de la


parte de F2 que no tiene que ver
con F1.
Manteniendo F1, constante: cul
es el efecto de F2 en X3
2
2 1
1
F F
r
1
Estimacin de parmetros
57
Estimacin de parmetros
Estimadores de los elementos de ; es decir,
de , y , que hagan que se acerque los
ms posible a S.

Se llama funcin de ajuste (o discrepancia) a
F(S, )

Procedimientos de estimacin:
-Mnimos cuadrados no ponderados (ULS)
-Mnimos cuadrados generalizados (GLS)
-Mxima verosimilitud (ML)
-Mnimos cuadrados ponderados (WLS)

E

-.001
-.001
-.002
-.244
.218

E =

S d
p*(p+1)/2 elementos distintos de la matriz
de varianzas-covarianzas residuales
Residuals for Covariances/Correlations/Residual Correlations
X1 X2 X3 X4 X5
________ ________ ________ ________ ______
X1 -0.001
X2 -0.001 -0.002
X3 -0.244 0.218 -0.002
X4 -1.056 10.266 0.637 -0.003
X5 -2.027 -5.594 -0.516 -0.001 -0.001
Cmo ponderarlos?
Estimacin de parmetros


Funcin de discrepancia: Se busca minimizar el tamao
de los residuos.





1) Valor mnimo = 0 (Ajuste perfecto)

2) Cuanto mayores son los residuos mayor es F
(independientemente de la direccin de los residuos)

3) Ser cauto al utilizarlo, sensible a la escala de las
variables. No asume distribucin de las variables. No
proporciona errores tpicos.

( )

~ E
i
i ULS
d S F
2
)

, (
ULS: Mnimos Cuadrados no Ponderados
El tamao de las discrepancias
depende de las unidades de
medida de las variables
60
1
2 2 2 *
1
2 2 2
2 2 2
1
*
1
*
1
*
1
1
*
1
1
*
1
d k S d
k
S k S
kx x
x x
x x
x x
= =
=
=
=
o
o o
Matriz de varianzas-covarianzas asinttica
s
11
S
12
s
22
10 6 90
9 3 87
11 4 84
12 5 72

s
11
s
12
s
22
10*k
2
6*k

90

9*k
2
3*k

87

11*k
2
4*k

84

12*k
2
5*k

72


62
s
11
s
12
s
22
s
11
S
2
S11
s
12
S
S11,S11
S
2
S12

s
22
S
S11,S22
S
S12,S22
S
2
S22

63
Ponderacin de las
discrepancias

= E
i j
j i ij
d d w S F ) ( )

, (
:
ij
w
ULS: s i = j , w=1, de lo contrario w=0
GLS: w depende de las varianzas y covarianzas de las variables (S), ms
peso a la discrepancia cuanto menor las varianzas (covarianzas) de las
variables implicadas. No cambia de iteracin a iteracin.
ML: w depende de las varianzas y covarianzas de las variables (E) , ms
peso a la discrepancia cuanto menor las varianzas (covarianzas) de las
variables implicadas. Cambia de iteracin a iteracin.
WLS: w tiene en cuenta la falta de normalidad de las variables, pero
requiere estimar la matriz W de k*(k+1)/2 elementos, donde k=p*(p+1)/2

Se relaciona inversamente con la varianza muestral del producto de
discrepancias i y j
-.001
-.001
-.002
-.244
.218

d
64
ML: Mxima Verosimilitud
Asumiendo una distribucin multivariada normal para las variables (en
diferenciales) la funcin de verosimilitud slo depende de la matriz de
varianzas-covarianzas:
Si la distribucin es multivariada normal. La matriz de varianzas-
covarianzas sigue una distribucin conocida (de Wishart). Por lo tanto, se
maximiza la siguiente funcin:
( ) p S tr S S F
ML
E + E = E
1 1

ln )

, (
( ))

)( 1 ( 5 . 0 ln ) 2 ( 5 . 0

ln ) 1 ( 5 . 0 ) ln( ))

| ( (
1
E + E = E S tr N S p N N k S P Ln
Maximizar lo anterior es equivalente a minimizar la siguiente funcin de
discrepancia:
0 )

, (

= E
E =
S F
S
ML
Ventaja: Proporciona medidas estadsticas de ajuste del
modelo y de errores tpicos de estimacin
Mxima verosimilitud (ML):
Qu parmetros hacen ms probables los datos observados
Se asume que las variables se distribuyen normalmente.

Mnimos cuadrados generalizados (GLS):
Se asume que las variables se distribuyen normalmente.

Mnimos cuadrados ponderados (WLS).
No asume normalidad de las variables
pero requiere muestras muy grandes.

Mtodos robustos: Nuevos mtodos (DWLS/WLSMV/MLMV)


Tericamente
66
ML diferir de GLS y WLS:

Si el modelo es incorrecto.


WLS diferir de ML y GLS :

Si los datos no se distribuyen normalmente.

67
Recomendaciones
Se cumplen supuestos: ML, pues ofrece errores tpicos
(y contrastes estadsticos), aunque:
- Problemas de convergencia (muestras pequeas/n
indicadores por factor pequeo)
- ms casos Heywood (p.e., unicidades negativas)
- resultados ms distorsionados si el modelo se
especifica mal o si no se cumplen los supuestos,

ULS puede ser incorrecto si las diferencias de varianzas
en las variables son arbitrarias

Comprobacin del ajuste
0
2
4
6
8
10
12
0 1 2 3 4 5 6 7 8 9 10
y
Lineal (y)
Polinmica (y)
Ajuste de los modelos
2 CRITERIOS DE AJUSTE BIEN
DIFERENCIADOS:

Modelos que hagan los residuos pequeos en
nuestra muestra

Modelos parsimoniosos (se repetiran los
resultados en otra muestra?)
71
Indicadores de ajuste
ndices de ajuste absoluto:

s extensione y
2
_
Medidas basadas en los residuos:
Standardized Root Mean Squared Residuals (SRMR
)

ndices de ajuste comparativo:
Normed Fit Index (NFI)
Non-Normed Fit Index (NNFI o TLI)
Comparative Fit Index (CFI)

Medidas en errores de aproximacin:
Root Mean Square Error of Aproximation (RMSEA)

Medidas basadas en la informacin:
Akaike Information Criterion (AIC)
Bayes Information Criterion (BIC)



Estadstico chi-cuadrado
F N ) 1 (
2
= _
La p asociada indica la probabilidad de obtener una funcin de discrepancia
tan grande como la obtenida en la muestra si nuestro modelo fuera
correcto en la poblacin.
Hiptesis nula: La funcin de discrepancia es cero en la poblacin
Hiptesis alternativa: La funcin de discrepancia no es cero en la poblacin
Problemas:
1. La hiptesis nula nunca es cierta.
2. Depende del tamao de la muestra.
CHI/DF:
Regla informal. El valor esperado de CHI es DF. Si la ratio es 1 entonces el
modelo se ajusta. Suelen considerarse aceptables si son menores de 5
(preferiblemente menores que 3 2).

Problema: sensible al tamao muestral
x
1
x
2
x
3
x
4
x
5
e
1
e
2
e
3
e
4
e
5

11

21

32

42

52
1
1
1
1
1

31
Residuals for Covariances/Correlations/Residual Correlations
X1 X2 X3 X4 X5
________ ________ ________ ________ ______
X1 -0.001
X2 -0.001 -0.002
X3 -0.244 0.218 -0.002
X4 -1.056 10.266 0.637 -0.003
X5 -2.027 -5.594 -0.516 -0.001 -0.001
TESTS OF MODEL FIT

Chi-Square Test of Model Fit

Value 3.465
Degrees of Freedom 3
P-Value 0.3254
Chi-Square Test of Model Fit for the Baseline Model

Value 110.211
Degrees of Freedom 10
P-Value 0.0000
Modelo de independencia de variables
Nuestro modelo
MODELO DE INDEPENDENCIA: MODELO EN EL QUE SE
ESTIMAN COMO PARMETROS LAS VARIANZAS Y SE
FIJAN EL RESTO DE PARMETROS (COVARIANZAS) A 0.
x
5

x
4

x
3

x
1

x
2

e
1

e
2

e
3

e
4

e
5

76
Medidas de bondad de ajuste
ndices de ajuste comparativo

2
2
2
2 2
1
b
m
b
m b
b
m b
F
F F
NFI
_
_
_
_ _
=

=
Regla: 0.95. Rango: 0 1.
b
b
m
m
b
b
b
m b
gl
gl gl
F
F F
NNFI
2
2 2
_
_ _

=

=
( ) ( )
( ) ( ) ( ) 0 , , max
0 , max
1
2 2
2
m m b b
m m
gl gl
gl
CFI


=
_ _
_
Chi-Square Test of Model Fit

Value 3.465
Degrees of Freedom 3
P-Value 0.3254

Chi-Square Test of Model Fit for the Baseline Model

Value 110.211
Degrees of Freedom 10
P-Value 0.0000

CFI/TLI

CFI 0.995
TLI 0.985
RMR:
- El promedio de los residuos. Poco
informativo si no se analiza la matriz de
correlaciones.
SRMR:
- promedio de los residuos calculados sobre la
matriz de correlaciones, debe ser menor que
.06.
.

2 / ) 1 ( *
1 1
2
+
=

= =
p p
d
SRMR
p
i
i
j
ij
SRMR (Standardized Root Mean Square Residual)

Value 0.031
Afecta al tamao de los residuos:
(modelo real)

(nuestro modelo)
S (observada)
F
P
: Error de Aproximacin en la poblacin
(disminuye al aumentar el nmero de parmetros)
(no depende del tamao de la muestra)
S (nuestro modelo)
V
A
R
I
A
C
I
O
N

M
U
E
S
T
R
A
L

VARIACION DEBIDA AL MODELO
F: Funcin de discrepancia
(mayor que el error de aproximacin)
E
r
r
o
r

d
e

e
s
t
i
m
a
c
i

n

(
d
e
p
e
n
d
e

d
e
l


t
a
m
a

o


d
e

l
a

m
u
e
s
t
r
a
)

81
Medidas de bondad de ajuste
Medidas basadas en errores de aproximacin
RMSEA (root mean square error of aproximation)

Hemos visto que (N-1)F ~
2
con parmetro gl. si el modelo propuesto en H
0
es
correcto. En ese caso, en sucesivas muestras, tendremos diferentes
valores de (N-1)F cuya distribucin es
2
con parmetro gl. Error de
estimacin.

En realidad, (N-1)F ~
2
es no centrada con parmetros gl y parmetro de no
centralidad (N-1)F
0
, (cuando el modelo no es correcto. Error de
aproximacin.

RMSEA
(Raiz del Error Cuadrtico de Aproximacin)
- mayor que 0. Preferiblemente por debajo de
0.05 (recomendable por debajo de 0.08, nunca
por encima de 0.10)
- Indica el error de aproximacin medio por
cada grado de libertad.
- No depende del tamao de la muestra
- Penaliza por la complejidad del modelo.

m
m m
m
p
gl
N
gl
gl
F
RMSEA
|
|
.
|

\
|
|
|
.
|

\
|

= =
0 ,
1
max
2
_
Ejemplo (continua)
RMSEA (Root Mean Square Error Of Approximation)

Estimate 0.039
90 Percent C.I. 0.000 0.178
Probability RMSEA <= .05 0.433
84
Medidas de bondad de ajuste
Medidas basadas en la informacin

Akaike Information criterion: AIC = 2k - 2ln(L)

Medidas basadas en la informacin

Bayes Information criterion: BIC = kln(N) - 2ln(L)

k = nmero de parmetros libres
L = funcin de verosimilitud H
0

N= tamao muestra


Regla: cuanto menor, mas apropiado el modelo. Medida indicada para la
comparacin de modelos no anidados.

Loglikelihood

H0 Value -1804.876
H1 Value -1803.144

Information Criteria

Number of Free Parameters 12
Akaike (AIC) 3633.752
Bayesian (BIC) 3665.014
86
The Journal of Educational Research, 2006, 99, 6, 323-337
87
Recomendaciones
Para decidir el ajuste hay que fijarse en

- Los indicadores de ajuste vistos.
- Si los coeficientes estimados son
significativos.
- La comunalidad de cada indicador.
Reespecificacin de los modelos
ndices de modificacin:
Cambio _
2
si aadieramos el nuevo parmetro al
modelo. Si es mayor que 3.84 eso indica que el
cambio sera significativo al 5%.

Preferiblemente no utilizar o solo utilizar si las
muestras son muy grandes (capitalizacin del
azar).