Professional Documents
Culture Documents
• nieobserwowalne bezpośrednio
• hipotetyczne
W praktyce (często, lecz nie zawsze): EFA jako analiza poprzedzająca CFA.
Analiza czynnikowa - porównanie
λ1 λ3
λ2
Wskaźniki:
x1 x3 pozycje testowe - item 1, item 2, item 3 itd.
x2
ξ1 [xi] - zmienna latentna
δ1 δ3 λ1 [lambda] - ładunek czynnikowy
δ2 δ1 [delta] - wariancja swoista
Przykład - narzędzie badające
postawę wobec statystyki
Jednym z aspektów badania trafności teoretycznej może być
sprawdzenie, na ile struktura teoretyczna faktycznie będzie
jednoczynnikowa.
Postawa
wobec
statystyki
Item 1 Item 3
Item 2
δ1 δ3
δ2
Cecha ukryta - model teoretyczny
ALE: również zgodnie z teorią postawy manifestować się mogą na trzech
poziomach: behawioralnym, afektywnym, poznawczym. Zatem może:
ξ1 [xi] - zmienna latentna
Φ12 Φ13 Φ23
λ1 [lambda] - ładunek czynnikowy
δ1 [delta] - wariancja swoista
Φ12 [fi] - kowariancja ładunków
ξ1 ξ2 ξ3
λ1 λ3 λ4 λ6 λ7 λ9
λ2 λ5 λ8
x1 x3 x4 x6 x7 x9
x2 x5 x8
δ1 δ3 δ4 δ6 δ7 δ9
δ2 δ5 δ8
Cecha ukryta - model teoretyczny
ALE: również zgodnie z teorią postawy manifestować się mogą na trzech
poziomach: behawioralnym, afektywnym, poznawczym. Zatem może:
Czynniki mogą być
z sobą powiązane.
Φ12 Φ13 Φ23
λ1 λ3 λ4 λ6 λ7 λ9
λ2 λ5 λ8
Item 1 Item 3 Item 4 Item 6 Item 7 Item 9
Item 2 Item 5 Item 8
δ1 δ3 δ4 δ6 δ7 δ9
δ2 δ5 δ8
Jedno- vs wielowymiarowość
• jednowymiarowość konstruktu =
uprawomocnienie posługiwania się wynikiem
ogólnym (sumarycznym) w teście
• wielowymiarowość konstruktu =
uprawomocnienie posługiwania się wynikami w
podskalach lub czynnikach.
Czy jednowymiarowe jest zawsze tylko
jednowymiarowe, a wielowymiarowe
jest zawsze tylko wielowymiarowe?
Bo przecież nie może być zbyt łatwo…
Jednowymiarowość zasadnicza
ZALETY
możliwość pomiaru głównej cechy, która interesuje badacza oraz cech bardziej szczegółowych
Wskaźnik 1 (item 1)
wariancja wspólna
(common variance)
Wskaźnik 2 (item 2)
Eksploracyjna analiza czynnikowa
Wskaźnik 1 (item 1)
wariancja specyficzna
(common variance)
Wskaźnik 2 (item 2)
Źródła wariancji wspólnej = korelacja
między pozycjami testowymi
item 1 item 2 item 3 item 4 item 5 item 6 item 7 item 8 item 9 item 10 item 11 item 12 item 13
item 1 -
item 2 ,270** -
item 3 ,517** ,326** -
item 4 ,224** ,253** ,355** -
item 5 ,252** ,656** ,334** ,410** -
item 6 ,257** ,627** ,283** ,467** ,671** -
item 7 ,171* ,236** ,171* ,471** ,257** ,313** -
item 8 ,287** 0,101 ,328** ,158* 0,036 0,133 0,014 -
item 9 ,439** ,172* ,599** ,255** ,222** ,280** ,169* ,452** -
item 10 0,109 ,302** ,214** ,433** ,328** ,403** ,344** -0,004 ,176* -
item 11 ,158* ,343** 0,126 ,365** ,336** ,357** ,327** -0,027 0,059 ,512** -
item 12 ,165* ,231** ,235** 0,058 ,144* ,171* -0,009 ,191** ,168* 0,029 0,015 -
item 13 ,322** ,604** ,474** ,446** ,707** ,612** ,321** ,192** ,349** ,280** ,311** ,247** -
4. Korelacje między
zmiennymi są różne od
zera.
Założenia techniczne dla EFA
1. Przynajmniej
porządkowy poziom
pomiaru wskaźników.
za Nunnallym (1978) - 10 razy
2. Normalność wskaźników więcej osób badanych niż
wskaźników
(itemów).
za Fieldem (2013) - 10-15 osób na
każdą z zanalizowanych
3. Odpowiednio duża próba. zmiennych
1. Przynajmniej
porządkowy poziom
pomiaru wskaźników.
1. Przynajmniej
porządkowy poziom
pomiaru wskaźników.
2. Normalność wskaźników
(itemów).
Test Bartletta jako
3. Odpowiednio duża próba.
metoda weryfikacji
4. Korelacje między
GWARANCJA
zmiennymi są różne od
SENSOWNOŚCI EFA
zera.
Test sferyczności Bertletta
kryterium połowy.
Metoda 1: wartość własna
Wartość własna - odzwierciedla siłę powiązań między korelacjami skali silnie z
sobą korelującymi i tworzącymi konkretny czynnik:
• informuje o tym, jaka część całkowitej zmienności jest tłumaczona przez dany
czynnik.
Warunki sensowności:
• liczba wskaźników jest mniejsza iż 30, a zasoby zmienności wspólnej
po wyodrębnieniu są większe niż 0,70
• liczność próby jest większa iż 250, a przeciętne zasoby zmienności
wspólnej są większe lub równe 0,60 (Field, 2013, s. 677-679).
Kryterium Kaisera: wyodrębnij wszystkie czynniki,
których wartość własna jest większa od 1,00
rzadziej
… lub większe od 0,70 (zob. Jolliffe, 1986). stosowana
interpretacja
Metoda 2: wykres osypiska
Metoda 2: wykres osypiska
Kiedy stosować?
• duża próba (N > 200)
• klarowna struktura
czynnikowa
Metoda 3: analiza równoległa
Opracowana: Horn (1965); udoskonalona: Green i in. (2012)
najsensowniejsze
Metoda osi głównych Maksymalizuje wariancję wspólną dla Raczej metoda dla opisu cechy latentnej w próbie -
(principal axis factoring, czynnika głównego. bez zamiaru generalizacji rezultatu poza próbę.
PAF)
Nie wymaga spełnienia założenia o Brak wskaźników dotyczących dopasowania do
normalności rozkładu wskaźników. „modelu zerowego” (idealnego).
Metoda największej Raportowany jest poziom istotności dla Wymaga spełnienia założenia o normalności
wiarygodności różnicy między strukturą modelową a rozkładu wskaźników.
(maximum likelihood, ML) empiryczną.
Często wskazuje na błędy w zakresie specyfikacji
Można wyliczać przedziały ufności dla modelu.
ładunków.
Metoda składowych
głównych (principal NIE JEST METODĄ ANALIZY CZYNNIKOWEJ!
component analysis, PCA)
Metody obliczania ładunków
czynnikowych
Metoda Zalety Wady
Metoda osi głównych Maksymalizuje wariancję wspólną dla Raczej metoda dla opisu cechy latentnej w próbie -
(principal axis factoring, czynnika głównego. bez zamiaru generalizacji rezultatu poza próbę.
PAF)
Nie wymaga spełnienia założenia o Brak wskaźników dotyczących dopasowania do
normalności rozkładu wskaźników. „modelu zerowego” (idealnego).
Metoda największej Raportowany jest poziom istotności dla Wymaga spełnienia założenia o normalności
wiarygodności różnicy między strukturą modelową a rozkładu wskaźników.
(maximum likelihood, ML) empiryczną.
Często wskazuje na błędy w zakresie specyfikacji
Można wyliczać przedziały ufności dla modelu.
PCA wyznacza czynniki tylko w oparciu o wspólną
ładunków.
wariancję poszczególnych pozycji testowych, zaś EFA
Pozwala testować istotność ładunków.
uwzględnia zarówno wariancję wspólna jak i swoistą
Metoda składowych
głównych (principal NIE JEST METODĄ dla każdejANALIZY
pozycji testowej.
CZYNNIKOWEJ!
component analysis, PCA)
Metody obliczania ładunków
czynnikowych
Metoda Zalety Wady
Metoda osi głównych Maksymalizuje wariancję wspólną dla Raczej metoda dla opisu cechy latentnej w próbie -
(principal axis factoring, czynnika głównego. bez zamiaru generalizacji rezultatu poza próbę.
PAF)
Nie wymaga spełnienia założenia o Brak wskaźników dotyczących dopasowania do
normalności rozkładu wskaźników. „modelu zerowego” (idealnego).
Metoda największej Raportowany jest poziom istotności dla Wymaga spełnienia założenia o normalności
wiarygodności różnicy między strukturą modelową a rozkładu wskaźników.
(maximum likelihood, ML) empiryczną.
Często wskazuje na błędy w zakresie specyfikacji
Można wyliczać przedziały ufności dla modelu.
ładunków.
Metoda redukcji dużej ilości danych, nie
Pozwala testować istotność ładunków.
stanowiąca modelu cechy ukrytej!
Metoda składowych
głównych (principal NIE JEST METODĄ ANALIZY CZYNNIKOWEJ!
component analysis, PCA)
EFA a PCA
Źródło: https://statystykawpsychologii.blogspot.com/2018/02/efa-i-pca.html
EFA a PCA
Fabrigar i wsp. (1999):
• wyniki uzyskiwane w ramach PCA i EFA różnią się od siebie znacząco,
głównie w zakresie:
wyliczonych zasobów zmienności wspólnej
ilości wskaźników wchodzących w skład składowej/czynnika.
X = a · F1 + b · F2 + ... + k · Fk
X = a · F1 + b · F2 + ... + k · Fk
Ładunki czynnikowe
Ładunek czynnikowy - stopień, w jakim poszczególne wskaźniki
ładują czynniki latentne.
X = a · F1 + b · F2 + ... + k · Fk
czynniki teoretyczne
ładunki czynnikowe
Interesują nas te najwyższe (> 0,50 lub > 0,30)
Ładunki czynnikowe
Możliwe - lecz niekonieczne i rzadko raportowane - jest określenie istotności
statystycznej dla ładunków czynnikowych, która będzie pochodną wielkości próby, jaka
została przebadana.
X = a · F1 + b · F2 + ... + k · Fk
Varimax Promax
Equamax Oblimin
EFA - PRZYKŁADOWA
ANALIZA
International Personality Item Pool
Baza: IPIP_dataset.sav
Program: jamovi
International Personality Item Pool
TEORIA
Podobieństwa między EFA i CFA
CFA pozwala na
weryfikowanie teoretycznych
założeń dotyczących badanego
konstruktu lub tworzonego
narzędzia (rozumianych jako
element trafności teoretycznej),
w szczególności zaś udzielenie
odpowiedzi na pytanie o to, na
ile badany konstrukt traktować
można jako jednowymiarowy
bądź też postulować jego
wielowymiarowość.
Modele cechy latentnej w CFA
CFA pozwala na
weryfikowanie teoretycznych
założeń dotyczących badanego
konstruktu lub tworzonego
narzędzia (rozumianych jako
element trafności teoretycznej),
w szczególności zaś udzielenie
odpowiedzi na pytanie o to, na
ile badany konstrukt traktować
można jako jednowymiarowy
bądź też postulować jego
wielowymiarowość.
Jednowymiarowość w EFA
Drasgow & Hulin (1990):
jednowymiarowość można
stwierdzić, gdy mamy w zbiorze
danych jeden główny,
dominujący czynnik
Reckase (1979):
pierwszy czynnik powinien
wyjaśniać co najmniej 20%
wariancji wyników, by być
stabilnym
Reckase (1979):
pierwszy czynnik powinien
wyjaśniać co najmniej 20%
wariancji wyników, by być
stabilnym
ξg
ξg
Identyfikacja modelu
Estymacja modelu
Identyfikacja modelu
Estymacja modelu
ZASADA 2:
w sytuacji, gdy model zawiera dwa lub więcej czynników latentnych i dwa wskaźniki
przyporządkowane każdemu z nich, rozwiązanie będzie nadmiernie zidentyfikowane
pod warunkiem, że każda ze zmiennych latentnych będzie skorelowana z przynajmniej
jedną inną zmienną latentną, przy niezależności błędów wskaźników; jakkolwiek jednak
w sytuacji takiej istnieje zawsze ryzyko zaledwie dokładnego zidentyfikowania modelu
(np. w przypadku braku korelacji między czynnikami latentnymi), rekomendowane jest
użycie minimum trzech wskaźników dla każdej zmiennej latentnej (Brown, 2006).
Korki w CFA
Identyfikacja modelu
Estymacja modelu
Identyfikacja modelu
Estymacja modelu
• Najcześciej stosowany
Identyfikacja modelu
Estymacja modelu
Identyfikacja modelu
Estymacja modelu
Baza: IPIP_dataset.sav
Program: jasp
International Personality Item Pool
Ugodowość
Sumienność
Ekstrawersja
Neurotyczność
Otwartość
International Personality Item Pool
Tabela 1. Ładunki czynników dla testu IPIP - wyniki CFA
Czynnik Wskaźnik λ SE λ Z p
Określenie i estymacja modelu: Ugodowość A1 0.256 0.055 4.658 < 0.001
A2 -0.690 0.055 -12.485 < 0.001
A3 -0.976 0.065 -15.071 < 0.001
A4 -0.835 0.062 -13.453 < 0.001
Wychodząc z koncepcji Wielkiej Piątki założono, że
A5 -1.073 0.068 -15.899 < 0.001
struktura testu winna być pięcioczynnikowa. W Sumienność C1 0.763 0.053 14.449 < 0.001
celu weryfikacji struktury wykorzystano C2 0.699 0.056 12.552 < 0.001
konfirmacyjną analizę czynników (CFA). Do C3 0.437 0.052 8.417 < 0.001
C4 -1.130 0.066 -17.000 < 0.001
estymacji parametrów modelu wykorzystano
C5 -1.230 0.073 -16.904 < 0.001
diagonalnie ważony estymator najmniejszych Ekstrawertyczność E1 0.796 0.060 13.364 < 0.001
kwadratów (DWLS) - ze względu na brak E2 1.319 0.067 19.665 < 0.001
normalności wyników w pozycjach testowych oraz E3 -0.915 0.055 -16.748 < 0.001
porządkowy charakter skali pomiarowej, na jakiej E4 -1.039 0.059 -17.534 < 0.001
E5 -0.805 0.051 -15.842 < 0.001
badani ustosunkowywali się do twierdzeń testu. Neurotyczność N1 1.234 0.075 16.379 < 0.001
N2 1.006 0.068 14.849 < 0.001
N3 1.242 0.074 16.675 < 0.001
Wielkości uzyskanych ładunków czynnikowych, N4 1.228 0.074 16.556 < 0.001
wraz z ich istotnością przedstawiono w tabeli 1. N5 0.887 0.070 12.594 < 0.001
0,07 [95% CI: 0,061; 0,077]; SRMR = 0,09; TLI: C3 0.437 0.052 8.417 < 0.001
C4 -1.130 0.066 -17.000 < 0.001
0,89; CFI = 0,90. C5 -1.230 0.073 -16.904 < 0.001
Ekstrawertyczność E1 0.796 0.060 13.364 < 0.001
E2 1.319 0.067 19.665 < 0.001
E3 -0.915 0.055 -16.748 < 0.001
E4 -1.039 0.059 -17.534 < 0.001
E5 -0.805 0.051 -15.842 < 0.001
Neurotyczność N1 1.234 0.075 16.379 < 0.001
N2 1.006 0.068 14.849 < 0.001
N3 1.242 0.074 16.675 < 0.001
N4 1.228 0.074 16.556 < 0.001
N5 0.887 0.070 12.594 < 0.001
O5 0.123 0.062 1.982 0.047
Otwartość O1 0.727 0.058 12.451 < 0.001
O2 -0.617 0.074 -8.294 < 0.001
O3 1.032 0.076 13.616 < 0.001
O4 0.037 0.051 0.723 0.470
O5 -0.456 0.066 -6.951 < 0.001