Professional Documents
Culture Documents
2. Cechy latentne (ukryte) = zjawiska psychologiczne, których nie da się bezpośrednio określić (np. sumi-
enność) i ocenia się je za pomocą itemów odnoszących się do zachowań wskazujących (np. na sumien-
ność)
- hipotetyczne
- możliwe do wyrażenia na kontinuum
- nie mogą być mierzone bezpośrednio, tylko pośrednio - na podstawie obserwowalnych wskaźników
- rzadko mają tylko jeden wskaźnik
- wszystkie wskaźniki mają pewne wspólne źródło w postaci cechy ukrytej
3. Podejścia psychometryczne
I. teoria losowego doboru próby (na większe populacje, tzw. uniwersum) - wynik obserwowalny w teście
stanowi funkcję wyniku prawdziwego i błędu pomiaru; kontrola błędu pomiaru warunkuje tutaj
wartość mierzonej cechy w kontekście generalizacji pomiaru przeprowadzonego w próbie na popu-
lację
• trzy nurty:
- klasyczny (KTT - klasyczna teoria testów) - Guliksen, 1950
- zmodyfikowana KTT - Lord i Novick, 1968
- teoria uniwersalizacji - Cronbach, 1972
1 z 12
• teoria odpowiedzi na pozycje testowe (IRT - item respons theory) - rzeczywisty wynik osoby
wykonującej test; bada to, jak odpowiedzi na kolejne pytania pozwalają na określenie rzeczywistego
wyniku osoby badanej na kontinuum cechy
4. Test - narzędzie pomiarowe lub technika służące do kwantyfikowania zachowań, cech lub dyspozycji
w celu ich zrozumienia lub przewidywania innych zachowań.
Stanowi zbiór próbek zachowań lub charakterystyk utożsamianych z badanym zjawiskiem.
• Rodzaje testów:
- standaryzowane - posiadają dokładnie sprecyzowanie zasady ich stosowania; wyposażone w normy
otrzymane w wyniku przebadania reprezentatywnej próby pochodzącej z populacji, dla której test ma
być stosowany
- niestandaryzowane - często stosowane tylko raz, np. testy wiadomości budowane przez nauczycieli na
ich własny użytek, w których dopuszcza się możliwość interakcyjnego modyfikowania sytuacji badań
LUB:
- indywidualne
- grupowe
- szybkości - czas rozwiązania jest ograniczony i z założenia nikt nie powinien go ukończyć w wyznac-
zonym czasie; różnice indywidualne są determinowane szybkością wykonania
- mocy - stwarza każdej osobie badanej szanse na podjęcie próby rozwiązania wszystkich pozycji testu;
trudność w takim teście rośnie stopniowo; rzadko ktoś dostaje max pkt
- obiektywne - posiadają starannie opracowane metody obliczania testu (może go policzyć każdy, na
bazie szablonu)
- nieobiektywne - wymaga dużej znajomości przedmiotu pomiaru, a otrzymany wynik odzwierciedla
subiektywne umiejętności psychologa
- słowne - zadania tylko z materiału werbalnego; kryterium jest sprawność językowa
- bezsłowne - wykonanie określonej czynności
2 z 12
- właściwości poznawczych - mierzące wytwory procesów poznawczych, gdzie każde zadanie ma ściśle
określoną odpowiedź prawidłową (np. testy zdolności czy uwagi)
- właściwości afektywnych - mierzące postawy, wartości, zainteresowania i inne poznawcze aspekty
osobowości; nie istnieje kategoria odpowiedzi prawidłowej; problemem jest trafność samopisu przez
osobę badaną
- zorientowane na normy - punktem odniesienia dla interpretacji wyników jest konkretna populacja
osób
- testy zorientowane na kryterium - opisują badaną jednostkę w kategoriach specyficznych umiejęt-
ności, jakie udało się jej opanować
• Pozycja testowa (item) - próbki zachowań reprezentatywnych dla danego konstruktu -> opcja do
wyboru w teście
- w testach wiedzy: udzielenie poprawnej odpowiedzi dla pozycji testowej wiąże się z wnioskowaniem o
wyższym poziomie wiedzy w danym obszarze
- w testach psychologicznych: udzielenie odpowiedzi dla pozycji testowej zgodnej z kluczem wiąże się z
wnioskowaniem o wyższym poziomie cechy
• Wariancje:
- wariancja wspólna - wskaźniki cechy latentnej bez względu na swój charakter współdzielą część zmien-
ności, czyli wariancji
- swoista - pozostała część wariancji, niewspółdzielona z pozostałymi wskaźnikami. W jej skład
wchodzą:
-> wariancja specyficzna dla danego wskaźnika, której źródłem jest inna cecha ukryta
-> wariancja błędu - związana z błędem pomiaru i nierzetelnością narzędzia
3 z 12
I. Zdefin-
iowanie
mier-
zonej
właści-
wości i
jej op-
er-
acjon-
alizacja
II.
Określe-
nie formatu bodźca i formatu odpowiedzi
- ile pozycji testowych będzie miał test?
- ile czasu zajmie wypełnienie go?
- jaki typ pozycji testowych będzie zawierał? -> pozycje z narzuconym kluczem odpowiedzi (skala dy-
chotomiczna - tak/nie, prawda/fałsz; skala w formacie Likerta (0-5); skala na kontinuum) / pozycje z
nienarzuconym kluczem
- jaki zakres wyników będzie raportował?
- czy będzie to test do badań indywidualnych czy grupowych
4 z 12
• Rzetelność w klasycznej teorii testów (Guliksen)
Wynik otrzymany (t) nie jest idealną miarą mierzonej cechy, a funkcją faktycznego poziomu mierzonej
cechy (wynik prawdziwy - T) zniekształconą przez poziom błędu pomiaru (e)
t=T+e
e=t-T
- testy równoległe - dwie wersje testu i równoważne narzędzia pomiaru składające się z podobnych
zadań; tak skonstruowane, że pomiar różnymi wersjami testu daje te same korelacje, co podwójne
badanie jedną z wersji testu
-> współczynnik równoważności międzytestowej (konsystencji) - korelacja między dwoma testami
równoległymi przeprowadzonymi bez przerwy czasowej -> pokazuje w jakim stopniu wariancja błędu za-
leży od różnic między wersjami testu i jak wpływa treść pozycji na wynik; może prowadzić do zawyżania
rzetelności, jeżeli testy są nadmiernie równoległe (nie pomieszane pozycje, tylko np. zmiana frazeologii)
-> współczynnik stabilności względnej - dwa testy równoległe przeprowadzone w odstępie czasowym ->
jest to stabilność krótko- lub długoterminowa (zależy od czasu odstępu); prowadzi do ustalenia dolnej
granicy rzetelności testu (gorzej już nie będzie)
5 z 12
-> omega McDonalda - mierzy zgodność wewnętrzną; rekomendowana w przypadku skal wielowymi-
arowych
• Moc dyskryminacyjna pozycji testowej - korelacja pozycji testowej i wyniku w całym teście
-> im wyższa korelacja pozycji i wyniku, tym silniej różnicuje (dyskryminuje) dana pozycja testowa w
kontekście badania całej cechy
-> pozycje o wysokich mocach dyskryminacyjnych (>/= 0,20) w wysokim stopniu przyczyniają się do
badania cechy, a te o niskich mocach (< 0,20) w niewielkim stopniu
-> analiza mocy dyskryminacyjnej stanowić może kryterium odsiewania pozycji najsłabszych psychome-
trycznie (najmniejsza szansa osiągnięcia satysfakcjonującej rzetelności)
4. Trafność pomiaru - stopień w jakim test mierzy zamierzoną cechę, na ile spełnia założenia pomi-
arowe. Wysoki poziom trafności = gwarancja sensowności interpretacji wyników oraz zasadność przyp-
isania im określonego znaczenia psychologicznego
• Rodzaje trafności
• Metody sędziów kompetentnych:
- jakościowe - zbieranie informacji zwrotnej od ekspertów na temat
jakości językowej i treściowej wygenerowanych itemów, np. metoda
Lawshego (trójstopniowa skala)
-> współczynnik W. Kendalla - miara zgodności pomiędzy rankingami pochodzącymi z wielu źródeł, np.
od różnych osób
W < 0,40 - niewystarczająca zgodność
0,40 < W < 0,59 - zadawalająca zgodność
0,60 < W < 0,80 - dobra zgodność
W > 0,80 - bardzo dobra zgodność
• trafność kryterialna - wskazuje stopień powiązania wyników w teście z kryterium; ocenia, czy na pod-
stawie wyników testu możemy wnioskować o przypuszczalnej pozycji badanego na kontinuum innej
cechy (tzw. kryterium), np. Czy na podstawie wyników w teście badającym postawę wobec statystyki
możemy przewidywać oceny ze statystyki?
7 z 12
zowana jest nie tylko macierz korelacji między wskaźnikami, ale także macierz korelacji między zmien-
nymi ukrytymi
-> model podwójnego czynnika (bifactor, model bezpośrednio hierarchiczny) - czynnik główny jest
definiowany przez ładunki czynnikowe wszystkich pozycji skali, a czynniki poboczne (specyficzne) są
wyodrębnione na podstawie analizy mniejszych grup pozycji; w ujęciu tym pojawia się więcej niż jedno
źródło wspólnej wariancji wpływającej na oszacowanie.
• EFA (eksploracyjna analiza czynnikowa) - analiza wstępna: eksploracja wskaźników (szukanie czyn-
ników ukrytych i określanie ich optymalnej liczby). Wszystkie mierzone zmienne odnoszą się do
każdej ukrytej zmiennej. Często na dalszym etapie wymaga potwierdzenia przez CFA.
8 z 12
- analiza równoległa (paralel analysis) -> wyodrębnij liczbę czynników dla których wartości własne
będą >/= 95.centyl wartości własnej oczekiwanej, otrzymanej w wyniku analizy zbiorów testowych
- kryterium procenta wariancji wyjaśnionej -> wybór liczby czynników gwarantującej pewien arbi-
tralnie określony % wariancji przez zmienne; abstrahuje od wartości własnych i jego restrykcyjność
leży w gestii badacza; powinno
być odzwierciedlone w skład-
owych głównych w > 80%
- kryterium połowy -> liczba
wyodrębnionych czynników
powinna być mniejsza niż
połowa liczby wskaźników
włączanych do analizy
czynnika.
III. Określenie metody rotacji ładunków czynnikowych - w sytuacji, gdy proponowane rozwiązanie
składa się z kilku czynników; jeśli rozwiązanie jest jednoczynnikowe ładunki można prezentować
również w postaci nierotowanej
- ładunek czynnikowy - stopień w jakim poszczególne wskaźniki ładują czynniki latentne. Im wyższy
ładunek czynnikowy, tym silniej wskaźnik „powiązany jest” z czynnikiem.
9 z 12
-> rotacja czynników - maksymalizacja wielkości ładunku czynnikowego na jednym z czynników, przy
minimalizacji ładunków na innych (ułatwia interpretację, stosujemy wtedy, gdy wyróżniamy więcej niż
jeden czynnik)
11 z 12
II. Dobór grupy normalizacyjnej - grupy na podstawie której wyników zostaną wyliczone normy; jej
struktura powinna odzwierciedlać strukturę populacji (być reprezentatywna); najlepszy jest dobór
losowy, warstwowy lub kwotowy
- normy ogólnokrajowe - grupa odzwierciedlająca populację kraju
- normy lokalne - dla wąsko zdefiniowanej populacji
III. Podjęcie decyzji o skali przeliczonej w jakiej wyrażone będą normy (np. stanowej)
IV. Dokonanie transformacji normalizacyjnej
12 z 12