You are on page 1of 6

Psychometria to:

Sposoby budowania pytań testowych


Kryteria wyboru pytań o najlepszych parametrach
Przekształcanie odpowiedzi na wyniki liczbowe
Ocena jakości wyników testów
Interpretacja wyników

Przykładowe Testy psychologiczne


Test wiedzy o produkcie w procesie rekrutacji
Test zdolności matematycznych uczniów
Test procesów poznawczych pacjenta po udarze
Test inteligencji

Rodzaje testów psychologicznych:


Standaryzowane i niestandaryzowane
Zasady stosowania i normy
Indywidualne i grupowe
Pojedynczo lub wiele osób
Szybkości i mocy
Z ograniczeniem czasowym lub bez
Obiektywne i nieobiektywne
Ocena wyniku mechaniczna czy wymaga umiejętności
Słowne i bezsłowne
Wymagają opanowania języka lub nie
Poznawcze i afektywne
Istnieje odpowiedź prawidłowa lub nie
Zorientowany na normy lub poziom wykonania
Punkt odniesienia dla wyników – bezwzględny lub na tle
populacji

Statystyki opisowe czyli jak opisać i zrozumieć posiadane dane


są to róznorodne procedury stosowane do zobrazowania najważniejszych właściwości posiadanych
danych, bez wyciągania wniosków wykraczających poz te dane.

Do statystyk opisowych zaliczamy:


• Techniki ilustrujące liczebność: liczba, częstotliwość, procent

• Techniki pokazujące tendencję centralną (punkt, dookoła którego skupiają się dane) np.:
średnia, mediana, modalna.

• Techniki pokazujące zmienność (rozproszenie wyników dookoła ich punktu skupienia) np.:
wariancja, odchylenie standardowe, rozstęp
• Wykresy i tabele

Statystyki opisowe
średnia
mediana i percentyle
modalna
wariancja
odchylenie standardowe
Miar współzmienności

Kowariancja
korelacja

Skale standaryzowanych
z-score
IQ

Kryteria dobroci testów psychologicznych – RZETELNOŚĆ


Pomiar rzetelny powinien być powtarzalny. Rzetelność dotyczy powtarzalności pomiaru.
Można także powiedzieć, że jest to wielkość błędu, jaki popełniamy korzystając z wyników danego
testu.Wynik każdego testu psychologicznego obarczony jest błędem

Źródła błędu w pomiarze testowym


Błąd systematyczny
Błąd niesystematyczny (losowy, przypadkowy)

W przypadku błędu systematycznego wynik w teście „wynika” nie z poziomu mierzonej cechy,
ale z powtarzalnego, stałego błędu np.:Chęci zawyżenia wyniku, Niezrozumienia testu, Braku
motywacji do dobrego wykonania itp.

Błędy systematyczne są uporządkowane, układają się w pewien trend, wyniki pomiaru na ich
skutek, zmieniają się zgodnie z pewnym wzorcem.

W przypadku błędu niesystematycznego(losowego) Błędy powstają w na skutek działania


czynników niesystematycznych, losowych. W kolejnych powtórzeniach pomiaru u tej samej osoby,
może się pojawić lub nie.Wynika z Konstrukcji testu, sytuacji testowania, Sposobu oceny wyników,
Jest to stały element każdego pomiaru testowego – nie da się go uniknąć.

Błędy niesystematyczne są nieuporządkowane, nie przejawia żadnych wzorców.

Sposób oceny wyników:


Błędy systematyczne – są powtarzalne, układają się we
wzorce, są uporządkowane np.: waga łazienkowa dodaje
zawsze 5 kg
Błędy losowe – losowe, niesystematyczne, nieuporządkowane
tworzą szum np.: waga łazienkowa raz dodaje 3kg, a innym
razem odejmuje 2,5kg itd.

Błędy systematyczne są mniej groźne, o tyle że jeśli odnajdziemy ich wzór, ustalimy pewien ich
trend, porządek, to możemy je korygować np.: jeśli wiem, że waga zawsze dodaje 5 kg, to mogę
odjąć 5 kg od wyniku.
Jeśli będzie dużo błędów losowych (np. pytania będą za trudne,
instrukcje niezrozumiałe, warunki badań zmienne) w wynikach
pomiaru będzie dużo szumu, błędu i nie będą powtarzalne.
Jeśli badany za każdym razem uzyskuje inny wynik z powodu
różnych czynników losowych, to co nam po takim wyniku?
Wyniki obarczone wysokim błędem losowym są bezużyteczne
Klasyczna teoria testów

X=T+E

X = wynik otrzymany w teście


T = wynik prawdziwy
E = błąd pomiaru

Rzetelność informuje nas o tym jaki jest związek między wynikiem prawdziwym T a wynikiem
otrzymanym X
X=T+E

Związek ten możemy wyraz w formie:


Wskaźnika rzetelność -korelacja (r) miedzy wynikiem prawdziwym T a wynikiem otrzymanym X
Współczynnika rzetelności – współczynnik determinacji wskaźnika
rzetelności czyli kwadrat korelacji miedzy wynikiem prawdziwym T
a wynikiem otrzymanym X

Korelacja

Współczynnik korelacji określa stopień współzmienności między


dwiema zmiennymi, przyjmuje wartość od -1 do 1

Współczynnik determinacji określa siłę związku między zmiennymi -


ile zmienności jednej zmiennej jest wyjaśniane przez zmienność
drugiej – jest to współczynnik korelacji do kwadratu

Przykład:

Współczynnik korelacji pomiędzy wynikiem na egzaminie


magisterskim z psychologii a IQ studenta wynosi r = 0.80, a
współczynnik determinacji R2= 0.64 (0.80 * 0.80)
Co z tego wynika?
Interpretacja korelacji
Współczynnik jest wysoki (-1 do 1), więc r = .80 wskazuje, że
występuje współzmienność, studenci, którzy mają wysokie IQ
uzyskują też wysokie wyniki na egzaminie.

Interpretacja współczynnika determinacji r = 0.80, R2= 0.64 - 64%


zmienność jednej zmiennej jest wyjaśniana przez zmienność drugiej
zmiennej
Jeśli obserwujemy, że studenci różnią się wynikiem z egzaminu magisterskiego to 64% tych różnic
wynika z różnic w inteligencji, a reszta 36% z innych czynników np.: czasu nauki, sumienności itp.
Pamiętajmy, że współczynnik korelacji sam nie mówi nam o sile związku.

Testy równoległe to testy, które mierzą to samo i tak samo, ale


innym zestawem pytań i spełniają warunki:
Mają takie same średnie
Mają takie same odchylenia standardowe
Interkoleracja pozycji jest taka sama
Korelacja z pewną wybraną zmienną Z jest taka sama
Założenia klasycznej teorii testów, które muszą być spełnione, by korzystać z testów
równoległych:
• pierwsze założenie– błąd pomiarowy wynika tylko z czynników niesystematycznych
• drugie założenie: Nie ma związku między wynikiem prawdziwym a błędem
pomiarowym – korelacja między błędem pomiaru a wynikiem prawdziwym wynosi 0
• trzecie założenie: Błędy pomiarowe w kolejnych pomiarach nie są ze sobą powiązane
• czwarte załozenie: mierzona cecha jest stała

Rzetelność=

S – przyjmujemy jako oznaczenie odchylenia standardowego


s2 – wariancja (czyli odchylenie standardowe do kwadratu)

Zatem współczynnik rzetelności to korelacja między wynikiemprawdziwym a otrzymanym


podniesiona do kwadratu.

Ponadto znajomość współczynnika rzetelności bazując na założeniach klasycznej teorii testów,


pozwala także określić zmienność błędu losowego E – tzw. standardowy błąd pomiaru.
Standardowy błąd pomiaru – odchylenie standardowe różnic pomiędzy wynikiem otrzymanym a
prawdziwym, gdybyśmy nieskończenie wiele razy testowali tę samą osobę wersjami
równoległymi tego samego testu.

Metody badania rzetelności:


• Metoda powtarzania testu test – retest
• Rzetelność szacowana metodą wersji równoległych testu
• Rzetelność szacowana na podstawie jednego badania
• Rzetelność jako zgodność ocen

METODA POWTARZANIA TESTU_RETEST

1. Wariant z przerwą (najczęstszy)


Podwójne wykonanie tego samego testu i obliczenie korelacji między wynikami.
Istotna jest tu długość przerwy między kolejnymi wykonaniami testu. Musi być na tyle długa, by
osoby zapomniały swoje odpowiedzi, ale na tyle krótka, by nie doszło to trwałych zmian
osoby badanej, zwykle kilka tygodni lub miesięcy.
2. Wariant bez przerw, ten sam test dwa razy
Zasadne w testach, w których jedno wykonanie nie wpływa na późniejsze wyniki np.
motorycznych, sensorycznych, ale niekoniecznie w testach, gdzie może dochodzić do uczenia
się lub zapamiętywania odpowiedzi.

RZETELNOŚĆ SZACOWANIA METODĄ WERSJI RÓWNOLEGŁYCH

1. Wariant z przerwą
Współczynnik stabilności względnej
Badani w odstępie czasu rozwiązują dwie alternatywne wersje tego samego testu, które są
równoległe i obliczamy korelacje między uzyskanymi wynikami.
2. Wariant bez przerwy
Współczynnik równoważności międzytestowej. Badani rozwiązują dwie wersje alternatywne w tym
samym czasie i obliczamy korelację między wynikami.
RZETELNOŚĆ SZACOWANA NA PODSTAWIE JEDNEGO BADANIA

Metoda połówkowa
Testy równoległe tworzymy w obrębie jednego testu, tworząc z jego pytań połówki.
Metody podziału na połówki:
Losowy
Parzyste nieparzyste
Ze względu na treść i trudność

Rzetelność to współczynnik korelacji między połówkami testu, która musi być jeszcze skorygowana
np.: wzorem Spearmana – Browna, ponieważ każda połówka jest krótsza niż cały test, a
rzetelność wiąże się z długością testu.

𝑟𝑝 = korelacja między połówkami

Metoda zgodności wewnętrznej


Test możemy podzielić na wiele połówek i za każdym razem możemy otrzymać inną korelację
między połówkami, a zatem inne oszacowanie rzetelności, zatem warto sprawdzić, jaka jest
średnia korelacja dla wszystkich możliwych podziałów na połówki.
Dwa często stosowane sposoby:
Wzór Kudera-Richardsona (tylko odpowiedzi binarne)
Wzór Cronbacha – tzw α – Cronbacha (skala ciągła)

Najpopularniejsza metoda szacowania rzetelności – choć nie


zawsze poprawnie używana.

Warunki korzystania z alfy Cronbacha


Niezależność błędów pomiaru - błędy przypisane do itemów są losowe i niepowiązane, jeśli są
powiązane mogą wynikać z „czegoś” innego niż tylko mierzona cecha.
Tau-eqivalence – każdy z itemów wnosi podobny wkład w końcowy
wynik, każde pytanie jest tak samo ważne.
Jednowymiarowość – test mierzy jeden konstrukt

RZETELNOŚĆ JAKO ZGODNOŚĆ OCEN

Rzetelność jako korelacja między ocenami wyników dokonywanych przez różne osoby.
Metody badania rzetelności - porównanie
METODA ŹRÓDŁO BŁĘDÓW

Powtarzanie tego samego testu, bez przerwy Czynniki związane z osobą badaną

Powtarzanie tego samego testu, z przerwą Upływ czasu

Wersje alternatywne, bez przerwy Treść pytań

Wersje alternatywne, z przerwą Treść pytań i upływ czasu

Metoda połówkowa Treść pytań

Metoda Kudera - Richardsona i alfa Cronbacha Treść pytań

Zgodność ocen sędziów Róznice międz sędziami

Czynniki wpływające na rzetelność:

• Długość testu
Im więcej pytań, tym test rzetelniejszy – im więcej informacji, tym większa szansa na
właściwą ocenę Jednak może być nadużywane – dużo podobnych pytań może zawyżać
rzetelność. Krótki rzetelny test jest lepszy niż długi
• Zmienność, zakres mierzonej cechy w badanej próbie Współczynnik rzetelności
zależy też od wariancji wyników prawdziwych, jeśli wariancja maleje, to i rzetelność maleje
np.: Badanie na grupie osób tylko o wysokiej inteligencji będzie miało niższą rzetelność niż
badania na całej populacji, bo zmienność inteligencji będzie mniejsza

You might also like