You are on page 1of 11

TEORETYCZNE SPRAWY

Oznaczenia

M – średnia
Mg – średnia geometryczna
Me – mediana
Rkw – rozkład ćwiartkowy
OC – odchylenie ćwiartkowe
SD; s – odchylenie standardowe z próby
SD2; s2 – wariancja z próby
σ – wariancja z populacji
2

σ – odchylenie standardowe z populacji

r – Pearsona; korelacja
rho – Spearmana; korelacja
d – Somersa; korelacja
z – zestandaryzowana wartość w jednostkach odchylenia standardowego

Skale pomiarowe

Nominalna
Porządkowa/rangowa Me Rkw
Przedziałowa/interwałowa Me Rkw M SD
Ilorazowa/stosunkowa Me Rkw M SD Mg

Reguły tworzenia przedziałów klasowych

 Wybierać należy przedział klasowy o takim rozmiarze, by 10 do 20 takich przedziałów objęło


wszystkie wyniki.
 Przedziały klasowe powinny być równe 1, 3, 5 10 lub 20 jednostek.
 Przedział klasowy należy zacząć od wartości, która stanowi wielokrotność rozmiaru tego przedziału.
Właściwości średniej arytmetycznej:

 Można obliczać tylko dla zmiennych mierzonych na skali przedziałowej lub stosunkowej.
 Jest wrażliwa na wartości skrajne
 Graficznie przedstawia środek ciężkości rozkładu
 Suma odchyleń wszystkich pomiarów od średniej jest równa 0
 Suma kwadratów odchyleń od średniej jest mniejsza niż suma odchyleń od dowolnej innej wartości

Średnia geometryczna

 Stosuje się tylko do pomiarów na skali stosunkowej


 Jest bardziej odporna na wartości odstające niż średnia arytmetyczna

Mediana

 Mediana jest to taka wartość, powyżej i poniżej której znajduje się po 50% obserwacji.
 Medianę możemy obliczać tylko dla skali porządkowej, przedziałowej i stosunkowej (NIE nominalna)
 Graficznie dzieli cały obszar pod rozkładem na dwie równe części
 Nie jest wrażliwa na wartości skrajne

Kwartyle

 dzielą rozkład na 4 części PO 25%


 Q1, Q2, Q3

Tertyle – 3 części; Kwintyle – 5 części; Decyle – 10 części; Percentyle – 100 części

Miary zmienności

Najbardziej użyteczne miary zmienności (rozproszenia):

1. Rozstęp i rozpiętość
2. Wariancja i odchylenie standardowe
3. Rozstęp ćwiartkowy i odchylenie ćwiartkowe
4. Odchylenie przeciętne
1. Rozstęp i rozpiętość

Rozstęp – różnica pomiędzy największą a najmniejszą wartością. Bardzo wrażliwe na wartości skrajne  R
= Xmax - Xmin

Rozpiętość – rozstęp powiększony o 1 jednostkę pomiarową.

2. Wariancja i odchylenie standardowe

Wariancja – suma kwadratów odchyleń od średniej podzielonej przez liczebność pomiarów. Dla populacji

Wariancja – suma kwadratów odchyleń od średniej podzielonej przez liczebność pomiarów minus jeden.
Dla próbki

Odchylenie standardowe SD – pierwiastek z sumy kwadratów odchyleń od średniej podzielonej przez


liczebność pomiarów.

Właściwości odchylenia standardowego

 Stosuje się tylko w przypadku pomiarów na skali przedziałowej lub stosunkowej.


 Wykorzystuje naturalne jednostki.
 Jest wrażliwe na wartości skrajne.
 Jest bardziej stabilnym i dokładnym estymatorem odpowiedniego parametru w populacji w
porównaniu z innymi miarami zmienności.
 Nie ma łatwo uchwytnej interpretacji jak odchylenie przeciętne.
 Łatwiej niż inne miary poddaje się działaniom matematycznym.

3. Rozstęp ćwiartkowy i odchylenie ćwiartkowe

Rozstęp ćwiartkowy — różnica pomiędzy trzecim a pierwszym kwartylem: Rkw = Q3 – Q1

 Stosuje się w przypadku pomiarów na skali porządkowej, przedziałowej lub stosunkowej.


 Jest to obszar zmienności środkowych, typowych 50% obserwacji.
 Ma dużą wartość eksploracyjną.
 Jest odporny na wartości skrajne

Odchylenie ćwiartkowe: OC = (Q3 – Q1)/2. Mówi, jak kwartyle przeciętnie odchylają się od mediany.
Rozkłady

Lewoskośny Prawoskośny
Skośny ujemnie Skośny dodatnio
skośność < -1 skośność > 1
M<Me<Mo M>Me>Mo
Mo>Me>M Mo<Me<M

Leptokurtyczny Mezokurtyczny Platykurtyczny


K>3 -3 < K < 3 K < -3
Przekształcenie normalne – ogólna definicja

 Przekształcenie normalne – jest to przekształcenie zmiennej wyrażonej w wynikach surowych w


postać normalną przy arbitralnie wybranej średniej i odchyleniu standardowym.
 Stosuje się w procesie normalizacji testów.
 Ogólny wzór: Wynik znormalizowany = Mn + sn*z
o gdzie z - to wynik standaryzacji wyników surowych Mn - średnia wybranej skali normalnej
sn - odchylenie standardowe wybranej skali normalnej

Skale normalizacyjne

M s Przedziały Uwagi
TEN 50 10 Norma między 30-70
Testy: MMPI-2, ACL
STEN 5,5 2 10 Skok = 0,5z od -2 do 2
Tabelka z procentami
10 stenów
STANI 5 2 9 Skok = 0,5z od -1,75 do 1,75
9 staninów
Skale selekcyjne w wojsku i edukacja
Tabelka z procentami
10 stenów
TETRO 10 4 Od -2,5 do 2,5
W skali 21 jednostek
STEIWOWA 3 1 To jest ta skala, która ledwo istnieje,
więc nie ma co się przejmować
Rozkład empiryczny i teoretyczny

 Rozkład empiryczny wymaga przeprowadzenia badań lub serii prób (empirycznej obserwacji)
 Rozkład teoretyczny nie wymaga przeprowadzenia badań a jego kształt jest ustalany na podstawie
wzoru matematycznego lub rachunku podobieństwa
 Rozkład dwumianowy oznacza rozkład kombinacji dwóch takich cech, których suma prawdopodobieństw
występowania równa 1

Rozkład normalny

 jest uogólnieniem rozkładu dwumianowego dla p = q = ½ na sytuację, gdy jest nieskończenie wiele
prób.
 jest rozkładem zmiennej losowej ciągłej
 jest rozkładem teoretycznym

Rola rozkładu normalnego w psychologii

 Krzywa jest symetryczna. Średnia mediana i modalna zbiegają się w jednym punkcie
 Krzywa jest asymptotyczna. Zbliża się do osi poziomej, lecz nigdy do niej nie dochodzi i rozciąga
się od minus nieskończoności do plus nieskończoności
 Punkty zagięcia krzywej znajdują się w miejscach +/- 1s od średniej. W tych miejscach krzywa
zmienia się z wypukłej na wklęsłą.
 Ok 68% powierzchni pod krzywą mieści się w granicach +/- 1 s od średniej
 Kształt rozkładu normalnego zależy od wartości średniej i odchylenia standardowego

Dystrybuanta

 Prawdopodobieństwo tego, że zmienna X ma wartości mniejsze bądź równe x


 Typ wykresu, który pokazuje związek pomiędzy wartościami ciągłej zmiennej losowej a
prawdopodobieństwem, czyli relacją pomiędzy z a polem pod krzywą normalną.

Korelacje
Pojęcie korelacji

 Korelacja – związkiem pomiędzy dwoma zmiennymi


 Współczynnik korelacji – liczbowa miara związku
 Użyteczność współczynnika korelacji

 Wyjaśnianie obserwowanych zjawisk - (jakie są ich przyczyny – atrybucja oparta na wiedzy


naukowej)
 Przewidywanie (predykcja) przyszłych zdarzeń

Kryteria uwzględniane przy wyborze miary związku (wybór współczynnika korelacji)

 Liczba korelowanych zmiennych


 Rodzaj skali pomiarowej (nominalna, porządkowa, ilościowa)
 Liczby wartości przyjmowanych przez korelowane zmienne
 Natura związku – liniowa, krzywoliniowa
 Testowanie szczegółowych warunków zastosowania danego współczynnika

Wspólne cechy różnych miar związku

 Wymagają zestawienia pomiarów zmiennych dla tej samej osoby


 Wzrostowi jednej zmiennej towarzyszy wzrost drugiej -> związek dodatni (+)
 Wzrostowi jednej zmiennej towarzyszy spadek wartości drugiej zmiennej -> związek ujemny (-) nie
dotyczy nominalnej, bo tam nie ma spadków
 0 – oznacza brak związku pomiędzy zmiennymi
 Wartość miary związku mieści się pomiędzy -1 a +1
 Im bliżej -1 lub +1 tym silniejszy związek

Współczynnik korelacji r Pearsona

 Współczynnik korelacji liniowej (zakłada liniowy związek między zmiennymi)


 współczynnik wg momentu iloczynowego (kor 0,5 tzn. wzrost wartości o 1SD to druga wartość
wzrośnie o 0,5SD)
 parametryczny współczynnik korelacji (tzn. dla ilościowej)
Warunki zastosowania r Pearsona

 skala ilościowa dla obu zmiennych


 liniowość związku pomiędzy zmiennymi (jeśli związek nie będzie liniowy, wyniki mogą zostać
zafałszowane)
 podobieństwo rozkładu zmiennych (najlepiej, żeby rozkłady obu zmiennych były normalne)
 idealny przypadek: rozkłady normalne (As = 0, K = 0)
 umiarkowana skośność

Odsetek wspólnej wariancji

 r^2 - współczynnik determinacji


 100% – odsetek wspólnej wariancji

Jeśli frekwencja jest 0,5 korelacji z ocena egzaminu tzn. że ocena z egzaminu jest tłumaczona w 25% przez
frekwencje a 75% przez inne zmienne.

Poziom statystycznej istotności

Przy obliczaniu każdego współczynnika korelacji pojawia się dokładna informacja na temat jego istotności
statystycznej = jakie jest prawdopodobieństwo błędu uogólnienia korelacji na populację.

Otrzymaną istotność porównujemy z istotnością kryterialną p < 0,05

Jeżeli poziom istotności jest p,0,05 współczynnik korelacji jest statystycznie istotny (korelacja istnieje w
populacji z bledem p)

Jeżeli współczynnik istotności jest większy p > 0,05 współczynnik korelacji nie jest statystycznie istotny
(nie mamy podstaw, żeby stwierdzić, że korelacja występuje w populacji)
Istotność statystyczna a siła związku

Wysoka istotność statystyczna nie przekłada się na wysoką silę związku!

 na podstawie istotności p orzekamy o wiarygodności ustalonej siły związku dla populacji w oparciu
o badania próby
 na podstawie znaku wsp. Korelacji (+ lub - ) stwierdzamy kierunek zależności
 na podstawie wartości współczynnika korelacji orzekamy o silę związku

0.00 – 0.10 bardzo niska


0.11 – 0.30 niska
0.31 – 0.50 umiarkowana
0.51 – 0.70 wysoka
0.71 – 1.00 bardzo wysoka

Współczynniki korelacji rangowej:

Założenie: obie zmienne są mierzone przynajmniej na skali rangowej

Ogólne zalecenia: im większa liczba wartości, które przyjmuje każda ze zmiennych, tym lepiej

Właściwości: wartości wahają się w granicach od -1 do +1

Rodzaje współczynników korelacji rangowej:

Symetryczne:

 rho Spearmana
 tau-b Kendalla
 tau-c Kendalla
 Gamma

Asymetryczne:

 d Somersa – asymetryczne - oznacza to, że używamy kiedy teoria sugeruje związek P-S
o wrażliwe na rangi wiązane; należy ich unikać

Jeśli nie możemy użyć Pearsona najlepszym odpowiednikiem jest rho Spearmana
Właściwości rho Spearmana:

 Jest rangowym odpowiednikiem r Pearsona


 Odporny na wartości skrajne
 rho podniesione do kwadratu jest interpretowany w terminach wyjaśnianej zmienności jak r Pearsona
 Częściowo traci swoją wartość w miarę wzrostu liczby rang wiązanych

Zastosowanie rho Spearmana:

 W przypadku małej ilości rang wiązanych


 Można zastosować do pomiaru związków krzywoliniowych w postaci krzywej logarytmicznej lub
zbliżonej
 Stosuje się jako miara podobieństwa profili

Kendall

W Kendalla – Bada zgodność ocen kilku osób; raczej się nie stosuje w psychologii

Tau Kendalla

 miara podobieństwa uporządkowani


 Opiera się na (p)rawdopodobieństwie: różnicy między P tego, że dwie zmienne układają się w tym
samym porządku w obrębie obserwowanych danych a P, że ich uporządkowanie się różni
 Na wyniki duży wpływ ma częstotliwość występowania rang wiązanych
 Jest porównywalne z rho co do siły statystycznego wnioskowania
 Logika leżąca u podstaw definicji rho i tau, a także same formuły obliczeniowe są różne, stąd dają
one nieco inne wyniki

Inne korelacje

Phi Yula

 2 zmienne o dwóch kategoriach – 2x2


 Nie można stwierdzić kierunku związku, bo to są dwie inne kategorie

C kontyngencji

 Im więcej kategorii tym większa będzie wartość wskaźnika


Kappa Cohena

 wykorzystywany w psych
 kiedy sprawdzamy zgodnosc ocen sedziów
 dane od różnych osob ktore dotycza tej samej rzeczy
 np. zgodnosc profili ktorzy chca zawrzeć związek - dwie osoby oceniaja ważne rzeczy i badamy jaka
jest zgodnosc

Eta

 jedna nominalna druga przedziałowa (ilościowa)


 miara związku między zmienna jakościowa i ilościowa
 rzadko wykorzystywany

You might also like