Professional Documents
Culture Documents
Korelacja (Prezentacja)
Korelacja (Prezentacja)
Rysunek za: Brzeziński, J. (2019). Metodologia badań psychologicznych. Wydanie nowe. Warszawa: Wydawnictwo
Naukowe PWN. (str. 199)
ZWIĄZEK MIĘDZY
ZMIENNYMI ILOŚCIOWYMI
• Zbadamy teraz siłę i charakter związku
pomiędzy dwiema zmiennymi
interwałowymi:
• poziom stresu (X)
• nasilenie specyficznych objawów
psychosomatycznych (Y).
ZWIĄZEK MIĘDZY
ZMIENNYMI ILOŚCIOWYMI
ZWIĄZEK MIĘDZY ZMIENNYMI
ILOŚCIOWYMI
• Obliczamy kowariancję według wzoru:
cov xy =
( X − X )(Y − Y ) 68,8
= = 6,88
N 10
ZWIĄZEK MIĘDZY
ZMIENNYMI ILOŚCIOWYMI
cov xy
r=
sx s y
ZWIĄZEK MIĘDZY ZMIENNYMI
ILOŚCIOWYMI
• Odchylenia standardowe dla zmiennej X i Y
możemy obliczyć ze skróconego wzoru:
X X
2
2
sx = −
N N
ZWIĄZEK MIĘDZY
ZMIENNYMI ILOŚCIOWYMI
ZWIĄZEK MIĘDZY
ZMIENNYMI ILOŚCIOWYMI
X X
2
2
385 55
2
sx = − =
− = 2,87
N N 10 10
Y Y
2
2
769,84 84, 40
2
sy = − =
− = 2, 40
N N 10 10
ZWIĄZEK MIĘDZY
ZMIENNYMI ILOŚCIOWYMI
cov xy 6,88
r= = = 0,99
sx s y 2,87 * 2,40
Otrzymana wartość świadczy o
bardzo silnym związku dodatnim
między zmiennymi X i Y .
ZWIĄZEK MIĘDZY
ZMIENNYMI ILOŚCIOWYMI
Nxy − (x)(y )
r=
[ Nx − (x) ][ Ny − (y ) ]
2 2 2 2
10 * 533 − 55 * 84,40
r= =
(10 * 385 − 552 )(10 * 769,84 − 84,402 )
5330 − 4642
r= =
(3850 − 3025)(7698,40 − 7123)
688
r= = 0,99
825 * 575,40
ZWIĄZEK MIĘDZY
ZMIENNYMI ILOŚCIOWYMI
• Identyczne wyniki otrzymujemy obliczając
korelację w pakiecie statystycznym :
INTERPRETACJA SIŁY ZWIĄZKU
6 d i 2
rs = 1 −
n(n − 1)
2
• Współczynnik rs Spearmana
podobnie jak r Pearsona
przyjmuje wartości od -1 (dla
bardzo silnych związków
ujemnych) do + 1 (dla bardzo
silnych związków dodatnich.
WSPÓŁCZYNNIK rs SPEARMANA
• Współczynnik korelacji Spearmana
zależy wyłącznie od uporządkowania
zaobserwowanych wartości, może
zatem być stosowany do dowolnych
zmiennych, których wartości można
uszeregować. Jako metoda rangowa, r
Spearmana jest w niewielkim tylko
stopniu wrażliwe na obserwacje
odstające, dzięki czemu szczególną
użyteczność znajduje w analizie danych
niskiej jakości.
WSPÓŁCZYNNIK rS SPEARMANA
1 3,5 4,0
2 3,5 4,0
3 3,8 2,0
4 4,0 3,0
5 4,1 6,0
6 4,2 5,0
7 4,2 7,0
8 4,4 5,0
9 4,5 6,0
10 4,5 8,0
PORANGOWANO POMIARY
RANGI WPISANO DO TABELI
WSPÓŁCZYNNIK rs SPEARMANA
6 d i 2
6 * 40,00
rs = 1 − = 1 − =
n(n − 1)
2
10(100 − 1)
240
rs = 1 − = 0,757
990
WSPÓŁCZYNNIK rs SPEARMANA
• rs=0,757
rs2=0,573
WSPÓŁCZYNNIK rs SPEARMANA
Zmienna A Zmienna B
N Ważne 10 10
Braki danych 0 0
H0 jest
prawdziwa H0 jest fałszywa
błąd pierwszego
Odrzucenie H0 rodzaju OK.
• Poziom a – prawdopodobieństwo
popełnienia błędu pierwszego
rodzaj = poziom istotności testu
N −2 10 − 2 8
t=r = 0,99 = 0,99 =19,8
1− r 2
1 − 0,99 2
0,02
POZIOM ISTOTNOŚCI
• Obliczoną statystykę t porównujemy z
wartością t krytyczną odczytaną z tablic
rozkładu t Studenta. Do odczytania wartości
potrzebna jest nam liczba stopni swobody
(df), która jest równa:
• df = n - 2 = 10 - 2 = 8
• n – liczba par skorelowanych pomiarów
• Odczytana z tablic wartość krytyczna t dla
df= 8 i p=0,05 jest równa 2,306.
POZIOM ISTOTNOŚCI
• Hipotezę zerową (r=0) odrzucamy wówczas, gdy
spełniony jest warunek:
tobl t kryt
• tzn. gdy obliczona BEZWGLĘDNA wartość
statystyki jest większa od ta czyli wpada do
obszaru krytycznego.
• Jak widać powyżej obliczone t =19,8 jest
większe od ta =2,306 i wpada do obszaru
krytycznego(obszaru odrzucenia). Oznacza to,
że możemy odrzucić hipotezę zerową, wynika z
tego, że obliczony współczynnik korelacji jest
istotny (prawdopodobieństwo popełnienia
błędu jest niższe od założonego p=0,05).
POZIOM ISTOTNOŚCI
ROZKŁAD t STUDENTA
• Rozkłady tego typu po raz pierwszy
wprowadził William Gosset
publikujący pod pseudonimem
Student. (stąd wywodzi się ich
nazwa) Zmienna losowa jest tu
oznaczana małą literą t (od
ostatniej litery nazwiska autora).
Rozkład ma różny przebieg w
zależności od liczby stopni swobody.
ROZKŁAD t STUDENTA
ROZKŁAD t STUDENTA
William Sealy Gosset (1876-1937) angielski statystyk,
publikował pod pseudonimem Student. Jak czytamy na
stronie Stepticemia: (https://scepticemia.com/2012/09/21/william-
gosset-a-true-student/)
0.35
0.30
0.25
0.20
0.15
0.05
0.00
-3 -2 -1 0 1 2 3
-t t
n,a n,a
POZIOM ISTOTNOŚCI
• Analogicznie postępujemy w przypadku danych
porządkowych. Wartość t dla współczynnika rs
Spearmana obliczamy z wzoru:
a b
c d
Dane nominalne
Skończony TAK NIE SUMA
College:
Kobieta 9 1 10
Mężczyzna 14 12 26
SUMA: 23 13 36
Wartość
σ 𝑤 σ 𝑘 10 ∗ 23
oczekiwana →
𝑒𝑎 = = = 6,39
𝑛 36
o e (o-e) (o-e)2 (o-e)2/e
a 9 6,39 2,61 6,82 1,07
b 1 3,61 -2,61 6,82 1,89
c 14 16,61 -2,61 6,82 0,41
d 12 9,39 2,61 6,82 0,73
suma: 4,09
• df=(w-1)*(k-1) = (2-1)*(2-1) = 1
(w – liczba wierszy; k – liczba kolumn)
Testy Chi-kwadrata
𝜒2 4,09
•𝜑 = = = 0,34
𝑁 36
Wojew.1 10 15 15 40
Wojew.2 25 20 5 50
Wojew.3 15 15 20 50
Suma: 50 50 40 140
Dane nominalne
• Obliczamy wartości oczekiwane ( e ) dla
poszczególnych komórek
a b c a+b+c
d e f d+e+f
g h i g+h+i
a+d+g b+e+h c+f+i N
• Np.
(a + b + c)(a + d + g ) 40 * 50
ea = = = 14,29
N 140
o e (o-e) (o-e)2 (o-e)2/e
a 10 14,29 -4,29 18,40 1,29
b 15 14,29 0,71 0,50 0,04
c 15 11,43 3,57 12,74 1,12
d 25 17,86 7,14 50,98 2,85
e 20 17,86 2,14 4,58 0,26
f 5 14,29 -9,29 86,30 6,04
g 15 17,86 -2,86 8,18 0,46
h 15 17,86 -2,86 8,18 0,46
i 20 14,29 5,71 32,60 2,28
suma: 14,79 c2obl
POZIOM ISTOTNOŚCI
• W tablicy rozkładu c2 odczytujemy wartość
c2a dla liczby stopni swobody:
• df=(w-1)*(k-1) = (3-1)*(3-1) = 4
(w – liczba wierszy; k – liczba kolumn)
c2
V= N min( w −1; k −1)
• min (w-1;k-1) oznacza mniejszą z dwóch
wartości: liczba wierszy minus 1 lub liczba
kolumn minus 1
DANE NOMINALNE
c2
V= N min( w −1; k −1) = 14 , 79
140*2 = 0,23
Obliczona wartość współczynnika V świadczy o
bardzo słabym związku między zmiennymi.
Należy pamiętać, iż w przypadku danych nominalnych przy
interpretacji należy również opisać charakter związku – np.
w województwie 1 przeważają zwolennicy opcji B i C, a w
województwie 2 zwolennicy opcji A
INTERPRETACJA SIŁY ZWIĄZKU