Professional Documents
Culture Documents
Etapy postępowania w naukach empirycznych: fakty, obserwacje -> wnioski, teoria -> empiryczna weryfikacja –
przewidywanie zachowań na podstawie założeń teoretycznych -> jeśli dane się pokrywają z założeniami
teoretycznymi, wtedy mówimy, że teoria jest weryfikowalna/ jeśli to co zakładaliśmy nie znajduje odzwierciedlenia
w rzeczywistości, wtedy nie przyjmujemy teorii.
1) Sformułowanie problemu badawczego oraz hipotezy badawczej- jako “ujęzykowienie problemu” (przegląd
literatury, żeby postawić pytanie, hipotezę, albo żeby replikować eksperyment).
Pytanie badawcze=intuicja badawcza, która leży u podłoża problemu i hipotezy badawczej (cokolwiek to oznacza)
Przykład:
zmienna zależna - Samoocena
zmienne niezależne - osiągnięcia szkolne/akademickie
inne zmienne- które nie są przedmiotem naszych badań, należy je nazwać i skontrolować, żeby nie miały wpływu na
zmienną zależną i nie przeszkadzały: dochód, status ekonomiczny
3) Operacjonalizacja zmiennych
Dobranie narzędzi badawczych (np. Test), którymi będziemy mierzyć zmienne w aspektach najbardziej
interesujących nas
4) Wybór modelu badawczego (badanie korelacyjne vs. Eksperymentalne, rodzaje planu eksperymentalnego, dobór
metod analizy statystycznej danych)
6) Wybór modelu statystycznego (model testu t ANOVA lub MANOVA, Model analizy regresji)
Teraz przypominamy zmienne: (będzie na egzaminie) - Brzeziński str 30-32 – zmienne a skala nominalna –
zagadnienie na egzamin!
Zależne - to zmienne, które są przedmiotem naszego badania, których związki z innymi zmiennymi chcemy określić.
Niezależne - zmienne które oddział wpływu ją na powyższą, od których ona zależy to zmienne niezależne.
Zmienne nominalne - (skala nominalna – pozwala stwierdzić, czy zmienna przynależy czy nie do jakiejś kategorii-
przykład płeć- 2 kategorie, dychotomiczna, pozwala zaklasyfikować jednostkę do jednej z dwóch kategorii, nic
więcej).
Skala porządkowa - rangowa – pozwala zaklasyfikować jednostkę do grupy oraz stwierdzić zwiększenie bądź
zmniejszenie nasilenia oddziaływania jakiś cech – nie zgadzam się, zgadzam się, nie mam zdania) - na tej skali
można mierzyć nasilenie cechy, nie o ile.
Ilościowe:
Skala interwałowa (przedziałowa) - nie tylko pozwala stwierdzić nasilenie cechy, ale także o ile jednostek coś różni
się od czegoś- równych interwałów, pozwala stwierdzić różnicę między wartościami
Skala wielorazowa (stosunkowa) - pozwala powiedzieć o ile razy więcej/ jedna wartość jest wielokrotnością innej,
ma 0 absolutne
-Główne zadanie statystyki opisowej jest uporządkować liczby, które otrzymujemy w skutek jakiegoś pomiaru.
Rozkład liczebności - każde uporządkowanie danych, które pokazuje liczebność różnych wartości zmiennej lub
liczebność przedziałów klasowych
Przykład 1:
W badaniach osoby badane były w wieku od 10 do 20 lat, należy podać rozkład liczebności, żeby zobaczyć
procentowy udział osób w różnych kategoriach wiekowych, żeby sprawdzić, czy jest reprezentatywna
5 – x%
57 – 100%
X= (5*100/)57=8,77%
R= Xmax - Xmin +1
- Należy wybrać przedział klasowy o takim rozmiarze, by 10-20 takich przedziałów obejmowało wszystkie
wyniki
- -Przedziały klasowe powinny być równe 1, 3, 5, 10, lub 20 jednostek.
- Należy zaczynać przedział klasowy od wartości, która stanowi wielokrotność rozmiaru tego przedziału.
- Zapisując wartości zmiennej ciągłej w postaci dyskretnej, przyjmujemy, że wartość zapisana przedstawia
wartość rzeczywistą mieszczącą się w połowie jednostki pomiarowej poniżej i powyżej
Wykład 2) 16.11.2021 - zajęcia prowadzone z książki Francuza +ma nam umieścić ten rozdział w plikach i wyśle
rozdział z przykładami zadanek, +umieści to co dziś robiliśmy - W “Liczby nie wiedzą skąd pochodzą” str. 106-117
1) Uporządkowujemy dane (od najmniejszej do największej)
1, 1, 2, 2, 4, 5, 5, 5, 6, 6,
2) Liczymy rozpiętość:
R = Xmax – Xmin + 1
- Wybierać należy przedział klasowy o takim rozmiarze, by 10 do 20 takich przedziałów objęło wszystkie
wyniki
- Przedziały klasowe powinny być równe 1, 3, 5, 10 lub 20 jednostek
- Przedział klasowy należy zacząć od wartości, która stanowi wielokrotność rozmiaru tego przedziału
procent
przedział środek dokładne liczebność Procent
liczebność skumulowany
klasowy przedziału granice skumulowana [%]
[%]
1-3 2 0,5 – 3,5 4 4
10 10
4-6
5 3,5 – 6,5 6 10 15 25
7-9
8 6,5-9,5 0 10 0 25
10-12
11 9,5-12,5 6 16 15 40
13-15
14 12,5-15,5 3 19 7,5 47,5
16-18
17 15,5-18,5 4 23 10 57,5
19-21
20 18,5-21,5 4 27 10 67,5
22-24
23 21,5-24,5 7 34 17,5 85
25-27
26 24,5-27,5 3 37 7,5 92,5
28-30
29 17,5-30,5 2 39 5 97,5
31-33
32 30,5-33,5 1 40 2,5 100
Dokładna granica= 1 mieści się między 0,5 – 1,5 – dolna granica, 3 mieści się między 2,5 – 3,5 - górna granica.
Rozkładem liczebności jest każde uporządkowanie danych, które pokazuje liczebności różnych wartości zmiennej
lub liczebność przedziałów klasowych.
- Zapisując wartości zmiennej ciągłej (może być każda liczba np. 12,56) w postaci dyskretnej, przyjmujemy, że
wartość zapisana przedstawia wartość rzeczywistą mieszczącą się w połowie jednostki pomiarowej powyżej i
poniżej wartości zapisanej, (3 mieści się powyżej 2,5 i poniżej 3,5)
- W przypadku zmiennych dyskretnych (np. Iloraz inteligencji musi być albo 99 albo 100, nie może być 99,5)
nie trzeba przeprowadzać rozróżnienia pomiędzy przedziałem klasowym, a granicami dokładnymi przedziałów,
ponieważ są one tożsame
Precyzja pomiaru zmiennej jest uzależniona od użytej skali pomiarowej. Z uwagi na precyzję pomiaru (skali
pomiarowej) można wyodrębnić cztery szerokie klasy zmiennych. Są to zmienne: (1) nominalna, (2) porządkowa, (3)
przedziałowa i (4) stosunkowa.
Zmienna nominalna jest właściwością elementów należących do takiej grupy, która została wyznaczona przez
operację pozwalającą na formułowanie twierdzeń o równości lub różności.
- W przypadku zmiennej nominalnej możemy twierdzić, że jeden element jest pod względem interesującej
nas właściwości taki sam albo inny niż drugi element.
- Nie możemy natomiast formułować twierdzeń o uporządkowaniu elementów, o jednakowości różnic
między elementami ani o tym, ile razy jeden element jest większy lub mniejszy niż drugi.
Np. możemy poklasyfikować ludzi według koloru oczu. Kolor jest zmienną nominalną. Twierdzenie, że osoba z
niebieskimi oczami jest w jakiś sposób „większa niż" bądź „mniejsza niż" osoba z oczami piwnymi, jest pozbawione
sensu. Podobnie pozbawione sensu jest twierdzenie, że różnica między oczami niebieskimi a piwnymi jest taka
sama, jak różnica między oczami piwnymi a zielonymi. Jedyny rodzaj twierdzenia, jaki można z sensem formułować,
mając do dyspozycji informacje o kolorze oczu, to twierdzenie, że kolor oczu pewnej osoby jest taki sam albo inny
niż kolor oczu drugiej osoby.
Zmienna porządkowa jest właściwością określoną przez operację, która pozwala na uszeregowanie elementów
grupy.
- Możliwe są tu więc nie tylko twierdzenia o równości bądź różności elementów, lecz także twierdzenia typu
„większy niż" i „mniejszy niż".
- Twierdzenia o jednakowości różnic między elementami albo o tym, ile razy jeden element jest większy lub
mniejszy niż drugi, nie są możliwe.
Np. Jeżeli musimy uporządkować grupę osób według stopnia agresywności, skłonności do współpracy lub jakiejś
innej jeszcze cechy, to otrzymujemy w efekcie zmienną typu porządkowego. W psychologii często mamy do
czynienia ze zmiennymi porządkowymi.
Zmienna przedziałowa jest właściwością określoną przez operację, która pozwala na formułowanie, obok twierdzeń
o równości lub różności i twierdzeń typu „większy niż" i „mniejszy niż", również twierdzeń o równości przedziałów.
Zmienna przedziałowa nie ma „prawdziwego" punktu zerowego, aczkolwiek dla wygody taki punkt zerowy można
sobie dowolnie wyznaczyć.
Np. Zmiennymi przedziałowymi są pomiary temperatury według skal Fahrenheita i Celsjusza. Rozważmy trzy obie-
kty, A, B i C, mające temperaturę odpowiednio 12°, 24° i 36°. Można słusznie powiedzieć, że różnica między
temperaturą przedmiotu A i przedmiotu B jest taka sama, jak różnica między temperaturą przedmiotu B i
przedmiotu C. Można również słusznie powiedzieć, że różnica między temperaturą przedmiotu A i przedmiotu C jest
dwa razy większa niż różnica między temperaturą przedmiotu A i przedmiotu B bądź też przedmiotu B i przedmiotu
C. Nie można natomiast słusznie powiedzieć, że B ma temperaturę dwukrotnie wyższą niż A ani że C ma
temperaturę trzykrotnie wyższą niż A. W życiu codziennym, jeżeli wczoraj temperatura wynosiła 20°, a dzisiaj
wynosi 10°, nie mówimy, że wczoraj było dwa razy cieplej ani że temperatura była dwa razy wyższa niż dzisiaj.
Zmienną przedziałową z arbitralnie określonym punktem zerowym jest również czas kalendarzowy.
Zmienna stosunkowa jest właściwością określoną przez operację, która pozwala na formułowanie, obok wszystkich
typów twierdzeń omówionych poprzednio, również twierdzeń o równości stosunków.
- Znaczy to, że można mówić, iż jedna wartość zmiennej jest dwa lub trzy razy taka jak druga itp.
- W przypadku zmiennej stosunkowej zawsze istnieje jakieś zero absolutne. Użyte liczby odzwierciedlają
odległość od naturalnego początku.
Np. Przykładami zmiennych stosunkowych mogą być długość, ciężar i liczebność zbiorów. Jeden obiekt może być
dwa razy dłuższy niż inny, trzy razy cięższy niż inny albo cztery razy liczniejszy. Zmienne typu stosunkowego często
spotykamy w naukach fizycznych. W psychologii zmienne spełniające kryteria zmiennych stosunkowych należą do
rzadkości.
Zasadnicza różnica między zmienną stosunkową i przedziałową polega na tym, że w przypadku zmiennej
stosunkowej pomiarów dokonuje się, poczynając od prawdziwego punktu zerowego, a w przypadku zmiennej
przedziałowej od punktu zerowego lub początku określonego arbitralnie. Z tego powodu w przypadku zmiennej
stosunkowej stosunki można ustalać bezpośrednio na podstawie samych wartości zmiennej i odpowiednio je
interpretować. W przypadku zmiennej przedziałowej stosunki można ustalać na podstawie różnic między
wartościami zmiennej. Zmienną stosunkową tworzą różnice, ponieważ proces odejmowania eliminuje bądź kasuje
dowolnie wyznaczony początek. Różnice są takie same, niezależnie od umiejscowienia punktu zerowego lub
początku.
Przykłady:
23.11.2021
Oprócz histogramów można używać wieloboków liczebności (na osi OX mieszczą się środki przedziałów
Tendencje centralne charakteryzują najbardziej typową wartość rozkładu. To pewna wartość stanowiąca centralny
punkt odniesienia. Znajduje się ona w miejscu największego skupienia i jest typową dla tego zbioru. Potocznie
tendencję centralną określa się jako przeciętną. Najczęściej stosowanymi miarami tendencji centralnej są średnia
arytmetyczna, mediana i modalna, rzadziej stosowanymi miarami tendencji centralnej są średnia geometryczna i
średnia harmonijna. Najmocniejsza tendencja centralna to średnia.
-średniej nie możemy obliczać na skalach rangowych i nominalnych, tylko na przedziałowych i stosunkowych (na
skali rangowej nie ma stałych wartości, możemy dodawać, ale nie możemy dzielić)
-graficznie przedstawia środek ciężkości rozkładu – miejsce najbardziej zrównoważone w stosunku do reszty
wyników
-suma kwadratów odchyleń od średniej jest mniejsza niż suma odchyleń od dowolnej innej wartości
Obliczanie średniej M= suma poszczególnych wyników/ ilość wyników
5 2 3 3 2 M=15/5= 3 M=3
5 4 5 3 4 3 M=24/6=4
Lub
Średnia ważona
M= (Ocena * liczebność pierwszej grupy + Ocena +liczebność kolejnej grupy itd.)/ sumę liczebności
M= (3,5*30+4*17+4,5*9+4*17)/73= 3,86
M=623/40=57
M=11
Klasa „A”
5 2 3 3 2 M=3
5 2 3 3 22 M=7
Średnia geometryczna:
Mediana jest to taka wartość, powyżej i poniżej której znajduje się po 50% obserwacji.
NIE NOMINALNEJ!),
X- liczba obserwacji
R- rangi
X 48 60 54 55 57 60 49
(PRZED OBLICZANIEM MEDIANY TRZEBA JA USZEREGOWAĆ OD NAJMNIEJSZYCH DO NAJWIĘKSZYCH LICZB)
X 48 49 54 55 57 60 60
R 1 2 3 4 5 6 7
Me= 55
Parzysta liczba obserwacji
X 48 49 54 55 57 60 60 85
R 1 2 3 4 5 6 7 8
Me= 56
X 48 49 55 55 55 60 60 85
R 1 2 3 4 5 6 7 8
Me zatem to przedział 54,5 +1*2/3=55,17 (bo taka odległość przedziałów ?? chuj wie, o co mu chodzi, są niby 55,
55, 55 – szerokość przedziału, mediana mieści się w 2/3 odległości przedziału, a odległość= 1
N- liczba przypadków = 40
h- przedział klasowy- 3
15,5+ [(40/2 – 19)/ 4] * 3
(Średnia debil, mediana zazwyczaj bardziej obiektywna. Jak normalnie ktoś Ci podaje info o średniej zarobków, to
tnie w chuja i manipuluje. -Stary)
Kwartyle – podział na 4
Q1, Q2, Q3
Kwintyle- podział na 5
Decyle- podział na 10
30.11.2021
Rozkład normalny
miara symetrii:
ten jest symetryczny
ale może być też skośny
rozkład lewoskośny - skośny ujemnie, <-1 najwięcej wysokich wyników, mało niskich wyników
M< Me < Mo
Rozkład prawoskośny - skośny dodatnio, o przewadze niskich wyników wynik skośności >+1
M > Me > Mo
Platykurtyczny = K< -1
Wariancja – suma kwadratów odchyleń od średniej podzielone przez liczebność pomiarów - dla populacji
Wariancja – suma kwadratów odchyleń od średniej podzielonej przez liczebność pomiarów minus jeden – dla
próbki
Odchylenia standardowe SD – pierwiastek z sumy kwadratów odchyleń od średniej podzielonej przez liczebność
pomiarów.
Właściwości odchylenia standardowego
- Stosuje się tylko w przypadku pomiarów na skali przedziałowej lub stosunkowej. (Dla skali rangowej dobrą miarą
tendencji centralnej jest mediana)
- Wykorzystuje naturalne jednostki.
- Jest wrażliwe na wartości skrajne.
- Jest bardziej stabilnym i dokładnym estymatorem odpowiedniego parametru w populacji w porównaniu z innymi
miarami zmienności. (populacja- parametry, próbka - estymatory, estymowanie- przewidywanie)
- Nie ma łatwo uchwytnej interpretacji jak odchylenie przeciętne.
- Łatwiej niż inne miary podaje się działaniom matematycznym - większość testów i wzorów wykorzystuje
odchylenia standardowe
W rozkładzie normalnym pomiędzy - trzeba się na pamięć nauczyć obszarów powierzchni znajdująch się pod
krzywą normalną
Pod całą krzywą mieści się 100% obserwowalnych wyników
+/- 1SD znajduje się ok 68% populacji
+/- 1,64SD znajduje się ok 90% populacji
+/- 1,96SD znajduje się ok 95% populacji
+/- 2,58SD znajduje się ok 99% populacji
(Im bardziej wyniki odstają od średniej, tym spada liczebność tych wyników)
Dobrze skonstruowany test i przeprowadzony na próbce pow 1000 osób powinien mieć rozkład normalny.
(znormalizowany rozkład z)
Rozkład dla próbki
SD=15
M=100
115= M+1SD
130= M+2SD
Kiedy skala jest rangowa lub porządkowa nie oblicza się średniej tylko rozstęp ćwiartkowy i odchylenie ćwiartkowe.
Rozstęp ćwiartkowy – różnica
Standaryzacja zmiennych.
Zadanka
Przykład 1
Student A uzyskał wynik 83 w pierwszym teście oraz 35 w drugim.
W jakim teście wypadł lepiej w porównaniu z innymi?
M = 73 — dla testu ze statystyki.
M = 36 — dla testu z percepcji.
Lepiej wypadł w teście ze statystyki, ponieważ jego wynik był powyżej średniej.
Przykład 2
Student B uzyskał wynik 63 w pierwszym teście oraz 26 w drugim.
W jakim teście wypadł lepiej w porównaniu z innymi?
M = 73 — dla testu ze statystyki, s = 10
M = 36 — dla testu z percepcji, s = 5
Ze statystyki:
z= (63-73) /10=-1SD
z percepcji:
z= (26-36) /5= -2SD – w nim wypadł gorzej
Standaryzacja zmiennych.
Standaryzacja zmiennych polega na podzieleniu odchylenia każdej wartości od średniej przez odchylenie
standardowe.
Jest użyteczna przy porównywaniu rozkładów, które mają różne jednostki pomiarowe.
Przykład 1
Student A uzyskał wynik 82 w pierwszym teście oraz 35 w drugim.
W jakim teście wypadł lepiej w porównaniu z innymi?
M = 73; s = 10 — dla testu ze statystyki.
M = 36; s = 5 — dla testu z percepcji.
Przykład 2
Pewien student B uzyskał wynik 63 w pierwszym teście oraz 26 w drugim.
W jakim teście wypadł lepiej w porównaniu z innymi?
M = 73 — dla testu ze statystyki,
M = 36 — dla testu z percepcji,
z1 = (63 – 73) /10 = –1;
z2 = (26 – 36) /5 = –10/5 = –2.
W pierwszym lepszy niż w drugim.
Skale normalizacyjne
- Skala tenowa (T)
- Skala stenowa
- Skala staninowa
- Skala tetronowa
- Skala stejwowa
- Różnicowanie: pełne
- Skale tenowe są używane na przykład w teście MMPI-2, ACL
- Wzór przekształcenia normalnego:
Wynik tenowy = 50 + 10*z
gdzie z - to wynik standaryzacji wyników surowych
Skala stenowa
- Skala stenowa (od ang. standard ten) - skala testu psychologicznego znormalizowana tak, aby średnia w populacji
wynosiła 5,5, a odchylenie standardowe 2.
W skali jest 10 jednostek. W ten sposób zaokrąglone wyniki < 5 oznaczają wartość poniżej przeciętnej, a > 6 wartość
powyżej przeciętnej.
- Liczba jednostek skali wynosi 9 staninów, natomiast jej zakres wynosi od 1 do 9 stanina.
- Skok skali jest równy 1 staninowi (0,5 odchylenia standardowego jednostek znormalizowanych "z")
- Wzór przekształcenia normalnego:
Różnicowanie: wartości od -1,75 do +1,75 jednostek znormalizowanych "z" (staniny krańcowe powyżej 1,75s)
- Przeznaczenie: różnicowanie w obrębie "normy"
Skala tetronowa
- Skala tetronowa – skala znormalizowana tak, aby średnia
w populacji wynosiła 10, a odchylenie standardowe 4.
- Wzór przekształcenia normalnego:
Wynik tetronowy = 10 + 4*z
gdzie z - to wynik standaryzacji wyników surowych
W skali jest 21 jednostek (od 0 do 20 punktów)
Obejmuje od -2,5 do +2,5 odchylenia standardowego wyników w rozkładzie normalnym
Skala stejwowa
- Skala stejwowa – skala znormalizowana tak, aby średnia w
populacji wynosiła 3, a odchylenie standardowe 1.
- Wzór przekształcenia normalnego:
Wynik stejwowy = 3 + 1*z
gdzie z - to wynik standaryzacji wyników surowych
07.12.2021
Skala /miara tendencji centralnych /zmienność
nominalna – Modalna (Mo) - liczba kategorii (możemy przyporządkować informacje do różnych kategorii
Porządkowa - Modalna (Mo)/ Mediana –preferowana - rozstęp ćwiartkowy, odchylenia ćwiartkowe
Ilościowa - Modalna Mediana Średnia - najlepsza? - to zależy (symetryczny M, asymetryczny Me (bo M jest
wrażliwa na dane odstające))
Zmienna ma charakter losowy – nie da się przewidzieć wyniku
Zdarzenie - wartość zmiennej losowej - zbiór przypadkowych zdarzeń - nie mówimy o prawdopodobieństwie
subiektywnym, tylko obiektywnym i empirycznym – matematycznym
Rozkład teoretyczny – nie wymaga żadnych badań. Np. Normalny – mamy matematyczny wzór i na jego podstawie
ustalamy kształt.
Rozkład symetryczny - skośność = 0, M=Mo=Me. - jest to idealny rozkład, a ideały nie występują
Jednak będzie on się zbliżał do 0, im większa będzie próba i bardziej losowy dobór.
Suma liczba
oczek układów prawdopodobieństwo wystąpienia sumy
2 1 1 / 36 ; 0,028
3 2 2 / 36 ; 0,056
4 3 3 / 36 ; 0,083
5 4 4 / 36 ; 0,111
6 5 5 / 36 ; 0,139
7 6 6 / 36 ; 0,167
8 5 5 / 36 ; 0,139
9 4 4 / 36 ; 0,111
10 3 3 / 36 ; 0,083
11 2 2 / 36 ; 0,056
12 1 1 / 36 ; 0,028
Rozkład dwumianowy
Liczba
0 orłów 1 orzeł 2 orły 3 orły 4 orły 5 orłów 6 orłów
monet
1 1/2 1/2
2 1/4 2/4 1/4
3 1/8 3/8 3/8 1/8
4 1/16 4/16 6/16 4/16 1/16
Opisuje go wzór:
p – prawdopodobieństwo zajścia określonego zdarzenia
q – prawdopodobieństwo, że określone zdarzenie nie zajdzie
n- liczba niezależnych zdarzeń
- Rozkład normalny jest uogólnieniem rozkładu dwumianowego dla p = q = ½ na sytuację, gdy jest nieskończenie
wiele prób.
- Rozkład normalny jest rozkładem zmiennej losowej ciągłej
- Rozkład normalny jest rozkładem teoretycznym
- średnie
- odchylenia standardowe
Suma=1901
Warunki zastosowania r Pearsona
- skala ilościowa dla obu zmiennych
- liniowość związku pomiędzy zmiennymi
- podobieństwo rozkładu zmiennych
- idealny przypadek: rozkłady normalne (As = 0, K = 0)
- umiarkowana skośność:
Mówimy, że 100% wariancji w jednej zmiennej powiązane jest z 25% wariancji u drugiej zmiennej
np. Gdyby było 100% to taki sam wzrost masy do takiego samego wzrostu objętości
Im więcej osoba chodzi na zajęcia - pozytywna korelacja z jej ocena na egzaminie r = 0,5
100% wariancji chodzenia na zajęcia jest powiązana z oceną na egzaminie w 25%
Zaczynamy od Symetrycznych:
Właściwości rho-Spearmana
- jest najlepszym rangowym odpowiednikiem r.Pearsona (odporne na wartości skrajne)
Najmocniejsze – to te testy, które wykryją zależność, różnicę, która istnieje w rzeczywistości, zawsze trzeba
wybierać najmocniejszy, jeśli nie może być on zrealizowany bierzemy niższy, jeśli zaczniemy od niższego a można
zastosować lepszy, jest to błąd strategiczny.
-Odporny na wartości skrajne
-Rho podniesione do kwadratu jest interpretowany w terminach wyjaśnianej zmienności jak r Pearsona
Częściowo traci swoją wartości w miarę wzrostu liczby rang wiązanych
Nie będziemy tego obliczać - w psychologii stosujemy tylko taub i tauc Kendalla
Tau-b Kendalla (rozwinięcie w Kendalla)
Procedura obliczeniowa:
Rangujemy osobno każdą ze zmiennych
- Porządkujemy w kolejności od najwyższej rangi (1) do najniższej wg jednej zmiennej
- Porównujemy po kolei w ramach drugiej zmiennej rangę każdej osoby z pozostałymi. Wynik porównania wynosi:
+1, jeżeli ranga danej osoby jest wyższa od rangi drugiej osoby
-1, jeżeli jest niższa
0, jeżeli jest taka sama (rangi wiązne)
- Sumujemy wszystkie wyniki porównań (S – miara inwersji)
- Obliczmy wg. Wzoru tau
Przypisywanie rangi:
ilość rang - ilość pomiarów
Wiek rangi - najstarszy (13lat) - ranga 1, najmłodszy (0lat) - ranga 5
Waga rangi - najcięższy 38kg – ranga1, najlżejszy (3kg) - 5 ranga
Porównujemy po kolei w ramach drugiej zmiennej (on sam nie wiedział co robi, więc nie wytłumaczę...)
Współczynnik kappa Cohena – wykorzystywany częściej niż w Kendalla, -wyjątek, jeśli chodzi nam o zgodność
sędziów/ocen, stosuje się wtedy, kiedy interesuje nas zgodność ocen dotyczących tego samego pomiaru, ale
pochodzących od innych osób. Np. Kiedy chcemy zbadać zgodność profili osób chcących zawrzeć związek małżeński.
Współczynnik eta (mamy różne skale jedna zmienna jest nominalna (jakościowa) druga ilościowa), związek
nieliniowy, rzadko wykorzystywane. Np. Korelacja między płcią a agresywnością.
Spotykamy się albo za tydzień albo za dwa, nauczyć się tabelki i przypomnieć o korelacjach ogólnie, pokaże nam
przykładowe pytania i czego się możemy spodziewać
Obliczmy miary tendencji centralnej (+coś jeszcze ale zapomniałam)
R pearsona i obszar powierzchni pod krzywą normalną - ale trudniejsze niż na zajęciach
Egzamin wygląda tak, dostajemy kwestionariusz, będą tam pytania, w pracy zasadniczej, pyta Jaki współczynnik
korelacji, żeby skorelować 3 i 5 pytanie.