Statystyka Opisowa

Statystyka opisowa – 1 zajęcia psychologia
-Psychologia aspiruje do bycia nauką empiryczną
Etapy postępowania w naukach empirycznych: fakty, obserwacje -> wnioski, teoria -> empiryczna weryfikacja –
przewidywanie zachowań na podstawie założeń teoretycznych -> jeśli dane się pokrywają z założeniami
teoretycznymi, wtedy mówimy, że teoria jest weryfikowalna/ jeśli to co zakładaliśmy nie znajduje odzwierciedlenia
w rzeczywistości, wtedy nie przyjmujemy teorii.
Przebieg procesu badawczego w psychologii: (wg. Brzezińskiego)
1) Sformułowanie problemu badawczego oraz hipotezy badawczej- jako “ujęzykowienie problemu” (przegląd
literatury, żeby postawić pytanie, hipotezę, albo żeby replikować eksperyment).
Pytanie badawcze=intuicja badawcza, która leży u podłoża problemu i hipotezy badawczej (cokolwiek to oznacza)
2) Określanie obrazu przestrzeni zmiennych niezależnych istotnych dla zmiennej zależnej

zmienna zależna - główna zmienna, przedmiot zainteresowania badacza.
zmienna niezależna - wpływa na zmienną zależną, badacz nią manipuluje i sprawdza jak ta manipulacja wpływa na
zmienna zależną
Kiedy formujemy problem badawczy, w następnym kroku określamy wszystkie zmienne które mogą mieć wpływ na
zmienną zależną.
Przykład:
zmienna zależna - Samoocena
zmienne niezależne - osiągnięcia szkolne/akademickie
inne zmienne- które nie są przedmiotem naszych badań, należy je nazwać i skontrolować, żeby nie miały wpływu na
zmienną zależną i nie przeszkadzały: dochód, status ekonomiczny
3) Operacjonalizacja zmiennych
Dobranie narzędzi badawczych (np. Test), którymi będziemy mierzyć zmienne w aspektach najbardziej
interesujących nas
4) Wybór modelu badawczego (badanie korelacyjne vs. Eksperymentalne, rodzaje planu eksperymentalnego, dobór
metod analizy statystycznej danych)
5) Dobór próby populacji
6) Wybór modelu statystycznego (model testu t ANOVA lub MANOVA, Model analizy regresji)
7) Akceptacja lub odrzucenie hipotezy
8) Ocena interpretacja i generalizacja rezultatu badawczego – w odniesieniu do założeń teoretycznych.
Teraz przypominamy zmienne: (będzie na egzaminie) - Brzeziński str 30-32 – zmienne a skala nominalna –
zagadnienie na egzamin!
Zależne - to zmienne, które są przedmiotem naszego badania, których związki z innymi zmiennymi chcemy określić.
Niezależne - zmienne które oddział wpływu ją na powyższą, od których ona zależy to zmienne niezależne.
Zmienne nominalne - (skala nominalna – pozwala stwierdzić, czy zmienna przynależy czy nie do jakiejś kategorii-
przykład płeć- 2 kategorie, dychotomiczna, pozwala zaklasyfikować jednostkę do jednej z dwóch kategorii, nic
więcej).
Skala porządkowa - rangowa – pozwala zaklasyfikować jednostkę do grupy oraz stwierdzić zwiększenie bądź
zmniejszenie nasilenia oddziaływania jakiś cech – nie zgadzam się, zgadzam się, nie mam zdania) - na tej skali
można mierzyć nasilenie cechy, nie o ile.
Ilościowe:
Skala interwałowa (przedziałowa) - nie tylko pozwala stwierdzić nasilenie cechy, ale także o ile jednostek coś różni
się od czegoś- równych interwałów, pozwala stwierdzić różnicę między wartościami
Skala wielorazowa (stosunkowa) - pozwala powiedzieć o ile razy więcej/ jedna wartość jest wielokrotnością innej,
ma 0 absolutne
-Główne zadanie statystyki opisowej jest uporządkować liczby, które otrzymujemy w skutek jakiegoś pomiaru.
Rozkład liczebności - każde uporządkowanie danych, które pokazuje liczebność różnych wartości zmiennej lub
liczebność przedziałów klasowych
Przykład 1:
Wartości, które mogą wypaść na kostce: 1 2 3 4 5 6
Ile razy wypadła częstotliwość (f): 1 – 3, 2 – 3, 3 – 4, 4 - 4, 5 - 6, 6 – 3
Przykład 2: (na egzaminie będzie taka tabelka i trzeba będzie obliczyć %)
W badaniach osoby badane były w wieku od 10 do 20 lat, należy podać rozkład liczebności, żeby zobaczyć
procentowy udział osób w różnych kategoriach wiekowych, żeby sprawdzić, czy jest reprezentatywna
5 – x%
57 – 100%
X= (5*100/)57=8,77%
R= Xmax - Xmin +1
Reguły tworzenia przedziałów klasowych (wg Fergusona)
- Należy wybrać przedział klasowy o takim rozmiarze, by 10-20 takich przedziałów obejmowało wszystkie
wyniki
- -Przedziały klasowe powinny być równe 1, 3, 5, 10, lub 20 jednostek.
- Należy zaczynać przedział klasowy od wartości, która stanowi wielokrotność rozmiaru tego przedziału.
Granice dokładne przedziałów klasowych
- Zapisując wartości zmiennej ciągłej w postaci dyskretnej, przyjmujemy, że wartość zapisana przedstawia
wartość rzeczywistą mieszczącą się w połowie jednostki pomiarowej poniżej i powyżej
Pierwsze 40 liczb spisać
Ocena statystyki od 1-33
Na następnych zajęciach będzie analiza tych danych
Wykład 2) 16.11.2021 - zajęcia prowadzone z książki Francuza +ma nam umieścić ten rozdział w plikach i wyśle
rozdział z przykładami zadanek, +umieści to co dziś robiliśmy - W “Liczby nie wiedzą skąd pochodzą” str. 106-117
1) Uporządkowujemy dane (od najmniejszej do największej)
1, 1, 2, 2, 4, 5, 5, 5, 6, 6,
10, 11, 12, 12 ,12, 12, 14, 14, 15, 17,
17, 18, 18, 19, 20, 20, 21, 22, 22, 22
23, 23, 24, 24, 25, 25, 26, 28, 28, 33
2) Liczymy rozpiętość:
R = Xmax – Xmin + 1
R= 33-1+1= 33 - rozpiętość naszych wyników wynosi 33 jednostki
3) Liczba przedziałów klasowych – wybieramy rozpiętość

Reguły tworzenia przedziałów klasowych:
- Wybierać należy przedział klasowy o takim rozmiarze, by 10 do 20 takich przedziałów objęło wszystkie
wyniki
- Przedziały klasowe powinny być równe 1, 3, 5, 10 lub 20 jednostek
- Przedział klasowy należy zacząć od wartości, która stanowi wielokrotność rozmiaru tego przedziału
Interwał - szerokość przedziału = 1, to 33:1=33 – nasze wyniki zmieszczą się w 33 przedziałach
Jeśli wynosi 2, to całość objęłoby 17 przedziałów
Interwał (I) Liczba klas (przedziałów =R/I )

1 33
2 33:2=16,5=17 - pasuje
3 33:3=11 – pasuje – wybieramy ten
4 33:4=9
5 33:5=7
Wybieramy interwał 3, ponieważ 11 mieści się w przedziale 10-20
Zaczynamy od najniższego wyniku, który jest wielokrotnością 3
Pierwszy przedział klasowy
procent
przedział środek dokładne liczebność Procent
liczebność skumulowany
klasowy przedziału granice skumulowana [%]
[%]
1-3 2 0,5 – 3,5 4 4
10 10
4-6
5 3,5 – 6,5 6 10 15 25
7-9
8 6,5-9,5 0 10 0 25
10-12
11 9,5-12,5 6 16 15 40
13-15
14 12,5-15,5 3 19 7,5 47,5
16-18
17 15,5-18,5 4 23 10 57,5
19-21
20 18,5-21,5 4 27 10 67,5
22-24
23 21,5-24,5 7 34 17,5 85
25-27
26 24,5-27,5 3 37 7,5 92,5
28-30
29 17,5-30,5 2 39 5 97,5
31-33
32 30,5-33,5 1 40 2,5 100
Dokładna granica= 1 mieści się między 0,5 – 1,5 – dolna granica, 3 mieści się między 2,5 – 3,5 - górna granica.
Środek przedziału liczymy = Dolna granica przedziału + interwał: 2

0,5 + {(3,5-0,5):2}
3,5-0,5=3
3:2=1,5
1,5+0,5=2
Liczebność - ile wyników mieści się w tym przedziale
Liczebność skumulowana- wszystkie poprzednie wyniki + ten przedział
Rozkładem liczebności jest każde uporządkowanie danych, które pokazuje liczebności różnych wartości zmiennej
lub liczebność przedziałów klasowych.
Granice dokładne przedziałów klasowych:
- Zapisując wartości zmiennej ciągłej (może być każda liczba np. 12,56) w postaci dyskretnej, przyjmujemy, że
wartość zapisana przedstawia wartość rzeczywistą mieszczącą się w połowie jednostki pomiarowej powyżej i
poniżej wartości zapisanej, (3 mieści się powyżej 2,5 i poniżej 3,5)
- W przypadku zmiennych dyskretnych (np. Iloraz inteligencji musi być albo 99 albo 100, nie może być 99,5)
nie trzeba przeprowadzać rozróżnienia pomiędzy przedziałem klasowym, a granicami dokładnymi przedziałów,
ponieważ są one tożsame
+wracamy do skal pomiarowych

Na przykładzie, który będzie na egzaminie
Skale pomiarowe (b.ważne)
Precyzja pomiaru zmiennej jest uzależniona od użytej skali pomiarowej. Z uwagi na precyzję pomiaru (skali
pomiarowej) można wyodrębnić cztery szerokie klasy zmiennych. Są to zmienne: (1) nominalna, (2) porządkowa, (3)
przedziałowa i (4) stosunkowa.
Zmienna nominalna jest właściwością elementów należących do takiej grupy, która została wyznaczona przez
operację pozwalającą na formułowanie twierdzeń o równości lub różności.
- W przypadku zmiennej nominalnej możemy twierdzić, że jeden element jest pod względem interesującej
nas właściwości taki sam albo inny niż drugi element.
- Nie możemy natomiast formułować twierdzeń o uporządkowaniu elementów, o jednakowości różnic
między elementami ani o tym, ile razy jeden element jest większy lub mniejszy niż drugi.
Np. możemy poklasyfikować ludzi według koloru oczu. Kolor jest zmienną nominalną. Twierdzenie, że osoba z
niebieskimi oczami jest w jakiś sposób „większa niż" bądź „mniejsza niż" osoba z oczami piwnymi, jest pozbawione
sensu. Podobnie pozbawione sensu jest twierdzenie, że różnica między oczami niebieskimi a piwnymi jest taka
sama, jak różnica między oczami piwnymi a zielonymi. Jedyny rodzaj twierdzenia, jaki można z sensem formułować,
mając do dyspozycji informacje o kolorze oczu, to twierdzenie, że kolor oczu pewnej osoby jest taki sam albo inny
niż kolor oczu drugiej osoby.
Zmienna porządkowa jest właściwością określoną przez operację, która pozwala na uszeregowanie elementów
grupy.
- Możliwe są tu więc nie tylko twierdzenia o równości bądź różności elementów, lecz także twierdzenia typu
„większy niż" i „mniejszy niż".
- Twierdzenia o jednakowości różnic między elementami albo o tym, ile razy jeden element jest większy lub
mniejszy niż drugi, nie są możliwe.
Np. Jeżeli musimy uporządkować grupę osób według stopnia agresywności, skłonności do współpracy lub jakiejś
innej jeszcze cechy, to otrzymujemy w efekcie zmienną typu porządkowego. W psychologii często mamy do
czynienia ze zmiennymi porządkowymi.
Zmienna przedziałowa jest właściwością określoną przez operację, która pozwala na formułowanie, obok twierdzeń
o równości lub różności i twierdzeń typu „większy niż" i „mniejszy niż", również twierdzeń o równości przedziałów.
Zmienna przedziałowa nie ma „prawdziwego" punktu zerowego, aczkolwiek dla wygody taki punkt zerowy można
sobie dowolnie wyznaczyć.
Np. Zmiennymi przedziałowymi są pomiary temperatury według skal Fahrenheita i Celsjusza. Rozważmy trzy obie-
kty, A, B i C, mające temperaturę odpowiednio 12°, 24° i 36°. Można słusznie powiedzieć, że różnica między
temperaturą przedmiotu A i przedmiotu B jest taka sama, jak różnica między temperaturą przedmiotu B i
przedmiotu C. Można również słusznie powiedzieć, że różnica między temperaturą przedmiotu A i przedmiotu C jest
dwa razy większa niż różnica między temperaturą przedmiotu A i przedmiotu B bądź też przedmiotu B i przedmiotu
C. Nie można natomiast słusznie powiedzieć, że B ma temperaturę dwukrotnie wyższą niż A ani że C ma
temperaturę trzykrotnie wyższą niż A. W życiu codziennym, jeżeli wczoraj temperatura wynosiła 20°, a dzisiaj
wynosi 10°, nie mówimy, że wczoraj było dwa razy cieplej ani że temperatura była dwa razy wyższa niż dzisiaj.
Zmienną przedziałową z arbitralnie określonym punktem zerowym jest również czas kalendarzowy.
Zmienna stosunkowa jest właściwością określoną przez operację, która pozwala na formułowanie, obok wszystkich
typów twierdzeń omówionych poprzednio, również twierdzeń o równości stosunków.
- Znaczy to, że można mówić, iż jedna wartość zmiennej jest dwa lub trzy razy taka jak druga itp.
- W przypadku zmiennej stosunkowej zawsze istnieje jakieś zero absolutne. Użyte liczby odzwierciedlają
odległość od naturalnego początku.
Np. Przykładami zmiennych stosunkowych mogą być długość, ciężar i liczebność zbiorów. Jeden obiekt może być
dwa razy dłuższy niż inny, trzy razy cięższy niż inny albo cztery razy liczniejszy. Zmienne typu stosunkowego często
spotykamy w naukach fizycznych. W psychologii zmienne spełniające kryteria zmiennych stosunkowych należą do
rzadkości.
Zasadnicza różnica między zmienną stosunkową i przedziałową polega na tym, że w przypadku zmiennej
stosunkowej pomiarów dokonuje się, poczynając od prawdziwego punktu zerowego, a w przypadku zmiennej
przedziałowej od punktu zerowego lub początku określonego arbitralnie. Z tego powodu w przypadku zmiennej
stosunkowej stosunki można ustalać bezpośrednio na podstawie samych wartości zmiennej i odpowiednio je
interpretować. W przypadku zmiennej przedziałowej stosunki można ustalać na podstawie różnic między
wartościami zmiennej. Zmienną stosunkową tworzą różnice, ponieważ proces odejmowania eliminuje bądź kasuje
dowolnie wyznaczony początek. Różnice są takie same, niezależnie od umiejscowienia punktu zerowego lub
początku.
Z punktu widzenia praktyki opracowywania statystycznego danych w psychologii i pedagogice rozróżnienie

między zmiennymi przedziałowymi i stosunkowymi nie ma w zasadzie znaczenia i wygodnie jest brać pod uwagę nie
cztery, lecz trzy klasy zmiennych i trzy odpowiadające im klasy metod statystycznych. Zmienne przedziałowe i
stosunkowe są określane jako ilościowe.
Przykłady:
Płeć- skala nominalna

Staż pracy – skala stosunkowa/ ilościowa (ma zero absolutne, można powiedzieć, ile razy więcej)
Miejsce zamieszkania - (wieś małe miasto, średnie i duże) - porządkowa/rangowa
Czy jesteś w związku (tak-formalny, tak- niefomalny, nie) - nominalna
Czym masz dzieci (t,n) - nominalna
Ile masz dzieci (wpisz odpowiedź) - stosunkowa / przedziałowa
Kto utrzymuje rodzinę (ja, partner, razem, inni, możliwość wpisania swojej odp.) - nominalna
Czy posiadasz kredyt – nominalna
Podaj wysokość kredytu (miejsce do wpisania) - stosunkowa
- porządkowa
-porządkowa, można uszeregować
+Na egzaminie będzie pytanie: jakiego współczynnika korelacji użyć
23.11.2021
1. Etap analizy – stowrzenie histogramów liczebności, robimy go na przedziałach, a nie na wszystkich

zmiennych (tabele słupkowe, ale zmienne mają charakter ciągły [a w tabelach słupkowych to są pojedyncze
zmienne, nie ma płynnego przejścia, robimy wtedy, gdy zmienne nie mają charakteru skal ilościowych] tylko
dla skal ilościowych – przedziałowe, ilorazowe w SPSS
Oprócz histogramów można używać wieloboków liczebności (na osi OX mieszczą się środki przedziałów
Miara tendencji centralnej
Tendencje centralne charakteryzują najbardziej typową wartość rozkładu. To pewna wartość stanowiąca centralny
punkt odniesienia. Znajduje się ona w miejscu największego skupienia i jest typową dla tego zbioru. Potocznie
tendencję centralną określa się jako przeciętną. Najczęściej stosowanymi miarami tendencji centralnej są średnia
arytmetyczna, mediana i modalna, rzadziej stosowanymi miarami tendencji centralnej są średnia geometryczna i
średnia harmonijna. Najmocniejsza tendencja centralna to średnia.
Właściwości średniej arytmetycznej:
-średniej nie możemy obliczać na skalach rangowych i nominalnych, tylko na przedziałowych i stosunkowych (na
skali rangowej nie ma stałych wartości, możemy dodawać, ale nie możemy dzielić)
-jest wrażliwa na wartości skrajne
-graficznie przedstawia środek ciężkości rozkładu – miejsce najbardziej zrównoważone w stosunku do reszty
wyników
-suma odchyleń wszystkich pomiarów od średniej jest równa 0
-suma kwadratów odchyleń od średniej jest mniejsza niż suma odchyleń od dowolnej innej wartości
Obliczanie średniej M= suma poszczególnych wyników/ ilość wyników
5 2 3 3 2 M=15/5= 3 M=3
5 4 5 3 4 3 M=24/6=4
Średnia z obu grup: M= (15+24)/11 = 3,5454…
Lub
3x5 + 4X6 = 39/11= 3,5454
Średnia ważona
Grupa ćw. Liczebność grupy Ocena ze statystyki

A 30 3.5
B 17 4.0
C 9 4.5
D 17 4.0
Razem 73 ?
M= (Ocena * liczebność pierwszej grupy + Ocena +liczebność kolejnej grupy itd.)/ sumę liczebności
M= (3,5*30+4*17+4,5*9+4*17)/73= 3,86
Przedział Dokładne Liczeb Procent

Środek Liczebność Procent
klasowy granice ność skumulow
przedziału Skumulow
1-3 2 0.5 – 3.5 4 4 10% 10%
4-6 5 3.5 – 6.5 6 10 15% 25%
7-9 8 6.5 – 9.5 0 10 0% 25%
10-12 11 9.5 – 12.5 6 16 15% 40%
13 -15 14 12.5 – 15.5 3 19 7.5 % 47.5 %
16 - 18 17 15.5 – 18.5 4 23 10% 57.5 %
19 - 21 20 18.5 – 21.5 4 27 10% 67.5 %
22 -24 23 21.5 – 24.5 7 34 17.5 % 85%
25 - 27 26 24.5 – 27.5 3 37 7.5 % 92.5 %
28 - 30 29 27.5 – 30.5 2 39 5% 97.5 %
31 - 33 32 30.5 – 33.5 1 40 2.5 % 100%
M=623/40=57
(Środek w przypadku przedziału klasowego 1-4:
0,5 1 1,5 2 2,5 3 3,5 4 4,5 Środek przedziału to 2,5)
Suma odchyleń od średniej:

7 13 22 9 11 4
M=11
(7-11) + (13-11) + (22-11) + (9-11) + (11-11) + (4-11) = -4+2+11-2-7= 0
Wrażliwość na odstające wyniki średniej
Klasa „A”
5 2 3 3 2 M=3
5 2 3 3 22 M=7
Średnia geometryczna:
Mg= Pierwiastek n z iloczynu wszystkich wyników, gdzie n= liczba wyników
Stosuje się tylko do pomiarów na skali stosunkowej.
Jest bardziej odporna na wartości odstające niż średnia arytmetyczna
Średnia harmonijna – (wyjebane w nią - Marcel)
Mediana jest to taka wartość, powyżej i poniżej której znajduje się po 50% obserwacji.
-Medianę możemy obliczać tylko dla skali porządkowej, przedziałowej i stosunkowej (
NIE NOMINALNEJ!),
-graficznie dzieli cały obszar pod rozkładem na dwie równe części,
-nie jest wrażliwa na wartości skrajne,
Nieparzysta liczba obserwacji
X- liczba obserwacji
R- rangi
X 48 60 54 55 57 60 49
(PRZED OBLICZANIEM MEDIANY TRZEBA JA USZEREGOWAĆ OD NAJMNIEJSZYCH DO NAJWIĘKSZYCH LICZB)
X 48 49 54 55 57 60 60
R 1 2 3 4 5 6 7
Me= 55
Parzysta liczba obserwacji
X 48 49 54 55 57 60 60 85
R 1 2 3 4 5 6 7 8
Me= 56
Kilka takich samych liczb w okolicach mediany
X 48 49 55 55 55 60 60 85
R 1 2 3 4 5 6 7 8
Me= 55 trafia między 54,5 i 55,5 – dokładne granice przedziału 55
Me zatem to przedział 54,5 +1*2/3=55,17 (bo taka odległość przedziałów ?? chuj wie, o co mu chodzi, są niby 55,
55, 55 – szerokość przedziału, mediana mieści się w 2/3 odległości przedziału, a odległość= 1
Przedział Dokładne Liczebno Procent

Środek Liczebność Procent
klasowy granice ść skumulow
przedziału Skumulow
1-3 2 0.5 – 3.5 4 4 10% 10%
4-6 5 3.5 – 6.5 6 10 15% 25%
7-9 8 6.5 – 9.5 0 10 0% 25%
10-12 11 9.5 – 12.5 6 16 15% 40%
13 -15 14 12.5 – 15.5 3 19 7.5 % 47.5 %
16 - 18 17 15.5 – 18.5 4 23 10% 57.5 %
19 - 21 20 18.5 – 21.5 4 27 10% 67.5 %
22 -24 23 21.5 – 24.5 7 34 17.5 % 85%
25 - 27 26 24.5 – 27.5 3 37 7.5 % 92.5 %
28 - 30 29 27.5 – 30.5 2 39 5% 97.5 %
31 - 33 32 30.5 – 33.5 1 40 2.5 % 100%
Mediana mieści się między 16-18
L- dokładna dolna granica przedziału, w którym znajduje się mediana = 15,5
F- suma wszystkich liczebności poniżej = 19
Fm= liczebność przedziału zawierającego medianę= 4
N- liczba przypadków = 40
h- przedział klasowy- 3
15,5+ [(40/2 – 19)/ 4] * 3
(Średnia debil, mediana zazwyczaj bardziej obiektywna. Jak normalnie ktoś Ci podaje info o średniej zarobków, to
tnie w chuja i manipuluje. -Stary)
Kwartyle – podział na 4
Q1, Q2, Q3
Kwintyle- podział na 5
Decyle- podział na 10
Percentyle- podział na 100
Modalna jest wartością występującą najczęściej
30.11.2021
Rozkład normalny
miara symetrii:
ten jest symetryczny
ale może być też skośny
rozkład lewoskośny - skośny ujemnie, <-1 najwięcej wysokich wyników, mało niskich wyników
M< Me < Mo
Rozkład prawoskośny - skośny dodatnio, o przewadze niskich wyników wynik skośności >+1
M > Me > Mo
(Średnia jest wrażliwa na odstające wyniki)
Rozkład normalny jest rozkładem symetrycznym

Miara rozproszenia, na ile wyniki różnią się od średniej, na ile są podobne do wartości centralnej.
Kurtozy
mezokurtyczny – normalne rozproszenie w przedziale od –1 do +1
leptokurtyczny = K> +1
Platykurtyczny = K< -1
Miary zmienności. I obszarry pod krzywą normalną

Najbardziej użyteczne miary zmienności (rozproszenia):
- Rozstęp i rozpiętość (rozstęp +1)
- Odchylenie przeciętne
- Wariancja i odchylenie standardowe
- Rozstęp ćwiartkowy i odchylenie ćwiartkowe
Rozstęp – różnica pomiędzy największą a najmniejszą wartością

- Jest bardzo wrażliwe na wartości skrajne.
- Zaletą tej miary jest jej intuicyjna zrozumiałość.
Rozpiętość – rozstęp powiększony o 1 jednostkę pomiarową.
- Wariancja – suma kwadratów odchyleń od średniej podzielonej przez liczebność pomiarów.

- Odchylenie standardowe (Standard dewvaton – SD )– pierwiastek z sumy kwadratów odchyleń od średniej
podzielonej przez liczebność pomiarów.
W populacji samo n (w mianowniku)

w małych próbkach n–1 czyli w mianowniku
Przykład obliczeń ( dla próbki)
Dla populacji byłoby:
Wariancja – suma kwadratów odchyleń od średniej podzielone przez liczebność pomiarów - dla populacji
Wariancja – suma kwadratów odchyleń od średniej podzielonej przez liczebność pomiarów minus jeden – dla
próbki
Odchylenia standardowe SD – pierwiastek z sumy kwadratów odchyleń od średniej podzielonej przez liczebność
pomiarów.
Właściwości odchylenia standardowego
- Stosuje się tylko w przypadku pomiarów na skali przedziałowej lub stosunkowej. (Dla skali rangowej dobrą miarą
tendencji centralnej jest mediana)
- Wykorzystuje naturalne jednostki.
- Jest wrażliwe na wartości skrajne.
- Jest bardziej stabilnym i dokładnym estymatorem odpowiedniego parametru w populacji w porównaniu z innymi
miarami zmienności. (populacja- parametry, próbka - estymatory, estymowanie- przewidywanie)
- Nie ma łatwo uchwytnej interpretacji jak odchylenie przeciętne.
- Łatwiej niż inne miary podaje się działaniom matematycznym - większość testów i wzorów wykorzystuje
odchylenia standardowe
W rozkładzie normalnym pomiędzy - trzeba się na pamięć nauczyć obszarów powierzchni znajdująch się pod
krzywą normalną
Pod całą krzywą mieści się 100% obserwowalnych wyników
+/- 1SD znajduje się ok 68% populacji
+/- 1,64SD znajduje się ok 90% populacji
(Krzywa normalna znormalizowana - średnia wynosi 0 a odchylenie standardowe 1)

Rozkład dla populacji
(Im bardziej wyniki odstają od średniej, tym spada liczebność tych wyników)
Dobrze skonstruowany test i przeprowadzony na próbce pow 1000 osób powinien mieć rozkład normalny.
(znormalizowany rozkład z)
Rozkład dla próbki
SD=15
M=100
115= M+1SD
130= M+2SD
Jaki procent osób będzie miał IQ powyżej 130?

2,2% osób
Jaki % osiąga IQ pomiędzy 85 a 115?
68%
Kiedy skala jest rangowa lub porządkowa nie oblicza się średniej tylko rozstęp ćwiartkowy i odchylenie ćwiartkowe.
Rozstęp ćwiartkowy – różnica
Rozstęp ćwiartkowy — różnica pomiędzy trzecim

a pierwszym kwartylem: Rkw = Q3 – Q1.
– Stosuje się w przypadku pomiarów na skali porządkowej, przedziałowej lub stosunkowej.
– Jest to obszar zmienności środkowych, typowych 50% obserwacji.
– Ma dużą wartość eksploracyjną.
– Jest odporny na wartości skrajne
Odchylenie ćwiartkowe: OC = (Q3 – Q1) /2. Mówi, jak kwartyle przeciętnie odchylają się od mediany.
Rozkład skrzynkowy na wyniki odstające
Standaryzacja zmiennych.
Zadanka
Przykład 1
Student A uzyskał wynik 83 w pierwszym teście oraz 35 w drugim.
W jakim teście wypadł lepiej w porównaniu z innymi?
M = 73 — dla testu ze statystyki.
M = 36 — dla testu z percepcji.
Lepiej wypadł w teście ze statystyki, ponieważ jego wynik był powyżej średniej.
Przykład 2
Student B uzyskał wynik 63 w pierwszym teście oraz 26 w drugim.
M = 73 — dla testu ze statystyki, s = 10
M = 36 — dla testu z percepcji, s = 5
Ze statystyki:
z= (63-73) /10=-1SD
z percepcji:
z= (26-36) /5= -2SD – w nim wypadł gorzej
Standaryzacja zmiennych.
Standaryzacja zmiennych polega na podzieleniu odchylenia każdej wartości od średniej przez odchylenie
standardowe.
Jest użyteczna przy porównywaniu rozkładów, które mają różne jednostki pomiarowe.
Przykład 1
Student A uzyskał wynik 82 w pierwszym teście oraz 35 w drugim.
M = 73; s = 10 — dla testu ze statystyki.
M = 36; s = 5 — dla testu z percepcji.
z1 = (82 – 73) /10 = 0,9;

z2 = (35 – 36) /5 = –1/5 = –0,2.
W pierwszym lepszy niż w drugim.
Przykład 2
Pewien student B uzyskał wynik 63 w pierwszym teście oraz 26 w drugim.
M = 73 — dla testu ze statystyki,
M = 36 — dla testu z percepcji,
z1 = (63 – 73) /10 = –1;
z2 = (26 – 36) /5 = –10/5 = –2.
W pierwszym lepszy niż w drugim.
Przekształcenie normalne – ogólna definicja

- Przekształcenie normalne – jest to przekształcenie zmiennej wyrażonej w wynikach surowych w postać normalną
przy arbitralnie wybranej średniej i odchyleniu standardowym.
- Stosuje się w procesie normalizacji testów.
- Ogólny wzór:
Wynik znormalizowany = Mn + sn*z
gdzie
z - to wynik standaryzacji wyników surowych
Mn - średnia sn - odchylenie standardowe wybranej skali normalnej
Skale normalizacyjne
- Skala tenowa (T)
- Skala stenowa
- Skala staninowa
- Skala tetronowa
- Skala stejwowa
wybranej skali normalnej

Skala tenowa (T) (ten – 10 przedziałów)
- Skala tenowa – skala znormalizowana tak, aby średnia w populacji wynosiła 50, a odchylenie standardowe 10.
- Uważa się, iż wartości pomiędzy 30 a 70 oznaczają, iż dana wielkość jest w granicach normy. Wychylenia poza te
granice, szczególnie w stronę negatywnych wyników, mogą oznaczać patologiczne nasilenie danej cechy.
- Różnicowanie: pełne
- Skale tenowe są używane na przykład w teście MMPI-2, ACL
- Wzór przekształcenia normalnego:
Wynik tenowy = 50 + 10*z
gdzie z - to wynik standaryzacji wyników surowych
Skala stenowa
- Skala stenowa (od ang. standard ten) - skala testu psychologicznego znormalizowana tak, aby średnia w populacji
wynosiła 5,5, a odchylenie standardowe 2.
W skali jest 10 jednostek. W ten sposób zaokrąglone wyniki < 5 oznaczają wartość poniżej przeciętnej, a > 6 wartość
powyżej przeciętnej.

Wynik stenowy = 5,5 + 2*z gdzie z - to wynik standaryzacji wyników surowych
Właściwości skali stenowej

- Średnia = 5,5 (między 5 a 6 stenem)
- Odchylenie standardowe = 2,0
- Liczba jednostek skali = 10 stenów
- Zakres = od 1 do 10 stena
- Skok skali = 1 sten (0,5 odchylenia standardowego jednostek znormalizowanych „z”)
- Różnicowanie: wartości od -2 do +2 jednostek znormalizowanych „z” (steny krańcowe powyżej 2S)
- Przeznaczenie: różnicowanie w obrębie „normy”
Skala staninowa
Skala staninowa (od ang. standard nine), standardowa dziewiątka - dziewięciostopniowa skala znormalizowana tak,
aby średnia w populacji wynosiła 5, a odchylenie standardowe 2.
- Liczba jednostek skali wynosi 9 staninów, natomiast jej zakres wynosi od 1 do 9 stanina.
- Skok skali jest równy 1 staninowi (0,5 odchylenia standardowego jednostek znormalizowanych "z")
Wynik staninowy = 5 + 2*z

- Pierwsze użycie 1943, USA, skale selekcyjne w wojsku.
- Najczęstsze zastosowanie: edukacja
Różnicowanie: wartości od -1,75 do +1,75 jednostek znormalizowanych "z" (staniny krańcowe powyżej 1,75s)
- Przeznaczenie: różnicowanie w obrębie "normy"
Skala tetronowa
- Skala tetronowa – skala znormalizowana tak, aby średnia
w populacji wynosiła 10, a odchylenie standardowe 4.
Wynik tetronowy = 10 + 4*z
W skali jest 21 jednostek (od 0 do 20 punktów)
Obejmuje od -2,5 do +2,5 odchylenia standardowego wyników w rozkładzie normalnym
Skala stejwowa
- Skala stejwowa – skala znormalizowana tak, aby średnia w
populacji wynosiła 3, a odchylenie standardowe 1.
Wynik stejwowy = 3 + 1*z
07.12.2021
Skala /miara tendencji centralnych /zmienność
 nominalna – Modalna (Mo) - liczba kategorii (możemy przyporządkować informacje do różnych kategorii
 Porządkowa - Modalna (Mo)/ Mediana –preferowana - rozstęp ćwiartkowy, odchylenia ćwiartkowe
 Ilościowa - Modalna Mediana Średnia - najlepsza? - to zależy (symetryczny M, asymetryczny Me (bo M jest
wrażliwa na dane odstające))
Zmienna ma charakter losowy – nie da się przewidzieć wyniku
Zdarzenie - wartość zmiennej losowej - zbiór przypadkowych zdarzeń - nie mówimy o prawdopodobieństwie
subiektywnym, tylko obiektywnym i empirycznym – matematycznym
Prawdopodobieństwo obiektywne = liczba wypadków pożądanych / liczba wypadków możliwych
Rozkład teoretyczny – nie wymaga żadnych badań. Np. Normalny – mamy matematyczny wzór i na jego podstawie
ustalamy kształt.
Rozkład symetryczny - skośność = 0, M=Mo=Me. - jest to idealny rozkład, a ideały nie występują
Jednak będzie on się zbliżał do 0, im większa będzie próba i bardziej losowy dobór.
Rozkład empiryczny – przeprowadzamy badanie i tworzymy rozkład, patrzymy, jak on wygląda

np. Jak na ćwiczeniach - stosunek do gier
Empiria nie zawsze pokrywa się z teorią
Rozkład teoretyczny przykład:

Ile oczek może wypaść podczas rzutu dwoma sześciennymi kostkami (oczka od 1-6)
Ω=36
Suma liczba
oczek układów prawdopodobieństwo wystąpienia sumy
2 1 1 / 36 ; 0,028
3 2 2 / 36 ; 0,056
4 3 3 / 36 ; 0,083
5 4 4 / 36 ; 0,111
6 5 5 / 36 ; 0,139
7 6 6 / 36 ; 0,167
8 5 5 / 36 ; 0,139
9 4 4 / 36 ; 0,111
10 3 3 / 36 ; 0,083
11 2 2 / 36 ; 0,056
12 1 1 / 36 ; 0,028
(Gdybyśmy wzięli więcej kostek, wykres zbliżałby się do krzywej normalnej)
Rozkład dwumianowy
Prawdopodobieństwo wypadnięcia różnej liczby orłów w rzucie monetami
Liczba
0 orłów 1 orzeł 2 orły 3 orły 4 orły 5 orłów 6 orłów
monet
1 1/2 1/2
2 1/4 2/4 1/4
3 1/8 3/8 3/8 1/8
4 1/16 4/16 6/16 4/16 1/16
5 1/32 5/32 10/32 10/32 5/32 1/32

6 1/64 6/64 15/64 20/64 15/64 cze.64 sty.64
Wierszy w tabeli są rozwinięciem gdzie n – liczba monet

Rozkład dwumianowy
Rozkład dwumianowy oznacza rozkład kombinacji dwóch takich cech, których suma prawdopodobieństw
występowania równa 1
Opisuje go wzór:
p – prawdopodobieństwo zajścia określonego zdarzenia
q – prawdopodobieństwo, że określone zdarzenie nie zajdzie
n- liczba niezależnych zdarzeń
- Rozkład normalny jest uogólnieniem rozkładu dwumianowego dla p = q = ½ na sytuację, gdy jest nieskończenie
wiele prób.
- Rozkład normalny jest rozkładem zmiennej losowej ciągłej
- Rozkład normalny jest rozkładem teoretycznym
Rola rozkładu normalnego w psychologii

- Krzywa jest symetryczna. Średnia mediana i modalna zbiegają się w jednym punkcie
- Krzywa jest asymptotyczna. Zbliża się do osi poziomej, lecz nigdy do niej nie dochodzi i rozciąga się od minus
nieskończoności do plus nieskończoności
- Punkty zagięcia krzywej znajdują się w miejscach +/- 1s od średniej. W tych miejscach krzywa zmienia się z
wypukłej na wklęsłą.
- Ok 68% powierzchni pod krzywą mieści się w granicach +/- 1 s od średniej
- Kształt rozkładu normalnego zależy od wartości średniej i odchylenia standardowego
Dystrybuanta
- Prawdopodobieństwo tego, że zmienna {\displaystyle X}X ma wartości mniejsze bądź równe x{\displaystyle x}x
- Typ wykresu, który pokazuje związek pomiędzy wartościami ciągłej zmiennej losowej a prawdopodobieństwem,
czyli relacją pomiędzy z a polem pod krzywą normalną.
Wykres gęstości prawdopodobieństwa

- Powstaje z matematycznego przetworzenia dystrybuanty
- Właściwość: Stosunek pola powierzchni pod funkcje gęstości ograniczone przez dwie proste przechodzą przez
punkty A i B od pola powierzchni pod całym wykresem równy jest prawdopodobieństwu otrzymania dowolnej
wartości z przedziału (A – B)
Korelacja - zależność, współwystępowanie, związek pomiędzy zmiennymi
Przykłady korelacji – systematyczność a dobre wyniki w nauce
-Współczynnik korelacji – liczbowa miara związku
Użyteczność współczynnika korelacji

- Wyjaśnianie obserwowanych zjawisk (np. Analiza regresji)
(jakie są ich przyczyny – atrybucja oparta na wiedzy naukowej)
- Przewidywanie (predykcja) przyszłych zdarzeń
Korelacje obliczamy przy parze zmiennych
predykcja- określanie wartości jednej zmiennej na podstawie drugiej
*Pytania (można się spodziewać na egzaminie)

- Czy współczynnik korelacji można liczyć dla jednej obserwacji? - Nie
- Czy współczynnik korelacji można obliczyć dla dwóch zmiennych,
z których jedna ma wariancję = 0 (wszystkie wyniki były takie same)? - Nie, ponieważ nie ma zmiany wartości dla
jednej ze zmiennych
- Czy współczynnik korelacji można obliczyć dla dwóch zmiennych X (10 pomiarów) i Y (15 pomiarów)? - Nie,
Czy współczynnik korelacji można obliczyć dla dwóch zmiennych, z których jedna X została zmierzona w jednej
klasie, a druga w innej klasie tej samej szkoły? - Nie, ponieważ musimy mieć dwa pomiary dla jednej osoby
Kryteria uwzględniane przy wyborze miary związku (wybór współczynnika korelacji)

- Liczba korelowanych zmiennych – w tym semestrze będziemy się zajmować korelacją między parą zmiennych – 2
zmienne
- Rodzaj skali pomiarowej (nominalna, porządkowa, ilościowa)
- Liczby wartości przyjmowanych przez korelowane zmienne
- Natura związku
- Testowanie szczegółowych warunków zastosowania danego współczynnika
Liczba korelowanych zmiennych
My zajmujemy się tylko ”dla par zmiennych”
Wspólne cechy różnych miar związku:

- Wymagają zestawienia pomiarów zmiennych dla tej samej osoby
- Wzrostowi jednej zmiennej towarzyszy wzrost drugiej -> związek dodatni (+)
- Wzrostowi jednej zmiennej towarzyszy spadek wartości drugiej zmiennej -> związek
ujemny (-)
- 0 – oznacza brak związku pomiędzy zmiennymi
- Wartość miary związku mieści się pomiędzy -1 a +1
- Im bliżej -1 lub +1 tym silniejszy związek
Współczynnik korelacji r Pearsona (dwie zmienne mierzone na skali ilościowej/ilorazowej/stosunkowej):

- Współczynnik korelacji liniowej
- współczynnik wg momentu iloczynowego
- parametryczny współczynnik korelacji
Suma od pierwszego do ostatniego pomiaru odchyleń w zakresie jednej i drugiej zmiennej /
- średnie
- odchylenia standardowe
Suma=1901
 Warunki zastosowania r Pearsona
- skala ilościowa dla obu zmiennych
- liniowość związku pomiędzy zmiennymi
- podobieństwo rozkładu zmiennych
- idealny przypadek: rozkłady normalne (As = 0, K = 0)
- umiarkowana skośność:
Etapy interpretacji współczynnika korelacji w naukach społecznych

- Istotność statystyczna (podstawa do interpretacji, do uogólnienia na populację) 0,05
- Kierunek związku ( + lub - )
- Siła zależności (wartość bezwzględna współczynnika korelacji):
0.00 – 0.10 bardzo niska
0.11 – 0.30 niska
0.31 – 0.50 umiarkowana
0.51 – 0.70 wysoka
0.71 – 1.00 Bardzo wysoka
Odsetek wspólnej wariancji
- – współczynnik determinacji r=0,5 =0,25 0,25*100%=25%
- 100% – odsetek wspólnej wariancji
Mówimy, że 100% wariancji w jednej zmiennej powiązane jest z 25% wariancji u drugiej zmiennej
np. Gdyby było 100% to taki sam wzrost masy do takiego samego wzrostu objętości
Im więcej osoba chodzi na zajęcia - pozytywna korelacja z jej ocena na egzaminie r = 0,5
100% wariancji chodzenia na zajęcia jest powiązana z oceną na egzaminie w 25%
Graficzne ilustracje siły związku:

Na tym skończyliśmy
Model związku
Wybór właściwej miary związku polega na znalezieniu właściwego modelu, który najlepiej opisuje związek
pomiędzy zmiennymi (o ile taki istnieje)
Jeżeli r Pearsona = 0, ściśle oznacza to, że model liniowy w ogóle nie pasuje do danych zmiennych 2 możliwości.
Poziom statystycznej istotności

Przy obliczaniu każdego współczynnika korelacji pojawia się dokładna informacja na temat jego istotności
statystycznej = jakie jest prawdopodobieństwo błędu uogólnienia korelacji na populację.
Otrzymaną istotność porównujemy z istotnością kryterialną p < 0,05
Jeżeli poziom istotności jest p,0,05 współczynnik korelacji jest statystycznie istotny (korelacja istnieje w populacji z
bledem p)
Jeżeli współczynnik istotności jest większy p > 0,05 współczynnik korelacji nie jest statystycznie istotny (nie mamy
podstaw, żeby stwierdzić, że korelacja występuje w populacji)
Poziom dochodu a waga studentów
Wyniki obliczenie w SPSS
Jakie wnioski można wyciągnąć z tego przykładu?
Istotność statystyczna a siła związku

Wysoka istotność statystyczna nie przekłada się na wysoką silę związku!
- na podstawie istotności p orzekamy o wiarygodności ustalonej siły związku dla populacji w oparciu o badania
próby
- na podstawie znaku wsp. Korelacji (+ lub - ) stwierdzamy kierunek zależności
- na podstawie wartości współczynnika korelacji orzekamy o silę związku
Współczynniki korelacji rangowej

założenie: obie są mierzone przynajmniej na skali rangowej
Ogólne zalecenia: im większa liczba wartości, które przyjmuje każda ze zmiennych, tym lepiej
Właściwości: wartości wahają się w granicach od (–1,+1)
Parametryczne – dla skal ilościowych (R.Pearsona)

Nieparametryczne współczynniki korelacji – dla reszty skal
Rodzaje współczynników korelacji rangowej:
Symetryczne: (jedna zmienna jest przyczyną druga skutkiem)
rho Spearmana i>=10
tau-b Kendalla i>=5 (5x5, 6x6, 7x7, 8x8, 9x9)
tau-c Kendalla i>=5 (5x6, 6x7, 5x8, 9x7)
Gamma
Asymetryczne:
d Sommersa
Zaczynamy od Symetrycznych:
Obliczanie współczynnika rho Spearmana
.d- różnica między jedną a drugą rangą

d2 - d kwadrat
Rho- Spearmana nie lubi rang wiązanych (to co jest na czerwono)
Właściwości rho-Spearmana
- jest najlepszym rangowym odpowiednikiem r.Pearsona (odporne na wartości skrajne)
Najmocniejsze – to te testy, które wykryją zależność, różnicę, która istnieje w rzeczywistości, zawsze trzeba
wybierać najmocniejszy, jeśli nie może być on zrealizowany bierzemy niższy, jeśli zaczniemy od niższego a można
zastosować lepszy, jest to błąd strategiczny.
-Odporny na wartości skrajne
-Rho podniesione do kwadratu jest interpretowany w terminach wyjaśnianej zmienności jak r Pearsona
Częściowo traci swoją wartości w miarę wzrostu liczby rang wiązanych
Zastosowanie rho Spearmana

- w przypadku małej liczby rang wiązanych
- można zastosować do pomiaru związków krzywoliniowych w postaci krzywej logarytmicznej lub złożonej
- stosuje się jako miara podobieństwa profili
Mierzy na ile są podobne oceny kilku osób - (W Kendalla)
Nie będziemy tego obliczać - w psychologii stosujemy tylko taub i tauc Kendalla
Tau-b Kendalla (rozwinięcie w Kendalla)
Procedura obliczeniowa:
Rangujemy osobno każdą ze zmiennych
- Porządkujemy w kolejności od najwyższej rangi (1) do najniższej wg jednej zmiennej
- Porównujemy po kolei w ramach drugiej zmiennej rangę każdej osoby z pozostałymi. Wynik porównania wynosi:
+1, jeżeli ranga danej osoby jest wyższa od rangi drugiej osoby
-1, jeżeli jest niższa
0, jeżeli jest taka sama (rangi wiązne)
- Sumujemy wszystkie wyniki porównań (S – miara inwersji)
- Obliczmy wg. Wzoru tau
Przypisywanie rangi:
ilość rang - ilość pomiarów
Wiek rangi - najstarszy (13lat) - ranga 1, najmłodszy (0lat) - ranga 5
Waga rangi - najcięższy 38kg – ranga1, najlżejszy (3kg) - 5 ranga
Porównujemy po kolei w ramach drugiej zmiennej (on sam nie wiedział co robi, więc nie wytłumaczę...)
Sumujemy wyniki , mówił, że nie będzie na egzaminie, bo sam się zajebał

przy obliczeniach.
*Trzeba zapamiętać różnice, kiedy tau b a kiedy tau c

Asymetryczne (?)
Nie ma żadnych założeń, oprócz tego, że liczba wartości w nawiasie decyduje co wybierzemy
Nie ma tutaj mowy o pozytywnych, negatywnych związkach, nie ma natężenia w skalach nominalnych NIE MA
MOŻLIWOŚCI MÓWIENIA O KIERUNKACH ZWIĄZKU NA SKALI NOMINALNEJ!
φ (Fi) nie może być ujemne- bo jest pod pierwiastkiem!

Płeć a palenie (k lub m, pali lub nie), (2x2)
max c-kontyngencji zależy od liczby wartości, które przyjmuje zmienna
K – najmniejsza liczba kategorii (kolumn, wierszy)

jeśli mamy tabelę 5x4 to wtedy k=4
Współczynnik kappa Cohena – wykorzystywany częściej niż w Kendalla, -wyjątek, jeśli chodzi nam o zgodność
sędziów/ocen, stosuje się wtedy, kiedy interesuje nas zgodność ocen dotyczących tego samego pomiaru, ale
pochodzących od innych osób. Np. Kiedy chcemy zbadać zgodność profili osób chcących zawrzeć związek małżeński.
Współczynnik eta (mamy różne skale jedna zmienna jest nominalna (jakościowa) druga ilościowa), związek
nieliniowy, rzadko wykorzystywane. Np. Korelacja między płcią a agresywnością.
Tyle, jeśli chodzi o współczynniki korelacji
Spotykamy się albo za tydzień albo za dwa, nauczyć się tabelki i przypomnieć o korelacjach ogólnie, pokaże nam
przykładowe pytania i czego się możemy spodziewać
Obliczmy miary tendencji centralnej (+coś jeszcze ale zapomniałam)
R pearsona i obszar powierzchni pod krzywą normalną - ale trudniejsze niż na zajęciach
Egzamin wygląda tak, dostajemy kwestionariusz, będą tam pytania, w pracy zasadniczej, pyta Jaki współczynnik
korelacji, żeby skorelować 3 i 5 pytanie.
Zadanka z mtc porobić w materiałach umieścił
Obliczyć medianę, średnią z przedziałów/rozkładu liczebności, modę,

Skale będą, (mamy inny niż kogni). Na jakiej skali można policzyć miary tendencji centralnej.

Statystyka Opisowa

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Statystyka Opisowa

Uploaded by

Copyright:

Available Formats

Statystyka opisowa – 1 zajęcia psychologia

-Psychologia aspiruje do bycia nauką empiryczną

Przebieg procesu badawczego w psychologii: (wg. Brzezińskiego)

2) Określanie obrazu przestrzeni zmiennych niezależnych istotnych dla zmiennej zależnej

5) Dobór próby populacji

7) Akceptacja lub odrzucenie hipotezy

8) Ocena interpretacja i generalizacja rezultatu badawczego – w odniesieniu do założeń teoretycznych.

Wartości, które mogą wypaść na kostce: 1 2 3 4 5 6

Ile razy wypadła częstotliwość (f): 1 – 3, 2 – 3, 3 – 4, 4 - 4, 5 - 6, 6 – 3

Przykład 2: (na egzaminie będzie taka tabelka i trzeba będzie obliczyć %)

Reguły tworzenia przedziałów klasowych (wg Fergusona)

Granice dokładne przedziałów klasowych

Pierwsze 40 liczb spisać

Ocena statystyki od 1-33

Na następnych zajęciach będzie analiza tych danych

10, 11, 12, 12 ,12, 12, 14, 14, 15, 17,

17, 18, 18, 19, 20, 20, 21, 22, 22, 22

23, 23, 24, 24, 25, 25, 26, 28, 28, 33

R= 33-1+1= 33 - rozpiętość naszych wyników wynosi 33 jednostki

3) Liczba przedziałów klasowych – wybieramy rozpiętość

Interwał - szerokość przedziału = 1, to 33:1=33 – nasze wyniki zmieszczą się w 33 przedziałach

Jeśli wynosi 2, to całość objęłoby 17 przedziałów

Interwał (I) Liczba klas (przedziałów =R/I )

Wybieramy interwał 3, ponieważ 11 mieści się w przedziale 10-20

Zaczynamy od najniższego wyniku, który jest wielokrotnością 3

Pierwszy przedział klasowy

Środek przedziału liczymy = Dolna granica przedziału + interwał: 2

Liczebność - ile wyników mieści się w tym przedziale

Liczebność skumulowana- wszystkie poprzednie wyniki + ten przedział

Granice dokładne przedziałów klasowych:

+wracamy do skal pomiarowych

Skale pomiarowe (b.ważne)

Z punktu widzenia praktyki opracowywania statystycznego danych w psychologii i pedagogice rozróżnienie

Płeć- skala nominalna

-porządkowa, można uszeregować

+Na egzaminie będzie pytanie: jakiego współczynnika korelacji użyć

1. Etap analizy – stowrzenie histogramów liczebności, robimy go na przedziałach, a nie na wszystkich

Miara tendencji centralnej

Właściwości średniej arytmetycznej:

-jest wrażliwa na wartości skrajne

-suma odchyleń wszystkich pomiarów od średniej jest równa 0

Średnia z obu grup: M= (15+24)/11 = 3,5454…

3x5 + 4X6 = 39/11= 3,5454

Grupa ćw. Liczebność grupy Ocena ze statystyki

Przedział Dokładne Liczeb Procent

(Środek w przypadku przedziału klasowego 1-4:

0,5 1 1,5 2 2,5 3 3,5 4 4,5 Środek przedziału to 2,5)

Suma odchyleń od średniej:

(7-11) + (13-11) + (22-11) + (9-11) + (11-11) + (4-11) = -4+2+11-2-7= 0

Wrażliwość na odstające wyniki średniej

Mg= Pierwiastek n z iloczynu wszystkich wyników, gdzie n= liczba wyników

Stosuje się tylko do pomiarów na skali stosunkowej.

Jest bardziej odporna na wartości odstające niż średnia arytmetyczna

Średnia harmonijna – (wyjebane w nią - Marcel)

-Medianę możemy obliczać tylko dla skali porządkowej, przedziałowej i stosunkowej (

-graficznie dzieli cały obszar pod rozkładem na dwie równe części,

-nie jest wrażliwa na wartości skrajne,

Nieparzysta liczba obserwacji

Kilka takich samych liczb w okolicach mediany

Me= 55 trafia między 54,5 i 55,5 – dokładne granice przedziału 55

Przedział Dokładne Liczebno Procent

Mediana mieści się między 16-18

L- dokładna dolna granica przedziału, w którym znajduje się mediana = 15,5