Professional Documents
Culture Documents
opisowa
WPiK UAM
Tomasz Ptaszyński, 2023
Program IBM SPSS Statistics 28
6. Osoby uczestniczące w zajęciach laboratoryjnych powinny korzystać z szatni i nie przynosić na zajęcia okryć
zewnętrznych oraz bagażu. Studenci nie powinni używać komputerów do celów nie związanych z zajęciami.
7. Na laboratoria należy przychodzić punktualnie, prowadzący może nie dopuścić do zajęć osoby spóźnionej.
Studenci, którzy nie przyjdą punktualnie na zajęcia muszą się liczyć z tym, że ich stanowisko komputerowe
zostanie zajęte przez osobę odrabiającą ćwiczenia.
Zmienna (variable) –
właściwość przyjmująca
różne – co najmniej
dwie – wartości.
Podział zmiennych
Ze względu na wielkość zbioru, z którego przyjmuje
wartości:
Dwuwartościowe
(dychotomiczne)
Trójwartościowe
(trychotomiczne)
Wielowartościowe
(politomiczne)
Podział zmiennych
ZDYCHOTOMIZOWANEJ
Podział zmiennych
Skala nominalna
Skala porządkowa
Skala interwałowa
Skala ilorazowa
Skala Nominalna
Każdą zmienną
dwuwartościową traktujemy
jako wyrażoną na skali
NOMINALNEJ !
Skala Nominalna
Skala Porządkowa
Skala Porządkowa
Skala Interwałowa
Skala Interwałowa
Skale Interwałowe i ilorazowe
Skale Interwałowe i ilorazowe
Skala Skala
Celsjusza Kelvina
Skale Interwałowe i ilorazowe
Skalami ilorazowymi nie są również
skale logarytmiczne np. pH
Wskaźnik pH to ujemny wykładnik stężenia jonów wodorowych
[H+]
Np:
pH=2 stężenie [H+] = 0,01 mol/dm3
pH=3 stężenie [H+] = 0,001 mol/dm3
pH=4 stężenie [H+] = 0,0001 mol/dm3
DOMINANTA
= WARTOŚĆ MODALNA
= MODA (Mo)
Określa wartość NAJCZĘSTSZĄ w danym
zbiorze
Może być stosowana dla skal nominalnych,
porządkowych i ilościowych.
Miary tendencji centralnej
Miary tendencji centralnej
(wydruk z pakietu
statystycznego)
Statystyki
poziom stresu
N Ważne 13
Braki 0
danych
Dominanta 3,0
poziom stresu
Procent Procent
Częstość Procent ważnych skumulowany
Ważne 1,0 2 15,4 15,4 15,4
2,0 1 7,7 7,7 23,1
3,0 3 23,1 23,1 46,2
4,0 2 15,4 15,4 61,5
5,0 2 15,4 15,4 76,9
6,0 1 7,7 7,7 84,6
7,0 2 15,4 15,4 100,0
Ogółem 13 100,0 100,0
Miary tendencji centralnej
MEDIANA (Me)
Me= 5,5
Wartość: 1 1 3 4 4 5 6 7 7 8 8 9
nr
pomiaru: 1 2 3 4 5 6 7 8 9 10 11 12
Miary tendencji centralnej
Miary tendencji centralnej (wydruk
z pakietu statystycznego)
Statystyki
poziom stresu
N Ważne 13
Braki 0
danych
Mediana 4,0
poziom stresu
Procent Procent
Częstość Procent ważnych skumulowany
Ważne 1,0 2 15,4 15,4 15,4
2,0 1 7,7 7,7 23,1
3,0 3 23,1 23,1 46,2
4,0 2 15,4 15,4 61,5
5,0 2 15,4 15,4 76,9
6,0 1 7,7 7,7 84,6
7,0 2 15,4 15,4 100,0
Ogółem 13 100,0 100,0
Miary tendencji centralnej
ŚREDNIA ARYTMETYCZNA
– wartość przeciętna
X
Ma zastosowanie TYLKO do skal ilościowych
(interwałowych i ilorazowych).
Średnia arytmetyczna
i
X
X= i =1
N
Sumujemy wszystkie pomiary od i=1 do N-tego i
dzielimy przez liczbę pomiarów (N).
Średnia arytmetyczna
Miary tendencji centralnej (wydruk
z pakietu statystycznego)
Statystyki
poziom stresu
N Ważne 13
Braki danych 0
Średnia 3,923
poziom stresu
Procent
Częstość Procent Procent ważnych skumulowany
Ważne 1,0 2 15,4 15,4 15,4
2,0 1 7,7 7,7 23,1
3,0 3 23,1 23,1 46,2
4,0 2 15,4 15,4 61,5
5,0 2 15,4 15,4 76,9
6,0 1 7,7 7,7 84,6
7,0 2 15,4 15,4 100,0
Ogółem 13 100,0 100,0
Średnia ważona
Niekiedy stosujemy średnią ważoną:
(we wzorze W – oznacza wagi dla
poszczególnych pomiarów)
N
w X i i
X= i =1
N
w
i =1
i
Średnia ważona
Co oznacza:
w1 x1 + w2 x2 + ... + wn xn
X=
w1 + w2 + ... + wn
W ten sposób dane którym przypisano
większe wagi mają większy udział w
określeniu średniej ważonej niż dane,
którym przypisano mniejsze wagi.
Kwartyle i mediana
Kwartyle i mediana
Kwartyle, decyle, percentyle
Statystyki
poziom stresu
N Ważne 13
Braki danych 0
Percentyle 25 2,500
50 4,000
75 5,500
poziom stresu
Procent Procent
Częstość Procent ważnych skumulowany
Ważne 1,0 2 15,4 15,4 15,4
2,0 1 7,7 7,7 23,1
3,0 3 23,1 23,1 46,2
4,0 2 15,4 15,4 61,5
5,0 2 15,4 15,4 76,9
6,0 1 7,7 7,7 84,6
7,0 2 15,4 15,4 100,0
Ogółem 13 100,0 100,0
Percentyle
Q3 − Q1 5,5 − 2,5
Q= = = 1,5
2 2
Otrzymana wartość pozwala stwierdzić, że połowa
pomiarów w próbie odchyla się od mediany o 1,5
kategorii.
Miary dyspersji
Kolejną
miarą jest
ODCHYLENIE ŚREDNIE zwane
również PRZECIĘTNYM.
Jest
to średnia arytmetyczna
bezwzględnych odchyleń
pomiarów od średniej
arytmetycznej w próbie.
Odchylenie średnie
Odchylenie średnie
AD =
X i −X
=
21,08
= 1,62
N 13
Odchylenie średnie
Zamiast
wprowadzać wartości
bezwzględne można podnieść
poszczególne różnice do kwadratu.
Procedurataka pozwala obliczyć
najszerzej stosowaną miarę
zmienności – odchylenie standardowe,
którego wartość podniesiona do
kwadratu nazywamy wariancją.
Wariancja
Definicyjny wzór na wariancję w próbie ma postać:
s=
(X i − X) 2
=
48,92
= 2,02
n −1 13 − 1
WARIANCJA
W próbie W populacji
Średnia
arytmetyczna
X m
Odchylenie
standardowe s s
Wariancja
s 2 s2
Reguła trzech sigm
Odchylenie standardowe jest nie tylko
najbardziej stabilną miarą rozproszenia
w próbie. W populacji, gdy rozkład
zmiennej jest zbliżony do rozkładu
normalnego, wartości odchylenia
standardowego wyznaczają od średniej
przedziały, w których znajduje się zwykle
taka sama liczba pomiarów. Regułę tę
nazywamy regułą trzech sigm (trzech
odchyleń standardowych).
Reguła trzech sigm
Skale opierające się na
odchyleniu standardowym
Skala standaryzowana: przedstawia wyniki
pomiarów w postaci jednostek odchylenia
standardowego. Wyniki na skali przedstawione są w
taki sposób, że średnia wynosi 0, a jednostka (z)
odpowiada jednemu odchyleniu standardowemu.
Skale opierające się na
odchyleniu standardowym
Skala stenowa (standard ten): skala
przekształcona w taki sposób, że
średnia ma wartość 5,5, a odchylenie
standardowe ma wartość 2 (Zakres =
od 1 do 10 stena).
Narzędzie to służy m.in. do
normalizowania wyników testów
psychologicznych.
Skale opierające się na
odchyleniu standardowym
Miarą
zróżnicowania rozkładu cechy jest
współczynnik zmienności określony
wzorem:
s 2,02
v= = = 0,52
x 3,92
Gdzie s to odchylenie standardowe w próbie, a x to średnia
w próbie.
Zmienność
Dla danych porządkowych stosowany jest
pozycyjny współczynnik zmienności oparty na
medianie i odchyleniu ćwiartkowym:
Q 1,5
VQ = =
4
= 0,38
Me
Zmienność
Rozkład symetryczny
Skośność bliska 0
Skośność
Rozkład
prawoskośny –
skośność
dodatnia
Tradycyjnywzór na współczynnik
skośności opierał się na różnicy pomiędzy
średnią a medianą:
x − Me
Am = 3
s
Momenty średniej
Drugi moment:
2
(X − X )
m2 =
N
Momenty średniej
Trzeci moment:
3
(X − X )
m3 =
N
Czwarty moment:
4
(X − X )
m4 =
N
Momenty średniej
Skośność
Skośność w oparciu o momenty średniej
obliczamy według wzoru: m
g1 = 3
m2 m2
Natomiast błąd standardowy skośności
(SES) szacujemy następująco:
6n(n − 1)
SES =
(n − 2)( n + 1)( n + 3)
Skośność
Bezwzględna wartość skośności
dwukrotnie większa od swego błędu
standardowego jest wskaźnikiem
odejścia od symetrii rozkładu.
n2 −1
SEK = 2 * SES
(n − 3)(n + 5)
Kurtoza
Podobnie jak przy skośności
bezwzględna wartość kurtozy
dwukrotnie większa od swego błędu
standardowego jest wskaźnikiem
istnienia kurtyczności rozkładu.
Oznacza to, że rozkład jest
kurtyczny wówczas, gdy
bezwzględna wartość kurtozy jest
większa od podwojonego błędu
standardowego.
Kurtoza
Kurtoza
m4 27,88
g2 = 2 − 3 = 2
− 3 = −1,03
m2 (3,76)
n2 −1 169 − 1
SEK = 2 * SES = 2 * 0,62 = 1,19
(n − 3)(n + 5) 10 *18
Rozkład leptokurtyczny
Kurtoza > O
Kurtoza < O
d = R / k = 47/6 = 7,83
suma 45 100
Histogram
Krzywa kumulatywna
(ilustruje liczebność skumulowaną)
Krzywa kumulatywna
120
100
80
60
40
20
0
11-18,5 18,5-26,5 26,5-34,5 34,5-42,5 42,5-50,5 50,5-58,5
Histogram i wielobok
liczebności
Łącząc ze sobą środki górnych boków
histogramu otrzymujemy wielobok
liczebności. Pole powierzchni tej
figury jest równe polu powierzchni
kolumn histogramu.
Wykres słupkowy
(kolumnowy)
Wykres kołowy
Wykres słupkowy poziomy
brak informacji
zachodniopomorskie
wielkopolskie
warmińsko-mazurskie
świętokrzyskie
śląskie
pomorskie
podlaskie
podkarpackie
mazowieckie
małopolskie
łódzkie
lubuskie
dolnośląskie
250
200
150
100
50
0
1 5 10 15 20 25 30 35 40 45 50 60 70 83
Wykres liniowy ze znacznikami
Wejścia w kolejnych dniach tygodnia
253
218
215 195
194
165
150
176 168
137
121 124 123
69
mężczyźni kobiety
Wykres skrzynkowy (pudełkowy)
Wykres rozrzutu
Opis przy pomocy programu SPSS – przykład.