You are on page 1of 26

No.

Statistika
-Tutorial-
Procijenite očekivani tlak za oboljele i za zdrave ispitanike.
Što možete zaključiti iz toga?

Basic statistic Descriptive statistics


Procjena očekivanja je prosjek, računamo
1. Kliknemo na varijable 8. Kliknemo na Summary prosjek za zdrave i za oboljele

3. Kliknemo na By Group
2. Odaberemo varijablu tlak
Nakon što kliknemo na By group otvorit će nam se lijevi prozor

4. Kliknemo Grouping Variable(s)


5. Odaberemo varijablu bolest
6. Kliknemo OK

7. Kliknemo OK

Nakon ovoga vratimo se na prethodni korak i kliknemo na Summary


Nakon što kliknemo na OK otvorit će nam se rezultati

Iz tablica očitamo
prosjek (Mean) za
pojedini slučaj

Procjena očekivane vrijednosti tlaka za sve


S lijev strane u tabu Workbook4 (zdrave i bolesne) iznosi 138.3268
biramo prikaz koji želimo vidjeti

Procjena očekivane vrijednosti tlaka za oboljele


iznosi 143.7375

Procjena očekivane vrijednosti tlaka za zdrave


iznosi 135.4603

KOMENTAR: Možemo zaključiti da oboljele osobe imaju nešto veći očekivani tlak od onih koji su zdravi
Intervalom pouzdanosti 95% procijenite očekivani tlak.

Statistics Basic statistic Descriptive statistics

Interval pouzdanosti za vjerovatnost (kada tražimo udio ili postotak),


a drugi interval pouzdanosti je za očekivanja

1. Kliknemo na varijable
3. Kliknemo na Advanced
2. Odaberemo varijablu tlak
Nakon što kliknemo na Advanced otvorit će nam se ovaj prozor

5. Kliknemo na Summary
4. Odaberemo Conf. limits for means
Otvorit će nam se ovi rezultati
i iz njih očitamo pouzdane intervale

Donja granica interval pouzdanosti: 136.4529

Gornja granica interval pouzdanosti: 140.2007

Ovdje paziti da se ukuca traženi interval


pouzdanosti (95%)

ODGOVOR: Od 100 ispitanika 95 bi podržavalo izračunatu vrijednost tlaka, tj. za 95 ispitanika


očekivani tlak bi bio u interval od 136.45 do 140.20, a smo 5 njih ne bi bilo u tom intervalu.
Odredite 95%-tne pouzdane intervale za proporciju osoba koje nikad nisu konzumirale
duhan (varijabla duhan jednaka 0), posebno za oboljele (bolest=1) i zdrave
(bolest=0). Usporedite i komentirajte.
Statistics Power Analysis
3. Kliknemo OK
1. Odaberemo Interval Estimation
Ovdje je bitno upisati
2. Odaberemo One Proportion točne vrijednosti

Nakon što kliknemo Ok dobit


ćemo ovaj prozor.

Potrebne vrijednosti možemo


očitati iz tablice frekvencija
…podsjetimo se kako iz tablice frekvencija doći do potrebnih podataka…

Statistics Basic statistic Frequency Tables

1. Kliknemo na varijable 8. Kliknemo na Summary


3. Kliknemo na By Group
2. Odaberemo varijablu duhan
Nakon što kliknemo na By group otvorit će nam se lijevi prozor

4. Kliknemo Grouping Variable(s)


5. Odaberemo varijablu bolest
6. Kliknemo OK

7. Kliknemo OK

Nakon ovoga vratimo se na prethodni korak i kliknemo na Summary


Nakon što kliknemo na Summary otvorit će nam se rezultati

S lijeve strane u tabu Workbook4


biramo prikaz koje rezultate
želimo vidjeti
Sad možemo unijeti potrebne vrijednosti u tablicu

Potrebno je unijeti vrijednosti


za oboljele i zdrave

Očitavamo proporciju
Pi (Crude)

Kada smo napravili za zdrave


isto napravimo i za bolesne
i onda usporedimo

KOMENTAR:
Proporcija onih koji nisu nikad komnzumirali duhan
Ukupan broj je puno veća među onima koji nisu imali bolest
promatranih Interval koji Udio promatranih
trebamo odrediti 92/302 = 0.3046 nego oni koji jesu
95% = 0.95
Sistolički tlak viši od 140 smatra se povišenim. Možemo li na razini značajnosti
0.05 tvrditi da ispitanici imaju povišeni očekivani tlak?
Statistics Basic statistic t-test, single sample
1. Kliknemo na varijable
3. Kliknemo na Advanced 2. Odaberemo varijablu tlak
Nakon što kliknemo na Advanced otvorit će nam se lijevi prozor

Nakon što kliknemo Summary dobit ćemo


5. Kliknemo Summary tablicu s rezultatima
4. Upišemo vrijednost tlaka s
kojom želimo usporediti

Iz tablice očitamo p vrijednost i usporedimo


je s 0.05, s obzirom da je veća ne možemo
odbaciti H0

KOMENTAR:
Na razini značajnosti α = 0.05 ne možemo odbaciti
hipotezu H0, tj. možemo tvrditi da ispitanici imaju
povišeni tlak.
Imamo li razloga sumnjati u normalnu distribuiranost varijable BMI na
razini značajnosti 0.05?

Basic statistic Descriptive statistics


3. Kliknemo OK
1. Kliknemo na varijable 2. Odaberemo varijablu BMI

4. Kliknemo na tab Normallity


Nakon što kliknemo na Normality otvorit će nam se ovaj prozor
His togram : bm i
Nakon što kiknemo na Historams dobijemo S hapiro-W ilk W = .98353, p= .00004
graf s rezultatima iz koje isčitamo 140
E xpec ted Norm al

p vrijednost
120

6. Kliknemo na Histograms
100

No. of obs.
80

60

40

20

0
0 5 10 15 20 25 30 35 40 45
X < = C ategory B oundary

H0 – BMI vrijednost dolazi iz normalne


distribucije
H1 – BMI vrijednost ne dolazi iz normalne
distribucije
5. Kliknemo na Shapiro-Wilk`s W test

S obzirom da je p < 0.05 (varijabla ne dolazi iz normalne distribucije) možemo zapisati odgovor:
Na razini značajnosti α od 0.05 odbacujemo hipotezu H0 i prihvaćamo hipotezu H1 tj. možemo tvrditi da
BMI indeks ne dolazi iz normalne distribucije
Koliko iznosi procijenjeni koeficijent korelacije između varijabli tlak i bmi i
što govori njegov predznak?
Basic statistic Correlation matrices
2. Odaberemo varijable
3. Kliknemo na Options
1. Kliknemo na Two lists

U ovom slučaju kod odabira varijabli


nije bitno koju vartijablu ćemo odabrati
s koje strane.
Nakon što kliknemo na Options otvorit će nam se ovaj prozor

Nakon što kiknemo na Summary dobijemo


4. Kliknemo na Display r, p-values and N`s Tablicu s rezultatima iz koje isčitamo
Koeficijent korelacije
5. Kliknemo na Summary

Koeficijen korelacije iznosi 0.3565, s obzirom


da se radi o pozitivnom predznaku koefiijenta
korelacije zaključujemo da je pozitivno koreliran

Ovdje još možemo imati pitanje dali


su varijable tlak i bmi zavisne

S obzirom da nam je p < 0.05 možemo zaključiti


da su varijable nezavisne
Neka je X slučajna varijabla koja modelira varijablu bolest, a Y slučajna varijabla koja
modelira varijablu obitelj. Odredite empirijsku distribuciju slučajnog vektora (X, Y ).
Možemo li tvrditi da oboljenje ovisi o pojavi bolesti u obitelji na razini značajnosti 0.05?

Statistics Basic statistic Tables and banners

1. Kliknemo na Stub-and-banner
3. Odaberemo varijable bolest i obitelj

2. Kliknemo na Specify tables

5. Kliknemo na OK 4. Kliknemo na OK

X – bolest Y - obitelj
Nakon što kliknemo na OK otvorit će nam se ovaj lijevi prozor

6. Kliknemo na Options 8. Kliknemo na Summary


Kada kiknemo na Summary dobit ćemo
Tablicu s rezultatima iz koje možemo
očitati

NE

DA
7. Odaberemo Percentages od total count
Nakon ovoga bitno je pravilno
interpretirati rezultate
ZAJEDNIČKA ILI EMPIRIJSKA DISTRIBUCIJA SLUČAJNOG VEKTORA X I Y

0.4459 nije imao bolesti i u obitelji nema povijesti bolesti

0.2078 nije imao bolesti ali u obitelji ima povijesti bolesti

0.1385 imao bolesti ali u obitelji nema povijesti bolesti

0.2078 imao bolesti i u obitelji ima povijesti bolesti


MOŽEMO LI TVRDITI DA SU OBOLJENJA ZAVISNI O BOLESTI:

Vratimo se u ovu tablicu 2. Odaberemo Pearsons & M-L


3. Kliknemo na Detailed
1. Kliknemo na Options two-way tables

4. Očitamo prvu p vrijednost

S obzirom da je p < 0.05 odbacujemo H0 i prihvaćamo hipotezu H1 možemo zapisati odgovor:

Na razini značajnosti α od 0.05 odbacujemo hipotezu H0 i prihvaćamo hipotezu H1 tj. možemo tvrditi da
ne možemo
oboljenje ovisi o pojavi bolesti
Procijenite parametre linearnog modela indeksa tjelesne mase u ovisnosti o dobi.
Napišite formulu modela. Za koliko raste indeks tjelesne mase sa svakom godinom
života?

Graphs 2D Scatterplots 5. Kliknuti OK Odrediti prvo što je zavisna a što


nezavisna varijabla.
Indeks tjelesne mase je zavisna varijabla

4. Kliknuti OK

1. Kliknuti variables

3. Na Y-os odabiremo zavisnu


2. Na X-os odabiremo ono varijablu
što modeliramo
Nakon što kliknemo OK otvorit će nam se dijagram raspršenosti

1. Očitamo jednadžbu: bmi = 11.1326 + 0.3334 ∙ dob


U zadatku se traži da procijenimo
2. Zapišemo formulu linearnog modela: parametre linearnog modela.
Parametri linearnog modela su:
y = 11.1326 + 0.3334x
S c atterplot of bm i agains t dob je prvi član i iznosi 11.1326
s rc e 8v*462c
bm i = 11.1326+ 0.3334*x
je drugi član i iznosi 0.3334
45

Potrebno je odgovoriti i na pitanje za


40
koliko raste indeks tjelesne mase sa
svakom godinom života
35

30 Indeks tjelesne mase sa svakom godinom


Života raste za , ili za 0.3334
bmi

25

20

15

10

5
10 20 30 40 50 60 70
dob
Za slučajan vektor opisan pod (f), procijenite vjerojatnost oboljenja ako u
obitelji nema slučajeva bolesti. Procijenite i vjerojatnosti P(X = 0, Y = 0), P(Y
= 1|X = 0).
Vratimo se u ovu tablicu
3. Kliknemo na Summary
1. Kliknemo na Options
2. Odaberemo sve tri
Nakon što kliknemo na Summary otvorit će nam se rezultati

Iz ove tablice sada isčitavamo sve procijenjene


vjerovatnosti koje nas zanimaju
The end
UPOZORENJE:
Ovaj tutorial nije 100% točan, napravljen je prema osobnom sjećanju i bilješkama od Sanje. Procijenjena pouzdanost točnosti
riješenih zadataka se kreće u intervalu [95.23% – 97.34%]. Na razini značajnosti odbacujemo Hipotezu odgovornosti za Vaš uspjeh
i usvajamo hipotezu da učite na vlastitu odgovornost!!!

You might also like