Professional Documents
Culture Documents
INFORMATIKA I
STATISTIKA
MedSta - Uvodno 1
Osnovno nastavno štivo
MEDICINSKA STATISTIKA
Ivanković D i sur.
Osnove statističke analize za medicinare.
Biblioteka Udžbenici i priručnici Medicinskog
fakulteta Sveučilišta u Zagrebu, svezak 24,
Zagreb 1988.
MEDICINSKA INFORMATIKA
Kern J, Petrovečki M (urednici).
Medicinska informatika.
Medicinska naklada, Zagreb 2009.
MedSta - Uvodno 2
Dopunsko štivo
MedSta - Uvodno 3
WEB SJEDIŠTE
statinfo.mefos.hr
MedSta - Uvodno 4
SVRHA ISTRAŽIVANJA
opis
– stanje u populaciji
usporedba
– novi postupak VS stari postupak
povezanost
– rizični čimbenik i bolest/stanje
MedSta - Uvodno 5
STATISTIKA?
MedSta - Uvodno 6
….neki razlozi - praćenje literature….
“ …p < 0.05…”
Multiple R .96764
R Square .93632
Adjusted R Square .92883
Standard Error 6.54079
MedSta - Uvodno 7
….neki razlozi - deskripcija i analiza rezultata….
MedSta - Uvodno 9
neki razlozi - planiranje istraživanja i
eksperimenta.
- metoda “što ispadne” u istraživanju i
eksperimentu može rezultirati nepouzdanim i
neinterpretabilnim rezultatima
MedSta - Uvodno 10
“Savjetovati se sa statističarem
nakon što je pokus završen često je
samo zahtjev da izvrši post-mortem
pregled.
MedSta - Uvodno 11
Pojam i predmet statistike
“alat”
– KADA ju primjenjivati
– KAKO ju primjenjivati
MedSta - Uvodno 12
KADA ?
?
?
MedSta - Uvodno 13
KAKO ?
?
?
MedSta - Uvodno 14
...pojam i predmet statistike...
MedSta - Uvodno 15
...pojam i predmet statistike...
(statističke jedinice,
entiteti)
populaciju čine osnovne jedinice
promatranja
zdravstveni radnik u populaciji
zdravstvenih radnika
NUMERIČKE KATEGORIČKE
(kvantitativne) (kvalitativne,
opisne)
KONTINUIRANE DISKRETNE
NOMINALNE ORDINALNE
MedSta - Uvodno 17
Numeričke varijable
kontinuirane varijable
– varijable koje teorijski pretpostavljaju
postojanje beskonačnog broja vrijednosti
diskretne varijable
– varijable čija se vrijednost uvećava ili
umanjuje za cijeli broj jedinica
MedSta - Uvodno 18
Kategoričke varijable
nominalne varijable
– varijable čije su vrijednosti određene
pripadnošću nekoj kategoriji
MedSta - Uvodno 19
...kategoričke varijable...
ordinalne varijable
– varijable čije su vrijednosti određene
pripadnošću nekoj od kategorija s poznatim
redosljedom
MedSta - Uvodno 20
Još neke vrste podataka...
postotci ili proporcije (percentages or proportions)
– odnos dijela prema cjelini
– omjer dva istovrsna podatka
ejekcijska frakcija, ...
omjeri (ratios)
– omjer dva raznovrsna podatka (omjer dviju
varijabli)
BMI
MedSta - Uvodno 21
...još neke vrste podataka...
stope (rates)
– odnos opaženog broja pojave nekog svojstva
prema jedinici populacije nekog područja u
nekom vremenskom periodu
morbiditet, mortalitet,...
skorovi (scores)
– rezultat zbrajanja vrijednosti dodijeljenih
kategorijama varijabli od interesa
MedSta - Uvodno 23
...još neke vrste podataka...
cenzorirani (censored)
– podatci koji se ne mogu točno izmjeriti,
ali je poznato da prelaze neku granicu
mjerenja
najčešće se pojavljuju:
– u laboratorijskim mjerenjima –
vrijednosti ispod/iznad mogućnosti
detekcije nekog uređaja
– u studijama praćenja (follow-up):
očekivano svojstvo se nije pojavilo u
promatranom periodu
ispitanik uključen u istraživanje je iz nekog
razloga izuzet prije završetka istraživanja
MedSta - Uvodno 24
LJESTVICE MJERENJA
1. nominalna
2. ordinalna
3. intervalna
4. omjerna
MedSta - Uvodno 25
1. Nominalna ljestvica
90kg = 3*30kg
3174.653oz = 3*1058.218oz (1kg=35.27392oz)
MedSta - Uvodno 29
Rezultati mjerenja na ljestvicama višeg
reda mogu se prikazati ljestvicama
nižeg reda, ali NE I OBRNUTO !
MedSta - Uvodno 30
NEKOLIKO VAŽNIH PRAVILA ...
MedSta - Uvodno 31
Unos podataka
VARIJABLE
JEDINICE bolesnik1
bolesnik2
PROMATRANJA
bolesnik3
.
.
MedSta - Uvodno 32
RAZDIOBA OBILJEŽJA
1x
3x
4x
MedSta - Uvodno 33
Primjer
MedSta - Uvodno 34
Primjer 1.
Na jednom čovjeku izvršeno je 50 mjerenja vremena
reakcije. Dobiveni su sljedeći podaci (u tisućinkama
sekunde):
196 173 186 189 173 165 167 160 140 174
180 151 157 164 154 169 190 180 163 157
169 167 165 160 177 165 157 177 159 175
166 173 185 177 184 183 162 192 174 162
165 172 158 169 146 170 171 169 168 153
Ma
ksi Sredina ?
mu
m
? ?? ??? ?
?
um
nim
Mi
MedSta - Uvodno 35
TABLICA FREKVENCIJA
MedSta - Uvodno 36
... tablica frekvencija ...
MedSta - Uvodno 37
... tablica frekvencija ...
sredina razreda
broj koji najbolje reprezentira dani razred
MedSta - Uvodno 38
... tablica frekvencija ...
MedSta - Uvodno 39
... tablica frekvencija ...
MedSta - Uvodno 40
za dani razred:
apsolutna frekvencija:
– koliko mjerenja ima vrijednosti iz intervala tog
razreda
apsolutna kumulativna frekvencija:
– koliko mjerenja ima vrijednost manju ili jednaku
gornjoj granici tog razreda
relativna frekvencija:
– koliki postotak mjerenja od ukupnog broja
mjerenja ima vrijednost iz intervala tog razreda
kumulativna relativna frekvencija:
– koliki postotak mjerenja od ukupnog broja
mjerenja ima vrijednost manju ili jednaku gornjoj
granici tog razreda
MedSta - Uvodno 41
Tablica frekvencija podataka iz
primjera
MedSta - Uvodno 42
Primjer 2.
min = 140 max = 196
Broj r. Granice r. Sredina r. f cf rf crf
1 140 – 144 142 1 1 0,02 0,02
2 145 – 149 147 1 2 0,02 0,04
3 150 – 154 152 3 5 0,06 0,10
4 155 – 159 157 5 10 0,10 0,20
5 160 – 164 162 6 16 0,12 0,32
6 165 – 169 167 12 28 0,24 0,56
7 170 – 174 172 8 36 0,16 0,72
8 175 – 179 177 4 40 0,08 0,80
9 180 – 184 182 4 44 0,08 0,88
10 185 – 189 187 3 47 0,06 0,94
11 190 – 194 192 2 49 0,04 0,98
12 195 – 199 197 1 50 0,02 1,00
UKUPNO : 50 1,00
MedSta - Uvodno 43
RAZDIOBA FREKVENCIJA
HISTOGRAM FREKVENCIJA
14
12
10
frekvencija
8
6
4
2
0
140 145 150 155 160 165 170 175 180 185 190 195
donja granica razreda
MedSta - Uvodno 44
RAZDIOBA FREKVENCIJA
POLIGON FREKVENCIJA
14
12
10
frekvencija
8
6
4
2
0
142 147 152 157 162 167 172 177 182 187 192 197
sredina razreda
MedSta - Uvodno 45
RAZDIOBA FREKVENCIJA
50
40
frekvencija
30
20
10
0
144 149 154 159 164 169 174 179 184 189 194 199
gornja granica razreda
MedSta - Uvodno 46
RAZDIOBA FREKVENCIJA
0.30
0.25
relativna frekvencija
0.20
0.15
0.10
0.05
0.00
142 147 152 157 162 167 172 177 182 187 192 197
sredina razreda
MedSta - Uvodno 47
RAZDIOBA FREKVENCIJA
0.80
kumulativna relativna
0.60
frekvencija
0.40
0.20
0.00
144 149 154 159 164 169 174 179 184 189 194 199
gornja granica razreda
MedSta - Uvodno 48
Stablo i list (stem-and-leaf)
f stablo list
1.00 14 . 0
1.00 14 . 6
3.00 15 . 134
5.00 15 . 77789
6.00 16 . 002234
12.00 16 . 555567789999
8.00 17 . 01233344
4.00 17 . 5777
4.00 18 . 0034
3.00 18 . 569
2.00 19 . 02
1.00 19 . 6
MedSta - Uvodno 49
PAŽNJA !
– broj razreda
preveliki broj razreda => male frekvencije ili
prazni razredi
premali broj razreda => razredi jako sažeti
=> izgubljeno puno informacija
uobičajeno: 10-20 razreda (ovisno o broju i
prirodi podataka)
kod nominalnih varijabli:
broj kategorija=broj razreda
MedSta - Uvodno 50
PAŽNJA !
– granice razreda
MedSta - Uvodno 51
OPISIVANJE RAZDIOBE
PODATAKA
MedSta - Uvodno 52
PARAMETAR I STATISTIKA
POPULACIJA
1.UZORAK
2.UZORAK
. . .
n-ti UZORAK
MedSta - Uvodno 53
PARAMETAR I STATISTIKA
aritmetička
sredina visine 1.
uzorka
= 172.2
aritmetička
sredina visine 2.
uzorka
= 178.1
aritmetička
aritmetička sredina
sredina visine n-
visine populacije
tog uzorka
= 175.4
= 173.7
MedSta - Uvodno 54
PARAMETAR I STATISTIKA
parametar:
– vrijednost (obično nepoznata) koja predstavlja
neku karakteristiku populacije
– unutar populacije, parametar je nepromjenljiva
vrijednost koja NE VARIRA
statistika:
– veličina izračunata iz podataka izmjerenih na
uzorku
– vrijednost statistike MIJENJA SE od uzorka do
uzorka
MedSta - Uvodno 55
Uobičajene oznake:
OCJENA PARAMETAR
PARAMETRA POPULACIJE
(STATISTIKA)
ARITMETIČKA
SREDINA
X
STANDARDNA
DEVIJACIJA s
PROPORCIJA p
MedSta - Uvodno 56
OPISIVANJE RAZDIOBE PODATAKA
sredina
varijabilnost
oblik
MedSta - Uvodno 57
MJERE SREDINE (centralne tendencije)
( srednje vrijednosti, prosjeci, mjere lokacije )
ARITMETIČKA SREDINA
MEDIJAN (središnja vrijednost)
MOD (dominantna ili tipična vrijednost)
GEOMETRIJSKA SREDINA
HARMONIJSKA SREDINA
MedSta - Uvodno 58
ARITMETIČKA SREDINA
oznake: X ..... uzorak μ..... populacija
ARITMETIČKA SREDINA
INDIVIDUALNIH PODATAKA
N
x 1 x 2 ... x N
x
i 1
i
N N
xi ... vrijednosti mjerenog obilježja
N ... ukupan broj podataka
MedSta - Uvodno 59
Primjer
MedSta - Uvodno 60
ARITMETIČKA
Kolika je aritmetička sredina nizaSREDINA
podataka:
1, 2, 3, 3, 4, 5?
x1 x 2 x 3 x 4 x 5 x 6
x
6
1 2 3 3 4 5 18
3
6 6
1 1 1 1 2 12 18
x 3
6 6
MedSta - Uvodno 61
Imamo dva niza podataka:
A: 1 2 3 3 4 5
B: 1 1 1 1 2 12
MedSta - Uvodno 62
aritmetička sredina je težište distribucije
1 2 3 4 5
1·1 1·1
1·2 1·2
3 = 3
1 2 3 4 5 6 7 8 9 10 11 12
1·1
4·2 1·9
9 = 9
MedSta - Uvodno 63
ARITMETIČKA SREDINA GRUPIRANIH
PODATAKA
f 1 x S 1 f 2 x S 2 ... f k x Sk f x i Si
i 1
N N
fi ... frekvencija i-tog razreda
xSi ... sredina i-tog razreda
k ... broj razreda
N ... ukupan broj podataka
MedSta - Uvodno 64
Kolika je aritmetička sredina podataka
ARITMETIČKA u sljedećoj tablici:
SREDINA
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14
f 33 31 30 12 12 10 9 9 9 8 7 7 6 3
f· 33 62 90 48 60 60 63 72 81 80 77 84 78 42
x
14
f
i 1
i 186
14
f x i i 930
i 1
930
x 5
186
MedSta - Uvodno 65
33
k
28
f 1 x S 1 f 2 x S 2 ... f k x Sk f x i Si
930
23 i 1
5
N N 186
18
13
8
3
-2
1 2 3 4 5 6 7 8 9 10 11 12 13 14
f 33 31 30 12 12 10 9 9 9 8 7 7 6 3
MedSta - Uvodno 66
ZAJEDNIČKA ARITMETIČKA SREDINA
(aritmetička sredina aritmetičkih sredina,
ponderirana aritmetička sredina)
x1 N1 x 2 N 2 ... x n N n
x N
i 1
i i
x zaj n
n
N
i 1
i N
i 1
i
STUDENT 1 STUDENT 2
MedSta - Uvodno 68
PREDMET ...OCJENA ECTS
mjere centralne tendencije ...
STUDENT 1 STUDENT 2
2 4 5 9 5 8 3 4 105
uspjeh S 1 4 . 20
25 25
5 4 2 9 3 8 5 4 82
uspjeh S 2 3 . 28
25 25
MedSta - Uvodno 69
U dva navrata vršeno je mjerenje neke dužine i
... mjere centralne tendencije ...
dobiveni su slijedeći rezultati:
x1 = 20cm ; N1 = 15
x2 = 23cm ; N2 = 60
a) Kolika je zajednička aritmetička sredina?
b) Kolika je zajednička aritmetička sredina za
N1=60;N2=15?
20 15 23 60 300 1380
a) x zaj 22 . 4 cm
15 60 75
20 60 23 15 1200 354
b) x zaj 20 . 6 cm
15 60 75
aritmetička sredina osjetljiva je ne samo
na vrijednost nego i na broj podataka
MedSta - Uvodno 70
Aritmetička sredina nema smisla, tj. nije
dobar reprezentant podataka ako je:
- razdioba asimetrična
- broj podataka mali, a varijabilnost velika
(velike razlike u vrijednostima podataka)
MedSta - Uvodno 71
Imamo niz podataka:
A: 2 2.5 3.5 3 4
Kolika je suma odstupanja pojedinačnih vrijednosti od
aritmetičke sredine? Kolika je suma kvadrata odstupanja
pojedinačnih vrijednosti od aritmetičke sredine te od
vrijednosti 2; 4; 5?
(2-3)+(2.5-3)+(3.5-3)+(3-3)+(4-3) = -1-0.5+0.5+0+1 = 0
1. (x
i 1
i ) 0
N N
2. (x
i 1
i ) 2
(x
i 1
i
2
a ) , a
MedSta - Uvodno 73
MEDIJAN (središnja vrijednost)
vrijednost koja se u nizu podataka poredanih
po veličini nalazi točno u sredini –
središnja vrijednost po položaju
vrijednost medijana:
– za neparan N: vrijednost koja se nalazi na
(N+1)/2 mjestu
– za paran N: sredina vrijednosti podataka
koji se nalaze na N/2 i (N+2)/2 mjestu
MedSta - Uvodno 74
MEDIJAN (središnja vrijednost)
prednosti:
– na vrijednost medijana ne utječu
ekstremne vrijednosti
pogodan kao mjera centralne
tendencije kod asimetričnih
raspodjela
MedSta - Uvodno 76
MOD (dominantna vrijednost)
MedSta - Uvodno 77
UNIMODALNA
BIMODALNA
UNIFORMNA
MedSta - Uvodno 78
MJERE RASPRŠENJA
( VARIJABILNOSTI )
MedSta - Uvodno 79
( mjere disperzije, raspršenja )
RASPON
KVANTILE
VARIJANCA
STANDARDNA DEVIJACIJA
KOEFICIJENT VARIJABILNOSTI
MedSta - Uvodno 80
RASPON
R = max - min
nedostaci:
– uzima u obzir samo dvije ekstremne
vrijednosti koje uopće ne moraju biti
karakteristične za promatranu varijablu
– ovisi o broju opažanja (veći broj opažanja
=> veći raspon)
MedSta - Uvodno 81
KVANTILE
mjere varijabilnosti po položaju
kvartile, decile, centile
donja kvartila (Q1 ili 25%)
– vrijednost podatka koji stoji na centralnom
mjestu polovice podataka nižih od medijana
gornja kvartila (Q3 ili 75%)
– vrijednost podatka koji stoji na centralnom
mjestu polovice podataka viših od medijana
Q2 - medijan
MedSta - Uvodno 82
obuhvat jedinica obuhvat jedinica
centila decila
promatranja promatranja
.... ....
MedSta - Uvodno 83
VARIJANCA
prosječno kvadratno odstupanje od aritmetičke
sredine
N
(x i ) 2
VARIJANCA
2 i 1 POPULACIJE
N
N
(x x) i
2
VARIJANCA
UZORKA
s
2 i 1
N 1
MedSta - Uvodno 84
STANDARDNA DEVIJACIJA
ZA POPULACIJU ZA UZORAK
N N
(x i ) 2
(x i x) 2
i 1
s i 1
N N 1
služi za ocjenu pojedinih rezultata oko
aritmetičke sredine
izražava se uz aritmetičku sredinu
obično je
2s < raspon < 6s
MedSta - Uvodno 85
KOEFICIJENT VARIJABILNOSTI
ZA POPULACIJU ZA UZORAK
s
K .V . 100 K .V . 100
x
MedSta - Uvodno 87
MOMENTI RAZDIOBE
uzastopne mjere prosječnih odstupanja
od aritmetičke sredine nultog, prvog,
drugog, trećeg i višeg reda
x i
n
n i 1
N
MedSta - Uvodno 88
NULTI I PRVI MOMENT
N N
x i
0
1 N
0 i 1
1
i 1
N N N
x i
1
0
1 i 1
0
N N
MedSta - Uvodno 89
DRUGI MOMENT
x i
2
2 i 1
2
VARIJANCA
N
MedSta - Uvodno 90
TREĆI MOMENT
x i
3
3 i 1
N
za simetrične raspodjele 3 = 0
MedSta - Uvodno 91
KOEFICIJENT ASIMETRIJE
(coefficient of skewness)
3
3 3
3 > 0 .... asimetrija udesno (pozitivna asimetrija)
3 < 0 .... asimetrija ulijevo (negativna asimetrija)
3 = 0
3 > 0 3 < 0
MedSta - Uvodno 92
ČETVRTI MOMENT
x i
4
4 i 1
N
MedSta - Uvodno 93
KOEFICIJENT SPLJOŠTENOSTI
(coefficient of kurtosis)
4 > 3 raspodjela je uža
4 (šiljatija) od normalne
4 4 (leptokurtic)
4 = 3 normalna spljoštenost
raspodjela je šira
4 < 3
(spljoštenija) od
normalne
(platykurtic)
MedSta - Uvodno 94
KOEFICIJENT SPLJOŠTENOSTI
(coefficient of kurtosis)
4
eksces spljoštenosti 4 3
za normalnu raspodjelu
eksces spljoštenosti = 0
MedSta - Uvodno 95
ODNOS MJERA SREDINE I ASIMETRIJE
90
80
70
SIMETRIČNA
60
50
40
30
20
10
0
75- 81- 87- 93- 99- 105- 111- 117- 123- 129- 135- 141- 147- 153- 159- 165- 171- 177- 183- 189- 195- 201- 207- 213- 219- 225-
80 86 92 98 104 110 116 122 128 134 140 146 152 158 164 170 176 182 188 194 200 206 212 218 224 230
x Me Mo
MedSta - Uvodno 96
ODNOS MJERA SREDINE I ASIMETRIJE
180
160
140
ASIMETRIČNA U DESNO
120
100
(pozitivna asimetrija, >0)
80
60
40
20
0
23- 26- 29- 32- 35- 38- 41- 44- 47- 50- 53- 56- 59- 62- 65- 68- 71- 74- 77- 80- 83- 86- 89- 92- 95- 98-
25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100
Mo = 37 X 42
Me = 38
Mo Me x
MedSta - Uvodno 97
ODNOS MJERA SREDINE I ASIMETRIJE
180
160
140
ASIMETRIČNA U LIJEVO
120
100
(negativna asimetrija, <0)
80
60
40
20
0
3-5 6-8 9-11 12- 15- 18- 21- 24- 27- 30- 33- 36- 39- 42- 45- 48- 51- 54- 57- 60- 63- 66- 69- 72- 75- 78-
14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80
X 58 Mo = 63
Me = 62
x Me Mo
MedSta - Uvodno 98
GRAFIČKO PRIKAZIVANJE
PODATAKA
MedSta - Uvodno 99
RAZDIOBA OBILJEŽJA
prikazuje se histogramom (stupičasti grafikon, “column
chart”) ili poligonom frekvencija (linijski grafikon, “line
chart”)
HISTOGRAM FREKVENCIJA
14
12
10
frekvencija
8
6
4
2
0
140 145 150 155 160 165 170 175 180 185 190 195
donja granica razreda
14 50
12
40
10
frekvencija
frekvencija
8 30
6 20
4
10
2
0 0
142 147 152 157 162 167 172 177 182 187 192 197 144 149 154 159 164 169 174 179 184 189 194 199
sredina razreda gornja granica razreda
0.20
kumulativna relativna
0.60
0.15
frekvencija
0.40
0.10
0.05 0.20
0.00 0.00
142 147 152 157 162 167 172 177 182 187 192 197 144 149 154 159 164 169 174 179 184 189 194 199
sredina razreda gornja granica razreda
100%
12.9% 12.9% 90%
80%
70%
17.3% 60%
50%
40%
30%
20%
56.9%
10%
0%
30
25
20
15
10
5
0
lipanj
svibanj
srpanj
listopad
rujan
prosinac
travanj
studeni
ožujak
kolovoz
siječanj
veljača
148
144
140
136
132
Max
Min
Mean; Mean+SD
128 Mean-SD
Visina
25
20
15
10
5
0
125 130 135 140 145 150
Visina
MedSta - Uvodno 106