You are on page 1of 17

Statistiko sreivanje i prikazivanje podataka

Tipovi podataka Na poetku bilo kakvog istraivakog procesa potrebno je definisati statistiku masu tj. skup jedinica na kojima treba izvriti planirano istraivanje. Ovako definisan skup naziva se u statistici osnovni skup, koji se sastoji od statistikih jedinica. Statisitke jedinice su istovetne tj. imaju odreene iste osobine ili bar jednu osobinu na osnovu koje se svrstavaju u osnovni skup. Osobine po kojima se statistike jedinice meusobno razlikuju nazivaju se obeleja i ona su predmet prouavanja tokom istraivanja. Razliiti vidovi u kojima se obeleja mogu javiti nazivaju se modaliteti obeleja. Obeleja u statistici mogu se podeliti na prosta i sloena. Prosta obeleja imaju jasne granice izmeu modaliteta npr. pol, brano stanje. Kod sloenih obeleja ne postoji mogunost da se uspostavi jasna granica izmeu modaliteta ili postoji veliki broj modaliteta npr. uzrok smrti, zdravstevno stanje i dr. Obeleja se prema obliku u kome se iskazuju dele na numerika i atributivna. Sa statistikog aspekta najvanije je da li se obeleja mogu izraziti kvanitativno ili ne. Sva obeleja koja se mogu izraziti brojano nazivaju se numerika obeleja, npr. telesna teina, nivo holesterola, koncentracija hemoglobina, broj bolesnika. Numerika obeleja se dalje mogu podeliti na neprekidna (kontinuirana) i prekidna (diskontinuirana). Neprekidna numerika obeleja dobijaju se u procesu merenja i njihova karakterisitka je da ona mogu da uzmu bilo koju vrednost. Telesna teina novoroeneta moe biti izmerena na vagi koja pokazuje jednu decimalu, pa e i telesna teina nekog novoroeneta biti npr. 3,3kg, ali ako imamo vagu koja meri na 4 decimale teina e biti prikazana kao 3,3582kg. to znai da kod neprekidnih numerikih obeleja brojane vrednosti koje se dobiju zavise od tehnikih mogunosti mernih instrumenata. Ova obeleja se izraavaju u odreenim jedinicama mere. Nasuprot neprekidnim obelejima, prekidna nastaju u procesu brojanja i predstavljaju se u vidu celih brojeva. Primer ovakvog obeleja je broj bolesnika, ocena na ispitu, broj novoroenadi i dr. Postoje obeleja koja se ne mogu meriti i ne mogu izraziti brojano takva obeleja se nazivaju opisna ili atributivna i njihove osobine se opisuju pol, brano stanje, zdravstveno stanje (oboleli, nisu oboleli) i dr. Po svom karakteru ova obeleja su diskontinuirana.

Merne skale Na osnovu nivoa merenja merne skale se mogu podeliti u etri osnovne: nominalna, ordinalna, intervalna i skala odnosa. Nominalna skala prati najnii nivo merenja. Ova skala se primenjuje za podatke koji su klasifikovani u odreeni broj i tip modaliteta. Na primer, pol muki/enski, krvna grupa 0/A/B/AB. Izmeu modaliteta ne moe se uspostaviti redosled. Ordinalna skala, za razliku od nominalne skale, utvrene modalitete moe da rangira tj. moe da se utvrdi redosled, ali ne moe da utvrdi apsolutnu razliku meu modalitetima. Npr, nivo bola jak/srednje jak/slab/ bez bola, zatim stadijumi nekog tumora I, II, III, IV stadijum. Modaliteti su rangirani od najmanjeg do najveeg, ali se ne moe rei da je stadijum IV dva puta gori od stadijuma II ili da je jednaka razlika izmeu stadijuma I i III i izmeu stadijuma II i IV. Intervalnu skalu karakterie jedinica mere, mogue je utvrditi apsolutnu razliku meu ispitivanim podacima, ali ne postoji mogunost uspostavljanja relativnog odnosa meu ispitivanim podacima. Primer je temperatura koja se moe izraziti u Celzijusima (S) ili u Farenhajtima (F). Ne moe se uspostaviti relativni odnos, jer nula ne predstavlja odsustvo temperature. Osim toga, nule se ne poklapaju: 0S = 32F, 10S=42F, 2h10S84F ve 52F. Skala odnosa je najpreciznija skala. NJene osnovne karakterisitke su da ima jedinice mere, moe se utvrditi kako apsolutna tako i relativna razlika meu ispitivanim podacima. Primer za ovu mernu skalu je telesna teina ili visina. Ako uzmemo da je jedan student medicine visok 180cm, a drugi 198 cm mogue je utvrditi da je apsolutna razlika u visini izmeu ova dva studenta 18 cm, ali i da je drugi student vii za 10% od prvog studenta.

Metode prikupljanja podataka Tokom istraivakog procesa ispitivana pojava moe biti posmatrana u celoj populaciji (potpuno posmatranje) ili na delu populacije (delimino posmatranje). Metode potpunog posmatranja su metod popisa i metod registracije i izvetaja. Metod popisa snima stanje neke masovne pojave u tano odreenom trenutku. Popis je odreen kritinim momentom pojave koji predstavlja trenutak koji odreuje koje e statisitke jedinice ui u popis, i vremenom trajanja popisa. Metod registracije i izvetaja, za razliku od metode popisa, registruje podatke za odreeni vremenski period. Medicinska dokumentacija predstavlja grupu sredstava za usklaeno evidentiranje i prikupljanje podataka o dogaajima i aktivnostima u sistemu zdravstvene zatite. Funkcije medicinske dokumentacije: Daje uvid u zdravstveno stanje bolesnika Omoguava postavljanje dijagnoze i odabir terapije Olakava komunikaciju izmeu lekara i lekara i bolesnika Predstavlja temelj za razliite zdravstveno-statistike analize Sudsko-medicinski dokaz sprovedinih postupaka Indikator kvaliteta rada zdravstvene slube Baza podataka za nauna istraivanja 2

Osnovnu medicinsku dokumentaciju ine: zdravstveni karton, istorija bolesti, temperaturno-terapijsko-dijetetska lista, karton o potronji lekova, karton vakcinacije, otpusna lista sa epikrizom, protokol bolesnika, protokol za registrovanje rezultata medicinskog rada, protokol operisanih i umrlih, matina knjiga lica smetenih u stacionarnoj zdravstvenoj ustanovi, lista anestezije. Postoje i pomona sredstva za voenje evidencija a to su: registar kartoteke, dnevna evidencija o posetama i radu, tekua evidencija o utvrenim stanjima i oboljenjima, dnevna evidencija o kretanju bolesnika u stacionaru. Metode deliminog posmatranja su anketa i statistiki eksperiment. Anketa (upitnik) je izvor podataka ili merni instrument sainjen od pitanja koja su odtampana na papiru ili na drugom pogodnom medijumu, najee raunaru. Upitnik je namenjen prikupljanju podataka, ispitivanju stavova i ponaanja kod manje grupe ispitanika. U pripremi ankete potrebno je izvriti dobru selekciju ispitanika koji e biti anketirani. Na poetku upitnika mora da se naglasi svrha anketiranja, ko sprovodi anketu, da li je anonimna ili nije. Pitanja koja se postavljaju mogu biti otvorenog ili zatvorenog tipa. Kod otvorenog tipa pitanja ispitanik sam pie svoj odgovor, a kod zatvorenog tipa ispitanik zaokruuje ili na neki drugi nain oznaava jedan od ponuenih odgovora. Na kraju ankete potrebno je ostaviti prostor za primedbe, sugestije ispitanika. Pravila prilikom formiranja ankete su sledea: pitanja treba da budu kratka, jasna, precizna, da nisu dvosmislena, da ne navode na odgovor. Anketa treba da bude primerena intelektualnom nivou ispitanika, ne sme da bude predugaka. Anketa moe biti sprovedena lino, slanjem putem pote ili elektronske pote, postavljena na veb sajtu.

Metode sreivanja podataka Prikupljeni podaci predstavljaju sirov materijal koji se ne moe podvrgnuti statistikoj analizi. Ovako prikazani podaci predstavljaju osnovnu empirijsku seriju, gde su vrednosti obeleja prikazane redom kako su prikupljane. Potrebno je ove nesreene podatke urediti po nekom kriterijumu ime se formira osnovna serija, najee se podaci sreuju po veliini. Institut za javno zdravlje sproveo je anketu meu enama starosti 30 40 godina koliko puta godinje odlaze na kontrolne ginekoloke preglede. Dobijeni su sledei podaci: 0034224310132443201224302 1423102212321012131024331 Na osnovu ovako prikazanih podataka nismo u mogunosti da formiramo sliku o navikama ena odreenog uzrasta da poseuju ginekologa. Kako bi zakljuili kakve su navike ena potrebno je prvo srediti podatke po veliini. 0000000011111111111222222 2222222233333333334444444 Nakon sreivanja podataka po veliini potrebno je saeti podatke u vidu proste distribucije frekvencije. Distribucija frekvencije predstavlja takvu statistiku seriju gde se vrednosti obeleja

upisuju u jednu kolonu, a uestalost tj. frekvenciju u drugu kolonu. Dakle, distribucija frekvenicije pokazuje kako je rasporeen broj jedinica posmatranja po pojedinim vrednostima obeleja. Za gore pomenute podatke formirana je prosta distribucija frekvencije. Broj poseta 0 1 2 3 4 f 8 11 14 10 7 50

Na osnovu ovako sreenih podataka moe se zakljuiti da najvei broj ena poseuje ginekologa dva puta godinje. Nain sreivanja podataka zavisi od tipa obeleja. Atributivna i numerika diskontinuirana obeleja predstavljaju se prostom distribucijom frekvencije, a numerika kontinuirana obeleja se predstavljaju distribucijom frekvencije sa klasnim (grupnim) intrevalima. Distribucija frekvencije sa klasnim (grupnim) intervalima odreena je brojem intervala, veliinom intervala i granicama intervala. Osim toga, potrebno je voditi rauna o tome da intrevali budu meusobno jednaki, jer se time omoguava meusobno uporeivanje grupa. Broj intervala oznaava se sa K i odreuje se Sturgesovom formulom. K = 1+3,32192 log N, Veliina intervala odreuje se po formuli: Veliina intervala =
X max X min K

N = ukupan broj statistikih jedinica

Treba voditi rauna da granice intervala budu jasne i precizne, ime se jasno pokazuje kom intervalu pripada vrednost posmatranog obeleja, zatim, mora se voditi rauna da kraj jednog intervala ne bude i poetak drugog, jer se time izbegava situacija da se ne zna kom intervalu pripada ispitivana vrednost. Kod 30 bolesnika odreivane su vrednosti glikemije (eera u krvi) i dobijene su sledee vrednosti: 8,6 7,7 6,2 6,6 8,0 9,3 7,3 8,5 10,9 11,1 8,4 9,4 6,9 12,3 13,1 11,9 10,5 9,2 12,6 11,4 13,7 9,0 6,6 11,4 11,0 8,1 7,3 13,9 12,1 8,0

Na osnovu prikupljenih podataka nije mogue doneti zakljuak o vrednosti glikemije kod ispitivanih bolesnika. Stoga je potrebno srediti i saeti podatke u vidu ditribucije frekvenicije sa klasnim (grupnim) intervalima. 4

Potrebno je odrediti broj intervala: K = 1+3,32192 log N K = 1+3,32192 log 30 = 1+3,32192*1,48 = 5,91 6 X min 13,9 6,2 X = =1,28 1,3 Veliina intervala = max K 6 Za gore prikazane podatke potrebno je formirati distribuciju frekvencije sa 6 intervala, gde je veliina intervala 1,3. H 6,2 7,5 7,5 8,8 8,8 10,1 10,1 11,4 11,4 12,7 12,7 14,0 f .... .... .... .... .... .... ....

Ovakav nain formiranja intervala nije ispravan, jer dolazi do preklapanja vrednosti. U datom primeru, postavlja se pitanje u koji interval uvrstiti vrednost od 11,4.
H 6,2 7,49 7,5 8,79 8,8 10,09 10,1 11,39 11,4 12,69 12,7 13,99 f 6 7 4 4 6 3 30

Ovako formirana distribucija frekvencije sa klasnim intervalima je ispravna i pokazuje da najvei broj bolesnika ima vrednost glikemije izmeu 7,5 8,79.

Prikazivanje podataka

Nakon sreivanja podataka potrebno je iste prikazati to jasnije i preciznije. Prikazivanje podatka moe biti tabelarno i grafiki. Tabela je prikaz podataka sastavljen od redova i kolona. Svaka tabela mora da ima naslov tebele, zaglavlje i pretkolonu. Naslov tabele ______________________________________________________________
ZAGLAVLJE
PRETKOLONA

SUMA REDOVA

Polje

SUMA KOLONA

Tabele mogu biti proste, sloene i kombinovane. Proste tabele prikazuju samo jednu statistiku seriju. U tabeli 1 je prikazan broj stanovnika u periodu od 2003-07. godine. Tabela1. Broj stanovnika u Srbiji u periodu 2003-07. godine Godina 2003 2004 2005 2006 2007 Br. stanovnika 7532613 7463157 7440769 7411569 7381579

Sloene tabele prikazuju vie statistikih serija. U tabeli 2 prikazani su podaci o broju stanovnika, broju ivoroenih i broju mrtvoroenih u Niavskom regionu u periodu od 2003 do 2007. godine, to predstavlja prikazivanje tri statistike serije u odreenom vremenskom periodu. Tabela2. Vitalna statistika u Niavskom regionu u periodu 2003-07. godine Godina 2007 2006 2005 2004 2003 Br. stanovnika 376946 378059 379076 379829 380976 ivoroeni 3425 3558 3550 3691 3603 Mrtvoroeni 21 23 23 24 19

Kombinovane tabele prikazuju serije podataka dobijenih ukrtanjem dva ili vie obeleja. Oboleli Zdravi Mukarci ene Mukarci ene Vakcinisani 345 273 567 534 1719 Nevakcinisani 673 652 321 283 1929 1018 925 888 817 3648 Prema tipu obeleja koje prikazuju dele se na tabele kontigencije i tabele korelacije. Tabele kontigencije prikazuju opisna obeleja, a tabele korelacije numerika obeleja.
Grafiko prikazivanje podataka

Grafiko prikazivanje podataka nudi upadljivije i jasnije utvrivanje razlika meu prikazanim serijama podataka. Grafikoni predstavljaju vizuelnu ilustraciju tabela, ali nisu njihova zamena, ve dopuna. Nedostatak grafikona je to konstrukcija grafikona zavisi od postavljene srazmere, drugi nedostatak to ponekad u istoj razmeri nije mogue prikazati sve vrednosti, npr. najmanje i najvee vrednosti. Grafikoni se dele na takaste, linijske i povrinske. Kod takastog dijagrama podaci su prikazani u vidu taaka. Svaka taka je u koordinatnom sistemu definisama dvema vrednostima, nezavisnom koja se nanosi na apscisu i zavisnom koja se nanosi na ordinatu. Obino se, osim prikaza podatka u vidu taki, odreuje i regresiona linija tj. prava koja najbolje pokazuje meusobni odnos prikazanih taaka.
10.00 9.00 8.00 7.00 6.00 5.00 4.00 3.00 2.00 1.00 0.00

25

35

45

55
starost

65

75

85

Linijski dijagrami se dele na: poligon i kriva frekvencije, vremenski linijski dijagram, kumulativni i polarni dijagram.

Kriva frekvencije koristi se za kontinuirana obeleja, na apscisu se nanose mali intervali obeleja, formira se niz taaka, ijim spajanjem se formira kriva. U statistci je najpoznatija i najvie se primenjuje Gausova kriva.

Vremenski linijski dijagram prati jedno ili vie obeleja kroz vreme. Na apscicu se nanosi vreme, a na ordinatu vrednosti obeleja. Upotrebljava se za praenje trenda.
382000 381000 380000 379000 378000 377000 376000 375000 374000

2003

2004

2005

2006

2007

Grafikon . Broj stanovnika u periodu 2003-07. godine Povrinski dijagrami se dele na tapiasti dijagram, histogram, kruni dijagram i kartogram. tapiasti dijagrami se sastoje od odvojenih stubia, na X-osu se nanose modaliteti obeleja, a na u-osu frekvencija ispitivanog obeleja. Korisiti se za prikazivanje diskontinuiranih obeleja.
50

45

40

35

30

puai nepuai

25

20

15

10

puai

nepuai

Histogram je tip povrinskog dijagrama kojim se prikazuju numerika kontinuirana obeleja. Sastoji se od spojenih stubia, gde irina stubia predstavlja irinu klasnog intervala, a visina frekvenciju. Ukoliko se spoje sredine stubia formira se poligon frekvencije.

Kruni dijagrami se koriste za prikazivanje delova neke strukture. Ceo krug predstavlja 100% neke strukture.

puai nepuai

Kartogrami su dijagrami po geografskoj karti, gde se za svaki region ili podruje upisuje vrednost ispitivane pojave.

Primenjena statistika u MS Excelu Unos, grupisanje, tabelarno i grafiko prikazivanje statistikih podataka

Unos statistikih podataka

Unos podataka, tj formiranje datoteke, prvi je korak u radu s podacima dobijenim u nekom istraivanju. Ispravno formiranje datoteke, nuan je korak za dalju analizu unetih podataka. Kada se pokrene program Excel, na ekranu se pojavi radni list (Sheet ili Spreadsheet), u obliku tabela. Svaki radni list se sastoji od 65.536 redova (oznaenih brojevima od 1 do 65.356) 256 kolona (oznaenih slovima od A do IV). Radni listovi ine radnu knjigu (Book), unutar koje se smeta celokupna datoteka. Najmanja jedinica, definisana presekom reda i kolone, naziva se elija (Cell), i svaki radni list ima 16.777.216 elija. Pri unosu podataka u Excel, treba imati na umu sledee: 1. Jedan red-jedan pacijent 2. Varijable se unose u kolone, tako da jedna kolona predstavlja jednu varijablu. U prvi red se unose nazivi varijabli. 3. Kod kategorijskih (atributivnih) varijabli, modalitete obeleavati brojevima (muki pol=1, enski pol=2) 4. Ako je vrednost numerikog obeleja 0 ne ostavljati praznu eliju, ve upisati 0 5. Kod unoenja decimalnih brojeva, broj pisati sa zarezom, a ne sa takom. Dokaz da je broj pravilno uneen je da se on nalazi u desnoj strani elije. Podaci koji su u levoj strani tretirani su kao rei.

10

Grupisanje atributivnih obeleja

Grupisanje atributivnih (kategorijskih) varijabli vri se prikazivanjem u tabelama, preko apsolutnih i relativnih frekvencija. Najbolje objanjenje emo prikazati kroz primer: Primer: U ambulantama u gradu Niu je analizirano kojim se danoma najvei broj pacijenata javlja lekaru. Sakupljene su informacije iz 20 ambulanti i dobijeni sledei podaci: Ambulanta 1 2 3 4 5 6 7 8 9 10 Reenje: Dobijene podatke unesemo u list MS Excela na sledei nain: Dan Pon Uto Sreda etvrtak Sreda Petak Subota Nedelja Ponedeljak sreda Ambulanta 11 12 13 14 15 16 17 18 19 20 Dan Petak Subota Nedelja Ponedeljak sreda Sreda etvrtak Sreda Sreda sreda

11

Procedura se koristi za grupisanje podataka se naziva Histogram, koja pored grupisanja omoguava i grafiko prikazivanje podataka. Postupak je sledei: Na padajuem meniju Tools kliknemo miem na opciju Data Analysis i oznaimo Histogram, i kliknemo OK. Napomena: ukoliko se Data Analyse ne nalazi u padajuem meniju Tools, treba je ukljuiti tako to se klikne na Tools/Add-Ins i oznai Analysis ToolPak-VBA. Na ekranu se dobija sledei prozor:

U okvi Input Range unosimo adrese elija u kojima se nalaze sirovi podaci (B1:B21), a u Bin Range unosimo adrese elija sa modalitetima obelej akoje smo sami upisali (C1:C8). Oznaimo opciju Labels, jer smo uneli i adrese elija u kojima se nalaze naslovi (B1 i C1).

12

Pritisnemo OK i dobijemo sledei ispis:

Dani su prikazani brojevima od 1 do 7, gde je ponedeljak=1 a nedelja=7. Sledea kolona predstavlja apsolutne frekvencije, a trea kolona kumulativni procenat. Ukoliko je potrebno da pored apsolutnih frekvencija izraunamo i relativne potrebno je uraditi sledee: U eliju ispod druge kolone, izraunamo sumu. U novu kolonu upiemo znak %, to nam oznaava procentualnu (relativnu strukturu). U eliju ispod toga zadamo formulu za izraunavanje =F13/$F$21*100, ime zapravo apsolutnu vrednost frekvencije, delimo sa sumom i mnoimo sa 100. Znak $ unosimo kako bismo fiksirali eliju sa kojom delimo. Zadatu formulu u prvoj eliji, razvuemo do poslednje i tako zadamo izraunavanje relativne strukture za sve vrednosti.

13

Grafiko prikazivanje statistikih podataka

Grafiko prikazivanje rezultata je jako bitan element statitike analize, jer izmeu ostalog prua najeksplicitniji uvid u rezultate rada, i omoguava nam najbri i najpotpuniju sliku o analiziranim pojavama. Grafike prikaze moemo podeliti na: 1. Povrinske grafikone 2. Linijske dijagrame 3. Takaste i 4. Kartograme. Excel je svakako jedan od najboljih i najlakih programa za grafiko prikazivanje, to se nadam da emo i pokazati u narednim primerima. Primer 2. U decembarskom ispitnom roku polagalo je 200 studenata i rezultati su bili sledei:

Ocena iz statistike 5 6 7 8 9 10

Broj studenata 10 20 40 60 35 35

Dobijene podatke predstavi grafiki (krunim i tapiastim dijagramom)? Reenje: Podatke iz tabele unesemo u Excel kao na slici. Kliknemo na ikonu Chart Wizard na liniji sa alatima i dobijemo sledei prozor:

14

Izaberemo Pie (pitica), iz menija Chart Type i kliknemo Next. Dobijemo sledei prozor:

Oznaimo Columns i u Data Range unesemo celokupan sadraj radnog lista. Daljim pritiskom na Next, dobijamo dijaloge za definisanje naslova tabele i drugih ispisa, ali se mi zadravamo na ovom koraku, i pritiskamo Finish, i dobijamo krajnji oblik krunog dijagrama:

15

br st

5% 18% 10%

Ocena 5 Ocena 6 18% 20% Ocena 7 Ocena 8 Ocena 9 Ocena 10

29%

Na isti nain je mogue kreirati i druge vrste grafika, tapiaste, histograme itd, izabirom tipa grafika u prozoru Chart Type, to e praktino i biti demonstrirano na vebama iz medicinske statistike i informatike.

16

Zadaci za vebanje

1. Kod 30 ena odreivan je nivo jednog hormona. Dobijena su sledee vrednosti: 25,3 18,6 20,4 15 27,8 19,4 11 19,4 18,6 12,5 23,5 14 19,8 16,7 17,2 22,4 23,5 20 18,7 26,6 18,8 15,4 19,5 27 16,8 21 22,4 14,7 19,5 21,4 Srediti podatke u vidu distribucije frekvencije sa klasnim intervalima i prikai grafiki. 2. Na klinici za plastinu hirurgiju registrovan je broj opekotina razliitog stepana u toku jedne godine. Dobijeni su sledei podaci: I III II IV I I II III II II III IV IV I I I II III I II II II II III III I I I I I II III I I II I I I III II II I II I I I II I I II II I I III II II II I I I II III I Dobijene podatke srediti u prostu distribuciju frekvencije, grafiki prikazati podatke u vidu tapiastog i krunog dijagrama. 3. Dati su podaci o starosti pacijenata obelelih od hepatitisa A u Nikom regionu u toku 2008. godine. 33 34 29 31 43 35 37 19 41 24 47 19 32 30 48 43 27 37 34 34 28 39 29 38 27 33 41 37 38 33

Podatke srediti u distribuciju frekvencije sa klasnim intervalima, prikazati podatke tabelarno i grafiki. 4. U tabeli je prikazan broj prekida trudnoe u Srbiji u periodu od 2000 do 2007. godine. 2000 2001 2002 2003 2004 2005 2006 2007 Broj prekida trudnoe 23749 22356 24897 23678 25603 26645 25665 24273 Prikazati podatke grafiki i ocenite trend prekida trudnoe u datom periodu. U mikrobiolokoj laboratoriji praen je broj deca kolskog uzrasta sa urednim nalazom brisa grla. Utvreno je da je 130 devojica imalo uredan nalaz od ukupno 200 pregledanih. Od 250 deaka 176 imalo je uredan nalaz. Prikazi podatke u vidu tabela kontigencije i konstruii grafikon.

17

You might also like