You are on page 1of 10

Teorijske raspodele verovatnoe Sluajno promenljiva nastaje kada se odreenim sluajnim dogaajima dodeljuju brojevi ili atributi, to zavisi

od skale merenja, tako je da uz svaki dodeljeni broj ili atribut vezana neka verovatnoa. Dakle, neka varijabla x moe poprimiti k razliitih vrednosti (npr. vrednost glikemije moe biti 3,4; 5,6; 9,9mmol/l, .... do k). Ova varijabla postaje sluajno promenljiva ukoliko dobija pojedine vrednosti sa odreenom verovatnoom (npr. verovatnoa glikemije 5,6 u nekoj populaciji je 0,04). Raspodelu verovatnoe neke sluajno promenljive ine sve vrednosti koje ta varijabla moe imati, kao i njene pripadajue verovatnoe. Na taj nain se formiraju krivulje verovatnoe. U praksi najee ove krivulje nisu pravilnog oblika. Ukoliko uspemo da aproksimiramo neke empirijske vrednosti u neku teorijsku raspodelu, u mogunosti smo da vrimo najrazliitije procene i analize biolokih pojava. Znaaj primene teorijskih rasporeda se ogleda u tome jer su kod njih proueni svi elementi i sve osobine, a kod mnogih posmatranih rasporeda nisu uvek poznati svi elementi. Teorijske raspodele verovatnoe prikazane su razliitim matematikim modelima. One prikazuju nain na koji je ukupna verovatnoa raspodeljena na pojedine vrednosti sluajno promenljive. Zavisno od tipa sluajno promenljive teorijske rasodele verovatnoe dele se na: prekidne i neprekidne. Raspodele prekidne sluajno promenljive prikazuju se grafiki pologonom i tapiastim dijagramom, a raspodele neprekidne sluajno promenljive predstavljaju se krivom koja se naziva kriva gustine verovatnoe. Raspodele verovatnoe opisuje se najee odreivanjem najmanje dva deskriptivna parametra (npr. aritmetika sredina, standardna devijacija, varijanasa itd.). Najpoznatije teorijske raspodele su: binomni raspored, normalan raspored i Paissonov raspored. Osim ove tri teorijske raspodele esto se u praksi primenjuju i Studentov t-raspored, 2-raspored, Fisherov raspored. Binomni raspored Binomni raspored predstavlja tip prekidne teorijske raspodele. Prvi put je opisao vajcarski matematiar Jacob Bernoulli 1700. godine. Teorijski binomni raspored predstavlja raspored verovatnoa vrednosti prekidne sluajno promenljive dihotomnog, odnosno binomnog karaktera. Prekidna sluajno promenljiva moe da se rasporeuje po ovom matematikom modelu pod uslovom da ima dva meusobno isljuiva ishoda (npr. uspeh/neuspeh). Binomni raspored se zasniva na teoriji verovatnoe i zakonu velikih brojeva uz uslov da je p=0,5 i q=0,5, odnosno da je verovatnoa povoljnog i nepovoljnog dogaaja ista, tj. 50% i 50%. Primer za ovaj tip rasporeda je bacanje novia pri emu mogu da padnu pismo ili glava. Pismo i glava imaju podjednake anse da se padnu p=0,5 i q=0,5. Meutim, u praksi se retko deava da se 10 bacanja padnu 5 glava i 5 pisma. Dakle, nismo u mogunosti da predvidimo ishod dogaaja. Na ishod utiu razni sporedni faktori: nain bacanja, sila kojom je novi baen uvis, sam oblik i sastav novia itd. Ipak na

velikom broju pokuaja ishodi se pribliavaju svojim teorijskim verovatnoama i to je postulat teorije verovatnoe tj. Zakon velikih brojeva. Uz pomo matematikog obrasca moe se odredi verovatnoa oekivanog dogaaja koji e se desiti x puta iz n pokuaja. Matematiki obrazac za verovatnou nastanka x oekivanih dogaaja iz n pokuaja glasi: p (x;n)= p q

n x

n x

, x = x!(n x )!

n!

Simbol x predstavlja skraenicu za binomni koeficijent.

U kome je znak uzvika oznaka za faktorijel. Podsetimo se da faktorijel, na primer broja 5 iznosi: 5!=5x4x3x2x1. U praksi se esto radi radi lakeg odreivanja moguih kombinacija umesto binomnog obrasca, ije je izraunavanje sloeno koristi tzv. Paskalov trougao. Osnovni uslovi za primenu binomnog rasporeda: posmatrana sluajno promenljiva mora da bude binomnog karaktera pokuaji mora da budu meusobno nezavisni ili da uzorak bude sluajno odabran da svaki dogaaj ima istu verovatnou uspeha pri svakom pokuaju ili da svi lanovi posmatrane populacije imaju istu ansu da budu sluajno izabrani veliina uzorka n mora da bude zanemarljiva u odnosu na veliinu populacije N Binomni raspored je definisan pomou dva parametra, n i p. Sa n se oznaava broj jedinki u uzorku ili broj ponavljanja. Drugi bitan parametar koji definie ovaj raspored je p odnosno stvarna verovatnoa uspeha za svaku jedinku ili svaki pokuaj. Zato se binomni raspored simboliki predstavlja kao B(n,p). Aritmetika sredina binomne distribucije je vrednost sluajne varijable koju oekujemo ako posmatramo n jedinki ili pokuaj ponavljamo n puta, i iznosi np, a varijansa binomne distribucije iznosi np(1-p). Kada je n mala vrednost, distribucija je zakrivljena u desno ako je p<0,5 a ako je p>0,5 distribucija je zakrivljena u levo. Sa porastom veliine uzorka distribucija postaje vie simetrina. Binomna distribucija aproksimira normalnu distribuciju ako su joj vrednosti i aritmetike sredine i varjanse vee od 5. Normalan raspored Teorijska distribucija koja je nala najveu primenu u medicinskim istraivanjima je normalan raspored. Posebno pri zakljuivanju o osnovnom skupu na osnovu uzorka. Pripada tipu neprekidnih teorijskih rasporeda, tj. raspodela verovatnoe kontinuirane sluajno promenljive.

Normalan raspored je prvi prouavao francuski naunik Abraham de Moivre (1667-1745). Naziv je dobio po nemakom nauniku Karlu Friedrichu Gaussu (17771855), koji je prouavao greke merenja. Normalan raspored je karakteristian za numerika neprekidna obeleja. Grafiki se normalan raspored prikazuje Gausovom krivom. Osobine normalne krive: 1. Po svom obliku normalan raspored je predstavljen kontinuiranom krivom zvonastog oblika, koja je unimodalna. 2. Protee se od + do , asimptotski se pribliava x osi; tako da je interval krive konaan. 3. Simetrina je u odnosu na aritmetiku sredinu. Znai da se 50% veih vrednosti nalazi levo od x , a 50% manjih vrednosti nalazi desno od x . Oko aritmetike sredine se koncetrie najvei broj vrednosti, a ekstremne mala i ekstremno velike vrednosti imaju najmanju frekvenciju. 4. Kako je kriva simetrina aritmetika sredina je jednaka medijani odnosno modu: x =Me=Mo. 5. Normalan raspored je definisan x , SD. Za svaki niz za koji je odreen x , SD mogue je konstruisati krivu. Aritmetika sredina odreuje mesto zvona u koordinatnom sistemu, a standardna devijacija odreuje nagib krive, tj. take pregiba krive. 6. Povrina ispod normalne krive koja je ograniena x-osom izjednaava se sa 1, odnosno sa 100% 7. Za ovaj raspored vae sigma pravila: U intervalu od 1SD u odnosu na aritmetiku sredinu nalazi se 68,27% svih vrednosti. Dakle u ovom intervalu se nalazi: P( x -1SD<x> x +1SD)=0,6827=68,27% U intervalu od 2SD u odnosu na aritmetiku sredinu nalazi se 95,47% svih vrednosti. Dakle u ovom intervalu se nalazi: P( x -2SD<x> x +2SD)=0,9546=95,46% U intervalu od 3SD u odnosu na aritmetiku sredinu nalazi se 99,73% svih vrednosti. Dakle u ovom intervalu se nalazi: P( x -3SD<x> x +3SD)=0,9973=99,73%

Sve vrednosti sluajno promenljive nalaze se u okviru 6 standardnih devijacija, van ovog intervala ostaje zanemarljiv broj vrednosti (po 0,15% od intervala + do ). Na osnovu ove osobine normalna raspodela moe da se koristi kao aproksimacija svih ostalih rasporeda. 8. Ukoliko se povea aritmetika sredina krivulja se pomera udesno, ukoliko se smanji pomera se ulevo. Ukoliko se povea SD, krivulja se sniava i iri, ukoliko se smanjuje SD, krivulja je vea i ua. Slika ilustruje upravo oblike normalnog rasporeda definisane za razliite parametre x i SD. 9. Ako sluajno promenljiva x ima normalan raspored, tada e i njena lienarna transformacija y=a+bx, takoe imati normalan raspored i suma n nezavisnih promenljivih ima normalan raspored.

Slika. Oblici normalnog rasporeda u zavisnosti od vrednosti aritmetike sredine i standardne devijacije.

Standardizovan normalan raspored Obzirom da je svaka Gausova kriva odreena aritmetikom sredinom i standardnom devijacijom, potrebno je da se za svaki niz podataka konstruie kriva to zahteva dobro poznavanje matematikih modela. Kako bi se upotreba ove krive uinila jednostavnijom definisan je standardizovan normalan raspored. Standardizovan normalan raspored definisan je x =0, SD=1. Osobine standardizovanog normalnog rasporeda iste su kao i kod normalnog rasporeda. Ako podatke koji karakteriu standardizovan normalan raspored zamenimo u formuli za z vrednost: 4

x x x0 = =x 1 SD dobiemo standardizovane vrednosti sluajno promenljive. z= Na osnovu ovoga formirane su tablice verovatnoe odgovarajuih povrina. U tabeli Povrina ispod normalne kriva date su vrednosti funkcije rasporeda standardizovane normalne promenljive. U pretkoloni su date vrednosti z od 0 do 5. U sredinjem delu tabele su date vrednosti povrine ispod normalne krive izmeu 0 i date z vrednosti. Obzirom da je jedna od osobina ovog rasporeda simetrinost, jednake su povrine izmeu 0 i z , kao i izmeu -z i 0. Ako elimo da odredimo kolika je povrina tj. verovatnoa za z=0,25 onda u prekoloni naemo vrednost 0,2, a u zaglavlju vrednost 5 (oznaava drugu decimalu), na njihovom preseku oitamo vrednost 0987. Kako se verovatnoa oznaava ili od 0 do 1, ili u procentima. Oitanu vrednost moemo pisati kao 0,0987 ili 9,87%.

z= x x
SD

Druga decimala 5 6 7 8 9 0000 0040 0080 0120 0160 0199 0239 0279 0319 0359 0398 0438 0478 0517 0557 0596 0636 0675 0714 0753 0793 0932 0871 0910 0948 0987 1026 1064 1103 1141 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 0 1 2 3 4

0,0 0,1 0,2 0,3 ... ...

U sluaju kada elimo da na osnovu verovatnoe odredimo z vrednost onda je potrebno da datu verovatnou podelimo sa 2, zbog osobine da su jednake povrine izmeu 0 i z , kao i izmeu -z i 0. Tako za p= 40%, podelimo datu vrednost sa 2, i potraimo u tablici najbliu vrednost. Za p = 40% (p =0,4000) z =0,52. Primer. Pretpostavimo da je prosena visina studenata medicine je 170, a SD=5, i da je rasporeena u vidu normalnog rasporeda. x =170, SD=5. a) Koji procenat studenata ima visinu od 170 do 180cm? Obzirom da je jedna od vrednosti jednaka x , onda je potrebno odrediti z vrednost samo za 180cm x x 180 170 z= = = 2 , za z = 2, p = 47,72% SD 5 Zakljuujemo da 47,72% studenata ima visinu od 170 do 180cm. b) Koji procenat studenata ima visinu od 162 do 172cm?
5

Potrebno je odrediti dve z-vrednosti, tj. za svaku visinu svoju z-vrednost. x x 162 170 = = 1,6 , za z = -1,6 p1=44,52% h1=162, z1 = SD 5

x x 172 170 = = 0,4 , za z = 0,4, p2 = 15,54% SD 5 p = p1 + p2 = 44,52% + 15,54% = 60,06% c) Koji procenat studenata je nii od 160? x x 160 170 = = 2 , za z = -2, p1=47,72% h1=160, z1 = SD 5 Dobijena verovatnoa pokazuje da se u intervalu od 160 170 nalazi 47,72% studenata, kako bi odredili procenat koji je nii od 160 potrebno je da oduzmemo odreenu verovatnou od 50% p= 50% - 47,72% = 2,28%
h2=172, z 2 =

Studentov t - raspored Studentov t raspored je otkrio Vilijam Goset, hemiar i statistiar zaposlen u Ginisovoj pivskoj kompaniji. Smatrao se studentom koji jo uvek ui statistiku, tako da je svoje radove potpisivao pod pseudonimom student, ili je moda koristio pseudonim zbog Ginisovih ogranienja o tajnama zanata. Kod malih uzoraka simbol z-vrednost se zamenjuje simbolom t-vrednost. Njegova formula je: t=

x uz x os x uz x os = SDuz SG n 1

Sutinska razlika izmeu t-vrednosti i z-vrednosti je u tome to u izrazu: t=

xuz x os SDuz n 1
SDuz n 1
.

sluajno promenljive predstavljaju i x uz x os i

U sutini standardna greka predstavlja ovde sluajno promenljivu, jer zavisi od veliine uzorka, samim tim t-vrednost zavisi od veliine uzorka, dok to nije bio sluaj sa z-vrednou, jer je standardna greka bila konstantna, pa z-vrednost nije zavisila od veliine uzorka. Aritmetike sredine jednakih uzoraka, ali manjih od 30 jedinica rasporeuju se oko aritmetike sredine osnovnog skupa, po posebnom t-rasporedu, tako da t-vrednost zavisi od veliine uzorka. Postoje razliite vrste t distribucija, to je klasa distribucija.

Kriva t-rasporeda je simetrina i u obliku zvona kao kod normalnog rasporeda, unimodalna, definisana je od minus do plus beskonano. Ipak, irenje je vee, dakle kriva je ira i spljotenija u odnosu na normalni raspored. Kada se govori o odreenoj t distribuciji, mora se odrediti stepen slobode. Sa porastom broja stepena slobode, t raspored blii normalnom rasporedu.

Na slici je grafiki prikazana razlika izmeu t-rasporeda i standardizovanog normalnog rasporeda. Za male uzorke za ocenu intervala ne mogu da se primene tablice normalnog rasporeda, ve posebne Student-ove tablice t-rasporeda. irina krive uslovljava da se na nju ne moe da primeni sigma tri pravilo, tj. da se u intervalu t= 0 1,96 SG nalazi 95% t-vrednosti. Ovaj procenat t-vrednosti se nalazi u znatno irem intervalu, a veliina intervala zavisi i od veliine uzorka: to je uzorak manji to je irina intervala vea.

za uzorak od 2 jedinice u intervalu: x os 12,71SG za uzorak od 4 jedinice u intervalu: x os 3,18 SG za uzorak od 10 jedinica: x os 2, 26 SG za uzorak od 20 jedinica: x os 2,09 SG za uzorak od 30 jedinica: x os 2,04 SG

Na osnovu iznetih osobina Studentovog t-rasporeda uraene su posebne tablice za granine t-vrednosti za odgovarajuu verovatnou i broja stepena slobode. Kod uzoraka veih od 30 jedinica i za odgovarajuu verovatnou t-vrednost se izjednauje sa z-vrednou, a Studentov t-raspored zadobija oblik standardizovanog normalnog rasporeda. Iz ovog se moe zakljuiti da tablice Studentovog t-rasporeda mogu da se primenjuju za ocenu intervala pouzdanosti aritmetike sredine osnovnog skupa i na osnovu malih uzoraka (n<30 jedinica) i na osnovu velikih uzoraka (n>30). Odnosno da se t-raspored 7

mora koristiti pri radu sa malim uzorcima, a da je njegovo korienje preporuljivo pri radu sa velikim uzorcima. U tabeli su prikazane osnovne razlike izmeu z i t-vrednosti. Razlike izmeu Z i t vrednosti Udaljenost sluajno promenljive od X izraena u jedinicama SD Ako je X =0 a SD=1, Z se rasporeuje oko Z=0 u vidu standardizovanog normalnog rasporeda U intervalu Z=0 3SD nalazi se 99,73% svih Z vrednost Za odgovarajuu P, Z se odreuje na osnovu tablica normalnog rasporeda. Z=1,64 za P=0,90 Z=1,96 za P=0.95 Z=2,58 za P=0.99 Testovi zasnovani na Z vrednosti primenjuju se samo za velike uzorke n>30. Hi- kvadrat raspored 2 distribucije je neprekidnog karaktera. Na osobinama 2 rasporeda bazira se zakljuivanje prilikom korienja 2 testa. Tipian grafik gustine ovog rasporeda prikazan je na slici. Osnove karakteristike Hi kvadrat rasporeda: Raspored je definisan u oblasti od 0 do +; Kriva rasporeda nije simetrina, meutim sa poveanjem broja modaliteta posmatranog obeleja (sa poveanjem broja stepena slobode) Hi kvadrat raspored se pribliava normalnom rasporedu. Za svaki stepen slobode postoji i odreen Hi kvadrat raspored i kritine oblasti prihvatanja ili odbacivanja nulte hipoteze. Odnos izmeu razlike i SG te razlike t-vrednost se oko t=0 ne rasporeuje u vidu standardizovanog normalnog rasporeda, ve u vidu specifinog trasporeda U intervalu t=0 3SD nalazi se manje od 99,73% t-vrednosti. Za odgovarajuu P i SS t se odreuje na osnovu studentovih tablica trasporeda. Sa poveanjem n, t se pribliava Z i sa n>30 izjednaava se sa Z. Testovi zasnovani na t-vrednosti mogu se primenjivati i na male i na velike uzorke.

S.S.=3 S.S.=4 S.S.=5 S.S.=6

2 0 +

Tumaenje realizovane vrednosti 2 testa vri se na osnovu tablica kritinih vrednosti 2 distribucije.

Zadaci za vebanje 1. Kod 30 dijabetiara na klinici za endokrinologiju u Niu odreivan je nivo glikemije, dobijene su sledee vrednosti: H F 6,2 7,49 6 7,5 8,79 7 8,8 10,09 4 10,1 11,39 4 11,4 12,69 6 12,7 13,99 3 30 Sa verovatnoom od 95% odredi kolika je prosena glikemija kod svih dijabetiara u Niu. 2. U nikom Klinikom centru proseno leenje bolesnika je 50 dana ( x =50) i SD=5. Izraunati: Koji procenat bolesnika je leen manje od 25 dana? Koji procenat bolesnika je leen od 45 do 55 dana? Koji procenat bolesnika je leen vie od 70 dana? Koji procenat bolesnika je leen od 20 do 30 dana? Kako je niki kliniki centar referentna zdravstvena ustanova u zemlji, proceniti kolika je prosena duina leenja u svim klinikim centrima u Srbiji sa verovatnoom od 95%?

10

You might also like