Sadržaj

1. Uvod u Excel ..............................................................................................................................2 1.1. Startovanje Excela...............................................................................................................3 1.2. Radno okruženje.................................................................................................................3 1.3. Radni papir i ćelija..............................................................................................................3 1.4. Upisivanje i kretanje po ćelijama .....................................................................................5 1.5. Formatiranje ćelija ..............................................................................................................6 1.6. Formatiranje decimalnih brojeva .....................................................................................6 1.7 Menjanje boje pozadine i teksta ćelije..............................................................................7 1.8 Podešavanje širine i visine ćelija. Ubacivanje i izbacivanje redova i kolona ..............7 1.9 Spajanje ćelija .......................................................................................................................8 1.10 Uokvirivanje ćelija.............................................................................................................8 1.11 Premeštanje i kopiranje ćelija ..........................................................................................9 1.12 Snimanje i zatvaranje dokumenta.................................................................................10 1.13 Otvaranje novog i postojećeg dokumenta ...................................................................10 1.14 Rad sa formulama ...........................................................................................................10 1.15 Fiksiranje ćelija u formulama.........................................................................................11 1.16 Grafikoni...........................................................................................................................12 2. Funkcije raspodele u Excelu ..................................................................................................15 2.1. Binomna raspodela...........................................................................................................16 2.2. Poasonova raspodela .......................................................................................................21 Srednja vrednost i disperzija .............................................................................................21 Aproksimacija binomne raspodele Poasonovom ...........................................................21 2.3. Normalna raspodela ........................................................................................................26 3. Empirijska raspodela u Excelu ..............................................................................................34 3.1. Osnovni pojmovi .........................................................................................................35 3.2 Empirijska raspodela ..................................................................................................37 Intervalno sređivanje podataka.........................................................................................41 4. Intervalne ocene parametara .................................................................................................47 raspodele.......................................................................................................................................47 4.1 Ocena srednje vrednosti normalne raspodele sa poznatom disperzijom ..............48 4.2 Ocena srednje vrednosti normalne raspodele nepoznate disperzije ........................53 5. Analiza korelacije ....................................................................................................................59 5.1 Uzorački koeficijent korelacije.........................................................................................62 5.2 Regresione prave ...............................................................................................................65 5.3 Provera značajnosti korelacije .........................................................................................68 5.4 Interpretacija koeficijenata korelacije .............................................................................70 6. Regresiona analiza...................................................................................................................72

6.1 Metod najmanjih kvadrata...............................................................................................75 6.2 Srednje kvadratno odstupanje empirijske formule ......................................................77 6.3 Koeficijent determinacije ..................................................................................................77 6.4 Određivanje pravolinijske zavisnosti .............................................................................78 6.5 Intervali poverenja odsečka i nagiba ..............................................................................86 6.6 Testiranje hipoteza u vezi sa odsečkom i nagibom .....................................................89 6.7 Linearizovane dvoparametarske empirijske formule.................................................90 Literatura ....................................................................................................................................100

1

1. Uvod u Excel

2

1. a zatim kliknuti na Microsoft Excel. Svaki dokument sa kojim se radiu Excelu naziva se naziva se sveska ili knjiga (eng. Ukoliko ikone programa nema na desktopu tada je Excel potrebno pokrenuti prko Start menija. 3 . menija Programs. Traka za formulu (Formula Bar) je traka gde se unosi formula za ćeliju sa kojom radimo. snimanje dokumenta. Pord toga u statusnoj liniji možemo videti da li je uključeno prekucavane. Osnovna osobina vršenja takvih proračuna na računaru je da se izmenama određenih podataka menjaju i vrednosti koje su zasnovane na njima. Paleta standard (Standard Toolbar) ili paleta sa standardnim alatkama se nalazi ispod trake sa menijima i sadrži najčešće korištene alate iz menija (novi dokument. Enter (unos u ćeliju). određivanje vrste. jedan za grafike itd. 1. Da bi se odvoile značajne celine u okviru jendog dokumenta koriste se radni papiri. Startovanje Excela Microsoft Excel je program za tabelarna proračunavanja. poravnavanja teksta . veličine i boje slova.1. otvaranje. Dakle. Dupli klik mišem na ikonu Microsoft Excel i program je pokrenut. Book). štampanje dokumenta i slično). Radno okruženje Radno okruženje Excel-a čine : Naslovna linija (Title Bar) – se nalazi na samom vrhu ekrana i tu se nalazi ispisano ime dokumenta s kojim se trenutno radi i ime programa. koji čine knjigu. Radni papir i ćelija Radni papir (eng.. Cell) su osnovni elementi rada u Excelu..3. jedan radni papir može da se koristi za proračun. Traka sa menijima (Menu Bar) – se nalazi odmah ipod naslovne linije i u njoj se nalaze meniji u kojima su grupisani razni alati. Worksheet) i ćelija (eng. Startovanje Excel-a se vrši preko ikone na desktopu. kucanje velikih slova itd. itd. Klizači omogućavaju pomeranje papira kako bi se videle sve ćelije.2.1. Statusna linija (Status Bar) opisuje u svom levom uglu stanje u kom se nalazi programReady (spreman za rad). Paleta Format (Formatting Toolbar) ili paleta za formatiranje sadrži alate koji se koriste za formatiranje teksta.

Otvara se novi prozor u kome se sa OK potvrđuje brisanje. 4 .1.vrši se preko padajućeg menija Insert. ako se pritisne desni taster miša na bilo koju od kartica postojećih radnih papira. broj. u novootvorenom prozoru dovoljno je kliknuti OK. Uklanjanje radnog papira – vrši se pritiskom desnog tastera miša na karticu radnog papira koji treba obrisati. opcije Worksheet. Ćelije se u Excel-u mogu povezivati tako da jedna zavise od druge i na taj način formirati formule po kojima se računaju vrednosti.Slika 1. dok se sa Cancel prekida. i u novootvorenom meniju bira se opcija Delete. Otvara se novi meni u kome se odabira opcija Insert. Ili. procenti. Sam radni papir sastavljen je od ćelija. i za svaku od njih može se definisati tip (tekst. Ubacivanje novog radnog papira. koje se nalaze iznad statusne linije. valuta. datum). Svaka ćelija može sadržati tekst ili brojeve.

recimo A70 u pritisnuti OK i kursor će se naći na navedenom mestu. Excel sam rapspoznaje određene tipove podataka. Upisivanje i kretanje po ćelijama Da bi se podatak u određenu ćeliju potrebno je da se levim tasterom miša klikne na nju.4. Pritiskom na bilo koji taster sa tastature počinje unos podataka u selektovanu ćeliju. Međutim u kompleksnijim tabelama koje prelaze jednu stranu radnog papira lakše je nekad direktno otići na željenu ćeliju. ili taster Shift. Otvara se prozor kao sa slike. U novom prozoru u polju Go To dovoljno je ukucati poziciju ćelije. 5 . Polje To Book govori u koju knjigu (dokument) se premešta radni papir. Na kraju se sa OK potvrđuju odabrane opcije. 1. Ćelija postaje uokvirena crnim pravougaonikom. Premeštanje i kopiranje radnog papira. Moguće je obrisati i više ćelija odjednom tako što se prvo sve selektuju. Za to se koristi padjući meni Edit i opciju Go To. Nakon ukucavanja teksta dovoljno je pritisnuti Enter ili strelicama pomeriti kursor na neku drugu ćeliju. a zatim se pritisne taster Delete. držeći taster Control – za pojedinačno selektovanje. Nakon tog upisuje se novo ime i pritisne taster Enter. Brisanje teksta iz ćelije se vrši ozmačavanjem ćelije koja se briše a zatim se pritisne taster Delete.ponekad je potrebno promeniti redosled radnih papira. Pritisne se desni taster miša na karticu radnog papira čije se ime menja. Sekektovanje radnih papira – kada je potrebno obrisati više radnih papira ili se nad njima vrše neke izmene. Za to se koristi opcija Move or Copy. kao na slici gore. Selektovanje se vrši pritiskom na levi taster miša na kartice radnih papira koje se nalaze iznad statusne linije. Opcije move to end papir šalje na kraj knjige (dokumenta).za selektovanje susednih radnih papira. Polje Before Sheet ukazuje na to pre kog radnog papira želimo da postavimo odabrani radni papir.Menjanje imena radnog papira – koristi se isti meni kao i prethodne dve operacije. Pomeranje kurora na određenu ćeliju najlakše je izvršiti klikom levog miša na tu ćeliju. Otvara se prozor kao sa slike. a zatim u novootvorenom meniju klikne na Rename. potrebno ih je prvo označiti – selektovati. Ukoliko je otkačeno polje Create a copy biće napravljena kopija radnog papira.

poslednje dugme služi za spajanje ćelija u jednu i centriranje teksta koji se nalazi u njima u sredinu. Odabirom kartice Alignment pojavljuje se prozor kao na slici. zakrivljenje ili podvlačenje teksta. U polju Category pojavljuje se lista mogućih tipova podataka u ćeliji. 6 . Ako je otkačeno Wrap Text tadaće tekst ukoliko ne može da stane u ćeliju biti prelomljen u dva ili više redova. 1. Podešavanje tipa ćelije. vrste slova i veličine. u sredinu i desno. i u ovoj opciji moguće je birati zapis broj kao i broj decimalnih mesta. Merge Cells služi za spajanje ćelija. Veoma bitne su stavke pod poljem Text Control. 2. U padajućem meniju Format odabere se opcija Format Cells. tekst. Nakon pokretanja ove opcije otvara se prozor kao sa slike. Formatiranje ćelija Formatiranje ćelija podrazumeva podešavanje tipa ćelije (broj. U polju Sample vidi se kako će izgledati podatak nakon promene tipa. Za to se koriste ikone .5. koristeći Tekst je moguće iskoristiti i za podebljanje. Horizontalno poravnanje moguće je izvršiti iz Palete Format koristeći koji redom centriraju tekst levo. To se radi na sledeći način: 1. Podešavanje slova u ćeliji – veličina i tip slova može se desiti preko Palete Format za promenu tipa slova i za promenu veličine slova. Polje Orientation nudi mogućnost da se tekst okreće u ćeliji pod određenim uglom.1. minute. Time predstavlja vreme i bira se načina zapisa vremena.6. Označi se ćelija ili ćelije kojima se određuje broj decimala. Polje horizontal predstavlja horizontalno poravnanje. Ukoliko je otkačeno polje Shrink to fit tada će veličina slova biti smanjena tako da tekst staje u ćeliju. Nekoliko bitnih tipova su : Numberpredstavlja broj. kod nas je na primer dd-mm-yyyy (danmesec-godina).većina gore navedenih podešavanja vrši preko padajućeg menija Format opcije Cells. kao i nekoliko drugih opcija. Formatiranje decimalnih brojeva Kod unosa brojeva može se unapred odrediti željeni broj decimala. nameštanje poravnanja. sekunde). preko polja indent moguće je postaviti koliko će tekst biti omeren od leve ivice ćelije. Poravnjanje teksta u ćeliji – poravnanje teksta se vrši kako horizontalno tako i vertikalno. Date – predstavlja datum. Vertikalno poravnanje kao i horizontalno vrši se preko opcije Format Cells iz padajućeg manija Format. bira se zapis datuma. datum ili valuta). koristi se i Custom koji predstavlja korisnički tip. kod nas hh:mm::ss (sati.

i time je bojenje pozadine završeno. Odabira se boja za popunjavanje pozadine selektovanih ćelija.3. pojavljuje se prozor kao na slici. a na drugu smanjuje. Ubacivanje i izbacivanje redova i kolona Širina kolone se podešava tako što : 1. 3. 7 . 2. 2. Boja teksta u ćelijama menja se na sledeći način: 1. ako se otkaći polje Use 1000 separator koristiće se razdvajanje preko 1000 sa zarezom a u polju Negative number bira se izgled negativnog broja. Označi se ćlija čija se boja teksta menja. Kursor miša postavlja se na ivicu polja sa imenom kolone označene slovom iznad ćelija. Na kraju se pusti levi taster miša. U prozoru kao na slici odabere se nova boja teksta u ćelijama 1.7 Menjanje boje pozadine i teksta ćelije Boja pozadine ćelija menja se na sledeći način: 1. Označi se ćelija čija se boja pozadine menja. Kursor miša postaje vertikalna crna crtica sa strelicama na gore i dole. U polju Decimal places bira se broj decimala. Brojevima u označenim ćelijama pritiskom na prvu ikonicu povećava se broj decimala. Držeći pritisnut levi taster miša pomera se širina kolone B koliko je potrebno.8 Podešavanje širine i visine ćelija. Kursor miša postaje crna uspravna linija sa strelicama u levo i desno. Levim tasterom miša pritisne se crna sterlica pored ikone kantice u Paleti Format. 1. U kartici Number u polju Category. Kursor miša postavlja se na ivicu polja sa brojem reda levo od ćelija. 3. odabere se Number. tada se pojavljuju opcije kao na slici. 4. Decimale se mogu nameštati i preko ikonica iz palete Format. Levim tasterom miša pritisne se na crnu strelicu pored ikone . 3. Visina reda menja se na sličan način: 1. 2.

3. dva i tri. miš se povlači na gore il na dole smanjujući ili povećavajući tako visinu reda. Red se dodaje tako što: 1. a zatim se u kartici alignment otkači polje Merge Cells. Nakon nameštanja pušta se levi taser miša. Kursor se pozicionira u ćeliju koja pripada redu iznad kojeg se ubacuje novi red. 1. 2. Selektuju se ćelije koje treba spojiti. U padajućem meniju Format odabere se Format Cells. Ponekad se pogrešno spoje ćelija pa je potrebno spojene ćelije vratiti u stanje gde je svaka za sebe. Držeći pritisnut levi taster miša. sve kolone desno od nje premeštaju se ulevo za jedno mesto. 2. bira se kartica Border.9 Spajanje ćelija Spajanje ćlija podrazumeva spajanje više ćelija u jednu ćeliju. 2. te tanke linije pri štampanju neće biti vidljive. u Format Cells u kartici Alignment isključi se otkačeno polje Merge Cells. Da bi se linije tabele naglasiel potrebno je selektovati ćelije čiji okvir se menja i preko padajućeg menija Format Cells. Nakon toga ako je obrisana kolona. 2. Primer spojenih ćelija.2. U novotvorenom meniju odabere se opcija Delete. Spajanje se vrši: 1. U padajućem meniju Insert odabere se opcija Rows.10 Uokvirivanje ćelija Iako je radni papir podeljen na ćelije i između njih postoje linije. 3. nakon 8 . a u slučaju brisanja reda za jedno mesto se premeštaju redovi ispod obrisanog reda. Odabir se potvrđuje sa OK. Kolona se dodaje tako što: 1. a zatim u padajućem meniju Format. Desnim tasterom miša klikne se na ime kolone ili broj reda. 1. to se radi tako što se označi ćelija nastala spajanjem. bila bi polja jedan. Kursor se pozicionira u ćeliju koja pripada koloni ispred koje se ubacuje nova kolona. u prikazanoj tabeli . Brisanje kolone ili reda vrši se tako što: 1. U padajućem maniju Insert odabere se opcija Columns.

Koristeći opciju Cut iz Palete Standard umesto Copy ćelije bi bile premeštene. nakon toga 3. i tada bi kursor trebalo da se pretvori u belu strelicu. 1. Ćelije se kopiraju na sledeći načn: 1. Pusti se levi taster miša Na ovaj način podaci se više ne nalaze u ćelijama u kojima su bili već samo u onima u koje su premešteni. i ćelije se pojavljuju na papiru. Pritisne se dugme Copy iz Palete Standard. a oko zapamćenih ćelija se pojavljuje trepćući okvir. 2. Ako podaci treba da ostanu i da se pojave u novim ćelijama tada se koristi kopiranje ćelija. Polje Border koristi se i kada nisu potrebne samo spoljne ivice uokvirene. U polju Presets bira se None da bi ćelije bile bez okvira a Outline da bi se uokvirile spoljne ivice. ali bi mogle više puta sa opcijom Paste da se „ispuštaju“ u dokument. čime su selektovane ćelije zapamćene u memoriji računara. Držeći pristisnut levi taster miša pomeraju se selektovane ćelije na mesto na koje se trebaju premestiti. Pritiskom levog tastera miša.čega se otvara prozor kao na slici. negde oko crne tamne linije. već možda i iscrtane unutrašnje ili dijagonalne linije. 4. Kursor miša se pomeri na ivicu selekcije. Selektuju se ćelije koje treba kopirati. 9 . Selektuju ćelije koje treba premestiti. Nakon puštanja levog tastera ceo označeni deo biće popunjen prethodno selektovanim delom. Pritisne se dugme Paste iz Palete Standard. 2. Klikom na dugme koje prikazuje pravac linije uključuje ili isključuje iscrtavanje linija tog pravca. ne puštajući ga može se razvući selektovani deo. Ćelije je moguće iskopirati i koristeći mali crni kvadrat u donjem desnom uglu selekcije. 4. Levim tasterom miša klikne se na ćeliju gde treba da se nađu kopirane ćelije. i boja linije. U polju Line bira se vrsta linije kojom se iscrtavaju okviri. 3.11 Premeštanje i kopiranje ćelija Premeštanje ćelija se vrši tako što se: 1. Ako se kursor miša postavina taj mali crni kvadrat on se pretvara crnu strelicu.

Ovim je operacija snimanja dokumenta završena. Aktiviranje formule se izvodi tako što se označi ćelija u koju treba ukucati formulu i pritisne znak = na tastaturi.14 Rad sa formulama Najnznačajniji deo Excel-a. odnosno pod kojim imenom da se snimi na hard disk (ili diksketu). a najčešće se to vrši klikom na u gornjem desnom uglu prozora. Ako treba otvoriti već postojeći dokument. Ako je dokument koji se snima već ranije snimljen pod tim imenom onda se snimanje obavlja automatski. 1. 1. ili opcija Open iz padajućeg menija File. traži najveće vrednosti kao i mnogo toga drugog.1. Time je Excelu naznačeno da će ova ćelija biti upotrebljena za formulu. U polju File name treba upisati ime dokumenta i potom kliknuti na dugme Save. koji se nalazi na disku računara koristi se ikona Open iz palete Standard. ili opciju New iz padajućeg menija File. a može se napraviti i novi folder za ovaj dokument klikom na ikonu Create New Folder.12 Snimanje i zatvaranje dokumenta Ako dokument treba sačuvati da bi se kasnije koristio trebalo bi ga snimiti na hard disk. Zatvaranje dokumenta Dokument u Excelu se može zatvoriti na više načina. samo odabirom opcije Save iz File menija. Excel izračunava prosek. Ako je to prvi put da se snima taj dokument u kojem se traži da se unese ime tog dokumenta. U polju Save in može se izabrati folder u koji treba smestiti dokument. Drugi način za zatvaranje aktivnog dokumenta je da se izabere operacija Close iz padajućeg menija File. Snimanje dokumenta se vrši tako što se iz padajućeg menija File izabere Save. Ako je potrebno otvoriti novi prazan dokument. U principu rad sa svim formulama je sličan. koristi se ikona New Blank Document iz Palete Standard. Menja se izgled trake za fomule (formula bar) koja se nalazi ispod Palete format. Pomoću njih se povezuje više ćelija.13 Otvaranje novog i postojećeg dokumenta Prilikom svakog startovanja Excel-a otvara se i nova prazna sveska u kojoj se može započeti rad. crna strelica služi za odabir nekih funkcija 10 . Sa leve strane pojavljuje se dugme sa funkcijama. suština njegovog korišćenja jesu formule.

Zatim se obeleži ta ćelija. nakon toga se obeleži ostatak kolone B koji treba popuniti. klikne se na ikonicu Copy iz palete Standard.služi za poništavanje formule. i na kraju se klikne na ikonicu Paste iz palete Standard.15 Fiksiranje ćelija u formulama Ponekad je potrebno pri kopiranju formula da neke ćelije ostaju fiksirane. Neka je konstanta upisana u ćeliju B1. onda se u koloni C prilikom sabiranja ćelija B1 mora "fiksirati" . Polje ukucane formule (umesto čega se jednostavno može pritisnuti Enter na tastaturi). a zatim se formula kopira na ostale ćelije. 1. tj. 273. 11 . npr. Ukoliko treba po nekoj formuli izračunati vrednosti za niz podataka to se radi na sledeći način: Ako na primer treba pomnožiti sve podatke iz kolone A sa 10. u ćeliji B1 napiše se formula. Na taj način se naravno mogu kopirati i bilo koje druge formule. mora se staviti znak $ ispred oznake kolone i ispred oznake reda (kao na slici). Recimo da sve elemente kolone A treba sabrati sa nekom konstantom. a polje za potvrdu koje se često koriste.

Podrazumeva se da je potrebna tabela na osnovu koje se crta grafik. Klikom na jedan od podtipova bira se izgled grafika. Izrada grafika može se pokrenuti preko padajućeg menije Insert. kao i šta se nalazi na x. Klikom na bilo koji član liste polja Chart Type u polju Chart sub-type prikazuju se podtipovi ovog tipa. Druga stavka je Series. tj. 12 . U novom prozoru pojavaljuju se dve kartice. Ovo je prvi od četiri koraka koji se sprovode pri ubacivanju graika u radni list. pomoću koje se određuju serije na grafiku. Data range označava mesto na kome se podaci nalaze. koliko će serija biti. opcije Chart ili preko dugmeta u paleti Standard. Oni na jednostavan i jasan način prikazuju rast ili pad vrednosti i odnose među njima.1. U prvom koraku bira se vrsta grafika. Otvara se prozor kao naslici.16 Grafikoni Za grafičko predstavljanje tabela urađenih u Excel-u koriste se grafikoni. Za prelazaka na sledećei korak treba kliknuti na Next. Klikom na Next prelazi se na sledeći prozor. a šta na y osi. Postupak predstavljanja grafikon na radu stranu Excel-a sastoji se iz više koraka.

Left. Right). Top. 13 . Kartica Data Table omogućava prikazivanje dodatne tabele sa poacima koji se nalaze na grafiku. Jedna je da se ovako napravljeni grafik ubaci kao objekat u određeni radni list ili da se grafikon ubaci u novi radni list. Ako je sve podešeno treba kliknuti na Finish i grafikon je na radnom listu. odnostno da li da se prikazuju i male (Minor gridlines) i veće (Major gridlines). Nakon podešavanja svi ovih opcija da bi se prešlo na poslednji prozor za unos grafika treba kliknuti na Next. Kartica Gridlines omogućava da se uključi/isključi mrežu ose. Kartica Legend podešava legendu. naziva osa – polja Value(X) axes i Value(Y) axes. Na svaki od prethodnih prozora može se vraćati na klikom na dugme Back. Kartica Axes omogućava da se uključi/isključi prikazivanje osa. Poslednji prozor nudi samo dve mogućnosti.U novom prozoru prva kartica Title služi za podešavanje ili ubacivanje naziva grafika – polje Chart Title. ako je označeno polje Show Table. Ukoliko je onačeno polje Show Legend tada se u poljima ispod bira pozicija legende (Bottom. Kartica Data Labels omogućava da uključi prikazivanje vrednosti na samom grafiku. i ako je uključeno omogućava da se bira gustina. Corner.

Grafik se može pomerati tako što se kursor dovede na deo ekrana koji on zauzima i pritisne se levi taster miša, ne puštajući ga vuče se miš i grafik do mesta na kome treba da stoji. Crni kvadrati na krajevima grafika služe za menjanje veličine grafika. Ako je u nekom od koraka za izradu grafika došlo do greške ili jednostavno treba promeniti neku stavku, tada se koristi padajući meni Chart. Opcija Chart Type vraća na izbor tipa grafika, Chart Options na prozor sa opcijama grafika itd.
284 283 282 281 280 279 Series1 278 277 276 275 274 273 0 2 4 6 8 10 12

14

2. Funkcije raspodele u Excelu

15

2.1. Binomna raspodela
Ova diskretna raspodela ima veliku primenu u kontroli kvaliteta proizvoda Posmatrajmo niz nezavisnih eksperimenata (u literaturi poznat kao Bernulijeva šema) tj. za svaki od njih važi da je njegov ishod nezavisan od ishoda ostalih opita. Neka je za svaki od eksperimenata vezan događaj A i neka je verovatnoća njegovog nastupanja jednaka p, P(A) = p. Binomni zakon daje verovatnoću da će se u n eksperimenata ili proba posmatrani događaj A dogoditi x puta. Dakle, broj nastupanja događaja A u n proba je slučajna veličina X, koja ima binomnu raspodelu verovatnoće. Možemo sada da izvedemo binomni zakon. Tražimo verovatnoću, b(x,n,p) da u n opita posmatrani događaj A nastupi x puta. Verovatnoća svakog od događaja u kome je A u n proba nastupio x puta je: p x qn - x a ukupan broj takvih, međusobno isključivih događaja jednak je broju kombinacija klase x od n elemenata. Tako je,

 n b( x, n, p) =   p x q n − x ,  x  

x = 0,1,2,..., n

(2.37) je

U Excel-u se za ovu vrstu raspodele koristi funkcija BINOMDIST. Rezultat funkcije verovatnoća binomne raspodele da će slučajna promenljiva X imati zadatu vrednost. Sintaksa BINOMDIST(number_s, trials, probability_s, cumulative)

Number_s – broj nastupanja nekog događaja u n proba (slučajna promenljiva X) Trial_s – broj nezavisnih proba, n Probability_s – verovatnoća nastupanja događaja u svakoj probi

16

Tabela se dobija tako što se u red 1 unose podaci za xi. odabere opcija Function. a zatim se iz padajućeg menija Insert.Cumulative – logička vrednost koja određuje oblik funkcije. odabere se BINOMDIST i otvara se novi prozor (kao na slici) 17 . kada se otvori novi prozor funkcija BINOMDIST se traži u statističkim funkcijama (Statistical). tokom dužeg perioda. BINOMDIST daje kumulativnu raspodelu funkcije. Događaj A je dobijanje defektne komponente. q = 1 − p = 100 5 Broj opita. rezultat je verovatnoća da će događaj nastupiti X puta. Primer 2. je p= 20 4 = 1 / 5. Dati su tabela i poligon raspodele. dok se pi izračunava pomoću funkcije BINOMDIST. Kolika je verovatnoća da u slučajnom uzorku od 6 komponenata a) bude 4 defektna b) ne bude više od 3 defektna c) ne bude nijedan defektan Rešenje Prepoznaje se binomni model. Tako je konstatovano da je procenat škarta 20%. n = 6. a njegova verovatnoća. Neka mašina proizvodi 1000 komponenata/h i svakih 30 minuta je uzimano po 10 uzoraka radi kontrole. ako je Cumulative=TRUE. ukoliko je tabela napisana na isti način kao na slici. dobijena empirijski. Dakle. klikne se na ćeliju J2.1. ukoliko je Cumulative= FALSE.

funkcija se kopira na prethodno objašnjen način.Unose se odgovarajući argumenti: Number_s .upisuje se 0. b) U pitanju je zbir događaja.unosi se vrednost iz ćelije J1. jer je potrebna vrednost za samo jedan događaj.upisuje se logička vrednost FALSE. jer je to broj proizvoda u slučajnom uzorku. verovatnoća od 20%. ali sa nešto drugačijim argumentima. da bi se popunio ostatak tabele. 18 .2. i kao rezultat dobija se vrednost za binomnu raspodelu. Cumulative . a) Ovde treba izračunati verovatnoću da su u slučajnom uzorku od 6 proizvoda 4 budu defektna. Probability_s . a ne zbir događaja. jer se traži da ne budu više od 3 defektna proizvoda. problem se takođe rešava korišćenjem funkcije BINOMDIST. odnosno samo se klikne na ćeliju J1. Zatim se na osnovu tabele nacrta grafik. kao kod popunjavanja tabele. Potvrđuje se sa OK. Trials .upisuje se 6. Problem se rešava korišćenjem funkcije BINOMDIST.

c) Koji broj ispravnih ampula u uzorku od 6 komada je nejverovatniji? 19 .Number_s . znači da je x = 0 pa imamo Primer 2. a) Odrediti zakon raspodele verovatnoće slučajne promenljive: broj ispravnih ampula u slučajnom uzorku od 6 ampula b) Odrediti očekivanu vrednost i disperziju slučajne promenljive. a ne o pojedinačnom događaju.upise se 6 Probabilitiy_s – upisuje se 0. c) Ovde se traži da nijedan od proizvoda ne bude defektan.2 Cumulative – upisuje se TRUE jer se radi o zbiru događaja.2. Detaljnom proverom kvaliteta ampula punjenih tečnošću utvrđeno je da je na 100 ampula 75 ispravnih.upisuje se 3 Trials .

b) µx = np = 4. D(X) = npq = 1.125 se izračunavaju upisivanjem formula.6.2. c) Najverovatniji broj ampula u uzorku je 5.5. a nakon toga se na poznati način crta grafik.Rešenje 3 a) U pitanju je binomni zakon: b(x. ) .6 4  x  4  4   Slede tabelarni i grafički prikaz zakona raspodele: Tabela se formira na isti način kao i u 1. 4 x 3  6  3  1 p ( x) = b( x.. 20 .. ) =    ⋅ 6 − x . x = 0.1.6.. zadatku..

Tako se Poasonov model koristi za opisivanje verovatnoće retkih (p je malo). x = 0. kada obim uzorka n teži beskonačnosti uz uslov da pri tom proizvod obima uzorka i verovatnoće posmatranog događaja. σ 2 = lim np (1 − p ) = np = µ x n →∞ p →0 np = const Dakle. 21 . x! gde je µ neki pozitivan broj.Dakle. Za dovoljno veliko n i malo p binomna raspodela se može aproksimirati Poasonovom. µ = np < 5 Poasonova raspodel u Excelu može se dobiti korišćenjem funkcija POISSON. Praktični kriterijum za primenljivost takve aproksimacije je [Chatfield C. tj. slučajna promenljiva X ima Poasonovu raspodelu ako je µ x −µ p( x) = e . p → 0.2.1. Srednja vrednost i disperzija Očekivana vrednost i disperzija za Poasonovu raspodelu mogu se dobiti kao granične vrednosti tih parametara za binomnu raspodelu. srednja vrednost i disperzija slučajne promenljive X raspodeljene po Poasonovom zakonu su: µ x = σ2 = µ x Aproksimacija binomne raspodele Poasonovom Računanje verovatnoća je znatno obimnije kod binomne nego kod Poasonove raspodele.2. emitovanje radioaktivnih čestica • incidenti u dobro regulisanom saobraćaju • smetnje u telefonskom saobraćaju i prenosu podataka • greške u računarskim sistemima Slučajna promenljiva je broj realizacija retkog događaja u vremenskom intervalu date dužine. (µ = const): µ x = np = µ . µ = np ostane ograničen.]: n > 20..2. 1983. kada n → ∞.. međusobno nezavisnih (uslov za binomni zakon) događaja kao što su: • radioaktivni raspad nekih izotopa.. Poasonova raspodela Poasonov (Poisson) zakon raspodele se može dobiti kao granični slučaj binomnog modela..

2 < 5 ispunjen je uslov n > 20. Zadatak 2. izračunava se na sledeći način. ako je FALSE. rezultat funkcije je kumulativna Poasonova funkcija raspodele verovatnoća da će broj slučajnih događaja biti između 0 i X (uključujući i te vrednosti). rezultat je Poasonova funkcija verovatnoće da će broj događaja biti tačno X. Odrediti verovatnoću da je u uzorku od 60 komponenata defektno: a) 3 komada b) ne više od 3 c) bar dva Rešenje U pitanju je binomni zakon. Pošto je n = 60 > 20 i µ = np = 60⋅0. 22 . pošto je ustanovljeno da ja aproskimacija Poasonovom raspodelom moguća.3.logička vrednost koja definiše funkciju raspodele verovatnoće. Ako je taj argument TRUE. Mean. Cumulative) X – broj događaja Mean – očekivana vrednost Cumulative . verovatnoća da je u uzorku od 60 komponenata defektno 3 komada. µ = np < 5 i rešavanje problema se može znatno uprostiti zamenjujući binomni zakon Poasonovim ( iako to u Excelu ne predstavlja problem). Procenat škarta pri proizvodnji komponenata u nekoj fabrici je 2%.02 = 1.Sintaksa : POISSON (X. a) Dakle.

i nakon toga iz statističkih funkcija odabere POISSON.P( X = 3) = ( 2. klikne se na ćeliju B11. zatim se iz padajućeg menija Insert odabere opcija Function.2 e = e ≈ 0. kada se potvrdi sa OK otvara se sledeći prozor 23 .2)3 −1.42 ) (µ)3 − µ (1.0867 3! 3! Ukoliko su podaci unešeni na isti način kao na slici.

za X se upisuje 3. za Mean se klikne na ćeliju B8 jer je u toj ćeliji izračunata očekivana vrednost. pa se kao rezultat dobija kumulativna Poasonova funkcija. P( X ≥ 2 ) = 1 − P( X < 2) = 1 − [ p(0) + p (1)] = 1 − e − µ + µe − µ ≈ 0. osim što se u polje Cumulative upisuje TRUE. b) Kako je ovde potrebno odrediti verovatnoću da su ne više od 3 komada defektna. i u polje Cumulative se upisuje FALSE jer se traži vrednost verovatnoće Poasonove raspodele za X=3. problem se rešava slično kao pod a). što ustvari znači 2 i više.3374 [ ] 24 .9662 2 6 c) Kada je potrebno odrediti verovatnoću da su bar 2 komada defektna. P( X ≤ 3) = p(0) + p(1) + p(2) + p (3) = (1 + µ + µ 2 µ3 − µ + )e ≈ 0.Ovde se unose odgovarajući argumenti. izračunava se Poasonova kumulativna funkcija za vrednost 1 (uključuje vrednosti verovatnoće za 0 i 1) i onda oduzme od 1.

25 . n. koja se od tačne vrednosti razlikuje manje od 1%. n. pa je: ω = P(X ≤1) = p(0) + p(1) = b(0.9384 = 93.? Rešenje Traženu relativnu frekvencu ω se.4]e −0. 0. µ = np < 5 nije ispunjen: ω = p(0) + p(1) = [1 + µ]e − µ = [1 + 0.9418 = 94. nalazi kao verovatnoća da se u slučajnom uzorku od 10 komada nađe najviše jedan defektan proizvod.4 = 0. p) ω = q10 + 10 ⋅ p ⋅ q 9 = 0.4.04 ⋅ 0.Zadatak 2.9610 + 10 ⋅ 0. u Excelu se ovaj problem rešava funkcijom BINOMDIST.8% Sada se koristi funkcija POISSON Dobija se pak dobra procena. p) + b(1. mada prvi od uslova n > 20. U kom procentu kutija će se naći najviše jedan defektan proizvod. u skladu sa statističkom definicijom verovatnoće (ω ≈ p). Automat daje 4% defektnih proizvoda. Problem se može približno rešiti aproksimacijom binomnog zakona Poasonovim. U pitanju je slučajna promenljiva sa binomnom raspodelom b(x. 10.2% Odnosno. Proizvodi se pakuju u kutije po 10 komada.04).969 = 0.

što se kratko označava sa X : N(µ. Normalna raspodela Ovo je najvažnija raspodela za primene u statističkoj obradi eksperimentalnih podataka u društvenim.2. Za neprekidnu slučajnu promenljivu X kažemo da ima normalnu ili Gausovu raspodelu sa parametrima µ i σ. Rezultat ove funkcije je vrednost promenljiveza koju normalna kumulativna funkcija raspodele ima datu verovatnoću.3. σ > 0 U Excel-u se za normalnu raspodelu koristi funkcija NORMDIST. mean. standard_dev. postoji i inverzna funkcija NORMINV. Sintaksa: NORMDIST (x. cumulative) x – vrednost za koju se izračunava funkcija Mean – aritmetička sredina raspodele Standard_dev – standardna devijacija raspodele Cumulative – logička vrednost koja definiše vrstu funkcije. FALSE – funkcija gustine verovatnoće. TRUE – kumulativna vrednost raspodele. 26 .σ) ako je njena gustina: −  1 f ( x) = e 2 σ 2π 1  x −µ   σ  2 . µ. Pored funkcije NORMDIST. prirodnim i tehničkim naukama.

Dakle.σ2). standardizovana normalno raspodeljena slučajna promenljiva. dobijena linearnom transformacijom. σ x0 = 1 . x2 1 F0 ( x) = P( X 0 < x) = 2π −∞ ∫e x − t2 2 dt 27 . mean. ima takođe normalnu raspodelu. µ x0 = 0. X0 = X −µ σ koja ima nultu srednju vrednost i jediničnu disperziju. slučajna promenljiva. N(0.1) sa gustinom: 1 −2 f 0 ( x) = e 2π i funkcijom raspodele. koja se zove standardizovana normalna raspodela. standard_dev) Probability – verovatnoća za koju se izračunava vrednost promenljive.Sintaksa : NORMINV (probability. a ≠ 0 ima takođe normalnu raspodelu. Y = aX + b. Mean – aritmetička sredina raspodele Standard_dev – standardna devijacija raspodele Standardizovana normalna raspodela Ako je X slučajna promenljiva sa normalnom raspodelom N(µ.

Takođe postoji i inverzna funkcija NORMSINV. ∆ : N(0.µ se može aproksimirati slučajnom veličinom sa normalnom raspodelom. Odstupanje. ∆ = δ . δ od nominalne vrednosti µ. ∆ debljine proizvedene glazirane keramičke pločice. Sintaksa: NORMSDIST(z) Z – vrednost za koju se izračunava funkcija. Sintaksa: NORMSINV(probability) Probability – verovatnoća za koju se izračunava vrednost promenljive Zadatak 2. 0.5.Za određivanje standardne normalne kumulativne funkcije raspodele koristi se funkcija NORMSDIST.3). Odrediti: 28 .

5. u polje Mean upisuje 29 .0. Tj.a) Očekivani škart u 1000 proizvedenih komada. ili ukoliko su podaci uneseni na ista mesta kao na slici klikne se na ćeliju A12. Do funkcije se dolazi na isti način kao i u prethodnim primerima .3 ≤ δ ≤ µ + 0.5 apsolutna vrednost.5 dobiće se preko verovatnoće suprotnog događaja.5 c) Očekivani broj pločica u 1000 komada čije su debljine u intervalu: µ . međutim.2 ili δ ≥ µ + 0.4 a) Verovatnoća da odstupanje ∆ bude veće od 0. Rešenje Koristi se funkcija NORMDIST. i da se mora izračunati verovatnoća za x ≤0. U polje x upisuje se -0. treba uzeti u obzir da je 0.5 i x ≤ . ako se kao ispravne prihvataju pločice čija debljina odstupa od nominalne najviše 0.5 mm. b) Očekivani broj pločica u 1000 komada čije su debljine: δ ≤ µ .0. verovatnoće da odstupanje bude manje od 0.0.5. a zatim oduzeti manju od veće verovatnoće.5.

5) = P(δ ≤ µ − 0.2 ∨ δ ≥ µ + 0.096. njihovu razliku izračunatu na već poznat način treba oduzeti od 1.3. 30 .2. a zatim za 0. u slučajnom uzorku od 1000 komada jednak: m = pn = 1000⋅0.5 u polje x upisuje vrednost 0.se 0. p = 0.096 = 96 b) P (δ ≤ µ − 0.5 oduzima od 1. Ako postoji verovatnoća događaja .5.5 (ili se klikne na ćeliju A13). Pošto su izračunate ove dve vrednosti. onda je u skladu sa binomnim zakonom (ili u skladu sa statističkom definicijom verovatnoće) očekivani broj defektnih pločica m. Potvrđuje se sa OK. a u polje Cumulative upisuje se logička vrednost TRUE. u polje Standard_dev 0.pojava defektne pločice. Dalje se klikne na ćeliju u koju se izračunava druga funkcija ( u konkretnom primeru to je ćelija B13) i postupak se ponavlja. pa se dobijena vrednost za 0.2) + P (δ ≥ µ + 0.5) Ovde se prvo izračunava kumultaivna funkcija normalne raspodele za vrednost -0. samo što se umesto vrednosti -0.

4) Slično se rešava i ovaj problem.6.0.4 Verovatnoća za vrednost -0. h u časovima ima normalnu raspodelu N(100. na već opisan način. koristi se funkcija NORMDIST. koja se dalje množi sa 1000 i dobija se broj pločica čije su debljine δ ≤ µ .3 i 0.2 ili δ ≥ µ + 0. Zadatak 2.4.3 ≤ δ ≤ µ + 0. računaju se kumulativne funkcije normalne raspodele za vrednosti -0. b) Ako je jedna elektronska lampa već izdržala 90 časova. 31 .5) a) Naći verovatnoću da nova elektronska lampa istog tipa traje najmanje 105 časova. kolika je verovatnoća da će izdržati još 15? Rešenje a) Tražena verovatnoća se izračunava iz verovatnoće suprotnog događaja.3 se oduzima od one za 0. Vek trajanja elektronske lampe.Sabiranjem vrednosti u ćelijama B22 i C 23 dobija se tražena verovatnoća.5 c) P ( µ − 0. i dobijeni rezultat se množi sa 1000.

3 Verovatnoća pogotka cilja u jednom gađanju je p = 0.9 cilj bio pogođen bar jednom? Događaj A nastupa u nekom eksperimentu sa verovatnoćom p = 0.2.2 Odrediti. X > 90 i računa se pomoću formule : P ( X > 105 / X > 90) = P[( X > 105)( X > 90)] P( X > 105) = P( X > 90) P ( X > 90) Dakle. Koliko gađanja treba izvesti da bi sa verovatnoćom ne manjom od 0. Kao što se moglo očekivati. a) Kako glasi zakon verovatnoće za X. pomoću funkcije NORMDIST dobija se verovatnoća za 90h. Neka je X broj nastupanja događaja A u nizu od 5 opita.Događaj A nastupa u nekom eksperimentu sa verovatnoćom p = 0. c) izračunati srednju vrednost i disperziju. a zatim se podeli sa verovatnoćom za 105h.3. b) Izračunati P(X ≤ 3). 2. dobijena je nešto veća verovatnoća nego u a) Zadaci za vežbu 2.b) Traži se uslovna verovatnoća: verovatnoća da će nastupiti događaj. c) izračunati srednju vrednost i disperziju.3. Neka je X broj nastupanja događaja A u nizu od 5 opita. b) Izračunati P(X ≤ 3). 32 . a) Kako glasi zakon verovatnoće za X. X > 105 pošto je nastupio događaj. a) Verovatnoću da se u 8 bacanja kocke šestica pojavi 3 puta b) Očekivani broj šestica u 180 bacanja kocke? 2.1.

5 Verovatnoća pogotka cilja u jednom gađanju je p = 0.2Ω).9 cilj bio pogođen bar jednom? 2. 0. po apsolutnoj vrednosti. 2. a) U koliko će se posto kutija nalaziti najviše jedan defektan komad? b) Postiže li se Poasonovom raspodelom zadovoljavajuća aproksimacija. a) izračunati procenat kutija koje sadrže više od propisane količine deterdženta.7.4). Proizvodi se pakuju u kutije po 50 komada. Jedna velika serija sadrži 4% defektnih proizvoda.9 i P ( X > 9 / X > 5) Slučajna promenljiva ima normalnu raspodelu N(3. ako se dozvoljava maksimalna greška rezultata od 1. Dužom kontrolom proizvoda utvrđeno je da je srednja masa deterženta u kutiji 506g. b) bar jedna. Naći verovatnoću da od tri greške međusobno nezavisnih merenja a) bar jedna ne bude veća od 4mm. Proizvodi se bez prethodne kontrole i izdvajanja loših pakuju u kutije od 50 komada.2. Izračunati P( X > 9) 2.5 i 10. sa standardnim odstupanjem 12g. σ = 8mm.8 Slučajne greške merenja imaju normalnu raspodelu sa µ = 0.. Otpor električnih otpornika ima normalnu raspodelu N(5Ω.4 Odrediti.10 Neki proizvođač deterdženta ima mašinu za pakovanje po 500g deterdženta u jednu kutiju. Uz pretpostavku da mase deterdženta u kutijama imaju normalnu raspodelu. b) izračunati onu srednju vrednost i standardno odstupanje raspodele masa deterdženta.6 Automat daje 4% defektnih proizvoda.11. a) Koliko će defektnih proizvoda sadržavati najveći broj kutija? b) Koliki je procenat takvih kutija? 2. a) Verovatnoću da se u 8 bacanja kocke šestica pojavi 3 puta b) Očekivani broj šestica u 180 bacanja kocke? 2. Slučajnim izborom uzmemo dva takva otpornika i vežemo ih na red. koji bi prepolovili procenat prepunjenih kutija i u isto vreme obezbedili da najviše 1% kutija sadrži manje od 497g.2. Kolika je verovatnoća da taj spoj ima otpor između 9. ne bude veća od 4mm.5Ω ? 33 .5%? 2. c) kolika bi se prosečna ušteda u deterdžentu (%) postigla? 2. Koliko gađanja treba izvesti da bi sa verovatnoćom ne manjom od 0.

Empirijska raspodela u Excelu 34 .3.

To je svakako nemoguće u slučaju beskonačnog osnovnog skupa. prosečni životni vek stanovništva neke države predstavlja važnu karakteristiku od koje. Skup svih elemenata . pri kontroli neke procesne veličine (pritisak. odstupaju dužine života pojedinih građana. U slučaju pak praćenja sadržaja sumpora u proizvedenoj gumi. beskonačno velik komad gume i beskonačan niz analiza pod istim uslovima. kao i od tražene tačne vrednosti merene veličine. statističari nazivaju statističko obeležje. odnosno neophodna je izvesna apstrakcija koja kao rezultat ima hipotetičnu beskonačnu populaciju.1. U slučaju bacanja dve kocke za igru. manje ili više. statističko obeležje je posmatrani rezultat (recimo suma dobijena dva broja). svaki test je statistička jedinica. a osnovni skup je beskonačan jer se može zamisliti beskonačan broj bacanja kocke. populacija se smatra beskonačnom. Za masovne pojave je karakteristično da pojedinačni slučajevi manje ili više odstupaju od onog što se može smatrati njenom karakteristikom. Primeri su demografska ispitivanja i testova kvaliteta proizvoda. temperatura. kao naučna disciplina. koja se naziva i teorijska raspodela. tj.statističkih jedinica (masovnost) koji može biti i beskonačan.3.broj elemenata jednak je broju proizvedenih pločica u nekom periodu vremena. Osnovni pojmovi Statistika. statistička jedinica je definisana kao svaka od mogućih položaja dve bačene kocke.obeležja u osnovnom skupu. koncentracija. U poslednjem primeru to je osoba . Osnovni skup po pravilu ima veliki broj elemenata . Tako je životni vek građanina neke države primer statističkog obeležja. za razliku od životnog veka. Pri tome je retko moguće izmeriti obeležja svih statističkih jedinica osnovnog skupa. Na primer. raspodele verovatnoće. Zamišljamo naime. ali i u slučaju konačnih populacija. U slučaju kontrole kvaliteta proizvoda. Rezultati ponovljenih merenja se međutim razlikuju među sobom. Zato se iz populacije izdvaja jedan konačan podskup statističkih jedinica koji se naziva (statistički) uzorak. to retko dolazi u obzir jer je ili neekonomično ili praktično neizvodljivo. recimo. Slično. debljine proizvedenih keramičkih pločica.) može se zamisliti beskonačan broj merenja. zbog slučajne greške merenja. Ako kontrolišemo.građanin neke države.statističkih jedinica naziva se populacija ili generalni skup ili osnovni skup. izučava masovne pojave u društvu. itd. populaciju čine svi stanovnici jedne države. Statističko obeležje je vezano za jasno definisan elemenat (entitet) koga nazivamo statistička jedinica. 35 . koja sama. Na primer. prirodi i tehnici. Umesto izraza: uzorak iz osnovnog skupa sa pretpostavljenom raspodelom (recimo normalnom) često se koristi kraći termin: uzorak iz pretpostavljene raspodele (npr. Statističko obeležje i populacija Ono što se u teoriji verovatnoće naziva slučajna promenljiva. onda je populacija ograničena . koji su destruktivni (proizvod u toku testa biva oštećen). normalne). Uzorak se ispituje radi donošenja zaključaka o raspodeli slučajne promenljive . Drugi primer su rezultati merenja neke fizičke veličine. u posmatranom primeru. Statistički uzorak Osnovni zadatak statistike je definisanje raspodele frekvenci posmatranog obeležja. nije slučajna veličina (na primer gustina gasa na datoj temperaturi i pritisku).

Jasno je da se ne može očekivati potpuno tačno opisivanje ili reprezentacija populacije na osnovu analize uzorka. Jedno od najvećih ograničenja pri tome je svakako obim uzorka pod kojim se podrazumeva broj elemenata populacije izdvojenih u uzorak. sa relativnom frekvencom 0. Ako takav element ne postoji. xn Obrada i analiza rezultata obuhvata matematičku obradu sređenih podataka i njihovu interpretaciju. Teorija uzoraka kao deo statistike. posmatranja. 36 . ili se mogu kompjuterski generisati pomoću odgovarajuće funkcije. nezavisno od ostalih. uđe u uzorak. Ako recimo osnovni skup ima manje od 100 elemenata. Za takav uzorak kažemo da je slučajan uzorak. bavi se problemom izbora takvog uzorka koji će obezbediti dovoljnu pouzdanost zaključaka o populaciji.1).9. 0 .. Svi elementi populacije se numerišu. Tako na primer.. Takav uzorak. da na osnovu informacija iz uzorka izvede neke zaključke o osnovnom skupu. Da bi uzorak bio reprezentativan. taj broj iz tablice jednostavno ispuštamo i nastavljamo postupak. mora biti tako formiran da svaki element populacije ima jednaku šansu da. naziva se reprezentativan uzorak. x2 . čija se struktura u odnosu na posmatrano obeležje ne razlikuje značajno od strukture osnovnog skupa. i = 1. da bi smo dobili neku predstavu o raspodeli posmatrane slučajne veličine. U postupku statističke analize mogu se izdvojiti sledeće faze: • statističko posmatranje • sređivanje podataka • obrada i naučna analiza rezultata Statističko posmatranje se sastoji u planskom prikupljanju podataka o statističkim jedinicama putem anketa. merenja itd. uzimaju se redom slučajni dvocifreni brojevi i u uzorak uključuju elementi označeni tim brojevima. Međutim.. Tablica slučajnih brojeva formira se iz dugačkog niza cifara. Počev od nasumce odabranog broja u tablici. iz slučajnog uzorka obima n dobijamo niz od n vrednosti (xi.9 se u polaznom nizu brojeva približno pojavljuje jednak broj puta (dakle.L.. potreban je niz slučajnih dvocifrenih brojeva (ili se svaki četvorocifren broj iz tablice interpretira kao dva dvocifrena). kao što smo već naveli.čak i veliki uzorak može da dovede do pogrešnog modela. Prvi korak pri tom je uređivanje po veličini dobijenog niza od n brojeva. koji se “iseče” na brojeve sa istim odabranim brojem cifara (tablice iz literature najčešće sadrže četvorocifrene brojeve). Svaka od cifara 0 . Statistička analiza Zadatak statističke analize je.n) Sređivanje podataka se sastoji u njihovom tabelarnom i grafičkom prikazivanju. vrši se uz pomoć tablice slučajnih brojeva koji se mogu naći u priručnicima iz statistike. Formiranje slučajnog uzorka iz ograničene populacije (recimo stanovništvo). veličina uzorka nije jedini faktor koji ograničava tačnost zaključaka . a rezultat je uređen niz koji se u statistici zove varijacioni niz: x1 . Najjednostavniji postupak za formiranje slučajnog uzorka je sledeći.

21. (x . m ). 21 Treba formirati empirijsku raspodelu starosti studenata u apsolutnim i relativnim iznosima. 21.L. oni se mogu prepisati redom iz zadataka. * 1 1 * 2 2 * k k k≤n za koji se takođe kaže da predstavlja grupisane podatke.( x2 . 21. 21. 23. teorijske raspodele i može se prikazati tabelarno.. 22. mi. k ≤ n Jasno je da pri tome važi. m ).3. ( xk . ωk ). 25. 21. 22. (x . dobija se empirijska raspodela relativnih frekvenci u obliku niza parova: * * * ( x1 . xk = xn . 21. tada empirijska raspodela relativnih frekvenci predstavlja aproksimaciju zakona raspodele verovatnoće slučajne promenljive X tj.K. Primer 3. nakon toga sortirati. 22. 23. 22. i =1 k ∑ω i =1 k i =1 Ako su u pitanju vrednosti neke diskretne slučajne promenljive X. koja predstavlja niz parova: (x . 26. 23. 22. 22. 24. x2 . 20. xn za svaku od vrednosti u nizu može se odrediti (apsolutna) frekvenca pojavljivanja. Sortiranje podatak u tabeli se vrši tako što se obeleže podaci i klikne na ikonicu Sort Ascending 37 . ∑m i =1 k i =n Ako se za grupisane podatke izračunaju relativne frekvence ωi = mi/n. 23.1. 21. u vidu trakastog dijagrama ili poligona raspodele Što se tiče rešavanja problema vezanih za empirijsku raspodelu. ω1 ). ω2 ).2 Empirijska raspodela Polazeći od varijacionog niza x1 . Rešenje Prvo treba formirati varijacioni niz na sledeći način: U kolonu C se upisuju se podaci o starosti u godinama. ∑ mi = n . 25. Primetimo da je: ∗ ∗ x1 = x1 . oni će se u Excelu svesti na formiranje odgovarajućih tabela i crtanje dijagrama. U grupi od 25 studenata II godine studija su anketiranjem dobijeni podaci o starosti u godinama: 22. m ).L. Dobijeni rezultat je empirijska raspodela frekvenci. 21.

opcije Function. Iako je crtanje grafika već prethodno objašnjeno. ona sadrži grupisane podatke o broju godina. Funkcija se dobija iz padajućeg menija Insert.i kao rezultat dobija se kolona C koja izgleda kao na slici (desno). Nakon toga korišćenjem funkcije COUNT prebrojavaju se podaci. na primer : I na kraju se izračunavaju vrednosti ω. Argumente funkcije predstavljaju članovi varijacionog niza. u kome se bira tip grafika (Chart type). Crtanje se započinje ili odabirom Chart iz padajućeg menija Insert. i iz statističkih funkcija odabere COUNT. 38 . i odabere se XY (Scatter). Tada se otvara novi prozor. U sledećem koraku formira se nova tabela. Ovde se pri kopiranju formula na ostatak reda mora voditi računa o tome da je n konstanta. Vrednosti za m se dobijaju opet korišćenjem funkcije COUNT. Pošto je tabela konačno formirana crta se grafik. ili klikom na ikonicu Chart Wizard. tj. i da njen položaj mora biti fiksiran. i to prebrojavanjem podataka za određenu vrednost x*. i to kao odnos m i n. za odgovarajuću grupu podataka. da se ispred oznake reda i kolone mora staviti znak $. ovde će još jednom biti prikazano na konkretnom primeru.

i u sledećem prozoru odabere kartica Series. a na y osi za m i ω. gde će se obeležiti podaci na osnovu kojih se crta grafik. kao što su oznake za x i y osu. naziv grafika i slično. čime se crtanje grafika završava. Serije podataka se dodaju klikom na „dugme“ Add. Nakon toga se ponovo klikne na Next i u sledećem prozoru na Finish.Klikne se na Next. 39 . a dodatna podešavanja se rade na grafiku. Klikne se na Next. Na x osi treba da budu vrednosti za x*. kada se desnim tasterom miša klikne na grafik i odabere opcija format. a zatim se u poljima X values i Y values upisuju odgovarajuće vrednosti. i u sledećem prozoru urade ostala podešavanja grafika.

Pošto bi ovde trebalo prikazati zavisnost ω od x* na sekundarnoj osi. desnim tasterom se klikne na seriju ω. Format Data Series. 40 . potvrđuje se sa OK. tj. poligon raspodele starosti studenata u apsolutnim i relativnim i znosima. Kao rezultat dobija se grafik sa primarnom i sekundarnom osom. kada se otvori novi prozor klikne se na karticu Axis i odabere opcija Plot Series on – Secondary axis.

1985.].. intervalno sređivanje podataka. 41 . Mereno je vreme izvođenja neke radne operacije u sekundama: 24 28 22 26 24 27 26 25 26 23 30 26 29 25 27 24 26 25 24 27 Formirati tabelu intervalno sređenih podataka u 5 klasa i histogram. Tabela 4. u 3). k Frekvence mi. 4. . ... b) koji se nazivaju klase. 1990. [ u 2.. [Ahnazarova S.. i = 1. u 2) M [ u k-1. b) sredine klasa * x1 * x2 frekvence m1 m2 M mk n relativne frekvence ω1 ω2 M ωk 1 M * xk Pored poligona raspodele..1) sadrži veliki broj međusobno različitih vrednosti obeležja X. Intervalno sređivanje se inače praktikuje kada su u pitanju podaci o neprekidnoj slučajnoj promenljivoj. …. ui).. drugoj. Za broj klasa ne postoji striktno pravilo. Sredine klasa ćemo označiti sa xi* : xi* = ui −1 + ui 2 . Interval [a. zavisno od obima uzorka [Vukadinovic S. kao grafički prikaz intervalno sređenih podataka koristi se histogram empirijske raspodele.2. u1). ... Tabelarni prikaz intervalno sređenih podataka dat je u Tab. u 2). [ u k-1. Primer 3.1 Intervalno sređeni podaci klase 1 2 M k ∑ [a. a visine odabrane tako da su im površine jednake relativnim frekvencama. vrši se tzv. a u literaturi se sreću i empirijske formule za izbor k.k sada predstavljaju broj vrednosti obeležja X koje pripadaju prvoj.. deli se na k podintervala: [a.Intervalno sređivanje podataka Ako je obim uzorka veliki i ako niz (4. i = 1.. Kafarov V. u1) [ u 1. To je niz pravougaonika čije su osnove intervali [ui-1.].1. k-toj klasi. Preporučuje se da ono bude od 5 – 21. Obično se uzima da su klase jednake širine.. [ u 1. Poslednje tri kolone daju empirijsku raspodelu apsolutnih i empirijsku raspodelu relativnih frekvenci. b) kome pripadaju sve vrednosti X za uzorak.

Argument predstavlja skup vrednosti čija se srednja vrednost traži. Najmanji interval u kome leže svi podaci. treća frekvence. na osnovu koga se formira nova tabela. Prva kolona nove tabele sadrži nazive klasa. Kao i u prethodnom primeru formira se varijacioni niz (kolona D na slici).22)/5 = 2. Da bi se izračunale sredine klasa koristi se funkcija AVERAGE. a peta visinu pravougaonika u histogramu. a nalazi se u statističim funkcijama. Ona se kao i ostale funkcija poziva iz menija Insert. druga sredine klasa. podaci iz uzorka su uvek diskretni. je interval [22.Rešenje U pitanju je neprekidna slučajna promenljiva. četvrta relativne frekvence. ali samo obeležje može biti diskretno ili kontinualno (kao što je ovde slučaj). Naravno. pa ćemo usvojiti klase širine. d = (32 . 42 . opcije Function. tj. U prvu kolonu se samo upišu podaci. a njegova širina je deljiva sa 5. odnos ω/d. 32).

u ova dva slučaja mora se voditi računa o tome kako se zapisuju n i d. U prvom koraku (Chart Type) bira se Column. u četvrtom se završava crtanje grafika. osa i legende. U trećem koraku izvrše se podešavanja oko naslova. Dalje se na Series – Add ubacuju podaci na osnovu koji se crta histogram. Dalje se pomoću Chart Wizard-a crta histogram. u polju Category (X) axis labels klase. 43 . jer se radi o konstantama. u konkretnom slučaju obeleži se ćelije od E2 do E6. četvrta kao odnos broja m i n. Kao rezultat dobija se sledeći histogram. u polju Values se označavaju vrednosti ω/d. a peta kao odnos ω i d.Treća kolona se popunjava kao i prethodnom primeru pomoću funkcije COUNT.

Rešenje Prvo se formira varijacioni niz.1). 44 .n (4.Empirijska funkcija raspodele Pretpostavimo da smo grupisanjem podataka iz varijacionog niza xi. potpuno je analogan grafiku funkcije raspodele F(x) za diskretnu slučajnu promenljivu (Sl. kao i u primeru 3.. i na osnovu toga formira tabela. Empirijska funkcija raspodele predstavlja aproksimacije funkcije raspodele populacije (teorijska funkcija raspodele) i ukoliko je obim uzorka. koje leže levo od odabrane tačke x... 2. k pri čemu. Grafik empirijske funkcije raspodele Fn* ( x) .1. m i ω ili w) dobijaju se na već poznat način. n veći. Primer 3. vrednosti xi* predstavljaju sredine klasa (vidi tabelu 4. zove se kumulativna frekvenca N(x) i dobija se kao suma: N ( x) = x i* < x ∑m i Deljenjem kumulativne frekvence za tačku x ukupnim brojem podataka n. Ukupan broj tačaka xi . mi ).2). aproksimacija će biti bolja (teorema Glivenka). dobili empirijsku raspodelu frekvenci: ( xi* . Fn* ( x) = N ( x) = ∑ ωi n x i* < x (*) Jednačina (*) predstavlja definiciju empirijske funkcije raspodele.. i = 1.1 nacrtati grafik empirijske funkcije raspodele.. Prve tri kolone (x*. Neka je x bilo koja vrednost na x-osi.3). odredi broj elemenata pomoću funkcije COUNT. Fn* ( x) . dobijamo relativnu kumulativnu frekvencu. i =1.. u slučaju intervalno sređenih podataka..3 Za uzorak iz primera 3. Četvrta kolona dobija se pomoću funkcije SUM i to za svaku ćeliju posebno..

4.4 0.45 .2 0.9 0.95 . 1.3 0.2.45 4.6 0.7 3. 4. 7.95 1. 3.4 Klase 1.45 3.3. 5. b) standardnu grešku srednje vrednosti uzorka Tabela uz Primer 3.2 2.95 .95 Sredina klasa x* 1.1. Proceniti a) srednju vrednost i disperziju osnovnog skupa.7 4.95 2.2 3.2 4.95 3.1 0 20 21 22 23 24 25 26 Primer 3.95 . 2.Poslednja kolona F(x*+0) dobija se kao N(x*+0)/n.4. Formula za prvi red u koloni može se kopirati na preostale redove.7 Frekvence m 2 1 4 15 10 5 3 45 . Opet se mora uzeti u obzir da je n konstanta i na odgovarajući način je obeležiti u formuli.7 2. kao što se vidi na slici.2.7 F(x*+0) 0.45 .4 U tabeli je dat je uzorak sa grupisanim podacima. Pošto je formirana tabela crta se histogram za F(x*+0) pomoću Chart Wizard-a.3. 1 0.45 .5 0.45 .45 2. 6.8 0.

b) Na sličan način se po odgovarajućim formulama se izračunava standardna greška 46 .Rešenje Prvo se formira nova tabela: a) Na osnovu tabele pomoću formula prikazanih na slici izračanuavaju se srednja vrednost i disperzija.

Intervalne ocene parametara raspodele 47 .4.

odnosno ako važi: ( ) * P (θ1 < θ < θ* ) = γ = 1 − α 2 Jasno je da je: * P (θ ≤ θ1 ∨ θ ≥ θ* ) = α 2 pa se verovatnoća α = 1 . σx = σ n n kao jedinicom Odredimo sada. Odredimo dakle faktor zα.1) ε  i primeniti je na posmatrani problem. iznosi ta granica?). sa njenim standardnim odstupanjem σ x = σ da važi: mere (koliko standardnih odstupanja σ x .1 Ocena srednje vrednosti normalne raspodele sa poznatom disperzijom Pretpostavimo da je slučajni uzorak obima n uzet iz populacije sa normalnom raspodelom N (µ. θ* je interval pouzdanosti ili interval poverenja 2 za parametar θ. ako sa unapred zadatom verovatnoćom. θ* se nazivaju 2 * granice pouzdanosti ili poverenja. σ 48 .Interval poverenja Ocene parametra θ. a širina intervala θ* − θ1 predstavlja meru preciznosti 2 intervalne ocene parametra (što je širina intervala manja. Za interval poverenja kažemo da je simetričan.σ). jer predstavlja verovatnoću da tačna vrednost * parametra bude izvan procenjenog intervala. σ x ). Uzoračka srednja vrednost X tada ima raspodelu . γ granicu apsolutnog odstupanja aritmetičke sredine X od njene srednje vrednosti µ. Intervalna ocena se zove i * interval poverenja ili pouzdanosti. Uzećemo jednačinu P ( ∆X < ε) = 2Φ Znači da treba u jednačini. preciznost intervalne ocene je veća). γ možemo da tvrdimo da sadrži tačnu vrednost parametra. Interval θ1 . takav P X − µ < zα σ x = γ = 1 − α gde je γ zadato.γ naziva i rizik. ( ) (4. čija je disperzija σ2 poznata. Granice intervala pouzdanosti θ1 . u vidu intervala. sa nivoom pouzdanosti ili poverenja γ. za zadatu verovatnoću. ako važi: * P (θ < θ1 ) = P (θ > θ* ) = α / 2 2 4. zovu se intervalne ocene. X : N (µ.

Jednačina (4. interval pouzdanosti sa nivoom pouzdanosti γ = 1 . σ x i µ su konstante). (4. x + zα σ / n .α.2a) (4.3a) 49 . traženi faktor zα se dobija kao rešenje jednačine: ( ) Φ ( zα ) = 1− α 2 raspodelom za koju Laplasova funkcija dobija vrednost (1 − α ) 2 . X .Bird).2a) predstavlja događaj da uzoračka srednja vrednost. Relaciji ekvivalentne sledeće relacije odnosno predstavlja onu vrednost standardizovane slučajne promenljive sa normalnom X − µ < zα σ x su (4. 2 vrednost Ekvivalentna definicija koeficijenta pouzdanosti je (vidi sliku 4. za granicu odstupanja ε uzeti zα σ x . pri poznatoj disperziji osnovnog skupa. pod uslovom da je poznata srednja vrednost µ • * Događaj (4. upadne u interval sa fiksnim granicama (zα.O. kao slučajna promenljiva. σ zameniti sa σ x Rezultat je: P X − µ < zα σ x = 2Φ( zα ) = γ Dakle. tako definiše granice verovatnog intervala za X .2b) uz zadatu verovatniću γ. za srednju vrednost osnovnog skupa µ. Zaključujemo da. koga možemo zvati verovatan interval za uzoračku srednju vrednost.1) može interpretirati na dva različita načina: • Relacija (4. izračunat iz datog uzorka. P ( X 0 ≥ zα ) = α Zaista.1).2b) µ − zα σ x < X < µ + zα σ x X − zα σ x < µ < X + zα σ x pa se jedn. (4.3) gde je zα definisano jednačinom Φ ( zα ) = 1− α i zvaćemo ga koeficijent pouzdanosti (J. po definiciji P (θ1 < θ < θ* ) = γ = 1 − α 2 predstavlja interval poverenja za nepoznatu srednju vrednost µ.1): ona standardizovane slučajne promenljive sa normalnom raspodelom za koju važi. glasi: (x − z σ / α n .• • • apsolutno odstupanje ∆X zameniti sa X − µ . ili µ = x ± zα σ / n ) (4.

zα γ 0.5 )   X −µ α = P X − µ ≥ z α σ x = P ≥ zα  = P ( X 0 ≥ zα )   σ x   ( ) f 0 (x ) = 1 − x2 e 2π 2 Slika 6. Ako je greška merne metode. σ = 100C.3a U Tab. Tako.96 2. interval poverenja srednje vrednosti merenih temperatura peći: 50 . koji sa zadatom verovatnoćom γ obuhvata nepoznatu ali fiksnu vrednost µ.58 Treba zapaziti da su granice intervala poverenja (4. ako bi postupak uzimanja uzorka i određivanja intervala poverenja ponavljali.64 1.95 0. date su vrednosti koeficijenta pouzdanosti za tri nivoa pouzdanosti γ.1 .95. da bi preciznost procene odstupanja tačne temperature od izmerene (sa datim nivoom pouzdanosti) bila 50C? Rešenje a) Za γ = 0.05 0. iz tablice : z1−α 2 = z0. Tabela 4.96 . Aritmetička sredina četiri izmerene temperature peći optičkim pirometrom je 22500C.1.90 0.(6.01 zα 1. b) Koliko je ponovljenih merenja temperature neophodno. a) Naći sa pouzdanošću od 95% interval u kome leži prava vrednost temperature. 4. ali bi mogli očekivati da će u (γ⋅100) % (recimo 95%) svih slučajeva izračunati interval pouzdanosti obuhvatiti parametar µ.koeficijenti pozdanosti. koje se najčešće koriste u praksi.99 α 0.1. Jasno je sada zašto se za verovatnoću γ kaže da predstavlja nivo pouzdanosti intervalne ocene.975 = 1. Ilustracija jednačine 4. pa je. svaki put bi dobili drugačiji interval poverenja.10 0. Dakle interval poverenja predstavlja jedan slučajan interval.3) slučajne vrednosti ( X je slučajna veličina).

za veće uzorke iz bilo koje raspodele sa parametrima µ i σ.4) bez obzira na tip raspodele. za velike uzorke (n ≥ 30) je primenljiva i aproksimacija: s 2 = σ2 = σ2 ( ) ∗ pa se za veće uzorke (n ≥ 30) iz raspodele sa nepoznatom disperzijom. 51 .8 0C b) Preciznost procene predstavlja poluširinu intervala pouzdanosti.35 Odnosno u Excelu ovo izračunavanje izgleda ovako: Usvaja se kao minimalan broj neophodnih merenja: n = 16 Aproksimacija za velike uzorke iz raspodele sa nepoznatom disperzijom U skladu sa centralnom graničnom teoremom.92 n n n ≥ 3. x + zα s / n . prava temperatura peći. σ n ).odnosno.2 < t <2259.96 ≤ 5 ⇒ n ≥ 3. S druge strane. ili ) µ = x ± zα s / n (4. t leži u intervalu 2240. primenljiva je aproksimacija da aritmetička sredina X ima normalnu raspodelu N ( µ. interval aproksimira intervalom: (4.3) (x − z s / α n .92 2 = 15. pa je uslov: σ 10 z1−α 2 ⋅ = 1. sa pouzdanošću od 95%.

a) Odrediti granice u kojima se nalazi srednja masa čokolada “od 100grama”. b) Ponoviti proračun za nivo pouzdanosti 99%.64 . čija je deklarisana masa 100g (prva kolona tabele).Primer 4. zα = 1. pa je poluširina intervala pouzdanosti: 52 . c) Da li se sa pouzdanošću od 90% može tvrditi da je srednja masa čokolade “od 100grama” manja od nominalne (100g). tako da ukazuje na poremećaj u procesu? Da li se ista tvrdnja može dati i sa sa pouzdanošću od 99% ? Rešenje Najpre izračunavamo uzoračku srednju vrednost i uzoračku disperziju iz formula za grupisane podatke a) Za pouzdanost 90%.2 Obavljeno je 100 merenja mase čokolada. sa pouzdanošću od 90%.

zα = 2. a) Ako je poznata greška metode.9.46 g b) Za pouzdanost 99%.µ = 99.06 ± 0. σ). 99.58 . 99. Primer 4.raspodeli.2 Ocena srednje vrednosti normalne raspodele nepoznate disperzije U slučajevima kada je disperzija σ2 nepoznata i uzorak nije veliki (n < 30) određivanje intervala pouzdanosti srednje vrednosti populacije sa normalnom raspodelom N (µ. Prema očekivanju.1 %.06 − 0. bazira se na Studentovoj ili t . Odrediti interval u kome sa pouzdanošću γ = 95% leži pravi sadržaj bakra. srednja masa proizvedene čokolade manja od deklarisane. sa povećanjem nivoa pozdanosti smanjena je preciznost intervalne ocene (širi interval) c) Sa pouzdanošću γ = 0.46. σ = 2.06 + 0.60.5 b) Iz datog uzorka procenjena je greška metode.1 53 .46) ⇒ (98.52 ) Pošto taj interval ne obuhvata nominalnu vrednost 100g i leži ispod te vrednosti. tj. srednja masa proizvedenih čokolada “od 100grama” leži u intervalu: (99. s = 2. 4. sa datom pouzdanošću možemo da tvrdimo da je srednja vrednost populacije.3 Procenat bakra u nekoj supstanci meren je 6 puta i aritmetička sredina 6 merenja je x = 14.

Rezultat funkcije je vrednost za koju Studentova raspodela „t“ ima zadatu verovatnoću.Na osnovu ovih podataka prema formuli se na sledeći način izračunava interval: Kada je poznata procenjena greška metode.α pomoću funkcije TINV. verovtanoća je 1-0.α. opcije Function. Sintaksa: TINV(Probability.x). i upisuje se u polje Deg_freedom. koja se dalje koristi za izračunavanje intervala po formuli: 54 . a broj stepeni slobode je n-1=6-1=5. Funkcija se poziva iz padajućeg menije Insert. što se i upisuje u polje Probability.95=0.05. izračunava se td. U konkretnom slučaju kako je pouzdanost 95%. Deg_freedom – je broj koji označava broj stepeni slobode karakterističan za raspodelu. i odabirom TINV iz statističkih funkcija. Deg_freedom) Probability – verovatnoća da vrednost x bude izvan intervala (–x. Dobijeni rezultat je vrednost td.

b * = −0. 3. 3.179mg. dobija se kao b = b* ± t9. koji sadrži beskonačan broj svih mogućih rezultata određivanja berilijuma u datoj probi. Rezultati ponovljenih analiza (mg) su: 3. b: b = µ − 3.05 Iz datog uzorka izračunava se: s 10 x = 3. 3. interval pouzdanosti za njenu srednju vrednost b. 3. Srednja vrednost x se izračunava pomoću funkcija AVERAGE. 3.177.167.177.177.179 sa 95% nivoom pouzdanosti.173.169 a) Proceniti interval pouzdanosti za sistematsku grešku (bias) metode.177. Radi provere tačnosti metode. 3.179 . gde je µ srednja vrednost zamišljenog osnovnog skupa. fotometrijskom titracijom je određivan berilijum u probi sa poznatom količinom berilijuma od 3.1733.4. 3.Primer 4.0. 3.0057 Zatim se pomoću funkcije TINV izračunava t: 55 .169.177. 3. Rešenje Prvo sve podatke treba uneti u tabelu na sledeći način: a) Ocena sistematske greške iz datog uzorka od 10 merenja je: b* = x − 3.171.

s se izračunava pomoću funkcije STDEV Funkcija STDEV procenjuje standardnu devijaciju na osnovu uzorka. Interval je dalje : Primer 4. number2.. je 1 do 30 brojeva koji se odnose na uzorak populacije.) Number1.5 Za uzorke u Primeru 3. number2. izborom opcije Function . Sintaksa: STDEV(number1.. Funkcija STDEV poziva se iz menija Insert. To može da bude i samo jedan niz ili referenca niza umesto argumenata rastavljenih zarezom.2 izračunati intervalnu ocenu standardnog odstupanja sa pouzdanošću 90%. Statistical . Rešenje: Prvo treba formirati sledeću tabelu: 56 . STDEV..

Rezultat funkcije je inverz funkcije raspodele hi.95 = 6. Deg_freedom) Probability .α 2 = χ14. Kada se zadda vrednost verovatnoće. rezultat će biti vrednost greške #N/A. Pa je : 57 . Funkcija CHIINV do rezultata dolazi iteracijama.57. χ14.Zatim treba upisati sledeće podatke i izračunati disi2 i d Dalje se izračunava s2 i s po formuli: 2 2 2 2 Pomoću funkcije CHIINV izračunava se : χ14. Sintaksa: CHIINV (Probability. Ako funkcija ne kovergira ni posle 100 iteracija.69 Funkcija CHIINV se takođe nalalazi u statističkim funkcijama. Deg_freedom – broj stepeni slobode.1− α 2 = χ14.verovatoća raspodele hi-kvadrat za koju se izračunava x.kvadrat.05 = 23. 0. 0. funkcija CHIINv pravi iteracije dok se ne dobije rezultat tačan do ±3 10-7.

58 .

5. Analiza korelacije 59 .

• ako postoji korelacija. umesto sa dva nevezana ili nezavisna uzorka: (xi .2..1). u xy koordinatni sistem. na bazi paralelnog praćenja njihovih vrednosti.. Prvi korak u analizi korelacije je ucrtavanje uređenih parova (xi. recimo čvrstinu. yi). recimo građevinskom. da li je ona slaba ili jaka. vezanim uzorkom (5.1) ili tzv.. Slika 5. i = 1. već stohastička veza između ta dva obeležja. c) negativna 60 . tj. kao tačaka. i = 1. • da li je ona pozitivna ili negativna.Predmet ove glave je analiza međuzavisnosti (korelacije) dve neprekidne slučajne promenljive. na neko svojstvo tog materijala. da li sa porastom sadržaja posmatrane komponente čvrstina građevinskog materijala raste ili opada. • ako postoji korelacija..1. Drugi primer je uticaj sadržaja neke komponente u složenom materijalu. Želimo metodama statistike da. i = 1.m ) gde su merenja xi i yi nepovezana. yi )... Dijagram rasipanja Za statističku analizu korelisanosti dve slučajne promenljive (obeležja) X i Y.n ) i ( yi ... Na osnovu rasporeda tačaka u dijagramu. da li je ona linearna ili nelinearna. na osnovu merenja.2. može se grubo proceniti: • da li postoji stohastička zavisnost promenljivih (korelacija). • koliko je ta korelacija izražena (jaka). n (5. b) slaba pozitivna. dođemo do zaključka da li posmatrani sadržaj komponente utiče na čvrstinu građevinskog materijala i uz to. Najočigledniji primer međuzavisnosti dve slučajne veličine su visina i masa čoveka i u pitanju je ne funkcionalna.2.. Ilustracije linearne korelacije: a) jaka pozitivna. neophodno je raspolagati parovima (odgovarajućih) vrednosti promenljivih: (xi .. Dobijeni dijagram se naziva dijagram rasipanja (scatter diagram).

znači da dvodimenzionalna promenljiva (X. jer se tačke rasipaju oko neke krive. Konačno. što znači.5. u pitanju je jaka korelacija. gde su velike vrednosti za X praćene uglavnom malim vrednostima za Y.y y a) x b) x Slika 5.1a).1). ograničićemo se na linearnu korelaciju. eksperimentalne tačke leže oko neke prave. na kojima su eksperimentalne tačke raspoređene duž neke prave ili krive ukazuju na (funkcionalnu) zavisnost uslovne srednje vrednosti slučajne promenljive Y od druge promenljive X. korelacija je slaba (Sl. tj.Y). nema ni pozitivnog ni negativnog trenda.2b. U ovom materijalu.1a .2a ilustruje slučaj nelinearne korelacije ili nelinearne stohastičke veze.2a). 5. linearno povezane. u paru sa velikim vrednostima X. na Sl.Y) ima normalnu raspodelu.b). ne uočava se povezanost između X i Y. linija na dijagramu rasipanja.1).c. uglavnom. Dalje. funkcije (linije) regresije: µ y x = ϕ1 ( x) Pri tom. • da će se statistička analiza bazirati na pretpostavci o normalnoj raspodeli dvodimenzionalne promenljive (X. što daje osnovu za pretpostavku da su X i Y približno ili tačno. (a) Nelinearna korelacija. pa zaključujemo da su one nezavisne ili nekorelisane. 5. predstavlja u stvari grubu ocenu iz datog uzorka (5. Ako tačke leže blizu prave (Sl 5.1a. ukazuju na pozitivnu korelaciju ili pozitivan trend. u blizini koje leže eksperimentalne tačke.5. Slike (5. jer su velike vrednosti za Y . • da će predmet analize biti uzorački koeficijent korelacije. dok Sl. Iz teorije verovatnoće znamo da dijagrami (5. a ako je rasipanje tačaka oko prave veliko. kao mera jačine i pokazatelj pozitivne ili negativne korelacije 61 . (b) Nema korelacije Na slikama 5. ako je zavisnost pravolinijska.1a-c. Slika 5.1c ilustruje negativnu korelaciju ili trend.2.

Smena izraza (5. 1990] datog u Tabeli 5. dobijaju se iz vrednosti statistike S2.14a).3) i (5.2) i transformacije analogne onoj.6) 2 n     n∑ x 2 −  ∑ x   n∑ y 2 −  ∑ y        i =1 i  i =1 i   i =1 i  i =1 i      U matematičkoj statistici se dokazuje da je ocena koeficijenta korelacije ρxy dobijena formulom (5. rxy ≤ 1 (5. sx = 1 n −1 ∑ ( xi − x ) 2 .1) dobićemo iz ocena kovarijanse σ xy .3) a sxy kao: s xy = tj.1. σy. i standardnih odstupanja σx. daju sledeću praktičnu formulu za izračunavanje uzoračkog koeficijenta korelacije: .16b). 62 .5.4) S xy = 1 n ∑ ( X i − X )(Yi − Y ) n − 1 i =1 (5. može se dati ocena jačine linearne korelacije na osnovu empirijskog pravila [Vukadinović.6) konzistentna i asimptotski nepristrasna.2) Nepristrasne ocene sx i sy standardnih odstupanja. i =1 i =1 i =1 n n 2 rxy = n∑ xi yi − (∑ xi )(∑ yi ) n n n n Iz izračunate vrednosti uzoračkog koeficijenta korelacije. i =1 n 2 sy = 1 n −1 ∑(y i =1 n i − y)2 (5.4) u (5. koja je primenjena za izvođenje praktične formule za računanje uzoračke disperzije (4. iz istog uzorka: rxy = s xy sx s y (5.1 Uzorački koeficijent korelacije Ocenu koeficijenta korelacije slučajnih promenljivih X i Y : ρ xy = σ xy σ xσ y iz uzorka (5. kao vrednost statistike: 1 n ∑ ( xi − x )( yi − y ) n − 1 i =1 (5.5) za koju se može pokazati da predstavlja nepristrasnu ocenu kovarijanse σ xy (3.

(5. Tabela uz Primer 5.1.1 Primećeno je da je visok sadržaj supstance A u sirovini.Jačina linearne korelacije rxy r ≤ 0. Kao meru jačine linearne veze između sadržaja supstanci A i B. obično praćen i visokim sadržajem supstance B.5 < r < 0. Radi utvrđivanja eventualne linearne korelacije između sadržaja dve komponente izvršeno je merenje sadržaja A i B u 10 slučajnih uzoraka sirovine.Tabela 5. praćen je porastom sadržaja druge. rxy = 10 ⋅ 9228 − 499 ⋅174 10 ⋅ 27115 − 499 2 10 ⋅ 3182 − 174 2 = 0.7 0.3 0.9 jačina linearne veze: neznačajna korelacija značajna korelacija jaka korelacija vrlo jaka korelacija Primer 5.1 x (% A) 67 54 72 64 39 22 58 43 46 34 y (% B) 24 15 23 19 16 11 20 16 17 13 174 x2 4489 2916 5184 4096 1521 484 3364 1849 2116 1156 27175 y2 576 225 529 361 256 121 400 256 289 169 3182 xy 1608 810 1656 1216 624 242 1160 688 782 442 9228 ∑ 499 Rešenje Tačke (xi. Rezultati su dati u prve dve kolone Tabele 5.1 . Pomoćni proračuni su dati u tabeli.9 r > 0.7 ≤ r ≤ 0. yi) treba ucrtati u dijagram rasipanja. mže se izračunati po jedn.933 63 .6) uzorački koeficijent korelacije. Očigledan je pozitivan linearan trend: porast sadržaja jedne suspstance.

30 25 20 y(%B) 15 10 5 0 0 10 20 30 40 x(%A) 50 60 70 80 Dakle uzorački koeficijent se može izračunati po formuli. Uzorački koeficijent korelacije može se izračunati i korišćenjem funkcije PEARSON. Array2 – je skup zavisnih podataka. rezultat je Pearson-ov koeficijent korelacije r koji pokazuje linearnu korelaciju dva skupa podataka. ali postoji i znatno jednostavniji način za njegovo izračunvanje. gde nisu potrebni pomoćni proračuni. Sintaksa: PEARSON(Array1. Funkcija PEARSON nalazi se u statističkim funkcijama. Array2) Array1 – je skup nezavisnih podataka. 64 .

u pitanju je vrlo jaka linearna veza. tražiti u obliku: y = y + rxy sy sx ( x − x ) = b0 + b1 x odakle slede formule za izračunavanje nagiba b1 i odsečka b0: 65 . zaključili da posmatrane slučajne promenljive nisu nezavisne. Regresionu pravu y(x).36b) σx (y −µy) σy Dobijene pravolinijske zavisnosti zvaćemo regresione prave (regression lines) i iz njih možemo da procenimo ili predvidimo (predict) vrednost jedne slučajne promenljive na osnovu vrednosti druge.5. linearnih regresionih funkcija: µ y / x = µ y + ρ xy µ x / y = µ x + ρ xy σy σx (x − µx ) (3. koje predstavljaju ocene iz datog uzoraka (5. 5.2 Regresione prave Ako smo na osnovu veličine uzoračkog koeficijenta korelacije rxy. kao ocenu regresione funkcije (3.1).35b) ćemo.1). logično.Prema empirijskom kriterijumu (Tab. korisno je izračunati koeficijente u pravolinijskim zavisnostima jedne od druge promenljive.35b) (3.

5a) c0 = x − c1 y (5. dobijamo kao ocenu regresione funkcije (3. Za x = 55.7b) Slično.36b): x = x + rxy i formule za nagib c1 i odsečak c0 su: c1 = rxy s x s xy = 2 = sy sy n∑ xi yi − (∑ xi )(∑ yi ) i =1 i =1 n n n   n∑ yi2 −  ∑ yi  i =1  i =1  n n i =1 2 (5. odnosno procenu sadržaja supstance B: 66 . ako ona sadrži 55% supstance A b) proceniti sadržaj komponente A u sirovini. Parameti se mogu izračunati korišćenjem statističkih funkcija SLOPE i INTERCEPT. računa se y iz regresione prave. regresionu pravu x(y). ako ona sadrži 20% supstance B Rešenje a) Traženu procena dobija se iz regresione prave y(x). potrebno je a) proceniti sadržaj komponente B u sirovini.8b) Primer 5.7a) b0 = y − b1 x sx ( y − y ) = c0 + c1 y sy (5.2 Iz podataka datih u prethodnom primeru.b1 = rxy sy sx = s xy s 2 x = n∑ xi yi − (∑ xi )(∑ yi ) i =1 i =1 n n n   n∑ xi2 −  ∑ xi  i =1  i =1  n n i =1 2 (5. Dakle prvo je potrebno izračunati parametre ove prave.

Sintaksa: INTERCEPT(Known_y's. ne računa se iz prethodno dobijene prave (rešavajući njenu jednačinu po x). Sintaksa: SLOPE(Known_y's. već iz prave. Known_x's) Known_y's . Rezultat funkcije INTERCEPT je tačka preseka linearne regresije sa y osom. koja predstavlja ocenu regresije x po y i čiji su parametri: 67 . Known_x's) Known_y's .Rezultat funkcije SLOPE je nagib linearne regresije.je matrica ili skup ćelija zavisnih numeričkih pojedinačnih podatak. Known_x's – je skup nezavisnih pojedinačnih podataka. b) Procena sadržaja x supstance A za dati sadržaj y supstance B. Known_x's – je skup nezavisnih pojedinačnih podataka.je matrica ili skup ćelija zavisnih numeričkih pojedinačnih podatak.

procenjeni sadržaj x druge komponente biće: x = b0 + a1 y = −11. postavlja se pitanje da li ona ukazuje na postojanje linearne korelacije između slučajnih promenljivih X i Y .Y) ima dvodimenzionalnu normalnu raspodelu. y = 20. oko nule kao njene srednje vrednosti.6). tada slučajna promenljiva: T= Rxy n − 2 1 − Rxy 2 (9.obim uzorka (5.9) gde su: n .3 Provera značajnosti korelacije Ako je dobijena vrednost uzoračkog koeficijenta korelacije (5. s obzirom na jaku korelaciju (rxy > 0.9) Teorijska osnova za formulisanje testa je sledeći stav (teorema): Ako slučajna promenljiva (X. 5. Zato proveravamo statističku značajnost izračunatog uzoračkog koeficijenta korelacije ili. ili je samo rezultat slučajnih varijacija vrednosti statistike Rxy. definisane formulom (5. približavanje linearne stohastičke zavisnosti.9).6 + 3. tj.1) 68 . drugim rečima hipotezu: H 0 : ρ xy = 0 (5. sa nultom vrednošću koeficijenta korelacije ρxy (X i Y su nezavisne). To se moglo očekivati.6) mala po apsolutnoj vrednosti.53 ⋅ 20 = 59% što se veoma dobro slaže sa eksperimentalnom vrednošću (58%).Za sadržaj komponente B. funkcionalnoj.

% y. 2 α T= vrednost za Rxy se računa iz Primer 5. Rešenje Pomoću funkcije PEARSON izračunava se koeficijent korelacije r Testira se hipoteza: H0: ρ = 0 Pošto je poznato da povećanje sadržaja kalaja u leguri po praviliu snižava temperaturu topljenja legure (negativna korelacija) to se. 0C x.6) ima t .Rxy . bira jednostrani test.1 513 44.5.8 513 44. 2 α t > t n − 2.2 stepena slobode. u cilju smanjenja rizika prihvatanja pogrešne nulte hipoteze. Odatle slede kriterijumi značajnosti uzoračkog koeficijenta korelacije.6 514 45.5 521 44.2 Tabela 5.5 514 Proceniti koeficijent korelacije između sadržaja kalaja i tačke topljenja i testirati njegovu značajnost sa α=0.3 526 45.9 512 45.2 519 44.9 525 44.raspodelu sa d = n .7 521 44.1 522 44. %) i odgovarajuće izmerene tačke topljenja (y.0 514 44.1 513 43.2 . odnosno odbacivanja hipoteze (5.9) i dati su u Tab. 0C) date su u prve dve kolone tabele: x. tj. % y.uzorački koeficijent korelacije (5.0 537 45.4 511 44. 0C 44.2 512 46.Testiranje hipoteze H0: ρ = 0 Alternativna hipoteza. H1 ρ≠0 ρ>0 ρ<0 Statistika: Rxy n − 2 1 − Rxy 2 Kriterijum odbacivanja hipoteze: t > t n − 2 . alternativna hipoteza: H1: ρ < 0 69 .1 513 45.3 Izmerene vrednosti sadržaja kalaja u leguri (x.05.7 510 45.α t > t n − 2.

Tako. Tako. neophodno je dobro poznavati njihovu fizičko-hemijsku prirodu s jedne strane.302 16 1 − 0. visoka vrednost rxy može biti rezultat delovanja treće promenljive. sa kojom su rasle posmatrane dve jeste vreme. ima smisla računati samo kada ima indikacija (teoretska znanja. Ako je veza nelinearna. primer "treće" ili "nekontrolisane" promenljive je temperatura. Hunter W i Hunter S. na kraju svake godine. koja deluje na veliki broj fizičko-hemijskih parametara i ako se ne kontroliše (drži konstantnom) u toku praćenja neke dve veličine. Takođe je važno imati u vidu da statistički značajna vrednost koeficijenta korelacije nije dokaz da između posmatranih promenljivih postoji kauzalna (suštinska) veza. Instruktivan i duhovit primer daju Boks i sar.75.4 Interpretacija koeficijenata korelacije S obzirom na smisao teoretskog koeficijenta korelacije ρxy. U periodu od 7 godina. Da li iz toga treba zaključiti da je porast nataliteta prouzrokovan porastom broja roda (rode donose decu?)? U ovom primeru. a koja je prouzrokovala istovremene promene posmatranih promenljivih i privid njihove međuzavisnosti.27. treća promenljiva. je određivan broj stanovnika Oldenburga i broj roda i zapažena je jaka linearna korelacija između te dve veličine. dijagram rasipanja) da je veza između posmatranih promenljivih linearna ili približno linearna. uzorački koeficijent korelacije r xy nije merilo jačine korelacije i može biti i blizak nuli.27 < 1. 5. i vrlo pažljivo kontrolisati eksperimente.Vrednost T . 70 . t16.302 2 = −1. s druge strane. koja se menja u toku eksperimenata. njegovu procenu rxy.statistike izračunava se pomoću funkcije TINV.75 Pošto je 1.1 = 1. [Box G.. a zatim se po formuli računa kritična vrednost: t= r n−2 1− r 2 = − 0. 0. izvodimo zaključak da rezultati merenja ne ukazuju na značajnu korelaciju između sadržaja kalaja i tačke topljenja legure. U laboratorijskim i pogonskim merenjima. može stvoriti privid kauzalne veze izmedju njih. da bi se utvrdila suštinska povezanost između dve promenljive. uprkos jakoj vezi. 1978].

min Temper.01 c) Izračunati odsečak regresione prave y(x) sa jednom decimalom i nagib sa 4 decimale.5 11. y za x = 6 i x za y = 9 Testirati značajnost koeficijenta korelacije sa nivoom značajnosti α = 0. prema kome temperatura hlađenog medijuma. 0C): x.6 1175 37.0 28.05 5. N Istezanje.7 a) Nacrtati dijagram rasipanja i na osnovu njega proceniti jačinu i znak korelacije b) Izračunati koeficijent korelacije (sa tri decimale) i proveriti njegovu značajnost sa nivoom α = 0.3 Dati su eksperimentalni podaci: x: y: a) b) c) d) e) 6 8 5 7 8 7 8 10 7 5 6 8 10 10 4 6 9 8 7 6 Nacrtati dijagram rasipanja i na osnovu njega proceniti jačinu i znak korelacije Izračunati koeficijent korelacije na tri decimale Izračunati koeficijente regresionih pravih y(x) i x(y).0 1150 29. mm 2 2 5 23 8 62 11 119 15 223 Izračunati na tri decimale koeficijent korelacije i na osnovu njegove vrednosti oceniti jačinu korelacije i njen znak.3 1125 19. sa tačnošću od 3 decimale Izračunati.6 1225 57. sa jednom decimalom.2 21. 5. 5. % 1100 8.5 50.2 60.5 30. na različitim temperaturama (x. x izvršena su merenja i dobijeni rezultati: Vreme. %) neke supstance u procesu.ZADACI 5.5 40 42. 0C y. d) Izračunati prinos na temperaturi 1160 0C 71 .4 Praćen je prinos (y. % x.1 Radi provere Njutnovog zakona hlađenja.2 Radi provere Hukovog zakona (linearna veza između jačine sile i deformacije) dobijeni su sledeći rezultati merenja: Sila. 0C 4 46 8 34 10 30 12 26 16 24 22 20 Izračunati na tri decimale koeficijent korelacije i na osnovu njegove vrednosti oceniti jačinu korelacije i njen znak. 0C y. y približno linearno opada sa vremenom.8 1200 50.3 62.

Regresiona analiza 72 .6.

1.1). tako da regresiona jednačina..k. a temperaturu topljenja legure zavisno-promenljivom. • Ocenjivanje regresionih koeficijenata βj. a drugu (Y) zavisno-promenljivom.. • Statističku analizu dobijene jednačine: preciznost predskazivanja.6) pravolinijsku zavisnost: µy/x = µy + ρ sa teorijskim koeficijentima regresije: σy σx ( x − µ x ) = µ y − β1µ x + β1 x 1 24 4 3 β0 β1 = ρ σy σx .Y).k parametri ili koeficijenti. β k ) (6. Izbor oblika regresione jednačine (empirijske formule) Iz definicije regresione funkcije.2) zovu predstavlja što bolju aproksimaciju regresione funkcije (6.. b1 . izveli smo (Pogl.1). jednu promenljivu (X) smatramo nezavisno-. Budući da daje srednju vrednost promenljive Y za zadatu vrednost X.. β1 ..Često..k. b0 . j = 0.. sledi da izbor oblika regresione jednačine (6. koje se nazivaju regresione jednačine ili empirijske formule (jednačine)... j = 0. koji figurišu u funkciji (6.1.1) i zovu se pravi ili teorijski regresioni koeficijenti. logično sadržaj kalaja u leguri smatrati nezavisno-. Koeficijenti bj se empirijski regresioni koeficijenti ili parametri u empirijskoj formuli.. tj. od dve slučajne promenljive.1) zahteva poznavanje raspodele verovatnoće dvodimenzionalne slučajne promenljive (X... µ y x = ϕ( x..1.1) gde su βj. određivanje njihovih približnih vrednosti: b j. 3. najbolja funkcija za predskazivanje vrednosti Y za dato X je regresiona funkcija: µ y x = ϕ1 ( x) Tako je u mnogim praktičnim problemima u nauci i tehnici od interesa naći približnu regresionu funkciju i predmet regresione analize je formulisanje približnih regresionih funkcija. ako je ona normalna.... j = 0. Tako je u Primeru 8. bk ) (6. β0 .. y ( x) = ϕ( x. Zadatak regresione analize obuhvata: • Izbor oblika regresione funkcije.. Tako. intervali poverenja teorijskih regresionih koeficijenata itd. β0 = µ y − β1µ x Regresiona jednačina ili empirijska formula tada glasi: y ( x) = b0 + b1 x 73 .3. na osnovu uzorka (8...

dvodimenzionalna raspodela nije poznata. Praktično. j = 0. problem izbora oblika regresione jednačine ili empirijske formule se rešava približno na osnovu: • teoretskih znanja i iskustva u vezi sa uticajem neke fizičke veličine X na drugu fizičku veličinu Y • dijagrama rasipanja eksperimentalnih tačaka ( xi .7a. dakle one koje bi dobili primenom metode maksimalne verodostojnosti (Pogl.... kao empirijske formule se često koriste polinomi drugog i višeg stepena: y ( x) = b0 + b1 x + b2 x 2 + Lbk x k (k ≥ 2) Ako odabrana empirijska formula.. već ima čisto empirijski karakter. Drugim rečima. poznato je da temperatura ima jak uticaj na brzinu hemijske reakcije.2 (Jedn.. U hemijskoj kinetici se izraz za brzinu r nepovratne hemijske reakcije.. pri određivanju koeficijenata u Arenijusovoj zavisnosti konstante brzine y x 74 .2. Na osnovu poznavanja osnovnih zakonitosti u hemijskoj kinetici..4). Statistička analiza regresione jednačine Ovo je veoma složen problem...k kao ocenama teorijskih regresionih koeficijenata. već determinisana (kontrolisana) promenljiva. 8..c2.4) nema kao osnovu regresionu funkciju (3. bk ) (6.. b0 .3) y ( x) = f ( x. bj.. 4. eksperimentalne vrednosti xi.2..čiji parametri b0 i b1 predstavljaju ocene teorijskih koeficijenata β0 . tada se naravno ne može govoriti o parametrima bj... β1 i intuitivno smo ih izveli u Pogl.. i = 1. Tako se pri ispitivanju uticaja temperature na brzinu neke reakcije. u opštem slučaju rešiv samo uz pretpostavku da nezavisna promenljiva nije slučajna.n u uzorku (8. empirijsku jednačinu k(T) tražimo u obliku poznate Arenijusove (Arrenius) formule: k (T ) = k0 e − E / RT = b0 e − b1 / T Zbog svoje jednostavnosti i osobine da mogu dobro da aproksimiraju različite funkcije.31a)...1) su unapred odabrane ili fiksirane. yi ). (6. mada zavisi od temperature.. b1 .. j = 0.. Tako je on.. meri temperatura T(K) i eksperimentalno određuju odgovarajuće vrednosti konstante brzine hemijske reakcije k. kao funkcija uzorka...k .. c2 . Na primer.. n Na primer. a k(T) se zove konstanta brzine hemijske reakcije... 8. molske koncentracije reaktanata.. jer zahteva poznavanje raspodela empirijskih regresionih koeficijenata.b).1. Kako u opštem slučaju. T ) = k (T ) f (c1 .)  3   s⋅m  gde su c1. ovaj uslov će biti zadovoljen ako su slučajne varijacije (greške merenja) u vrednostima slučajne promenljive Y mnogo veće od onih u vrednostima X ( σ 2 >> σ 2 ).1. Može se pokazati da te formule daju najverodostojnije ocene teorijskih regresionih koeficijenata.. najčešće traži u obliku:  mol  r (c1 . i = 1. c2 .

.5) 75 . Neka smo odabrali oblik empirijske formule (6..5 pokazali.n. bude manji od broja eksperimentalnih tačaka: k+1<n Traže se vrednosti parametara bj.. je ona za koju je suma kvadrata odstupanja merenja od te vrednosti najmanja.n i pretpostavimo da merenja imaju normalnu raspodelu i da ne sadrže sistematske i grube greške.2.hem.3).. Uzmimo na primer da je radi procenjivanja tačne vrednosti r neke fizičke veličine.. Određivanje parametara u empirijskoj formuli Neka raspolažemo eksperimentalnim tačkama (xi. bk ). takve da se računske vrednosti zavisno promenljive dobijene iz nje: yirac = f ( xi . i = 1.. n (6. Dobijamo je iz uslova minimuma funkcije S(r): n dS = −2∑ ( xi − r ) = 0 dr i =1 kao: r= 1 n ∑ xi = x n i =1 Prepoznajemo aritmetičku sredinu.k u odabranoj empirijskoj formuli.. i = 1.yi). b1 . reakcije od temperature. da su svih n vrednosti nezavisno promenljive u uzorku različite tj... i = 1. koju određujemo na bazi ponovljenih merenja. Prema principu najmanjih kvadrata. j = 0.. 6.. upravo jednaka tačnoj vrednosti merene veličine (Pogl.. za početak.2. Pretpostavimo. koja je. izvedeno n ponovljenih merenja. da nema ponovljenih merenja zavisno promenljive za jednu vrednost nezavisne... 4.. pri čemu je neophodno da broj parametara (k+1) u formuli.1 Metod najmanjih kvadrata Princip najmanjih kvadrata je formulisao Ležandr (Legendre): najverovatnija vrednost bilo koje veličine. sa rezultatima: xi. slučajne greške merenja temperature su daleko manje od slučajnih grešaka pri određivanju konstanti brzine reakcije (posredna merenja).. za koju smo u Pogl.2. pod uslovom da merenje ne sadrže sistematske i grube greške..4).2. b0 ..1. da predstavlja najverodostojniju ocenu srednje vrednosti rezultata merenja kao slučajne veličine.. kao najverovatniju vrednost za r uzimamo onu za koju suma kvadrata odstupanja: S (r ) = ∑ (xi − r ) i =1 n 2 ima minimum..

najmanje razlikuju od eksperimentalnih (iz uzorka): yi. (6..n eksperimentalnih od računskih vrednosti zavisno promenljive: S = S (b0 .1.. Slika 6.6...6). yi ). k ∂b j Jednačine (6..1..1). biraju se tako vrednosti parametara. funkcija samo nepoznatih parametara.. j = 0...n u smislu principa najmanjih kvadrata.7) Neka u uzorku.. n ima ponovljenih merenja zavisno promenljive Y pri jednoj vrednosti za x...Provlačenje krive između eksperimentalnih tačkaka Primetimo da je suma kvadrata odstupanja S.2. što znači da među vrednostima xi... i = 1.. Tada.. yi ). 76 . pri čemu je mera odstupanja krive od eksperimentalnih tačaka. a računske vrednosti yirac .n ima jednakih. b1 . Oni se dobijaju rešavanjem sistema jednačina. funkcije parametara. Problem izračunavanja parametara bj. i = 1.6).....2.. b1 .2. Geometrijski interpretirano.7) su u literaturi poznate pod nazivom normalne jednačine... (xi .. bk ) = ∑ ei2 = ∑ ( yi − yirac ) 2 i =1 i =1 n n (n > k + 1) (6.4) "provlači" što bliže eksperimentalnim tačkama (Sl.k se tako svodi na problem određivanja minimuma funkcije više promenljivih (6.. bk ) = 0. a to znači da suma kvadrata odstupanja ei... da se kriva (6. n su.6) bude najmanja. i = 1... jer su vrednosti (xi .2.. n poznate.. prema (6.. broj njenih vrednosti u grupisanom uzorku) veći od broja parametara (k+1) u empirijskoj formuli: m > k+1 važe sva prethodna razmatranja. i = 1.5)..2. uz uslov da je broj različitih vrednosti nezavisno promenljive m (tj...1 .6) i kojih ima tačno onoliko koliki je broj traženih parametara: ∂S (b0 . i = 1.... koji predstavljaju potreban uslov minimuma funkcije (6. suma kvadrata odstupanja (6.. j = 0..2. i = 1.

. tj.. • analizu adekvatnosti neke regresione jednačine Ako se neka regresiona jednačina oceni kao adekvatna (adekvatno opisuje zavisnost srednje vrednosti slučajne promenljive Y od kontrolisane promenljive x). deli se razlikom ukupnog broja eksperimentalnih tačaka i ukupnog broja parametara u formuli.2..8) Kao što vidimo. Da bi smo definisali opštu meru jačine veze (linearne ili nelinearne) između slučajne promenljive Y i kontrolisane promenljive x. onda njeno srednje kvadratno odstupanje s2: • daje nepristrasnu ocenu disperzije slučajne promenljive Y • predstavlja meru jačine stohastičke zavisnosti Y od x (ukoliko je s2 veće. bk ) Nekada smo međutim suočeni sa problemom da od više empirijskih jednačina. j = 0. b1 . razmotrićemo značenje dve sume kvadrata odstupanja izračunate iz uzorka (xi... yi. od eksperimentalnih podataka. Tako se mogu porediti regresione jednačine sa različitim brojem parametara.. koristi se srednje kvadratno odstupanje empirijske formule ili regresione jednačine (6... odaberemo najbolju. pri čemu je pri jednakim sumama kvadrata odstupanja za dve formule. definisano kao: s2 = ∑ ( yi − yirac ) 2 i =1 n n − (k + 1) = ∑(y i =1 n i − f ( xi . bk )) 2 n − (k + 1) (6. kao tražena mera. b1 . Za rešavanje tog problema.1. yi) i = 1..n. suma kvadrata odstupanja eksperimentalnih od računskih vrednosti iz dobijene empirijske formule.. čiji su parametri izračunati metodom najmanjih kvadrata. 77 . U skladu sa principom najmanjih kvadrata. Srednje kvadratno odstupanje (6.6. potrebna nam je neka mera odstupanja empirijske formule. bolja ona koja sadrži manji broj parametara. onu koja najbolje opisuje ili "fituje" (od glagola to fit) date eksperimentalne podatke. veza je slabija) 6. odnosno najmanje u određenom smislu odstupa od njih.. Suma: SST = ∑ ( yi − y ) 2 i =1 n predstavlja meru ukupne varijacije u eksperimentalnim vrednostima.3 Koeficijent determinacije Kao mera jačine linearne stohastičke veze između promenljivih služi koeficijent korelacije (Glava 5). Suma..4). b0 .2 Srednje kvadratno odstupanje empirijske formule Neka smo metodom najmanjih kvadrata odredili parametre bj..8) se u regresionoj analizi koristi za: • poređenje kvaliteta više regresionih jednačina. b0 ...k u odabranoj empirijskoj formuli (6.. koje mogu da sadrže različit broj paramatara.4): y ( x) = f ( x.

. n što kao rezultat ima vrednost SSF blisku nuli.. pod pretpostavkom da je forma regresione jednačine tačna.. oko aritmetičke sredine y kao odabrane referentne vrednosti..6) − y) 2 koji se zove koeficijent determinacije.4 Određivanje pravolinijske zavisnosti Pretpostavimo da srednja vrednost slučajne promenljive Y linearno zavisi od kontrolisane promenljive x: µ y x = β0 + β1 x (6.2. S obzirom na ovu osobinu.. koja daje ocene srednje vrednosti za Y. 6.. i = 1. će kao procene dati yirac ≈ y . koeficijent determinacije je pogodnija mera jačine veze između Y i x nego srednje kvadratno odstupanje s2 (6.. kao pogodna mera jačine veze između x i Y nameće se količnik dve sume: R2 = ∑(y i =1 n i =1 n rac i − y)2 ∑(y . b0 . b1 . Za koeficijent determinacije važi: 0 ≤ R2 ≤ 1 pa se on može interpretirati kao deo ukupne varijacije koji je objašnjen empirijskom formulom. Može se reći da SSF predstavlja objašnjenu (empirijskom formulom) varijaciju oko y .SSF = ∑ ( yirac − y ) 2 = ∑ ( f ( x. ona tačno reprodukovati eksperimentalne tačke : yirac = yi ..2..10) 78 . odnosno količnik dve sume blizak nuli: SSF ≈0 SST Drugi granični slučaj je funkcionalna veza između dve promenjive što znači da ni Y nije slučajna promenljiva. i = 1. n pa će količnik dve sume biti jednak jedinici: SSF =1 SST Dakle... i 0 ≤ R2 ≤ 1 (6. Tada će.8). odnosno da je: µy/x = µy empirijska jednačina. U slučaju da Y ne zavisi od x.. bk ) − y ) 2 i =1 i =1 n n meri varijacije računskih vrednosti koje daje regresiona jednačina.

Drugim rečima. izračunavamo parametre b0.. nakon prebacivanja poznatih vrednosti na drugu stranu jednačina.6). nakon deljenja jednačina sa (-2) i sređivanja: ∑ yi − nb0 − b1 ∑ xi = 0 i =1 i =1 n ∑ xi yi − b0 ∑ xi − b1 ∑ xi2 = 0 i =1 i =1 i =1 n n n Konačno... b1 dobijamo iz uslova minimuma sume kvadrata odstupanja eksperimentalnih od računskih vrednosti (6. ili drugim rečima. uzoračke regresione koeficijente b0. b1 (odsečak prave i njen nagib) u empirijskoj formuli: y = b0 + b1 x (6. β1 .13a) (6. b1 ) = ∑ ( yi − yirac ) 2 = i =1 n ∑[ y i =1 n i − (b0 + b1 xi )]2 Primenjujući pravilo da je prvi izvod sume jednak sumi prvih izvoda.13b) koje predstavljaju normalne jednačine (6. i = 1.2. M (E ) = 0 (6..7a.10) i slučajnog odstupanja (greške) E : Y = βo + β1 x + E.12) Metodom najmanjih kvadrata. Rešenja dobijenog sistema jednačina se mogu prikazati u obliku identičnom formulama (5. dobijamo sistem od dve linearne jednačine po traženim parametrima: n  n  nb0 +  ∑ xi b1 = ∑ yi i =1  i =1  n  n   n   ∑ xi b0 +  ∑ xi2 b1 = ∑ xi yi i =1  i =1   i =1  (6.11) Iz uzorka (xi . zavisno promenljivu Y možemo da prikažemo u obliku zbira njene srednje vrednosti (6. koja u slučaju formule (6.12) izgleda: S (b0 . n procenjujemo vrednosti teorijskih regresionih koeficijenata β0 . za uslove minimuma dobijamo: ∂S = ∂b0 ∂S = ∂b1 ∑ 2[ y i =1 n i − (b0 + b1 xi )](−1) = 0 − (b0 + b1 xi )](− xi ) = 0 ∑ 2[ y i =1 n n i odnosno.b): 79 .7) za slučaj pravolinijske regresije. yi ).

. s2 = kao vrednost statistike: 1 n 2 ∑ ( yi − b0 − b1 xi ) n − 2 i =1 1 n 2 ∑ (Yi − b0 − b1 xi ) n − 2 i =1 M S 2 = σ2 y (6.b).2.. s 2 y ∑y = 2 i − ( ∑ yi ) 2 / n n −1 (6.1 (6.n su nezavisna i imaju normalnu raspodelu metod najmanjih kvadrata daje saglasne i nepristrasne ocene regresionih koeficijenata: M (B j ) = β j .18) 2 2 gde su s x i s y srednji kvadrati odstupanja: s 2 x ∑x = 2 i − (∑ xi ) 2 / n n −1 .. i = 1. pri sledećim pretpostavkama: • • važi linearan model (6. j = 0.b1 = n∑ xi yi − (∑ xi )(∑ yi ) i =1 i =1 n n n   n∑ xi2 −  ∑ xi  i =1  i =1  n n i =1 2 (6.. pri konstantnoj temperaturi približno linearno opada sa porastom koncentracije CaCl2. na bazi podataka datih u prve tri kolone tabele − 80 .14b) D(E ) = σ 2 = const. x(%) u vodi.11) za merenja Yi.1 Zbog zajedničkog jona Cl rastvorljivost BaCl2. U Jedn..11a.n disperzija slučajnih varijacija zavisno promenljive Y je konstantna: (6.8). pokazuje se da srednjekvadratno odstupanje računskih vrednosti (6..16) S2 = (6. a) Formulisati empirijsku jednačinu za procenjivanje rastvorljivosti BaCl2 pri različitim sadržajima CaCl2 u vodi. y(%) u vodi. Bj su statistike čije se vrednosti računaju formulama (6.2.19) Primer 6. Uz to.. y • merenja Yi.15) identične onima koje daje metod maksimalne verodostojnosti. 6. i = 1.17) predstavlja nepristrasnu ocenu disperzije zavisno promenljive: ( ) Formuli (6.14a) b0 = y − b1 x Tako.16) ekvivalentna je sledeća: s2 = n −1 2 2 ( s y − b12 s x ) n−2 (6.12..

43 − 1. Iako funkcije SLOPE i INTERCEPT ne izračunavaju nagib i odsečak po metodi najmanjeg kvadrata.b) Proceniti rastvorljivost BaCl2 pri koncentraciji CaCl2 od 13%. 81 . nego se traže parametri koji daju najbolje slaganje sa eksperimentalnim podacima. x 0 5 8 10 15 20 58 y 32 25 20 17 11 5 110 x2 0 25 64 100 225 400 814 xy 1024 625 400 289 121 25 720 pa je empirijska prava: y = 31. Tabela uz Primer 6. rezultat će svakako biti dobar pa njihovo korišćenje ne predstavlja grešku.355 x U dijagram su ucrtane eksperimentalne tačke i dobijena prava.1 N0 1 2 3 4 5 6 ∑= Rešenje a) Nagib i odsečak u traženoj empirijskoj pravolinijskoj zavisnosti mogu se dobiti pomoću funkcija SLOPE i INTERCEPT.

35 30 25 20 y 15 10 5 0 0 5 10 x 15 20 25 y = -1.434 Series1 Linear (Series1) Slika uz Primer 6. (odabere se Linear).1 Prvo se nacrta dijagram na osnovu eksperimentalnih podataka. To se radi na sledeći način: Pošto je nacrtan dijagram desnim tasterom klikne se na neku od tačaka i odabere opcija Add Trendline. zatim se klikne na karticu Options 82 .3553x + 31. Nakon toga otvara se novi prozor u kome se bira tip linije. a zatim se dodaje prava (trendline).

dobijamo procenu odgovarajuće rastvorljivosti BaCl2: y = 31. 0C R.77 55 99.Gde se vrše ostala podešavanja vezana za pravu. a) izračunati temperaturni koeficijent otpornosti metala α. Ω 30 86. Potvrđuje se sa OK. x = 13 u dobijenu empirijsku jednačinu.2 Merene su električne otpornosti R metalnog provodnika na različitim temperaturama t: t.355 ⋅13 = 13. y = R. Rešenje a) Pošto su u datoj pravolinijskoj zavisnosti otpora od temperature: R(t ) = R0 (1 + αt ) = R0 + R0 αt = b0 + b1t odsečak i nagib jednaki: b0 = R0 b1 = R0α traženi temperaturni koeficijent α se dobija iz njih kao: α= b1 b1 = R0 b0 Uz x = t. i linija je na dijagramu.60 50 97. ukoliko se označi polje Display equation on chart. b) Smenom zadate rastvorljivosti CaCl2. koji je definisan jednačinom temperaturne zavisnosti otpora: R (t ) = R0 (1 + αt ) b) proceniti standardnu grešku primenjene metode merenja otpornosti.92 45 96. između ostalog može se na dijagramu prikazati i jednačina ove prave.77 60 101.82 Potrebno je iz podataka.67 35 92. računa se nagib i odsečak pomoću funkcija INTERCEPT i SLOPE: 83 .01 40 93.43 − 1.8% Primer 6.

i iz njih koeficijent α:

α=

b1 = 0.0062 b0

Dijagram rasipanja eksperimentalnih tačaka i regresiona prava su dati na slici uz primer.
104 102 100 98 96 94 92 90 88 86 84 30 40 50 60 70 Series1 Linear (Series1) y = 0.463x + 74.674

Slika uz Primer 6.2 b) Kao ocenu standardne greške merne metode σR, može se uz pretpostavke navedene u prethodnom tekstu, da uzmemo srednje kvadratno odstupanje (6.16):

sR =

1 n 7.125 2 ∑ ( yi − b0 − b1 xi ) = 5 = 1.43Ω n − 2 i =1

Koje se takođe može izračunati kvadriranjem rezultata dobijenog korišćenjem funkcije STEYX. Funkcija se nalazi u statističkim funkcijama, a njen rezultat je standardna greška predviđene vrednosti y za svako x u regresiji. Sintaksa: STEYX(Known_y's, Known_x's) Known_y's – niz ili skup zavisnih pojedinačnih podataka. Known_x's - niz ili skup nezvavisnih pojedinačnih podataka

84

Koeficijent determinacije i koeficijent korelacije

Koeficijent determinacije, kao opšta mera jačine veze između Y i x, u slučaju pravolinijske zavisnosti dobija oblik:

R =
2

∑(y
i =1 n i =1

n

rac i

− y)2 =
2

∑ (b
i =1 n

n

0

+ b1 xi − y ) 2
i

( 9.14 b )

∑(y

i

− y)

∑(y
i =1

=

∑b
i =1 n i =1

n

2 1

( xi − x ) 2
i

− y)

2

∑(y

− y)

2

2 sx =b 2 sy 2 1

(6.20)

2 2 gde su s x , s y srednji kvadrati odstupanja (6.19). Ako parametar b1 izrazimo preko koeficijenta

korelacije rxy, pomoću Jedn. (8.7a):

b1 = rxy

sy sx

dobijamo da je koeficijent determinacije jednak kvadratu koeficijenta korelacije:
2 R 2 = rxy

ili R = R 2 = rxy

što smo, s obzirom na značenje tih koeficijenata mogli da očekujemo. U slučaju linearne zavisnosti Y od x, R 2 dakle daje jačinu linearne veze, ali pošto je uvek pozitivan, ne daje (za razliku od rxy) informaciju o tome da li Y opada ili raste sa x.

85

6.5 Intervali poverenja odsečka i nagiba
Određivanje intervala poverenja odsečka β0 i nagiba β1 u pravolinijskoj regresionoj funkciji (6.10), zahteva poznavanje raspodela njihovih ocena, tj. statistika Bj, j = 0,1. Sa pretpostavkama navedenim u prethodnom poglavlju, može se pokazati da uzorački regresioni koeficijenti imaju normalne raspodele: Bj: N (β j , σb j ), j = 0,1 sa disperzijama:
2 σb1 =

(6.21)

σ2 y
(n − 1) s
2 x
n

= c1σ 2 y

(6.21a)

2 σb0 =

∑x
i =1

2 i 2 x

n(n − 1) s

σ 2 = c0 σ 2 y y

(6.21b)

2 gde je s x srednji kvadrat odstupanja (6.16), a c0 i c1 koeficijenti, definisani samim jednačinama

(6.21a-b). Formule (6.14a,b) pokazuju da su statistike Bj, j = 0,1 linearne kombinacije slučajnih promenljivih Yi, i =1,2,..,n, koje prema pretpostavkama imaju raspodele: Yi: N (β0 + β1 xi , σ y ), i = 1,2,..., n i tako relacije (6.21, 6.21a-b) slede iz osobine linearnosti normalne raspodele, tj. iz jednačina (2.57) i (2.58).
2 Ocene disperzija uzoračkih regresionih koeficijenata sb j , j = 0,1 dobijamo kada u Jedn.

(6.21a-b) umesto disperzije σ 2 zavisno promenljive, zamenimo njenu ocenu s2: y
2 sb j = c j s 2 , j = 0,1

(6.22)

koja se računa formulom (6.16) ili (6.18): Iz izloženog sledi, da standardizovana slučajna veličina:

Z=

B j − M (B j )

σb j

=

Bj − β j cj σy

, j = 0,1

(6.23)

gde su koeficijenti cj, j = 0,1 definisani jednačinama (6.21a,b) ima raspodelu N (0,1). Kao što smo se u Pogl. 6.2 upoznali, to dalje znači da bezdimenziona statistika:

T=

B j − M (B j ) Sb j

=

Bj − β j cj S

, j = 0,1

(6.24)

gde je statistika S definisana jednačinom (6.17), ima t - raspodelu sa d=n-2

86

j = 0.25) Primer 6.3 Za uzorak od 12 studenata dati su u tabeli brojevi poena osvojeni u testu inteligencije (x) i brojevi poena osvojeni na ispitu iz hemije (y): x: y: 50 74 50 76 55 76 55 85 55 81 55 74 65 85 65 90 65 94 70 87 70 98 70 91 a) Izračunati nagib i odsečak u empirijskoj pravolinijskoj zavisnosti y = b0 + b1 x b) Proceniti jačinu linearne veze c) Dati intervalne ocene za prave regresione koeficijente β0 i β1 sa nivoom pouzdanosti Rešenje a) Nagi i odsečak se izračunaju pomoću funkcija SLOPE i INTERCEPT.stepeni slobode. 95%. sa nivoom poverenja γ = 1-α: − t n − 2. da bi mogli da definišemo intervale poverenja teorijskih regresionih koeficijenata. Sada imamo sve što je neophodno.α s c j . 100 95 90 85 80 75 70 45 50 55 60 x 65 70 75 y 87 .α s c j + b j < β j < b j + t n − 2.1 (6.

Known_x's . 88 . odnosno koeficijent determinacije Sintaksa: RSQ(Known_y's.4% ukupne varijacije u bodovima ostvarenim na ispitu iz hemije objašnjeno varijacijama u broju bodova osvojenih u testu inteligencije (varijacija objašnjena regresionom jednačinom).6% ukupne varijacije u bodovima ostvarenim na ispitu je neobjašnjen. kao mera jačine linearne veze može se izračunati kao koren koeficijenta determinacije ili pomoću funkcije PEARSON: (jaka linearna veza.1) Na osnovu vrednosti koeficijenta determinacije.8.niz ili skup nezvavisnih pojedinačnih podataka Koeficijent korelacije. možemo da konstatujemo da je 74. Ostatak od 25. prema Tab. Known_x's) Known_y's – niz ili skup zavisnih pojedinačnih podataka.b) Izračunaju se srednji kvadrati odstupanja pomoću funkcije STDEV : a onda pomoću funkcije RSQ se izračunava koeficijent determinacije: Rezultat funkcije RSQ je kvadrat Pirsonovog koeficijenta korelacije.

0.c) Za izračunavanje itervala poverenja (6. uključujući i njegove granice. koja se dobija kao koren srednjeg kvadrata odstupanja dobijene empirijske jednačine od eksperimentalnih tačaka (6.18).65. Imajući u vidu (Pogl.1 (6.228 ⋅ 4.6 Testiranje hipoteza u vezi sa odsečkom i nagibom Proveravamo hipoteze: H 0 : β j = β0j .1 j = 0.319 ⋅ 1. treba izračunati koeficijenti c0 i c1.05 s c0 = 2.486 ⋅10 −3 2 (n − 1) s x Za date podatke pomoću funkcije TINV izračunava se t vrednost: i poluširine intervala poverenja regresionih koeficijenata su: t10.268 6.526 < β1 < 1.486 ⋅10 −3 = 0.25) sa nivoom poverenja γ = 1 .0. 89 . 7.27) H1 : β j ≠ β0j . nasuprot hipoteza: j = 0.26) (6. traženi intervali poverenja su: 7.508.371 Konačno.α.5) da interval poverenja regresionog koeficijenta (6. odnosno pomoću funkcije STEYX Dalje.44 < β0 < 52.319 ⋅ 5. c0 = ∑x i =1 n 2 i 2 x n(n − 1) s = 44470 = 5.228 ⋅ 4.605 t10. 12 ⋅11⋅ 61.05 s c1 = 2.174 c1 = 1 = 1.508 = 22.25). 0. potrebna je ocena standardnog odstupanja vrednosti Y.

u kojima ne figurišu nepoznati parametri. b1 ) (6.26) 6. Da bi se računski problemi olakšali pristupa se.b j − β j ≤ t n −2. zi = log yi. oblast odbacivanja te hipoteze uz rizik prve vrste α.α s c j .. linearne. a to znači da ima oblik: y = b0 ϕ0 ( x) + b1ϕ1 ( x) (6.1 ili. samo ako je formula linearna po parametrima. j = 0. v = log x. Na primer. A = log a. formula: y = ax b gde su a i b parametri. funkcije ϕ0(x) i ϕ1(x) su: ϕ0 ( x) = 1.2. kad god je to moguće.26).28) Relacija (6.. j = 0. Na primer kod pravolinijske regresije. normalne jednačine su nelinearne i njihovo rešavanje nije jednostavno. vi = log xi. se može linearizovati logaritmovanjem: (6. što kao rezultat daje linearnu formulu po novim promenljivima v i z: z = A + Bv.33) Pošto izračunamo odsečak A i nagib B iz vrednosti novih promenljivih.28) daje kriterijume odbacivanja hipoteza (6. “ispravljanju” ili linearizaciji jednačine. ϕ1 ( x) = x Ako dvoparametarska empirijska formula: y = f ( x. b0 . i = 1.α . B=b (6. pogodnom smenom promenjivih..1 predstavlja oblast prihvatanja nulte hipoteze (6. što je ekvivalentno: tj = bj − β j s cj > t n − 2.n 90 . b j − β j > t n − 2.7 Linearizovane dvoparametarske empirijske formule Može se pokazati da su normalne jednačine (6.7) za izračunavanje parametara u nekoj dvoparametarskoj empirijskoj formuli.1 (6.α s c j .29)..29) gde su ϕ0(x) i ϕ1(x) bilo kakve funkcije. j = 0.30) nema oblik (6. biće.31) log y = log a + b log x i smenom promenljivih: z = log y.

3 134.6.1 . x 1 2 3 4 5 6 7 y 62.5 127. Na žalost. Izračunati parametre u odabranoj zavisnosti i koeficijent determinacije.4) zbog izvedene transformacije.33).04405 0. uz primer.9 x/y 0. rigorozna statistička analiza linearizovane formule je nemoguća ili vrlo otežana. y = y = a + bv x a + bx z = a + bx z = A + bv gde je A = lna z = A + Bx gde je A = lna. a = 10A U Tab. B = lnb 4.03712 0.6. Tabela 6.6.1 87.. a na Sl. koje važe za originalnu zavisno promenljivu (Pogl..7 136. dobijamo kao: b = B.2 grafici datih nelinearnih funkcija. jer neophodne pretpostavke. y = smena promenljivih linearizovana formula z = a + bx 1 a + bx b x z= v= z= 1 y 1 x x y 2. liči na sledeće krive na Sl.Linearizacija dvoparametarskih formula formula 1. y = a ⋅ b x v = ln x.7. koja bi približno povezivala tačke. z = ln y z = ln y Primer 6.01610 0.02740 0. Zamišljena linija. y = a ⋅ x b 5.2 109. yi). prema eksperimentalnim vrednostima datim u tabeli (prve od dve kolone).1 date su smene promenljivih za linearizaciju nekih dvoparametarskih neliearnih formula. y = a + 3.2 134. ne važe za novu zavisnu promenljivu.originalne parametre a i b.02294 0. prema (6.03142 0.6..2.5 Odabrati formu dvoparametarske empirijske jednačine koja opisuje zavisnost y od x.2: 91 . ucrtane su eksperimentalne tačke (xi..05189 Rešenje Na slici 1. i = 1..

.4 4: a = 4 3 1 2 4 0 2 4 6 x 8 10 12 3.2 b = 0. upisane su izračunate vrednosti za z = x/y.5 y 10 8 6 4 2 0 4 3 2 1 0 2 4 6 1: a = -0. 12 10 5 0 -5 -10 2 1 3 1: a = -0.5 4: a = 0.0 0. b = 0.3 a + bx 12 10 8 x y = a + b/x.1 2: a = 0. koloni tabele uz primer.• • linije 2 i 4 familije krivih sa jednačinom: liniju 2 familije krivih sa jednačinom: y= x a + bx y = ax b Zato u uži izbor formula ulaze navedene dve...95 y 4 2 0 y 6 b = 0. b = 0 .8 8 10 12 x x . i = 1.3 2 4 6 b = 0.3 1: a = -0.5 1.0 2.2. z = x/y U 3.3 y = ab . y= a + bx b = 0 . zi).04 b = 1.7.0 1.5 0.1 2: a = 2 3: a = 4 4: a = 6 4 3 y 0 2 4 6 x 8 10 12 8 10 12 1 y= . a) jednačina y = x a + bx Smena koja linearizuje jednačinu je: v = x.1 2: a = 2 3: a = -0.0 0 b = 1.5 2. a na slici 2 uz primer ucrtane su tačke (xi.2 b = 0.3 b = 1.1 3: a = -0.. a = 2 x 92 .

5 .5 1 2 y 3 4 2 4 6 x b 8 10 12 y = ax .Grafici nelinearnih funkcija iz Tab.06000 0. a = 4 Slika 6.Tačke u koordinatama x .Eksperimentalne tačke 0.04000 x/y 0.14 12 10 8 6 4 2 0 0 1: b = 0.2 .3 3: b = -0.01000 0.02000 0.5 .z 93 .5 2: b = 0.03000 0.3 4: b = -0. 6.00000 0 2 4 x 6 8 Slika 2 uz Primer 6.1 160 140 120 100 80 60 40 20 0 0 1 2 3 4 x 5 6 7 8 y Slika 1 uz Primer 6.05000 0.

Eksperimentalne tačke u koordinatama lnx-lny Parmetri u prihvaćenoj formuli se dobijaju iz parametara linearizovane jednačine: z = b0 + b1v.0056899 x 94 . z = lny.5 . v = x kao: a = b0 . ne leže duž neke prave i ova jednačina se odbacuje 5 4.2 4.0056899 i eksperimentalni podaci su približno opisani jednačinom: y= x 0.9 4.5 Series1 z=lny Slika 3 uz Primer 6.3 4. b) jednačina y = ax b Nove promenljive su: v = lnx. Tačke.5 2 2.z.8 4.010229 + 0.5 4.6 4.4 4.010229. z = x / y. b = 0.U dijagramu sa transformisanim koordinatama tačke približno leže na pravoj liniji. ucrtane u korrdinatama v . b = b1 Pomoću funkcija SLOPE i INTERCEPT dobija se a = 0.7 4.1 4 0 0.5 1 v=lnx 1.

52 64. 0C). x y lny 14.02 74.5 0.54 86.62 98.5 0. (x.5 0.5 0 30.5 . ei: 160 140 120 100 80 60 40 20 0 0 1 2 3 4 x 5 6 7 8 y Slika 4 uz Primer 6.U tabeli su data odstupanja eksperimentalnih od računskih vrednosti.98 94.6 Date su eksperimentalne vrednosti specifične električne provodljivosti stakla (y) u funkciji od temperature.0 0.018 -4.004 -5.073 -2.41 95 . Odabrati empirijsku formulu i odrediti parametre u njoj. Primer 6.9) računa se pomoću funkcije RSQ Dakle.Eksperimentalne tačke i dobijena kriva Koeficijent determinacije (6.9 0.029 -3.7 0. dobijena empirijska formula objašnjava 90% od ukupnih promena u vrednostima zavisno promenljive.051 -2.090 -2.

2 uz primer) približno leže duž neke prave.1 0. sa graficima dvoparametarskih emirijskih formula zapaža se da bi moguć adekvatan oblik formule bio: y = ab x Smenom z = lny dobija se linearna jednačina: z = lna + lnbx Smena nije primenljiva na prvu eksperimentalnu tačku jer je: ln(0) = ∞.01 0 0 20 40 60 x 80 100 120 y Slika 1.6 . 1 uz primer.06 0. formula se prihvata.07 0.03 0.05 0.Rešenje Poređenjem izgleda zamišljene linije koja bi spajala eksperimentalne tačke na Sl. uz Primer 6.02 0.09 0. 0.04 0. Pošto eksperimentalne tačke u transformisanim koordinatama (Sl.Eksperimentalne tačke 96 .08 0.

00 -4.011⋅10 −3 ⋅1.4518 i parametre u polaznoj.00 -6.6 .001011.897.00 x Series1 y 20 40 60 80 100 120 Slika 2.00 -2. nelinearnoj formuli: a = eA = 0.0.046 x 97 . B = 0. b = eB = 1.00 -3.046 Dobija se empirijska jednačina: y = 1.00 -5.00 0 -1.Eksperimentalne tačke u transformisanim koordinatama A = -6. uz Primer 6.

83 a) Uveriti se na osnovu dijagrama rasipanja da se može pretpostaviti linearna zavisnost stepena konverzije od temperature b) Izračunati sa 4 decimale odsečak i sa 3 decimale nagib regresione prave y(x) c) Izračunati srednji kvadrat odstupanja regresione prave od eksp.73 80 38.47 100 42. g/s 10 14. 0C 640 652 668 680 684 ρ. 6.95.1 92. 6. sa α = 0. b) u problemu 9. c) = a ( x + 3) + b x y 2 2 d) y = e a x +b b  e) y =  ax +  x  −1 6. 6.14 40 27. 0C) i odgovarajućim masenim protocima (m.168 5.4 Koje smene promenljivih "ispravljaju" sledeće krivolinijske dvoparametarske zavisnosti: a 1 a) y = ax + b .95.0 0. 6. %) na raznim temperaturama (x.1 Meren je stepen konverzije reaktanta u reaktoru (y.ZADACI 6.120 10. b) y = + b .0 0. sa nivoom poverenja 0.0 0. temperaturnog koeficijenta gustine (promena gustine. b) Proceniti gustinu na temperaturi 74 0C c) Dati intervalnu ocenu.82 b) Dati intervalne ocene odsečka i nagiba sa nivoom pouzdanosti 0.76 20 20.1 91.3.083 98 .0 0. 0C y.3 Merene su gustine ρ (g/ l) neke supstance na različitim temperaturama t: a) 20 30 40 50 60 t.05: a) u problemu 8. pri povećanju temperature za 1 0C). g/s) navode na zaključak da maseni protok varira linearno sa korenom temperature: m = a t +b t.279 2. % 207. 0C): x. (kg/ l) 70 692 Odrediti odsečak sa jednom i nagib sa tri decimale u pravolinijskoj zavisnosti gustine od temperature. uveriti se da podaci o temperaturama (t. podataka d) Izračunati koeficijente determinacije i korelacije i dati interpretaciju e) Izračunati intervalne ocene odsečka i nagiba.95.2 Proveriti statističku značajnost nagiba regresione prave y(x) (da li je izračunati nagib značajno različit od nule).4 91.58 200. 0C m.30 210.0 0.6 Date su eksperimentalne vrednosti: x y 1.63 203. sa nivoom poverenja 0.56 201.1 Povezati rezultate sa značajnošću izračunatih koeficijenata korelacije.3 92.194 3.5 a) Ucrtavajući eksperimentalne tačke u odgovarajući koordinatni sistem.4 91.

v -molska zapremina. 6. cm3/mol p.044 40 0.2 25. pomoću dijagrama rasipanja b) Izračunati parametre m i c i srednje kvadratno odstupanje empirijske formule.7 61. Rezultati su dati u tabeli: x y 5 0. %) i očitavana vrednost na skali higrometra (y).656 0.469 343 0.9 Dati su viskoziteti vode.011 20 0. m i c -parametri.7 Pretpostavlja se da za neki gas približno važi sledeća jednačina stanja: gde su: p .pritisak.5 40. 6.8 Radi kalibracije higrometra.9 105 7.3 71.549 η 333 0. bar 50. sa tri decimale.0 51.170 a) Na osnovu dijagrama rasipanja odabrati dvoparametarsku empirijsku zavisnosti y(x) b) Izračunati parametre u odabranoj formuli.801 0.8 a) Proveriti pretpostavku.. parametre a i b u empirijskoj jednačini: y= 1 a x +b pv m = c 6.005 0.308 1. η na različitim temperaturama T (K): a) Izračunati parametre u formuli: T 283 293 303 313 323 1. Za date podatke: v.5 81.406 η = ae b T b) Proceniti viskozitet vode na 300K 99 . variran je sadržaj vode u gasu (x. Izračunati.083 60 0.5 64.126 80 0.

.. Kompjuter za početnike. autorska skripta Božić D. 100 . Inc. IDG Books Worldwide.Literatura Paunović R. Primatron.. maranGraphics Inc. Osnovi inženjerske statistike. 1999. CA. Novi Sad. 2003.. Foster City. Excel 2000 Simplified.. Omorjan R.

Sign up to vote on this title
UsefulNot useful