Professional Documents
Culture Documents
Vjerovatnost I Statistika - Skracena Predavanja
Vjerovatnost I Statistika - Skracena Predavanja
Pored kvalitativnih i kvantitativnih obiljeja esto se koristi i vremensko obiljeje koje oznaava trenutak ili vremenski interval s kojim su elementi statistikog skupa u vezi (npr. godina, mjesec, tjedan, vikend, sat). Podaci e se smatrati statistikim ako su prikupljeni prema odreenom planu prikupljanja, odnosno poznatom nacrtu eksperimenta, ako su varijabilni i ako ih je dovoljan broj. S obzirom na izvor, podaci se dijele na primarne i sekundarne. Primarni podaci se prikupljaju neposrednim promatranjem svojstava elemenata statistikog skupa, u skladu s predmetom i svrhom istraivanja. Prikupljaju se na temelju plana promatranja ili eksperimenta, a njihov opseg i struktura ovise o zadacima odreenog istraivanja. Sekundarni podaci se pribavljaju iz ve postojeih baza podataka, te su rezultat djelatnosti drugih institucija, odnosno subjekata (npr. dravne ustanove, poduzea). Suvremeni je pristup podacima preko informacijskih sustava (internet).
Medijan (Me) je poloajna srednja vrijednost koja numeriki niz ureen po veliini dijeli na dva jednaka dijela 50% jedinica u nizu ima vrijednost numerikog obiljeja jednaku ili manju od medijana, a preostalih 50% jedinica vrijednost jednaku ili veu od medijana. Mod (Mo) je vrijednost obiljeja koja se najee pojavljuje u nizu, tj. vrijednost obiljeja s najveom frekvencijom.
7. Kombinatorika
Kombinatorika je matematika grana koja se bavi rasporedom elemenata na prazna mjesta u nizu. Uglavnom prouava konane skupove i strukture. Javljaju se dva tipa problema: (1) egzistencija razmjetaja i prouavanje poznatih razmjetaja (2) prebrojavanje i klasifikacija razmjetaja. Skup sadri n elemenata. Ako se u niz rasporede svi elementi skupa, radi se o permutacijama. Kada su elementi u nizu meusobno razliiti, broj moguih rasporeda n elemenata rauna se pomou permutacija bez ponavljanja. Skup od n elemenata moe imati grupe jednakih elemenata r1, r2,..., rk (gdje je r1+r2+...+rk=n). Ako skup od n elemenata sadri r jednakih elemenata, tada se mogui naini rasporeda svih elemenata skupa raunaju pomou permutacija s ponavljanjem. Kod varijacija se iz skupa od n elemenata bira njih r, jer u nizu ima r praznih mjesta. Broj varijacija rtog razreda od n razliitih elemenata rauna se pomou varijacija bez ponavljanja. Ako se elementi u skupu ponavljaju, tada se mogui naini razmjetaja r elemenata od ukupno n elemenata raunaju pomou varijacija s ponavljanjem. Kod varijacija je bitan redoslijed rasporeivanja elemenata na slobodna mjesta u nizu. Kod kombinacija se iz skupa od n elemenata bira njih r, ali nije vaan poredak elemenata unutar niza. Ako niz mora sadravati razliite elemente, radi se o kombinacijama bez ponavljanja. Ako se elementi smiju ponavljati, broj moguih poredaka elemenata rauna se pomou kombinacija s ponavljanjem.
8. Vjerojatnost
Vjerojatnost, sluajna varijabla i distribucije vjerojatnosti temeljni su pojmovi inferencijalne statistike. Pri definiranju vjerojatnosti polazi se od pojma sluajnog pokusa te sluajnog dogaaja. Sluajni pokus je svaki pokus za koji se mogu odrediti svi mogui ishodi. Kod sluajnog pokusa ishodi se ne mogu predvidjeti sa sigurnou, a pokus se u definiranim uvjetima moe ponavljati. Rezultat pokusa je dogaaj ili ishod. Dogaaji se oznaavaju velikim slovima A, B... Siguran dogaaj je dogaaj koji e se dogoditi u svakom ponavljanju pokusa, tj. onaj koji e uvijek nastati. Nemogu dogaaj se nikada ne dogodi tj. ne moe nastati. Ostali dogaaji su sluajni dogaaji, tj. oni se mogu ili ne moraju dogoditi. Vjerojatnost je brojana mjera nastanka sluajnih dogaaja. Vjerojatnost nastanka dogaaja A oznaka P(A) je mogunost da e se dogaaj A dogoditi. Vjerojatnost nekog dogaaja moe poprimiti vrijednosti izmeu 0 i 1, tj. 0 P(A) 1. Vjerojatnost nastanka nemogueg dogaaja jednaka je 0, a vjerojatnost sigurnog dogaaja je 1. Klasina definicija ili vjerojatnost a priori: polazi se od pretpostavke da su svi dogaaji (ishodi) sluajnog pokusa jednako mogui. Tada je vjerojatnost nastanka dogaaja A jednaka omjeru broja za njega povoljnih ishoda (m) i ukupnog broja ishoda (n). Statistika definicija ili vjerojatnost a posteriori: vjerojatnost dogaaja odreuje se naknadno, promatranjem ponaanja relativnih frekvencija povoljnog ishoda dogaaja A, ako se broj ponavljanja pokusa poveava u beskonanost. Statistika se vjerojatnost aproksimira relativnom frekvencijom tj. omjerom apsolutne frekvencije (nA) i opsega statistikog skupa (n).
Tri aksioma vjerojatnosti (Kolmogorov, 1933.): (1) Vjerojatnost sluajnog dogaaja je nenegativna funkcija: P(A) 0. (2) Vjerojatnost je aditivna funkcija, tj. vjerojatnost dva meusobno iskljuiva dogaaja jednaka je zbroju njihovih vjerojatnosti: P(AB) = P(A) + P(B). (3) Vjerojatnost je normirana funkcija, tj. vjerojatnost sigurnog dogaaja jednaka je 1: P() = 1. Vjerojatnost da se dogaaj A nee dogoditi zove se suprotna vjerojatnost - Q(A). Zbroj vjerojatnosti i suprotne vjerojatnosti nekog dogaaja jednaka je 1, tj. P(A)+Q(A)=1. Zbrajanje vjerojatnosti (vjerojatnost ili-ili i ekskluzivnom smislu): ako su A i B dva meusobno iskljuiva dogaaja, vjerojatnost da e nastupiti dogaaj A ili dogaaj B (ali ne oba) jednaka je zbroju njihovih vjerojatnosti. Mnoenje vjerojatnosti (vjerojatnost i-i): pretpostavlja se da se dogaaji A i B meusobno ne iskljuuju, to znai da se mogu istovremeno dogoditi. Dogaaji A i B su nezavisni ako je vjerojatnost da e se dogoditi dogaaj A i dogaaj B jednaka produktu njihovih vjerojatnosti. Vjerojatnost da e se dogoditi dogaaj A ili dogaaj B ili oba dogaaja zove se vjerojatnost barem jedan. Vjerojatnost da e se dogoditi barem jedan od dogaaja A ili B je suprotna vjerojatnost da se nee dogoditi niti jedan od dogaaja A ili B. Vjerojatnost samo jedan: neka su dogaaji A i B nezavisni i poznate su vjerojatnosti da e se ti dogaaji dogoditi P(A) i P(B). Vjerojatnost da e se dogoditi samo jedan od ta dva dogaaja je suma vjerojatnosti dvaju sloenih dogaaja. Vjerojatnost da e se dogoditi dogaaj A, uz uvjet da se dogodio dogaaj B, zove se uvjetna vjerojatnost.
9. Teorijske distribucije
Distribucije koje su formirane grupiranjem opaanja ili elemenata skupa prema nekom obiljeju, zovu se originalne, empirijske ili opaene distribucije. Distribucije koje se mogu oekivati u skladu s naim iskustvom ili na temelju nekih teorijskih postavki zovu se teorijske distribucije. Pretpostavljamo ih u nekom statistikom modelu ili ih postavljamo kao hipotezu koju treba ispitati. Teorijske distribucije zadane su analitiki. Sluajna varijabla je numerika vrijednost obiljeja, a njezino pojavljivanje ovisi o sluaju. Teorijska sluajna varijabla moe poprimiti vrijednosti na brojnom pravcu od - do +. Diskontinuirana (diskretna) sluajna varijabla poprima vrijednosti prirodnih brojeva. Kontinuirana sluajna varijabla moe poprimiti i bilo koju vrijednost u intervalu od jednog do drugog cijelog broja. Kontinuirane teorijske distribucije: (1) Normalna ili Gaussova distribucija (2) Studentova ili t-distribucija (3) Gama distribucija ( 2-test). Diskontinuirane teorijske distribucije: (1) Binomna distribucija (2) Poissonova distribucija (3) Hipergeometrijska distribucija. Svaka teorijska distribucija ima svoj zakon vjerojatnosti po kojem su distribuirane tekue vrijednosti sluajne varijable X. Osim funkcije vjerojatnosti, te distribucije imaju: oekivanje (Ex), varijancu (Vx), koeficijent asimetrije (3) i koeficijent zaobljenosti (4).
Binomna distribucija
Ako je vjerojatnost da se dogodi neki dogaaj poznata, unaprijed utvrena i konstantna tijekom cijelog istraivanja (iznosi p), kae se da se diskontinuirana sluajna varijabla X ravna prema tzv. binomnoj distribuciji B(n; p).
Poissonova distribucija
Ako je vjerojatnost da se dogodi neki dogaaj poznata, unaprijed utvrena, konstantna i jako mala tijekom cijelog istraivanja (iznosi p), te broj pokusa tei u beskonanost (n) umjesto binomne distribucije, koristi se Poissonova distribucija P( ). U praksi se Poissonova distribucija koristi ako je n 50 i p 0,10. Ova distribucija je definirana za rijetke dogaaje, odnosno za one dogaaje koji imaju veliki uzorak i malu vjerojatnost.
Na koeficijent pouzdanosti (t) utjee veliina uzorka i postotak pouzdanosti (odreuje ga istraiva). S obzirom na veliinu, razlikujemo velike uzorke (vie od 30 elemenata) i male uzorke (manje od 30 elemenata). n>30 : - kod 95% pouzdanosti: t = 1,96 - kod 99% pouzdanosti: t = 2,58 n30 : raunaju se stupnjevi slobode formula: k = n 1; Koeficijent pouzdanosti (t) odredi se pomou tablice Vrijednosti t za Studentovu razdiobu. Frakcija izbora (f) je odnos veliine uzorka i veliine osnovnog skupa. Pomou nje se odreuje veliina uzorka u odnosu na populaciju. Vrijednost frakcije izbora utjee na izraunavanje standardne greke procjene. Faktor korekcije koristi se kod izraunavanja standardne greke procjene ako je frakcija izbora (f) vea od 0,05. U tom sluaju se formula za standardnu greku mnoi faktorom korekcije.
Dijagram rasipanja ili oblak rasprenosti je grafiki prikaz pomou kojeg se uoava priroda odnosa izmeu promatranih pojava. Sastoji se od toaka koje su odreene parovima vrijednosti varijabli X i Y. Koeficijent korelacije je brojani pokazatelj stupnja statistike povezanosti meu pojavama. Koeficijent korelacije moe poprimiti vrijednosti iz intervala od -1 do +1. Predznak pokazuje smjer (pozitivna ili negativna veza), a veliina koeficijenta pokazuje jakost veze (jaka, slaba, srednja, potpuna). Koeficijent linearne korelacije (Pearsonov koeficijent linearne korelacije) (r) je brojana mjera kojom se mjeri jakost i smjer povezanosti dviju pojava koje su u linearnom statistikom odnosu. Stupanj povezanosti izmeu pojava koje su izraene modalitetima redoslijednog obiljeja (npr. ocjena, broj bodova) mjeri se koeficijentom korelacije ranga. Spearmanov koeficijent korelacije ranga (rs) izraunava se kod ispitivanja korelacije dviju varijabli ranga.
10
Trend je dinamina srednja vrijednost koja pokazuje opu tendenciju kretanja pojave u vremenu. Razlikujemo sljedee vrste trendova: (1) linearni trend (2) parabolian trend (3) eksponencijalni trend. Model linearnog trenda objanjava linearno kretanje vrijednosti promatranog vremenskog niza kroz vrijeme. Grafiki se prikazuje linijskim grafikonom.
Preuzeto iz: Markovi, S., Raspor, S., Statistika Prirunik, Veleuilite u Rijeci, 2008.
11