You are on page 1of 51

SKRIPTA

Poslovna statistika
Sadržaj:
Statistika i statistička istraživanja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

Statistički skup i statističke varijable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Mjere srednje vrijednosti ili mjere centralne tendencije . . . . . . . . . . . . . . . . . . . . 25

Mjere disperzije ili varijacije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Mjere oblika distribucije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

Parametri spljoštenosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

Mjere koncentracije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Formule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

abc pitanja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

1
TEORI JA
STATISTIKA I STATISTIČKA ISTRAŽIVANJA

Pojam statistike
Naziv statistika potiče od novolatinskog termina ratio status i italijanskog ragione di
stato što znači državni interes i izvedenice statista koja predstavlja osobu sposobnu
za vođenje državnih poslova.

Postoje sljedeće definicije statistike:


¨ Statistika predstavlja grupu naučnih metoda koje omogućuju prikupljanje
podataka o masovnim pojavama, njihovu prezentaciju, analizu, tumačenje i
korištenje u razne svrhe, prvenstveno u svrhu informisanja i donošenja odluka.
(ova je za nas najbitnija)
¨ Statistika je nauka koja proučava varijacije masovnih pojava i njihovih
elemenata u vremenu i prostoru u cilju informisanja i donošenja odluka.
¨ Statistika predstavlja skup uređenih numeričkih podataka o raznim prirodnim ili
društvenim pojavama koje prikupljaju i objavljuju statistike, naučnoistraživačke
i druge ustanove.

Masovna pojava - pojava koja se manifestuje na velikom broju objekata.


Istražujemo ih na osnovu informacija o obilježjima elemenata koji ih sačinjavaju.

Primjeri masovnih pojava:


¨ Starost, visina, težina
¨ Nivo proizvodnje,
¨ Realizovani nivo uvoza i izvoza,
¨ Obim prodaje,
¨ Poslovni rezultat.

Statistička jedinica - element koji posjeduje obilježja na osnovu kojih se istražuju


varijacije masovne pojave.

Veličina populacije - broj statističkih jedinica koje sačinjavaju jednu populaciju (N).

Modalitet – vrijednost koju može uzeti statistička varijabla.

Cilj statistike je proučavanje varijacija obilježja elemenata statističkog skupa


prvenstveno kvantitativnim metodama u cilju utvrđivanja zakonitosti koje vladaju
među raznim pojavama.

Statistiku kao naučnoistraživačku metodu možemo podijeliti na deskriptivnu i


inferencijalnu statistiku.

Da bi se preciznije odredio pojam deskriptivne statistike navodi se nekoliko definicija:


¨ Deskriptivna statistika je naučna metoda informisanja o masovnim pojavama
koja, koristeći kvantifikaciju i formalizaciju, omogućava donošenje odluka.
¨ Deskriptivna statistika je metoda kvantitativne deskripcije masovnih pojava.

2
¨ Deskriptivna statistika predstavlja skup metoda koje omogućavaju opis,
prezentaciju i rekapitulaciju podataka koji su najčešće vrlo brojni.

Metode inferencijalne statistike se zasnivaju na teoriji vjerovatnoće.

Da bi mogli biti korišteni, podaci o masovnim pojavama moraju biti obrađeni i


analizirani.

6 etapa statističkog istraživanja:


¨ definisanje ciljeva;
¨ definisanje problematike istraživanja;
¨ prikupljanje podataka;
¨ obrada i analiza podataka;
¨ provjera podataka;
¨ tumačenje i interpretacija podataka;
¨ zaključci i donošenje odluka.

Prikupljanje podataka
Podatak je činjenica koja može, ali i ne mora, biti brojana i koja predstavlja
informaciju koju možemo koristiti u našem istraživanju. Za prikupljanje podataka
možemo koristiti više metoda.

(Podatak postaje informacija tek kada ga možemo iskoristiti.)

Podatke dijelimo na: primarne(prikupljeni specifično za jedno istraživanje) i


sekundarne(podaci koji su prije prikupljeni za neka druga istraživanja, ali se mogu
iskoristiti i sada).

Metode prikupljanja podataka


Za sekundarne podatke metoda prikupljanja je DESK metoda:
¨ Metoda prikupljanja podataka za stolom
¨ Sekundarni podaci koje je neko predhodno već sakupio, agregirao i na neki
način „pohranio ili arhivirao”
¨ Podaci koji se odnose na problem istraživanja, a nalaze se u raznim pisanim
dokumentima u kompaniji odnosno u eksternim institucijama
¨ Podaci koji se nalaze zapisani u raznim internim odnosno eksternim izvorima,
kao što su dokumentacija kompanije, statističke publikacije, ekonomske
analize, literatura, časopisi, dnevna i periodična štampa, web-stranice, baze
podataka na Internetu i sl.
¨ Npr. istraživanje istorijskih dokumenata, korištenje postojeće literature ili već
predhodno objavljenih baza podataka (sekundarni izvori podataka)

Direktno posmatranje (evidentiranje) - predstavlja najjednostavniji način prikupljanja


podataka. Pod posmatranjem podrazumijevamo svaku činjenicu koja se odnosi na
jednu situaciju, fenomen ili slučaj, pod uslovom da oni ne mogu biti promijenjeni
posmatranjem.

Npr, možemo posmatrati broj osoba prisutnih u amfiteatru, boju table, boju očiju, itd.
Veliki broj podataka prikupljen na ovaj način sadržan je u evidencijama, registrima i

3
dokumentima (npr.: podaci o broju rođenih, broju umrlih, o prodaji određenog
proizvoda, temperaturi, itd.)

Osnovna prednost ove metode leži u njezinoj objektivnosti. Potrošač nije u direktnom
kontaktu s istraživačem i ponaša se spontano. Na taj način kvalificirani i stručni
istraživači mogu zapaziti vrlo važne elemente i karakteristike ponašanja ispitanika,
koji su značajni za daljnju perspektivu istraživanja.

Prednost je i što nema potrebe za traženjem pristanka ispitanika da učestvuje u


istraživanju.

Anketa se sastoji u ispitivanju određenog broja osoba jedne populacije. Ova metoda
omogućava prikupljanje podataka koji se ne mogu prikupiti direktnim posmatranjem i
koje je teško prikupiti na drugi način. Postoje također ankete mišljenja, profesionalne
ankete, sociološke ankete, itd.

Upitnik je sistem pitanja vezan uz ciljeve istraživanja, na koje anketar mora dobiti
odgovore od ispitanika.

Pošto se anketa odnosi na osobe jedne populacije potrebno je precizno definisati


populaciju. Tip ankete koji se najčeše primjenjuje u praksi je anketa određenog broja
osoba populacije.

Načini realizacije ankete:


¨ Anketari idu na teren i direktno realizuju anketu
¨ Poštom
¨ Telefonom
¨ On-line anketa
¨ E-mail anketa

Odabrani broj osoba iz populacije se naziva uzorak.

Metoda uzoraka je skup postupaka pomoću kojeg se na osnovi poznavanja


ograničenog broja elemenata zaključuje o karakteristikama cjeline, ili mase
elemenata.

Okvir uzorka – lista svih elemenata populacije

Metode uzorkovanja:
¨ Slučajni uzorci (zasnovani na vjerovatnoći - jedinice populacije se slučajno
biraju u uzorak)
• Jednostavni slučajan uzorak
• Sistematski uzorak
• Panel uzorak, itd.

¨ Namjerni uzorci (nisu zasnovani na vjerovatnoći - odabran na osnovu


subjektivnih kriterija)
• Kvota uzorak
• Prigodan uzorak
• Dobrovoljan uzorak

4
Sistematski uzorak
Slučajan uzorak u kojem izbor elemenata u uzorak vršimo po nekom sistematskom
redu odabirući slučajno početak.

¨ Podrazumjeva izbor svakog k-tog elementa iz okvira uzorka, gdje se k


izračunava kao:
• k = veličina populacije (N) / veličina uzorka (n)
¨ Svaki element populacije ima istu vjerovatnoću izbora.
¨ Na slučaj se bira početna tačka.
¨ Prednost - jednostavnost izbora uzorka.
¨ Nedostatak - nereprezentativnost u slučajevima kada postoji određeni način
prema kojem je populacija upisana u listu i ako se taj način poklapa sa
intervalom uzorka.

Stratifikovani uzorak
Stratifikacija (tipski izbor) - proces grupisanja jedinica populacije u podpopulacije
(stratume) koje su unutar sebe homogene a između sebe heterogene.

Heterogena populacija – mogu se generisati stratumi (npr. studenti I, II ili III godine
Fakulteta)

¨ Prednosti:
• Osigurava zastupljenost jedinica iz svakog stratuma.
• Povećava efikasnost i preciznost jer omogućava kontrolu strukture
uzorka.

Kod proporcionalnog izbora važi sljedeće  Proporcija:


• Veličina populacije : Veličina stratuma k =
• Veličina uzorka : Veličina poduzorka uzetog iz stratuma k

Klaster uzorak
Procedura uzorkovanja za klaster uzorak:
¨ Populacija se dijeli na skupine.
¨ Bira se slučajno određeni broj skupina (klastera) koje predstavljaju populaciju.
¨ U uzorak se uključuju sve jedinice koje se nalaze u izabranim skupinama
(klasterima)

Korisno je primjeniti klaster uzorak kada:


¨ ne raspolažemo listom svih jedinica, odnosno odgovarajućom bazom uzorka ili
¨ je osnovni skup velik i sastavljen od jedinica koje su npr. prostorno vrlo
udaljene tada troškovi ankete mogu biti vrlo veliki.

5
Manja efikasnost nego u slučaju jednostavnog slučajnog uzorka.

Panel uzorak
Koristi se:
¨ da bi se istražile promjene karakteristika populacije u vremenu,
¨ da se kontinuirano prate neke pojave,
¨ u istraživanju tržišta, praćenju troškova života, itd.

Izabrani potrošači odgovaraju na povremene ankete.


Promjena ispitivanih jedinica kao i promjena pojave su značajni nedostaci ovog tipa
uzorka.
Primjena panel uzorka je ograničena na prethodna istraživanja u primjeni ankete.

Višeetapni uzorak
Populacija se podijeli na podskupove prema hijerarhijskom principu
Postepeno, po etapama izbora:
¨ prva etapa - biramo jedinice prvog stepena.
¨ druga etapa - iz svake jedinice prvog stepena biramo jedinice drugog
stepena...
¨ posljednja etapa – formira se uzorak.

Kvota uzorak
U skladu sa specifičnim kriterijem i ciljem istraživanja izaberu se podpopulacije iz
kojih se mora anketirati određeni broj jedinica prema zadanoj kvoti i to je jedini uslov
kod ovog tipa uzorkovanja.

Kvota je unaprijed zadana (recimo 65% žena) i istraživač jedino mora zadovoljiti tu
kvotu te ne mora uvažavati princip slučajnog izbora.

Nije skup, jednostavno se realizuje i poštuje kroz zadanu kvotu proporcije u


populaciji.

Često se primjenjuje u ispitivanju javnog mijenja.

Prigodan uzorak
Uzimamo u uzorak elemente do kojih smo u datom trenutku jedino mogli doći ili koji
su nam se slučajno prigodno našli pri ruci, npr. uzorak koji pravi profesor od svojih
studenata, uzorci koje formira anketar presrećući prolaznike na ulici ili kupce u robnoj
kući i slično.

Prednosti:

6
¨ najjeftiniji,
¨ najkraće vreme provođenja,
¨ pogodan za eksplorativna istraživanja

Nedostaci:
¨ pristrasnost izbora,
¨ nije reprezentativan,
¨ nije preporučljiv za opisna i uzročna istraživanja

Dobrovoljan uzorak
¨ u uzorak uzimamo osobe koje su izrazile spremnost da budu dio našeg uzorka
¨ npr. testiranje lijekova ili dobrovoljni davaoci krvi.

Snowball uzorkovanje
Identificiranje i kvalificiranje inicijalnog seta respondenata koji mogu pomoći
istraživačima pronaći ostale sudionike istraživanja.

Određivanje primjerene veličine uzorkovanja


¨ Varijabilnost karakteristika populacije koja se istražuje
¨ Veća varijabilnost karakteristika povećava potrebnu veličinu uzorka.
¨ Željeni nivo pouzdanosti u procjenama
¨ Viši nivo pouzdanosti podrazumijeva povećavanje potrebne veličine
uzorka.
¨ Željeni stepen preciznosti u procjeni parametara populacije
¨ Veći stepen preciznosti podrazumijeva povećavanje potrebne veličine
uzorka.

Intervju - Specijalna vrsta stručnog razgovora, između istraživača (intervjuera) i


ispitanika (intervjuisanog), gdje istraživač na bazi razrađenog koncepta pitanja,
pokušava saznati od ispitanika što više o zadanim aspektima problema.

Polazni instrument je podsjetnik za ispitivanje. Nije riječ o klasičnom anketnom


instrumentu već o popisu tema o kojima će se razgovarati, pri čemu su za svaku
temu razrađena elementarna pitanja.

Prema broju učesnika, intervju može biti pojedinačni i grupni.

Pojedinačni intervju se naziva i “dubinski intervju", jer se kroz vođenje razgovora sa


ispitanikom pokušavaju saznati uzroci njegovog ponašanja u odnosu na predmet
ispitivanja.

7
Kod grupnog intervjua vodi se razgovor sa 4-8 osoba.

Ograničenja kod ove metode su:


¨ ograničenost uzorka,
¨ zahtjeva se visoka stručnost intervjuera,
¨ problem “pristanka” za razgovor koji traje duže vremena i slično.

Popis je oblik prikupljanja podataka pri kojem se obuhvataju sve jedinice statističkog
skupa u određenom trenutku. Popis je najobuhvatniji način prikupljanja podataka.
Pošto zahtijeva veliki utrošak sredstava i vremena provodi se samo u određenim
vremenskim intervalima, npr. svakih 10 godina.

Eksperiment
Način prikupljanja podataka neposrednim čulnim opažanjem, korištenjem pomoćnih
tehničkih sredstava ili bez njih.

Uslovi se vještački izazivaju i kontrolišu.


Primjena u ekonomiji ograničena.

Mogućnost upotrebe eksperimenta:


¨ priroda pojave i predmeta istraživanja
¨ razvijenost teorije i metodologije
¨ etički momenat

Izvještaji i ostale indirektne metode prikupljanja podataka


Sljedeći postupak prikupljanja podataka obuhvata metode čija je zajednička
karakteristika da ne analiziraju direktno jednu situaciju ili fenomen (dakle nema
direktnog posmatranja) nego neke njihove posljedice.

Kao primjer ovog postupka prikupljanja podataka možemo navesti razne izvještaje
kojima se podaci prikupljaju periodično, historijske dokumente, itd.

Obrada podataka
Obrada prikupljenih podataka podrazumijeva realizaciju tri osnovne etape koje
prethode donošenju odluka:

¨ Eksploatacija podataka (upoznavanje podataka, evidentiranje i sređivanje da


bi se imala globalna vizija prikupljenih podataka).

¨ Deskriptivna analiza slijedi poslije prve etape i cilj joj je da opiše i predstavi
prikupljene podatke pomoću tabela, grafičkih prikaza, izračunavanja osnovnih

8
parametara. Bitni postupci u ove dvije etape su klasiranje, vizualizacija i
sinteza prikupljenih podataka.

¨ Treća faza obuhvata ocjenu intervala povjerenja za analizirane parametre i


provjeru hipoteza koje se odnose na istraživani fenomen. Analiza prikupljenih
podataka bi trebala omogućiti realizaciju treće faze čiji cilj je generalizacija
dobijenih rezultata i donošenje odluka.

STATISTIČKI SKUP I STATISTIČKE VARIJABLE

Populacija (osnovni/statistički skup) - skup statističkih jedinica:


¨ Konačna (tačno znamo broj članova, npr. učenika u školi, učitelja u opštini sl.)
¨ Beskonačna (obuhvata sve sadašnje, ali i buduće članove osnovnog skupa,
npr. učenike koji idu ili će ići u neku školu ili koji uče ili će učiti neko gradivo)

Hipotetični skup čine jedinice koje se definišu nekim modelom.

Statistički skup se definiše:


¨ pojmovno,
¨ prostorno i
¨ vremenski.

Pojmovna definicija skupa utvrđuje pripadnost skupu s obzirom na pojam jedinice


(elementa).
Na primjer: Populaciju privatnih preduzeća predstavljaju sva preduzeća koja su
registrovana kao privatna preduzeća.
Prostorna definicija definiše prostor kojem pripadaju jedinice statističkog skupa.

Vremenska definicija određuje vrijeme u kojem se statističke jedinice posmatraju i


analiziraju.
Osnovni skup može biti definisan u vremenskom trenutku ili vremenskom intervalu. U
vremenskom trenutku se definišu npr. broj stanovnika, broj preduzeća, broj
zaposlenih, osnovna sredstva. Uobičajeno je da se u vremenskom intervalu
posmatra npr. poslovni rezultat ili proizvodnja nekog proizvoda u godini, trimestru ili
mjesecu.

Skup podataka o posmatranom obilježju za dio jedinica skupa predstavlja uzorak koji
služi kao osnova za zaključivanje o osnovnom skupu (populaciji).

PRIMJER:
Masovna pojava: nezaposlenost

Statistički skup:
- radno sposobno stanovništvo

Statistička jedinica:
- radno sposobni stanovnik

Pojmovna definicija skupa:

9
- radno sposobno stanovništvo

Vremenska definicija skupa:


- Februar 2016.

Prostorna definicija:
- grad Sarajevo ili Zeničko-Dobojski kanton

Statističke varijable
Obilježja po kojima se razlikuju jedinice statističkih skupova nazivaju se varijable.

PRIMJER:
Statistička varijabla dužina radnog staža:
¨ zaposleni u kompaniji “Shine” se razlikuju po dužini radnog staža,
¨ svakom zaposlenom u kompaniji “Shine” možemo pridružiti jednu i samo jednu
vrijednost dužine njegovog radnog staža.
¨ modalitet varijable dužina radnog staža je npr. 10 godina, 7 mjeseci i 14
dana.

Pravila pridruživanja su definisana mjernim skalama.


4 osnovna tipa mjernih skala:
¨ nominalna;
¨ ordinalna;
¨ intervalna;
¨ numerička (metrička).

Nominalna mjerna skala


¨ Nominalna skala je predstavljena u obliku liste obilježja po kojima se razlikuju
elementi statističkog skupa.
¨ Nominalna obilježja mogu biti atributivna i geografska.
¨ Poredak modaliteta je nebitan.
¨ Svaki modalitet ima isti relativni značaj, te njihovo upoređivanje ili rangiranje
nije moguće prema objektivnom kriteriju.
¨ Nisu dozvoljene matematičke operacije.
¨ Jedino je moguće izvršiti prebrojavanje u kontekstu formiranja distribucije
frekvencija.

Nomenklatura je uređen popis modaliteta nominalne varijable, kojima se pripisuje


nomenklaturni broj. Nomenklature su konvencije, koje se donose zakonski ili
dogovorom državnih organa ili međunarodnih organizacija.

Ordinalna mjerna skala


¨ Modaliteti opisno izraženi, moguće ih je porediti i rangirati prema nekom
logičnom redosljedu i objektivnom kriteriju.

10
¨ Poredak bitan, nemaju svi modaliteti isti značaj.
¨ Dozvoljeno prebrojavanje i logičke operacije poređenja (<,=,>), ali ne i
matematičke operacije.
¨ Moguće opisno date modalitete zamijeniti rangovima (1., 2., 3., ...).
¨ naziva se i varijabla ranga.

Intervalna mjerna skala


¨ Na intervalnoj skali osobinama elemenata populacije se pridruzuju brojevi.
¨ Numerički dati modaliteti, ali položaj nule se arbitrarno određuje.
¨ Nula ne znači odsustvo pojave (nije “prirodna” već “dogovorena” nula).
¨ Nulu na skali mozemo postaviti gdje zelimo, ali se mora zadovoljiti osobina
ove skale da razlike medju mjernim osobinama odgovaraju razlikama brojeva
na intervalnoj skali.
¨ Dozvoljeno prebrojavanje, poređenje i oduzimanje, pr: Celzijusova skala

Metrička(numerička) mjerna skala


¨ Numerički dati modaliteti i posjeduje “prirodnu” nulu.
¨ Nula znači odsustvo pojave (“prirodna” nula).
¨ Dopuštene sve logičke i matematičke operacije i zbog toga ova skala ima
najbolje metričke osobine i omogućava najprecizniju i najopširniju analizu.
¨ Numeričke varijable mogu biti prekidne i neprekidne.

Veličina populacije je broj elemenata koji čine populaciju.

Frekvencija modaliteta je broj elemenata statističkog skupa koji posjeduju posmatrani


modalitet.

Prikupljene statističke podatke možemo prezentovati na više načina:


¨ Tabelarno
¨ Grafički
¨ Literarno
¨ Modelom

Tabelarno: Uređenu statističku seriju dobivamo ako podatke grupišemo po rastućem


redoslijedu i formaliziramo sljedećom relacijom: (Xi; i = 1,2,...,N) gdje (i) predstavlja
rang opservacije. Na uređenoj statističkoj seriji jednostavnije je uočiti najveću i
najmanju vrijednost podataka.

U slučaju statističke distribucije frekvencija se takođe jednostavno uočava najmanji i


najveći podatak u seriji bez posmatranja cijele serije navedenih podataka,
određujemo najčešći podatak (MOD) i raspolažemo sa frekvencijom svakog
modaliteta.
Vrste frekvencija
Apsolutna frekvencija (fi) – je broj (učestalost) pojavljivanja jednog modaliteta.

11
Relativna frekvencija (pi) – predstavlja proporciju elemenata koji imaju isti modalitet.

Rastuća apsolutna kumulanta – koliko podataka ima vrijednost manju ili jednaku
vrijednosti modaliteta xi na kojoj se trenutno nalazimo.

Opadajuća apsolutna kumulanta - koliko podataka ima vrijednost veću od vrijednosti


modaliteta xi na kojoj se trenutno nalazimo.

Rastuća relativna kumulanta - koliki je % podataka koji imaju vrijednost manju ili
jednaku vrijednosti modaliteta xi na kojoj se trenutno nalazimo (ako pomnožimo sa
100%).

Opadajuća relativna kumulanta - koliki je % podataka koji imaju vrijednost veću od


vrijednosti modaliteta xi na kojoj se trenutno nalazimo (ako pomnožimo sa 100%).

Ako je data distribucija frekvencija sa intervalima S(xj) predstavlja broj modaliteta sa


vrijednošću varijable koja je jednaka ili manja od gornje granice j-tog intervala, a F(xj)
proporciju modaliteta čija je vrijednost jednaka ili manja od gornje granice j-tog
intervala.
PRIMJER: (zadatak)
U populaciji od 15 studenata proveli smo anketu sa pitanjem: “Koji žanr filma najviše
volite?” i dobili sljedeće odgovore:
12
dramu, triler, komediju, horor, triler, dramu, komediju, triler, akciju, dramu, komediju,
akciju, dramu, komediju, dramu

Formirati odgovarajuću distribuciju frekvencija.

RJEŠENJE:
Populacija
¨ studenti

Statistička jedinica
¨ student

Veličina populacije
¨ N=15

Varijabla
¨ omiljeni filmski žanr

Tip varijable
¨ kvalitativna nominalna

Modaliteti
¨ Akcija, drama, horor, komedija, triler

Distribucija frekvencija

PRIMJER:
Na osnovu ispitivanja 35 gradova dobili smo podatke o broju osnovnih škola u
jednom gradu:

1, 1, 2, 3, 5, 6, 1, 2, 2, 4, 2, 6, 2, 3, 4, 1, 2, 7, 2, 2, 4, 4, 3, 4, 2, 2, 3, 4, 3, 3, 5, 3, 1, 5,
2
Uporediti i komentarisati statističku seriju sa bruto podacima, uređenu statističku
seriju i statističku distribuciju frekvencija.

RJEŠENJE:
Populacija
¨ gradovi
13
Statistička jedinica
¨ grad

Veličina populacije
¨ N=35

Varijabla
¨ broj osnovnih škola u gradu

Tip varijable
¨ kvantitativna prekidna

Modaliteti
¨ 1,2,3,4,5,6,7

Serija koju imamo u postavci zadatka je statistička serija sa bruto podacima, to je


baza podataka u koju smo upisivali podatke za svaki grad („nesređeni ili nabacani
podaci“). Da bismo dobili uređenu statističku seriju moramo sortirati podatke po
veličini:

1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6,
7

Radna tabela (neintervalno grupisanje):

Radna tabela (neintervalno grupisanje):

14
Na osnovu radne tabele potvrđujemo da:
¨ Posljednja rastuća apsolutna kumulativna frekvencija mora uvijek biti jednaka
N.
¨ Posljednja opadajuća apsolutna kumulativna frekvencija mora uvijek biti
jednaka 0.
¨ Posljednja rastuća relativna kumulativna frekvencija mora uvijek biti jednaka 1.
¨ Posljednja opadajuća relativna kumulativna frekvencija mora uvijek biti
jednaka 0.

Tumačenje frekvencija

¨ u 23 grada imamo 3 škole ili manje od 3

¨ u 6 gradova imamo više od 4 škole

¨ u 45,71 % gradova imamo 2 škole ili manje od 2

¨ u 8,57% gradova imamo više od 5 škola.

Tipovi statističkih varijabli prema tipu mjerne skale:


¨ Kvalitativna statistička varijabla:
 Nominalna ili atributivna
- odgovara joj nominalna mjerna skala
- npr. boja automobila, spol

 Ordinalna
- odgovara joj ordinalna mjerna skala

15
- npr. zvanje univerzitetskog radnika

¨ Kvantitativna statistička varijabla


 Prekidna
- može uzeti samo neke ili određene vrijednosti iz
zadanog intervala
- cijeli broj
- npr. broj prisutnih studenata na predavanju, broj
zaposlenih na fakultetu
 Neprekidna
- teoretski može uzeti bilo koju vrijednost iz zadanog
intervala
- može imati decimalni zarez
- npr. visina ili težina studenta I godine, dužina
proizvoda

PRIMJER:
U fast-food objektima prodaju se tri različita tipa napitaka: bezalkoholna pića, čajevi i
kafa. Bezalkoholna pića se nude u obliku tri veličine: mala, srednja i velika. Koji tip
varijable predstavlja:

Varijabla tip napitka?


¨ Kvalitativna nominalna varijabla

Varijabla veličina pakovanja bezalkoholnog pića?


¨ Kvalitativna ordinalna varijabla

PRIMJER:
Kojeg su tipa varijable pomoću kojih izražavamo:

Navršene godine jedne osobe


¨ Kvantitativna prekidna varijabla

Temperaturu u amfiteatru
¨ Kvantitativna varijabla sa intervalnom skalom jer 0 ne znači odsustvo
pojave

Ljubaznost neke osobe


¨ Kvalitativna ordinalna varijabla (ljubazan, neutralno, drzak)

Bračno stanje
¨ Kvalitativna nominalna (atributivna) varijabla (modaliteti opisno dati, svi
imaju isti relativni značaj)
Način plaćanja potrošača u tržnom centru (gotovina, kreditna kartica, ček, potrošačka
kartica, ostalo)

16
¨ Kvalitativna nominalna iz ugla tržnog centra ili moguće ordinalna iz ugla
potrošača

PRIMJER:
U nizu je analizirano 40 podataka. Ako je za modalitet 20 izračunata relativna
frekvencija 0,3, odrediti apsolutnu frekvenciju tog modaliteta.

RJEŠENJE:

PRIMJER:
Za 25 domaćinstava imamo informacije o veličini zemljišnog posjeda (u ha):
12,3 13,4 14,8 8,3 13,6 12,4 12,0 12,8 11,2 13,8 15,0 13,2 16,2
12,7 11,7 13,9 13,0 9,5 14,5 12,7 16,0 13,5 10,2 9,6 14,8

Formirati statističku distribuciju frekvencija (širina intervala 2). Odrediti centre


intervala.

RJEŠENJE:
Populacija
¨ zemljišni posjedi

Statistička jedinica
¨ posjed

Veličina populacije
¨ N=25

Varijabla
¨ veličina posjeda

Tip varijable
¨ kvantitativna neprekidna (kontinuirana)

Krajnji oblik grupisanja je statistička distribucija frekvencija, kada svakom intervalu


(riječ o neprekidnoj varijabli, “odozgo otvorenih” intervala ima n) pridružimo njemu
odgovarajuću apsolutnu frekvenciju:

- i donja i gornja granica j - tog intervala

- j- ti interval

17
- apsolutna frekvencija j - tog intervala

- n - broj intervala,

N=25

Formiramo intervale širine (veličine, amplitude) l=2 i za date intervale (n=5)


određujemo apsolutne frekvencije na osnovu prebrojavanja bruto podataka.

Radna tabela – distribucija frekvencija (intervalno grupisanje)

12,3 13,4 14,8 8,3 13,6 12,4


12,0 12,8 11,2 13,8 15,0 13,2
16,2 12,7 11,7 13,9 13,0 9,5
14,5 12,7 16,0 13,5 10,2 9,6
14,8

Centri intervala
Kod intervalno grupisane serije kako
bismo omogućili dalje kalkulacije sa
podacima moramo intervale
aproksimirati njima odgovarajućim
razrednim sredinama ili centrima
intervala:

Radna tabela – intervalno grupisanje, centri intervala

Ri fi
8-10 3 ci

18
9
10-12 3
12-14 13
14-16 4
16-18 2
25

PRIMJER:
Za zadanu distribuciju frekvencija:

¨ Odrediti relativne frekvencije.


¨ Odrediti relativne rastuće kumulativne frekvencije.
¨ Objasniti:
 apsolutnu frekvenciju drugog intervala.
 relativnu frekvenciju petog intervala
 relativnu rastuću kumulativnu frekvenciju trećeg intervala.

RJEŠENJE:

• Za 6 dana u okviru analiziranih 30 dana broj opravki kretao se u intervalu [30-


35).
• 16,67% dana u analiziranoj populaciji od 30 dana imalo je broj opravki u
intervalu [45-50).
• 56,67% analiziranih dana imalo je manje od 40 opravki u toku dana.

Grafičko predstavljanje statističkih varijabli

19
Postoji više vrsta grafičkih reprezentacija. Najčeše korišten oblik grafičkog
predstavljanja su dijagrami koji se dijele na:
¨ stigmograme,
¨ linearne dijagrame,
¨ površinske dijagrame i
¨ stereograme.

Korištenje grafikona predstavlja odličan način da se pojednostavi prikazivanje i


razumjevanje obimnog i složenog materijala kao što su poređenja, obrasci i trendovi
u podacima. Na primjer, umjesto da analizirate nekoliko kolona brojeva radnog lista,
možete koristiti grafikon da biste na prvi pogled uporedili promjene u dinamici upisa u
škole između djevojčica i dječaka u određenom vremenskom periodu.

Izbor grafikona direktno zavisi od tipa statističke varijable.

Kvalitativna varijabla može se predstaviti pomoću:


¨ jednostavnih stubaca
¨ strukturnog stubca
¨ strukturnog kruga ili polukruga

Ako je nominalna varijabla poredak nije bitan, ako je ordinalna varijabla poredak
stubaca je bitan i ne smije se mijenjati.

U slučaju kombinovanja više varijabli koristi se:


¨ strukturni - razdijeljeni stubac
¨ razdvojeni ili višestruki stupci
¨ razdijeljeni stupci

Kod geografske serije moguće je nacrtati i kartogram.

Jednostavni stupci
Na y-osi su apsolutne frekvencije
Na x-osi su modalieti (opisi), stupci iste širine i razdvojeni

20
Strukturni stubac
Jedan stubac visine 100% se dijeli na modalitete prema njihovim procentualnim
frekvencijama: Pi=pi*100

Strukturni krug
Jedan krug sa 360° se dijeli na modalitete prema njihovim uglovima: ugao=p i*360°

Razdijeljeni stubac za više pojava

21
Razlike se ističu.

Razdijeljeni ili višestruki stubac za više pojava

Razlike se manje vide.

Kartogram

22
Odstupanja mjesečnih količina padavina (%) od normalnih vrijednosti za januar 2020.
godine u Kantonu Sarajevo

Grafikoni – Excel
U Excelu u segmentu Insert – Chart možemo naći funkciju Chart i odabrati različite
tipove grafikona:

PRIMJER:
Na kursu za manekenke koji je pohađalo 58 djevojaka zabilježili smo njihovu boju
očiju i dobili sljedeću distribuciju frekvencija:

Grafički predstaviti ovu distribuciju. Analizirati strukturu.


RJEŠENJE – osnovni statistički pojmovi

23
¨ Riječ je o nominalnoj kvalitativnoj varijabli “boja očiju”.
¨ Populacija su djevojke sa kursa za manekenke.
¨ N=58
¨ Koristićemo sljedeće grafikone:
 stupce
 strukturni krug
 strukturni stubac

Grafikon stubaca:
broj djevojaka

25 23

20

15 14
12
10 9

0
plava smeđa crna zelena

boja očiju

Možemo mijenjati poredak stubaca, jer je riječ o nominalnoj varijabli.

Strukturni krug:

24
Strukturni stubac:

100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
plava smeđa crna zelena

MJERE SREDNJE VRIJEDNOSTI ILI MJERE CENTRALNE TENDENCIJE

Mjere srednje vrijednosti mogu biti potpune (izračunate, izvedene) i pozicione


(položajne, nepotpune).

U potpune mjere srednje vrijednosti ubrajamo:


¨ artimetičku
¨ geometrijsku
¨ harmonijsku
¨ kvadratnu i
¨ kubnu sredinu.

25
Pozicione mjere srednje vrijednosti su:
¨ mod
¨ medijana i
¨ kvantili.

Aritmetička sredina je prosječna srednja vrijednost.


Aritmetička sredina jedne statističke serije je jednaka zbiru opservacija podijeljenim
sa veličinom serije. Aritmetička sredina izražava prosječnu vrijednost jedne serije ili
distribucije podataka i predstavlja najznačajniju mjeru centralne tendencije.

Geometrijska sredina za serije negrupisanih podataka je jednaka N-tom korijenu iz


proizvoda vrijednosti varijable I izračunava se prema sljedećoj formuli:

Geometrijska sredina izravnava odnose, tj. proporcionalne promjene između


uzastopnih podataka u analiziranoj seriji.

Harmonijska sredina se definiše kao recipročna vrijednost artimetičke sredine


recipročnih vrijednosti varijable X.
Harmonijska sredina za seriju negrupisanih podataka se izračunava pomoću
sljedećeg izraza:

Kvadratna i kubna sredina

26
Mod je jedna od najstarijih pozicionih vrijednosti koja se jednostavno utvrđuje. Mod
se definiše kao modalitet varijable koji se najčešće pojavljuje tj. Modalitet koji ima
najveću frekvenciju.

Serija može biti bimodalna ili višemodalna ukoliko se u jednoj seriji nalazi više
modaliteta koji imaju najvišu frekvenciju.

Primjer (kad se nalaze intervali):

Prednosti moda
¨ Može se odrediti i za kvalitativnu varijablu
¨ Jednostavno se određuje
¨ Nije osjetljiv na “outliere”

Nedostaci moda
¨ Ne može se uvijek odrediti
¨ Osjetljiv je na način kako se formira statististička serija i njeni intervali
¨ Nepouzdan kod asimetričnih distribucija

27
Medijana ili centar pozicije
Medijana spada u pozicione srednje vrijednosti. Medijana je vrijednost obilježja koja
u u seriji uređenoj po veličini (rastućem ili opadajućem redosljedu) zauzima centralnu
poziciju (rang) i dijeli seriju na dva jednaka dijela.
Teorijski 50% podataka ima vrijednost manju ili jednaku medijani i preostala polovina
podataka vrijednosti veće od medijane. Medijana je poziciona srednja vrijednost i za
izračunavanje medijane nisu bitne vrijednosti svih podataka nego njihov rang u seriji.

Određivanje medijane u uređenoj seriji


Određivanje medijane zavisi od broja podataka u seriji. Analiziraćemo slučajeve
određivanja medijane ukoliko je broj podataka neparan i ukoliko je broj podataka
paran.

*Neparan broj podataka

*Paran broj podataka

28
U seriji grupisanoj u intervale, medijana se računa na sljedeći način:

Karakteristike medijane

¨ Medijana je parameter centralne pozicije u seriji na koju ekstremne vrijednosti


nemaju uticaja jer medijana ne zavisi od vrijednosti podataka nego od
njihovog ranga, pozicije u seriji. Ako su npr. greškom evidentirane neke
ekstremne vrijednosti one neće uticati na medijanu.

U oba slučaja medijana je jednaka 58.

Kako u uređenoj seriji polovina podataka prethodi medijani i polovina podataka se


nalazi poslije medijane, medijana se naziva također kvantil reda 0,5 (ili reda 50%).

29
Kvantili
U uređenoj seriji {x(i) } kvantil reda p koji označavamo sa xp je jednak vrijednosti
varijable za koju postoji proporcija opservacija koje su jednake ili manje od xp i
komplementarna proporcija (1-p) opservacija koje su veće od xp:

Određivanje kvantila u uređenoj seriji

Ako u uređnoj seriji postoji vrijednost xj za koju je uz


pretpostavku da je S=0 ako je j=1.

Određivanje kvantila u intervalno grupisanoj seriji

Kvartili
Kvartili se označavaju sa Q1, Q2, Q3 i predstavljaju kvantile reda p=1/4, p=1/2 i
p=3/4 ili reda 25%, 50% i 75%. Kvartili su vrijednosti varijable koji distribuciju uređenu
po veličini dijele na 4 jednaka dijela.

U uređenoj seriji prvi kvartil Q1 je jednak modalitetu vrijednosti varijable od kojeg


25% elemenata skupa ima jednaku ili manju vrijednost i 75% elemenata skupa ima
veću vrijednost posmatranog obilježja. Dakle, 25% opservacija prethode Q1 i 75%
opservacija se nalaze poslije Q1. Medijana je jednaka drugom kvartilu Me=Q2.

30
Decili
Decili se označavaju sa D1, D2, …..D9 i predstavljaju kvantile reda 10%, 20%, ...,
90%. Ima ih devet i dijele uređenu statističku seriju na 10 jednakih dijelova. U
uređenoj seriji 20% opservacija prethodi D2, a 80% opservacija se nalazi poslije D2.

Centili
Centili se označavaju sa C1, C2, ..C95, … C99L predstavljaju kvantile reda 1%,
2%, .., 95%, ..., 99%. Ima ih, dakle, 99 i dijele uređenu statističku seriju na 100
jednakih dijelova. U uređenoj seriji 1% podataka prethodi C1 i 99% podataka slijedi
poslije C1. Kao i za medijanu, kumulativna frekvencija kvantila reda p % je vrlo blizu
p % kada su podaci istovremeno mnogobrojni i različiti.

PRIMJER:

31
MJERE DISPERZIJE ILI VARIJACIJE

Postoje dva pristupa konstrukciji mjera disperzije:


¨ Mjerenje odstupanja između dva podatka u seriji ili između dva parametra
centralne tendencije,
¨ Mjerenje odstupanja podataka od nekog reprezentativnog parametra.

Mjere disperzije možemo klasificirati na apsolutne i relativne.

Apsolutne mjere disperzije su:


¨ raspon varijacije
¨ interkvantilno apsolutno odstupanje
¨ srednje apsolutno odstupanje
¨ varijansa
¨ standardna devijacija.

Relativne mjere disperzije su:


¨ interkvantilna relativna odstupanja
¨ koeficijenet varijacije
¨ koeficijent kvartilne devijacije.

Apsolutne mjere disperzije


Raspon varijacije
Raspon varijacije predstavlja apsolutno odstupanje između maksimalne I minimalne
vrijednosti varijable:
RV=xmax - xmin

Interkvantilno apsolutno odstupanje


Da bi se otklonio nedostatak raspona varijacije, konstruisani su parametri koji
«eliminišu» određenu proporciju opservacija na početku i na kraju serije, dakle
određenu proporciju najmanjih i najvećih vrijednosti. Interdecilno odstupanje D9-D1
eliminiše 10% opservacija na početku serije i 10% opservacija na kraju serije. Na taj
način dobijamo mjeru disperzije koja se odnosi na 80% centralnih opservacija.

Srednje apsolutno odstupanje


Srednje apsolutno odstupanje spada u mjere disperzije koje se konstruišu kao
odstupanje modaliteta od nekog reprezantivnog parametra.

32
Pri računanju treba primijeniti odgovarajuću formulu u zavisnosti od raspoloživih
podataka. Srednje apsolutno odstupanje je parametar koji je jednostavno objasniti.
Veća vrijednost srednjeg apsolutnog odstupanja ukazuje na veću disperziju podataka
u odnosu na njihovu aritmetičku sredinu. Srednje apsolutno odstupanje ne može biti
jednako nuli, osim u slučaju kad su svi modaliteti jednaki, ali tada se problem sinteze
podataka ne postavlja. Ovaj parametar se rijetko koristi i ima više teorijsku nego
praktičnu vrijednost.

Varijansa
Za konstrukciju varijanse primjenjujemo četiri faze. Prve tri faze su iste kao faze koje
smo analizirali za konstrukciju srednjeg apsolutnog odstupanja.

Postupak za rješavanje četvrte faze je različit. Da bismo izbjegli anuliranje pozitivnih


odstupanja od aritmetičke sredine sa negativnim odstupanjima od aritmetičke
sredine, za svaku opservaciju računamo kvadratno odstupanje od aritmetičke sredine
(xi - x ) 2 i zatim računamo njihovu aritmetičku sredinu.

Varijansa je jednaka aritmetičkoj sredini kvadrata odstupanja između modaliteta i


njihove aritmetičke sredine.

33
Osobine varijanse
Osobine varijanse možemo formalizirati na sljedeći način:
¨ Ako svakoj opservaciji dodamo isti broj, varijansa se neće promijeniti:

¨ Ako svaki podatak u posmatranoj seriji pomnožimo sa nekim brojem a,


varijansa će biti pomnožena sa a2:

¨ Dvije prethodne osobine možemo istovremeno posmatrati I izraziti sljedećom


relacijom:

Standardna devijacija
Varijansa je parameter disperzije čija se numerička vrijednost ne može korektno
objasniti, ali koja posjeduje analizirane osobine računanja. Standradna devijacija je
najznačajnija mjera disperzije opšteprihvaćena u statističkoj analizi I predstavlja
prosječno odstupanje vrijednosti numeričke varijable od njene artimetičke sredine.

34
Standardna devijacija:

ona se izražava u istoj jedinici mjere kao i posmatrana varijabla.

Relativne mjere disperzije


Interkvantilna relativna odstupanja
Interkvantilna relativna odstupanja dobijamo tako što u odnos stavimo odgovarajuće
kvantile.

Najčešća interkvantilna relativna odstupanja su:

Koeficijent kvartilne devijacije


Koeficijent kvartilne devijacije je relativni pokazatelj disperzije i definišemo ga na
sljedeći način:

Vrijednost ovog koeficijenta se kreće u intervalu od 0 do 1, ili od 0 do 100% ako ga


izrazimo u procentima. Ako je vrijednost ovog koeficijenta jednaka nuli tada nema
disperzije. Veća vrijednost ovog koeficijenta ukazuje na veću disperziju.

Koeficijent varijacije
Koeficijent varijacije je relativna mjera disperzije definisana odnosom između
standardne devijacije i artimetičke sredine.

Koeficijent varijacije je neimenovani broj i uobičajeno je da ga izražavamo u


procentima. Koeficijent varijacije pokazuje Koliko jedinica standardne devijacije u
prosjeku otpada na svaku jedinicu artimetičke sredine.

Standardizovane varijable

35
Standardna devijacija je parameter koji opisuje disperziju statističke serije kao
cjeline. Za utvrđivanje relativnog položaja modaliteta varijable u seriji primjenjuje se
standardizovana vrijednost varijable koja je definisana sljedećim izrazom:

Standardizovana varijabla je jednaka količniku između odstupanja vrijednosti


varijable od artimetičke sredine i standardne devijacije.
Standardizovana varijabla je linearna transformacija vrijednosti varijable X.

Artimetička sredina standardizovane varijablje je jednaka nuli:

Čebiševa teorema
Čebiševa teorema omogućava istovremeno tumačenje artimetičke sredine I
standardne devijacije.

Primjer:

Ova teorema se koristi za definisanje karakterističnih intervala u inferencijalnoj


statistici.

36
MJERE OBLIKA DISTRIBUCIJE

Momenti distribucije frekvencija


Za konstrukciju paramatera oblika distribucije frekvencije koristimo centralne
momente distribucije frekvencija koji se definišu na bazi višestepenih odstupanja
vrijednosti varijable od artimetičke sredine.

Centralni moment r-tog reda je dat sljedećim izrazima:

Mjere asimetrije
Razlikuju se tri tipa distribucije:
¨ simetrična
¨ lijevo asimetrična
¨ desno asimetrična
Često nam analiza dijagrama u stupcima ili histograma omogućava da uočimo da li je
distribucija simetrična ili ne.

37
Polazna veličina za mjerenje asimetrije je treći momenat oko artimetičke sredine koji
je jednak artimetičkoj sredini odstupanja vrijednosti varijable od artimetičke sredine
podignutih na treći stepen.

Analiza osobina ovog parametra omogućava da konstatujemo da je u slučaju


simetrične distribucije brojnik navedenih izraza jednak nuli i trei momenat oko sredine
jednak nuli. U slučaju desne asimetrije moment trećeg reda je pozitivan. Za lijevo
asimetričnu distribuciju moment trećeg reda je negativan:

Moment trećeg reda zavisi od jedinica mjere u kojima je izražena varijabla I zbog
toga je njegova direktna primjena otežana. Da bi otklonio taj nedostatak. Ficher je

predložio sljedeći koeficijent asimetrije:

Ovaj koeficijent predstavlja relativnu mjeru smjera i veličine asimetrije:

Vrijednost Ficherovog koeficijenta asimetrije se najčešće nalazi u intervalu [-2;+2].


Postoji I drugi koeficijenti asimeterije koji su brži za računanje, a čije osobine
proizilaze iz empirijskih iskustava. To su:

koji je predstavljen kao standardizirano odstupanje moda od artimetičke sredine.


Najčešća vrijednost ovog koeficijenta se nalazi u interval (-3;+3).

38
Na grafikonu 2.10. je predstavljena simetrična distribucija. Kod simetrične distribucije
aritmetička sredina, mod i medijana su jednaki.

Za desno asimetričnu distribuciju artimetička sredina je veća od medijane I moda.


Relativna mjera asimetrije je pozitivna.

39
Za lijevo asimetričnu distribuciju artimetička sredina je manja od medijane I moda.
Relativna mjera asimetrije je negativna.

PARAMETRI SPLJOŠTENOSTI

Konstrukcija parametara spljoštenosti je bazirana na četvrtom momentu oko sredine:

Četvrti moment oko sredine je prosječno odstupanje vrijednosti varijable od njene


artimetičke sredine podignuto na četvrti stepenč

Zaobljenost se upoređuje i mjeri prema zaobljenosti modalnog vrha normalne


distribucije koristeći sljedeće koeficijente:

40
MJERE KONCENTRACIJE

Mjere koncentracije analiziraju način raspodjele agregatnih veličina ili globalnih


vrijednosti na modalitete statističkih varijabli.
Mjere koncentracije se dijele na apsolutne i relativne.

Najpoznatije apsolutne mjere koncentracije su koncentracijski omjer i Herfindahlov


indeks.

Relativne mjere koncentracije se nazivaju i mjere nejednakosti u raspodjeli


agregatnih veličina. Među najpoznatije mjere koncentracije ubrajaju se Lorenzova
kriva ili kriva koncentracije i Ginijev koeficijent.

Lorenzova kriva
Lorenzova kriva se konstruiše u pravougaonom koordinatnom sistemu na osnovu
relativnih kumulativnih frekvencija i relativne kumulativne globalne vrijednosti.
Globalna vrijednost predstavlja proizvod fj xcj u kojem je fj frekvencija intervala čiji je
centar xc . Na apscisu se nanose kumulativne relativne frekvencije Fj a na ordinatu
relativne kumulativne globalne vrijednosti Qj .

Da bismo nacrtali Lorezovu krivu prvo konstruišemo kvadrat čije su strane jednake
jedinici. Ovaj kvadrat je poznat pod imenom Ginijev kvadrat. Dijagonala kvadrata
odgovara liniji jednake raspodjele. Lorenzova kriva se nalazi u trouglu čija tjemena
imaju koordinate (0,0), (1,1) i (0,1). Potpuna nejednakost u raspodjeli je određena
katetama trougla (0,1) i (1,1).
Kada se kriva više udaljava od dijagonale koncentracija je vea i raspodjela je
neravnomjernija i obrnuto.

41
Ginijev koeficijent
Ginijev koeficijent je relativna mjera koncentracije i definisan je kao odnos površine
između Lorenzove krive i pravca jednake raspodjele i površine trougla koji se nalazi
ispod dijagonale koja predstavlja pravac jednake raspodjele. Površina između
Lorenzove krive i pravca jednake raspodjele se naziva i površina koncentracije.

Kada je Ginijev koeficijent jednak nuli, koncentracija je jednaka nuli i postoji perfektna
jednakost u raspodjeli mase primanja.

Ako je Ginijev koeficijent jednak jedinici koncentracija je maksimalna i postoji


maksimalna nejednakost u raspodjeli ukupne mase primanja.

Medijala
Medijala je vrijednost varijable pridružena relativnoj kumulativnoj rastućoj globalnoj
vrijednosti od 50%.

42
FORMULE
MJERE CENTRALNE TENDENCIJE

Artimetička sredina:

Formula za izračunavanje negrupisane serije podataka.

Formula za izračunavanje neintervalno grupisane


podatke.

Formula za izračunavanje intervalno


grupisane podatke.

Mod:
fmax =fMo (za grupisane podatke)
---------------------------------------------------------------

(Formula za izračunavanje mod-a kad se nalaze intervali)

Medijana:
Određuje se na osnovu rastuće kumulante

*Neparan broj podataka“

*Paran broj podataka*


43
*Intervalno grupisana serija*

Kvartili:
Označavaju se sa Q1 , Q2 , Q3....

Prvi modalitet kod kog je zadovoljeno N/4 <S(rastuća)a(...) je prvi kvartil gdje se
nalazi Q1...
A za izračunavanje 3.kvartila 3N/4 <S(rastuća)a(...) ............. je treci kvartil gdje se
nalazi Q3...

Decili:

44
Decili se označavaju sa D1, D2, …..D9 i predstavljaju kvantile reda 10%, 20%, ...,
90%. Ima ih devet i dijele uređenu statističku seriju na 10 jednakih dijelova. U
uređenoj seriji 20% opservacija prethodi D2, a 80% opservacija se nalazi poslije D2.
Npr: D8 = 8N/10 <S(rastuća) (…) = D8 = (…)

Centili:
Centili se označavaju sa C1, C2, ..C95, … C99L predstavljaju kvantile reda 1%,
2%, .., 95%, ..., 99%. Ima ih, dakle, 99 i dijele uređenu statističku seriju na 100
jednakih dijelova. U uređenoj seriji 1% podataka prethodi C1 i 99% podataka slijedi
poslije C1. Kao i za medijanu, kumulativna frekvencija kvantila reda p % je vrlo blizu
p % kada su podaci istovremeno mnogobrojni i razliciti.

MJERE VARIJABILITETA (DISPERZIJE)

Mjere disperzije se dijele na apsolutne i relativne.

Apsolutne mjere disperzije

Raspon varijacije: Raspon varijacije predstavlja apsolutno odstupanje između


maksimalne i minimalne vrijednosti varijable:

Interkvantilno apsolutno odstupanje:

Prosječno apsolutno odstupanje:

Varijansa:

45
Standardna devijacija:

Relativne mjere disperzije:

Interkvantilna relativna odstupanja:

Koeficijent kvartilne devijacije:


46
Koeficijent varijacije:

Čebiševa teorema:

MJERE OBLIKA DISTRIBUCIJE

Momenti distribucije frekvencija:

47
Mjere asimetrije:

Ficherov koeficijent:

Pearsonov koeficijent:

48
PARAMETRI SPLJOŠTENOSTI

MJERE KONCETRACIJE

Lorenzova kriva:

Ginijev koeficijent:

49
Određivanje Ginijevog koeficijenta metodom trapeza:

Ako koristimo relativne frekvencije izražene u procentima, formula za izračunavanje


Ginijevog koeficijenta je jednaka sljedećem izrazu:

Određivanje Ginijevog koeficijenta metodom trouglova:

Medijala:

50
51

You might also like