Professional Documents
Culture Documents
Poslovna statistika
Sadržaj:
Statistika i statistička istraživanja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Parametri spljoštenosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Mjere koncentracije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Formule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
abc pitanja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1
TEORI JA
STATISTIKA I STATISTIČKA ISTRAŽIVANJA
Pojam statistike
Naziv statistika potiče od novolatinskog termina ratio status i italijanskog ragione di
stato što znači državni interes i izvedenice statista koja predstavlja osobu sposobnu
za vođenje državnih poslova.
Veličina populacije - broj statističkih jedinica koje sačinjavaju jednu populaciju (N).
2
¨ Deskriptivna statistika predstavlja skup metoda koje omogućavaju opis,
prezentaciju i rekapitulaciju podataka koji su najčešće vrlo brojni.
Prikupljanje podataka
Podatak je činjenica koja može, ali i ne mora, biti brojana i koja predstavlja
informaciju koju možemo koristiti u našem istraživanju. Za prikupljanje podataka
možemo koristiti više metoda.
Npr, možemo posmatrati broj osoba prisutnih u amfiteatru, boju table, boju očiju, itd.
Veliki broj podataka prikupljen na ovaj način sadržan je u evidencijama, registrima i
3
dokumentima (npr.: podaci o broju rođenih, broju umrlih, o prodaji određenog
proizvoda, temperaturi, itd.)
Osnovna prednost ove metode leži u njezinoj objektivnosti. Potrošač nije u direktnom
kontaktu s istraživačem i ponaša se spontano. Na taj način kvalificirani i stručni
istraživači mogu zapaziti vrlo važne elemente i karakteristike ponašanja ispitanika,
koji su značajni za daljnju perspektivu istraživanja.
Anketa se sastoji u ispitivanju određenog broja osoba jedne populacije. Ova metoda
omogućava prikupljanje podataka koji se ne mogu prikupiti direktnim posmatranjem i
koje je teško prikupiti na drugi način. Postoje također ankete mišljenja, profesionalne
ankete, sociološke ankete, itd.
Upitnik je sistem pitanja vezan uz ciljeve istraživanja, na koje anketar mora dobiti
odgovore od ispitanika.
Metode uzorkovanja:
¨ Slučajni uzorci (zasnovani na vjerovatnoći - jedinice populacije se slučajno
biraju u uzorak)
• Jednostavni slučajan uzorak
• Sistematski uzorak
• Panel uzorak, itd.
4
Sistematski uzorak
Slučajan uzorak u kojem izbor elemenata u uzorak vršimo po nekom sistematskom
redu odabirući slučajno početak.
Stratifikovani uzorak
Stratifikacija (tipski izbor) - proces grupisanja jedinica populacije u podpopulacije
(stratume) koje su unutar sebe homogene a između sebe heterogene.
Heterogena populacija – mogu se generisati stratumi (npr. studenti I, II ili III godine
Fakulteta)
¨ Prednosti:
• Osigurava zastupljenost jedinica iz svakog stratuma.
• Povećava efikasnost i preciznost jer omogućava kontrolu strukture
uzorka.
Klaster uzorak
Procedura uzorkovanja za klaster uzorak:
¨ Populacija se dijeli na skupine.
¨ Bira se slučajno određeni broj skupina (klastera) koje predstavljaju populaciju.
¨ U uzorak se uključuju sve jedinice koje se nalaze u izabranim skupinama
(klasterima)
5
Manja efikasnost nego u slučaju jednostavnog slučajnog uzorka.
Panel uzorak
Koristi se:
¨ da bi se istražile promjene karakteristika populacije u vremenu,
¨ da se kontinuirano prate neke pojave,
¨ u istraživanju tržišta, praćenju troškova života, itd.
Višeetapni uzorak
Populacija se podijeli na podskupove prema hijerarhijskom principu
Postepeno, po etapama izbora:
¨ prva etapa - biramo jedinice prvog stepena.
¨ druga etapa - iz svake jedinice prvog stepena biramo jedinice drugog
stepena...
¨ posljednja etapa – formira se uzorak.
Kvota uzorak
U skladu sa specifičnim kriterijem i ciljem istraživanja izaberu se podpopulacije iz
kojih se mora anketirati određeni broj jedinica prema zadanoj kvoti i to je jedini uslov
kod ovog tipa uzorkovanja.
Kvota je unaprijed zadana (recimo 65% žena) i istraživač jedino mora zadovoljiti tu
kvotu te ne mora uvažavati princip slučajnog izbora.
Prigodan uzorak
Uzimamo u uzorak elemente do kojih smo u datom trenutku jedino mogli doći ili koji
su nam se slučajno prigodno našli pri ruci, npr. uzorak koji pravi profesor od svojih
studenata, uzorci koje formira anketar presrećući prolaznike na ulici ili kupce u robnoj
kući i slično.
Prednosti:
6
¨ najjeftiniji,
¨ najkraće vreme provođenja,
¨ pogodan za eksplorativna istraživanja
Nedostaci:
¨ pristrasnost izbora,
¨ nije reprezentativan,
¨ nije preporučljiv za opisna i uzročna istraživanja
Dobrovoljan uzorak
¨ u uzorak uzimamo osobe koje su izrazile spremnost da budu dio našeg uzorka
¨ npr. testiranje lijekova ili dobrovoljni davaoci krvi.
Snowball uzorkovanje
Identificiranje i kvalificiranje inicijalnog seta respondenata koji mogu pomoći
istraživačima pronaći ostale sudionike istraživanja.
7
Kod grupnog intervjua vodi se razgovor sa 4-8 osoba.
Popis je oblik prikupljanja podataka pri kojem se obuhvataju sve jedinice statističkog
skupa u određenom trenutku. Popis je najobuhvatniji način prikupljanja podataka.
Pošto zahtijeva veliki utrošak sredstava i vremena provodi se samo u određenim
vremenskim intervalima, npr. svakih 10 godina.
Eksperiment
Način prikupljanja podataka neposrednim čulnim opažanjem, korištenjem pomoćnih
tehničkih sredstava ili bez njih.
Kao primjer ovog postupka prikupljanja podataka možemo navesti razne izvještaje
kojima se podaci prikupljaju periodično, historijske dokumente, itd.
Obrada podataka
Obrada prikupljenih podataka podrazumijeva realizaciju tri osnovne etape koje
prethode donošenju odluka:
¨ Deskriptivna analiza slijedi poslije prve etape i cilj joj je da opiše i predstavi
prikupljene podatke pomoću tabela, grafičkih prikaza, izračunavanja osnovnih
8
parametara. Bitni postupci u ove dvije etape su klasiranje, vizualizacija i
sinteza prikupljenih podataka.
Skup podataka o posmatranom obilježju za dio jedinica skupa predstavlja uzorak koji
služi kao osnova za zaključivanje o osnovnom skupu (populaciji).
PRIMJER:
Masovna pojava: nezaposlenost
Statistički skup:
- radno sposobno stanovništvo
Statistička jedinica:
- radno sposobni stanovnik
9
- radno sposobno stanovništvo
Prostorna definicija:
- grad Sarajevo ili Zeničko-Dobojski kanton
Statističke varijable
Obilježja po kojima se razlikuju jedinice statističkih skupova nazivaju se varijable.
PRIMJER:
Statistička varijabla dužina radnog staža:
¨ zaposleni u kompaniji “Shine” se razlikuju po dužini radnog staža,
¨ svakom zaposlenom u kompaniji “Shine” možemo pridružiti jednu i samo jednu
vrijednost dužine njegovog radnog staža.
¨ modalitet varijable dužina radnog staža je npr. 10 godina, 7 mjeseci i 14
dana.
10
¨ Poredak bitan, nemaju svi modaliteti isti značaj.
¨ Dozvoljeno prebrojavanje i logičke operacije poređenja (<,=,>), ali ne i
matematičke operacije.
¨ Moguće opisno date modalitete zamijeniti rangovima (1., 2., 3., ...).
¨ naziva se i varijabla ranga.
11
Relativna frekvencija (pi) – predstavlja proporciju elemenata koji imaju isti modalitet.
Rastuća apsolutna kumulanta – koliko podataka ima vrijednost manju ili jednaku
vrijednosti modaliteta xi na kojoj se trenutno nalazimo.
Rastuća relativna kumulanta - koliki je % podataka koji imaju vrijednost manju ili
jednaku vrijednosti modaliteta xi na kojoj se trenutno nalazimo (ako pomnožimo sa
100%).
RJEŠENJE:
Populacija
¨ studenti
Statistička jedinica
¨ student
Veličina populacije
¨ N=15
Varijabla
¨ omiljeni filmski žanr
Tip varijable
¨ kvalitativna nominalna
Modaliteti
¨ Akcija, drama, horor, komedija, triler
Distribucija frekvencija
PRIMJER:
Na osnovu ispitivanja 35 gradova dobili smo podatke o broju osnovnih škola u
jednom gradu:
1, 1, 2, 3, 5, 6, 1, 2, 2, 4, 2, 6, 2, 3, 4, 1, 2, 7, 2, 2, 4, 4, 3, 4, 2, 2, 3, 4, 3, 3, 5, 3, 1, 5,
2
Uporediti i komentarisati statističku seriju sa bruto podacima, uređenu statističku
seriju i statističku distribuciju frekvencija.
RJEŠENJE:
Populacija
¨ gradovi
13
Statistička jedinica
¨ grad
Veličina populacije
¨ N=35
Varijabla
¨ broj osnovnih škola u gradu
Tip varijable
¨ kvantitativna prekidna
Modaliteti
¨ 1,2,3,4,5,6,7
1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6,
7
14
Na osnovu radne tabele potvrđujemo da:
¨ Posljednja rastuća apsolutna kumulativna frekvencija mora uvijek biti jednaka
N.
¨ Posljednja opadajuća apsolutna kumulativna frekvencija mora uvijek biti
jednaka 0.
¨ Posljednja rastuća relativna kumulativna frekvencija mora uvijek biti jednaka 1.
¨ Posljednja opadajuća relativna kumulativna frekvencija mora uvijek biti
jednaka 0.
Tumačenje frekvencija
Ordinalna
- odgovara joj ordinalna mjerna skala
15
- npr. zvanje univerzitetskog radnika
PRIMJER:
U fast-food objektima prodaju se tri različita tipa napitaka: bezalkoholna pića, čajevi i
kafa. Bezalkoholna pića se nude u obliku tri veličine: mala, srednja i velika. Koji tip
varijable predstavlja:
PRIMJER:
Kojeg su tipa varijable pomoću kojih izražavamo:
Temperaturu u amfiteatru
¨ Kvantitativna varijabla sa intervalnom skalom jer 0 ne znači odsustvo
pojave
Bračno stanje
¨ Kvalitativna nominalna (atributivna) varijabla (modaliteti opisno dati, svi
imaju isti relativni značaj)
Način plaćanja potrošača u tržnom centru (gotovina, kreditna kartica, ček, potrošačka
kartica, ostalo)
16
¨ Kvalitativna nominalna iz ugla tržnog centra ili moguće ordinalna iz ugla
potrošača
PRIMJER:
U nizu je analizirano 40 podataka. Ako je za modalitet 20 izračunata relativna
frekvencija 0,3, odrediti apsolutnu frekvenciju tog modaliteta.
RJEŠENJE:
PRIMJER:
Za 25 domaćinstava imamo informacije o veličini zemljišnog posjeda (u ha):
12,3 13,4 14,8 8,3 13,6 12,4 12,0 12,8 11,2 13,8 15,0 13,2 16,2
12,7 11,7 13,9 13,0 9,5 14,5 12,7 16,0 13,5 10,2 9,6 14,8
RJEŠENJE:
Populacija
¨ zemljišni posjedi
Statistička jedinica
¨ posjed
Veličina populacije
¨ N=25
Varijabla
¨ veličina posjeda
Tip varijable
¨ kvantitativna neprekidna (kontinuirana)
- j- ti interval
17
- apsolutna frekvencija j - tog intervala
- n - broj intervala,
N=25
Centri intervala
Kod intervalno grupisane serije kako
bismo omogućili dalje kalkulacije sa
podacima moramo intervale
aproksimirati njima odgovarajućim
razrednim sredinama ili centrima
intervala:
Ri fi
8-10 3 ci
18
9
10-12 3
12-14 13
14-16 4
16-18 2
25
PRIMJER:
Za zadanu distribuciju frekvencija:
RJEŠENJE:
19
Postoji više vrsta grafičkih reprezentacija. Najčeše korišten oblik grafičkog
predstavljanja su dijagrami koji se dijele na:
¨ stigmograme,
¨ linearne dijagrame,
¨ površinske dijagrame i
¨ stereograme.
Ako je nominalna varijabla poredak nije bitan, ako je ordinalna varijabla poredak
stubaca je bitan i ne smije se mijenjati.
Jednostavni stupci
Na y-osi su apsolutne frekvencije
Na x-osi su modalieti (opisi), stupci iste širine i razdvojeni
20
Strukturni stubac
Jedan stubac visine 100% se dijeli na modalitete prema njihovim procentualnim
frekvencijama: Pi=pi*100
Strukturni krug
Jedan krug sa 360° se dijeli na modalitete prema njihovim uglovima: ugao=p i*360°
21
Razlike se ističu.
Kartogram
22
Odstupanja mjesečnih količina padavina (%) od normalnih vrijednosti za januar 2020.
godine u Kantonu Sarajevo
Grafikoni – Excel
U Excelu u segmentu Insert – Chart možemo naći funkciju Chart i odabrati različite
tipove grafikona:
PRIMJER:
Na kursu za manekenke koji je pohađalo 58 djevojaka zabilježili smo njihovu boju
očiju i dobili sljedeću distribuciju frekvencija:
23
¨ Riječ je o nominalnoj kvalitativnoj varijabli “boja očiju”.
¨ Populacija su djevojke sa kursa za manekenke.
¨ N=58
¨ Koristićemo sljedeće grafikone:
stupce
strukturni krug
strukturni stubac
Grafikon stubaca:
broj djevojaka
25 23
20
15 14
12
10 9
0
plava smeđa crna zelena
boja očiju
Strukturni krug:
24
Strukturni stubac:
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
plava smeđa crna zelena
25
Pozicione mjere srednje vrijednosti su:
¨ mod
¨ medijana i
¨ kvantili.
26
Mod je jedna od najstarijih pozicionih vrijednosti koja se jednostavno utvrđuje. Mod
se definiše kao modalitet varijable koji se najčešće pojavljuje tj. Modalitet koji ima
najveću frekvenciju.
Serija može biti bimodalna ili višemodalna ukoliko se u jednoj seriji nalazi više
modaliteta koji imaju najvišu frekvenciju.
Prednosti moda
¨ Može se odrediti i za kvalitativnu varijablu
¨ Jednostavno se određuje
¨ Nije osjetljiv na “outliere”
Nedostaci moda
¨ Ne može se uvijek odrediti
¨ Osjetljiv je na način kako se formira statististička serija i njeni intervali
¨ Nepouzdan kod asimetričnih distribucija
27
Medijana ili centar pozicije
Medijana spada u pozicione srednje vrijednosti. Medijana je vrijednost obilježja koja
u u seriji uređenoj po veličini (rastućem ili opadajućem redosljedu) zauzima centralnu
poziciju (rang) i dijeli seriju na dva jednaka dijela.
Teorijski 50% podataka ima vrijednost manju ili jednaku medijani i preostala polovina
podataka vrijednosti veće od medijane. Medijana je poziciona srednja vrijednost i za
izračunavanje medijane nisu bitne vrijednosti svih podataka nego njihov rang u seriji.
28
U seriji grupisanoj u intervale, medijana se računa na sljedeći način:
Karakteristike medijane
29
Kvantili
U uređenoj seriji {x(i) } kvantil reda p koji označavamo sa xp je jednak vrijednosti
varijable za koju postoji proporcija opservacija koje su jednake ili manje od xp i
komplementarna proporcija (1-p) opservacija koje su veće od xp:
Kvartili
Kvartili se označavaju sa Q1, Q2, Q3 i predstavljaju kvantile reda p=1/4, p=1/2 i
p=3/4 ili reda 25%, 50% i 75%. Kvartili su vrijednosti varijable koji distribuciju uređenu
po veličini dijele na 4 jednaka dijela.
30
Decili
Decili se označavaju sa D1, D2, …..D9 i predstavljaju kvantile reda 10%, 20%, ...,
90%. Ima ih devet i dijele uređenu statističku seriju na 10 jednakih dijelova. U
uređenoj seriji 20% opservacija prethodi D2, a 80% opservacija se nalazi poslije D2.
Centili
Centili se označavaju sa C1, C2, ..C95, … C99L predstavljaju kvantile reda 1%,
2%, .., 95%, ..., 99%. Ima ih, dakle, 99 i dijele uređenu statističku seriju na 100
jednakih dijelova. U uređenoj seriji 1% podataka prethodi C1 i 99% podataka slijedi
poslije C1. Kao i za medijanu, kumulativna frekvencija kvantila reda p % je vrlo blizu
p % kada su podaci istovremeno mnogobrojni i različiti.
PRIMJER:
31
MJERE DISPERZIJE ILI VARIJACIJE
32
Pri računanju treba primijeniti odgovarajuću formulu u zavisnosti od raspoloživih
podataka. Srednje apsolutno odstupanje je parametar koji je jednostavno objasniti.
Veća vrijednost srednjeg apsolutnog odstupanja ukazuje na veću disperziju podataka
u odnosu na njihovu aritmetičku sredinu. Srednje apsolutno odstupanje ne može biti
jednako nuli, osim u slučaju kad su svi modaliteti jednaki, ali tada se problem sinteze
podataka ne postavlja. Ovaj parametar se rijetko koristi i ima više teorijsku nego
praktičnu vrijednost.
Varijansa
Za konstrukciju varijanse primjenjujemo četiri faze. Prve tri faze su iste kao faze koje
smo analizirali za konstrukciju srednjeg apsolutnog odstupanja.
33
Osobine varijanse
Osobine varijanse možemo formalizirati na sljedeći način:
¨ Ako svakoj opservaciji dodamo isti broj, varijansa se neće promijeniti:
Standardna devijacija
Varijansa je parameter disperzije čija se numerička vrijednost ne može korektno
objasniti, ali koja posjeduje analizirane osobine računanja. Standradna devijacija je
najznačajnija mjera disperzije opšteprihvaćena u statističkoj analizi I predstavlja
prosječno odstupanje vrijednosti numeričke varijable od njene artimetičke sredine.
34
Standardna devijacija:
Koeficijent varijacije
Koeficijent varijacije je relativna mjera disperzije definisana odnosom između
standardne devijacije i artimetičke sredine.
Standardizovane varijable
35
Standardna devijacija je parameter koji opisuje disperziju statističke serije kao
cjeline. Za utvrđivanje relativnog položaja modaliteta varijable u seriji primjenjuje se
standardizovana vrijednost varijable koja je definisana sljedećim izrazom:
Čebiševa teorema
Čebiševa teorema omogućava istovremeno tumačenje artimetičke sredine I
standardne devijacije.
Primjer:
36
MJERE OBLIKA DISTRIBUCIJE
Mjere asimetrije
Razlikuju se tri tipa distribucije:
¨ simetrična
¨ lijevo asimetrična
¨ desno asimetrična
Često nam analiza dijagrama u stupcima ili histograma omogućava da uočimo da li je
distribucija simetrična ili ne.
37
Polazna veličina za mjerenje asimetrije je treći momenat oko artimetičke sredine koji
je jednak artimetičkoj sredini odstupanja vrijednosti varijable od artimetičke sredine
podignutih na treći stepen.
Moment trećeg reda zavisi od jedinica mjere u kojima je izražena varijabla I zbog
toga je njegova direktna primjena otežana. Da bi otklonio taj nedostatak. Ficher je
38
Na grafikonu 2.10. je predstavljena simetrična distribucija. Kod simetrične distribucije
aritmetička sredina, mod i medijana su jednaki.
39
Za lijevo asimetričnu distribuciju artimetička sredina je manja od medijane I moda.
Relativna mjera asimetrije je negativna.
PARAMETRI SPLJOŠTENOSTI
40
MJERE KONCENTRACIJE
Lorenzova kriva
Lorenzova kriva se konstruiše u pravougaonom koordinatnom sistemu na osnovu
relativnih kumulativnih frekvencija i relativne kumulativne globalne vrijednosti.
Globalna vrijednost predstavlja proizvod fj xcj u kojem je fj frekvencija intervala čiji je
centar xc . Na apscisu se nanose kumulativne relativne frekvencije Fj a na ordinatu
relativne kumulativne globalne vrijednosti Qj .
Da bismo nacrtali Lorezovu krivu prvo konstruišemo kvadrat čije su strane jednake
jedinici. Ovaj kvadrat je poznat pod imenom Ginijev kvadrat. Dijagonala kvadrata
odgovara liniji jednake raspodjele. Lorenzova kriva se nalazi u trouglu čija tjemena
imaju koordinate (0,0), (1,1) i (0,1). Potpuna nejednakost u raspodjeli je određena
katetama trougla (0,1) i (1,1).
Kada se kriva više udaljava od dijagonale koncentracija je vea i raspodjela je
neravnomjernija i obrnuto.
41
Ginijev koeficijent
Ginijev koeficijent je relativna mjera koncentracije i definisan je kao odnos površine
između Lorenzove krive i pravca jednake raspodjele i površine trougla koji se nalazi
ispod dijagonale koja predstavlja pravac jednake raspodjele. Površina između
Lorenzove krive i pravca jednake raspodjele se naziva i površina koncentracije.
Kada je Ginijev koeficijent jednak nuli, koncentracija je jednaka nuli i postoji perfektna
jednakost u raspodjeli mase primanja.
Medijala
Medijala je vrijednost varijable pridružena relativnoj kumulativnoj rastućoj globalnoj
vrijednosti od 50%.
42
FORMULE
MJERE CENTRALNE TENDENCIJE
Artimetička sredina:
Mod:
fmax =fMo (za grupisane podatke)
---------------------------------------------------------------
Medijana:
Određuje se na osnovu rastuće kumulante
Kvartili:
Označavaju se sa Q1 , Q2 , Q3....
Prvi modalitet kod kog je zadovoljeno N/4 <S(rastuća)a(...) je prvi kvartil gdje se
nalazi Q1...
A za izračunavanje 3.kvartila 3N/4 <S(rastuća)a(...) ............. je treci kvartil gdje se
nalazi Q3...
Decili:
44
Decili se označavaju sa D1, D2, …..D9 i predstavljaju kvantile reda 10%, 20%, ...,
90%. Ima ih devet i dijele uređenu statističku seriju na 10 jednakih dijelova. U
uređenoj seriji 20% opservacija prethodi D2, a 80% opservacija se nalazi poslije D2.
Npr: D8 = 8N/10 <S(rastuća) (…) = D8 = (…)
Centili:
Centili se označavaju sa C1, C2, ..C95, … C99L predstavljaju kvantile reda 1%,
2%, .., 95%, ..., 99%. Ima ih, dakle, 99 i dijele uređenu statističku seriju na 100
jednakih dijelova. U uređenoj seriji 1% podataka prethodi C1 i 99% podataka slijedi
poslije C1. Kao i za medijanu, kumulativna frekvencija kvantila reda p % je vrlo blizu
p % kada su podaci istovremeno mnogobrojni i razliciti.
Varijansa:
45
Standardna devijacija:
Čebiševa teorema:
47
Mjere asimetrije:
Ficherov koeficijent:
Pearsonov koeficijent:
48
PARAMETRI SPLJOŠTENOSTI
MJERE KONCETRACIJE
Lorenzova kriva:
Ginijev koeficijent:
49
Određivanje Ginijevog koeficijenta metodom trapeza:
Medijala:
50
51