You are on page 1of 19

STATISTIKA-TABLIČNO PRIKAZIVANJE PODATAKA

Kao pomoć u donošenju odluka koriste se podaci.

Statistika je znanost o prikupljanju, organiziranju, prezentiranju, analiziranju i interpretiranju


podataka radi potpore u donošenju učinkovitijih odluka.

KLASIFIKACIJA PODATAKA

1. KVALITATIVNI (kategorijalni)-npr. Npr.: spol, bračno stanje, boja očiju (=definirane kategorije)
2. KVANTITATIVNI (numerički)
a. Diskretni-npr. br. studenata, broj neispravnih proizvoda u seriji (=prebrojavanje)
b. Kontinuirani -npr. visina, masa, BDP (=mjerenje)

MJERNE LJESTVICE (SKALE)

Podaci se mogu razvrstati u 4 mjerne ljestvice s obzirom na metrička svojstva: nominalna, ordinalna,
intervalna i omjerna.

Mjerna ljestvica određuje količinu informacija u podacima.

Mjerna ljestvica određuje koje su metode statističke (i matematičke) obrade prikladne.

NOMINALNA LJESTVICA-Kategorije (nema rangiranja ili smjera)

Nominalni podaci su oznake ili nazivi koji se koriste za klasifikaciju.

Oznake mogu biti numeričke i nenumeričke.

Numeričke oznake ne predstavljaju broj, nego samo brojčanu šifru, identifikator.

Podaci se ne mogu rangirati.

Npr. Bračno stanje (oženjen/udata, neoženjen/neudata, udovac/ica, rastavljen/a)

Turisti prema rezidentnosti (0=Domaći, 1=strani (primjer numeričkih oznaka))

Status studenta (R=Redoviti, I=izvanredni (primjer nenumeričke oznake))

Obveznik podnošenja porezne prijave (0=Ne (nije obveznik), 1=Da (obveznik))

ORDINALNA LJESTVICA-Rangirane kategorije (rangiranje, redoslijed)

Slično nominalnim podacima, ordinalni podaci su oznake ili nazivi, ali se mogu rangirati.

Oznake mogu biti numeričke i nenumeričke.

Numeričke oznake ne predstavljaju broj.

Primjeri:

Stručna sprema (NSS, SSS, VŠS, VSS)

Standards and Poor’s rating (AAA, AA+, AA, AA-, A+, A, A-, BBB,.., D)

Zadovoljstvo uslugom (1 – u potpunosti nezadovoljan, 2 – djelomično nezadovoljan, 3 – niti


nezadovoljan niti zadovoljan, 4 – djelomično zadovoljan, 5 – u potpunosti zadovoljan)

Ocjena kolegija (1- nedovoljan, 2 – dovoljan, 3 – dobar, 4 – vrlo dobar, 5 – izvrstan)


Sklonost kupca u odnosu na tri vrste ledenog čaja (Prvi izbor, drugi izbor, treći izbor)

INTERVALNA LJESTVICA-Razlika između mjera je jednaka, ali nema prave nule

Kod intervalne mjerne ljestvice jednake razlike u brojevima jednake su razlikama u mjernom svojstvu,
tj. razlike brojeva su jednake.

Intervalna ljestvica ukazuje na udaljenost, mjerenu jediničnim intervalima, od proizvoljno izabrane


nule.

Položaj nule je dogovorno određen, nula ne znači ne postojanje pojave.

Primjer:

Mjerenje temperature:

stupanj Celzija, stupanj Farenheita

Razlika između 20 i 21°C jednaka je razlici između 21 i 22°C.

Razlika između 50 i 51°F jednaka je razlici između 51 i 52°F.

OMJERNA LJESTVICA-Razlika između mjera je jednaka, postoji prava nula

Omjerna ljestvica slična je intervalnoj, ali omjer opažanja ima smisla.

Kod omjerne mjerne ljestvice jednake razlike u brojevima predstavljaju jednake razlike u mjernom
svojstvu.

Omjerna ljestvica ukazuje na udaljenost, mjerenu jediničnim intervalima, od prirodne nule.

Nula znači nepostojanje pojave.

Primjer: Udaljenost, plaća, masa, količina izvoza

VRSTE VARIJABLI

Nominalna i ordinalna ljestvica vrste su kvalitativnih (kategorijalnih) podataka.

Intervalna i omjerna ljestvica ubrajaju se u kvantitativne (numeričke) podatke

Mjerne ljestvice-dopuštene operacije


Ljestvica Aritmetičke operacije Mjere centralne tendencije
Nominalna ništa Mod
Ordinalna ništa Mod, medijan
Intervalna +,- Mod, medijan, ar.sredina
omjerna +,-,×,÷ Mod, medijan,
arit.,harm.,geom. sredina

PRESJEČNI PODACI

Presječni podaci ili podaci vremenskog presjeka prikupljaju se u isto (ili u približno isto) vrijeme.

Prikuplja se ista vrsta podataka za više jedinica npr. noćenja turista u siječnju o.g. po županijama.

VREMENSKA SERIJA
Podaci se prikupljaju za određeno vremensko razdoblje (npr. 10 godina). Npr. izvoz iz Hrvatske
tijekom posljednjih 10 godina.

PANEL

Panel podataka je kombinacija podataka vremenske serije i vremenskog presjeka (longitudinalno


istraživanje).

Npr. godišnji podaci o BDP-u, izvozu i uvozu za Hrvatsku, Sloveniju i Mađarsku u razdoblju od 10
godina.

IZVORI PODATAKA

1. PRIMARNI-istraživanje (anketa), eksperiment, promatranje


Anketa o zadovoljstvu kupaca.
Testiranje materijala različitih dobavljača kako bi se izabrao materijal koji će se koristiti u
proizvodnji.
Brojanje prolazaka automobila kroz raskrižje kako bi se procijenila isplativost postavljanja
reklamnog panoa.
2. SEKUNDARNI-objavljeni
Državni zavod za statistiku – DZS, npr. Popisni podaci.
Zagrebačka burza – ZSE, npr. kretanje cijene dionica HT-a.
Hrvatska turistička zajednica – HTZ, npr. Dolasci turista u kampove.

POPULACIJA I UZORAK

Populacija (ili osnovni skup) je cjelovit skup svih elemenata (vrijednosti) koji zanimaju istraživača.

N predstavlja veličinu populacije

Uzorak je promatrani podskup jedinki (vrijednosti) populacije.

n predstavlja veličinu uzorka

OBILJEŽJA

Parametar je specifično obilježje populacije. Npr. prosječna starost svih studenata Fakulteta.

Statističko obilježje (eng. statistic) je specifično obilježje uzorka. Npr. prosječna starost uzorka
studenata Fakulteta.

Primjeri populacije:

Svi stanovnici Hrvatske. Sva domaćinstva u Primorsko-goranskoj županiji. Sve dionice kojima se trguje
na Zagrebačkoj burzi. Svi studenti Ekonomskog fakulteta u Rijeci.

JEDNOSTAVNI SLUČAJNI UZORAK

U jednostavnom slučajnom uzorku:

Svaki element populacije bira se slučajnim izborom, ima jednaku mogućnost biti

izabran, svaki mogući uzorak veličine n ima jednake mogućnosti biti izabran.

SUSTAVNI UZORAK

Članovi populacije moraju biti poredani na način koji nije u vezi s predmetom interesa.
Izabere se svaki k-i element iz populacije: k=N/n

Slučajno se izabere broj od 1 do k za prvi element koji se izabire.

GRANE STATISTIKE

1. DESKRIPTIVNA-Grafički i numerički postupci za sumiranje i obradu podataka


a. Prikupljanje podataka-Npr. anketa
b. Prikazivanje podataka-Npr. tablice i grafikoni
c. Sumiranje podataka-Npr. prosjek uzorka
2. INFERENCIJALNA-Podaci iz uzorka koriste se donošenje zaključaka ili odluka o populaciji
 proces donošenja zaključka ili donošenja odluka o populaciji na temelju rezultata
uzorka
 za procjenu karakteristike populacije-Npr. procjenjujemo prosječnu masu studenata
na temelju uzorka
 za testiranje hipoteza o populaciji-Npr. testiramo tvrdnju kako je prosječna masa
studenata 70 kg

NOVE TEHNIKE - POSLOVNA ANALITIKA

Poslovna analitika kombinira statističke metode s metodama i tehnikama menadžmenta i


informacijskih sustava.

Statističke metode se rabe za analizu i istraživanje podataka kako bi se otkrili neočekivani odnosi.

Metode menadžmenta uporabljaju se za razvoj modela koji utječu na organizacijsku strategiju,


planiranje i organizaciju.

Metode informacijskih sustava rabe se za prikupljanje i obradu podataka svih veličina, uključujući i
velike skupove podataka koja bi inače bilo teško učinkovito procijeniti.

Poslovna analitika – primjeri primjene u kontekstu donošenja odluka

Marketing – vođenje programa vjernosti i istraživanje donošenja odluka potrošača kako bi se


povećala prodaja.

Upravljanje ljudskim resursima – razumijevanje odnosa između pokretača ljudskih resursa, ključnih
poslovnih rezultata, vještina zaposlenika, sposobnosti i motivacije.

Upravljanje opskrbnim lancima – prognoziranje na temelju distribucije proizvoda i optimiziranja


prodaje na temelju ključnih mjera zaliha.

Financijska analiza – određivanje zašto se događaju određeni trendovi kako bi se prognozirala buduća
financijska okolina.

TABLIČNO I GRAFIČKO PRIKAZIVANJE PODATAKA

Vrsta tablica i grafikona ovisi o varijabli koja se obrađuje.

1. KVALITATIVNI PODACI
a. Tablice-distribucija frekvencija (1 varijabla), tablica kontingence (2+ varijabli)
b. Grafikoni-jednostavni stupci, strukturni krug, Paretov dijagram-1 varijabla
-višestruki (dvostruki) stupci-2+ varijable
2. KVANTITATIVNI PODACI
a. Uređeni niz-dijagram točaka, S-L dijagram
b. Distribucija frekvencija-histogram, poligon frekvencija (pojedinačne varijable)
-dijagram rasipanja (istraživanje odnosa među varijablama)
c. Kumulativna distribucija-kumulanta

TABLICA KONTINGENCE (unakrsna tablica)

 Prikazuje broj opažanja za svaku kombinaciju dviju (ili više) kvalitativnih varijabli
 r redaka i c stupaca-tablica kontingence reda r x c

PARETOV DIJAGRAM

 Koristi se za prikaz nominalnih podataka.


 Stupčasti grafikon u kojem su kategorije poredane od veće prema manjoj frekvenciji.
 Na istom grafikonu prikazan je i kumulativni poligon frekvencija.
 Koristi se za odvajanje „nekolicine najvažnijih” od „trivijalnog mnoštva”.
 Tipično se koristi pri u analizi pogrešaka u okviru kontrole kvalitete.

DISTRIBUCIJA FREKVENCIJA

Distribucija frekvencija je popis ili tablica koja sadrži razrede (klase) ili grupe (kategorije ili raspone
podataka) i pripadajuće frekvencije.

DISTRIBUCIJA FREKVENCIJA - RAZREDI

Broj razreda ovisi o veličini uzorka, veći uzorak uobičajeno ima veći broj razreda.

Obično se rabi najmanje 5, ali ne više od 15-20 razreda.

Širina razreda zaokružuje se na više.

Razredi se ne smiju preklapati.

Širina razreda-formula:

w = i = širina razreda = (najveća vrijednost − najmanja vrijednost)/ broj razreda

PITANJA PRI GRUPIRANJU PODATAKA

1. Koliko treba razred biti širok? (koliko razreda treba biti?)


2. Kako odrediti granice razreda?-Cilj je kreirati distribuciju koja nije niti previše „nazubljena”
niti previše „kockasta”

KOLIKO RAZREDA?

Puno razreda (uski intervali)-Može dovesti do prilično „nazubljene” distribucije s „rupama” za prazne
razrede.

Malo razreda (široki intervali)-Može previše sažeti varijacije i dovesti do „kockaste” distribucije

-Može sakriti važne uzorke varijacije


HISTOGRAM

 Grafikon uspravnih stupaca distribucije podataka


 Nema razmaka između stupaca
 Na apscisi se prikazuju granice razreda
 Na ordinati se nanose frekvencije, relativne frekvencije ili postoci
 Visina stupaca predstavlja frekvenciju, relativnu frekvenciju ili postotak

POLIGON FREKVENCIJA

 Linijski grafikon
 Na apscisi se prikazuje sredina razreda.
 Na ordinati se prikazuju frekvencije, relativne
 frekvencije ili postoci.
 Dodaje se i jedan razred prije prvog razreda, te jedan razred nakon posljednjeg razreda.
Frekvencije nadodanih razreda su 0

DIJAGRAM RASIPANJA

 upotrebljava se za parove opažanja dviju kvantitativnih varijabli


 Jedna varijabla mjeri se na apscisi, a druga na ordinati
 Rabi se za istraživanje moguće povezanosti između dviju kvantitativnih varijabli

POGREŠKE PRI PRIKAZIVANJU PODATAKA

 Sabijanje ili nepravilno prikazivanje ordinate


 Ne uključivanje nule na ordinati
 Ne navođenje relativne baze prilikom usporedbe podataka

DESKRIPTIVNA STATISTIKA

BROJČANE MJERE

 Mjere centralne tendencije i položaja


 Mjere disperzije
 Mjere oblika distribucije podataka
 Mjere eksploracije podataka
 Kovarijanca, regresija i koeficijent korelacije

VRSTE NUMERIČKIH DESKRIPTIVNIH POKAZATELJA

 Mjere centralne tendencije ili srednje vrijednosti


 Mjere varijabilnosti – disperzije – raspršenosti
• Standardizirana varijabla – standardizirane vrijednosti varijable, pomoću kojih se
procjenjuje relativni položaj podataka u odnosu na aritmetičku sredinu, također pokazuju
postoje li neke netipične vrijednosti varijable koje utječu na nesimetričnost distribucije
 Pokazatelji oblika distribucije:
• Koeficijent asimetrije
• Koeficijent zaobljenosti
• Tablica pet ključnih pokazatelja – five number summary (5’S)

MJERE CENTRALNE TENDENCIJE I POLOŽAJA

 srednjim vrijednostima, a to su:


• ARITMETIČKA SREDINA i GEOMETRIJSKA SREDINA – u izračun uključuju sve vrijednosti
brojčane varijable
 Položajne mjere:
• MOD i MEDIJAN – određuje ih položaj u skupu brojčanih podataka

ARITMETIČKA SREDINA

 Može se odrediti na dva načina:


• JEDNOSTAVNA aritmetička sredina – računa se za negrupirane podatke
• VAGANA ili PONDERIRANA aritmetička sredina – računa se za podatke grupirane u
distribuciju frekvencija pri čemu su frekvencije ponderi

IZDVOJENICE ILI NETIPIČNE VRIJEDNOSTI

 Izdvojenice (engl. outliers) su ekstremne vrijednosti koje su netipično male ili netipično velike
 Razlozi za pojavu izdvojenica su različiti, npr.:
• rijedak podatak
• krivo razvrstavanje podataka u grupu
• pogreška mjerenja
• pogreška unosa podataka
 Izdvojenice mogu značajno utjecati na veličinu prosjeka pa s takvim utjecajem prosjek može
biti loša mjera centralne tendencije

„UREĐENI” PROSJEK

Sa ciljem da se odstrani utjecaj netipično malih i/ili velikih vrijednosti podataka, može se ukloniti, tj.
„odrezati” postotak malih ili velikih vrijednosti u skupu podataka.

Prosjek preostalih podataka naziva se uređeni prosjek (engl. Trimmed Mean).

Namjera je da se dobije bolji pokazatelj centralne tendencije skupa podataka – a to je „odrezani”


prosjek.

„Odrezani” prosjek od 5% znači da je odstranjeno 5% najmanjih i 5% najvećić vrijednosti iz skupa


podataka.

Znači da se uređeni prosjek od 5% računa kao prosjek središnjih 90% podataka.

Općenito, uređeni prosjek od α posto dobiven je izostavljanjem α posto podataka na početku i α


posto na kraju niza te izračunavanjem prosjeka za preostale podatke.
PREDNOSTI ARITMETIČKE SREDINE:

 Aritmetička sredina je dobro razumljiva većini ljudi


 Izračun prosjeka je jednostavan i uključuje sve vrijednosti brojčane varijable

NEDOSTACI ARITMETIČKE SREDINE:

 Osjetljiva na ekstremne vrijednosti


 U distribucijama s jednom ili više izdvojenica prosjek nije najbolji pokazatelj pa se
preporučuje uporaba medijana.

MEDIJAN (Me)

 Ukoliko niz podataka sadrži izdvojenice, umjesto aritmetičke sredine prikladnije je koristiti
medijan.
 MEDIJAN je mjera položaja koja niz podataka uređenih po veličini dijeli na dva jednakobrojna
dijela. Ubraja se u skupinu pokazatelja koji se nazivaju kvantili.
 KVANTILI su vrijednosti koje niz uređenih podataka dijele općenito na q jednakih dijelova.
 Za izračun medijana potrebno je prvo podatke urediti po veličini. Zatim se izračunava
medijalna točka.

PREDNOSTI MEDIJANA:

 U odnosu na potpune srednje vrijednosti manje je osjetljiv na ekstremne vrijednosti


(izdvojenice).
 Reprezentativnost medijana u asimetričnim distribucijama frekvencija veća je u odnosu na
aritmetičku sredinu.
 Može se uporabljati čak i kada nisu poznate sve vrijednosti varijable.

NEDOSTACI MEDIJANA:

 Kada je broj opažanja mali, reprezentativnost medijana može biti upitna.


 Ako cilj istraživanja zahtijeva i analizu izdvojenica, tada izračun medijana nije opravdan.

MOD (Mo)

 MOD je najčešća vrijednost u skupu podataka.


 Niz podataka ne mora imati niti jednu vrijednost koja se ponavlja – bezmodalna distribucija.
 U nizu podataka moguće je da postoji više vrijednosti koje se ponavljaju identičan broj puta –
višemodalna distribucija.

PREDNOSTI MODA:

 Brz i jednostavan način određivanja


 Najmanje je osjetljiv na izdvojenice
 Može se odrediti za numeričke i nenumeričke podatke
NEDOSTACI MODA:

 Osjetljiv je na različito razvrstavanje frekvencija


 Ponekad nije informativan (pravokutna distribucija)
 Ponekad nema jedinstveno tumačenje – bimodalne i višemodalne distribucije (koji od njih je
reprezentativniji?)

OSTALE MJERE CENTRALNE TENDENCIJE

 Kvartili
 Harmonijska sredina
 Geometrijska sredina

KVARTILI

 Osim medijana, koji niz uređenih podataka po veličini dijeli na dva jednaka dijela, koriste se
još neke mjere položaja.
 Kvartili (engl. quartiles ili hinge) niz podataka uređenih po veličini dijeli na četvrtine, a
percentili na stote dijelove.
• Prvi kvartil (Q1) niz dijeli na dva nejednaka dijela tako da prvi dio obuhvaća ¼ podataka, a
drugi dio preostale ¾ podataka.
• Treći kvartil (Q3) niz dijeli na dva nejednaka dijela tako da prvi dio obuhvaća ¾ podataka,
a drugi dio preostalu ¼ podataka.

HARMONIJSKA SREDINA (H)

 Harmonijska sredina recipročna je vrijednost aritmetičke sredine izračunana iz recipročnih


vrijednosti za koje se sredina izračunava.
 Može se odrediti na dva načina:
• JEDNOSTAVNA harmonijska sredina – računa se za negrupirane podatke
• VAGANA ili PONDERIRANA harmonijska sredina – računa se za podatke grupirane u
distribuciju frekvencija

GEOMETRIJSKA SREDINA

 koristi se:
• za izračunavanje stope promjene pojave u vremenu
• kao srednja vrijednost numeričkih podataka
 Geometrijska sredina može se koristiti u poslovnoj ekonomiji za određivanje prosječne stope
povrata na ulaganje
MJERE DISPERZIJE (VARIJABILNOSTI)

 Varijabilnost podataka mjeri se stupnjem rasipanja, odnosno disperzije oko neke mjere
centralne tendencije.
 To su potpune i nepotpune mjere disperzije:
• Raspon varijacije
• Interkvartil
• Varijanca
• Standardna devijacija
• Koeficijent varijacije
• Srednje apsolutno odstupanje

RASPON VARIJACIJE

 Najjednostavnija mjera disperzije je raspon varijacije, koji predstavlja razliku između najveće i
najmanje vrijednosti podataka

INTERKVARTIL

 Interkvartilni raspon varijacije određuje varijabilnost središnjih 50% podataka – isključuje


25% najmanjih i 25% najvećih podataka pa na ovu mjeru izdvojenice nemaju utjecaja

GRAFIKON BOX-PLOT (BP)

 BP grafikon sastoji se od pravokutnika (ili kutije, engl. box) čiju veličinu određuju kvartili.
Pravokutnik je podijeljen na mjestu medijana, a iz njega vire „brkovi” do najmanje i najveće
vrijednosti podataka.
 Jednostavni BP-dijagram ističe pet vrijednosti:
• medijan
• kvartile
• najmanju vrijednost i najveću vrijednost
 Uz BP-dijagram uobičajeno se prikazuje tablica tih pet ključnih pokazatelja tzv. five number
summary (5’S).
 BP-dijagram je prikladan za prikaz raspona varijacije i interkvartila te smjera eventualne
asimetrije podataka.

VARIJANCA

 Varijanca je prosječna vrijednost zbroja kvadrata odstupanja pojedinih vrijednosti niza


podataka od njihova prosjeka.

STANDARDNA DEVIJACIJA

 Standardna devijacija računa se kao drugi korijen iz varijance, a izražava prosječno


odstupanje od prosjeka u jedinicama mjere u kojima su izraženi podaci za koje se računa.
Apsolutni je pokazatelj reprezentativnosti prosjeka

SREDNJE APSOLUTNO ODSTUPANJE

 Srednje apsolutno odstupanje (MAD engl. Mean Absolute Deviation) uzima apsolutne
vrijednosti odstupana xi od aritmetičke sredine.
KOEFICIJENT VARIJACIJE

 Koeficijent varijacije (V) je mjera disperzije kojom se prosječno odstupanje od prosjeka


izražava relativno.

MJERE OBLIKA DISTRIBUCIJE PODATAKA

 Mjere oblika distribucije podataka opisuju način na koji su podaci raspoređeni između
najmanje i najveće vrijednosti.
 Pokazatelji su:
• Koeficijent asimetrije i
• Koeficijent zaobljenosti

MJERE ASIMETRIJE

 Mjere do koje razine podaci nisu simetrični.


 Distribucija je simetrična ako izgleda isto lijevo i desno od središnje točke.
 Ako je mjera asimetrije:
• Jednaka nula – simetrična distribucija
• Negativna – lijevostrano asimetrična distribucija
• Pozitivna – desnostrano asimetrična distribucija

METODE EKSPLORACIJE PODATAKA

 Eksploracijske metode otkrivanja izdvojenih ekstremnih vrijednosti uključuju grafičke alate i


brojčane metode:
• BP-dijagram i tablica 5’S
• Standardiziranu varijablu (z-skor) te empirijsko i Čebiševljevo pravilo
• Kombinaciju metoda za eksploracijsku analizu
 Empirijsko pravilo i Čebiševljevo pravilo korisni su za otkrivanje netipičnih, izdvojenih
vrijednosti i za utvrđivanje relativnog položaja podatka u odnosu na aritmetičku sredinu.
Temelje se na standardiziranoj vrijednosti (z) numeričke varijable.

EMPIRIJSKO PRAVILO

 Empirijsko pravilo primjenjivo je na distribuciju numeričkih podataka zvonolikog


(simetričnog) oblika i određuje sljedeće obuhvate podataka:
• Raspon µ ± 1σ obuhvaća oko 68% podataka
• Raspon µ ± 2σ obuhvaća oko 95% podataka
• Raspon µ ± 3σ obuhvaća oko 99,7% podataka

ČEBIŠEVLJEVO PRAVILO

 Čebiševljevo pravilo koristi se za distribucije koje nemaju poznat oblik ili koje nisu zvonolikog
oblika i određuje sljedeće obuhvate podataka:
• Najmanje 75% podataka obuhvaćeno je rasponom µ ± 2σ
• Najmanje 89% podataka obuhvaćeno je rasponom µ ± 3σ
• Najmanje 94% podataka obuhvaćeno je rasponom µ ± 4σ
 Kao netipične (izdvojene) vrijednosti najčešće se određuju one koje su izvan granica
aritmetičke sredine ±3 standardne devijacije te je takve vrijednosti potrebno dodatno
analizirati.
ANALIZA VREMENSKIH NIZOVA

 Vremenski niz je skup kronološki uređenih vrijednosti pojave. Vrijednosti promatrane


varijable vremenskog niza označavaju se Yt i zovu se frekvencije.
 S obzirom na vrijeme opažanja vrijednosti pojave postoje dvije vrste vremenskog niza:
• intervalni vremenski niz
• trenutačni vremenski niz.
 Kod intervalnog vremenskog niza vrijednost pojave mjeri se u vremenskom intervalu.
 Kod trenutačnog vremenskog niza vrijednost pojave mjeri se u trenutku vremena.

VRSTE VREMENSKIH NIZOVA:

Intervalni vremenski niz

• promatranje u vremenskom intervalu (BDP 2019. god.)


• ima svojstvo kumulativnosti (moguće izračunati sumu frekvencija intervala vremenskog niza)

Trenutačni vremenski niz

• pojave moguće promatrati samo u presjeku vremena (u “kritičnom trenutku”)


• frekvencije pokazuju razinu pojave u “kritičnom trenutku”, npr. broj zaposlenih (stanje
30.09.)
• nema svojstvo kumulativnosti

Grafičkim prikazom vremenskih nizova postiže se jasnija i preglednija slika kretanja vrijednosti
promatran pojave kroz vrijeme.

Intervalni vremenski nizovi mogu se prikazivati:

• linijskim grafikonom
• površinskim grafikonom (obično su to stupci koji su naslonjeni jedan na drugi, jer vrijeme
teče kontinuirano).

Trenutačni vremenski nizovi mogu se prikazivati:

• linijskim grafikonom.

Preporuka: na istom grafikonu ne uspoređivati više od 3pojave

POKAZATELJI DINAMIKE

U svrhu definiranja kretanja vrijednosti neke pojave u vremenu koriste se apsolutni i relativni
pokazatelji:

• Apsolutni pokazatelji računaju se običnim oduzimanjem vrijednosti pojave u jednom


vremensko razdoblju od vrijednosti iste pojave u drugom razdoblju i izražavaju se u
originalnim jedinicama mjere.
• Relativni pokazatelji, za razliku od apsolutnih, omogućuju usporedbu kretanja pojava s
različitim jedinicama mjere. Relativni pokazatelji su indeksi i stope promjene.
INDEKSNI BROJEVI

Indeksi su relativni brojevi dinamike koji pokazuju:

• relativan odnos između dva ili više stanja jedne te iste pojave na dva različita mjesta ili u dva
različita vremenska intervala

primjena: kod trenutačnih i kod intervalnih vremenskih nizova

Podjela indeksa:

• S obzirom na obuhvat promatranih pojava:


 individualni indeksi
 skupni (grupni, agregatni) indeksi
• S obzirom na bazu usporedbe:
 indeksi stalne baze usporedbe (bazni indeksi)
 indeksi promjenjive baze usporedbe (verižni ili lančani)

Prednosti indeksa pred drugim brojevima su sljedeće:

 indekse je lako izračunati kako iz apsolutnih podataka, tako i iz koeficijenata ili samih indeksa
- ukratko iz svih vrsta statističkih podataka i pokazatelja
 indeksi daju zornu sliku o veličini relativnih promjena pojava u vremenu
 s obzirom da su indeksi neimenovani brojevi, moguće je uspoređivati indekse raznovrsnih
pojava, čija usporedba inače ne bi bila moguća zbog različitih mjernih jedinica

Individualni indeksi su relativni pokazatelji dinamike kretanja vrijednosti pojave vremenskog niza i
njima se uspoređuje stanje jedne pojave u različitim vremenskim intervalima ili momentima.

Individualni indeksi dijele se na:

 verižne indekse
 bazne indekse.

VERIŽNI INDEKSI

 Verižni indeksi su relativni brojevi koji pokazuju promjene stanja pojave u uzastopnim
razdobljima.
 Verižni indeks (Vt) računa se tako da se vrijednost frekvencije vremenskog niza podijeli s
vrijednosti prethodnog razdoblja i omjer pomnoži sa 100
 Oduzme li se od verižnih indeksa 100, razlika pokazuje iznos relativne promjene razine pojave
u uzastopnim razdobljima.
 Verižni indeksi grafički se prikazuju jednostavnim stupcima ili specifičnim linijskim
grafikonom.

INDEKSI NA STALNOJ BAZI

 Bazni indeksi (It) mjere promjenu razine pojave u relativnom iznosu prema razini pojave u
razdoblju izabranom za bazu usporedbe
 Za bazno razdoblje treba uzeti vrijeme u kojemu pojava nije bila izložena neuobičajenim
utjecajima.
 Indeksi na stalnoj bazi ili bazni indeksi pokazuju relativne promjene (u %) pojave u tekućem
razdoblju u odnosu na neko odabrano bazno razdoblje. Ako se od baznih indeksa oduzme
100, onda rezultat pokazuje za koliko % se vrijednost pojave u jednom razdoblju promijenila
u odnosu na odabrano bazno razdoblje.
 Bazni indeksi se tumače u postotcima tako da se od njih oduzme 100.
 Pri provođenju statističke analize u praksi treba pažljivo birati bazno razdoblje jer se
pogrešnim izborom mogu dobiti iskrivljene predodžbe o dinamici pojave.
 Ako se na primjer za bazno razdoblje odabere takvo razdoblje u kojemu je vrijednost pojave
najmanja u nizu, izračunati bazni indeksi će pokazivati porast u odnosu na bazu.
 Ako se, suprotno, za bazno razdoblje odabere ono u kojemu je vrijednost pojave najveća u
nizu, bazni indeksi će pokazivati stalan pad u odnosu na izabranu bazu. Na taj način se u
praksi može manipulirati podacima.

TUMAČENJE INDEKSA

 Kod tumačenja indeksa korisnici često ne znaju kada upotrebljavati postotke, a kada
indeksne poene.
 Pravilo je jednostavno: kada se tumači vrijednost samo jednog indeksa koriste se postoci, a
kada se uspoređuje vrijednost dvaju indeksa razlika se iskazuje u indeksnim poenima.
 Znači da je Laspeyresov indeks za 1,8 indeksna poena veći od Paascheovog indeksa (110,4%-
108,6%=1,8 indeksna poena).

ANALIZA POVEZANOSTI MEĐU POJAVAMA

 Ako se istražuje jakost statističkih veza – stupanj statističke povezanosti između pojava –
primijenit će se korelacijska analiza
 Ako je svrha analitički (jednadžbom) izraziti odnos između pojava ocjenjivat će se regresijski
modeli
 Model koji sadrži jednu zavisnu i jednu nezavisnu varijablu naziva se modelom jednostavne
regresije, a model s dvije ili više nezavisnih varijabli model višestruke regresije.
 Regresijska i korelacijska analiza provode se na osnovi stvarnih vrijednosti pojava (varijabli),
tj. prikupljenih podataka o analiziranim pojavama.
 Povezanost pojava može biti:
• funkcionalna (matematička) – veze se mogu predočiti izrazima na temelju kojih se točno
utvrđuje vrijednost jedne za danu vrijednost druge (drugih) vrijednosti: Y = f (X )
• statistička – jednoj vrijednosti jedne pojave odgovara više vrijednosti druge (drugih)
pojava

DIJAGRAM RASIPANJA

 Za određivanje oblika regresije kao vrlo prikladno, a jednostavno sredstvo koristi se dijagram
rasipanja.
 Stoga je polazna točka u korelacijskoj i regresijskoj analizi izrada dijagrama rasipanja.
 Dijagram rasipanja je grafički prikaz točaka u koordinatnom sustavu koje predstavljaju niz
uređenih parova (x1, y1), (x2, y2), …, (xn, yn); pri čemu su xi vrijednosti jedne nezavisne
varijable (X), a yi, vrijednosti zavisne varijable (Y).
 Iz rasporeda točaka može se zaključiti o obliku, smjeru i jakosti veze, odnosno jesu li varijable
korelirane ili nisu.
• Pozitivan ili izravan odnos između dvaju varijabli je odnos između dviju varijabli u kojem ako
jedna varijabla raste i druga varijabla raste i obratno.
• Svi linearni odnosi s pozitivnim nagibom (smjerom) su izravni odnosi.
• Inverzan ili negativan odnos je odnos između dviju varijabli u kojem jedna varijabla raste dok
se druga smanjuje i obratno.
• Svi linearni odnosi s negativnim nagibom (smjerom) su inverzni odnosi.
• Nelinearan (krivolinijski) odnos između dvije varijable
• Nema povezanosti između dvije varijable

KOVARIJANCA

 Kovarijanca je mjera smjera i jakosti linearne povezanosti između dviju varijabli.


 Veličina kovarijance ovisi o mjerilu u kojem su iskazne varijable.
 Nije moguće uspoređivati veličine kovarijance između različitih mjernih jedinica (npr.
Kilogrami nasuprot godinama).
 Zbog toga se kovarijanca standardizira → računa se koeficijent linearne korelacije

KOEFICIJENT LINEARNE KORELACIJE

 Pearsonov koeficijent korelacije također je mjera smjera i jakosti linearne povezanosti


između dviju varijabli.
 Jakost veze među pojavama na temelju koeficijenta korelacije može se tumačiti
Chadockovom ljestvicom:

r Tumačenje
0 Odsutnost veze
0 – (±0,5) Slaba veza
(±0,5) – (±0,8) Veza srednje jakosti
(±0,8) – (±1) Jaka veza
±1 Potpuna veza

KOEFICIJENT KORELACIJE RANGA

Ispitivanje stupnja veze između pojava danih u obliku modaliteta redoslijedne (ordinalne, rang)
varijable nije moguće na isti način kao i za varijable dane u obliku numeričkih nizova (kvantitativna
varijabla), jer varijable ranga nemaju za to potrebna metrička svojstva. Stoga se koriste
neparametrijske metode.

Vrijednosti dviju rang varijabli rangiraju se po veličini, a povezanost njihovih rangova mjeri se
Spearmanovim koeficijentom korelacije ranga
MODEL JEDNOSTAVNE LINEARNE REGRESIJE

Regresijski model je jednadžba s parametrima i varijablama kojima se opisuje povezanost zavisne


varijable (Y) i nezavisne varijable (X). Model uključuje i pogrešku relacije.

 b0 je očekivana vrijednost zavisne varijable (y) kada je vrijednost nezavisne varijable (x)
jednaka nuli (x=0).
 b1 pokazuje prosječnu promjenu zavisne varijable (y) kada se nezavisna varijabla (x)
promijeni za jedinični iznos

METODA NAJMANJIH KVADRATA

Metoda najmanjih kvadrata je procedura kojom se, na temelju podataka iz uzorka, ocjenjuje
regresijska jednadžba, odnosno parametri b0 i b1

Metoda najmanjih kvadrata koristi podatke uzorka za procjenu vrijednosti b0 i b1 za koje zbroj
kvadrata odstupanja između stvarnih vrijednosti zavisne varijable yi i procijenjenih vrijednosti zavisne
varijable postiže minimum

MJERE VARIJABILNOSTI: SST, SSR I SSE

Analiza varijance u modelu jednostavne linearne regresije (ANOVA) polazi od raščlambe zbroja
kvadrata odstupanja vrijednosti zavisne varijable od njezina prosjeka (SST) na komponentu
protumačenu modelom (SSR) i neprotumačenu (SSE) ili rezidualnu komponentu:

SST = SSR + SSE

Broj stupnjeva slobode općenito se odnosi na broj nezavisnihopažanja u uzorku minus broj
populacije koji se moraju procijeniti iz podataka uzorka.

KOEFICIJENT DETERMINACIJE

Koeficijent determinacije je mjera reprezentativnosti regresijskog modela. Zasniva se na analizi


varijance.

Koeficijent determinacije pokazuje kolika je proporcija odstupanja protumačena regresijskim


modelom u ukupnim odstupanjima.

Regresijski model je reprezentativniji što je vrijednost R2 bliže 1:

• Za vremenske serije premašuje 0,7


• Za presječne podatke (npr. države ili tvrtke) vrijednost je u rasponu 0,4 - 0,6

KORIGIRANI KOEFICIJENT DETERMINACIJE

Korigirani koeficijent determinacije je mjera reprezentativnosti regresijskog modela koja uzima u


obzir stupnjeve slobode, odnosno veličinu uzorka i broj nezavisnih varijabli.

Vrijednost korigiranog koeficijenta determinacije manja je ili jednaka vrijednosti koeficijenta


determinacije, a može biti i negativna.
S obzirom da korigirani koeficijent determinacije uzima u obzir broj stupnjeva slobode, a time i broj
nezavisnih varijabli, njegova važnost dolazi do izražaja u modelu višestruke linearne regresije.

KOEFICIJENT LINEARNE KORELACIJE

Koeficijent linearne korelacije usko je povezan s koeficijentom determinacije.

Na ovaj način ne dobiva se njegov predznak, već se predznak određuje prema predznaku regresijskog
koeficijenta b1:

predznak (r) = predznak (b)

PRETPOSTAVKE REGRESIJSKOG MODELA

Pretpostavke modela slučajnih pogrešaka (ε) jesu:

• Sredina nula – Pogreške predstavljaju slučajnu varijablu sa sredinom jednakom 0.


• Konstantnost varijance (homoskedastičnost) – Varijanca slučajnih pogrešaka s 2 jednaka je za
sve vrijednosti varijable x.
• Normalna distribuiranost – Distribucija slučajnih pogrešaka slijedi normalnu distribuciju za
sve vrijednosti varijable x.
• Nezavisnost – Slučajne pogreške međusobno su statistički nezavisne – nisu u međusobnoj
korelaciji

GRAFIČKI PRIKAZ VREMENSKOG NIZA

Trend je dugoročna karakteristična i zakonomjerna linija kretanja vremenskog niza.

Prije početka modeliranja, preporuča se grafički prikazati podatke. Na taj se način može brzo
procijeniti postoji li među podacima linearan odnos.

Ako postoj trend, provjeriti linearnost:

• Linearnost trenda može se uočiti iz grafikona. Ako varijabla X (vrijeme) ima linearni odnos s Y
onda će se točke, koje prikazuju parove njihovih vrijednosti, nakupljati oko ravne linije.
• Ako je prisutna krivulja, koristiti nelinearni trend

MODEL TRENDA

 Na prethodnom grafikonu vidljiva je linearna povezanost između vremena (X) i Y (porastom


vremenskog razdoblja povećava se i Y).
 Linearni trend može se prikazati ravnom linijom.
 Jednostavna regresijska analiza jedna je od najčešće korištenih metoda za modeliranje
linearnog odnosa ili trenda.
 Regresijskim modelom moguće je izvršiti interpolaciju trenda. Interpolacija je procjena
regresijskih vrijednosti zavisne varijable na temelju nezavisne varijable.
 Regresijski model moguće je koristiti za predviđanje kretanja pojave u budućem razdoblju
(ekstrapolacija)
ZNAČENJE REGRESIJSKIH PARAMETARA

Parametri b0 i b1 u regresijskom modelu imaju sljedeće značenje:

Parametar b0 je odsječak regresijske linije na osi Y:

 ako model uključuje vrijednost X=0, b0 pokazuje vrijednost varijable Y za X=O, odnosno b0 je
očekivana vrijednost vremenskog niza u ishodišnom razdoblju
 ako model ne uključuje X=0, b0 nema posebno značenje u regresijskom modelu.

Parametar b1 je nagib (smjer) regresijske linije:

 pokazuje prosječnu linearnu promjenu zavisne varijable Y kada nezavisna varijabla (vrijeme)
poraste za jedinicu X.

OCJENA REGRESIJSKE FUNKCIJE

U modelu linearnog trenda pretpostavlja se da je zavisna varijabla funkcija vremena (vrijeme je


nezavisna varijabla) i slučajne pogreške, koja je rezultat svih ostalih utjecaja.

Cilj regresijske analize je ocijeniti nepoznate parametre b0 i b1, koji pokazuju kako promjene
nezavisne varijable (vrijeme) utječu na vrijednosti zavisne varijable.

Uobičajena metoda za ocjenu regresijskog modela je METODA NAJMANJIH KVADRATA (OLS).

Pretpostavlja se da su odstupanja oko linije najmanjih kvadrata slučajna.

TESTIRANJE POUZDANOSTI MODELA TRENDA

Nakon ocjene parametara modela trenda postavlja se pitanje reprezentativnosti, odnosno


sposobnosti modela da objasni kretanje zavisne varijable vremenskog niza Y kroz vrijeme X.

Jedan od načina provjere je da se grafički prikaže standardna pogreška u odnosu na zavisnu varijablu
Y.

“Oblik" grafikona pokazat će je li funkcija koju ste modelirali zapravo linearna.

REZIDUALNA ODSTUPANJA (E)

 Mjere razliku između stvarnih i procijenjenih vrijednosti vremenske serije u razdoblju t.


 Rezidualna odstupanja trebaju biti relativno mala.

APSOLUTNA REZIDUALNA ODSTUPANJA (A)

 Mjere razliku apsolutnu vrijednost rezidualnih odstupanja u razdoblju t.


 Apsolutna odstupanja trebaju biti relativno mala.

PROSJEČNA APSOLUTNA POSTOTNA ODSTUPANJA (MAPE)

 Mjere apsolutnu devijaciju u postotku od stvarnih vrijednosti.


 MAPE treba biti manji od 10%.
TESTIRANJE POUZDANOSTI MODELA

Prilikom izrade modela možete se zapitati koji statistički testovi mogu pokazati je li model dobar. Ne
postoji jedan točan odgovor. Pokazatelji koji se najčešće koriste:

 MSE – Prosječna kvadratna pogreška – ili varijanca regresije je aritmetička sredina kvadrata
rezidualnih odstupanja.
 Standardna pogreška procjene – ili standardna devijacija trenda je pozitivan drugi korijen iz
varijance. Treba biti manja u usporedbi s drugim modelima. Vrijednost će ovisiti o vrijednosti
varijable Y koja se modelira. Znači, usporedba je moguća samo s drugim modelima koji imaju
jednaku zavisnu varijablu.
 R2 – Koeficijent determinacije – je proporcija modelom protumačenog dijela zbroja kvadrata
odstupanja u ukupnom zbroju kvadrata odstupanja. Ova vrijednost treba biti što viša

PROSJEČNA KVADRATNA POGREŠKA (MSE)

 Mjeri kvadratna rezidualna odstupanja


 MSE predstavlja procjenu varijance (σ2) regresijskog modela
 NAPOMENA: U regresijskoj analizi, prosječna kvadratna pogreška (MSE) je zbroj kvadrata
reziduala podijeljen pripadajućim stupnjevima slobode. Kod prognoziranja, MSE je prosjek
zbroja kvadrata prognostičke pogreške.

METODA EKSTRAPOLACIJE TRENDA

Osnovno obilježje ekstrapolacije trenda je da su buduće vrijednosti bilo koje varijable “određene
isključivo svojim povijesnim vrijednostima."

Osnovna procedura:

• Određuje se trend za prošlo razdoblje i odgovarajuća krivulja


• Buduća vrijednost prognozira se na temelju ocijenjene krivulje

Prednosti:

• Zahtijeva malo podataka


• Jednostavna metodologija

Nedostaci:

• Koristi samo zbirne podatke


• Pretpostavlja se da će se trendovi iz prošlosti nastaviti i u budućnosti.

You might also like