You are on page 1of 24

STATISTIKA

MALA SKRIPTA

TEORIJA ZA USMENI

Verzija: 1.06.

ID: 10501
Bok!
Drago nam je što si odabrao SKRIPTARNICU za pronalazak materijala koji će ti pomoći u učenju.

Što je SKRIPTARNICA?
Skriptarnica je projekt Štreberaj tima i Žute kopiraone, a nastala je u želji da ti olakšamo studiranje.
Sve skripte možeš pogledati na stranici www.referada.hr, a kupiti u SKRIPTARNICI, odnosno u Žutoj
kopiraoni.

Kad se mali studenti slože… sve se može, sve se može


Ideja projekta je zajedničkim snagama napraviti što bolje materijale. Ako pronađeš nešto što je krivo
u skripti ili jednostavno želiš dati neku sugestiju, rado ćemo te poslušati. Pošalji nam mail na
skriptarnica@referada.hr

Updateamo materijale, zato pazi na verziju!


Sve sugestije i prijedloge pokušavamo što brže uvažiti. Na www.referada.hr i našoj facebook grupi
EFZG SUPPORT by Štreberaj možeš pratiti što se događa i uvijek biti u toku s najnovijim materijalima.
Na naslovnici ti piše koju verziju skripte imaš u rukama (npr. Verzija: 1.03).

Žuta is the place to be!


U Žutoj kopiraoni uvijek ćeš pronaći najnovije verzije naših skripti, pitalica i primjera ispita!

Tko je napisao skripte?


Skripte koje nađeš kod nas nisu nužno naše autorsko djelo. To su razne skripte koje nam studenti
donesu. Mi smo odabrali one najbolje i malo ih uredili tako da ti je ljepše ponavljati iz njih. U
Štreberaju uvijek preporučamo učenje iz knjige! Skripte su tu da ti pomognu ponoviti gradivo.

Koje skripte smo pisali mi?


Naši edukatori rade skripte iz kolegija za koje držimo instrukcije. Sve takve skripte u nazivu imaju
Štreberaj.

Želimo ti puno sreće s učenjem!

1
1. UVOD
Statistika – znanstvena metoda koja se bavi prikupljanjem, analiziranjem i tumačenjem podataka
različite vrste.

Podaci – promotrena kvalitativna i kvantitativna svojstva objekata, stvari, osoba, procesa...

Svrha primjene statističkih metoda – donošenje suda o osobitosti promatranih pojava, ispitivanje
različitih pretpostavki, predviđanje razine i stanja pojava.

Metode deskriptivne statistike – sastoje se u primjeni postupaka uređivanja, grupiranja, tabeliranja,


grafičkog prikazivanja statističkih podataka; podaci se ne poopćavaju.

Metode inferencijalne statistike – polaze od uzorka iz realne i konačne populacije čije se realizacije
mogu smatrati uzorkom procesa; njima se također donose vjerojatnosni sudovi o cjelini.

1.1. Statistički skup


Statistički skup – sastoji se od jedinica kojima se ispituje jedno ili više svojstava koja od jedinice do
jedinice očituju statističku promjenljivost

Opseg skupa – broj jedinica


~ prema opsegu skupa statistički skupovi se dijele na konačne i beskonačne

Konačan skup – ima konačan broj elemenata

Beskonačan skup – ima beskonačno mnogo elemenata

Skup podataka ili osnovni skup – podaci o danoj varijabli za svaki element statističkog skupa

Populacija može biti:


 realna
 hipotetična
 konačna
 beskonačna

Uzorak – podskup statističkog skupa


~ u svakom statističkom istraživanju realni statistički skupovi se definiraju pojmovno, prostorno i
vremenski
 Pojmovno – određuje se pripadnost skupu
 Prostorno – određuje se kojem skupu pripadaju sve jedinice stat. skupa
 Vremenski – određuje se vremenski interval ili vremenska točka za koje su vezane
sve jedinice skupa

2
1.2. Vrste i izvori statističkih podataka
Statistički podaci – rezultati mjerenja svojstava jedinica statističkih skupova, njihovih podskupova ili
eksperimentalnih jedinica

Statistička varijabla ili obilježje – svojstvo koje oblikom ili stupnjem varira od jedinice do jedinice
skupa; po njemu se elementi skupa razlikuju ili jedni drugima nalikuju

Skala
Skup modaliteta varijable

Razlikujemo:

 nominalnu
 ordinalnu
 intervalnu
 omjernu

Nominalna skala – dana je u obliku nenumeričkog skupa, odnosno liste naziva; redoslijed
odabran po volji; nisu dopuštene brojčane operacije (npr. po abecedi)

Ordinalna skala – pridružuje slovne oznake, simbole ili brojeve elementima skupa prema
intenzitetu mjerenog svojstva (npr. po rangu (ocjene))

Intervalna skala – pridružuju se jedinicama brojevi sukladno intenzitetu mjerenog svojstva;


ima definiranu mjernu jedinicu i dogovorno utvrđenu nulu; moguće su osnovne računske
operacije osim dijeljenja (npr. temperaturna skala)

Omjerna skala – pridružuju se brojevi jedinicama statističkog skupa sukladno intenzitetu


mjerenog svojstva; ima definiranu mjernu jedinicu i nulu koja označuje nepostojanje svojstva;
moguće su osnovne računske operacije

Numerička varijabla
To varijabla mjerena na numeričkoj skali (intervalnoj i omjernoj)

 diskretna num. varijabla – poprima konačan broj vrijednosti


 kontinuirana num. varijabla – može poprimiti bilo koju vrijednost iz nekog intervala

1.3. Uređivanje podataka


Svrha uređivanja stat. podataka – omogućiti donošenje osnovnih sudova o danoj pojavi; njihovim
uređenjem nastaju statistički nizovi.

Nominalni niz – nastaje uređenjem podataka o modalitetima nominalne varijable

3
Redoslijedni niz – nastaje uređenjem podataka o rang-varijabli
Numerički niz – formira se sređivanjem podataka koji predočuju vrijednosti numeričke varijable

Vremenski niz – kronološko nizanje podataka o nekoj pojavi

Jednostavna tabela – prikazuje se jedan stat. niz

Skupna tabela – prikazuje se više nizova nastalih sređivanjem podataka prema modalitetima iste
varijable

Tabela kontingence – prikazuju se podaci grupirani istodobno prema modalitetima dviju li više
varijabli

Relativni brojevi – pomoću njih se provodi elementarna analiza podataka u sklopu deskriptivne
statistike (postoci, proporcije, relativne frekvencije, indeksi i relativni brojevi koordinacije)

1.4. Niz kvalitativnih podataka


Kvalitativni podaci – oblici nominalne ili redoslijedne varijable

Grupiranjem se skup podataka koji se odnose na jedinice stat. skupa raščlanjuju u podskupove koji
se međusobno ne preklapaju

Frekvencija – broj podataka istog oblika varijable

Relativna frekvencija pi – omjer je frekvencije i ukupnog broja podataka

Postotna relativna frekvencija Pi – relativna frekvencija pomnožena sa 100

𝑓𝑖 𝑓𝑖
𝑝𝑖 = 𝑁
𝑃𝑖 = 𝑁
∙ 100

~ grupirani podaci se uobičajeno prikazuju tabelom kontigence, koja se sastoji od predstupca,


zaglavlja, polja tabele, marginalnog retka i marginalnog stupca

4
2.NUMERIČKI NIZOVI I DISTRIBUCIJA
FREKVENCIJA
Numerički nizovi nastaju uređenjem kvantitativnih podataka. Pojedinačni numerički podaci
predočavaju se dijagramom s točkama i dijagramom stablo list

Ako je riječ o velikom broju podataka, o numeričkoj kontinuiranoj varijabli ili ako diskretna numerička
varijabla poprima velik broj različitih vrijednosti, distribucija frekvencija formira se grupiranjem na
temelju razreda; svaki razred ima svoju gornju i donju granicu.

Frekvencija razreda
 broj istih i sličnih vrijednosti numeričke varijable
 formiranju distribucije prethodi određivanje broja razreka k i veličina razreda; broj razreda k
za grupiranje N vrijednosti numeričke varijable aproksimira se izrazom 𝑘 ≈ 1 + 3.3𝑙𝑜𝑔𝑁 –
Sturgesovo pravilo

Distribucija frekvencija prikazuje se histogramom i poligonom frekvencija


 Histogram – površinski grafikon
 Poligon frekvencija – linijski grafikon

2.1. Srednje vrijednosti statističkog niza


Aritmetička sredina
 najvažnija i najraširenija srednja vrijednost
 određuje se tako da se zbroje vrijednosti numeričke varijable i podijele s njihovim brojem

𝑁
1
𝑥̅ = ∑ 𝑥𝑖
𝑁
𝑖=1
Svojstva:
 zbroj odstupanja vrijednosti numeričke varijable od njezine aritmetičke sredine jednak je nuli
 zbroj kvadrata odstupanja vrijednosti numeričke varijable od njezine sredine minimalan je
 aritmetička sredina nalazi se između najmanje i najveće vrijednosti niza za koji je izračunana

Aritmetička sredina aritmetičkih sredina


 izračunava se kao vagana sredina u kojoj se za pondere uzima broj podataka za koje su
računane pojedine sredine
𝑘
1
𝑥̅ = ∑ 𝑁𝑖 𝑥̅
𝑁
𝑖=1

5
Aritmetička sredina relativnih brojeva koordinacije i aritmetička sredina postotaka
 izračunavaju se kao vagane sredine u kojima su ponderi osnovice tih brojeva

𝑣 𝐷𝑖
𝑅𝑖 = 𝐵𝑖 𝑃𝑖 = 𝐶𝑖
∙ 100
𝑖

Geometrijska sredina
Geometrijska sredina N vrijednosti numeričke varijable X jest N-ti korijen iz produkta njezinih
vrijednosti

𝐺 = 𝑁√𝑥1 ∙ 𝑥2 ∙ … 𝑥𝑖 … 𝑥𝑁

Za grupirane podatke, geometrijska sredina dana je izrazom


𝑁
𝑓 𝑓 𝑓 𝑓
𝐺 = √𝑥11 ∙ 𝑥22 ∙ … 𝑥𝑖 𝑖 ∙ … 𝑥𝑁𝑁

Harmonijska sredina
Harmonijska sredina N vrijednosti numeričke varijable X recipročna je vrijednosti aritmetičke sredine
njezinih recipročnih vrijednosti.
𝑁
𝐻=
1
∑𝑁𝑖=1 𝑥
𝑖
Mod
Mod je položajna srednja vrijednost; najčešća vrijednost ili modalitet koji se pojavljuje u nizu. Postoji
ako su u nizu barem dva jednaka podatka.
Mod distribucije frekvencija s razredima aproksimira se pomoću izraza:

(𝑏 − 𝑎)
𝑀𝑜 = 𝐿1 + ∙𝑖
(𝑏 − 𝑎) + (𝑏 − 𝑐)

b-najveća (korigirana) frekvencija; modalni razred je onaj sa najvećom kor. frekvencijom

Medijan. Kvantili
Medijan je položajna srednja vrijednost koja numerički niz uređen po veličini dijeli na dva jednaka
dijela
 ako je broj podataka neparan, medijan je vrijednost središnjeg člana uređenog po veličini
 ako je broj podatak paran, medijan je jednak poluzbroju vrijednosti varijable središnjih dvaju
članova uređenog niza

Medijan u distribuciji frekvencija s razredima aproksimira se pomoću izraza:

𝑁
− ∑ 𝑓1
𝑀𝑒 = 𝐿1 + 2 ∙𝑖
𝑓𝑚𝑒𝑑

6
fmed-frekvencija medijalnog razreda (medijalni je onaj razred čija kumulativna frekvencija prvi put
uključuje vrijednost N/2

Medijan se ubraja u kvantile. Kvantili su vrijednosti numeričke varijable ili modaliteti rang-varijable
koji uređen numerički ili redoslijedni niz dijele na jednakobrojne dijelove. Dijele li kvantili na četiri
jednakobrojna dijela riječ je o kvartilima, na 10 dijelova decilima, na 100 dijelova percentilima.

2.2. Mjere disperzije


Mjerama disperzije brojčano se opisuje stupanj varijabilnosti statističkih podataka; najjednostavnija
mjera disperzije je raspon varijacije. Među pokazatelje varijabilnosti ubrajaju se interkvartil i
koeficijent kvartilne devijacije; najvažnija mjera disperzije je varijanca te iz nje izvedena standardna
devijacija i koeficijent varijacije; rabi se i srednje apsolutno odstupanje (MAD)

Raspon varijacije. Interkvartil


Raspon varijacije je najjednostavnija približna mjera disperzije; izražen je u mjernim jedinicama
obilježja;
𝑅𝑥 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

Interkvartil je apsolutna mjera disperzije; raspon varijacije središnjih 50 % članova niza uređenih
parova
𝐼𝑄 = 𝑄3 − 𝑄1

Varijanca. Standardna devijacija. Koeficijent varijacije


Varijanca je aritmetička sredina kvadrata odstupanja vrijednosti numeričke varijable od njezine
aritmetičke sredine
1 𝑁
𝜎 2 = ∑ (𝑥𝑖 − 𝑥̅ )
𝑁 𝑖=1

Standardna devijacija je pozitivni drugi korijen iz varijance


𝑁
1
𝜎 = √ ∑(𝑥𝑖 − 𝑥̅ )2
𝑁
𝑖=1

Varijanca i standardna devijacija distribucije frekvencija:


1 1
𝜎 2 = 𝑁 ∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2 𝜎 = √𝑁 ∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2

Koeficijent varijacije je omjer standardne devijacije i aritmetičke sredine pomnožen sa 100

𝜎
𝑉= 100
𝑥̅

7
Srednje apsolutno odstupanje od aritmetičke sredine i medijana:
𝑁
1 𝑁 1
𝑀𝐴𝐷 = ∑ |𝑥𝑖 − 𝑥̅ | 𝑀𝐴𝐷𝑀𝑒 = ∑|𝑥𝑖 − 𝑀𝑒|
𝑁 𝑖=1 𝑁
𝑖=1
Standardizirana varijabla
Standardizirana varijabla z je linearna transformacija numeričke varijable X; provodi se tako da se
odstupanja vrijednosti numeričke varijable podijele sa standardnom devijacijom

(𝑥 − 𝑥̅ )
𝑧=
𝜎

2.3. Mjere asimetrije, zaobljenosti i koncentracije


Mjere asimetrije
Mjerama asimetrije mjeri se način rasporeda podataka prema aritmetičkoj sredini ili nekoj drugoj
vrijednosti; najvažnije mjere su Pearsonova i Bowleyjeva mjera

Koeficijent asimetrije 𝛼 3 - omjer trećeg momenta oko sredine i standardne devijacije podignute na
treću potenciju
𝜇3
𝛼3 = 3
𝜎

Pearsonova mjera asimetrije – standardizirano odstupanje vrijednosti medijana ili moda od


aritmetičke sredine; uglavnom prima vrijednosti iz intervala ±3

3(𝑥̅ − 𝑀𝑒) (𝑥̅ − 𝑀𝑜)


𝑆𝑘 = 𝑆𝑘 =
𝜎 𝜎

Bowlyjeva mjera asimetrije – temelji se na odnosima kvartila i medijana; poprima vrijednosti iz


intervala ±1
𝑄1 + 𝑄3 − 2𝑀𝑒
𝑆𝑘𝑄 =
𝑄3 − 𝑄1

Mjere zaobljenosti
Zaobljenost modalnog vrha distribucije mjeri se koeficijentom zaobljenosti

Koeficijent zaobljenosti 𝜇4 – omjer četvrtog momenta oko sredine i standardne devijacije na četvrtu
potenciju
𝜇4
𝛼4 = 4
𝜎

𝛼4 = 3 − 𝑛𝑜𝑟𝑚𝑎𝑙𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑗𝑎
𝑎4 > 3 − š𝑖𝑙𝑗𝑎𝑠𝑡𝑖𝑗𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑗𝑎
𝛼4 < 3 − 𝑝𝑙𝑜𝑠𝑛𝑎𝑡𝑖𝑗𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑗𝑎

8
Mjere koncentracije
 Mjerama koncentracije mjeri se način rasporeda totala ili druge prikladne agregatne veličine
po jedinicama niza ili modalitetima statističkih varijabli

Razlikujemo:

a) apsolutne mjere koncentracije


 koncentracijski omjer
 Herfindahlov indeks

b) relativne mjere koncentracije


 Ginijev koeficijent

9
3. OSNOVNI POJMOVI VJEROJATNOSTI
3.1. Definicije vjerojatnosti
Pokus – djelatnost, postupak mjerenja, opažanja, iz kojeg izvire neki rezultat (ishod)

Slučajni pokus:
 onaj koji završava s barem dva ili više ishoda
 ishodi se ne mogu predvidjeti sa sigurnošću
 u definiranim uvjetima, pokus se može ponavljati beskonačno mnogo puta

Prostor uzorka (elementarnih događaja) S – skup svih mogućih različitih ishoda slučajnog pokusa
 događaj je elementaran ako se može rastaviti u jednostavnije događaje

Slučajni događaj A – jednočlani ili višečlani podskup skupa S, tj. podskup skupa svih elementarnih
događaja

Isključivi događaji – ne mogu se istodobno ostvariti 𝐴 ∩ 𝐵 = ∅; radi se o nastupu A ili B događaja

Definicija vjerojatnosti „a priori“ – polazi od pretpostavke da slučajni pokus ima konačan broj
jednako mogućih ishoda; ako su ishodi slučajnog pokusa jednako mogući, tada je vjerojatnost
nastupa događaja A jednaka omjeru broja za njega povoljnih ishoda m i ukupnog broja ishoda n.

Definicija vjerojatnosti „a posteriori“ – granična vrijednost relativne frekvencije povoljnog ishoda


događaja A ako se broj ponavljanja pokusa izvedenih u istim uvjetima povećava u beskonačnost

Aksiomatska definicija vjerojatnosti – preslikavanje koje svakom događaju 𝐴 ∈ 𝑆 pridružuje broj


P(A) i koji zadovoljava slijedeće uvjete:

1. 0 ≤ 𝑃(𝐴) ≤ 1 𝑛𝑒𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑛𝑜𝑠𝑡
2. 𝑃(𝑆) = 1 𝑛𝑜𝑟𝑚𝑖𝑟𝑎𝑛𝑜𝑠𝑡
3. 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) 𝑎𝑑𝑖𝑡𝑖𝑣𝑛𝑜𝑠𝑡

3.2. Slučajna varijabla i distribucije vjerojatnosti


Slučajna varijabla X – numerička funkcija koja svakom ishodu slučajnog pokusa pridružuje realan
broj

Diskretna slučajna varijabla – poprima konačan broj vrijednosti ili prebrojivo mnogo njih

Kontinuirana slučajna varijabla – poprima bilo koju vrijednost iz nekog intervala

10
Distribucija vjerojatnosti diskretne slučajne varijable – skup uređenih parova različitih vrijednosti
te varijable i pripadajućih vrijednosti

Kumulativna funkcija (f-ja distribucije F(xi)) – pokazuje kolika je vjerojatnost da diskretna slučajna
varijabla poprimi vrijednost jednaku xi ili manju od te vrijednosti

Distribucija vjerojatnosti kontinuirane slučajne varijable – opisuje razdiobu vjerojatnosti na


intervalu vrijednosti varijable

Funkcija distribucije kontinuirane slučajne varijable (F(x)) – ima svojstva analogna onima za f-ju
distribucije diskretne slučajne varijable

3.3. Modeli distribucije vjerojatnosti


Modeli distribucije vjerojatnosti diskretne slučajne varijable
Modeli distribucije vjerojatnosti diskretne slučajne varijable – funkcije vjerojatnosti poznatih
oblika i svojstava

Binomna distribucija – diskontinuirana distribucija vjerojatnosti koja se može koristiti pri donošenju
poslovnih odluka u situacijama kada slučajni pokus ima obilježja Bernoullijevog procesa; pokus ima
dva ishoda: uspjeh i neuspjeh

Poissonova distribucija – u modeliranju situacija kada je broj povoljnih ishoda koji se mjeri u
vremenskoj jedinici, jediničnoj površini, udaljenosti ili volumenu vrlo malen; ishodi pokusa su
neovisni

Modeli distribucije vjerojatnosti kontinuirane slučajne varijable


Normalna (Gaussova) distribucija – kontinuirana distribucija vjerojatnosti koja je simetrična,
savršeno zaobljena i zvonolika

Studentova distribucija – simetrična, oblik ovisi o veličini uzorka n

ℵ2 distribucija – kontinuirana i pozitivno asimetrična; definira se nad intervalom [0, ∝] samo za


pozitivne vrijednosti

F-distribucija – kontinuirana, pozitivno asimetrična; definirana nad intervalom [0, ∝], a ovisi o dva
parametra:
a) broj stupnjeva slobode za brojnik
b) broj stupnjeva slobode za nazivnik

11
4.METODA UZORAKA
Dvije osnovne zadaće metode uzoraka:
1. da na osnovi uzoraka iz osnovnog skupa procijene karakteristike tog skupa
2. da se na osnovi podataka dobivenih uzorkom donese odluka da li da se prihvati ili odbaci
određena pretpostavka

Faktori koji određuju primjenu uzorka:


1. kod namjernog izbora istraživač izabire iz osnovnog skupa one elemente koje smatra
tipičnima ili reprezentativnima
2. kod prigodnog izbora uzorak je prigodno izabran, a ne slučajno
3. kod slučajnog izbora za svaki element postoji mogućnost da bude izabran za uzorak

Sampling-distribucija aritmetičkih sredina, proporcija i varijanci


Sampling-distribucija – teorijska distribucija vjerojatnosti procjenitelja parametra

Sampling-varijabla – slučajna varijabla jer se uzorci izabiru tako da svaka jedinica tj. svaki uzorak ima
određenu vjerojatnost izbora

4.1. Procjene parametara


Procjenitelj – metoda procjenjivanja, formula

Procjena – primjena procjenitelja na podacima iz uzorka

Procjenitelj parametra jednim brojem – nije moguće donijeti sud o preciznosti procjene, niti
zaključivati o razini povjerenja s kojom se ona može upotrijebiti
Intervalni procjenitelj – oslanja se na oblik i svojstva normalne ili Studentove t sampling-distribucije
sredina

Razina pouzdanosti (1 − 𝛼) – vjerojatnost da će se između granica L1 i L2 naći parametar 𝜃

Procjena aritmetičke sredine i totala osnovnog skupa


Aritmetička sredina osnovnog skupa 𝜇 – parametar koji se procjenjuje brojem i intervalom
𝑛
1
𝑥̅ = ∑ 𝑥𝑖
𝑁
𝑖=1

ako je uzorak >30 = veliki uzorak (Normalna distribucija)

𝑃 (𝑥̅ − 𝑧𝛾 𝜎𝑥̅ < 𝜇 < 𝑥̅ + ⋯ ) = (1 − 𝛼)


2

12
ako je uzorak <30 = mali uzorak (Studentova distribucija)

𝑃 (𝑥̅ − 𝑡𝛾 𝜎𝑥̅ < 𝜇 < 𝑥̅ + ⋯ ) = (1 − 𝛼)


2

Total T – zbroj vrijednosti numeričke varijable konačnog osnovnog skupa

𝑇̂ = 𝑁𝑥̅
𝑃 (𝑇̂ − 𝑧𝛾 𝜎 𝑇̂ < 𝑇 < 𝑇̂ + ⋯ ) = (1 − 𝛼)
2

Određivanje veličine uzorka za procjenu aritmetičke sredine osnovnog skupa


Ovisi o:
1. vrsti osnovnog skupa koji je konačan ili beskonačan
2. razini pouzdanosti procjene
3. željenoj preciznosti procjene
4. stupnju varijabilnosti obilježja

Ako se pogreška i stupanj varijabilnosti izražavaju apsolutno, koristi se slijedeća formula:


𝑧𝛾 𝜎 2
𝑛=[ 2 ]
𝑑

Ako se pogreška i stupanj varijabilnosti izražavaju relativno, koristi se slijedeća formula:


2
𝑧𝛾 𝑉
2
𝑛=[ ]
𝑑𝑟

Procjena proporcije osnovnog skupa


Proporcija konačnog osnovnog skupa – parametar koji predočuje omjer članova skupa s određenim
𝑀
oblikom obilježja M i opsega skupa N, 𝑝 = 𝑁

𝑚
Procjenitelj proporcije osnovnog skupa brojem – proporcija uzorka 𝑝̂ = , gdje je m broj članova
𝑛
uzorka s određenim oblikom obilježja, a n veličina uzorka

𝑃 (𝑝̂ − 𝑧𝛾 𝜎𝑝̂ < 𝑝 < 𝑝̂ + ⋯ ) = (1 − 𝛼)


2

4.2. Testiranje hipoteza o parametru


Testiranje hipoteza o parametru
 svaki postupak testiranja polazi od nulte i alternativne hipoteze

13
Pogreška tipa I. – učini se kad se odbaci istinita nulta hipoteza

Pogreška tipa II. – učini se kada se prihvati nulta hipoteza premda je lažna

Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa


 ako je uzorak >30, riječ je o velikom uzorku (z-test)
 ako je uzorak ≤30, riječ je o malom uzorku (t-test)
 nepoznata je aritmetička sredina osnovnog skupa 𝜇, a njezina je pretpostavljena veličina 𝜇0
𝑥̅ − 𝜇0 𝑥̅ − 𝜇0
𝑧= 𝑡=
𝜎𝑥̅ 𝜎𝑥̅

odluke se mogu donositi i pomoću kritičnih granica:


𝑐1 = 𝜇0 − 𝑧𝛼 𝜎𝑥̅ 𝑐2 = 𝜇0 + 𝑧𝛼 𝜎𝑥̅
2 2

Testiranje hipoteze o proporciji osnovnog skupa pomoću velikog uzorka


 nepoznata je proporcija osnovnog skupa p, a njezina pretpostavljena veličina je 𝑝0

𝑝̂ − 𝑝0
𝑧=
𝜎𝑝̂

4.3. Usporedba parametara osnovnih skupova


Procjena razlike aritmetičke sredine dvaju osnovnih skupova nezavisnim uzorcima

𝜎12 𝜎22
𝐷 = 𝜇1 − 𝜇2 𝜎𝐷̂ = √ +
𝑛1 𝑛2
̂ − 𝑧𝛼 𝜎𝐷̂ < 𝐷 < 𝐷
𝑃 (𝐷 ̂ + ⋯ ) = (1 − 𝛼)
2

Test hipoteza o razlici aritmetičkih sredina dvaju osnovnih skupova nezavisnim uzorcima
̂ − 𝐷0
𝐷
𝑧=
𝜎𝐷̂

Procjena razlike proporcija i test hipoteze o razlici proporcija na temelju velikih nezavisnih
uzoraka
 neka su n1 i n2 dovoljno veliki nezavisni uzorci izabrani iz osnovnih skupova s proporcijama p1
i p2 i neka su 𝑝̂1 𝑖 𝑝̂2 proporcije uzoraka

̂ − 𝐷0
𝐷 𝑚1 + 𝑚2 1 1
𝑧= 𝑝̂ = ̂ = 𝑝̂1 − 𝑝̂2
𝐷 𝜎̂𝐷̂ = √𝑝̂ 𝑞̂ ( ) + ( )
𝜎𝐷̂ 𝑛1 + 𝑛2 𝑛1 𝑛2

𝑃 (𝑝̂ − 𝑧𝛼 𝜎𝑝̂ < 𝑝 < 𝑝̂ + ⋯ ) = (1 − 𝛼)


2

14
5. ODABRANI NEPARAMETARSKI
TESTOVI
𝜒 𝟐 - test (hi-kvadrat test)
 hi-kvadrat testom ispituje se hipoteza o jednakosti proporcija triju ili više osnovnih skupova

Postoje tri testa s kojima ćemo se susresti

 test o obliku distribucije populacije


 test o nezavisnosti dviju varijabli
 test o jednakosti proporcija triju ili više nezavisnih populacija

6.REGRESIJSKA ANALIZA
6.1. Regresijski model. Osnovni pojmovi
Regresijska analiza – sastoji se u primjeni različitih metoda ispitivanja ovisnosti jedne varijable ili
više drugih

Zadaće:
 ocjenjivanje nepoznatih parametara
 izračunavanje mjere disperzije i drugih stat.-analitičkih pokazatelja

Korelacijska analiza – sastoji se u primjeni postupaka kojima se utvrđuju pokazatelji jakosti veze
među pojavama

Status varijabli u modelu , to jest koja je varijabla zavisna, a koje su nezavisne, ovisi o danoj primjeni
modela i izvire iz poznavanja područja primjene

Regresijski model – jednadžba ili skup jednadžbi s konačnim brojem parametara i varijabli
 zavisna varijabla je (y)
 nezavisna varijabla je (x)

Model jednostavne linearne regresije

15
 Modelom jednostavne regresije izražava se statistički odnos među dvjema pojavama
predočenima vrijednostima numeričkih varijabli; model sadrži zavisnu i jednu nezavisnu
varijablu

Model populacije:
𝑦𝑖 = 𝛽0 + 𝛽𝑥𝑖 + 𝑒𝑖
Model uzorka:
̂0 + 𝛽̂ 𝑥𝑖 + 𝑒̂𝑖
𝑦𝑖 = 𝛽
Regresijska jednadžba:
̂0 + 𝛽̂ 𝑥
𝑦̂ = 𝛽

Regresijski koeficijent 𝛽̂ – pokazuje za koliko se u prosjeku linearno mijenja vrijednost zavisne


varijable Y za jediničnu promjenu nezavisne varijable X

̂0 – vrijednost regresijske funkcije 𝑦̂ ako je vrijednost nezavisne varijable X jednaka


Konstantni član 𝛽
nuli

Regresijske vrijednosti – vrijednosti regresijske funkcije s procijenjenim parametrima (npr. ako je


cijena 60 €, regresijska vrijednost potrošnje je 81,7 kg.)

̂0 + 𝛽̂ 𝑥𝑖
𝑦̂𝑖 = 𝛽

Rezidualna odstupanja – procjene vrijednosti slučajne varijable u modelu regresije (npr. stvarna
vrijednost potrošnje je manja od procijenjene za...)
Intervalni procjenitelji parametara:

𝑃 (𝛽̂ − 𝑓𝑟 (𝜗)𝜎𝛽̂ < 𝛽 < 𝛽̂ + ⋯ ) = (1 − 𝛼)


2
~ ako se cijena poveća za 1 €, procjenjuje se da će se...

̂0 − 𝑓𝑟 (𝜗)𝜎𝛼̂ < 𝛽0 < 𝛽


𝑃 (𝛽 ̂0 + ⋯ ) = (1 − 𝛼)
2

~ ako je cijena 0 € procjenjuje se da je potrošnja...


Koeficijent determinacije – omjer protumačenog dijela zbroja kvadrata i ukupnog zbroja kvadrata
𝑆𝑃
𝑟2 =
𝑆𝑇
ST – suma kvadrata odstupanja stvarne vrijednosti zavisne varijable od njene aritmetičke
sredine

SP – suma kvadrata odstupanja procijenjenih vrijednosti zavisne varijable od njene arit.


sredine

SR – suma kvadrata odstupanja empirijske vrijednosti zavisne varijable od regresijske


vrijednosti

16
Model višestruke linearne regresije
Model višestruke regresije – njime se predočuje statistička kovarijacija jedne numeričke varijable
pomoću dvije ili više drugim numeričkih varijabli

Analiza modela višestruke linearne regresije


Koraci u analizi modela:
1. utvrđivanje oblika modela, te svojstva varijabli i parametara
2. procjena parametara, varijance, standardne devijacije, prognostičkih vrijednosti
3. testiranje hipoteza

Opći linearni regresijski model osnovnog skupa za n-vrijednosti:

𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + ⋯ + 𝛽𝑗 𝑥𝑖𝑗 + ⋯ + 𝛽𝐾 𝑥𝑖𝐾 + 𝑒𝑖

Model uzorka:
̂0 + 𝛽̂1 𝑥𝑖1 + 𝛽̂2 𝑥𝑖2 + ⋯ + 𝛽̂𝑗 𝑥𝑖𝑗 + ⋯ + 𝛽̂𝐾 𝑥𝑖𝐾 + 𝑒̂𝑖
𝑦𝑖 = 𝛽

Model s procijenjenim parametrima:


̂0 + 𝛽̂1 𝑥1 + 𝛽̂2 𝑥2 + ⋯ + 𝛽̂𝑗 𝑥𝑗 + 𝛽̂𝐾 𝑥𝐾
𝑦̂ = 𝛽

Procjena konstantnog člana 𝛽 ̂0 – vrijednost regresijske funkcije uzorka ako su vrijednosti K


nezavisnih varijabli jednake nuli

Procjena regresijskih koeficijenata 𝛽̂𝑗 – pokazuje koliko se linearno u prosjeku mijenja vrijednost
zavisne varijable ako se varijabla Xj poveća za jedan, uz uvjet da se ne mijenjaju vrijednosti preostalih
nezavisnih varijabli

Testiranje hipoteza o modelu višestruke linearne regresije


Najčešće se rabe ovi testovi:

1. skupni test
 𝐻0 … 𝛽1 = 𝛽2 = 𝛽𝑗 = 0
 𝐻1 … ∃𝛽𝑗 ≠ 0
𝑆𝑃

 izvodimo ga pomoću empirijskog F-omjera: 𝐹 = 𝐾


𝑆𝑅
𝑛−(𝑘+1)

2. pojedinačni test (jednosmjerni)


 𝐻0 … 𝛽1 ≥ 0
 𝐻0 … 𝛽1 < 0

17
Korelacijska matrica
1 𝑟𝑦1 ⋯ 𝑟𝑦𝐾
𝑟1𝑦 1 ⋯ 𝑟1𝐾
𝑅 = 𝑟2𝑦 𝑟21 ⋯ 𝑟2𝐾
⋮ ⋮ ⋱ ⋮
𝑟
[ 𝐾𝑦 𝑟𝐾1 ⋯ 1 ]

~ elemente korelacijske matrice tvore kovarijance standardiziranih vrijednosti varijable

18
7. OSNOVNA ANALIZA VREMENSKIH NIZOVA
7.1. Osnovna analiza vremenskih nizova
Vremenski niz – skup kronološki uređenih vrijednosti varijable koja predočuje neku pojavu ili
statistički proces u vremenu

Podjela vremenskih nizova:


 intervalni – nastaje zbrajanjem vrijednosti pojave po intervalima vremena (površinski i linijski
grafikoni)
 trenutačni – sastoji se od kronološki uređenih vrijednosti koje su u svezi s odabranim
vremenskim točkama (linijski grafikoni)

~ vremenski niz je deterministički ako se na temelju njegovih članova mogu egzaktno predviđati
razne pojave

~ vremenski niz je stohastički ako se pomoću njegovih članova buduća stanja mogu procijeniti

7.2. Pokazatelji dinamike


Pokazatelji dinamike – brojčane veličine kojima se opisuju promjene razine pojava u vremenu

Dijele se na:
 one koji pokazuju pojedinačne promjene razina pojave u uzastopnim razdobljima
 one koji pokazuju promjene razine pojave tekućeg vremena prema razini odabranog
razdoblja

Podjela prema mjernim jedinicama:


 apsolutne mjere promjene
 relativne mjere promjene (stopa promjene)

Prve diferencije – izražavaju veličinu promjena razina pojava u uzastopnim razdobljima

∆𝑦𝑡 = 𝑦𝑡 − 𝑦𝑡−1

Prosječne prve diferencije – računaju se uporabom samo posljednje i prve vrijednosti niza

𝑦𝑛 − 𝑦1
∆̅𝑦 =
𝑛−1
Stope promjene – omjer prve diferencije i odgovarajuće serije pomnožena sa 100

19
𝑦𝑡 − 𝑦𝑡−1
𝑠𝑡 = ∙ 100
𝑦𝑡−1

Prosječne stope – određuje se pomoću geometrijske sredine koeficijenta dinamike

𝑛−1 𝑦𝑛
𝑠̅ = ( √ − 1) ∙ 100
𝑦1

Individualni indeksi
Indeksi vremenskog niza – relativni brojevi koji izražavaju odnos stanja jedne pojave ili skupine
pojava u različitim razdobljima ili vremenskim točkama

Pojavljuju se u dva oblika:


1. verižni indeksi – relativni brojevi koji pokazuju promjene stanja pojave u uzastopnim
razdobljima
𝑦𝑡
 𝑉𝑡 = 𝑦 ∙ 100
𝑡−1
2. bazni indeksi – njima se mjeri promjena razine vremenske pojave u relativnom iznosu prema
članu niza jednog odabranog razdoblja ili vremenske točke
𝑦
 𝐼𝑡 = 𝑦𝑡 ∙ 100
𝑏

Koeficijent dinamike:
𝑦𝑡
𝑣𝑡 =
𝑦𝑡−1

Skupni indeksi
Skupni indeksi – relativni brojevi kojima se mjere relativne promjene skupine pojava u vremenu
Dijele se na skupne indekse:
 cijena
 količina
 vrijednosti

U analizi dinamike skupine pojava izračunavaju se:


 Laspeyresov indeks cijena i količina
 Paascheov indeks cijena i količina
 indeks vrijednosti

Laspeyresov indeks cijena - skupni indeks koji pokazuje kolike su prosječne relativne promjene
cijena skupine k pojava koje čine neku logičnu cjelinu

∑𝑘𝑖=1 𝑝𝑖𝑡 𝑞𝑖0


𝑃0𝑡 (𝑞0 ) = ∙ 100
∑𝑘𝑖=1 𝑝𝑖0 𝑞𝑖0

20
Laspeyresov indeks količina – skupni indeks koji pokazuje kolike su prosječne relativne promjene
količina skupine k pojava koje čine neku logičnu cjelinu i to polazeći od baznog razdoblja

∑𝑘𝑖=1 𝑞𝑖𝑡 𝑝𝑖0


𝑄0𝑡 (𝑝0 ) = ∙ 100
∑𝑘𝑖=1 𝑞𝑖0 𝑝𝑖0

Paascheov indeks cijena – vagana aritmetička sredina individualnih indeksa cijena u kojoj su za
pondere uzete vrijednosti količina tekućeg razdoblja po cijenama baznog razdoblja

∑𝑘𝑖=1 𝑝𝑖𝑡 𝑞𝑖𝑡


𝑃0𝑡 (𝑞𝑡 ) = ∙ 100
∑𝑘𝑖=1 𝑝𝑖0 𝑞𝑖𝑡

Paascheov indeks količina – vagana aritmetička sredina individualnih indeksa količina u kojoj su za
pondere uzete vrijednosti obračunate po cijenama tekućeg razdoblja

∑𝑘𝑖=1 𝑞𝑖𝑡 𝑝𝑖𝑡


𝑄0𝑡 (𝑝𝑡 ) = ∙ 100
∑𝑘𝑖=1 𝑞𝑖0 𝑝𝑖𝑡

Indeks vrijednosti – omjer tekućeg i vrijednosti baznog razdoblja

∑𝑘𝑖=1 𝑝𝑖𝑡 𝑞𝑖𝑡


𝑉𝑜𝑡 = ∙ 100
∑𝑘𝑖=1 𝑝𝑖0 𝑞𝑖0

21
8. ODABRANI MODELI VREMENSKIH SERIJA
8.1. Odabrani modeli vremenski serija
Komponente:
 komponenta trenda – upućuje na osnovni tok pojave u vremenu
 sezonska komponenta – posljedica je periodičnog utjecaja klimatskih faktora, ritma
proizvodnje, potrošnje
 ciklična komponenta – pokazuje se onda kada se vremenska pojava obnavlja na približno isti
način, s periodom dvije ili više godina

Model trenda – njime se opisuje dugoročna kovarijacija pojave s vremenom

Aditivni model trenda – opći oblik modela temeljen na standradnoj dekompoziciji

𝑌 =𝑇+𝑒

Multiplikativni model trenda – komponente su mu faktori umnoška

𝑌 =𝑇∙𝜀

Y=pojava predočena vremenskom serijom


T=komponenta trenda predočena nepoznatom f-jom vremena
e, 𝜀=nepoznata slučajna odstupanja

Model linearnog (jednostavnog) trenda:


𝑦𝑡 = 𝛽0 + 𝛽𝑥𝑡 + 𝑒𝑡

Jednadžba linearnog trenda:


̂0 + 𝛽̂ 𝑥
𝑦̂ = 𝛽

∑𝑛𝑖=1 𝑥𝑡 𝑦𝑡 − 𝑛𝑥̅ 𝑦̅
𝛽̂ = ̂0 = 𝑦̅ − 𝛽̂ 𝑥̅
𝛽
∑𝑛𝑖=1 𝑥𝑡2 − 𝑛𝑥̅ 2

𝑛
1 𝑛+1 ∑ 𝑦𝑡
∑ 𝑥𝑡2 = 𝑛(𝑛 + 1)(2𝑛 + 1) 𝑥̅ = 𝑦̅ =
6 2 𝑛
𝑖=1

22
Prognostička vrijednost:
̂0 + 𝛽̂ (𝑛 + 𝜏)
𝑌̂𝑛+𝜏 = 𝛽

Jednadžba eksponencijalnog trenda:


̂0 + 𝑋𝑙𝑜𝑔𝛽̂
𝑙𝑜𝑔𝑦̂ = 𝑙𝑜𝑔𝛽

𝑛
∑𝑛𝑡=1 𝑙𝑜𝑔𝑦𝑡 − 𝑥̅ ∑𝑛𝑡=1 𝑙𝑜𝑔𝑦𝑡 1
𝑙𝑜𝑔𝛽̂ = ̂0 = ∑ 𝑙𝑜𝑔𝑦𝑡 − 𝑥̅ 𝑙𝑜𝑔𝛽̂
𝑙𝑜𝑔𝛽
∑𝑛𝑡=1 𝑥𝑡2 − 𝑛𝑥̅ 2 𝑛
𝑡=1

Prognostička vrijednost:
𝑌̂𝑛+𝜏 = 𝛼̂ + 𝛽̂ (𝑛+𝜏)

23

You might also like