Professional Documents
Culture Documents
MALA SKRIPTA
TEORIJA ZA USMENI
Verzija: 1.06.
ID: 10501
Bok!
Drago nam je što si odabrao SKRIPTARNICU za pronalazak materijala koji će ti pomoći u učenju.
Što je SKRIPTARNICA?
Skriptarnica je projekt Štreberaj tima i Žute kopiraone, a nastala je u želji da ti olakšamo studiranje.
Sve skripte možeš pogledati na stranici www.referada.hr, a kupiti u SKRIPTARNICI, odnosno u Žutoj
kopiraoni.
1
1. UVOD
Statistika – znanstvena metoda koja se bavi prikupljanjem, analiziranjem i tumačenjem podataka
različite vrste.
Svrha primjene statističkih metoda – donošenje suda o osobitosti promatranih pojava, ispitivanje
različitih pretpostavki, predviđanje razine i stanja pojava.
Metode inferencijalne statistike – polaze od uzorka iz realne i konačne populacije čije se realizacije
mogu smatrati uzorkom procesa; njima se također donose vjerojatnosni sudovi o cjelini.
Skup podataka ili osnovni skup – podaci o danoj varijabli za svaki element statističkog skupa
2
1.2. Vrste i izvori statističkih podataka
Statistički podaci – rezultati mjerenja svojstava jedinica statističkih skupova, njihovih podskupova ili
eksperimentalnih jedinica
Statistička varijabla ili obilježje – svojstvo koje oblikom ili stupnjem varira od jedinice do jedinice
skupa; po njemu se elementi skupa razlikuju ili jedni drugima nalikuju
Skala
Skup modaliteta varijable
Razlikujemo:
nominalnu
ordinalnu
intervalnu
omjernu
Nominalna skala – dana je u obliku nenumeričkog skupa, odnosno liste naziva; redoslijed
odabran po volji; nisu dopuštene brojčane operacije (npr. po abecedi)
Ordinalna skala – pridružuje slovne oznake, simbole ili brojeve elementima skupa prema
intenzitetu mjerenog svojstva (npr. po rangu (ocjene))
Numerička varijabla
To varijabla mjerena na numeričkoj skali (intervalnoj i omjernoj)
3
Redoslijedni niz – nastaje uređenjem podataka o rang-varijabli
Numerički niz – formira se sređivanjem podataka koji predočuju vrijednosti numeričke varijable
Skupna tabela – prikazuje se više nizova nastalih sređivanjem podataka prema modalitetima iste
varijable
Tabela kontingence – prikazuju se podaci grupirani istodobno prema modalitetima dviju li više
varijabli
Relativni brojevi – pomoću njih se provodi elementarna analiza podataka u sklopu deskriptivne
statistike (postoci, proporcije, relativne frekvencije, indeksi i relativni brojevi koordinacije)
Grupiranjem se skup podataka koji se odnose na jedinice stat. skupa raščlanjuju u podskupove koji
se međusobno ne preklapaju
𝑓𝑖 𝑓𝑖
𝑝𝑖 = 𝑁
𝑃𝑖 = 𝑁
∙ 100
4
2.NUMERIČKI NIZOVI I DISTRIBUCIJA
FREKVENCIJA
Numerički nizovi nastaju uređenjem kvantitativnih podataka. Pojedinačni numerički podaci
predočavaju se dijagramom s točkama i dijagramom stablo list
Ako je riječ o velikom broju podataka, o numeričkoj kontinuiranoj varijabli ili ako diskretna numerička
varijabla poprima velik broj različitih vrijednosti, distribucija frekvencija formira se grupiranjem na
temelju razreda; svaki razred ima svoju gornju i donju granicu.
Frekvencija razreda
broj istih i sličnih vrijednosti numeričke varijable
formiranju distribucije prethodi određivanje broja razreka k i veličina razreda; broj razreda k
za grupiranje N vrijednosti numeričke varijable aproksimira se izrazom 𝑘 ≈ 1 + 3.3𝑙𝑜𝑔𝑁 –
Sturgesovo pravilo
𝑁
1
𝑥̅ = ∑ 𝑥𝑖
𝑁
𝑖=1
Svojstva:
zbroj odstupanja vrijednosti numeričke varijable od njezine aritmetičke sredine jednak je nuli
zbroj kvadrata odstupanja vrijednosti numeričke varijable od njezine sredine minimalan je
aritmetička sredina nalazi se između najmanje i najveće vrijednosti niza za koji je izračunana
5
Aritmetička sredina relativnih brojeva koordinacije i aritmetička sredina postotaka
izračunavaju se kao vagane sredine u kojima su ponderi osnovice tih brojeva
𝑣 𝐷𝑖
𝑅𝑖 = 𝐵𝑖 𝑃𝑖 = 𝐶𝑖
∙ 100
𝑖
Geometrijska sredina
Geometrijska sredina N vrijednosti numeričke varijable X jest N-ti korijen iz produkta njezinih
vrijednosti
𝐺 = 𝑁√𝑥1 ∙ 𝑥2 ∙ … 𝑥𝑖 … 𝑥𝑁
Harmonijska sredina
Harmonijska sredina N vrijednosti numeričke varijable X recipročna je vrijednosti aritmetičke sredine
njezinih recipročnih vrijednosti.
𝑁
𝐻=
1
∑𝑁𝑖=1 𝑥
𝑖
Mod
Mod je položajna srednja vrijednost; najčešća vrijednost ili modalitet koji se pojavljuje u nizu. Postoji
ako su u nizu barem dva jednaka podatka.
Mod distribucije frekvencija s razredima aproksimira se pomoću izraza:
(𝑏 − 𝑎)
𝑀𝑜 = 𝐿1 + ∙𝑖
(𝑏 − 𝑎) + (𝑏 − 𝑐)
Medijan. Kvantili
Medijan je položajna srednja vrijednost koja numerički niz uređen po veličini dijeli na dva jednaka
dijela
ako je broj podataka neparan, medijan je vrijednost središnjeg člana uređenog po veličini
ako je broj podatak paran, medijan je jednak poluzbroju vrijednosti varijable središnjih dvaju
članova uređenog niza
𝑁
− ∑ 𝑓1
𝑀𝑒 = 𝐿1 + 2 ∙𝑖
𝑓𝑚𝑒𝑑
6
fmed-frekvencija medijalnog razreda (medijalni je onaj razred čija kumulativna frekvencija prvi put
uključuje vrijednost N/2
Medijan se ubraja u kvantile. Kvantili su vrijednosti numeričke varijable ili modaliteti rang-varijable
koji uređen numerički ili redoslijedni niz dijele na jednakobrojne dijelove. Dijele li kvantili na četiri
jednakobrojna dijela riječ je o kvartilima, na 10 dijelova decilima, na 100 dijelova percentilima.
Interkvartil je apsolutna mjera disperzije; raspon varijacije središnjih 50 % članova niza uređenih
parova
𝐼𝑄 = 𝑄3 − 𝑄1
𝜎
𝑉= 100
𝑥̅
7
Srednje apsolutno odstupanje od aritmetičke sredine i medijana:
𝑁
1 𝑁 1
𝑀𝐴𝐷 = ∑ |𝑥𝑖 − 𝑥̅ | 𝑀𝐴𝐷𝑀𝑒 = ∑|𝑥𝑖 − 𝑀𝑒|
𝑁 𝑖=1 𝑁
𝑖=1
Standardizirana varijabla
Standardizirana varijabla z je linearna transformacija numeričke varijable X; provodi se tako da se
odstupanja vrijednosti numeričke varijable podijele sa standardnom devijacijom
(𝑥 − 𝑥̅ )
𝑧=
𝜎
Koeficijent asimetrije 𝛼 3 - omjer trećeg momenta oko sredine i standardne devijacije podignute na
treću potenciju
𝜇3
𝛼3 = 3
𝜎
Mjere zaobljenosti
Zaobljenost modalnog vrha distribucije mjeri se koeficijentom zaobljenosti
Koeficijent zaobljenosti 𝜇4 – omjer četvrtog momenta oko sredine i standardne devijacije na četvrtu
potenciju
𝜇4
𝛼4 = 4
𝜎
𝛼4 = 3 − 𝑛𝑜𝑟𝑚𝑎𝑙𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑗𝑎
𝑎4 > 3 − š𝑖𝑙𝑗𝑎𝑠𝑡𝑖𝑗𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑗𝑎
𝛼4 < 3 − 𝑝𝑙𝑜𝑠𝑛𝑎𝑡𝑖𝑗𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑗𝑎
8
Mjere koncentracije
Mjerama koncentracije mjeri se način rasporeda totala ili druge prikladne agregatne veličine
po jedinicama niza ili modalitetima statističkih varijabli
Razlikujemo:
9
3. OSNOVNI POJMOVI VJEROJATNOSTI
3.1. Definicije vjerojatnosti
Pokus – djelatnost, postupak mjerenja, opažanja, iz kojeg izvire neki rezultat (ishod)
Slučajni pokus:
onaj koji završava s barem dva ili više ishoda
ishodi se ne mogu predvidjeti sa sigurnošću
u definiranim uvjetima, pokus se može ponavljati beskonačno mnogo puta
Prostor uzorka (elementarnih događaja) S – skup svih mogućih različitih ishoda slučajnog pokusa
događaj je elementaran ako se može rastaviti u jednostavnije događaje
Slučajni događaj A – jednočlani ili višečlani podskup skupa S, tj. podskup skupa svih elementarnih
događaja
Definicija vjerojatnosti „a priori“ – polazi od pretpostavke da slučajni pokus ima konačan broj
jednako mogućih ishoda; ako su ishodi slučajnog pokusa jednako mogući, tada je vjerojatnost
nastupa događaja A jednaka omjeru broja za njega povoljnih ishoda m i ukupnog broja ishoda n.
1. 0 ≤ 𝑃(𝐴) ≤ 1 𝑛𝑒𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑛𝑜𝑠𝑡
2. 𝑃(𝑆) = 1 𝑛𝑜𝑟𝑚𝑖𝑟𝑎𝑛𝑜𝑠𝑡
3. 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) 𝑎𝑑𝑖𝑡𝑖𝑣𝑛𝑜𝑠𝑡
Diskretna slučajna varijabla – poprima konačan broj vrijednosti ili prebrojivo mnogo njih
10
Distribucija vjerojatnosti diskretne slučajne varijable – skup uređenih parova različitih vrijednosti
te varijable i pripadajućih vrijednosti
Kumulativna funkcija (f-ja distribucije F(xi)) – pokazuje kolika je vjerojatnost da diskretna slučajna
varijabla poprimi vrijednost jednaku xi ili manju od te vrijednosti
Funkcija distribucije kontinuirane slučajne varijable (F(x)) – ima svojstva analogna onima za f-ju
distribucije diskretne slučajne varijable
Binomna distribucija – diskontinuirana distribucija vjerojatnosti koja se može koristiti pri donošenju
poslovnih odluka u situacijama kada slučajni pokus ima obilježja Bernoullijevog procesa; pokus ima
dva ishoda: uspjeh i neuspjeh
Poissonova distribucija – u modeliranju situacija kada je broj povoljnih ishoda koji se mjeri u
vremenskoj jedinici, jediničnoj površini, udaljenosti ili volumenu vrlo malen; ishodi pokusa su
neovisni
F-distribucija – kontinuirana, pozitivno asimetrična; definirana nad intervalom [0, ∝], a ovisi o dva
parametra:
a) broj stupnjeva slobode za brojnik
b) broj stupnjeva slobode za nazivnik
11
4.METODA UZORAKA
Dvije osnovne zadaće metode uzoraka:
1. da na osnovi uzoraka iz osnovnog skupa procijene karakteristike tog skupa
2. da se na osnovi podataka dobivenih uzorkom donese odluka da li da se prihvati ili odbaci
određena pretpostavka
Sampling-varijabla – slučajna varijabla jer se uzorci izabiru tako da svaka jedinica tj. svaki uzorak ima
određenu vjerojatnost izbora
Procjenitelj parametra jednim brojem – nije moguće donijeti sud o preciznosti procjene, niti
zaključivati o razini povjerenja s kojom se ona može upotrijebiti
Intervalni procjenitelj – oslanja se na oblik i svojstva normalne ili Studentove t sampling-distribucije
sredina
12
ako je uzorak <30 = mali uzorak (Studentova distribucija)
𝑇̂ = 𝑁𝑥̅
𝑃 (𝑇̂ − 𝑧𝛾 𝜎 𝑇̂ < 𝑇 < 𝑇̂ + ⋯ ) = (1 − 𝛼)
2
𝑚
Procjenitelj proporcije osnovnog skupa brojem – proporcija uzorka 𝑝̂ = , gdje je m broj članova
𝑛
uzorka s određenim oblikom obilježja, a n veličina uzorka
13
Pogreška tipa I. – učini se kad se odbaci istinita nulta hipoteza
Pogreška tipa II. – učini se kada se prihvati nulta hipoteza premda je lažna
𝑝̂ − 𝑝0
𝑧=
𝜎𝑝̂
𝜎12 𝜎22
𝐷 = 𝜇1 − 𝜇2 𝜎𝐷̂ = √ +
𝑛1 𝑛2
̂ − 𝑧𝛼 𝜎𝐷̂ < 𝐷 < 𝐷
𝑃 (𝐷 ̂ + ⋯ ) = (1 − 𝛼)
2
Test hipoteza o razlici aritmetičkih sredina dvaju osnovnih skupova nezavisnim uzorcima
̂ − 𝐷0
𝐷
𝑧=
𝜎𝐷̂
Procjena razlike proporcija i test hipoteze o razlici proporcija na temelju velikih nezavisnih
uzoraka
neka su n1 i n2 dovoljno veliki nezavisni uzorci izabrani iz osnovnih skupova s proporcijama p1
i p2 i neka su 𝑝̂1 𝑖 𝑝̂2 proporcije uzoraka
̂ − 𝐷0
𝐷 𝑚1 + 𝑚2 1 1
𝑧= 𝑝̂ = ̂ = 𝑝̂1 − 𝑝̂2
𝐷 𝜎̂𝐷̂ = √𝑝̂ 𝑞̂ ( ) + ( )
𝜎𝐷̂ 𝑛1 + 𝑛2 𝑛1 𝑛2
14
5. ODABRANI NEPARAMETARSKI
TESTOVI
𝜒 𝟐 - test (hi-kvadrat test)
hi-kvadrat testom ispituje se hipoteza o jednakosti proporcija triju ili više osnovnih skupova
6.REGRESIJSKA ANALIZA
6.1. Regresijski model. Osnovni pojmovi
Regresijska analiza – sastoji se u primjeni različitih metoda ispitivanja ovisnosti jedne varijable ili
više drugih
Zadaće:
ocjenjivanje nepoznatih parametara
izračunavanje mjere disperzije i drugih stat.-analitičkih pokazatelja
Korelacijska analiza – sastoji se u primjeni postupaka kojima se utvrđuju pokazatelji jakosti veze
među pojavama
Status varijabli u modelu , to jest koja je varijabla zavisna, a koje su nezavisne, ovisi o danoj primjeni
modela i izvire iz poznavanja područja primjene
Regresijski model – jednadžba ili skup jednadžbi s konačnim brojem parametara i varijabli
zavisna varijabla je (y)
nezavisna varijabla je (x)
15
Modelom jednostavne regresije izražava se statistički odnos među dvjema pojavama
predočenima vrijednostima numeričkih varijabli; model sadrži zavisnu i jednu nezavisnu
varijablu
Model populacije:
𝑦𝑖 = 𝛽0 + 𝛽𝑥𝑖 + 𝑒𝑖
Model uzorka:
̂0 + 𝛽̂ 𝑥𝑖 + 𝑒̂𝑖
𝑦𝑖 = 𝛽
Regresijska jednadžba:
̂0 + 𝛽̂ 𝑥
𝑦̂ = 𝛽
̂0 + 𝛽̂ 𝑥𝑖
𝑦̂𝑖 = 𝛽
Rezidualna odstupanja – procjene vrijednosti slučajne varijable u modelu regresije (npr. stvarna
vrijednost potrošnje je manja od procijenjene za...)
Intervalni procjenitelji parametara:
16
Model višestruke linearne regresije
Model višestruke regresije – njime se predočuje statistička kovarijacija jedne numeričke varijable
pomoću dvije ili više drugim numeričkih varijabli
Model uzorka:
̂0 + 𝛽̂1 𝑥𝑖1 + 𝛽̂2 𝑥𝑖2 + ⋯ + 𝛽̂𝑗 𝑥𝑖𝑗 + ⋯ + 𝛽̂𝐾 𝑥𝑖𝐾 + 𝑒̂𝑖
𝑦𝑖 = 𝛽
Procjena regresijskih koeficijenata 𝛽̂𝑗 – pokazuje koliko se linearno u prosjeku mijenja vrijednost
zavisne varijable ako se varijabla Xj poveća za jedan, uz uvjet da se ne mijenjaju vrijednosti preostalih
nezavisnih varijabli
1. skupni test
𝐻0 … 𝛽1 = 𝛽2 = 𝛽𝑗 = 0
𝐻1 … ∃𝛽𝑗 ≠ 0
𝑆𝑃
17
Korelacijska matrica
1 𝑟𝑦1 ⋯ 𝑟𝑦𝐾
𝑟1𝑦 1 ⋯ 𝑟1𝐾
𝑅 = 𝑟2𝑦 𝑟21 ⋯ 𝑟2𝐾
⋮ ⋮ ⋱ ⋮
𝑟
[ 𝐾𝑦 𝑟𝐾1 ⋯ 1 ]
18
7. OSNOVNA ANALIZA VREMENSKIH NIZOVA
7.1. Osnovna analiza vremenskih nizova
Vremenski niz – skup kronološki uređenih vrijednosti varijable koja predočuje neku pojavu ili
statistički proces u vremenu
~ vremenski niz je deterministički ako se na temelju njegovih članova mogu egzaktno predviđati
razne pojave
~ vremenski niz je stohastički ako se pomoću njegovih članova buduća stanja mogu procijeniti
Dijele se na:
one koji pokazuju pojedinačne promjene razina pojave u uzastopnim razdobljima
one koji pokazuju promjene razine pojave tekućeg vremena prema razini odabranog
razdoblja
∆𝑦𝑡 = 𝑦𝑡 − 𝑦𝑡−1
Prosječne prve diferencije – računaju se uporabom samo posljednje i prve vrijednosti niza
𝑦𝑛 − 𝑦1
∆̅𝑦 =
𝑛−1
Stope promjene – omjer prve diferencije i odgovarajuće serije pomnožena sa 100
19
𝑦𝑡 − 𝑦𝑡−1
𝑠𝑡 = ∙ 100
𝑦𝑡−1
𝑛−1 𝑦𝑛
𝑠̅ = ( √ − 1) ∙ 100
𝑦1
Individualni indeksi
Indeksi vremenskog niza – relativni brojevi koji izražavaju odnos stanja jedne pojave ili skupine
pojava u različitim razdobljima ili vremenskim točkama
Koeficijent dinamike:
𝑦𝑡
𝑣𝑡 =
𝑦𝑡−1
Skupni indeksi
Skupni indeksi – relativni brojevi kojima se mjere relativne promjene skupine pojava u vremenu
Dijele se na skupne indekse:
cijena
količina
vrijednosti
Laspeyresov indeks cijena - skupni indeks koji pokazuje kolike su prosječne relativne promjene
cijena skupine k pojava koje čine neku logičnu cjelinu
20
Laspeyresov indeks količina – skupni indeks koji pokazuje kolike su prosječne relativne promjene
količina skupine k pojava koje čine neku logičnu cjelinu i to polazeći od baznog razdoblja
Paascheov indeks cijena – vagana aritmetička sredina individualnih indeksa cijena u kojoj su za
pondere uzete vrijednosti količina tekućeg razdoblja po cijenama baznog razdoblja
Paascheov indeks količina – vagana aritmetička sredina individualnih indeksa količina u kojoj su za
pondere uzete vrijednosti obračunate po cijenama tekućeg razdoblja
21
8. ODABRANI MODELI VREMENSKIH SERIJA
8.1. Odabrani modeli vremenski serija
Komponente:
komponenta trenda – upućuje na osnovni tok pojave u vremenu
sezonska komponenta – posljedica je periodičnog utjecaja klimatskih faktora, ritma
proizvodnje, potrošnje
ciklična komponenta – pokazuje se onda kada se vremenska pojava obnavlja na približno isti
način, s periodom dvije ili više godina
𝑌 =𝑇+𝑒
𝑌 =𝑇∙𝜀
∑𝑛𝑖=1 𝑥𝑡 𝑦𝑡 − 𝑛𝑥̅ 𝑦̅
𝛽̂ = ̂0 = 𝑦̅ − 𝛽̂ 𝑥̅
𝛽
∑𝑛𝑖=1 𝑥𝑡2 − 𝑛𝑥̅ 2
𝑛
1 𝑛+1 ∑ 𝑦𝑡
∑ 𝑥𝑡2 = 𝑛(𝑛 + 1)(2𝑛 + 1) 𝑥̅ = 𝑦̅ =
6 2 𝑛
𝑖=1
22
Prognostička vrijednost:
̂0 + 𝛽̂ (𝑛 + 𝜏)
𝑌̂𝑛+𝜏 = 𝛽
𝑛
∑𝑛𝑡=1 𝑙𝑜𝑔𝑦𝑡 − 𝑥̅ ∑𝑛𝑡=1 𝑙𝑜𝑔𝑦𝑡 1
𝑙𝑜𝑔𝛽̂ = ̂0 = ∑ 𝑙𝑜𝑔𝑦𝑡 − 𝑥̅ 𝑙𝑜𝑔𝛽̂
𝑙𝑜𝑔𝛽
∑𝑛𝑡=1 𝑥𝑡2 − 𝑛𝑥̅ 2 𝑛
𝑡=1
Prognostička vrijednost:
𝑌̂𝑛+𝜏 = 𝛼̂ + 𝛽̂ (𝑛+𝜏)
23