Professional Documents
Culture Documents
Osnovni pojmovi
Prikazivanje podataka
Etape naučnog pristupa u istraživanju na
bazi podataka
Definisanje ciljeva
Definisanje problematike i
oblasti istraživanja
•Prikupljanje podataka
Statistika •Obrada, analiza i prezentacija podataka
•Provjera podataka
•Tumačenje i interpretacija podataka
Zaključci
Donošenje odluka
6
Prikupljanje podataka
Primarni izvor podataka–podaci se prikupljaju na temelju
plana promatranja ili eksperimenta
Sekundarni izvor podataka–rezultati djelatnosti drugih
institucija (javni podaci, informacijski sustavi na
komercijalnoj osnovi, Internet, ...)
Sekundarni izvori su povoljni zbog niskih troškova i
vremenske dostupnosti. Prije primjene treba pomno
proučiti metodološke osnove odnosno pojmovne i druge
definicije kako bi se osigurala njihova ispravna upotreba.
www.bhas.ba
www.fzs.ba
www.rzs.rs.ba
7
Obrada podataka
Obrada prikupljenih podataka podrazumijeva
realizaciju tri osnovne etape koje prethode
donošenju zaključaka i odluka:
Eksploatacija podataka
Deskriptivna analiza
Provjera hipoteza
• Objašnjenja
• Predviđanja
Zaključci i odluke
8
Statistika i predmet izučavanja statistike
Masovna pojava je svaka pojava koja sadrži veliki broj jedinica.
Svi studenti Univerziteta u Sarajevu,
Dnevni broj putnika u vozilima Centrotransa,
Obim proizvodnje,
Zaposlenost u javnom sektoru,
Broj stanovnika i karakteristike, itd.
9
Statistički skup ili populacija
Elemente koji posjeduju niz obilježja na osnovu kojih se
istražuju varijacije masovne pojave nazivamo statističkim
jedinicama
13
Primjer
Statistički skup: Turističke zajednice u Sarajevu tokom
2016 godine
Nominalna varijabla (pr. vrsta djelatnosti, vrsta robe, ...) pojavljuje se u velikom broju
oblika. Nomenklatura je uređen popis modaliteta nominalne varijable kojima se
pripisuje nomenklaturni broj
17
ORDINALNA MJERNA SKALA
Obilježje kojemu vrijednost dodjeljujemo prema
ordinalnojmjernoj skali –redoslijedno obilježje ili rang varijabla
Vrijednost je broj ili naziv koji izražava redoslijed ili intenzitet,
pr. ocjena uspjeha na fakultetu, ekonomska razvijenost, školska
sprema, …
Ne mogu se provoditi nikakve računske operacije, ali se te
vrijednosti mogu međusobno uspoređivati
21
Primjer:
Odredite tip varijable pomoću koje mjerimo (opisujemo):
Navršene godine jedne osobe
Kvantitativna prekidna varijabla
Cijenu hljeba
Kvantitativna kontinuirana varijabla ili kvalitativna ordinalna
varijabla
Temperaturu u amfiteatru
Kvantitativna varijabla sa intervalnom skalom
Ljubaznost neke osobe
Kvalitativna ordinalna varijabla (ljubazan, neutralno, drzak)
Boju kose
Kvalitativna nominalna (atributivna) varijabla
Primjer:
Koje su vrste varijabli pomoću kojih možemo mjeriti:
Jačinu zvuka
Kvantitativna varijabla dobijena mjerenjem ili
kvalitativna ordinalna varijabla (ako kažemo ton je slab ili
jak)
Stručnu spremu
Kvalitativna ordinalna varijabla (niža, viša, visoka, ostalo)
Nivo razvijenosti zemlje
Kvalitativna ordinalna varijabla (nerazvijene, zemlje u
razvoju, razvijene)
Težinu studenta
Kvantitativna kontinuirana varijabla dobijena mjerenjem
Primjer:
Odredite tip varijable pomoću koje mjerimo (opisujemo):
Visinu studentice
Kvantitativna kontinuirana varijabla dobijena mjerenjem
Razumijevanje gradiva
Kvalitativna ordinalna varijabla (slabo, srednje, dobro,
izvrsno) ili kvantitativna prekidna varijabla (ako se
ocjenjuje ocjenom 5-10)
Nacionalnost
Kvalitativna nominalna (atributivna) varijabla (modaliteti
opisno dati, svi imaju isti relativni značaj)
Broj članova domaćinstva
Kvantitativna prekidna varijabla
Bračno stanje
Kvalitativna nominalna (atributivna) varijabla (modaliteti
opisno dati, svi imaju isti relativni značaj)
Pitanja za studente
1. Definišite statističku varijablu.
2. Nabrojite tipove statističkih varijabli.
3. Koja je osnovna razlika između kvantitativnih i
kvalitativnih varjabli?
4. Navedite primjere kvalitativnih varijabli.
5. Navedite primjere kvantitativnih varijabli.
25
Pitanja za ponavljanje
1. Za svaku od sljedećih varijabli, odredite da li je
kvantitativna ili kvalitativna, i kojem tipu tih varijabli
pripada.
26
Pitanja za ponavljanje
2. Za svaku od slijedećih varijabli, odredite da li je
kvantitativna ili kvalitativna, i kojem tipu tih varijabli
pripada.
27
Primjer: Odabrati da li su u pitanju obilježje
ili jedinice statističkog skupa
Radnici
Jedinice statističkog skupa
Starost učenika
Obilježje
Domaćinstva
Jedinice statističkog skupa
Primanja
Obilježje
Visina uloga na štednju
Obilježje
Stanovnici
Jedinice statističkog skupa
Primjer 2:
Ulozi na štednju
Jedinice statističkog skupa
Studenti
Jedinice statističkog skupa
Ocjena iz Statistike
Obilježje
Učenici
Jedinice statističkog skupa
Potrošnja brašna
Obilježje
Banke
Jedinice statističkog skupa
Spol
Obilježje
Visina dugoročnih kredita
Obilježje
Primjer 2:
31
Prezentacije podataka
Neuređena statistička serija
32
Primjer 1
Institut za javno zdravlje sproveo je anketu među
ženama starosti 30 – 40 godina koliko puta godišnje
odlaze na kontrolne ginekološke preglede. Dobijeni su
sljedeći podaci:
0034224310132443201224302
1423102212321012131024331
Neuređena statistička serija
Formalno:xi; i = 1,...,n
Primjer 1, cont
Na osnovu ovako prikazanih podataka nismo u
mogućnosti da formiramo sliku o navikama žena
određenog uzrasta da posećuju ginekologa. Kako bi
zaključili kakve su navike žena potrebno je prvo srediti
podatke po veličini:
0000000011111111111222222
2222222233333333334444444
Uređena (rangirana) statistička serija
Formalno:x(i); (i) = 1,...,n
Primjer 1, cont
Nakon sređivanja podataka po veličini potrebno je sažeti
podatke u vidu proste distribucije frekvencije.
Distribucija frekvencije predstavlja takvu statističku seriju gde se
vrednosti obilježja upisuju u jednu kolonu, a učestalost tj. frekvenciju
u drugu kolonu. Dakle, distribucija frekvenicije pokazuje kako je
raspoređen broj jedinica posmatranja po pojedinim vrijednostima
obilježja.
Formalno:(xi ,f i) i = 1,...,K
Za gore pomenute podatke formirana je prosta distribucija
frekvencije. Broj posjeta godišnje Frekvencija
Na osnovu ovako sređenih
0 8 podataka može se zaključiti da
najveći broj žena posećuje
1 11 ginekologa dva puta godišnje.
2 14
3 10
4 7
Ukupno 50
Prikazivanje podataka
Nakon sređivanja podataka potrebno je iste prikazati
što jasnije i preciznije. Prikazivanje podatka može biti
tabelarno i grafički. Tabela je prikaz podataka
sastavljen od redova i kolona.
Svaka tabela mora da ima naslov tebele, zaglavlje i
pretkolonu.
Prikazivanje podataka
Tabele mogu biti proste, složene i kombinovane.
Proste tabele prikazuju samo jednu statističku seriju.
U tabeli 1 je prikazan broj stanovnika u periodu od 2003-07.
godine.
Prikazivanje podataka
Složene tabele prikazuju više statističkih serija.
U tabeli 2 prikazani su podaci o broju stanovnika, broju
živorođenih i broju mrtvorođenih u XYZ regionu u
periodu od 2003 do 2007. godine, što predstavlja
prikazivanje tri statističke serije u određenom
vremenskom periodu.
Prikazivanje
Kombinovane tabele prikazuju serije podataka
dobijenih ukrštanjem dva ili više obilježja.
7 6 10 6 9 8
10 7 10 8 9 7
7 7 10
10 9 7
6 7 10
7 9 7
10 7 10
6 7 10 9 10 7
10 7 9 6 10 7
8 7 9 9 10 7
10 7 9 8 10 7
9 8 9
8 10 7
7 8 9
7 10 6
7 8 9
10 8 8 8 10 6
10 8 8 9 10 6
10 8 8 7 10 6
40 8 8 8
Primjer 2
Ocjena xj Frekvencije fj
6 4
7 8
8 7
9 6
10 9
Ukupno 34
41
Primjer 2
6
4
4
0
6 7 8 9 10
Ocjene
42
Primjer 2
43
Tabelarna prezentacija podataka –
distribucija frekvencija
Način sređivanja podataka zavisi od tipa obilježja.
Atributivna i numerička diskontinuirana obilježja predstavljaju se
prostom distribucijom frekvencije, a numerička kontinuirana
obilježja se predstavljaju distribucijom frekvencije sa klasnim
(grupnim) intrevalima.
Distribucija frekvencije sa klasnim (grupnim) intervalima
određena je brojem intervala, veličinom intervala i
granicama intervala. Osim toga, potrebno je voditi računa o
tome da intrevali budu međusobno jednaki, jer se time
omogućava međusobno upoređivanje grupa.
Broj intervala označava se sa K i određuje se Sturgesovom
formulom: K=1+3,3 log N , gdje je N broj podataka.
Veličina intervala se određuje po formuli:
Statistička distribucija frekvencija
Modaliteti xj Frekvencije f j
x1 f1
x2 f2
. .
. .
xj fj
. .
. .
xn fn
45
Intervalno grupisana distribucija
Vrijednosti Frekvencija Amplituda Centri Relativna
varijable xi fi (širina intervala frekvencija
grupisane u intervala) ai ci pi
intervale
[x0; x1) f1 a1 c1 p1
[x1; x2) f2 a2 c2 p2
.............. ................ ................ ................ ................
[xi-1; xi) fi ai ci pi
............... ................ ............... ................. .................
[xn-1; xn) fn an cn pn
Ukupno N 1 ili 100%
46
Primjer 2.
Tabela 10. Starosna struktura stanovništva Federacije BiH u
2010. godini, Nominalne granice intervala
47
Frekvencije i kumulativne frekvencije
Definicije
Absolutna frekvencija je broj (učestalost) pojavljivanja
jednog modaliteta i njen simbol je fi
Relativna frekvencija je jednaka absolutnoj frekvenciji
modaliteta podijeljenoj sa ukupnom frekvencijom:
fi
pi
N
Absolutna kumulativna frekvencija Sj (može biti rastuća: ≤
i opadajuća: > )
Relativna kumulativna frekvencija Fj (može biti rastuća: ≤ i
opadajuća: > )
Kumulativne frekvencije
Kumulativna rastuća absolutna frekvencija jednog
modaliteta je jednaka zbiru frekvencija modaliteta za
koje varijabla ima vrijednost manju ili jednaku od tog
modaliteta.
Kumulativna opadajuća absolutna frekvencija jednog
modaliteta je jednaka zbiru frekvencija modaliteta za koje
varijabla ima vrijednost striktno veću od tog modaliteta.
0 , x j xmin
S ( x j ) 0 S ( x j ) N , xmin x j x max
N , x j xmax
S ( xi ) S ( x j ), xi x j
Kumulativne relativne frekvencije
Osobine rastuće kumulativne distribucije sa relativnim
frekvencijama su:
0 , x j xmin
F ( x j ) 0 F ( x j ) 1, xmin x j x max
1 , x j xmax
F ( xi ) F ( x j ), xi x j
Kumulativne frekvencije: značenje
Objašnjenje vrijednosti kumulativne distribucije frekvencija
proizilazi iz načina njenog formiranja.
S(xj) predstavlja broj observacija posmatranog skupa čija je
vrijednost varijable jednaka ili manja od xj.
F(xj) pokazuje koja je proporcija elemenata posmatranog skupa
čija je vrijednost varijable jednaka ili manja od xj.
Ocjena xj Frekvencije fj
6 4
7 8
8 7
9 6
10 9
Ukupno 34
54
Tabela frekvencija
Ocjena Frekvencj
xj ije fj Sj+ Sj- pj Fj+ Fj -
10 9 34 0 0,265 1 0,000
Ukupno 34 1,000
55
Grafička prezentacija
Osnovna funkcija jednog grafika je da olakša
prezentaciju,vizualizaciju, čitanje i interpretaciju
podataka.
Kompletirajte uvijek: naslov grafika, nazive
predstavljenih podataka, označite precizno
razmjeru i jedinice mjere i eventualno primjer
čitanja grafika.
56
Vrste grafičke prezentacije:
35
Apsolutne frekvencije
30
25
20
15
10
5
0
6 7 8 9 10
Sj+ Sj-
Ocjene
59
Kumulativne rastuće i opadajuće
Relativne frekvencije
relativne frekvencije
1
0,8
0,6
0,4
0,2
0
6 7 8 9 10
Fj+ Fj - Ocjene
60
Grafički prikaz prekidne statističke varijable
Diagram sa stupcima
f ili p
61
Kumulativna kriva prekidne varijable
F(x)
62
Grafički prikaz neprekidne statističke varijable
Histogram
f/a ili p/a
63
Histogram
- U slučaju serije intervalno grupisanih podataka sa
jednakom amplitudom visina pravougaonika koji čine
histogram je proporcionalna frekvenciji svakog intervala.
64
Kumulativna kriva
Fu %
65
Pitanja
66
Primjer
Na populaciji studenata FF Sarajevo - odsjek Sociologija 2013/14 analizirati sljedeća obilježja:
POL, VISINA, OCJENE IZ SOCIOLOGIJE I DEMOGRAFIJE, STAV PREMA USLOVIMA STUDIRANJA
NA FF
Nakon provedenog istraživanja dobijene su sljedeće vrijednosti:
Ukupno 20 Pol
0%
Pol 8 12 M
Ž
0 5 10 15 20 25
Primjer, nastavak
Visina Centar
histogram intervala frekvencija relativna frekvencija kumulanta rel fr
140-150 145 0 0 0
150-160 155 2 0,1 0,1
160-170 165 10 0,5 0,6
170-180 175 6 0,3 0,9
180 - 190 185 1 0,05 0,95
190-200 195 1 0,05 1
200-210 205 0 0 1
12
1.2
10
1
8
0.8 Kumulanta
histogram - rel
6 Visina histogram
0.6 frekv
poligon
Kumulanta
4 poligon relativne
0.4
frekvenc
2
0.2
0
0
145 155 165 175 185 195 205
145 155 165 175 185 195 205
Primjer, nastavak
Ocjene Ocjene iz Soc Ocjene iz demogr relativna frekvencija relativna frekvencija2
6 2 3 0,1 0,15
7 3 5 0,15 0,25
8 8 8 0,4 0,4
9 5 2 0,25 0,1
10 2 2 0,1 0,1
Ocjene
9
8
7
6
5
Ocjene iz Soc
4
Ocjene iz demogr
3
2
1
0
6 7 8 9 10
Primjer, nastavak
Stav Frekvencija
dobro 10
nako 7
loše 3
Stav Stav
12
10 10
8 8
6 6
Stav Stav
4 4
2 2
0 0
dobro nako loše dobro nako loše