Statistika je znanstvena disciplina koja se bavi prikupljanjem , obradom, analizom podataka i iznošenjem rezultata.
Populacija (skup svih promatranih entiteta, tj. elemenata)
Uzorak (statistički skup, podskup populacije) Statističko obilježje: kvantitativno ili numeričko (kontinuirano kao masa ili visina učenika i diskretna kao broj zaposlenika itd.) kvalitativno ili kategorijsko (atributna kao što su spol, zanimanje ili geografska kao mjesto rođenja itd.) Tablica frekvencija Frekvencija ili učestalost je broj koji pokazuje koliko se puta neki podatak pojavljuje u skupu podataka i označavamo ga sa 𝑓 . Relativna frekvencija je omjer frekvencije pojedine vrijednosti obilježja prema ukupnom zbroju i označavamo je sa 𝑝 = , 𝑖 = 1,2,3, … , 𝑛, 𝑁 = 𝑓 + 𝑓 + ⋯ + 𝑓 = ∑ 𝑓 (opseg skupa ili zbroj frekvencija) Grafički prikaz Stupčasti dijagram (histogram) Linijski dijagram Kružni dijagram Piktogram (legenda ili ključ) Stablo-list dijagram (legenda ili ključ)
MJERE SREDINE
Mod – najčešći podatak
Medijan – srednji podatak ili aritmetička sredina dvaju srednjih podataka Aritmetička sredina – srednja vrijednost uzorka/populacije 𝑥 + 𝑥 +⋯+ 𝑥 𝑥̅ = (𝑛𝑖𝑧 𝑜𝑑 𝑛 č𝑙𝑎𝑛𝑜𝑣𝑎 𝑛𝑒𝑔𝑟𝑢𝑝𝑖𝑟𝑎𝑛𝑖ℎ 𝑣𝑟𝑖𝑗𝑒𝑑𝑛𝑜𝑠𝑡𝑖) 𝑛 MJERE RASIPANJA
Ekstremne vrijednosti (minimum 𝑥 i maksimum 𝑥 )
Raspon (rang) , 𝑹 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏 Izdvojenica (ne utječe na mod ili medijan, ali bitno utječe na sredinu, podatak koji odudara) Kvantili – položajne vrijednosti koje numerički niz uređen prema veličini dijele na jednakobrojne dijelove. Broj dijelova 𝑞. Razlikujemo: 𝑥 , 𝑛 = 2𝑘 + 1 medijan : 𝑀 = , , 𝑛 = 2𝑘 donji i gornji kvartil, decili (položajne vrijednosti koje uređeni numerički niz dijele na 10 jednakobrojnih dijelova Di ) percentili (položajne vrijednosti koje uređeni numerički niz dijele na 100 jednakobrojnih dijelova Pi ) Kvartili (prvi ili donji , 𝑄 ; drugi – medijan uzorka, 𝑄 ; treći ili gornji, 𝑄 ;) – dijele podatke na četiri jednakobrojna niza Brkata kutija (dijagram pravokutnika, kutijasti dijagram) – zorni prikaz odnosa 5 ključnih podataka: min, max i tri kvartila Interkvartilski razmak, 𝑄 − 𝑄 (raspon 50% srednjih podataka) ⋯ Varijanca (disperzija, varijanca populacije ) 𝜎 = − 𝑥̅ Standardna devijacija – drugi korijen varijance