Professional Documents
Culture Documents
Predavanje PDF
Predavanje PDF
Mere centralne tendencije, kao to sam naziv kae, imaju za cilj da odrede centar
osnovnog skupa. Jednostavnije reeno, ove mere treba da daju informaciju o onome to je
tipino, zajedniko za sve elemente (jedinice) jednog skupa. Vrednosti distribucija
frekvencija (serija) saimamo toliko, da ih svodimo na jednu jedinu vrednost. Postoje vie
mera centralne tendencije i svaka ima svoje prednosti i nedostatke. Dele se na Potpune
(matematike) koje mogu da budu: a)Aritmetika sredina; b)Harmonijska sredina; c)
Geometrijska sredina i Poloajne : a)Medijana; b)Mod
Aritmetika sredina - prosek
Najee koriena mera centralne tendencije je aritmetika sredina ili prosek.
Njena definicija je jednostavna: suma vrednosti podataka podeljena brojem podataka.
Matematika definicija aritmetike sredine je:
x=
x1 + x2 + x3 +K+ xn
=
x
n n
gde je:
x - aritmetika sredina (x - bar),
x1 , x2 , x3 ,K xn
- vrednosti obeleja,
n - broj podataka ili veliina uzorka1 i
-grko veliko slovo sigma, koje oznaava zbir ili sumu (oznaava sabiranje,
pojedinanih vrednosti obeleja x).
Primer 1: Telesna masa petoro sluajno izabrane novorodjenadi iznosila je: 3,2;
4,8; 3,7; 5,0 i 4,3 kg. Kolika je prosena teina ove grupe novoroenadi?
Reenje: Koristei navedenu optu formulu i opte simbole neophodno je prvo
sabrati vrednosti: x1=3,2; x2=4,8; x3=3,7; x4=5,0 i x5=4,3 kg, pa njihov zbir podeliti sa 5
opservacija u uzorku (veliina uzorka: n=5). Dakle, aritmetika sredina telesne mase ove
grupe novoroenadi je:
Prosena telesna masa pri roenju ove grupe novoroenadi iznosi 4,2 kg.
Dati nain izraunavanja aritmetike sredine, kao centralne vrednosti skupa ili
uzroka, moe da se primeni samo kod malih uzoraka i kada su podaci dati u vidu
empirijske serije, odnosno kada nisu sreeni u vidu distribucije frekvencija.
1
Uzorak je deo osnovnog skupa, na osnovu koga donosimo zakljuke o osnovnom skupu.
1
Aritmetika sredina za prostu distribuciju frekvencija izraunava se na taj
nain, to se vrednosti distribucije (x) mnoe (ponderiu) svojim odgovarajuim
frekvencijama (f), pa se dobijeni zbir proizvoda (fx), podeli sa ukupnom frekvencijom.
Matematika definicija ponderisane aritmetike sredine je:
x=
f1 x1 + f2 x2 + f3 x3+K+fn xn
=
f x
f1 + f2 + f3+K+fn f
f =n
- broj elemenata uzorka.
Tabela br. 1
Radna tabela za izraunavanje ponderisane aritmetike sredine
Broj lanova domainstva x Broj domainstava f f.x
1 8 18=8
2 11 2 11 = 22
3 29 3 29 = 87
4 11 4 11 = 44
5 4 5 4 = 20
63 181
x=
fx = 181 = 2,87
f 63
Dakle, navedeni soliter sa 63 domainstava u proseku je imao 2.87 lana po
domainstvu. Pri izraunavanju aritmetike sredine, esto se dobijaju apsurdne vrednosti,
kao 2,87 lana po domainstvu (gornji primer), ili 5,6 pregleda po jednom korisniku, 2,3
dijagnoze po jednom bolesniku itd. Meutim, ove se vrednosti u statistikim
izraunavanjima upotrebljavaju kao takve, pa treba izbegavati zaokruivanje na cele
brojeve.
2
Aritmetika sredina za distribuciju frekvencije sa grupnim intervalima
izraunava se po istom postupku, s tim to se grupni intervali zamene svojim aritmetikim
sredinama ( x i ), pa se te vrednosti mnoe odgovarajuim frekvencijama.
x=
f1x1 + f2x2 +K+ fnxn
=
f xi
f1 + f2 +K+ fn f ,
gde je: x i - aritmetika sredina grupnog intervala.
x=
fx i
=
2575,0
= 80,47
f 32
Prosena teina uenika je 80,47 kg.
iroka primena aritmetike sredine kao mere centralne tendencije nije sluajna.
Ona ne samo da je jednostavna, razumljiva i laka za raunanje ve ima jo mnoge poeljne
osobine:
3
1. Moe da se izrauna za bilo koji niz intervalnih podataka, to znai da uvek
postoji;
2. Bilo koji niz podataka ima samo jednu aritmetiku sredinu, to znai da je ona
jedinstvena vrednost bilo kog niza;
3. Za njeno izraunavanje uzimaju se u obzir svi podaci, to znai da na njenu
veliinu utiu sve vrednosti niza, od najmanje do najvee;
4. Suma pojedinanih odstupanja lanova statistike serije od aritmetike sredine
uvek je jednaka 0. Kao ilustraciju uzmimo 5. novoroenadi iju smo aritmetiku
sredinu ve izraunali: x =4,2.
n Vrednost niza xx
1 3,2 3,2-4,2=-1,0
2 4,8 4,8-4,2=0,6
3 3,7 3,7-4,2=-0,5
4 5,0 5,0-4,2=0,8
5 4,3 4,3-4,2=0,1
Sasvim je logino da zbir svih odstupanja bude jednak 0, jer je aritmetika sredina
po veliini vrednosti centar serije, pa je i suma odstupanja pojedinanih vrednosti serije
iznad aritmetike sredine jednaka sumi odstupanja pojedinanih vrednosti statistike serije
ispod aritmetike sredine.
5. Zbir kvadrata odstupanja pojedinanih vrednosti od aritmetike sredine jednak
je minimumu:
( x x) = min
Drugim reima, zbir kvadrata odstupanja od bilo koje druge vrednosti niza, pa i od
medijane i moda, kao mera centralne tendencije vei je od zbira kvadrata odstupanja od
aritmetike sredine:
( X Me) 2
> (X X )2 ( X Mod ) > ( X X )
2 2
Ovo je veoma vana osobina aritmetike sredine jer ona omoguava primenu
metoda najmanjih kvadrata.
Aritmetiku sredinu nema smisla raunati ako raspodela nije simetrina, kada
imamo mali broj podataka i kada je izraena varijabilnost podataka.
4
Pored aritmetike sredine koja predstavlja najee korienu meru centralne
tendencije pomenuemo i Harmonijsku i Geometrijsku sredinu koje takoe spadaju u
matematike mere centralne tendencije.
Harmonijska sredina upotrebljava se ree i to kod specifinih sluajeva tj. u onim
situacijama kada obeleja elemenata jednog skupa stoje u recipronom odnosu sa
obelejem elemenata nekog drugog skupa, tj. za analizu onih pojava iji je intenzitet
obrnuto proporcionalan vrednostima posmatranog obeleja
Harmonijska sredina je reciprona vrednost aritmetike sredine recipronih
vrednosti za koje se sredina izraunava.
n
Ona se rauna po formuli X=
1 1 1 1
+ + + ... +
X1 X 2 X 3 Xn
Primer:
U pet laboratorija raena je ista analiza. U osmoasovnom radnom vremenu
utvren je prosean utroak vremena po pacijentu u minutima:
Laboratorija A B C D E
Utr. vreme po pacijentu 0,8 1,0 1,2 1,2 1,5
Prosean utroak vremena po jednoj analizi, za sve laboratorije iznosi 1,09 minuta,
a ukupno vreme rada svih laboratorija iznosi 5 x 8 x 60 = 2400 min.
Prema tome, uraene analize na svim analajzerima iznose 2400 : 1.09 = 2200
minuta.
5
Geometrijska sredina se primenjuje u analizi vremenskih nizova i pomou nje se
izraunava prosena stopa promene pojave. Kao i svaka srednja vrednost nalazi se izmeu
najvee i najmanje vrednosti niza za koji se izraunava i brojano se razlikuje od
aritmetike sredine, osim ako svi lanovi niza nisu jednaki. Geometrijska sredina je uvek
manja od aritmetike. Izraunava se kao N-ti koren iz proizvoda njegovih lanova:
G = n X 1xX 2 xX 3x...xXn
Primer:
Date su vrednosti numerike varijable X: 22, 35, 25, 25, 32, 28, 31, 24, 30, 34, 34,
23.
Izraunajte: aritmetiku, harmonijsku i geometrijsku sredinu?
G = 12 22 35 25 25 ... 23 x 343
x= = = 28,58333
G = 28,22745 N 12
N 12
H= x 0 H= = 27,87
1 0,430550114
x
27,87<28,23<28,58
H<G< x
6
Medijana
= Me M mesto medijane
Primer 4: Uzmimo ponovo, telesne mase pet sluajno odabrane novoroenadi ije
su telesne mase bile: 3,2; 4,8; 3,7; 5,0 i 4,3. Ako telesne mase uredimo po veliini
dobijamo:
n x
1 3,2 < MMe =
Me (5+1)/2=3
2 3,7 <
Me
MMe3 4,3 Me = 4,3 kg
Me
4 4,8 >
Me
5 5,0 >
Me
Medijanu predstavlja telesna masa treeg novoeneta, a njegova teina je 4,3 kg,
pa je medijana: Me=4 kg. Dva novoroeneta (50%) imaju manju telesnu masu, a dva
(50%) veu telesnu masu od medijane.
7
Za paran niz vrednosti, medijana se odreuje kao aritmetika sredina dva centralna
lana. Mesta centralnih lanova odreuju se prema obrascima:
N N +2
= mesto prvog lana = mesto drugog lana
2 2
f + 1 = MeM ako je
2
f neparan broj
8
Primer 6. Uzmimo ve poznatu distribuciju frekvencija domainstava prema broju
lanova:
x f Kumulativni zbir Kumulativni zbir
(odozgo) (odozdo)
1 8 8 63
2 11 19 55
3 29 48 44
4 11 59 15
5 4 63 4
63 - -
MeM =
f + 1 = 63 + 1 = 32
2 2
Broj lanova 32 domainstava predstavljaju vrednost medijane. Kumulativni zbir
odozgo pokazuje da se to domainstvo nalazi izmeu 48 domainstava koja imaju tri lana
pa je Me =3 lana. I u ovom sluaju 50% domainstava imaju manju ili istu vrednost kao
medijana, a 50% domainstava istu ili veu vrednost od medijane.
I da na kraju rezimirama: Medijana je grublja ocena od aritmetike sredine. Na nju
ne utiu veliine vrednosti, ve broj vrednosti; ona moe da se izrauna i kada minimalna i
maksimalna vrednost serije nisu poznate.
Primenjuje se kao mera centralne tendencije kod izrazito heterogenih skupova.
Modus
Mod, modus, tipina vrednost, je poloajna mera centralne tendencije i to je ona
vrednost obeleja ili onaj modalitet obeleja, koji ima najveu frekvenciju, najveu
zastupljenost u okviru ukupne frekvencije.
U primeru 1. gde je data distribucija frekvencija domainstava prema broju
lanova, najveu frekvenciju pokazuju domainstva koja imaju 3 lana. Prema tome,
vrednost moda je 3 lana.
Danas se kae za Centralnu Srbiju i Vojvodinu da su tipina domainstva sa po 3
lana (roditelji i jedno dete). Tuberkuloza i zarazne bolesti su tipine za nerazvijene,
siromane zemlje. Kardiovaskularne bolesti i rak su tipini za razvijene zemlje.
Tipino je ono to preovladava. Neke pojave mogu da imaju i dve modalne vred-
nosti, pa kaemo da su bimodalne.
Znai, mod nije jedna jedina vrednost skupa, kao to je to aritmetika sredina.
9
Primer 7. Data je distribucija frekvencija sto studenata prema visini ocene na ispitu
iz Statistike.
Ocena Broj
studenata
5 10
6 28
7 12
8 10
9 30
10 10
100
f
30 28 30
20
10 10 12 10 10
0
5 6 7 8 9 10
10
Meusobni odnos mera centralne tendencije
Ako se vrednosti posmatranog obeleja (x) rasporeuju, tako oko svog centralnog
proseka, da je najvei broj manjih i veih vrednosti simetrian u odnosu na centar, onda se
dobija simetrian raspored, koji se grafiki manifestuje kao simetrina zvonasta linija kao
na grafikonu br. 9.
11
Mere centralne tendencije-izraunavanje u MS Excelu
Primer:
Stomatolozi: 6, 5, 5, 6, 7, 9, 8, 5, 5, 6, 8, 7, 6, 9, 10,
Reenje:
U novi radni list Excela, unesemo podatke po redu koji smo dobili. Za izraunavanje
aritmetike sredine iz negrupisanih podataka koristimo funkciju =AVERAGE (raspon
podataka).
12
U prozoru Insert Function, u polje Or select a function izaberemo Statistical. U polju
Select a function, imamo veliki broj statistikih funkcija, od kojij je potrebno da izaberemo
AVERAGE. Kliknemo na OK i dobijemo sledei prozor:
Medijana i mod:
Medijana, ili srednja poloajna vrednost, je centralna vrednost niza, koja ga deli na dva
jednaka dela. U odnosu na medijanu, 50% vrednosti je manje, i isto toliko vee od nje. Medijanu
koristimo kod heterogenih nizova, kada je koeficijent varijacije vei od 30%, i tada je ona
reprezentativnija mera centralne tendencije od aritmetike sredine.
13
U programu MS Excel medijanu iz negrupisanih podataka izraunavamo pomou
funkcije: =MEDIAN (raspon podataka).
14
Pitanja i zadaci za vebu u vezi materije za I, II, i III poglavlje:
15
10. Vreme krvavljenja kod 10 osoba obolelih od esencijalne trombocitopenije iznosilo je:
pacijenti: 1 2 3 4 5 6 7 8 9 10
vreme 4 8 6 8,2 7 5 4,5 9 7,5 10
krvavljenja u
minutima:
Zadatak: 1. Odredi medijanu; 2. Izraunaj interval varijacije i interkvartilnu razliku i
uporedi dobijene vrednosti. ta moe da zakljui?
11. Izmerena je koncentracija SO2 na 10 mernih mesta i dobijene su sledee koncentracije:
Merna mesta: 1 2 3 4 5 6 7 8 9 10
vrednosti: SO2: 74 5 200 30 40 120 0 50 90 100
Zadatak: 1. Koja mera centralne tendencije moe da reprezentuje datu seriju? 2. Odredi
vrednosti prvog (Q1) i treeg (Q3) kvartila i interkvartilnu razliku.
12. Odreen je radijalni puls kod 15 odraslih osoba mukog pola i kod 15 osoba enskog pola i
dobijene su sledee vrednosti:
mukarci: 60 62 69 65 74 67 71 73 78 81 83 71 76 75 72
ene: 61 72 73 81 86 80 82 79 76 66 78 81 84 67 70
Zadatak: 1. Izraunaj koeficijent varijacije za oba niza i oceni varijabilnost. 2. Sredi serije
u vidu distribucije frekvencije sa veliinom intervala od 3 jedinice i izraunaj aritmetiku
sredinu. Zato se vrednost aritmetike sredine izraunate iz empirijskog niza razlikuje od
aritmetike sredine izraunate iz distribucije frekvencije sa grupnim intervalima?
13. Broj stanovnika prema popisu iz 1991. godine u sledeim okruzima bio je: Niki okrug:
395.688; Topliki okrug: 111.706; Pirotski okrug: 116.876; Jablaniki: 255.091 i Pinjski
okrug: 242.369.
Zadatak: Date podatke predstavi u vidu statistike tabele i predstavi grafiki.
14. Izmerene su telesne mase i telesne visine 13 deaka i dobijene su sledee vrednosti:
N: 1 2 3 4 5 6 7 8 9 10 11 12
teina: 43 48 50 43 46 40 49 41 47 40 39 43
visnia: 140 150 152 140 145 141 145 140 146 135 139 140
Zadatak: 1. Izraunaj mere centralne tendencije za svaku seriju. 2. Predstavi grafiki i
ucrtaj prave za aritmetiku sredinu, medijanu i mod. Nai njihov odnos i odgovori zato se
medijana po vrednosti uvek nalazi izmeu aritmetike sredine i moda, bilo da je asimetrija
rasporeda ulevo ili udesno? 3. Proveri da li se dobija ista vrednost za mod iz
aproksimativne veze:
mod = 3 Me -2 x .
16
15. Broj umrle odojadi po mesecima u godini na podruju N, bio je:
meseci: januar februar mart april maj jun
umrla 25 15 10 5 12 13
odojad:
juli avgust septemba oktobar novemb decemba
r ar r
15 30 24 15 10 14
Zadatak: Datu vremensku seriju prikai grafiki najmanje na dva naina. ta zapaa i
kako to objanjava?
16. Data je distribucija domainstava prema broju lanova:
broj lanova: 1 2 3 4 5 6 7
broj domainstava: 14 30 43 38 19 14 12
Zadatak: Odredi medijanu i mod, i predstavi grafiki.
17. Pri upisu u prvi razred osnovne kole vre se sistematski lekarski pregledi. Pored ostalog
meri se i sposobnost dece. Jedne godine, kod jedne generacije dobijeni su sledei rezultati
(poenima od 1-12 ocenjene su sposobnosti dece):
broj poena: 1 4 7 9 10 11 12
deaci: 260 544 660 1200 1800 960 70
devojice: 265 540 600 1200 1850 700 65
Zadatak: 1. Odrediti koeficijent varijacije i za jednu i za drugu grupu i oceniti varijabilnost.
2. Odredi medijanu i mod i 3. Predstavi grafiki.
18. U jednom domu zdravlja prosean broj dnevne optereenosti lekara iznosio je 25 pregleda
sa standardnom devijacijom od 5 pregleda, a u drugom domu zdravlja prosena dnevna
optereenos je bila 30 pregleda sa standardnom devijacijom od 4 pregleda. Ako lekar N u
prvom domu zdravlja ima 20 pregleda dnevo, a lekar M u drugom domu zdravlja 26
pregleda dnevno, koji je od ova dva lekara tee podnosio svoje dnevno optereenje s
obzirom na prosenu optereenost lekara u odgovarajuem domu zdravlja?
17