Professional Documents
Culture Documents
9.1 Estatistika Deskribatzailea
9.1 Estatistika Deskribatzailea
Adibideak.
1. Hiri baten politika berri bati buruz biztanleen “aldeko” edo “kontrako” iritzia atributo
motakoa izango litzateke.
2. Supermerkatu baten kutxan bezeroek iragandako denbora, aldagai motakoa izango
litzateke.
1. Lortu datuen heina edo ibilbidea: ibilbidea = datu handiena - datu txikiena
Tarte baten maiztasuna, bere barruak erortzen diren datuen kopurua da. Maiztasun
erlatiboa, maiztasun arruntari datu kopurua zatituz lortzen da.
a0 – a1 m1 n1 f1 N1 = n1 F1
a1 – a2 m2 n2 f2 N2 =N1+ n2 F2 = F1+ f2
… … … … … …
ak-1 - ak mk nk fk Nk= Nk-1+nk = N Fk=Fk-1+fk= 1
N 1
157
Adibidea. Zein izango lizateke tarte kopuru egokiena datu kopurua Ondorengoa bada:
a) N = 100 b) N = 1000
Erregela orokor bezala, tarte kopuru egokienak 5 eta 10 bitartean egon beharko luke.
Adibidea. Ondorengo datuak klase baten ikasleen notak dira. Sailkatu datuak.
6 4 7 5 7 2
5 5 5 5 6 10
9 10 7 3 8 7
3 5 4 8 9 7
7 4 6 7 4 6
klaseko notak
8 7
7 6
6
5 4 4
4
3 2 2 2 2
2 1
1 0
0
1 2 3 4 5 6 7 8 9 10
Ikusten denez banakera simetrikoa jarraitzen dute erdiko balioren baten inguruan.
158
JOERA ZENTRALEKO BALIOAK
1. Batezbesteko aritmetikoa: 𝑥̅
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 ∑𝑛𝑖=1 𝑥𝑖
𝑥̅ = =
𝑛 𝑛
𝑥1 𝑛1 + 𝑥2 𝑛2 + ⋯ + 𝑥𝑘 𝑛𝑘 ∑𝑘𝑖=1 𝑥𝑖 𝑛𝑖
𝑥̅ = =
∑𝑘𝑖=1 𝑛𝑖 𝑛
2. Moda: mo
Moda gehien errepikatzen den datua da, bakarra dagoeneko kasuan. Bestela ez dago
modarik.
3. Mediana: m
Datuak ordenatu eta gero, posizio zentrala duen datua mediana da. Datu kopurua
bikoitia balitz, mediana bi datu zentralen batezbestekoa da.
Medianak datuen %50a bere ezkerrean du eta beste %50a eskuinean.
Era berean datuen %25a markatzen duen neurria behe koartila deitzen da eta %75a
markatzen duena goi koartila.
Batezbestekoa:
∑𝑛
𝑖=1 𝑥𝑖 6+4+7+⋯+4+6 (1).0+(2).1+⋯+(10).2
𝑥̅ = 𝑛
= 30
= 30
= 6
Hau da, mediana 15. eta 16. datuen batezbestekoa da. Maiztasun metatuei begiratua
ikuzten dugu 6 dela.
159
SAKABANATZE NEURRIAK
2. Batezbesteko desbiderazioa.
Lehenengo bariantza lortzen da: datu bakoitza eta batezbesteko aritmetikoaren arteko
kenduraren karratuaren batezbestekoa da da.
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝐵𝐴𝑅 = = 𝜎2
𝑛
∑𝑛 (𝑥𝑖 − 𝑥̅ )2
𝐷𝑇 = √𝐵𝐴𝑅 = √ 𝑖=1 = 𝜎
𝑛
Datuak populazio osoa izan beharrean, lagin bat besterik ez direnean, bere bariantza
populazioaren bariantzaren antzekoagoa da, zatitzailean n-1 ipintzen bada
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∑𝑛 (𝑥𝑖 − 𝑥̅ )2
𝐵𝐴𝑅𝑙𝑎𝑔𝑖𝑛𝑎 = = 𝑠2 → 𝐷𝑇𝑙𝑎𝑔𝑖𝑛𝑎 = √ 𝑖=1 =𝑠
𝑛−1 𝑛−1
∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2 ∑ 𝑥𝑖2 −2𝑥̅ ∑ 𝑥𝑖 + ∑ 𝑥̅ 2 ∑ 𝑥𝑖2 −2𝑥̅ 𝑛𝑥̅ + 𝑛𝑥̅ 2 ∑ 𝑥𝑖2
𝐵𝐴𝑅 = = = = − 𝑥̅ 2
𝑛 𝑛 𝑛 𝑛
160
Adibidea. Klasearen noten ibilbidea, batezbesteko desbiderazioa eta desbiderazio tipikoa
lortu.
Batezbesteko desbiderazioa:
∑𝑛
𝑖=1 |𝑥𝑖 −𝑥̅ | |1−6| .0+ |2−6| .1+⋯+|10−6| .2
𝐵𝐷 = 𝑛
= = 30
= 1,64
Bariantza:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 (1 − 6)2 . 0 + (2 − 6)2 . 1 + ⋯ + (10 − 6)2 . 2
𝐵𝐴𝑅 = = =4
𝑛 30
Guztia labur genezake esanez, nota gehienak 𝑥̅ ± 𝜎 tartean daudela. Hau da, 6 ± 2 tartean.
a) 1, 2, 3, 4, 5, 6 b) 1, 1, 1, 6, 6, 6 c) -5, 2, 3, 4, 5, 12
∑ 𝑥𝑖2
Bariantza: 𝐵𝐴𝑅 = − 𝑥̅ 2
𝑛
91
a) 𝐵𝐴𝑅 = 6
− 3,52 = 2,9 DT = 1,7
111
b) 𝐵𝐴𝑅 = 6
− 3,52 = 6,25 DT = 2,5
221
c) 𝐵𝐴𝑅 = 6
− 3,52 = 24,9 DT = 5
161
Adibidea. Izan bitez ondorengo neurriak, burdinolatik bidalitako altzairuzko hagaxka edo ziri
batzuren luzerak:
29 28 11 16 27
25 27 22 25 22
23 28 22 29 25
25 29 26 24 28
20 29 30 25 28
25 29 30 24 30
29 25 26 24 24
20 26 21 32 22
Ebazpena.
∑𝑘
𝑖=1 𝑚𝑖 𝑛𝑖 1003,5
Batezbestekoa: 𝑥̅ = = = 25,0875
𝑛 40
162
Maiztasun metatuetan ikusten dugu, laugarren tartean dagoela. Mediana lortzeko
estrapolazioa edo hiruko erregela egingo dugu:
21 datu
20,5
5
21,5 Mediana 25
OHARRA.
Kalkulatzen bada bakankako 40 datuekin ondorengoa lortzen da:
Ikusten denez jatorrizko populazioaren bariantzen antzekoagoa azken hau da. Gainera
lagin txikietan azken bi hauen desberdinasuna nabarmena da.
163
HAGAXKEN LUZERA
16
16
14
12 10
9
10
8
6
3
4
1 1
2
0
12.75 16.25 19.75 23.25 26.75 30.25
ARIKETAK
55 53 48 55 53
54 51 46 47 47
Lortu:
a) batezbestekoam moda, mediana eta behe eta goi koartilak.
b) ibilbidea, batezbesteko desbiderazioa eta lagin desbiderazio tipikoa
batezbestekoa 50,9
moda 55
mediana 52
behe koartila 47,25
goi koartila 53,75
ibilbidea 9
batezbeseko desbiderazioa 3,12
lagin bariantza 12,77
lagin desbiderazioa 3,57
164
Ebazpena.
a) Datuak bakanka:
Batezbestekoa: 5,49 Moda: 4,9
Medianaren posizioa: (1+35)/2 = 18 Mediana: 5
Bariantza populazio bezala: 8,68 Desbiderazio tipikoa: 2,95
Bariantza lagina bezala: 8,93 Desbiderazio tipikoa: 2,99
Batezbesteko desbiderazioa: 2,29
Adar-hosto motako grafikoa lagungarri izan daiteke moda eta mediana bilatzeko.
Horretarako datuen ibilbidea kalkulatzen da: datu handiena-txikiena = 13,6 - 0,7 = 12,9
Tarte borobillak aukeratu, zabalera hamarren potentzia edo bere erdia izanik. Gure kasuan
1 aukeratuko dugu. Horrela tarteak izango dira
0-1 1-2 2-3 … 12 – 13 13 – 14
Ondoren zuzen bertikala marrazten da: Berre eskerraldean, tartearen digitu amankomuna
ipintzen da eta eskuinaldean datu bakoitzaren digitu partikularra:
ADARRA HOSTOAK MAIZTASUNAK METATUAK
0 7 1 1
1 90 2 3
2 549 3 6
3 5714420 7 13
4 9979 4 17
5 06571 5 22
6 52612 5 27
7 8 1 28
8 585 3 31
9 7 1 32
10 0 32
11 31 2 34
12 0 34
13 6 1 35
35
165
∑𝑘
𝑖=1 𝑚𝑖 𝑛𝑖 191,125
Batezbestekoa: 𝑥̅ = = = 5,46
𝑛 35
Guztia labur bilduta esan genezake datuen gehiengoa 𝑥̅ ± 𝜎 tartean dagoela: 5,46±2,7
Batezbesteko desbideraziorako ondorengo kalkulua egigo dugu:
|mi-5,46|*ni
18,4285714
19,9642857
5,52857143
11,0571429
14,7428571
76,7857143
∑𝑛
𝑖=1 |𝑚𝑖 −𝑥̅ |𝑛𝑖 76,7857143
𝐵𝐷 = 𝑛
= 35
= 2,19
2. Izan bitez ondorengo lau datu sortak, lau metodoen bidez lortutako material baten
gogortasun indizeei buruzkoak:
1. SORTA
19 35 32 30 31 26 30 28 24 25
2. SORTA
22 28 25 25 21 26 25 31 31 19
3. SORTA
57 39 51 54 55 43 47 48 44 56
4. SORTA
79 85 80 77 83 83 71 80 84 73
Lortu sorta bakoitzaren mediana eta koartilak. Kutxa grafikoak eraiki konparaketa egiteko.
166
19 24 25 26 28 30 30 31 32 35
19 21 22 25 25 25 26 28 31 31
39 43 44 47 48 51 54 55 56 57
71 73 77 79 80 80 83 83 84 85
1+10
Medianaren posizioa: = 5,5
2
1+5,5 5,5+10
Behe koartilaren posizioa: 2
= 3,25 eta goi koartilarena: 2
= 7,75
19 25,25 29 30,75 35
19 22,75 25 27,5 31
71 77,5 80 83 85
Bibotea Kutxa
%25 %25 %25 %25
167
R
Ondorengo grafikoan ikusten den bezala, lehen eta bigarren sortak gogortasun baxukoak
dira, bigarren sortak elementu berdintsuagoak dituelarik. Laugarren sortak ez ditu bakarrik
gogortasun altuko elementuak, gainera elementu oso homogenoak edo doiak ditu.
4. Hurrengo datuek kirolari batek 30 astetan zehar, astero jarduera batetan igarotako ordu
kopuruak adierazten dituzte.
Datuak tartetan sailkatu eta maiztasunekin grafikoa eraiki.
Kalkulatu: batezkestekoa, mediana eta populazio desbiderazio tipikoa
6,3 8,6 7,9 7,8 8 8,8 8,5 7,5 9,4 8,1
Ebazpena
maximoa minimoa ibiltartea tart kopurua zabalera
9,4 6,3 3 6 0.5
Marka x Maiz n x .n x² . n
tartea
6,8 6,55 1 6,55 42,9
6,3
7,3 7,05 4 28,2 198,81
6,8
7,8 7,55 7 52,85 399,02
7,3
8,3 8,05 8 64,4 518,42
7,8
8,8 8,55 4 34,2 292,41
8,3
9,3 9,05 5 45,25 409,51
8,8
9,8 9,55 1 9,55 91,2
9,3
30 241 1952,27
∑x 2 𝑛 1952,27
𝜎= √ − 8,03 2 = √ − 8,03 2 = 0.77
30 30
8
8 7
7
6 5
5 4 4
4
3
2 1 1
1
0
6.55 7.05 7.55 8.05 8.55 9.05 9.55
168
5. Ondorengo datuak eraikuntza solairu handi baten zonen altuera desberdinei dagozkie:
m n
HASIERA AMAIERA MARKA MAIZTASUNA M. METATUA mn m2 n
-1,27 -0,79 -1,03 5 5 -5,15 5,3045
-0,79 -0,31 -0,55 4 9 -2,2 1,21
-0,31 0,17 -0,07 17 26 -1,19 0,0833
0,17 0,65 0,41 11 37 4,51 1,8491
0,65 1,13 0,89 12 49 10,68 9,5052
1,13 1,61 1,37 7 56 9,59 13,1383
1,61 2,09 1,85 3 59 5,55 10,2675
2,09 2,57 2,33 1 60 2,33 5,4289
60 24,12 46,7868
169
Goi koartila: posizioa = (30,5+60)/2 = 45,25
Interpolazioa: 0,65+(1,13-0,65)(45,25-37)/(49-37) =0,98
Batezbesteko desbiderazioaren kalkulua:
|m-batezbestekoa|n
7,16
3,808
8,024
0,088
5,856
6,776
4,344
1,928
37,984
BD= 37,984/60=0,633066667
12
10
7
8
5
6 4
3
4
1
2
0
-1.03 -0.55 -0.07 0.41 0.89 1.37 1.85 2.33
METROAK
170