Professional Documents
Culture Documents
jn
j n
Adibidea: Kalkula dezagun txitei inokulaturiko birusaren latentzia-aldiaren 6. dezila eta mediana (datuak elkartu gabe).
Egun-kopurua 5 6 7 8 9 10 11 12 13 14 15 16 Totala fi 5 9 6 14 12 8 5 11 7 7 4 2 90 Fi 5 14 20 34 46 54 59 70 77 84 88 90
Arantza Urkaregi
17
= 60 90 = 54 . Balio hau maiztasun metatuen zutabean agertzen 100 100 denez, 6. dezilaren kalkulua hauxe izango da:
1 1 p60 = ( x j + x j +1 ) = (10 + 11) = 10.5 2 2
Orduan, txiten %60ak, birusa inokulatu eta 10.5 egun baino lehenago gaixotasunaren sintomak dituzte. Mediana kalkulatzeko, n/2 = 45. 45 ez da agertzen maiztasun metatuen zutabean. Aurrekoan esandakoari jarraituz, handiagoa den lehenengo maiztasun 46 da, eta honi dagokion aldagiaren balioa 9 da, alegia Me = 9.
li = mediana daukan klasearen beheko muga n = laginaren tamaina Fi-1 = mediana daukanaren aurreko klasearen maiztasun metatua ai = mediana daukan klasearen zabalera fi = mediana daukan klasearen maiztasuna
diren. Geometrikoki, ondoko irudiak adierazten du medianaren kalkulu-metodoa datuak elkarturik daudenean:
Arantza Urkaregi
18
Estatistika Deskribatzailea
Adibidea: Kalkula dezagun txitei inokulaturiko birusaren latentzia-aldiaren mediana (datuak elkarturik). Egun-kopurua [4.5, 6.5) [6.5, 8.5) [8.5, 10.5) [10.5, 12.5) [12.5, 14.5) [14.5, 16.5) Totala Mediana ondoko erara kalkulatuko da: n/2 = 90/2 = 45 orduan, mediana daukan klasea [8.5, 10.5) da. Beraz, li = 8.5, Fi-1 = 34, ai = 2 eta fi = 20. Hau da,
Me = 8.5 + (45 34) 2 = 9.6 egun 20
ai 2 2 2 2 2 2
fi 14 20 20 16 14 6 90
Fi 14 34 54 70 84 90
Mediana, bere ezkerretara banaketaren %50a uzten duen balio zentrala da.
p j = li +
( j.n 100 Fi 1 ) ai fi
Adibidea: Kalkula dezagun lehen koartila, aurreko adibideko datuak erabiliz; hau da, txiten 25%-a gaixotu arte iraun den birusaren latentzia-aldia, datuak elkarturik daudenean. Lehen koartila kalkulatzeko: 25 n = 25 90 = 22.5. Orduan, lehen koartila daukan klasea 100 100 [6.5, 8.5) da.
Egun-kopurua [4.5, 6.5) [6.5, 8.5) [8.5, 10.5) [10.5, 12.5) [12.5, 14.5) [14.5, 16.5) Totala xi 5.5 7.5 9.5 11.5 13.5 15.5 ai 2 2 2 2 2 2 fi 14 20 20 16 14 6 90 Fi 14 34 54 70 84 90
Orduan, txiten 25%-ak, birusa inokulatu eta 7.85 egun baino lehenago gaixotasunaren sintomak dituzte.
Arantza Urkaregi
19
Estatistika Deskribatzailea
KUTXA-DIAGRAMA
Kutxa-diagrama, datu-multzo baten posizioaren ikus-pertzepzioa errazten duen adierazpide grafikoa da. Baita, outlier deritzon balio arraro edo muturretakoak aurkitzea baimentzen digu. Hainbat datu-multzoren banaketa konparatu nahi direnean oso erabilgarria da. Kutxa-diagrama edozein estatistikarako software-en bidez eraiki daitezken arren, bere eraikuntza pausuka azalduko dugu. Pausoak ondokoak dira: 1. Erreferentzia eskala irudikatu, bertikala zein horizontala. 2. Mediana, lehen eta hirugarren koartilak eta koartilarteko heina kalkulatu. 3. Barne-hesiak deitzen diren m1 eta m3 puntuak kalkulatu ondoko erara: m1 = q1 1.5RI m3 = q3 + 1.5RI Puntu hauek outlier-ak detektatzeko erabiliko dira. 4. Albo-balioak deitzen diren b1 eta b3 balioak kalkulatu, non, b1, m1 balioarengandik hurbilen dagoen aldagaiaren balioa da, m1 baino txikiagoa ez izanik; eta, b3, m3 balioarengandik hurbilen dagoen aldagaiaren balioa da, m3 baino handiagoa ez izanik. 5. Kanpo-hesiak deitzen diren M1 eta M3 puntuak kalkulatu ondoko erara: M1 = q1 2(1.5)RI M3 =q3 + 2(1.5)RI 6. Orain arte kalkulaturiko balio guztiak eskalan kokatu. 7. q1 eta q3 balioak muturretan ezarriz, kutxa bat irudikatu, mediana dagoen puntuan lerro bat jarririk. 8. Albo-balioak besoen bidez adierazi, eta kutxarekin lotu. 9. Barne eta kanpo-hesien bitartean dauden aldagaiaren balioak, zirkulu irekien bidez adierazi. Puntu hauek outlier moderatu bezala kontsideratzen dira. 10.Kanpo-hesien kanpoaldean dauden aldagaiaren balioak asteriskoen bidez adierazi. Puntu hauek izugarrizko outlier bezala kontsideratzen dira.
M1 *
m1
b1
q1
Me
q3
b3
m3
M3 *
Arantza Urkaregi
20
Estatistika Deskribatzailea
Adibidea: Airearen kutsadura aztertzeko, 57 hiritan aztertu zen esekidura-materiaren partikulaedukia (mikrogramo/m3-tan), hurrengo emaitzak lorturik: 68 65 12 22 63 43 32 43 42 25 49 27 27 74 38 49 30 51 42 28 36 36 27 23 28 42 31 19 32 28 50 46 79 31 38 30 27 28 21 43 22 25 16 49 23 24 25 44 45 12 57 51 24 69 47 23 12
RI = q3 q1 = 46.5 25 = 21.5
57 0 25,00 32,00 46,50
m1 = q1 1.5 RI = 25 1.5 21.5 = -7.25 b1 = 12 m3 = q3 + 1.5 RI = 46.5 + 1.5 21.5 = 78.75 b3 = 74 M1 = q1 2 1.5 RI = 25 3 21.5 = -39.5 M3 = q3 + 2 1.5 RI = 46.5 + 3 21.5 = 111
100 90 80 70 60 50 40 30 20 10 0
N= 57 9
Partikula-edukina
Arantza Urkaregi
21
Estatistika Deskribatzailea
1 2 3 4 5 6 7 9 8
1 0
N= 589 65
ez-erretzailea
erretzailea
erretze-historia
30
20
614 609 139 179 196 5 32 596 599
10
adina
0
N= 318 336
emakumea
gizona
sexua
Arantza Urkaregi
22
Estatistika Deskribatzailea
Batezbesteko aritmetikoa ( x )
x + x2 + ... + xn i =1 x= 1 = n n xi
n
x f + x 2 f 2 + ... + xk f k i =1 x= 1 1 = n n
xi f i
Adibidea: Kalkula ditzagun txitei inokulaturiko birusen batezbesteko latentzia-aldia, datu zehatzak eta elkartuta ditugunean.
Elkartu gabeko datuen kasuan, batezbesteko aritmetikoa ondokoa da:
x=
889 = 9.8778 90
Hots, txitei inokulaturiko birusaren batezbesteko latentzia-aldia 9.9 egunetakoa da. Elkartutako datuen kasuan, batezbesteko aritmetikoa ondokoa da: x= 883 = 9.8111 90
Hots, txitei inokulaturiko birusaren batezbesteko latentzia-aldia 9.8 egunetakoa da. Taula estatistikoak ondokoak dira: Egun-kopurua xi 5 6 7 8 9 10 11 12 13 14 15 16 Totala fi 5 9 6 14 12 8 5 11 7 7 4 2 90 fi xi Egun-kopurua 25 54 42 112 108 80 55 132 91 98 60 32 889 [4.5, 6.5) [6.5, 8.5) [8.5, 10.5) [10.5, 12.5) [12.5, 14.5) [14.5, 16.5) Totala xi 5.5 7.5 9.5 11.5 13.5 15.5 fi 14 20 20 16 14 6 90 fi xi 77 150 190 184 189 93 883
Arantza Urkaregi
23
Estatistika Deskribatzailea
Agertutako batezbestekoak desberdinak dira; hau guztiz logikoa da, zeren eta datuak elkartzerakoan informazioa galtzen baita, eta honek estatistikoaren kalkuluan eragina baitu. Dena den, klasekopurua egokia baldin bada, galdutako informazioa ez da garrantzitsua. Propietateak: 1. Bere abantailarik handiena kalkulatzeko erraztasuna da. 2. Bere oztopoa da, lagin-fluktuazioekiko sentikorra izan daitekeela, muturretan jartzen diren balio arraroek eragina daukatelako batezbestekoan. Adibidez, 2, 3, 4, 5, 5, 6 eta 300 balioen batezbesteko aritmetikoa
2 + 3 + 4 + 5 + 5 + 6 + 300 = 46.4286 7 da, baina balio honek ez ditu aurreko balioak ondo adierazten.
Mediana (Me)
Alde bakoitzean ale-kopuru berdina (50%-a) daukan aldagaiaren balioa da. Kasu bi bereizten ditugu:
n n
taulako maiztasun metatuen (Fi) zutabean agertzen ez bada: maiztasun metatu biren bitartean 2 egon beharko da, beraz hauetatik handienari dagokion aldagaiaren balioa izango da mediana. 2 balioa taulako maiztasun metatuetariko bat baldin bada, adibidez Fj, orduan: 1 ( x j + x j +1 ) 2
Me =
Propietateak:
1. Banaketa asimetrikoetan, joera zentraleko estatistikorik adierazgarriena da. 2. Kalkulatzeko erraza da.
3. Lagin-fluktuazioekiko ez da sentikorra.
Moda (Mo)
Maiztasun handiena daukan aldagaiaren balioa da.
Adibidea: Kalkula dezagun txitei inokulaturiko birusaren latentzia-aldiaren moda (datuak elkartu gabe).
Maiztasun absoluturik handiena 14 da, eta honi dagokion aldagaiaren balioa 8 da; orduan, Mo=8.
3. Bere kalkuluan lagineko datu bakar bat erabiltzen denez, informazio asko galtzen da. 4. Ez da zertan erdi aldean egon behar, muturretan egon daiteke.
ELKARTUTAKO DATUAK:
Beti, moda (mediana bezala) jatorrizko datuekin kalkulatzea hobe izaten da, noski. Baina, datuak ez ditugunean, propietate geometriko sinple batzuetan oinarritzen den formula aplikatuko dugu. handiena, edo histogramako altuerarik handiena) ai daukan klaseari klase modala deituko diogu, eta kasu honetan, modaren balioa ondoko adierazpenaren bidez kalkulatzen da:
Mo = li + 1 ai 1 + 2
f Maiztasun-kontzentraziorik handiena ( i
non: li = klase modalaren beheko muga ai = klase modalaren zabalera f f 1 = i i 1 ai ai 1 f f 2 = i i +1 ai ai +1 f i / ai = klase modalaren histogramako altuera = klase modalaren aurreko klasearen histogramako altuera (klase modala lehenengoa baldin bada, balio hau 0 da) f i +1 / ai +1 = klase modalaren hurrengo klasearen histogramako altuera (klase modala azkena baldin bada, balio hau 0 da) diren. Geometrikoki, ondoko irudiak adierazten du modaren kalkulu-metodoa datuak elkarturik daudenean:
Estatistika Deskribatzailea
Adibidea: Kalkula dezagun txitei inokulaturiko birusaren latentzia-aldiaren moda, datuak elkarturik daudenean. fi Egun-kopurua xi ai
ai
[4.5, 6.5) [6.5, 8.5) [8.5, 10.5) [10.5, 12.5) [12.5, 14.5) [14.5, 16.5) Totala
2 2 2 2 2 2
7 10 10 8 7 3
Klase modal bi daude: [6.5, 8.5) eta [8.5, 10.5), zeren eta histogramako altuera maximoa biek baitute dute. Klase bakoitzeko moda kalkulatzen da: Mo = 6.5 + Mo = 8.5 + 10 - 7 2 = 8 .5 (10 7) + (10 10) 10 - 10 2 = 8 .5 (10 10) + (10 8)
Kasu honetan, klaseak jarraian daudenez, moda bakarra da. Adibidea: Kalkula dezagun 50 pertsonen altueren moda (datuak elkarturik).
fi
6 22 12 7 3 50
Histogramaren altuerak begiratu behar ditugu ( f i / ai ). Handiena 240 da, eta [1.70, 1.75) klaseari dagokio, orduan berau izango da klase modala. Formula aplikatuz:
Mo = 1.70 +
Arantza Urkaregi
26
Estatistika Deskribatzailea
y=
ax + b c
2. Batezbestekoarekiko desbiderapenen batezbestekoa nulua da: 1 k ( xi x ) f i = 0 n i =1 3. Batezbestekoarekiko desbiderapenen karratuen batezbestekoa minimoa da. Hau da, 1 k Q(a ) = ( xi a )2 f i minimoa da, x = a denean. n i =1
x i wi
Adibidea: Ikasleek ikasgai bat gainditzeko, praktika-txostenen eta azterketaren notak kontuan hartzen dira. bi azterketa egin ditu. Ikasle batek 5 lortu du praktika-txostenetan eta azterketan, 7. Praktika-txostenek azken kalifikazioaren %30a suposatzen dute eta azterketak %70a. Zein da ikasle horren azken kalifikazioa?
xh =
5 30 + 7 70 = 5 0,30 + 7 0,70 = 1,5 + 4,9 = 6,4 100
(Batezbesteko aritmetikoa kalkulatuko bagenu, azken kalifikazioa 6 izango litzateke, baina horrela praktikei eta azterketari balio berbera emango genieke)
Aplikazioak
Batezbesteko aritmetiko haztatua maiz erabiltzen da prezio indizeak kalkulatzeko orduan, ondasun ezberdinen prezio igoerak ondasun bakoitzaren kontsumoaren arabera haztatu behar baitira. Batezbesteko tasak edo ehunekoak kalkulatzeko ere erabiltzen da.
Arantza Urkaregi
27
Estatistika Deskribatzailea
Adibidez, eskualde bateko bi udalerrien langabezi tasak %6 eta %10 badira hurrenez hurren ezin da besterik gabe esan batezbesteko langabezi tasa %8koa denik, batezbesteko aritmetiko sinplea erabiliz, bi udalerriek biztanleria aktibo ezberdinak dituztelako. Batezbestekoa kalkulatzeko orduan biztanleria aktiboaren arabera haztatu behar da beraz. Biztanleria aktiboak 1.000 eta 3.000 pertsonakoak badira hurrenez hurren, honela kalkulatzen da batezbesteko langabezi tasa, batezbesteko aritmetiko haztatua erabiliz:
xh = 6 1.000 + 10 3.000 36.000 = =9 4.000 4.000
2. BATEZBESTEKO GEOMETRIKOA
1 k f i ln xi n i =1
G = n x1 1 x2 2 xk k
ln G =
Aplikazioak
Ekonomia arloko datuak aztertzeko erabiltzen da bereziki. Portzentaia, arrazoi, indize edo hazkunde-tasen batezbestekoak kalkulatzeko oso erabilgarria da. Interes konposatu, inflazio eta biztanle-hazkundeek denboran zehar duten eragin biderkatzailea nabarmentzen ditu. Batezbesteko geometrikoa erabiltzea gomendatzen da aldagai batzuek denboran zehar izandako batezbesteko aldaketa (portzentaiatan) kalkulatu nahi dugunean. Hainbat egoeratan, batezbesteko aritmetikoaren bidez lortutako emaitzak ez dira batezbesteko geometrikoaren bidez lortutakoen artean ez da alde handirik agertzen, baina alde txikiek erabaki okerrak ondoriozta ditzakete.
Adibidea: Hurrengo taulan, bost urtetan zehar, 100 euroko aurrezki-gordailuaren hazkundea agertzen da, kontuan izanda interes-tasak %7, %8, %10, %12 eta %18 izan direla hurrenez hurren.
Urtea
1 2 3 4 5
Interes-tasa (%)
7 8 10 12 15
Hazkunde-faktorea
1.07 1.08 1.10 1.12 1.15
Zein da aurrezki-gordailuaren batezbesteko hazkundea 5 urte hauetan? Batezbesteko aritmetikoa kalkulatzen badugu:
Arantza Urkaregi
28
Estatistika Deskribatzailea
x=
Batezbesteko interes-tasa %10.4 izan dela esango genuke. Edo hazkunde-faktorea erabiliz, x= 1.07 + 1.08 + 1.10 + 1.12 + 1.15 5.52 = = 1.104 5 5
Eta hasierako aurrezkia, batezbesteko hazkunde-faktoretik biderkatzen badugu, lortu beharko genukeen amaierako aurrezkia hauxe litzateke: 100 1.104 1.104 1.104 1.104 1.104 = 164 Baina lortutako amaierako aurrezkia 16.73 -koa izan da. Beraz, batezbesteko hazkundefaktorea pixka bat txikiagoa izan da. Nola kalkulatu behar dugu batezbesteko hazkunde-tasa? Batezbesteko geometrikoaren bidez:
G = 5 1.07 1.08 1.10 1.12 1.15 = 5 1.6373 = 1.1036 Beraz, batezbesteko hazkunde-tasa 1.1036 da.
3. BATEZBESTEKO KOADRATIKOA
Q=
1 k 2 f i xi n i =1
Q2 =
1 k 2 f i xi n i =1
Aplikazioak
Batzuetan, aldagaiaren balioak positiboak eta negatiboak dira, esate baterako, neurrien erroreak. Kasu horietan, batezbestekoa kalkulatzerakoan, zeinuaren eragina baztertu nahi badugu, batezbesteko koadratikoa erabili beharko dugu. Fisikan, korronte alternoetan, etxeko tentsioa adierazteko erabiltzen den kontzeptua balio eraginkorra erabiltzen da. Balio hau, era sinusoidalean aldantzen den uneko tentsioaren batezbesteko balio koadratikoa da. Olatu irregularren kasuan, olatu adierazgarria da batezbesteko altuera koadratikoa duen olatua. Geometrian ere, azaleren kasuan, gehien erabiltzen den batezbestekoa batezbesteko koadratikoa da.
Adibidea: Bira A1 eta A2, hurrenez hurren, l1 eta l2 tamainuko aldeak dituzten bi lauki. Zein da bien arteko batezbesteko laukia? Bi aukera egon daitezke: 1) Batezbeteko laukiaren aldetzat, bi aldeen batezbesteko aritmetikoa hartzea. 2) Batezbesteko laukiaren azalera, bi laukien batezbesteko azalera izango da.
l +l Lehenengo kasuan, l = 1 2 2
Arantza Urkaregi
29
Estatistika Deskribatzailea
2 2 A + A2 l1 + l2 Bigarren kasuan, A = 1 = 2 2
Azken hau da logikoena, eta batezbesteko laukiaren aldea da laukien aldeen batezbesteko koadratikoa. 4. BATEZBESTEKO HARMONIKOA 1 1 k 1 = fi H n i =1 xi
H=
n
k f i i =1 xi
Aplikazioak Produktibitate, abiadura, denbora, etekin, aldaketa eta abar bezalako aldagaien batezbestekoa kalkulatzeko erabiltzen da. Batezbesteko prezioa Produktu ezberdinak erosten baditugu, bakoitzaren kantitate ezberdinak, baina bakoitzean dirukopuru berbera inbertituz, batezbesteko prezioa da, produktuen prezioen batezbesteko harmonikoa. Batezbesteko ekoizpen-etekina Artikulu bat ekoizten duten langileek abiadura ezberdinez egin dezakete. Langile bakoitzak artikulu-kopuru berbera ekoiztu behar badu, batezbesteko etekin-abiadura langileen etekinabiaduren batezbesteko harmonikoa izango da. Batezbesteko abiadura Distantzia berbera egiteko abiadura ezberdinak erabiltzen badira, batezbesteko abiadura da abiaduren arteko batezbesteko harmonikoa. Adibidea: Kotxe batek Bilbotik Donostiarako ibilbidea 110 km/h-ko abiaduraz egiten du. Bueltan, euria zela, abiadura 90 km/h-koa izan zen. Zein da joan-etorrian egindako batezbesteko abiadura? Pentsatu gabe, baten batek erantzungo zuen 100 km/h, batezbesteko aritmetikoa erabiliz. Baina hori ez da erantzun zuzena. Batezbesteko abiadura kalkulatzeko, egindako espazio osoa zati erabilitako denbora osoa egin beharko genuke. Bilbo eta Donostiaren arteko distantzia d baldin bada, erabilitako denborak hauek dira:
t joan = Beraz, d 110 t etorri = d 90
Batezbesteko abiadura =
2d d d + 110 90
2 1 1 + 110 90
= 99 km/h.
Arantza Urkaregi
30
Estatistika Deskribatzailea
(M ) =
1 k f i ( xi ) n i =1
x1
x2
xk
Beraz, M izango da y = (x) kurbaren puntu baten abzisa, non puntu horren ordenatua G-rena den. Propietatea: eta deribatuek zeinu konstantea badute, ondoko erlazioa betetzen da: M < x da, baldin eta (x) (x) < 0 bada, M > x da, baldin eta (x) (x) > 0 bada, M = x da, baldin eta (x) (x) = 0 edo xi berdinak badira.
> 0
> 0
G
> 0
< 0
G
Arantza Urkaregi
31
Estatistika Deskribatzailea
< 0
< 0
G
< 0
> 0
G
y
M
Adibidea: G < x da frogatuko dugu. Horretarako, abiapuntua (x) = ln (x) hartzea da. Hau da: ln Mln =
n ln Mln = ln x1f1 x 2f 2 x kf k 1 k f i ln(xi ) n i =1
f f f Beraz, Mln = n x1 1 x2 2 xk k = G
Baina, ( x ) =
Kasu honetan, ( x ) = r x r 1 eta ( x ) = r (r 1) x r 2 dira. Hau da, ( x ) = r 2 (r 1) x 2r 3 Beraz, Mr > x izango da, baldin eta r > 1 bada
Mr < x izango da, baldin eta r < 1 bada Mr = x izango da, baldin eta r = 1 edo xi berdinak badira
Arantza Urkaregi
32
Eta 2 > 1 denez, Q > x izango da. Batezbesteko harmonikoa M-1 da:
n 1 1 k 1 = fi denez, H = = M-1 k f H n i =1 xi i i =1 xi
Propietatea: G batezbesteko geometrikoa, 0 ordenako batezbestekoa da. Frogapena. ordenako batezbesteko (M) horrela definitzen da: (M ) = 1 k f i xi n i =1
(M ) 1 = 1
a 1
x 1 k fi i n i =1
Baina, 0 denean,
ln a da.
f f f M0 = n x1 1 x2 2 xk k = G
Beraz, ln M0 =
1 k f i ln(xi ) n i =1
(Ma)a =
1 k f i xia n i =1
eta
(Mb)b =
1 k f i xib n i =1
Arantza Urkaregi
33
Estatistika Deskribatzailea
Mr funtzio gorakorra izateko ondokoa egiaztatu beharko dugu: a < b baldin bada, Ma < Mb ezberdintza beteko da. Suposatuko dugu a < b dela eta Y = X a moduan definitzen dugu.
1 k a Orduan, Ma(X) = n f i xi i =1 eta 1 k b Mb(X) = n f i xi i =1
1 b b 1 k a = f y i i n i =1 1 b 1 a
1 k = n f i yi i =1
=y
= [Mb/a(Y)]1/a
Beraz, Ma < Mb da, baldin eta a < b bada, hau da, r ordenako batezbestekoa, r-ren funtzio gorakorra da.
Ikusi ditugun batezbesteko-mota ezberdinak r ordenako batezbestekoaren kasu partikularrak dira: Q = M2, H = M-1, x = M1 eta G = M0 Azpiindizeen erlazioa kontuan hartuz, hau da, -1 < 0 < 1 < 2 denez, H < G < x < Q erlazioa lortzen dugu.
Arantza Urkaregi
34