You are on page 1of 25

3.

Gaia: Bi aldagaien maiztasun-banaketa


eta haien arteko erlazioa
-Kontingentzia-taulak. Bazter-banaketak eta
banaketa baldintzatuta
-Adierazpen grafikoa:
-Bi zutabeetako grafikoa (kualitatiboak)
-Puntu-hodeia (bi algai kuantitatibo)
-Korrelazio koefizientea
-Aldagaien arteko independentzia
-Korrelazioa ez da sorburua (kausa)

Marrazkiak: Gonick, L. eta Smith, W.: La estadística en comic. Zendrera 1


Zariquiey, Barcelona,1999
Orain arte, aldagai bat baino ez dugu ikasi. Aldagaia izan ahal da pildora bat ematen
zaien pertsonen banaketa, edo istripu batean parte hartu duten kotxeen banaketa…
OrainTEMA 3. Distribuciones
bi aldagaiak nola erlazionatzen de
direnfrecuencias bidimensionales
ikasiko dugu. Adibidez, ikasleen pisu eta
ikasleen altueren arteko erlazioa aztertuko dugu.
3.1 Distribuciones bidimensionales de frecuencias
3.2 Distribuciones marginales
3.3 Distribuciones condicionadas. Independencia
Galdera en
distribución. garrantzitsu
guztiak erlazioekin
3.4 Momentos lotuta daude
3.4.1 Momentos ordinarios o respecto al origen
3.4.2 Momentos centrales o respecto a la media
3.5 Covarianza. Coeficiente de correlación
3.6 Efectos de las transformaciones lineales
3.6.1 Variables centradas y tipificadas
3.6.2 Efectos de la combinación lineal deL. eta
Gonick, variables
Smith, W.: La estadística en comic.
Zendrera Zariquiey, Barcelona,1999
3.7 Variables incorrelacionadas
Hona hemen honekin lotuta dauden zenbait galdera garrantzitsu:
-Aurrekusi ahal dugu bizi-esperantza tensio arteriala neurtzen?
-Selektibitatean ateratako notak eta unibertsitatekoak independienteak dira?
2
-Estatistika liburuak irakurtzeak pertsona on bihurtzen zaitu?
Kontingentzia-taula
•Aldagai estatistiko bikoitz baten maiztasun-banaketa: aldagai-
balio bikoitzen multzoa eta dagozkien maiztasunak (absolutuak
eta erlatiboak) ezagutu behar.
Sarrera bikoitzeko taula da (erabiltzen da batez ere behintzat
aldagai bat kualitatiboa denean)
x=ilea/ y=sexya Gizona Emakumea TOTALA X

Gaztainakoa 3 0 3

Ikaslea Sexua Ile kolorea Beltza 1 2 3


1 E Horia
Horia 2 2 4
2 G Gaztainakoa
3 G Horia totala Y 6 4 10
4 G Beltza
5 E Beltza Maiztasun erlatiboekin
6 E Horia
7 G Gaztainakoa x=ilea/ y=sexua Gizona Emakumea TOTALA X
8 G Gaztainakoa Gaztainakoa 0,3 0 0,3
9 G Horia Beltza 0,1 0,2 0,3
E
10 Beltza Horia 0,2 0,2 0,4
totala Y 0,6 0,4 1
3
Bazter-banaketa: aldagai baten balioak soillik
kontsideratuko ditugu, edozein direlarik beste aldagaiak
hartzen dituen balioak. (X,Y) aldagai bikoitz batetik bi
banaketa bakun (X-ena eta Y-rena) eskura ditzakegu.

N
X aldagaiaren
bazter-maiztasun
Y aldagaiaren bazter-maiztasun absolutuak: absolutuak:
• Kontingentzia-taula. Maiztasun erlatiboen terminotan:

5
Banaketa baldintzatuak.
Banaketa baldintzatuak: aldagai baten banaketa beste aldagaiaren balioa
finkatuta dugunean. Hau da, sub-populazioaren banaketa bat da,
Adibidea:

• NOTAZIOA:
X-en banaketa baldintzatua Y-k yj balioa hartzeari:
Y-ren banaketa baldintzatua X-k xi balioa hartzeari:

Interpretazioa ulertzeko banaketa baldintzatuak termino


erlatibotan adierazi behar dira
Adibidez:
https://es.khanacademy.org/math/ap-statistics/analyzing-categorical-
ap/distributions-two-way-tables/v/marginal-distribution-and-conditional-
distribution (Spanish)
https://www.khanacademy.org/math/ap-statistics/analyzing-categorical-
ap/distributions-two-way-tables/v/marginal-distribution-and-conditional-
distribution (English) 6
Banaketa independentzia

Banaketa baldintzatuak independentzia aztertzeko baliogarriak dira (


batez ere aldagai bat kualitatiboa denean

Banaketa baldintzatutak berdinak baldin badira, orduan aldagai


arteko eralaziorik ez dago, beraz banaketa independienteak dira

-Adibidez: Badago erlazioarik ilea eta sexuaren artean?

7
Bi aukera helburuaren arabera: zer
adierazi nahi dugu?
Maiztasun erlatibo baldintzatuta alderdi politikoarekiko

f (x/y=PNV) f(x/y=EH) f (x/y=IU) f (x/y=PP) f(x/y=PSOE) F(x/y=best.))


[18-28) 0,28457588 0,56534669 0,1773557 0,0541953 0,20994043 0,13186078
[28,40) 0,35514432 0,25277821 0,25259003 0,13510113 0,28575727 0,17001339
[40,57) 0,28590402 0,07622476 0,27553034 0,33097842 0,12112642 0,2248996
[57,95) 0,07437577 0,10565034 0,29452393 0,47972515 0,38317588 0,47322624
1 1 1 1 1 1
Alderdi bakoitzako botu emaileen adina
0,6

0,5 Badakigu
0,4
grafiko hau
[18-28) irakurtzen?
0,3 [28,40)
[40,57)

0,2 [57,95)

0,1

0
PNV EH IU PP PSOE 8
Bi aukera helburuaren arabera: zer
adierazi nahi dugu?
PNV EH IU PP PSOE Besterik
f(y/x=[18-28) 0,27 0,31 0,06 0,05 0,30 0,02 1,00
f (y/x=[28,40) 0,31 0,12 0,08 0,11 0,36 0,02 1,00
f(y/x=[40,57) 0,30 0,05 0,11 0,32 0,19 0,03 1,00
f (y/x=[57,95) 0,06 0,05 0,08 0,34 0,43 0,05 1,00

Adinaren arabera botuen banaketa


0,50
0,45
0,40 Badakigu
0,35 grafiko hau
0,30
0,25
“irakurtzen”?
0,20
0,15
0,10
0,05
0,00
f(y/x=[18-28) f (y/x=[28,40) f(y/x=[40,57) f (y/x=[57,95)

PNV EH IU PP PSOE Otros

9
Bi aldagietako grafikoak:
-Aldagai bat behintzat kualitatiboa:
Numer of siblings (fi) by gender
1
0,8 Beti maiztasun erlatiboetan. Bi
0,6
0,4 grafiko mota zer aztertu nahi
0,2
0
dugun arabera
0 1 2 3
Number of siblings (y)

M W

-Aldagai kuantitatiboetan: Puntu-hodeia edo dispertsioa


Irakurketa orduak eta pisua ( Kg)
10
Orduak irakurtzen astean

9
8
7
6
5
4
3
2
1
0
0 10 20 30 40 50 60 70 80
Pisua 10
Ikasleen pisuaren datuak X aldagaikoak dira, eta altuerarenak Y aldagaikoak.
Horrela, (xi , yi ) “i ikasle”-aren pisu eta altuera da.
(xi, yi ) puntuak grafiko batean ipini ahal ditugu, eta grafiko honi puntu-hodeia
_
edo dispertsio grafikoa deitzen diogu. x
100

85

PISUA
70
AMATXU!

55

40
150 165 180 200
Gonick, L. eta Smith, W.: La estadística en comic.
Zendrera Zariquiey, Barcelona,1999 ALTUERA

Puntu batzuk lodiagoak dira, horietan bi ikasleren edo gehiagoren altuera eta
pisu berdinakoak-elkartuta daudelako.
12
13
Korrelazioa
Bi aldagaien arteko erlazioak neurtzeko teknika da

Lan egindako ordu kopurua enpresa tamainaren menpe ote dago?


Alderdi politiko jakinari botoa ematea hauteslearen adinaren menpe ote
dago?

Erlazio lineala neurtzeko, aldagaiak kuantitatiboak izanda:

1
-Kobariantza (δxy)= ∑𝐾𝐾𝑖𝑖=1 ∑𝐿𝐿𝑗𝑗=1(𝑥𝑥𝑖𝑖 − µ𝑖𝑖 )2 (𝑦𝑦𝑗𝑗 − µ𝑗𝑗 )2 𝑛𝑛𝑖𝑖𝑖𝑖
𝑁𝑁

•Kobariantza positiboa: erlazio lineala positiboa edo zuzena aldagaien


artean (oro har, biak gorantz edo beherantz doaz, elkarrekin).

• Kobariantza negatiboa: erlazio lineala negatiboa edo inbertsoa aldagaien


artean (oro har, aldagai bat igotzean, bestea jaitsiko da).
14
• Kobariantza zero: aldagaien artean ez dago erlazio linealik.
𝛿𝛿𝛿𝛿𝛿𝛿
-Korrelazio koefizientea (rxy):(Pearson) 𝑟𝑟𝑥𝑥𝑥𝑥 =
Abantailak::
𝛿𝛿𝑥𝑥 𝛿𝛿𝑦𝑦
Korrelazio-koefizienteak (r) ez ditu unitaterik
r negatiboa bada,
eta bere balioa -1 eta +1 artean kokatuko da: orduan x-k eta y-k
erlazioa negatiboa
r +1etik hurbil kokatuz gero: korrelazio zuzen daukate
edo positibo handia

•r -1etik hurbil kokatuz gero: korrelazio


inbertsoa edo negatibo handia

r=0 , orduan ez dagho erlazio linealik (


inkorrelatuta daude aldagaiak).

Desabantaila:Aldagaien arteko erlazioa


lineala ez bada, orduan r-k ez du ondo
adierazten zer-nolako erlazioa dagoen
Determinazio koefizientea korrelazioaren
Gonick, L. eta Smith, W.: La estadística en comic.
karratua da: r2xy Zendrera Zariquiey, Barcelona,1999
Begiratu grafikoak eta erantzun:
a) Zeinetan dago aldagaien arteko erlaziorik?
b) Zeinetan dago erlazio linealik?
c) Erlazio lineala dagoen grafikoetan aztertu zein motatakoa eta zein
graduetakoa den, eta kasu bakoitzako asmatu zein izan daiteke korrelazio
koefizientea

Iturria:http://www.scielo.org.mx/pdf/relime/v9n3/v9n3a4.pdf 16
Datuak testu-inguru batean aztertu eta azaldu behar dira

17
Korrelazioa eta kausa
Ikertzaileek X eta Y aldagaiak aztertzen dutenean, lotura logiko bat
proposatzen dute haien artean (aldagai independienteak (x) beste
aldagaian (y) eragiten duela suposatzen dute
Determinazio koefizientea r (Perason edo korrelazio koefizientea) ber
bi baino ez da : r2xy
Determinazio koefizientea modu honetan uler daiteke : x aldagaiaren
aldaketak eragiten duen y aldagaiaren aldakortasunaren portzentaia
(%)

Pearson koefizienteak bakarrik neurtzen du erlazioaren gogortasuna,


ez du adierazten zein den erlazioaren kausa

Eta r –k gainera beste aldagaiek eduki ahal duten eragina ere ez du


aztertzen…

18
Korrelazioa ez da zergaitia (kausa)
Irakurketa (l) eta pisuaren (p) arteko
erlazioa aurkitzen badut, ze ondorio
atera ditzaket?
l → p: irakurtzeak lodiarazten du?
p → l: Loditzeak irakurtzearazten du?.
Kilo gehiago loditzean, nekatuago gaude
eta sofan etxanda liburu on bat irakurtzea
nahiago dugu.
l → r → p: Irakurketak lasaitasuna (r
aldagaia) behar du, eta lasaiegi bagaude,
ariketa faltagatik loditzen gara?.
Iturria: t → l Ω p: Lasai eta bakartiak diren
https://commons.wikimedia.org/wiki/File:TEMPERATUR pertsonak (t aldagaia) jarduera lasaiak
ASvsPIRATAS.png eta bakartiak aukeratzen dituzte, eta
beraz, gehiago irakurtzen dute eta
kirola gutxiago egiten dute?

¿edo koentzidentzia bat baino ez da?

Iturria: https://www.analiticaweb.es/correlacion-implica-
causalidad-o-no/
ITURRIA: 19
HTTPS://ES.XKCD.COM/STRIPS/CORRELACION/
20
21
22
23
24
OINARRIZKO BIBLIOGRAFIA
--Barcena, M.J., Fernández, K., Ferreira, E. y Garín, M.A: Estatistika Deskribatzailearen eta
Probabilitatearen baliabideak. UPV-EHU, 2007

-Agirre Basurko, E.: Estatistikaren oinarriak: ariketak. UEU, 2006, http://www.buruxkak.org

-Barandiaran Galdos, M eta Orueta Coria, M.I. : Estatistika deskribatzailea Excel-en bidez. EHUko
euskera errektoreordetzaren sarean argitaratuta.

-Barrenetxea, M; fernandez, K eta Orueta, M:: Estatistika-ariketak. UEU, 1991. www.buruxkak.org

-Fernandez, K.: Estatistika deskribatzailea. UEU, 1993 (2. argitarapena).

-Fernandez Agirre, K.: Estatistirako sarrera, koerlazioa, erregresioa eta datu anizkoitzen
analisia. U.E.U.,1996 www.buruxkak.org

-Fernández, A; Orbe, J. eta Zubia, M.: Estatitika I eta Estatistika II Ariketak. Probabilitate teoría eta
inferentzia estatistikoa. UEU, 1997. www.buruxkak.org
-Fernández, A; Orbe, J. eta Zubia, M.: Estatistikarako sarrera: ariketak UEU, 1997.
www.buruxkak.org
- Fernández, A; Orbe, J. eta Zubia, M.: Estatistikarako sarrera : UEU, 1996. www.buruxkak.org

-Fernandez Agirre, K. : Estatistikaren Hastapenak, Ariketak. Adierazburuak eta Ebazpideak, UEU.


www.buruxkak.org

-Cairo, Alberto: www.thefunctionalart.com

Marrazkiak: Gonick, L. y Samith, W.: La estadística en comic. Zendrera Zariquiey, Barcelona,1999.


25

You might also like