You are on page 1of 10

1

Estadstica bidimensional
20 15 10

0 5 10 15 20

Matemtiques aplicades a les cincies socials 1r de Batxillerat curs 2013-2014

Exemple :

Introducci
En un estudi estadstic sestudien variables estadstiques per a una poblaci en particular. Es possible que quan fem un estudi estadstic moms preguntem per una variable estadstica (edat, color dull, pes,....) per en la majoria dels casos es treballa a ms duna varianble estadstica. En aquest tema en centrarem amb aquest tipus destudis anomenats bidimensionals si estudien dues variables estadstiques. En aquest tema treballarem amb dues variables estadstiques i ens centrarem en organitzar, representar i analitzar les dades obtingudes en un estudi estadstic per poder comprendre millors els resultats i poder predir possibles valors. Per aconseguir aquest proposit sha destudiar les relacions que tindran les diferents variables estadstiques. Ens alguns casos veurem que hi ha relaci entre les variables estudiades i en daltres podrem comprovar que hi ha variables que no tenen cap tipus de relaci.

En la segent taula podrem observar les notes de matemtiques i fsica recullides en una classe de 20 alumnes:

Nombre dalumnes 2 3 3 8 3 1

Notes Matemtiques 4 4 5 6 7 9

Notes Fsica 4 5 4 5 8 10

Podem observar en aquesta taula que per exemple 3 alumnes han tret un 5 en matemtiques i un 4 en fsica. En aquest tema aprendrem a veure si hi ha relaci entre les notes de matemtiques i fsica i per una altra banda a poder fer prediccions sobre possibles notes que poden obtenir els alumnes en fsica si sabem els seus resultats en matemtiques.

Matemtiques aplicades a les cincies socials 1r de Batxillerat curs 2013-2014

Exemple:

Diagramas de dispersi
En aquesta unitat estudiarem experiments estadstiques on sestudien dues variables estadstiques, aquests experiements sanomenen experiements bidimensionals o bivariables. Per representar les dades daquests experiemnts en una taula utilitzarem un tipus de taula anomenades taules de contingncia. Aquests tipus de taules tenen dues entrades da dades, una a la part superior, i una altra a la part esquerre. En el interior es posen les freqncies absolutes, relatives o percentatges de les dues variables a la vegada. s normal afegir al final de cada fila i columna les distribucions marginals que sn les sumes de tots els elements de cada fila o columna, en definitiva sn les frequencies de cadascuna de les dues variables. La suma de la fila o la columna es posa al marge inferior esquerre i s la grandria de la mostra.

A partir de la taula anterior, anem a construir la taula de contingncia:


Nombre dalumnes 2 3 3 8 3 1 Notes Matemtiques 4 4 5 6 7 9 Notes Fsica 4 5 4 5 8 10

La taula associada s :
Y: Notes de fsica 4 4 X: Notes de mates 5 6 7 9 5 11 3 2 3 8 3 1 1 5 3 8 10 5 3 8 3 1 20 3

Matemtiques aplicades a les cincies socials 1r de Batxillerat curs 2013-2014

Apartir daquestes dades podem estudiar la mitjana aritmtica, la varincia i la desviaci tpica de cada variable. Per fer-ho treballarem per separat amb cada variable i les seves corresponents freqncies absolutes que pots obtenir en les distribucions marginals. Exemple: Seguin amb lexemple anterior:
xi 4 5 6 7 9 nxi 5 3 8 3 1 20 xinxi 20 15 48 21 9 113 nxi(xi-x)^2 13,6125 1,2675 0,98 5,4675 11,2225 32,55

Un grfic molt mportant quan treballem amb estadstica bidimensional s el diagrama de dispersi o nvol de punts. s un grfic que dna molta informaci rpidament de la relaci entre les diferents variables dun estudi estadstic. Consisteix en posar en un sistema de coodenades cartesianes, en leix de les abscisses els valors duna variable (x) i en leix de les ordenades els valors de laltra variable. Per ltim posar punts a partir de les dades recullides en les taules. Exemple
Notes Mates / Fsica
10

7,5

x = x =

113 = 5,65 20 32,55 = 1,2757 20

2,5

Fes-ho ara per a la variable Y.

0 2,25 4,5 6,75 9

Matemtiques aplicades a les cincies socials 1r de Batxillerat curs 2013-2014

Segons el grau de dependncia es poden classificar en :

Mesures de correlaci
Quan estudiem dues variables estadstiques ens interessa el tipus de relaci que tenen aquestes variables. Aquestes relacions entre variable ens ajudar a predir la tendncia duna variable a modificar laltre variable i al contrari. Direm que dues variable sn dependents o tenen relaci estadstica quan podem observar en el diagrama de dispersi com els diferents punts segueixen aproximadament un tipus de funci. Si les dades no segeixen cap tipus de funci direm que les variables sn independents. Els tipus de relaci poden ser: directa o positiva si quan una variable augmenta laltra tamb ho fa. inversa o negativa si quan una variable augmenta lalta variable disminueix.

fortament dependents si les dades saproximen molt a la grfica duna funci. feblement dependents si les dades saporximen una mica a la grfica duna funci.

Tipus de relaci entre variables

Relaci lineal directa i forta

Matemtiques aplicades a les cincies socials 1r de Batxillerat curs 2013-2014

Per ltim segons el tipus de funci a la que saproximin les dades la relaci por ser : lineal si les dades saproximen a una linea recta. quadrtica si les dades saproximen a una parbola.

La covarincia s la mitjana dels productes de les desviacions iy . de les variables X i Y respecte le mitjanes aritmtiques x Es simbolitza amb xy i es calcula com : " " " xy = i=1 nxy (xi x ) ( yi y ) n
m

En aquesta unitat noms estudiarem les variable amb dependncia lineal i noms podem predir resultats daquelles variables que tinguin una relaci forta. Per fer-ho no ens fixarem noms en el diagrama de dispersi, ja que no podem tenir un valor numric de la relaci entre variables. Per-ho calcularem la covarincia entre les variables.

amb uns quants clculs podem arribar a la segent frmula equivalent: " " " " xy = i=1 nxy xi yi n
m

x y

Exemple Tornant a lexemple anterior on tenim les variables notes de matemtiques i notes de fsica

La covarincia
4

Y: Notes de fsica 5 3 8 10 5 3 8 3 1 5 11 3 1 8 3 1 20 6

La covarincia s un parmetre estadstic que ens permet saber si la relaci entre dues variables s directa, inversa o nulla. Si la covarincia s positiva, la relaci s directa. Si la covarincia s negativa, la relaci s inversa. Si al covarincia s 0, la relaci s nula.

4 X: Notes de mates 5 6 7 9

2 3

Matemtiques aplicades a les cincies socials 1r de Batxillerat curs 2013-2014

calculant les mitjanes obtenim x = 5,65 i y = 5,45. Llavors la covarincia s : xy = xy = i=1 nxy xi yi n
m

x y =

2 4 4 + 3 4 5 + 3 5 4 + 8 6 5 + 3 7 8 + 1 9 10 5,65 5,45 20

650 30,7925 = 1,7075 20

Com la covarincia s positiva podem deduir que les dues variables estadstiques notes de matemtiques i notes de fsica tenen una relaci directa.

Coeficient de correlaci o de Pearson


El coeficient de correlaci o de Pearson s un parmetre que ens indica si la relaci lineal s forta o feble, s a dir, el grau dintensitat en la relaci lineal entre dues variables. El coeficient de Pearson es representa amb un r i es defineix com :

r=

xy x y

s a dir el coeficient de Pearsn s la covarincia de les dues variables dividit entre el producte de les desviacions tpiques de cada variable.Com els desviacions tpiques sn sempre positives (venen de fer una arrel quadrada de la variancia), llavors el coeficient de Pearson sempre t el mateix signe que la covarincia.
7

Matemtiques aplicades a les cincies socials 1r de Batxillerat curs 2013-2014

Propietats del coeficient de Pearson


El coeficient de Pearson sempre est entre -1 i 1, s a dir : " " " " " 1 r 1

Fent alguns clculs podem calcular la desviaci tpica de les Y: y = 1,6271 Per tant podem calcular la intensitat de la relaci entre les dues variables amb el seu coeficient de pearson : " " " r= xy x y = 1,7075 = 0,8226 1,2757 1,6271

Si r = 1 la relaci s molt forta i directa, realment s una lnia recta creixent . Si r = 1 la relaci s molt forta i inversa, realment s una lnia recta decreixent. Si r t un valor proper a 1, llavors la relaci s directa i bastant forta. Si r t un valor proper a -1 a relaci s inversa i bastant forta. Els diagrames llavors saproximen a una lnia recta creixent i decreixent respectivament. Si r t un valor proper a zero, tant positiu com negatiu, hi haur una relaci feble o molt feble.

Com el coeficent s positiu i proper a 1, podem saber que la relaci s lineal directa i forta. Vegem el diagrama de dispersi per comprovar el resultat obtingut.
10

7,5

Exemple
5

En lexemple de les notes de matemtiques i fsica tenim les segents dades :


2,5

xy = 1,7075 x = 1,2757
0 2,25 4,5 6,75 9

Matemtiques aplicades a les cincies socials 1r de Batxillerat curs 2013-2014

Regressi lineal
Moltes vegades quan fem un estudi estadstic, tenim com objectiu predir valors sobre cadascuna de les variables estadstiques. Aix ser possible quan la relaci entre les variables sigui forta. Essent la predicci ms fiable contra ms forta sigui la relaci entre variables. Lobjectiu de la regressi lineal s determinar com s la relaci funcional entre les dues variables. Per aquest motiu si la relaci lineal s forta aproximarem la relaci funcional per una recta de la forma y=ax+b si volem predir valors de la variable x a partir de valors de la variable x, o x=cy+d si volem predir valors de la variable x a partir dels valors de la variable y. Aquestes dues recte sanomenen rectes de regressi i sn les rectes que millor aproximen a tots els punts del diagrama de dispersi. Segons les necessitats farem servir una recta o laltra.

Com a caracterstica adicional daquestes rectes ambdues pasx, y ), s a dir passen pel punt mitja de la distribucsen pel punt ( ci. Noms podem fer servir les rectes de regressi per predir valor dins del rang de dades. Si agafem dades de fora del nostre rang de dades lerror pot ser molt gran. Noms podem calcular les rectes de regressi quan la relaci lineal s forta, o sigui, el coeficient de Pearson s proper a 1 o -1. Clcul de la recta y = a x + b Aquesta recta de regressi es calcula aix:

yy =

xy
2 x

(x x )

allant daquesta frmula podem veure que

a=

xy
2 x

!!

b=y

xy x
2 x

Clcul de la recta x = cx + b Aquesta recta de regressi es calcula aix:

xx =

xy
2 y

(y y )

allant daquesta formla podem veure que


9

Matemtiques aplicades a les cincies socials 1r de Batxillerat curs 2013-2014

c=

xy
2 y

! !

d=x

xy y
2 y
10

Exemple Utilitzant un altre cop el mateix exemple podem contrur les rectes de regressi a partir de les dades : " " " x = 5,65 " " " y = 5,45 y = 1,6271
2 y = 2,6475"

7,5

x = 1,2757 " "


2 x = 1,6274"

2,5

"

"

xy = 1,7075
0 2,25 4,5 6,75 9

Llavors les dues rectes sn a= xy


2 x

1,7075 = 1,0492" 1,6274


2 x

Si volem saber quina nota de fsica treuen de mitja els alumnes que a mates tenen un 8 agafariem la recta y = 1,0492 x 0,4781 = 1,0492 8 0,4781 = 8,26 Si volgussim saber la nota de treuen a mates els alumnes que a fsica treuen un 6 farem : x = 0,6449y + 2,135 = 0,6449 6 + 2,135 = 6,0044 Si volgussim valvular la nota de fsica duna alumne que treu un 0 a mates, lerror seria molt gran perqu noms tinc informaci dels alumnes que han tret a mates de 4 a 9.

b=y c= xy
2 y

xy x

= 5,45

1,7075 5,65 = 0,4781 1,6274

1,7075 = 0,6449 2,6475


2 y

d=x per tant

xy y

= 5,65

1,7075 5,45 = 2,135 2,6475

y = 1,0492 x 0,4781

x = 0,6449y + 2,135
10

You might also like