You are on page 1of 30

3.

Distribucions bidimensionals
Grau en Psicologia
Universitat de Vic

J.C.Martori
Introducció
 Taula de doble entrada d’una sèrie
bidimensional.
yJ y1 y2 y3 . . . ym
xI
Freqüències
x1 n11 n12 n13 . . . n1m conjuntes
x2 n21 n22 n23 . . . n2m
x3 n31 n32 n33 . . . n3m
. . . . . . . .
. . . . . . . .
. . . . . . . .
xn nn1 nn2 nn3 . . . nnm

 Sèrie: (xi,yj,nij), i=1..r, j=1..s


J.C.Martori
Introducció
 Un exemple: Edat (x) i
pes (y) de 17 persones:

(18,56), (18,59), y 53 54 55 56 57 58 59 nI
(19,53), (19,53), x

(19,55), (19,57), 18 0 0 0 1 0 0 1 2

(19,57), (19,58),
19 2 0 1 0 2 5 0 10
20 3 2 0 0 0 0 0 5
(19,58), (19,58),
nJ 5 2 1 1 2 5 1 N= 17
(19,58), (19,58),
(20,53), (20,53),
(20,53), (20,54),
(20,54)

J.C.Martori
Representació gràfica
 Núvol de punts de l’exemple anterior.
60

58

56
y
54

52

50
17 18 19 20 21
x

J.C.Martori
Distribucions marginals
 Distribució de X independentment dels valors
de Y (i viceversa).
s
ni =  nij
j =1
r
n j =  nij
i =1

 Dues sèries: (xi,ni), i=1..r i (yj,nj), j=1..s.

J.C.Martori
Distribucions marginals
 Edats i pesos:
Xi ni xi ni

18 2 36
19 10 190
20 5 100

N = 17 326

Yj nj Yj nj Yj2 nj

53 5 265 14.045
54 2 108 5.832
55 1 55 3.025
56 1 56 3.136
57 2 114 6.498
58 5 290 16.820
59 1 59 3.481

N = 17 947 52.837

J.C.Martori
Distribucions condicionades
 Imposem una
y 1 2 3 4 nI
x

restricció a una de 5 1 2 0 3 6

les variables i 10
15
2
3
1
2
3
1
2
2
8
8

eliminem els valors


que no la satisfan. nJ 6 5 4 7 N= 22

Y / X=5 nj X / Y>2 ni
1 1 5 3
2 2 10 5
4 3 15 3
N=6 N = 11

J.C.Martori
Independència estadística
 Dependència: Direm que dues variables són
dependents quan el valor d’un depèn del valor de
l’altre. Hi ha una relació entre les dues variables.

Exemples: Pes i talla, renda i consum

 Independència: Direm que dues variables són


independents quan no hi ha cap relació entre elles.

Exemple: Pes i nota de l’examen d’estadística I

J.C.Martori
Independència estadística
 Definició d’independència estadística:
ni n j nij
X , Y són independents  =  i, j
N N N

X 5 7 10 nJ
Y

4 8 16 8 32
5 20 40 20 80
8 8 16 8 32

nI 36 72 36 N= 144

J.C.Martori
Mesures de correlació
 Tipus de correlació: LINEAL

J.C.Martori
Mesures de correlació
 Tipus de correlació: Quadràtica

J.C.Martori
Mesures de correlació
 Tipus de correlació: EXPONENCIAL

J.Ll. Garcia/J.C.Martori
Mesures de correlació lineal
 Establir el grau de correlació lineal
entre les variables:

◼ Covariància (SXY)
◼ Coeficient de correlació lineal de Pearson
(rXY).

J.C.Martori
Mesures de correlació lineal
 Covariància: mesura la relació entre X,Y →
orientació del núvol de punts.

 (x − X )(y )
r s
1
S XY = i j − Y ni j
N i =1 j =1

 O millor:
n m

 x y n
i =1 j =1
i j ij

S XY = − XY
N
J.C.Martori
Mesures de correlació lineal
 Covariància:
És la mitjana aritmètica del producte de les
desviacions de X respecte la seva mitjana, i
les desviacions de Y respecte la seva
mitjana.

n m

 x y n
i =1 j =1
i j ij

S XY = − XY
N
J.C.Martori
Mesures de correlació lineal
 Propietats:
◼ Si Sxy>0 → relació positiva o directa.
◼ Si Sxy<0 → relació negativa o inversa.
◼ Si Sxy=0 → incorrelació=no hi ha relació
lineal entre les variables=X i Y
són estadísticament
independents.

J.C.Martori
Mesures de correlació lineal

Sxy<0 Sxy>0 Sxy=0

J.C.Martori
Mesures de correlació lineal
 Coeficient de correlació de Pearson:
S XY
rXY =
S X  SY
 Propietats:
◼ -1≤ rxy ≤1.
◼ rxy i SXY tenen sempre el mateix signe.

J.C.Martori
Mesures de correlació lineal
 Si rxy=1 → Correlació 7

lineal perfecte positiva.


6
5
4
y
3
2
1
0
0 1 2 3 4 5 6 7

7
6

 Si rxy=-1 → Correlació y
5
4

lineal perfecte negativa.


3
2
1
0
0 1 2 3 4 5 6 7

J.C.Martori
Regressió lineal
 Objectiu: substituir la dependència
estadística per la dependència funcional.
Covariació estadística Covariació funcional

y y

x x

A cada valor de la X li A cada valor de la X li


correspon diferents correspon un únic
valors de la Y valor de la Y

J.C.Martori
Regressió lineal
 Com? Fent passar una corba pel núvol
de punts.
 Recta: ajustament o regressió lineal.
 Paràbola: ajustament o regressió
quadràtic/a.
 Exponencial: ajustament o regressió
quadràtic/a.
 Etc.
Segons el núvol de punts
s’adapti a un tipus determinat
de corba, s’escollirà un
ajustament o un altre.
J.C.Martori
Regressió lineal
 En dependència lineal entre les dues
variables, la funció que busquem és
una recta: la regressió lineal simple.

◼ Els objectius són:

 Explicar el tipus de relació entre les dues


variables.
 Fer prediccions.

J.C.Martori
Regressió lineal
 Mètode dels mínims quadrats:
determinar quina és la recta que passa
més a prop de tots els punts del núvol.

 Si y*=a+bx, i (xi,yj) és un punt del


núvol, notem y*i=a+bxi i minimitzem:

 (y − yi *) nij =  ( y j − (a + bxi ) ) nij


r s r s
2 2
j
i =1 j =1 i =1 i =1

J.C.Martori
Regressió lineal
 La solució és:
S xy
b= 2
a = Y −bX
Sx
 Observacions:
◼ signe(b)=signe(Sxy).
◼ b=pendent de la recta=variació de y en
augmentar x en una unitat.

J.C.Martori
Regressió lineal
 Exemple:
yJ 3 5 6 nI xInI xI2nI xIyJnIJ
xI

1 2 0 0 2 2 2 6
2 4 3 0 7 14 28 24+30
4 0 0 1 1 4 16 24
5 0 3 0 3 15 75 75

nJ 6 6 1 N= 13 35 121 159

yJnJ 18 30 6 54

yJ2nJ 54 150 36 240

 Recta de regressió de Y respecte X:


Y*=2,76+0,52X

J.C.Martori
Bondat de l’ajustament
 Com de semblants són recta i núvol?

 Ho mesurem:
1. Variància residual (Se2).
2. Coeficient de determinació (R2).
J.C.Martori
Bondat de l’ajustament
1. Variància residual (Se2):

És la variància dels errors o residus. Veiem la


concentració del núvol de punts entorn a la
recta de regressió.

 (e )
s r
2

Si eij = yj - yi* ij − e nij


j =1 i =1
Se =
2

J.C.Martori
Bondat de l’ajustament
1. Variància residual (Se2):

 Propietats:

1. Se2 ≥ 0
2. Es compleix que la mitjana dels valors
predits (y*) = mitjana dels valors
observats (y).
3. Es compleix que Sy2=Sy*2+Se2
4. Si Se2=0, l’ajustament és perfecte.
J.C.Martori
Bondat de l’ajustament
2. Coeficient de determinació:
Ens informa el % d’informació que
recull la recta de regressió; la bondat de
l’ajustament de la recta i, per tant la
representativitat d’aquesta.

Així, podem valorar si la predicció


(recta) és fiable.

J.C.Martori
Bondat de l’ajustament
2. Coeficient de determinació:
2
S y*
R =
2
2
·100
Sy

 Propietats:
◼ 0≤R2≤100. Si R2≥75%, bon ajustament.
◼ Si la regressió és lineal: R2=(rxy)2

J.C.Martori

You might also like