You are on page 1of 50

Tema 5.

VARIABLES QUANTITATIVES

BIOESTADÍSTICA
Grau de nutrició humana i dietètica
Universitat Rovira i Virgili

Meritxell Pallejà
meritxell.palleja@urv.cat
Variables quantitatives
 Recordem:
QUANTITATIVES
Poden prendre un número infinit de valors.
Són quantitats numèriques

Discreta Contínua

Les respostes presenten Pot prendre qualsevol valor


interrupcions en l’escala en un interval específic.
numèrica.
Exemple: numero de cigarrets Exemples: alçada, pes
Estimació d’una mitjana

 Exemples de paràmetres de les variables contínues:


Mitjana, desviació típica, mediana,..
 Per estimar el valor de la mitjana, calculem:
𝑛
𝑖=1 𝑥𝑖
𝑥=
𝑛
Distribució Normal o Gaussiana
 La funció de densitat es diu que té forma de
“campana de Gauss”
 Altres distribucions es poden aproximar a una
Normal en certes condicions
 Paràmetres que defineixen una distribució Normal:
 Mitjana (𝜇)
 Variància (𝜎 2 )
 És simètrica
 f(x), la funció de densitat, tendeix a 0 en els
extrems. (−∞ i +∞)
Recordatori: Passos per realitzar un
contrast d’hipòtesis
1. Determinar què volem saber.
Voldrem contrastar certes condicions sobre els valors que prenen les
mitjanes
2. Determinar una Hipòtesis Nul·la i una Hipòtesis
Alternativa.
Igualtat / més gran o més petita que..
Comparar dues poblacions / comparar respecte un valor concret
3. Establir un estadístic de prova.
z, t

4. Construir les zones d’acceptació i rebuig de les


hipòtesis.
5. Calcular el valor “p”.
6. Decidir si es rebutja o no la Hipòtesis Nul·la.
Tests paramètrics i no paramètrics
 Tests paramètrics: Assumeixen que les distribucions de
les dades són normals. Per tant, s’han de complir unes
condicions estàndards perquè els resultats siguin
fiables.
 Tests NO paramètrics: No hi ha cap assumpció sobre la
distribució de les dades. Per tant, es poden aplicar en
qualsevol cas.

Els tests paramètrics tenen més potència estadística que


els no paramètrics. És a dir, un test paramètric té més
capacitat per concloure un rebuig de 𝐻0 .
Tests paramètrics i no paramètrics
 Com sabem si les dades són normals?
 Realitzem un contrast de normalitat
 Veiem que la seva distribució té forma de campana de
Gauss
 Si la mostra és gran (n≥30), podrem suposar que
segueix una distribució normal pel Teorema Central del
límit
Esquema, quin test utilitzar?

Normalitat?

Paramètrics
Tipus de
tests No
paramètrics
Número de grups a contrastar
 Comparar la mitjana d’un grup amb un valor. Tipus
d’hipòtesis:
𝐻0 : 𝜇 = 𝑘
on 𝑘 ∈ −∞, ∞
𝐻1 : 𝜇 ≠ 𝑘
𝑜 𝑏é <, >
Exemple:
Volem contrastar si la mitjana d’edat de tots els estudiants
de la URV és 21 o no. Plantegem les hipòtesis:

𝐻0 : 𝜇 = 21
𝐻1 : 𝜇 ≠ 21
Número de grups a contrastar
 Comparar les mitjanes entre dos grups. Tipus d’hipòtesis:
𝐻0 : 𝜇1 = 𝜇2
on 𝜇1 i 𝜇2 són les mitjanes del grup 1 i 2
𝐻1 : 𝜇1 ≠ 𝜇2
𝑜 𝑏é <, >
Exemple:
Volem contrastar si la mitjana d’edat entre els nois i les noies
que estudien a la URV és igual. Plantegem les hipòtesis:

𝐻0 : 𝜇𝑛𝑜𝑖𝑠 = 𝜇𝑛𝑜𝑖𝑒𝑠
𝐻1 : 𝜇𝑛𝑜𝑖𝑠 ≠ 𝜇𝑛𝑜𝑖𝑒𝑠
Esquema, quin test utilitzar?

Normalitat i Número de
igualtat de grups
variàncies?

1 grup
Paramètrics
Tipus de 2 grups
tests
No 2 grups
paramètrics
Dades aparellades o independents?
 Dades aparellades: Cada observació d’un grup
esta relacionada amb una altra observació de
l’altre grup. És a dir, hi ha parelles de valors
relacionats.

Tres situacions diferents de dades aparellades:


 Mesures repetides sobre un mateix individu però en
diferents temps.
 Individus semblants per naturalesa (bessons, ..)
 Emparellament artificial, es busca que per cada
individu d’un grup n’hi hagi un de semblant de l’altre
grup.
Dades aparellades
 En el disseny de mesures repetides no es valora la
variabilitat entre individus, sinó dins del mateix
individu.
 La variabilitat entre individus és més gran que entre

un sol individu
Exemple:
Es mesura el grau de concentració en un grup de 25
estudiants abans i mitja hora després de beure una
cervesa.
Esquema, quin test utilitzar?

Normalitat i Número de
igualtat de grups Dependència? TEST
variàncies?

1 grup - T d’Student

Paramètrics
Independents T d’Student
2 grups
T d’Student per
Tipus de tests Aparellades a dades
aparellades

Independents U Mann-
Whitney
No paramètrics 2 grups
Aparellades Wilcoxon
Tests paramètrics
Normalitat? Número de Dependència? TEST
grups

1 grup - T d’Student

Paramètrics
Independents T d’Student
2 grups
T d’Student per
Tipus de tests Aparellades a dades
aparellades

Independents U Mann-
Whitney
No paramètrics 2 grups
Aparellades Wilcoxon
Comparar una mitjana amb
un valor de referència

Normalitat? Número de Dependència? TEST


grups

1 grup - T d’Student

Paramètrics
Independents T d’Student
2 grups
Aparellades T d’Student
Comparar una mitjana amb
un valor de referència
Exemple:
Volem contrastar si la mitjana d’edat de tots els
estudiants de nutrició de la URV és 21 o no. Sabem
que l’edat segueix una distribució normal. Plantegem
les hipòtesis:
𝜇→ mitjana poblacional
𝐻0 : 𝜇 = 21 𝑥 → mitjana mostral
𝐻1 : 𝜇 ≠ 21
Seleccionem una mostra de 25 alumnes seleccionada
de forma aleatòria. I observem que la mitjana d’edat
de la mostra és 22’5, amb una desviació típica de
2’7.
Comparar una mitjana amb
un valor de referència
 Dades que tenim:
n= 25 Calculem la 𝑡:
𝑥= 22’5 𝑥−𝜇
𝑡=
𝜇= 21 𝑠 √𝑛
𝑠 = 2’7
22,5−21 1,5
𝑡= = = 2,778
2,7 √25 0,54

𝑡 té 𝑛 − 1 graus de llibertat, ho expressem: 𝑡𝑛−1,𝛼/2


Per 𝛼 = 0.05 observem en la taula: 𝑡25−1,0.05/2 = 2,064
Comparar una mitjana amb
un valor de referència
𝑡 = 2,778 / 𝑡25−1,0.05/2 = 2,064
 CONCLUSIONS:

 Regió d’acceptació:
2,78
RA

-2,06 2,06
 P-valor (indica la probabilitat d'obtenir un valor igual o més extrem
que l'observat, suposant que sigui veritat la hipòtesi nul·la):
P-valor= 2 × 𝑃 𝑡 > 2,78 ≅ 2 × 0,004 = 0,008
0,008<0,05 Taula

Rebutgem 𝐻0 amb un nivell de confiança del 5%.


Comparar dos mitjanes independents

Normalitat? Número de Dependència? TEST


grups

1 grup - T d’Student

Paramètrics
Independents T d’Student
2 grups
Aparellades T d’Student
Comparar dos mitjanes independents
Exemple:
Es compara l’efecte de dues dietes per saber si la
pèrdua de pes és diferent segons si es segueix una
dieta o bé l’altra. La dieta 1 la feien 20 persones i la
dieta 2, 15 persones. Sabem que la mitjana de kg
perduts amb la dieta 1 és de 7,8 i en la dieta 2 de
10,1. I unes variàncies de 3,1 i 2,9, respectivament.
Els kg perduts segueixen una distribució normal.
1. Plantegem les hipòtesis:
𝐻0 : 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
Comparar dos mitjanes independents

2. Escollir quin test hem d’utilitzar. Normalitat?


Independència?
Si, si

3. Variàncies iguals entre els dos grups?


F-Snedecor:
𝑠𝑚𝑎𝑥 2
𝐹𝑛1−1,𝑛2−1 =
𝑠𝑚𝑖𝑛 2
Quan més gran sigui F, més desiguals són les variàncies.
Si no hi ha igualtat, s’hauria d’utilitzar el test de Welch.
Comparar dos mitjanes independents

4. Estimació de la variància conjunta (o ponderada, pels


graus de llibertat):
2 2
𝑛 1 − 1 × 𝑠1 + 𝑛 2 − 1 × 𝑠2
𝑠𝑝2 =
𝑛1 − 1 + (𝑛2 − 1)

On 𝑠12 i 𝑠22 són les variàncies de cada grup.

En l’exemple,

20−1 ×3,1+ 15−1 ×2,9


𝑠𝑝2 = =3,015
20−1 +(15−1)
Comparar dos mitjanes independents

5. Calcular el valor de la t d’Student.

𝑥1 − 𝑥2
𝑡𝑛1+𝑛2−2 ~𝑡 =
1 1
𝑠𝑝 + Error Estàndard
𝑛1 𝑛2 de la diferència
de mitjanes
(EEDM)

En l’exemple,
7,8 − 10,1 −2,3
𝑡20+15−2 = = = −3,9
1 1 0,59
3,015 +
20 15
Busquem el valor de la taula per a 𝑡33,𝛼/2 = 2,035
Comparar dos mitjanes independents

𝑡 = −3,9 / 𝑡33,0.05/2 = 2,035


 CONCLUSIONS:

 Regió d’acceptació: -3,9


RA

-2,035 2,035
 P-valor (indica la probabilitat d'obtenir un valor igual o més extrem
que l'observat, suposant que sigui veritat la hipòtesi nul·la):
P-valor= 2 × 𝑃 𝑡 > 3,9 ≅ 2 × 0,003 = 0,006
0,006<0,05 Taula

Rebutgem 𝐻0 amb un nivell de confiança del 5%. Hi


ha diferències significatives entre una dieta i l’altra.
Comparar dos mitjanes aparellades

Normalitat? Número de Dependència? TEST


grups

1 grup - T d’Student

Paramètrics
Independents T d’Student
2 grups
Aparellades T d’Student
Comparar dos mitjanes aparellades

Exemple:
Volem saber si una dieta pobra en sal redueix la tensió
arterial (sistòlica), per això es selecciona un grup de 90
pacients hipertensos i es mesura la tensió arterial abans
de començar la dieta i 2 mesos més tard. Inicialment
s’obté una TAM (tensió arterial mitjana) de 110,5 i 2
mesos més tard és de 107,58. La desv. típica de la
diferència és 9,02.
Comparar dos mitjanes aparellades

1. Plantegem les hipòtesis:


𝐻0 : 𝜇𝑎𝑏𝑎𝑛𝑠 = 𝜇𝑑𝑒𝑠𝑝𝑟é𝑠
𝐻1 : 𝜇𝑎𝑏𝑎𝑛𝑠 ≠ 𝜇𝑑𝑒𝑠𝑝𝑟é𝑠
Equivalent a:
𝐻0 : 𝜇𝑑𝑒𝑠𝑝𝑟é𝑠 − 𝜇𝑎𝑏𝑎𝑛𝑠 = 0
𝐻1 : 𝜇𝑑𝑒𝑠𝑝𝑟é𝑠 − 𝜇𝑎𝑏𝑎𝑛𝑠 ≠ 0

La diferència de dues mitjanes és la mitjana de la


diferència. I així podem seguir els passos que fèiem
per comparar una mitjana amb un valor (en aquest
cas, 0)
Comparar dos mitjanes aparellades

2. Escollir quin test hem d’utilitzar. Normalitat?


SI
Independència?
NO

Recordatori:
 Dades aparellades: Cada observació d’un grup esta

relacionada amb una altra observació de l’altre grup.


És a dir, hi ha parelles de valors relacionats.
Comparar dos mitjanes aparellades

3. Calculem el valor de la t d’Student:


𝑥 − 𝜇 𝑥𝑑𝑖𝑓 − 0
𝑡𝑛−1,𝛼/2 ~𝑡 = =
𝑠 √𝑛 𝑠𝑑𝑖𝑓 / 𝑛

En l’exemple,
𝑥𝑎𝑏𝑎𝑛𝑠 = 110,5
𝑥𝑑𝑖𝑓 = −2,92
𝑥𝑑𝑒𝑠𝑝𝑟é𝑠 = 107,58
𝑠𝑑𝑖𝑓 = 9,02
−2,92−0
𝑡90−1,0.05/2 ~𝑡 = =-3,07
9,02/ 90
𝑡90−1,0.05/2 = 𝑡89,0.025 = 1,9870
Comparar dos mitjanes aparellades

𝑡 = −0,34 / 𝑡89,0.05/2 = 1,987


 CONCLUSIONS:
 Regió d’acceptació: -3,07
RA

-1,987 1,987

 P-valor (indica la probabilitat d'obtenir un valor igual o més extrem


que l'observat, suposant que sigui veritat la hipòtesi nul·la):
P-valor= 2 × 𝑃 𝑡 > 3,07 ≅ 2 × 0,002 = 0,004
0,004<0,05 Taula

Rrebutgem 𝐻0 , hi ha diferències significatives.


Tests no paramètrics
Tests paramètrics i no paramètrics
 Tests paramètrics: Assumeixen que les distribucions de
les dades són normals. Per tant, s’han de complir unes
condicions estàndards perquè els resultats siguin
fiables.
 Tests NO paramètrics: No hi ha cap assumpció sobre la
distribució de les dades. Per tant, es poden aplicar en
qualsevol cas.

Els tests paramètrics tenen més potència estadística que


els no paramètrics. És a dir, un test paramètric té més
capacitat per concloure un rebuig de 𝐻0 .
Normalitat? Número de Dependència? TEST
grups

1 grup - T d’Student

Paramètrics
Independents T d’Student
2 grups

Tipus de tests Aparellades T d’Student

Independents U Mann-
Whitney
No 2 grups
paramètrics
Aparellades Wilcoxon
NO Número de Dependència? TEST
Normalitat grups

Independents U Mann-
Whitney
No 2 grups
paramètrics
Aparellades Wilcoxon
Test de U Mann-Whitney
 També se li pot dir:
Test de U Mann-Whitney-Wilcoxon

 El que contrastem ara són distribucions i no mitjanes:

𝐻0 : La distribució dels valors dels dos grups és la mateixa


𝐻1 : Els valors de un grup són superiors als de l′atre grup

És a dir:
𝐻0 : Distribucions iguals
𝐻1 : Distribucions diferents
Test de U Mann-Whitney

 Consisteix en realitzar 𝑛1 × 𝑛2 comparacions, tots


els valors d’un grup es comparen amb els de l’altre
grup i es compta el número de vegades que els
d’un grup són superiors als de l’altre grup.
On 𝑛1 i 𝑛2 és la mida de la mostra per cada grup.

 L’estadístic de contrast és 𝑈 i es troba


comptabilitzant el número de vegades que un grup
té valors superiors a l’altre.
Test de U Mann-Whitney
Exemple
Es compara l’efecte de dues dietes
per saber si la pèrdua de pes és
diferent segons si es segueix una
dieta o bé l’altra.
Les dades són les següents:
𝑛1 = 14 i 𝑛2 = 10
Test de U Mann-Whitney
Passos a seguir:
1. Ordenar de menor a major la variable a comparar
2. Crear una nova variable que indiqui per a cada
individu quants cops és més gran que els individus de
l’altre grup
3. Comptabilitzar els empats
4. Sumar quants cops el grup 1 és superior al grup 2 i a
la inversa. I equiparar els empats. Això és 𝑈1 i 𝑈2
5. Calcular el valor de z per a l’estadístic U
6. Conclusions
Test de U Mann-Whitney
En l’exemple:
1. Ordenar de menor a major la
variable a comparar:
Test de U Mann-Whitney
2. Crear una nova
variable que indiqui
per a cada individu
quants cops és més
gran que els individus
de l’altre grup

3. Comptabilitzar els
empats
Test de U Mann-Whitney
4. Sumar quants cops el grup 1 és superior al grup 2 i
a la inversa.
I equiparar els empats.
Tenim 2 empats per tant,
en repartim un a cada U.
𝑈1 = 85 + 1 = 86
𝑈2 = 53 + 1 = 54
Fixem-nos:
𝑛1 × 𝑛2 = 14 × 10 = 140
𝑈1 + 𝑈2 = 86+54=140
Test de U Mann-Whitney
5. Calcular el valor de z per a l’estadístic U.
Si n>20 podem aproximar a una normal

𝑈𝑚𝑖𝑛 − 𝑛1×𝑛
2
2
𝑧=
𝑛1 × 𝑛2 ×(𝑛1 +𝑛2 +1)
12

En l’exemple, calculem z en 𝑈2 ja que és el més petit.


54 − 14×10
2 −16
𝑧= = = −0,94
14×10×(14+10+1) 17,08
12
Test de U Mann-Whitney
6. Conclusions
 Regió d’acceptació:
z=-0,94 -0,94
𝑧𝛼/2 = 𝑧0.025 = 1,96
 P-valor: -1,96 1,96
Busquem a la taula 0.94, el valor de l’àrea és 0.1736,
però estem considerant bilateral. Per tant el P-valor és
2*0,1736=0,347>0,05

No podem rebutjar 𝐻0 . No podem assegurar que hi


hagi diferències entre les dues distribucions.
Test de U Mann-Whitney
Interpretació de U
𝑈2 = 54
 El total de comparacions possibles són:
𝑛1 × 𝑛2 = 14 × 10 = 140

 Si calculem, 54/140=0,39
 Interpretem que el 39% de les vegades els que han
fet la dieta 2 han perdut més pes que els de la dieta
1.
NO Número de Dependència? TEST
Normalitat grups

Independents U Mann-
Whitney
No 2 grups
paramètrics
Aparellades Wilcoxon
Test de Wilcoxon per a dades
aparellades
1. Igual que en el test de la T d’Student per a dades
aparellades, calculem la diferència:
𝑑𝑖 = 𝑥1𝑖 − 𝑥2𝑖
2. Ordenem la nova variable creada, amb valor absolut, de
menor a major. |𝑑𝑖 |
3. Considerem les diferències amb el signe (positiu o negatiu)
que té menor freqüència i no considerem els valors iguals a 0,
a partir d’això calculem la suma de T, on:
𝑖 Si els signes positius són més
𝑑𝑖 >0
𝑇=
𝑖 Si els signes negatius són més
𝑑𝑖 <0
Test de Wilcoxon per a dades
aparellades
4. De la mateixa manera calcularíem T’, sumant les
observacions amb signe amb major freqüència.
5. Si T o T’ és inferior o igual a les quantitats que
apareixen a la taula de Wilcoxon es rebutja la
hipòtesis nul·la del contrast.

𝐻0 : No hi ha diferències entre les obs aparellades


𝐻1 : Hi ha diferències
Exemple
 Es vol saber si hi ha diferencies entre el pes de la
gent que consumeix a una cadena de menjars
ràpids més de 5 vegades a la setmana. Suposem
que les dades segueixen una distribució normal i
que les variàncies són iguals estadísticament.
La mitjana de pes per al grup de consumidors és de
90,69 i per al grup de no consumidors és de 89,47.
Les variàncies respectivament són: 32,14 i 54,53. En
el grup de consumidors tenim 40 individus i en el de
no consumidors en tenim 35.

You might also like