You are on page 1of 21

Bioestadística MH

“Distribución
Ji-Cuadrado”

Tatiana Burga Ghersi Wilber Rodríguez L


Variables cualitativas (y también v.a. discretas o
continuas agrupadas en intervalo).
Tres usos de esta distribución:

-Test de Ajuste de distribuciones:


Es un contraste de significación para saber si los
datos de una muestra son conformes a una ley de
distribución teórica que sospechamos que es la
correcta.

-Test de homogeneidad de varias muestras


cualitativas:
Sirve para contrastar la igualdad de procedencia de un
conjunto de muestras de tipo cualitativo.

-Test para tablas de contingencia:


Es un contraste para determinar la dependencia o
independencia de caracteres cualitativos
una regla más flexible y que no sacrifica demasiada precisión
2. Para ninguna clase ocurre que

2. para casi todos los , salvo a lo sumo un


de ellos.
Como sólo son los valores grandes de los que nos llevan a
rechazar H0, la región crítica es:

Figura: Región crítica (sombreada) para un contraste con el estadístico .


EJEMPLO:
En un grupo de n=70 varones, se ha calculado su peso y se han
observado las siguientes cantidades:

¿Se ajustan estos datos a una distribución normal?

Peso M. clase Frecuencias


55 - 60 57,5 5
60 - 65 62,5 10
65 - 70 67,5 15
70 - 75 72,5 17
75 - 80 77,5 12
80 - 85 82,5 8
85 - 95 90 3
Figura: Histograma de frecuencias absolutas y función de
densidad gaussiana (cambiada de escala) más próxima al
mismo, en el sentido de que sus parámetros han sido
calculados a partir del histograma.
En primer lugar, vamos a unir el último intervalo con el
primero, para asegurarnos de que cada intervalo contenga
por lo menos 5 observaciones:

Peso M. clase Frecuencias


55 - 60 57,5 5
60 - 65 62,5 10
65 - 70 67,5 15
70 - 75 72,5 17
75 - 80 77,5 12
80 - 95 87,5 11

n=70

1.- Planteamiento de hipótesis


H0: fo = fe →Las fo provienen de uma distribución Normal
H1: fo ≠ fe → Las fo no provienen de uma distribución Normal

2.- Nivel de significancia: α= 0.05


3.- Regla de decisión
Grados de Libertad = k – m – 1= 6-2-1= 3

Donde:
k = Número de clases
m = Número de parámetros estimados

7.81
4.- Estadístico de Prueba

Encontramos los valores observados y los valores esperados de suponer


cierta H0:

Peso

ai - bi ni
- 60 5 5,761 4,3395
60 - 65 10 8,729 11,456
65 - 70 15 13,874 16,2174
70 - 75 17 15,687 18,4229
75 - 80 12 13,062 11,0243
80 - 11 12,887 9,3893
n
n=70 70,849
=70
5.- Comparación del valor experimental con tabular

entonces , luego no se puede rechazar a la vista


de los datos, el que estos provengan de una población normal.

6.- Decisión
Existe suficiente evidencia estadística para aceptar que
los datos sobre el peso de los pacientes provienen de una
distribución normal
La prueba   en el contraste de
independencia de variables
aleatorias cualitativas
Si dos variables cualitativas están o no asociadas,
viendo si son dependientes o no.
Utilizaremos las tablas de Contingencia

Para lo que utilizaremos el estadístico de prueba:

r k (O − Eij )
2

χ 2 = ∑∑
ij

i =1 j =1 Eij

Es así un test no dirigido (test de planteamiento bilateral), que nos


indica si existe o no relación entre dos factores pero no en qué
sentido se produce tal asociación
Tabla 3. Tabla de contingencia para estudiar la asociación entre
fumar durante la gestación y el bajo peso del niño al nacer.
Valores observados y valores esperados (entre paréntesis) si los
factores fuesen independientes.

Recién nacido de bajo peso

Gestante Sí No Total

Fumadora 43 (18.5) 207 (231.5) 250

No fumadora 105 (129.5) 1645 (1620.5) 1750

Total 148 1852 2000

1.- Planteamiento de hipótesis


H0: No hay asociación entre las variables
(El bajo peso del niño y el hecho de fumar durante
la gestación son independientes, no están asociados)

H1: Si existe asociación entre las variables.


(El bajo peso del niño y el hecho de fumar durante
la gestación están asociados)

2.- Nivel de significancia: α= 0.05


3.- Regla de decisión
Grados de Libertad =(Filas-1)x(Columnas-1)
= (2-1)X(2-1) = 1

3.84
4.- Estadístico de Prueba : Frecuencias marginales

E11 =
( a + b) × ( a + c) 148 × 250
E11 = = 18,5
n 2000

E12 =
( a + b) × ( b + d ) E12 =
1852 × 250
= 231,5
n 2000

E21 =
( c + d ) × ( a + c) E21 =
148 × 1750
= 129,5
n 2000

E22 =
( c + d ) × (b + d ) E22 =
1852 × 1750
= 1620,5
2000
n

χ 2
=
( 43 − 18,5)
2
+
( 207 − 231,5)
2
+
( 105 − 129,5)
2
+
( 1645 − 1620,5)
2
= 40,04
18,5 231,5 129,5 1620,5
5.- Comparación del valor experimental con tabular

entonces , luego se puede rechazar la hipótesis


nula.

6.- Decisión
Existe suficiente evidencia estadística para rechazar que
el bajo peso del niño y el hecho de fumar durante la
gestación están asociados
La prueba   en el contraste de
homogeneidad de variables
aleatorias cualitativas
Dos variables cualitativas para comparar sus
proporciones.Utilizaremos las tablas de
Contingencia

Para lo que utilizaremos el estadístico de prueba:

r k (O − Eij )
2

χ 2 = ∑∑
ij
=
i =1 j =1 Eij
Ejemplo
Se desea saber si la distribución de los grupos sanguíneos es
similar en individuos de dos poblaciones.

Frec A B AB O
Observ
Muestra 1 90 80 110 20
Muestra 2 200 180 240 30

¿Qué conclusiones pueden obtenerse de estos datos si se usa


un nivel de significación del 5%

1.- Planteamiento de hipótesis

H0: La variable se distribuye igualmente en ambas


poblaciones

H1: La variable no se distribuye en forma homogenea em


ambas poblaciones

2.- Nivel de significancia: α= 0.05


3.- Regla de decisión
Grados de Libertad = (Filas-1) x (Columnas-1)
= (2-1)(4-1)= 1x3= 3

7.81
4.- Estadístico de Prueba: Frecuencias Marginales

A B AB O TOTAL

M1 90 91.58 80 82.11 110 110.53 20 15.79 300

M2 200 198.42 180 177.9 240 239.47 30 34.21 650

290 290.00 260 260.00 350 350.00 50 50.00 950

r k (O − Eij )
2

χ 2 = ∑∑
ij
= 1.76
i =1 j =1 Eij
5.- Comparación del valor experimental con tabular

entonces , luego no se puede rechazar la


hipótesis nula.

6.- Decisión
Existe suficiente evidencia estadística para no rechazar
que exista una distribución homogénea del grupo sanguíneo
en ambas poblaciones.
• GRACIAS

You might also like