You are on page 1of 57

ESTADÍSTICA NO

PARAMÉTRICA
Proporciones
2
Chi-Cuadrado (c )

Mann-Whitney
Kruskal-Wallis
Correlación de Spearman

Tipo de Variables y test a utilizar
Variable Grupos Test
Intervalar 2 - ind dif. Student no pareado
Intervalar 2 - mismos ind. Student pareado
Intervalar 3 ó más grupos ANOVA/Scheffé/...
Dep/Ind Análisis de Reg. / r
Nominal 2 grupos Chi cuadrado
Ordinal 2 grupos Chi cuadrado
Ordinal 2 grupos Mann-Whitney
Ordinal 3 grupos Kruskal-Wallis
Ordinal 2 g /mismos ind Wilcoxon
Ordinal dep/ind Spearman

Tipo de experimento
Dos grupos de Tres o más Antes y Múltiples Asociación
tratamiento grupos después de un tratamientos entre dos
Escala de consistentes de consistentes tratamiento en en los variables
individuos de individuos los mismos mismos
medición diferentes diferentes individuos individuos

Intervalar (y Test t no pareado Análisis de Test t pareado Análisis de Regresión
obtenida de Varianza varianza de linear y
población con medidas correlación de
distribución repetidas Pearson;
normal)* análisis de
Bland-Altman

Nominal Chi-cuadrado de Chi-cuadrado Test de Q de Coeficiente de
tabla de de tabla de McNemar Cochrane contingencia
contingencia contingencia

Ordinal Test de suma de Estadístico de Test del signo Estadístico de Correlación de
rangos de Mann- Kruskal-Wallis de rangos de Friedman rangos de
Whitney Wilcoxon Spearman

Tiempo de Test de Gehan ó
sobrevida Test de rango del
Log

* Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales

Proporción
• Resumen de variables binarias:
– Síntoma: Presente / Ausente
– Tratamiento: Efectivo / Fracaso
• Si r, número de sujetos observados con
la característica, en la muestra n la
proporción será:
– Con la característica p = r / n
– Sin la característica q = 1- p

Intervalo de confianza de una
proporción

se( p)  p(1  p) / n
IC95%  p  1,96  se( p)

0285  0. No confía 30.308  1. 81 dicen que la privacidad se pierde.308(1  0.252 a 0.364 .8% En una clínica dental le preguntan a 263 pctes si confían que sus CD tengan los datos en un PC.2% p  81 / 263  0. el IC 95% es: Si confía 69.96  0.308 se( p)  0.308) / 263  0.0285 IC95%  0.

Tests de proporciones • Si existe diferencia con una proporción conocida • Comparar si existen diferencias significativas entre dos proporciones no pareadas • Comparar si existen diferencias significativas entre dos proporciones pareadas .

valor esperado error estándar de valor observado . o sea: Valor observado . Si existe diferencia con una proporción conocida • Similar a lo visto en test t (comparar con promedio conocido).

a nivel nacional se sabe que el asma se presenta en 15%.2187 .0244 215 0.85 se( p )   0.15 z  1.23 0.18  0. entre 15% y 18%? p  pesp z se( p ) p (1  p ) se( p )  n 0.En una clínica de 215 pctes.23  0. ¿Existen diferencias significativas.15  0. 39 (18%) tienen asma.0244 Tabla de valores z (buscar) :1.

en dos grupos (Lewith y Machin.31 ¿Existen diferencias significativas? .A 25 pctes con osteoartrosis cervical se les dividió. al azar.75 4/13 en el grupo placebo mejoró =0. • 13 recibieron placebo. 9/12 con IR mejoró o desapareció el dolor = 0. 1981): • 12 fueron tratados con estimulación infra roja (IR).

4423 y el Error estándar es 0.se( p1  p2 )  var(p 1 )  var(p 2 ) p1 (1  p1 ) p2 (1  p2 ) se( p1  p2 )   n1 n2 IC95%  p1  p2  1.0.96  0.1789 o sea IC 95%  0.1789 IC95%  p1  p2  1.96  se( p1  p2 ) En el ejemplo : 0.3077  0.3077  0.09 a 0.6923 se( p1  p2 )   12 13 se( p1  p2 )  0.79 Existen dif significativas .7500 .25 0.75  0.

9 5 5 10 2.05 = 11.1 = 5 Crític : c 0.1 ------------------------------------------------------------------------------------- TOTAL 60 60 =13.9 2 5 10 2.5 3 15 10 2.07 Rechazar Ho .5 4 17 10 4.5 6 11 10 0.40 = c Gl = 6 . Chi cuadrado Lado del dado f(0) f(E) (0-E)2/E -------------------------------------------------------------------------------------- 1 7 10 0.

33 ) 2 (34  53.67 43.793 55.33) 2 c2      31.67 44.33 53.793.67 ) 2 ( 63  43. p<0. gl = 1.33 c2= 31.0001 . MEJORA SINTOMAS DEL RESFRIO SI NO VITAMINA C 75 34 25 63 PLACEBO (O  E ) 2 c  2 E ( 75  55.67 ) 2 ( 25  44.

67 Placebo fo =25 fo =63 88 fe =44.33 Total 100 25 197 f columna = 100*88/197 .Cálculo del test – chi-cuadrado Mejoran de los síntomas del resfrío SI NO Total = 100*109/197 Vitamina C fo =75 fo =34 109 fe =55.33 fe =53.67 fe =43.

Cálculo de valores esperados A B C D Ea  ( A  B)( A  C ) /( A  B  C  D) Eb  ( A  B)( B  D) /( A  B  C  D) Ec  ( A  C )(C  D) /( A  B  C  D) Ed  ( B  D)(C  D) /( A  B  C  D) .

67 25 63 88 44.33 53.67 ) 2 ( 25  44.67 44.67 43.33 100 97 197 (O  E ) 2 c  2 E ( 75  55.33 .33) 2 c2      31.33 ) 2 (34  53. Cálculo de valores esperados Si No Total Esperados 75 34 109 55.67 ) 2 ( 63  43.793 55.67 43.33 53.

Chi-Square Table .

49. + (24 .55)2/55 + ..65 gl = (f .05 = 9.1) (c .19)2/19 = 9.. SE RECHAZA HO .1) = 4 Crítico: c2 0.1) (3 . ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTI- CÁLCULO PD Bajo E Moderado E Alto E TOTAL A 49 (55) 30 (26) 21 (19) 100 B 67 (55) 21 (26) 12 (19) 100 C 49 (55) 27 (26) 24 (19) 100 TOTAL165 78 57 300 E = 100 E = 55 165 300 c2 = (49 .1) = (3 .

Chi-Square Table .

Chi . con muestras pequeñas (en una celda existen menos de 5 observaciones). Ant: 3x3 = 9 x 10 = 90 .E|2 .cuadrado (c2) c2 = (O .E)2/E (Chi cuadrado de Pearson) c = (|O . Ej: 2 x 2 = 4 x 10 = 40 Ej. Tamaño de muestra: n de celdas x 10.1/2) / E Corrección de Yates Corrección de Yates: para tablas 2x2.

Áreas bajo la curva .

• Eje X es el valor calculado de Chi-cuadrado de acuerdo a la fórmula. . • Eje Y es el número de veces que se obtiene el valor de chi- cuadrado. Distribución de Chi-Cuadrado • Supongamos que repetimos experimento 1000 veces (el de la Vit C / Placebo). Para cada experimento calculamos el valor de Chi-Cuadrado y ploteamos dichos valores.

ODDS RATIO • Proporciona: – Estimado de la relación entre dos variables binarias (si / no) – Permite examinar los efectos de otras variables en dicha relación – Forma especial y conveniente de interpretación en estudios caso-control .

BMJ 320.• “The odds that a single throw of a die will produce a six are 1 to 5. Bland y Altman. 2000 . The odds ratio. or 1/5”.1468. • “ODDS: es la relación de la probabilidad que el evento de interés ocurra contra la probabilidad de que esto no ocurra”.

29 No 25 (c) 63 (d) .559 Si IC 95% : 3.00 a 10.96  SE (log e OR ) Si No 75 (a) 34 (b) OR = 5. Razón de desigualdad (Odd ratio) a c ad OR   b bc d 1 1 1 1 SE (log e OR )     a b c d IC95%OR  1.

96 SE (ln OR ) . a c ad 75  63 OR     5.559 b bc 34  25 d 1 1 1 1 SE (log e OR )     a b c d 1 1 1 1 SE (log e OR )     75 25 34 63 SE (log e OR )  0.314035 IC95%OR  exp ln OR  1.

559)  1.96  0.3308 a 1.7154 IC  1. exp(1.559 34  25 LN (5.00 .100 exp(2.7154  1.100) IC 95%  10.3140 2.3308 ). 75  63 OR   5.286 a 3.

314 OjO: Debe calcular IC 95% = 1.715 0.000 Total 100.000 0.314 .000 197.000 63.000 0.Cases are weighted by the value of variable N. Frequencies HACE_EJERC$ (rows) by MEJOR_SINT$ (columns) si no Total Si 75.000 Test statistic Value df Prob Pearson Chi-square 31.000 No 25.000 109.000 88.000 34.197 1.000 Coefficient Value Asymptotic Std Error Odds Ratio 5.715 ± 1.793 1.96 * 0.559 Ln(Odds) 1.000 Yates corrected Chi-square 30.000 97.

• <1: personas con factor de riesgo son menos probable que experimenten el evento. • OR = (A/C) / (B/D) • >1: personas con factor de riesgo tienen más probabilidad que presenten el evento. Riesgo Relativo • Relación de frecuencias de dos categorías. . O desigualdad de ser clasificado en la columna 1 en lugar de la columna 2.

15 135 150 Total 25 175 200 Existe asociación entre niños de bajo peso al nacer y edad de la madre? .) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. Ed. 10 40 50 > 20 a. 3ª. Edad Materna y peso al nacer (Fleiss y col.

• Si OR <1: hay una asociación negativa. (presencia del factor disminuye la probabilidad de encontrar el evento. tablas 2x2) (similar a riesgo relativo) • Si OR >1: existe una asociación positiva entre el factor de riesgo y el evento. variables nominales. Odds ratio (es solamente para estudios caso-control. .

= --------------------------------------------. Ed.2 50x150x25x175 .= 2.)2 200(|10x135-40x15| -1/2 200)2 c2 = -----------------------------------------.58 n1.1n. Edad Materna y peso al nacer (Fleiss y col.½ n.. 3ª.) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. 15 135 150 Total 25 175 200 n.n.n2.. (|n11n22 – n12n21| . 10 40 50 > 20 a.

3ª...2 n.½ n.= --------------------------------------------.n. (|n11n22 – n12n21| . n11 n12 n1.58 n1.) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. Total n.n2.)2 200(|10x135-40x15| -1/2 200)2 c2 = -----------------------------------------. n21 n22 n2.2 50x150x25x175 .= 2. n..1n. > 20 a. Ed.1 n. Edad Materna y peso al nacer (Fleiss y col.

050 0.675 0.875 1.75 Total 0.075 0. Ed.00 .125 0. 0. 3ª.200 0. Proporciones (Fleiss y col.25 > 20 a.) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. 0.

3ª. 30 270 300 Total 50 350 400 Existe asociación entre niños de bajo peso al nacer y edad de la madre? . Ed. 20 80 100 > 20 a.) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. Edad Materna y peso al nacer (Fleiss y col.

• Especificidad: proporción de negativos que son correctamente identificados por el test .• Sensibilidad: proporción de positivos que son correctamente identificados por el test.

89 .80 VPP = a / a + b = 45 / 55 = 0.82 VPN = d / c + d = 40 / 45 = 0. Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad de tests para diagnóstico ENFERMEDAD SI NO (a) (b) SI Verdad + Falso + 45 10 TEST (c) (d) NO Falso – Verdad - 5 40 N = 100 Sensibilidad = a / a + c = 45 / 50 = 0.90 Especificidad = d / b + d = 40 / 50 = 0.

90 Especificidad = d / b + d = 72 / 90 = 0. Valores predictivos positivo y negativo para evaluar la seguridad de tests para diagnóstico Tomado de Kramer.33 VPN = d / c + d = 72 / 73 = 0. 1988 ENFERMEDAD SI NO (a) (b) SI Verdad + Falso + 9 18 TEST (c) (d) NO Falso – Verdad - 1 72 N = 100 Sensibilidad = a / a + c = 9 / 10 = 0.80 VPP = a / a + b = 9 / 27 = 0. Comparación de sensibilidad y especificidad vs.99 .

• Valor predictivo positivo (VPP): proporción de pacientes con resultado de test positivo que son correctamente diagnosticados. • Valor predictivo negativo (VPN): proporción de pacientes con resultado de test negativo que son correctamente diagnosticados. .

Tests no paramétricos para dos o más muestras Equivalente a test t pareado: Wilcoxon Equivalente a test t no pareado: Mann-Whitney Equivalente a ANOVA: Kruskal Wallis Utilizar con variables ordinales o cuando variables intervalares no presenten distribución normal .

Test U de Mann-Whitney • Colocar rangos a las observaciones en orden de menor a mayor .

Placebo Rango Droga Rango ------------------------------------------------------------------------ 1000 1 1400 6 1380 5 1600 7 1200 3 1180 2 1220 4 T= 9 19 -------------------------------------------------------------------------- Mann-Whitney U= 3. p = 0. Test de Mann-Whitney Producción de orina diaria mL/día.289 .

Test de Tukey-Duckworth • Cálculos se pueden hacer en la cabeza • Existe solamente un requisito que cumplir: 4 ≤ n1 ≤ n2 ≤ 30 • Ho: Las muestras son idénticas • Ha: Las muestras son diferentes • El test estadístico a calcular es C .

01 = 10 .05 = 7 C0. Test de Tukey-Duckworth • Existen solamente dos valores críticos: C0.

. Determine medición más grande y más pequeña en cada muestra ranqueada. cuente todos los valores que son mayores que la medición más grande en el otro grupo. 2. Test de Tukey-Duckworth Procedimiento 1. En la muestra que contiene el valor más grande de todos los valores combinados.

Sume ambas cantidades (= C). En la otra muestra. 4. .3. cuente todas las mediciones que son más pequeñas que la medición más pequeña del grupo de la primera medición.

05 = 7 Ccalc ≥ C0.Grupo1 Grupo2 80 84 81 89 82 92 83 92 84 92 85 94 Valores de 86 95 exclusión 87 96 89 96 92 96 93 98 94 98 96 99 97 101 98 103 Mayor valor Ccalc = 4 + 3 = 7 C0. Conclusión: las muestras son diferentes .05 por lo tanto se rechaza Ho.

Kruskal-Wallis • Equivalente a Anova • Extensión del test de Mann-Whitney a más de dos grupos • Al conjunto de observaciones (N) se les da rango (1 a N). y para cada grupo se calcula la suma de rangos. y posteriormente se calcula H. indiferente de qué grupo estén. definido por .

y es siempre igual a (N+1)/2. Ri = es la suma de los rangos de ni observaciones. 12 ni ( Ri  R) 2 H N ( N  1) Donde R es el promedio de todos los rangos. Para calcular es más fácil: 2 12 R H N ( N  1)  ni  3( N  1) i .

5) 94 ( 5) -288 (18) 91 ( 6) 100 ( 2) 4 (15) 37 (14) 98 ( 4) -76 (16)  rango 55 36 80 Rango medio 9.33 .00 13. 1986) (Rangos en paréntesis) Relajación y biofeedback Relajación No tratados 62 (11) 69 (10) 50 (12) 74 ( 8.5) 43 (13) -120 (17) 86 ( 7) 100 ( 2) 100 ( 2) 74 ( 8. % de reducción de cefalea en tres grupos (Fentress et al.17 6.

99 Se acepta Ho.69 18 19  6 6 6  Gl = GRUPOS – 1 = 2 Valor crítico: tabla de c = 5. 2 12 R H N ( N  1)  ni  3( N  1) i 12  55 36 80  2 2 2 H      3 19  5. .

No se necesita establecer relación distribución normal de dos variables . 1863 .No se ve tan ordinales (ó afectada por intervalares sin DN) “outliers” .1945 Correlación de Spearman • Medida No Ventajas: Paramétrica para . Sicólogo.

. • Contrapartida no paramétrica de la correlación de Pearson. Correlación de Spearman • Correlación para variables ordinales • Para determinar la significancia de la asociación de dos variables continuas en que no existe normalidad de las variables.

6 ( xi  yi ) 2 rs  1  n(n  1) 2 6 d 2 rs  1  n n 3 (n: número de pares de obs.) (d= dif de rangos) .

de rangos: -2 0 2 -3 3 -3 1 2 0 0 (x – y) d2 = 4 0 4 9 9 9 1 4 0 0  d2 = 40 rs = 1 – [ 6(40) / 10(102 – 1)] = 0.757 . lado der e izq. Existe relación ? Derecha (x) 83 97 91 72 76 88 95 89 75 74 Rango 5 10 8 1 4 6 9 7 3 2 ----------------------------------------- Izquierda(y) 87 98 84 82 74 92 91 83 80 77 Rango 7 10 6 4 1 9 8 5 3 2 ----------------------------------------- Dif. Grado de reabsorción ósea en mandíbula.

Diferentes escalas. diferentes medidas de su asociación Escala de ambas Medida de variables asociación Nominal Chi-Square de Pearson: χ2 Ordinal rho de Spearman Intervalar r de Pearson .

RL. x ± ds – Inferencia estadística: test t. Resumen • Método de investigación – Protocolo – Artículo científico • Bioestadística – Estadística descriptiva: n. ANOVA. %. c2 . ARS.