Professional Documents
Culture Documents
net/publication/275021061
Estadística analítica
CITATIONS READS
0 13,948
3 authors, including:
Pedro Romero-Aroca
Hospital Universitari Sant Joan de Reus
149 PUBLICATIONS 2,241 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Pedro Romero-Aroca on 03 August 2015.
ESTADÍSTICA ANALÍTICA
Julio José Gonzalez López, Carlos Lázaro García, Pedro Romero Aroca
«Aunque es fácil mentir con estadísticas, es mucho más fácil mentir sin ellas»
Frederick Mosteller
ficación estadística de la interpretación que nosotros esa distribucion o el tamaño muestral es pequeño (en
hacemos de dichos resultados (ver capítulo 22). La general, menos de 30), debemos utilizar pruebas no
significación estadística lo que nos indica es cuan paramétricas.
separados están nuestros resultados con los que ob- Combinando estos factores, los principales test
tendríamos si fueran debidos solo al azar. En el ca- que podemos utilizar son los que se muestran en las
pítulo 24 se exponen algunos errores comunes en el tablas I y II. La primera muestra la prueba de elección
manejo de la significación estadística. según los factores anteriormente referidos y la tabla II
De manera arbitraria se determina que un resul- muestra alternativas si no pueden realizarse pruebas
tado es estadísticamente significativo cuando existe paramétricas.
un 95% de probabilidades de que el resultado ob-
tenido NO sea debido al azar (p<0,05). Dicho de
otra forma, solo tenemos un 5% de probabilidades Ejemplo 23.1
de cometer un error tipo alfa. Si deseamos estar aún
más seguros, podemos elevar el nivel de significación eseamos comprobar si un nuevo AINE
D
hasta un 99% (p<0,01). Debemos destacar que la sig- es más eficaz en el tratamiento del ede-
nificación estadística depende de dos factores: la di- ma macular postquirúrgico que el que
ferencia que estamos intentando probar (cuanto ma- solíamos utilizar habitualmente. Como
yor sea, más fácil es probarla) y el tamaño muestral variable de respuesta tomamos la agude-
(más fácil detectar diferencias cuanto mayor tamaño za visual. (cuantitativa) y comparamos
muestral tengamos). dos grupos de tratamiento, uno con cada
fármaco, (variable cuantitativa dicotó-
mica, es decir, de dos categorías). Con-
b) Elección de la prueba estadística sultando la tabla I, vemos que la prueba
que debemos utilizar es la t de Student.
Una de las causas más frecuentes de duda del in- Si nuestra muestra es pequeña o no sigue
vestigador con poca experiencia es la elección del una distribución normal (veremos más
test estadístico en los contrastes de hipótesis, pero tarde como se comprueba eso) debería-
en la inmensa mayoría de los casos es sencillo. Esta mos utilizar una prueba no paramétrica,
elección depende de: que consultando la Tabla II es la U de
1. Tipos de variables: cuantitativas (y si son dos Mann-Whitney. Si existen más de dos
grupos o más de dos grupos de comparación) y cua- grupos de comparación (en el caso en
litativas (y dentro de estas últimas si son nominales u que comparemos tres o más tipos de AI-
ordinales, ver capítulo 8). NES) la prueba sería la ANOVA o un test
2. Si los datos son apareados o independien- no paramétrico en muestras pequeñas
tes. Son datos apareados los que se realizan en (Kruskal-Walls).
los mismos sujetos (por ejemplo la medida de la
PIO antes y después de la administración de un
colirio hipotensor), mientras que son datos inde-
pendientes los que se obtienen de individuos dife- Ejemplo 23.2
rentes (por ejemplo, al comparar la eficacia de dos
técnicas quirúrgicas en dos grupos de pacientes eseamos determinar si un nuevo mé-
D
diferentes). todo de receta hospitalaria informatiza-
3. La distribución de las variables estudiadas. Las da disminuye el número de errores en
pruebas paramétricas suponen una distribución es- el proceso de prescripción y adminis-
pecífica en las variables estudiadas (generalmente la tración de fármacos comparándolo con
distribucion normal o de Gauss). Para ver si nuestra el método convencional con soporte de
distribución es normal debemos utilizar un test es- papel. Tenemos una variable cualitativa
tadístico, habitualmente el de Kolmogorov-Smirnov. dicotómica (error/no error) y dos grupos
Ver el apartado de la t de Student en este mismo ca- de estudio (pacientes con receta infor-
pítulo, donde se explica como se comprueba esto matizada y pacientes con receta en pa-
mediante un ejemplo. Estas pruebas son de elección pel). Por lo tanto el test de elección sería
y son más potentes. Si no nos es posible determinar un Ji (o Chi) cuadrado.
23. Estadística analítica 179
la salud, generalmente en la comparación entre dos entre la distribución de nuestra muestra y el modelo
técnicas quirúrgicas, tratamientos o pruebas diagnós- de distribución normal. En el programa SPSS vamos a
ticas si medimos los resultados con variables cuanti- la pestaña Analizar gPruebas no paramétricas gK-S
tativas. Podemos realizar el test «t» de Student para de una muestra y señalamos entre sus posibilidades
comparar el valor medio obtenido por ejemplo con la distribución de contraste normal (vemos que tam-
un nuevo fármaco hipotensor ocular antes y después bién ofrece la posibilidad de comprobar si se ajusta a
de su instauración (muestras apareadas). También otros tipos de distribuciones). Entonces nos aparece
nos informa sobre las diferencias en un nuevo trata- un cuadro de resultados con un nivel de significación
miento respecto a uno anterior o a los valores basales estadística. Si p<0.05 existe una diferencia estadís-
de referencia (pruebas de conformidad). O bien nos ticamente significativa respecto a una distribución
permite comparar efectos en muestras diferentes, por NORMAL, luego NO es una distribución normal. En
ejemplo el valor medio de presión intraocular tras nuestro caso particular encontramos que el valor de
realizar una trabeculoplastia selectiva en un grupo «p» es mayor de 0,05, por lo que nos encontramos
con Síndrome Pseudoexfoliativo con de un grupo ante una distribución NORMAL.
con Glaucoma Pigmentario. Después hemos de saber si existe o no igualdad
Al ser un test paramétrico, se requiere que la dis- de varianzas aplicando el test de Levene, pero esto
tribución muestral de las medias siga una distribu- ya nos lo da el programa en el cuadro de la t de Stu-
ción normal (habitualmente comprobada mediante dent. Para llegar a él señalamos Analizar g Comparar
el test de Kolmogorov-Smirnov) y que el tamaño de la medias g Prueba T para una muestra, introducimos
muestra sea grande (generalmente más de 30 casos, las variables de estudio y se nos muestra el siguiente
siempre que la distribución de la variable no presente cuadro:
asimetría ni anomalías destacables). No es necesario Si p>0,05 (test de Levene), existe homocedastici-
que ambos grupos sean iguales en número. Asimis- dad u homogeneidad de varianzas y hay que tomar el
mo es necesario analizar la varianzas, ya que si no valor correspondiente (marcado en rojo en la figura).
existe homogeneidad de varianzas, el resultado del Si p<0,05, existe heterocedasticidad, o heterogenei-
test se verá afectado. dad de varianzas y hay que tomar el valor correspon-
Dado que este es el test más utilizado, vamos a diente (Marcado en azul en la figura).
desarrollar un ejemplo a modo de tutorial utilizando En nuestro caso se cumple el criterio de homoge-
el programa estadístico SPSS. Estudiaremos si la pa- neidad de varianzas. Una vez que sabemos es nor-
quimetría corneal es diferente entre hombres y muje- mal y las varianzas son homogéneas, podemos utili-
res Para ello realizamos una paquimetría ultrasónica zar la t de Student. A mayores valores de «t» menor es
a 100 hombres y 100 mujeres de un mismo rango de el valor de «p». El valor de «p» obtenido en nuestro
edad. La hipótesis nula (H0) es que las medias de espe- ejemplo es 0,833, por lo que podemos afirmar que
sor corneal son las mismas en ambos grupos, mientras no se encuentran diferencias estadísticamente signifi-
que la hipótesis alternativa (H1) es que son distintas. cativas entre los valores de espesor corneal observa-
Lo primero es comprobar si esta distribución si- dos entre hombres y mujeres. De esta manera acep-
gue una ley normal, que es un paso muy importante tamos la hipótesis nula que nos dice que las medias
para saber si la prueba que debemos utilizar es pa- de espesor corneal son las mismas en ambos sexos.
ramétrica o no. La prueba que debemos utilizar es la Existen calculadoras on line para la t de Student,
de Kolmogorov-Smirnov, que hace una comparación algunos introduciendo todos los datos y otros con
182 23. Estadística analítica
Ejemplo 23.5
g) Pruebas de correlación: Pearson y Spearman
Realizamos un estudio para analizar
nuevamente el espesor corneal, esta Cuando nos encontramos ante variables cuantita-
vez en 4 poblaciones distintas. El pri- tivas que pueden estar relacionadas, hemos de apli-
mer grupo estará compuesto por 50 car análisis de correlación y regresión para estudiar
pacientes de ascendencia caucásica, el vínculo entre ellas. Si aplicamos una correlación
el segundo por 50 de ascendencia afri- vamos a estudiar la dirección y la potencia de aso-
cana, el tercero por 50 sujetos de as- ciación entre ambas variables pero en ningún caso
cendencuia asiática y el cuarto por 50 seremos capaces de establecer una relación de cau-
23. Estadística analítica 183
a un espacio n-dimensional, donde la ecuación de riables pueden tener importancia sobre el valor de la
nuestra recta sería: variable resultado (por ejemplo, si queremos conocer
los factores de riesgo de progresión de un glaucoma
pensaremos en el valor de la PIO, en la edad, en los
Donde y es el valor que tomaría la variable res- antecedentes familiares, paquimetría, etc.). Una vez
puesta; a es el término independiente (valor de y decidido cuáles pueden ser interesantes, se trata de
cuando el valor de todas las variables predictoras es seleccionar aquellas que tengan mayor relación con
0); ßi (para i desde 1 hasta n) es el coeficiente de re- la variable resultado, buscando el modelo más simple
gresión de xi; y xi (para i desde 1 hasta n) es el valor (con menor número de variables) que mantenga una
que toma cada una de las variables predictoras (6). capacidad explicativa y predictiva. Con el objetivo de
El cálculo de la ecuación de regresión es laborio- ayudarnos en esta decisión, los diferentes programas
so, y se realiza mediante métodos informatizados. El informáticos incorporan métodos de incorporación
coeficiente de determinación R2 es el índice propio progresiva (forward) o de eliminación progresiva (bac-
de cada modelo de regresión que nos permite medir kward). Los métodos forward comienzan introducien-
la calidad de ajuste o predicción lograda. Se inter- do en el modelo la variable con mayor correlación con
preta de igual forma que en regresión lineal simple la respuesta, y luego siguen con aquellas que mejor
(esto es, indica la proporción de la variación de la mejoran el modelo (mayor aumento de R2). El proce-
variable respuesta que es atribuible a los factores pre- so acaba cuando la mejoría del modelo producida al
dictores), y permite comparar entre sí distintos mode- incluir la siguiente variable no mejora la función pre-
los de regresión. dictora del modelo de forma significativa. Los métodos
backward parten de un modelo que incluye todas las
variables, y van excluyendo de una en una a las peores
b) Regresión logística hasta que la capacidad predictora del modelo dismi-
nuye de forma significativa. Los métodos paso a paso
Vamos a hablar ahora de la técnica multivariante (stepwise) son una mejora sobre los anteriores. Estos
más usada en medicina. Las posibles razones de esto métodos evalúan las variables incluidas en el modelo
son: cada vez que una nueva variable entra, de modo que
– Utilidad para predecir variables dicotómicas pueden excluir variables que dejen de aportar informa-
(estar o no enfermo). ción una vez que la nueva variable entra en el modelo.
– Permite incluir como predictores variables
cuantitativas (Gaussianas o no) y cualitativas (7). BIBLIOGRAFÍA
– Permite el cálculo de Odds Ratios «controla-
das» por el resto de variables 1. Devore JL. Probabilidad y estadística para ingenieros y
ciencias. Editorial: Cenpage Learning Editores S.A. de C.V.;
En este caso, ya no hablamos de una ecuación li- 2008 pag 10-31.
neal. Una vez tenemos el modelo, podemos calcular 2. Pardell H, Cobo E, Canela J. Manual de bioestadística. Edi-
la probabilidad que tiene cada individuo de presen- torial MASSON SA Barcelona 1986. pag: 11-14.
tar la variable respuesta, en función de las variables 3. Milton JS, Tsokos JO. Estadística para biología y ciencias
predictoras. La calidad de la predicción del modelo de la salud. INTERAMERICANA-MCgraw-hill, Madrid
1989, pag: 103-131.
puede medirse usando una curva de características
4. Martel PJ, Diez Vega FJ. Probabilidad y estadística en me-
operativas de receptor (curva ROC), que enfrenta la dicina. Ed Díaz de Santos, Madrid 1997 pag: 308-313, 95.
sensibilidad contra la especificidad del modelo pro- 5. Cohen J. Statistical Power Analysis for the Behavioral
bado en los mismos individuos con los que ha sido Sciences (second ed.). Lawrence Erlbaum Associates 1988.
construido. El área bajo esa curva es el índice que re- 6. Marill KA. Advanced statistics: linear regression, part II:
multiple linear regression. AcadEmerg Med 2004; 11: 94-
sume la capacidad de predicción de la ecuación, y se
102.
conoce como índice C (fig. 2). Un modelo que siem- 7. Worster A, Fan J, Ismaila A. Understanding linear and lo-
pre acertase tendría un índice C de 1 (clasificaría bien gistic regression analyses. CJEM 2007; 9(2): 111-3.
al 100% de los individuos), mientras que un modelo 8. Ahmed FE, Vos PW, Holbert D. Modeling survival in colon
que clasificase a los individuos al azar tendría un ín- cancer: a methodological review. Molecular cancer 2007;
6: 15.
dice C de 0,5 (acertaría en un 50% de los individuos).
9. Klein JP, Rizzo JD, Zhang MJ, Keiding N. Statistical methods
Elección de variables independientes en regresión for the analysis and presentation of the results of bone ma-
multivariante: El primer paso a la hora de construir un rrow transplants. Part 2: regression modeling. Bone ma-
modelo de regresión multivariante es elegir qué va- rrow transplantation 2001; 28: 1001-11.