You are on page 1of 27

1

1.1

Ejemplo de anlisis descriptivo de un conjunto de datos


Introduccin
En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadstica
descriptiva. El objetivo es repasar algunos conceptos bsicos y proporcionar un gua de
trabajo que sirva de referencia en el anlisis descriptivo. A lo largo del ejemplo, se
comentaran los procedimientos propios de SPSS y se propondrn algunas cuestiones
de interpretacin de resultados.

1.2

Base de datos
La base de datos para este ejemplo se encuentra en la pgina:
http://www.udl.es/usuaris/q3695988/WebCursPrimer/
En dicha pgina, seleccionar la opcin Casos Prcticos en la barra izquierda. Una vez
en Casos prcticos, seleccionar la base de datos del ejemplo: Factores implicados en
la evolucin a ciertas intervenciones quirrgicas.

1.3

Enunciado general del ejemplo


En un estudio se quiere evaluar la posible relacin entre determinados factores clnicos
y la evolucin observada en determinados procesos post operatorios relacionados con
una patologa. Para ello, se han recogido los datos de un conjunto de pacientes
sometidos a intervencin quirrgica en el ltimo ao. La informacin recogida es la
siguiente:
Gnero:
IMC
Concentracin 1
Concentracin 2
Concentracin 3
Gravedad al ingreso:
Ingreso:
Evolucin

1.4

1 Hombre, 2 Mujer
Indice de masa corporal

+, ++, +++
1 Programado, 2 Urgencia
+, ++, +++

Objetivos

Realizar una descriptiva completa del conjunto de datos, justificando en cada caso
el mtodo elegido
Estimar el rango de normalidad de los metabolitos incluidos en este estudio en
funcin de la evolucin de los pacientes. Evaluar la posibilidad de utilizar alguno de
estos metabolitos como pronstico de evolucin.
Determinar si la evolucin est relacionada con la gravedad al ingreso. Qu
factores pueden influenciar esta relacin?
Comparar las concentraciones de los metabolitos entre hombres y mujeres.
Estudiar la relacin entre los niveles de los metabolitos y la evolucin

EJEMPLO ANLISIS DE DATOS

-1-

Anlisis

2.1
2.1.1

Realizar una descriptiva completa del conjunto de datos, justificando en


cada caso el mtodo elegido
Variables cualitativas
En este conjunto de datos, disponemos de distintas variables cualitativas (gnero,
gravedad al ingreso, ingreso y evolucin. Por otra parte, disponemos de distintas
variable cuantitativas (imc, y las distintas concentraciones).
Empezaremos realizando una descriptiva de las variables cualitativas, teniendo en
cuenta las distintas variables de que se dispone y los objetivos del estudio. Para ello,
fundamentalmente podemos utilizar grficos de barras y tablas de porcentajes.
En primer lugar, estudiaremos los resultados de la base de datos desde el punto de
vista de tablas de porcentajes, relacionando la gravedad al ingreso con la evolucin de
los pacientes. El procedimiento para obtener esta tabla es:
Analizar>Estadisticos descriptivos>Tablas de contingencia
Seleccionaremos la gravedad al ingreso en las filas y la evolucin en las columnas:

A continuacin, indicaremos en la opcin Casillas.. que nos interesan los porcentajes


de fila:

EJEMPLO ANLISIS DE DATOS

-2-

El resultado que se obtiene es:


Tabla de contingencia GRAVEDAD * EVOLUCIO

+
GRAVEDAD

+
++
+++

Total

Recuento
% de GRAVEDAD
Recuento
% de GRAVEDAD
Recuento
% de GRAVEDAD
Recuento
% de GRAVEDAD

12
22,6%
12
27,3%
41
51,9%
65
36,9%

EVOLUCIO
++
23
43,4%
25
56,8%
31
39,2%
79
44,9%

+++

Total

18
34,0%
7
15,9%
7
8,9%
32
18,2%

53
100,0%
44
100,0%
79
100,0%
176
100,0%

Los porcentajes parecen indicar que la gravedad al ingreso comporta una peor
evolucin. Para evaluar este punto, podemos calcular los residuales ajustados. En la
opcin Casillas seleccionaos esta opcin:

La nueva tabla ser:

EJEMPLO ANLISIS DE DATOS

-3-

Tabla de contingencia GRAVEDAD * EVOLUCIO

+
GRAVEDAD

++

+++

Total

Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD

12
22,6%
-2,6
12
27,3%
-1,5
41
51,9%
3,7
65
36,9%

EVOLUCIO
++
23
43,4%
-,3
25
56,8%
1,8
31
39,2%
-1,4
79
44,9%

+++

Total

18
34,0%
3,6
7
15,9%
-,5
7
8,9%
-2,9
32
18,2%

53
100,0%
44
100,0%
79
100,0%
176
100,0%

Donde puede verse que, efectivamente, podemos concluir que el porcentaje de


pacientes con gravedad (+++) al ingreso evoluciona peor (+) que el resto.

EJEMPLO ANLISIS DE DATOS

-4-

Podemos estimar la probabilidad de que un paciente con una gravedad (+++) al ingreso
tenga una evolucin (+). Para ello, recordad que el intervalo de confianza (95%) para
una probabilidad es:

p0 1.96

p 0 (1 p 0 )

(1)

Utilizando esta expresin podemos calcular, para el grupo de gravedad (+++) al ingreso:

0.52 1.96

0.52 0.48
79

(2)

0.52 0.11
(0.41,0.63)
Este resultado puede compararse con el resultado para los pacientes con gravedad (+)
al ingreso

0.23 1.96

0.23 0.77
53

(3)

0.23 0.11
(0.12,0.34)
Podis comprobar que ambos intervalos no se solapan, indicando que la probabilidad
de evolucionar desfavorablemente es superior en el grupo de mayor gravedad al
ingreso.
Ejercicio: calcular los intervalos de confianza para todas las probabilidades de la tabla
anterior. Discutir los resultados y relacionarlos con la interpretacin de los residuales
ajustados.
Los resultados de una tabla de contingencia pueden representarse mediante una
grfica de barras. Para ello, utilizaremos la opcin Grficos>Barras, seleccionando la
opcin de Agrupado

EJEMPLO ANLISIS DE DATOS

-5-

En el cuadro de dilogo correspondiente, indicaremos:

Es importante seleccionar la opcin % de casos para que los resultados se expresen


segn porcentajes. En el eje de categoras situaremos la evolucin, y los grupos
vendrn definidos por gravedad. El resultado ser:
60

50

40

30

Porcentaje

20

GRAVEDAD
+

10
++
0

+++
+

++

+++

EVOLUCIO

Donde se indican los mismos porcentajes de la tabla anterior. Puede apreciarse que el
porcentaje de pacientes con evolucin desfavorable (+) aumenta con la gravedad al
ingreso, mientras que la proporcin de pacientes con buena evolucin (+++) disminuye.
Ejercicio: Copia los resultados de la tabla a un fichero de Excel y calcula los intervalos
de confianza para cada probabilidad. Incluye unas barras de error que complementen la
grfica de barras.

EJEMPLO ANLISIS DE DATOS

-6-

Hasta este punto, hemos relacionado la evolucin con la gravedad al ingreso. Seria
interesante explorar si esta relacin es similar en hombres y mujeres. Para ello,
podemos repetir la tabla de contingencia incluyendo la variable gnero como una capa.
Con ello, se realizar una tabla independiente para hombres y mujeres:

El resultado que obtendremos ser:


Tabla de contingencia GRAVEDAD * EVOLUCIO * GENERO

GENERO
Hombre

+
GRAVEDAD

++

+++

Total
Mujer

GRAVEDAD

++

+++

Total

Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD

6
26,1%
-1,4
4
23,5%
-1,4
22
50,0%
2,4
32
38,1%
6
20,0%
-2,2
8
29,6%
-,8
19
54,3%
2,9
33
35,9%

EVOLUCIO
++
9
39,1%
-,4
7
41,2%
-,2
20
45,5%
,5
36
42,9%
14
46,7%
,0
18
66,7%
2,5
11
31,4%
-2,3
43
46,7%

+++

Total

8
34,8%
2,3
6
35,3%
1,9
2
4,5%
-3,6
16
19,0%
10
33,3%
2,8
1
3,7%
-2,2
5
14,3%
-,6
16
17,4%

23
100,0%
17
100,0%
44
100,0%
84
100,0%
30
100,0%
27
100,0%
35
100,0%
92
100,0%

Puede apreciarse que no la tendencia es similar en ambos casos.


Ejercicio: Estima la probabilidad de que una mujer con gravedad (+++) al ingreso
evolucione desfavorablemente (+). Compara este resultado con el correspondiente para
los hombres. Repite este clculo para el evolucin (+++).

EJEMPLO ANLISIS DE DATOS

-7-

Utilizando los mismos procedimientos, exploraremos la posible relacin entre el tipo de


ingreso y la evolucin. Obtenemos:
Tabla de contingencia INGRESO * EVOLUCIO

+
INGRESO

Programado

Urgencias

Total

Recuento
% de INGRESO
Residuos corregidos
Recuento
% de INGRESO
Residuos corregidos
Recuento
% de INGRESO

24
29,3%
-2,0
41
43,6%
2,0
65
36,9%

EVOLUCIO
++
39
47,6%
,7
40
42,6%
-,7
79
44,9%

+++

Total

19
23,2%
1,6
13
13,8%
-1,6
32
18,2%

82
100,0%
94
100,0%
176
100,0%

De estos resultados, podemos indicar que los pacientes de urgencias presentan una
proporcin superior de evolucin desfavorable, si bien los resultados no son muy
significativos. En este caso, seria conveniente considerar la gravedad al ingreso:
Tabla de contingencia INGRESO * EVOLUCIO * GRAVEDAD

GRAVEDAD
+

+
INGRESO

Programado

Urgencias

Total
++

INGRESO

Programado

Urgencias

Total
+++

INGRESO

Programado

Urgencias

Total

Recuento
% de INGRESO
Residuos corregidos
Recuento
% de INGRESO
Residuos corregidos
Recuento
% de INGRESO
Recuento
% de INGRESO
Residuos corregidos
Recuento
% de INGRESO
Residuos corregidos
Recuento
% de INGRESO
Recuento
% de INGRESO
Residuos corregidos
Recuento
% de INGRESO
Residuos corregidos
Recuento
% de INGRESO

5
15,6%
-1,5
7
33,3%
1,5
12
22,6%
3
17,6%
-1,1
9
33,3%
1,1
12
27,3%
16
48,5%
-,5
25
54,3%
,5
41
51,9%

EVOLUCIO
++
14
43,8%
,1
9
42,9%
-,1
23
43,4%
11
64,7%
,8
14
51,9%
-,8
25
56,8%
14
42,4%
,5
17
37,0%
-,5
31
39,2%

+++

Total

13
40,6%
1,3
5
23,8%
-1,3
18
34,0%
3
17,6%
,3
4
14,8%
-,3
7
15,9%
3
9,1%
,1
4
8,7%
-,1
7
8,9%

32
100,0%
21
100,0%
53
100,0%
17
100,0%
27
100,0%
44
100,0%
33
100,0%
46
100,0%
79
100,0%

Ejercicio: Utilizando tablas de frecuencias, explora la relacin entre la evolucin de los


pacientes y su gravedad al ingreso teniendo en cuenta el tipo de ingreso y el gnero.
Discute las limitaciones de los resultados que obtengas.

EJEMPLO ANLISIS DE DATOS

-8-

Variables cuantitativas
Al realizar una descriptiva de la variables cuantitativas, es conveniente, en primer lugar,
comprobar si se comportan como una normal. Para ello, podemos utilizar grficas P-P.
El procedimiento es: Grficos>P-P:

El resultado para conc1 es:

Normal grfico P-P de CONC3


1,0

,8

Prob acum esperada

2.1.2

,5

,3

0,0
0,0

,3

,5

,8

1,0

Prob acum observada

EJEMPLO ANLISIS DE DATOS

-9-

Normal grfico P-P sin tendencia d


,03

,02

Desviacin de Normal

,01

0,00

-,01

-,02
-,2

0,0

,2

,4

,6

,8

1,0

1,2

Prob acum observada


Puede observase que la grfica P-P se acerca bastante a la diagonal, sin que la grfica
de desviaciones muestre diferencias importantes respecto a los valores esperados
segn la distribucin normal.
Ejercicio: Comprobar la normalidad del resto de variables cuantitativas.
Podemos completar este anlisis descriptivo de la normalidad mediante histogramas.
Para ello, seleccionamos Grficos>Histograma:

EJEMPLO ANLISIS DE DATOS

- 10 -

El resultado para conc3 es:


50

40

30

20

10
Desv. tp. = 4,48
Media = 42,8
N = 176,00

0
32,6

41,8
37,2

51,0
46,4

CONC3

Ejercicio: Estudia la distribucin del resto de variables cuantitativas mediante


histogramas
Para el estudio descriptivo de variables cuantitativas continuas, es ms interesante
utilizar diagramas de cajas. Este tipo de grficas nos permite comparar la distribucin
de cada variable en funcin de distintas variables cuantitativas. As, podemos comparar
la distribucin de conc3 en funcin de la gravedad al ingreso. Para ello,
seleccionamos: Graficos>Diagramas de Cajas>Simple:

EJEMPLO ANLISIS DE DATOS

- 11 -

Obtenemos:
60

118

50

40

39

CONC3

30

20
N=

53

44

79

++

+++

GRAVEDAD

Podemos apreciar que no se observan cambios importantes en la distribucin de esta


variable en los distintos grupos de pacientes segn la gravedad al ingreso. Los valores
extremos en el caso de gravedad (+++) indican individuos con valores alejados del
resto. Estos valores deben validarse para excluir errores en la entrada de datos.
Mediante diagramas de cajas, podemos explorar la distribucin de una variable en
funcin de dos variables cualitativas. Por ejemplo, podemos verificar si el tipo de ingreso
y la gravedad determinan diferencias en la distribucin de conc3. Para ello utilizaremos:
Graficos>Diagramas de Cajas>Agrupados:

EJEMPLO ANLISIS DE DATOS

- 12 -

60

68

50

40

39

CONC3

30

INGRESO
Programado
Urgencias

20
N=

32

21

17

27

++

33

46

+++

GRAVEDAD
Podemos observar que no se producen variaciones apreciables.
Ejercicio: Determina si la gravedad al ingreso y el gnero determinan alguna variacin
importante en la distribucin de imc, y de las concentraciones.

EJEMPLO ANLISIS DE DATOS

- 13 -

El anlisis exploratorio de estos datos nos indica que existen algunas diferencias
importantes en funcin de la edad:
130

120

75
37

110

100

CONC2

90

80
N=

84

92

Hombre

Mujer

GENERO

Esta descriptiva puede completarse mediante tablas de medias y desviaciones tpicas.


Para ello podemos utilizar Analizar>Comparar Medias>Medias:

Informe
CONC1
GENERO
Hombre
Mujer
Total

EJEMPLO ANLISIS DE DATOS

Media
51,670
51,748
51,711

Desv. tp.
2,3444
2,6864
2,5221

N
84
92
176

- 14 -

Podemos completar el anlisis, introduciendo distintas capas y pivotando la tabla


resultante. As, podemos comparar las medias en funcin del gnero, ingreso y
gravedad:
Informe
CONC1

GENERO
Hombre

Mujer

Total

GRAVEDAD
+
++
+++
Total
+
++
+++
Total
+
++
+++
Total

Media
52,9
54,2
50,7
52,1
53,6
51,1
51,3
52,3
53,3
52,2
51,0
52,2

Programado
Desv. tp.
3,0
2,6
2,1
2,8
2,7
3,4
2,7
3,0
2,8
3,4
2,4
2,9

N
12
6
17
35
20
11
16
47
32
17
33
82

Media
52,1
51,8
50,9
51,4
52,3
51,4
50,5
51,2
52,2
51,6
50,7
51,3

INGRESO
Urgencias
Desv. tp.
1,9
1,9
1,9
1,9
2,8
1,5
2,1
2,2
2,3
1,6
2,0
2,0

N
11
11
27
49
10
16
19
45
21
27
46
94

Media
52,5
52,7
50,8
51,7
53,2
51,3
50,9
51,7
52,9
51,8
50,8
51,7

Total
Desv. tp.
2,5
2,4
1,9
2,3
2,7
2,4
2,4
2,7
2,6
2,5
2,1
2,5

Desde el punto de vista exploratorio, es interesante determinar la posible relacin entre


variables cuantitativas. Esta descriptiva puede realizarse mediante grficas de
dispersin: Graficos>Dispersin:

Obtenemos:

EJEMPLO ANLISIS DE DATOS

- 15 -

N
23
17
44
84
30
27
35
92
53
44
79
176

120

110

100

CONC2

90

80
44

46

48

50

52

54

56

58

60

CONC1

Puede observarse que no existe una tendencia evidente entre los valores de ambas
variables.
Ejercicio: Utilizando los procedimientos anteriores, realiza una descriptiva completa de
los datos. En funcin de los resultados, indica una interpretacin global de los mismos
en funcin de los objetivos que se han planteado.

EJEMPLO ANLISIS DE DATOS

- 16 -

2.2

Estimar el rango de normalidad de los metabolitos incluidos en este


estudio en funcin de la evolucin de los pacientes. Evaluar la posibilidad
de utilizar alguno de estos metabolitos como pronstico de evolucin.
Si podemos admitir una distribucin normal, el intervalo de normalidad al 95% se calcula
como:

X 1.96 s

(4)

Para ello, debemos calcular las medias y desviaciones tpicas correspondientes a los
casos de inters. Vamos a calcular dichas medias para hombres y mujeres:
Informe

EDAD

IMC

CONC1

CONC2

CONC3

Media
Desv. tp.
Error tp. de la media
N
Media
Desv. tp.
Error tp. de la media
N
Media
Desv. tp.
Error tp. de la media
N
Media
Desv. tp.
Error tp. de la media
N
Media
Desv. tp.
Error tp. de la media
N

Hombre
53,64
4,949
,540
84
22,51
,951
,104
84
51,670
2,3444
,2558
84
104,370
6,0601
,6612
84
45,000
4,2134
,4597
84

GENERO
Mujer
60,89
4,488
,468
92
20,50
,955
,100
92
51,748
2,6864
,2801
92
93,932
6,2720
,6539
92
40,880
3,7652
,3925
92

Total
57,43
5,939
,448
176
21,46
1,385
,104
176
51,711
2,5221
,1901
176
98,914
8,0756
,6087
176
42,847
4,4777
,3375
176

En funcin de estos resultados, los valores normales (que expresan entre que valores
esperamos el 95% de los resultados individuales) para conc2 serian, para los hombres:

104.37 1.96 6.06

(5)

104.37 11.88
(92.49,116.25)
Para las mujeres serian:

93,93 1.96 8.07

(6)

93.93 15.82
(78.11,109.75)
Puede verse que los resultados esperados se sitan ligeramente por debajo en
hombres que en mujeres.

EJEMPLO ANLISIS DE DATOS

- 17 -

Ejercicio: Calcula los intervalos de referencia para el resto de variables

Ejercicio: Calcula los intervalos de referencia de cada variable segn el grado de


evolucin
Si estamos interesados en determinar qu variable puede ser utilizada para clasificar a
los pacientes para predecir su posible evolucin, debemos establecer qu variable
presenta diferencias de distribucin en funcin de la evolucin. Para ello, podemos
empezar utilizando diagramas de barras:
70

60
60
157
122

CONC1

50

22

40
N=

65

79

32

++

+++

EVOLUCIO

Puede observarse que existe una relacin entre la evolucin y la conc1. Esta variable
podra utilizarse como indicativo de evolucin en el diseo de un criterio diagnstico.
Para explorar esta posibilidad, podemos calcular una curva ROC. El procedimiento
indica si la variable en cuestin puede discriminar un determinado grupo de pacientes.
En este caso, tomaremos como grupo de inters al grupo (+++). El procedimiento es:
Grficos>Curva COR

EJEMPLO ANLISIS DE DATOS

- 18 -

El resultado que se obtiene es:

Curva COR
1,0

,8

Sensibilidad

,5

,3

0,0
0,0

,3

,5

,8

1,0

1 - Especificidad
Los segmentos diagonales son producidos por los empates

Podemos apreciar que esta variable discrimina bien entre el grupo de buena evolucin
(+++) y el resto de grupos. Podemos incluir a las otras variables en la misma grfica:

Curva COR

1,0

,8

Procedencia de la cu

Sensibilidad

,5

CONC3
,3

CONC2
CONC1

0,0
0,0

,3

,5

,8

1,0

1 - Especificidad

Los segmentos diagonales son producidos por los empates.

EJEMPLO ANLISIS DE DATOS

- 19 -

Podemos apreciar que conc3 no discrimina en absoluto, mientras que conc2


proporciona alguna discriminacin pero en menor medida que conc1.

2.3

Determinar si la evolucin est relacionada con la gravedad al ingreso.


Qu factores pueden influenciar esta relacin?
Podemos estudiar esta relacin mediante tablas de contingencia. En primer lugar,
tenemos:
Tabla de contingencia GRAVEDAD * EVOLUCIO

12
22,6%
-2,6
12
27,3%
-1,5
41
51,9%
3,7
65
36,9%

EVOLUCIO
++
23
43,4%
-,3
25
56,8%
1,8
31
39,2%
-1,4
79
44,9%

4
4

Sig. asinttica
(bilateral)
,000
,000

,000

+
GRAVEDAD

++

+++

Total

Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD

+++
18
34,0%
3,6
7
15,9%
-,5
7
8,9%
-2,9
32
18,2%

Total
53
100,0%
44
100,0%
79
100,0%
176
100,0%

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos

Valor
21,976a
21,339
18,551

gl

176

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 8,00.

Por lo tanto, como ya habamos comentado en el apartado 2.1.1, se observa una


relacin significativa entre la gravedad al ingreso y la evolucin, de manera que la
probabilidad de una buena evolucin esta asociada a una menor gravedad al ingresos.

EJEMPLO ANLISIS DE DATOS

- 20 -

Si consideramos el tipo de ingreso y el gnero como posibles factores de confusin


encontramos:
Tabla de contingencia

GENERO
Hombre

+
GRAVEDAD

++

+++

Total
Mujer

GRAVEDAD

++

+++

Total

Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD

6
26,1%
-1,4
4
23,5%
-1,4
22
50,0%
2,4
32
38,1%
6
20,0%
-2,2
8
29,6%
-,8
19
54,3%
2,9
33
35,9%

EVOLUCIO
++
9
39,1%
-,4
7
41,2%
-,2
20
45,5%
,5
36
42,9%
14
46,7%
,0
18
66,7%
2,5
11
31,4%
-2,3
43
46,7%

+++
8
34,8%
2,3
6
35,3%
1,9
2
4,5%
-3,6
16
19,0%
10
33,3%
2,8
1
3,7%
-2,2
5
14,3%
-,6
16
17,4%

Total
23
100,0%
17
100,0%
44
100,0%
84
100,0%
30
100,0%
27
100,0%
35
100,0%
92
100,0%

Tabla de contingencia

INGRESO
Programado

+
GRAVEDAD

++

+++

Total
Urgencias

GRAVEDAD

++

+++

Total

EJEMPLO ANLISIS DE DATOS

Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD

5
15,6%
-2,2
3
17,6%
-1,2
16
48,5%
3,1
24
29,3%
7
33,3%
-1,1
9
33,3%
-1,3
25
54,3%
2,1
41
43,6%

EVOLUCIO
++
14
43,8%
-,6
11
64,7%
1,6
14
42,4%
-,8
39
47,6%
9
42,9%
,0
14
51,9%
1,2
17
37,0%
-1,1
40
42,6%

+++
13
40,6%
3,0
3
17,6%
-,6
3
9,1%
-2,5
19
23,2%
5
23,8%
1,5
4
14,8%
,2
4
8,7%
-1,4
13
13,8%

Total
32
100,0%
17
100,0%
33
100,0%
82
100,0%
21
100,0%
27
100,0%
46
100,0%
94
100,0%

- 21 -

Estos resultados parecen indicar ambos factores no influencian de manera significativa


la relacin entre la gravedad al ingreso y la evolucin.
Finalmente, aunque no disponemos de muestra suficiente, podemos considerar todos
los factores simultneamente:
Tabla de contingencia GRAVEDAD * EVOLUCIO * GENERO * INGRESO
GENERO

INGRESO
Programado

+
GRAVEDAD

++

+++

Total
Urgencias

GRAVEDAD

++

+++

Total

Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD
Residuos corregidos
Recuento
% de GRAVEDAD

EJEMPLO ANLISIS DE DATOS

2
16,7%
-1,6
1
16,7%
-1,0
9
52,9%
2,3
12
34,3%
4
36,4%
-,3
3
27,3%
-1,0
13
48,1%
1,2
20
40,8%

Hombre
EVOLUCIO
++
+++
4
6
33,3%
50,0%
-,8
2,8
3
2
50,0%
33,3%
,4
,7
8
0
47,1%
,0%
,5
-3,1
15
8
42,9%
22,9%
5
2
45,5%
18,2%
,2
,2
4
4
36,4%
36,4%
-,5
2,0
12
2
44,4%
7,4%
,2
-1,9
21
8
42,9%
16,3%

Total

12
100,0%

3
15,0%
-1,4
2
18,2%
-,6
7
43,8%
2,1
12
25,5%
3
30,0%
-1,2
6
37,5%
-,9
12
63,2%
1,9
21
46,7%

6
100,0%
17
100,0%
35
100,0%
11
100,0%
11
100,0%
27
100,0%
49
100,0%

Mujer
EVOLUCIO
++
+++
10
7
50,0%
35,0%
-,1
1,6
8
1
72,7%
9,1%
1,6
-1,3
6
3
37,5%
18,8%
-1,3
-,5
24
11
51,1%
23,4%
4
3
40,0%
30,0%
-,2
2,2
10
0
62,5%
,0%
2,0
-1,8
5
2
26,3%
10,5%
-1,8
-,1
19
5
42,2%
11,1%

Total
20
100,0%
11
100,0%
16
100,0%
47
100,0%
10
100,0%
16
100,0%
19
100,0%
45
100,0%

- 22 -

Pruebas de chi-cuadrado

INGRESO
Programado

GENERO
Hombre

Mujer

Urgencias

Hombre

Mujer

Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos

4
4

Sig. asinttica
(bilateral)
,019
,005

9,501

,002

35
7,033b
6,935

4
4

,134
,139

3,670

,055

47
5,089c
4,774

4
4

,278
,311

1,509

,219

49
9,694d
10,415

4
4

,046
,034

3,683

,055

Valor
11,792a
14,805

gl

45

a. 6 casillas (66,7%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima


esperada es 1,37.
b. 5 casillas (55,6%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima
esperada es 2,57.
c. 7 casillas (77,8%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima
esperada es 1,80.
d. 5 casillas (55,6%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima
esperada es 1,11.

Podemos observar que en algunos casos, la relacin deja de ser significativa. Parte de
este cambio es debido a la falta de casos, sin descartar totalmente la posibilidad de
interacciones significativas que determinen una evolucin distinta en cada tipo de
paciente. Por lo tanto, seria conveniente disear un estudio ms completo y utilizar
tcnicas estadsticas ms potentes (multivariantes) para explorar el problema.

Comparar las concentraciones de los metabolitos entre hombres y


mujeres.
La comparacin descriptiva de las concentraciones entre hombres y mujeres puede
hacerse mediante diagramas de cajas. Por ejemplo, para conc2 tenemos:
130

120

75
37

110

100

90

CONC2

2.4

80
N=

84

92

Hombre

Mujer

GENERO

EJEMPLO ANLISIS DE DATOS

- 23 -

Podemos ver que existen diferencias apreciables. Podemos completar esta descripcin
mediante el clculo de ndices muestrales:
Informe
CONC2
GENERO
Hombre
Mujer
Total

Media
104,4
93,9
98,9

Desv. tp.
6,1
6,3
8,1

Error tp. de
la media
,7
,7
,6

Mnimo
90,6
83,5
83,5

Mximo
118,2
110,6
118,2

N
84
92
176

Finalmente, podemos comparar ambos grupos y estimar la diferencia de muestras. Para


ello utilizaremos la opcin:
Analizar>Comparar Medias>Prueba T para dos muestras independientes

Debemos definir los cdigos de la variable gnero para definir los grupos que queremos
comparar:

El resultado es:
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
CONC2

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

,032

Sig.
,858

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

Diferencia
de medias

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

11,208

174

,000

10,439

,9314

8,6004

12,2770

11,225

173,434

,000

10,439

,9299

8,6033

12,2742

En este punto, debemos recordar que la prueba de Levene para la igualdad de


varianzas permite evaluar si las muestras son compatibles con la hiptesis de que las
varianzas poblacionales son iguales. En este caso, p=0.858, lo que indica que podemos
asumir que las varianzas son iguales.

EJEMPLO ANLISIS DE DATOS

- 24 -

La prueba de T evala si las muestras son compatibles con la hiptesis de igualdad de


medias poblacionales. En este caso, siguiendo la primera fila puesto que asumimos
igualdad de varianzas, p=0.000, lo que indica que las muestras no son compatibles con
la hiptesis. La estimacin de la diferencia de medias es entre 8.6 y 12,3, indicando que
la concentracin media en los hombres (grupo 1) es superior a la de las mujeres.
Ejercicio: Evaluar la igualdad de medias poblacionales en el resto de variables en
funcin del sexo

Estudiar la relacin entre los niveles de los metabolitos y la evolucin


La descriptiva de respecto a la evolucin de los pacientes proporciona el siguiente
resultado:
130

120

110

100

90

CONC2

2.5

15

80
N=

65

79

32

++

+++

EVOLUCIO

Indicando que puede existir una relacin significativa entre el nivel de conc2 y la
evolucin, sin que ello implique necesariamente una relacin causa-efecto. Podemos
estimar el valor medio de conc2 para cada nivel de evolucin. Para ello utilizaremos:
Grficos>Barras de error>Simple:

EJEMPLO ANLISIS DE DATOS

- 25 -

120

95% IC CONC2

110

100

90
N=

65

79

32

++

+++

EVOLUCIO

Puede observarse que el valor medio se incrementa en cada grupo de evolucin. A


partir de estos resultados, podemos aventurar al interpretacin de que las diferencias
son significativas, dado que los intervalos no se solapan. Sin embargo, esta
interpretacin es provisional y deberamos emplear un procedimiento estadstico que
permitiera evaluar esta hiptesis. El procedimiento adecuado en este caso sera el
anlisis de la varianza (ANOVA).
Podemos evaluar el posible efecto de otras variables. As, por ejemplo, si
seleccionamos Graficos>Barras de error>Agrupados:

EJEMPLO ANLISIS DE DATOS

- 26 -

Obtenemos:
120

110

95% IC CONC2

100

GENERO
90
Hombre

Mujer

80
N=

32

33

36

43

++

16

16

+++

EVOLUCIO

En esta grfica, podemos observar que la concentracin media es superior en hombres


a cualquier nivel de evolucin y que las diferencias son constantes. Por otra parte, la
relacin entre la concentracin media y la evolucin es similar en hombre y mujeres. Por
lo tanto, podramos concluir que la relacin entre evolucin y concentracin es
independiente del gnero. Como en el caso anterior, deberamos utilizar un
procedimiento de ANOVA para verificar esta interpretacin.
Ejercicio: Determina si la gravedad al ingreso es un factor que modifique la relacin
entre conc2 y la evolucin.

EJEMPLO ANLISIS DE DATOS

- 27 -

You might also like