You are on page 1of 20

ASIGNATURA METODOLOGIA DE INVESTIGACION EN SALUD I

CARRERA DE PSICOLOGA
VICERRECTORA ACADMICA
UNIVERSIDAD DE ACONCAGUA

APUNTES DE CLASES
CURSO B-LEARNING
AO 2016
NOTA PRELIMINAR: Los apuntes de clase que aqu se presentan son fruto del trabajo de
recopilacin de material, editado, con objetivos didcticos, en un solo documento unitario,
orientado a servir de gua para alumnos de pregrado de Psicologa de la Universidad de
Aconcagua.

UNIDAD IV: ANLISIS DE DATOS


Tema 10: Anlisis de informacin I: Formulacin de un plan de anlisis de datos.

10.1 Introduccin
Como puede observarse en la figura n1 el ltimo elemento a desarrollar en la planificacin
del diseo de investigacin es el plan de anlisis de datos. En dicho plan se establece como
se realizar el tratamiento estadstico de los datos para obtener informacin que permita
comprobar las hiptesis planteadas y cumplir con el objetivo general del estudio.

Proyecto de
Investigacin

Formulacin del Operacionalizacin Diseo de la Factibilidad de la


problema del problema Investigacin Investigacin

Definicin de Formulacin de Estrategias de


Fuentes
Objetivos hiptesis investigacin

Conexin con Recursos


Operacionlizacin Diseo Muestral
marcos tericos Disponibles

Planificacin del
Tcnica de
Unidad de Anlisis tiempo de
obtencin de datos
investigacin

Plan de analisis de
datos

Figura n1: Etapas del proyecto de investigacin

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Para planificar adecuadamente lo que realizaremos con los nuestros datos debemos conocer
las variables que hemos incluido en el estudio. Como ya comentamos cuando hablamos sobre
diseos de investigacin, existen diferentes formas de clasificar las variables. Un forma de
clasificar los datos (o variables) es por niveles de medicin. Esta clasificacin permite de
acuerdo a Newbold, Carlson y Thorne (2008) dividir los datos en cualitativos y cuantitativos.
En los datos cualitativos la diferencia entre los nmeros no tienen ningn significado
mensurable, los nmeros son asignados para representar una cualidad. Por ejemplo podemos
asignar el nmero 1 a miembro de la clase y el nmero 2 a otra y esto no permite sacar
ninguna conclusin. Ahora bien, en los datos cuantitativos la diferencia entre los nmeros si
es medible, un puntaje de 90 es casi el doble que uno de 50, esa diferencia es medible y tiene
un significado.
Los datos cualitativos pueden adoptar dos niveles de medicin, nominal u ordinal. Estas
escalas de medida provienen de datos que se obtienen a travs de preguntas categricas (Si,
no; alto, medio, bajo).
Los datos cuantitativos por su parte pueden formar escalas de intervalo o de razn. En ambas,
se hace referencia a una escala ordenada en la que la diferencia entre las mediciones, como
se mencion antes, s tiene significado. En el caso de las escalas de intervalo se ofrecen datos
en relacin con nivel de referencia fijado arbitrariamente, indicando el orden y la distancia
respecto de ese valor arbitrario. Por su parte las escalas de razn indican distancia y orden de
un valor respecto de un cero natural. A continuacin en la tabla n1 se sintetizan los detalles
de las escalas revisadas en el tema 4.

Tabla n1: tipos de escala de medicin


Escala Caracterstica Ejemplo
Nominal Escalas dicotmicas que marcan la igualdad Sexo: mujer u hombre
o diferencia de un atributo o su presencia Gripe: tener gripe o no tener
Los niveles son excluyentes. gripe
Depresin: tener depresin o
no tener depresin.

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Ordinal Escala que plantea la relacin mayor o Nivel socioeconmico
menor entre sus atributos. Sus niveles Nivel de escolaridad
plantean un orden
Intervalo Marca distintos niveles de un continuo a Intervalos de edad (18-21
partir del cual se pueden encontrar los aos; 22 a 28 aos; 29-31
atributos. Tiene lmite inferior y superior. aos, 23-35 aos)
Razn Presencia de los elementos incluyendo un Apoyo social 0, no tiene red.
cero real que marca la ausencia de un Nmero de hijos, 0 significa
atributo (el cero puede marcar un valor que no tiene hijos.
neutro o puede marcar que no hay Edad: 0 aos, es que an no
elementos) hay un ao de vida.

10.2 Etapa del Plan de Anlisis de informacin.

Un Plan de Anlisis de datos debe especificar tres elementos. El primero de ellos es mediante
que herramienta tecnolgica o software realizaremos el anlisis. Existen varios de ellos pero
los ms utilizados son SPSS, STATA, SAS y R. A travs de estos programas se pueden llevar
a cabo anlisis estadsticos y sntesis grafica de las variables. Otra herramienta til para el
anlisis de informacin es el Excel, que permite realizar varios de los anlisis de los softwares
estadstico pero de forma menos especfica.
Un segundo elemento a considerar en un plan de anlisis de datos es la descripcin de las
variables que son parte del estudio y que al mismo tiempo permite describir a los participantes
del estudio. En el apartado del plan de anlisis de un proyecto no especificamos que anlisis
descriptivos realizaremos pero s que los llevaremos a cabo. Es importante destacar que la
exploracin descriptiva permite conocer las distribuciones y es informacin fundamental
para tomar decisiones respecto del anlisis inferencial.
Finalmente debemos establecer qu tipo de anlisis realizaremos para probar nuestras
hiptesis y abordar nuestros objetivos del estudio. En este sentido establecemos si
realizaremos anlisis paramtricos o no paramtricos, si compararemos, relacionaremos o
estableceremos modelos explicativos. Para poder completar estos elementos sin tener la
informacin exacta de la muestra, en la etapa de construccin del proyecto lo hacemos de

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


forma terica, estableciendo un plan de acuerdo a los objetivos e hiptesis que hemos trazado
previamente.
A continuacin unos ejemplos respecto del plan de anlisis de datos.
Plan de Anlisis de datos
Se llevar a cabo un anlisis para establecer posible existencia de sesgos de seleccin. En
el anlisis descriptivo se constatarn los supuestos para realizacin de anlisis
estadsticos paramtricos (distribucin normal, homogeneidad de las varianzas del error e
independencia de las observaciones).
Se debe tener en cuenta que los datos sern sometidos a anlisis de comparaciones
intra-grupales e inter-grupales en las variables principales (adherencia al tratamiento,
autoestigma y calidad de vida), de forma de establecer el efecto del programa
psicoeducativo en estos aspectos. El anlisis inter-grupal de la variable principal se
llevarn a cabo a travs de un anlisis de varianza mltiple y anlisis de varianza factorial
en los que se considerarn como factores las variables secundarias y las variables
de control (caractersticas sociodemogrficas, consumo de alcohol y sintomatologa)
Mascayano y cols, 2013. Evaluacin de una intervencin en autoestigma para mejorar
adherencia al tratamiento y calidad de vida en personas con trastorno mental grave"
Proyecto Fonis SA13I10384.

Plan de Anlisis de Datos


Se utilizarn estadsticas descriptivas para describir las necesidades y las caractersticas
sociodemogrficas, clnicas y sociales de la persona con demencia y su cuidador.
Con el fin de determinar qu factores sociales, personales y del cuidador se asocian
significativamente con las necesidades no cubiertas de la persona con demencia, se
realizarn, segn corresponda, anlisis de correlacin y pruebas de comparacin de
grupos.

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Miranda- Castillo (2011) Necesidades y calidad de vida de los adultos mayores con
demencia, y su relacin con factores sociales, personales y del cuidador principal
informal". Proyecto Fondecyt N11100457

10.3 Tipos de Anlisis estadsticos.

10.3.1 Estadstica descriptiva


Como se mencion en el apartado anterior, en el plan de anlisis debemos establecer que se
realizar un anlisis descriptivo de los datos y adems como se probaran las diferentes
hiptesis y objetivos del estudio.
Respecto del anlisis descriptivo, cuando ya hemos recogido informacin y nos enfrentamos
a nuestros datos debemos buscar una forma de sintetizar todas estas observaciones. Dicha
sntesis se realiza a travs de la estadstica descriptiva. Adems para facilitar las conclusiones
y entendimiento del lector presentamos la informacin de manera grfica. Esta sntesis
grafica puede ser en forma de tablas o grficos, y es usualmente llevada a cabo en la etapa
descriptiva pero tambin es utilizada para facilitar la lectura de los anlisis inferenciales.
La estadstica descriptiva busca describir caracterstica de la poblacin o muestra estudiada.
Lo realiza a travs de dos conjuntos de medidas de resumen, las medidas de posicin y las
medidas de variabilidad.
Antes de avanzar debemos recordar que cuando hablamos de caractersticas poblacionales
especficas hablamos de lo que se conoce como parmetros y cuando hablamos de
caractersticas especficas respecto de una muestra hablaremos de estadsticos (confuso
porque estadstico tambin es una forma de decir a las personas profesionales de la
estadstica)
Bueno las medidas descriptivas que observaremos a continuacin refieren a una muestra y
por tanto son Estadsticos.
Medidas de Posicin, las medidas de posicin pueden ser dividas en medidas de tendencia
central y medidas de tendencia no central. Las medidas de tendencia Central entregan
informacin numrica sobre una observancia tpica de los datos. Las medidas de tendencia
central ms utilizadas son la media, la mediana y la moda. Estos estadsticos permiten

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


establecer valores en torno a los cuales tienden a aglomerarse los datos de nuestra muestra.
A continuacin se describen las tres medidas de tendencia central ms importantes:

Media aritmtica: suma de los datos, dividida por el total de datos en una muestra.
Mediana: observacin central de los datos ordenados en una muestra.
Moda: observacin que ms se repite en una muestra.

Las Medidas de tendencia no central permiten ubica la posicin que ocupa un valor dentro
de un conjunto de datos. Los ms utilizados son los percentiles, los deciles y los cuartiles.
Percentiles, es un valor del conjunto de datos que dividir la muestra es cien partes iguales,
los datos se ordenaran de forma acumulativa hasta l y a la vez ser sobrepasado por x
cantidad de datos. Los percentiles pueden calcularse para variables cuantitativas y
cualitativas ordinales nicamente.
Cuartiles, son 3 valores que permiten dividir el grupo de datos en cuatro partes iguales. Los
cuartiles corresponden a los percentiles 25, 50 y 75. Estos son acumulativos de forma que
solo el 25% de los datos se acumulara en torno al tercer cuartil o percentil 75 (imaginemos
un chocolate dividido en 100 partes iguales, el percentil 25 divide 25 pedazos de los 75
restantes, luego el 50, 50 pedazos de los 50 restantes, es cierto corresponde a la mediana; y
luego el tercer cuartil divide 75 pedazos de los 25 restantes).
Deciles, son 9 valores que dividen los datos en 10 partes iguales. Funcionan de forma similar
que los cuartiles y percentiles dividiendo los datos en valores bajo ellos y sobre ellos.
Todas estas medidas permiten establecer el orden de las observaciones, por ejemplo en el
caso de puntajes de pruebas de seleccin podramos decir que puntaje obtuvo el 75% de los
estudiantes que lo rindieron o cual fue el puntaje que obtuvo el 25% de los estudiantes ms
destacados.
Medidas de variabilidad o dispersin permiten establecer la variacin entre los datos ya que
todas las observaciones de una muestra adoptaran diferentes valores. De entre las medidas
de dispersin podemos mencionar:
Rango: diferencia entre la observar mayor y la observacin menor.
Desviacin Estndar: distancia promedio de todos los datos al promedio.
Varianza: desviacin estndar al cuadrado.

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Rango intercuartilico: mide la dispersin que hay en el 50% central de los datos, es decir
es la diferencia entre el tercer cuartil (Q3) o percentil 75 y el primer cuartil (Q1) o percentil
25.

10.3.2 Descripcin Grafica

La descripcin grfica de los datos puede realizarse en base a tablas o grficos. Estos deben
utilizarse en funcin del tipo de variables que estamos analizando. A continuacin se
describen las tablas y grficos en funcin de los tipos de variables.
Descripcin grfica de variables categricas (escalas cualitativas)
Las variables categricas pueden ser descritas utilizando tablas de distribucin de frecuencia.
Estas tablas lo que muestran son las respuestas posibles a la variable categrica.

Tabla n 2: tabla de frecuencias (ejemplo)


Variables frecuencia porcentaje
Sexo Mujeres 34 46
Hombres 50 54

Otra forma de describir variables categricas es a travs de grficos de barra o grficos de


torta. De acuerdo a Newbold, Carlson y Thorne (2008), los grficos de barra son tiles para
resaltar la frecuencia de cada categora permitiendo que se observen los porcentajes
comparadamente. Ahora bien los grficos circulares o de torta nos permiten mostrar la
proporcin de esos porcentajes.
A continuacin se pueden observar ejemplos para cada grfico. Las herramientas de grficos
de Excel son bastante tiles a la hora de elaborar grficos de este tipo. Ahora bien, los
softwares estadsticos permiten obtenerlos en conjunto con el clculo de frecuencia.

Grfico n1: tipos de establecimientos educacionales (Ejemplo grfico de barra)

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Tipo de establecimientos
educacionales
57
60
50
40
30
30
20 13
10
0
Colegios Colegios Particulares Colegios Municipales
subvencionados

Grfico n2: sexo de los participantes (Ejemplo grficos de barra)


sexo de los participantes

46
54 mujer
hombre

Como pueden observar de acuerdo a los valores entre la tabla y el grfico de barra ambas
formas son equivalentes por lo que al momento de analizar la informacin y presentar los
estadsticos descriptivos debemos elegir entre una u otra forma para no ser redundantes.
Ahora bien, es importante destacar que en el plan de anlisis no utilizamos informacin
grfica, nicamente explicamos el tipo de anlisis que realizaremos.

Descripcin grafica para describir variables numricas (escalas cuantitativas).


La distribucin de frecuencia para datos numricos por intervalos se puede representar de la
misma forma que con los datos cualitativos es decir con tablas de frecuencia o grficos de
barra o torta. Ahora bien, es importante saber cmo crear intervalos. Un intervalo se
construye de la siguiente forma:

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


1. Se decide el nmero de intervalos que se requiere crear (si una variable numrica
discreta que quiere convertir en intervalos como la edad, utilice algn antecedente
para convertirla en intervalos como por ejemplo niveles edad utilizados por la Unesco
en los casos educacionales)

2. Establecer la amplitud de los intervalos, determinando el recorrido de los datos (valor


mx.-valor mn.) y luego dividiendo el recorrido por el nmero de intervalos que se
desea crear, lo que nos permite obtener la amplitud de los intervalos (Ejemplo: 27
aos- 18 aos= 9 / 3 intervalos= amplitud de intervalos de 3 aos)

3. Sumar al valor mnimo la amplitud, lo que permitir obtener el valor mximo del
primer intervalo, y as sucesivamente hasta completar el nmero de intervalos

Los intervalos que la compongan deben ser semiabiertos a la derecha de modo que el valor
mnimo est contenido en el intervalo pero el mximo no. A su vez se debe recordar que los
intervalos no deben solaparse entre s y deben contener toda la informacin obtenida en las
observaciones, es decir no puede haber una observacin que pueda esta en dos intervalos al
mismo tiempo ni observaciones que queden fuera de los intervalos.

Tabla n3: edad en intervalos


Edad-aos Frecuencia %
18-21 6 25
22- 25 3 50
26- 29 4 25

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Grfico n3: edad en intervalos

Edad en intervalos
60 50

40
25 25
20

0
18-21 22- 25 26- 29

Otra forma de presentar variables numricas es a travs de histogramas u ojivas. Un


histograma es un grfico formado por barras verticales construidas sobre una lnea recta
horizontal delimitada por los intervalos de la variable mostrada. Los intervalos corresponden
a los de una tabla de distribucin de frecuencias. La altura de cada barra es proporcional al
nmero de observaciones que hay en cada intervalo (Newbold, Carlson y Thorne, 2008). En
el grfico n4 podemos observar un grfico creado en el software SPSS sobre niveles de
hemoglobina en la sangre.

Figura n1: nivel de hemoglobina en la sangre

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Los histogramas nos permiten conocer la forma de una distribucin. Se denomina
distribucin simtrica a aquella en que los valores estn agrupados equilibradamente a un
lado y al otro del punto medio (Newbold, Carlson y Thorne, 2008). Por su parte se denomina
distribucin sesgada a aquella que es asimtrica, es decir las observaciones estn agrupados
en mayor proporcin hacia un lado y otro del centro. Una distribucin es sesgada
positivamente si la cola se extiende ms hacia la derecha en funcin de los valores positivos,
una distribucin sesgada negativamente tendr una cola que se extiende mayoritariamente
hacia los valores negativos. Se debe tener cuidado con estas observaciones porque en algunos
casos matemticamente la distribucin no es de la forma en que se observa en los histogramas
y por tanto este debe complementarse con otros anlisis para conocer bien su distribucin
(Newbold, Carlson y Thorne, 2008)

Figura n2: Histogramas simtricos o asimtricos.

Figura obtenida de la Universidad de Valencia (https://www.uv.es/ceaces/index.htm)

Finalmente, de acuerdo a Newbold, Carlson y Thorne (2008) la ojiva es el nombre que recibe
un grfico de frecuencias acumuladas, es una lnea recta que conecta puntos que representan
porcentaje acumulado de las observaciones situadas por debajo del lmite de cada intervalo
en una distribucin de frecuencias acumuladas.

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


En la grafico n4 se puede observar una ojiva correspondiente a edad de los estudiantes

Grfico n4: distribucin edad estudiantes por rango

Rango etareo de los estudiantes


120

100 100
85
80
75
60

40
25
20

0
18-21 22-25 26-29 30-33

Hasta aqu, nicamente hemos descrito formas de presentar informacin numrica en


intervalos, la razn para ello es que cuando se utilizaran escalas de razn la grfica que se
utiliza no presenta frecuencias sino que las estadsticas de resumen como la media y la
desviacin estndar. Esta informacin cuando es para un solo grupo es preferible presentarla
en tablas. Ahora bien, el uso de grficos se incorpora cuando mostraremos relaciones entre
las variables, como por ejemplo la media obtenida en una prueba de aptitud para 3 grupos de
estudiantes de diferente tipo de establecimiento educacional.

Tabla n 3: Caractersticas socioeconmicas y demogrficas de los participantes.


Total
N (%) 205 (100%)
Edad promedio d.e 742,9
Escolaridad promedio (aos) d.e 63,9

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Grfico n5: promedio prueba de aptitud de acuerdo a tipo de establecimiento

Promedio prueba aptitud


95
90
90
85
85
79
80

75

70
C.Subencionado C. Municipal C.Particular

Recordatorio: Frecuencias
Frecuencias absolutas: Contabilizan el nmero de observaciones en cada intervalo o nivel
de una variable cualitativa (nominal u ordinal)
Porcentajes: proporcin de observaciones en cada categora en relacin con el total de
observaciones.
Porcentaje acumuladas: Es la acumulacin de porcentaje de las observaciones por cada
nivel adicional de la variable.
Figura n3: tabla de frecuencias obtenida a travs del programa SPSS

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


10.4 Tipos de Estadsticos para prueba de Hiptesis
Como mencionamos al inicio del captulo, en el plan de anlisis establecemos que tipo de
anlisis de inferencia llevaremos a cabo para probar nuestras hiptesis y cumplir nuestros
objetivos. Pues bien, inferencia en estadstica implica que debemos estimar valores
poblacionales a travs de los datos de nuestra muestra (parmetros calculados en base a
estadsticos). Bueno, no abordaremos en este tema el procedimiento de prueba de hiptesis
que nos permite conseguir estas inferencias, pero si comenzaremos a conocer algunos de los
estadsticos que necesitaremos. Como hemos mencionado en torno a este curso, el planificar
un proyecto de investigacin se trata de tomar decisiones, y en esta etapa la decisin que
estadsticos debo utilizar cuando realice el procedimiento para la prueba de hiptesis. Eso es
lo que relatamos en un plan de anlisis.
Bueno el estadstico que utilizaremos para inferir informacin depender del tipo de
distribucin que presenten las observaciones que recogemos, y el tipo de variable que
estamos buscando describir. En el caso de que se trata de relaciones o comparaciones entre
variables tambin deberemos utilizar un tipo de estadstico en especfico que nos permitir
concluir respecto de la relacin entre esas variables.
Primero que todo debemos saber que existe otra clasificacin de las variables que tiene que
ver con sus caractersticas. En este sentido, las variables pueden categricas y numricas
(similar a las escalas de medida) las variables categricas son un atributo compuesto de
categoras, es decir sealan la pertenencia de un sujeto a un grupo con determinadas
caractersticas o la presencia de un fenmeno compuesto de diferentes niveles que se puede
poseer o no poseer. Estas variables pueden ser nominales u ordinales, las variables
categricas nominales son aquellas que marcan dos niveles, presencia o ausencia del
atributo, pertenecer a una de esas dos categoras no otorga ningn orden o valor, en cambio
las variables categricas ordinales presentan niveles de un atributo al que se puede
pertenecer y si permiten considerar un orden en su aparicin (de ah el nombre ordinal, de
orden). Respecto a las variables numricas estas puedes ser continuas o discretas. Las
variables numricas continuas pueden potencialmente tener un nmero infinito de valores,
incluyendo valores expresados en decimales, fracciones, etc. Ejemplo de estas variables son

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


el peso corporal, la presin sangunea, los ingresos monetarios, etc. Por su parte las variables
numricas discretas solo puede tener un nmero finito de valores (Taucher, 1999) ejemplo
son el nmero de hijos, el nmero de camas en un hospital, el nmero de estudiantes de un
curso, etc.
Volviendo ahora a los estadsticos, lo primero que debemos tener en cuenta es que estos
pueden dividirse en estadsticos paramtricos y no paramtricos, la diferencia entre uno y
otro grupo es que para los estadsticos paramtricos se asume que las variables son numricas
u ordinales, y adems se distribuyen acorde a la curva normal. Lo que permite utilizar la
teora del lmite central que es la que sustenta la inferencia de los parmetros en base a los
estadsticos. Cuando alguno de estos principios no se cumple entonces es que se han
desarrollado otro grupo de estadsticos, los no paramtricos, que para su clculo utilizan otro
tipo de distribucin. Para saber si nuestras variables principales se distribuyen de acuerdo a
la curva normal se utilizan otras pruebas especficas. Este procedimiento se lleva a cabo en
la etapa inicial de exploracin y descripcin de nuestras variables en el grupo de
participantes.
Adicionalmente otro elemento que afecta los estadsticos para la prueba de hiptesis, es el
nmero de observaciones que realizamos. Si bien hay ocasiones en que con un nmero
reducido de observaciones podemos observar distribuciones normales, se ha llegado a la
convencin que con menos de 30 observaciones se utilice estadsticos no paramtricos.
Ahora bien, dentro de las estadsticos paramtricas y no paramtricos existen diferentes tipos,
los que responden a la hiptesis u objetivo que deseamos probar. En este sentido tenemos en
ambos grupos estadsticos para comparar y otros para relacionar. Esta comparacin puede
ser realizada para un solo estadstico con un valor terico, para dos parmetros provenientes
de muestras independientes o para dos parmetros que provienen de muestras relacionadas e
incluso para ms de dos parmetros (en esa descripcin utilizamos la palabra parmetro
porque las conclusiones se realizan respecto de los parmetros pero utilizando informacin
de la muestra). Como puede apreciarse en la figura n4, en el caso de los estadsticos
paramtricos, cuando comparamos un parmetro con su valor terico o realizamos
comparaciones entre dos parmetros ya sea que provengan de muestras independientes o
relacionadas, utilizamos la distribucin t de student con sus diferentes variaciones, por lo que
los estadsticos son conocidos como t student. Luego cuando queremos realizar una

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


comparacin con ms de dos parmetros tendremos que utilizar una distribucin denominada
F, que da sustento a un estadstico conocido como Anlisis de Varianza (ANOVA). Debe
tenerse en cuenta que cuando se realizan comparaciones entre dos o ms parmetros, lo que
permite establecer cada grupo a partir del cual se calcula el parmetro es una variable
independiente de tipo categrica. Por ejemplo, supongamos que nos interesa conocer si una
nueva intervencin teraputica es mejor que la existente para el tratamiento de mujeres con
depresin postparto. Entre las cosas que mediremos ser el nivel de sntomas depresivos y
por tanto queremos inferir si el tratamiento mejora el nivel de sntomas depresivos en el grupo
intervenido. Para ello al final de la intervencin compararemos la media de los grupos de
intervencin y control. Como pueden observar lo que separa a los grupos es una variable
independiente, la intervencin, tener o no tener la intervencin permite establecer dos grupos
cuyos niveles de sntomas depresivos sern calculados y comparados utilizando su media
aritmtica con la prueba de t student para muestras independientes. Esto es vlido tambin
para estudios no experimentales en donde se comparan por ejemplo una variable en base a
los niveles educacionales, como en el ejemplo de las pruebas de seleccin y el tipo de
establecimiento educacional.
Por su parte si lo que se busca es relacionar variables y ambas variables son numricas,
entonces utilizaremos un estadstico de correlacin llamado correlacin de Pearson. Ahora
bien, si la relacin es entre variables categricas utilizaremos un estadstico que no es
propiamente una prueba paramtrico pero es la nica que cumple ese rol y que se basa en la
distribucin de chi cuadrado de la cual adquiere su nombre. Esto ocurre porque las variables
categricas no pueden distribuirse en funcin de la curva normal por tanto siempre que hay
dos de ellas involucradas, no importa el nmero de observaciones, lo que haremos ser
utilizar el estadstico de chi-cuadrado

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Figura n4: estadsticos paramtricos

1 variable teorica T studen 1 muestra

T student 2
2 muestras
muestras
independientes
independientes
Comparar
T student una
2 muestras
muestra
relacionadas
relacionada

Anova (analisis de
K muestras
varianza)
Estadsticos Parametricos

Variables Correlacin de
continuas Pearson

2 variables
Relacionar Chi- cuadrado
categoricas

T student muestras
1 numrica y 1
independientes o
categorica
relacionadas

Respecto de los estadsticos no paramtricos, existen estadsticos especficos para comparar


parmetros con un parmetro terico, entre dos o ms parmetros providentes de muestras
relacionadas o independientes, o entre ms de dos parmetros. Asimismo existen estadsticos
para relacionar variables (ver figura n5).
Ahora bien, es importante destacar que tanto para los estadsticos paramtricos como no
paramtricos si lo que deseamos es relacionar dos variables y una de ellas es numrica y la
otra categrica, entonces lo que utilizamos son las pruebas de comparacin, interpretando el
resultado como una relacin entre variables. No puede existir diferencia entre dos parmetros
relacionados en base a una variable independiente si es que no existe una relacin entre la
variable numrica descrita a travs de los parmetros comparados (como su media aritmtica)
y la variable independiente que origina los grupos (hombres y mujeres, intervencin o
control, establecimiento educacional, etc)

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Figura n5: estadsticos no paramtricos

1 variable Kolmogorov
teorica Smirnov

2 muestras U de Mann
independientes Whitney
Comparar
2 muestras
Wilcoxon
relacionadas

K muestras Kruskal Wallis


Estadsticos No Parametricos

Variables Correlacin de
continuas Spearman

2 vairables
Relacionar Chi- cuadrado
categricas

1 nmerica y 1 Wilcoxon o U de
categorica Mann Whitney

De esta forma es que podemos construir el plan de anlisis. Previo al recogimiento de los
datos establecemos como esperamos analizarlos en orden a probar nuestras hiptesis y
cumplir los objetivos. Ahora bien, si luego de la recoleccin de datos y el anlisis exploratorio
y descriptivo encontramos alguna diferencia con lo que planebamos podemos establecer
otro tipo de anlisis para los datos.

Referencias
Miranda- Castillo, C (2011) Necesidades y calidad de vida de los adultos mayores con
demencia, y su relacin con factores sociales, personales y del cuidador principal informal".
Proyecto Fondecyt N11100457.

Mascayano, F. Lips, W. Alvarado, R. Lukens, E. Tapia, T, Tapia, E, Schilling, S. Salas, A.


Bustamante, J. Munizaga, P. Cid, P. Dapello, B. 2013. Evaluacin de una intervencin en
autoestigma para mejorar adherencia al tratamiento y calidad de vida en personas con
trastorno mental grave". Proyecto Fonis SA13I10384. Santiago. Chile

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016


Newbold, P. Carlson, W. Thorne, B (2008) Estadstica para administracin y economa.
Sexta edicin. Pearson Prentice Hall. Madrid.
Taucher, E. (1999) Bioestadstica. Segunda Edicin. Editorial ocho libros. Santiago. Chile

Metodologa de Investigacin en Salud I - Recopilado y editado por Thamara Tapia - Ao 2016