You are on page 1of 10

Capítulo 1

Preliminares

1. LA ESTADÍSTICA Y LA INVESTIGACIÓN CIENTÍFICA

1.1 LA ESTADÍSTICA
Es una disciplina que mediante los conocimientos derivados de la lógica y la matemática y a
través de una secuencia ordenada de procedimientos, permite la captación, clasificación,
presentación, descripción, análisis e interpretación de la información necesaria en la
investigación científica.

No recurra a la estadística sólo después de haber captado la información aún siguiendo un


procedimiento planificado

1.2 LA INVESTIGACIÓN CIENTÍFICA


Es la búsqueda sistemática, controlada, empírica y crítica de proposiciones hipotéticas, sobre
relaciones presumidas entre fenómenos naturales.
Puede tener dos propósitos fundamentales: producir conocimientos y teorías (investigación
básica) y resolver problemas prácticos (investigación aplicada)
También es un proceso (lo que significa dinámico, cambiante y continuo), compuesto por una
serie de etapas, las cuales se derivan unas de otras.

La principal característica de la investigación científica es que debe seguir el proceso de manera


ordenada y rigurosa

1.3 ETAPAS DE LA INVESTIGACIÓN CIENTÍFICA


Las etapas de la investigación científica son: planificación, ejecución y evaluación. Estas etapas
involucran una serie de pasos a seguir:

Paso 1. Concebir la idea a investigar


“Todavía no se conoce el sustituto de una buena idea”

Paso 2. Planteamiento del problema de Investigación

Bioestadística Ing, LUZ BULLÓN 1


“Un problema correctamente planteado está parcialmente resuelto, a mayor exactitud
corresponden más posibilidades de obtener una solución satisfactoria”

Los elementos que contiene el planteamiento del problema son:


 Objetivos de la investigación (qué pretende la investigación)
 Preguntas de la investigación (qué respuestas se encontrarán)
 Justificación (por qué debe hacerse la investigación)
 Criterios de evaluación (conveniencia, relevancia social, implicancias prácticas, valor
teórico, etc.)
 Viabilidad de la investigación
 Consecuencias de la investigación

Paso 3. Elaboración del marco teórico


Comprende las labores de detección, obtención y consulta de la literatura, lo cual
permitirá la adopción de una teoría o el desarrollo de una perspectiva teórica. Es
importante porque:

 Ayuda a prevenir errores cometidos en estudios anteriores


 Orienta sobre cómo habrá de llevarse a cabo el estudio
 Amplía el horizonte de estudio y guía al investigador evitando se desvíe del
planteamiento original
 Conduce al establecimiento de las hipótesis
 Inspira nuevas líneas o áreas de investigación
 Provee de un marco de referencia para la interpretación de los resultados de la
investigación

Paso 4. Formulación de la hipótesis


Formuladas a manera de proposiciones, las hipótesis son explicaciones tentativas del
fenómeno investigado. Las hipótesis surgen de los objetivos y las preguntas de la
investigación. Se pueden distinguir dos clases: hipótesis de investigación e hipótesis
estadísticas.

“Los científicos deberían saber que una buena hipótesis científica es el resultado de un
pensamiento creativo y si acaso, “inspirado”, mientras que la hipótesis estadística no es,
en general, sino la expresión tipificada de una fase de la comprobación empírica de una
hipótesis científica”

Paso 5. Definición del tipo de investigación


El tipo de investigación se define en función de los objetivos que se pretenden alcanzar,
de los recursos disponibles y del tipo específico de problema que se quiere abordar
Los diferentes tipos de investigación pueden ser agrupados de acuerdo a cuatro criterios
que forman dicotomías no mutuamente excluyentes. La combinación de estas dicotomías
da cuenta de la estructura específica de cada investigación. (Mendez et al, 1984)
Los criterios se definen basados en:
 El período en que se capta la información
 La evolución del fenómeno estudiado
 La comparación de poblaciones
 La intervención del investigador

Bioestadística Ing, LUZ BULLÓN 2


Paso 6. Selección de la muestra apropiada para la investigación
La primera cuestión a resolver en esta etapa es determinar la unidad de análisis (unidad
estadística), es decir, quiénes son los sujetos u objetos a ser estudiados. Esto depende del
problema a investigar y los objetivos de la investigación. Luego se procede a delimitar la
Población a ser estudiada y sobre la cual se pretende generalizar los resultados
(Inferencia). No siempre es posible o necesario estudiar toda la población (razones de
costo, tiempo, definición de la población, etc.), entonces se obtiene un subgrupo o
muestra de la población

Paso 7. Recolección de datos


 Preparar un instrumento de medición
 Aplicar el instrumento (obtener las observaciones de las variables que son de interés)
 Preparar las mediciones obtenidas para que puedan analizarse correctamente (crítica y
codificación)

Paso 8. Análisis de los datos


 Toma de decisiones respecto a los análisis a realizar (técnicas estadísticas)
 Elección del programa de computación más adecuado
 Procesamiento de los datos
 Obtención de los resultados
Las técnicas estadísticas que se usen dependen de tres factores:
 El nivel de medición de las variables
 La manera como se hayan formulado las hipótesis
 El interés del investigador

“Cada método de análisis tiene su razón de ser y un propósito específico”

Paso 9. Elaboración del reporte de investigación


Finalizada la investigación, deber comunicarse los resultados, el investigador debe
presentarlos teniendo muy claro:
 El contexto en que habrán de presentarse los resultados
 Quienes son los usuarios o receptores de los resultados
 Las características de los usuarios

Bioestadística Ing, LUZ BULLÓN 3


LA ESTADÍSTICA EN LA INVESTIGACIÓN CIENTÍFICA

Reproducido de: McPherson, Glen (1999), Statistics in Scientific Investigation, Its Basis,
Application and Interpretation

Bioestadística Ing, LUZ BULLÓN 4


PROBLEMA

DISEÑO  ANÁLISIS

ENFOQUE: PROCEDIMIENTOS ESTADÍSTICOS:
• Observacional • Síntesis de Datos
• Experimental • Estimación de Parámetros
• Prueba de Hipótesis

PROBLEMA ESTADÍSTICO

CONTEXTO  DATOS
 Población (mayor colección de elementos)  Información factual de las
 Proceso físico (genera resultados o salidas) características (variables)
En ambos, se observa características bien  Números, códigos
definidas de los elementos de una muestra

ANÁLISIS DE DATOS
Depende de:

 Cómo se han formulado las hipótesis


 Nivel de medición de las variables

NIVELES DE MEDICIÓN
En una relación de orden, de menos a más, son:

 Nominal = 
 Ordinal =  < >
 Interválica =  < > + -
 Proporcional =  < > + -  

Bioestadística Ing, LUZ BULLÓN 5


SÍNTESIS DE DATOS
Estadística Descriptiva: univariada, multivariada
Herramientas: tablas, gráficos, números

Análisis Exploratorio de Datos


Herramientas de diagnóstico

INFERENCIA ESTADÍSTICA
 Papel de la teoría de Probabilidades
 La Distribución Normal
 Los supuestos restrictivos de las pruebas estadísticas

Una prueba útil (no significa que sea la mejor) para datos nominales, también lo es
para datos de niveles superiores. Por el contrario, una prueba que es útil para datos
de intervalo es inaplicable para datos de nivel inferior

MUESTREO E INFERENCIA

Población

Muestra
 Muestreo

x
 2
Inferencia
2
s
P

PROBABILIDADES

Roy Jastram, en Elements of Statistical Inference, dice:


“Es un gran progreso científico hacia un dominio intelectual del mundo que nos rodea,
generalizar lógica y precisamente acerca de miles de valores que no hemos visto,
sencillamente por la confianza proporcionada por, por ejemplo, cincuenta o cien de estos
valores”

Al tratar con datos, siempre se llega a un punto más allá del cual el aumento de la
información por observaciones adicionales no merece el aumento de los costos

Bioestadística Ing, LUZ BULLÓN 6


2. PRUEBA DE HIPÓTESIS

2.1 DIFERENCIA DE DOS MEDIAS: CASOS


1. MUESTRAS INDEPENDIENTES Y VARIANCIAS CONOCIDAS
2. MUESTRAS INDEPENDIENTES, VARIANCIAS DESCONOCIDAS E IGUALES
3. MUESTRAS INDEPENDIENTES, VARIANCIAS DESCONOCIDAS Y DIFERENTES

FIG 1. Diagrama de flujo para decidir entre el uso de z y t cuando se realizan inferencias acerca de la media
de la población (* Para usar un procedimiento no paramétrico) (Tomado de DANIEL,W. 2002)

4. MUESTRAS DEPENDIENTES O PAREADAS

Dos poblaciones son relacionadas, dependientes o pareadas cuando dos variables son obtenidas
para un mismo elemento de la población, o una variable es obtenida en un mismo elemento de la
población, en dos momentos distintos o por dos observadores.
Las poblaciones tienen medias y variancias desconocidas, se define la variable aleatoria
D  X  Y , con media  d y variancia  d2 se extrae una muestra aleatoria bivariada de tamaño n,
 X1 , Y1  ,  X 2 , Y2  , ,  X n , Yn  .
La prueba compara los valores del par observado y se basa en la magnitud de esta diferencia. El
procedimiento de prueba es similar al caso de una media considerando a D como la variable en
estudio.
La prueba paramétrica conveniente es la t, usada cuando son satisfechas sus suposiciones,
básicamente la de normalidad

Las hipótesis
Unilateral inferior Bilateral Unilateral Superior
H 0 : D  k H 0 : D  k H 0 : D  k
H1 : D  k H1 : D  k H1 : D  k

Bioestadística Ing, LUZ BULLÓN 7


Estadístico de prueba
Dk
T0 = t n 1
SD / n
Regiones de rechazo
Unilateral inferior Bilateral Unilateral Superior
t0  t , n1 t0  t1 /2, n1 t0  t1 , n1

EJEMPLO. Un ingeniero químico está desarrollando repelente de insectos y quiere saber si una
fórmula recién inventada brinda mayor protección contra la mordedura de insectos que la que
proporciona el producto líder del mercado. En un experimento, a 14 voluntarios se les roció un
brazo con el viejo producto y el otro con la nueva fórmula. Después cada uno metió los brazos en
dos cámaras llenas con igual número de mosquitos, zancudos y otros insectos picadores. El
número de picaduras recibidas en cada brazo se transcriben aquí.

Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Fórmula antigua 5 2 5 4 3 6 2 4 2 6 5 7 1 3
Fórmula nueva 3 1 5 1 1 4 4 2 5 2 3 3 1 2
Diferencia A–N 2 1 0 3 2 2 –2 2 –3 4 2 4 0 1

Descriptive Statistics

Variable N Mean Median StDev SE Mean

FAntigua 14 3.929 4.000 1.817 0.486


FNueva 14 2.643 2.500 1.447 0.387
Dif A-N 14 1.286 2.000 2.016 0.539
Dif N-A 14 -1.286 -2.000 2.016 0.539

Paso 1. Las hipótesis:


Ho: D = 0
H1: D > 0 La nueva fórmula es más efectiva

Paso 2. Nivel de significación: =0.02

Paso 3. Suposiciones necesarias para la validez de la prueba.


 La variable D tiene distribución normal
 La muestra bivariada es aleatoria

Paso 4. Prueba estadística


Prueba t,
Dk
T0 = t n 1
SD / n

Paso 5. Establecer la regla de decisión (criterio para el rechazo o no de Ho)


Rechazar Ho si t0  t 0.98, 14  2.28160
Bioestadística Ing, LUZ BULLÓN 8
Paso 6. Calcular el valor del estadístico de prueba.
n = 14 d  1.286 sD2  2.0162
1.286
t0 =  2.3859
0.539

Paso 7. Conclusión
Se rechaza la hipótesis nula. Hay suficiente evidencia estadística para concluir que la nueva
fórmula es más efectiva que la antigua. El número de picaduras es menor con la nueva fórmula.

CÁLCULO DE LA PROBABILIDAD O valor p

P  t0  2.3859  0.0164713

Luego, como 0.0164713 < 0.02 rechazamos Ho.

Paired T-Test and CI: Antigua, Nueva

Paired T for Antigua - Nueva

N Mean StDev SE Mean


Antigua 14 3.929 1.817 0.486
Nueva 14 2.643 1.447 0.387
Difference 14 1.286 2.016 0.539

98% lower bound for mean difference: 0.056


T-Test of mean difference = 0 (vs > 0): T-Value = 2.39 P-Value = 0.016

2.2 EJEMPLO DE APLICACIÓN DE LA PRUEBA CHI-CUADRADO

http://www.conservacion.org.ar/archivos/Estudio-aves.pdf

El presente estudio se realizó en el norte de la provincia de Misiones (Lat. 25º 51´ S; Long. 54º
10´ O), dentro de la eco-región de la Selva Atlántica. Esta eco-región es considerada un
ecosistema de alta prioridad de conservación a nivel global (ICBP 1992, Myers et al. 2000).
El área de estudio incluye los parques provinciales Urugua-í (84.000 has.) y Horacio Foerster
(5000 has.) y la zona comprendida entre ambos, donde se encuentran remanentes forestales
nativos que alternan con diversos usos antrópicos. Los fragmentos de bosque allí presentes
podrían funcionar como un corredor ecológico para la fauna. El objetivo del presente estudio fue
conocer el uso del hábitat por parte de las aves que utilizan el corredor.

Metodología:
Se utilizó el método de puntos de escucha (Bibby et al. 1998). Los muestreos se realizaron
durante la primavera (octubre) del año 2002 ya que se trata de la época de mayor actividad de las
aves. El área de estudio fue dividida en 5 bandas adyacentes (Figura 1). Dentro de cada banda se
estableció una línea central sobre la cuál se dispusieron puntos cada 150 mts. (20 puntos por
Bioestadística Ing, LUZ BULLÓN 9
línea). En cada punto se registró el total de aves detectadas auditiva o visualmente durante un
lapso de 10 minutos. Los muestreos se realizaron de 6:00 a 10:30 a.m. Todos los ambientes
naturales y antrópicos fueron considerados (selvas y capueras, pasturas y cultivos), y se aseguró
que el número de puntos por ambiente fuese proporcional a su superficie dentro de cada banda.
Se utilizaron guías y grabaciones para la identificación de las especies
(Narosky e Yzurieta 1987, Straneck 1990a y b, Sick 1985, Ridgely and Tudor 1989/1994).
Se calculó el Índice Puntual de Abundancia (Blondel 1971) y la riqueza que fueron comparados
entre líneas utilizando métodos no paramétricos (Chi-cuadrado).

Al comparar el número de individuos entre las línea sólo nueve especies, con más de 20
individuos en total, mostraron diferencias significativas (Chi-cuadrado, p<0,05) (Tabla2)

Anexo: Resultados de las pruebas en MINITAB:

Caso: estudio de aves. Especie Thamnophilus Coerulescens

Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: C8

Test Contribution
Category Observed Proportion Expected to Chi-Sq

1 19 0.2 9.8 8.63673


2 2 0.2 9.8 6.20816
3 6 0.2 9.8 1.47347
4 11 0.2 9.8 0.14694
5 11 0.2 9.8 0.14694

N DF Chi-Sq P-Value

49 4 16.6122 0.002

Bioestadística Ing, LUZ BULLÓN 10

You might also like