You are on page 1of 110

LA HIPOTESIS, EL DISEO DE EXPERIMENTOS

Y LA PSEUDOREPETICIN

INVESTIGACIN CIENTFICA
Cualquier investigacin comienza con una pregunta sobre algn aspecto
d l entorno.
del
t
La escala puede variar segn los intereses del investigador.
En ciencia formal, existe una serie de pasos lgicos relacionados, que
eventualmente llevan a una respuesta provisional o a una revisin objetiva
d lla pregunta
de
t original.
i i l
El esquema se llama Mtodo Cientfico o Mtodo Hipottico-Deductivo
Hipottico Deductivo

LA LGICA ARISTOTLICA
Un silogismo es una forma de razonamiento de tres frases:
-las dos primeras son llamadas premisas, lo que quiere decir enviadas adelante; y
la tercera frase es la conclusin.
conclusin
Fue formulado por primera vez por Aristteles, en su obra lgica Organum.
Ejemplo:
Premisa 1: Dios creo a los peces en el sexto da.
Premisa 2: Los peces viven en el agua.
Conclusin: Los que viven fuera del agua no son peces
peces.

la lgica es un instrumento, un mtodo de razonamiento que procede


clasificando cada cosa de una manera perfectamente determinada.
Por tanto, obliga a ver las cosas como si fueran idnticas a s, INMUTABLES,
PERENNES.

mtodo
mtodo cientfico resolutivo
resolutivo-compositivo
compositivo
1564-1642

1.- Observacin: Hay que partir de la precisin en la consideracin del objeto de la


investigacin, posible solo por la determinacin de datos de observacin minuciosos.
2. Elaboracin de una hiptesis explicativa: La explicacin de un nuevo modo de
concebir el fenmeno requiere una explicacin nueva, lo cual se hace como hiptesis.
3.- Deduccin: Sobre esta hiptesis se hace necesario extraer las consecuencias que
se derivan del hecho de tenerla por verdadera.
4.- Experimento o verificacin: Se montan las condiciones en las que se puedan
4
medir las consecuencias deducidas, procurando unas condiciones ideales para que las
interferencias con otros factores sean mnimos (rozamientos, vientos etc.), y comprobar
si efectivamente en todos los casos, siempre se reproducen dichas consecuencias.

Galileo considera tres tipos de hiptesis:


1) Las metafsicas que no tienen comprobacin alguna
2) Las inventadas para salvar la situacin, como explicacin de las apariencias
3)) Las deductivas p
pensadas p
para p
poder obtener de ellas nuevas relaciones
matemticas entre los elementos de la observacin. Estas son las que realmente
interesan a la ciencia.

Discurso del mtodo para conducir bien la propia razn y buscar la verdad en las
ciencias.
ciencias
Discurso y noTratado para poner evitar la censura eclesistica, no enseando sino
solo hablando.

Descartes pone en duda todos los conocimientos aprendidos a lo largo de su


educacin.
1. No admitir jams cosa alguna como verdadera sin haber conocido con evidencia que
as era.
2. Dividir cada una de las dificultades que examinare, en tantas partes fuere posible y
en cuantas requiriese su mejor solucin.
3. Conducir con orden mis pensamientos, empezando por los objetos ms simples y
ms fciles de conocer, para ascender poco a poco, gradualmente, hasta el
conocimiento de los ms compuestos, e incluso suponiendo un orden entre los que
no se preceden naturalmente
naturalmente.
4. Hacer en todo recuentos tan integrales y unas revisiones tan generales, que llegase a
estar seguro de no omitir nada.

Francis Bacon

Ciclo emprico

Considera que la ciencia se constituye desvelando las leyes naturales a partir de una
multitud de observaciones de fenmenos, siendo stos considerados como
regularidades de la naturaleza, medibles y cuyas relaciones de causa/efecto eran
expresables en frmulas matemticas.

Su libro Novum Organum influy mucho en la aceptacin por parte de la ciencia de la


observacin y experimentacin precisas.
En esta obra mantena que haba que abandonar todos los prejuicios y actitudes
preconcebidas.
El llam
ll en griego
i
eidola
id l o dolos,
d l
a esos prejuicios.
j i i
1. Idola tribus: los pre juicios comunes, debido a modos comunes de pensamiento.
2. Idola specus: los prejuicios propios del individuo.
3. Idola fori: los debidos a una dependencia excesiva del lenguaje
4. Idola teatri: los que provienen de de la tradicin.

Karl Popper: Falsacionismo


No se puede afirmar algo universal a partir de los datos particulares de las
observaciones.
Aunque uno vea millones de cisnes blancos,
blancos no puede afirmar que todos
todos los
cisnes son blancos. En cambio, si encontramos un solo cisne negro podemos
afirmar: No todos los cisnes son blancos.

Popper arguye que las hiptesis son solo conjeturas audaces (a menudo basadas en
muy pocas observaciones) que sometemos a los ms severos tests.
Si lla hi
hiptesis
t i supera llos ttests,
t se lla acepta
t provisionalmente
i i
l
t y se produce
d
ell
progreso cientfico.
p
debe rechazarse si no resiste nuestros tests.
Por el contrario,, la hiptesis

"la Naturaleza responde a nuestros experimentos con un NO DECISIVO


o con un s inaudible (H. Weyl, 18851955)

Gravitational waves from the big bang: alive (March 2014) death (January 2015).

INICIO

OBSERVACIONES
Patrones en el espacio y el tiempo

MODELOS
Explicaciones o teoras

En el Mtodo Cientfico la
pregunta se convierte en
una aseveracin,, formulada
como una prediccin.

HIPTESIS
Predicciones basadas en un modelo

HIPTESIS NULA
Oposicin lgica a la hiptesis
EXPERIMENTO
Prueba crtica de la hiptesis nula

Retiene la Ho
Rechaza la
hiptesis y el
modelo

INTERPRETACION

NO TERMINE AQU
POR FAVOR

Rechaza Ho
Apoya la
hiptesis y el
modelo

Esquema generalizado de los componentes lgicos de un programa de investigacin en ecologa. Ho es el smbolo


para representar a la hiptesis nula.

INICIO

OBSERVACIONES
Patrones en el espacio y el tiempo

MODELOS
Explicaciones o teoras

En el Mtodo Cientfico la
pregunta se convierte en
una aseveracin,, formulada
como una prediccin.

HIPTESIS
Predicciones basadas en un modelo

HIPTESIS NULA
Oposicin lgica a la hiptesis
EXPERIMENTO
Prueba crtica de la hiptesis nula

Retiene la Ho
Rechaza la
hiptesis y el
modelo

INTERPRETACION

NO TERMINE AQU
POR FAVOR

Rechaza Ho
Apoya la
hiptesis y el
modelo

Esquema generalizado de los componentes lgicos de un programa de investigacin en ecologa. Ho es el smbolo


para representar a la hiptesis nula.

1. Aristteles puso un estricto nfasis en la observacin directa


para la obtencin de evidencia.
2. Galileo dijo que hay que partir de la precisin en la
consideracin del objeto de la investigacin, posible solo por
la determinacin de datos de observacin minuciosos.

Osea, sobre la necesidad de ser un buen observador.

INICIO

OBSERVACIONES
Patrones en el espacio y el tiempo

MODELOS
Explicaciones o teoras

En el Mtodo Cientfico la
pregunta se convierte en
una aseveracin,, formulada
como una prediccin.

HIPTESIS
Predicciones basadas en un modelo

HIPTESIS NULA
Oposicin lgica a la hiptesis
EXPERIMENTO
Prueba crtica de la hiptesis nula

Retiene la Ho
Rechaza la
hiptesis y el
modelo

INTERPRETACION

NO TERMINE AQU
POR FAVOR

Rechaza Ho
Apoya la
hiptesis y el
modelo

Esquema generalizado de los componentes lgicos de un programa de investigacin en ecologa. Ho es el smbolo


para representar a la hiptesis nula.

Elaboracin de una hiptesis explicativa: La explicacin de un nuevo modo de


concebir el fenmeno requiere una explicacin nueva, lo cual se hace como hiptesis.
Deduccin: Sobre esta hiptesis se hace necesario extraer las consecuencias que se
derivan del hecho de tenerla por verdadera.

INICIO

OBSERVACIONES
Patrones en el espacio y el tiempo

MODELOS
Explicaciones o teoras

En el Mtodo Cientfico la
pregunta se convierte en
una aseveracin,, formulada
como una prediccin.

HIPTESIS
Predicciones basadas en un modelo

HIPTESIS NULA
Oposicin lgica a la hiptesis
EXPERIMENTO
Prueba crtica de la hiptesis nula

Retiene la Ho
Rechaza la
hiptesis y el
modelo

INTERPRETACION

NO TERMINE AQU
POR FAVOR

Rechaza Ho
Apoya la
hiptesis y el
modelo

Esquema generalizado de los componentes lgicos de un programa de investigacin en ecologa. Ho es el smbolo


para representar a la hiptesis nula.

Descartes: Dividir cada una de las dificultades a examinar, en tantas partes


como sea posible y en cuantas sean necesarias para su mejor solucin.
Popper: Si ha de formar parte de la ciencia, una hiptesis debe ser falsable o
refutable.

INICIO

OBSERVACIONES
Patrones en el espacio y el tiempo

MODELOS
Explicaciones o teoras

En el Mtodo Cientfico la
pregunta se convierte en
una aseveracin,, formulada
como una prediccin.

HIPTESIS
Predicciones basadas en un modelo

HIPTESIS NULA
Oposicin lgica a la hiptesis
EXPERIMENTO
Prueba crtica de la hiptesis nula

Retiene la Ho
Rechaza la
hiptesis y el
modelo

INTERPRETACION

NO TERMINE AQU
POR FAVOR

Rechaza Ho
Apoya la
hiptesis y el
modelo

Esquema generalizado de los componentes lgicos de un programa de investigacin en ecologa. Ho es el smbolo


para representar a la hiptesis nula.

Experimento
p
o verificacin: Un axioma aceptado
p
de Aristteles deca q
que la velocidad de los
cuerpos en cada dependa de sus pesos respectivos: una piedra de dos libras cae dos veces ms
rpida que una de una libra.
Galileo declar q
que el p
peso no tena nada q
que ver en el fenmeno,, y q
que... dos cuerpos
p de p
pesos
distintos... alcanzaran el suelo en el mismo momento.
Los profesores de la Universidad se burlaron de Galileo y ste decidi hacer una prueba pblica en
la Torre de Pisa. Invit a toda la Universidad una maana. Llev una bola de cien libras y otra slo
de una: cayeron por igual y, con un fuerte ruido, golpearon juntas el suelo.
La vieja tradicin era falsa. El experimento de la ciencia moderna lo demostraba.

INICIO

OBSERVACIONES
Patrones en el espacio y el tiempo

MODELOS
Explicaciones o teoras

En el Mtodo Cientfico la
pregunta se convierte en
una aseveracin,, formulada
como una prediccin.

HIPTESIS
Predicciones basadas en un modelo

HIPTESIS NULA
Oposicin lgica a la hiptesis
EXPERIMENTO
Prueba crtica de la hiptesis nula

Retiene la Ho
Rechaza la
hiptesis y el
modelo

INTERPRETACION

NO TERMINE AQU
POR FAVOR

Rechaza Ho
Apoya la
hiptesis y el
modelo

Esquema generalizado de los componentes lgicos de un programa de investigacin en ecologa. Ho es el smbolo


para representar a la hiptesis nula.

Galileo: Sobre la hiptesis se hace necesario extraer las consecuencias que se


derivan del hecho de tenerla por verdadera.
Popper: Si la teora supera los tests, se la acepta provisionalmente y se produce
el progreso cientfico.

INICIO

OBSERVACIONES
Patrones en el espacio y el tiempo

MODELOS
Explicaciones o teoras

En el Mtodo Cientfico la
pregunta se convierte en
una aseveracin,, formulada
como una prediccin.

HIPTESIS
Predicciones basadas en un modelo

HIPTESIS NULA
Oposicin lgica a la hiptesis
EXPERIMENTO
Prueba crtica de la hiptesis nula

Retiene la Ho
Rechaza la
hiptesis y el
modelo

INTERPRETACION

NO TERMINE AQU
POR FAVOR

Rechaza Ho
Apoya la
hiptesis y el
modelo

Esquema generalizado de los componentes lgicos de un programa de investigacin en ecologa. Ho es el smbolo


para representar a la hiptesis nula.

SI DIOS ES LA RESPUESTA
CUL ES LA PREGUNTA?

SE DEBE FORMULAR PREGUNTAS QUE SI SE PUEDAN


CONTESTAR
Las preguntas se deben formular de modo que se puedan contestar con datos
tomados dentro de un perodo de tiempo razonable.
Las preguntas deben evitar el trmino porqu?, pero deben ser
Comparativas
Cul contiene ms especies nativas de ranas: 700 Has de pantano o
700has de asfalto?
Seductoras
Cul es la probabilidad de que mi partido gane las elecciones generales?
Sencillas
Las agregaciones transitorias de Ovis aries asociadas a establecimientos
agrcolas de subsistencia adyacentes, afectan negativamente la supervivencia de
propgulos y el reclutamiento de los juveniles de Abies guatemalensis a 2800m, en
los bosques de conferas de Totonicapn sin exclusin, comparado con parcelas
control de exclusin en los mismos bosques?

Una hiptesis falsable Cul es el mejor


equipo de ftbol en Guatemala?

PREGUNTAS???
Ejercicio de Preguntas

Hiptesis
p
cualitativa descriptiva
p
La proporcin de sexos es de 49:51

Hiptesis Correlacional
A mayor longitud del pi, mayor longitud de del edeago

Hiptesis de diferencia entre grupos


La concentracin de euglenofita es mayor en la costa que en el mar abierto

Hiptesis que establecen relaciones de causalidad


A menor altitud,
ltit d mayor di
diversidad.
id d

El AJUSTE DE LA TOMA DE DATOS A LA


PREGUNTA (DISEO EXPERIMENTAL)

Si usted trabajara en reas habitadas por demonios, estara


en problemas independientemente de la perfeccin de su
di
diseo
(an as) la replicacin y el intercalamiento espacial
de los tratamientos le proveen la mejor pliza de seguro
seguro.
S Hulbert 1984
S.
1984.

PSEUDOREPETICIN Y EL DISEO DE EXPERIMENTOS


ECOLGICOS
Pseudoreplicacin es el error ms frecuentemente cometido por los eclogos.
Definicin:
La utilizacin de rplicas que no son independientes entre s, analizadas
por mtodos estadsticos que asumen independencia de rplicas
rplicas
La replicacin reduce los efectos de la variacin al azar o ruido y proporciona
la estimacin del p
posible error.
La forma en que comnmente se observa pseudoreplicacin en los
experimentos es en:
1. SEGREGACIN TEMPORAL
2 LA SEGREGACIN ESPACIAL.
2.
ESPACIAL
Solucin: Intercalar.

CMO INTERCALAR?

INTERCALAMIENTO
C
Completamente
l t
t all Azar
A
El intercalamiento de
tratamientos y
controles es aleatorio.

T5

C1

C3
T1

Es el tipo de
muestreo mas
sencillo
Se aplica en lugares
poco conocidos

C4

T4

T3
C5

C2

T2

Puede producir segregacin:


Ejercicio Cuadrado Latino 3x3

INTERCALAMIENTO

Diseo de bloques al azar


S
Se distribuyen
di ib
llos
controles y los
tratamientos
estratificados
estratificados.

Reduce la
probabilidad de un
n
efecto influyente pero
no detectado, de
gradientes presentes
y de eventos al azar.

C1
T1
T2

C3

T2

T1

C3

T2
T1

INTERCALAMIENTO
Diseo Sistemtico
Intercalamiento de
tratamientos y
controles es regular.
regular

Este diseo corre el


riesgo de coincidir con
alguna propiedad que
varie a intervalos
peridicos, pero es
raro.

TIPOS DE SEGREGACIN Y CMO DETECTARLAS


Segregacin simple y agregada.
Los controles y los tratamientos no estn intercalados sino segregados, ya sea
en forma contnua o discontnua. El problema es que las reas pueden ser
diferentes.
Tratamiento
1

Control

Dos tratamientos (control y tratamiento) y 3 rplicas para cada uno

TIPOS DE SEGREGACIN Y CMO DETECTARLAS


Segregacin aislada.
Una barrera de algn tipo separa tratamientos y controles. Es menos
recomendable
d bl que ell anterior.
t i P
Por ejemplo,
j
l all usar cmaras

d
de ambiente
bi t
controlado, acuarios, etc.

CAMARA 1

CAMARA 2

TIPOS DE SEGREGACIN Y CMO DETECTARLAS


Rplicas fsicamente interdependientes.
Las rplicas estn conectadas entre s y los tratamientos tambin. Se usa
en acuarios
i o cmaras

con sistema
i t
d
de mantenimiento
t i i t comn.

TIPOS DE SEGREGACIN Y CMO DETECTARLAS


Sin replicacin.
La utilizacin de una sola rea como tratamiento y una sla rea como
control. Nunca se debe usar inferencia estadstica, cuando este modelo
es la nica solucin.

Tratamiento

Control

PREVALENCIA DE LA PSEUDOREPLICACIN

48% de todos los estudios estn pseudoreplicados


(Hurlbert 1984)
71% de los estudios que utilizan ANOVA tienen
errores de diseo (Underwood 1981)

OMNIPRESENCIA DE LA PSEUDOREPLICACION
Muchos de los estudios ecolgicas presentan el problema de pseudoreplicacin
debido a:
1. Falta de rplicas
1
2. Segregacin de las rplicas (falta de intercalamiento)
3. Utilizacin de muestras que no son independientes.
Los tres tipos de pseudoreplicacin ms comunes son:
Pseudoreplicacin simple: No hay intercalamiento de muestras.
Pseudoreplicacin por sacrificio: Existen rplicas verdaderas pero los datos de
las rplicas se juntan para realizar el anlisis estadstico o cuando una o ms
medidas de una unidad de muestreo son consideradas como rplicas
i d
independientes.
di t
Pseudoreplicacin temporal: Cuando muestras mltiples de cada unidad
p
se obtienen en fechas o tiempos
p distintos.
experimental
QUE HACER?

FUENTES POTENCIALES DE CONFUSIN EN UN


EXPERIMENTO Y MEDIOS PARA MINIMIZAR SU EFECTO
1 C
1.
Cambios
bi temporales
t
l Tratamientos
T t i t control
t l o testigos
t ti
2. Efectos del procedimiento. Tratamientos control o testigos
3. Sesgo del experimentador. Asignacin al azar de los tratamientos a las unidades
experimentales. Asignacin al azar de procedimientos.
4 Variabilidad generada por el experimentador.
4.Variabilidad
experimentador Replicacin de tratamientos
5.Variabilidad inicial o inherente en las unidades experimentales. Replicacin de
tratamientos. Intercalamiento de tratamientos
6. Interferencia no diablica (eventos al azar). Observaciones concomitantes
7 Interferencia diablica
7.
diablica. Vigilancia eterna
eterna, exorcismo
exorcismo, sacrificios humanos
humanos.

Y CUANDO ES INEVITABLE LA PSEUDOREPLICACION?


Indicar explcitamente la pseudoreplicacin
No utilizar inferencia estadstica. Cuando se usa estadstica, las diferencias encontradas
se refieren a diferencias de sitio y no de tratamiento.
Estadstica multivariada y no paramtrica?

COMO DISEAR Y DESARROLLAR UN ESTUDIO


1. Pregunta
g
Formule clara y concisamente el tema de inters en forma de pregunta. La coherencia y
claridad de los resultados dependern de que tan clara es la concepcin inicial del
problema.
2. Rplicas
Lleve a cabo el muestreo con varias rplicas dentro de cada combinacin de tiempo,
localidad y otras variables controlables. Las diferencias entre tratamientos slo
pueden ser demostradas si se conocen las diferencias dentro de los tratamientos.
3. Azar
Tome un nmero igual de muestras con rplicas y escogidas al azar para cada
combinacin de variables controlables (tiempo, lugar, etc.). El colocar las muestras
en lugares representativos o tpicos no constituye muestreo al azar (muestreo al
troche moche).
4. Control
Para examinar si una condicin tiene un efecto, tome muestras en donde la condicin
est presente y en donde est ausente, pero las verifique que las dems variables
sean similares. Los efectos nicamente pueden demostrarse comparando con un
control.

COMO DISEAR Y DESARROLLAR UN ESTUDIO


5. Diseo
5
Lleve a cabo un muestreo preliminar que proporcione las bases para evaluar el diseo
de muestreo y las opciones del anlisis estadstico. Los investigadores que se
saltan este p
paso p
por falta de tiempo
p acaban p
perdiendo ms tiempo.
p
6. Eficiencia
Verifique que el mtodo e instrumentos de muestreo realmente muestren la poblacin
que se piensa
piensa, con una eficiencia igual y adecuada para todo el rango de
condiciones de muestreo. Las variaciones en la eficiencia de muestreo entre reas
producen sesgos en la comparacin de las reas.
7. Estratificacin
Si el rea de muestreo contiene patrones ambientales a gran escala, divida el rea en
subreas relativamente homogneas y reparta las muestras en proporcin al tamao
de las subreas
subreas.
8. Muestreo y precisin
Verifique que el tamao de la unidad de muestreo sea apropiado al tamao, densidad y
di t ib i espacial
distribucin
i ld
de llos iindividuos
di id
que se estn
t muestreando.
t
d E
Estime
ti
ell nmero

de muestreos replicados necesarios para obtener la precisin requerida.

COMO DISEAR Y DESARROLLAR UN ESTUDIO


9. Distribucin de los datos
Examine los datos para ver si la variacin del error es homognea, normalmente
distribuda e independiente de la media
distribuda,
media. Si no lo es
es, como en la mayora de los
casos donde se examinan datos de campo, entonces:
Transforme los datos apropiadamente (logartmica, raiz cuadrada, arc-seno y
recproco)
Utilice un procedimiento de distribucin libre (no paramtrico)
Utilice un diseo de muestreo secuencial
10. Resultados
Ya que se escogi el mejor resultado estadstico para examinar la hiptesis, acepte el
resultado. Un resultado no deseado o inesperado no es razn vlida para rechazar
ell mtodo
d utilizado
ili d y tratar d
de encontrar otro mejor.
j

Seleccionar
S
l
i
llos sitios
ii d
de
tala y no tala en los tres
tratamientos
Para evaluar el efecto
sobre la diversidad
6 replicas por tratamiento.
Los sitios de extraccin
son los
l cuadrados,
d d
llos
sitios de no tala son los no
marcados.

LO MISMO PERO AHORA


CON 6 RPLICAS POR
TRATAMIENTO

EVALUACIN DE UN MEDICAMENTO CONTRA


HIPERTENSIN

Presin
arterial
sistlica

Y1

Y2

Presin
arterial
sistlica

Y1-Y2 mide el efecto del tratamiento?

EVALUACIN DE UN MEDICAMENTO CONTRA


HIPERTENSIN

Presin
arterial
sistlica

Y1

Y2

Y1-Y2 mide el efecto del tratamiento?

Presin
arterial
sistlica

No hay
y
repeticiones y
hay factores de
confusin.

Se requiere repeticiones de cada


tratamiento

Se realizaron cinco mediciones durante cinco das,


en cada mujer
j
Hay cinco repeticiones

Y11, Y12 Y13 Y14 Y15

Presin
arterial
sistlica

Y21, Y22 Y23 Y24 Y25

Presin
t i l
arterial
sistlica

Y1-Y2 mide el efecto del tratamiento?

FACTORES DE CONFUSIN
Se realizaron
ea a o cinco
c co mediciones
ed c o es du
durante
a te c
cinco
co d
das,
as, e
en cada mujer
uje

Y21, Y22 Y23 Y24 Y25

Y11, Y12 Y13 Y14 Y15


Edad 40
Gonorrea

Y1

Presin
arterial
sistlica

Y2

Presin
arterial
i tli
sistlica

Edad 47
Candidiasis

Toma caf

No Toma caf

No Estrs

Estrs

Etapa frtil

Menstruacin

Deportista

No deportes

Etc.

Etc.
Pseudorepeticiones

Y1-Y2 mide el efecto del tratamiento?

Se requiere repeticiones
verdaderas de cada tratamiento

Cinco mujeres diferentes por cada tratamiento: factores


aleatorios diferentes dentro de cada tratamiento

Y11, Y12 Y13 Y14 Y15

Presin
arterial
sistlica

Presin
arterial
sistlica

Y21, Y22 Y23 Y24 Y25

Y1-Y2 mide el efecto del tratamiento?

1. Tiene que realizar un diseo experimental para medir el efecto del aprovechamiento
de madera sobre la biodiversidad. Tiene transectos de 100 metros por taxn. Coloque 6
rplicas por tratamiento (bosque no perturbado vs reas de aprovechamiento).
aprovechamiento)

2. Analice: Replicacin, hiptesis, diseo, anlisis de datos.


3. Cul es la relevancia de los grados de libertad.
4. Compare resultados con el ttulo. Discuta.

LA INFERENCIA ESTADSTICA

Ronald A. Fisher
17 de febrero de 1890 29 de jjulio de 1962.
Fisher es uno de los principales fundadores de la gentica de poblaciones. Participacin en la
Sntesis Evolutiva Moderna (Teora Moderna de la Evolucin).
Logr conciliar la biometra con la gentica mendeliana. Era defensor de la Eugenesia.
En 1947 fund la revista Heredity: An International Journal of Genetics.

Estadstica Descriptiva
Un estadstico es un valor que resume la informacin contenida en un juego de
observaciones o datos.
p ) interesa un p
par de estadsticos con informacin de:
Generalmente ((no siempre)
1) El valor tpico o promedio de las observaciones (media aritmtica o promedio hasta
la mediana)
2) La magnitud de la variacin entre ellas. Por ejemplo, la Varianza (s2) o hasta
la Desviacin Estndar (s)

La grfica presenta dos juegos de datos con la misma media (7) pero diferentes
varianzas. Cada punto representa una observacin.
En a la mediana es bien diferente de la media. En b es igual.

Cul estadstico
representa mejor el valor
promedio?
Si necesita el valor promedio
de las observaciones
observaciones, elija la
media.
Si necesita el valor de la
observacin tpica, elija la
mediana.

Ejemplo: Hay un rbol de sotobosque cuyos frutos son consumidos y sus


semillas dispersadas por una sola especie de murcilago.
1. Ud. registr el nmero de frutos removidos por noche (supuestamente por
murcilagos), de un gran nmero de rboles.
2. Los resultados son muy variables:
a) en la mayora de rboles muy pocos frutos fueron removidos
b) en unos pocos rboles hay altas tasas de remocin de frutos.
Debido a la influencia numrica de los rboles populares, los valores de la media y la
mediana son muyy diferentes. La media es mayor
y que
q la mediana.

MEDIA: Nmero Promedio de frutos removidos por rbol.


MEDIANA: Nmero de frutos removidos del rbol tpico.
Qu representa la Media? La actividad de los murcilagos (ndice de la cantidad de
frutos consumidos por los murcilagos)
Qu representa la Mediana? La dispersin de semillas (el rbol tpico de la poblacin
ha dispersado pocas semillas este ao).
)

MEDIDAS DE VARIABILIDAD: LA VARIANZA Y LA DESVIACIN ESTNDAR


La Desviacin Estndar (S) es el promedio de desviacin de las puntuaciones con
respecto a la media. Se expresa en las medidas originales de medicin de la
distribucin.
s = (X-)
(X )2/N
La Varianza es la desviacin estndar elevada al cuadrado (s2).
Hay que tener en cuenta de que la varianza puede verse muy influida por los outliers y
se desaconseja su uso cuando las distribuciones de las variables aleatorias tienen colas
pesadas.

PODER ESTADSTICO I
El poder estadstico representa la probabilidad de rechazar la hiptesis nula
cuando es realmente falsa.
Representa la capacidad de una prueba para detectar si existen diferencias
estadsticamente significativas o asociaciones de una magnitud determinada.
Esto ocurre cuando se hace un contraste de hiptesis
la hiptesis que se contrasta es que

no existen diferencias entre los tratamientos (hiptesis nula)


frente a la hiptesis alternativa de

los tratamientos son realmente diferentes.

PODER ESTADSTICO
La prueba de significancia estadstica calcula la probabilidad de que los resultados
obtenidos en una investigacin se deban al azar, cuando la hiptesis nula es cierta:

No existen diferencias entre ambos grupos.


g p
Esta probabilidad es el grado de significancia estadstica o valor de p.
Basndose en esta probabilidad, se decidir rechazar o no la hiptesis nula.
As, cuanto menor sea el valor de p, menor ser la probabilidad de que los resultados
obtenidos se deban al azar y mayor evidencia habr en contra de la hiptesis nula
nula.
Si dicha probabilidad es menor que un valor de p fijado previamente (habitualmente se
toma p<0,05), la hiptesis nula se rechazar.

As, cuando el valor de p est por debajo de 0,05, se dir que el resultado
es estadsticamente significativo y ser no significativo en cualquier otro
caso.
caso

As pues, a partir de los resultados de un estudio, puede haber cuatro


conclusiones posibles:
a) que existen diferencias entre los grupos que se comparan cuando
realmente las hay.
b) que no hay diferencias, cuando stas no existen.
En ambos casos, no se comete ningn error.
c) Tambin se puede concluir que existen diferencias cuando no las hay.
Es decir, puede rechazarse la hiptesis nula cuando en realidad es verdadera.

Si esto ocurre, se comete un error de tipo I o error


La probabilidad de cometer un error de este tipo es lo que mide precisamente
el grado de significacin p.

d) En algunas ocasiones, por el contrario, los resultados de un estudio no


son significativos. Se habla entonces de estudios negativos.
No obstante, la ausencia de significacin estadstica no implica
necesariamente que no exista relacin entre el factor de estudio y la respuesta
respuesta.
Puede ocurrir, que an existiendo tal asociacin o una diferencia
biolgicamente relevante, el estudio haya sido incapaz de detectarla como
estadsticamente significativa.
En estudios de este tipo se concluir que no existen diferencias cuando
realmente s las hay. Este error se conoce como error de tipo II.

La probabilidad de cometer un error de este tipo suele


denotarse por y su complementario, 1-, es lo que se
conoce como poder estadstico

Posibles conclusiones tras una prueba estadstica de contraste de hiptesis


hiptesis.
Resultado de la prueba

Existe asociacin o
diferencia
Realidad
No existe asociacin o
diferencia
= probabilidad de cometer un error de tipo I.
= probabilidad de cometer un error de tipo II.

Asociacin o
diferencia
significativa

Asociacin
o diferencia
no significativa

No error

Error de tipo II

(1- )

E
Error
de
d titipo I

N error
No
(1- )

Los costos para la Conservacin, de cometer un error estadstico Tipo I o de Tipo II.
Cul lado, el derecho o el izquierdo, le preocupa ms a usted?

"Llamar
Llamar al especialista en estadstica despus de haber
hecho el experimento puede no significar ms que pedirle
que haga un anlisis postmortem:
es posible que sea capaz de decir a causa de qu muri el
experimento"
Congreso Estadstico Hind, 1938

PODER ESTADSTICO II
La prueba de significancia estadstica calcula la probabilidad de que los
resultados obtenidos en una investigacin se deban al azar (la probabilidad de
rechazara una hiptesis nula falsa).

No existen diferencias entre ambos grupos.


Esta probabilidad es el grado de significancia estadstica o valor de p.
Basndose en esta probabilidad, se decidir rechazar o no la hiptesis nula.
As, cuanto menor sea el valor de p,
As
p menor ser la probabilidad de que los resultados
obtenidos se deban al azar y mayor evidencia habr en contra de la hiptesis nula.
Si dicha probabilidad es menor que un valor de p fijado previamente (habitualmente se
t
toma
p<0,05),
0 05) lla hi
hiptesis
t i nula
l se rechazar.
h

As, cuando el valor de p est por debajo de 0.05, se dir que el resultado
es estadsticamente significativo y ser no significativo en cualquier otro
caso.

The irony is that when UK biologist Ronald Fisher introduced the P value in the
1920s, he did not mean it to be a definitive test .
Fisher quiso que p fuera slo una parte de un proceso no numrico muy fluido.
Pero Fisher y colaboradores fueron atacados por el movimiento para hacer que la
toma de decisiones basada en la evidencia fuera rigurosa y objetiva (encabezado
por Jerzy Neyman y Egon Pearson). Ellos introdujeron el poder estadstico, falsos
positivos, falsos negativos, etc.
y ellos deliberadamente excluyeron el valor de p de Fisher.

Egon Pearson

Jerzy Neyman

El teorema fundamental de Neyman


Neyman-Pearson
Pearson describe el criterio ptimo para distinguir dos
hiptesis simples H0: =0 y H1: =1.
El criterio consiste en rechazar la hiptesis =0 tras observar X cuando la razn de las funciones
de verosimilitud cumpla

y k sea tal que

donde es el nivel de significancia elegido

Tons, en una prueba de significancia estadstica hay dos nmeros que pueden ser
fcilmente confundidos:
1. El p-value de la prueba estadstica.
2. El nivel de significancia o alfa.
Ambos son probabilidades y varan de cero a uno.

El valor alfa nos da la probabilidad de un error tipo I (rechazar una hiptesis nula que es
verdadera).
En una prueba con significancia de 0.05 = 1/20, una hiptesis nula verdadera ser
rechazada una de cada 20 veces.
El rea bajo la curva representa las frecuencias relativas o probabilidad
probabilidad.
Podemos calcular el poder estadstico determinando la probabilidad de que la media de
nuestra muestra caiga
g en el rea bajo
j la curva de la regin
g
azul ((1-b)) .

Para determinar si los valores observados son significativos, comparamos los valores
de y p. Puede ocurrir que:
1. El valor p < . Rechazamos la hiptesis nula y decimos que el resultado es
estadsticamente significativo. El efecto no est explicado por el azar.
2. El valor p > . No podemos rechazar la hiptesis nula. El resultado no es
estadsticamente significativo. Los datos observados se pueden explicar por azar.
- Mientras ms pequeo , es mas difcil obtener un resultado significativo.
- Mientras mas grande , tons, mas fcil obtener resultados significativos.

En su obra Statistical methods and scientific inference (1956) Fisher escribi:


Ningn investigador tiene un nivel de significacin fijo, con el cual ao tras ao y en
toda circunstancia rechaza las hiptesis; ms bien entrega su mente(gives his mind
to) a cada caso particular a la luz de la evidencia y de sus ideas.
Actualmente
c ua e e la
a esca
escala
a de los
os niveles
e es de ssignificacin
g cac sue
suele
e interpretarse
e p e a se
razonablemente de la siguiente manera:
NIVEL DE SIGNIFICANCIA

INTERPRETACIN

P < 0.01

Fuerte evidencia en contra de la hiptesis nula

0.01< P < 0.05

Evidencia moderada en contra de la hiptesis


p
nula

0.05 < P < 0.1

Evidencia Sugestiva

P>0
0.1
1

No existe evidencia real

Fuente: Nuzzo 2014, Nature.

Un estudiante de doctorado obtuvo datos para su tesis de 2000 personas (polticos).


Ah demostr que los polticos moderados ven las sombras en tonos grises con ms
precisin que cualquiera de los polticos extremos de derecha o de izquierda.
La hiptesis era sexy y los datos la apoyaban claramente:
El valor P fue de 0.01,
0 01 interpretado usualmente como muy
muy significante
significante
Pero luego, pensando en publicarlo en una revista de alto impacto, le pas la
borrachera: con la posibilidad de controversias por la reproducibilidad del experimento,
l y su asesor replicaron el estudio.
Con datos extra el valor de P pas a 0.59, ni siquiera cercano al convencional 0.05
El efecto haba desaparecido y con esto, los sueos de un joven de ser inmortal.

Un nuevo enfoque Bayesiano seal que los umbrales tradicionales de decisin son
muy optimistas y explican la dificultad de reproducir un montn de estudios publicados.
Ellos sugieren que se utilice un valor p < 0.001, o, p < 0.0053.

SELECCIN DEL TAMAO DE LA


MUESTRA
La muestra es en esencia, un subgrupo de la poblacin

Muestras probabilsticas (e.g. encuestas)


Dada una poblacin de N cul es el menor nmero de unidades muestrales (personas,
aldeas, sitios, animales, plantas, etc) que se necesitan para tener una muestra (n) que
me asegure un error estndar menor de 0.1?

Como no se conocen los valores de la poblacin, se utilizan


estimadores de los valores promedio y las varianzas de las
poblaciones
= valor estimado de una variable determinada (Y) que nos interesa conocer
V = Varianza de la poblacin con respecto a determinadas variables
S2 = Varianza de la muestra
S = Error estndar
SE

((dependiente del nmero

de elementos muestreados))

n
n
=
Se selecciona una muestra, n

Con los estimados de la


muestra se infieren
valores de la poblacin

- = ?
? = error estndar

Resumiendo:
Para una determinada varianza (V) de y, qu tan grande debe ser mi muestra?
1) n = S2 = varianza
i
d
de lla muestra
t
= p (1-p)
(1 )
V2
varianza de la poblacin
SE2
2)) n =

n _
1 + n/N

Ejemplo:
S determin
Se
d t
i que existen
i t 1176 pescadores
d
en lla regin
i C
Caribe
ib d
de G
Guatemala,
t
l que
ganan alrededor de Q1000-Q4500 mensuales, utilizando mtodos artesanales.
Una ONG yya se gast
g
el dinero p
pero necesita saber cual es la diversidad de la p
pesca y
cul es el nmero de pescadores (n) que se debe entrevistar para tener un error
estndar menor de 0.015, debido a que ya no pueden entrevistarlos a todos.
p = Probabilidad del nivel de confianza (0
(0.015
015 0.9)
0 9)
n = Tamao de la muestra (n = Tamao de la muestra sin ajustar)
N = tamao de la poblacin
= valor promedio de una variable = 1, un pescador (Q.1000-4500), por lancha
SE = error estndar = 0.015
V2 = Varianza de la poblacin definido como SE2: Cuadrado del error estndar
S2 = Varianza de la muestra expresada como la probabilidad de ocurrencia de

Cuntos alumnos de la Universidad se debe entrevistar


para estimar sus conocimientos, actitudes y prcticas
respecto al calentamiento global.

Y si slo le tocan de ingeniera?

Estratificacin de la muestra probabilstica


La estratificacin aumenta la precisin de la muestra e implica el uso deliberado de
diferentes tamaos de muestra para cada estrato, a fin de lograr reducir la varianza de
cada unidad de la media muestral.
Estrato
dePescadores
1
2
3
4
5
6
7
8
9
10

Area deTrabajo
de Trabajo
delosPescadores

TotalPoblacin
Total
Poblacin
(fh)=0.2534
Nh (fn)=nh
Mariscos
53
Sartn
109
RioDulce
215
El Estor
87
PlayaDorada
98
Livingston
110
Polochic
81
BahadeAmatique
221
PuntadeManabique
151
PuntaHerrera
51
N=1176

Muestra
nh=Nh xfh
13

fh = n/N = Ksh
fh = nh/Nh = ksh
ksh = n/N
Ksh = n/N = 298/1176 = 0
0.2534
2534

nh=n=298

En un nmero determinado de elementos muestrales (n = nh) la varianza


d lla media
de
di muestra
t d
de () puede
d reducirse
d i
all mnimo,
i
sii ell ttamao
d
de lla
muestra para cada estrato es proporcional a la desviacin estndar dentro
del estrato.

TAMAO DE LA MUESTRA (NMERO DE RPLICAS)


PARA UNA PREGUNTA NO COMPARATIVA
Ejemplo: Necesita saber cuantas muestras debe tomar con una red de arrastre en una
quebrada, para estimar la densidad de poblacin de ninfas de Odonata, con un error
relativo de 5%, donde la media estimada es de 17 individuos por unidad de evaluacin
y s2 estimado es 37.
1) P
Precisin
i i Relativa:
R l ti
Estima el nmero mnimo de rplicas que se necesita para disminuir el error estndar
de la media (SEx), a un valor aceptable. Krebs sugiere estimar el nmero mnimo de
muestras p
para reducir el error estndar a 5% de la media de la muestra,,
esto es: 0.05x
as podemos sustituir SEx por 0.05x en la frmula:

0.05x = s2 / n
n = [s2est/0.0025x2 ]

Usando la ecuacin anterior


anterior, para estimar el tamao de la muestra para una pregunta
no comparativa:
Ud. decidi que no tiene tiempo para obtener tantas muestras (cincuenta y algo), de
manera que decide relajar el error relativo a 25% en lugar del 5%.

Qu cambios debe hacer en las ecuaciones anteriores?


Qu tan grande es el n ahora?

Importancia de los estadsticos de la muestra como estimadores de los


parmetros de la poblacin.
La poblacin de caimanes de una laguna est amenazada. Le piden estimar cul es la
longitud promedio de caimanes adultos y subadultos de la laguna. El profe xq es pilas
sabe que hay 99 caimanes adultos y subadultos cuya longitud est dada por la
siguiente tabla:

Saque la media, la varianza y la desviacin estndar

Ahora, Ud. no tiene idea de esos valores, as que debe hacer un muestreo de la
poblacin (submuestrear):
1) Ud
Ud., bien pilas
pilas, captur y midi un caimn (n=1)
(n=1). Puede responder a la pregunta
original? Porqu?
2)) Que p
pasa si ud. captur
p
el caimn No. 89.
3) Que pasa si captura n=3, los caimanes 89, 55 y 39. Y la varianza?
4) Que pasa si aumenta n a 10
10, al azar: caimanes 22
22, 51
51, 78
78, 2
2, 56
56, 8 y 28
28.
5) Utilice esos valores, explore la media, varianza y desviacin estndar para
determinar Error Estndar de la Media:
SEx= s/n = s2/n
6) Estime el Lmite de Confianza de 95%:
P((-(SEx*t) (+ (SEx*t)) = 0.95
t= valor de t en la tabla para = 0.05
= promedio
di obtenido
bt id
SEx= Error Estndar de la Media
P: quiere decir probabilidad.

Ejercicio:
Usted desea conocer el contenido de mercurio en la poblacin de lobinas del lago
de Atitln. Casualmente, este ao sali publicado el artculo:
Cano E
Cano,
E.B.
B 2015
2015. Mercury accumulation in largemouth bass (Micropterus
salmoides) in a Guatemalan lake. Journal of Lake Fisheries 43(4): 567-570.
En el artculo usted p
pudo encontrar los siguientes
g
datos:
Especie
Micropterus salmoides

Tamao
muestra
10

Media
30mg/100g

Desviacin
Estndar (S)
7
7.5
5 mg/100g

Cuntas lobinas de Atitln se necesitan para llevar a cabo la estimacin del


contenido de mercurio?
Nota: Usted necesita el estudio con un lmite de error de 3mg (osea 30m +- 3mg):
LE= 3
LE
El nivel de confianza (nc) que busca es de 95%.
n = (nc2 * Var)/LE2
nc = nivel de confianza de que con la muestra se obtenga el promedio de mercurio
que contiene la especie de pez, donde: nc = Z(1-alfa/2)

95% ---> alfa= 1- 0.95


0 95 = 0.05
0 05
nc = Z(1-alfa/2)
nc = Z(1-alfa/2) = Z(1-0.05/2)
nc= Z(0.975)

nc= P(Z<z) = 0.975

buscamos en el interior de la tabla de la normal estandarizada el valor 0.975 y


de los mrgenes deducimos que z=

You might also like