You are on page 1of 54

INSTITUTO DE MATEMÁTICA Y FISICA

La Estadística y el Método Científico

DOCENTE Gloria Correa Beltrán


Apunte basado en:

De Martha Aliaga

• Mendoza, Argentina
• Ph.D. Estadística, University of Michigan, 1986.
• M.A. Estadística. CIENES. Universidad de Chile. Chile, 1967.
• B.A. Matemática, Universidad de Buenos Aires, Argentina.

http://dta.utalca.cl/estadistica/
¿Por qué necesitamos del conocimiento científico?

El hombre aspira a captar el orden que existe en el mundo de los


fenómenos para hacerlos inteligibles, dar una explicación racional de
ellos y hacerlos manejables o previsibles una vez que conoce sus
causas.
La palabra ciencia viene del latín “scientia” que significa Conocimiento.

¿Cómo logramos ese conocimiento?


R. A través del Método Científico

El Método Científico es un conjunto de principios y procedimientos para la
búsqueda sistemática del conocimiento.

El método científico, en conjunto con la estadística, nos provee de este


conjunto procedimientos para obtener y resumir información para
tomar decisiones.
Etapas del Método Científico
Características de método científico:

• El método científico es un proceso iterativo de aprendizaje

• Los resultados no dan respuestas definitivas.

• Los resultados pueden sugerir nuevas hipótesis

• Una decisión puede tomarse ahora pero puede estar sujeta a


prueba en un tiempo más

• Es un proceso que nunca termina


¿Qué es la Estadística?

La Estadística es “la ciencia de la recolección y análisis de datos para la


toma de decisiones”.

Es la ciencia de los datos1.

Recolección

Análisis

Interpretación

Presentación
de resultados

1Ferreiro, O. y Fernández de la Reguera, P. (1988) “La estadística, una ciencia en la controversia”. Revista
Universitaria 25: 13-17. http://www.educandus.cl/estadistica/
¿Estadística y Método Científico?

• La Estadística y el Método Científico nos proveen una colección de


principios y procedimientos para obtener información, resumirla y
tomar decisiones.

• Este es un proceso de aprendizaje iterativo del mundo que nos


rodea.
Conceptos Básicos

• Población es el grupo de objetos o individuos bajo estudio, acerca


de los cuales queremos obtener información.

• Muestra es una parte de la población de la cual se obtiene


información.

• Inferencia Estadística es el
proceso de sacar
conclusiones acerca de
una población basados en
información de una
muestra de esa población.
Conceptos Básicos
El lenguaje de toma de decisiones en Estadística

¿Debo tomar Aspirina o Migranol para el dolor de cabeza?

• Laboratorios Bayer me dice que


tome Aspirina Teoría antigua

• Laboratorios Migra me dice que


tome Migranol Teoría nueva

Tenemos dos teorías que compiten…

En estadística las vamos a llamar HIPÓTESIS


Hipótesis
La hipótesis es una explicación posible a la situación problema o una
respuesta posible a la pregunta planteada

• Se expresa en términos afirmativos.


• Se basa en el conocimiento científico existente, en la experiencia
previa del investigador, o en la observación de hechos relacionados
con el problema.
• Las dos teorías que compiten se denominan:
- hipótesis nula
- hipótesis alternativa.
• Al proceso de decidir entre la hipótesis nula y la alternativa, se le
denomina: Prueba de hipótesis
Test de hipótesis
Contraste de hipótesis o
Docimacía de Hipótesis
Tipos de hipótesis

• Hipótesis nula (H0): Establece que nada va a suceder, no hay efecto, no


hay diferencia, no hay cambio en la población. Es el “status quo”, lo
convencional, lo que sabemos de la población, lo aceptado hasta el
momento.

La hipótesis nula se va a considerar como cierta hasta que se tenga


suficiente evidencia de lo contrario

• Hipótesis alternativa (H1): Es una alternativa a la hipótesis nula.


Establece lo que el investigador espera que sea verdad, el cambio en la
población que el investigador espera encontrar.

H0: La Aspirina es mejor (o igual) que el Migranol para el dolor de


cabeza

H1: El Migranol es mejor que la Aspirina para el dolor de cabeza


Ejemplo

H0: El hábito de fumar no afecta la memoria en fumadores excesivos


mayores de 43 años
H1: El hábito de fumar produce problemas en la memoria en fumadores
excesivos mayores de 43 años
Ejemplo

H0: El consumo de bebidas gaseosas con altos niveles de acidez, no


afecta el esmalte de los dientes.
H1: El consumo de bebidas gaseosas con altos niveles de acidez, daña el
esmalte de los dientes.
La prueba de hipótesis se parece a un juicio penal

En éste, se parte del supuesto de que el acusado es inocente. La


hipótesis nula es de inocencia.

Lo contrario de la hipótesis nula es la hipótesis alternativa, la cual


expresa una creencia de culpabilidad.

Por lo tanto, las hipótesis en un juicio criminal se escribirían:

H0: El acusado es inocente


H1: El acusado es culpable

Para probar las aseveraciones o hipótesis se lleva a cabo un juicio.


H0: El acusado es inocente
H1: El acusado es culpable

El testimonio y las pruebas obtenidas durante el juicio equivalen a la


información de la muestra.

Si la información de la muestra concuerda con la hipótesis de


inocencia, no se puede rechazar la hipótesis nula que el consignado
es inocente.

Sin embargo, si la información muestral no es consistente con la


hipótesis de inocencia, se rechazará la hipótesis nula.

En este caso la acción a tomar se basará en la hipótesis alternativa


de que el acusado es culpable.
Los abogados defensores y querellantes presentan sus casos.

El juez debe ponderar la evidencia presentada y decidir si es


suficiente para declarar culpable al inculpado.

Pero el sistema de justicia no es perfecto.

Sea cual sea la decisión va a existir la probabilidad de cometer un


error.
¿Qué errores se pueden cometer?

•Declararlo culpable cuando en realidad es inocente.

•Declararlo inocente cuando el inculpado era en realidad culpable.

Estos tipos de error tienen un nombre especial


Error Tipo I (α: alpha):
rechazar la hipótesis nula H0 cuando es verdadera

Error Tipo II (β:beta):


aceptar la hipótesis nula H0 cuando es falsa

La “Verdad”
H0 Verdadera H0 Falsa
Decisión Error
Rechazar H0
basada tipo I
en los Error
datos Aceptar H0
tipo II

Se puede cometer Error Tipo I sólo si rechazamos Ho.


Se puede cometer Error Tipo II sólo si NO rechazamos Ho.
Probando un nuevo medicamento

H0: La Aspirina es mejor (o igual) que el Migranol para el dolor de cabeza


H1: El Migranol es mejor que la Aspirina para el dolor de cabeza

¿Cuáles son los dos tipos de errores que se pueden cometer al decidir
entre las dos hipótesis?

Error Tipo I: Concluir que el Migranol es más efectivo que la


Aspirina, cuando no es así.
Concluir que la Aspirina es más efectiva que el
Error Tipo II:
Migranol, cuando en realidad no es así.

¿Cuáles son la consecuencias del error tipo I?


¿Cuáles son la consecuencias del error tipo II?
¿Cuál error es más grave desde un punto de vista ético?
Si el Error Tipo I es considerado grave, ¿porque no hacerlo cero?
Probando un nuevo medicamento

H0: La Aspirina es mejor (o igual) que el Migranol para el dolor de cabeza


H1: El Migranol es mejor que la Aspirina para el dolor de cabeza

Una manera posible de no cometer el error tipo I sería no rechazar


nunca la hipótesis nula.

Pero si hacemos esto nunca vamos a aceptar una teoría nueva.


Tenemos que correr un pequeño riesgo.
Conceptos básicos

En estadística, la probabilidad de cometer el error tipo I se llama Nivel de


significancia y se denota por la letra griega alfa (  ).

La probabilidad de cometer el error tipo II se denota por


la letra griega beta, 

= Nivel de significancia

= Probabilidad de cometer el error tipo I

= Probabilidad de cometer el error tipo II


Significancia estadística

Los datos que obtenemos de una muestra serán estadísticamente


significativos, si las observaciones son muy poco probables cuando H0 es
verdadera.

Si los datos son estadísticamente significativos, entonces rechazamos H0.

Generalmente queremos proteger lo que ya conocemos reduciendo la


probabilidad de cometer el Error Tipo I.

Una manera de no cometer el error tipo I sería nunca rechazar la hipótesis


nula. Pero si hacemos esto nunca vamos a aceptar una teoría nueva.
Tenemos que correr un pequeño riesgo.

Sea cual sea nuestra decisión siempre existirá una pequeña probabilidad
de cometer error.
¿Qué hay en la bolsa?

Se tienen dos bolsas idénticas. Cada bolsa contiene 20 vales. El


contenido de cada bolsa es:
Contenido de las Bolsas
A B
- $560.000 $1.890.000
La misión es decidir entre la bolsa A o la B a partir de la selección de UN
vale. El riesgo mayor es elegir la bolsa A pues nos ganaríamos una
“deuda”.
Para este caso las hipótesis son:
H0: la bolsa que me están mostrando es la BOLSA A
H1: la bolsa que me están mostrando es la BOLSA B

¿Cuál es el error tipo I?

Error tipo I = rechazar H0 cuando H0 es Verdadera


= quedarse con la bolsa creyendo que no es A pero es A
= ganar una deuda de $560.000

¿Cuál es el error tipo II?


Error tipo II = aceptar H0 cuando H0 es Falsa
= rechazar la bolsa creyendo que es A, pero es B
= pierde de ganar $1.890.000
Para este caso las hipótesis son:
H0: la bolsa que me están mostrando es la BOLSA A
H1: la bolsa que me están mostrando es la BOLSA B

¿Cómo tomamos la decisión?

Las elecciones obvias:

-$1000 => es la Bolsa A => acepto H0


$1000 => es la Bolsa B => rechazo H0

Pero si me sale un vale de $10 ó de $20 ó …. ó de $60 ¿qué hacemos?


Regla de Decisión

Un regla de decisión es una regla formal que establece


cuando rechazar H0, basados en los datos

Examinemos las probabilidades de cada vale:

La dirección del extremo corresponde a la posición de los


valores que son más probables bajo H1 que bajo H0.
Región de rechazo, Región de aceptación, valor crítico

Una regla de decisión tiene tres elementos:

Una región de rechazo es un conjunto de valores para los


cuales rechazamos H0.

Una región de aceptación es un conjunto de valores para


los cuales aceptamos H0.

Un valor crítico es el valor que marca el punto inicial del


conjunto de valores de la región de rechazo.
Región de rechazo, Región de aceptación, valor crítico

Una región de rechazo se llama unilateral o de una cola:

si el conjunto de valores extremos están todos en una dirección,


ya sea a la derecha (cola superior) o a la izquierda (cola
inferior).

Una región de rechazo se llama bilateral o de dos colas:

si el conjunto de valores extremos están en las dos direcciones


derecha e izquierda.
Para determinar la regla de decisión veremos tres opciones rechazar Ho si
bono seleccionado es de:
$40 mil o más
$50 mil o más
$60 mil o más
Regla de decisión:
Rechazar H0 si el vale seleccionado es de $ 40 mil o más.

H0: la bolsa que me están mostrando es la Bolsa A


H1: la bolsa que me están mostrando es la Bolsa B
Región de Rechazo:
Vales  $ 40 mil

Región de Aceptación:
Vales < $ 40 mil

Valor Crítico:
$40 mil
Calcularemos Error tipo I (α):

H0: la bolsa que me están mostrando es la Bolsa A


H1: la bolsa que me están mostrando es la Bolsa B

α: P(rechazar Ho / Ho es Verdadera)
α: Probabilidad de seleccionar $40, $50, $60 o $1.000 de A
α: 4/20 = 0,20
Calcularemos Error tipo II (β):

H0: la bolsa que me están mostrando es la Bolsa A


H1: la bolsa que me están mostrando es la Bolsa B

β : P(aceptar Ho / Ho es Falsa)
β : Probabilidad de seleccionar $30, $20, $10 o -$1.000 de B
β : 4/20 = 0,20
Regla de decisión:
Rechazar H0 si el vale seleccionado es de $ 50 mil o más.

H0: la bolsa que me están mostrando es la Bolsa A


H1: la bolsa que me están mostrando es la Bolsa B
Región de Rechazo:
Vales  $ 50 mil

Región de Aceptación:
Vales < $ 50 mil

Valor Crítico:
$50 mil
Calcularemos Error tipo I (α):

H0: la bolsa que me están mostrando es la Bolsa A


H1: la bolsa que me están mostrando es la Bolsa B

α: P(rechazar Ho / Ho es Verdadera)
α: Probabilidad de seleccionar $50, $60 o $1.000 de A
α: 2/20 = 0,10
Calcularemos Error tipo II (β):

H0: la bolsa que me están mostrando es la Bolsa A


H1: la bolsa que me están mostrando es la Bolsa B

β : P(aceptar Ho / Ho es Falsa)
β : Probabilidad de seleccionar $40, $30, $20, $10 o -$1.000 de B
β : 6/20 = 0,30
Regla de decisión:
Rechazar H0 si el vale seleccionado es de $ 60 mil o más.

H0: la bolsa que me están mostrando es la Bolsa A


H1: la bolsa que me están mostrando es la Bolsa B
Región de Rechazo:
Vales  $ 60 mil

Región de Aceptación:
Vales < $ 60 mil

Valor Crítico:
$60 mil
Calcularemos Error tipo I (α):

H0: la bolsa que me están mostrando es la Bolsa A


H1: la bolsa que me están mostrando es la Bolsa B

α: P(rechazar Ho / Ho es Verdadera)
α: Probabilidad de seleccionar $60 o $1.000 de A
α: 1/20 = 0,05
Calcularemos Error tipo II (β):

H0: la bolsa que me están mostrando es la Bolsa A


H1: la bolsa que me están mostrando es la Bolsa B

β : P(aceptar Ho / Ho es Falsa)
β : Probabilidad de seleccionar $50, $40, $30, $20, $10 o -$1.000 de B
β : 12/20 = 0,60
Resumen de α y β para las tres reglas de decisión:

Región de
Valor Crítico α β
Rechazo

$60 mil $60 o más 0,05 0,60

$50 mil $50 o más 0,10 0,30

$40 mil $40 o más 0,20 0,20

Conclusión: …
El valor p : ¿qué tan raros son los datos?

Nos vamos a enfocar en lo que los datos observados nos dicen.

Partimos con el supuesto de que H0 es verdadera.

Nos preguntamos:

Si H0 es verdadera (la Bolsa es la A) ¿cuál es la probabilidad de obtener el


valor observado en la muestra o uno aún más extremo?

Esta probabilidad se llama valor - p


El valor-p es la probabilidad de obtener el valor observado o uno más
extremo, bajo el supuesto que Ho es Verdadera
Entendemos que a menor valor-p, mayor es la evidencia de los datos en
contra de la hipótesis nula.
Cálculo del valor p
Ejemplo 1:
Suponga que usted selecciona un vale de $30 mil y la regla de decisión es
rechazar H0 si el vale seleccionado es de $ 50 mil o más.

Es decir un nivel de significancia α de 0,10

¿Qué decidimos?

No rechazar Ho pues el valor observado no cayó en la Región Crítica

Región de Aceptación Región de Rechazo


Ejemplo 1 (continuación)
Ahora llegaremos a la misma conclusión pero a partir del valor p.

α = 0,10

¿cuál es la probabilidad de obtener el valor observado ($30) o uno aún


más extremo?

valor-p = 6/20=0,30

valor p = 0,30 > α = 0,10

La decisión estadística es No rechazar H0


Cálculo del valor p
Ejemplo 2:
Suponga que usted selecciona un vale de $60 mil y la regla de decisión es
rechazar H0 si el vale seleccionado es de $ 50 mil o más.

Es decir un nivel de significancia α de 0,10

¿Qué decidimos?

Rechazar Ho pues el valor observado cayó en la Región Crítica

Región de Aceptación Región de Rechazo


Ejemplo 2 (continuación)
Ahora llegaremos a la misma conclusión pero a partir del valor p.

α = 0,10

¿cuál es la probabilidad de obtener el valor observado ($60) o uno aún


más extremo?

valor-p = 1/20=0,05

valor p = 0,05 < α = 0,10

La decisión estadística es Rechazar H0


Resumen del valor p para los dos ejemplos

α Valor p Conclusión

0,30 NO se rechaza Ho
0,10
0,05 Se rechaza Ho

Si valor p > α NO rechazamos Ho


(los datos NO son estadísticamente significativos)

Si valor p < α Rechazamos Ho


(los datos son estadísticamente significativos)
Ejercicio 1: Se tienen dos bolsas A y B, cada una tiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si el la bolsa A o la bolsa B. Las
hipótesis son:
H0: la bolsa que me están mostrando es la Bolsa A
H1: la bolsa que me están mostrando es la Bolsa B

Se debe sacar un vale para luego tomar la decisión.

a) ¿Se trata de una prueba


Unilateral o Bilateral?
Justifique.

R. Es una prueba bilateral


porque los valores más
probables para la hipótesis
alternativa están en ambos
extremos.
Ejercicio 1: Se tienen dos bolsas A y B, cada una tiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si el la bolsa A o la bolsa B. Las
hipótesis son:
H0: la bolsa que me están mostrando es la Bolsa A
H1: la bolsa que me están mostrando es la Bolsa B

Se debe sacar un vale para luego tomar la decisión.

b) Establezca la Regla de Decisión.

Región de Rechazo:
Vales ≤ $ 20 mil y Vales  $ 90 mil

Región de Aceptación:
$20 mil < Vales < $ 90 mil

Valores Críticos:
$20 y $90 mil
Ejercicio 1: Se tienen dos bolsas A y B, cada una tiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si el la bolsa A o la bolsa B. Las
hipótesis son:
H0: la bolsa que me están mostrando es la Bolsa A
H1: la bolsa que me están mostrando es la Bolsa B

Se debe sacar un vale para luego tomar la decisión.

c) Calcule el nivel de significancia.

α: P(rechazar Ho / Ho es Verdadera)

α: 6/30 = 0,20
Ejercicio 1: Se tienen dos bolsas A y B, cada una tiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si el la bolsa A o la bolsa B. Las
hipótesis son:
H0: la bolsa que me están mostrando es la Bolsa A
H1: la bolsa que me están mostrando es la Bolsa B

Se debe sacar un vale para luego tomar la decisión.

d) Calcule el Error tipo II.

β: P(aceptar Ho / Ho es Falsa)

β: 12/30 = 0,40
Ejercicio 1: Se tienen dos bolsas A y B, cada una tiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si el la bolsa A o la bolsa B. Las
hipótesis son:
H0: la bolsa que me están mostrando es la Bolsa A
H1: la bolsa que me están mostrando es la Bolsa B

Se debe sacar un vale para luego tomar la decisión.

e) ¿Cómo puedo reducir β?

R. Aumentando α
Ejercicio 1: Se tienen dos bolsas A y B, cada una tiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si el la bolsa A o la bolsa B. Las
hipótesis son:
H0: la bolsa que me están mostrando es la Bolsa A
H1: la bolsa que me están mostrando es la Bolsa B

Se debe sacar un vale para luego tomar la decisión.

f) Calcule el valor p si el vale que


se sacó es $40 mil

R. ¿cuál es la probabilidad de
obtener el valor observado
($40) o uno aún más extremo?

valor-p = 10/30 * 2 = 0,33 * 2

valor p = 0,67 > α = 0,20

La decisión estadística es
NO Rechazar H0
Ejercicio 1: Se tienen dos bolsas A y B, cada una tiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si el la bolsa A o la bolsa B. Las
hipótesis son:
H0: la bolsa que me están mostrando es la Bolsa A
H1: la bolsa que me están mostrando es la Bolsa B

Se debe sacar un vale para luego tomar la decisión.

g) Calcule el valor p si el vale que


se sacó es $100 mil

R. ¿cuál es la probabilidad de
obtener el valor observado
($100) o uno aún más
extremo?

valor-p = 1/30 * 2 = 0,033 * 2

valor p = 0,067 < α = 0,20

La decisión estadística es
Rechazar H0
Resumen
del
Capítulo

http://dta.utalca.cl/estadistica/

http://www.educandus.cl/estadistica/

You might also like