Professional Documents
Culture Documents
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
APUNTES UNIDAD 1. Pruebas estadísticas de la investigación
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Las hipótesis estadísticas se clasifican en dos: La hipótesis nula y la hipótesis alternativa, las cuales
a su vez, establecen tipos de error en los que se puede incurrir al tomar una decisión.
Hipótesis Hipótesis
Alternativas de Nulidad
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Existe evidencia sustancial de que el nuevo método de enseñanza es mejor que el método
tradicional.
Una hipótesis complementaria o la contrapartida de ésta, denotada H0, sería: No existe evidencia
sustancial de que el nuevo método de enseñanza sea mejor que el método tradicional.
Ejercicio tomado de Pimienta Lastra, R. (2003), Aplicaciones de matemáticas en las ciencias sociales:
Prueba Estadística de Hipótesis, Universidad Autónoma Metropolitana, Unidad Xochimilco, México.
Consultado el 19 de enero de 2016. Disponible en: http://bidi.xoc.uam.mx/
Para poder entender las descripciones anteriores, revisemos el siguiente video.
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
En el segundo caso, si la hipótesis Ha es verdadera no se rechaza y se concluye.
Los datos del experimento muestran evidencia sustancial de que el nuevo método de enseñanza
mejora al método tradicional. Para saber si la afirmación es correcta estadísticamente, el nueva
método de enseñanza deberá ser aplicado a un gran número de estudiantes para poder determinar
si el porcentaje de aprobados, denótese p, es sustancialmente mayor que cuando se usa el método
tradicional, sin embargo, nótese que en el experimento la información se limita al resultado
obtenido en tan sólo 25 estudiantes.
Suponiendo que los 25 estudiantes en el experimento pueden considerarse como observaciones
independientes de la población, se puede ver que el modelo de probabilidad para X tiene una
distribución binomial con n==25 (distribución binomial cuenta el número de éxitos de n ensayos o
pruebas con una probabilidad de éxito) y p un parámetro desconocido. Simbólicamente las hipótesis
del problema, planteadas originalmente, se representan por:
H0: p ≤ 0.75 (El nuevo método de enseñanza no es mejor que el método tradicional).
vs.
Ha: p > 0.75 (El nuevo método de enseñanza mejora sustancialmente al método tradicional).
La naturaleza del parámetro citado está incorporada en el parámetro p, el cual representa el
porcentaje de éxitos con el nuevo método. Para considerar a un enunciado como válido se deben
acumular suficientes evidencias que lo apoyen. Por lo tanto el investigador deberá tornarlo como
falso, a menos que lo contrario sea ampliamente respaldado por los datos. En otras palabras, la
hipótesis nula deberá ser vista como cierta y sólo rechazarse cuando los datos muestren
ampliamente lo contrario.
especifica regularmente antes de la selección de una muestra para que los resultados obtenidos no
influyan en la decisión.
En una prueba de hipótesis la toma de decisiones se haya sujeta a los datos recolectados a través
de un experimento o de una muestra aleatoria, por lo que es posible cometer dos tipos de errores
que pueden llevar a una pérdida sustancialmente diferente, estos errores son:
• Error tipo 1: Rechazar una hipótesis verdadera.
• El error tipo II: No rechazar una hipótesis falsa.
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
A continuación se presenta una regla de decisión de hipótesis estadística
Decisión Cierto Falso
Rechazar H0 Error de tipo I
Aceptar H0 Error de tipo II β
Un subconjunto de una población. Una muestra es representativa cuando los elementos son
seleccionados de tal forma que pongan de manifiesto las características de una población. Su
característica más importante es la representatividad.
La selección de los elementos que conforman una muestra pueden ser realizados de forma
probabilística o aleatoria (al azar), o no probabilística.
Población es el universo de un conjunto de elementos, los cuales serán el objeto de estudio, los
cuales pueden ser determinados o indeterminados en otras palabras: finitos o infinitos, y para el
caso de que el tamaño de la población sean muy extensa y la recopilación de esta información sea
complicada, se decide seleccionar sólo una muestra.
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Es necesario realizar una estimación, y para ello se debe realizar un estudio de una población, de la
que desconocemos sus parámetros. Para ello el tamaño de la muestra normalmente es
representado por "n" y siempre es un número entero positivo. El tamaño exacto de la muestra
puede variar dependiendo de las necesidades de investigación. De lo anteriormente expuesto, la
determinación del tamaño de la muestra, brinda una mejor precisión en las estimaciones de las
propiedades de la población. Es importante tomar en cuenta que junto a esa estimación, y dado la
cual no siempre coincide con el valor real del parámetro, se debe notar en el estudio un error
aproximado que se comete al realizarla.
Una muestra representativa, habla sobre la no preferencia en cuanto a los datos tomados de la
muestra representativa. Y una muestra adecuada y válida, se refiere a que la muestra debe ser
obtenida de tal manera que permita establecer un mínimo de error posible respecto de la población.
La obtención de la muestra debe estar basada mediante procesos matemáticos que eliminen la
posibilidad del error.
En la distribución Muestral, su objetivo es poder tomar y mostrar diferentes características que por
su formación de contenido en cuanto a calidad, muchas veces, no puede ser exhibida de forma
cuantitativa. Por ejemplo, el sexo y la preparación, y poder determinar la media de las “mujeres de
una región dada que usan determinado servicio” de una población.
Por lo que a las características de interés del estudio se llaman parámetros poblacionales, que no es
más que la media y la proporción.
Los parámetros poblacionales y estadísticos, son las funciones que representan la muestra, y no es
más que la expresión matemática que indica la forma de combinar los datos, en una estimación.
La distribución muestral de la estadística se divide en dos regiones, una región de rechazo, conocida
como región crítica y una región de no rechazo o aceptación.
Recordemos un poco de las hipótesis estadísticas, de las que ya hablamos anteriormente, de las
cuales se mencionó sobre la distribución muestral dentro de la estadística, y vimos que estas
hipótesis pueden caer dentro de la región de aceptación, y no se puede rechazar en la que se le
conoce como hipótesis nula.
La región de rechazo puede suponerse como el conjunto de valores de la estadística de prueba que
no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Que por otro lado, estos
valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la
región de no rechazo de la de rechazo.
Los errores hipotéticos se dividen en errores de tipo I y tipo II. Para ello es necesario definir que
cuando es rechazada una hipótesis, cuando debió haberse aceptado, se dice que se cometió un error
de tipo I, y al contrario, si se acepta una hipótesis cuando debió haberse rechazado se dice que se
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
cometió un error de tipo II. Para estos casos anteriores en los que se ha tomado una decisión
equivocada, se ejecuta el llamado error de juicio.
Es así que para toda investigación, las decisiones o pruebas de hipótesis deben ser efectivas,
buscando que no haya errores en la toma de decisiones, aunque esto no es tan fácil, porque
cualquier tamaño de muestra, puede venir acompañado de cualquier tipo de error, y más cuando
se permiten incrementos en los tamaños de la muestra, generando así mucha incertidumbre en los
resultados.
Es por ello, que cuando se decide hacer una investigación es preferible el tomar tamaños de muestra
grande, sabiendo de ante mano que muchas veces esto no es posible. Para adentrarnos en la región
de rechazo revisemos el siguiente tema.
1.8 Decisión.
La teoría de decisiones se puede resumir como la toma decisión en base al análisis lógico y
cuantitativo de todos los resultados obtenidos en diferentes pruebas realizadas por la estadística,
en las que se verán afectados una decisión en un mundo eventual.
Según Pimienta Lastra, R., (2003), la teoría de decisión en una prueba de hipótesis estadística, que
los datos del experimento, denotado ∝ ̅ (alfa gorro). Si ∝ ̅ es menor que se rechaza H0 y se acepta
Ha, es decir se acepta la aseveración operacional de la hipótesis de investigación, gráficamente se
tiene:
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
• ̅ entonces se rechaza H0
Si > ∝
• ̅ entonces no se rechaza H0
Si < ∝
Lo anteriormente descrito es lo que se le llama prueba de la hipótesis nula, tal que ∝ ̅ se le denomina
el estadístico de prueba. Para ello a esta prueba de la hipótesis nula, especifica el conjunto de
valores de una variable aleatoria X, para las cuales H0 puede ser rechazada.
El valor que se utiliza para determinar el curso de la acción, se llama estadístico de prueba y al
conjunto de valores para los que H0 es rechazado se llama región de rechazo de la prueba. Una
prueba queda completamente especificada por un estadístico de prueba y la región de rechazo.
(Pimienta, 2003)
Intuitivamente, se sospecha qué valores grandes de X indican que H0, puede ser falsa, y Ha
verdadera; en forma similar valores pequeños de X sugieren que H0 es verdadera y Ha es falsa.
x= 0,1,2,...n
Se tiene que la probabilidad de cometer el error tipo I, está dada para valores de x=18,19,..., 25; por
lo tanto:
̅ = P(x ≤18 | p= ½)
∝
25
̅ = ∑25
∝ 𝑥=18[ 𝑋 ](½) (½)
8 25-x
̅ = 0.007
∝
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
De lo anterior se puede concluir:
Como ∝ ̅ = 0.007 es menor que a = 0.05 se rechaza H0, es decir, a un nivel de significancia del 5% se
puede concluir que los datos del experimento han mostrado que el nuevo método de enseñanza es
mejor que el anterior.
Podría todavía cuantificarse la magnitud del error tipo II, pero en este caso no se hará, ya que no es
el objetivo de este bloque.
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.