You are on page 1of 10

UNIDAD 1

UNIDAD 1. Pruebas estadísticas de la investigación

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
APUNTES UNIDAD 1. Pruebas estadísticas de la investigación

1 Pruebas estadísticas de la investigación


Antes de adentrarnos a nuestro tema en cuestión, conozcamos la definición de la estadística según,
Mendenhall (1987) donde informa que la estadística es un área de la ciencia que se ocupa del diseño
de experimentos o procedimientos de muestreo, del análisis de datos y de realizar inferencias
acerca de una población de mediciones a partir de la información contenida en una muestra.
De lo anteriormente descrito podemos definir a la estadística como una ciencia de la matemática,
encargada de organizar, resumir y analizar datos, a partir de una muestra o población capaz de
realizar deducciones, las cuales más tarde, permitirán la toma de decisiones en cualquier disciplina.
Para poder estudiar la información mediante una variable cuantitativa, las pruebas estadísticas de
estimación y contraste empleadas crean suposiciones de una muestra aleatoria de una distribución
de probabilidad de tipo normal o de Gauss.
Las suposiciones obtenidas de esta muestra en momentos no resulta válida, y en otras la duda de
que no sea adecuada no es fácil de comprobar, por tratarse de muestras pequeñas.
Para este caso es importante tomar dos consideraciones:
• Los datos se pueden transformar de tal manera que sigan una distribución normal.
• O bien se puede acudir a pruebas estadísticas no paramétricas, las cuales no se basan en
ninguna suposición en cuanto a la distribución de probabilidad, mientras que las pruebas que
suponen una distribución de probabilidad determinada para los datos se denominan pruebas
paramétricas.
Las pruebas paramétricas y no paramétricas anteriormente descritas, serán profundizadas en su
contenido en bloques posteriores.

1.1.1 Hipótesis estadísticas.


Al intentar tomar una decisión, es importante hacer suposiciones o conjeturas acerca de la
población estudiada. Dichas suposiciones pueden o no ser verdaderas y se denominan Hipótesis
Estadísticas.
Las llamadas hipótesis estadísticas son afirmaciones que tienen que ver con las distribuciones de la
probabilidad de las poblaciones.

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Las hipótesis estadísticas se clasifican en dos: La hipótesis nula y la hipótesis alternativa, las cuales
a su vez, establecen tipos de error en los que se puede incurrir al tomar una decisión.

Hipótesis Hipótesis
Alternativas de Nulidad

1.1.2 Hipótesis Alternativas.


La prueba estadística de hipótesis alternativa comprueba si un supuesto sobre las características de
la población, está respaldado por los datos muestrales. En base a los propósitos de la investigación,
el supuesto sobre la población debe contener una afirmación sobre el valor de algún parámetro (p),
por lo tanto una hipótesis estadística alternativa, son aquellas que difieren de cualquier hipótesis
dada. Por ejemplo, si en una hipótesis es p= 0.5, donde p es un parámetro desconocido, las hipótesis
alternativas podrían ser cualquier otro valor dado a p que sea diferente de p=0.5, y es representada
por H1 (algunos autores la denominan Ha).

1.2 Hipótesis de Nulidad.


En la estadística en muchas ocasiones suelen formularse Hipótesis estadísticas con el fin de
rechazarla o nulificarla, es decir, esto para poder inferir que un procedimiento es mejor
procedimiento que otro, para poder determinar la hipótesis de la No Diferencia entre los
procedimientos, por lo que se explica que las diferencias observadas no son más que incertidumbres
en el mismo muestreo de la población, Por lo que se le conocería como Hipótesis Nula y es
representada como H0.
Ejemplo:
La experiencia ha demostrado que el porcentaje de alumnos aprobados usando un cierto método
de enseñanza es del 75%. Se anticipa que si se usa un nuevo método de enseñanza, el porcentaje
de aprobados será mayor que cuando se usa el método tradicional.
En este caso la Hipótesis H1 sería:

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Existe evidencia sustancial de que el nuevo método de enseñanza es mejor que el método
tradicional.
Una hipótesis complementaria o la contrapartida de ésta, denotada H0, sería: No existe evidencia
sustancial de que el nuevo método de enseñanza sea mejor que el método tradicional.
Ejercicio tomado de Pimienta Lastra, R. (2003), Aplicaciones de matemáticas en las ciencias sociales:
Prueba Estadística de Hipótesis, Universidad Autónoma Metropolitana, Unidad Xochimilco, México.
Consultado el 19 de enero de 2016. Disponible en: http://bidi.xoc.uam.mx/
Para poder entender las descripciones anteriores, revisemos el siguiente video.

1.3 Elección de la prueba estadística.


De acuerdo a la información muestral, es necesario tomar una decisión para poder tomar una
decisión de los pasos a seguir, para ello tenemos dos opciones de Hipótesis, en las cuales si la
hipótesis es falsa, entonces se debe rechazar y concluir, y se dice que: La hipótesis estadística no
está considerablemente respaldada por los datos de la muestra.
Al transcurso en el cual se selecciona una de estas dos acciones se le llama elección de la prueba
estadística de hipótesis.
Permaneciendo con el ejemplo de Pimienta Lastra, R. (2003); se supone que el nuevo método de
enseñanza se aplicó en 25 estudiantes y que hubo un número de aprobados al que denominaremos
X.
La hipótesis Ha que se puede plantear es:
Ha: Existe evidencia sustancial que el nuevo método de enseñanza mejora al método tradicional.
La hipótesis complementaria H0 es:
H0: No existe evidencia sustancial de que el nuevo método de enseñanza mejora al método
tradicional.
Al examinar la eficacia de las hipótesis los resultados pueden ser:
a) La hipótesis Ha es verdadera, es decir, existe certidumbre fundamental de que el nuevo método
de enseñanza mejora al método tradicional.
b) La hipótesis Ha es falsa, es decir, no existe certidumbre fundamental de que el nuevo método de
enseñanza mejora al método tradicional.
En el ejemplo las alternativas de decisión son dos: la primera es rechazar la Hipótesis Ha, si es falsa,
y concluir: Los datos del experimento muestran evidencia sustancial de que el nuevo método de
enseñanza no mejora al método tradicional.

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
En el segundo caso, si la hipótesis Ha es verdadera no se rechaza y se concluye.
Los datos del experimento muestran evidencia sustancial de que el nuevo método de enseñanza
mejora al método tradicional. Para saber si la afirmación es correcta estadísticamente, el nueva
método de enseñanza deberá ser aplicado a un gran número de estudiantes para poder determinar
si el porcentaje de aprobados, denótese p, es sustancialmente mayor que cuando se usa el método
tradicional, sin embargo, nótese que en el experimento la información se limita al resultado
obtenido en tan sólo 25 estudiantes.
Suponiendo que los 25 estudiantes en el experimento pueden considerarse como observaciones
independientes de la población, se puede ver que el modelo de probabilidad para X tiene una
distribución binomial con n==25 (distribución binomial cuenta el número de éxitos de n ensayos o
pruebas con una probabilidad de éxito) y p un parámetro desconocido. Simbólicamente las hipótesis
del problema, planteadas originalmente, se representan por:
H0: p ≤ 0.75 (El nuevo método de enseñanza no es mejor que el método tradicional).
vs.
Ha: p > 0.75 (El nuevo método de enseñanza mejora sustancialmente al método tradicional).
La naturaleza del parámetro citado está incorporada en el parámetro p, el cual representa el
porcentaje de éxitos con el nuevo método. Para considerar a un enunciado como válido se deben
acumular suficientes evidencias que lo apoyen. Por lo tanto el investigador deberá tornarlo como
falso, a menos que lo contrario sea ampliamente respaldado por los datos. En otras palabras, la
hipótesis nula deberá ser vista como cierta y sólo rechazarse cuando los datos muestren
ampliamente lo contrario.

1.4 Nivel de significancia.


Cuando se prueba una hipótesis, la probabilidad máxima con la que se arriesga a cometer un error

especifica regularmente antes de la selección de una muestra para que los resultados obtenidos no
influyan en la decisión.
En una prueba de hipótesis la toma de decisiones se haya sujeta a los datos recolectados a través
de un experimento o de una muestra aleatoria, por lo que es posible cometer dos tipos de errores
que pueden llevar a una pérdida sustancialmente diferente, estos errores son:
• Error tipo 1: Rechazar una hipótesis verdadera.
• El error tipo II: No rechazar una hipótesis falsa.

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
A continuación se presenta una regla de decisión de hipótesis estadística
Decisión Cierto Falso
Rechazar H0 Error de tipo I 
Aceptar H0 Error de tipo II β

Habitualmente en la práctica se utiliza un nivel de significancia que va de 0.05 o 0.01, esto no


significa que sean los únicos, por lo que en algunos ejercicios encontraremos algunos otros datos.
Por lo que ejemplificando lo anterior se podría decir que si se tiene un nivel de significancia de 0.05
es decir del 5%, entonces existe la probabilidad de 5 entre 100 del rechazo de la hipótesis para que
esta pueda ser aceptada, demostrando así una confianza del 95% en cuanto a la toma de decisión
correcta.

1.5 Tamaño de la muestra.


Es necesario definir primeramente que es la muestra y para ello Quesada Ibarguen, V., & Vergara
Schmalbach, J. (S/F), la definen como:

Un subconjunto de una población. Una muestra es representativa cuando los elementos son
seleccionados de tal forma que pongan de manifiesto las características de una población. Su
característica más importante es la representatividad.

La selección de los elementos que conforman una muestra pueden ser realizados de forma
probabilística o aleatoria (al azar), o no probabilística.

Población es el universo de un conjunto de elementos, los cuales serán el objeto de estudio, los
cuales pueden ser determinados o indeterminados en otras palabras: finitos o infinitos, y para el
caso de que el tamaño de la población sean muy extensa y la recopilación de esta información sea
complicada, se decide seleccionar sólo una muestra.

Muestra es el subconjunto de la población.

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Es necesario realizar una estimación, y para ello se debe realizar un estudio de una población, de la
que desconocemos sus parámetros. Para ello el tamaño de la muestra normalmente es
representado por "n" y siempre es un número entero positivo. El tamaño exacto de la muestra
puede variar dependiendo de las necesidades de investigación. De lo anteriormente expuesto, la
determinación del tamaño de la muestra, brinda una mejor precisión en las estimaciones de las
propiedades de la población. Es importante tomar en cuenta que junto a esa estimación, y dado la
cual no siempre coincide con el valor real del parámetro, se debe notar en el estudio un error
aproximado que se comete al realizarla.

Una muestra representativa, habla sobre la no preferencia en cuanto a los datos tomados de la
muestra representativa. Y una muestra adecuada y válida, se refiere a que la muestra debe ser
obtenida de tal manera que permita establecer un mínimo de error posible respecto de la población.

La obtención de la muestra debe estar basada mediante procesos matemáticos que eliminen la
posibilidad del error.

1.6 Distribución muestral

En la distribución Muestral, su objetivo es poder tomar y mostrar diferentes características que por
su formación de contenido en cuanto a calidad, muchas veces, no puede ser exhibida de forma
cuantitativa. Por ejemplo, el sexo y la preparación, y poder determinar la media de las “mujeres de
una región dada que usan determinado servicio” de una población.

Por lo que a las características de interés del estudio se llaman parámetros poblacionales, que no es
más que la media y la proporción.

Los parámetros poblacionales y estadísticos, son las funciones que representan la muestra, y no es
más que la expresión matemática que indica la forma de combinar los datos, en una estimación.

1.7 Región de rechazo.

La distribución muestral de la estadística se divide en dos regiones, una región de rechazo, conocida
como región crítica y una región de no rechazo o aceptación.

Recordemos un poco de las hipótesis estadísticas, de las que ya hablamos anteriormente, de las
cuales se mencionó sobre la distribución muestral dentro de la estadística, y vimos que estas
hipótesis pueden caer dentro de la región de aceptación, y no se puede rechazar en la que se le
conoce como hipótesis nula.

La región de rechazo puede suponerse como el conjunto de valores de la estadística de prueba que
no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Que por otro lado, estos
valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la
región de no rechazo de la de rechazo.

Los errores hipotéticos se dividen en errores de tipo I y tipo II. Para ello es necesario definir que
cuando es rechazada una hipótesis, cuando debió haberse aceptado, se dice que se cometió un error
de tipo I, y al contrario, si se acepta una hipótesis cuando debió haberse rechazado se dice que se

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
cometió un error de tipo II. Para estos casos anteriores en los que se ha tomado una decisión
equivocada, se ejecuta el llamado error de juicio.

Es así que para toda investigación, las decisiones o pruebas de hipótesis deben ser efectivas,
buscando que no haya errores en la toma de decisiones, aunque esto no es tan fácil, porque
cualquier tamaño de muestra, puede venir acompañado de cualquier tipo de error, y más cuando
se permiten incrementos en los tamaños de la muestra, generando así mucha incertidumbre en los
resultados.

Es por ello, que cuando se decide hacer una investigación es preferible el tomar tamaños de muestra
grande, sabiendo de ante mano que muchas veces esto no es posible. Para adentrarnos en la región
de rechazo revisemos el siguiente tema.

1.8 Decisión.

La decisión o toma de decisiones es un proceso en el cual, el investigador deberá seleccionar entre


dos o más alternativas. La teoría de la decisión en la estadística lleva a cabo muchas aplicaciones
que nos permiten una adecuada toma de decisiones, en la que estima diferentes factores en lo que
profundizaremos más adelante.

No siempre la decisión radica en elegir un modelo de probabilidad definitivo y estimar los


parámetros con la información obtenida. En la psicología y otras áreas de gestión, existen ciertos
tipos de problemas en los que no es posible obtener muestras o información objetiva, para estimar
ciertas características de la población, por lo que es necesario recurrir a la información de una
persona o información subjetiva.

La teoría de decisiones se puede resumir como la toma decisión en base al análisis lógico y
cuantitativo de todos los resultados obtenidos en diferentes pruebas realizadas por la estadística,
en las que se verán afectados una decisión en un mundo eventual.

Según Pimienta Lastra, R., (2003), la teoría de decisión en una prueba de hipótesis estadística, que

los datos del experimento, denotado ∝ ̅ (alfa gorro). Si ∝ ̅ es menor que se rechaza H0 y se acepta
Ha, es decir se acepta la aseveración operacional de la hipótesis de investigación, gráficamente se
tiene:

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
• ̅ entonces se rechaza H0
Si  > ∝
• ̅ entonces no se rechaza H0
Si  < ∝
Lo anteriormente descrito es lo que se le llama prueba de la hipótesis nula, tal que ∝ ̅ se le denomina
el estadístico de prueba. Para ello a esta prueba de la hipótesis nula, especifica el conjunto de
valores de una variable aleatoria X, para las cuales H0 puede ser rechazada.

El valor que se utiliza para determinar el curso de la acción, se llama estadístico de prueba y al
conjunto de valores para los que H0 es rechazado se llama región de rechazo de la prueba. Una
prueba queda completamente especificada por un estadístico de prueba y la región de rechazo.
(Pimienta, 2003)

Para ejemplificar lo anteriormente planteado, continuemos con el problema que se ha venido


trabajando de Pimienta Lastra, donde las hipótesis nula y alternativa planteadas anteriormente son:

 Ho: p < 0.75


 vs
 Ha: p > 0.75
Donde los valores que puede tomar la variable aleatoria X son: 1, 2, 25. Cada uno de estos valores
tienen las mismas posibilidades de ocurrir, tanto bajo la hipótesis H0 como bajo la hipótesis Ha, pero
ninguno aisladamente puede probar que una de las dos hipótesis es cierta.

Intuitivamente, se sospecha qué valores grandes de X indican que H0, puede ser falsa, y Ha
verdadera; en forma similar valores pequeños de X sugieren que H0 es verdadera y Ha es falsa.

Sospeche que al aplicarse el nuevo método de enseñanza aprobaron 18 estudiantes, bajo el


supuesto de que la variable aleatoria X se distribuye como una binomial con parámetro p=1/2, es
decir, B (25,1/2); se puede determi
determinado.

Tomando en este ejemplo un = 0.05, se tiene:

=P (Rechazar H0 dado que H0 es verdadera),


Como X se distribuye B(25,1/2) y la forma de esta distribución es:

f(x)= [𝑋𝑛] pX (1 _p)n_X

x= 0,1,2,...n
Se tiene que la probabilidad de cometer el error tipo I, está dada para valores de x=18,19,..., 25; por
lo tanto:

̅ = P(x ≤18 | p= ½)

25
̅ = ∑25
∝ 𝑥=18[ 𝑋 ](½) (½)
8 25-x

̅ = 0.007

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
De lo anterior se puede concluir:

Como ∝ ̅ = 0.007 es menor que a = 0.05 se rechaza H0, es decir, a un nivel de significancia del 5% se
puede concluir que los datos del experimento han mostrado que el nuevo método de enseñanza es
mejor que el anterior.

De forma gráfica, la prueba presentaría la siguiente forma:

Esquemáticamente, la representación sería:

Decisión Cierto Falso


P ≤ 0.75 p > 0.75
Rechazar H0 ̅ = 0.007
Error de tipo I ∝
Aceptar H0 Error de tipo II

Podría todavía cuantificarse la magnitud del error tipo II, pero en este caso no se hará, ya que no es
el objetivo de este bloque.

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.

You might also like