You are on page 1of 11

c |

 
c   c   c 
En las unidades anteriores se manejó el uso de la distribución z, la cual se podía utilizar siempre y cuando los
tamaños de las muestras fueran mayores o iguales a 30 ó en muestras más pequeñas si la distribución o las
distribuciones de donde proviene la muestra o las muestras son normales.|
En esta unidad se podrán utilizar muestras pequeñas siempre y cuando la distribución de donde proviene la
muestra tenga un comportamiento normal. Esta es una condición para utilizar las tres distribuciones que se
2
manejarán en esta unidad; t de student, X ji-cuadrada y Fisher.|
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya que también la podemos
utilizar con muestras aleatorias de tamaño grande.|
En esta unidad se verá un nuevo concepto necesario para poder utilizar a las tres distribuciones mencionadas. Este
concepto es "Ô  
 .|
„ara definir grados de libertad se hará referencia a la varianza muestral:|
|
Esta fórmula está basada en à  Ô  
 (degrees of freedom). Esta
2
terminología resulta del hecho de que si bien s está basada en à cantidades
..., éstas suman cero, así que especificar los valores de
cualquier à  de las cantidades determina el valor restante. „or ejemplo, si Ã|

; y , entonces automáticamente tenemos , así que sólo tres de

los cuatro valores de están libremen te determinamos 3 grados de libertad.|


Entonces, en esta unidad la fórmula de grados de libertad será Ã  y su simbología |
 c  c 

÷upóngase que se toma una muestra de una población normal con media y varianza  ÷i
es el promedio de las à observaciones que contiene la muestra aleatoria, entonces la
distribución es una distribución normal estándar. ÷upóngase que la varianza de la población
A
es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza por s?
La distribución {proporciona la respuesta a esta pregunta.|

La media y la varianza de la distribución { son †y para >2, respectivamente.|


La siguiente figura presenta la gráfica de varias distribuciones { La apariencia general de la distribución { es similar
a la de la distribución normal estándar: ambas son simétricas y unimodales, y el valor máximo de la ordenada se
alcanza en la media †  ÷in embargo, la distribución { tiene colas más amplias que la normal; esto es, la
probabilidad de las colas es mayor que en la distribución normal. A medida que el número de grados de libertad
tiende a infinito, la forma límite de la distribución { es la distribución normal estándar.|

|
|
 |
r. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, está más dispersa que la curva normal estándar z.
3. A medida que
aumenta, la dispersión de la curva t correspondiente disminuye.|
4. A medida que
, la secuencia de curvas t se aproxima a la curva normal estándar, por lo que la curva z recibe a
veces el nombre de curva t con gl = |
La distribución de la variable aleatoria t está dada
por: Esta se conoce como la !  con
grados de libertad.|
÷ean Xr, X2, . . . , Xn variables aleatorias independientes que son todas normales con media y desviación

estándar . Entonces la variable aleatoria tiene una distribución t con = n-r grados de libertad.|
La distribución de probabilidad de t se publicó por primera vez en r 08 en un artículo de W. ÷. Gosset. En esa
época, Gosset era empleado de una cervecería irlandesa que desaprobaba la publicación de investigaciones de
sus empleados. „ara evadir esta prohibición, publicó su trabajo en secreto bajo el nombre de "÷tudent". En
consecuencia, la distribución t normalmente se llama distribución {{Ã{, o simplemente distribución t. „ara
derivar la ecuación de esta distribución, Gosset supone que las muestras se seleccionan de una población normal.
Aunque esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales que
poseen distribuciones en forma casi de campana aún proporcionan valores de t que se aproximan muy de cerca a
la distribución t.|
La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a
uno. Unicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.|

÷e acostumbra representar con el valor t por arriba del cual se encuentra un área igual a . Como la

distribución t es simétrica alrededor de una media de cero, tenemos ; es decir, el valor t que
deja un área de a la derecha y por tanto un área de a la izquierda, es igual al valor t negativo que deja un
área de en la cola derecha de la distribución. Esto es, t0.  = -t0.0, t0. =-t0.0r, etc.|
„ara encontrar los valores de t se utilizará la tabla de valores críticos de la distribución t del libro „robabilidad y
Estadística para Ingenieros de los autores Walpole, Myers y Myers.|
Ejemplo:|
El valor t con = r4 grados de libertad que deja un área de 0.02 a la izquierda, y por tanto un área de 0.  a la
derecha, es|
t0. =-t0.02 = -2.r4|

|
÷i se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto que se tiene que hacer la
resta de . La manera de encontrar el valor de t es buscar el valor de en el primer renglón de la tabla y
luego buscar los grados de libertad en la primer columna y donde se intercepten y se obtendrá el valor de t. |
Ejemplo:|
Encuentre la probabilidad de ±t0.02 < t < t0.0.|
÷olución:|

Como t0.0 deja un área de 0.0 a la derecha, y ±t0.02 deja un área de 0.02 a la izquierda, encontramos un área
total de r-0.0-0.02 = 0. 2.|
„( ±t0.02 < t < t0.0) = 0. 2|
Ejemplo:|
Encuentre k tal que „(k < t < -r.r) = 0.04, para una muestra aleatoria de tamaño r que se selecciona de una
distribución normal.|
÷olución:|

|
÷i se busca en la tabla el valor de t =r.r con r4 grados de libertad nos damos cuenta que a este valor le
corresponde un área de 0.0 a la izquierda, por ser negativo el valor. Entonces si se resta 0.0 y 0.04 se tiene un
valor de 0.00, que equivale a  Luego se busca el valor de 0.00 en el primer renglón con r4 grados de
libertad y se obtiene un valor de t = 2. , pero como el valor de está en el extremo izquierdo de la curva
entonces la respuesta es t = -2.  por lo tanto:|
„(-2.  < t < -r.r) = 0.04|
Ejemplo:|
Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 00 gramos por
milímetro de materia prima. „ara verificar esta afirmación toma una muestra de 2 lotes cada mes. ÷i el valor de t
calculado cae entre ±t0.0 y t0.0, queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que
tiene una media de r8 gramos por milímetro y una desviación estándar de 40 gramos? ÷uponga que la
distribución de rendimientos es aproximadamente normal.|

à 
Êe la tabla encontramos que t0.0 para 24 grados de libertad es de r.rr. „or tanto, el fabricante queda satisfecho
con esta afirmación si una muestra de 2 lotes rinde un valor t entre ±r.rr y r.rr.|
÷e procede a calcular el valor de t:|

|
Este es un valor muy por arriba de r.rr. ÷i se desea obtener la probabilidad de obtener un valor de t con 24
grados de libertad igual o mayor a 2.2 se busca en la tabla y es aproximadamente de 0.02. Êe aquí que es
probable que el fabricante concluya que el proceso produce un mejor producto del que piensa.|
 " # $  %    |

÷i y s son la media y la desviación estándar de una muestra aleatoria de una población normal con varianza
, desconocida, un intervalo de confianza de
( )r00% para es:|

|
donde /2 es el valor t con = n-r grados de libertad, que deja un área de /2 a la derecha.|
÷e hace una distinción entre los casos de conocida y desconocida al calcular las estimaciones del intervalo
de confianza. ÷e debe enfatizar que para el primer caso se utiliza el teorema del límite central, mientras que para
desconocida se hace uso de la distribución muestral de la variable aleatoria t. ÷in embargo, el uso de la
distribución t se basa en la premisa de que el muestreo se realiza de una distribución normal. En tanto que la
distribución tenga forma aproximada de campana, los intervalos de confianza se pueden calcular cuando la
varianza se desconoce mediante el uso de la distribución t y se puede esperar buenos resultados.|
Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se pueda suponer, con
desconocida y n 30, s puede reemplazar a y se puede utilizar el intervalo de confianza:|

|
„or lo general éste se denomina como un Ã{ 
 ÃÃ{  Ã. La justificación yace sólo en la
presunción de que con una muestra grande como 30, s estará muy cerca de la real y de esta manera el teorema
del límite central sigue valiendo. ÷e debe hacer énfasis en que esto es solo una aproximación y que la calidad de
este enfoque mejora a medida que el tamaño de la muestra crece más.|
Ejemplos:|
r. El contenido de siete contenedores similares de ácido sulfúrico son .8, r0.2, r0.4, .8, r0.0, r0.2, y .
litros. Encuentre un intervalo de confianza del % para la media de todos los contenedores si se supone
una distribución aproximadamente normal.

à 
La media muestral y la desviación estándar para los datos dados son:|
r0 y s= 0.283|
En la tabla se encuentra que t0.02=2.44 con  grados de libertad, de aquí, el intervalo de confianza de %
para es:|

|
Con un nivel de confianza del % se sabe que el promedio del contenido de los contenedores está entre
.4 y r0.2 litros.|
2. Un artículo publicado en el ù  Ã
 {ÃÃ 
{ Ã presenta las siguientes 20 mediciones del
tiempo de combustión residual en segundos de especímenes tratados de ropa de dormir para niños:
.8 . 3 . . .|
.8 . . 4 .8 .|
.83 . 2 .4 . .88|
.  .  . 3 . 2 .8 |
÷e desea encontrar un nivel de confianza del % para el tiempo de combustión residual promedio.
÷upóngase que el tiempo de combustión residual sigue una distribución normal.|

à 
La media muestral y la desviación estándar para los datos dados son:|
.82 y s= 0.0 |
En la tabla se encuentra que t0.02=2.0 3 con r grados de libertad, de aquí, el intervalo de confianza de % para
es:|
|

|
„or lo tanto, se tiene una confianza del % de que el tiempo de combustión residual promedio se encuentra entre
.803 y .8  segundos.|
c&     c  c   '" $  |

Ciertamente sospechamos que las pruebas sobre una media poblacional con desconocida, debe incluir el
uso de la distribución t de ÷tudent. La estructura de la prueba es idéntica a la del caso de conocida, con la
excepción de que el valor en la estadística de prueba se reemplaza por la estimación de s calculada y la
distribución normal estándar se reemplaza con una distribución t.|
Ejemplos:|
r. El Ã{{{ 
{   Ã publica cifras del número anual de Kilowatt-hora que gastan varios aparatos
eléctrodomésticos. ÷e afirma que una aspiradora gasta un promedio de 4 kilowatt-hora al año. ÷i una
muestra aleatoria de r2 hogares que se incluye en un estudio planeado indica que las aspiradoras gastan
un promedio de 42 kilowatt-hora al año con una desviación estándar derr. kilowatt-hora, ¿esto sugiere
con un nivel de significancia de 0.0 que las aspiradoras gastan, en promedio, menos de 4 kilowatt-hora
anualmente? ÷uponga que la población de kilowatt-hora es normal.

à |
r. Êatos:
= 4 kilowatt-hora|
s= rr. kilowatt-hora|
= 42 kilowatt-hora|
n = r2|
= 0.0|
3. Ensayo de hipótesis
Ho; = 4 kilowatt-hora|
Hr; < 4 kilowatt-hora|

|
4. Regla de decisión:
÷i tR -r.  No se rechaza Ho|
÷i tR < -r.  ÷e rechaza Ho|
. Cálculos:
|
. Justificación y decisión:
Como ±r.r > -r. , por lo tanto no se rechaza Ho y se concluye con un nivel de significancia del 0.0 que
el número promedio de kilowwatt-hora que gastan al año las aspiradoras no es significativamente menor
que 4.|

à 
 { {  |

|
Regla de decisión:|
÷i 3 .83 No se Rechaza Ho|
÷i < 3 .83 ÷e rechaza Ho|
Como la = 42 y este valor no es menor que 3 .83 por lo tanto no se rechaza Ho.|
÷e puede aprovechar este ejemplo para calcular el valor de „ , como el valor de t calculada es de ±r.r, se busca
en la tabla y se ve que el area a la izquierda de este valor es de 0.r3 con rr grados de libertad, por lo tanto no se
rechaza Ho., ya que sería un valor alto para un nivel de significancia.|

|
r. Un artículo publicado en la revista a{ 
ÃÃ Ã describe los resultados de pruebas de resistencia
a la adhesión de 22 especímenes de aleación U-00. La carga para la que cada especímen falla es la
siguiente en M„a:
r .8| r8.| r.| r.| r.8|

r.4| r4.r| r3.| rr. | rr.4|

rr.4| 8.8| .| r.4| r.4|

r .| r4. | r2.| rr. | rr.4|

r0.r| . | || || ||
¿÷ugieren los datos que la carga promedio de falla es mayor que r0Mpa? ÷upóngase que la carga donde
se presenta la falla tiene una distribución normal, y utilicese = 0.0. Calcule el valor de „.|

à 
r. Êatos:
= r0|
s = 3.|
= r3.r|
n = 22|
= 0.0|
3. Ensayo de hipótesis
Ho; = r0|
Hr; > r0 |

|
4. Regla de decisión:
÷i tR r.2r no se rechaza Ho.|
÷i tR> r.2r se rechaza Ho.|
. Cálculos:

|
. Justificación y decisión.
Como 4. 0 >r.2r se rechaza Ho y se concluye con un nivel de significancia del 0.0 que la carga de falla
promedio es mayor que r0Mpa.|
Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en este caso la media
de la muestra. Êe la fórmula de la distribución muestral de medias se despeja la media de la muestra:|

|
Regla de decisión:|
÷i rr.30 No se rechaza Ho|
÷i > rr.30 ÷e rechaza Ho|
Como la media de la muestral es de r3.r M„a y es mayor al valor de la media muestral límite de rr.30 por lo tanto
se rechaza Ho y se llega a la misma conclusión. |
„ara calcular el valor de „ se va a la tabla y se busca en 2r grados de libertad el valor de t = 4. 0. ÷e obseva que
el valor mayor de t que se encuentra en la tabla con 2r grados de libertad es de 3.8r el cual le corresponde un
área a la derecha de 0.000, por lo que para el valor de 4. 0 el G   

 , y esto apoya la
decisión de rechazar Ho.|
3. Los pesos en libras de una muestra aleatoria de bebés de seis meses son: r4., r2., r.3, r.r, r4.4,
r2. , r3. y r4. . Haga una prueba con nivel de % de significancia para determinar si el peso promedio de
todos los bebés de seis meses es distinto a r4 libras, suponga que sus pesos se distribuyen normalmente y
calcule el valor de „.

à 
r. Êatos:
= r4 libras|
s = r.2r libras|
= r4.3 libras|
n = 8|
= 0.0|
2. Ensayo de hipótesis
Ho; = r4 libras|
Hr; r4 libras|

|
3. Regla de Êecisión:
÷i ±2.3 tR 2.3 No se rechaza Ho|
÷i tR < -2.3 ó si tR > 2.3 ÷e rechaza Ho|
4. Cálculos:

|
. Justificación y decisión:
Como|±2.3 0.7012 2.3 por lo tanto, no se rechaza Ho y se concluye con un nivel de significancia
del 0.0 que el peso promedio de todos los bebés de seis meses es de r4 libras.|

à 
 { {  |

r2. 8 y r.0r|
|
|
|
|

|
Regla de decisión:|
÷i r2. 8 r.0r No se rechaza Ho|
÷i < r2. 8 ó > r.0r se rechaza Ho|
Como la = r4.3 libras, entonces no se rechaza Ho .|
„ara calcular el valor de „ se busca en la tabla el valor de 0.0r2 con  grados de libertad. ÷e obseva que este
valor no se encuentra pero se puede interpolar entre los valores de 0.4 y 0.8  con áreas de 0.30 y 0.20
respectivamente. Interpolando linealmente se obtiene el valor de 0.2r.|

|
! |
El error tipo II se calcula de la misma forma en la que se calculó con la distribución z. ÷e realizarán algunos
ejercicios en los cuales se determinará la probabilidad de cometer el error tipo II, utilizando la tabla de la
distribución.|
Existen curvas características de operación en los libros con diferentes grados de libertad para determinar los
tamaños de muestra correspondientes según el grado de error que se quiera, recordando que entre mayor sea el
tamaño de muestra menor será el error.|
r. ÷e sabe que los voltajes de una marca de pilas tamaño C se distribuyen normalmente, se probó una
muestra aleatoria de r y se encontró que la media es de r.4 volts con una desviación estándar de 0.2r
volts. En el nivel de significancia de 0.0r:
a. ¿Indica esto que la media de los voltajes es menor que r. volts?
b. Calcular la probabilidad de cometer el error tipo II si el voltaje promedio real de las pilas es de r.3 volts.

à |
r. Êatos:
= r. volts.|
s= 0.2r volts|
= r.4 volts.|
n = r|
= 0.0r|
2. Ensayo de hipótesis
Ho; = r. volts|
Hr; < r. volts|

|
3. Regla de decisión:
÷i tR -2.24 No se rechaza Ho|
÷i tR < -2.24 ÷e rechaza Ho|
. Cálculos:

|
. Justificación y decisión:
Como ±r.84 > -2.24, por lo tanto no se rechaza Ho y se concluye con un nivel de significancia del 0.0r que
los voltajes de las pilas tamaño C no son menores a r..|
„ara calcular el error tipo II se tiene que obtener el valor de de la siguiente forma:|

|
|
|
|
|
|

|
„ara encontrar el valor de se busca en la tabla de la distribución t el valor de r.0 con r4 grados de libertad.
Como este valor no se encuentra en la tabla se interpola entre 0.88 y r.0 con un área de 0.20 y 0.r
respectivamente. Al interpolar se obtiene un área de 0.rr2 y esta es la probabilidad de cometer el error tipoII
cuando la media verdadera es de r.3 volts y un tamaño de muestra de r.|
2. „ara el ejercicio del peso de los bebés de  meses, calcular el error tipo II, si los pesos verdaderos
hubieran sido de rr y r4. libras.

à |

„rimero se calculan los valores de :|


|

|
|
|
En este último cálculo para se tendrá que analizar las áreas de los dos extremos, pues estas no están dentro de
la región de aceptación, por lo tanto no se deben de tomar en cuenta para el error tipo II.|
÷e busca en la tabla el valor de 3. con  grados de libertad, y al interpolar nos da un área de 0.004. El área
correspondiente a r.r con  grados de libertad es de 0.r4 . „or lo que =r-(0.0040.r4 )= 0.843|
3. „ara el ejercicio en donde se dan los resultados de pruebas de resistencia a la adhesión de 22
especímenes de aleación U-00., encontrar la probabilidad de cometer el error tipo II si la carga promedio
de falla es igual a rr.

à |
„rimero se obtendrá el valor del estadístico límite:|
|
|
|