You are on page 1of 48

Capitu lo

8.1 INTERVALOS DE CONFIANZA


En el capitulo anterior, consideramos la estimaci6n puntual de un parimetro desconocido de la poblaci6n, es decir, el c6lculo de un dnico ndmero que sea una buena aproximaci6n. En la mayoria de 10s problemas pricticos, un estimador puntual por si solo es inadecuado. 'Por ejemplo, supongamos que un control realizado sobre una muestra aleatoria de piezas procedentes de un gran envio nos lleva a estimar que el 10% de todas las piezas son defectuosas. Un gerente que se enfrenta a este dato posiblemente se harh preguntas del tipo: "LPuedo estar totalmente seguro de s posique el verdadero porcentaje de piezas defectuosas esth entre el 5% y el 15%?" o " ~ E muy ble que entre el 9% y el 11% de las piezas Sean defectuosas?". Esta clase de preguntas requieren informaci6n que va mis all6 de la contenida en una simple estimaci6n puntual; son preguntas que buscan conocer la fiabilidad de dicho estimador. En otras palabras, se trata de la bdsqueda de un estimador por intervalos, un rango de valores. entre 10s que posiblemente se encuentre la cantidad que se estima. Si extraemos una muestra relativamente grande de la poblaci61-1,es 16gico esperar que la informacidn que nos aporta sea mhs fiable que la procedente de una muestra mis pequeiia, siempre que las restantes condiciones del muestreo Sean las mismas. Sin embargo, este aspect0 no se refleja en la estimaci6n puntual. Por ejemplo, nuestro estimador de la proporci6n de piezas defectuosas seria el mismo si encontrhamos una pieza defectuosa en una muestra de tamaiio diez que si descubritsemos 100 defectuosas en una muestra de 1.000 piezas. Como luego veremos, el increment0 de la precisi6n de nuestra informaci6n sobre 10s parimetros de la poblaci6n se refleja en 10s estimadores por intemalos; mis especificamente, cuanto mayor sea la muestra, menor seri el intemalo que recoge nuestra incertidumbre sobre el verdadero valor del parhmetro, siempre que las otras condiciones permanezcan iguales.

234

E S T I M A C I ~ NPOR INTERVALOS

Definiciones:
Un estimador por intervalos de un parhetro poblacional es una regla (basada en informaci6n muestral) para determinar un rango, o un intervalo, en el cual posiblemente se encuentre dicho parhetro. La estimaci6n correspondiente se denornina estimacion por intervalos. Hasta ahora hernos dicho que 10s estimadores por intervalos contienen "posiblemente" o "muy posiblemente" el verdadero, aunque desconocido, parhetro poblacional. Para formalizar estas afirmaciones, es necesario expresarlas en tkrminos probabilisticos. Sea 8 el parhetro a estimar. Supongamos que hemos extraido una muestra aleatoria y que bashdonos en la informaci6n muestral es posible encontrar dos variables aleatorias, A y B, con A menor que B. Si estas variables aleatorias tienen la propiedad de que la probabilidad de que A sea menor que 8 y que B sea mayor que 8 es 0,9, podemos decir que

El intervalo de A a B es un estimador por intervalos de 8 a1 90% de confianza. Si denominamos las realizaciones particulares de estas dos variables aleatorias por a y b, entonces, el intervalo de a a b se denomina intervalo de confianza del90% para 8. De acuerdo con el concept0 de frecuencia de probabilidad, podemos interpretar estos intervalos ask si se extraen repetidamente muestras de la poblaci6n y se calculan 10s intervalos de esta manera, entonces, el 90% de 10s intervalos contendrh el parhmetro desconocido. De manera m6s general, podernos definir intervalos de confianza del porcentaje que nosotros queramos, siempre menor, por supuesto, del 100%. Supongamos que las variables aleatorias A y B son tales que donde a es un ntimero cualquiera entre 0 y 1. (En el ejemplo del p k a f o anterior, 1 - a = 0,9, por lo que a = 0,l.) Entonces, si se extraen repetidarnente muestras aleatorias de la poblaci6n y se calcula este intervalo, una proporci6n (1 - a), o 100(1 - a)%, de estos intervalos contendrh el parhetro 8. Un intervalo calculado de esta manera se denornina un intervalo de confianza del 100(1 - a)% para 8.

Definiciones:
Sea 8 un parhetro desconocido. Supongamos que bashdonos en la informaci6n muestral, podemos encontrar dos variables aleatorias A y B tales que Si representamos las realizaciones particulares de A y B por a y b, entonces, el intervalo de a a b se denornina intervalo de confianza del 100(1 - a)% para 8. La cantidad (1 - a ) se denomina contenido probabilistico o nivel de confianza del intervalo. Si se extraen muestras aleatorias de la poblaci6n un nlimero elevado de veces, el parhetro 8 estarh contenido en un 100(1 - a)% de 10s intervalos calculados de este modo. El intervalo de confianza obtenido de esta manera se escribe a<B<b En las siguientes piginas de este capitulo, desarrollaremos e ilustraremos con ejernplos procedimientos para hallar intervalos de confianza en varios tipos de problemas comunes de estimaci6n. En posteriores capitulos se recogerh ejemplos mhs sofisticados.

INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCI6N NORMAL.. .

235

8.2 INTERVALOS DE CONFIANZA PARA LA MEDIA

DE WNA DISTRIBUCI~N NORMAL: VAIUANZA POBLACIONAL CONOCIDA


Imaginemos que se extrae una muestra aleatoria de una distribuci6n normal con media desconocida y varianza conocida, y que nuestro objetivo es hallar un intervalo de confianza para la media poblacional. Este problema resulta poco realista, ya que rara vez (probablemente ninguna) se conoce la varianza poblacional siendo la media desconocida. Sin embargo, a veces si se da el caso en que habibndose extraido anteriormente y con frecuencia muestras de la poblaci6n. la varianza de la poblaci6n de interbs puede suponerse conocida aproximadamente bashdonos en dicha experiencia pasada. AdemBs, como veremos m h adelante, si se dispone de una muestra suficientemente grande, el mktodo desarrollado para este caso, en el cud la varianza poblacional es conocida, puede ser utilizado si se estima dicha varianza de la muestra. No obstante, la principal virtud de esta dcnica es que nos permite una exposici6n clara y sencilla de 10s procedimientos empleados a la hora de hallar intervalos de confianza. Si representarnos por XI, Xz, ...,X . una muestra aleatoria de n observaciones de una poblaci6n normal con media p y varianza conocida u2, y p ~Xr la media muestral, entonces, 10s intervalos de confianza para la media poblacional e s t h basados en el resultado por el que la variable aleatoria

tiene una distribuci6n normal estandar. Supongarnos que queremos calcular un intervalo de confianza del90% para la media poblacional. A partir de la funci6n de distribuci6n acumulada de la variable aleatoria normal esthdar, recogida en la Tabla 3 del Apkndice, tenemos que P(Z < 1,645) = Fz(1,645) = 0.95 Por tanto, P(Z > 1,645) = 0.05 Tarnbikn, dado que la funci6n de densidad de la variable aleatoria normal esthdar es simktrica alrededor de la media, 0, se deduce que P(Z < - 1,645) = 0.05 La probabilidad de que Z estk entre -1,645 y 1,645 es por ello Estos cAlculos de probabilidad se recogen en la Figura 8.1. Hasta ahora, hemos comprobado que la probabilidad de que una variable aleatoria normal estiindar estk entre 10s valores - 1.645 y 1,645 es igual a 0.9. A continuaci6n, transformarnos estA afirmaci6n probabilistica en un intervalo de confianza para la media poblacional:

Por tanto, la probabilidad de que en el intervalo aleatoLio que va de (X - 1 , 6 4 5 u l f i ) a (X+1,645ufi) se encuentre la media poblacional es 0.9. Asi, a partir de nuestra definici6n anterior

236

ESTIMACI~N POR INTERVALOS

FIGURA 8.1 P(-1,645<2<1,645) = 0,90, donde Z es una variable aleatoria normal estfindar

de intervalo de confianza se deduce que el intervalo de (F - 1 , 6 4 5 ~ 1 6a ) (y + 1 , 6 4 5 ~ 1 6es ) un intervalo de confianza del90% para p, donde T es el valor especifico observado para la media muestral. Para una mayor sencillez, este intervalo se expresa asi:

EJEMPLO

8.1

Tenemos una muestra aleatoria con media cinco de sesenta observaciones procedentes de una poblaci6n normal con desviaci6n tipica seis. Hallar un interval0 de confianza del90% para la media poblacional, p. Tenemos que

X=25 u=6 El intervalo de confianza del90% viene dado por

n=16

de manera que obtenemos

Nos detenemos ahora para considerar la interpretacibn adecuada de 10s intervalos de confianza siguiendo el Ejemplo 8.1. En este ejemplo, calculamos, basindonos en una muestra de 60 observaciones, un intervalo de confianza del90% para la media poblacional desconocida que va desde 22,5325 a 27,4675. Ahora bien, esta muestra particular es s610 una de las muchas que extraerse extraidas de la poblaci6n. Supongamos que quisiCramos empezar otra vez, tomando una segunda muestra de 60 observaciones. Es totalmente seguro que la media de esta segunda muestra seri distinta a la obtenida inicialmente. Consecuentemente, si calculamos un intervalo de confianza del90% utilizando esta segunda muestra, serd tarnbiCn diferente al obtenido en el Ejemplo 8.1. Podriamos extraer unqelevado nlimero de muestras aleatorias independientes de 60 observaciones y calcular el correspondiente in-

INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUC16N

NORMAL..

237

tervalo de confianza del90% para cada una de ellas. El contenido probabilistico del intervalo implica que el 90% de 10s intervalos calculados de este mod0 incluyen el verdadero valordel parhetro. Es en este sentido que podemos decir que tenemos una "confianza del90%" en nuestra estimaci6n por intervalos. Estas ideas se ilustran en la Figura 8.2. La parte (a) de la figura muestra la distribuci6n muestral de la media muestral de n observaciones procedentes de una poblaci6n normal con media p y desviaci6n tipica a.Esta distribuci6n muestral es normal, con media p y desviaci6n tipica u / f i .Un intervalo de confianza para la media poblacional estarh basado en el valor observado de la media muestral, es decir, en una observaci6n extraida de nuestra distribuci6n muestral. La parte (b) de la figura recoge una sucesi6n de intervalos de confianza del 90%, obtenidos de muestras independientes de la poblaci6n. El centro de estos intervalos, que son simplemente 10s valores observados de la media muestral, estarhn con frecuencia muy cerca de la media poblacional, p. Sin embargo, algunos pueden estar sensiblemente alejados de dicho valor. Estamos seguros de que el 90% de un numero elevado de estos intervalos incluirh la media poblacional. Pasamos ahora a tratar de manera general el cilculo de intervalos de confianza con un determinado contenido probabilistico. Presentamos una nueva notaci6n para ello.

FIGURA 8.2 Interpretaci6n de un intervalo de confianza del90%

(a) Distribuci6n muestral de la media muestral de n obervaciones procedentes de una distribuci6n normal con media p y varianza a2

(b) lntervalos de confianza del 90%para la media poblacional

Notaci6n:
Sea Z una variable aleatoria normal esthdar y a un valor tal que 0 < a < 1. Llamaremos entonces z, a1 nbmero que verifica I P(Z > z , )=a

Esta notaci6n se ilustra en la Figura 8.3, en la que se observa claramente c6mo encontrar z, en las tablas de la funci6n de distribucidn acumulada de la variable aleatoria normal esthdar. Da& que P(Z > z,) = a,entonces,

como se muestra en la Figura 8.3. Por tanto, para cualquier a,z, puede determinarse a partir de la Tabla 3 del ApCndice. Por ejemplo, si a = 0,025, entonces
'

1 - a = 0,975

y asi y en la tabla tenemos que Por tanto, La Tabla 8.1 recoge valores de z, correspondientes a algunos valores de a que son utilizados con frecuencia a la hora de hallar intervalos de confianza. El lector puede verificar estas cantidades incluidas en la Tabla 3 del ApCndice. Supongamos ahora que necesitamos un interval0 de confianza del 100(1 - a)% para la media poblacional. Empleando la notaci6n ya introducida, tenemos que

FIGURA 8.3 P(Z > z , ) = a,donde Z es una variable aleatoria normal estindar

INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCI~N NORMAL.. .


y por la sirnetria de la densidad normal alrededor de la media
P(Z < - z a ) = 2 Se deduce, por tanto, que
ff

239

Estos chlculos de probabilidad se ilustran en la Figura 8.4. Hemos encontrado un rango de valores de la variable aleatoria normal esthndar con un contenido probabilistico especifico. Esta informaci6n puede ser empleada para elaborar un intervalo de confianza con el mismo contenido probSlbiii$ico para la media poblacional. Siguiendo exactamente la misma lhea argumental que la utilizada al calcular el intervalo del90%, tenemos que

Se deduce de la definici6n de intervalos de confianza que s i x es el valor especifico observado de la media muestral, entonces, un intervalo de confianza del 100(1 - a)% para la media poblacional viene dado por

TABLA 8.1 Valores de z, procedentes de la tabla de la funci6n de distribuci6n acumulada normal esthdar

F'IGURA 8.4 P(-za<Zua)

= 1 - a , donde Z es una variable aleatoria normal esthndar

240

ESTIMACI~N POR INTERVALOS

-k-Intervalos de confianza para la media de una poblacion normal: varianza poblacional conocida Supongamos que tenemos una muestra aleatoria de n observaciones procedentes de una distribuci6n normal con media p y varianza 2. Si 2 es conocida y el valor observado de la media entonces, un intervalo de confianza del 100(1 - a)% para la media poblacional muestral es viene dado por

x,

x-3E<p<z+5E

donde zd es el numero que verifica P(Z > z , )


=

z2

y la variable aleatoria Z tiene una distribuci6n normal estindar

La interpretacidn de estos intervalos de confianza generales se corresponde con la de un intervalo del 90%. Si se toman muestras de n observaciones repetida e independientementey se calculan intervalos de confianza del 100(1 - a)% empleando la f6rmula del recuadro, entonces, despuCs de un gran numero de extracciones, un 100(1 - a)% de estos intervalos incluirin la verdadera media poblacional.

EJEMPI,O

8.2

Un proceso produce bolsas de azucar refinado. El peso del contenido de estas bolsas tiene una distribuci6n normal con desviaci6n tipica 15 gramos. Los contenidos de una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos. Calcular un intervalo de confianza del95% para el verdadero peso medio de todas las bolsas de azdcar producidas por el proceso. Dado que buscamos un intervalo de confianza del95%, tenemos que lOO(1 - a s 9 5 por lo que
a
i

= 0,05

Entonces,
Zd?

= z.025

y buscamos el valor ZO,O~S para el cud


P(Z > z.025) = 0,025 Por tanto,

donde Fz(z) es la funcidn de distribucidn acumulada de la variable aleatoria normal estindar. Entonces, de la Tabla 3 del ApCndice, tenemos que
Zo25 = 1,96 El intervalo de confianza del95% para la media poblacional u es
(

INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCI6N NORMAL..

245 1

donde

z=100

za=1,96

u=15

n=25

Por tanto, el intervalo que buscarnos es

Por todo esto, el intervalo de confianza que pedia el ejernplo va de 94,12 a 105,88 grarnos. Nos detenernos ahora a considerar la naturaleza general de 10s intervalos de confianza para la rnedia de una poblaci6n normal cuando la varianza es conocida. Los resultados que siguen aportan una visi6n de la estructura de la estimaci6n por intervalos. Algunos autores extienden tam6iCn estos resultados a otros problemas de estimaci6n por intervalos. 0 0 ( 1 - a)% para la media poblacional es Hemos visto que un intervalo de confianza del 1

Como se podria intuir. la medid&estral X esth en el centro del intervalo. La longitud, w, del intervalo, es decir, la distancia entre 10s extrernos, es

Puede comprobarse, entonces, que la longitud de un intervalo de confianza depende de su contenido probabilistico, la desviaci6n tipica poblacional y el ndmero de observaciones de la rnuestra. En particular, se verifican 10s siguientes resultados:
1. Dado un contenido probabilistico y un tamaiio muestral, cuanto mayor sea la desviacio'n tkica poblacional p, mayor longitud tendrrf el intervalo de confianza para la media poblacional. Esto resulta convincente intuitivamente, dado que, siempre que las otras condiciones permanezcan intactas,'cuanto mis dispersa est6 la distribuci6n de la poblaci6n alrededor de su media, m i s incierta seri nuestra inferencia sobre la media. Esta incertidumbre adicional se refleja en unos intervalos de confianza de mayor longitud. 2. Dado un contenido probabilistico y una desviaci6n tipica poblacional, cuanto mayor sea el tamario de la muestra n, mcis corto serrf el intervalo de confianzapara la media poblacional. Una vez m6s, esti conclusi6n resulta intuitiva. Cuanta mayor ihformaci6n obtenemos sobre una poblaci6n, rnis precisa debe ser nuestra inferencia sobre su media. Esta precisi6n adicional se refleja en unos intervalos de confianza rnis cortos.

3. Dada una desviaci6n tipica poblacional y un tamaiio muestral, cuanto mayor&b&hTd>~robdbilistico ( 1 - a),mayor serrf la longitud del intervalo de confianza para la media poblacional. Por ejemplo, un interval~ de confianza del99% seri rnis largo que un intervalo de confianza del95% basado en la misma informaci6n muestral. Esto se debe a que cuanto mayor sea (1 - a), menor seri a y, tanto, mayor seri z , ~ En . efecto, a cambio de una mayor certidumbre en nuestras declaraciones de probabilidad, obtenemos una menor precisi6n de dichas afirmaciones. Esto se refleja en unos intervalos de confianza mis largos para 10s parhetros de la poblaci6n, ya que el contenido probabilistico aumenta.

Estos resultados se ilustran en la Figura 8.5. La figura recoge, para la misma media rnuestral, el efecto en el intervalo de confianza de incrementos en el tamaiio de la muestra, la desviaci6n tipica poblacional y el contenido probabilistico del intervalo. En esta secci6n, a1 elaborar intervalos de con!ianza para la media, introdujimos dos requisitos que limitan el campo de aplicaci6n de estos estirnadores por intervalos a problemas prhcticos -a saber, que la distribuci6n poblacional es normal y que su varianza es conocida. Sin embargo, si el tamaiio de la mues-

FIGURA 8.5 Los efectos del tamaiio de la muestra n, la desviaci6n tipica poblacional a y el contenido pmbabilistico
(1 - a) para la media de una distribuci6n normal; en cada caso, la media muestral es 19,8

tra es grande, ninguno de 10s requisitos resulta muy restrictive. En este caso, por el teorema central del limite, 10s intervalos de confianza descritos en esta secci6n siguen siendo aproximadamente vhlidos incluso cuando la distribuci6n de la poblaci6n no es normal. AdemL, cuando el tamaiio de la muestra es grande, la desviaci6n tipica muestral sera un estimador lo suficientementebueno de la desviaci6n tipica poblacional como para permitirnos emplear el prirnero en lugar del segundo sin afectar seriamente el intervalos de confianza exactamente del contenido probabilistico de 10s intervalos. Asi, podemos cal~ular mismo modo descrito previamente, sustituyendo la desviaci6n tipica poblacional por la muestral.

t3"

..\
-

Intervalos de confianza para la media poblacional: tamaiios muestrales grandes Supongamos que tenemos una muestra de n observaciones procedentes de una distribuci6n con media p. Sean I y sx la media muestral observada y la desviaci6n tipica, respectivamente. Entonces, si n es ) % para p viene dada por grande', una buena aproximacidn de un interval0 de confianza del 100(1 - a
jg

i z < El. <


ZdS"

Z4Sx

En la mayor parte de 10s casos esta aproximaci6n seguirh siendo adecuada incluso cuando la distribuci6n de la poblaci6n no es normal. Asi, si el tamaiio muestral es grande, podemos relajar dos de las hipdtesis realizadas anteriormente y, por consiguiente, ampliar considerablemente el campo de aplicacidn de nuestros resultados, como se ilustra en el siguiente ejemplo.

' Como una regla empirica, consideramos que n = 30 observaciones o m h constituyen una muestra "grande". Sin embargo, no se debe concluir que la aproximaci6n es virtualmente perfecta para una muestra de 30 observaciones y absolutamente tenible para una tamaiio muestral de 29. MAS bien, la calidad de esta aproximaci6n mejora gradualmente con un tamaiio muestrd creciente.

EJEMPLO

8.3

' Se extrajo una muestra aleatoria de 172 estudiantes de contabilidad y se les pidi6 que evaluasen unas determinadas condiciones de trabajo en una escala de 1 (no importante) a 5 (extremadamente importante)'. La "seguridad en el trabajo" recibi6 una calificaci6n media de 4,38 con una desviaci6n tipica muestral de 0.70. Calcular un intervalo de confianza del99% para la media poblacional. Dado que 10s valores de las observaciones tienen que ser n6meros enteros entre 1 y 5, la distribuci6n de la poblaci6n no es normal. Sin embargo, gracias a1 teorema central del limite, para una muestra de este tamaiio, la distribuci6n muestral de la media muestral serh muy cercana a la normal, lo cual justifica 10s siguientes ctilculos. Obtenemos el intervalo

donde

, yz

es el valor para el cud P(Z > z ) ,


=a 1 2

Entonces, para un intervalo de confianza del99%

donde el valor, z se ha obtenido de la tabla 3 del Ap6ndice. El intervalo de confianza del99% para la media poblacional es

4.24

< p < 4.52

Asi, el intervalo de confianza del99% para la calificaci6n media poblacional va desde 4.24 a 4.52.

8.3 LA DISTRIBUCI~NTDE STUDENT


En la secci6n anterior, derivamos intervalos de confianza para la media de una poblaci6n normal cuando la varianza poblacional era conocida. Apuntamos que la hip6tesis de la varianza conocida podia relajarse cuando el tamaiio muestral era grande. Trataremos ahora el caso, de considerable inter& prhctico, en el que la varianza poblacional es desconocida y el tamaiio de la muestra es pequeiio. Para ello es necesario presentar una nueva clase de distribuciones de probabilidad. El resultado desarrollado en la Secci6n 8.2 estaba basado en el hecho de que la variable aleatoria

2 Estos resultados fueron proporcionados por P. Bundy y D. Noms, "What accounting students consider important in he job seletion process", Journal of Applied Business Research, 8, no. 2 (1992). 1-6.

tiene una distribuci6n normal estirndar. En el caso que la desviaci6n tipica poblacional sea desconocida, este resultado no puede ser utilizado directamente. En tales circunstancias, es natural considerar la variable aleatoria que resulta de sustituir el valor desconocido a en la Ecuaci6n (8.3.1) por la desviaci6n tipica muestral, sx, obtenihndose
t=%

Esta variable aleatoria no sigue una distribuci6n normal estandar. Sin embargo, su distribucidn es conocida y es de hecho un miembro de una familia de distribuciones denominada t de Student3.

La distribucion t de Student Dada una muestra de n observaciones con media X y desviaci6n tipica SX, procedente de una poblaci6n normal con media p, la variable aleatoria
-p t= X sdfi

sigue una distribucion t de Student con (n - 1) grados de libertad 4. Un miembro determinado de la familia de distribuciones t de Student se caracteriza por el nlimero de grados de libertad para el cual emplearemos el parhmetro v. Una variable aleatoria t de Student con v grados de libertad la denominaremos por t,. La forma de la distribuci6n t de Student es bastante similar a la de la normal esthdar. Ambas distribuciones tienen media 0 y la funciones de densidad son simCtricas alrededor de la media. Sin embargo. la funci6n de densidad de la t de Student tiene una dispersidn mayor (que se refleja en una mayor varianza) que la normal esthndar. Este hecho puede verse en la Figura 8.6, la cual recoge las funciones de densidad de la normal esthdar y de la distribuci6n t de Student con tres grados de libertad. La dispersi6n mayor de la t de Student surge como resultado de la incertidumbre adicional provocada por el hecho de sustituir la desviaci6n tipica poblacional conocida por un estimador muestral. A medida que el ndmero de grados de libertad aumenta, la t de Student toma una forma cada vez mis similar a la de la normal esthndar. Cuando el ndmero de grados de libertad es elevado, ambas distribuciones son virtualmente idknticas. Esto resulta razonable intuitivamente, y se deduce del hecho de que para una muestra grande, la desviaci6n tipica muestral es un estimador muy preciso de la desviaci6n tipica poblacional. Para basar nuestras inferencias sobre la media poblacional en la distribucidn t de Student, necesitamos probabilidades asociadas a dicha distribuci6n. Para describir estas probabilidades hemos de introducir una nueva notacidn que presentamos en la Figura 8.7 y en el siguiente recuadro.

'Este resultado fue publicado en 1908 por W.S. Cosset cuando trabajaba en Irlanda para la empresa Guinness Breweries, la cud prohibi6 que sus empleados publicasen investigaciones cientfficas. Por esta raz6n. su trabajo apareci6 bajo el seud6nimo "Student", el cud da nombre a la distribuci6n. '~dvitrtase que el niunero de grados de libertad coincide con el correspondiente &$d&tribuci6n chi-cuadrado basada en el mismo tamaiio muestral como asi vimos en la Secci6n 6.4. Formalmente, laJvariable aleatoria t de Student con Y grados de libertad se define como
"

donde Z es una variable aleatoria normal esthdar, x.2 es una variable aleatoria chi-cuadrado con v gados de libertad y Z y x.2 son independientes.

FICURA 8.6 Funci6n de densidad de las distribuciones normal esthdar y t de Student con tres grados de libertad
Distribucibn normal esttrndar Dishibuci6n t de Student con tres grados de libertad

-3

-2

-1

t,?

Notaci6n:
Representaremos por t , la variable aleatoria que sigue una distribuci6n t de Student con v grados de libertad. AdemAs, t , , sera el valor para el cual

P(t" > t , , ) = a
En las aplicaciones mds usuales, necesitaremos encontrar el valor t , , correspondiente a una probabilidad determinada a.Estas cantidades se recogen en la Tabla 6 del ApCndice. Por ejemplo, supongamos que queremos hallar el valor que excede con probabilidad 0,l a una variable aleatoria t de Student con 15 grados de libertad. Es decir, .
P(tl5

> tl5,o.l)

0,l

Si miramos en la tabla, tenemos que Utilizaremos ahora la distribuci6n t de Student para calcular intervalos de confianza para la media de una poblaci6n normal. De manera similar a lo expresado con respecto a la distribuci6n normal esthdar en la Secci6n 8.2, se deduce que a P(t, > I , , ) = -

FICURA 8.7 P(t, > t , , ) = a, donde t, es una variable aleatoria t de Student con v grados de libertad

246

ESTIMACI~N POR INTERVALOS

FIGURA 8.8 P(-t,, < t, < t,&) = 1 - a,donde t, es una variable aleatoria t de Student con v grados de libertad

Ademis, debido a la simetria de la funci6n de densidad de la distribuci6n t de Student alrededor de su media 0

Finalmente, dado que las probabilidades de sucesos mutuamente excluyentes y colectivamente exhaustivos suman 1, se deduce que

Estas probabilidades se muestran en la Figura 8.8, que se corresponde con la Figura 8.4, referida a la distribuci6n normal esthdar.

8.4 INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCI~N NORMAL: VARLANZA POBLACIONAL DESCONOCIDA
Podemos emplear ahora la distribuci6n t de Student para derivar intervalos de confianza para la media de una poblaci6n normal cuando la varianza es desconocida, siguiendo un argument0 similar al de la Secci6n 8.2. Supongamos que disponemos de una muestra aleatoria de n observaciones procedentes de una poblaci6n normal con media p y varianza desconocida, y que buscamos intervalos de confianza para la media poblacional. Sean X y sx2 la media y la varianza muestrales, respectivamente. Entonces, sabemos, por lo expuesto en la Secci6n 8.3, que la variable aleatoria

sigue una disuibuci6n t de Student con (n - l).grados de libertad.

INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUC16N NORMAL.. .

247

. Supongamos que queremos calcular un intervalo de confianza dellOO(1 - a)% para la media poblacional. Siguiendo el razonamiento empleado en la Secci6n 8.2, tenemos que

Por tanto. de la definici6n de intervalos de confianza se deduce que si 3 y s, son 10s valores observados para la media y la desviacidn tipica muestrales, entonces, un intervalo de confianza del 100(1 a)% para la media poblacional viene dado por

Intervalos de confianza para la media de una poblaci6n normal: varianza poblacional desconocida Supongamos que tenemos una muestra aleatoria de n observaciones procedentes de una distribuci6n normal con media p y varianza desconocida. Si la media y la desviaci6n tipica muestrales observadas son, respectivamente,f y s , , entonces, un intervalo de confianza del 100(1 - a)% para la media
poblacional viene dado por
L - l . d x

< <f + L-

1 . d ~

6
donde t. - I , 4 es el valor que verifica
a

fi

P(t" - 1 > t n - I,&) = 2


y la variable aleatoria t,l sigue una distribuci6n t de Student con (n - 1) grados de libertad.

A continuaci6n, ilustramos con un ejemplo el uso de la t de Student a la hora de hallar intervalos moderado de confianza para la media de una poblaci6n normal cuando se dispone s610 de un n ~ m e r o de observaciones.

EJEMPLO

3.4

Una muestra aleatoria de seis coches americanos de un determinado modelo consumen las siguientes cantidades en kildmetros por litro:

Calcular un intervalo de confianza del90% para el consumo de gasolina medio poblacional de 10s autom6viles de este modelo, suponiendo que la distribuci6n de la poblacion es normal. Como un primer paso, tenemos que hallar la media y la varianza muestrales, las cuales pueden ser calculadas ayudiindonos de la siguiente tabla:

248

ESTIMACI~N POR INTERVALOS

La media muestral es

y la varianza muestral es

por lo que la desviacidn estfindar muestral es


s, =

d @ %

= 0,98

Dada la hip6tesis de que la distribucidn de la poblacidn es normal, podemos construir intervalos de confianza para la media poblacional:

donde

AdemBs, dado que n - 1 = 5, y como buscamos un intervalo de confianza del90%, tenemos que a = 0,1, por lo que a12 = 0,05 y

de acuerdo con la Tabla 6 del ApCndice. El intervalo de confianza del90% para la consumo de gasolina medio poblacional es, entonces,

Asi, nuestro intervalo de confianza del90% para el consumo de gasolina medio poblacional va de 18,67 a 20,29 kil6metros por litro. A veces, en lugar de presentar linicamente un intervalo de confianza, resulta conveniente presentar una sene de intervalos de confianza con distintos contenidos probabilisticos. A1 analizarlos conjuntamente podemos formarnos una imagen mBs clara sobre 10s posibles valores del parhetro poblacional que se haya estimado. La Figura 8.9 muestra 10s intervalos de confianza del80%, 95% y 99% calculados a partir de 10s datos del Ejemplo 8.4. AdviCrtase que la longitud de 10s intervalos aumenta a medida que crece el contenido probabilistico, tal y como era de esperar.

INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRlBUCl6N NORMAL.. .

249

EJEMPLO

8.5

En un estudio de 10s efectos de las fusiones en la indusma del transporte por carretera5,se examino una muestra aleatoria de 70 empresas resultantes de una fusi6n y se midi6 el increment0 en la tasa de crecimiento de la carga en toneladas transportadas en el period0 posterior a la fusibn, comparbdolo con el anterior a dicha fusi6n. Para cada una de estas empresas, se examin6 otra empresa con una localizacidn y tamaiio sirnilares per0 que no habia participado en una fusi6n. Se calcul6 la diferencia en las tasas de crecimiento de ambas clases de empresa. Los valores muestrales que surgieron como resultado de dicho cAlculo tenian media 0,105 y desviaci6n tipica 0,440. Calcular un intervalo de confianza del90% para la media poblacional, asumiendo que la distribuci6n de la poblaci6n es normal. Los intervalos de confianza se hallan a partir de
f

t n - 1,ar~Sx

y en este caso se tiene que

fi

<p<f+

tn

- 1,ar~Sx

fi

Dado que n - 1 = 16, y como buscamos un intervalo de confianza del95%, entonces, a = 0,05, y se sigue que empleando la Tabla 6 del ApBndice. Asi pues, el intervalo de confianza del95% para la media poblacional es

FIGURA 8.9 Intervalos de confianza del80%, 95% y 99% para el consumo de gasolina medio poblacional correspondientes a 10s datos del Ejemplo 8.4
lntervalo de confianza del 80% 18,89 19,48 20,07

I
18,67

lntervab de confianza del90% 19,48

I 20,29

I 18,45

lntervalo de confianza del 95% 19,48

I 20,51

t 17,87

lntelwlo de confianza del99% 19,48

I 21,09

'Ejemplo presentado en R.P.Boisjoly y T.M. Corsi, "The economic implications of less-than-truckload motor camer mergers", Journal of Economics and Business33 (1980), 13-20.

250

ESTIMACI~N POR INTERVALOS

El intervalo de confianza del95% para la diferencia media poblacional en el increment0 de las tasas de crecimiento entre empresas resultado de una fusi6n y aquellas que no lo son va desde -0,121 a 0,331. Advikrtase que el interval0 incluye el 0, lo cual sugiere que 10s datos no contradicen seriamente la conclusi6n de que no existe tal diferencia en media.

1. En la secretaria de tercer ciclo de cierta universidad se ha comprobado que la nota media de licenciatura de 10s candidatos para la admisi6n a un master en Administraci6n de Empresas sigue una distribuci6n normal con una desviaci6n tipica de 0,45. Se toma una muestra aleatoria de 25 solicitudes correspondientes a1 presente aiio y se obtiene una media muestral de las calificaciones medias igual a 2,l. a) Calcular un intervalo de confianza del95% para la media poblacional. b) A p& de 10s resultados muestrales, un estadistico calcula para la media poblacional una intervalo de confianza que va de 2,81 a 2,99. Calcular el contenido probab'istico asociado a dicho intervalo. 2. Se sabe que el peso de 10s ladrillos producidos por una determinada fhbrica sigue una distribuci6n normal con una desviaci6n tipica de 0,12 kilos. En el dia de hoy se extrae una muestra aleatoria de sesenta ladrillos cuyo peso medio es de 4,07 kilos. a) Calcular un intervalo de confianza del99% para el peso medio de 10s ladrillo producidos hoy. b) Sin realizar 10s ciilculos, determinar si un interval~ de confianza del95% para la media poblacional tendria mayor, menor o la misma longitud que el calculado en el apartado (a). c) Se decide que maiiana se tomarh una muestra de 20 ladrillos. Sin realizar 10s c8lculos, determinar si un intervalo de confianza del 99% para el peso medio de 10s ladrillos producidos maiiana tendrfa mayor, menor o la misma longitud que el calculado en el apartado (a). d) Se sabe que la desviaci6n tipica poblacional para la producci6n de hoy es de 0,15 kilos. Sin realizar 10s c~lculos, determinar si un intervalo de confianza del99% para el peso medio de 10s ladrillos producidos hoy tendria mayor, menor o la misma longitud que el calculado en el apartado (a). 3. Un director de producci6n sabe que la cantidad de impurezas contenida en 10s envases de cierta sus-

tancia quimica sigue una distribuci6n normal con una desviaci6n tipica de 3,8 gramos. Se extrae una muestra aleatoria de nueve envases cuyos contenidos de impurezas son 10s siguientes:

a) Calcular un intervalo de confianza de190% para el peso medio poblacional de impurezas. b) Sin realizar 10s ciilculos, determkar si una intervalo de confianza del95% para la media poblacional tendrfa una longitud mayor, menor o igual a la calculada en el apartado (a). 4. Un directive de cierta empresa ha comprobado que 10s resultados obte~dos en 10s tests de aptitud por 10s s e licitantes de un determinado puesto de trabajo sigue una distribuci6n normal con una desviaci6n tipica de 32,4 puntos. La media de las calificaciones de una muestra aleatoria de nueve tests es de 187,9 puntos. a) Calcular un intervalo de confianza del80% para la calificaci6n media poblacional del grupo de solicitantes actual. b) A parti? de estos resultados muestrales, un estadistico calcula para la media poblacional un interval~ de confianza que va desde 165,8 a 210,O puntos. Calcular el contenido probabilistico de dicho intervalo. 5. Se tom6 una muestra aleatoria de 1.562 estudiantes de marketing en cierta universidad y se les pidi6 que calificasen en una escala de ~ l n o (totalrnente en desacuerdo) a siete (totalmente de acuerdo) la siguiente afirmacibn: "La mayoria de los anuncios publicitarios insultan la inteligencia del consumidor mediom6. La media y la desviaci6n tipica de las respuestas fue de 3,92 y 1,57, respectivamente. Calcular un intervalo de confianza del95% para la calificaci6n media poblacional. 6. Se tom6 una muestra aleatoria de 541 consumidores y se les pidid que calificasen en una escala de Datos proporcionados por J.C. Andrews, "The dimensionality of beliefs toward advetising in general", Journal of Advertising,18,no. 1 (1989), 26-35.

INTERVALOS DE CONFIANZA PARA IAMEDIA DE UNA DISTR~BUCION NORMAL.. .

25 1

uno (totalmente en desacuerdo) a cinco (totalmente de acuerdo) la siguiente afirmaci6n: "Un vendedor deberia responsabilizarse de 10s productos defectuosos aun cuando se hayan tomado todas la precauciones posibles en su fabricaci6n y ventan7.La calificaci6n media y desviaci6n tipica de la muestra heron de 3,81 y 1.34, respectivamente. a) Calcular un intemalo de confianza del90% para la calificaci6n media poblacional. determinar si un intervalo b) Sin realizar 10s c~culos, de conlianza del80% tendria una mayor, menor o igual longitud que el calculado en el apartado (a). 7. Se tom6 una muestra aleatoria de 457 directores de producci6n japoneses y se les pidi6 que calificasen en una escala de uno (totalmente en desacuerdo) a cinco (totalmente de acuerdo) la siguiente afirmaci6n: "Reducir 10s productos defectuosos en las entregas a 10s clientes significa mayores costesW8. La respuesta media y desviaci6n tipica muestrales h e ron de 3 3 9 y 1,045, respectivamente. A partir de estos resultados, se calcul6 un intemalo de confianza de 3,49 a 3,69 para la media poblacional. Calcular el contenido probabilistico de dicho intemalo. 8. Un metodo diseiiado para medir la eficacia de 10s textos escritos es empleado para medir la comprensi6n de las noticias financieras. El procedimiento consiste en un test al que es sometido una muestra aleatoria de 352 contables; una nota de 57 sobre 100 supone un adecuado entendimiento9.La calificaci6n media y la desviaci6n tipica de la muestra heron de 60,41% y 11,28%, respectivamente. Calcular un intemalo de confianza del 90% para la calificaci6n media poblacional y comentar el resultado obtenido. 9. Se tom6 una muestra aleatoria de 174 expertos en investigaci6n de mercados y se les pidi6 que calificasen en una escala de uno (totalmente en desacuerdo) a siete (totalrnente de acuerdo) la siguiente afinnaci6n: "A veces utiLizo tecnicas de investigaci6n que garantizan la obtenci6n de 10s resultados que mi cliente/jefe desea"'O. La calificaci6n media y la desviaci6n tipica de la muestra hemn de 6,06 y 1,43, respectivamente.
7 ~ DeConinck . y J. Kopf, "Consumers' atitudes toward product liability reform", American Business Review, 10, no. 2 (1:92), 78-83. S.J. Daniel y W.D. Reitsparger, "Linking quality strategy with management control systems: empirical evidence from Japanese industry", Accounting, Organizations and society, 16; (1991), 601-18. Datos procedentes de A.H. Adelberg, "A methodology for measuring the understandability of financial report messages", Journal of Accounting Research, 17 (1979), 565-92. 10 I.P. Akaah, "Organizational culture and ethical research behavior", Journal of the Academy of Marketing Science, 21 (1993). 59-63:

a) A partir de estos resultados, se calcula un intervalo de conlianza que va desde 5,96 a 6,16. Calcular el contenido pmbabilistico de dicho intervalo. b) Comparar este resultado con el obtenido en el Ejercicio 7. Los dos intemalos de confianza tienen la misma longitud, pero su contenido probabilisticos es muy distinto. ~ P o qu6? r 10. Una tienda esth interesada en conocer 10s gastos en prendas de vestir de 10s estudiantes universitarios en el primer mes del curso academico. La media y la desviaci6n tipica de una muestra aleatoria de nueve estudiantes heron de 15.782 pesetas y 3.889 pesetas, respectivamente. Suponiendo que la poblaci6n sigue una distribuci6n normal, calcular un intemalo de confianza del95% para el gasto medio poblacional. 1 1 . La Direcci6n General de Triifico quiere conocer la velocidad a la que circulan 10s autom6viles en un tramo determinado de una carretera. Para una muestra de siete autom6viles, el radar seiial6 las siguientes velocidades en kil6metros por hora:

a) Calcular la media y la varianza muestral. b) Suponiendo que la distribuci6n poblacional es normal, hallar un intervalo de confianza del 95% para la velocidad media de 10s autom6viles que circulan por dicho tramo. 12. Una clinica oferta un programa de adelgazamiento. Una muestra aleatoria de 10 de sus antiguos pacientes recogi6,las siguientes perdidas de peso en kilos a1 completar el programa:

Sup6ngase que la distribucidn de la poblaci6n es normal. a) Calcular un intemalo de confianza del99% para la media poblacional. b) Sin realizar 10s chlculos, determinar si un intervalo de confianza del90% para la media pobla-

252

ESTIMACI~N POR INTERVALOS


16. Un fabricante de mhuinas recreativas est6 considerando su instalaci6n en 10s bares de varios campus universitarios. En un estudio piloto de la rentabilidad potencial de esta iniciativa, se instalaron mlquinas durante una semana en diez bares elegidos al azar. Si xi representa el beneficio semanal en miles de pesetas, se tienen 10s siguientes resultados:

cional tendria una longitud mayor, menor o igual a la obtenida en el apartado (a). 13. Las notas que obtienen 10s alumnos de una determinada asignatura en el examen final se sabe siguen una distribuci6n normal. Se extrae una muestra de 25 calificaciones que dan lugar a 10s siguientes estadisticos:

a) Calcular la media y la varianza muestral. b) Calcular un intervalo de confianza del90% para la media poblacional. 14. Una poblaci6n sigue una distribuci6n normal con media y varianza desconocidas. A partir de lo expuesto en la Secci6n 8.4 es posible, dada un muestra aleatoria, calcular intervalos de confianza para la media poblacional. Sin embargo, esto no es posible cuando se dispone de una muestra de una ~ c observaci6n. ~ P o qut? r 15. El director de una escuela de empresariales esth interesado en conocer 10s salarios de 10s ex-alumnos cinco aiios desputs de completar sus estudios. Dispone de una muestra aleatoria de 25 de estos diplomados cuya media y desviaci6n tfpica muestral es de 124.447 pesetaslmes y 120.025 pesetaslmes, respectivamente. Suponiendo que la distribuci6n de la poblaci6n es normal, hallar un intervalo de confianza del90% para la media poblacional.

a) Especificando las hip6tesis necesarias, calcular un intervalo de confianza del80% para 10s beneficios medios semanales poblacionales. b) Sin realizar 10s c6lculos, determinar si un interval~ de confianza del 90% para la media poblacional tendria una longitud mayor, menor o igual a la obtenida en el apartado (a). a

17. Una empresa de alquiler de coches estl interesada en conoc&el tiempo que sus vehiculos permanecen en el taller de reparaciones. Una muestra aleatoria de nueve coches indic6 que el pasado aiio el n6mero de dtas que cada uno de estos coches habia permanecido fuera de servicio era
Especificando las hip6tesis necesarias, calcular un intervalo de confianza del90% para el nhnero medio de dias que la totalidad de 10s vehiculos de la empresa se encuentra fuera de servicio.

8.5 INTERVALOS DE CONFIANZA PARA PROPORCIONES (MUESTRAS GRANDES) DE LA POBLACI~N


Supongamos ahora que estarnos interesados en la proporci6n de miembros de la poblaci6n que poseen un determinado atributo. Por ejemplo, podriamos querer estimar la proporci6n de individuos rnayores de edad que estih a favor de la legalizacidn del aborto libre. Si se toma una muestra aleatoria, un estirnador puntual razonable de la proporcidn de la poblacidn es la proporci6n rnuestral. En esta secci6n. construirernos intewalos de confianza para la proporci6n poblacional. Situindonos en el rnarco de la distribuci6n binomia1,px representa la proporci6n de "txitos" en n intentos independientes, cada uno con probabilidad de "C~ito'~ p. En la Seccidn 6.3, virnos que si n es grande, entonces, la variable aleatoria

sigue aproximadamente una distribuci6n normal. Desgraciadamente, este resultado no nos permite por si solo el chlculo de intewalos de cohfianza para la proporci6n poblacional, ya que el denominador de la

Ecuaci6n (8.5.1) depende del parhetro p desconocido. Sin embargo, si el tarnaiio muestral es grande, pudemos conseguir una buena aproximaci6n sustituyendo p por su estimador puntualdx, es decir,

Por tanto, para tamaiios muestrales grandes, la variable aleatoria

sigue aproximadamente una distribuci6n normal. Podemos, pues, utilizar este resultado para la construcci6n de intemalos de confianza para la proporci6n poblacional. Como ya hemos hecho anteriormente, definiremos z , como el valor para el cual

donde la variable aleatoria Z sigue una dishibuci6n normal. Entonces,

Por lo que se deduce que si la proporci6n muestral observada es$, un intervalo de confianza aproximado a1 100(1 - a)% para la proporci6n poblacional viene dado por
I I

Intervalos de confianza para la proporci6n poblacional (Muestras grandes)


Seafixla proporci6n observada de "Cxitos" en una muestra aleatoria de n observaciones procedentes de una poblaci6n con una proporci6n p de Cxitos. Entonces, si n es grande, un intervalo de confianza del 100(1 - a)% para la proporci6n poblacional viene dado por
$ x - ~ a ) ~ < p < B + z d

donde zd es el valor para el cual

P(Z > z d ) = 2

ff

y la variable aleatoria Z tiene una distribuci6n normal1'.


" Los intervalos de confianza construidos de este mod0 son geneplmente bastante fiables cuando se basan en muestras con n = 40 o mas observaciones.

Los intervalos de confianza para la proporci6n poblacional estin centrados en la proporci6n muestral. Se puede comprobar tambien que, siempre que las demhs condiciones permanezcan intactas, cuanto mayor sea el tamaiio muestral n, menor sera la longitud del intervalo de confianza. Este hecho refleja el increment0 en la precisi6n de la informaci6n sobre la proporci6n poblacional obtenida a medida que aumenta el tamaiio muestral.

EJEMPLO

8.6

A una muestra aleatoria de 344 mayoristas industriales se les pregunt6: ''iCu6I es la politica de su empresa con respecto a la aceptacidn por park del personal de compras de regalos que eventualrnente reciben de 10s proveedores? Ochenta y tres de estos mayoristas respondieron que, o bien la decisi6n era del personal de compras, o bien no habia ninguna politica al respecto (de manera que 10s compradores tomaban su propia decisi6n) 12. Calcular un intervalo de con!ianza del90% para la proporci6n poblacional. Siendo p la verdadera proporci6n poblacional y pxla proporci6n muestral, 10s intervalos de confianza para la proporci6n poblacional vienen dados por

px - zd2

p l ; ~ ' )

<p

<Ox

J"","'
zd2 = 1,645

donde, para un intervalo de confianza del90%, a = 0,1, de manera que ff/2 = 0,05 y Z a = 2.0, = 1,645 consultando la Tabla 3 del ApCndice. Entonces, tenemos que

n = 344
0,241
0

Ii, = 831344 = 0,24.1 <

Por tanto, un intervalo de confianza del90% para la proporci6n poblacional es

- 1,645

/T

0,203 < p < 0,279 Asi pues, el intervalo recorre 10s valores entre el 20,3% y 27,9% de la poblaci6n. La Figura 8.10 muestra 10s intervalos de confianza del 80%, 95% y 99% para la proporcibn poblacional. Como siempre, cuanto mayor es el contenido probabilistico, mayor es la amplitud d.el intervalo de confianza que se basa en la misma muestra.

EJEMPLO

8.7

A una muestra aleatoria de 147 directores de recursos humanos que ofertan trabajo a titulados universitarios, se le pregunt6 cuiQ era el papel que jugaba el expediente acadCmico en la evaluacidn de 10s candidatos. Ochenta y siete de estos directores contestaron "definitivo", "extremadamente importante" o "muy importante"". Calcular un intervalo de confianza del 95% para la proporci6n poblacional de directores de recursos humanos que compartian esta opini6n. Para un intervalo de confianza del95%, a = 0,05, por lo que zd2 = Z O , = ~ 1,96 ~ (Tabla 3 del Aptndice). Entonces, tenemos que

"M.M. Bud, "Gift-givingand gift-taking in industrial companies", Industrial Marketing Management, 18 (1989), 91-94. "Esta infomaci6n fue recogida por R.M. Schramm y R.N.Dortch, "An analysis of effective resume content, format, and appearance, based on college recruiter perceptions," Bulletin of the Association of Business Communication, 54, no. 3 (1991), 18-23.

FIGURA 8.10 Intervalos de confianza del80%, 90% y 99% para una proporci6n poblacional basada en 10s datos del Ejemplo 8.6
1 0,211
Intervalo de confianza del 80%

0,241

I 0,271

lnbrvalo de confianza del 90%

I
0,196

Intervalo de confianza del 95%

0,241

I 0,286

I 0,182

Intervalo de confianza del 99%


.

0,241

0,300

Sustituyendoen la f6mula general obtenemos el intervalo de confianza del95% que viene dado por 0,613 - 1,96
0

J )

<p
0,533 < p

< 0,613 + 1 9 6 < 0,693

Por tanto, el intervalo de confianza discutre entre 10s valores 53,3% y 69,3%. Este intervalo es bastante amplio, lo cual es un signo de la imprecisi6n de nuestro conocimiento sobre la proporci6n poblacional. Se pueden conseguir intervalos de confianza con menor amplitud si se toman muestras m h grandes. En la Secci6n 8.9, veremos c6mo determinar el tamaiio muestral necesario para construir un intervalo de confianza con una amplitud dada.

8.6 INTERVALOS DE CONFIANZA PARA LA VARIANZA DE UNA POBLACI~N NORMAL


En las Secciones 8.2 y 8.4, aprendimos a calcular intervalos de confianza para la media poblacional. En ocasiones, se requieren tarnbiCn estimaciones por intervalos para la varianza de la poblaci6n. Como se podria intuir, tales estimaciones esthn basadas en la varianza muestral. Imaginemos que tenemos una muestra de n observaciones procedentes de una poblaci6n n o d con vay representarnos por sx2 la varianza muestral. En la Secci6n 6.4, vimos que la vahble aleatoria rianza d,

sigue una distribuci6n chi-cuadrado con (n - 1) grados de libertad. Este resultado es clave a la hora de construir intervalos de confianza para la varianza poblacional cuando se toman muestras de una poblaci6n normal.

256

ESTIMACION POR INTERVALOS

FIGURA 8.11 P(x: > X:a) = a,donde x.2 es una variable aleatoria chi-cuadrado con v grados de libertad

Para derivar la f6rmula que nos permite el cdculo de intervalos de confianza para la varianza, se requiere ampliar nuestra notaci6n, la cual se presenta en la Figura 8.1 1 y en el recuadro siguiente.

Notacion:
Denominaremos X: la variable aleatoria que tiene una distribuci6n chi-cuadrado con v grados de libertad. XZ.. sera el valor para el cual P(x.' > x Z ; a ) = a

Para una probabilidad dada a, necesitaremos el correspondiente valor el cud podremos encontrar entre 10s valores de la funci6n de distribuci6n acumulada de la variable aleatoria chi-cuadrado recogidos en la Tabla 5 del Aptndice. Por ejemplo, supongamos que queremos hallar un nlimero para el cual la probabilidad de que una variable aleatoria chi-cuadrado con seis grados de libertad sea mayor que dicho nlimero es igual a 0,05, es decir,

xZ,,,

P(x? > $,0.05)


En la Tabla 5 del Aptndice se recoge que
xZs.0.05

= 0705

= 12.59

Empleando la notacidn que acabamos de definir tenemos que

De manera similar, se define

xZ,~-

como el valor que verifica

y, por tanto,

Finalmente,

INTERVALOS DE CONFIANZA PARA LA VARIANZA DE UNA POBLACI6N NORMAL

257

Esta probabilidad se ilustra en la Figura 8.12. Como ejemplo, supongarnos que queremos hallar dos n6meros tales que la probabilidad de que una variable aleatoria chi-cuadrado con seis grados de libertad se encuentre entre ambos valores es de 0,9. Entonces,
1-cr=0,9
y

cr=0,1
= 0,9

por lo que
P(X:.o,95 < ~ 6 ' < &,0.05)

Hemos visto anteriormente que

xi, o,os = 12,59. En la Tabla 5 del ApCndice, comprobamos que


x:, 0.95 = 1,64

Asi, la probabilidad de que la variable aleatoria estC entre 1,64 y 12,59 es igual a 0,9. Para calcular intervalos de confianza para la varianza poblacional, tenemos que para la distribuci6n chi-cuadrado con ( n - 1) grados de libertad
1 - a.=P(x;:-1.1-d<d-I<x;:-I.&)

Por tanto, si s? es el valor observado de la varianza muestral, un intervalo de confianza del 100(1 - a)% vendri dado por

Intervalos de confianza para la varianza de una poblaci6n normal Supongamos que disponemos de una muestra aleatoria de n observaciones procedentes de una poblaci6n normal con varianza oZ. Si la varianza muestral observada es s;, entonces, un intervalo de confianza del 100(1 - a)% para la varianza poblacional vendrtl dado por
(n - 1)s; < u2< (n - 1)s; X: - 1 . d d - 1.1 - '$2

donde ~ 2- .I.d es el valor que verifica


P(x% - I >d - 1 . 4 ) y
1Y

= -

X2. -

es el valor para el cual


P(X'.-1
< ~ 2 . - l . I - d )

= -

1Y

y la variable aleatoria

- I sigue una distribuci6n chi-cuadrado con ( n - 1 ) grados de libertad.

FIGURA 8.12 P(x't.,- < xf < xioR) = 1 - a,donde X,? es una variable aleatoria chi-cuadrado con v grados de llbertad

EJEMPLO

8.8

Una muestra aleatoria de pastillas para el dolor de cabeza tiene una desviaci6n tipica de 0,8% en la concentraci6n del ingrediente activo. Hallar un interval0 de confianza del 90% para la varianza poblacional. Tenemos que
n = 15

: s

(0,8)'

= 0,64

Dado que el intervalo de confianza requerido es del90%, entonces, a = 0,1, y consultando la Tabla 5 del ApCndice,

$ - I,&

= x?4.0.05 = 2368

xi -

1.1

= ~ : 4 . 0 , 9 5 = 6.57

El intervalo de confianza del90% para la varianza poblacional viene dado por

Sustituyendo

por lo que 0,378 < uZ< 1,364 Nuestro intervalo de confianza del90% para la varianza poblacional en la concentraci6n del ingrediente activo discurre, por tanto, entre 0,378 y 1,364. Dado que la desviaci6n tipica es igual a la raiz cuadrada, podemos obtener un intervalo de confianza del90% para la desviaci6n tipica poblacional tomando raices cuadradas. El resultado es Por tanto, nuestro intervalo de confianza del90% para la desviaci6n tipica poblacional de la concentraci6n porcentual del ingrediente activo de estas pastillas va del0,61% a 1,17%. Finalizamos esta secci6n advirtiendo sobre el peligro de seguir este procedimiento cuando la distribuci6n de la poblaci6n do es normal. La validez del estimador por intervalos para la varianza depende en mayor medida de la hip6tesis de normalidad que el correspondiente a 1a.media poblacional.

INTERVALCIS DE CONFIANZA PARA LA VARIANZA DE UNA POBLAC16N NORMAL

259

EJERCICIOS

18. El ayuntarniento de Le6n esta considerando la posicomo las mds importantes iniciativas para increbilidad de levantar una estatua en memoria de un mentar la competitividad de su productosI7. famoso filhtropo de la ciudad, lo c u d conduciria a a) Calcular un intervalo de confianza del99% para una subida de la contribuci6n urbana. Una muestra la proporci6n poblacional. aleatoria de 610 contribuyentes leoneses revela que b) Sin hacer 10s cdlculos, determinar si un interel 50,7% de 10s encuestados estd en contra de dicha v al~ de confianza del90% tendria una longitud medida. Hallar un intervalo de confianza del 99% mayor, menor o igual a la del intervalo calcupara la proporci6n de la poblaci6n que desaprueba lado en el apartado (a). el levantamiento de la estatua. toma una muestra aleatoria en EEUU de 96 faSe 19. Se extrae una muestra aleatoria de 189 partidos de bricantes extranjeros con inversiones directas en el la NBA en 10s cuales el primer cuarto no concluy6 pais y que utilizan distribuidores industriales indecon resultado de empate. En 132 de estos partidos, pendientes estadounidenses. Treinta y dos de estos el equipo con ventaja en el marcador a1 final del manifestaron que 10s distribuidores casi fabricantes primer cuarto gan6 el partidoI4. nunca eran capaces de cumplir adecuadamente con a) Hallar un intervalo de confianza del90% para la su funci6n de asesoramiento t6cnico18. Calcular un proporcidn poblacional de ocasiones en las cuaintervalo de confianza del 80% para la proporci6n les el equipo con ventaja a1 final del primer poblacional. cuarto gana finalmente el partido. 24. De una muestra aleatoria de 198 estudiantes de b) Sin realizar 10s cdlculos, determinar si un intermarketing, 98 consideraron como poco Btico "inval~ de confianza del 95% para la proporci6n flar" las calificaciones a c a d 6 m i c a ~ ' ~ Utilizando . poblacional tendria una amplitud mayor o meesta informaci6n, un experto en estadistica calcul6 nor que la obtenida en (a). un intervalo de confianza de 0,445 a 0,545 para la 20. El 47,9% de una muestra aleatoria de 323 trabajaproporci6n poblacional. ~ C u d es l el contenido prodores afiliados a algdn sindicato estaban de acuerdo babilistic~ de dicho intervalo? o muy de acuerdo con la siguiente afirmaci6n: "Los 25. Se toma una muestra aleatoria de quince predicciones trabajadores sindicados deberian negarse a trabajar . de analistas financieros correspondientes a las ganancuando se contrata para el trabajo a un trabajador cias por acci6n de la General Motors para el pr6ximo no afiliad~"'~. Utilizando esta informaci6n, un exaiio. La desviaci6n tipica muestral es de 0,88 d6lares. perto en estadistica calcul6 un intervalo de conCalcular un intervalo de confianza del 95% para la fianza entre 45,8% y 50,0% para el porcentaje povarianza poblacional de las predicciones. blacional de trabajadores afiliados a sindicatos que 26. Utilizando 10s datos del Ejercicio 11, calcular un compartian esta opini6n. Calcular el nivel de conintervalo de confianza del80% para la varianza pofianza asociado a este intervalo. blacional de la velocidad de 10s autom6viles que 21. De una muestra aleatoria de 134 auditores empleacirculan por ese tramo de la carretera. dos en grandes empresas de auditoria, 82 de ellos de27. Utilizando 10s datos del Ejercicio 12, calcular un clararon que siempre que recibian un nuevo encargo intervalo de confianza del 90% para la desviaci6n de auditoria preguntaban al auditor anterior cud1 hatfpica poblacional correspondiente a la pCrdida de bia sido la raz6n del cambio de auditor 16. Calcular peso de 10s pacientes de la clinica. un intervalo de confianza del95% para la proporci6n poblacional. 28. Utilizando 10s datos del Ejercicio 3, calcular un interval~ de confianza del 95% para la desviaci6n ti22. De una muestra aleatoria de 95 pequeiias empresas pica poblacional. , fabricates, 29 seiialaron las mejoras en la calidad
"H. Cooper, K.M. DeNeve y F. Mosteller, "Predicting professional sports game outcomes from intermediate game scores," Chance, 5, no. 3 (1992). 18-22. 15 S. Chang y L. Robinson, "Perceptions of labor unions by union members and their potential employers," Mid-American Journal of Business, 5 , no. 2 (1990), 25-30. 16 J.C. Lambert. S.J. Lambert y T.G. Calderon, "Communication between successor and predecessor auditors,"Auditing: A Journal of Practice and Theory, 10, no. 1 (1991). 97-109.
"W. Davig y S. Brown, "~ncrementai decision making in small manufacturing firms," Journal of Small Business Management, 30, no. 2 (1992). 53-60. '' B. Rosenbloom y T.L. Larsen, "How foreign firms view their U.S. distributors,"Industrial Marketing Management, 21

(1?!2),

93-101.

P.A. Dabholkar y J.J. Kellaris, 'Toward understanding marketing students' ethical judgment of controversial personal selling practices,"Journal of Business Research, 24 (1992), 313-29.

260

ESTIMACI~N POR INTERVALOS

29. Los intervalos de confianza para la varianza poblacional descritos en esta secci6n no e s t h centrados en la varianza muestral. LPor quC? Ilustra con un grifico tu respuesta. 30. Dada la informacidn muestral, es posible (en principio) construir intervalos de confianza con menor longitud y con el mismo contenido probabilistico que 10s presentados en esta secci6n. ~ P oqub? r nustra con un grifico tu respuesta. 31. Un psic6logo quiere estimar la varianza de las calificaciones obtenidas por 10s candidatos a un puesto de trabajo en un test de aptitud. Extrae para ello una muestra aleatoria de 18 candidatos cuya desviaci6n tipica es igual a 10,4. Calcular un intervalo de confianza del 90% para la varianza poblacional. LQUC has asumido a la hora de construir el intervalo? 32. Un fabricante quiere estimar la variabilidad de 10s niveles de impureza de 10s envios de materia prima de un determinado proveedor. Extrae para ello una muestra de quince envios y comprueba que la des-

viaci6n tipica muestral en la concentraci6n de 10s niveles de irnpureza es de 2,36%. Sup6ngase que la poblaci6n es normal. a) Calcular un intervalo de confianza del95% para la varianza poblacional. b) Sin hacer 10s cillculos, determinar si un intervalo de confianza del99% tendria una longitud mayor, menor o igual a la del intervalo calculado en el apartado (a). 33. Un trabajador tiene como cometido cubrir con una capa de plistico una superlicie metaica. Se extrae una muestra aleatoria de nueve observaciones correspondientes al grosor de dicha capa de plistico. Los valores obtenidos (en milimetros) son 10s siguientes: 19,8 21,2 18,6 20,4 21,6 19,8 19,9 20.3 20,8 Suponiendo que la poblaci6n es normal, hallar un intervalo de confianza del90% para la varianza poblacional.

8.7 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES


Un problema importante en inferencia estadistica es el correspondiente a la comparaci6n de dos medias poblacionales. Por ejernplo, una ernpresa recibe envios de una sustancia quimica de dos proveedores distintos y quiere estimar la diferencia entre 10s nivelos medios de irnpurezas presentes en 10s envios de ambos proveedores. Otro ejemplo puede ser el d e un agricultor que e s t i considerando el uso de dos fertilizantes altemativos y e s d interesado en la diferencia de las producciones medias por hectkea resultantes. Para comparar las medias poblacionales, se extrae una muestra aleatoria de las dos poblaciones y la inferencia sobre la diferencia entre ambas medias se basa en 10s resultados muestrales. El mttodo apropiado para analizar esta informacidn depende del procedimiento empleado a1 seleccionar las rnuestras. Nosotros considerarernos las dos posibilidades siguientes: 1. DATOS PAREADOS. En este procedimiento, las muestras se eligen por pares, una de cada poblaci6n. La idea es que, aparte del aspect0 objeto de estudio, 10s elementos de cada uno de estos pares deben estar relacionados, de rnanera que la comparaci6n pueda ser establecida directamente. Por ejemplo, supongamos que queremos medir la eficacia de un curso de lectura ripida. Una manera de abordar el problema seria tomar nota de las palabras por minuto leidas por una rnuestra de alumnos antes de tomar el curso y compararlas con 10s resultados obtenidos por 10s mismos alumnos una vez completado el curso. En este caso, cada par consistiria en medidas de la velocidad de un mismo alumno realizadas antes y desputs del curso. 2. MUESTRAS INDEPENDIENTES. En este mttodo se extraen dos muestras independientes de cada una de las dos poblaciones de inter&, de rnanera que 10s miembros de una muestra no tienen necesariamente relaci6n con 10s miembros de la otra. En el ejernplo de la empresa que recibe envfos de una determinada sustancia quimica de dos proveedores distintos, podriamos escoger muestras independientes de lotes de cada proveedor y medir 10s niveles de irnpureza de cada lote elegido.

Cualquiera que sea el mttodo escogido, nuestro objetivo en esta secci6n es construir intervalos de confianza para la diferencia de las medias de dos poblaciones.

INTERVALOS DE CONFIANZA BASADOS EN DATOS PAREADOS


De manera general, supongarnos que tomamos una muestra aleatoria de n pares de observaciones que representamos por (x,, y,), (x2,y2), ... , (x., y.), procedentes de dos poblaciones con medias I*, y px. Asi, XI, x2, ... ,x., corresponden a las observaciones con media pxe y,, y2, ... ,y. a las observaciones con media A. La Tabla 8.2 recoge 10s datos de consumo de gasolina correspondientes a una muestra aleatoria de ocho autom6viles norteamericanos de dos modelos diferentes. Se formaron pares con las dos muestras, y cada elemento de un determinado par fue conducido por la misma mta y por el mismo piloto, de manera que la variabilidad entre conductores y rutas pudo eliminarse como factor distorsionador. La tabla tambitn incluye las diferencias, di, entre 10s datos. Estas diferencias forman una muestra aleatoria procedente de una poblaci6n cuya media es (px - A), la diferencia entre las medias poblacionales entre dos modelos de coches.

TABLA 8.2 Consumo de gasolina, en kil6metros por litro, correspondientes a datos pareados procedentes de dos muestras de automdviles de dos modelos diferentes
COCHES X COCHES Y DIFFERENCIAS

La media y la varianza muestral de las diferencias en el consumo de gasolina pueden calcularse utilizando la informaci6n recogida en la tabla. Para la media el resultado es

y para la varianza

por lo que la desviaci6n muestral observada es Nos encontramos en una situaci6n en la que podemos plantearnos el ciilculo de un interval0 de confianza para una media poblacional (px - A), dada una muestra aleatoria (10s valores de las diferencias di) de esa poblaci6n. Si la distribuci6n poblacional asumida es normal, el mttodo desarrollado en la Secci6n 8.4 puede aplicarse directamente, ya que las diferencias en 10s datos pareados constituyen una muestra aleatoria de una poblaci6n cuya media es igual a la cantidad que estamos intentando estimar.

262

ESTIMAC~~N POR INTERVALOS

Intervalos de confianza para la diferencia de medias: datos pareados Supongamos que disponemos de una muestra aleatoria de datos pareados procedentes de distribuciones con medias y py.Sean a y sd la media y la desviaci6n tipica muestrales para las n diferencias d, = x i - yi. Si se asume que la distribuci6n de las diferencias es normal, entonces, un intervalo de confianza del 100(1 - a)% para (px- pY)viene dado por
d--

tn-l,dZSd

< p x - p y < d + -

t n - 1.mfl.Sd

v'il
P(tn

v'il
a

donde t. - ,.& es el valor para el cud


-I

> tm - 1.4) = 2

y la variable aleatoria t n . sigue ~ una distribuci6n t de Student con (n - 1) grados de libertad.

En el ejemplo del consumo de gasolina, comprobamos que Para un intervalo de confianza del99%, a = 0.01, por lo que

consultindose 10s valores en la Tabla 6 del ApCndice. Por tanto, obtenemos el intervalo de confianza del99% para la diferencia de las medias poblacionales al sustituir en

es decir,

Asi pues, hemos comprobado, basindonos en la informacidn de la Tabla 8.2, que un intervalo de confianza del99% para la diferencia en el consumo medio de gasolina de 10s dos tipos de autom6viles discurre entre -0,342 y 1,892 kil6metros por litro. Dado que el intervalo incluye el 0, no existe evidencia suficiente en la muestra como para rechazar la hip6tesis de que las dos medias son iguales.

INTERVALOS DE CONFIANZA BASADOS EN MUESTRAS INDEPENDIENTES


Examinamos ahora el caso en el que se toman muestras independientes, no necesariamente del mismo tamaiio, de dos poblaciones de inter&. Imaginemos que disponemos de una muestra aleatoria de n, observaciones procedentes de una poblacidn con media p x y varianza a x 2 , y de una muestra aJeatoria independiente de n, observaciones de una poblacidn con media pyy varianza .uyZ. Sean X e Y las medias muestrales respectivas.

Corno un primer paso, veamos el caso en el que las dos distribuciones poblacionales son normales con varianzas conocidas. Dado que el objeto de interts es la diferencia entre las dos medias poblacionales, resulta razonable basar la inferencia en la diferencia entre las medias rnuestrales correspondientes. Esta variable aleatoria tiene media E(X - Y )= E(X) - E(Y) = y, dado que las rnuestras son independientes, varianza
p y

Adernds, se puede probar que su distribuci6n es normal. Por tanto, la variable aleatoria

tiene una distribuci6n normal esthdar. Podernos ernplear entonces un razonarniento similar a1 de la Secci6n 8.2 para construir intervalos de confianza para la diferencia entre las medias poblacionales. Debido a que este intervalo requiere el conocimiento de las varianzas poblacionales, se utiliza en raras ocasiones. Sirl embargo, corno en el caso de la Secci6n 8.2, su carnpo de aplicaci6n se extiende facilrnente cuando 10s tarnaiios de las rnuestras son grandes, corno se expone en el recuadro siguiente.

Intervalos de confianza para la diferencia de medias: muestras independientes (Varianzas conocidas o tamaiios de muestras grandes) Supongarnos que disponernos de rnuestras aleatorias independientes de n, y ny observaciones procedentes de distribuciones normales con medias pxy py,y varianzas ax2 ya : . Si las medias rnuestrales observadas son P e 7, entonces, un intervalo de confianza del 100(1 - a)% para (px - py) viene dado por

( T - y ) - z & ~ ~ < p x - p y < ( z - Y ) + z &


donde, z es el valor para el cual
P(Z > z&) = 2
a

, ,
a2 + a ?

y la variable aleatoria Z sigue una distribuci6n normal esthndar. Si el tarnaiio de las muestras n, y ny es grandeZ0, entonces, sustituyendo en la expresi6n anterior las s ys ; por las rnuestrales, se obtiene una buena aproximaci6n a un intervalo varianzas poblacionales : de confianza dellOO(1-a)% para (px - py). Para muestras grandes, esta aproxirnaci6n seguird siendo vdlida incluso cuando las distribuciones poblacionales no sean normales.

EJEMPLO

fi.9

Para una rnuestra aleatoria de 96 fumadores, el niunero rnedio de horas de absentisrno laboral a1 rnes fue de 2,15 y la desviaci6n tipica rnuestral fue de 2,09 horas a1 mes. Para una rnuestra aleatoria independiente de 206 trabajadores que nunca han furnado, el nurnero rnedio de horas fue de 1.69 y la

20

Treinta observaciones en cada rnuestra son, en general, suficientes para realizar esta aproxirnaci6n.

desviaci6n tipica de 1,91 horas al mes2'. Calcular un intervalo de confianza del99% para la diferencia entre las dos medias poblacionales. Con respecto a 10s fumadores, tenemos que
n, = 96 y con respecto a 10s trabajadores que nunca furnaron
55 = 2,15
sx = 2,09

Dado que 10s tamaiios muestrales son grandes, podemos utilizar las varianzas muestrales en lugar de las varianzas poblacionales desconocidas de la f6rmula recogida en el recuadro. Los intervalos de confianza para la diferencia de las medias poblacionales tomarh, entonces, la siguiente forma:

donde, para un intervalo de confianza del99% El intervalo que buscamos es

Dado que el cero esti dentro del intervalo de confianza, no hay suficiente evidencia en 10s datos como para rechazar la hip6tesis de que ambas poblaciones tienen la misma media.

EJEMPLO

8.10

Se tomaron dos muestras aleatorias independientes de profesores y jefes de administraci6n universitarios, y se les pidi6 que evaluasen en una escala de 1 (empeor6 sustancialmente) a 5 (mejor6 sustancialmente) la importancia en la prlctica administrativa de la investigaci6n en direcci6n estrattgica durante la pasada dicada ". La calificaci6n media de la muestra de 321 profesores fue de 3.01 con una desviaci6n tipica de 1,09. En cuanto a la muestra de jefes de administraci6n, la calificaci6n media fue de 2,88 y la desviaci6n tipica de 1,Ol. Calcular un intervalo de confianza del95% para la diferencia de medias (px - py), donde m es la media poblacional de 10s profesores y pyes la media poblacional de 10s jefes de adminis~aci6n. Una vez mis, dado que 10s tamaiios muestrales son grandes, podemos emplear las varianzas muestrales en lugar de las varianzas poblacionales de la f6rmula

21 M.R. Manning, J.S. Osland y A. Osland, "Work-related consequences of smoking cessation,"Academy of Managezent Journal, 32 (1989). 606-21. S. A. Zahra y J.A. Pearce, "Priorities of CEOs and strategic management professors for future academic research," Journal of Managerial Issues, 4 (1992), 171-89.

donde

y para un intervalo de confianza del95% Por tanto, el intervalo es


I

Este intervalo incluye el cero, lo cual es indicativo de la ausencia de evidencia de que las dos medias son diferentes. La Figura 8.13 muestra.este intervalo de confianza, junto con 10s correspondientes a niveles de confianza del80%, 90% y 99%. Tratamos ahora el caso en el cual 10s tarnafios muestrales no son grandes y se requiere un intervalo de confianza para la diferencia de medias de dos poblaciones normales. De hecho, cuando las varianzas poblacionales son desconocidas, este problema resulta dificil de abordar de forma general. Sin embargo, en 10s casos especiales en 10s que se pueda asumir que las varianzas poblacionales son i g u a l e ~se ~~ puede , emplear un mCtodo bastante sencillo. Supongamos una vez mhs que disponemos de dos muestras aleatorias de nx y n,observaciones procedentes de dos poblaciones con medias y py, y. varianza c o m ~ n desconocida d. La inferencia sobre las medias poblacionales se basa, como en 10s ejemplos anteriores, en la diferencia entre las dos medias muestrales. Esta variable aleatoria tiene una distribuci6n normal con media (k- py) y varianza

(x

Por tanto, se verifica que la variable aleatoria

tiene una distribuci6n normal esthndar. Sin embargo, este resultado no puede ser utilizado tal como figura en el recuadro ya que la expresi6n depende de la varianza poblacional desconocida. Debido a que esta varianza es la misma para ambas poblaciones, pueden emplearse 10s dos conjuntos de informaci6n muestral para estimarla. El estimador es
S2

= (nx - l)sx2

+ (n, - 1)s; (nx + n, - 2)

23

Veremos en el Capftulo 9 c6mo se pueden emplear 10s datos para corroborar esta hip6tesis.

266

E S T I M A C ~ ~POR N INTERVALOS

FIGURA 8.13 Intervalos de confianza del80%, 90% y 95% para la diferencia de las medias poblacionales basados en 10s datos del Ejemplo 8.10
I 4 0 2

Intervalo de confianza del 80% 0,13

I 0,28

I 4,07

lntervalo de confianza del9O% 0,13

I 0.33

I 4,11

Intervalo de confianza del95% 0,13

I 0,37

lntervalo de confianza del99%

donde sx2 y S : son las dos varianzas muestrales. Reemplazando en la EcuaciQ (8.7.1) la varianza desconocida crZ por su estimador sZ, obtenemos la variable aleatoria - (px - pr) t = (X -

n x

+n y

Puede demostrarse que esta variable aleatoria sigue una distribuci6n t de Student con (n, n, - 2) grados de libertad. Dado este resultado, 10s intervalos de confianza para la diferencia de medias poblacionales se construyen empleando una 16gica similar a la utilizada en la Secci6n 8.4.

Intervalo de confianza para la diferencia de medias de dos poblaciones normales: Muestras independientes, varianzas poblacionales iguales Supongamos que disponemos de dos muestras aleatorias independientes con n, y n, observaciones que proceden de poblaciones normales con medias y py,y varianza comdn desconocida. Si las medias s , s ; entonces, un interval0 de confianza dellOO(1 - a)% y varianzas muestrales observadas son E,y y,: viene dado por

donde

y t.,

,
-

es el valor que verifica


P(tnx + n,
-2

> t , + n, -2.a) = -

a 2

donde la variable aleatoria t,, + bertad.

.,

sigue una distribucidn t de Student con (n,

+ ny - 2 ) grados de li-

EJEMPLO

8.11

En un estudio sobre 10s efectos de la planificacidn en el rendimiento financier0 de 10s bancosZ4, se extrajo una muestra aleatoria de seis instituciones financieras que contaban con un sistema de planificacidn formal, y se comprobd que el porcentaje medio anual de crecimiento de 10s ingresos netos en dicha muestra era de 9,972 con una desviaci6n tipica de 7,470. La media de dicho crecimiento en otra muestra aleatoria independiente de nueve bancos que no recurrian a la planificacidn fue de 2,098 con una desviacidn tipica de 10,834. Suponiendo que'las dos poblaciones son normales y tienen la misma varianza, calcular'un intervalo de confianza del90% para la diferencia de medias. Tenemos que x se corresponde con "planificadores" e y con "no planificadores"

La estirnacidn de la varianza poblacional comlin es


$2

(nI - 1)s;

(nx + n, - 2 )

+ (n, - 1)s; s=

(5)(7,47012 + (8)(10,834)2 13

= 93,693

y, por tanto,
= 9,680

El intervalo que tenemos que hallar es de la forma

donde, para un nivel de confianza del90%, a = 0,1, por lo que


fnx+ny - 2 . 4

- t 1 3 . 0.05

= 1,771

dato que se recoge en la Tabla 6 del Apkndice. Por tanto, el intervalo de confianza del90% para la diferencia de 10s incrementos, medios porcentuales es

24 D.R. Wood y R.L. La Forge, "?he impact of comprehensive planning on financial performance,"Academy o f Management Journal, 22 (1979), 516-26.

268

ESTIMACI~N POR INTERVALOS

-1,161 < p x - p y < 16,909 El interval0 incluye el cero, lo cud sugiere que no existe evidencia suficiente en la muestras como para rechazar la hip6tesis de la igualdad de medias entre ambas poblaciones.

8.8 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS

PROPORCIONES POBLACIONALES (MUESTRAS GRANDES)


En la Secci6n 8.5, construimos intervalos de confianza para una dnica proporci6n poblacional. En muchas ocasiones, estamos interesados en comparar dos proporciones. Por ejemplo, podn'amos querer comparar la proporci6n de jugadores de fiitbol que siguen en activo a 10s 35 aiios con la de atletas que tienen ese atributo. En esta secci6n indicaremos c6mo construir intervalos de confianza para la diferencia entre dos proporciones poblacionales cuando se toman dos muestras aleatorias independientes procedentes de ambas poblaciones. Supongamos que una muestra de n, observaciones de una poblaci6n con una proporci6n px de "Cxitos" da lugar a una proporci6n m ~ e s t r a l y ~ que ~ , se obtiene una proporcidn muestralBy a1 examinar una muestra aleatoria independiente de ny observaciones procedentes de una poblaci6n con proporci6n py de "Cxitos". Dado,que estamos interesados en la diferencia poblacional (px - py), parece 16gico estudiar el comportamiento de la variable aleatoria @X- BY).Su media es

y, debido a que las muestras se extrajeron independientemente, la varianza

AdemBs, si 10s tamafios muestrales son grandes, la distribuci6n de esta variable aleatoria es aproximadamente normal, por lo que si le restamos su media y la dividimos por la desviaci6n tipica, el resultado es una variable aleatoria normal estBndar. Por otra parte, para tamafios de muestra grandes, esta aproximaci6n sigue siendo vBlida aun cuando se sustituyan en la Ecuaci6n (8.8.1) las proporciones poblacionales desconocidas por sus equivalentes muestrales. Asi pues, la variable aleatoria

sigue aproximadamente una distribuci6n normal esthdar. Este resultado permite la construcci6n de intervalos de confianza para la diferencia entre dos proporciones poblacionales cuando 10s tamaiios de muestra son grandes, como se explica en el recuadro.

Intervalos de confianza para la diferencia entre proporciones poblacionales (Muestras grandes) Sea$= la proporci6n de Cxitos observada en una muestra aleatoria de tamaiio n, procedente de una poblaci6n con proporci6n de txitos px, y s e a h la proporcidn de txitos observada en una muestra aleatoria independiente procedente de una poblaci6n con proporcidn pvde Cxitos. Entonces, si 10s tamaiios muestrales son grandes 25, un intervalo de confianza del 100(1- a)% viene dado por

(8, - h) - z4n

PX(1 - 01)

O Y ( 1 - 0Y) < p x - P Y < ( 8 x -

fjy)+ Z 4 n

J .
O X ( 1 - Ox)

+0YU -

07)

donde za es el valor que verifica


a P(z > zmn)= 2

y la variable aleatoria Z sigue una distribuci6n normal esthdar.


A continuaci6n presentamos este mttodo ayudhdonos de dos ejemplos.

EJEMPLO

8-12

En un estudio de 10s proyectos patrocinados por empresas (PPE) en cursos universitarios de marketing, se les pidi6 a 10s profesores encargados de dicha asignatura que utilizaban en su labor profesional 10s PPE que evaluasen la frase "Los PPE exigen demasiado tiempo de trabajo a1 departamento". De una muestra de 92 profesores de escuelas acreditados por la AACSBZ6 que empleaban 10s PPE, 49 estaban de acuerdo con esta opinibn. De una muestra independiente de 82 profesores que tambiCn hacian uso de 10s PPE, per0 que pertenecian a escuelas no acreditadas, 36 compartian dicha visi6n2'. Siendo px y py las proporciones poblacionales respectivas, calcular un intervalo de confianza del90% para (px - p ~ ) . Tenemos que 49 36 n, = 92 ny = 86 fiy = - = 0,419 fix = - = 0,533 92 86 Para un intervalo de confianza del90%, a = 0,1, por lo que z,n = ~ 0 . 0 5= 1,645 Haciendo las sustituciones correspondientes en la f61mula de 10s intervalos de confianza, obtenemos (0,533)(0,467) (0,419)(0,58 1) (0,533 - 0,419) - 1,645 92 86

2s Esta aproximaci6n es vfilida si cada muestra contiene a1 menos cuarenta observaciones. 26Nota:American Assembly of Collegiate Schools of Business. 27 V. Vincent y G. de 10s Santos, "Combining theory and practice in college marketing courses," Business Forum, 14, no. 1 (1989), 25-28.

270.

ESTIMACI~N POR INTERVALOS

Dado que el intervalo incluye el cero, no existe evidencia muestral considerable en contra de la hip6tesis de que ambas proporciones poblacionales son iguales.

EJEMPLO

8-13

Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de contabilidad de tWmo curso de sexo masculine y femenino. De 120 hombres, 107 esperaban disfrutar de un trabajo de jomada completa en un mixitno de diez aiios. De 141 mujeres encuestadas, 73 tenian esta esperanza28. Hallar un intervalo de confianza del95% para la diferencia entre las dos proporciones poblacionales. Los valores muestrales son
n, = 120

p", = 1071120 = 0,892

ny = 141

py = 731141 = 0,518

Para un intervalo de confianza del95%, a = 0,05, por lo que


Zm/z = 20,025 =

l,96

El intervalo a calcular es, por tanto,

El hecho de que el cero se encuentra bastante alejado del rango de este htervalo, sugiere claramente que la proporci6n de hombres que esperim trabajar en regimen de dedicaci6n exclusiva en un maxim0 de diez afios es mayor.

R.J.Maupin, "Gender roles in transition: career and family expectations of accounting students," Mid-American Journal of Business, 8 (1993), 33-37.

28

EJERCICIOS

PAR
SIN CON PAR SIN CON CALEFACC~~N CALEFACCI~N CALEFACCI~N CALEFACCI~N SOLAR SOLAR SOLAR SOLAR

34. Se extrajo una muestra aleatoria de diez pares de casas idtnticas en una gran ciudad y se instal6 un sistema de calefacci6n solar en un elemento de cada par. Los totales de las facturas del gas en unidades monetarias con-espondientesa 10s tres meses de inviemo se detaUan en la tabla. Asumiendo distribuciones poblacionales normdes, hallar un interval0 de confianza del90% para la diferencia entre las medias poblacionales.

1 2 3 4 5

485 423 515 425 653

452 386 502 376 605

6 7 8 9 10

386 426 473. 454 496

380 395 411 415 44 1

35. Una muestra aleatoria de seis representantes que

jomada completa3'. Para una muestra aleatoria de 138 licenciados procedentes de familias con un nivel socio-econ6mico alto, el salario medio total era de 36.558 d6lares y la desviaci6n tipica de 11.624 d6lares. Para una muestra aleatoria independiente de 266 licenciados procedentes de familias con un nivel socio-econ6mico bajo, el salario medio y la desviaci6n tipica muestral eran de 37.499 y 16.521 d6lares, respectivamente. Calcular un intervalo de confianza del 90% para la diferencia entre las dos medias poblacionales. AGENTE ANTES DESPUBS 39. Para una muestra aleatoria de 190 empresas que reDEL CURS0 DEL CURS0 valorizaron sus activos fijos, la ratio media de la deuda con respecto a1 activo fijo material era 0,s 17 y la desviaci6n tipica 0,14g3'. Para una muestra aleatoria independiente de 417 empresas que no revalorizaron sus activos, dicha ratio media y la desviaci6n tipica fueron 0,489 y 0,159, respectivamente. Calcular un intervalo de confianza del99% para la diferencia entre las dos medias poblaciona36. La calificaci6n media de una muestra de 40 estules. diantes de contabilidad de una clase en la cual se emplearon t6cnicas de aprendizaje en grupo, fue de 40. Un investigador esth intentando estimar el efecto de 322.12 y la desviaci6n tipica de 54,53. La calificaun f h a c o en la habilidad de 10s individuos para ci6n media y la desviaci6n tipica de una muestra realizar una determinada tarea de coordinaci6n psialeatoria de 61 estudiantes delmismo curso de una comotriz. Los miembros de una muestra aleatoria clase en la que no se emplearon dichas ttcnicas, de nueve personas ingirieron el f h a c o antes de fueron iguales a 304,61 y 62,61, respectivamenteZ9. realizar la prueba. La puntuaci6n media obtenida Calcular un intervalo de confianza del95% para la fue 9,78 y la varianza muestral 17,64. Una muestra diferencia entre las dos calificaciones medias po. aleatoria independiente de diez personas se emple6 blacionales. como grupo de control e ingirieron un placebo antes de realizar la prueba. La puntuaci6n media y va37. En un estudio sobre la igualdad de oportunidades rianza muestral de este grupo de control fueron de las mujeres en la profesi6n de contable, se les pi15.10 y 27,01, respectivamente. Suponiendo que di6 a 10s elementos de dos muestras que evaluasen las distribuciones poblacionales son normales con en una escala de uno (desaprobaci6n total) a cinco varianzas iguales, calcular un intervalo de con(totalmente de acuerdo) la siguiente afirmaci6n: fianza del90% para la diferencia entre las dos pun"Las mujeres cuya profesi6n es la de contable tietuaciones medias. nen las mismas posibilidades de ser contratadas que 10s hombres". Para una muestra aleatoria de 172 41. Una empresa envia una muestra aleatoria de doce mujeres contables, la respuesta media h e 3,483 y la de sus agentes de ventas a un curso diseiiado para desviaci6n tipica 0,97. Para una muestra aleatoria incrementar la motivaci6n y, por tanto, presumibleindependiente de 186 contables varones, la media y mente, su efectividad. Un aiio desputs, estos agenla desviaci6n tipica muestral fueron 3,435 y 0,894, tes generaron unas ventas con un valor medio de respectivamente3'. Calcular un intervalo de con43,s millones de pesetas y una desviaci6n tipica de fianza del 95% para la diferencia entre las dos me5.600.000 pesetas. Durante el mismo periodo, se dias poblacionales. extrajo una muestra aleatoria independiente de 15 personas que no habian asistido a1 curso, y las 38. Se someti6 a estudio una poblaci6n de licenciados ventas medias generadas y su desviaci6n tipica fueen empresariales que habian terminado recienteron 40.800.000 y 4.300.000 pesetas, respectivamente la carrera y que disfrutaban de un empleo de asistieron a un curso sobre ttcnicas de venta se someti6 a estudio durante los tres meses anteriores y 10s tres meses posteriores a dicho curso. La tabla siguiente muestra los irnportes de las ventas, en miles de pesetas, generadas por cada uno de 10s seis agentes en 10s dos periodos. Suponiendo que la distribuci6n poblacional es normal, calcular un intervalo de confianza del 80% para la diferencia entre las medias poblacionales.
" W. Whitely, T.W. Dougherty y G.F. Dreher, "Relationship of career mentoring and socioeconomic origin to managers' and professionals' early career progress," Academy of M2;agement Journal, 34 (199 1). 331-51. P. Brown, H.Y. Izan y A.L. Loh, "Fixed asset revaluations and managerial incentives,"Abacus, 28 (1992), 36-57.

29 S.M. Lightner, "Accounting education and participating group dynamics," Collegiate News and Views, 35, no. 1 (1!9fl), 5-9. M.W. Trapp, R.H. Hermanson y D.H. Tumer," "Current perceptions of issues related to women employed in public accounting," Accounting Horizons, 3, no. 1 (1989), 71-85.

272

ESTIMACI~N POR INTERVALOS

mente. Suponiendo que las dos poblaciones son normales y tienen la misma varianza, calcular un intervalo de confianza del 95% para la diferencia entre las medias. 42. Los estudiantes de un curso introductorio de teorIa econ6mica impartido por profesores asociados son sometidos a un examen. Veintiun estudiantes aue asisten a las clases de un determinado profesor, obtuvieron una puntuaci6n media de 72,l (sobre cien) en dicha prueba con una desviaci6n tipica de 11,3. Dieciocho estudiantes asignados a otro p&fesor asociado alcanzaron una ~untuaci6n media de 73.8 con una desviaci6n tipica de 10,6. Suponiendo que estos dabs pueden ser considerados muestras aleatorias independientes procedentes de dos poblaciones normales con la misma varianza, calcular un intervalo de confianza del 80% para la diferencia entre las medias. 43. De una muestra aleatoria de 112 grandes empresas minoristas, 70 emplean la regresi6n como un mttodo de predicci6n. De una muestra aleatoria independiente de 135 pequeiios minoristas, 65 utilizan Calcular la regresitin como m6todo de predi~ci6n~~. un intervalo de confianza del95% para la diferencia entre las proporciones poblacionales. 44. De una muestra aleatoria de 1.203 estudiantes de empresariales en 1979, el 20,2% afinnaron que la docencia era una alternativa muy poco atrayente. De una muestra aleatoria de 1.203 estudiantes de empresariales en 1989, el 13,2% cornpartian dicha 0 ~ i n i 6 n Calcular ~~. un intervalo de confianza del
A

99% para la diferencia entre las proporciones poblacionales. 45. De una muestra aleatoria de 154mMcos, el 59% consideraron que la posibilidad de introducir campaiias de publicidad para 10s hospitales era una idea muy poco recomendable. De una muestra aleatoria de 310 consumidores, el 24,2% compardan esta opini6n3'. Calcular un intervalo de confianza del95% para la diferencia entre las proporciones poblacionales. 46. De una muestra aleatoria de 100 varones, 61 est6n a favor de introducir ciertas reformas en la Constituci6n. De una muestra aleatoria independiente de 100 mujeres, 54 aprueban la introducci6n de las reformas. Se construye el siguiente intervalo de confianza con la informaci6n muestral:

cull es el covtenido probabilistico de este intervalo? 47. I $ un estudio sobre 10s comportamientos de compra en 10s supermercados, se les pidi6 a varios clientes que respondiesen a un pequeiio cuestionariojusto despuks de depositar un articulo en el carro. De una muestra aleatoria de 570 que eligimn un product0 que no estaba de ofexta, 308 afirmaron que habian comprobado el precio en el momento de elegirlo. De una muestra aleatoria de 232 que escogieron un articulo en oferta, 157 dijeron haber hecho dicha compbaci6n~. Calcular un intervalo de confianza del90% para la diferencia entre las proporciones poblacionales.

33 R.T. Peterson, "Forecasting practices in retail industry," Journal of Business Forecasting Methods and Systems, 1 2 , no. l (1993), 11-14. Discutiremos la regresi6n en 10s Capftu10~~~ a1114. 2 W.R. Swinyard, F.W. Langrehr y S.M. Smith, "The appeal of retailing as a career: a decade later," Journal of Retailing, 67 (1991). 45165.

" J.A. Bell y C.R. Vitaska, "Who likes hospital advertising-consumer or physician?" Journal of Health Care Marketing, 12, no. 2 (1992). 2-7. 36 P.R. Dickson y A.G. Sawyer, "The price knowledge and search of supermarket shoppers," Journal of Marketing, 54, no. 3 (1990), 42-53.

8.9 C ~ M O ESTIMAR EL T W O DE LA MUESTRA


Hasta ahora hemos desarrollado mCtodos para construir intervalos de confianza para un pardmetro poblacional, basindonos en la informaci6n contenida en una muestra determinada. Siguiendo este proceso, un investigador puede creer que el intervalo de confianza resultante es demasiado amplio, enfrentindose asi a un grado de incertidumbre poco deseable. Normalmente, la 6nica mmera de reduck esta incertidumbre consiste en tomar una muestra con un tamaiio mayor.

En algunas situaciones, el investigador puede ser capaz de fijar por adelantado la amplitud del interval~ de confianza, eligiendo un tamaiio muestral lo suficientemente grande como para garantizar dicha amplitud. En esta secci6n, seiialaremos c6mo el tamaiio de la muestra puede elegirse de este mod0 para dos problemas de estimaci6n. Se pueden emplear mCtodos similares para tratar otros problemas de estimaci6n.

INTERVALOS PARA LA MEDIA DE UNA DISTRIBUCION NORMAL: VARIANZA POBLACIONAL DESCONOCIDA


Cuando tomamos una muestra aleatoria de n observaciones procedentes de una poblaci6n normal con media p y varianza conocida uZ, vimos en la Secci6n 8.2 que un intervalo de confianza del 100(1 - a)% viene dado por

donde 55 es la media muestral observada y zPRes el valor cntico apropiado de la distribuci6n normal. Este intervalo estii centrado en la media muestral y recorre una distancia

a cada lado de la media muestral, de manera que L es la mitad de la longitud del intervalo. Supongamos ahora que el investigador quiere fijar L de antemano. Por la Ecuaci6n (8.9.1) tenemos que

y elevando a1 cuadrado 10s dos lados de esta ecuaci6n, obtenemos

Esta elecci6n del tamaiio muestral nos garantiza que el intervalo de confianza tendrA una amplitud L a cada lado de la media muestral.

Tamaiio muestral de 10s intervalos de confianza para la media de una distribution normal: varianza poblacional conocida Supongamos que disponemos de una muestra aleatoria procedente de una poblaci6n normal con varianza conocida u2. Entonces, un intervalo de confianza del 100(1 - a)% para la media poblacional tiene una amplitud L a cada lado de la media muestral, si el n6mero de observaciones es

n=- z&u2
L~

donde zd es el valor para el cual

P(Z > z&) = y Z sigue una distribuci6n normal esthndar.

a 2

274

E S T ~ M A C I ~ POR N INTERVALOS

Naturalmente, el n6mero de observaciones de la muestra tierie que ser entero. Si el ndmero n resultante no es un entero, lo redondeamos por exceso para garantizar que nuestro intervalo de confianza no exceda la amplitud requerida.

EJEMPLO

8-14

La longitud de las barras de metal producidas por una cadena de producci6n es una variable aleatoria con distribuci6n normal y desviaci6n tipica 1,8 milimetros. Bashdose en una muestra aleatoria de nueve observaciones, se calcul6 el siguiente intervalo de confianza del99% para la longitud media poblacional: Supongamos que un director de producci6n Cree que el intervalo es demasiado amplio, y exige un intervalo con el mismo nivel de confianza, pero cuya longitud a cada lado de la media muestral no sea superior a 0,5 milimetros. ~ C u h t a observaciones s debe tener la muestra para construir tal intervalo? Tenemos que Por tanto, el tamaiio muestral exigido es

Asi pues, para satisfacer la petici6n del director, se necesita una muestra aleatoria de a1 menos 86 observaciones. Este gran increment0 en el tamaiio muestral representa el coste adicional de conseguir una mayor precisi6n en la estimaci6n de la verdadera media, reflejada en un intervalo de confianza m8s corto.

En la Secci6n 8.5, comprobamos que, bashdonos en una muestra aleatoria'de n observaciones, un intervalo de confianza del 100(1 - a)% viene dado por

dondep, es la proporci6n muestral observada. Este intervalo esti4 centrado en la proporci6n muestral y recorre una distancia I

a cada lado de la proporci6n muestral. Ahora bien, esta f6rmula no puede ser aplicada directamente para construir un intervalo de confianza con una longitud determinada, ya que depende de la proporci6n muestral, la cual no se conoce de antemano. Sin embargo, independientemente del resultado, a x ( l - Ox) no puede ser mayor que 0,25 cuando el valor de la proporci6n muestral es 0,5. De este modo, el mayor valor que puede alcanzar L es L., el cud viene dado por

C ~ MESTIMAR O EL TAMAI(I0 DE LA MUESTRA

275

Supongamos que un investigador quiere elegir un tamaiio muestral lo suficientemente grande co'mo para garantizar que el intemalo de confianza no tendr6 una amplitud mayor que L. a cada lado de la proporci6n muestral. Por la Ecuaci6n (8.9.2) tenemos que

y elevando esta cantidad a1 cuadrado obtenemos

Esta expresi6n proporciona el tamaiio muestral que buscamos.

Tamaiio muestral de 10s intervalos de confianza para la proporci6n muestral Supongamos que tomamos una muestra aleatoria procedente de una poblaci6n. Entonces, un interval~ de confianza del 100(1 - a)% para la proporci6n poblacional, que tiene una amplitud m h i m a L a cada lado de la proporci6n muestral, vendrfi garantizado por un nlimero de obsemaciones
n = 0,25z& -

L.Z

EJEMPLO

8-15

En el Ejemplo 8.7, construimos un intemalo de confianza del95% para la proporci6n de directores de recursos humanos que consideraban que el expediente acadkmico era muy importante en la evaluaci6n de un candidato. Bashdonos en 142 obsemaciones, el intemalo era 0,533 < p < 0,693 Supongamos ahora que queremos calcular un intemalo de confianza del95% cuya longitud a cada lado de la proporci6n muestral no sea supkrior a 0,06. ~ C u h t a obsemaciones s necesitamos? Tenemos que

L a = 0,06 y Asi, el numero de obsemaciones requerido es

Z,D

= z0.025 = 1,96

Por tanto, un nlimero minimo de 267 obsemaciones garantiza un intemalo de confianza con la longitud exigida.

Con frecuencia, 10s medios de comunicaci6n informan acerca de 10s resultados de encuestas de opini6n de la poblaci6n, o alglin subconjunto de la misma, sobre temas de actualidad. Normalmente, estas noticias dan cuenta de 10s porcentajes de 10s miembros de la poblaci6n que comparten un criten o determinado. Estas informaciones suelen concluir con frases como: "Con un margen de error del 3%". Aunque normalmente no se indica, el "margen de error" se corresponde con la longitud de 10s intemalos de confianza del 95%. En particular, estos intemalos son iguales a1 porcentaje muestral

276

ESTIMACI~N POR INTERVALOS

m6sJmenos el margen de error que se especifica, es decir, siguiendo nuestra notacibn, el valor L. expresado como un porcentaje. Por ejemplo, una encuesta de opini6n realizada durante la campaiia electoral de las elecciones generales de 1993 dio cuenta de la opini6n de 1.065 votantes. La encuesta contaba con "un margen de error del 3%". De aqui se deduce que un intervalo de confianza del95% para el porcentaje de la poblaci6n que tiene unas determinadas preferencias es igual a1 porcentaje muestral m6slmenos 3% como mlximo. Para comprender estas ideas, por la Ecuaci6n (8.9.2) tenemos que

o, en porcentaje, 3%. En realidad, se tom6 un tamaiio muestral que garantizase este resultado.

EJERCICIOS
48. Utilizando 10s datos del Ejercicio 1, hallar el nbmero de observaciones muestrales necesarias para construir un intervalo de confianza del95% para la media poblacional de las calificaciones medias con una amplitud de 0,05 puntos a cada lado de la media muestral. 49. Utilizando 10s datos del Ejercicio 2, hallar el tamaiio muestral necesario para calcular un intervalo de confianza del90% para el peso medio poblacional de 10s ladrillos, cuya amplitud a cada lado de la media muestral sea igual a 0,01 kilos. 50. Utilizando 10s datos del Ejercicio 3, hallar el ndmero de observaciones muestrales necesarias para construir un intervalo de confianza del99% para la cantidad media de impurezas, cuya amplitud a cada lado de la media muestral,sea igual a 0,5 gramos. 51. Un gabinete de investigaci6n quiere estimar la proporci6n de consumidores que, siempre que las demh condiciones fuesen las mismas, adqukirian antes un product0 de fabricaci6n nacional que uno elaborado por un competidor extranjero. Su intenci6n es construir un intervalo de confianza para la proporci6n poblacional con una amplitud mixima a cada lado de la media muestral de 0,04. LCufintas observaciones son necesarias para alcanzar este objetivo? El portavoz en el Congreso de un partido politico quiere estimar la proporci6n de diputados que estarian a favor de una polt5mica proposici6n de ley. Su intenci6n es construir un intervalo de confianza del 99% cuya amplitud maxima a cada lado de la media muestral sea de 0,05. ~ C u l n t a s observaciones muestrales son necesarias? 53. Un investigador quiere comparar dos proporciones poblacionales y se propone tomar muestras aleatorias independientes con el mismo tamaiio muestral de cada una de las dos poblaciones. El investigador quiere tener la garantia de que un intervalo de confianza del90% para la diferencia entre las dos proporciones poblacionales no tendrl una amplitud superior a 0,05 a cada lado de la media muestral. ~Cufil es el nbmero de observaciones muestrales que debe extraer de cada poblaci6n?

EJERCICIOS D ER E P A S O
54. A partir de dos muestras aleatorias independientes procedentes de dos poblaciones, un investigador comprueba que un interval0 de confianza del95% para la diferencia en el consumo medio de gasolina entre 10s coches X y 10s coches Y va desde 0,6 a 1,9 kil6metros
por litro. jImplica esto que la probabilidad de que la verdadera diferencia en el consumo medio de gasolina que se encuentre entre 0,6 y 1,9 kil6metros por litro sea 0,95? Si crees que no es asi, jcud us la interpretsci6n vdida de dicho interval0 de confianza?

55. Una empresa cervecera sabe que las cantidades de cerveza que contienen sus latas sigue una distribuci6n normal con desviaci6n tipica 0,03 litros. a) Se extrae una muestra aleatoria de 25 latas y, a partir de la misma, un experto en estadistica construye un intervalo de confianza para la poblaci6n media que discurre entre 0,28 y 0,38. jCuAl es el nivel de confianza asociado a este intervalo? b) Un gerente de esta empresa exige un intervalo de confianza del99% que tenga una amplitud maxima de 0,03 litros a cada lado de la media muestral. jcuiintas observaciones se necesitan para alcanzar este objetivo? 56. A una muestra aleatoria de 595 empaquetadores profesionales se les pidi6 que valorasen en una escala de 1 (completamente amoral) a 7 (completamente aceptable) la priictica de empaquetar "marcas genkricas (ejemplo marca Pryca)" de manera que se asemejen a marcas conocidas3'. La respuesta media y la desviaci6n tipica muestrales resultaron ser 3,38 y 1,8, respectivamente. a) Calcular un intervalo de confianza del90% para la media poblacional. b) Sin realizar 10s ciilculos, determinar si un interval~ de confianza del99% para la media poblacional tendria mayor, menor o igual amplitud que la del intervalo obtenido en (a). 57. El nlimero de reservas semipales de billetes d e cierto vuelo de una compaiiia atrea sigue una distribuci6n normal. Se toma una muestra aleatoria de 81 observaciones de nlimeros de reservas de este vuelo. El ndmero medio de reservas muestral resulta ser 112 y la desviaci6n tipica 36. Ademiis, de estos 81 vuelos, 30 llegaron a su destino con un retraso de miis de quince minutos. a) Calcular un intervalo de confianza del95% para el ndmero medio poblacional de reservas para este vuelo. b) Calcular un intervalo de confianza del95% para la varianza poblacional del nlimero de reservas. c) Calcular un intervalo de confianza del95% para la proporci6n poblacional de vuelos que llegan con un retraso de miis de quince minutos. 58. La vida media de una muestra aleatoria de 66 ruedas de una determinada marca result6 ser 32.000 kil6metros y su desviaci6n tipica 6.400. Sup6ngase que la distribuci6n poblacional es normal.

a) Calcular un intervalo de confianza del90% para la media poblacional. b) Calcular un intervalo de confianza del90% para la desviacidn tipica poblacional. 59. Supongamos que el tiempo (en horas) dedicado por 10s estudiantes de una determinada asignatura a la preparaci6n del examen final tiene una distribuci6n normal. Se toma una muestra aleatoria de seis estudiantes cuyos resultados son 10s siguientes (en horas dedicadas): 12,2 18,4 23,l 11,7 8,2 24,O a) Calcular la media y la varianza muestrales. b) Calcular un intervalo de confianza del99% para la media poblacional. c) Calcular un intervalo de confianza del99% para la varianza poblacional. d) Sin realizar 10s cilculos, determinar si un interval~ de confianza del90% tendrfa una amplitud mayor o menor que el hallado en el apartado (b). 60. a) Explica la importancia que tiene el teorema central del limite para la estimaci6n por interva10s de la media poblacional. b) En la Secci6n 8.7, presentarnos dos procedimientos distintos para el cAlculo de intervalos de confianza para la diferencia de medias poblacionales. Explica la raz6n por la cual ambos procedimientos son necesarios y acompaiia t u explicaci6n con ejemplos realistas que ilustren en qut casos es apropiado cada uno de 10s dos mttodos. 61. Se quiere estimar el precio medio de 10s alquileres de pisos en una determinada ciudad. Para ello se toma una muestra aleatoria de doce pisos alquilados y se obtienen 10s siguientes importes en miles de pesetas:

Suponiendo que la distribuci6n de la poblacidn es normal, calcular un intervalo de confianza del90% para el precio medio poblacional. 62. En una muestra aleatoria de 1.158 ejecutivos recientemente ascendidos, el 47.9% consideraron la estadistica como una parte muy importante de la preparaci6n para el puesto de director general3'.
38

"P.F. Bone y R.J. Corey, "Ethical dilemmas in packaging: beliefs of packaging professionals," Journal of Macromarkering, 12, no. 1 (1992). 45-54.

Si no te lo Crees, consulta H.W. Hildebrandt, F.A. Bond,

E.L. Miller y A.W. Swinyard, "An executive appraisal of


courses which best prepare one for general management," Journal of Business Communicarion, 19, no. 1, (1982), 5-15.

You might also like