You are on page 1of 23

ESTIMACIN DE PARMETRO

HAMLET MATA MATA PROF. DE LA UNIVERSIDAD


POLITCNICA DE EL TIGRE-VENEZUELA
INTRODUCCIN
Es muy interesante conocer las caractersticas de las muestras. El clculo de los estadsticos o ndices
que las definen y describen son netos y muy rentable. Pero en ocasiones nos preguntamos por las
caractersticas de la poblacin de origen de donde proceden las muestras. El objetivo parece ambicioso:
se trata de conocer lo que por definicin es inalcanzable. Normalmente las poblaciones son
inabarcables puesto que son infinitas, o en el mejor de los casos cuasi-infinitas, lo cual nos deja como
estbamos.
Los parmetros poblacionales caracterizan y describen las poblaciones. Son equivalentes a los
estadsticos o estadgrafos en las muestras. Un estadstico es una funcin de la muestra, esto es,
depende sola y exclusivamente de nuestra muestra. Vara y est sometido al error (variabilidad) del
muestreo. Los parmetros no varan, son constantes y adems desconocidos. Contienen las
caractersticas de la poblacin. En una poblacin cuya distribucin es conocida pero desconocemos
algn parmetro, podemos estimar dicho parmetro a partir de una muestra representativa.
La inferencia estadstica se ocupa, entre otras cuestiones, de los procedimientos de estimacin de
parmetros desconocidos de la distribucin de una variable aleatoria o de la poblacin, a partir de la
informacin suministrada por una muestra de tamao reducido, extrada al azar. La estimacin de
parmetros por intervalos, permite construir un intervalo que contendr el parmetro a estimar con
una confianza fijada a priori por el experimentador.
El objetivo ms importante de la Estadstica es obtener una inferencia con respecto a la poblacin
basndose en la informacin contenida en una muestra. Como las poblaciones se describen mediante
medidas numricas denominadas parmetros, el objetivo de la mayora de las investigaciones
estadsticas es deducir una inferencia con respecto a uno o ms parmetros de la poblacin.
Se han estudiado, hasta el momento, las nociones fundamentales de distribucin de probabilidades; se
est en condiciones, entonces, de tratar los mtodos de inferencia estadstica, los cuales comprenden los
procedimientos para estimar parmetros de poblaciones y probar (contrastar) si una afirmacin
provisional sobre un parmetro poblacional se ve apoyada o desaprobada ante la evidencia de la
muestra.
Hablando en general, hay dos tipos de inferencia: la deductiva y la inductiva. Una inferencia
deductiva es un juicio o generalizacin que se basa en un razonamiento o proceso dialctico a priori.
Por ejemplo, se supone que dos monedas estn perfectamente equilibradas y que entonces la
probabilidad de cada una de caer "cara" es = 0,5 (premisa). La media o nmero esperado de "caras" en
la jugada de las monedas deber ser 1 (conclusin). Si las premisas son ciertas, las conclusiones no
pueden ser falsas.
Una inferencia inductiva, por otra parte, es un juicio o generalizacin derivado de observaciones
empricas o experimentales; la conclusin sobre el nmero promedio de "caras" con base en los
resultados de una muestra de prueba. Si los resultados de las pruebas son diferentes, la conclusin
tambin ser diferente. No se requiere una suposicin a priori sobre la naturaleza de las monedas. La
inferencia estadstica es primordialmente de naturaleza inductiva y llega a generalizaciones respecto de
las caractersticas de una poblacin al valerse de observaciones empricas de la muestra.
Es muy probable que una estadstica muestral sea diferente del parmetro de la poblacin y slo por
coincidencia sera el uno exactamente igual al otro. La diferencia entre el valor de una esta dstica
muestral y el correspondiente parmetro de la poblacin se suele llamar error de estimacin. Slo se
sabra cul es el error si se conociera el parmetro poblacional, pero ste por lo general se desconoce.
La nica manera de tener alguna certeza al respecto es hacer todas las observaciones posibles del total
de la poblacin en la mayora de las aplicaciones prcticas, lo cual, desde luego, es imposible o
impracticable.

Y en efecto, la razn de ser de la inferencia estadstica es la falta de conocimientos acerca de las


caractersticas de la poblacin. Pero que tales caractersticas se desconozcan no impide el que se acte.
Las inferencias estadsticas se hacen por posibilidades o probabilidades. De la media de la muestra se
hacen inferencias sobre la media de la poblacin. No se sabe exactamente cul es la diferencia entre
estas dos medias, ya que la ltima es desconocida en la mayora de los casos. No obstante, si se sabe
que es ms bien poca la probabilidad de que esta diferencia sea mayor que, por ejemplo, tres a an dos
errores estndares.
Los problemas que se tratan en la inferencia estadstica se dividen generalmente en dos clases: los
problemas de estimacin y los de prueba de hiptesis. Como al estimar un parmetro poblacional
desconocido se suele hacer una afirmacin o juicio este ltimo ofrece solamente una estimacin. Es un
valor particular obtenido de observaciones de la muestra. No hay que confundir este concepto con el de
estimador, que se refiere a la regla o mtodo de estimar un parmetro poblacional. Por ejemplo, se dice
que X es un estimador de porque la media muestral proporciona un mtodo para estimar la media
de la poblacin. Un estimador es por naturaleza un estadstico y como tal tiene una distribucin. El
procedimiento mediante el cual se llega a la obtencin y se analizan los estimadores se llama
estimacin estadstica, que a su vez se divide en estimacin puntual y estimacin por intervalos. En
una poblacin cuya distribucin es conocida pero desconocemos algn parmetro, podemos estimar
dicho parmetro a partir de una muestra representativa.
Uno de los principales objetivos de la estadstica inferencial es estimar parmetros poblacionales.
Desde el punto de vista matemtico, los parmetros son valores que definen la forma y localizacin de
un modelo probabilstico. Los parmetros poblacionales son constantes que caracterizan una
poblacin. Estos parmetros pueden ser de ubicacin (como la media, mediana, proporcin) o de
dispersin (como la varianza o coeficiente de variacin). Los parmetros se estiman mediante el
muestreo de la poblacin. Los valores que se calculan a partir de muestras para estimar parametros se
llaman estimadores. Los estimadores se calculan mediante reglas matemticas (frmulas) a partir de los
elementos de la muestra. Por ejemplo, la media muestral, un estimador de la media poblacional se
calcula como:

La seleccin de elementos en una muestra se puede hacer de distintas formas, El muestreo aleatorio es
la seleccin al azar de los elementos que constituyen una poblacin. El muestreo puede ser sin
reemplazo, en este caso, los elementos que se extraen no son devueltos. El muestreo con reemplazo
ocurre cuando el elemento extrado es devuelto a la poblacin. En el caso de que el tamao de la
poblacin sea muy grande, el muestreo sin reemplazo no afecta las estimaciones, de lo contrario debe
considerarse el efecto de la extraccin de los elementos de la poblacin. La seleccin y extraccin
aleatoria de los elementos de la poblacin para realizar inferencias sobre atributos poblacionales es
necesaria para evitar sesgos, lograr independencia entre las observaciones y mantener objetividad en
las inferencias realizadas. Puesto que los elementos de la muestra varan de manera impredecible (si la
extraccin es aleatoria), los estimadores tambin varan. Por lo tanto, los estimadores son variables
aleatorias.
Para la estimacin de los estadsticos de posicin se toma como base el clculo combinatorio y
permutacional. Se utilizan fundamentalmente las tcnicas de remuestreo, Bootstrap y Jackknife. Estas
tcnicas no han sido suficientemente desarrolladas y utilizadas porque histricamente los economistas
(padres de los estadistas) empleaban las sumatorias y la medias y nunca las medidas de posicin,
medianas o cuartiles. Esto es lgico cuando hablamos de dinero.
La estimacin de parmetros puede ocurrir de dos formas: a) Estimacin puntual, la cual es la
estimacin del valor del parmetro y b) Estimacin por intervalo, en este caso se construye un
intervalo probabilstico que expresa la probabilidad de que el parmetro se encuentre dentro de dicho
intervalo con cierto nivel de confiabilidad. Se recomienda que en la presentacin de estimaciones
puntuales siempre se asocie su variabilidad, por ejemplo, en el caso de la media muestral, es
recomendable presentar tambin el error estndar y tamao de muestra

Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona
informacin sobre el valor del parmetro. Por ejemplo la media muestral es un estimador de la media
poblacional, la proporcin observada en la muestra es un estimador de la proporcin en la poblacin.
Una estimacin es puntual cuando se obtiene un slo valor para el parmetro. Los estimadores ms
probables en este caso son los estadsticos obtenidos en la muestra, aunque es necesario cuantificar el
riesgo que se asume al considerarlos. Recordemos que la distribucin muestral indica la distribucin
de los valores que tomar el estimador al seleccionar distintas muestras de la poblacin. Las dos
medidas fundamentales de esta distribucin son la media que indica el valor promedio del estimador y
la desviacin tpica, tambin denominada error tpico de estimacin, que indica la desviacin
promedio que podemos esperar entre el estimador y el valor del parmetro.
Ms til es la estimacin por intervalos en la que calculamos dos valores entre los que se encontrar
el parmetro, con un nivel de confianza fijado de antemano.
Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene al
parmetro que se est estimando.
Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del
parmetro. Se indica por 1 habitualmente se da en porcentaje (1- )100%. Hablamos de nivel de
confianza y no de probabilidad ya que una vez extrada la muestra, el intervalo de confianza contendr
al verdadero valor del parmetro o no, lo que sabemos es que si repitisemos el proceso con muchas
muestras podramos afirmar que el (1- )% de los intervalos as construidos contendra al verdadero
valor del parmetro. Por lo general los nivele de confianza ms utilizados son: 99, 95 y 90 %, a estos
se les denominan coeficientes de confianza: es el nivel de confianza que se tiene en el que el intervalo
contenga el valor desconocido del parmetro; estos son simplemente convencionales.
Un intervalo de confianza tiene un lmite inferior de confianza (LIC) y un lmite superior de confianza
(LSC). Esos limites se encuentran calculando primero la media muestral, X . Luego se suma una cierta
cantidad a X para obtener el LSC y la misma cantidad se resta a X para obtener el LIC, estos valores
que se suman y restan a la media muestral se les denominan errores de estimacin.
Confianza e Intervalos de confianza
La estimacin de parmetros mediante un solo valor se conoce como estimacin puntual. Es bastante
arriesgada puesto que no conocemos ni la imprecisin ni se establece el grado de confianza que nos
merece el resultado. Estos dos inconvenientes se obvian con la estimacin por intervalos
confidenciales. Por un lado proporcionan un valor de la imprecisin dado por la longitud del intervalo
de confianza. Por otro proporcionan un valor de la fiabilidad que nos debera merecer nuestra
estimacin, o nivel de confianza.
Afortunadamente algo tan sutil como la confianza se puede cuantificar, y no slo eso sino que se
mueve en unos lmites tan cmodos para el pensamiento como son entre el cero y el cien por ciento.
Por convenio, y nadie parece en desacuerdo, para la mayora de las ocasiones una confianza del 95%
parece suficiente. Este es el valor que gobierna la longitud del intervalo de confianza.
Como se interpreta una confianza del 95%?. Si llevamos a cabo un experimento 100 veces
obtendramos 100 distribuciones muestrales de datos y 100 intervalos de confianza. De estos 100
intervalos, 95 de ellos cubriran el valor del verdadero parmetro poblacional. Desgraciada o
afortunadamente, nosotros solo realizamos el experimento una sola vez. Con lo que nunca sabremos si
nuestro intervalo es uno de esos 95 que contienen el parmetro de estudio.
Tcnicamente, aunque esto suene a una sofisticacin innecesaria, no podemos asociar el concepto de
nivel de confianza con el concepto de probabilidad. As no se puede establecer que tenemos una
probabilidad del 95% de que el parmetro buscado este dentro de nuestro intervalo.
Las tcnicas de estimacin de parmetros poblacionales se incluyen dentro de la estadstica inferencial.
Un Teorema Importante
Todos los parmetros poblacionales pueden ser estimados a partir de tcnicas de estimacin. La
mayora de los estimadores se basan en la distribucin de los estadsticos en el muestreo y toman como
base algunas propiedades deseables del teorema del lmite central. Este teorema tiene unas propiedades
tan deseables que es la base de la estadstica analtica. Viene a decir fundamentalmente dos cosas:
3

1.- Que las muestras individualmente son diferentes de las poblaciones pero en conjunto son muy
parecidas
2. Que las muestras no son gobernadas por el azar, sino que en conjunto siguen, no importa de lo que
estemos tratando, las leyes universales de las funciones tericas de probabilidad. La funcin de
probabilidad normal rige, en la mayora de las ocasiones cuando las muestras son mayores de 30, estas
distribuciones muestrales.
Otro Enfoque
Para la estimacin de los estadsticos de posicin se toma como base el clculo combinatorio y
permutacional. Se utilizan fundamentalmente las tcnicas de remuestreo, Bootstrap y Jackknife. Estas
tcnicas no han sido suficientemente desarrolladas y utilizadas porque histricamente los economistas
(padres de los estadistas) empleaban las sumatorias y la medias y nunca las medidas de posicin,
medianas o cuartiles. Esto es lgico cuando hablamos de dinero.
La estimacin de parmetros puede ocurrir de dos formas: a) Estimacin puntual, la cual es la
estimacin del valor del parmetro y b) Estimacin por intervalo, en este caso se construye un
intervalo probabilstico que expresa la probabilidad de que el parmetro se encuentre dentro de dicho
intervalo con cierto nivel de confiabilidad. Se recomienda que en la presentacin de estimaciones
puntuales siempre se asocie su variabilidad, por ejemplo, en el caso de la media muestral, es
recomendable presentar tambin el error estndar y tamao de muestra.
ESTIMACIN DE PARMETROS
La teora clsica de la Inferencia Estadstica trata de los mtodos por los cuales se selecciona una
muestra de una poblacin y, basndose en las pruebas de las muestras, se trata de:
* Estimar el valor de un parmetro desconocido, por ejemplo .
* Verificar si es o no igual a cierto valor predeterminado, por ejemplo 0.
El primero de estos dos procedimientos, de inferir de una muestra a una poblacin, se llama estimacin
de un parmetro; el segundo, prueba de una hiptesis acerca de un parmetro. Dentro del primer
procedimiento, la estimacin de un parmetro puede tener por resultado un solo punto (estimacin
puntual), o un intervalo dentro del cual exista cierta probabilidad de encontrarlo (estimacin por
intervalos).
Un estimador puntual es un nico punto o valor, el cual se considera va a estimar a un parmetro. La
expresin E( ) = sugiere que el nico valor de es un estimador puntual insesgado o no viciado de
.
Un estimador por intervalo se construye sobre el concepto de un estimador puntual, pero adems,
proporciona algn grado de exactitud del estimador. Como el trmino lo sugiere, un estimador por
intervalo es un rango o banda dentro de la cual el parmetro se supone va a caer.
Las tcnicas estadsticas de estimacin intentan conocer el valor de estos parmetros. La media de edad
de un conjunto de personas es fcilmente calculable y no est sometido a ninguna clase de imprecisin.
La media de edad de la poblacin de donde proviene esa muestra es desconocida. Si la muestra cumple
la condicin de ser aleatoria, es posible intentar calcular la media poblacional. El clculo de los
parmetros se basa en la informacin suministrada por la muestra.
En el proceso de ir de la informacin de la muestra (estadsticos) al estimado de los parmetros
poblacionales ocurren dos cosas, una buena y otra mala:
a.- Ganamos en generalizacin. Esto es, pasamos de la parte al todo. De las muestras a las poblaciones
b.- Perdemos precisin o lo que es lo mismo, ganamos en imprecisin. La estimacin de parmetros
poblacionales se realiza construyendo intervalos (segmentos) que suponemos cubren o contienen el
parmetro buscado.

ESTIMACIN CON Y SIN SESGO


Si la media de las distribuciones de muestreo de un estadstico es igual que la del correspondiente
parmetro de la poblacin, el estadstico se llama un estimador sin sesgo del parmetro; si no, se
denomina un estimador sesgado. Los correspondiente valores de tales estadsticos se llaman
estimaciones sin sesgo y sesgadas, respectivamente.
ESTIMACIN EFICIENTE
Si las distribuciones de muestreo de los estadsticos tienen las mismas medias (o esperanza
matemtica), el de menor varianza se llama un estimador eficiente de la media, mientras que el otro se
llama un estimador ineficiente. Los valores correspondientes de esos estadsticos se llaman
estimacin eficiente e estimacin ineficiente, respectivamente. Si consideramos todos los posibles
estadsticos cuyas distribuciones de muestreo tienen la misma media, aquel de varianza mnima se
llama a veces el estimador de mxima eficiencia, o sea el mejor estimador.
ESTIMACIN - GENERALIDADES
El uso principal de la inferencia estadstica en la investigacin emprica, es lograr conocimiento de una
gran clase de unidades estadsticas (seres humanos, plantas, parcelas de tierra), de un nmero
relativamente pequeo de los mismos elementos.
Los mtodos de inferencia estadstica emplean el razonamiento inductivo, razonamiento de lo
particular a lo general y de lo observado a lo no observado.
Cualquier coleccin o agregacin grande de cosas que deseamos estudiar o de las cuales deseamos
hacer inferencias, se llama poblacin. El trmino poblacin tiene ms significado cuando se lo junta
con la definicin de muestra de una poblacin: una muestra es una parte o subconjunto de una
poblacin. Una muestra de n elementos de la poblacin de N elementos, debera ser seleccionada de
forma tal que las caractersticas de la poblacin puedan ser estimadas con un margen de error conocido.
Los valores de varias medidas descriptivas calculadas para las poblaciones, se llaman parmetros.
Para las muestras, estas mismas medidas descriptivas se llaman estadsticos o estadgrafos.
Matemticamente, podemos describir muestras y poblaciones al emplear mediciones como la media,
mediana, moda y desviacin estndar. Cuando estos trminos describen las caractersticas de una
muestra se denominan estadsticos o estadgrafos y cuando describen las de una poblacin se
denominan parmetros, con lo que podemos decir que:" Un estadstico es una caracterstica de una
muestra y un parmetro es una caracterstica de una poblacin." Un parmetro describe una poblacin
de la misma manera que un estadgrafo describe a una muestra. Los investigadores de la estadstica
usan la palabra poblacin para referirse no slo a personas sino a todo los elementos que han sido
escogidos para su estudio; mientras que emplean la palabra muestra par describir una porcin escogida
de la poblacin. La notacin utilizada empleada para denotar estadsticos de muestra es de letras latinas
minsculas y para representar parmetros de una poblacin se utilizan letras griegas o latinas
maysculas.
MUESTRA
ESTADSTICO

POBLACIN
PARMETRO

Media Aritmtica
Variancia

Desvo Estndar

Coeficiente
Correlacin
Tamao

de

Un estadgrafo o estadstico calculado a partir de una muestra es un estimador del parmetro en la


poblacin. Una estimacin es alguna funcin de los resultados de una muestra que produce un valor,
llamado estimador. El estimador da alguna informacin respecto al parmetro. Por ejemplo, la media
de la muestra, , es un estimador de la media en la poblacin. Las poblaciones pueden ser infinitas
o finitas. Para la mayora de los propsitos de investigacin, se supone que las poblaciones son
infinitas, no finitas, en tamao, las cuales son algo artificial o imaginario. Una poblacin finita puede
ser extremadamente grande. Es posible concebir un proceso de conteo de los elementos de la
5

poblacin, el cual puede ser computado; luego la poblacin es tcnicamente finita. Afortunadamente no
es necesario crear problemas en cuanto a la distincin entre poblaciones infinitas y finitas.
El mtodo usado para seleccionar la muestra es muy importante al juzgar la validez de la inferencia que
se hace de la nuestra a la poblacin. Para que una muestra sirva adecuadamente como base para obtener
estimadores de parmetros poblacionales, debe ser representativa de la poblacin. El muestreo al azar
de una poblacin producir muestras que "a la larga" son representativas de la poblacin. Si una
muestra se extrae aleatoriamente, es representativa de la poblacin en todos los aspectos, esto es, el
estadgrafo diferir del parmetro solo por azar. La habilidad para estimar el grado de error debido al
azar (error de muestreo), es un rasgo importante de una muestra al azar.
PROPIEDADES DE UN BUEN ESTIMADOR
Para poder utilizar la informacin que se tenga de la mejor manera posible, se necesita identificar los
estadgrafos que sean buenos estimadores, cuyas propiedades son:

Insesgabilidad: , estimador de es una variable aleatoria y por lo tanto tiene una distribucin de
probabilidad con una cierta media y variancia. Se puede definir estimador insesgado diciendo: Si se

utiliza un estadstico muestral para estimar el parmetro de la poblacin , se dice que es un

estimador insesgado de , si la esperanza matemtica de coincide con el parmetro que desea


estimar.

En smbolos: es insesgado E ( )
O sea que es de esperar que si se toman muchas muestras de igual tamao partiendo de la misma

distribucin y si de cada una se obtiene un valor , la media de todos los valores de ha de estar
muy cerca de .
* La media muestral es un estimador insesgado de la media poblacional, o sea que E( ) =
* La variancia muestral, es un estimador insesgado de la variancia poblacional?
La respuesta depende de como se defina la variancia muestral.

Si

( xi X 2 ) 2

, entonces S es un estimador sesgado de

E (S 2 )

2 pues

. Mas an,

n 1 2
. Pero el sesgo se puede corregir alterando la definicin de variancia muestral.
n

En efecto, si S*2

( xi X ) 2

n 1

es la variancia muestral corregida, entonces ( E ) S*2 2 y S es un

estimador insesgado de 2 .
Eficiencia: si se utilizan dos estadsticos o estadgrafos como estimadores del mismo parmetro,
entonces aquel cuya distribucin muestral tenga menor variancia, es un estimador ms eficiente o ms
eficaz que el otro. Es decir:

es eficiente

mnima.

Consistencia: Si es un estimador muestral calculado a partir de una muestra de tamao n y si


es el
parmetro de poblacin que se va a estimar, entonces es un estimador consistente de si la
probabilidad de que el valor absoluto de la diferencia entre y su esperanza
iguale o supere a e
(error admitido que tiende a cero, o sea que es tan pequeo como se quiera), tienda a cero cuando el
nmero de elementos de la muestra tienda a infinito. Es decir, la consistencia se refiere a que al
aumentar el tamao de muestra, el estimador se aproxima al parmetro.
Suficiencia: La suficiencia se refiere a que el estimador haga uso de toda la informacin de la muestra
para estimar al parmetro. La media muestral hace uso de todas las observaciones. Un estimador
suficiente del parmetro es aquel que agota toda la informacin pertinente sobre que se puede
disponer en la muestra. Por ejemplo, si se toma una muestra de n = 30 valores con el fin de estimar ,
pueden utilizarse como estimadores la primera, la dcimo quinta o la ltima observacin, o el promedio
6

entre la primera y la quinta observacin. Pero estos estimadores no son suficientes pues no contienen
toda la informacin disponible de la muestra. La media aritmtica calculada con las 30 observaciones
s lo es pues tiene en cuenta todas las observaciones. En definitiva, por ejemplo la media aritmtica
muestral y la forma corregida de la variancia muestral, son estadsticas que satisfacen los criterios o
propiedades de "buenos" estimadores.
Evaluacin de la bondad de un Estimador
Para evaluar si un estadstico es mejor estimador que otro, se evalan cuatro criterios:
Imparcialidad: Se dice que un estadstico es un estimador imparcial si, en promedio, tiende a tomar
valores que estn por encima del parmetro de la poblacin que se est estimando con la misma
frecuencia y la misma extensin con la que tiende a asumir valores por debajo del parmetro que se
est estimando. Se refiere al hecho de que una media de muestra es un estimador no sesgado de una
media de poblacin, porque la media de distribucin de muestreo de las medias de muestras tomadas de
la misma poblacin es igual a la media de la poblacin misma. Podemos decir que una estadstica es un
estimador imparcial (o no sesgado) si, en promedio, tiende a tomar valores que estn por encima del
parmetro de la poblacin y la misma extensin con la que tiende a asumir valores por debajo del
parmetro de poblacin que se est estimando.
Eficiencia: Esta caracterstica se refiere al tamao del error estndar del estadstico, mientras ms
pequeo sea el error estndar, en ms eficiente el estimador. Se refiere al tamao del error estndar de
la estadstica. Si comparamos dos estadsticas de una muestra del mismo tamao y tratamos de decidir
cul de ellas es un estimador ms eficiente, escogeramos la estadstica que tuviera el menor error
estndar o la menor desviacin estndar de la distribucin de muestreo. Tiene sentido pensar que un
estimador con un error estndar menor (con menos desviacin) tendr una mayor oportunidad de
producir una estimacin ms cercana al parmetro de poblacin que se est considerando.
Coherencia: Un estadstico es un estimador coherente de un parmetro de poblacin si al aumentar el
tamao de la muestra, se tiene casi la certeza de que el valor de la estadstica se aproxima bastante al
valor del parmetro de la poblacin. Si un estimador es coherente, se vuelve ms confiable si tenemos
tamaos de muestras ms grandes.
Suficiencia: Un estimador es suficiente si utiliza una cantidad de la informacin contenida en la
muestra que ningn otro estimador podra extraer informacin adicional de la muestra sobre el
parmetro de la poblacin.
ESTIMACIN POR INTERVALOS DE CONFIANZA
Lo dicho hasta ahora se refiere a una estimacin puntual, es decir, estimar un parmetro a travs de un
nico valor. Esta estimacin no es muy conveniente pues con ella no se puede determinar el error de
muestreo, ni la precisin de la estimacin, ni la confianza que merece tal estimacin. Existen otros
mtodos para estimar parmetros poblacionales que son mucho ms precisos. Por ejemplo:
* Mtodo de los mnimos cuadrados.
* Mtodo de los momentos.
* Mtodo de la mxima verosimilitud se basa en el principio de que generalmente ocurre lo ms
probable.
* Mtodo de estimacin por intervalos de confianza, este ser el que se desarrollara en este curso.
El procedimiento de determinar un intervalo (a, b) que comprenda un parmetro de poblacin con
cierta probabilidad 1 , se llama estimacin por intervalos. Se vern los casos paramtricos, es
decir, aquellos en los que se tiene conocimiento del tipo de distribucin de la poblacin (Binomial,
Normal, etc.).
DISTRIBUCIONES MUESTRALES
Este concepto se relaciona con la idea de variacin o fluctuaciones al azar, para lo cual todas las
posibles muestras de un tamao N en una poblacin dada (con o sin reposicin). Para cada muestra,
podemos calcular un estadstico (tal como la media o la desviacin tpica) que variar de muestra a
muestra. De esta manera obtendremos una distribucin del estadstico que se llama su distribucin de
7

muestreo. Si, por ejemplo, el estadstico utilizado es la media muestral, entonces la distribucin se
llama la distribucin de muestreo de medias, o, distribucin de muestreo de la media. Anlogamente,
podramos tener distribuciones de muestreo de la desviacin tpica, de la varianza, de la mediana, de
las proporciones, etc. Para cada distribucin de muestreo podemos calcular la media, la desviacin
tpica, etc. As pues, podremos hablar de la media y la desviacin tpica de la distribucin de muestreo
de medias, etc.
DISTRIBUCIN DE MUESTREO DE MEDIAS
Es una distribucin probabilstica que consta de una lista de todas las medias muestrales posibles de un
tamao dado de una poblacin y la probabilidad de ocurrencia asociada con cada media muestral. Si
tomamos varias muestras de una poblacin con el objetivo de obtener la media poblacional,
observaramos que cada una de ellas posiblemente nos dan diferentes valores de dicha media. Si se
organizaran las medias de todas las muestras posibles de un tamao especfico tomadas de una
poblacin se obtendra lo que se conoce como una distribucin muestral de medias.
Para muestras de tamao N, sin reposicin, de una poblacin finita de tamao Np>N tenemos,

y X

NP N
NP 1

Si la poblacin es infinita o si el muestreo es con reposicin, los resultados anteriores se reducen a:

y X

Para valores grandes de N (N30), la distribucin de muestreo de medias, es aproximadamente normal


con media X y desviacin tpica X , independientemente de la poblacin (en tanto en cuanto la
media poblacional y la varianza sean finitas y el tamao de la poblacin sea al menos doble que el de la
muestra). Este resultado para una poblacin infinita es un caso especial del teorema del lmite central
de teora avanzada de probabilidades, que afirma que la precisin de la aproximacin mejora al crecer
N. Esto se indica en ocasiones diciendo que la distribucin de muestreo es asintticamente normal.
Debemos anotar que las caractersticas de la poblacin sern las mismas que tendrn las diferentes
muestras de la misma:
Si la poblacin no tiene distribucin normal, la distribucin muestral de medias de cualquier manera
tender a aproximarse a la forma normal.
La dispersin en la distribucin de las medias muestrales es siempre menor que la dispersin de la
poblacin y ser mucho ms pequea mientras ms grande sea el tamao de la muestra.
ESTIMACIONES DE INTERVALO DE CONFIANZA PARA PARMETROS DE
POBLACIN
Sean x la media y la desviacin tpica (error tpico) de la distribucin de muestreo de un estadstico S.
Entonces, si la distribucin de S es aproximadamente normal (que como hemos visto es cierto para
mucho estadsticos si el tamao de la muestra N30), podemos esperar hallar un estadstico real S que
est en los intervalos s -s a s +s, s -2s a s+s, o s -s a s +3s alrededor del 68.27 %, 95,45
% y 99.73 % de la curva normal, respectivamente.
Equivalentemente, podemos esperar hallar (o sea, podemos estar confiados en encontrar) s en los
intervalos S - s a S + s, S - 2s a S + 2s, o S - 3s a S + 3s alrededor del 68.27%, 95.45% y
99.73% , de la curva normal, respectivamente. Por esta razn, llamamos a ese respectivos intervalos
los intervalos de confianza 68.27%, 95.45% y 99.73% para estimar s. Los nmeros extremoso de estos
intervalos se llaman entonces los lmites de confianza 68.27%, 95.45% y 99.73%.
Anlogamente, S 1.96s. y S 2.58s son los lmites de confianza 95% y 99% (o sea 0.95 y 0.99)
para S. El porcentaje de confianza se suele llamar nivel de confianza. Los nmeros 1.96 y 2.58, etc. en
los lmites de confianza se llaman coeficientes de confianza o valores crticos, y se denotan por z c. De

los niveles de confianza que no aparecen en la tabla, los valores de z c se pueden encontrar gracias a las
tablas de reas bajo la curva normal.
NIVELES DE CONFIANZA
NIVEL
DE 99.73% 99%
CONFIANZA
3.00
2.58
ZC

98%

96%

95.45%

95%

90%

80%

68.27%

50%

2.33

2.05

2.00

1.96

1.645

1.28

1.00

0.6745

Una normal de media y desviacin se transforma en una z. De acuerdo a las siguientes figuras.
Llamando z al valor de una variable normal tipificada que deja a su derecha un rea bajo la curva de
, es decir, que la probabilidad que la variable sea mayor que ese valor es (estos son los valores que
X
ofrece la tabla de la normal). Podremos construir intervalos de la forma Z1 2
Z 2 ,

n
para los que la probabilidad es 1 - .

ERRORES TPICOS:
La desviacin tpica de una una distribucin de muestreo de un estadstico se suele llamar su error
tpico. En la siguiente tabla, se presentan errores tpicos de distribucin de muestreo para varios
estadsticos bajo las condiciones de muestreo aleatorio de una poblacin infinita (o muy grande) o de
muestreo con reposicin de una finita. Tambin recoge observaciones particulares que garantizan la
validez de estos resultados y otras notas pertinentes.
Se debe tomar en cuenta que si el tamao de la muestra es lo bastante grande, las distribuciones de
muestreo son normales o casi normales. Por ellos, los mtodos se conocen como mtodos de grandes
muestras. Cuando N30, las muestras se llaman pequeas. Cuando los parmetros de la poblacin, tales
como ro, son desconocidos, pueden ser estimados con precisin por sus correspondientes
estadsticos muestrales, a saber, s, X , y r, si las muestras son suficientemente grandes.

DISTRIBUCIN
DE MUESTREO

ERROR TPICO

OBSERVACIONES
Esto es cierto para muestras grandes y
pequeas. La distribucin muestral de medias
es casi normal para 30, incluso cuando la
poblacin no es normal.

Medias

x , la media de la poblacin, en todos


lo casos.
La nota precedente para las medias se aplica
aqu
tambin
Proporciones

p p , en todos los casos.

Desviaciones Tpicas

(1)

(2)

Varianzas

(1)

Para 100, la distribucin muestral de s es


casi
normal.
s viene dada por (1) slo si la poblacin es
normal (o aproximadamente normal). Si la
poblacin no es normal, se puede usar (2).
Note, que (2) se reduce a (1) cuando 2=2
y 4=4, lo cual es cierto para poblaciones
normales.
Para 100, s= muy aproximadamente
Las observaciones hechas sobre la desviacin
tpica son aplicables tambin aqu. Debemos
notar que (2) da (1) en el caso de poblaciones
normales.
s2=2(N-1)/N, que es casi igual a 2 para N
grandes.

(2)

Intervalo de Confianza para ; con Conocida


Si X es la media de una muestra aleatoria de tamao n de una poblacin con varianza conocida 2 ,
un intervalo de confianza de (1 )100% para esta dado por X Z 2

X Z 2

,
n
n
donde Z 2 es el valor de z que delimita un area de 2 a su derecha. Este teorema se cumple en el
caso de muestras de tamao n 30.

Es la probabilidad de que el intervalo no incluya al verdadero valor del parmetro. 1 es el nivel


de confianza, es una medida de la fiabilidad de la estimacin. Por ejemplo, si se toma = 10%,
entonces 1 = 90% y se dice que se tiene un intervalo de confianza del 90% y que la probabilidad de
que el intervalo contenga al verdadero valor del parmetro es del 90%. Es decir, que si repetidamente
se muestra y se construye tal intervalo una y otra vez, 90 de cada 100 de estos intervalos, contendr al
parmetro y 10 de ellos no. Se puede pensar que 1 significa certeza, seguridad y significa riesgo. La
seguridad menos el riesgo, es decir 1 da, por lo tanto, el coeficiente de confianza de nuestras
afirmaciones.
En general, es posible construir intervalos de confianza para cualquier coeficiente de confianza
(1 )100% para basado en una muestra grande

X Z 2

, es decir:

10

X Z 2
X Z 2

, es el lmite inferior del intervalo de confianza y

, el lmite superior del intervalo de confianza.

Una vez determinado el intervalo, es decir, una vez calculados numricamente los limites inferiores y
superiores, ya no debe hablarse en trminos de confiabilidad ni en trminos probabilsticos, pues la
situacin pasa a ser completamente determinstica. De tal manera, asociado a un intervalo de confianza
ya calculado, se tiene una probabilidad 0 1 de que contenga al parmetro a estimar y no hay otra
opcin, ya que lo contiene o no lo contiene. Resumiendo, los extremos del intervalo son variables
aleatorias, mientras que el parmetro a determinar es constante.

Muestras diferentes originaran valores distintos de X y, consecuentemente originaran diferentes


estimaciones por intervalos del parmetro . Mientras mayor sea el valor que se elija para Z 2 ,
ms amplio sern los intervalos y abra mayor confianza de que la muestra seleccionada en particular
dar un intervalo que contenga al parmetro desconocido .
Figura: Intervalo de confianza para la media.

En general, los pasos a seguir para estimar un parmetro por el mtodo de los intervalos de confianza,
son:
* Fijar el coeficiente de confianza que se desea en la estimacin.
* Extraer la muestra y calcular el o los estadsticos necesarios.
* Determinar la distribucin en el muestreo que tiene el estadstico empleado.

CASO 1 Con conocido:


Sea X .., N ( , ) donde es desconocido y conocido.
Sea x1 , x2, ... , xn una muestra aleatoria de la variable aleatoria X y sea

la media muestral.


Se sabe que X .., N ,
independientemente del valor de n, por el teorema central del lmite.
n

11

, N (0,1)

n
Luego, tipificando:

Z Z 2
1

Se plantea:

entonces:


P X Z 2
X Z 2
1
n
n

Observaciones:
Si las muestras se toman sin reposicin de una poblacin finita de tamao N, debe emplearse el factor
de correccin por finitud y el intervalo ser:

X Z 2

N n

; X Z 2
n 1
n

N n

n 1

Si la poblacin es slo aproximadamente normal, la igualdad sigue siendo vlida en forma aproximada.
Figura: La distribucin N (0,1) y el intervalo ms pequeo posible cuya probabilidad es 1 . Por
simetra, los cuartiles Z 2 y Z1 2 slo difieren en el signo.

Ejemplo 1: Un grupo de investigadores en Medicina desea estimar el cambio medio de presin


sangunea por paciente en un sanatorio. Se ha seleccionado una muestra al azar de 30 pacientes y se
12

hall que
puls/seg. Los investigadores saben que la desviacin estndar de los cambios de
presin sangunea para todos los pacientes es = 3 puls/seg segn estudios anteriores. Ellos desean
estimar el cambio medio de la presin sangunea por paciente con un intervalo del 95% de confianza,
suponiendo que la variable aleatoria "cambios de presin sangunea" tiene asociada una distribucin
normal de probabilidad.
Respuesta:
X = cambio en la presin sangunea por paciente del sanatorio (en pulsaciones por segundo)
, = 3, 1 - = 0.95

n = 30,
Por tabla:

Z 2 1.96

Entonces:

Lmite inferior (LIC) = 5 1.96

30

Lmite superior (LSC) = 5 1.96

5 1,073 3.9

3
30

5 1,073 6.1

Por lo tanto resulta el Intervalo del 95% de confianza para la media: (3,9; 6,1). Entonces, se puede
afirmar que el cambio medio en la presin sangunea por paciente, pertenece al intervalo (3,9; 6,1)
pulsaciones, con un nivel de confianza del 95%.
En cuanto al tamao ptimo de muestra, e

determina el error mximo admitido de muestreo


n
e indica la precisin de la estimacin. Lgicamente se pretende que sea lo ms pequeo posible. Por
otra parte, (1 - ) es el coeficiente de confianza y se pretende que sea lo ms grande posible. Pero
Z 2 depende del valor de y al hacer mayor el coeficiente de confianza (1 - ), el valor Z 2 ser
mayor y por lo tanto el error aumentar. Esto se puede regular aumentando el tamao de la muestra con
lo que el error disminuir.
Para el ejemplo 1, e 1.96

3
30

1,073 puls / seg

con un nivel de confianza del 95%.

Si se utiliza X como una estimacin de , se puede tener una confianza de (1 )100% de que el
error ser menor que una cantidad especificada e cuando el tamao de la muestra es

Z2 2 * 2
Z 2 *
Z 2 *
Z 2 *
e
n
n
n
e
e
n
e2

Si se desea elevar el nivel de confianza a 99% en el problema anterior, pero sin aumentar el error e de
estimacin, el tamao de la muestra debera ser:

Z 2 *
n
e

Z 2 2,575..; 3..; e 1,073..; Entonces ,


n

(2,575) 2 32
(1,073) 2

n 51.8 52.0

Es decir, que se debe tomar una muestra de aproximadamente 52 pacientes en lugar de 30.
Por el contrario, si el investigador deseara un error de estimacin menor, por ejemplo 1 puls/seg,
manteniendo el nivel de confianza en 95%, el tamao de la muestra requerido ser:

13

(1,96) 2 (3) 2
(1) 2

34.6 35.0 Pacientes.

EJEMPLO 1A.-Para una muestra de 81 habitantes de cierta poblacin se obtuvo una estatura media de
167 cm. Por estudios anteriores se sabe que la desviacin tpica de la altura de la poblacin es de 8 cm.
Construye un intervalo de confianza para la estatura media de la poblacin al 95%.
Datos: 8,....n 81,...Z 2 1.96(95%),...X 167


P X Z 2
X Z 2
1
n
n

167 1.96

8
81

167 1.96

8
81

167 1.96 x0.89 167 1.96 x0.89

167 1.74 167 1.74 (165,26;..168,74)


Entonces el intervalo de confianza buscado es: (165.26; 168.74)
Por lo tanto resulta el Intervalo del 95% de confianza para la media: (165.26, 168.74). Entonces, se
puede afirmar que el cambio medio en la estura de esa poblacin, pertenece al intervalo (165.26,
168.74), con un nivel de confianza del 95%.
El estudiante debe calcular los intervalos para los niveles de confianza de 90% y de 99%.
EJEMPLO: La media y la desviacin estndar para los promedios de puntuacin de una muestra
aleatoria de 36 estudiantes de un Tecnolgico son 2.6 y 0.3, respectivamente. De qu tamao debera
ser la muestra si se desea tener una confianza de 95 % de que la estimacin de es menor que0.05?
SOLUCIN: Puesto que el tamao de la muestra es grande, la desviacin estndar puede
aproximarse mediante s 0.3 , Z 2 1.96 y e = 0.05. Aplicando la siguiente formula se tiene:

Z 2 *
n
e

n (1.96)(0.3) n 138

0.05

Por lo tanto, se puede tener una confianza de 95 % de que una muestra aleatoria de tamao 138
proporcionar una estimacin de la media aritmtica de la muestra que ser diferente de la media
aritmtica de la poblacin en una cantidad menor que 0.05.
EJEMPLO: La desviacin tpica de la altura de los habitantes de un pas es de 8 cm. Calcular el
tamao mnimo que ha de tener una muestra de habitantes de dicho pas para que el error cometido al
estimar la altura media sea inferior a 1 cm. con un nivel de confianza del 90%.

Z 2 *
SOLUCIN: Se aplica la formula para calcular el tamao de la muestra n
e

Z 2 1,645 de acuerdo con la tabla; e =1; 8 , entonces

, donde

(13.16) 2
(1,645)(8)
n
173.

1

12
Por lo tanto, se puede tener una confianza de 90 % de que una muestra aleatoria de tamao 173
proporcionar una estimacin de la media aritmtica de la muestra que ser diferente de la media
aritmtica de la poblacin de ese pas en una cantidad menor que 1 cm.

14

Para estimar se debe utilizar el desvo estndar muestral corregido as: S

( xi X ) 2 ,

ya que
n 1
segn se ha visto, es un estimador insesgado del correspondiente parmetro poblacional .
S
Reemplazando en la variable tipificada
por S X
resulta el siguiente teorema:
n
Intervalo de Confianza de Muestras Pequeas para ; con desconocida
Si X y S son la media y la desviacin estndar de una muestra aleatoria de tamao n < 30, tomada
de una poblacin aproximadamente normal con varianza desconocida 2 , un intervalo de confianza
S
S
, donde t 2 es el valor
X t 2
(1 )100% para viene expresada por, X t 2
n
n
t con v = n 1 grados de libertad, que delimitan un rea de x / 2 a su derecha.
Por lo tanto:
P [ X t 2

S
n

X t 2

S
n

] 1

Dada la distribucin del estadstico y el nivel de confianza, se tiene la siguiente igualdad probabilstica:

P t 2
t 2 1 , donde
S

n
verificando P(T t 2 ) 2.

t 2 es el valor critico dela variable T de Student

La expresin anterior es equivalente a: P( X t 2

S
n

X t 2

a que con una probabilidad 1- el intervalo aleatorio ( X t 2

S
n

) 1 que hace referencia

, X t 2

) contendr el valor
n
n
medio . El intervalo es aleatorio ya que sus extremos se determinan a partir de los estimadores media
muestral y desviacin tpica muestral, tratndose de variables aleatorias. La probabilidad a que se
refiere dicho intervalo aleatorio, puede interpretarse de manera informal pero quizs ms clara: "Si
15

consideramos todas las muestras distintas de tamao n que puedan ser extradas de la poblacin X, y
con las observaciones de cada una construimos los correspondientes intervalos, segn la estructura
anterior, el (1- de estos intervalos contendrn el parmetro "
Por tanto, si extraemos una muestra de tamao n y con los datos u observaciones, x1, x2 ,..., xn ,
calculamos los extremos del intervalo, dispondremos del concreto intervalo de confianza para el
S
S
parmetro ( X t 2
, X t 2
) que, en funcin de la interpretacin informal anterior,
n
n
contendr dicho parmetro con una confianza (1-
Observacin: el nivel de confianza establece en alguna medida la longitud del correspondiente
intervalo de confianza. Aumentando el nivel de confianza (mayor certeza), aumenta la longitud
(menor precisin).
Figura: La distribucin de Student tiene las mismas
propiedades de simetra que la normal tipificada

Ejemplo 2: Una muestra de 15 pollos tomadas al azar en un galpn con 5000 pollos, (que elabora
alimentos balanceados), permiti establecer un aumento de peso promedio de 90 g por semana y por
pollo, y un desvo tpico de 10 g. Se busca estimar el incremento de peso promedio para los 5000 pollos
del establecimiento con un intervalo de confianza del 90%.
Respuesta:
X = aumento de peso por ave
n = 15;

= 90g; S = 10 g.

Por tabla:

t 2 1,761
X t 2

S
n

y el intervalo resultante ser:

90 1,761

10
15

90 4,55 (85,5;..94,6)

Interpretando este resultado, se dice que el aumento de peso por ave por semana en el establecimiento
est entre 85,5 y 94,6 gramos, con un 90% de confianza.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
ESTIMACIN DE LA DIFERENCIA DE DOS MEDIAS
CASO 1: Poblaciones normales y 1 y 2 con 1 y 2 conocidos.
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y 22 respectivamente, un
estimador puntual de la diferencia entre 1 y 2 esta dado por el estadstico X 1 X 2 . Por lo cual,
1 2 , se seleccionaran dos muestras aleatorias
para obtener una estimacin puntual de
16

independientes, una de cada poblacin, de tamao n1 y n2 , y se calculara la diferencia X 1 X 2 de las


medias maestrales.
Si la seleccin de las muestras se realizaron independientemente a partir de poblaciones normales o en
caso contrario, n1 y n2 son mayores que 30, se puede establecer un intervalo de confianza para
1 2 considerando la distribucin muestral de X 1 X 2 . De acuerdo con este planteamiento puede
esperarse que la distribucin muestral de X 1 X 2 tenga una distribucin aparentemente normal con

2 2
. De acuerdo con
media X X 1 2 y desviacin estndar X X 1 2
n1
n2
1
2
1
2

este planteamiento se puede afirmar con una probabilidad de 1 que la variable normal estndar es:

( X 1 X 2 ) ( 1 2 )

y caer entre Z 2 y Z 2 , entonces , P(Z 2 Z Z 2 ) 1

12 22

n1
n2

y ahora sustituyendo Z por su valor, se expresa en forma equivalente que

( X 1 X 2 ) ( 1 2 )

1
P Z 2

2
2
1 2

n1
n1

Intervalo de Confianza para 1 2; con 2 1 y 2 2Conocidas


Si X 1 y X 2 son las medias de muestras aleatorias independientes del tamao de n 1 y n2 a partir de
poblaciones con varianzas conocidas 12 .. y.. 22 , respectivamente, un intervalo de confianza de
(1 )100% para 1 2 esta dada por la formula matemtica siguiente:

( X 1 X 2 ) Z 2

12

2
2 2
2 1 2 ( X 1 X 2 ) Z 2 1 2 , donde Z 2 es el valor Z
n1 n2
n1 n2

que delimita un rea de 2 a su derecha.


En forma general se tiene:

( X 1 X 2 ) Z 2

12

2 .
n1 n2
2

Observacin: En la frmula tambin puede utilizarse 2 1


X 2 X 1 en lugar de X 1 X 2 .

y en ese caso debe considerarse

El grado de confianza es exacto cuando se seleccionan muestras a partir de poblaciones normales.


Cuando las poblaciones no son normales, se obtienen un intervalo de confianza aproximado muy
aceptable cuando n1..y..n2 30 .Cuando se desconocen 12 y 22 y las muestras son suficientemente
grandes, se puede reemplazar 12 por
intervalo de confianza.

S12 y 22 ... por...S 22 sin que se afecte en forma alguna el

Ejemplo 3: Al determinar la superficie en miles de hectreas de las explotaciones agrcola-ganaderas de


cierta zona, una muestra de 40 explotaciones dio una superficie media de 900 ha, con una desviacin
tpica de 300 ha. En otra zona, al muestrear tambin 40 explotaciones, la superficie media fue de 600
ha con una desviacin tpica de 150 ha. Suponiendo que en ambas zonas la variable "superficie en ha
por explotacin" se distribuye normalmente, estimar por un intervalo de confianza del 90%, la
diferencia entre las superficies medias de las explotaciones de ambas zonas.

17

Respuesta:
X1 = superficie de cada explotacin agropecuaria de la primera zona
X2 = superficie de cada explotacin agropecuaria de la segunda zona
, n = 40; S12 300.., S 22 150 , por ser una muestra grande se

puede remplazar S 2 .. por.. 2 sin que se afecte el intervalo de confianza.


Por tabla:

Z 2 1,645 Luego aplicando la formula se tiene:

300 2 150 2
IC0.90 (900 600) 1,645

IC0.90 300 1,645 x53,033 IC0.90 300 87.24.


40
40
Entonces, IC0.90 = (212,8; 387,2)
Interpretando este resultado, se puede afirmar que la diferencia entre las superficies medias de las
explotaciones agrcola-ganaderas de ambas zonas, se encuentra entre 212,8 y 387,2 ha, con un 90% de
confianza.
EJEMPLO 4. Cincuenta alumnas y setenta y cinco alumnos del IUJAA presentan una prueba de
Estadstica. Las muchachas obtuvieron una calificacin promedio de 76 puntos, con una desviacin
tpica de 6, mientras que los muchachos lograron un promedio de 82, con una desviacin estndar de
8. Encuentre el intervalo de confianza de 96 % para la diferencia de 1 2 , donde 1 es la
puntuacin media de todos los alumnos y 2 es la puntuacin promedio de todas las alumnas que
presentaron esa prueba.
SOLUCIN: La estimacin puntual de 1 2 es

X1 X 2 82 76 6. Puesto que n1...y...n2


son grandes, se puede sustituir 1.. por..S1 8.. y.. 2.. por..S 2 6 . Por tabla Z 2 2.05 , por lo tanto,
sustituyendo en la formula estos datos, el intervalo de confianza de 96 % es:

( X 1 X 2 ) Z 2

6 2.05

12
n1

22
n2

, ( X 1 X 2 ) 6.., 12 8,..n1 75,.. 22 6,..n2 50. .

64 36

6 2.05 x1,254 6 2.57 (3.43,..8.57) , luego el intervalo buscado es:


75 50

(3.43; 8.57), o tambin,

3.43 1 2 8.57
DISTRIBUCIN DEL MUESTREO DE PROPORCIONES
Supongamos que una poblacin es infinita y que la probabilidad de ocurrencia de un suceso (su xito)
es p, mientras la probabilidad de que no ocurra es q =1 p. Por ejemplo, la poblacin puede ser la de
todas las posibles tiradas de una moneda, en la que la probabilidad del suceso <<cara>> es p = .
Consideremos todas las posibles muestras de tamao N de tal poblacin, y para cada una de ellas
determinemos la proporcin de xitos P. En el caso de una moneda, P sera la proporcin de caras en
N tiradas. Obtenemos as una distribucin de muestreo de proporciones cuya media p y cuya
desviacin tpica p viene dada por

p p

pq

p(1 p)
n

Para valores grandes de N (N30), la distribucin de muestreo est, muy aproximadamente,


normalmente distribuida, Ntese que la poblacin est binomialmente distribuida. Las ecuaciones
anteriores son vlidas tambin para una poblacin en la que se hace muestreo con reposicin. Para
18

poblaciones finitas en que se haga muestreo sin reposicin, dichas ecuaciones quedan sustituidas por
y

Intervalo de confianza para p, a partir de una muestra grande

Si p Es la proporcin de xito en una muestra aleatoria de tamao n, y q 1 p , un intervalo de


confianza aproximado de (1 )100% para el parmetro binomial p esta dado por la siguiente
formula matemtica:

pq
pq

, donde
p p Z 2
n
n
general la formula se puede expresar as:

p Z 2

p Z 2

Z 2 es el valor de

x / 2 a su derecha. En forma

pq
.
n

La proporcin p de la muestra se utiliza como estimacin de p en... pq porque se desconoce el


n

valor de p y se trata de la cantidad que se debe estimar. Para estar seguro de su confiabilidad, se

requiere que los productos np... y...nq sean mayores o iguales a 5.


EJEMPLO: En una muestra aleatoria de n = 500 familias propietarias de equipos de televisin en la
ciudad de El Tigre se encontr que x = 340 se suscribieron a Cables El Tigre. Obtenga un intervalo de
confianza de 95 % para estimar la proporcin real de familias en la ciudad mencionada que se
suscribieron a Cables El Tigre.

SOLUCIN: La estimacin puntual de


p..es.. p 340 / 500 0.68. Por tabla se sabe que

Z 2 1.96 ; p 0.68;...q 1 p 0.32, luego el intervalo de confianza aplicando la formula general


ser:

0.68 1.96

(0.68)(0.32)
0.68 1.96 x0.021 068 0.04 El .. int ervalo..de..confianza ..es :
500

(0.64 p 0.72)
Ejemplo: En una muestra de 100 pacientes sometidos a un cierto tratamiento se obtienen 80
curaciones. Calcular el intervalo de confianza al 95% de la eficacia del tratamiento.

80

p
0.80;..q 1 p q 0.20;..Z 2 1.96;..n 100 .
100
Intervalo de confianza al 95 %: 0.80 1.96

(0.80)(0.20)
0.80 1.96(0.04) 0.80 0.0784
100

Luego el intervalo de confianza al 95 % es:(0.72; 0.88)


Qu significa este intervalo? La verdadera proporcin de curaciones est comprendida entre,
aproximadamente,
72%
y
88%
con
un
95%
de
probabilidad.
Es suficientemente preciso? Habr que juzgarlo con criterios clnicos.
EJEMPLO: Una mquina fabrica piezas de precisin y en una caja de 200 piezas, recibida por un
cliente han aparecido 7 piezas defectuosas, a un nivel de confianza del 99% entre qu valores se puede
esperar que est la verdadera proporcin de piezas defectuosas fabricadas por la mquina?

19

SOLUCIN: Se calcula la proporcin de de piezas defectuosas en la muestra: p


0.035 , luego
200

pq

,
q 1 p q 0.965 , por tabla Z 2 2,575 , ahora aplicando la formula general p Z 2
n
se tiene:
(0.035)(0.965)
(0.035) 2,575(0.013) (0.035) (0.033) ,
200
buscado es: (0.002; 0.068).
(0.035) 2,575

luego

el

intervalo

Se deja al estudiante que calcule los intervalos para los niveles de confianza de 90% y 95%

Si p es valor central de un intervalo de confianza de (1 )100% , entonces p estimar sin error el

valor de p. Sin embargo, la mayora de las veces p no ser exactamente igual a p, y la estimacin

puntual ser errnea. El tamao de ese error ser la diferencia positiva que separa p y p , y puede

pq
tenerse una confianza de (1 )100% de que esa diferencia no exceder de Z 2
. De acuerdo
n
con este planteamiento se afirma que:

Si p se utiliza como una estimacin de p, puede tenerse una confianza de (1 )100% de que el error

pq
no exceder de Z 2
. Por lo tanto, se puede afirmar que:
n

Si p se utiliza como una estimacin de p, puede tenerse una confianza de (1 )100% de que el
error ser menor que una cantidad especificada e cuando el tamao de la muestra es

Z2 2 pq
aproximadamente de n
.
e2
EJEMPLO: En una muestra aleatoria de n = 500 familias propietarias de equipos de televisin en la
ciudad de El Tigre se encontr que x = 340 se suscribieron a Cables El Tigre. De qu tamao debe
ser la muestra necesaria, si se desea tener una confianza de 95 % de que la estimacin de p este dentro
de 0.02?
SOLUCIN: Se tomarn las 500 familias como una muestra preliminar que proporcionar una

Z2 2 pq
340
0.68 ; por tabla Z 2 1.96 ; e = 0.02. Luego se aplica la formula n
muestra p
500
e2

(1.96) 2 (0.68)(0.32)
(0.02) 2

2090.

Por lo tanto, si la estimacin de p se basa en una muestra aleatoria de tamao 2090, se puede tener una
confianza de 95 % de que la proporcin de la muestra no ser diferente de la proporcin real en ms de
0.02.
Algunas veces ser poco prctico obtener una estimacin de p que habr de utilizarse al determinar el
tamao de la muestra para un grado de confianza especificado. Si esto ocurre, se establece un lmite

superior para n, observando que pq p(1 p), lo cual debe ser por lo menos igual a , ya que p
debe estar entre 0 y 1. De acuerdo con este planteamiento se puede enunciar lo siguiente:

Si p se utiliza como una estimacin de p, se puede tener por lo menos una confianza de (1 )100%
de que el error no exceder de una cantidad especificada e cuando el tamao de la muestra sea

Z2 2

Z 2

4e 2 2e

20

EJEMPLO: En una muestra aleatoria de n = 500 familias propietarias de equipos de televisin en la


ciudad de El Tigre se encontr que x = 340 se suscribieron a Cables El Tigre. De qu tamao debe
ser la muestra necesaria, si se desea tener una confianza de 95 % de que la estimacin de p este dentro
de un 2 %?
SOLUCIN: En este caso a diferencia del ejemplo anterior, se supondr ahora que no se ha tomado
ninguna muestra preliminar para tener una estimacin de p. Por lo tanto, puede tenerse por lo menos 95
% de confianza de que la proporcin en la muestra no ser diferente de la proporcin verdadera en ms
2

Z 2
as:
de 0.02 si se elige una muestra de tamao aplicando la formula n

2e
Datos: Z 2 1.96,..e 0.02 y como se desconoce p esta se toma como p = 05.
2

1.96
2401.
n
(2)(0.02)
EJEMPLO: Imagina que queremos estimar con un error mximo del 3%, el porcentaje de audiencia de
un programa de TV, y queremos un 95% de confianza para nuestros resultados. No disponemos de
informacin previa sobre el posible valor de p. Cuntos teleespectadores debern ser encuestados?
SOLUCIN: Puesto que desconocemos p, tomaremos p = 0,5. Para un nivel de confianza del 95%
deberemos tomar Z 2 =1,96. Aplicando la formula

Z 2

2
e

, entonces se tiene:

1.96
2 3,8416 3,8416 1067
n
2(0.03) 2
4(0.0009) 0.0036

Con lo que n =1067. Tenemos pues un 95% de confianza en que el porcentaje que encontremos se
halle a menos de tres puntos porcentuales de la proporcin exacta.
Estimacin de la diferencia entre dos proporciones
Considrese el problema en el que se desea estimar la diferencia entre dos parmetros binomiales, p1 y
p2. Por ejemplo, se puede considerar que p1 es la proporcin de fumadores con cncer pulmonar y p2 la
de los que no fuman y tienen tambin cncer pulmonar. El problema, entonces, es estimar la diferencia
entre estas dos proporciones. En prmer lugar, se seleccionan muestras aleatorias independientes de
tamao n1 y n2 a partir de las dos poblaciones binomiales con medas n1 p1 y n2 p2, y variancia n1p1 q1 y
n2p2q2 , respectivamente; luego se determinan los nmeros x1 y x2 de personas de cada muestra con

padecimiento de cncer pulmonar y se forman las proporciones p x1 n1


y p x2 n2 . Un
estimador puntual de la diferencia entre las dos proporciones p1 p2 est dado por el estadstico

p1 p2 . As la diferencia de las proporciones de muestra, p1 p2 ser utilizada como estimacin

puntual de p1 p2 .
Un intervalo de confianza para p1 p 2 puede establecerse considerando la distribucin muestral de

p1 p2 . Se sabe que p1 y p 2 estn distribuidos aproximadamente en forma normal cada uno, con
medias p1 y p2 y variancias p1q1/n1 y p2q2 /n2, respectivamente. Eligiendo muestras independientes a

partir de las dos poblaciones, las variables p1 y p 2 sern independientes; luego, por la propiedad de

la distribucin normal, se concluye que p1 y p 2 est distribuida de modo aproximadamente normal,


pq
p q
con media p1 p 2 p1 p2 y varianza 2p p 1 1 2 2 , por lo tanto, se puede aseverar
1
2
n1
n2

21

P( z 2 Z z 2 ) 1

que

, donde

( p1 p 2 ) ( p1 p 2 )
Z
p1q1 p 2 q 2

n1 n2

despus de realizar las

simplificaciones algebraicas usuales, se reemplazan p1, p2, q1, . y.q2 en el radical por sus estimaciones

p1 x1 n1 ; p2 x2 n2 , q1 1 p1. y..q2 1 p2. Siempre que




p1q1 p 2 q 2

mayores o iguales a 5, obtenindose


.
n1
n2

n1 p1, n1q1, n2 p2,.y.n2 q2 sean todos

Intervalo de Confianza para p1 p2, a Partir de Muestras Grandes


Si p1 y p2 son las proporciones de xitos en muestras aleatorias de tamao n 1 y n2 respectivamente, y

adems q1 1 p1 y q2 1 p2 , entonces un intervalo de confianza p 1 p2 , esta dado la


formula:

( p1 p2 ) Z x 2



p1q1 p2 q2

p1 p2 ( p1 p2 ) Z x 2
n1
n2



p1q1 p2 q2

, donde
n1
n2

Z x 2 es el

valor que delimita un rea de x 2 a su derecha.


EJEMPLOS: Un fabricante de insecticida en presentacin aerosol desea comparar desea comparar dos
productos nuevos, A y B. En el experimento se emplean dos habitaciones del mismo tamao, cada una
con 1000 mosquitos. En uno de los cuartos se roca el insecticida A y en el otro se roca el insecticida
B en igual cantidad. Despus del experimento se obtiene un total de 825 y 760 mosquitos muertos por
accin de los insecticidas A y B respectivamente. Se desea estimar la diferencia de la proporcin de
xito para los dos insecticidas cuando se usan en condiciones similares a las experimentadas. Resuelva
el caso.

825 760

( p1 p2

0.065 . Por tabla


1000 1000
825
760

Z x 2 1.96 , p1
0.825,..q1 0.175;.. p2
0.76;..q2 0.24;..n 1000
1000
1000

SOLUCIN: El estimador puntual de (p1 p2) es

El intervalo de confianza del 95 % es:

(0.825)(0.175) (0.76)(0.24)

( p1 p2 ) 1.96

(0.065) 1.96(0.018) (0.065) (0.035)


1000
1000
El intervalo resultante es: 0.03 p1 p2 0.1 .
Por lo tanto se estima que la diferencia ( p1 p2 ) de proporciones de xito esta entre 0.03 y 0.100. Es
decir, se estima que p1 excede de p2 por al menos 0.03 y a lo ms por 0.100, entonces se puede tener
buena confianza en esta estimacin.
CONCEPTOS BSICOS

Estimacin: valor especfico de un estimador, calculado en base a una muestra dada.

Estimacin de intervalo: intervalo de valores utilizado para estimar un parmetro de poblacin


desconocido.

Estimacin de parmetros: Aproximacin del valor de parmetros poblacionales


desconocidos mediante el empleo de estadsticos muestrales.

Estimacin puntual: un solo nmero que se utiliza para estimar un parmetro de poblacin
desconocido.

Estimador: estadstico de muestra utilizada para estimar un parmetro de poblacin.


Conceptualmente es una variable aleatoria.
22

Estimador coherente: estimador que produce valores que se acercan ms al parmetro de la


poblacin conforme aumenta el tamao de la muestra.

Estimador eficiente: estimador con un menor error estndar que algn otro estimador del
parmetro de la poblacin, esto es, cuanto ms pequeo sea el error estndar de un estimador,
ms eficiente ser ese estimador.

Estimador imparcial: estimador de un parmetro de poblacin que, en promedio, asume


valores por encima del parmetro de la poblacin con la misma frecuencia, y al mismo grado,
con que tiende a tomarlos por debajo del parmetro de la poblacin.

Estimador suficiente: estimador que utiliza toda la informacin disponible en los datos
correspondientes a un parmetro.

Intervalo de confianza: intervalo de valores que tiene designada una probabilidad de que
incluya el valor real del parmetro de la poblacin.

Lmites de confianza: lmites inferior y superior de un intervalo de confianza.

Nivel de confianza: probabilidad que los estadsticos asocian con una estimacin de intervalo
de un parmetro de poblacin, sta indica qu tan seguros estn de que la estimacin de
intervalo incluir el parmetro de la poblacin. Probabilidad, designada de antemano, de que un
intervalo de confianza incluya al valor del parmetro desconocido.

Propiedades de un buen estimador: caractersticas deseables de un estimador, para lograr la


mejor aproximacin posible de un parmetro poblacional.

23