You are on page 1of 7

3.

ESTIMACIN DE PARMETROS E INTERVALOS DE CONFIANZA

3.1 Definicin de estimador y estimacin

El uso principal de la inferencia estadstica en la investigacin emprica, es lograr conocimiento de una gran clase de unidades estadsticas (seres humanos, plantas, parcelas de tierra), de un nmero relativamente pequeo de los mismos elementos. Los mtodos de inferencia estadstica emplean el razonamiento inductivo, razonamiento de lo particular a lo general y de lo observado a lo no observado. Cualquier coleccin o agregacin grande de cosas que deseamos estudiar o de las cuales deseamos hacer inferencias, se llama poblacin. El trmino poblacin tiene ms significado cuando se lo junta con la definicin de muestra de una poblacin: una muestra es una parte o subconjunto de una poblacin. Una muestra de n elementos de la poblacin de N elementos, debera ser seleccionada de forma tal que las caractersticas de la poblacin puedan ser estimados con un margen de error conocido. Los valores de varias medidas descriptivas calculadas para las poblaciones, se llaman parmetros. Para las muestras, estas mismas medidas descriptivas se llaman estadsticas. Un parmetro describe una poblacin de la misma manera que una estadstica describe a una muestra. Es costumbre simbolizar las estadsticas con letras romanas y los parmetros con letras griegas. Estadstica Media aritmtica Variancia Desvo estndar Coeficiente correlacin S S de R Parmetro m s2 s r

Una estadstica calculada a partir de una muestra es un estimador del parmetro en la poblacin. Una estimacin es alguna funcin de los resultados de una muestra que produce un valor, llamado estimador. El estimador da alguna informacin respecto al parmetro. Por ejemplo, la media de la muestra, es un estimador de la media m en la poblacin. Las poblaciones pueden ser infinitas o finitas. ,

Para la mayora de los propsitos de investigacin, se supone que las poblaciones son infinitas, no finitas, en tamao, las cuales son algo artificial o imaginario. Una poblacin finita puede ser extremadamente grande. Es posible concebir un proceso de conteo de los elementos de la poblacin, el cual puede ser computado; luego la poblacin es tcnicamente finita. Afortunadamente no es necesario crear problemas en cuanto a la distincin entre poblaciones infinitas y finitas. El mtodo usado para seleccionar la muestra es muy importante al juzgar la validez de la inferencia que se hace de la nuestra a la poblacin. Para que una muestra sirva adecuadamente como base para obtener estimadores de parmetros poblacionales, debe ser representativa de la poblacin. El muestreo al azar de una poblacin producir muestras que "a la larga" son representativas de la poblacin. Si una muestra se extrae aleatoriamente, es representativa de la poblacin en todos los aspectos, esto es, la estadstica diferir del parmetro solo por azar. La habilidad para estimar el grado de error debido al azar (error de muestreo), es un rasgo importante de una muestra al azar. En cuanto a la definicin de una estimacin es un valor especfico observado de una estadstica. Hacemos una estimacin si tomamos una muestra y calculamos el valor que toma nuestro estimador en esa muestra.

3.2 Propiedades de los estimadores

Para poder utilizar la informacin que se tenga de la mejor manera posible, se necesita identificar las estadsticas que sean buenos estimadores, cuyas propiedades son: A) Imparcialidad. Esta es una propiedad deseable de un buen estimador. El termino imparcialidad se refiere al hecho de que una media de muestra es un estimador no sesgado de una media de poblacin por que la media de la distribucin de muestreo de las medias de muestras tomadas de la misma poblacin es igual a la media de la poblacin misma. Podemos decir que una estadstica es un estimador imparcial (o no sesgado) si, en promedio, tiende a tomar valores que estn por encima del parmetro de la poblacin que se esta estimando con la misma frecuencia y la misma extensin con la que se tiende asumir valores por debajo del parmetro de poblacin que se esta estimando. B) Eficiencia. Si las distribuciones de muestreo de dos estadsticos tienen la misma media (o esperanza), el de menor varianza se llama un estimador eficiente de la media, mientras que el otro se llama un estimador ineficiente, respectivamente.

Si consideramos todos los posibles estadsticos cuyas distribuciones de muestreo tiene la misma media, aquel de varianza mnima se llama a veces, el estimador de mxima eficiencia, sea el mejor estimador. Las distribuciones de muestreo de media y mediana tienen ambas la misma media, a saber, la media de la poblacin. Sin embargo, la varianza de la distribucin de muestreo de medias es menor que la varianza de la distribucin de muestreo de medianas. Por tanto, la media muestral da una estimacin eficiente de la media de la poblacin, mientras la mediana de la muestra da una estimacin ineficiente de ella. De todos los estadsticos que estiman la media de la poblacin, la media muestral proporciona la mejor (la ms eficiente) estimacin. En la prctica, estimaciones ineficientes se usan con frecuencia a causa de la relativa sencillez con que se obtienen algunas de ellas. C) Coherencia Una estadstica es un estimador coherente de un parmetro de la poblacin si al aumentar el tamao de la muestra, se tiene casi la certeza de que el valor de la estadstica se aproxima bastante al valor del parmetro de la poblacin. Si un estimador es coherente, se vuelve ms confiable si tenemos tamaos de muestras ms grandes. Si usted se pregunta acerca de la posibilidad de aumentar el tamao de la muestra para obtener mas informacin sobre un parmetro de poblacin, encuentre primero si su estadstica es un estimador coherente o no. Si no, usted desperdiciar tiempo y dinero al tomar las muestras ms grandes. D) Suficiencia Un estimador es suficientemente si utiliza una cantidad de la informacin contenida en la muestra que ningn otro estimador podra extraer informacin adicional de la muestra sobre el parmetro de la poblacin que se esta estimando. En estos criterios presentados con anticipacin nos podemos dar cuenta del cuidado que debemos tener en escoger un buen estimador. Una estadstica de muestra dada no siempre es el mejor estimador de su parmetro de poblacin correspondiente. Considere una poblacin distribuida de manera simtrica, en la que los valores de la mediana y de la media coinciden. En este caso, la media de la muestra seria un estimador imparcial de la poblacin debido a que asumira valores que en promedio serian iguales a la mediana de la poblacin. Tambin, la media de la muestra seria un estimador consistente de la mediana de la poblacin puesto que, conforme aumenta el tamao de la muestra, el valor de la media de la muestra tendr a acercarse bastante a la mediana de la poblacin. Y a la media de la muestra seria un estimador ms eficiente de la mediana de la poblacin que a la mediana de la muestra misma, ya que en muestras grandes, la media de la muestra tiene una desviacin estndar menor que la mediana de la muestra. Al mismo tiempo, la mediana de la muestra de una poblacin distribuida simtricamente seria un estimador imparcial y consistente de la media de la poblacin, pero no el mas eficiente estimador por que en muestras grandes su error estndar es mayor que el de la media de la muestra.

3.3 Estimacin de media, varianza y proporciones

Intervalo de confianza Un rango de valores que se construye a partir de datos de la muestra de modo que el parmetro ocurre dentro de dicho rango con una probabilidad especfica. La probabilidad especfica se conoce como nivel de confianza. Es decir, una estimacin de un parmetro de la poblacin dada por dos nmeros, entre los cuales se puede considerar encajado al parmetro, se llama una estimacin de intervalo del parmetro. En la prctica se obtiene solamente una muestra y se calcula con ella un intervalo de confianza dicho intervalo contiene o no contiene a , no es razonable asignar una probabilidad a este evento. Estimar una media: Si deseamos estimar una media: debemos saber: 1. El nivel de confianza o seguridad (1-a ). El nivel de confianza prefijado da lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58. 2. La precisin con que se desea estimar el parmetro (2 * d es la amplitud del intervalo de confianza). 3. Una idea de la varianza S2 de la distribucin de la variable cuantitativa que se supone existe en la poblacin. Estimador de varianza Otra propiedad importante de un estimador es su varianza (o su raz cuadrada, la desviacin estndar). La importancia de la desviacin estndar es que nos permite darle un sentido numrico a la cercana del valor del estimador a su valor esperado. Entre menor sea la desviacin estndar (o la varianza) de un estimador, ser ms probable que su valor en una muestra especfica se encuentre mas cerca del valor esperado. Para aclarar esto, considere dos estimadores T1 y T2, suponga que ambos son instigados y suponga que la varianza de T1 es menor que la de T2 Qu quiere decir esto? Simplemente que en un entorno fijo del valor del parmetro, los valores de T1 son ms probables que los de T2. O sea que vamos a encontrar a T1 ms cerca del valor del parmetro que a T2. Esto hace que nuestras preferencias estn con T1. Cuando un estimador tiene una varianza menor que otro decimos que el estimador es ms eficiente. Estimar una proporcin: Si deseamos estimar una proporcin, debemos saber: 1. El nivel de confianza o seguridad (1-a ). El nivel de confianza prefijado da lugar a un coeficiente (Za). Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58.

2 .La precisin que deseamos para nuestro estudio. 3 .Una idea del valor aproximado del parmetro que queremos medir (en este caso una proporcin). Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha informacin utilizaremos el valor p = 0.5 (50%).

3.4

Intervalo de confianza para la media y para proporciones

. Una interpretacin correcta de la confianza de 95% es decir que si el experimento donde A est definido se realiza una y otra vez, a largo plazo A ocurrir 95% de las veces. Para nuestro caso, el 95% de los intervalos de confianza calculados contendrn a . Notar que los intervalos tienen el mismo tamao. Se puede observar que de los 11 intervalos calculados slo el tercero y el ltimo no contienen el valor de .

VALOR VERDADERO DE LA

SE HACE NOTAR QUE LOS INTERVALOS TIENEN EL MISMO TAMAO

Se puede observar que de los 11 intervalos calculados solo el tercero y el ltimo no contienen el valor de . Una estimacin de un parmetro de la poblacin dada por un solo nmero se llama una estimacin de punto del parmetro. No obstante, un estimador puntual slo refiere una parte de la historia. Si bien se espera que el estimador puntual est prximo al parmetro de la poblacin, se deseara expresar qu tan cerca est. Un intervalo de confianza sirve a este propsito. Intervalo de confianza: Un rango de valores que se construye a partir de datos de la muestra de modo que el parmetro ocurre dentro de dicho rango con una probabilidad especfica se conoce como nivel de confianza.

Es decir, una estimacin de un parmetro de la poblacin dada por dos nmeros entre los cuales se puede considerar encajado al parmetro, se llama una estimacin de intervalo del parmetro. Las estimaciones de intervalo indican la precisin de una estimacin y son, por tanto, preferibles a las estimaciones puntuales. Por ejemplo: si decimos que el porcentaje de productos defectuosos que produce una mquina es del 6%, entonces el nivel se ha medido en 0.06 y estamos dando una estimacin de punto. Por otra parte, si decimos que el porcentaje es 0.050.03 m (o sea, que esta entre 2% y 8%), estamos dando una estimacin de intervalo. El margen de error (o la precisin) de una estimacin nos informa de su fiabilidad. En estadstica, numerosos problemas estn relacionados con la estimacin de la media o la desviacin estndar de una poblacin dada a partir del estudio de una muestra de tamao n. As, por ejemplo:  una empresa le puede interesar el nmero promedio de piezas defectuosas A producidas por una cierta mquina.  un ingeniero especialista en vehculos le puede interesar la variabilidad en A el funcionamiento de un tipo vehculo. En las secciones anteriores se vio que si se supone que cada muestra de tamao n tiene la misma probabilidad de ser seleccionada, entonces la media de la distribucin de las medias de la muestra es la misma que la de la poblacin original, Qx = Q. An ms, para poblaciones suficientemente grandes, o para muestreos con remplaz, la desviacin estndar de la distribucin de las medias de la muestra,Wx , est relacionada con la desviacin estndar de la poblacin Wpor la ecuacin. Si en una aplicacin particular fuera prctico seleccionar todas las posibles muestras de tamao n, para determinar la media de cada una de ellas y, despus, calcular la media y la desviacin estndar de la distrib ucin de las medias de las muestras, las frmulas anteriores permitiran calcular Qy Wdirectamente. Por lo general, este procedimiento no es prctico. Lo que comnmente se hace es no estudiar todas las muestras de tamao n sino nicamente una de ellas. La media x y la desviacin estndar s de esa muestra nicamente se toman como estimaciones de Qy W, es decir, de la media y la desviacin estndar que corresponden a la poblacin original.

3.5 Determinacin del tamao de la muestra


La eleccin del tamao de una muestra apropiada es una pregunta frecuente al disear un estudio estadstico Cuntos objetos deben tomarse en la muestra? Si la muestra es demasiado grande, se desperdicia dinero al obtener los datos. Si la muestra es demasiado pequea, la conclusin obtenida ser insegura. El tamao necesario de la muestra depende de tres factores: 1. El nivel de confianza deseado Los niveles de confianza ms comnmente usados son 95% y 99%, pero se puede usar cualquier nivel entre 0 y 100%. El de 95% corresponde al valor z = 1.96 y el 99% al valor z = 2.58. Entre mayor sea el nivel de confianza elegido, mayor ser el tamao de la muestra correspondiente (Otros valores para 90% z = 1.645 y 70% z = 1.036). 2. El margen de error que el investigador est dispuesto a tolerar ste error corresponde a la mitad de la amplitud del intervalo de confianza. Si el error permitido es pequeo, se necesitar una muestra grande. Si el error permitido es grande, esto permitir una muestra ms pequea. 3. La variabilidad de la poblacin que se estudia. Si la poblacin est muy dispersa, se requerir una muestra grande. Por otro lado, si la poblacin est concentrada (es homognea) el tamao de muestra requerido ser ms pequeo. Ser necesario usar una estimacin de la desviacin estndar poblacional.