Estad

1.
Resumen Captulo 1 del Libro Estadstica Descriptiva: Puede definirse como aquellos mtodos que incluyen la recol eccin, presentacin y caraterizacin de un conjunto de datos con el fin de describir apropiadamente las diversas caractersticas de ese conjunto. Estadstica Inferencial: Puede definirse como aquellos mtodos que hacen posible la estimacin de una caracterstica de una poblacin o la toma de una decisin referente a una poblacin basndose slo en los resultados de una muestra. Para aclara este concepto se necesitan de las siguientes definiciones: Poblacin: es la totalidad de elementos o cosas bajo consideracin. Muestra: Es la porcin de la poblacin que se selecciona para su anlisis. Parmetro: Es una medida de resumen que se calcula para describir una caracterstica de toda una poblacin. Estadstica: Es una medida que se calcula para describir una caracterstica de una s ola muestra de la poblacin. Podemos encontrar dos tipos de estudios estadsticos que se emprenden: los estudio s enumerativos y los estudios analticos. Los estudios enumerativos involucran la toma de decisiones respecto a una poblac in y/o sus caractersticas. Los estudios analticos involucran realizar alguna actividad sobre un proceso para mejorar el desempeo en el futuro. La atencin de un estudio analtico est puesta sobr e la prediccin del comportamiento futuro de un proceso y sobre la comprensin y per feccionamiento de ese proceso. En un estudio analtico no existe un universo ident ificable, como sucede en un estudio enumerativo y en consecuencia tampoco hay un marco. 2. Resumen Captulo 2 del Libro Recoleccin de Datos La necesidad de datos: los datos se necesitan para: Proporcionar la introduccin imprescindible para un estudio de investigacin. Medir el desempeo en un servicio o proceso de produccin en curso. Ayudar en la formulacin de cursos alternativos de accin en un proceso de toma de d ecisiones. Satisfacer nuestra curiosidad. Que es un dato? Los datos pueden concebirse como informacin numrica necesaria para ayudarnos a tom ar una decisin con ms bases en una situacin particular. Cmo obtenemos los datos? Existen muchos mtodos mediante los cuales podemos obtener los datos necesarios. P rimero, podemos buscar datos ya publicados por fuentes gubernamentales, industri ales o individuales. Segundo, podemos disear un experimento. En tercer lugar, pod emos conducir un estudio. Cuarto, podemos hacer observaciones del comportamiento , actitudes u opiniones de los individuos en los que estamos interesados. Utilizacin de fuentes de datos publicadas Sin importar la fuente utilizada, se hace una distincin entre el recolector origi nal de los datos y la organizacin o individuos que compilan stos en tablas y diagr amas. El recolector de datos es la fuente primaria; el compilador de los datos e s la fuente secundaria. Diseo de un experimento En un experimento se ejerce control sobre el tratamiento de los dado a los parti cipantes. Conduccin de una encuesta Aqu no se ejerce ningn control sobre el comportamiento de la gente encuestada. Sim plemente se formulan preguntas respecto a sus opiniones, actitudes, comportamien to y otras caractersticas. Realizacin de un estudio observacional El investigador observa el comportamiento de inters directamente, por lo comn en s u entorno natural. La importancia de obtener buenos datos: GIGO GIGO: Entra Basura, sale basura. No importa el mtodo utilizado para obtener los d atos, si un estudio ha de ser til, si el desempeo debe controlarse apropiadamente o si el proceso de la toma de decisiones debe ampliarse, los datos recabados deb
en ser vlidos: es decir, las respuestas correctas deben valorarse de manera que s e obtengan mediciones significativas. Obtencin de datos mediante investigacin de encuesta Tipos de datos Existen bsicamente dos tipos de variables aleatorias que producen dos tipos de da tos: categricas y numricas. Las variables aleatorias categricas producen respuestas categricas, mientras que las variables numricas producen respuestas numricas. Las variables numricas pueden considerarse como discretas o continuas. Los datos disc retos son respuestas numricas que surgen de un proceso de conteo, mientras que lo s datos continuos son respuestas numricas que surgen de un proceso de medicin. La necesidad de definiciones operacionales. Una definicin operacional proporciona un significado a un concepto o variable que puede comunicarse a otros individuo s. Es algo que tiene el mismo significado ayer, hoy y maana para todos los indivi duos. Diseo del cuestionario El objetivo de un cuestionario es permitirnos recabar informacin significativa qu e nos ayude en el proceso de toma de decisiones. Seleccin de temas amplios - Longitud del cuestionario Los amplios temas de los cuestionarios deben enumerarse. Mientras ms largo sea el cuestionario, menor ser el cociente de respuesta. Por tanto, se deben evaluar cu idadosamente las preguntas. Las preguntas deben ser lo ms cortos posibles. Modo de Respuesta Existen tres modos mediante los cuales se realiza el trabajo de encuesta: la ent revista persona, telefnica y por medio del correo. La personal es la que tiene un a tasa de respuesta mayor, pero es ms costosa. Formulacin de preguntas Cada pregunta debe presentarse claramente en el menor nmero de palabras y cada pr egunta debe considerarse esencial para la encuesta. Adems, deben ser libres de am bigedades. Prueba del cuestionario Una vez analizadas los pros y contras de cada pregunta se debe realizar una prue ba piloto de manera que puedan examinarse en cuanto a claridad y longitud. Eleccin del tamao de muestra para la encuesta Existen tres razones para extraer una muestra. Antes que todo, por lo general ll eva demasiado tiempo realizar un censo completo. En segundo lugar, es demasiado costoso hacer un censo completo. Tercero, es demasiado molesto e ineficiente obt ener un conteo completo de la poblacin objeto Seleccin de los sujetos respondientes: tipos de muestras Existen bsicamente dos tipos de muestras: las muestra no probabilstica y la muestr a de probabilidad. Una muestra de probabilidad es aquella en la que los sujetos de la muestra se el igen sobre la base de probabilidades conocidas. En una muestra aleatoria simple cada individuo o elemento tiene la misma oportun idad de seleccin que cualquier otro, y la seleccin de un individuo o elemento part icular no afecta la probabilidad de que se elija cualquier otro. Extraccin de la muestra aleatoria simple La clave de la seleccin de muestras apropiada es obtener y mantener una lista act ualizada de todos los individuos o elementos de los cuales se extraer la muestra. Tal lista se conoce como el marco de la poblacin. Este listado de poblacin servir como la poblacin objetivo, de tal manera que si se extrajeran muchas muestrasde p robabilidades diferentes de tal lista, en el mejor de los casos cada muestra sera una representacin de la poblacin. - Muestreo con o sin reemplazo de poblaciones finitas Para seleccionar la muestra pueden usarse dos mtodos bsicos: con reemplazo o sin r eemplazo. Digamos que N representa la poblacin y n la muestra. Al extraer con ree mplazo la probabilidad de cualquier miembro de la poblacin de ser seleccionado en la primera extraccin es 1/N. La probabilidad de ser seleccionado en otra extracc in sigue siendo 1/N debido a que una vez registrado el dato, el individuo seguir f ormando parte de la poblacin. Sin embargo, al muestrear poblaciones humanas generalmente se considera ms apropi
ado tener una muestra de persona diferentes que permitir mediciones repetidas de la misma persona. La probabilidad en este caso es 1/N en la primera extraccin. L a probabilidad de que cualquier individuo no seleccionado previamente sea selecc ionado en la segunda extraccin es 1/N-1. La encuesta de la muestra El primer pasa para evaluar una encuesta es determinar si se bas en una muestra d e probabilidad o en una no probabilstico. Aun cuando las encuestas emplean mtodos de muestreo de probabilidad aleatorios, e stn sujetas a errores potenciales. Existen cuatro tipo de errores de encuesta: 1 - Error de cobertura o sesgo de seleccin. Este error resulta de la exclusin de c iertos sujetos del listado de poblacin, de tal manera que no tienen oportunidad d e ser seleccionados en la muestra. El error de cobertura provoca el sesgo de sel eccin. 2- Error de no-respuesta o sesgo de no-respuesta. El error de no-respuesta resul ta del fracaso de recolectar datos sobre todos los sujetos de la muestra. Y el e rror de no-respuesta da como resultado el sesgo de no-respuesta. 3- Error de Muestreo. Este error refleja la heterogeneidad o las diferencias de oportunidad de muestra a muestra basndose en la probabilidad de los sujetos que e stn siendo seleccionados en las muestras particulares. El error de muestreo puede reducirse tomando tamaos de muestra mayores, aunque esto incrementar el costo de aplicacin de la encuesta. 4- Error de Medicin. Este error se refiere a inexactitudes en las respuestas regi stradas que ocurren debido a una mala formulacin de las preguntas, el efecto de u n entrevistados sobre el encuestado o el esfuerzo hecho por el encuestado. Organizacin y Resumen de Datos Organizacion, Resumen Y Presentacion De Datos Estadisticos Conceptos que deben reforzarse POBLACION: es el conjunto formado por todas las unidades elementales que proporc ionarn las mediciones de inters. Pueden ser personas, cosas, objetos abstractos. CENSO: Cuando se estudia la totalidad de las unidades elementales que componen l a poblacin. Desventaja: errores de observacin. Ej.: omisiones, duplicaciones, no-ubicacin (no medibles) del encuestado, volumen de informacin MUESTRA: se estudia una parte representativa de la poblacin Desventaja: errores de observacin (no medibles) errores de estimacin (medible, cua ntificable) LOS DATOS ESTADISTICOS SON VARIABLES, SU RESULTADO VARIA DE UNA MEDICION A OTRA. Debido a ello a los datos estadsticos los denominamos VARIABLES. Segn se vio, las Variables se clasifican en: Categricas Ordinales o Nominales Y Numricas Discretas o Contnuas. Caso Sr. Jurez Problema: " Aumento en el ndice de rotacin de cobranzas". Poblacin: Todos los clientes que compran a crdito al seor Jurez en el local A o B. Supuestos: - Dos Locales A y B. Datos del ltimo mes. Muestra Local A: 60 clientes; Local B: 78 clientes. Hiptesis de Trabajo: Deudores del local A necesitan menos tiempo para pagar. Situacin econmica de los clientes peor nosotros > plazo de financiacin. Locales poseen precios > competencia. Mal sistema de cobros en cuenta corriente. Para Cada hiptesis se debe tomar una variable a analizar. Variable a Utilizar en nuestro Caso: " Cantidad de das transcurridos entre la con feccin de la factura y el efectivo cobro de la misma. Definiciones operacionales: N= Tamao de la poblacin. n= Tamao de la muestra. Yi = Variable a analizar El tamao de muestra es independiente del tamao de la poblacin. Distribucin de frecuencia:
fi: frecuencia absoluta. Fi: frecuencia absoluta acumulada. hi: frecuencia relativa ( cociente entre frecuencia absoluta y la muestra/poblac in ). Hi: frecuencia relativa acumulada. El 21,7 % de los clientes del local A pagan el da 20. En el local minorista hay p ocos que pagan los primeros das y pocos los que pagan el ltimo da. Para comparar se trabaja con frecuencias relativas (cuando los tamaos de muestra son distintos). 23/03/01 Prctico Ejercicio 2.35 - Pgina 49 n = 1425 Objetivo: " Medir el grado de satisfaccin de los clientes que compraron una video grabadora en los ltimos 12 meses. Poblacin: Todos los clientes que compraron una videograbadora en los ltimos 12 mes es. Preguntas cualitativas: Qu le pareci el producto? - Excelente. - Muy Bueno. - Bueno. - Malo. - Si. - No. Recomendara el Producto. Comprara nuestra marca o producto. Si. No. Preguntas Cuantitativas. Cuantas veces us el servicio tcnico? Ninguna. Una. Dos. Ms de dos. Diseo y funcionamiento. Califique de uno a diez Cuntas marcas analiz antes de decidir por Xenith? Cuntos productos Xenith posee Ud.? Ejercicio 3.8 - Pagina 61 b) Diagrama de Tallo y Hoja SPSS lo hace en forma automtica. Yi= Segundos que tarda un automvil de llegar de 0 a 60 Mph. Autos Alemanes Tallo Hoja 4 9 5 5 4 1 6 4 9 4 7 0 9 7 9 1
5 8 6 7 3 5 5 8 9 9 10 0 9 27/03/01 Construccin de Grficos Nombrar los ejes. Ttulo del grfico. Fuente de datos. Ejercicio 3.70 - Pagina 95 Yi fi hi Fi Hi 1,00 1 0,03 1 0,03 1,50 2 0,07 3 0,10 2,00 3 0,10 6 0,20 2,50 2 0,07 8 0,27 3,00 6 0,20 14 0,47 3,50 5 0,17 19 0,63 4,00 2 0,07 21 0,70 4,50
2 0,07 23 0,77 5,00 3 0,10 26 0,87 5,50 1 0,03 27 0,90 6,00 1 0,03 28 0,93 6,50 1 0,03 29 0,97 7,00 1 0,03 30 1,00 30 1,00 Yi = $ de cada manmetro. fi = cantidad de veces que se repite la variable. En este caso se supone que la variable es discreta. Construccin de Intervalos Intervalos sirve en especial para variables continuas Ry = Y max - Y min = Recorrido = Amplitud = Rango Ry = 7.5 - 1 = 6.5 Cantidad de intervalos 4 C= Amplitud del intervalo = Ry / Cantidad de intervalos = 6.5/4 = 1.625 C = Valor entero = 2 Ry* = c x cantidad de intervalos = 2 x 4 = 8 Yi-1 - Yi Yi fi hi 1 - 3 2 8 0.27 3 - 5 4 15 0.50 5 - 7 6 6 0.20 7 -9 8
1 0.03 30 1 Construccin del intervalo del Caso Jurez. R = 38 - 14 = 24 Cantidad de Intervalos = 7 Amplitud = Ry / c = 3.43 = 4 3. Resumen Captulo 3 del Libro Presentacin de datos numricos en tablas y diagramas Una distribucin de frecuencia es una tabla de resumen en la que los datos se disp onen en agrupamientos o categoras convenientemente establecidas de clases ordenad as numricamente. En esta forma las caractersticas ms importantes de los datos se aproximan muy fcilm ente, compensando as el hecho de que cuando los datos se agrupan de ese modo, la informacin inicial referente a las observaciones individuales de que antes se dis pona se pierde a travs del proceso de agrupamiento o condensacin. Al construir la tabla de frecuencia-distribucin, debe ponerse atencin a: Seleccionar el nmero apropiado de agrupamientos de clase para la tabla. Obtener un intervalo o ancho de clase de cada agrupamiento de clase. Establecer los lmites de cada agrupamiento de clase para evitar los traslapes. Seleccin del Nmero de Clases La distribucin de frecuencia debe tener al menos cinco agrupamiento de clase, per o no ms de 15. Si no hay suficientes agrupamientos de clase o si hay demasiados, se obtendr poca informacin. Obtencin de los intervalos de clase Ancho del intervalo Rango nmero de agrupamientos de clase deseado La principal ventaja de usar una de estas tablas de resumen es que las principal es caractersticas de los datos se hacen evidentes inmediatamente para el lector. La principal desventaja de tal tabla de resumen es que no podemos saber como se distribuyen los valores individuales dentro de un intervalo de clase particular sin tener acceso a los datos originales. El punto medio de la clase, sin embargo , es el valor usado para representar todos los datos resumidos en un intervalo p articular. El punto medio de una clase (o marca de clase) es el punto a la mitad de los lmit es de cada clase y es representativo de los datos de esa clase. Tabulacin de datos numricos: la distribucin de frecuencia relativa y distribucin de porcentaje La distribucin relativa de frecuencia se forma dividiendo las frecuencias de cada clase de distribucin de frecuencia entre el nmero total de observaciones. Entonce s puede formarse una distribucin de porcentaje multiplicando cada frecuencia rela tiva o proporcin entre 100. La distribucin de frecuencia relativa o la distribucin de porcentaje se vuelve ese ncial siempre que una serie de datos se compara con otra seria de datos, especia lmente si difiere el nmero de observaciones en cada serie de datos. Graficacin de datos numricos: el histograma y el polgono Histogramas Los histogramas son diagramas de barras verticales en los que se construyen barr as rectangulares en los lmites de cada clase. La variable aleatoria o fenmeno de i nters se despliega a lo largo del eje horizontal; el eje vertical representa el nm ero, proporcin o porcentaje de observaciones por intervalo de clase, dependiendo de si el histograma particular, es un histograma de frecuencia, un histograma de frecuencia relativa o histograma de porcentaje Al comparar dos o ms series de datos, ni los diagramas de tallo y hoja ni los his togramas pueden construirse en la misma grfica. Con respecto a estos ltimos, la so breposicin de barras verticales de uno en el otro ocasionara dificultades de inter pretacin; en estos casos se usan los polgonos. Polgonos El polgono de porcentaje se forma permitiendo que el punto medio de cada clase re
presente los datos de esa clase y luego conectando la sucesin de puntos medios co n sus respectivos porcentajes de clase. Distribuciones acumulativas y polgonos acumulativos Una tabla de distribucin de porcentaje acumulativo se construye registrando prime ro los lmites inferiores de cada clase a partir de la distribucin de porcentaje y luego insertando un lmite extra al final. Polgono de porcentaje acumulativo Para construir un polgono de porcentaje acumulativo (tambin llamado ojiva), el fenm eno se grafica en el eje horizontal, mientras que los porcentajes acumulativos s e grafican en el eje vertical. 4. Resumen Captulo 4 del Libro Resumen y descripcin de los datos numricos Propiedades de los datos numricos. Las tres mejores propiedades que describe una serie numrica de datos son: Tendencia central Variacin Forma Si estas mediciones se calculan a partir de una muestra, se denominan estadsticas , si se calculan a partir de los datos de una poblacin se denominan parmetros. Mediciones de tendencia Central La media aritmtica, es el promedio. Se calcula sumando todas las observaciones y luego dividiendo el total entre el nmero de elementos involucrados. La media acta como punto de equilibrio de tal forma que las observaciones menores compensan a las observaciones que son mayores. La media aritmtica se ve afectada en gran medida por valores extremos. La mediana. Es el valor medio de una secuencia ordenada de datos. Si no hay empa tes, la mitad de las observaciones sern menores y la otra mitad sern mayores. La m ediana no se ve afectada por valores extremos. Para calcular la mediana, primero se deben poner los datos en orden. Despus usamos la frmula del punto de posiciona miento. El clculo del valor de la media se ve afectado por el nmero de observaciones, no p or la magnitud de cualquier extremo. La moda. Es el valor de una serie de datos que aparece con ms frecuencia. La moda no se ve afectada por la ocurrencia de cualquier valor extremo. Cuartiles. Los cuartiles sonmediciones descriptivas que dividen los datos ordena dos en cuatro cuartos. Mediciones de la Variacin La variacin es la cantidad de dispersin o propagacin en los datos. El rango: es la diferencia entre la mayor y la menor observacin en una serie de d atos. El rango mide la propagacin total en la serie de datos. La debilidad del ra ngo es que no logra tomar en cuenta la forma en que los datos se distribuyen rea lmente entre el mayor y el menor valor. Sera impropio usar el rango como una medi cin cuando uno de o ambos componentes son observaciones extremas. El rango intercuartil: es la diferencia entre el tercer y primer cuartil. No se ve influida por valores extremos. La varianza y la desviacin estndar: a diferencia de las mediciones anteriores la v arianza y la desviacin estndar toman en cuenta como se distribuyen las observacion es. La Varianza de muestra es el promedio de las diferencias cuadradas entre cad a una de las observaciones de una serie de datos y la media. La desviacin estndar es simplemente la raz cuadrada de la varianza. La varianza y la desviacin miden la dispersin promedio alrededor de la media, es decir, como las observaciones mayor es fluctan por encima de sta y como las observaciones menores se distribuyen por d ebajo de sta. El Coeficiente de Variacin: es una medida relativa de variacin. Se expresa como po rcentaje antes que en trminos de las unidades de los datos particulares. Mide la dispersin en los datos relativa a la media. El coeficiente de variacin es til al comparar la variabilidad de dos o ms series de datos que se expresan en distintas unidades de medicin. Forma Para describir la forma slo necesitamos comparar la media y la mediana. Si estas
dos mediciones son iguales, por lo general podemos considerar que los datos son simtricos. Si la media excede a la mediana, los datos pueden describirse de sesgo positivo o sesgadas a la derecha. Si la media es excedida por la mediana, estos datos pueden llamarse de sesgo negativo o sesgadas a la izquierda. El sesgo pos itivo surge cuando la media se incrementa en algunos valores inusualmente altos, el sesgo negativo ocurre cuando la media se reduce en algunos valores extremada mente bajos. Clculo de mediciones descriptivas de resumen de una poblacin Las mediciones de tendencia central para una poblacin se calculan igual que en la muestra simplemente reemplazamos n por N. El rango y el rango intercuartil para una poblacin de tamao N se obtienen como si fuera una muestra reemplazando n por N. La varianza se calcula reemplazando el ( n - 1 ) del denominador por N. Uso de la Desviacin Estndar: La regla Emprica En series de datos simtricos, donde la mediana y la media son iguales, las observ aciones tienden a distribuirse igualmente alrededor de estas mediciones de tende ncia central. Cuando el sesgado extremo no se presenta y tal agrupamiento se obs erva en una serie de datos, podemos usar la denominada regla emprica para examina r la propiedad de variabilidad de datos y obtener una mejor idea de lo que la de sviacin estndar est midiendo. La regla emprica establece que en la mayora de las series de datos encontraremos q ue aproximadamente dos de cada tres observaciones (es decir, el 67%), estn conten idas en una distancia de una desviacin estndar alrededor de la media y aproximadam ente 90% a 95% de las observaciones estn contenidas a una distancia de 2 desviaci ones estndar alrededor de la media. Uso de la desviacin estndar: La regla de Bienaym Chebyshev No importa como se distribuyen los datos. el porcentaje de las distribuciones es tn contenidas dentro de las dsitancias de k desviaciones estndar alrededor de la m edia debe ser al menos 1 - 1 / k2 Al menos 75% de las observaciones deben estar contenidas dentro de distancias de +/-2 desviaciones estndar alrededor de la media. Al menos 88,89% de las observac iones deben estar contenidas dentro de una distancia de +/-3 desviaciones estndar alrededor de la media. Al menos 93.75% de las observaciones deben estar conteni das dentro de distancias de +/-4 desviaciones estndar alrededor de la media. 5. Resumen Captulo 5 del Libro Presentacin de datos categricos en tablas y diagramas Graficacin de datos categricos: de barras, de pastel y de punto Grfica de barras En la grfica de barras, cada categora se describe mediante una barra, cuya longitu d representa la frecuencia o porcentaje de observaciones que caen en una categora . Para construir una grfica de barras se hacen las siguientes sugerencias: Las barras deben construirse horizontalmente. Todas las barras deben tener el mismo ancho. Los espacios entre las barras deben variar entre la mitad del ancho de una barra hasta el ancho de una barra. Las escalas y guas son auxiliares tiles en la lectura de una grfica y deben incluirse. El punto cero u origen debe indicarse. Los ejes deben etiquetarse. Grfica de Pastel Grfica de Puntos Graficacin de datos categricos: el Diagrama de Pareto. El diagrama de Pareto es un tipo especial de grfica de barras verticales en la qu e las respuestas categrizadas se grafican en el orden de rango descendiente de su s frecuencias y se combinan con un polgono acumulativo en la misma escala. El pri ncipio bsico detrs de este dispositivo grfico es su capacidad de distinguir los "po cos vitales" de los "muchos triviales". Tabulacin de datos categricos: Tabla de contingencias y supertablas. Las tablas de contingencia se usan para examinar las respuestas a dos variables categricas simultneamente.
Supertablas. Una supertabla es esencialmente una coleccin de tablas de contingenc ia, cada una con las mismas variables y categoras de columna. Sin embargo, se inc luyen tantas variables de fila como se deseen para comparaciones frente a la var iable de columna. Tipos de Grficos Medidas Estadsticas. Medidas Estadsticas descriptivas. Variables Numricas: Medidas de posicin. Media. Mediana. Moda. Cuartiles. Medidas de Variacin. Rango. Rango Medio. Varianza. Desvo Estndar. Coeficiente de variacin. 6. Capitulo 6 del libro Probabilidad Bsica La probabilidad es la posibilidad u oportunidad de que suceda un evento particul ar. La probabilidad involucrada es una porcin o fraccin cuyo valor vara entre cero y uno exclusivamente. Observamos un evento que no tiene posibilidad de ocurrir ( es decir, el evento nulo), tiene una probabilidad de cero, mientras que un event o que seguramente ocurrir (es decir, el evento cierto), tiene una probabilidad de uno. Ejemplo: La posibilidad de sacar una carta con figura negra de una baraja. La posibilidad de que un individuo seleccionado aleatoriamente de una encuesta e ste de acuerdo con X tema. La posibilidad que tenga xito un nuevo producto en el mercado. Cada uno de los ejemplos anteriores se refiere a uno de los tres planteamientos del tema de la probabilidad. El primero a menudo se denominacom el planteamiento de la probabilidad clsica a priori. Aqu la probabilidad de xito se basa en el cono cimiento nterior del proceso involucrado. En el caso ms simple, cuando cada resul tado es igualmente posible. Esta posibilidad puede definirse de la siguiente man era: En el segundo ejemplo; llamado probabilidad clsica emprica, aunque la probabilidad se sigue definiendo como la proporcin entre el nmero de resultados favorables y e l nmero total de resultados, estos resultados se basan en datos observados, no en el conocimiento anterior a un proceso. El tercer planteamiento de probabilidad se denomina el enfoque de probabilidad s ubjetiva. Mientras que en los dos anteriores enfoques la probabilidad de un even to favorable se calculaba objetivamente, ya fuera de un conocimiento previo o de datos reales, la probabilidad subjetiva se refiere a la posibilidad de ocurrenc ia asignada a un evento por un individuo particular. La probabilidad subjetiva e s especialmetne til para la toma de decisiones en aquellas situaciones en que la probabilidad de diversos eventos no puede determinarse empricamente. Conceptos de probabilidad bsica Espacios de muestra y eventos Los elementos bsicos de la teora de probabilidades son los resultados del proceso o fenmeno bajo estudio. Cada tipo posible de ocurrencia se denomina un evento. Un evento simple puede puede describirse mediante una caracterstica sencilla. la compilacin de todos los eventos posibles se llama el espacio muestral. La manera en que se subdivide el espacioi muestral depende de los tipos de proba bilidades que se han de determinar. Tomando esto en cuenta, resulta de inters def inir tanto el complemento de un evento como un evento conjunto de la siguiente m anera: La complemento del evento A incluye todos los elementos que no son parte del eve nto A. Esta dado por el smbolo A.
Un evento conjunto es un evento que tiene dos o ms caractersticas. Tablas de Contingencias y diagramas de Venn Existen varias formas en las que puede verse un espacio muestral particular. El primer mtodo implica asignar los eventos apropiados a una tabla de clasificacione s cruzadas. Tal tabla tambin se denomina tabla de contingencia. Roja Negro Totales As 2 2 4 No As 24 24 48 Totales 26 26 52 La segunda forma de presentar el espacio muestral es usando un diagrama de Venn. Este diagrama se representa grficamente los diversos eventos como "uniones" e "i ntersecciones" de crculos. El rea contenida dentro del crculo A y de crculo B (rea central) es la interseccin de de Ay B (y se escribe A B) , puesto que esta rea es parte de A y tambien parte d e B. El rea total de los dos crculos es la unin de A y B (y se escribe A B ) y cont iene todos los resultados que son parte del evento A, parte del evento B o parte de ambos A y B. El rea fuera del diagrama fuera de A B contiene aquelloos result ados que no sonparte de A ni son parte de B. Probabilidad ( marginal ) simple La regla mas evidente para las probabilidades es que deben variar en valor de 0 a 1. Un evento imposible tiene una probabilidad cero de ocurrir, y un evento cie rto tiene una probabilidad uno de ocurrir. La probabilidad simple se refiere a l a probabilidad de ocurrencia de un evento simple. Ejemplo: la probabilidad de seleccionar una carta negra; la probabilidad de seleccionar un As La probabilidad simple se denomina probabilidad marginal puesto que el nmero tota l de xitos puede obtenerse del mrgen apropiado de la table de contingencias. Probabilidad Conjunta La probabilidad conjunta se refiere a fenmenos que contienen dos o mas eventos, c omo la probabilidad de un as negro, una reina roja o un empleado que este satisf echo con el trabajo y haya progresado dentro de la organizacin. P (A)= P ( A y B1 ) + P ( A y B2 ) + .....+ P ( A y Bk ) donde B1, B2, ... Bk son eventos mutuamente excluyentes y colectivamente exhaust ivos. Dos eventos son mutuamente excluyentes si ambos eventos no pueden ocurrir al mis mo tiempo. Dos eventos son colectivamente exhaustivos si uno de los eventos debe ocurrir. Por ejemplo, ser hombre y ser mujer son eventos mutuamente excluyentes y colecti vamente exhaustivos. Nadie es ambos ( son mutuamente excluyentes ) y todos son u no u otro ( son colectivamente exhaustivos ). Regla de la adicin La regla de la adicin se usa para encontrar la probabilidad del evento A o B. Est a regla para obtener la probabilidad de la unin de A y B considera la ocurrencia del evento A o del evento B o de ambos, A y B. El clculo de P ( A B ), la probabilidad del evento A o B, puede expresarse en la siguiente regla de la adicin general: P ( A B ) = P ( A o B ) = P ( A ) + P ( B ) P ( A y B ) Eventos mutuamente excluyentes
En ciertas circunstancias, sin embargo, la probabilidad conjunta no necesita res tarse porque es igual a cero. Tales circunstancias cuando no existen resultados para un evento particular. Por ejemplo, suponga que deseamos saber la probabilid ad de escoger un corazon o una espada si estuviramos seleccionando slo una carta d e una baraja estndar de 52 cartas de juego. Usando la regla de la adicin, tenemos lo siguiente: P ( corazn o espada ) = P ( corazn ) + P ( espada ) P ( corazn y espada ) P = 13/52 + 13/52 0/52 = 26/52 La interseccin en este caso no existe ( llamado el conjunto nulo ) porque no cont iene resultados, puesto que una carta no puede ser corazn y espada simultneamente. Siempre que la probabilidad conjunta no contenga ningn resultado, los eventos inv olucrados se consideran mutuamente excluyentes. Asi la regla general para evento s mutuamente excluyentes se reduce a: P ( A o B ) = P ( A ) + P ( B ) Eventos colectivamente exhaustivos Consideremos la probabilidad de seleccionar una carta negra o rojo. Puesto que s on mutuamente excluyentes al usar la ecuacin: 26/52 + 26/52 = 1 La probabilidad de rojo o negro suma uno. Dado que uno de los eventos debe ocurr ir se consideran mutuamente excluyentes. Probabilidad Condicional. Cuando estamos calculando la probabilidad de un evento particular A, dada inform acin sobre la ocurrencia de otro evento B, esta probabilidad se denomina probabil idad condicional, P ( A \ B ). La probabilidad condicional P ( A \ B ) puede def inirse de la siguiente manera: P ( A \ B ) = P ( A y B ) P ( B ) Independencia estadstica Se dice que dos eventos independientes si el conocimient o previo de la probabilidad de ocurrencia de uno de ellos no afecta la probabili dad del otro. Puede definirse de la siguiente manera: P ( A \ B ) = P ( A ) Regla de multiplicacin La frmula para la probabilidad condicional puede manipularse algebraicamente de f orma tal que la probabilidad conjunta P ( A y B ) puede determinarse a partir de la probabilidad condicional de un evento. La regla de multiplicacin para eventos independientes puede expresarse de la sigu iente manera sustituyendo P ( A ) por P ( A \ B ): P ( A y B ) = P ( A ) * P ( B ) Si esta regla se cumple para dos eventos, A y B entonces A y B son estadsticament e independientes. Por tanto, hay dos formas de determinar la independencia estads tica:. Los eventos A y B son estadsiticamente independientes si y slo si P ( A \ B )=P (A ) Los eventos A y B son estadsticamente independientes si y slo si P ( A y B ) = P ( A ) * P ( B ). Teorema de Bayes La probabilidad condicional toma en cuenta informacin respecto a la ocurrencia de un evento para encontrar la probabilidad de otro evento. Este concepto puede am pliarse para revisar probabilidaddes basadas en nueva informacin y, as determinar la probabilidad que un efecto particular se deba a una causa especfica. El proced imiento para revisar estas probabilidades se conoce como teorema de Bayes. El teorema de Bayes puede definirse a partir de las definiciones de probabilidad condicional y probabilidad marginal, asi el teorema de Bayes es: P ( Bi \ A ) = P ( A \ Bi ) P ( Bi ) P ( A \ B1 ) P ( B1 ) + P ( A \ B2 ) P ( B2 ) 7. Captulo 7 del libro Algunas distribuciones importantes de probabilidad discreta Una distribucin de probabilidad para una variable aleatoria discreta es un listad o mutuamente excluyente de todos los resultadosposibles para esa variable aleato ria, tal que una probabilidad particular de ocurrencia est asociada con cada resu ltado.
Esperanza Matemtica La media de una distribucin de probabilidad es el valor esperado de su variable a leatoria. El valor esperado de una variable aleatoria discreta puede considerarse como su promedio pesadoo sobre todos los resultados posibles, siendo los pesos la probab ilidad asociada con cada uno de los resultados. Esta medicin de resumen puede puede obtenerse multiplicando cada resultado posibl e Xi, por su probabilidad correspondiente P (Xi) y luego sumando los productos r esultantes. Por tanto, el valor esperado de la variable aleatoria discreta X, si mbolizado como E (X), puede expresarse de la siguiente manera: E(X)= ? Xi * P ( Xi) Varianza y desviacin estndar de una variable aleatoria discreta La varianza de una variable aleatoria discreta puede definirse como el promedio pesado de las diferencias cuadradas entre cada resultado posible y su media, sie ndo los pesos las probabilidades de cada uno de los resultados respectivos. Esta medicin de resumen puede obtenerse multiplicando cada diferencia cuadrada po sible ( Xi )2 por su probabilidad correspondiente P (Xi) y luego sumando los pro ductos restantes. Por lo tanto la varianza de la variable aleatoria discreta X p uede expresarse de la siguiente manera: ( Xi )2 * P (Xi) Funciones de distribucin de probabilidad discreta La distribucin de probabilidad para una variable aleatoria discreta puede ser: Un listado terico de resultados y probabilidades que pueden obtenerse de un model o matemtico que represente algn fenmeno de inters. Un listado emprico de resultados y sus frecuencias relativas observadas. Un listado subjetivo de resultados asociados con sus probabilidades subjetivas q ue representan el grado de conviccin del tomador de decisiones respecto a la prob abilidad de los resultados posibles. Un modelo se considera una representacin en miniatura de algn fenmeno subyacente. E n particular, un modelo matemtico es una expresin matemtica que representa cierto f enmeno subyacente. Para variables aleatorias discretas, esta expresin matemtica se conoce como funcin de distribucin de probabilidad. La caracterstica escencial de la distribucin uniforme es que es igualmente posible que ocurran todos los resultados de la variable aleatoria. Distribucin Binomial La distribucin binomial es una distribucin de probabilidad discreta que es extrema damente til para describir muchos fenmenos. La distribucin binomial posee cuatro propiedades esenciales: Las observaciones posibles pueden obtenerse mediante dos mtodos de muestreo disti ntos. Cada observacin puede considerarse como seleccionada de una poblacin infinit a sin reemplazo o de una poblacin finita con reemplazo. Cada observacin puede clasificarse en dos categoras mutuamente excluyentes y colec tivamente exhaustivas, usualmente denominadas xito y fracaso. La probabilidad de que una observacin se clasifique como xito, p, es constante de observacin a observacin. El resultado de cualquier observacin es independiente del resultado de cualquier observacin. Modelo matemtico P( X= x \ n, p ) = n ! px ( 1 p ) n-x X ! ( n x ) ! La primera parte de la frmula nos dice cuntas secuencias de arreglos de los x xitos de n observaciones son posibles. La segunda parte nos dice la probabilidad de o btener exactamente x xitos de n observaciones en una secuencia particular. Caractersticas de la distribucin binomial Forma. Siempre que p= 0.5 la distribucin binomial ser simtrica sin importar que tan grande o pequeo sea el valor de n. Sin embargo, cuando p ? 0.5 la distribucin ser sesgada. Mientras ms cercana este p de 0.5 y mayor sea el nmero de observaciones, n, menos sesgada ser la distribucin. Con una p pequea la distribucin estara sesgada a la derecha. Para p muy grandes, la distribucin sera sesgada a la izquierda. La media. La media de la distribucin binomial puede obtenerse fcilmente como el pr
oducto de sus parmetros, n y p. La desviacin estndar. La desviacin estndar se calcula usando la siguiente frmula: Distribucin de Poisson. La distribucin de Poisson es otra funcin de distribucin de probabilidad que tiene m uchas aplicaciones prcticas importantres. Un proceso Poisson no slo representa num erosos fenmenos discretos, sino que el modelo Poisson tambin se usa para proporcio nar aproximaciones a la distribucin binomial. Se dice que un proceso de Poisson existe si podemos observar eventos discretos e n un rea de oportunidad, un intervalo continuo, de tal manera que si acotamos el r ea de oportunidad o intervalo de manera suficiente: La probabilidad de observar exactamente un xito en el intervalo es estable. La probabilidad de observar exactamente ms de un xito en el intervalo es cero. La ocurrencia de un xito en cualquier intervalo es estadsticamente independiente d e aquella en cualquier otro intervalo. Caractersticas Forma. Cada vez que se especifica el parmetro ?, puede generarse una distribucinde probabilidad de Poisson espacfica. Una distribucin de Poisson estar sesgada a la d erecha cuando ? es pequea, y se aproximar a la simetra al crecer. La media y la desviacin estndar. Una propiedad de esta distribucin es que la media y la varianza son iguales al parmetro ?. Uso de la distribucin de Poisson para aproximar la distribucin binomial Para aquellas situaciones en las que n es grande ( mayor o igual a 20 ) y p es m uy pequea ( menor a 0.05 , la distribucin de Poisson puede usarse para aproximar l a distribucin binomial. La variable aleatoria de Poisson puede variar tericamente de 0 a 8 . Sin emabrgo, cuando se usa como una aproximacin a la distribucin binomial, la variable aleator ia de Poisson, el nmero de xitos de n observaciones, claramente no puede exceder e l tamao de la muestra n. Caractersticas =? = n * p 8. Captulo 8 del libro La distribucin Normal Modelos matemticos de variables aleatorias continuas:. La funcin de densidad de pr obabilidad. La probabilidad exacta de un valor particular de una distribucin continua es cero . A fin de eliminar la necesidad de realizar laboriosos clculos matemticos se ha d esarrolladola distribucin gaussiana o normal. La Distribucin Normal. Importancia de la distribucin Normal. La distribucin normal es de vital importancia en estadstica por tres razones princ ipales: Numerosos fenmenos continuos parecen seguirla o pueden aproximarse mediante sta. Podemos usarla para aproximar diversas distribuciones de probabilidad discreta y evitar as pesados clculos. Proporciona la base de la inferencia estadstica clsica debido a su relacin con el t eorema del lmite central. Propiedades de la distribucin normal Tiene forma de campana y es simtrica en apariencia. Sus mediciones de tendencia central (media, mediana, moda alcance medio y eje me dio) son todas idnticas.l Su "dispersin media" es igual a 1.33 desviaciones estndar. Es decir, el alcance in tercuartil est contenido dentro de un intervalo de dos tercios de una desviacin es tndar por debajo de la media a dos tercios de una desviacin estndar por encima de l a media. Su variable aleatoria asociada tiene un alcance infinito El modelo matemtico Para la distribucinnormal, el modelo usado para obtener las probabilidades desead as es:
Examinemos los componentes de la funcin: puesto que e y ? son constantes matemtica s, las probabilidades de la variable aleatoria X dependen slo de dos parmetros de la distribucin normal, la media de la poblacin y de la desviacin estndar de la pobla cin. Cada vez que especificamos una combinacin particular se generar una distribucin de probabilidad diferente. Estandarizacin de la distribucin normal Afortunadamente, al estandarizar los datos, solo necesitamos una frmula: Al usar la frmula de transformacin cualquier variable aleatoria normal X se convie rte en una variable aleatoria normal estandarizada Z. Mientras los datos origina les para la variable aleatoria X tenan una media y una desviacin estandar, la vari able aleatoria estandarizada Z siempre tendr una media = 0 y una desviacin = 1. Uso de las tablas de distribucin de probabilidad normal La tabla de normal representa las probabilidades o reas bajo la curva normal calc uladas desde la media hasta los valores particulares de inters X. Slo se enumeran en la tabla entradas positivas de Z, puesto que para una distribucin simtrica de e ste tipo con una media de cero, el rea que va desde la media hasta +Z debe ser idn tica al rea que va desde la media hasta Z. Al usar la tabla de normal se puede obs ervar que todos los valores de Z deben registrarse primero con hasta dos lugares decimales. Encontrar los valores correspondientes a probabilidades conocidas. Para encontrar un valor particular asociado con una probabilidad conocida,debemo s adoptar los siguientes pasos: Trazar la curva normal y luego colocar los valores para las medias en las escala s X y Z respectivas. Dividir la mitad apropiada de la curva normal en dos partes: la porcin de la X de seada a la media y la porcin de la X deseada al extremo. Sombrear el rea de inters. Usando la tabla de normal determinar el valor Z apropiado correspondiente al rea que est bajo la curva normal desde la X deseada hasta la media. Usando la ecuacin que se presenta a continuacin encontrar X. Aproximacin de la distribucin binomial Mientras ms cerca est p de 0,50 y mientras ms grande sea el nmero de observaciones d e la muestra n, ms simtrica se vuelve la distribucin. Siempre que el tamo de muestra sea grande, puede usarse la distribucin normal para aproximar las probabilidades exactas de xito que de otra manera se tendran que haber obtenido mediante laborio sos clculos. Como regla general, esta aproximacin normal puede usars siempre que n * p y n * ( 1- p ) sean al menos 5. Entonces la nueva Z sera la que se presenta a continuac in: Aproximacin de la distribucin de Poisson La distribucin normal tambin puede usarse para aproximar el modelo de poisson siem pre que el parmetro Lambda sea igual o mayor que cinco. Entonces la formula de Z ser la siguiente: 9. Capitulo 9 del libro Distribuciones de muestreo Con el fin de poder usar la estadstica de muestra para estimar el parmetro de pobl acin, deberamos examinar cada muestra posible que pudiera ocurrir. Si esta seleccin de todas las muestras posibles realmente se tuviera que hacer, la distribucin de todos los resultados se denominara distribucin de muestreo. El proceso de general izar estos resultados de muestra para la poblacin se refiere como una inferencia estadstica. Distribucin de muestreo de la media Propiedades de la media aritmtica Entre varias propiedades matemticas importantes de la media aritmtica para una dis tribucin normal estn:
Imparcialidad Eficiencia Consistencia. La imparcialidad, implica el hecho de que el promedio de todas las medias de mue stras posibles ser igual a la media de la poblacin. Tomemos como ejemplo una pobla cin de N=4 con tamaos de muestra de 2. Si seleccionamos dos muestras con reemplazo , podramos obtener 16 muestras posibles. El promedio de cada una de las muestras es igual a la media de la poblacin. Por lo tanto hemos demostrado que la media ar itmtica de muestra es un estimador imparcial de la media de la poblacin. Esto nos dice que an cuando no sepamos qu tan cerca est el promedio de cualquier muestra par ticular seleccionada a la media de la poblacin, al menos estamos seguros que el p romedio de todas las medias de muestra que se podran haber seleccionado ser igual a la media de la poblacin. La eficiencia, se refiere a la precisin de la muestra estadstica como un estimador del parmetro de poblacin. La media de muestra se acercar ms estable que otras medic iones de tendencia central. La media de muestra se acercar ms a la media de la pob lacin que cualquier otro estimador. La consistencia, se refiere al efecto del tamao de muestra, sobre la utilidad de un estimador. Al incrementarse el tamao de muestra, la variacin de la media de mue stra de la media de la poblacin se hace ms pequea, de manera que la media aritmtica de muestra se vuelve una mejor estimacin de la media de la poblacin. Error estndar de la media El hecho de que las medias de muestra son menos variables que los datos de pobla cin se desprende directamente de la ley de los grandes nmeros. Una media de muestr a particular promedia conjuntamente todos los valores de la muestra. Una poblacin puede consistir en resultados individuales que pueden tener un amplio radio de valores, de extremadamente pequeos a extremadamente grandes. Sin embargo, si un v alor extremo cae en la muestra, aunque tendr un efecto en la media, el efecto se reducir pues se promediar con todos los dems valores de la muestra. Adems, al increm entarse el tamao de la muestra, el efecto de un valor extremo se hace cada vez me nor, puesto que se est promediando con ms observaciones. Al muestrearse con reempl azo, el error estndar de la media es igual a la desviacin estndar de la poblacin div idida entre la raz cuadrada del tamao de muestra. Muestreo de poblaciones normales Puede demostrarse que si muestreamos con reemplazo de una poblacin con distribucin normal, la distribucin de muestreo de la media tambin tendr una distribucin normal para cualquier tamao de muestra y tendr una desviacin estndar como la que se mostr ms arriba. Al incrementarse el tamao de muestra el error estndar de la media disminuy e, de forma tal que una mayor proporcin de medias de muestra estn ms cercanas a la media de la poblacin. Muestro de poblaciones no normales En muchos casos no sabremos si la poblacin se distribuye normalmente. Por lo tant o, necesitamos examinar la distribucin de muestreo de la media para poblaciones q ue no estn normalmente distribuidas. Teorema del lmite central. Al hacerse lo bastante grande el tamao de muestra, la d istribucin de muestreo de la media puede aproximarse mediante la distribucin norma l. Esto es cierto no importando la forma de la distribucin de los valores individ uales de la poblacin. Qu tamao de muestra? Una gran parte de las investigaciones dem uestran que una muestra adecuada de por la menos 30, hace que la distribucin de m uestreo se aproxime a la normal. Para la mayora de las distribuciones de poblacin, sin importar la forma, la distri bucin de muestreo de la media tendr una distribucin aproximadamente normal, si se s eleccionan muestras de al menos 30 observaciones. Si la distribucin de la poblacin es lo bastante simtrica, la distribucin de muestreo de la media ser aproximadamente normal si se seleccionan muestras de al menos 15 observaciones. Si la poblacin se distribuye normalmente, la distribucin de muestreo de la media s
e distribuir normalmente sin importar el tamao de la muestra. Distribucin de muestreo de la proporcin Cuando trabajamos con variables categricas cada caracterstica puede clasificarse c on 1 o 0 para representar la presencia o ausencia de la caracterstica. Al tratar con datos categricos puede definirse como:
La proporcin tiene la propiedad especial de estar entre 0 y 1. El error estndar de la proporcin es: La distribucin de muestreo de la proporcin sigue una distribucin binomial. Sin emba rgo, cuando n*p y n*(1-p) son cada uno al menos 5 puede usarse la distribucin nor mal. Muestreo de poblaciones finitas En casi todas las investigaciones el muestreo es conducido sin reemplazo, por es to debe usarse un factor de correccin de poblacin finita (fpc) en la definicin tant o del error estndar de la media como del error estndar de la proporcin. El factor d e correccin puede expresarse como: 10. Capitulo 10 del libro Estimacin Introduccin La inferencia estadstica es el proceso que consiste en utilizar los resultados de una muestra para llegar a conclusiones acerca de las caractersticas de una pobla cin. Existen dos tipos de estimaciones: estimaciones puntuales y estimaciones de inte rvalo. Una estimacin puntual consiste en una sola estadstica de muestra que se uti liza para estimar el valor verdadero de un parmetro de poblacin. Puesto que la est adstica de prueba vara de una muestra a otra necesitamos considerar este hecho con el fin de proporcionar una estimacin ms significativa y caracterstica de la poblac in. Para lograr esto, debemos desarrollar una estimacin de intervalo de la media d e poblacin verdadera, tomando en consideracin la distribucin de muestreo de la medi a. El intervalo que construimos tendr una confianza o probabilidad especfica de es timar correctamente el valor verdadero del parmetro de poblacin. Estimacin de intervalo de confianza de la media (desvo de la poblacin conocido): En la inferencia estadstica debemos tomar los resultados de una sola muestra y ll egar a conclusiones acerca de la poblacin. En la prctica, la media de la poblacin e s la cantidad desconocida que se va a determinar. Para algunas muestras la estim acin de intervalo de la media de la poblacin ser correcta y para otras no. Tenemos que recordar que para el clculo del intervalo trabajamos con una estimacin de inte rvalo de confianza de 95, por ejemplo, esto puede interpretarse como si se tomar an todas las muestras posibles del mismo tamao, n, 95% de ellas incluiran la media de poblacin verdadera en alguna parte del intervalo alrededor de sus medias de m uestra, y solamente 5% de ellas no estaran incluidas. En general el nivel de conf ianza se simboliza como (1-a ) x 100%, en donde a es la porcisn que se encuentra en los extremos de la distribucisn que est fuera del intervalo de confianza. Por consiguiente para obtener la estimacin del intervalo tenemos: Z es el valor correspondiente a un rea de (1-a )/2 desde el centro de una distrib ucin normal estandarizada. El valor Z elegido para construir tal intervalo de con fianza se conoce como el valor crtico. Cualquier aumento en el nivel de confianza se logra ampliando simultneamente el i ntervalo de confianza obtenido (hacindolo menos preciso y menos til). Estimacin de intervalo de confianza de la media (desvo desconocido) Del mismo modo en que la media de la poblacin se desconoce, es probable que la de sviacin estndar real de la poblacin tampoco sea conocida. Por lo tanto, necesitamos obtener una estimacin de intervalo de confianza utilizando las estadsticas de mue stra "X" y "S". Para ello, utilizamos la distribucin t-student. De este modo, el intervalo de confianza se establecer a partir de la siguiente frm ula: Estimado del intervalo de confianza de la porcin
Podemos establecer la siguiente estimacin de intervalo de confianza (1-a) para la porcisn de la poblacisn: Determinacin del tamao de muestra para la media: El error de muestreo "e" se puede definir como: Por consiguiente para determinar el tamao de la muestra, deben conocerse tres fac tores: El nivel de confianza deseado. EL error de muestreo permitido. La desviacin estndar. Determinacin del tamao de muestra para una porcin: Al determinar el tamao de muestra para estimar una porcin se deben definir tres in cgnitas: El nivel de confianza. El error de muestreo permitido. La porcin verdadera de xitos. Estimacin y determinacin del tamao de muestra para poblaciones finitas. Estimacin de la media
Estimacin de la porcin Determinacin del tamao de muestra 11. Hiptesis nula y alternativa La prueba de hiptesis empieza con algo de teora, afirmacin o negacin con respecto a un parmetro particular de una poblacin. La hiptesis de que el parmetro de la poblacin es igual a la especificacin de la compaa se conoce como hiptesis nula. Una hiptesis nula es siempre una de status quo o de no diferencia. Se simboliza con el smbolo Ho. Siempre que especificamos una hiptesis nula, tambin debemos especificar una hiptesi s alternativa, o una que debe ser verdadera si se encuentra que la hiptesis nula es falsa. La hiptesis alternativa se simboliza H1. La hiptesis alternativa represe nta la conclusin a la que se llegara si hubiera suficiente evidencia de la informa cin de la muestra para decidir que es improbable que la hiptesis nula sea verdader a, y por tanto rechazarla. El hecho de no rechazar la hiptesis nula no es una pru eba de que sta sea verdadera. Nunca podemos probar que tal hiptesis sea correcta p orque estamos basando nuestra decisin nicamente en la informacin de la muestra, no en la poblacin entera. Resumen: La hiptesis nula se refiere siempre a un valor especificado del parmetro de poblac in, no a una estadstica de muestra. El planteamiento de la hiptesis nula siempre contiene un signo de igualdad con re specto al valor especificado del parmetro. El planteamiento de la hiptesis alternativa nunca contiene un signo de igualdad c on respecto al valor especificado del parmetro. Regiones de rechazo y de no rechazo La distribucin de muestreo de la estadstica de prueba se divide en dos regiones, u na regin de rechazo (conocida como regin crtica) y una regin de no rechazo. Si la es tadstica de prueba cae dentro de la regin de no rechazo, no se puede rechazar la h iptesis nula. La regin de rechazo puede considerarse como el conjunto de valores de la estadstic a de prueba que no tienen posibilidad de presentarse si la hiptesis nula es verda dera. Por otro lado, estos valores no son tan improbables de presentarse si la h iptesis nula es falsa. El valor crtico separa la regin de no rechazo de la de recha
zo. Riesgos en la toma de decisiones al utilizar la metodologa de prueba de hiptesis. Se pueden presentar dos tipos diferentes de errores: Un error tipo I se presenta si la hiptesis nula es rechazada cuando de hecho es v erdadera y deba ser aceptada. Un error tipo II se presenta si la hiptesis nula es aceptada cuando de hecho es f alsa y deba ser rechazada. Nivel de Significacin. La probabilidad de cometer un error tipo I denotada con la letra griega alfa, se conoce como nivel de significacin de la prueba estadstica. Est bajo el control directo del individuo que lleva a cabo la prueba. Ya que se h a especificado el valor de alfa, se conoce el tamao de la regin de rechazo, puesto que alfa es la probabilidad de un rechazo de la hiptesis nula. Coeficiente de confianza. EL complemento ( 1-a ) de la probabilidad de cometer u n error de tipo I se conoce como coeficiente de confianza. El coeficiente de confianza es la probabilidad de que la hiptesis nula no sea rec hazada cuando de hecho es verdadera y debera ser aceptada. Riesgo b . La probabilidad de cometer un error de tipo II se conoce como nivel d e riesgo del consumidor. A diferencia del error tipo I, en el cual las pruebas e stadsticas nos permiten controlar nuestra eleccin de a , la probabilidad de comete r un error del tipo II depende de la diferencia entre los valores supuesto y rea l del parmetro de poblacin. Como es ms fcil encontrar diferencias grandes, si la dif erencia entre la estadstica de muestra y el correspondiente parmetro de poblacin es grande, b la probabilidad de cometer un error del tipo II, probablemente sea pe quea. Potencia de una prueba. El complemento (1-b ) de la probabilidad de cometer un e rror del tipo II se conoce como potencia de una prueba estadstica. La potencia de una prueba es a probabilidad de rechazar la hiptesis nula cuando de hecho esta es falsa y debera ser rechazada. Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un estudio, consiste en aumentar el tamao de la muestra. Tamaos ms grandes d e muestra, nos permitirn detectar diferencias incluso muy pequeas entre las estadst icas de muestra y los parmetros de la poblacin. Cuando se disminuye a , b aumentar de modo que una reduccin en el riesgo de cometer un error de tipo I tendr como res ultado un aumento en el riesgo de cometer un error tipo II. Prueba de hiptesis Z para la media (desvo de la poblacin conocido) El estadstico de prueba a utilizar es: La Potencia de una prueba representa la probabilidad de que la hipstesis nula no sea rechazada cuando de h echo es falsa y debera rechazrsele. La potencia de prueba 1- representa la sensibil idad de la prueba estadstica para detectar cambios que se presentan al medir la p robabilidad de rechazar la hiptesis nula cuando de hecho es falsa y debera ser rec hazada. La potencia de prueba estadstica depende de qu tan diferente en realidad e s la media verdadera de la poblacin del valor supuesto. Una prueba de un extremo es ms poderosa que una de dos extremos, y se debera utili zar siempre que sea adecuado especificar la direccin de la hiptesis alternativa. Puesto que la probabilidad de cometer un error tipo I y la probabilidad de comet er un error tipo II tienen una relacin inversa y esta ltima es el complemento de l a potencia de prueba (1-), entonces a y la potencia de la prueba var?an en propor cisn directa. Un aumento en el valor del nivel de significacin escogido, tendra co mo resultado un aumento en la potencia y una disminucin en a tendra como resultado una disminucin en la potencia. Un aumento en el tamao de la muestra escogida tendra como resultado un aumento en la potencia de la prueba, una disminucin en el tamao de la muestra seleccionada te ndra como resultado una disminucin en la potencia. 12. Capitulo 12 del libro Pruebas de una muestra con datos numricos Eleccin del procedimiento de prueba apropiada Procedimientos paramtricos Todos los procedimientos paramtricos tienen tres caractersticas distintivas: Los p
rocedimientos de prueba paramtricos pueden definirse como aquellos 1)que requiere n que el nivel de medicin obtenido con los datos recolectados est en forma de una escala de intervalo o de una escala de cociente; 2)implican la prueba de hiptesis de valores de parmetros especificados 3) y por ltimo requieren un conjunto limita nte de suposiciones. Procedimientos sin distribucin y no paramtricos Los procedimientos de prueba sin distribucin pueden definirse ampliamente como 1) aquellos cuya estadstica de prueba no depende de la forma de la distribucin de la poblacin subyacente de la cual se tom la muestra de datos o como 2) aquellos para los cuales los datos no tienen fuerza suficiente para garantizar operaciones ar itmticas significativas. Los procedimientos no paramtricos pueden definirse como aquellos que no tienen qu e ver con los parmetros de una poblacin. Prueba t de hiptesis para la media (d2 desconocida) En ocasiones se desconoce la desviacin estndar de la poblacin. Sin embargo, se la p uede estimar con el clculo de S, la desviacin estndar de la muestra. Recordemos de muestreo de la media seguir una distribucin t con n-1 grado de libertad. Aproximacin del valor p Suposiciones de la prueba t de una muestra La prueba t est considerada como un procedimiento paramtrico clsico. Supuestos: los datos numricos obtenidos son tomados de manera independiente y representan una m uestra aleatoria de la poblacin que est distribuida normalmente. Prueba de hiptesis ?2 para la varianza (o desviacin estndar) Al intentar llegar a conclusiones con respecto a la variabilidad de la poblacin, primero debemos determinar que estadstica de prueba puede utilizarse para represe ntar la distribucin de la variabilidad de los datos de la muestra. Si la variable se supone que est distribuida normalmente, entonces la estadstica de prueba para probar si la varianza de la poblacin es igual o no a un valor especificado es: Una distribucin chi-cuadrado es una distribucin sesgada cuya forma depende exclusi vamente del nmero de grados de libertad. Conforma este aumenta, la distribucin se vuelve ms simtrica. 13. Captulo 13 del libro Pruebas de dos muestras con datos numricos Prueba t de varianza conjunta para diferencias entre dos medias Supongamos que consideramos dos poblaciones independientes, cada una con una med ia y una desviacin estndar. La estadstica de prueba utilizada para determinar la di ferencia entre las medias de las poblaciones est basada en la diferencia entre la X2). Debido al teorema del lmite central esta estadst s medias de las muestras (X1 ica seguir la distribucin normal. La estadstica de prueba Z es: En donde X es la media de la muestra correspondiente a cada una de las dos muest ras, n es el tamao de la muestra y por ltimo tenemos la varianza de la muestra. Si suponemos que las varianzas son iguales y que las muestras fueron tomadas de manera aleatoria e independiente se puede utilizar una prueba t de varianza conj unta para determinar si existe alguna diferencia significativa entre las medias de las poblaciones. Si puede calcular la siguiente estadstica de prueba t de vari anza conjunta: Donde: La estadstica de prueba t de varianza conjunta sigue una distribucin t con n-2 gra dos de libertad. Prueba t`de varianza separada para diferencias entre dos medias Si suponemos que las varianzas no son iguales como en el caso anterior debemos r eplantear el estadstico a utilizar. La estadstica de prueba t`puede ser aproximada con la frmula de v, mostrada anteri ormente. Prueba t para la diferencia de medias
Con el propsito de determinar cualquier diferencia que exista entre dos grupos re lacionados, deben obtenerse las diferencias en los valores individuales de cada grupo. Cuando la desviacin estndar de la poblacion de la diferencia es conocida y el tamao de muestra es lo suficientemente grande. La estadstica de prueba Z es: Sin embargo, en la mayora de los casos no conocemos la desviacin estndar real de la poblacin. La nica informacin que se puede obtener son las estadsticas sumarias como la media y la desviacin estndar de muestra. Si se supone que la muestra de result ados es tomada de manera aleatoria e independiente se puede realizar una prueba t para determinar si existe una diferencia media de poblacin significativa. La es tadstica seguir una distribucin t con n-1 grados de libertad. Ho= d = 0 donde d= 1-2 H1= d ? 0 Se puede calcular el siguiente estadstico de prueba: 14. Capitulo 14 del libro Prueba de hiptesis con datos categricos Prueba Z de una muestra para la proporcin Para evaluar la magnitud de la diferencia entre la porcin de la muestra y la porc in de la poblacin supuesta la estadstica de prueba est dada por la ecuacin siguiente: La estadstica de prueba Z est distribuida de manera aproximadamente normal. Prueba Z para diferencias entre dos porciones (muestras independientes) Cuando se evalan diferencias entre dos porciones basndose en muestras independient es se puede emplear una prueba Z. La estadstica de prueba es: Se supone que las dos porciones de poblacin son iguales. Ho= p1=p2 H1= p1 ? p2 Prueba X2 de independencia Sirve para evaluar diferencias potenciales entre la porcin de xitos en cualquier nm ero de poblaciones. Para una tabla de contingencias que tiene r renglones y c co lumnas, la prueba mencionada puede generalizarse como una prueba de independenci a. Como prueba de hiptesis las hiptesis nula y alternativa son: H0= Las dos variables categricas son independientes. H1= Las dos variables categricas estn relacionadas. La estadsitica de prueba es la siguiente: La regla de decisin consiste en rechazar a hiptesis nula a un nivel de significacin si el valor calculado de la estadstica de prueba es mayor que el valor crtico de e xtremo superior de una distribucin chi-cuadrada que posee (r-1)*(c-1) grados de l ibertad. 15. Captulo 15 del libro Regresin lineal simple y correlacin El anlisis de regresin se utiliza principalmente con el propsito de hacer prediccio nes. El anlisis de correlacin se utiliza para medir la intensidad de la asociacin entre las variables numricas. Diagrama de dispersin: cada valor es graficado en sus coordenadas particulares X, Y. Tipos de modelos de regresin. El modelo de lnea recta puede representarse como: El primer termino (B0), es la interseccin Y para la poblacin; B1 es la pendiente d e la poblacin y E es el error aleatorio en Y para la observacin i. En este modelo, la pendiente de la recta B1 representa el cambio esperado en Y por unidad de ca mbio en X; esto es, representa la cantidad que cambia la variable Y con respecto a una unidad de cambio particular en X. B0 representa el valor promedio de Y cu ando X es igual a cero. El modelo matemtico est influenciado por la distribucin de
los valores X y Y en el diagrama de dispersin. Determinacin de la ecuacin de regresin lineal simple. El mtodo de mnimos cuadrados. A b0 y b1 se los puede considerar como estimaciones de B0 y B1. Por consiguiente , la ecuacin de regresin de muestra sera: Yi es el valor predicho de Y para la observacin i, y Xi es el valor de X para la observacin i. El anlisis de regresin lineal simple tiene que ver con la bsqueda de la lnea recta q ue mejor se ajusta a los datos. El mejor ajuste significa que deseamos encontrar la lnea recta para la cual las diferencias entre los valores reales (Yi) y los v alores que seran predichos a partir de la lnea ajustada de regresin (Yi estimada) s ean lo ms pequeas posibles. Debido a que tales diferencias sern positivas y negativ as para las diferentes observaciones, minimizamos matemticamente la expresin: Una tcnica matemtica utilizada para determinar los valores de bo y b1 que mejor se ajusten a los datos observados se conoce como mtodo de mnimos cuadrados. Al utili zar este mtodo surgen dos ecuaciones normales: I. II. El error estndar de estimacin. El error estndar de la estimacin, representado como Syx se define como: Mediciones de variacin en regresin y correlacin. Con el fin de examinar que tan bie n una variable independiente predice a la variable dependiente, necesitamos desa rrollar algunas medidas de variacin. La primera: la suma total de cuadrados, esta puede dividirse en dos partes: la variacin explicada o suma de cuadrados debida a la regresin (SSR) y la variacin no explicada o suma de cuadrados de error (SSE). La suma de cuadrados debida a la regresin. La SSR representa la diferencia entre el valor promedio de Y y el valor promedio de Y que sera predicho a partir de la relacin de regresin).La SSE representa aquella parte de la variacin de Y que noo e s explicada por la regresin. SST = SSR + SSE En la que SST = Podemos ahora definir el coeficiente de determinacin r2: mide la porcin de variacin que es explicada por la variable independiente del modelo de regresin: Algunos investigadores sugieren que se calcule un coeficiente r2 ajustado para r eflejar tanto el nmero de variables explicatorias del modelo como el tamao de la m uestra. El coeficiente r2 ajustado se calcula de la siguiente manera: Correlacin: medicin de la intensidad de la asociacin En el anlisis de correlacin estamos interesados en medir el grado de asociacin entr e dos variables. La intensidad de la relacin se mide mediante el coeficiente de correlacin r , cuyos valores van de 1 a +1. El coeficiente de correlacin en casos de regresin lineal simple toma el signo de b1.
Suposiciones de regresin y correlacin. Las cuatro principales suposiciones acerca de la regresin son: 1.Normalidad. 2. Homoscedasticidad. 3. Independencia de error . 4. Linealidad. La primera suposicin, normalidad, requiere que los valores de Y estn distribuidos normalmente en cada valor de X. Siempre y cuando la distribucin de los valores de Yi alrededor de cada nivel de X no sea extremadamente diferente de una distribu cin normal, las inferencias acerca de la lnea de regresin y de los coeficientes de regresin no se vern seriamente afectadas. La segunda suposicin, homoscedasticidad, requiere que la variacin alrededor de la lnea de regresin sea constante para todos los valores de X. La tercera suposicin, independencia de error, requiere que el e rror sea independiente de cada valor de X. Por ltimo, la linealidad establece que
la relacin entre las variables es lineal. Estimacin del intervalo de confianza para predecir m yx.
Intervalo de prediccin para una respuesta individual Yi Inferencias respecto a los parmetros de poblacin en regresin y correlacin Ho= 1=0 (No hay relacisn) H1= 1 ? 0 (Hay relacisn) Y la estadstida de prueba para probar la hiptesis est dada por: La estadstica de prueba sigue una distribucin t con n-2 grados de libertad. Un segundo mtodo equivalente para probar la existencia de una relacin lineal entre las variables consiste en establecer una estimacin de intervalo de confianza de 1 y determinar si el valor supuesto est incluido en el intervalo. La estimacin del intervalo de confianza se obtendra de la siguiente manera: Un tercer mtodo para examinar la existencia de una relacin lineal entre dos variab les implica al coeficiente de correlacin de la muestra, r. Para ello se realiza l o siguiente: Ho: ? = 0 ( No hay relacin) H1: ? ? 0 (Hay relacisn) La estadstica de prueba para determinar la existencia de una correlacin esta dada por: La estadstica de prueba sigue una distribucin t con n-2 grados de libertad. Dificultades de la regresin y cuestiones ticas Las dificultades que surgen con frecuencia son: Falta de conciencia sobre las suposiciones de la regresin de mnimos cuadrados. Conocimiento de cmo evaluar las suposiciones de la regresin de mnimos cuadrados. Conocimientos de cules son las alternativas de la regresin de mnimos cuadrados si n o se cumple alguna suposicin individual. La creencia de que la correlacin implica causalidad. El uso del modelo de regresin sin conocer de qu se trata. 16. Aplicaciones estadsticas en administracin de la calidad y productividad Calidad y productividad: Una perspectiva histrica. Al tema de calidad y productiv idad lo podemos dividir en cuatro fases histricas: 1. Podemos pensar en una admin istracin de primera generacin como administracin mediante la accin, el tipo administ racin practicada por las sociedades cazadoras-recolectoras primitivas en que los individuos producan algo para s mismos o para su unidad tribal, siempre que el pro ducto fuera necesario. 2. Luego encontramos la administracin por direccin. Es la po ca del surgimiento de los gremios en Europa (Edad Media). Los gremios administra ban el entrenamiento de aprendices y trabajadores y determinaban las normas de c alidad y fabricacin de los productos hechos por el gremio. 3. La administracin por control, surge aproximadamente con Henry Ford, en el cual los trabajadores esta ban divididos entre aquellos que en realidad hacan el trabajo y aquellos que plan eaban y supervisaban el trabajo. Esto le quit responsabilidad al trabajador indiv idual con respecto al tema calidad y dej el tema en manos de inspectores. El esti lo de administracin por control contena una estructura jerrquica que pona nfasis en l a responsabilidad individual por la obtencin de un conjunto de objetivos predeter minados. 4. Por ltimo encontramos la administracin por proceso. Llamada a menudo T QM o Administracin de Calidad Total. Una de las caractersticas principales de este planteamiento consiste en centrar la atencin en una continua mejora de los proce sos. Se le da importancia al trabajo en equipo, atencin al cliente y rpida reaccin a los cambios. Tiene fuerte fundamentacin estadstica.
La teora de los diagramas de control. El diagrama de control es un medio para rev isar la variacin de la caracterstica de un producto o servicio mediante 1. la cons ideracin de la dimensin temporal en la cual el sistema fabrica productos y 2. el e studio de la naturaleza de la variabilidad del sistema. El diagrama de control p uede utilizarse para estudiar desempeos pasados o evaluar las condiciones present es o ambas cosas. Los diagramas de control pueden utilizarse para diferentes tip os de variables: para las variables categricas y para las variables discretas. La atencin principal del diagrama de control se enfoca en el intento de separar las causas especiales o asignables de la variacin de las causas comunes o debidas al azar. Las causas especiales o asignables representan grandes fluctuaciones en los dato s que no son inherentes a un proceso. Tales fluctuaciones son ocasionadas por ca mbios en un sistema. Las causas comunes o debidas al azar representan la variabilidad inherente que s e presenta en un sistema. Las causas especiales se consideran aquellas que no forman parte de un proceso y son susceptibles de corregir; mientras que las causas comunes pueden reducirse solo cambiando el sistema. Existen dos tipos de errores que los diagramas de con trol ayudan a prevenir. El primer tipo de error implica la creencia de que un va lor observado representa una causa especial de la variacin cuando de hecho se deb e a una causa comn de variacin del sistema. El segundo error implica tratar a una causa especial como si fuera una causa comn y no tomar medidas correctivas cuando son necesarias. La forma ms tpica de un diagrama de control establece lmites de control que se encu entran dentro de +/-3 desviaciones estndar de la medida de estadstica de inters. En general puede establecerse como: Algunas herramientas para estudiar un proceso: diagrama de esqueleto de pescado (Ishikawa) y de flujo de procesos. Un proceso es una secuencia de pasos que desc riben una actividad desde el inicio hasta su terminacin. El diagrama de esqueleto de pescado (o Ishikawa): El nombre viene de la manera e n que las diferentes causas estn ordenadas en el diagrama. El problema se muestra en la parte derecha y las principales causas se colocan en la parte izquierda. Estas causas a menudo se subdividen. Diagrama de flujo de proceso. Este diagrama nos permite ver un flujo de pasos de un proceso, desde su inicio hasta su terminacin. Los catorce puntos de Deming: una teora de la administracin por proceso. Deming de sarrollo su enfoque basndose en los siguientes catorce puntos: Crear una constancia en el propsito de mejorar el producto y el servicio. Adoptar la nueva filosofa. Dejar de ser dependientes de la inspeccin para lograr la calidad. Terminar con la prctica de otorgar contratos sobre la nica base del precio. En vez de ello minimizar el costo total trabajando con un solo proveedor. Mejorar constantemente y para siempre cada proceso de planeacin, produccin y servi cio. Instituir el entrenamiento en el trabajo. Adoptar e instituir el liderazgo. Eliminar el miedo. Derribar las barreras entre reas de personal. Eliminar lemas, exhortaciones y metas destinados a la fuerza laboral. Eliminar cuotas numricas para la fuerza laboral y objetivos numricos para la admin istracin. Retirar barreras que le restan orgullo a la gente respecto a su trabajo. Elimina r el sistema de evaluacin anual o de mrito. Instituir un vigoroso programa de educacin y autodesarrollo para todos. Poner a todo el que trabaje en la compaa a trabajar en el logro de la transformacin . Diagramas de control para la proporcin y el nmero de elementos que no se ajustan:. Los diagramas p y np. Diagrama p: basado en la porcin de elementos que no cumplen con los requisitos. P
ara establecer los lmites de control:
Cualquier valor negativo del lmite de control inferior significar que el lmite de c ontrol inferior no existe. Diagrama np: basado en el nmero de elementos que no cumplen con los requisitos. L os lmites de control los establecemos de la siguiente manera:
El diagrama R: Un diagrama de control para la dispersin. Los lmites de este diagra ma de control los obtenemos de la siguiente manera:
Diagrama X. El diagrama de control para X utiliza subgrupos de tamao n que se obt ienen sobre k secuencias consecutivas o periodos. Los lmites de control se obtien en de la siguiente manera:
Resumen Pronstico de series de tiempo. Tipos de mtodos de prediccin: Existen dos planteamientos para la prediccin: cualita tiva y cuantitativa. Los mtodos de prediccin cualitativa son especialmente importa ntes cuando no se dispone de datos histricos. Se consideran altamente subjetivos. Los mtodos de prediccin cuantitativa hacen uso de los datos histricos. Introduccin al anlisis de series de tiempo. Una serie de tiempo es un conjunto de datos numricos que se obtienen en perodos re gulares a travs del tiempo. El principal objetivo de una serie de tiempo consiste en identificar y aislar tales factores de influencia con propsitos de hacer pred icciones, as como para efectuar una planeacin y un control administrativo. Factores componentes del modelo multiplicativo de series temporales. Tendencia: impresin a largo plazo. Componente cclico: representa la oscilacin o los movimientos a la baja y a la alta que se dan a lo largo de la serie. Los movimientos cclicos varan en longitud, por lo general de dos a 10 aos. Componente irregular aleatorio: cualquier componente que no sigue la curva de te ndencia modificada por el componente cclico. Cuando los datos se registran mensual o trimestralmente adems de la tendencia ccli ca y los componentes irregulares debemos tomar en cuenta el factor estacional. El modelo multiplicativo clsico de las series temporales. Cuando los datos se obtienen anualmente una observacin Yi puede expresarse como: Yi=Ti*Ci*Ii; en la que Ti es el valor del componente tendencia, Ci= valor del co mponente cclico; Ii es el valor del componente irregular. Por otra parte cuando los datos se obtienen de manera trimestral o mensual una o bservacin Yi puede estar dada por: Yi=Ti*Si*Ci*Ii, en la que Si es el valor del componente estacional. El primer paso de una serie de tiempo consiste en graficar los datos y observar su tendencia a travs del tiempo. Primero debemos determinar si parece haber un mo vimiento a largo plazo hacia arriba o hacia abajo en la serie. ( es decir una te ndencia), o si la serie parece oscilar alrededor de una lnea horizontal a travs de l tiempo. Si este ltimo parece ser el caso entonces debe emplearse el mtodo de pro medios mviles o el suavizado exponencial, para suavizar la serie y proporcionarno s una impresin global a largo plazo. Suavizado de las series temporales anuales:. promedios mviles y suavizado exponen cial. Promedios mviles. Este mtodo es altamente subjetivo y dependiente de la longitud d el perodo elegido para la construccin de los promedios. Para eliminar las fluctuac
iones cclicas, el perodo escogido debe ser un valor entero que corresponda a la du racin promedio estimada de un ciclo. Los promedios mviles para un perodo elegido de longitud L consisten en una serie d e medias aritmticas calculadas en el tiempo de tal modo que cada media se calcula para una secuencia de valores observados que tienen esa longitud particular, L. El promedio mvil puede calcularse de la siguiente manera: Cuanto ms largo sea el perodo, menor ser el nmero de valores promedio mvil que se pue den calcular y graficar. Por consiguiente, la seleccin de promedios mviles con pero dos de longitud mayores a siete aos es, por lo general, no deseable puesto que ha br demasiados puntos de datos que faltan al inicio y al final de la serie, hacien do que sea ms difcil de obtener una impresin global de la serie completa. Suavizado Exponencial. El suavizado exponencial puede utilizarse para obtener predicciones a corto plaz o. Su nombre deriva del hecho de que nos proporciona un promedio mvil pesado o po nderado exponencialmente a travs de la serie de tiempo, esto es, a lo largo de la serie cada clculo de suavizado o prediccin depende de todos los valores observado s anteriormente. Esta es una ventaja con respecto al otro mtodo. Con este mtodo lo s pesos asignados a los valores observados disminuyen con el tiempo, de modo que cuando se hace el clculo, el valor observado ms reciente recibe el mayor peso. Para suavizar una serie de tiempo en cualquier periodo i tenemos la siguiente ex presin:. Ei= valor de la serie suavizada exponencialmente que se calcula en el perodo i. Ei-1= valor de la serie suavizada exponencialmente calculado en el perodo i-1 Yi= valor observado de la serie en el perodo i W= peso o coeficiente de suavizado que se asigna de manera subjetiva. W==2/(L+1) Si deseamos suavizar una serie mediante la eliminacin de las variaciones cclicas e irregular no deseadas, debemos seleccionar un pequeo valor de W. Si, nuestro obj etivo es hacer predicciones debisemos seleccionar el valor ms grande de W (cercano a uno). Anlisis de series de datos anuales: ajuste de tendencia de mnimos cuadrados y prons tico. El modelo lineal: El modelo cuadrtico: El modelo exponencial: Eleccin de un modelo de prediccin apropiado Leer ms: http://www.monografias.com/trabajos13/beren/beren.shtml#ixzz2uatP9rla

Estad

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Estad

Uploaded by

Copyright:

Available Formats

1.

ara establecer los lmites de control:

You might also like