You are on page 1of 46
Universidad Tecnolégica Nacional Facultad Regional Cordoba Ingenieria En Sistemas De Informactén 128 | 1100) wor 264 WAS INGRESANTES Sel . : & PERMANENCIA DE PRIME eS UA MITAD DE LOS 1 47% de los ingresamtes te PRIMERIZDS REGRESA, 2915 voivieron este abo Prof. Cdra. Gladys M. Rouadi PROBABILIDADES Y ESTADISTICAS CONCEPTOS BASICOS INGRESANTES ALA CARRERA ‘om eo / N06 QUEEN 2015 e872 ay 1 Esta maprcanitad eo en wf to sino 8304 CASI UN QUINTO DE Los INGRESANTES ES MUJER Tres oS8eee8Rs ‘embargo hasta ahora 14% de los ingreeanon Tou oqescrcevespeywas’ 2010 2011 2012 2013 014 2015 2016 2017 son mujeres. 1 Pemenen (Nepean * ar ANO 2015 A a Su BS Wp Probabilidades y Bsadistica La Estadistica constituye una disciplina cientifica que trata de la selecci6n, andlisis y uso de datos con el fin de resolver problemis. A toda persona, tanto en su ejercicio profesional como en su actividad diaria en contacto con diferentes medios, se le offece informacion en forma de datos. Consecuentemente, algunos conocimientos de Extadistica le sern de utilidad a la poblacién en general, pero en particular en conocimiento estadistico seta de vital importancia para ingenieros de todas las especialidades, cientilicos y administradores, debido a que manejan y analizan datos cotidianamente. En consecuencia las herramientas basicas de la Estadistica les rresullan de gran importancia a la hora del ejercicio profesional. Las aplicaciones de la Probabilidad y la Extadistica son numerosas en todos los casos de la ciencia aplicada en donde existan variaciones y donde las conchusiones acerca de un sistema estén basadas en datos observados. Por Estadistica y Probabilidad se entiende los métodos para describir y modelar la variabilidad, ademiis de permitir la toma de decisiones cuando la variabilidad esté presente, Del disetto a la produccion, los procesos tienen que ser permanentemente mejorados. Con sus conocimientos técnicos y dotados de habilidades estadisticas asicas para la recoleccién y representacion grifica de datos, ingenicros y cientificos podrin desenvolverse elicientemente, Agradezco a los integrantes de la Citedra y a Jos alumnos que colaboraron en la detecei6n de errores que permiten atto tras arto mejorar al presente material. Probabilidades y Estadistica: conceptos basicos. I" ed.-Cérdoba. ROUADI, Gladys Margarita. Eudecor, 2013, ISBN 978-987-1536:38-2, Fecha de catalogacion: LY/04/2013 Prof, Cara. Gladys M. Rouadi Il Probabilidades y Estadistica Unidad N* 8: Teoria del Muestreo Objetivos Especificos Que el estudiante: Visualice la necesidad y ventajas del muestreo. Identifique los distintos tipos de muestreo. Conozca como se selecciona una muestra. Tnterprete a través de las distribuciones por muestreo Ios errores, la probabilidad de cometerlos y la importancia de la variabilidad de los estadisticos. Conozea y aplique la Ley de los Grandes Niimeros y el Teorema Central del Limite Contenidos 1. Generalidades 2. Razones para el muestreo. 3. Base tedrica del muestreo. 4. Procedimientos para la seleccién de muestras. AL. Generalidades. 4.2, Muestreo no probabilistico. 4.2.1. Caracteristicas. 4.22, Muecstreo de criterio. 4.2.3. Muestreo de la muestra disponible. 4.24, Muestreo por cuotas. 43, Muestreo probabilistico, 431, Caracteristicas 43.2. Muestrco ileatorio simple. 4.3.8. Mucstrco alcatorio estratilicado. 4.3.4, Muestrco sistematico. 48.5. Muestrco por conglomerados. 4. Disiribuciones en el muestreo. 4.1, Distribucién por muestreo de la media muestral SLL. Muestreo con reposicion. 5.12. Muestreo sin reposicién. 5.2, Distribucién por muestreo de la proporcién muestra. $2.1. Muestreo con reposicién. 5.2.2, Muestreo sin reposicién. 58. Distribucion por muestreo de la varianza muestral corregida. $8.1. Muestreo con reposicion. 58.2. Muestreo sin reposicién. 6. Ley de los Grandes Nimeros, 7. Teorema Central del Limite. 8. Parimetos y estadisticas para variables y purimetros para variables aleatorias, Prof. Ctra. Gladys M. Ro Probabilidades y Estadistca 1, GENERALIDADES Hemos mencionado con anterioridad el concepto de POBLACION y MUESTRA. Pero recordemos nuevamente sus conceptos: Poblacién, Universo 0 Colectivo Es el conjunto de individuos, sean personas 0 cosas, sobre las cuales se desea ales se estudia alguna caracteristica. Son las unidades estadisticas, poseedoras de la caracteristica bajo estudio. informacién, © de las ct Asi, los alunos de un curso, constituyen un conjunto de individuos, pero esto solo, no configura una poblacién en sentido estadistico, pues es necesario definir, ademas, alguna o algunas caracteristicas que nos interesan analizar de ese conjunto. Por ejemplo, el peso, la estatura, la edad, ete; o bien medir en forma simultinea peso y altura; peso y edad; peso, altura y edad; et. Entonces, una poblacién en sentido estadistico queda configurada por el conjunto de individuos, sean personas 0 cosas, acompaiiadas por una o més caracteristicas que se miden 0 cuentan en cada una de ella. Muestra Es una parte de la Poblacién bajo estudio, convenientemente seleccionada, con el objetivo de obtener conclusiones, tomar decisiones o realizar predicciones validas sobre cl comportamiento de la totalidad de la Poblacion de la cual fue extraida, en relacion a la caracteristica o a las caracteristicas estudiadas. Debe quedar claro que nuestro propésito es siempre el conocimiento del comportamiento de la caracteristica o de las earacteristicas estudiadas en la Poblacion. Pero si ésta no puede examinarse en su totalidad, recurrimos a una parte de ella, llamada Muestra, arribando de esta manera a la Teoria Del Muestreo, Esta Teoria nos brindard y fijara pautas y enseiianzas necesarias para un correcto uso de las muestras y los procedimientos para su seleceién, a los fines de que las misms sean representativas y en idas para lograr el objetivo planteado para con la poblacién, consecuencia ¥ Las téenicas y procedimientos que se utilizan para inferir en forma valida desde muestra a toda la poblacién corresponden a la llamada Jnferencia Estadistica. srencia Estimacién de Parimetros de Poblacién, partiendo de estimadores muestrales (0 estadisticos) y calculando la precision de la estimacién (error de estimaci6n). (Deni acting: consist on be wizaci debs macs, pare verificar sii un determinado supuesto sobre la Poblacién es verdadero 0 falso, midiendo los riesgos de cometer un error. Recuérdese que toda medida calculada en base a datos poblacionales, se lama Pardmetro, y toda medida calculada en base a datos de muestras, se llama Estadistico, Prof, Cara. Gladys M. Rouadi Wp Probabitdades y Estadistica Estadistica O Estadigralo. ¥ntonces, los datos de muestra pueden usarse para Estimar Caracteristicas De La Poblacién Con Determinados Niveles De Confianza y Error (Estimacién Estadistica), © para Tomar Decisiones, Tales Como, Aceptar 0 Rechazar Valores Poblacionales Supuestos, Midiendo Los Riesgos De Cometer Un Error De Aceptarlos Siendo Falsos 0 De Rechazarlos Siendo Ciertos (Docimasia De Hipotests). denon rica choir season see Por ejemplo, si un fabricante desea probar la calidad de sus limparas sujetindolas a pruebas de duraci6n, esto es, encendiéndolas, debera recurrir indefectiblemente a un muestreo, pues de lo contrario destruiria su produccién. Sifla)jpoblaciones|nita) enfrentamos la alternativa de obtener informacién completa, mediante un examen del 1009% de todos los elementos de la poblacién, es decir, ializarunjeensoi(con excepcién de poblaciones que siendo finitas, constan de millones de elementos que hacen imposible su enumeraci6n completa, por lo que el tinico procedimiento prictico es el muestreo, pues, de realizarse un censo, Cabe preguntar: gPor qué es aconsejable utilizar una muestra que proporciona s6lo informacién incompleta acerca de la poblacién, cuando un censo proporcionaria informacién completa? ara responder analizaremos las siguientes razones: Aunque financiera, prictica y fisicamente sea posible observar a toda la poblacién, €l muestreo es mas cliciente debido a una mayor exactitud. Dicho de otra manera, los resultados obtenidos a través del muestreo, son casi tan precisos © en ciertos casos, mis precisos, que los obtenidos mediante un censo. Cualquier encuesta estadistica, utilizada para la captacion del dato (muestreo 0 censo) siempre contiene cierto error, Los errores estadisticos son de dos clases: a + Falta de respuesta de algunas unidades seleccionadas en la muestra. Esto puede suceder por omisién, por fracaso en la localizacién de algunas unidades, © por renuencia de algunos individuos a contestar las preguntas de la encuesta. Prok, Cara. Gladys M. Rowadi Il Probabilidades y Estadistica + Enrores de medicién en alguna unidad. Puede existir inexactitud en algin aparato de medicién, la persona entrevistada puede no conocer la respuesta o falsearla, etc. + Errores introducidos en la toma del dato, en la codificacién, tabulacién y anélisis de los resultados. + Son el resultado de la elecci6n casual de unidades de muestreo y ocurren cuando wabajamos con una parte del conjunto. En un censo desaparecen. Un error de estima ando ambos resultados se obtienen usando los mismos procedimientos. cién, es la diferencia entre el resultado de la muestra y el del censo, ¢1 En otras palabras, al calcular los pardmetros de la poblacién en base a n, estimaciones mues ales, se comete un error de estim: encia de lo que sucede con los ertores de observacién, is necesarias para medir estos errore: Lo importante aqui, a dife es que la Estadistica proporciona las téeni Entonces, no s6lo puede esperarse que el error total sea menor en un estudio de muestreo, sino que los resultados de ella, también pueden ser usados con un mayor grado de confianza, por nuestro conocimiento del tamaio probable del error. En resumen, el resultado final, es mas exacto cuando proviene de una muestra, que cuando proviene de un censo, pues son mayores los errores de observacién en el censo, que los errores de estimacién y observacién juntos, en el muestree. Por otro lado, los errores de observacién no pueden medirse con la precision con que se miden los errores de estim: Una muestra, generalmente, es menos costosa que un censo. El costo como argumento a favor del muestrco esté basado en que puede proporcionar datos con la suficiente precisién y a un costo mucho mas bajo que un censo. El costo puede reducirse mientras no se perjudique la precision que se desea, Es decir, no solo debemos elegir el muestreo considerando su menor costo, si con esto sacrificamos la calidad (precisién) de los resultados. Otra ventaja de una muestra sobre un censo, es que la primera produce en general, informacién con mucha més rapidez, fiandamentalmente en problemas en los cuales éste es esencial La rapidez se debe a dos razones principales: a Extraer una muestra, requiere menor tiempo que levantar un censo, ya que es uma tarea a menor es Prof. Cra. Gladys M, Rowadi 6 Wp Probabilidades y Bsadistica b- La correecion, codificacién y tabulaci6n de los resultados insume menos tiempo y cualquier encuesta proporciona informacién ttl, sélo después que los datos han sido recopilados y tabulados, La informa 11 debe llegar en tiempo oportuno, pasado el cual no es de utilidad. Los datos estadisticos poseen dos importantes caracteristic: a Diversidad. b- —_Regularidad o uniformidad. Analizaremos a cada una de ellas y veremos que son fundamento para inferir sobre la poblaci6n en base a datos muestrales. Las unidades clementales de cualquier poblacién son afectadas por una multiplicidad de fuerzas que, aunque relacionadas, actéan sobre los. elementos individuales con un considerable grado de independencia. ¥stas causas explican ls variaciones de una unidad a ota en a poblacién, Asi, naranjas del mismo Arbol pueden diferir en tamaiio, color, peso, o dulzura, Aunque la diversidad es una cualidad universal de los datos, no hay ninguna poblacién estadistica cuyos elementos varien entre si sin limite. Asi, siguiendo con las naranjas, las mismas varian en un grado limitado en tamatio, color, peso o dulzura, pero siempre seran identificadas como naranjas. EL hecho de que cualquier poblacién tiene propiedades caracteristicas y que las variaciones en sus elementos son limitadas, hacen posible que elijamos una muestra relativamente pequetia y al azar, que puede reflejar bastante bien las caracteristicas de la poblacién, Las fuerzas relacionadas, pero independientes, que producen variabilidad en una poblacién, estén a menudo tan equilibradas y concentradas que tienden a generar ig valores por arriba y por debajo de cierto valor central, alrededor del cual tienden a agruparse la mayor parte de los valores. Por ejemplo, los saldos de las cuentas de caja de ahorro en cualquier banco, pueden variar desde $1.000 hasta mas de $1.000.000 y la mayoria se hallarén en un lugar intermedio entre esos dos valores, Asi, los elementos individuales de una poblacién tienden a variar entre sf y al mismo tiempo, a adaptarse a ciertas normais. Por ello, tenemos diversidad y uniformidad en los datos. Prof, Cara. Gladys M. Rouadi Il Probabilidades y Estadistica Debido a la Unilormidad Estadistica, si se escoge una muestra gr caracteristicas de esta muestra diferiran muy poco de las de la poblacién. nde al azar, las Por la Diversidad, si se toman algunas muestras al azar, aunque muy similares en muchos aspectos, las muestras nunca coincidirén completamente unas con otras. ndencia de las caracteristicas mensurables a concentrarse alrededor de una medida de tendencia central (promedio), del que las observaciones individuales divergen en cierta forma definida. Los promedios son mis estables que los valores individuales, y resultan més estables a medida que se incrementa el niimero de observaciones (tamanio de la muestra). Esto se debe a que en una muestra grande, unas pocas observaciones extraordinarias, escasamente afectan a la media, porque hay muchas otras observaciones is tipicas. Pero, si la muestra es pequetia, no se presenta la oportunidad de que muchas observaciones tipicas inmovilicen una observacién extrema, por lo que, los promedios en muestras pequetias, exhiben mayor variabilidad que en muestras grandes. En la prictica, para hacer inferencias, generalmente tomamos una sola muestra. Sea ésta grande o pequeiia, estamos casi seguros de que sus caracteristica exactamente las de la poblacién. ¢Cémo podemos estar seguros entonces, sobre el grado de confianza de nuestras conclusiones? La respuesta es Aleatoriedad, o sea, se requiere que la muestra sea al azar. no son En base a lo analizado y recordando lo establecido en el punto 1.3. Etapas de la Investigacién Cientfiea, como etapas 1 y 2, 1- Formulacién o definicién del problema. 2 Disetio del experimento. decir: Donde mencionamos que las investigaciones pueden consistir en Experimentos, Estudios Muestrales 6 Estudios Observacionales, y que nuestro andlisis se centraré en los Estudios Muestrales, debemos entonces realizar el Disetio de Muestras que comprende: 1 EI Plan de Muestreo 2 Eleccién del estimador a utilizar. Es decir, deberd definirse la poblacién objeto de estudio, tanto en sus elementos componentes como en su probable distribucién (mucstreo de poblaciones finitas), asi n (lugar fisico donde se Hevard a cabo la investigacién) y tiempo (periodo nn de la informacién), lo que dijimos de acotar en tiempo y espacio. como la extensi para la recolece Lucgo, debera identificarse el Marco Muestral, es decir el listado de todas las unidades de muestreo que pueden ser seleccionadas en alguna etapa del proceso de muestreo (Ejemplo: Guia de Teléfono, Padrén Electoral, etc.), el que debera ser cuidadosamente analizado a fin de evitar dupli verificarse si conticne todos los elementos necesarios para evitar estimaciones sesgadas. iciones 0 ausencias, es decir, deberd Prof. Cra. Gladys M, Rowadi Probabilidades y Estadistca Inmediatamente, debera determinarse el tamaio de la muestra, procedimiento de estimacién, obtencién de las estimaciones y célculo de su precisién, que varian segiin el procedimiento de muestreo utilizado, para lo cual seguidamente los desarrollaremos. __ 4 EROCEDIMIENTOS PAR LA SELECCION DE MUESTRAS 4.1. Generalidades, Para que la Inferencia Kstadistica sea valida es necesario que la muestra sea representativa de la poblaci6n, Para seleceionar una muestra representativa deben Es de esperar que en el muestreo haya errores, un error de muestreo, como y dijimos, es la diferencia entre el valor de un estadigrafo, obtenido mediante una muestra aleatoria, y el valor del correspondiente parimetro de poblacién, debido a variaciones fortuitas en la seleceién de las unidades elementales, siderarse dos eriterios: Se mide, por lo que se llama fiabilidad 0 precision del muestreo, que esta relacionada con la varianza del estadigrafo. Cuanto mayor la varianza, menor la fiabilidad del resultado de la muestra, segiin demostraremos en desarrollos posteriores. El criterio de efectividad esta asociado al costo del muestreo. Un diseiio de muestreo se considera efectivo, si se obtiene el mismo grado de fiabilidad al menor costo posible, Un disefio de muestreo, se considera mas elective que otto, si el primero tiene menor costo que el segundo, dentro del mismo grado de fiabilidad. ‘Veamos ahora los tipos de procedimientos que pueden utilizarse: 4.2, Muestreo No Probabillstico. 4.2.1. Caracteristicas Las unidades de la poblacién que integrardn la muestra se eligen segtin el eriterio © juicio del investigador, por lo que no permite conocer: + Laprobabilidad que tiene la muestra de ser seleecionada, El error de muestreo, ni su evaluaci6n en términos de probabilidad (confianza © riesgo) + Precisién del estimador. Es decir, que la eleccién de los elementos de la muestra se realiza de manera casual, No hay aleatoriedad y no pueden realizarse Generalizaciones Tnferencias en mma pcb ace reeset Prof, Cara. Gladys M. Rouadi Probabilidades y Estadistca ‘También llamado Muestreo Intencional, Muestreo por Juicio 0 Pursposive Sampling. TERRES la muestra con base a un criterio determinado puede proporcionar resultados titles, no existen métodos disponibles para estimar el error de muestreo y por consiguiente Ejemplo: Para estudiar la preferencia por alsin producto alimenticio a base de pescado, se elige una regién donde el consumo de pescado est muy arraigado. ‘También llamado Muestreo a la Mano © Muestreo por Conveniencia. La muestra queda constituida por una parte de la poblacién que se encuentra convenientemente disponible. Pueden ser stiles para _propésitos limitados, pero no pueden proporcionar la seguridad de que los resultados obtenidos sean indicativos de las caracteristicas de la poblacion completa bajo estudio. Las conclusiones pueden contener un error considerable, Ejemplo: Seleccionar personas en la caja de un supermercado y entrevistarlas para conocer su opinion sobre un producto determinado. ae vmado del material de Estudio del Curso de Postgrado “Estadistica Aplicada a la Investigacion”. U Facultad de Ciencias Econémicas. Est. Nidia Blanch-Est. Silvia Joeckes. Modulo X- Pig. 31/35) Es un caso especial del Muestreo por Juicio y se utiliza en encuestas de opinién, investigaciones de mercado, etc. El investigador establece pasos explicitos para obtener una muestra que sea similar a la poblacién objetivo, ejerciendo ciertos “controles” sobre algunas caracteristicas de sus elementos. Se estiman los tamaiios de subconjuntos de la poblacién en base a datos de un listado, un censo, etc., a partir de lo cual se calculan proporcionalmente “cuotas” 6 miimero deseado de observaciones muestrales con respecto a los subconjuntos de la poblacién. Los encnestadores hacen lo que pueden por encontrar personas que satisfagan las restrieciones de sus controles de cuotas. iemplo Supongamos, por ejemplo, que un investigador desea realizar una encuesta para medir rating televisivos. Le interesa en particular evaluar la respuesta de acuerdo a subconjuntos de la poblacién determinades por edad, educacién e ingreso de los encuestados. Prof, Cara. Gladys M. Rouadi Ide Probabilidades y Estadistica Luego, las caracteristicas que desea controlar son: Edad. 4 categorias: Menosde 2021-80 31-50 Mas de 50 Nivel Educative Aleanzado. 3 categorias: Primario — Secundario Universitario Ingresos. 3 categorias: — Menos de 500 500-1000 “Miés de 1000 Estas caracteristicas pueden resumirse en la siguiente tabla: La muestra, entonces, tendr que estar conformada por personas menores de 20 afios con nivel de estudios primarios y que ganan menos de $500; menores de 20 aiios con estudios secundarios que ganen menos de $500, ete. En total, debera tener 4x3x3-36 grupos de personas bien diferenciados, para controlar las wes caracteristicas que ha establecido como relevantes por su influencia sobre el rating tclevisivo. Para obtener adecuadamente su. muestra, el investigador deberé contar con, informacién previa respecto a la proporcién de individuos de la poblacién que componen cada uno de estos grupos. Ello es posible, por ejemplo, a partir de datos provenientes de un Censo Poblacional. Pero, en otros casos, tal descripcién de la poblacién puede ser extremadamente dificil, 6 a veces, imposible de encontrar. Si el investigador posee la informacién, puede determinar el tamaiio que deberd tener la muestra en cada uno de los grupos efecttiando el siguiente célculo: ‘Tamano total de la muestra x Proporcion del grupo. Luego, si deseamos seleccionar una muestra de 1000 personas y se conoce por algin censo de poblacién que la proporcién de menores de 20 aios con estudios primarios que ganan menos de $500 es del 10%, tendriamos: 1000 x 0,10. 100 Prol. Cara. Chadys M. Rowadi " Il Probabilidades y Estadistica FI investigador debe, entonces, buscar 100 personas qu caracteristicas mencionadas. Este mismo procedimiento tiene luego que ser repetido en cada uno de los grupos preestablecidos. La manera de encontrar a estas personas queda ligada, generalmente, al juicio del investigador, retinan las 3 Los problemas que presenta el Muestreo por Cuotas son varios, a sabe + Antes de comenzar el procedimiento de seleccién hay que contar con una proporcién bastante aproximada de individuos que componen cada grupo, lo cual resulta a veces imposible. + Se deben seleccionar todas las caracter ticas que estén relacionadas con la informacién que queremos obtener a partir de la muestra. Por ejemplo, si queremos averiguar la actitud de la gente hacia el uso del pelo largo en los varones, evidentemente Ja edad debera ser una caracteristica a tener en cuenta. Si se deja de lado algu acteristica importante, los resultados: muestrales| pueden ser completamente erréneos, + Cuando se establecen caracteristicas de control miiltiples se crean numerosos grupos y, a veces, resulta imposible ubicar una cierta cantidad de personas que resinan todas las caracteristicas, 43.1. Caracteristicas La seleccion de unidades que integraran la muestra se realiza utilizando las propiedades proporcionadas por la ‘Teoria de Probabilidades, por lo que permite - Laprobabilidad de la muestra seleccionada. - Elerror de muestreo y su evaluaci6n en términos de probabilidad (Confianza 6 Riesgo). - Laprecisién del estimador. Permite realizar inferencias sobre la poblacién de la cual fue extraida la muestra por medio de métodos estadisticos al_introducir la aleatorizacién en el procedimiento de selecci Notese que: - No permite d incluirse en la muestra. - Una vez que un elemento ha sido seleccionado, requiere que deba incluirse en la muestra, sin permitir sustitucién, ecion acerca de los elementos que, de la poblacién, deberan Es el procedimiento por el cual se selecciona una muestra (n unidades) de una poblacin (N elementos), de manera tal que cada una de las muestras posibles del mismo tamatio tengan la misma probabilidad de ser seleccionadas, es decir, que las probabilidades de todas las muestras posibles del mismo tamafio (n) que se pueden obtener de una poblacién de N elementos, son iguales. Esto equivale a decir, que cada Prof. Cra. Gladys M, Rowadi Il Probabilidades y Estadistica uno de los elementos de la poblacién tiene la misma probabilidad de ser incluido en la muestra, Io cual implica la aplicacién de técnicas de azar, iemplo Si se desea conocer las opiniones de los estudiantes de una gran escuela, no se puede tener una muestra cafeteria hasta obtener el mimero de entrevistas que se de: toria con solo entrevistar a los estudiantes a la entrada de la ce Muchos estudiantes pueden no entrar jamais en la cafet entren, Ia probabilidad de entrevistarlos es nula. Una muestra asi obtenida no es aleatoria Uno de los métodos comrinmente utilizados para lograr una muestra aleatoria es emumerar todos los elementos de la poblacién definida, escribir los ntimeros en tarjetas, fichas o bolillas, ponerlos en una bolsa, mezclarlos y extracr los elementos segiin el tamaiio de muestra determinado. Si se toma con reemplazo, una vez analizado el elemento, vuelve a la poblacién, se mezclan nuevamente los objetos y se realiza la extraccion siguiente. Esto implica que la probabilidad permanezca invariable para cada objeto y la probabilidad de cada muestra 1 cs igual a Si se toma sin reemplazo, la probabilidad de cada objeto se hace mayor en cada nueva extraccién, pues el ntimero disponible para elegir, se reduce en el ntimero de objetos ya sacados, pero los objetos restantes tienen idéntica probabilidad de ser 1 seleccionados. La probabilidad para cada muestra se obtiene como or te procedimiento se simplfica haciendo uso de la Tabla de Nimeros Aleatorios. El Muestreo Aleatorio Simple es de aplicacién en poblaciones pequenas y homogéneas (los elementos se comportan de manera homogénea en relacién a la caracteristica bajo estudio) y requiere la identificacién de todos los elementos de la poblacién, A continuacién ejempli s el uso de la Tabla de Niimeros Aleatorios y ‘areme realizaremos la estimacion de 1, a wavés de su mejor estimador ¥ considerando tres muestras de entre cl total de muestras posibles. Ejemplo del uso de la ‘Tabla de Niimeros Aleatorios Dada la siguiente informacién, correspondiente al total de fichas con saldo deudor existentes en una empresa y clasilicadas en 8 intervalos: Prof. Cra. Gladys M, Rowadi Se pide realizar la estimacion de p, para lo cual se deberi: 1- Seleccionar tres muestras de tamaiio cinco con reposici6n, considerando: m: cantidad de muestras = 3 tamatio de cada muestra ~ 5 2 Comparar X con pt. Resoluci En primer lugar, calculamos Don = 238.300 _ 438,30 Recuérdese que cuando tenemos un intervalo, tomamos como valor de la variable el punto medio o marca de clase, que es la media aritmética de los extremos de cada intervalo, es decir: Yat Ys 2 Luego, construimos las tes muestras y-caleulamos sus medias. Para ello necesitamos elegir cinco miimeros aleatorios de los digitos de la tabla para cada muestra, por lo que en total necesitamos 15 niimeros aleatorios. La regla de decision queda planteada en funcién de las frecuencias absolutas acumuladas: Prok. Cara. Chadys M. Rowadi " Inde Probabitdades y Estadistica Ademiés, elegimos al azar los mimeros aleatorios (que en este caso representan el niimero de fichas de deudores varios). Una ver elegido el punto de comienzo en la tabla, extraemos los digitos siguiendo una columna hasta llegar al final de la pagina, luego comenzamos con la columna siguiente siempre de arriba abajo, y asi hasta completar el niimero de digitos a elegir. En nuestro caso, elegimos quince niimeros de tres digitos cada uno, todos seguidamente, Los cinco primeros, constituirin la primera muestra, los cinco. segundos la segunda y asi sucesivamente: Estos digitos representan la “ficha n, pero, qué saldo tiene esa ficha? Puesto que nuestra media es promedio de saldos, no de fichas, nos fijamos a qué intervalo correspond ese niimero de ficha y vemos cual es el saldo representativo para ese intervalo, dado por ¥ =» = _ 1825 ya 65 La diferencia con pi, se debe a que mientras la media poblacional es un parimetro cuyo valor ¢s constante en una poblacién determinada, la media muestral es una variable Prok, Cara. Gladys M. Rowadi Il Probabilidades y Estadistica aleatoria, cuyo valor puede variar dependiendo de las observaciones muestrales. que forman parte de la muestra elegida. En el caso planteado, se obtuvieron muestras a los fines de estimar el parimetro Media Poblacional (j), a través de su mejor estimador, la Media Muestral (0). Podemos interesamos en estimar el parimetro Proporcién Poblacional (P), a través de su estimador Proporcién Muestral (), © bien el parimetro Varianza Poblacional (¢*)6 Varianza Poblacional Corregida (5), 6 sus correspondientes desviaciones estindar (6 6 S$ respectivamente), recurriendo al valor muestral correspondiente (0 En relacién al analisis de la precision de los estimadores requerimos ealeular las, desviaciones estindares. Asi, oes el error estandar de la media muestral, 5 ¢s el error de la proporcién muestral, etc., y nos permitiran: Estimar la precision de la estimacién. - Estimar el tamaiio de la mu - Compat métodos de mues a 1 la precision de los estimadores, obtenida por medio de distintos eo. Para determinar el tamaiio de la muestra, se hace necesario especificar el error de estimacién que se desea y el nivel de confianza asociado, es decir, la evaluacién del error de muestreo en términos de probabilidad. En el siguiente tema a tratar: Distribuciones En EI Muestreo, aprenderemos a calcular errores estandares, es decir, las desviaciones de los estimadores. En la Bolilla Estimacién Estadistica, aprenderemos la determinacién del tamaiio de la muestra. sobre utiliza especialment 1- Cuando la informacion se desea con distinta precision para algunas subdivisiones de la poblacién. 2 Cuando los elementos difieren sensiblemente en los distinte poblacién, o sca cuando la poblacién no cs homogénea, es decir, sus clementos se comportan de manera heterogénea en relacién a la caracterfstica bajo estudio. 3 Cuando los problemas de muestreo que se presentan en cada parte son distintos y necesitan un tratamiento diferencial. La poblacién se divide en cierto mimero de grupos, llamados estratos (r grupos de N individuos cada uno), mutuamente excluyentes y colectivamente exhaustivos, es decir, no pueden haber sobre posiciones, ni omisiones. tos de la O sea que: NEN HN, tN y tect Ny Prof, Cara. Gladys M. Rouadi 6 Ide Probables y Ess Una ver. establecidos lo estratos, se extrac de cada uno de manera independiente uma muestra de tamaiio n,, siendo la muestra total n, igual a Ja suma de los n:, O sea que: EM FM EM, Fee EM, Debe tratarse de que los estratos tengan mayor homogeneidad que en la poblacién total, lo que permitira una mejor estimacién (mas precisa) de los parametros, utilizando muestras relativamente més pequefias. En la muestra obtenida en cada estrato se caleula el estadistico de interés. Estas medidas por estrato se ponderan adecuadamente para formar una estimacién combinada de la poblacién completa. plo Supongamos que con una muestra de 5 alumnos queremos estimar el promedio de edad de un grupo de 50 alumnos, de 1° a 5° atio, estratificados en la siguiente forma: Nu: alumnos de 1°, 2° y 3° afio = 30 Ne alumnos de 4* y 5* afte = 20 Se toma una muestra de n-5, donde n-8 y n-2. Asi, los resultados obtenidos en la muestra son : 1) > % ya FP 22+ 214194254264, n 5 = (484 +441 +361 +625+676)-5(22,6) _ 2587-25538 4 4 Estrato 1 oar Prok, Cara. Gladys M. Rowadi Ide Probables y Ess Estrato 2 Resumiendo: Como la informacién est separada en estratos se requiere calcular un promedio ponderado, luego el estimador seri el promedio ponderado de las estimaciones de los estratos individuales, donde las ponderaciones son los tamaiios de cada estrato. ZN _ G0x20,7)+(20x255) _ EN 50, 22,62 Siguiendo nuestro anélisis, diremos que el Muestreo Estratificado puede ser més eficiente que el Muestreo Aleatorio Simple. Para demostrarlo, plantearemos el siguiente ejemplo: ademos estimar la antigtiedad promedio de 2000 empleados de una Si fijamos una muestra de 50 empleados, existirin CiZ4y maneras de combinar 50 entre 2000, Asi, existiran casos en los cuales todos los empleados de la muestra provengan de tal planta, 0 todos provengan de la ofieina, 0 todos sean mujeres, 0 todos sean hombres. Tales muestras podrian considerarse “no representativas” y el hecho de que tales muestras no representativas sean posibles usando el Muestreo Aleatorio Simple, puede aumentar el error de muestreo y, por consiguiente, disminuir la precisi6n de la estimacién a partir de la muestra, Prok Cra. Gladys M, Rovadi 8 Il Probabilidades y Estadistica «Por qué estas muestras “no representativas” pueden aumentar el error de muestreo? El punto significative es considerar en qué aspectos estas posibles combinaciones de lay muestras son no representativas. Si son no representativas de caracteristicas que no estin relacionadas con el elemento bajo estudio (en este caso tiempo de servicio), el error de muestreo no increment Fjemplo: una combinacién puede estar formada por 50 empleados, todos ellos fumadores. ‘Tal grupo no seria representativo si estuviésemos interesados en saber la proporcién de empleados que fuman; sin embargo, en lo que respecta a la duracion de sus servicios, el hecho de fumar no quita representaci6n y, por lo tanto, no inerementa el error de muestreo para la estimacién del tiempo de servicio promedio. Por otra parte, la falta de representacién de las muestras con respeto al lugar en que trabajan dentro de la compaiiia, incrementarian el error de muestreo de la estimaci6n puesto que existe una relacién definida en la compaiifa XX, entre el tiempo de servicios y ¢l lugar en que trabajan los empleados (o sea en la planta, en la oficina, 0 en otra parte). . si la muestra esta formada slo de empleados de planta o solo media de la a, puede llevar a una estimacién que difiera considerablemente de la poblaci6n, ‘Tales combinaciones de muestras, que producen medias de la muestra alejadas de la media de la poblacién, tienden a hacer més variable la distribucién de muestreo de ¥, incrementando asi el error de muestreo. El muestreo aleatorio estratificado puede reducir tales causas del incremento del error de muestreo, haciendo imposible tomar algunas de estas. muestras_ “no representativas” y, en esta forma, haciendo que la distribucién de muestreo de ¥ sea ‘menos variable, lo que produce una mayor precision. Para definir Jos estratos se pueden emplear datos anteriores, intuicién o bien resultados preliminares procedentes de otros estudios. Es entonces, una combinacién de submuestras de los e: tos, que son muestr aleatorias simples o sisteméticas. En cuanto tales, todo elemento disponible de cada estrato tiene igual probabilidad de ser seleccioi Cuando de ser posible, los estratos son subdivididos en subestratos, Los estratos deben establece! ementos en cada estrato ¢ de forma tal que los difieren tanto como sea posible, respecto a la caracteristica bajo investigacin de los elementos en los otros estratos, si bien dentro de cada estrato deben ser tan homogéneos Prof. Cra. Gladys M, Rowadi Wp Probabitdades y Estadistica como sea posible. Entonces, debe buscarse heterogeneidad entre los estratos_y homogencidad dentro del estrato, Planeacién del tamano de las muestras Es conveniente que se planee el tamatio necesario de las muestra para minimizar los costos y para maximizar la precision. La magnitud de la muestra se llama afijacién, y tenemos: Ie Afijacién Igual Donde todods los 11 son iguales, o sea: Donde : r: cantidad de estratos ni: famaiio de la muestra 2 Aljiacién Proporcional Cada nm, posee en la muestra la misma proprocién o participacion que cada N, posee en la poblacién, entone 3 Afijacién Optima o de Neyman; (ea) Donde: ¢; es la desviacién estindar de los elementos en el estrato i. Esta formula maximiza la precision del estimador de la muestra. Entonces, la razén de muestreo se hace en cada estrato proporcional a la desviacién tipica de ese estrato. Cuanto mas homogeneo es el estrato, menor st desviacién tipica y menor su proporcién en la muestra, 20 Prok, Cara. Gladys M. Rowadi Ide Probables y Ess Cileulos: n=250 1) Igual: 2) Proporcional: =) 250 = 0,10x 250 = 25 5000. 3) Optima: n, -(4 0-7) 250-72 29.480 ny '500x10,3 29.480 } 250=44 Prok Cra. Gladys M, Rovadi 7 Il Probabilidades y Estadistica Observes 1) Si los estratos tienen idéntica participacién en el total y las desviaciones son parecidas, la afijacién igual puede aplicarse. 2) Si los estratos tienen diferente participacién en el total y las desviaciones son parecidas, la afijacién proporcional es aplicable. 3) Si los estratos tienen igual 6 diferente participacién en el total y la desviaciones son disimiles, la afijacién 6ptima es la aplicable, Se selecciona un elemento de la poblacién, cada k elementos, después de haberlos colocado en un cierto orden especificado. FI punto de partida, arranque 0 raiz, se selecciona al azar entre los k primeros elementos. Eiemplo Deseamos seleccionar una muestra sistematica de 50 cuadras en una comunidad que tiene 500 cuadras en la ciudad. N _ 500 n SO Donde k: raz6n de muestreo Después seleccionamos un mimero al azar entre | y 10, a partir de una tabla de digitos al azar. Supongamos que ese niimero sea 3, entonces la tercera cuadra sera la primera en. stra, la segunda cuadra, sera la decimotercera, la siguiente el nimero 23 y asi sucesivamente. la mu Fsto asegurara que una muestra sistemdtica contenga cuadras de todas las partes dee la ciudad (ventaja sobre el muestreo aleatorio).. Ocasionalmente puede ser menos eficiente que el Muestreo Aleatorio Simple, esto es cuando la poblacién se ordena en cierto orden periddico. Como ejemplo, supongamos que todas las cuadras de la ciudad contienen 8 casas. Un muestreo sistemitico de cada octava casa podria contener solamente casas en las esquinas y éstas pueden tener caracteristicas diferentes respecto a las familias de la cuadra. puede emplear ficilmente cuando se dispone de una lista de las unidades de la poblacién, como por ejemplo, una guia telefénica Se entativa que el Mue elementos cereanos de la poblaci6n se a que quedan distantes. jona uma muestra mas repres treo Aleatorio Simple, si los , de los que se parecen a los n mas entre em Prof. Cra. Gladys M, Rowadi 2 Il Probabilidades y Estadistica ‘Tiene la desventaja de requerir la numeraci6n u ordenamiento de_los elementos de la poblacién, lo cual podria ser fisicamente imposible si la poblacién abarca todo un. pais o una zona geografica considerable, es decir, si se trata de una gran poblacién, Debido a que el método nos asegura una muestra regularmente espaciada, nos asegura tma representacién uniforme de los elementos de la poblacién, y permite una timacién mas precisa de la media de la poblacién, que una tomada por el Muestreo Aleatorio Simple, salvo que las unidades k-ésimas que constituyen la muestra _resulten andlogas o estén correlacionadas. Diametralmente opuesto al muestreo por estratos esté el _muestreo por conglomerados, que consiste en seleccionar primero, al azar, grupos llamados conglomerados, de elementos individuales de la poblacién, y en tomar luego todos los elementos © una submuestra de ellos, dentro de cada conglomerado, para constituir asf la muestra global. hacen tan pequenas como se puedan las diferencias entre conglomerados, en. tanto que las diferencias entre los elementos individuales dentro de cada conglomerado se hacen tan grandes como sea posible. Lo ideal seria que cada conglomerado sea una miniatura de toda la poblacion y asi un solo conglomerado se llama Unidad De Muestreo Primaria, Si todos los elementos © unidades clementales de cada conglomerado seleccionados se incluyen en la muestra, se llama Muestreo De Una Etapa. Si se saca una submuestra aleatoria de elemento ccionado, se lama Muestreo En Dos Etapas. Si intervienen mas de dos etapas en la obtencién de la muestra global, es un Muestreo De Etapas Multiples. Desde luego, los métodos aleatorios se emplean en cada etapa. de cada conglomerado sel EI objetivo es el estudio de las caracteristicas de los elementos individuales 0 unidades elementales, si bien se eligen inicialmente las unidades de muestreo primarias. Ventajas: reduccién de costos para un grado de fiabilidad dado. Desventaja ausencia de fiabilidad para un tamaiio dado de muestra, La varianza tiende a ser mayor. Pero si el costo de seleccionar una unidad elemental se reduce mucho, la misma cuantia de gastos permitiré seleccionar una muestra mis grande, iemplo Seleccionar una muestra para entrevistar a la poblacién de Cordoba. No existe una lista al dia de los habitantes, y construirla resultar ademas encontrariamos que las personas de la muestra estarian esparcidas por toda la provincia y el costo de enviar entrevistadores hasta dichos lugares serfa alto. muy costoso, Podemos utilizar el muestreo por conglomerados (areas). Prof. Cra. Gladys M, Rowadi 8 Il Probabilidades y Estadistica Las ai s (barrios), por ejemplo, reciben el nombre de Unidades De Muestreo, debido a que son las unidades que se muestrearan. Las unidades de las cuales se obtendra informacién son Unidades Elementales, por ejemplo los individuos. En conelusién: - El muestreo por areas elimina la necesidad de formar una lista de todas las unidades elementales, pues utiliza una unidad de muestreo para la cual ya existe una lista completa o puede obtenerse con facilidad. - Se requieren muestras mas grandes que el Muestreo Aleatorio Simple, para obtener la misma precision, debido a que las personas que viven dentro de cualquier area a menudo tienden a ser mas parecidas en sus caracteristicas de opiniones, que las personas que viven en dreas distintas. Seleccién entre muestras de probabilidad y muestras de criterio Si la muestra debe ser extremadamente pequefia debido a razones de costo (inancieras) 0 de otra indole, debe preferirse una muestra de criterio a un muestra de probabilidad. Las mnestras de probabilidad deben ser consideradas cuando se requieren resultados de alta precision, 0 cuando se requieren resultados objetivos y desprovistos de error sistem: in decisiones 0 cursos de accién ©, debido a que se determina importantes sobre la base de los resultados de la muestra. Consideraremos cualquier tipo de procedimiento de muestreo de probabilidad, que proporcione en el mismo nivel de confianza, la misma precisién en la estimacién, a menor costo, © més precisién al mismo costo, como una técnica mas eficiente que el Muestreo Aleatorio Simple Prof. Cra. Gladys M, Rowadi 4 Wp Probabilidades y Bsadistica Hemos seiialado que las estadisticas de muestra raramente se obtienen por sf mismas, sino que sirven de base para generalizar acerca de parimetros de poblacién desconocides La Inerencia Estadistica supone métodos que nos permiten inferir de datos limitados (muestras) lo que es cierto de mayores conjuntos de datos (poblaciones).. Las conclusiones inductivas (de lo particular a lo general) Estos errores se originan en las variaciones al azar en el valor de una estadistiea de muestra de una muestra a otra, Como tales, pueden ser evaluados solo en términos de distribuciones de probabilidades de estadisticas de muestra, Una estadistica de muestra, que es calculada de una muestra al azar, es una Variable Aleatoria y por consiguiente tiene distribucion de probabilidad propia (Recuérdese que una distribucién de probabilidades se muestra en una tabla indicando todos los posibles valores para la variable y su respectiva probabilidad). ‘Tal divibucién, se conoce como Distibucién Por Muestreo De Una Estadtice, Un valor importante de estas distribueiones por muestreo, es la ayuda que nos prestan para revelar los tipos de errores de muestreo y sus magnitudes. Veremos a contimiacion y a través de un ejemplo sencillo la Distribucién por Muestreo de algunas estadisticas, tales como: Media Muestral, Proporcién Muestal y Varianza Muestral Corregida. Lo primero que debemos hacer es definir la poblaci6n a ser muestreada. Para ello, supongamos que nos interesa estudiar el niimero de materias aprobadas durante un curso lective determinado de los estudiantes de tercer aiio de la carrera de Ingenieria en Sistemas de Informacién de la Universidad Tecnologica Naciona Facultad Regional Cordoba. Para simplificar el problema consideremos que hay tan sélo seis estudiantes, 0 sea que el tamaiio poblacional (N) es igual a 6. (Logicamente que no usarfamos una muestra en este caso, sino que directamente recurririamos a un censo, pero a los fines del desarrollo del tema es conveniente esta simplificacion) Entonces, la poblacion queda definida de la siguiente manera Prof, Cara. Gladys M. Rouadi Wp Probabitdades y Estadistica fo a Caleularemos ahora, los siguicntes parimetros, pues serin de utilidad para demostraciones posteriores: 1- Media Poblacional (x) 2% Varianza Poblacional (o2)y Desviacién Estindar Poblacional (a) 3% Varianza Poblacional Corregida (s°?) y Desviacion Estindar Poblacional Corregida (5) 4- Proporcién Poblacional (P), considerando que nos interesa la proporcién de cesttdiantes con 2.0 menos materias aprobadas. Nuestra variable, es el mimero de materias aprobadas, que representaremos por X.. Luego: Entonces: 3) Sia =2 ==> 5, =V2 =14142 Podriamos haber calculado as, en funcién de su relacién con o%, de la iguiente forma: 666% 2=2 5 Prok Cra. Gladys M, Rovadi % Wp Probabitdades y Estadistica Y a Ss.en funcién de su relacién con 6 y , de la siguiente manera: 1,29 £ 5 4142 4) p= 22 N 6 Supongamos que se ha de extraer una muestra de 2 estudiantes (n ~ 2) mediante un muestreo aleatorio simple. ‘A cesta altura podremos preguntamos cuintas son las muestras posibles de tamatio 2 que podemos extraer de una poblacién de 6 individuos. La respuesta diferira segsin el muestreo sea con o sin reposicién, Analizaremos en primer término el Muestreo Gon Reposicién. Entonces, en general, la cantidad de muestras con reemplazo de tamatio n que viene dada por los arreglos con reposicién de N (tamatio poblacional) elementos tomados de n en n (tamatio muestral). Estos arreglos se simbolizan y definen como: Ay =N" Y para nuestro ejemplo: “AR meee es Nos interesa ahora conocer cuales son cada una de estas 36 muestras posibles. Para ello es conveniente construir una tabla de doble entrada, donde representamos al fen6meno aleatorio por el par de variables aleatorias (x1, x), donde x: es la variable aleatoria que representa todos los resultados posibles que se pueden presentar en la primera extraccion y x: es la variable aleatoria que representa todos los resultados posibles que se pueden presentar en la segunda extraccion. Légicamente que cada par de variables aleatorias, constituye una muestra posible. Asi, las 36 muestras posibles, quedan indicadas en la siguiente tabla: Prok, Cara. Gladys M. Rowadi Wp Probabitdades y Estadistica FI conjunto de toda las muestras posibles que se han confeccionado, constituyen el espacio muestral, y cada una de las muestras es un evento elemental. 4 © sea que: P. (ux) = para nuestro caso, siendo para el caso dem , OS 36 ’ Ne extracciones, 0 sea, P. (KX: tiene igual probabilidad de aparecer. es decir que cada una de las muestras yt N Ja cantidad de muestras sin reemplazo de tamano n que pueden extracrse de una poblacién de tamaiio N, viene dada por el combinatorio de N (tamaiio poblacional) elementos tomados de n en n (tamaio muestral). Las combinaciones se simbolizan y definen como: NI Cy nl(N =n)! NOTA: algunos autores reemplazan Cj, por ("). Y para nuestro ejemplo: OL 6*5*4*3*24t— 30 26-2)! Wat Q*N(4*3424H- 2 Luego, podemos extraer 15 muestras. Al igual que antes, nos interesa conocer cuales son cada una de estas muestras posibles. Para determinarlas, construimos idéntica tabla que la anterior, a la que haremos algunas salvedades. TABLA B En primer término hemos diferenciado a 3 de 3°, puesto que estos valores son elementos distintos, y al ser el muestreo sin reposicién se puede cometer el error de climinar a uno de ellos, y decimos error, puesto que de eliminar a uno de esos Prok Cra. Gladys M, Rovadi 8 Il Probabilidades y Estadistica elementos, estamos cambiando la poblacién, pues pasariamos a tener 5 elementos en ver de los 6 que constituyen nuestra poblacién bajo estudio. Por otro lado, todos Jos elementos de la diagonal principal, o sea aquellas muestras en que se repite el valor, no pueden constituir ahora el espacio probabilistico, pues el muestreo es sin reposicién, o sea que sien la primera extracci6n se ha presentado el 1, no puede volver a presentarse, por lo tanto todos los elementos de la diagonal principal no deben ser considerados. Nos quedan asi dos bloques, uno arriba de la diagonal prineipal y otro debajo. Cualquiera de ellos, pero solo uno, constituiré espacio probabilistico con 15 resultados posibles. (Obsérvese que en cada bloque, cada par es idéntico sélo que cambia el orden de presentacién de sus elementos). La probabilidad de cada evento elemental es ahora 1/15, para nuestro caso, siendo en 10 nu general de: Una ver planteada pacio. probabilistico, deduciremos la Distribucién Por Muestreo, de algunas istic La media muestral es, como toda media, un promedio de las observaciones. poblacién objeto de anilisis y definido el tamaiio muestral y Entonces, se calcula y se simboliza como: bs Cada muestra posible de tamaio n, extraida de una poblacién de N elementos, sea el muestreo, con 0 sin reposicién, daré lugar aun valor para ¥. Asi tendremos, que la cantidad de medias muestrales en el muestreo con reposicién es N" y el muestreo sin reposicion Cy, En el caleulo de la media muest intervienen las observaciones que son variables aleatorias, como con: de ello ¥ es también una variable aleatoria, uel Ahora bien, dentro de una muestra, ¥ es un Constante, pues en esa muestra es la 1 el conjunto de muestras posible ra ha de presentarse. inica media que puede calcularse, pero Fes una variable aleatoria, pues no sabemos cual mu Entonces, como a toda variable al a- su funcién de probabilidad be su espe su varianza y desviacion ‘oria, es posible caleularle: A tal fin calcularemos en primer término, los valores que ¥ puede asumir Prof. Cra. Gladys M, Rowadi » Inde Probabitdades y Estadistica |SiL.1: Muestroo Con Reposicibo. En la TABLA A, hemos definido las 36 muestras posibles, en base a ellas calculamos entonces las 36 medias muestrales. Asi, si la muestra es: L4l LD: (1,1): % 2 = 142 1,2);% =5=15 (1,2): % 2 143 (1.3% y asf sucesivamente. Construiremos ahora una tabla idéntica a Ja TABLA A, donde en lugar de cada muestra escribiremos su media muestral. Funcién de Probabilidad Obsérvese que hay valores iguales que se presentan para mas de una muestra, en tal caso, podlemos sistematizar estos valores en una tabla, tomando los valores distintos que puede asumir ¥ y caleular su probabilidad, teniendo en cuenta que cada descripeién representa un caso igualmente posible y mutuamente excluyente (no se pueden presentar juntos), de modo que las probabilidades se computan sumando el nimero de descripciones que pertenecen a cada valor en relacién al total de valores. TABLA D ‘Hemos arribado de esta manera a la funcién de probabilidades de la media muestral que constituye la Distribucin Por Muestreo de x . Prol. Cara. Chadys M. Rowadi * Inde Probabitdades y Estadistica Esperanza |i ele die beice dommstea de agalcun de la misma forma que la media de cualquier otra distribucién de probabilidades, s6lo que ahora reemplazamos a lavariable x por ¥. Para encontrar su valor construiremos la siguiente tabla de céleulos, donde ademas de P(Z,), consideraremos a n. (frecuencia absoluta). EG) =2= SE = 108 axe Ne 36 Entonces, los valores posibles de X, varian de 1 a 5, estando la distribucion centrada en 3. Este valor es el mismo que la Media Poblacional, es decir que E(X) = jt, ya sea que la poblaci6n se finita infinita. La varianza y desviaci6n estindar se calculan de la misma forma que la varianza y desviacién estindar de cualquier distibucién de probabilidades, sélo que reemplazamos ax por ©. Asi la varianza de la media muestral o varianza de es: Prol. Cara. Chadys M. Rowadi * Probabilidades y Estadistca -[eoor o, - fo? = See) —e@r - Luego para el ejemplo: - J0,8333 =0,9129 Notese que la distribucién de muestreo de ¥ no es tan variable como la de la poblacién muestreada, asi 6; = 0,9129, mientras que ox ~ 1,29. ‘9; Mide la variabilidad de las medias muestrales posibles ¥ en la distribucion de rmucstieo de ¥,y a, mide la varicion de los valores de X en la poblacion, Larelacion exacta entre 6; y oy, para muestras aleatorias simples, si el muestreo es con reemplazo (poblaciones finitas 6 infinitas) es: Y en consecuencia: ot n Comprobemos varias relaciones: 0.8833 yo} =1,666 = 1866 _ 9.833 2 =09129 yay = 1,29, luego: Prof, Cdra. Gladys M. Rouadi 2 Wp Probabitdades y Estadistica Obsérve ue ¢ inversamente proporcional al tamaio de la muestra. Esto quiere decir que Ahora bien, la distribucién de muestreo de ¥ esté basada en todas las muestras aleatorias posibles de um tamaito dado que pueden ser seleccionadas de una poblacién. No obstante en la prictica solamente se toma una muestra aleatoria, En este caso ges la distribucién de muestreo de X , um concepto iit ? La respuesta es si. Sabemos ahora , éste es tan solo uno de los muchos valores posibles que podria asumir la media de la muestra. La pregunta, entonces es, sila media de la muestra particular obtenida esta cercana a la media de la poblacién. Como nos ayuda la distribucién de muestreo de ¥ a responder a esta pregunta? TABLA D vevela que ninguna media de la 165-3) y (1-3)] materias, lo cual significa que el error posible debido al muestreo, es cuando mucho del 66%{(2/3)x100]. s, existe una ). Asi pues, podemos confiar mucho ( no) en que una muestra aleatoria simple de dos estudiantes indicara el niimero de matrerias aprobadas promedio de la poblacién con un error de no mas el 17%. 5.1.2, Muestreo Sin Reposicién En la TABLA B, hemos definido las 15 muestras posibles. En base a ellas calcularemos las 15 medias muestrales, siguiendo idéntico procedimicnto que en el caso, anterior. Prok Cra. Gladys M, Rovadi *% Inde Probabitdades y Estadistica Funcién de Probabilidad Y ésta es, al igual que antes, es la Distribucién Por Muestreo De . Esperanza qs. {23515 {e755 | [as | ans | wosas | 367515 || 10.5 {202515 | Entonces: E@ Considerando que en MSR. PC ~ 43 Lego: 2) = Asi, hemos arribado nuevamente aque E(%)= Remplazando segtin los datos: PG) -[B@)] - 5 10,666 = 08165, Prol. Cara. Chadys M. Rowadi - Probabilidades y Estadistica Si bien la E (X) es igual a p, tanto si el muestreo es con reemplazo o sin reemplazo, no sucede lo mismo con las relaciones entre: ay gt oy oY 0 Asi en el muestreo sin reemplazo: 20} Non ox [Non on ON-I Vn VN-1 EI factor recibe el nombre de factor de correccion ita, y se aproxima a 1 si el tamaiio de la poblaci6n es relativamente grande, comparado con el tamatio de la muestra, por lo cual, con el muestreo aleatorio simple de una poblacién infinita, la formula se convierte en: vn Por lo tanto, las tiltimas formulas, sélo aplicables a poblaciones infinitas, con frecuencia se usan para poblaciones finitas, siempre y cuando el tamaiio de la muestra no exceda al 5% del tamaio de la poblacién. 5.2, Distribucién Por Muestreo De La Proporcién Muestral. Recordemos que la proporcién muestral que simbolizamos por p 6 # , se define como el cociente entre el ntimero de éxitos en n pruebas, y el tamario de la muestra, En simbolos: p=P=~ Supongamos ahora, que en el ejemplo dado, nos interesa la proporcién de estudiantes con dos 6 menos materias aprobadas. También la proporcién muestral es una variable aleatoria, por lo tanto es posible calcularle: a. su funcién de probabilidad D. su esperanza . su varianza y desviacion Para ello, calcularemos en prime término los valores que puede asumir 521. Muestreo Con Reposicién En la TABLA A, se calcularon 36 muestras posibles y cada una de ellas daré lugar a una proporcién muestral , que para determinarla, 1 onamos a p= P=, donde x es el mimero de éxitos , que para nuestro caso, sera la cantidad de veces que en la muestra se presenten dos 6 menos materias aprobadas. Prof. Cra. Gladys M, Rowadi Inde Probabitdades y Estadistica Entonces, si la muestra es : (LD, x=2 (1.2), x=2 y (13), x=1 y yasi sucesivamente, hasta calcular las 36 proporciones, Las mismas se exponen en la tabla siguiente: Funcién de Probabilidad Al igual que para la media muestral, hay valores que se presentan para més de una muestra, por lo que podemos sistematizar estos valores en una tabla como sigue: TABLA G Que constituye la Distribucién Por Muestreo De La Proporcién Muestral. Esperanza Se simboliza y define: BH) =S2 P(é) a Prol. Cara. Chadys M. Rowadi * Ide Probables y Ess Entonces: Si recordamos el valor obtenido para P, proporcién poblacional, vemos que la distribucion por muestreo de P también esti centrada en la correspondiente caracteristica de la poblacién, o sea, alrededor de la proporcion poblacional 0,33. Luego, ya sea que la poblacién mnestreada sea finita © infinita, la media de la distribucién por muestreo de P es siempre igual a la proporcién de la poblacion P, es decir: E(P)=P Varianza y Desviaci6n Sténdar La variansa, se simboliza y define: o, = SPP) - [Ee = ot Notese que la variabilidad relativa de la distribucion por muestreo de Pes 100% 1(0,33/0,33) x 100), la cual es mucho mayor que la de la distribucién de ¥ de 30/43% [(0,9129/3) x 100}. Esta mayor variabilidad puede asegurarse al hecho de que P ignora el riimero de materias reales, aprobadas por los estudiantes de la muestra y considera solo sison menores o iguales a dos. Prok, Cara. Gladys M. Rowadi Inde Probabitdades y Estadistica Ahora bien, no necesitamos desarrollar la distribucién de P para calcular 0 (variacién de Pde una muestra a la otra), pues la teoria estadistica indica que, si el muestreo es aleatorio simple y con reposicién (poblaciones infinitas o finitas), entonc: Asi, reemplazando a P y n por su igual, obtenemos que: _ [033 OF ° 2 Anélogamente: 033(0,67) 2 5.2.2. Muestreo Sin Reposicién Siguiendo los mismos pasos anteriores, plantearemos los valores que P puede asumir, asi como su funcién de probabilidad, esperanza, varianza y desviacién esténdar. Entonces: Al igual que para la media muestral, en este caso los valores que P puede asumir, son los correspondientes al bloque superior 6 inferior a la diagonal principal, entonces: Fancién de Probabilidad 61S Asi, esta tabla, constituye la Distribucién Por Muestreo De P . Prol. Cara. Chadys M. Rowadi * Probabilidades y Estadistica Esperanza Al igual que antes: Luego: Entonces, en el muestreo sin reemplazo (poblaciones finitas), también se verifica que: E(P)=P. Varianza y Desviaci6n Sténdar Dein, o}= Se ee) le} = Reemplazando: Se Pe) [ee = Reemplazando: 0,089 = 0,298 En el caso del muestreo sin reemplazo (poblaciones finitas), se verifica que: PU=P) [N=n _ [0,33(0,67) [6-2 _ 9 99 n N-1 2 6-1 —— o, 39 Prok, Cara. Gladys M. Rowadi Il Probabilidades y Estadistica Anilogamente: P(Q-P) N=n _ 033(0,67) 6-2 oes n N-1 a EI factor recibe igual tratamiento que el ya anlizado para ¥ en el muestreo sin reeemplazo. 5.8, Distribuci6n Por Muestreo De La Varianza Muestral Corregida. Asi como a cada muestra le hemos calculado su media, podemos determinarle su varianza, que indicara como toda varianza, el grado de dispersion o concentracién de las observaciones muestrales respecto a su valor central Esta varianza, recibe el nombre de Varianza Muestral y se simboliza y calcula como: L Serie Simple La primera expresion corresponde a la férmula definicional (recuérdese que Ta varianza se definia como un promedio del cuadrado de las desviaciones con respecto a la media), mientras que la segunda expresi6n, constituye una formula de cileulo répido y es Ja que generalmetne utilizaremos, 2 Datos Agrupados Ee, -9? Pla) a Considerando que ™ = p(x,), luego la formula de calcul rapido se expresa como sigue: Sen, ne? $2, xo _ dn n n Definiremos a continuacién a la Varianza Muestral Corregida, concepto que sera de utilidad en los proximos capftulos, segiin veremos. Entonces la varianza muestral corregida, se simboliza y calcula: Prof. Cara. Gladys M, Ro “ Il Probabilidades y Estadistica 1 Series Simples 2 Datos Agrupados Els a ne lores par el célculo de s' y # son iguales, y la Obsérvese que los numera diferencia radica en el denominador de las formulas, n para s' y n-l para # Luego las relaciones entre ambas son: n n-1 Pes Por las mismas razones dadas en el capitulo I, al estudiar las medidas de dispersion, se puede definir la desviacién esténdar muestral y la desviacién estindar muestral corregida, Entonces la desviaci6n esténdar muestral, se simboliza y calcula: savs? Mientras que la desviacién e ga Vi? Por otro lado, las relaciones entre ambas son: vindar muestral corregida serfa: . {n s=3/7— Vin La varianza muestral corregida, por idé muestral, es también una variable aleatoria. Por lo tanto, calcularemos; s razones que las dadas para la media a: su funcién de probabilidad. b- su esperanza. 5.3.1. Muestreo Con Reposicién En base a la TABLA A, donde definimos las muestras posibles para nuestro cjemplo, calcularemos las 36 varianzas corregidas. Asi, si la muestra es (1,1), siendo ¥ 1, Prof. Cra. Gladys M, Rowadi 4 Probabilidades y Estadistica Y Gea 8 _ dept dan? n-1 2-1 2-1 =0+0=0 Sila muestra es (1,2), siendo ¥ = 1,5: (5, (= 5)* _ G=-15) , Q-15)" n=l n-1 2-1 2-1 = (-05)' + (0,5)? = 0,25 + 0,25 = 0,50 O bien: Qi +) (0? +2°) 20,5)" _ n-1 2-1 _ +8) 1025) =5-45=050 Y asi sucesivamente. ‘Luego, las vrianzas muestrales corregidas posibles son: Funcién de Probabilidad ‘Con igual criterio que el utilizado en los casos anteriores definimos la funcion de probabilidad que representa al igual que antes la Distribucin por mucstreo de $*. Asi: Y ésta es la Distribucién Por Muestreo De La Varianza Muestral Corregida. Prol. Cara. Chadys M. Rowadi e Inde Probabitdades y Estadistica Esperanza Con igual concepto, se simboliza y calcula como: Sen, EG)=358 PG) = 4 Entonces: Reemplazando: E (3) -60/36- 1,666, Pero 1,66 ¢s el valor de la varianza poblacional. Luego cuando el muestreo es con reposicién: E(®)~ of 5.3.2. Muestreo Sin Reposicién Al igual que en los casos vistos para el muestreo sin reposicién, los valores posibles para # corresponden al bloque superior o inferior de la diagonal principal, Iuego podemos detinir: Funcién de Probabilidad Y ésta es la Distribucién Por Muestreo De La Varianza Muestral Corregida. Prol. Cara. Chadys M. Rowadi * Wp Probabitdades y Estadistica Esperanza Lo simbolizamos y calculamos como: EG) = 35} Pa?) a Entonces: Reemplazando: E(#)-30/15-2 Pero 2 es el valor de la varianza poblacional corregida. Luego, cuando el muestreo es sin reposicién: EGS En resumen, hemos mostrado hasta ahora, que para cualquier estadistica de la muestra basada en un muestreo aleatorio simple de un tamaiio dado y de una poblacién especificada, existe una distribueién de muestreo de esa estadistica que indica: 1- ‘Todos los diferentes valores posibles de la estadistica de muestra que pueden ser obtenidos a partir de todas las diferentes muestras aleatorias posibles de un tamaiio dado, de la poblacién. 2 Las probabilidades de que se presenten estos valores de la estadistica de muestra. Cualquier distribucién de muestreo siempre se refiere a: 1-La poblacién espeeffica que esta siendo muestreada. 2-Un tamaiio especifico de muestra aleatoria simple. Si cambia la poblacién © el tmaiio de muestra aleatoria distribucién de muestreo. simple, obtenemos una nueva Prok, Cara. Gladys M. Rowadi Il Probabilidades y Estadistica 6.LEY DE GRANDES NUMEROS Expresa que “La probabilidad de que la diferencia entre el estadistico y el parémetro sea superior a un mimero_d, arbitrariamente elegido, tiende a 0, a medida que nitiende a”, Si simbolizamos por @ al parimetro y por 6 al estadistico, simbélicamente la ley de grandes mimeros queda indicada por: lim Pr(|6-0|>a j=0 O bien, podemos expresarla como lmPr(]6-@|sa )=1 En otras palabras, cuando el tamano de la muestra es grande, hay una probabilidad cercana a 1 de que el valor muestral (estadistico) esté cerca del valor poblacional (parametro).. Si consideramos 0= Media poblacional x ‘Media muestral Diremos Si consideramos @=P Proporcién poblacional 6=P — Proporcién muestral Diremos 7. TEOREMA CENTRAL DE LIMITE No re liamos ninguna demostracién de este teorema, nos limitamos a enunciarlo, Cualquiera sea la distribucién de la poblacién en la medida que posea varianza finita, la variable aleatoria z=2—# tenderd a distribuirse con media 0 y varianza 1, a alvn Prof. Ctra. Gladys M. Ro Il Probabilidades y Estadistica medida que 1 crece indefinidamente, donde x =, es la medida de una muestra al n azar de tamaio 1. En general, la normalidad de una distribucién de probabilidad para la media muesttal, es el llamado T.C.L. y puede ser establecido como sigue: 1) Cuando la poblacién es bastante grande y esti normalmente distribuida, la distribucién de probabilidad de las medias muestrales sera normal. 2) Cuando la poblacién no es normal, Ja distribucién de probabilidad de las medidas muestrales se aproximard a una distribucién normal si el tamafio de la muestra ¢s suficientemente grande, usalmente 30 0 més. 3) La distribucién normal de las medias muestrales tiene la media igual al valor esperado de la muestra B(e) y el error estindar o=, Los valores de Ee) y @=te6ricamente pueden ser caleulados a partir de la media sry la desviacion estindar & de la poblacién, respectivamente. Tambi a partir de ese teorema que aproximamos cualquier distribucién de probabilidad discreta a la distribucién normal para tamatios de muestra grandes, segtin Io ya analizado. 8 PARAMETROS Y ESTADISTICAS PARA VARIABLES Y PARAMETROS PARA VARIABLES ALEATORIAS. Segtin vimos, cuando se cuenta con los valores observados de la Variable bajo estudio, sea en base a una poblacién o en base a una muestra, se gene descriptivas lamadas parémetros o estadisticos. Por otro lado, si contamos con los valores posibles que una variable puede asumir, se genera una variable aleatoria, la descripcién se realiza a través de medidas que lamamos parémetros. Exponemos seguidamente una _Sintesis De Formulas, para cada una de ellos y las, relaciones existentes. Prof. Cara. Gladys M, Ro ‘6

You might also like