You are on page 1of 20
MaMaEuSch MA eats ma (I http://www .mathematik.uni- {ise mamacusch Seu Poblacién y muestra. Técnicas de muestreos Paula Lagares Barrciro’ Justo Puerto Albandoz” MaMaEuSch™ Management Mathematics for European Schools 94342 - CP - 1 - 2001 - 1 - DE - COMENIUS - C21 “Universidad de Sevilla “Este proyecto ha sido Hevado a cabo eon ayuda parical de la Comunidad Buropea en el mareo del pro- rama Séerates. Bl contenido del proyecto no refejy necesariamente la posicién de la Comunidad Europea, ri implica ninguna responsabilidad por su parte. Indice general 1. Poblacién y muestra. Técnicas de muestreo 1.1. Motivos para la realizacién de wn muestreo. Consideraciones necesarias 12. Técnicas de muestreo 1.3. Muestreo aleatorio con y sin reemplazamiento LA. Muestreo estratificado 1.5. Muestreo por conglomerados 9 16. Muestreo sistemstico 10 17. Otros tipos de muestreo ul 13 2. Un ejemplo de aplicacién de las técnicas de muestreo Capitulo 1 Poblacién y muestra. Técnicas de muestreo Vamos a ampliar en este capitulo lo que ya vimos al principio de Estadistica Deseriptiva, in- cluyendo ahora la definicién de algunas técnicas de muestzeo y de las nociones suficientes para ser capaces de decidir cuél es la técnica de muestreo mas adecuada a cada situacidn, Imagina por ejemplo que tu clase ha sido seleccionada como la muestra de una poblacién. El estudio que se vaya a realizar podria ser de diferentes temas, como los siguientes 1 La opinién sobre la posibilidad de organizar movidas altemnativas en tu ciudad, y sobre las propuestas de actividades a realizar en dicha movida. = Un sondeo sobre Ia valoracin de los diferentes lideres politicos. + La opinién sobre el destino de un posible viaje de fin de curso de los alumnos de tu nivel. {Crees que tu clase seria una buena muestra para cualquiera de estos casos? La respuesta es que, por ejemplo, para el segundo caso, los alumnos de una clase no son la muestra adecuada. Para el primer caso, es razonable pensar que pueden aportar informacién interesante, aunque la muestra puede resultar " pequeiia” y podria faltarle informacidn (chicos de otras edades, de otros barrios...) mientras que para el tercer caso, la muestra puede ser muy adecuada. Es por tanto muy importante Ia eleceién de uma téenica de muestreo que nos asegure que la muestra escogida es ’adocuada’ para el estudio que queremos realizar. 1.1. Motivos para la realizacién de un muestreo. Considera- ciones necesarias Imagina que vas a realizar estudios para conocer la siguiente informacién: = El porcentaje de espaiioles que tiene acceso a internet. = La duracién media de una determinada marca de pilas, Para el primer caso, la poblacién a la que debes preguntar es de mnés de 40 millones de personas. Es obvio que entrevistar a ms de 40 millones de personas supone un gran esfuerzo en varios sentidos. Primero, de tiempo, y segundo de dinero, puesto que es necesario contratar a muchos encuestadores, agarles viajes para que leguen a todos los pueblos, etc. Ademés, hay una dificultad afiadida: es dificil Hegar a todos y cada uno de los espaitoles, ya que cuando vayamos a entrevistar, habré gente ‘que esté de viaje fuera del pais, habré gente que esté enferma en el hospital, etc, En este caso, or motivos econdmicos, de tiempo y de dificultad de acceso a toda la poblacién, seria conveniente entrevistar a una cierta parte de la poblacién, una muestra, elegida convenientemente para poder extraer después conelusiones a toda Ia poblacién. En el segundo caso tenemos una problemstica diferente. Para poder estudiar la duracién de una pila, debemos usarla hasta que se gaste, lo que nos impide volver a usar Ia pila. Bs decir, de alguna manera "destruimos” este elemento de la poblacién. Si quisiéramos probar todas y cada una de las pilas, nos quedariamos sin ellas. En este caso, de nuevo serfa conveniente estudiar s6lo un conjunto de esas pilas y nego extraer conclusiones més generales a partir del conjunto que hemos estudiado. Por las razones anteriores, en muchos casos es conveniente el uso de muestras, pero para que podamos extraer conclisiones, es importante que elijamos bien las muestras para nuestros estudios. Por ejemplo, para el caso de el acceso a internet de los espatioles, elegir a 10 personas de 40 millones ce insuficiente, no es representativo, Tampoco lo seria preguntatle, por ejemplo a 100 personas de Madrid, o elegir a todos tus amigos y tu familia. Hay cuestiones que debemos especificar a la hora de elegir una muestra: 1. El método de soleccién de los indi iduos dle 1a poblacién (tipo de muestreo que se va a utilizar) 2. El tamaiio de la muestra, 3. El grado de fiabilidad de las conclusiones que vamos a presentar, es decir, una estimacién del ‘error que vamos a cometer (en términos de probabilidad). ‘Como ya hemos dicho, Ia seleccién no adecuada de los elementos de la muestra provoca errores posteriores a la hora de estimar las correspondientes metlidas en la poblacién, Pero podemos en- contrar més exrores: el entrevistador podria no ser imparcial, es decir, favorecer que se den unas respuestas més que otras. Puede ocurrit también que, por ejemplo, la persona que vayamos a en- trevistar no quiera contestar a ciertas preguntas (0 no sepa contestar). Clasificamos todos estos posibles errores de la siguiente manera: 1. Error de sosgo o de seleccién: si alguno de los miembros de la poblacién tiene més proba- Ddilidad que otros de ser seleceionados. Imagina que queremos conocer el grado de satisfaccidn, de los clientes de un gimnasio y para ello vamos a entrevistar a algunos de 10 a 12 de la mafiana, Esto quiere decir que las personas que vayan por la tarde no se verdn representadas por lo que la muestra no representaré a todos los clientes del gimmasio. Una forma de evitar este tipo de error es tomar la muestra de manera que todos los clientes tengan la misma probabilidad de ser seleccionados, 2. Error 0 sesgo por no respuesta: es posible que algunos elementos de la poblaciéa no quicran no puedan responder a determinadas cuestiones. O también puede oeurrit, cuando ‘tenemos cuestionarios de tipo personal, que algunos miembros de la poblacién no contesten, sinceramente. Estos errores son, en general, dificiles de evitar, pero en el caso de la sinceri dad, se suelen incorporar cuestiones (preguntas filtro) para detectar si se esté contestando: sinceramente. Después de lo que acabamos de ver, podemos decir que una muestra es sesgada cuando no es representativa de la poblacisn, 1.2. Técnicas de muestreo ‘Ya hemos hecho referencia a Ia importancia de 1a correcta eleccién de la muestra para que sea representativa para nuestra poblacién pero jc6mo clasificamos las diferentes formas de elegir una muestra? Podemos decir que hay tres Lipos de muestrvo: 1, Muestreo probabilistico: es aquel en el que cada muestra tiene la sor elegida, sina probabilidad de 2. Muestreo intencional u opinstico: en el que la persona que selecciona la muestra es quien procura que sea representativa, dependiendo de su intencién u opinién, siendo por tanto la ropresentatividad subjetiva. 3. Muestreo sin norma: se toma In muestra sin norma alguna, de cualquier manera, siendo la muestra representativa si la poblacién es homogénea y no se producen sesgos de seleccidn, Nosotros siempre haremos muestreo probabilistico, ya que en caso de elegir la técnica adecuada, es el que nos asegura la representatividad de la muestra y nos permite el caleulo de Ia estimacién de los errores que se cometen, Dentro del muestreo probabilistico podemos distinguir entre los siguientes tipos de muestreo: + Mucstreo aleatorio con y sin reemplazo + Mucstreo estratifeado, + Muestreo por conglomerades. + Mucsttco sistemético + Otros tipos de muestreo. Imagina ahora que ya has seleccionado wna muestra de un Centro de Ensefianza Secundaria (CES) en el que hay 560 alumnos. Has elegido una muestra de 28 alumnos para conocer si tienen internet en casa. Pero, (qué significa elegir a 28 de 560? {Qué proporcién de la poblacién estas centrevistando? Y a la hora de obtener conclusiones sobre la poblacién {a cudntos alumnos de la poblacién total representa cada uno de los de la muestra? Para calcular la proporcién de alumnos que estamos entrevistando, dividimos el tamaio de la rmestra entre el de la poblacién: 28/560 = 0,05, lo que quiere decir que estamos pasando la encuesta al 5% de la poblacién. ‘Ahora vamos a calcular a cudntos individuos representa cada uno de los elementos de la rauestra. Hacemos la divisién coutratia, dividimos el nimexo de individuos de la poblacién entre los de la ‘muestra: 560/28 = 20, lo que querria decir que cada uno de los elementos de la muestra representa ‘8.20 alumnos del CES, Los dos conceptos que acabamos de ver tienen la siguiente definieién formal: 1, Factor de clovacién: os el cociente entre el tamatio de Ia poblacién y el tama de la muestra, 2. Representa el nimero de lementos que hay en Ta poblaciéa por cada elensento de la muestra 2. Factor de muestreo: os cl cociente entre el tamaiio de la muestra y el tamaiio de la poblacién . Sise multiplica por 100, obtenemos el porcentaje de la poblacién que representa la muestra. 1.3. Muestreo aleatorio con y sin reemplazamiento ‘Ya hemos comentado que en caso de querer hacer muestreo de manera que la muestra sea repre- sentativa, debemos realizar muestteo probabilistico. ;Cémo harfas para seleccionar 28 alumnos de 560 dentro de un CES para que tuvieran todos la misma probabilidad de entrar en la muestra? Lo 1s sencillo seria hacer un sorteo para elegir 28, es decir, escogerlos al azar, asi todos tendrian las ‘mismas posibilidades de estar en la muestra. Este proceso de seleccién corresponde a un mucstreo aleatorio, Diremos que un muestreo es aleatorio cuando, el proceso de seleccién de la muestra garantice que todas las muestras posibles ‘que se pueden obtener de Ia poblacién tienen la misma probabilidad de ser elegidas, es decir, todos los elementos de la poblacién tienen la misma posibilidad de ser seleccionados para formar parte de lee muestra. ‘Cando un elemento es seleccionado, y hemos medido las variables necesarias para el estudio y puede volver a ser seleccionado, se dice que hacemos un muestreo aleatorio con reemplazamiento o eposicién. Generalmente recibe el nombre de muestreo aleatorio simple. En caso de que el elemento no vuelva a formar parte de la poblacién de manera que no puede volver a ser seleccionado se dice que se ha obtenido la muestra mediante un muestreo aleatorio sin reposicién 0 reemplazamiento. En algunos libros, este método recibe también el nombre de muestreo investrictamente aleatorio. Para nuestro ejemplo al clegir la muestra entre los 560 alumnos del CES, si vamos a preguntar por el hecho de que posean intemet en casa, no nos interesa preguntarle dos veces a la misma persona, Tuego una vez elegido un elemento de la muestra no quexemos volverlo a seleccionar. Realizarfamos pues un muestreo aleatorio sin reposicién o sin reemplazamiento. Aunque los dos métodos son diferentes, cuando el tamatio de la poblacién es infinito, o tan ‘grande que puede considerarse infinito, ambos métodos nos llevarin a las mismas concusiones. Sin embargo, si la fraccién de mnestreo n/N es mayor que 0,1 (amestreamos mas del 10% de la poblacién) la diferencia entre las conclusiones que se obtienen pueden ser importantes, ‘Al preguntar en nuestro ejemplo si los alumnos tienen o no internet en casa, nos interesa conocer tanto el mimero ce alumnos que tiene internet como la proporcién que eso supone dentro del centro, Estos dos valores, igual que la media para otros casos (por ejemplo si preguntamos por la altura), son los parametros mas ealculados y que habitualmente queremos estimar. Para cl easo del rmuestreo aleatorio tanto con reposicién como sin reposicién, estos estimadores vienen dados por las expresiones: Total: Media: Proporcisn La proporcién seria la media de una variable que toma valores cero 0 uno. En las anteriores expresiones: X; es el valor de la variable que estamos estudiando. N es el tamafio poblacionall nes ol tamaiio muestral Pes una variable que toma los valores 0 6 1 La estimacidn del error para estos estimadores seria: Total: Para el nmestreo con reposicién’ Para el muestreo sin reposicién: Media: Para el xauestreo con reposicién’ Para el muestreo sin reposicién: Proporeisn: Para el muestreo con reposicién: Para el xauestreo sin reposicién: 1.4. Muestreo estratificado Tmagina ahora que queremos hacer una estudio para saber a qué dedican su tiempo libre las personas que viven en tu ciudad. Todos sabemos que los ancianos no realizan el mismo tipo de actividades que los jovenes, ni tampoco que las personas de mediana edad, como por ejemplo tus padres, Nos interesaria entonces que toda esta informacién que tenemos de antemano nos ayude a construir una muestra més significativa, De hecko, nos interesa que todos esos colectivos estén representacios en nuestra muestra. A los colectives que hemos defini, en este caso por edad, los llamaremos estratos. Lo que haremos sera dividir muestra muestra de manera que haya represen tantes de todos los estratos, Vamos a defnirrigurosamente la manera de hacer un muestreo en este ‘Consideramos que tenemos la poblacign de tamatio NV dividida en & subpoblaciones de tamafos Mi, Nay---1 Me. Dichas subpoblaciones son disiuntas y cumplen que Nyt Na-+o>- + Ny = N. Cada tna de las subpoblaciones se denominan estratos. Si deseamos obtener una muestra de tamaiio nde la poblacién inicial, seleccionamos de cada estrato una muestra aleatoria de tama n, de manera, que ny tng +0 tne {Qué ventajas¢ inconvenientes presenta el muestico estzatificado? Las vemos a continua. Ventajas = Podemos tener informacién con més precisién dentro de las subpoblaciones sobre la earac~ teristica objeto del estudio, + Podemos aunnentar la precisgn de los estimadores de las earactrfsticas de toda la poblacion Inconvenientes: + La cleceién de tamatio de Ins muestras dentro de eada estate para que el total sca + La divisin en estratos en algunas poblaciones puede no ser sencilla En general, el muestreo estratificado proporciona mejores resultados que el muestreo aleatorio, mientras més diferentes sean los estratos entre sf y més homogéneos internamente, Podemos cousiderar 3 métodes para distribuir el tam de la muestra entre los estratos 1, Proporcionalmente al tamafio de cada estrato, es decir, si tomamos el estrato j-ésimo de tamafio Nj, entonces una muestra de dicho estrato sera de tamaiio n-- (Nj/N), siendo N el total de la poblacién y n el tamafio de la muestra, 2. Proporcionalmente a la variabilidad de la caracterfstica que estamos considerando en cada strato. Por ejemplo, si conocemos que la varianza en la altura de los alumnos es de 15 em y con las alumnas es de 5 em, la proporcisn de los alurnos es 3 a 1 y la muestra deber guardar esa proporcidn. 3. Se asigna cl mismo tamaiio a cada estrato. Como consccuencia se favorece a los estratos més pequedios y se perjudica a los grandes en cuanto a precision Para el caso del muestreo estratificado, los principales estimadores vendrian dados por las sigu- ientes expresiones: ‘Total: ‘Media: Proporci6n: dante ‘X es la media muestral de la variable X en el estrato h. Np es el tamato del estrato fh evel mao poblacional to cel tata mieetral en 8 etrat h freee tamazo muestra Dy es la proporcién mucstzal dela vasiableen el estrato h y la estimacién del error que cometemos al estimar los pardmetros poblacionales viene dado por: ‘Total i ee downa— w 8, yo SK 4] Media: P= Yow sozh, In y SR ti Proporcién: Jos mismos significados que antes, m1) ‘ a5 2 PQs duke b> donde Oy =1~ Pe 1.5. Muestreo por conglomerados Nos planteamos hacer un estudio de la altura de los alumnos de Secundaria de tu ciudad. En ugar de hacer un muestreo de tados los chicos de tu ciudad podriamos plantearnos elegir algunos barrios, ya que con respecto a la altura, los barrios son como “pequeiias poblaciones” comparables a la ciudad. En este caso jpodemos simplificar la eleccién de la mmuestra al elegir los barrios sin perder precisidn? La respuesta es que en este caso, podriamos elegir barrios y analizar las alturas de los estudiantes de cada barrio sin perder precisién. Vamos a ver el método que nos lo permite. En el muestreo por conglomerados, la poblacién se divide en unidades 0 grupos, IIamados com- lomerados (eneralmente son unidades 0 éreas en los que se ha dividido la poblacién), que deben ser lo mis representativas posible de la poblacién, es decir, deben representar la heterogencidad de la poblacién objeto del estudio y ser entre sf homogéneos. El motivo para realizar este muestreo es que a voces resultaria demasiado costoso realizar una lista completa de todos los individuos de la poblacién objeto del estudio, o que cuando se terminase de realizar la lista no tendsfa sentido la realizacién del estudio. El principal inconveniente que tiene es que si los conglomerados no son homogéneos entre sf, la ‘muestra final puede no ser representativa de la poblacién. Suponiendo que los conglomerados sean tan heterogéneos como la poblacidn, en relacién a las variables estudiadas, y que entre si sean homogéneos, para obtener una muestra bastard con se- leccionar algunos conglomeradas, En este caso se habla de muestreo por conglomerados de una etapa. El muestreo por conglomerados tiene la ventaja de simplificar Ia recogida de las informaciones muestrales, ‘Veamos ahora la expresin de los estimadores cuando trabajamos con esta técnica de muestreo. Total: ‘Media: Proporcisn: dopde X, es el total de la variable X en el conglomerado i , es In media muestral de la variable X en el conglomerado i N es el atimero de conglomerados de la poblacién, ‘M es el tamaio poblacional. ‘es el niimero de conglomerados de la muestra. -M; es el tamafo del conglomerado i. Aes el total de una variable A, que toma el valor 0.6 1 en el conglomerado i, de los errores que cometemos al hacer estas estimaciones son los siguientes: 7 Ses My? Media: Proporcién: VP) 1.6. Muestreo sistematico Se nos puede ocurrir otra manera de muestrear. Imaginemos que en tu centro hay 560 altumnos yy hemos decidido elegir uma muestra de de 28 personas. En este caso el factor de clevacién sexfa de 560/28 = 20. Numeramos a os alumanos del 1 al 560. Elegimos entonces un miimero a al azar entre 1 y 20 y ese seria el primer alunsuos seleceionado, el que oeupa el lagar 2. Luego tomamos el +20, 2+ 2-20 y asi sucesivamente. No es un muestreo aleatorio porque todas las muestras no son igualmente probables. Vamos a definr este tipo de muestreo. Supongamos que tenemos ana poblacién que consta de N elementos, ordenados y numerados del | hasta Ny y descamos obtener una muestra de tamasio n. Dicha poblacida la podemos dividir en n subconjuntos, cada uno de ellos con v = & elementos, es decir, cada subconjunto consta de tantos clementos como indica el factor de elevacin ‘Tomamos aleatoriamente un elemento de los enumerados desde 1, 2 hasta %, y lo lamamos 26; después se toman los siguientes elementos 29 + ¥, 29 + 20, ag + 30, Zp + Bn caso de que w no sea entero, se redondea al entero menor, con lo que puede que algunas muestras tengan tamaiio n ~ 1. Este hecho introduce una pequeila perturbacién en la teoria del anuestreo sistemistico, que es despreciable si n > 50. Bate tipo de muestreo requiere que previamente nos hayamos asegurado de que los elementos or- denados no presentan periodicidad en las variables objeto de estudio, puesto que si hay periodicidad yel periodo esté préximo al valor v, los resultados que se obtengan tendrdn grandes desviaciones y no tendrén valider El muestreo sistemiético es equivalente al muestreo aleatorio si los elementos se encuentran cemumerados de manera aleatoria Las ventajas de dicho método son: 1. Extiende la muestra a toda la poblaciéa, 2. Bs de facil aplicacién, Los inconvenientes que presenta son: 10 1, Aumento de la varianza si existe petiodicidad en la numeracién de los elementos, produciéndose ‘sesgo por seleccidn, 2. Problemas a la hora de la estimacién de la varianza. Puede considerarse tun caso particular del muestreo por conglomerados, estando cada uno de ellos formado por los siguientes elementos que ocupan en Ia lista el lugar: Primer conglomerado: 1, 1+, 1+2v, 1+3v, 1 +40, Segundo conglomerado: 2, 2+ v, 2+2u, 2+3u, 2+4v, imo conglomerado: v, 20, 3v, 40... nv. Seleccionar una muestra sistemstica equivale a seleccionar al azar un tinico conglomerado. Para cello es necesario que cada wn de Jos conglomerados definidos tengan tna composicidn similar a la poblacién. ‘También puede considerarse como un caso particular de muestreo estratificado con un niimero de estratos igual a n, cada uno de ellos con v elementos de manera que en cada estrato se elige un ‘nico elemento. En el muestreo estratificado el elemento scleccionado en cada estrato es aleatorio, mientras que cen el sistemético se elige de forma aleatoria al primer elemento quedando los restantes determinados or el factor v. Los estimadores para este tipo de muestreo son: ‘Total: » Media: Proporeisn: donde P es wna variable que toma los valores 06 1 1.7. Otros tipos de muestreo El muestreo bietdpico es un caso particular de muestreo por conglomerados en el que en la segunda etapa no se seleccionan todos los elementos del conglomerado, sino que se seleccionan tun determinado asimero de elementos de cada conglomerado de manera aleatoria. Los conglomerados de primera etapa se denominan unidades primarias, los de segunda etapa, secundarias. El muestzeo polietépico es una generalizacién del anterior, de manera que cada conglomerado puede estar formado a su vee por otros conglomerados y asi sucesivamente en varias etapas, u En general, para realizar estudios complejos se utilizan los conceptos de estratificacién, conglom- cerados y muestreo aleatorio, Por ejemplo, la poblacién de un pais se podria dividir en conglomerados (provincias, municipios, barrios) que pueden ser bastante heterogéneos internamente (por ejemplo, para estudiar la renta per cépita), pero bastante homogénoos entre si. Luego es nevesario clasificar estas unidades en estratos homogéneos (unidades primarias, por ejemplo los barrios). Cada una de ‘estas unidades primarias se divide en nuevas unidades (bloques de casas) lamadas secundarias, que se dividen en las casas concretas. La muestra se tomaria: 1. Seleccionando una muestra estratificada, de cada estrato (barrios), se toma al menos uno. 2, Se eligen al azar varios bloques de casas dentro de cada barrio seleccionado. 3. Se toman aleatoriamente una o varias casas dentro de los bloques seleccionados, 12 Capitulo 2 Un ejemplo de aplicacién de las técnicas de muestreo Hemos decidido realizar un estudio en un Centro de Ensefianza Secundatia, Queremos conocer datos sobre el niimero de alumnos que son zurdos del centro, del mimero de alumnos que tienen internet en casa, de la altura de los alumnos del centro y de la paga que reciben semanalmente. El hecho de estudiar el numero de eurdos de un centro es una informacién til para el propio ‘contro, ya. que éste debe disponer del equipamiento adectado para ellos, por ejemplo, sillas de pala adaptadas. La conexidn a intemet en casa es ya, en estos tiempos, un dato fundamental, Esta informacion puede ser utilizada tanto para sondear la postbilidad de oftecerle al alumno material a través de internet, tanto para conocer el potencial acceso de éstos a material didéctico en la web. El estudio de la altura es un clisico, Es interesante, de cualquier forma, conocer si realmente la altura evoluciona con los aiios y los espaiioles de hoy son mas altos. La paga es un dato social relevante, Es también interesante conocer de qué dinero disponen. habitualmente los chicos de edades adolescentes para comprender a qué dedican su tiempo. ‘Con estas premisas, decidimos hacer un muestreo para poder obtener conclusiones sobre todos Jos alumnos del CES sin tener que preguntar a todos y cada uno de ellos. La informacién de la que partimos es de la distribucién de aluranos por grupos y niveles en el centro: A[B[C[D | 6 | Tol T7ESO | 33 [20 5 20 | 15 | 50 65, 20 [15 | 26 [TF 75 7 | aT |B 79) T Bach [35 | 28 | 30 [31 [2] 145 [2 Bach [30 [34 [32 [ar | Luego estamos trabajando con una poblacién de 544 alumnos de un Instituto de Ensehanza Secundaria Partimos de una premisa, vamos a utilizar un tamayio de muestra de alrededor de 60 alumnos, ‘que es e] maximo que se nos permite y que nos parece suficiente para el estudio que vamos a realizar ‘Ya podemos obtener la primera informacién entonces, nuestra fraccién de muestreo sera n_ 60 ; f Fe 8102, cs decir, vamos a muestrear aproximiadamente un 11 % de la poblacién, Podemos caleular nuestra factor de elevacién, que s 5a nn 60 6 lo que es lo mismo, cada alumno entrevistado representa aproximadamente a 9 compafieros. Ahora tenemos que decidir qué método utilizamos para muestrear para las diferentes carac- cas que vamos a estudiar. Vamos a llamarlas de la siguiente manera: g 94, 1 X representard a La altura, 1 ¥ representaré a la paga, = Z xeprosentard a la variable "sor zurdo” que valdré 1 en caso de serlo y 0 en caso de ser distro 1 representa ala variable "tener internet en casa” que valdré 1 en caso de que se tenga internet ‘en casa y 0 en caso contrario. ‘Vamos a diferenciar dos casos de entre las 4 variables. Lo primero que nos hacemos es una pregunta: tenemos la poblacién dividida en niveles y en grupos {podemos considerar que esta division tiene influencia en alguna de estas variables? Es decis, jpademos considerar que en cada nivel, por ejemplo, la media de las alturas podria variar? La respuesta a esta pregunta es que por logica, si que lo haré. A priori, podemos suponer que la edad es una variable que tiene una influencia, importante para la altura. ;¥ para la paga? Pues también la edad es importante, puesto que a todos znos han ido aumentando la paga conforme hemos ido ereciendo, ;Ocurre lo mismo con el ser zurdo? Pues no, cuando uno es zurdo, lo es desde que nace, luego la edad no tiene ninguna influencia, Igual ocurre con el hecho de tener internet en casa. Nuestra técnica de muestreo elegida sera pues, diferente para estos dos grupos de casos. Caso I: Variables paga y altura Ya hemos visto que tenemos la poblacién dividida por cursos y por grupos. Para nosotros, la divisién en cursos es una divisién por estralos porque los cursos son homogéneos dentro de ellos con respecto a la edad (y podemos pensar que también con respecto a la paga y a la altura), y ‘como hemos visto que la edad tiene influencia en nuestras dos vatiables, tiene sentido pensar que nos interesa que haya representantes de todos los estratos en nuestra muestra. Laego en estos casos, nuestra cleccida es un muesineo aleatorio estratificade. Lo siguiente que debemos decidir es cl tamaiio muestral dentro de cada uno de los estratos, es decir, la afijacion. ‘Tenemos 6 estratos con los siguientes tamaiios: u Earate Tama (strato 1) [N= 53 (estrato2)__| Na = 65 (estrato 3) Na = 75 TF de FSO (estrato#) | Ny= 79 N= 2 de Bachillerato (estrato 6) | Ne= 127 T? de Bachillerato (eslrato Lo mis ldgico en este caso es utilizar afijacién proporcional, es decir, hacemos que los tamaios de los estratos guarden la mismas proporciones que los tamafios de los estratos. Caleulamos entonces el tamatio de la muestra en cada estrato a través de la siguiente formula: noms Juego obtenemos los siguientes tamaiios muestrales: ny = 60 8 = 5,84 luego tomamos my = 6. na = 60 16 Iuego tomamos nz = & nig = 60. 2 = 8.27 Inego tomamos ns = 8. nig = 60-2 = 8,71 nego tomamos ng = 8. ns 15,99 nego Lomamos ns = 16, ne 14,00 Inego Lomamos ng = 14, donde los redondeos se ban hecho para mantener el tamafio muestral 60 que habiamos acordado. Lugo ya tenemos los tamafios miestrales que necesitamos y podemos hacer un muestreo aleato- rio dentro de cada estrato para seleccionar el néimero de alunos que indica el correspondiente tamafio muestral del estrato Nuestros datos son los siguientes: Para la altura, obtuvimos Tstrato 1 | 165 | 161 | 15 | 150 | Ti | Tos Estrato 2 | tat | tor | 168 | 162 [165 [iri | 160 | Tor Estrato 3 | 168 | 165 [175 | 175 | 165 | 16s | 165 | 165 Estrato 4 | Tod | 171 | 177 | 16s | 170 | ies | 160 | 175 Estrato 5 [175 [173 | 161 | 158 [175 | 16d | 158 [ 161 TH [17s | 10 | 1a | os T7185 Estrato 6 | 190 | 178 | 194 | 18m [165 | 170 | 176 | 1s | t6s | rea | Tre | 18s pare |e Y para Ia pagai [ExatoT [WT 0 [ss [0 [0s Estratlo2[ 05] 0 fislop>s]2 [0 Estratod 5 | S| S [0 [w] 6 [ow Tstratod 2] 6 Ps [pe] 6 polo Estrato5 [5 [IO] 2 [15 [| [soz | ww] |» [wl a wl [Esrato@ zoo fe [8 [eap is fo [2 pops fw po Lo. Vamos ahora a proceder a hacer las estimaciones. Lo primero que hacemos es ealeular las medias de los diferentes estratos, que nos van dando informacién de cémo se comportan los diferentes estratos. Postcriormente, calcularemos la estimacién de la media de altura y de paga de los alumnos 15 del centro y la acompatiaremos de Ia estimacién del error cometido al realizar dicha estimacién. Hacemos el proceso independientemente para cada una de las dos variables: Para la altura tenemos: Tatrato Media Cuasivarianza T Fa bss 32 = 86 2 Fo = 164,625 _| 5% = 21,4107 3 Tel Sf, = 22.so8 [7 = 168,195 | 52, = 36,0061 5 To9,s125_| S%, = 81 6058 6 [me =r 6esT | 82, = o7ATS | ‘A primera vista ya observamos um resultado eurioso. La media es reciente segiin aumentamos de curso, Esto nos lleva a pensar que la eleccién de un muestreo estratificado ha sido adecuada para este caso, Pasamos a calcular abora nedia y cuasivarianza para la paga por estratos: Cuasivarianza Ta = 58857 Ahora calculamos la media estimada a partir de la muestra completa y la estimacién del error cen términos de la estimacidn de la varianza para las dos variables que estamos estudiando. Para la altura: saoos « 2-167 698 164,625 + 2 167.625 + 127 169.3125 + * -177,642857 — 168.9163, La expresién de la varianza es ¥) = Yo wha E a rd he = Ops W008 Ta 2 [ones Dona D876 3s = ost Doors TAN 1 [= ois [one] $= 0.1012 Posie 5 [EE = os08 [o0e7s | ge = ony [oseoT 6 = ore Foose |S = o.n07 Poser] 16 Ahora sustituimos estas cantidades en la expresién de la estimacién de la varianza y nos queda y= wk — A 3 — 0,009 0.8868 St yoo o,s769. 2! a foo1s o,g034.2 het * . 3020508; 2824 goer. ossor 282 oasis. ost, HS —o.n8 Luego para el caso de Ia altura ya tenemos nuestras estimaciones. La altura media estimada es 168.9463 y caleulamos que cometemos un error de 0.728. Pasamos ahora a hacer los mismos céleulos para la paga. Empezamos por caleular la media cestimada: 65 i 79 276+ BND + BP B25 + T6625 M5 17 bay 151875 + 8.8857 = 8.8633, La estimacién de la varianza la podemos caleular dizectamente ya que los valores de wh y fi son los mismos k x o a a 4,026 ray. 20:8107 33,3571 FOF) = Sok fa) SE = 0.000-0,8868- => + 0,014 0.8769, SF + 0,018: 0.8934, 25,4107 101,2291 35,229 40,02 -0,8988 + 0,0675 -0,8807- == 40,0518 -0,8808- = = 0,666. (Caso Il: Variables "Ser zurdo’ y "Tener internet en casa’ Ahora queremos estudiar las variables ’ser aurdo! y "tener internet en casa’. Es obvio que la division en estratos no es efectiva en este caso, as{ que debemos pensar en otro tipo de técnica de muestreo, Seguimos queriendo muestrear alrededor de 60 alumnos. Podrfamos pensar que frente a estas variables, los grupos en los que est dividida la poblacién se comportan como pequefias poblaciones, es decir, podemos considerar que los grupos se comportan aproximadamente como todo el centro. Ademés, nos resulta interesante la posibilidad de muestrear los grupos porque seleccionar ‘una muestra alentoria de alumnos, localizarlos y entrevistarlos no es una tarea sencilla. ‘Ahora bien, {qué son los grupos para nosotros? Pues ya hemos dicho que interiormente se comportan como pequefias poblaciones con respecto a nuestras variables, mientras que entre ellos son similares. Estamos hablando de que tenemos la poblacin dividida en conglomerados, luego para este caso aplicaremos el muestreo por conglomerados. Lo siguiente que tenemos que decidir es el mimero de grupos que vamos a muestrear. Como los grupos no son reguilares on tamatio, 263 grupos nos asogurarian estar rondando los 60. Para evitar la posibilidad de muestzear dos de los grupos pequefios y que nos quede una muestra excesivamente pequeita para lo que pretendemos, decidimos seleceionar 3 geupos de entre todos los del centro. ‘Asi pues, los datos que hemos obtenido son los siguientes. Para la variable ‘ser 2urdo' 7 Grupo 1 10001000000000100000, Grupo 2: 00000000000000000000000, Grupo 3: 0000000000001000100000000, 1 significa que es zurdo y 0 que no lo es. Ahora, para la variable tener internet en casa, hemos obtenido: Grupo 1 10010101011110100100, Grupo 2: 11101101101001111111110, Grupo 3: 1101011110111111011101111, donde, en este caso, 1 significa que tienen internet y 0 significa que no tienen. Pasamos ahora a caleular las estimaciones del total de wurdos y de la proporcién de zurdos, como del total de alumnos que tienen internet en casa y Ia proporcién de alumnos que tienen internet en casa. Caleulamos el total y la propor mn para cada grupo y cada variable: Taos Tatemet Grupo | Total | Proporcién | Total | Proporcign T 3 O15 10) Om 2 a 0 TT 7301 3 z 0s 20 os Ahora ya podemos caleular las estimaciones de la proporcién y del total de las variables Ze I Comenzamos por la variable Z: B+O+2 5 5 = ee e005, - aq 1OTIT+20 2 a7 i oa = 375, we Dhl HIT +2047 TS SEM 2+ W+ I OS Pasamos ahora a calcular la estimacién del error que estamos cometiendo en nuestros ealculos a la variable ’ser zurdo’ 0.6911 NU 2 2121=3)1 9g or96- a0)? 4 0 -00786-28)° 4 ¢ ViZ)= ZM.) = Bers (3 — 0,0735 - 20)? + (0 — 0,0735 - 23)? + (2 00736 25)"] = 329,18. 105) = SOP Pex Paty = BRAD or 20)? + (0 0.0735. 28)2 + (20,0735 .25)°] = 0.00111, Pasamos ahora a calcular los errores estimados para la variable ‘tener internet en casa’, 7q-XO—) 2A) [10 0.601120)? + (17 ~0,6911-28)® +20 ~0,6011-25)] = 464,128 ee lea oom 20)? + (17 — 0,6911 - 23)? + (20 — 0.6911 -25)?] 00049 19

You might also like