You are on page 1of 18
ESTADISTICA INFERENCIAL UNIVERSIDAD VERACRUZANA FACULTAD DE ADMINISTRACION Y ADMINSTRACION TURISTICA DIABET INFERNGL TEMA TAMANO DE LA MUESTRA. Canales Hernandez Anabel Escobar Martinez Marisol Fernandez Zapata Ana Karen Gonzalez Lopez Ana Karen Jiménez Flores-Jessica Mufioz. Rivera Claribel Torres Utrera Brenda Lilian f Reyes Ovalles Anahi , Mua. A Elsa Retureta Alvarez Pagina 1 ESTADISTICA INFERENCIAL TEMA: TAMANO DE LA MUESTRA APLICACION El determinar el tamafio de una muestra representa una parte esencial del método cientifico para poder llevar a cabo una investigacién. Al muestreo lo podemos definir como el conjunto de observaciones necesarias para estudiar la distribucién de determinadas caracteristicas en la totalidad de una poblacién, a partir de la observacién de una parte o subconjunto de una poblacién, denominada muestra. El calculo del tamafio de la muestra es uno de los aspectos a concretar en las fases previas de la investigacién comercial y determina el grado de credibilidad que concederemos a los resultados obtenidos Al definir el tamafio de la muestra, nosotros deberemos procurar que ésta informacién sea representativa, valida y contiable y al mismo tiempo nos represente un minimo costo. Por lo tanto, el tamafio de la muestra estara delimitado por los objetivos del estudio y las caracteristicas de la poblaci ademés de los recursos y el tiempo de que se dispone. Mua. A Elsa Retureta Alvarez Pégina 2 ESTADISTICA INFERENCIAL GLOSARIO DE TAMANO DE LA MUESTRA CONCEPTO DEFINICION TRADUCCION Es una afirmacién con respecto a una HIPOTESIS distribucion de probabilidad. Mua. A Elsa Retureta Alvarez Pagina 3 ESTADISTICA INFERENCIAL Se llama muestra a una parte de la poblacion a MUESTRA estudiar qué sirve para representarla. Una poblacién se precisa como un conjunto finito 0 POBLACION infinito de personas u objetos que presentan caracteristicas comunes. PORCENTAJE DE CONFIANZA (CONFIANZA) PORCENTAJE DE ERROR VARIABILIDAD Es el porcentaje de seguridad que existe para generalizar los. resultados obtenidos. Equivale a elegir una probabilidad de aceptar una hipstesis que sea falsa como si fuera verdadera, 0 la inversa: rechazar a_hipstesis verdadera por considerarla falsa. Es la probabilidad (0 porcentaje) con el que se acepté y se rechaz6 la hipétesis que se quiere investigar en alguna investigacién anterior o en un ensayo previo a la investigacién actual. FORMULARIO Mtra.A Elsa Retureta Alvarez Pagina 4 gb. ESTADISTICA INFERENCIAL TAMANO DE LA MUESTRA caso ESTADISTICO 2 ane —s donde: n= esl tamafio de la muestra; Z = 5 el nivel de confianza; E = es la precision o error. © = esa varianza a3 - Nar 752 ESTIMAR LA MEDIA (NDE 20/2 donde: s el tamafio de la muestra; s el nivel de confianza; NV = es el tamafo de la poblacién; © = esa varianza E = es la precision ol error. ne ESTIMAR LA PROPORCION donde: Mua. A Elsa Retureta Alvarez Pagina 5 ESTADISTICA INFERENCIAL sel tamafio de la muestra; es el nivel de confianza; s la variabilidad positiva; s la variabilidad negativa; s la precision o el error. mMODNS 2 Nene a (NA) BP+ 25 /2P9 donde: n= es el tamaiio de la muestra; es el nivel de confianza; es el tamafio de la poblacién s la variabilidad positiva; s la variabilidad negativa; E = es la precision 0 error Zz N Pp q INTRODUCCION TEORIA Mua. A Elsa Retureta Alvarez Pagina 6 ESTADISTICA INFERENCIAL En Estadistica el tamario de la muestra es el numero de sujetos que componen la muestra extraida de una poblacién, necesarios para que los datos obtenidos sean representativos de la poblaci6n. Para calcular el tamafio de una muestra hay que tomar en cuenta tres factores: 1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la poblacién total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacion. 3. El nivel de variabilidad que se calcula para comprobar la hipétesis. La confianza o el porcentaje de confianza es ol porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero también implica estudiar a la totalidad de los casos de la poblacion. El error 0 porcentaje de error equivale a elegir una probabilidad de aceptar una hip6tesis que sea falsa como si fuera verdadera, 0 la inversa: rechazar a hipdtesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamajio que la poblacién, por lo que conviene correr un cierto riesgo de equivocarse. La variabilidad es la probabilidad (0 porcentaje) con el que se acepté y se rechazé la hipétesis que se quiere investigar en alguna investigacién anterior o en un ensayo previo a la investigacién actual. El porcentale con que se aceptd tal hipétesis se denomina variabilidad positiva y se denota por p, y el porcentaje con el que se rechaz6 se la hipdtesis es la variabilidad negativa, denotada por q. Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad: p+q=1. Ademas, cuando se habla de la maxima variabilidad, en el caso de no existir antecedentes sobre la investigacién (no hay otras 0 no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5 Una vez que se han determinado estos tres factores, entonces se puede calcular el tamafio de la muestra como a continuacién se expone. SUPUESTOS Y RESTRICCIONES. Mua. A Elsa Retureta Alvarez Pégina7 ESTADISTICA INFERENCIAL SUPUESTOS El tamafio de la muestra depende de tres aspectos: 1) Error permitido 2) Nivel de confianza estimado 3) Cardcter finito 0 infinito de la poblacién. Las formulas generales para determinar el tamafio de la muestra son las siguientes: Para poblaciones infinitas (mas de 100,000 habitantes) Para poblaciones finitas (menos de 100,000 habitantes) Nomenclatura: n= Numero de elementos de la muestra N= lamero de elementos de la poblacién 0 universo P/Q = Probabilidades con las que se presenta el fenémeno. 22 = Valor critico correspondiente al con valor zeta 2, luego Z = 2. | de confianza elegido; mpre se opera E = Margen de error permitido (determinado por el responsable del estudio). Cuando el valor de P y de Q sean desconocidos 0 cuando la encuesta abarque diferentes aspectos en los que estos valores pueden ser desiguales, es conveniente tomar el caso mas adecuado, es decir, aquel que necesite el maximo tamafio de la muestra, lo cual ocurre para P = Q = 50, luego, P = 50 y Q = 50, RESTRICCIONES A la hora de determinar el tamafo que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el pardmetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de calculo del tamafio muestral delimitemos estos factores. Mua. A Elsa Retureta Alvarez Pagina 8 ESTADISTICA INFERENCIAL Parametro. Son las medidas o datos que se obtienen sobre la poblacién. Estadistico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacién de los parametros. Error Muestral, de estimacién o Standard. Es la diferencia entre un estadistico y su parametro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en tomo al valor de la poblacién, nos da una nocién clara de hasta dénde y con qué probabilidad una estimacién basada en una muestra se algja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigacién nos indicara hasta qué medida podemos cometerlo (los resultados se someten a error muestral © intervalos de confianza que varian muestra a muestra). Varia segin se calcule al principio o al final. Un estadistico seré mas preciso en cuanto y tanto su error es més pequefio. Podriamos decir que es la desviacion de la distribucion muestral de un estadistico y su fiabilidad. Nivel de Confianza. Probabilidad de que la estimacion efectuada se ajuste a la realidad. Cualquier informacién que queremos recoger esta distribuida segtin una ley de probabilidad (Gauss 0 Student), asi llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadistico capte el verdadero valor del parémetro. Varianza Poblacional. Cuando una poblacién es mas homogénea la varianza es menor y el ntimero de entrevistas necesarias para construir un modelo reducido del universo, 0 de la poblacién, seré mas pequefio. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos. FORMULAS Vamos a presentar dos formulas, siendo la primera la que se aplica en el caso de que no se conozca con precisién el tamafio de la poblacién, y es: Mua. A Elsa Retureta Alvarez Pagina 9 ESTADISTICA INFERENCIAL pes la variabilidad _positiva; q es [a variabilidad negativa; Donde: E esa precision o error. n es el tamafio de la muestra: Z es el nivel de confianza; Hay que tomar nota de que debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, hay que convertir todos esos valores a proporciones en el caso necesario. También hay que tomar en cuenta que el nivel de confianza no es ni un porcentaje, ni la proporcién que le corresponderia, a pesar de que se expresa en términos de porcentajes. El nivel de confianza se obtiene a partir de la distribucion normal estandar, pues la proporcién correspondiente al porcentaje de confianza es el area simétrica bajo la curva normal que se toma como la confianza, y la intencién es buscar el valor Z de la variable aleatoria que corresponda a tal area. En el caso de que si se conozca el tamafio de la poblacién entonces se aplica la siguiente formula: Donde: ZpgN n es el tamafo de la muestra; "=a Z es el nivel de confianza: NET +E P ee pes la variabilidad —positiva; ges la variabilidad negativa N es el tamaio de la poblacién: E es la precision 0 el error. La ventaja sobre la primera formula es que al conocer exactamente el tamafio de la poblacién, el tamafio de la muestra resulta con mayor precision y se pueden incluso ahorrarse recursos y tiempo para la aplicacién y desarrollo de una investigacién. TABLAS Para obtener el calculo adecuado del tamafio de la muesira, la formula exige un determinado nivel de confianza, el cual se puede consultar por medio de una tabla con valores estandar. Los valores Z, segiin la seguridad y 2) segtin el poder se indican en la Tabla siguiente. Mua. A Elsa Retureta Alvarez Pagina 10 ‘Se ESTADISTICA INFERENCIAL Tabla 2. Valores de Za y Zp mas frecuentemente Pret ir Za 5 Test unilateral | Test bilateral 0.200 0.842 1.282 0.150 1.036 1.440 0.100 1.282 1.645 0.050 1.645 1.960 0.025 1.960 2.240 0.010 2.326 2.576 Potencia b (1b) Zo 0.01 0.99 2.326 0.05 0.95 1.645 0.10 0.90 1.282 0.15 0.85 1.036 0.20 0.80 0.842 0.25 0.75 0.674 0.30 0.70 0.524 0.35 0.85 0.385 0.40 0.60 0.253 0.45 0.55 0.126 0.50 0.50 0.000 UTILIDAD El tamafio de la muestra nos permite obtener una cantidad significativa de la poblacién que abarca nuestro campo de investigacién, por lo tanto es de gran utilidad; ya que reduce el tiempo y los costos de una investigacién, agiliza el proceso de esta y se obtienen resultados significativos para la investigacion. Es por eso que para su mejor aprovechamiento y adecuados resultados es necesario el correcto caélculo del tamafio de la muestra. Un calculo equivocado Mtra.A Elsa Retureta Alvarez Pagina 11 ESTADISTICA INFERENCIAL podria generar lo contrario de todos los beneficios antes mencionados que este aporta. EJEMPLOS Ejemplo 1. Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en una industria. Se conoce que el peso de un saco que se llena con este instrumento es una variable aleatoria con distribucién normal. Si se supone que la desviacién tipica del peso es de 0,5 kg. Determine el tamafio de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95 de que el estimado y el parametro se diferencien modularmente en menos de 0,1 kg, Soluci6n: d=01 o=05 1-a@=0,95 a OZ)-2 2 1-ef-o975, (271 - (Cates) mA Zp-94 =196 d OL Evidentemente un tamafio de muestra no puede ser fraccionario por lo que se debe aproximar por exceso. El tamario de muestra seria de 97. Sila varianza de la poblacién es desconocida, que es lo que mas frecuente se ve en la practica el tratamiento sera diferente, no es posible encontrar una formula cuando la varianza poblacional es desconocida por lo que para ello aconsejamos utilizar el siguiente procedimiento- Primeramente, se toma una pequefia muestra, que se Ie llama muestra piloto, con . 2 4 ella se estima la varianza poblacional ( 7”) y con este valor se evala en la 2 2 formula (1), sustituyendo ( * ) por su estimacién (5 ). El valor de" obtenido sera aproximadamente el valor necesario, nuevamente con ese valor de ‘se extrae una muestra de este tamafio de la poblacion se le determina la varianza a esa i 4 2 i muestra, como una segunda estimacién de ( 7”) y se aplica de nuevo la formula (1), tomando la muestra con el " obtenido como muestra piloto para la siguiente Mua. A Elsa Retureta Alvarez Pagina 12 ESTADISTICA INFERENCIAL iteracién, se llegar a cumplir con las restricciones prefijadas. Se puede plantear . 2), Be : esta afirmacién ya que la 5 de 0 tiende a estabilizarse a medida que aumenta alrededor de la @” por lo que llegara el momento en que se encuentre el tamafio de muestra conveniente, sin embargo, en la préctica es mucho mas sencillo pues, alo sumo con tres iteraciones se obtiene el tamario de muestra deseado, este procedimiento para obtener el tamafio de muestra deseado se puede realizar utiizando en Microsoft Excel en la opcidn analisis de datos las opciones estadistica descriptiva para ir hallando la varianza de cada una de las muestras y la opcién muestra para ir determinado las muestras pilotos. Para obtener el tamaro de la muestra utilizando este método recomendamos la utilizacién de un paquete de computo como por ejemplo el Microsoft Excel, aplicando las opciones muestra y estadistica descriptiva. Para determinar el tamafio de la muestra cuando los datos son cualitativos es decir para el andlisis de fendmenos sociales 0 cuando se ullizan escalas nominales para verificar la ausencia o presencia del fenémeno a estudiar, se recomienda la utilizacién de la siguiente formula: a siendo &” sabiendo que: 2 _ ©" es la varianza de la poblacién respecto a determinadas variables. 2 . i 5” es la varianza de la muestra, la cual podré determinarse en términos de 2. probabilidad como * = PA- P) 5¢ es error estandar que estd dado por la diferencia entre (# ~*) la media poblacional y la media muestral. 2 2 (s¢)” 5 el error estandar al cuadrado, que nos servird para determinar 7”, por 2 2 lo que 7 = (se) es la varianza poblacional. Mua. A Elsa Retureta Alvarez Pagina 13 ESTADISTICA INFERENCIAL Ejemplo 2. De una poblacién de 1 176 adolescentes de una ciudad X se desea conocer la aceptacion por los programas humoristicos televisivos y para ello se desea tomar una muestra por lo que se necesita saber la cantidad de adolescentes que deben entrevistar para tener una informacién adecuada con error estandar menor de 0.015 al 90 % de confiabilidad Solucién: No1176 | S€ = 0,015 | (se) = (0,015)? = 0.000225 | = pa p)=090-09)=0.09 | se? _ 009 | porloque ~ 0,000225 400 ty 1+ ing Es decir para realizar la investigacién se necesita una muestra de al menos 298 adolescentes. 298 1+ Ejemplo 3. En el proyecto de Al Haouz en Marruecos, se ha calculado que cerca del 30% (0,3) de los nifios de la zona del proyecto padecen de malnutrici6n crénica, Este dato se basa en estadisticas nacionales sobre malnutricién en las zonas rurales. Utilizando los valores estandar indicados supra se efectua el calculo siguiente CAleulo: Calculo: 1.962 x .3(1-.3) Mua. A Elsa Retureta Alvarez Pagina 14 ESTADISTICA INFERENCIAL 052 n= 3.8416 x 21 .0025 n= 8068 0025 n= 322.72 ~ 323 Ejemplo 4. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la funcién eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o més pruebas. Encuentre un intervalo de confianza de 90% para la proporcién de los reproductores de discos compactos de la poblacion que no pasan todas las pruebas. Soluci6n. n=500 p= 15/500 = 0.03 2(0.90) = 1.645 0.0237

You might also like