You are on page 1of 41
Organizacion de los datos para reducir al minimo el error estadistico Inwoduccidn 36 ‘Control del error de muestreo 37 Estimacién estadisticacuidadosa contra adivinaci6n o estimacion apresurada 40 Error de muestreo y su manejo con la teoria de ia probabilidad 41 ‘Control del errr de medici6n 42 [Niveles de medicién: seleocién cuidadosa de los procedimientos estadsticos 42 Medicion 42 Variables nominales 43, Variables ordinales 44 Variables de intervalo 44 Variables de raza 45 ‘Como mejorar el nivel de medicién 47 Distincién det nivel de medida ‘yunidad de medida 47 Cotificacion y conteo de observaciones 48 Introduccién Distribuciones de recuenciss $0 ‘EstandarizaciOn de distibuciones de puntuaciones 51 Coditicaci¢a y conteo de datos deintervalofrazén 52 Redondeo de las obervactones de intervalalrazdn 53 ‘Los mites reales de puntuaciones redondeadas 53 Distribuciones de frecuencias de ‘proparciones y de porcentajes ara variables de intervatafrazsa Distribuciones de fecuencias e poreentajes acumulados 56 Perceniles y cuales $8 Agmupacig de datos ‘de intervalfrazin 60 Insensatez y falacins estaditicas: la importancia de tener una muestea representativa 61 Asi sea realizada para la investigacién cientifica, la mereadoteenia de un producto, un p ‘ndstico meteorol6gico © una simple apuesta, la prediccién del futuro es un pasatiempo ‘main, Los cientificos realizan predicciones empiticas para probar la exactitud de sus i Por ejemplo, ,cusl es la probabilidad de que seas victima de un delito en tu srea de tra Madriz (1996) enconirs tres factores de prediccién basados en la idea de que el riesgo! ser victima de un delito puede reducirse por medio del estudio cuidadoso de actividades tinarias. Un primer factor de riesgo es la exposicién, o vulnerabilidad circunstancial, c CConut del enordermestea 37 ‘trabajar solo por la noche en una tienda, Un segundo factor es la proximidad a delincuentes potenciales, como trabajar en una tienda ubieada en una zona con an alto indice delictivo. Un fercero es el atractivo del objetivo, es decir, desear Ia propiedad dle una victima, por ejemplo: tener grandes cantidades de dinero disponibles, Si ef ducio de una tienda pusiera a sus empleados en riesgo innecesario, un robo o asesinato no seria un suceso aleatorio 0 una equivocacién; seria un error. En el capitulo 1 notamos que los errores son grados conocidos de imprecisién, Conocer la relacién entre Jas circunstancias y la probabilided de un robo permite realizar mediciones preventivas que reduzcan las oportunidades calculadas para que los “errores” ocurran. Las mediciones para ln reduceién del riesgo podrfan incluir tener al menos dos empleados presentes, cerrar alas 11:00 pam. ubicarse en un lugar de trénsito denso, manejar pequeiias cantidades de dinero disponible ¢ instalar sistemas de alarma. La reduccién del error depende de la comprensién de las relaciones que predicen entre variables, Como brevemente anotamos en el capftulo 1, la estadistica trata sobre Ia comprensién cexacta y cl control del error estadistico, los grados conocidos de imprecisién en los proce- dimientos uitizados para reunir y procesar informacion, Los errores no son equivocaciones ‘Los errores son cantidades conocias de imprecision que pueden calcularse y reducirse por una seleccién cuidadosa e informada de diseflos de muestreo, instrumentos de medicién y formulas estadisticas, Error estadistico Grado conocido de imprecisién en jos provedimientos uti zados para reunir y procesar informacién, El andlisisestadistico comiinmente implica un muestreo: analizar s6lo una pequeta par te del grupo que se estudia. Por ejemplo, para aprender acerca de todas las tiendas pequefias, ppodriamos estudiar una muestra de 20 tiendas. ;Pueden los datos de ka muestra de 20 tiendas revelar con precisin como funcionan todas ellas? La investigacién también comprende la ‘observacion y la medicién. ;Podemos suponer que nuestras mediciones son completamente ‘exactas? El muestreo y la mediciGn son dos fuentes potenciales de error al obtener conclusio- ‘nes en la investigacién. El error de muestreo representa la inexactitud en las predieciones sobre una poblacion que resulta del hecho de que no observamos a todos los sujetos de la poblacién. Bl error de medicién es fa inexactiiud en la investigacién que se deriva de ins trumenios de medicién imprecisos, de las dificultades en (a clasificacién de las observacio: nes y de la necesidad de redondear los numeros. Después de estudiar cada uno de estos tipos de error, mostraremos emo estén relacionados. Control del error de muestreo Analizar significa escoger algo y examinarlo con detalle de manera organizada. Al realizar trabajo estadistico, analizamos grupos de personas, objetos 0 acontecimientas y medimos va riables para obtener promedios, tendencias o porcentajes, La medicién de una sola persona, Por ejemplo, registrar como 19 aitus de edad de Marfa Lopez, no proporciona tn estadistico; simplemente es una observacién, Sin embargo, determinar que la edd promedio de un grupo de 30 estudiantes es de 19.5 afios es calcular un estadistico con base en un conjunto de observaciones. El campo de la estadistica implica el resumen de eéleulos de numerosas ‘observaciones, es decir, la adicién de un grupo de ediciones, Nuestros intereses se enfocan cen observar muchos casos, recabar informacién precisa sobre ellos y hacer dectaraciones concisas sobre el grupo, no sobre los individues, 38 Captalo2_Organizacion do os datos para rducira mnimo e ror estacitico El grupo de sujetos que observamos a menudo es bastante pequefio. Nuestro propéi es estudiar el ntimero pequeiio de sujetos para obtener conclusiones sobre la poblacién: ‘grande a la cual esos sujetos pertenecen. Estudiar cada caso de un fenémeno es i ‘costoso ¢ innecesario. Por ejemplo, no tenemos que encuestar a cada votunte probable determinar el apoyo al candidato A. En cambio, podemos encuestar una muestra repres tiva de votantes probables, quizsi 500. Este grupo mas pequefio se llama muestra, mientr grupo més grande, completo, al que pertenece se denomina poblacién 0 universo, La figura 2-1 ejemplifica la nociGn de! muestreo. La poblacién (0 universo) es un g grande de personas de interés particular que deseamos estudiar y entender. Con frecuer las poblaciones estudiadas incluyen alas personas de un pais, estado 0 comunidad; los cn las instalaciones correccionales de un estado; los estudiantes actualmente inscritos en ‘universidad; las familias con hijos en edad escolar; los pacientes de un hospital; los jfes ‘cocina en restaurantes de Ia ciudad de Nueva York, y los ejecutivas de corporaciones. Us muestra cs un subgrupo pequeno de la poblacidin; la muestra se observa y se mide y des se wiliza para obtener conclusiones sobre la poblacién Poblacién (0 universo) Grupo grande de personas de interés particular que doseamos estudiar y entender. | Muestra Sudgrupo pequerio de la poblacién; la muestra so observa y 68 mide y después se utiliza para obtener conclusiones sobre la poblacién. EI muestreo es algo que hacemos todo el tiempo. Probamos una cucharada (una m tra) para decidir si agregamos mas picante en polvo a Ia olla (Ia poblacién). Para expl tuna carrera académica, por ejemplo sociologia, tomarfamos uno 0 des cursos (una mue para determinar si el universo de ideas y actividades de la Sociologia nos agrada. Una pri cita con alguien es un muestreo de la personalidad del individvo, una primera exposiciGn tuniverso de sus tendencias de conducta y actitudes. El muestreo es una conducta hu comin y eficaz, X= la medicién de una caactersticn sovnazs ddeuna pemona a ob|eo), por Felaciin de una X* Poblacén (porsiemplo, Semplain edad poblacén univer: { X_todorioeestudantes en X. 0) de mediciones x ‘con una muestra de mediciones un edleulo resumido de las mediciones ealizadas en una muestra, los aujctos de una poblacign (por ejemplo, para estimar un parimetio (por ejemplo la a edad promedio real de todos los {dad promedi de la mussita de ext estudiantes en el campus) Conol del ene de muesio 39 Nuestro interés, sin embargo, no est en la muestra por si misma, En cambio, quere mos aprender sobre la poblacién entera, Para adquirir informacién completamente correcta respecto de una poblacién entera, mediriamos ads sus miembros y resumiriamos los 4o- sultados en (érminos matemiticos, reportando porcentajes, tasas y promedios. Al edleulo resumido de mediciones realizadas en todos los sujetos en una poblacién se Ie llama paré- ‘metro. Por ejemplo, el promedio de edad de presos en la prisi6n Sharpwire es un parimetro. El porceniaje de ejecutivos mujeres en la Menrule Plastics Corporation es un pardmetto, Por ddeygracia, la mayoria de las poblaciones son tan grandes que no podemos invertir el tiempo yy los recursos necesarios para medir a todos los miembros, Por ejemplo, seria absurdo medit las estaturas de todos los adultos en un pats. A causa de los altos eostas para medir a cada sujeto en una poblaciGn, Ios verdaderos valores de los parimetros comiinmente son desco- nocidos. Por fortuna, el muestreo nos permite estimar parmetros con precisién. Con las mues- tras calculamos estudssticos en vez de parimetros. Un estadistico es wn cdlculo resumido de ‘ediciones realisadas en una muestra para estimar un pardmetro poblacional. Por ejemplo, fen una muestra de 800 republicanos registrados en Nueva Jersey, encontrariamos que 74 por ciento apoyan al gobernador. Este porcentaje constituye un estadistico: slo una estima- cidn del verdadero apoyo al gobernador. Una muestra las estadisticas ealculadas acerca de sta son simples herramientas para obtener conclusiones sobre una poblacién en genera, la poblacién no como un todo, Estas conclusiones, si se realizan siguiendo procedimientos esladisticos adecuados, se aman generalizaciones estadisticas. Parémetro Céiculo resumido de mediciones realizadas en tocos los sujetos de ura pobiacion Estadistico Caiculo resumido de mediciones realizadas en una muestra para cestimar un parémetro poblacional. "Nunca debemos perder de visi el hecho de que la pobacn esto que nes preacupa, Por «jemplo, una muestra de votantes en una “encuesta de sala” lomaula cuando las personas salen de las casilla) sugeririn que el candidato A ex ef ganador. Esta, sin embargo, es una «stimacién, una aproximacién del nivel de apoyo real El verdadero ganador slo se conocer despues que se cuenten todos los votos, es decir, cuando la poblacién entera de votantes haya sido medida ‘Una manera de recordar que una mvestra slo proporcionaestimaciones es compararlos resullados de varias muestras de la misma poblacién, Si un profesor de esaistica mandara ‘cada uno de los 30 miembros del grupo areunir una muestra de 10 compacros estudiantes y’estimara el promedio de edad de los estudiantes, cada miembro del grupo obtendria un resultado ligeramente diferente, (Si no estds convencido, consigue tt mismo dos mucstras.) Esta variabildad en los resultados de las muestras sso ree el hecho de que cl estado, én una muestatnica es slo una estimacién del verdadero parimetro de la poblacin, Entonces, ceémo confiaremos en os resultados de una sola mucstra? La respucsta a esta pregunia implica una noticia buena y una mal la mala es que cl estadista debe reconocer {que las conclusiones de una muestra no son totalmente corecas, dado que estos estadisticos son s6loestimaciones de pardmetros; la ena noticia es que los procedmicntosestadisticos y labgica de lateoria de probabilidad permiten a los estadistas specificarun grado de error conocido en las predicciones y, por consiguiente, estipular el grado de confianza que tendei Cepiulo2 ‘Organiza d les datos para educa minimo lem estadion mos en una conchusién basada en estadfsticos. En pocas palabras, aun cuando las esti nes estadisticas no son perfectas, sabemos que tan cerca estin de la perfecciéa. Estimacién estadistica cuidadosa contra adivinacién 0 estimacién apresurada La imaginacin estadistica enfatiza el entendimiento de un detalle en su contexto aproi teniendo cuidado de no emitirconclusiones simplistas 6 fantisticas. La estimacidn estas cas diferente del sentido comiin de la “adivinacin oestimacién apresurada”, que a men ce tendencioso. Una estimacin estadistia ese! iorme de unat medida de resumen enel muestreo sistemtico y en mediciones precisas e informadas, con grados conocider. error y confanca. Una adivinacién 0 estimacién apresurada es un informe de una medi de resumen basada en las experiencias personales limitadas y cominmente subjetivas, dencia aneedotica u observaciones informales apresurades. Laadivinacién podria ocurrr cuando un reportero de noticias elige al eandidato A o «seguro ganador porque el reporte de las encuestas de sada lo apoya con 52 por ciento probables votantes. En contraste, tomando en cuenta el tamatio de la muestra, un estat serfa mis cau y destacariael hecho de que 52 por cient significa 32 mds y menos 5 pun porcentuales; por consiguiente, el apoyo se encuentra entre 47 y $7 porciento. La victoria candidato A no esté asegurada porque el apoyo podria ser de solo 47 por ciento, Adem, estadista mantiene un grado de contianza para li estimacin de 95 por ciento, (No pode exigir 100 por ciento de confianza hasta que todos os votos se contabilicen,) La estima estalistica cuidadosa es diferente incluso de una buena suposicién. El estadista ditiere otros “pronosticadores” en dos maneras importantes: el estadista (1) controla y mane grado deertor en las estaisticas reportadas y (2) sefala de forma precisa la confianza en conclusiones, Un tipo particularmente insiioso de Ia estimaciGn apresurada es un estereotipo juicioso, es decir, una generalizacién falsa que implica que todos los individuos de wal categoria comparten ciertascaractertsiicas, normalmente indeseables. Existe un es racista, por ejemplo, en ereer que les aftoamericanos son ignorantes, perezos0s oinma para mantener asus familias y que éta es la causa de pobreza en Estados Unidos. De hee casi 7 de cada 10 estadounidenses pobres son blancos y la mayorfa de la gente pobre ti empleo, Las estimaciones apresuradas a menudo se guian por sentimientos que ref «estereoipos y sentimientos como odio, temor y superioidad. En contrast, las general nes estadistias se interpretan con cautelay dentro del contexto més grande de comprobaci Cientfica con sus resguardos contra la subjetividad. La tabla 2-1 compara las estimacion presuradas con las estimaciones estadisticas TABLA 2-1 | “Estimacion apresurada” del sentido comun contra estimacion estadistca La idea se basa on exporiencias personales Laidea go basa en muesteo slstemtico limtadae y comunmente eubjtivas, avidencia yen madien, ‘nieeddtica v observaciones apresiracas Produce conjoturas y conclusiones equivocadas. Produce estimaclones confablas con lradas conooidos de enor y contanza Gonara y retuerzaestorectpos, Produce genoraizaciones astasiticas. Usueimanta 0s un asunto de opinion LUsualmento 9¢ un esunto de hecho. bode frag . adel . Como et emor de muesten a1 Error de muestreo y su manejo con la teoria de la probabilidad Como la nica manera de conocer un pardmetro verdadero es mediante el sondeo de la po- blacién entera, cada estadistico calculado de una muestra es una estimacién. Por casualidad, los estadfsticos de algunas muestras estén més cerca del valor del parmetro verdadero que ‘oiros. La teoria de la probabilidad (capitulo 6) consiste en-el andlisis y la comprensidn de ‘as probabitidades de los acontecimientos: Nos brinda un conjunto de reglas para determinar la exactitud de los estadisticos de la muestra y calcular los grados de confianza que tencimos cen las conclusiones sobre una poblacidn, Para manejar exitosamente el error de muestreo debemos concentrarmos en sus fuentes eespecificas: el tama y Ia representatividad de la muestra. El tamaiio de la muestra se refere Al mimero de casos w observaciones que constituyen una muestra: el nimero de personas u ‘ohjetos observados. De manera general, cuanto mayor sea la muestra, menor ser elrango del cerror. Suponga que un investigador envia a dos asistentes para determinar la edad promedio de todo el alumnado. Uno les pregunt sus edades a 3 estudiantes, mientras que el segundo les ‘pregunta 1000. La intuicién nos lleva a tener mayor confianza en los resultados de la muestra ‘mayor, porque la muestra més pequenia pudiera reunir mas tcilmente sSlo a estudiantes j6ve- nes 0 s6lo mayores. En un capitulo posterior aprenderemos a calcular ¢ informar estadfsticos ‘con un “intervalo de confianza\” con una cantidad exacta de error para cualquier tamatio de ‘muestra dada. Con una muestra de 1 000 encontrariamos que la edad promedio en el campus exde 22.4 aflos, mas o menos 0.3 alos, Jo que sugiere que el promedio de edad se ubica entre 22.7 afos (esto es 22.4 +0.3) y 22.1 aos es decir, 22.4 0.3), El edleulo de “més menos algtin error de muestreo” est basado en probabilidades matematicas de la teorfa de la probabilidad. La teorfa de la probabilidad también nos permite sefialar exactamente qué tan a menudo un estadistico predeciré el pardmetro incorrectamente, es decir, qué tan & menudo los errores pueden causar una respuesta incorrecta. Por ejemplo, podemos advertir gue 5 por ciento de las veces nuestros procedimientos generan una conclusién fulsa, Al especificar este nivel de error, sin embargo, estamos pereibiendo también nuestro nivel de eonfianza. Si nuestra esti- ‘macién es incorrecta s6lo el 5 por ciento de las veces, entonees es correcta el 95 por ciento del total; asf, tenemos 95 por ciento de certeza, Un segundo factor que afecta la exactitud de! muestreo es hasta qué punto todos los segmentos de una poblacidn realmente estén incluidos en la muestra: la representatividad de la muestra. Una muestra representativa es aqueila en la que todos los segmentos de la por ‘blacién estén incluidos en la muesira en sus proporciones correctas respecto a la poblaciGn. Por ejemplo, si una poblaci6n del campus realmente es S4 por ciento hombres y 46 porciento ‘mujeres, una muestra representativa tend. que acercarse a esos porcentajes. Muestra representativa Muestra en la que todos los segmentos de la po- blacién estén incluidos en la muestra en sus proporciones correctas respecto @ la ppoblacién, ‘Una muestra no representativa es aquella en fa que algunos segmentos de la poblacién ‘stn representados en exceso 0 con defecio en ta muestra. Este es un tipo tiesgoso de error ‘de muestreo porque puede generar resultados totalmente engaiosas. Supongamos, por ejem- plo, que la administracién del campus desea encuestar a estudiantes sobre su apoyo para am- pliar el estadio de fitbol. Los voluntarios de la asociacién estudiantil de enfermeria llevan a ‘cabo la encuesta y se les pide registrar el voto de cada décimo estudiante; en cambio, ellos re- sgistran los votos de cada décimo estudiante que sale del edificio de enfermerta. Sin sorpresa, 42 Caputo? Organizaciin des datos pars redairal minim ol erorestediiso Jos resultados muestran que s6l0 23 por ciento de estudiantes estin a favor de la ampli {Por qué? Porque los miembros de la asociacin en realidad encuestaron a la poblacién ‘estudiantes de enfermerfa, que en su gran mayoria son mujeres y, por tanto, no es repress tativa del campus en conjunto, Diriamos que esta muesra esta sesgacda por una poreisn m ‘horas 2/2 (90 minutos) (120 minutos) (150 minutos) Calculamos los limites reales moviéndonos media unidad de redondeo en cada direcci6n, utilizando el siguiente procedimiento: 1. Observa la puntuacién e identifi la “unidad de redondeo”, el lugar decimal al que la puntuacién se redonded (como en la columna B que sigue). (Para uubicaciones det lugar decimal, revisa Ia figura A-I del apéndice A.) 2. Divide entre 2 esta unidad de redondeo (como en la columna C que sigue). Atencidn: no dividss el nimero del lugar decimal dela unidad de redondeo entre 2. 3. Resta el ndimero del paso 2 de la puntuacida redondeada observada, para obtener el limite real inferior (RI, como en la columna D que sigue). 4. Suma el resultado del paso 2 a la puntuacién redondeada observada, para obtener el limite real superior (LRI, como en la columna E que sigue). CCodiicacia ycontco de datos de imervalorazén 8 Ejemplos: Por cjemplo, para los 56 estudiantes que calificaron dos horas en el proyecto del Iabons- toro de quimica, redondeamos a Ia hora ms cercana (la posicin de ls unidad), Dividimos esta unidad de redondeo de una hora entre 2 para obtener hora y media. Entonces estamos «ste resultado de la puntuacién redondeada observada de dos horas para obtener el limite rea inferior (1M horas) To sumamos a la puntuacién observada de dos horas, para obtener el limite real superior (24 horas). Incluso es improbable que uno de estos 56 estudiantes tomara cxaclamente dos horas para eompletar el proyecto; dos horas es una estimacién redondeada. Poxiemos tener la certeza, sin embargo, de que cada uno de los 56 terminara entre 14 y 2¥¢ hhoras. Nuestro grado de precisi6n es la unidad de redondeo de una hora. Los prncipios de inclusividad y xclusividad también se aplican a las variables deiner valofrazén. Para una variable como la edad, apegarse al principio de inclusvidad pareceria razonable; slo rgistramos la “edad en el sitimo cumpleaios”. No obstante, para garuntizar Ia inclusividad, un euestionari de investigacin debe incluir las respuestas “se nego” y “no sabe" La exclusividad es razonable en cuanto a que todas las mediciones se realicen de la rmisma manera, en este caso la edad en el ltimo cumpleafios. i un encuestado dice que tiene 2B aos, entonces registra 26, no 27 ni 25. Distribuciones de frecuencios de proporciones y de porcentajes ‘para variables de intervalolrazén Las distribuciones de frecuencias de proporciones y porcentajes para variables de intervaloy ‘raz6n se caleulan de Ia misma forma que para variables nominalev/ordinales, excepto que en lugar de categorias tenemos puntuaciones. Por ejemplo, si la Universidad Smithville tiene 10000 estudiantes y 3.000 tienen 19 aftos, las frecuencias proporcionales y porcentuales para Ja puntuacion de 19 aitos son fade 19afos __3000 [de 19 afos en la Universidad Smithyill = ” 10 000 0.3000 4% [de 19 aftos en la Universidad Smithville] = (p) (100) = 30.00% {Capitulo 2 Onganizacin de tos datos para reduc al minima el er etadisticn TABLA 2.8 | llustracién de una distribucién de frecuencias porcentuales acumuladas: afios de escolaridad entre cuidadores de pacientes ancianos con Alzheimer Si estos célculos se realizan para todas las edades. los resultados se presentan como distribuciGn de frecuencias de porcentaje de la variable edad para la poblacién de estudiantes de la Universidad de Smithville. Distribuciones de frecuencias de porcentajes acumulados [La tabla 2-8 presenta la frecuencia, la frecuencia de porcentaje y las distibuciones de fe ccuencias de porceotajes acumulados de los nveles de escolaridad de 20 cuidadores, parienes «que acompafian a pacientes con Alzheimer en una clinica (Clair, Ritchey y Allman, 1993) Estas tres piezas de informacién son pares tipicas de los resultados obtenidos por comps tadora porque juntos generan respuestas rpidas «una serie de preguntas. Obviamente, le ccuencia de puntuacién bruta (f) proporciona una respuesta sobre cusntos sujetosrecibiroe una puntuacién especifica, y la frecuencia porcentual estandariza la frecuencia de acuerdo on el tamafio de la muestra. La informacién adicional dela tabla 2-8, la frecuencia de por = 8518 Pls FF S% [de calificaciones < 91} = (p) (100) = 85.18 = 85% Entonces, el rango percentilar es 85. Nétese que la calificacisn de Barry se incluyé en el efleulo porque es igual a la de John, Percents ycuaies $9 Kevin 5a 16 ‘Shanna 73 Cari 58 16 via 80 Fobert et 7 Angle 2 rian et w Aki % Mara 6 19 Daniel 8 Sem 9 20 kaitin 8 Jn 7m at Marcy ey sessica n 2 John ot Carat 73 23 Bary ot Brooke 5 4 wna 9% Kia 5 25 ‘Saran 5 Teny 7 a (Charles 6 Jackie 7 2 Elsa 7 DE PASOS PARA CALCULAR PERCENTILES: Ondenar las calificaciones. Calculara proporcién y porcentaje de casos con calificaciones jguales 0 menores que el caso de interés, Indicar et percentil en porcentajes entero. Recordar que los percentiles se obtienen fécilmente de una distribucién de poreentsjes acumulada, Los euartiles son cuantles que idenifican las punauaciones que dividen una distribu- in en cuatro grupos de igual tamano (es deci. 25 por ciento de los casos en cada grupo). ‘Cyando una distrbuci6n tiene un rango grande de puntuaciones, los cuartles se obtienen ficilmente a partir de distribuciones de frecuencias de porcentajes acumulados. El primer citar, Q, ¢s€1 250, percentil; el segundo, Q,-€8 el 500, percent; y el tercero, Q,¢5 el 750. ‘percentil Un software computarizado de estadistica por lo general esté programado para lenifcar cuartiles otros cuantiles, por ejemplo los deciles, que dividen una distibucién ‘en 10 grupos de igual tamato. La tabla 2-9 presenta la distribucn de notas en un examen de mitad de curso (X) & ilustra la utilidad de los cuartles. En este grupo de 20 estudiantes, el 25 por ciento mis bajo (©las cinco notas ands bajas) son X = 69 y menos, el siguiente cvarto de estudiantes es de X 72.484, el tercer cuarto son de X = 85 a1, y el cuarto més alto es de X= 93 y més. También -poslemos ver que un cuarto de los estudiantes obtuvo calificaciones de 69 © menos y no ob- {avo una C; la mitad obtuyo calificaciones arriba de 84, tres cuartos calificaron 91 0 menos, ‘a mitad obtuvo calificaciones entre 72 y 91, y asi sucesivamente. Captalo 2 Organizacion de los datos para redcir a fimo el ertar easton TABLA 29 | Cuartiles de una distribucion de calificaciones de un examen de mitad de curso 1 5.0% 1 50 1 50 1 50 1 50 1 50 1 50 1 50 1 90 1 50 © 0, = 500. paroont 1 50 2 100 1 50 1 50 + 0,=750, peroant 2 100 1 50 1 90 1 50 2 000% 3t 58 Py ry eo 2 % 7 e 84 85 6 8 o Fe oa 8 97 oral x Por Gltimo, es importante recordar ordenar Ias ealificaciones de uns distribucién antes de calcular los cuartiles. Cuantiles Puntuaciones que separan una porcién de los casos de una distribucion, Rango percentilar Entre ios casos en una cstrbucién de puntuaciones, 2s el porcentaje de casos que caen en o debajo de un valor especificado de X. Cuartiles Cuantiles que identtican los valores de puntuaciones que dividen una distribucién en cuatro grupos de igual tama. Agrupacién de datos de intervalo/razon AA veces, para lograr mayor claridad en la presentacién de una tabla o grifica, las distribu- cciones de intervalo/razn se agrupan o “colapsan"” en un niimero mas pequefio de eategoris ‘ordinales, Por ejemplo, en un estudio de adultos en Estados Unidos, os valores de Ia variable edad variardn de 20 a alrededor de 100, lo cual da 80 puntuaciones. Es confuso presentar ‘una tabla que presente la frecuencia y frecuencia de porcentaje de las 80 edades, Para mayor claridad, combinamos edades en categorfas de 10 afios, como se ve en la tabla 2-10, Insensiteey flaca estas: a importa de eves una muesiraepesenaiva OL TABLA 2-10 | La variable de razin de edad, agrupada ‘en categorias ordinales de 10 aos 1 4a 1049 2 6 15.18 3 108 2268 4 28 2143. ie 53 11.83 6 45 10.04 7 2 5.36 e ° 2o1 443 100.00 Hay algo importante qué ver respecto del agrupamiento de datos de intervalofraz6n, ‘Cuando agrupamos datos, eliminamos detalles, lo cual produce un error de agrupamiento. Por ejemplo, la tabla 2-10 muestra que hubo 106 encuestados entre 40 y 49 aos que contes- taron en la encuesta, Pero la mayoria estaba mas cerea de 40 0 de 497 No tenemos manera de saberio con s6lo observar las puntuaciones agrupadas. Si se dispone de los datos no agru- pados, podemos usarios para obtener eéleulos de promedtios mas precisos. En general, en ‘cualquier momento nos movemos de un nivel de medieién “superior” a otro “inferior” (esto es, de razén a intervalo, de intervalo a ordinal, de ordinal a nominal), perdemos informacion 1 ello limita lo que matemsticamente puede hacerse ‘No obstante, al leer el trabajo de otros, tal vez se nos presenten datos aerupados sin los «stadisticos correspondientes. En tales sitvaciones, el estudiante debe intentar comunicarse «on el autor para obtener los estadisticos descriptivs. Si eto noes posible, entonces pueden ‘aleularse promedios y otros estaditics a partir de os datos agrupados, pero dichosestadis- ticos incluirin error de agrupamiento, Véase un estudio de Freund y Simon (1991-70) acerea 4elcéleulo de estadisticos con dats agrupados. Insensatez y falacias estadisticas:la importancia de tener una muestra representativa FE tamafio muestra y Ia representatividad muestra son cosas separadas. Una muestra grande no garantiza una muestra representativa. Una equivocacién repetitva y sistematica en el ruestreo puede producir una muestra grande pero sesgada. Un caso clisico de error siste- mtico de muestreo ocurri en la campafia presidencial de 1936, en la que la revista Literary Digest seleccioné una muestra grande de amerostelef6nicos y propictarios de automovil, Los resultados mostraron un ebrumsdor apoyo para el candidato republicano, Alf Landon, sobre Franklin D. Roosevelt, el candidato demécrata. Cuando lleg el dia de elecciones, no fue Landon sino Roosevelt el que gan y nada menos que con un triunfo aplastante. La en- cuesta Literary Digest sistematicamente no hizo caso de electores sin teléfono ni automovil 1 asf fall6 en encuestaren forma adecuada & los pobres, quienes fueron el grueso del apoyo de Roosevelt (Babbie 1992: 192-93). Hay méiodos para verificar la representatividad de una CCapitalo2 Organicci6n de tos datos para redcir al minimo el enor eaditico ‘muestra, y los trataremos en el capitulo 10. Por ahora basta decir que una pequetia mues representativa es mejor que una grande no representativa. Una eucharadita de condime picante con todos los ingredientes es una mejor prueba de gusto que una cucharada de s6lo una parte de la olla Bjericiosparactcapialo2 67 del familiar cuidador con el pacionte sposa 14 Esn0s0 7 Hie a7 Hip 4 Hermana 8 Hermes 1 Madre 2 Nuora 13 Otro pariente temerino 4 tr pariente masculine 2 A continuaci6n se presentan datos sobre el nimero de vehiculos registrados para una muestra aleatoria de 20 hogares en el condado de Madison: 2, 1,2, 4,2,3.4,2, 144,2,1,0,3,2,4.3,4,2,2. 42) Compila ios dotos en una tabla de distribucién de freevencias eon columnes pra la frecuencia, la frecuencia proporcional, la frecuencia porcentual y la frecuencia de porcentajes acumulada. (No se requiere mostrar las f6emulas.) ) Si una familia tone tres vehiculos registrados, ,cuil es elrango percentilar de Js familia? interpreta tu respuesta. A continuaci6n veamos una lista de ealificaciones de examen de medio curso para un grupo de 14 estudiantes graduados, ‘Nombre del estudiante Calificacién de examen de medio curso sonathan susan vason ‘Andres kate Jenner ames rian Wise Ceretne Paticia kevin Mark vetrey RESSRSRAERS RRS 44) Caleula el rango percentilar de Jeffrey con base en el conjunte de calificaciones del examen presentado, 6) Caleula el sango percentilar de Brian.

You might also like