You are on page 1of 155
Prefacio: rrr a asignatura es de naturaleza practico —tedrico, orientado a desarrollar en L el estudiante habilidades superiores del pensamiento para el razonamiento logico y creativo, solucién de problemas y la toma de decisiones. El curso esté orientado a proporcionar al estudiante conocimientos estadisticos fundamentales sobre las técnicas de investigacion estadistica para recoger, analizar y mostrar informacién confiable y de calidad necesaria para la toma de decisiones. La asignatura esté disefiada para que el alumno al final de cada clase desarrolle casos practicos en base a datos reales. Comprende cuatro Unidades de Aprendizaje: @ Unidad I: Introduccién, Organizacién Y Presentacién De Datos. Unidad II: Medidas De Tendencia Central Y Medidas De Dispersién. Unidad Ill: Analisis De Regresién Y Correlacién Lineal Unidad IV: Probabilidades. UNIVERSIDAD PRIVADA TELESUP “Tendencia Contral Simple Por Et ‘para datos no ‘Método De Minimos > Probabilidad Valor, Eventos Mutuamente Excluyentes y Eventos no Excluyentes Bayes ¥ Técnicas ‘Do Conteo La competencia quo el estudiante debe lograr al final deg & la asignatura es: “Aplicar técnicas estadisticas para la recoleccién, presentacién, analisis e interpretacién de datos estadisticos.” ’ Indice del Contenido a = aa 7. —Intreduecion ca 1a. Presentacién y contextualizacién 03 . Compotoncia (logro) 08 ©: Capacidades 6 a. Actitudes 05 ‘Ideas basicas y contenido 05, 2. Desarrollo de los temas 07-30 ‘a. Toma 01: Introduccion, Concopto, Etapas dol Desarrollo doa Estadistica. o7 Toma 02: Variables Cualitativas y Cuantitativas. 1% © Tema 03: Organizacion de Datos y Distribucién de Frecuencias. 19 4d. Toma 04: Graficas Estadisticas 28 Lecturas recomendadas a Actividades 0 ‘Autoevaluacion an Resumen z [ UNIDAD DE APRENDIZAJE 27 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSION | 5-05 Tatroduecion a7 ‘a. Prosentacign y contoxtualizacion a . Competencia(logra) ar . Capacidades a7 4. Actitudes id 2 Ideas basicas y contenido a 2 Desarrollo de ios tomas. 487 ‘a. Tema 01: Medidas de Tendencia Central para datos no Agrupados. 43 . Tema 02: Medidas de Tendencia Central para datos Agrupados.. 54 ©. Toma 03: Medidas do Dispersion. 66 4d. Tema 04: Medidas de Posicién. 3 3. Lecturas recomondadas B 4 Actividades 5 SAutoevaluacion 5 &._Rosumen 3 [ONTDAD De APRENDIZATE 37 ANALISIS DE REGRESION Y CORRELACION UNEAL mie 7. —Intreduecion we ‘a. Presentacién y contextualizacién a5 . Compotoncia (logro) 35 ©. Capacidades 35 4. Acttudes 85 Ideas basicas y contenido 35 2. Desarrollo de los temas 25-105, ‘2. Toma 01: La Recta De Regresién Lineal Simple Por E! Método De Minimos Cuadrados. 6 Tema 02: El Coeficiente de Corrolacion. 0 ‘¢) Tema 03: El Coeficiente de Determinacién. ae 4d._Toma 04: Diagrama De Dispersion. 95 2. Lecturas recomendadas 108, 4 Actividades 107 5. Autoevaluacion 108 Resumen 114 Tatroduccion Ts ‘a. Presentacién y contextualizacién 16 b. Competencia 116 €. Capacidades 118 4. Actitudes 16 ‘Ideas basicas y contenido 118 2. Desarrollo de los temas. arts ‘2. Tema 01: Experimenta aleatori, espacio muestral, suceso 7 Tema 02: Definicion De Probabilidad, Valor, Eventos Mutuamonto Exciuyontes Y Eventos | 122 No Excluyontos ‘c. Tema 03: Probabilidad Condicional. war 4d. Toma 04: Probabllidad Total, Tooroma do Bayos y Tecnicas de Contoo. 121 3. Lecturas recomendadas 133 4. Actividades 146 5 Autoovaluacion 145 &._ Resumen 148, [IL SLOSARIC, 70 [IV-—FUENTES DE THFORMACION 730, [WSOLUCTONARIO Lil Introduccion TT a)Presentacién y contextualizacién Los temas que se tratan en la presente unidad temdtica, tiene por finalidad que el estudiante comprenda, las nociones basicas de la estadistica, tablas y graficos estadisticos. Para poder hacer que el alumno pueda usar estos conocimientos en su vida diaria, problemas simples, y dar un enfoque mas analitico con respecto a los problemas. b)Competencia Recopila, organiza, sistematiza la informacién estadistica, y representa mediante graficos estadisticos. ¢) Gapacidades 4. Define y explica la importancia de la estadistica y sus etapas. 2. Describe y aplica los diferentes tipos de variables en la estadistica descriptiva. 3. Explica las maneras de como organizar datos y distribuir frecuencia. 4. Explica la estructura de cada uno de los graficos usados en la estadistica descriptiva d)Actitudes ¥ Toma iniciativa y lidera al equipo en el cumplimiento de las actividades asignadas a su vez promueve actividades y toma de decisiones pertinentes. Y Planifica y cumple oportunamente sus tareas 0 actividades diarias y presenta sus trabajos en forma organizada e) Presentacién de Ideas bésicas y contenido esenciales de Ia Unidad: La Unidad de Aprendizaje 01: Introduccién, Organizacién Y Presentacién De Datos, comprende el desarrollo de los siguientes temas: TEMA 01: Introduccion, Concepto, Etapas del Desarrollo de la Estadistica. ‘TEMA 02: Variables Cualitativas y Cuantitativas. ‘TEMA 03: Organizaci6n de Datos y Distribucién de Frecuencias. TEMA 04: Graficas Estadisticas. Introduccion Concepto | Etapas del Desarrollo = de la Estadistica “ as Desarrollo de los Temas EE © Tema Oi: Introduecidn, Conegpto, Etapas Del Desarrollo Dg lea Estadistica A. Introduccién: La palabra “estadistica” suole utilizarse bajo dos significados distintos, 12 Como coleccién de datos numéricos.- Esto es el significado mas vulgar de la palabra estadistica. Se sobrentiende que dichos datos numéricos han de estar presentados de manera ordenada y sistematica. Una informacién numérica cualquiera puede no constituir una estadistica, para merecer este apelativo, los datos han de constituir un conjunto coherente, establecido de @ forma sistematica y siguiendo un criterio de ordenacién. ad AX | | 22 Como ciencia.- En este significado, La Estadistica estudia el comportamiento de los fendmenos de masas. Como todas las ciencias, busca las caracteristicas generales de un colectivo y prescinde de las particulares de cada elemento. Al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de nacimientos obtener después la proporcion de varones. Es muy frecuente enfrentarnos con fenémenos en los que es muy dificil predecir el resultado; asi, no podemos dar una lista, con las personas que van a morir con una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo. ~ ~! Er objetivo de la estadistica como ciencia es recopilar, | = , @ inlerpretar datos que en el futuro senviran para 1 | Proyectar posibles problemdticas futuras, consiguiendo 1 | Seguin estos datos, la solucién més viable y répida. ; Es una ciencia aplicada que nos proporciona un conjunto de métodos 0 técnicas para: + Recopilar. + Organizar. ’ ‘ + Presentar Datos, ae | + Analizar Datos. . = 2Quienes Usan La Estadistica? Los métodos estadisticos han encontrado en la actualidad aplicacion en el Gobiemo, la administracién de negocios, as Ciencias Sociales, la Sicologia, las Ingenierias, tas Ciencias Fisicas y Naturales y en muchos otros campos de la actividad intelectual Algunos ejemplos: En Los Organismos De Gobierno. Los diferentes indicadores economicos, tales como indices de precios al por mayor y al consumidor, las tasas de interés, las fluctuaciones del mercado bursatil y el indice de produccién industrial, no solamente describen el estado actual de la economia, sino que proporcionan pistas acerca de sus futuras tendencias. Con el auxilio de tales indicadores, los encargados de las politicas de los distintos organismos serian capaces de tomar decisiones més racionales con respecto a sus operaciones. UNIVERSIDAD PRIVADA TELESUP En La Administracién De Negocios. La creciente complejidad de la economia ha provocado un terrible grado de incertidumbre acerca de las operaciones futuras de cualquier empresa de negocios. Més y més compafiias estan usando el andlisis estadistico como herramienta para la toma de decisiones, especialmente en areas tales como investigacién de mercados, predicciones y planeacién a largo piazo en lo referente a recursos financieros y humanos. En La Educacién Y¥ En La Psicologia. La necesidad de analizar e interpretar datos numéricos ha hecho necesario para educadores y para sicélogos tener al menos alguna comprensién basica de los métodos estadisticos. La necesidad del sicblogo de herramientas estadisticas especiales ha llevado al desarrollo de nuevas técnicas estadisticas en las tltimas décadas. En las Ciencias Biolégicas y la Medicina. En agricutura, se utilizan para determinar los efectos de clases de semillas, de insecticidas y de fertiizantes en los campos. Se =) Las técnicas emplea también para determinar i estadisticas se han los posibles efectos laterales o J aplicado a una amplia la efectividad de las medicinas y a variedad de proyectos para proporcionar mejores de investigacion que métodos para controlar la impliquen el estudio de diseminacion de enfermedades individuos y de grupos. contagiosas. En la Sociologia, en la Antropologia y en las Ciencias del Comportamiento. En La Ingenieria. La aplicacion de los principios estadisticos al control de calidad ha sido una practica aceptada durante varias décadas. (UJ * UNIversIDAD PRIVADA TELESUP C. Etapas de Desarrollo de Ia Estadistica La historia de la estadistica esta resumida en tres grandes etapas 0 fases: 1.- Los Censos: Desde el momento en que se constituye una autoridad politica, la idea de inventariar de una forma mas 0 menos regular la poblacién y las riquezas existentes en el territorio esté ligada la conciencia de soberania y con los primeros esfuerzos administrativos. Los comienzos de la estadistica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el afio 3050 antes de Cristo, proliios datos relativos a la poblacion y a las riquezas del pais. 2 De La Descripcién A La Aritmética Politica: Las ideas mercantiistas entrafian una intensificacién de este tipo de investigacién. Colbert multiplica las encuestas sobre articulos manufacturados, e! comercio y la poblacién. Vauban, quien hace la primera propuesta de un impuesto sobre los ingresos, se sefiala como el verdadero precursor de los sondeos. La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Uno de sus principales exponentes Petty es autor de la famosa Aritmética Politica. Chaptal, ministro de! interior francés, publica, en 1801, el primer censo general de poblacién y desarrolla estudios industriales, de las producciones y de los cambios, los cuales se hicieron sistematicos durante las dos terceras partes del siglo XIX. incorpora, rapidamente, como un instrumento de analisis extremadamente poderoso para el estudio de los fenémenos econdmicos y sociales y, en general, para el estudio de fenémenos “cuyas causas son demasiado complejas para conocerlas totalmente y hacer posible su andlisis". Godofredo Achenwall, profesor de la Universidad de Gotinga, acufio, en 1760, la palabra estadistica, que extrajo del término italiano statista (estadista). Creia, y con sobrada razén, que los datos de la nueva ciencia serian el aliado mas eficaz del gobemante consciente. UNIVERSIDAD PRIVADA TELESUP Poblacién, Elementos Y Caracteres. Es obvio que todo estudio estadistico ha de estar referido a un conjunto o coleccién de personas 0 cosas. Este conjunto de personas 0 cosas es lo que denominaremos poblacion. Poblacién: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacién sobre el fenémeno que se estudia. Por ejemplo: si estudiamos el precio de la vivienda en una ciudad, la poblacién sera el total de las viviendas de dicha ciudad. Las personas 0 cosas que forman parte de la = poblacién se denominan elementos. En sentido estadistico, Z un elemento puede ser algo con existencia real, como i Z un automévil o una casa, 0 algo més abstracto como la temperatura, un voto, 0 un intervalo de tiempo. Luego por tanto de cada elemento de la poblacién podremos estudiar uno o mas aspectos cualidades o caracteres. La poblacién puede ser segiin su tamajio de dos tipos: Poblacién Finita: Cuando elntimero de elementos que lo forma 1 i pueden enumerar, por ejemplo el numero de alu | deun centro de ensefianza, o grupo clase. ¢ s UNIVERSIDAD PRIVADA TELESUP Poblacién Infinita: Cuando Ia cantidad de elementos que as forman no es posible numerarlo. Como ! por ejemplo si se realizase un estudio : sobre los productos que hay en el ; mercado. Hay tantos y de tantas calidades | que esta poblacién podria considerarse | infinita. ' ‘ Muestra: lait ao ------ -------- - - ------- ‘Subconjunto que seleccionamos de la poblacién. Asi, si se estudia el precio de la! vivienda de una ciudad, lo normal sera no recoger informacién sobre todas las! viviendas de la ciudad (seria una labor muy compleja), sino que se suele seleccionar, un subgrupo muestra) que se entienda que es suficientemente representative. Cuatitativas » Competencia: bs bore rt} m=) Jie ae SMM Tita a| Sa: Cy Ad. S Rr cuca cic) tyrant lat. oy ‘ UNIVERSIDAD PRIVADA TELESUP © Tema 02: Variables Cualitativas g Cuantitativas Las variables pueden ser clasificadas como cuantitativas (intervalares) 0 cualitativas (categéricas), dependiendo si los valores presentados tienen o no un orden de magnitud natural (cuantitativas), 0 simplemente un atributo no sometido a cuantificacion (cualitativa) La eleccion de la(s) escala(s) de medicion a utilizar depende, en primer lugar, del tipo de variable en estudio, y, ademas, del manejo estadistico a la que se someterd la informacion. En términos practicos, existe una correspondencia directa entre el ‘concepto de variable y escala de medicion. Un atributo corresponde a un valor especifico de una variable, como es el caso de la variable sexo, la que posee dos atributos: varn o mujer. En variables que exploran el grado de acuerdo o desacuerdo frente a una afirmacién los atributos podrian ser: (UJ * UNIVERSIDAD PRIVADA TELESUP ~ Dependiendo de los valores que puede tener una variable cualitativa, ésta puede a_| su vez ser dicot6micas (cuando solo pueden adoptar un solo valor sin jerarquia entre | I st hombre - mujer, positive-negativo, presente-ausente), 0 bien, poli o 1 | mutticotémicas, si existe la posibiidad de que adopten miltiples valores (edad, | tala, nivel socioecondmico, grupos sanguineos, calificacion previsional de usuarios). I 4S Las ascalas da madiclénde una uariablecualitatoa son:— = — — = | Nominal.- Nominal, En este nivel de medici6n se establecen categorias distintivas que no implican un orden especifico. Ejemplo: Nombres de personas, de establecimientos, raza, grupos sanguineos, estado civil. Estas variables no tienen ningun orden inherente a ellas ni un orden de jerarquia. Ordinal.- Cuando se establecen categorias con dos 0 mas niveles que implican un orden inherente entre si. Ejemplo: Grados de desnutricién, respuesta a un tratamiento, nivel socioeconémico, intensidad de consumo de alcohol, dias de la semana, meses del afo. A pesar de este orden jerarquico no es posible obtener valoracién numérica légica entre dos valores. 1. Las variables de tipo cuantitativo pueden a su vez ser / clasificadas como continuas o discretas. Las escalas Ye cuantitativas son reconocidas también como escalas 4 intervalares 0 numéricas. Continua.- Cuando entre dos valores determinados existen infinitas posibilidades de valores. Ejemplo: El peso, la talla, la presién arterial o el nivel de colesterol sérico. UNIVERSIDAD PRIVADA TELESUP Discreta.- Cuando la variable a medir solo puede adoptar un solo valor numérico, entero, con valores intermedios que carecen de sentido Ejemplo: El numero de hijos, de unidades vecinales del sector, numero de examenes de laboratorio o de pacientes atendidos. En la practica, salvo contadas excepciones no se dispone de métodos de medicion sofisticados como para poder medir exactamente los valores. Tanto las variables discretas como las continuas pueden agruparse construyendo itervalos, entre cuyos valores extremos se ubicaran las diferentes observaciones registradas. ‘Sin embargo, estrictamente hablando, s6lo las variables continuas pueden ser objeto de categorizacién mediante intervalos. I ! ! l I l I ' l Clasificacién de Variables ‘Cuantitativas (intervalares) Ej. Presién arterial, peso, edad, talla, IMC Ej. Numero de hijos, episodios de (Indice de Masa Corporal) infeccion urinaria Categéricas (cualitativas) aaa UNIVERSIDAD PRIVADA TELESUP NOTA: Las variables también se pueden clasificar en: Variables Bidimensionales: Recogen informacion sobre dos caracteristicas de la pobla (por ejemplo: edad y altura de los alumnos de una clase). No ordenable: Aquellas que sélo admiten una mera ordenacién alfabética, pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, ete. ‘Organizacion de Datos SsDAD p, % eaWa ~% . ° . y x :. DistribuciOnge 2 (: Frecuencias () (eel ericiaterH r > Ss *tps© UNIVERSIDAD PRIVADA TELESUP © Tema 03: Organizacién De Datos Y Pistribueion De Freeugncias Organizacién de los Datos Obtenidos de una Muestra ‘Cuando se han recopilado datos mediante un muestreo 0 un censo, la primera inquietud que aparece es sobre la manera en la que se puede realizar un andlisis descriptivo apropiado con la informacion recolectada de manera que resulte sencillo entender lo que ocurre en la poblacién de la que se han captado las observaciones. En este tema se proprocionan algunos procedimientos para la tabulacién de datos que conducen a la formacién de cuadros © tablas de frecuencias. Organizacién De Los Datos Cualitativos ee eee eee ‘Antes de iniciar el trabajo de organizacion de datos cualitativos, es necesario determinar si éstos corresponden a variables cualitativas nominales u ordinales. Si los datos son cualitativos nominales, se formar categorias que pueden ser presentadas en cualquier orden: por ejemplo los colores de preferencia de las personas. Si los datos son ordinales, entonces deben estar asociados a algun orden en su presentacién. Una vez definido el tipo de variable, se obliene mediante un proceso de conteo las frecuencias absolutas (numero de veces que se repite cada respuesta), luego las frecuencias relativas (division de cada frecuencia absoluta entre el tamafio de muestra) y/o los porcentajes de cada respuesta (cada frecuencia relativa multiplicada por 100). ‘También se puede encontrar las frecuencias absolutas acumuladas (Fi) Frecuencia relativa (hi).- Frecuencia acumulada (Fi).- Para cada clase, valor 0 modalidad, la frecuencia acumulada equivale la frecuencia absoluta (fi) de la fila sumada a a frecuencia ‘cumulada de Ia fila anterior. Para a primera fila, la frecuencia cumulada equivale simplemente a a frecuencia absoluta de la misma ila, Ejemplo 1. Una revista conocida efectué una encuesta respecto a lo adecuado de la protecci6n policial en la ciudad. Se seleccioné un total de 419 personas. Las respuestas se presentan en la siguiente tabla de frecuencias: Pesos Maoe a) Gostnccy ier) Errante) Cor) 1 si 293 No 80 Nosabel {|46 no responde Ejemplo 2. Se ha efectuado una encuesta a 200 madres solteras entre 15 y 25 afios de la ciudad de Piura. Los valores se agrupan en: primaria completa, secundaria completa y educacién superior completa. El resultado del conteo se presenta en la siguiente tabla: Erratic) OPIN) Primaria completa Secundaria completa Educac.superior completa Organizacién De Datos Cuantitativos Discretos Cuando se tienen datos cuantitativos discretos cuyo numero de resultados posibles no es grande, la informacion puede ser clasificada y presentada directamente sin pérdida de la identidad de la misma. En estos casos, primero se ordenan los posibles valores de la variable seguin su magnitud, y a continuacion se obtienen, mediante un proceso de conteo, las frecuencias absolutas asociadas a cada uno de dichos valores; las frecuencias relativas y porcentuales se obtienen de manera similar a lo descrito para las variables cualitativas. Ejemplo. Consideremos la variable numero de hijos y tomemos las observaciones de una muestra de 150 familias de zonas marginales de Lima Metropolitana. Los valores obtenidos se pueden agrupar en diferentes valores: 0 hijos, 1 hijo, 2 hijos, 3 hijos 0 4 hijos. Para hacer un arreglo de estas observaciones, usaremos una tabla como Ia siguiente: aa este co Died Sera end UNIVERSIDAD PRIVADA TELESUP Organizacién De Datos Cuantitativos Continuos Cuando se tiene informacion para una variable cuantitativa continua, las observaciones son usualmente diferentes entre si, lo cual hace que la evaluacién descriptiva a través de los valores individuales sea compleja. Para simplificar el andlisis, los datos son clasificados de acuerdo con ciertos rangos llamados intervalos de clase. Ejemplo. Tomamos una muestra de 100 nifios de 10 afios de edad para estudiar suestatura. Entonces la variable estatura que es cuantitativa contintia se puede presentar en una tabla del siguiente tipo: Tt Re tel ct [1.0mt.- 1.15mt] [1.15mt. - 1.30mt] [1.30mt- 1.45mt] [1.45mt.- 1.60mt] UNIVERSIDAD PRIVADA TELESUP ee ee ee ee ee ee ee ee La organizacion de los datos para el caso en que la variable estadistica usada tenga muchos valores implica e arreglo de las observaciones en intervaios de clases. El | | proceso para hallar los intervalos de clase es el siguiente: 1 Debemos hallar, en primer lugar, en la muestra, el menor valor observado y el mayor valor observado. % me ee eee ee ee ee ee ee eK ES arora ce rferiales io ceberd ox lan pareere (reve quasi an arcane (mayor de 15) que la verdadera naturaleza de la distribucién sea imposible de 1 visualizar. La longitud del intervalo de clase debera ser siempre la misma. I 1 ! I I Si la longitud de cada intervalo no fuera exacta, se puede tomar por exceso aseguréndonos de este modo que la reunién de todos los intervalos cubriré a todos los valores observados. iCémo decidimos cuantos intervalos de clase tomar? Existen varias reglas que se basan en el tamafio de nuestra poblacion o muestra. Una de las regias més usadas es la Regla de Sturges, regla empirica que funciona bastante bien para grupos de 30 a 300 observaciones. Esta regia nos dice que el numero de intervalos de clase para una muestra de tamafio n sera k si este resulta un numero entero 0 el siguiente numero entero a k, si k resulta un numero decimal. La ecuacién para hallar kes: k = 1 + 3.3 * log n, donde nes el tamafio de la muestra. UNIVERSIDAD PRIVADA TELESUP La marca de clase (xi), definida como el punto medio del intervalo de clase, debera tener de preferencia el mismo nimero de decimales que los valores observados. La marca de clase puede considerarse que e representante de los datos que caen en el intervalo. Ejemplo 1. Suponga que los datos que se presentan a continuacion corresponden a los valores de la inflacién anual durante el afio 2008 de un total de 20 ciudades de una regién del pais. Construir la distribucion de frecuencias 8.2 128 10.5 9.3 12.7 10.2 9.1 10.7 8.2 128 85 11.6 84 101 10.2 134 98 121136 11.7 Solucién R=13.6-8.2=54 K = 1 + 3.3 log20 i .29 = 5.29 = 5 (redondeo por aproximacion) C = Rik = 5.4/5 = 1.08 = 1.1 (redondeo por exceso; los datos tienen un decimal) Los limites de los intervalos se obtienen del siguiente modo: Lh =8.2 b=9.3 LLL +c=8.2+ 1429.3 Lis= 10.4 Ls=Lh+c=9.3+1.1= 104 LS3=Ll= 11.5 Ly= Ls #0= 10.44 1.4=11.5 LS, = Lis=12.6 Us=Lh + c= 11.54 1.4=126 LSs=LS.+ ¢=12.6+1.1=13.7 Las marcas de clase se calculan de la siguiente manera: x1 = *2*?_ 60 a= %2**— oeoy asi sucesivamente Para determinar las frecuencias absolutas se procede como sigue: Se toma la primera observacién 8.2 y se busca el intervalo de clase que pertenece, es el 8.2 - 9.3, luego se asigna una tarja en la interseccién de la columna de conteo y la fila de ese intervalo. Se toma ahora la otra observacién 12.8, la cual pertenece al intervalo 12.6 - 13.7, entonces se asigna una tarja en la interseccién de Ia fila de este nuevo intervalo y la columna de conteo. Asi sucesivamente hasta agotar la ultima observacién. Sumando las tarjas se obtiene la frecuencia absoluta de cada clase Para obtener las frecuencias acumuladas se procede de la siguiente forma: F2=F1+{2=5+5=10 UNIVERSIDAD PRIVADA TELESUP Con los resultados anteriores se obtiene el siguiente cuadro de distribucién de frecuencias ested rr ci Meee cnet cs CCMA CDG Serena) Ere ey peur ey ECC fi 82593 875 lil 5 5 sf a3; 404 985 mm 6 10 8. 104;115 1095 7 2 2 2 15;126 1205 il) 3 15 3 126;13.7 9 1315 Will 5 20 5/ Ejemplo 2. A continuacién, se presenta una lista ya ordenada de las observaciones hechas sobre el ingreso de las personas. S7 | 58 63 | 64 67 | 68 7 | 74 74 74 74 | 77 PPP PPE" | Para estos ingresos, el menor valor de la muestra es 53 délares y el mayor valor de la muestra es 97 délares. Luego, el rango de estos valores es: 97 - 53 = 44 délares Al aplicar la regla de Sturges con n= 50, tendremos: k= 1 + 3.3*(1.69897) = 6.6, lo que equivale a tomar 7 intervalos s) El tamafio o amplitud de cada intervalo de clase se determina asi: c=R IK= 44/7 = 6.29 = 7. (redondeo por exceso, al entero superior, considerando que los datos son entero. Si los datos tienen decimales el proceso es el mismo). UNIVERSIDAD PRIVADA TELESUP ‘Siguiendo el mismo proceso utilizado para el ejemplo 1, se tiene la tabla de distribucién de frecuencias: 153 ; 60] [60; 67] [67 ; 74] (74; 81) [84 ; 88] [88 ; 95] we [pep Graficas | s\DAD », oi 2p aa canes Ue Estadisticas “"™ oO. Competencia: UNIVERSIDAD PRIVADA TELESUP © Tema Presentacién De Los Datos Obtenidos De Una Muestra : Grafieas Estadisticas Una vez realizada la organizacion de los datos observados, es necesario presentar estos de forma grafica forma visual permitira resaltar algunos hechos que muestran los datos. Se verdn diversos tipos de gréficos catalogados segtin el tipo de variable a presentarse. Para Una Variable Cualitativa @) Grafica De Barras [ery ve) Primaria Completa Secundaria Completa 55 ‘Superior Completa 35 NUMERO DE MUJERES . GRAFICA DE BARRAS 60 so 40 30 20 10 o Completa Primaria Secundaria Superior Completa Completa GRADO DE INSTRUCCION 1m Primaria Completa sm Secundaria Completa 1m Superior Completa También es posible realizar GRAFICAS DE BARRAS HORIZONTALES, los cuales se parecen mucho a las graficas de columnas, con la salvedad importante de que la funcién de los ejes se intercambia y el eje horizontal queda destinado a las frecuencias y el eje vertical a las clases. Es muy comin que este tipo de graficos se utilicen para ilustrar el tamafio de una poblacién dividida en estratos como, por ejemplo, son sus edades. El ejemplo que se presenta es la poblacion de un pais ficticio llamado "Perulandia": Edad o 5,900 1900 15,000 20,000 Miles de habitantes A este tipo de graficos en particular se le llama piramide de edades por su forma. Incluso, cuando se compara la poblacién masculina y femenina por estratos de edades, se estila utilizar el lado izquierdo para la poblacion de un sexo y el lado derecho para el otro, el resultado es una “pirdmide" casi simétrica (dependera de la poblacién en particular), UNIVERSIDAD PRIVADA TELESUP b) Grafica De Sectores tra forma de presentar la informacion de una variable cualitativa es utilizando una grafica de sectores (también denominada grafica tipo "pie" o "pastel"). La grafica de sectores es un circulo dividido en varios sectores proporcionales en tamafio a las frecuencias relativas (hi) de las diferentes modalidades. En el caso anterior de la distribucion de frecuencias, tendremos: Primaria completa 40% de 360 grados = 144 grados Secundaria completa 37% de 360 grados = 133.2 grados Superior completa 23% de 360 grados = 82.8 grados | Peony | Primaria Completa ‘Seoundaria Completa Superior Completa Primaria Completa ™ secundaria Completa ™ superior Completa . UNIVERSIDAD PRIVADA TELESUP ©) Grafico De Bastones Para una variable cuantitativa discreta (con pocos valores) es posible usar los graficos de barras. Pero existe otro grafico, disefiado para este tipo de variables y es la GRAFICA DE BASTONES. En esta grafica, la frecuencia del valor de la variable es representada por un segmento de recta en vez de una barra. Tomemos la variable numero de hijos, los posibles valores de esta variable son 0 hijos, 1 hijo, 2 hijos, 3 hijos 6 4 hijos. Luego, para una muestra de 100 datos tendremos la distribucion de frecuencias: RYE] cy 7 7/ 100 = 0.07 15 15 1100 = 0.15 13/100 = 0.13 1.00 Grafica de bastones 25 aSeriet Numero de Familias Qhijos thio 2hijos__Shijos _4hijos UNIVERSIDAD PRIVADA TELESUP d)Histograma Para Una Variable Cuantitativa Discreta (Con Muchos Valores) © Continua existe una gréfica equivalente a la gréfica de barras, se denomina histograma Esta forma de presentacion también consiste en ‘graficar barras, pero, a diferencia de la grafica de barras, aqui las barras estan pegadas unas a otras. recy S 28;57,5] 55 2 2 0,04 4% 75,625] 60 3 5 006 6% —25;675]) 65 4 «49 008 8% | 75:725]. 70 5 14 0,0 10% Be assay ae a 75,825] 860. 10 32 0,20 20% 2,5; 87,5] 85 4 7,5; 925) 90 6 46 012° 42% UNIVERSIDAD PRIVADA TELESUP HISTOGRAMA FRECUENCIAS 30 MARCAS DE CLASE e) Poligono De Frecuencias Uniendo los puntos medios de los lados superiores de cada barra rectangular del histograma se obtiene un gréfico llamado poligono de frecuencias. El conocimiento del poligono de frecuencias ayudaré mas adelante en la busqueda de! modelo te6rico que mejor describa a los elementos de la poblacién de acuerdo con la variable que se estudia. Poligono De Frecuencias (Linea Negra) f) Ojiva Una grafica similar al poligono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una distribucin acumulativa y de igual manera que éstas, existen las ojivas mayores que y las ojivas menores Existen dos diferencias fundamentales entre las ojivas y los poligonos de frecuencias (y por esto la aplicacién de la técnica es parcial): Un extremo de la ojiva no se "amarra” al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva menor que, con el derecho. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de Ia ojiva mayor que, es la frontera menor, para la ojiva menor que, la frontera mayor. La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que esta sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se diria: después de las 4:00 horas). UNIVERSIDAD PRIVADA TELESUP De forma analoga, en la ojiva menor que, la frecuencia que se representa en cada frontera de clase son el nimero de observaciones menores que la frontera sefialada (en caso de tiempos seria el numero de observaciones antes de la hora que sefiala la frontera). Si se utiliza una distribucién porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que seguin sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que se acaba de usar, pero con una distribucion porcentual: 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% Cant. de visitas 01:89 1559 47:59 1959 21:59 2388 03:59 05.59 07:59 Fonsi F 1158 9) Grafica De Areas En ocasiones, al comparar dos series de observaciones (0 de datos) se utiliza una llamada grafica de areas, la cual consiste en rellenas el drea que se encuentre debajo de las lineas que resultan de una gréfica de lineas. El ejemplo que se presenta es la comparacién del total de las especies de las familias del orden Carnivora y las que estan amenazadas, en México, (fuente: Revista "Ciencia y Desarrollo”). UNIVERSIDAD PRIVADA TELESUP Wimero de especies Familias de espect Actualmente, y mucho en los medios masivos de comunicacién, se utilizan graficos para ilustrar los datos o los resultados de alguna investigacion. Regularmente se utiizan dibujos para representar dicha informacién, y el tamafio 0. el numero de estos dibujos dentro de una gréfica queda determinado por la frecuencia correspondiente. A este tipo de grafica se le llama pictograma y éstos son dos ejemplos: 2 18 8 eis ( 12 je 9G ge fos a 2 j 3 h)GrGfica De Dispersién Cuando se pretende ilustrar la dispersion de las observaciones realizadas, y asi trabajar algunas cosas como correlaciones se puede utilizar una grafica de dispersién. UNIVERSIDAD PRIVADA TELESUP Por ejemplo, el ejemplo de la izquierda es la dispersion que se presenta al comparar el numero de tesis doctorales en ciencias exactas contra el numero de Densidad (g/crm") osnwnuo ‘Tesis en otras éreas 0 5 10 ae Diametro (miles de km) Tesis en Ciencias Exactas 15 " La gratica de la derecha es resultado de comparar el didmetro (en miles de kilémetros) 02 los planetas interiores de nuestro sistema solar contra sus densidades (en gramos | Por centimetro cibico). Es interesante observar que los puntos parecen "seguir" una | linea imaginaria que se asemeja a una recta, con excepcion de un caso atipico: ! Mercurio, Uno de los usos de este tipo de graficas es precisamente encontrar si las observaciones siguen algun patron lineal (una linea de tendencia) o si existen valores atipicos. Para el caso del Excel, el Programa es capaz de graficar las lineas de tendencias que siguen un conjunto de datos. UNIVERSIDAD PRIVADA TELESUP i) Gréfica De Burbujas Un tipo de gréfico similar a las graficas de dispersion son las graficas de burbujas, en las cuales se presenta la dispersion de las observaciones de la misma forma que aquélias, pero se le afiade la posibilidad de visualizar otra variable representada en el tamafio del punto, pues éstos se convierten en circulos (burbujas) con radios proporcionales a las magnitudes que representan. ry a hb \ a& Traslacién (aiios) ° o 0 100 200 300 Distancia al Sol (mill. de km) Este ejemplo compara la distancia que existe entre cada uno de los planetas interiores de nuestro sistema solar con respecto al Sol, contra el tiempo que necesitan para recorrer sus érbitas, y el tamafio de las burbujas que indica la masa de cada planeta. Ademas existen otros tipos de gréficos, cada uno con caracteristicas particulares que les proporcionan cierta intencionalidad para su uso, como son las gréficas de radar y las graficas polares. Lecturas Recomendadas a “ INTRODUCCION, CONCEPTO, ETAPAS DEL DESARROLLO DE LA ESTADISTICA. “ ORGANIZACION DE DATOS Y DISTRIBUCION DE FRECUENCIAS Actividades 'y Ejercicios Ingresa al link presentacién de datos, lee atentamente las indicaciones, desarrolla los ejercicios y envialo por el mismo medio. 4. De los siguientes valores: Ford Toyota Nissan Hyundai ©=—-Hyundai_- Ford Nissan Ford = Hyundai Nissan Hyundai Toyota Hyundai Nissan Toyota Ford Toyota = Hyundai Ford Hyundai a. Hallarla frecuencia absoluta y relacional b. Hallarla frecuencia acumulada absoluta y relacional. ¢. Realizar un grafico de barras . Dibujar un diagrama circular. 2. Suponga que en estudio socioeconémico se observo, entre otras variables, el numero de trabajadores eventuales que tienen las empresas comerciales de una region de la ciudad de Trujillo. Mediante una muestra de 30 empresas se encontraron los siguientes resultados. 4 [io [5s [8 [10 [6 [10 [7 [8 Je [9 6 le [7 [10 [8 [7 ls [9 [7 1s ls [4 [7 [8 [6 | Construir el cuadro de distribucién de frecuencias Suponga que se ha llevado a cabo una encuesta a 28 personas elegidas al azar para analizar su opinién sobre la calidad de una nueva conserva que se desea introducir en el mercado. Los resultados observados fueron los siguientes: Bueno [Malo Bueno [Excelente | Regular | Bueno | Regular [Regular | Regular | Excelente | Excelente | Bueno | Excelente | Bueno Bueno [Excelente | Bueno | Malo Bueno | Bueno | Malo Bueno [Excelente | Bueno | Bueno | Excelente | Bueno | Excelente Construir el cuadro de distribucién de frecuencias. Autoevaluacion a 1. Clasifique las variables referidas a la poblacion de electores del Peru. Preferencia electoral. Edad del elector. ‘+ Estado socio econémico del elector. ‘+ Numero de integrantes en la familia del elector. ‘= Sexo del elector. ‘© Grado de instruccién del elector. ‘+ Ingresos mensuales del elector. a) 4 Cualitativas y 3 Cuantitativas b) 3 Cualitativas y 4 Cuantitativas ©) 2 Cualitativas y 5 Cuantitativas @) 5 Cualitativas y 2 Cuantitativas ©) 1 Cualitativas y 6 Cuantitativas 2. El objetivo principal de la estadistica descriptiva es: a) Deseribir una poblacién. b) Hallar las regularidades que se encuentran en los fenoémenos de masa. ) Inferir algo acerca de la poblacién. 4) Calcular un promedio. ) Hallar el promedio de acuerdo a la cantidad. 3. eCudles de las siguientes afirmaciones es cierto respecto a una muestra? a) Es parte de una poblacién. b) Debe contener al menos cinco observaciones. ¢) Se refiere a estadistica descriptiva. a) Se refiere a una variable no contable. e) Contiene dentro a la poblacion. 4. Una variable cualitativa. a) Siempre se refiere a una cualidad. b) Es no numérica UNIVERSIDAD PRIVADA TELESUP c) Siempre tiene sdlo dos resultados posibles. d) Todas las anteriores son correctas. e) Es numérica 5. Una variable en escala nominal. a) Casi siempre es el resultado de contar algo. 'b) Tiene un punto cero significative. c) Puede adquirir valores negativos. 1d) No puede tener més de dos categorias. ©) Solo sirve para nombrar su caracteristica 6. En una empresa, se hizo el estudio sobre las edades de los empleados y se obtuvo la siguiente tabla: 12 15 23 a 9 Total: 70 Donde A es el porcentaje de empleados con 30 afios 6 mas. Bes el porcentaje de empleados entre 40 y 45 afios. Sefiale A - B (aprox) a) 65% b) 60% ©) 63% d) 64% e) 62% 7. La tabla muestra la distribucién del ingreso familiar correspondiente a 80 familias. fi: frecuencia absoluta simple Fi: frecuencia absoluta acumulada aceon: [160 - 170) 12 «12 “ [i70=180)——4B80 —fiso-190qy—~C*“‘«2+*«*tST fi90=200)— SC«OS (200-210) Determine el nimero de familias que ganan menos de 200 nuevos soles. a) 66 b) 70 ©) 54 4) 76 ) 50 8. En una prueba de aptitud académica se evaluaron a “‘n” estudiantes y las notas obtenidas se clasificaron en una tabla de distribucién de frecuencias ‘como se muestra a continuacién. Corer ee act) ry eee 45 KI50 55 3K/100 ———_ —._.—_ ie de estudi S as {Qué porcentaje de estudiantes obtuvieron una nota menor que 65 75 3K/50 puntos 0 igual que 85 puntos? 85 K/100 a) 30% b) 40% c) 50% a) 60% €) 70% UNIVERSIDAD PRIVADA TELESUP 9. {Cual de los siguientes diagramas es un histograma? 4 ») l | | | | : —eoetliien ILE LL: MARCAS DECLASE 2 I * ) en iE i # i ie | eaten | arene e 10. 4Cual de los siguientes diagramas es una ojiva? a) b) Taal ato Tesi en as bow eg @ ° ie 7 Distal Sli dk ® e) 1e i ‘ont en Coneas tacos Resumen OO — UNIDAD DE APRENDIZAJE I: Tnteotinedion, Organinadion y Presemtacion de Datos La estadistica es un auxiliar de muchas ciencias con base matemitica referente a la recoleccién, analisis e interpretacion de datos, ya sea para ayudar en la resolucion de la toma de decisiones 0 para explicar condiciones regulares 0 irregulares de algun fenémeno, de ocurrencia en forma aleatoria 0 condicional. Se usa para la toma de decisiones en areas de negocios 0 instituciones gubemamentales. Variable es una caracteristica (magnitud, vector o numero) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio. Clasificacién de Variables: Cualitativos: Arrojan respuestas categéricas, miden cualidades y se les puede asignar después un valor numérico (codificarlas). Cuantitatives: Producen respuestas numéricas, miden cantidades y podemos tratar un dato cuantitativo como cualitativo (categorizando). Los datos recopilados en la muestra se pueden organizar en Tablas de Frecuencias. Estas tablas muestran: Frecuencia absoluta (fi): Resulta de contar el numero de| observaciones que “entran” en una clase Frecuencia Relativa (hi): Es la proporcion| de observaciones que “entran” en una clase Frecuencia Absoluta Acumulada (Fi): Es el numero de observaciones acumuladas. Frecuencia Relativa Acumutada (Hi): es la proporcién de observaciones acumuladas Las mas importantes graficas: Sector.- Consiste en dividir un circulo en tantos sectores| como valores de la variable. La amplitud de cada sector debe ser proporcional a la/ frecuencia del valor correspondiente. Histograma.- Es un caso particular del diagrama| anterior en el caso de variables continuas. Si los intervalos son correlativos, los) recténgulos aparecen pegados en la representacién grafica. Barras.- Consiste en dos| ejes perpendiculares y una barra o rectangulo para cada valor de la variable. Se suele colocar en el eje horizontal los valores de la variable. Introduccion ET a) Presentacién y contextualizacién Los temas que se tratan en la presente unidad, tiene por finalidad que el estudiante ‘comprenda las Medidas De Tendencia Central y Medidas de Dispersion asi como formular apreciaciones criticas sobre los diversos conceptos desarrollados. Conocer ademas las diferentes medidas para datos agrupados y no agrupados; esto se puede utilizar para organizar datos y resolver las interrogantes. b) Competencia Utiliza las medidas estadisticas adecuadamente para comprender mejor el comportamiento de los datos agrupados y no agrupados. ©) Capacidades 1 .Explica y compara los resultados obtenidos en base a las Medidas de Tendencia Central para datos no Agrupados. 2. Describe y analiza las Medidas de Tendencia Central para datos Agrupados. 3. Caloula y grafica la estructura de las Medidas de Dispersion. 4. Define, analiza y grafica las medidas de posicién. d) Actitudes Y Toma iniciativa y lidera al equipo en el cumplimiento de las actividades asignadas a su vez promueve actividades y toma de decisiones pertinentes. Y¥ Cumple con los horarios establecidos, respeta y cumple las normas de convivencia en el ambito superior universitario. Y Planifica y cumple oportunamente sus tareas 0 actividades diarias y presenta sus trabajos en forma organizada e) Presentacién de Ideas basicas y contenido esenciales de la Unidad: La Unidad de Aprendizaje 2: Medidas De Tendencia Central y Medidas de Dispersién, comprende el desarrollo de los siguientes temas: TEMA 01: Medidas de tendencia central para datos no agrupados. TEMA 02: Medidas de tendencia central para datos agrupados. TEMA 03: Medidas de dispersion. TEMA 04: Medidas de posicién. Tendencia Central Para Datos , ‘ y Competencia: (@ Explicar y comparar los resultados obtenidos Desarrollo de los Temas _————— eee © Tema 01: Medidas de Tendeneia Central Para Datos No Agrupados Las medidas de tendencia central: Son indicadores estadisticos que muestran hacia que valor (0 valores) se agrupan los datos. | Esta primera parte la dedicaremos a analizar tres medidas de tendencia central: aaa ee ae aI Hay que entender que existen dos formas distintas de Hay que entender que existen dos formas distintas de trabajar con los datos tanto poblacionales como muestrales: sin agruparlos 0 agrupandolos en tablas de frecuencias. Esta apreciacién nos sugiere dos formas de representar la media aritmética UNIVERSIDAD PRIVADA TELESUP Media Aritmética para Datos No Agrupados Podemos diferenciar la formula del promedio simple para datos poblaciones y muestrales: Observe que la variacién de ambas formulas radica en el tamafio de los datos (N identifica el tamario de la poblacién, mientras que m el de la muestra). | Elprofesor de la materia de estadistica desea | conocer el promedio de las notas finales de los 10 alumnos de la clase. Las notas de los alumnos son: 1 1 1 1 | Cabeanotar que en el ejemplo | 1 Se 2 SS, estamos hablando de una fe 30 35 38 42 40 poblacién correspondiente a ie gs semen! | todos los alumnos de la clase. fetoocco ceo -- (eecutllos ol nromecto_coinotes delce a! El promedio de las 10 notas es 1 = de 3,47. UNIVERSIDAD PRIVADA TELESUP Modifiquemos la primera neta por 0,0 y calculemos nuevamente la media aritmétic | _ 0.0+3.1+2.4+4.0+35+3.0435+38: 315 a 10 10 Ma3IS En este caso la media pasa de 3,47 a 3,15. Esta variacién notoria se debié a que: la media aritmética es sensible a los valores extremos cuando tratamos con pocos, datos. EI 0,0 es una nota atipica comparada con las demas, que estén ubicadas. entre 3,0 y 4,2. Mediana (Me): Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales. La definicion de geométrica se refiere al punto que divide en dos partes a un segmento. Por ejemplo, la mediana del segmento AB es el punto C. La mediana es 3, dejando § datos a cada lado. 3 UNIVERSIDAD PRIVADA TELESUP Ejemplo: (cantidad de datos par) Modifiquemos el ejemplo anterior, eliminando el titimo dato. Encontrar la mediana: PASO 1: Ordenar los datos. \ eee ee ee KKK + 11122234455 1 Ceol { PASO 2: Localizar el valor que divide en dos el numero de datos. EI punto medio se encuentra entre dos valores: 2 y 3, por tanto, el valor d OL $°- 28. mediana sera M Moda (Mo): indica el valor que més se repite, o la clase que posee mayor frecuencia. En el caso de que dos valores presenten la misma frecuencia, decimos que existe un conjunto de datos bimodal. Para mas de dos modas hablaremos de un conjunto de datos multimodal. Ejemplo: Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de gaseosa que mas consume ala semana: Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1 Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2 Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3 UNIVERSIDAD PRIVADA TELESUP SOLUCION PASO 1: Determinar las frecuencias de cada valor de la variable. La mara 1 se repite 15 veces La marca 2 se repite 6 veces > La marca 3 se repite 9 veces PASO 2: La moda representa el valor que mas se se repite. Mo = Marca 1 {VIeEdidas DeTendencia | Centra | Se. Para Datos = Agrupados — . Competencia: UNIVERSIDAD PRIVADA TELESUP © Tema 02: Medidas de Tendeneia Central para Datos Agrupados Cuando los datos se agrupan en tablas, la media aritmética es igual a la division de la sumatoria del producto de las clases por la frecuencia sobre el nimero de datos. Media Aritmética para Datos Agrupados La sumatoria parte desde el primer intervalo de clase (i = 1) hasta el ultimo (Ne), siendo Xi la clase del intervalo i. Cuando los datos se agrupan en tablas de frecuencias, el calculo de la media varia un poco, ya que existe una pérdida de informacién en el momento en que se trabaja con intervalos de frecuencia y no con los datos directamente (los datos se agrupan por intervalo, desconociendo el valor exacto de cada uno de ellos). Las marcas de clases (Xi) cumple la funcién de representar los intervalos de clase. UNIVERSIDAD PRIVADA TELESUP Ejemplo en Tablas La siguiente tabla de frecuencia muestra el nimero de preguntas de 81 encuestados sobre un test que consta de solo seis preguntas, G Preguntas buenas/ personas. i ‘SOLUCION PASO 1: Ne YX, f =lal5 + 213 + 3x8 + 4r19 + 5421+ 6x5 = 276 i=l PASO 2: Dividir la sumatoria sobre el numero total de datos. UNIVERSIDAD PRIVADA TELESUP En promedio los encuestados contestaron aproximadamente 3 (el valor exacto es el de 3,41) preguntas buenas. Ejemplo en Tablas de Frecuencia Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia’ 1 40.1 48.1 441 3 2 48.1 56.1 52.1 8 3 56.1 64.1 60.1 at 4 64.1 721 68.1 32 5 724 80.1 76.1 21 6 80.1 88.1 84.1 18 = 88.1 96.1 92.4 14 8 96.1 104.1 100.1 1 Solucién Las marcas de clase representan a los intervalos de clase, por ejemplo, suponemos que la marca de clase para el primer intervalo (44,1) se repite 3 veces, al desconocer los 3 valores exactos que estan dentro de dicho intervalo. Realizar la sumatori frecuencia absoluta. del producto resultante entre las marcas de clase por su ye rr rrr rer rrns VS eb 44.113 + 52.178 + 60.1111 + 68.1132 + 76.1121 Ve ! ‘+ :84.1118 + 92.1114 + 100.161 ' = 7890.6 Crested ee ee ar ! ! ! ! 4 UNIVERSIDAD PRIVADA TELESUP Paso 2: Dividir la sumatoria sobre el numero total de datos. 108 Ejemplo: Comparativa entre el calculo de la media aritmética para datos no agrupados y datos agrupados en tablas de frecuencia, Calcular la media aritmética a los siguientes datos sin agrupar y agrupandolos nales): \. 478 23,1 124 354 440 26,2 a 186 11,0 320 124 49,4 41,4 186 21,0 263 111 214 30.6 12,8 43,1 18,1 381 16,8 12.4 336 409 15,2 332 48,2 37.0 en una tabla de frecuencia (suponga que los datos son poblacio. Soluci6n Calculemos la media para los datos sin agrupar: Crete testes t EO _ A. Hs 18.64 18 6412 BEA GSI Te ATO LT { = 30 30 = v d = 2774 eS Luego construyamos la tabla y calculemos su media aritmética con el fin de comparar ‘ambos resultados: eer erereremnc) 1 11.0 17.4 14.2 8 2 74 238 20.6 6 3 238 302 27.0 2 4 30.2 36.6 33.4 5 5 36.6 43.0 39.8 4 6 43.0 49.4 5 UNIVERSIDAD PRIVADA TELESUP UNIVERSIDAD PRIVADA TELESUP Paso: Realizar la sumatoria del producto resultante entre las marcas de clase por su frecuencia absoluta. a ’ | @ |S WO= 14.218 + 20.616 + 27.0 12+ 33.415 + 39.814 + 46.215 ; e q = 8224 1 Paso 2: Dividir La Sumatoria Sobre El Numero Total De Datos. Si Se Observa El Resultado, Solo Se Diferencia En Centésimos De La Media Poblacional. Mediana para Datos Agrupados La mediana para datos agrupados en un cuadro de frecuencia se obtiene utilizando las frecuencias absolutas o las frecuencias relativas de la siguiente manera: Donde m = Intervalo que contione a la mediana Fmt = Frecuencia acumulada absoluta del intervalo anterior a la clase me (Fm) Hm.1= Frecuencia acumulada relativa del intervalo anterior ala clase d (Hm) fm = Frecuencia absoluta del intervalo de clase m. ha = Frecuencia relativa del intervalo de clase m. Lin. = Limite inferior de la clase donde esté ubicada la mediana ¢ = Longitud del intervalo de clase. UNIVERSIDAD PRIVADA TELESUP Ejemplo: Calcular la mediana a partir de la siguiente tabla de frecuencia: Ni | Clase f iF: h H 1 10 5 5 10,4% | 10,4% 2 20 7; 12 | 14,6% | 25,0% 3 30 10 22 | 20,8% | 45,8% 4 40 13 35 | 27,1% | 72,9% 5 50 10 45 20,8% 93,8% 6 60 2 47 4,2% 97,9% 7 70 1 48 2.1% | 100,0% Total 48 100,0% Solucién Paso t: Localizar entre que clases se encuentra la mediana. Observe que la mediana se ‘encuentra en la clase 4 (*) que contiene a los elementos 24 y 25. Como n= 48 (Atimero par), [a mediana sera la media aritmética de los valores que ocupan las posiciones 24 y 25. Paso 2: La posicién 24 corresponde al valor 40. La posicion 25 corresponde al valor 40. Ejemplo: Mediana Para Datos Agrupados En Tablas 5 = a Determinar la mediana de la siguiente tabla de frecuencia: Ni Lm Ls - FE h H Mc 1 | 21,20 | 29,21 5 5 12,50% | 12,50% | 25.21 2 | 2021 | 37,21 2: i 5,00% | 17,50% | 33.21 3 | 37,21 | 45,21 10 17 | 25,00% | 42.50% | 41,21 4 | 4521 | 53,21 a 24 | 17.50% | 60,00% | 49,21 5 | 53.21 | 61,21 12 36 | 30,00% | 90,00% | 57,21 6 | 6121 | 69,21 3 39 7,50% | 97,50% | 65,21 7 | 69,21 | 77,20 1 40 2,50% | 100,00% | 73.21 Total 40 100,00% UNIVERSIDAD PRIVADA TELESUP Solucién Paso 1: Localizar entre que intervalos de clase se encuentra la median: 1 Podemos observar que el punto que divide el 50% de los datos esta en el intervalo de | 1 clase 4, para ser mas preciso, entre los valores 45,21 y 53,21 (hasta 45,21 hay 1 ' agrupados el 42,50% de los datos, y hasta 53,21 se resume el 60,00% de los datos) ; is Tt TF H | Me 221 |S 5 12.50% | 25,21 2 azar] 2 Z 77.50% [33,21 3 10 17 [25.00% | 42.50% | 41.21 (& rei, Tia ea 750% 60.00% [aa.2i S| 5321 [ona | 12 | 36 | 30.00% | 90.00% [57.21 6 [e121 | 682 oa aorean 97.50% | 6521 ralseogt |azan h\ Seleaaaie sa : i0000% | 7821 Total divide en dos partes igualesltotatdetos | datos. En el mismo ejemplo ahora vamos a encontrar la mediana, utilizando para ello las frecuencias absolutas. Paso t: Localizar entre que intervalos de clase se encuentra la mediana. Podemos observar que el punto que divide en partes iguales a la distribucion esta enel intervalo de clase 4, para ser mas preciso, entre los valores 45,21 y 53,21 UNIVERSIDAD PRIVADA TELESUP UNIVERSIDAD PRIVADA TELESUP 2 Hallamos m = 45.21 a 53.21 fm = 7 7 = — Luego: Me = @8gs [771 @= Ulm = 45.21 o=8 45.21+ [=] 8 = 48.64 Fut = 17 Ubicando La Mediana En El Grafico De Ojiva prs | En.un grafico de ojiva, la mediana corresponde ala proyeccién del punto en eje horizontal que equivale al 50% de los datos. En la el grafico de ojiva del ejemplo | 36-1, la mediana estaria ubicada en el sexto intervalo, entre 350 y 400: I H TARA. 75.0% Division de la cantidad de 0.0% datos en dos partes iguales 400 150 200 250 9094385~ 400 450 Mediana Moda Para Datos Agrupados Marca2 Marca1 Marcat Marca 1 Marca3 Marca1 Marca2 Marca t Marca Marca3 Marca Marca 2 Marca Marca1 Marca Marca 1 Marca Marca3 Marca3 Marca 2 UNIVERSIDAD PRIVADA TELESUP Solucién Paso: Construimos la tabla de frecuencias Paso 2: ie La moda representa el valor que A mas se repite. En este caso es 7 la marca 1. 30 Calculo De La Moda Mediante Férmula Algunos autores suelen aplicar una férmula para determinar la moda para tablas de frecuencia = tee GAS) o ' Donde: Lins = Limite inferior de! intervalo donde se ubica la moda j d; = Diferencia entre el valor de la frecuencia donde se ubica la moda y el Il valor del intervalo anterior (fm ~ fr.) I d= Diferencia entre el valor de la frecuencia donde se ubica la moda y el 1 valor del intervalo siguiente (fm — fms) { = Longitud del intervalo de clase Ejemplo: Moda Para Datos Agrupados Calcular la moda a partir de la siguiente tabla de frecuencia: Cres koe) 21.21 29.21 29.21 37.21 UNIVERSIDAD PRIVADA TELESUP Solucién Paso 1: Hemos marcado (*) el intervalo que tiene la frecuencia més alt encuentra el valor de la moda. Paso 2: Ubicamos el limite inferior del intervalo de clase donde se ubica la moda = 53.21 Asi mismo hallamos las diferencias: d; = 12-7=5 d= 12-3=9 El valor de c= 8 Calculando la moda @@= 53.21 + (=3,) 8 = 56.08 Ejemplo 2 Calcular la moda en la siguiente tabla de frecuencias Los intervalos de clase que mas frecuencias tienen son [10- 12) y [12- 14) por tanto decimos que es un caso donde aparecen dos modas, (bimodal). Paso 2: Como hay dos modas, entonces calculando la primera moda Lim, = 10; d= 5 4= 1;d.=5-5= 0;0=2 Mo:-10 + (G2) 2= 12 UNIVERSIDAD PRIVADA TELESUP Ahora, la segunda moda: Lim2 = 12; d: = 5 — 5 = 0; d2= 5—0= 5 (Comoel 5 esta en el diltimo intervalo entonces la resta siempre es con 0); ¢= 2 Medidas de Dispersion Lec ee UNIVERSIDAD PRIVADA TELESUP © Tema 03: Medidas de Dispersion Las Medidas son: Hasta el momento hemos estudiado los valores centrales de la distribucién, pero también es importante conocer si los valores en general estan cerca 0 alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersion. Elrango 0 amplitud de un conjunto de datos es la diferencia entre la observacion de mayor valor y la observacién de menor valor. R= Xmmax— Xin Varianza: La varianza es la media aritmética de! cuadrado de las desviaciones respecto a la media de una distribucién estadistica. Este estadistico tiene el inconveniente de UNIVERSIDAD PRIVADA TELESUP plo, sila variable viene dada en cm. la varianza vendra en cm2. UNIVERSIDAD PRIVADA TELESUP Ecuaciones de Ia varianza 1) Varianza poblacional 2) Varianza muestra: eo? a ° 2 @ 2 a) Dates noagrupader G = B=@) _ in ® o oo or P 2 © 2 Bale b) Datos agrupados G@ = E@) _ Dai 9 o o A la varianza muestral con en el denominador n-1 se le llama cuasivarianza Desviacién estandar o tipica: Es la raiz cuadrada de la varianza, se denota por S. Este estadistico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Alaa raiz cuadrada de la Cuasi varianza se le llama Cuasi desviacion tipica. Coeficiente de Variacién: Es un estadistico de dispersion que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitira decir entre dos muestras, cual es la que presenta mayor dispersion. La denotaremos por C, +100% Todas estas medidas de dispersion vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos puiss'no @s. posible compara unidsdss de'distintn ipo: UNIVERSIDAD PRIVADA TELESUP Ejemplo 1. Sean los datos siguientes: 32, 54, 21, 33, 45, 49, 36, 42, 57, 28, 52, 61 a) Rango: 61-21=40 b) Para calcular Varianza muestral, primero se obtiene la suma de las observaciones y la suma de los cuadrados de las observaciones. 510 VEO 324544452461 = 510; => Ye == 425 DR @= 32? +542 +4 522% + 61? = 23414 12.573 425 00 = 1100 = 29.58% [10, 20) [20, 30) =e: 130,40) [40, 50) [50, 60 [60,70) [70, 80) Suma 42 1820 88 050 516.68 UNIVERSIDAD PRIVADA TELESUP Solucién En este caso se trata de datos agrupados, y para hacer los calculos usaremos las ecuaciones de datos agrupados. Va) Media aritmética: «= 18 = 43.33 I aaa 1b) Varianza: ¢ = = = 223.98 I eg Desviacion estandar: s = 223.98 = 14.96 1d Cooficiente de variacién: CV = +" :100 = 34.53 % l a ‘\e)_Desviacion Media: Dm = = = 12.30 eee eee ee ee ee ee Ejemplo 3. El tiempo que utilizan 6 nifios de igual edad para desarrollar una misma tarea fue el siguiente: 12,13, 15, 11, 17, 16. Calcular la Desviacion media. a a ae a - Calculando la media aritmética: a a X =12+13+15+11+17+16 = 84 = 14 minutos 6 6 1 - Calculando la desviacion media | MM = [12-14 | + [13-14 | + [15-14] + |11-14] + |17-14) + [16-14] ! I ° I DM= 24+1+14+34+3+2 = 12 = 2minutos. 6 6 ! wee eee ee ee Ke He ee eK eK ‘N Interpretacién: El tiempo utiizado por los nifios para desarrollar la tarea, se dispersa en promedio 2 minutos con respecto al valor central UNIVERSIDAD PRIVADA TELESUP Ejemplo 4. Los datos corresponden a las edades de 5 nifios de la Comunidad “x” de nuestro ejemplo inicial: 4, 5, 7, 8, 6. Vamos a calcular las medidas de dispersion para datos no agrupados. a) Desviacién Media (DM) Proceso 50/ _ ss+ 24S 19-615 =554 *10= Q, 16-6 2. Construyendo la siguiente tabla: 3. Calculando la Desviacion Media: DM= § = 1.2 afios 5 Interpretaci6n. La edad de los nifios con respecto a su media aritmética tiene una dispersion de 1.2 afios. UNIVERSIDAD PRIVADA TELESUP b) Cuasi varianza. Proceso: 1. Se calcula la media aritmética que en este caso es igual a 6 afios. 2 EX?= 42+ 5 +7? +8746? = 16 +254 49+64+ 36 = 190 3. Lacuasivarianza seré: St =De-n(F P= 190- nt 4 No tiene interpretacion practica, slo se calcula para poder determinar la cuasi desviacion estandar. ©) Cuasi desviacién Estandar (5): S= VS? = 25 = 158=2afos Interpretacion. Las edades de los nifios de la Comunidad “x” se dispersan respecto al valor central en aproximadamente 2 afios. d) Coeficiente de variacién ( CV) CV= $x 100 = 158x100 = 26.33% = 26% = 6 Interpretacién: Como cv% es menor que el 30% entonces la media es una medida representativa del conjunto de datos. Medidas | De | Posicion Competencia: y ee [POBREZA TOTAL > 418.6 48.7 Ha disminuido 004 2005 2006 2007 2008 2009 36 Selva | Selva | Lima Urbana! Rural !Metrop. Sierra UNIVERSIDAD PRIVADA TELESUP © Tema 04: Medidas dg Posicidn Acontinuacién se describen las medidas de posicién mas comunes utilizadas en estadistica, como lo son: Cuartiles: Hay 3 cuartiles que dividen a una distribucién en 4 partes iguales: primero, segundo y tecer cuartil. Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno deci. Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil) Cuartiles (01, 02, 03) Aquel valor de una serie que supera al 25% de los datos y es superado por el 75% restante. Formula de Q1 para series de Datos Agrupados en Clase. x er he 4: Posicion de Q1, la cual se localiza en la primera frecuencia acumulada_ que la contenga, siendo la clase de Q1, la correspondiente a tal frecuencia acumulada. Li, faa (frec. acumulda anterior), fi, Ic: idéntico a los conceptos vistos para Mediana pero referidos a la medida de la posicién correspondiente. a. Primer cuartil (91): b. Segundo cuartil (92): Coincide, es idéntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie. UNIVERSIDAD PRIVADA TELESUP ¢ Tercer cuartil (3): Aquel valor, término 0 dato que supera al 75% y e superado por el 25% de los datos restantes de la Serie. Formula de Q3 para series de Datos Agrupados en Clase. Donde: 2>(/i Posicion de Q3, todo idéntico al célculo de la Mediana. 4 Deciles (D1, D2... D9) 0 Grimer Decil (D1), Quinto Decl (DS) yNoveno Decl(O9.=SOC<‘“‘), UNIVERSIDAD PRIVADA TELESUP Tema 02: €1 Coeficiente de Correlacién La correlacién estadistica determina la relacién 0 dependencia que existe entre las dos variables que intervienen en una distribucion bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estan correlacionadas o que hay correlacién entre ellas. El coeficiente de correlacion lineal se expresa mediante la letra r. 1. El coeficiente de correlacién no varia al hacerlo la escala de medicion. Es decir, si expresamos la altura en metros 0 en centimetros el + Coeficiente de correlacién no varia. 2. _ El signo del coeficiente de correlacién es el mismo que el de la covarianza Silla covarianza es positiva, la correlacion es directa. Sila covarianza es negativa, la correlacion es inversa. Sila covarianza es nula, no existe correlacion. 3. El coeficiente es un numero real entre menos ~1 y 1 -1srst 4. Siel coeficiente de correlaci6n lineal toma valores cercanos a ~1 la correlaci6n es fuerte e inversa, y sera tanto mas fuerte cuanto mas se aproxime ra -1. 5. Siel coeficiente de correlacién lineal toma valores cercanos a 1 la correlacion es fuerte y directa, y sera tanto mas fuerte cuanto mas se aproxime ra 1. UNIVERSIDAD PRIVADA TELESUP 6. Si elcoeficiente de correlacién lineal toma valores cercanos a 0, la correlacion es débil Sir = 1 6 -1, los puntos de la nube estan sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional. Calcular el coeficiente de correlacion. UNIVERSIDAD PRIVADA TELESUP #380618 | 952 - 36,8 oj SS 2.18 = 43.08 10 +10 0, = (368-607 a, = ¥505 - 6.56 0, «Lt 195:90,1- 7.6 37.61 ae gor. 656 Ot v Obtener ¢ interpretar el coeficiente de correlacién lineal 7 alk a a . a a ‘Vl xy fi 100 40 000 100 20 000 3600 UNIVERSIDAD PRIVADA TELESUP 84 X= 0 60 y- e184 2 43750 _ gar 2 _ 3464 of = 60° =775 os 18.4 = 7.84 0, = W777 ‘5 = 27.84 = V7 84-28 o,, = #2500 69. 16.4 =-44 r= 24 _ 05 e428” Es una correlacién negativa débil. EI Coeficiente | see de Determinacion 9 | Competencia: ea” 7 % 2 Zz J Pp g eras vd Una nube de puntos que se agrupa en tomo a una recta imaginaria nos justifica el estudio de la regresi6n lineal entre las variables. Normalmente, la variable explicativa no explica (valga la redundancia) al 100% los resultados que se observan en la variable explicada. El unico caso en el que una variable explica al 100% a la otra variable es aquel donde los puntos de la nube formen una recta. En ese caso, cada valor de X nos da el valor exacto de Y. Pero ese no es el caso general. Vamos a cuantificar la calidad de la explicacion de Y por X mediante el Coeficiente De Determinacién. Los datos de ambas variables tienen una varianza. No nos vamos a interesar por la varianza de la X (independiente), pero si por la de Y, por estar influenciada por la otra = variable. " La varianza de Y esta generada, de una parte, por los datos de X (es decir, por la varianza), y de otra parte por causas desconocidas (a no ser que los datos formen una linea recta). El coeficiente de determinacion va a ser el % de varianza de Y que se puede explicar For X, y se le suele llamar CALIDAD DEL AJUSTE, porque valora lo cerca que esta la ‘ube de puntos de la recta de regresién (0 dicho de otro modo, lo ajustada que esta la Tube de puntos a la recta de regresion). Como yi = yi +e, desarrollando la expresion ce la varianza de Y se puede llegar a que: UNIVERSIDAD PRIVADA TELESUP Y por tanto, el % de varianza de Y explicada por X es: A Sy 2 x 100 s y 2 ty x 100 Que resulta ser §?.§ . elevado al cuadrado y multiplicado por 100. xy Es por ello que al coeficiente de determinacion se le llama R?, es decir De una determinada empresa se conocen los siguientes datos, referidos al volumen de ventas ( en millones de pesetas) y al gasto en publicidad ( en miles de pesetas) de los tiltimos 6 afios: UNIVERSIDAD PRIVADA TELESUP El coeficiente de determinacién lineal para obtener una medida descriptiva del grado de asociacién lineal que existe entre las variables. La expresion del coeficiente de determinaci6n es: Donde Sxy representa la covarianza de las variables X e Y. Cuya expresion simplificada es: 2 2_ Sy Ra ost Donde Sxy representa la covarianza de las variables X e Y. Cuya expresi6n simplificada es: Para clarificar la forma de calculo construimos la siguiente tabla: (variable X= Gastos de publicidad y variable Y= Volumen de vent X= 49,333; Y=21.5; 8x=20.870; sxy=158 ‘Substituyendo obtenemos que vale 0.956 UNIVERSIDAD PRIVADA TELESUP Series De Tiempo ‘Se denomina series de tiempo a un conjunto de observaciones obtenidas durante un periodo de tiempo. El objeto de analizar tales datos es determiner si se presentan ciertos Patrones o pautas no aleatorias que se puedan utilizar para predecir 0 hacer proyecciones futuras. Por ejemplo los pronésticos de venta, los pronésticos de matricula, pronésticos de produccién, ete. Eleccién Del Origen O Codificacién Del Tiempo Debido a que el tiempo (afios, meses, semanas y dias) es una variable cualitativa, es necesario codificarlo para poder realizar el andlisis ya se de regresi6n o de correlacién. r @) | Cuando se tiene series cronolégicas con datos impares, de periodos, se | ! ' ———————— | elige el origen en la mitad del periodo medio. | Ejemplo. Se tiene la siguiente de 7 aftos. cere 2004 2005 2006 --$ 2008 2009 2010 beer et) 3 2 0 1 2 . b) | Cuando se tiene series cronologicas con datos par, de | Periods, se elige el origen entre los dos periodos medios, ' ! | ya no aparece el cero y los cbdigos son alternados. 1 | Ejemplo 1 2005 2006 ©2007 2008 2009 2010 UNIVERSIDAD PRIVADA TELESUP Ejemplo 1. Los siguientes datos representan los registros de la matricula en INTUR PERU (en cientos de personas). Hallar la ecuacién lineal y luego hacer un pronéstico para el afio 2013. Afios 2006 2007 2008 2009 2010 25 28 24 19 24 Solucién. Se construye la tabla asignando los cédigos del tiempo. En este caso n es impar oon Luego a= 2.74 y @= ——S= = =" =-0.17 La ecuacién sera: Y = 2.74 —0.17X Para hallar el numero de matriculados en el afio 2013, se asigna el codigo de tiempo que sigue, asi: 2011 2012=4; 2013 Este valor reemplazamos en la ecuacion obtenida: Y = 2.74 — 0.17(5) = 1.89. Esto quiere decir que en el afio 2013 se matricularan aproximadamente 189 alumnos. UNIVERSIDAD PRIVADA TELESUP Ejemplo 2. Una constructora en 4 afios ha terminado de reconstruir la siguiente cantidad de casas en Pisco. Predecir para el afio 2012. Afftos 2007 2008 2009 2010 Casas reconstruidas 12 no 20 Solucién. Se construye la tabla asignando los cédigos del tiempo. En este caso n es par Luego se sigue e! mismo procedimiento del ejemplo 1, obteniéndose la siguiente ecuacion de regresion: Y = 15 + 1.5X Para realizar el pronéstico de numero de casas que serén reconstruidas en el afio 2013, se asigna el cédigo de tiempo que sigue asi: 2010=3; 2011=5; 2012=7 Este valor reemplazamos en la ecuacion: Y = 15 + (1.5)(7) = 25.5 = 26 Es decir en el afio 2012 se reconstruiran aproximadamente 26 casas. Diagrama de Dispersion coy Competencia: UNIVERSIDAD PRIVADA TELESUP © Tema 04: Diagrama de Dispersion Un diagrama de dispersién es un tipo de diagrama matematico que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posicion en el eje horizontal y el valor de la otra variable determinado por la posicién en el eje vertical. Un diagrama de dispersion se llama también gréfico de dispersion. Ejemplo 1 La tabla siguiente recoge las puntuaciones de 11 sujetos (N=11) en dos variables xeY. 5.68 Construir el diagrama de dispersion de Y en funcién de X. En base al diagrama construido. 2Cémo estan relacionada X e Y? UNIVERSIDAD PRIVADA TELESUP El grafico resultante es: DIAGRAMA DE DISPERSION Ejemplo 2.- 7 penne ete gorse DIAGRAMA DE DISPERSION Lecturas Recomendadas ED ‘LA RECTA DE REGRESION LINEAL SIMPLE POR EL METODO DE MINIMOS CUADRADOS ‘% EL COEFICIENTE DE CORRELACION %* EL COEFICIENTE DE DETERMINACION slont/Reuadrado.htm! “ DIAGRAMA DE DISPERSION Alctividades y Ejercicios SS OE Afio | Tiempo | Ofeta(y) oH 1980 4 ‘00000 41390 2 ‘20000 1381 3 40000 1382 4 ‘1000 1383 5 170000 198 é 4Sp000 1995 e 120000 1398 8 zonaoa 1397 8 210000 1385 10 200000 UNIVERSIDAD PRIVADA TELESUP Ingresa al link correlacién, lee atentamente las indicaciones, desarréllalo y envialo por el mismo medio. 2. Laevolucién del /PC (indice de precios al consumo) y de la tasa de inflacion en 1987 fue: mayo _|_suxio 19 a9 Calcula el coeficiente de correlacion entre el IPC y la tasa de Autoevaluacion a EES 4. En una zona de una ciudad se ha tomado una muestra para estudiar el numero de habitaciones dispuestas en un piso y el de personas que viven en él, ‘obteniéndose estos datos: NEDEHIANITACIONIS| 2 w]e 6 ry * * Calcula e interpreta el coeficiente de determinacion. a) 0.2025 b) 0.5929 ©) 0.7723 4) 0.9801 e) 0.1521 2. De una determinada empresa se conocen los siguientes datos, referidos al volumen de ventas (en millones de pesetas) y al gasto en publicidad (en miles de pesetas) de los ultimos 6 afios. Pore kc onesie an (mill. soles) ey Obtener las rectas de regresién minimo cuadratico. ZQué volumen de ventas de la empresa se podria esperar en un afio que se gaste de publicidad 60000 soles? ¢Y para un gasto en publicidad de 200000 soles? UNIVERSIDAD PRIVADA TELESUP a) Y= 3.604+0.363x ; 25.369; 10.859 b) Y= 3.704+0.363x; 25.500; 10.678 c) Y= 3.604+0.383x; 24.369; 11.246 d) Y = 3.904+0.363x; 24.768; 11.238 e) Y= 4.604+0.368x; 25.125; 10.756 3. Cinco nifios de 2, 3, 5, 7 y 8 afios de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos. Hallar la covarianza, a) 36.8 b) 31.6 c) 33.5 4) 30.8 e) 30.6 4, Se ha solicitado a un grupo de 50 individuos informacién sobre el numero de horas que dedican diariamente a dormir y ver la television. La clasificacién de las respuestas ha permitido elaborar la siente tabla: N° de horas dormidas (Xx) 6] 7] 8] 9 | 10 N° de horas de television (Y) 4]3]}3]2]4 Frecuencias absolutas (fi) 3] 16] 20] 10] 14 Calcular la covarianza a) -0.436 b) -0.453 ©) -0.235 d) -0.356 e) -0.358 a Estatura (X Calcular el coeficiente de correlacion. a) 0.92 b) 0.93 c) 0.94 d) 0.95 e) 0.98 dos variables X e Y se distribuyen segin la tabla siguiente YX 100 50 25 14 4 4 0 18 2 3 0 22 0 4 2 Obtener el coeficiente de correlacién lineal. a) -052 b) 0.54 ©) -0.66 @) -087 e) -059 UNIVERSIDAD PRIVADA TELESUP 7. Deuna determinada empresa se conocen los siguientes datos, referidos al volumen de ventas ( en millones de pesetas) y al gasto en publicidad ( en miles de pesetas) de los iltimos 6 afios: Volant Pt) (on Pb) " 6 " » Fa * 2 % Fa a @ ” 4Cual de los siguientes graficos representa es su diagrama de dispersién? a) b) 100 100 ; 20 + 20 + a ~ co | —__,* “0 ~ “ > 20 |» 20 o oO re er) 0 10 «0 a0 ©) | 120 4)| 100 a poy 0 | —_ * ® co | __# 5 [a a @ a | —__* 2 |} ge a» | —____*, 0 o o 0 0 3% ow 0 3% 4 8. Se dan los datos de demanda total y las ventas efectuadas por la empresa en los ultimos 11 aftos: ce) Gervandatcia rilescetm) | (miles de tm} UNIVERSIDAD PRIVADA TELESUP ventas eCual de los siguientes 3] aah 7] graficos representa es su = 7 diagrama de dispersion? ——| 0} 4 “aah | 7] ah 7a] EI "a 10 20 ? b) {| 8 oe as /_—_, ——______ 6 }—_+**___ a; |—_=_e ng ao | —___» — 5 — 5 ’ te o /—_____+__ o 200 400 600 ie ° 200 a) [“ po 18 > 30 << 10 20 - }______¢, > sf. yee 10 ¢ o 0 ° ° fo 400 500 Q 200__400 600 ®) 0 200 400 600 UNIVERSIDAD PRIVADA TELESUP 9. Se tienen los siguientes datos. Halla el coeficiente de determinacion. Afio | Tiempo | Oferta (¥) es) ‘1989 1 ‘100000 11990 2 4120000 131 3 1.40000 1992 4 440000 ‘995 5 70000 1934 8 4180000, 11985 7 4180000, 11998 8 00000 1997 3 210000 1996 19 200000 Se observa un comportamiento exponencial Se usara la regresi6n con la ecuaci6n Y = Anti log (a + b(X) ) nie 17 18 16 15 18 17 17 16 16 16 BO; 2) )o | sia eS is a) R?=(0,8282)°-100=68'59% by R?=(0,8456)? -100=71,51% ce) R?=(0,5252)' +100 = 38,59% d) R>=(0,9292)-100=78,59% e) R? =(0,6969)? -100 = 54.59% UNIDAD DE APRENDIZAJE III: ANALISIS DE REGRESION LINEAL Regresién Lineal Simple: Es el estudio de la relaci6n funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de prediccién y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notacién: Y=a+bXx Dond “a” es el valor de la ordenada donde la linea de regresién se intercepta con el eje Y. “b" es el coeficiente de regresion poblacional (pendiente de la linea recta). Determina la relacién 0 dependencia que existe entre las dos variables que intervienen en una distribucién bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estan correlacionadas 0 que hay correlacién entre elias. Una importante medida estadistica igual al cuadrado del coeficiente de correlacion. Se utiliza a menudo como medida de la eficacia de la cobertura en cuyo caso se mide el porcentaje de la variacion en el precio de una posicion al contado explicada por la variacion en el precio del instrumento de cobertura. Se puede obtener como R® a partir de una regresi6n lineal sencilla. La tepresentacién grafica més util para deseribir el comportamiento conjunto de dos variables es el diagrama de dispersi6n 0 nube de puntos, donde cada caso aparece| representado como un punto en el plano definido por las variables X: y X20 X y Y.

You might also like