Tema 1 La estadística: definiciones básicas Deming: ahora se va a dar inicio al módulo Medición y mejora de los sistemas de gestión de la calidad

en el sector público. Se trabajará principalmente con la estadística, que quizá, para algunos de ustedes es familiar; Nosotros, haremos que retome los conocimientos de la estadística de manera amigable y agradable, pues solo así, podrá ver lo útil que resulta manejar sus herramientas.

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

Chulo: Yo he escuchado que en la actualidad el uso de las herramientas estadísticas se hace cada día más generalizado, especialmente para apoyar el seguimiento de la implementación del sistema de gestión de calidad. Deming: Es correcto, todo el sistema de gestión de calidad debe medirse y controlarse y, no hay otra manera, que haciendo uso de dichas herramientas.

Chulo: Pero bueno, ¿Qué es la estadística? Deming: es un instrumento relativamente sencillo para tomar información, visualizarla, interpretarla, analizarla y tomar decisiones a tiempo. ¿Sencillo, verdad? Chulo: Y desde hace cuánto se utiliza la estadística Deming: La estadística fue primeramente un método de descripción de datos en los estados. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

El Estadístico se encarga del ordenamiento y manejo de datos presentándolos en tablas y gráficos que facilitan el análisis, para establecer conclusiones y recomendaciones para toma de decisiones oportunas

Ejemplos de estadística

Fisher Ronald

Galton Francis (regresión)

Análisis de varianza

QUESTELE, “frecuencia relativa” y “probabilidad matemática” El Estadista es una persona versada en un negocio, conoce la evolución diaria del país en términos de valores. Kart Pearson Fundo Dpto. de Estadística U. Londres

DATO CURIOSO: ¿Qué personaje de Colombia en recuerda usted que se haya hecho notar como estadista?

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010

presentadas de manera oportuna y correctas Apreciado estudiante. Variable: son los datos en términos numéricos Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . que debe ser bien recopilada en datos o variables y. le recomendamos ir al glosario para que pueda entender e identificar los términos que se usarán de aquí en adelante.Carlos Lleras Restrepo Albero Lleras Camargo Deming: El primer paso para poder hacer estadística es la recopilación de información.

número de alumnos que tiene un salón de clase Continuas: Son aquellas que representan cantidades muy dispersas en valores fraccionarios como por ejemplo la edad (58. como por ejemplo número de personas (128 personas).calibradores o galgas: pasa – no pasa . Proceso: como definió en el módulo uno. número de pupitres en el salón (35 pupitres). estatura (1.Conteo: número de piezas malas en un lote. también. Atributos: cuando la verificación de calidad no se puede medir en términos de variables se usa el concepto de aceptada o rechazada. Es.sentidos humanos: vista. la vigilancia periódica y continua sobre el desarrollo de un proceso o la calidad de un producto para comprobar que cumple con las especificaciones establecidas Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .68 m). adecuada o inadecuada. numero de cajas de 12 unidades. Variables Cualitativas: son aquellas que expresan distintas cualidades. cada modalidad que se presenta se determina atributo. el peso (58. numero de hijos que tiene una familia. es un conjunto de actividades mutuamente relacionadas que transforman entradas en salidas. característica o modalidad.7 kilos). tacto. gusto.Variable Cuantitativa: Son aquellas que se pueden medir y de las que podemos esperar un resultado numérico. defectuosa o no defectuosa. Control: todas aquellas actividades dirigidas a mantener un proceso en estado deseado. . oído. olfato. 6 años). el sistema de clasificación es por intermedio de . se pueden clasificar en discreta y continua Discreta: es aquella que se representa por números enteros sin fracciones. pasa o no pasa.

corresponde a la totalidad de los elementos que forman el universo de interés. Chulo: y. es preferible seleccionar unas cuantas partes para estudiarlas.. ¿A qué se le llama muestra? Deming: Cuando se presentan cantidades poblacionales resulta poco práctico y costoso analizar la totalidad de los elementos o partes que compone una dicha población. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .Apreciado estudiante: le sugerimos que vaya a la semana 3 del módulo uno. Por intermedio del control estadístico de los procesos se puede mantener el proceso dentro de normas establecidas. allí podrá recordar lo concerniente a proceso. Deming: Hay un término muy importante que se debe tener en cuenta: Población (se representa con la letra “N). Estas partes o piezas seleccionadas generalmente de manera aleatoria se le llaman muestra. pertenecen a la población todos aquellos elementos que poseen la característica que se desea estudiar.

Deming: Para hacer un buen estudio con las herramientas que nos brinda la estadística. es una parte de la estadística que se dedica a analizar y representar los datos. eso quiere decir que. • • • Medidas de tendencia central: moda.Hacer cuadro. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . y se necesita tomar información para decidir o tener una evidencia que apoye una decisión. Deming: ¡Exacto! Decimos. media Medidas de dispersión o de variación: rango. entonces. esto qué es. que cuando no es fácil o posible observar a toda la población. pero fundamental en todo estudio. mediana. se debe extraer una o unas pocas muestras representativas de la población. agrupada en frecuencias y agrupada en clases • Presentación gráfica de datos: histograma Deming: Pasaremos a ver la aplicación de estos términos con un ejemplo. varianza y desviación estándar Organización y procesamiento de datos: serie estadística simple. Chulo: Yo he escuchado hablar de la estadística descriptiva. lo que significa que todos tienen la misma probabilidad de ser escogidos. estas muestras para efectos de análisis estadístico debe cumplir con características como la de ser representativa de la población. Chulo. Está integrada por algunos elementos de la población. Este análisis es básico. Deming: La estadística descriptiva. es necesario conocer algunos términos. los elementos que la integran son escogidos de manera aleatoria o al azar. fotografía de una población y luego fotografía de una muestra Deming: La muestra (Se representa con la letra “n”).

57. 24. 30. 55. 30. 33. Recopilación o tabulación de la información: edades de funcionarios públicos 33. Las edades en términos de variables discretas (años completos) de un grupo de funcionarios de una entidad pública son: 1. 29. 53. 38. 28. 38. 57. 33. las más comunes son la media. 33. 38. 38. Organizar los datos de menor valor a mayor valor de cada variable discreta 24. 57 3. 33. 33 2. 33. 45. 28. 53. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . 24. 28. 33. 28. 45.Ejemplo. Uso de la estadística Existen diferentes tipos de medidas de centralización. 45. 33. 38. 33. 38. 38. 29. la Mediana y la Moda Deming: Vayamos contestando algunas preguntas y vamos avanzando en recordar estos tipos de medidas. 38. 38. 38. 55. 24.

1 El sistema de números 3. 30. 33 ^ Moda X Deming: La moda de una serie de números es aquel valor que más se repite. 38. 8. 24. 9. 30. 55. 28. 24. 11 Tiene de moda el 9 El sistema de números 3. 10. Deming: Eso es correcto. 7. 55. 45. 29. 24. 9. 38. 33. 6. 53. que es el valor o variable medio de una secuencia de datos Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . incluso si existe puede no ser única. 57. 5. 45.3 ¿Cuál fue el valor encontrado en la mitad de los datos? Respuesta: 33. 8. 8. 28. 6. 38. 9. 10 Tiene dos modas: 7 y 9 Chulo: Eso quiere decir que. 33. 53. 38. 33. 3. 45. 38. si se obtiene una sola moda es unimodal. 33. esto es la mediana. La moda puede no existir. 28. 9. 38. 33. 9. 7. es decir. 24. 38. si son 2 es bimodal y más de 2 multimodal. es el valor más común. 29. La moda se indica con ^X Ejemplo 1. 38. 28. 33 Respuesta: 21 3. 7.2 La edad más frecuente: 33 años es la moda (valor presentado con mayor frecuencia en una serie de datos) 33. 38. 9. 5.3. 45. 6. 7. 38. 33.1 ¿Cuántos empleados se incluyeron en el estudio? 33. 57.

7. X2. si el numero de muestras es par.57 años Esto es la media que es la suma de todos los valores de una variable específica (en este caso edad) dividida por el total de datos ∑ Xi n La formula de la media es X X De un conjunto de N números X1. 8.Para obtener la mediana. 10. 7.5 3. 4. 10 Su mediana será ½ (7 + 8) = 7. 8. XN. se ordenan los datos de menor a mayor.……. 9. la posición de la mediana será entre dos variables que corresponde a la posición central. 11 tiene de mediana el valor o variable 7 Ejemplo 2 Los números 3. 4. 4. 4. 6. 5. 8. 9. 9. es el valor promedio de una muestra o población y es igual a la suma del conjunto de datos dividido entre el número de datos Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . La mediana es el conjunto de datos ordenados en orden de magnitud ya sea ascendente o descendente. 8. 5. si N es impar la posición de la mediana es la posición media. o el promedio de los dos valores medios (cuando el número de datos es par) Ejemplo 1 Los números 3. 6.4 ¿Cuál es el valor promedio? Respuesta: edad promedio: 35. X3. el valor que ocupa la posición central dentro del conjunto de datos (cuando se tiene un número impar de datos).

38. 55. 28. 38. * Xi) 33. 33. 24. 55. 29. la media de los números 8 + 9 + 7 + 12 + 10 + 3 y 11 es X = 8 + 9 + 7 + 12 + 10 + 3 + 11 n 8. 33. 29. 38. 38. 30. 38. 53.. esa repetición es lo que se denomina frecuencia (fr) Agrupadas las edades multiplicamos cada edad (Xi) por las veces que se presentan (fr. 24. 45. 28. 33.………+ Xn = N Veamos otro ejemplo. 24. 45. 24. 33. 38. 57. 28. 33 Tabla agrupada en frecuencias = 36. 38. 38. 53. 33. 28. 45.X = X1 + X2 + X3+. 45..8095 años Xi 24 frecuencia 2 fr. 30.) y tenemos el valor (fr. 57.57 Donde ∑ (sigma mayúscula / letra griega) significa sumatoria Xi: representa observaciones individuales n : es el número de observaciones Xi: 33. 38. 38. * Xi 48 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . 33. 33 La media se ilustra con una X y sobre ella una pequeña línea Xmedia = 773 21 Deming: Bueno ahora como hemos agrupado las diferentes edades que se repiten.

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . existe un anécdota interesante sobre el concepto de un promedio.809 años Deming: ¡Ojo! a propósito de los promedios. como cuando en un grupo de personas mayores alguien dice: “Entre nosotros sumamos más de 300 años. así es.28 29 30 33 38 45 53 55 57 2 1 1 5 5 2 1 1 1 21 56 29 30 165 190 90 53 55 57 773 Deming: Si sumamos los resultados de fr. pues un valor muy alto o unos valores muy bajos. hay que tener cuidado.*Xi da como resultado el total de edades. pueden dar resultados que deben analizarse antes de accionar. aquí entre todos suman 773 años” Chulo: (Asombrado) ¡Uy! O sea que el promedio de 773 años entre 21 funcionarios es de 36.

El estudiante muy alegre por el dato que el anciano le había dado. pues 70 cm eran una profundidad pasable. se dio a la tarea de pasar el río.6 ¿Qué tanto están separados los datos del promedio o media? Esto se obtiene con la desviación estándar (S) que expresa que tanto se dispersan los datos en relación a la media Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .00 m y se ahogó” Charles Belt Little Chulo: Pobre joven. no tuvo en cuenta que los valores de las medias de dispersión son mayores cuando están muy disgregadas y son menores cuando los datos están cercanamente agrupados 3. su situación era muy difícil pues no sabia nadar y tenia que tomar la decisión de seguir adelante pasando el río. el señor anciano quien conocía el río en épocas de verano y que también conocía de estadística le respondió: “ El río en promedio tiene 70 cm. estudiante de estadística de una prestigiosa universidad.5 ¿Qué tan separados están los datos? Respuesta: 33. pues escuchaba – el llano es lindo – se dio al recorrido. 3. se encontró con una profundidad de 2. de profundidad”.58 m de estatura.HISTORIA PARA ANALIZAR: Profundidad promedio de 70 centímetros “ En una oportunidad un joven de 1. se encontró con que se terminó la carretera. pero cuando iba bien adentro en el recorrido del río. en sus vacaciones quiso conocer la belleza del llano. pero ya estando en el llano. Esto se llama rango o amplitud. pues seguía un río. ya que la edad mayor 57 menos la edad menor 24 = 33. en la orilla se encontraba un anciano se le acerco y le pregunto ¿En promedio cuánto tiene de profundidad el río?.

4868 Número de clases 10 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .20 Otra forma muy práctica es tomando la raíz cuadrada del numero de muestras o elementos que componen la muestra de variables y aproximando el resultado al número entero inmediatamente superior Ejemplo n = 90 datos Raíz cuadrada de 90 = 9. El número de clases o pisos o niveles (NC) se puede calcular NC = 1 + 3.100 101 .250 Más de 250 Número de clases (k) 5-7 6 . Es el valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor S= 1 ∑ xi − x ) 2 ( n −1 Serie agrupada en clases Cuando la muestra está integrada por un número mayor de datos.La S es la medida de dispersión más adecuada para la estadística descriptiva. es una guía que nos muestra para diferentes cantidades de datos.3 log n (n es el tamaño de la muestra) Bueno no nos compliquemos la vida. el número recomendado de clases a utilizar así Número de datos Menos de 50 50 . el número de pisos o clases lo podemos determinar con base en el siguiente criterio entrenado Usted puede utilizar la tabla que relaciono a continuación. estos datos se agrupan en subconjuntos o subclases.12 10 .10 7 .

126 32.000 28.251 36.125 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .626 48.500 44.125 4.125 4.000 Observe usted que precisamente la información de las edades de los 21 funcionarios quedó toda incluida en 8 niveles.125 4.375 40. de clase 28.625 48.125 4.876 IC 4.751 52.125 32. Qué observa usted? - Que en la primera clase inicia con la menor edad 24 años y se le agrega el “intervalo de clase” de 4.125 y se logra el primer rango o sea hasta 28.875 57.dm 8 niveles IC = 57 – 24 21 IC = 4.125 Clase 1 2 3 4 5 6 7 8 valor base 24.125 4.125 4.501 44.750 52.125 Inter.250 36.125 4.376 40.Intervalo de clase “IC” es la diferencia entre el dato mayor (DM) y el dato menor (dm) de la serie dividida por el número de clase o pisos que se ha determinado con anticipación Ejemplo: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos agruparlos en 8 niveles o números de clase (NC) El intervalo de clase de cada nivel o piso es IC = DM .

- Los siguientes niveles se va sumando el “Índice de confianza”.00 años.125 al anterior mayor valor del rango y se le sigue sumando hasta llegar al valor de la variable máxima. - Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior y sumándole una unidad. o una milésima o valor que haga diferenciar del anterior rango Tema 2 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . en este caso 4. o una centésima. en este caso 57.

en el que se involucra a todos los integrantes de una organización En 1950 uno de los alumnos de Juran y de Deming. En el año 1950 Armand Feigenbaun. Genichi Taguchi hace aportes sobre Métodos estadísticos Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . desarrolla el Control Total de Calidad (TQC).Evolución histórica de la Estadística en su aplicación de la calidad Evolución cronológica De 1920 a 1930 Shewarth precursor que inicia a utilizar métodos estadísticos en Bell Telephone En 1941 Harol Dodge y Henry Raming propusieron uso de tablas simplificadas de muestreo para inspección de entradas.

Shigeo Shingo. Philip B. estandarizar la operación y lograr resultados significativos en la mejora de la calidad. formación para la calidad. Deming propone Métodos de muestreo y recomienda 14 principios sobre el uso de herramientas estadísticas y la calidad En 1955. se establece el premio Deming de la Calidad. Poca -Yore. Con Ishikawa aparece el Movimiento de los Círculos de Calidad (mejorar la calidad. La revolución de la calidad en el Japón. Crosby. un comité de la Unión Japonesa de Científicos e Ingenieros (JUSE) analizaron un gran conjunto de técnicas herramientas y las denominaron las “Siete Nuevas Herramientas de Gestión y Planificación” En 1971 Ishikawa expone una herramienta muy útil. la Cultura de las Cinco S´s 1970. Ishikawa difunde por primera vez en Japón el concepto de Gráfico de Control. Normas Automotrices QS 900. productividad y seguridad) En 1968. se le responsabiliza al operario acerca de la calidad y el debe llevar e interpretar las medidas y variables usando gráficas de control En 1980 Creación de grupos de trabajo. Globalización de la Calidad. el Diagrama Causa-Efecto En 1979. En 1962. normas internacionales ISO 14000 y TQM (Total Quiality Management) Tema 3 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .En el año 1951. “Hacer bien las cosas a la primera vez”. El sistema de producción de Toyota y el Justo a tiempo. Normas internacionales ISO 9000 En 1990. el Kam-Ban. reducción de costos.

Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .Estadística descriptiva Distribución de frecuencias Chulo: En este tema se trabajarán las frecuencias. así se construye una tabla de dos columnas. relativa y sus componentes Deming: lo primero que se debe hacer es determinar la frecuencia de cada clase (fr.). absoluta. sumando de cada clase uno de los valores de la clase. en la primera se relacionan las clases y en la segunda su frecuencia.

llamada frecuencia absoluta (fr. Propiedad Primera Segunda Tercera Cuarta Quinta Sexta Descripción de la propiedad La suma de las frecuencias absolutas ordinarias es igual al tamaño de la muestra La suma de las frecuencias relativas o porcentuales es igual a 1 o sea al 100% de las observaciones.04761905 0.0952381 0. Para proporciones y se multiplica por 100 para porcentaje N Fr.abs.2857143 17. si o no cumple.761905 100. Frecuencias relativas: cuando la frecuencia de cada valor o clase.2380952 0.7142857 85. x 100 N Frecuencias relativas acumuladas: se obtienen sumando las fr.Chulo: Tenga en cuenta apreciado estudiante que existen dos tipos de frecuencias: relativas y acumuladas.142858 17.R= fr. n Agrupada en clases Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .761905 4. abs.23809524 0.04761905 0.52380952 9.23809524 0.1428571 17.9523807 1 porcentaje % 9.8095238 9.8571427 0. las cuales pueden expresarse como proporción (fracción de 1) o porcentajes (%) Xi 24 28 29 30 33 38 45 53 55 57 Total frecuencia absoluta 2 2 1 1 5 5 2 1 1 1 21 frecuencia acumulada 2 4 5 6 11 16 18 19 20 21 frecuencia relativa 0.285716 17. Las frecuencias relativas son siempre valores fraccionarios El último valor de las frecuencias absolutas acumuladas es igual al total de las observaciones El último valor de las frecuencias relativas acumuladas debe ser igual a 1 o el 100% de observaciones ¿Cumple? Si Si.04761905 0.04761905 1. para cada propiedad usted mismo verifique su cumplimiento.7142857 34. R) Se calcula con la ecuación fr.000001 grados ángulo 34.1904762 0.142858 17. se divide entre el número total de valores (N) se obtiene la frecuencia relativa (Fr.0952381 0. Las frecuencias absolutas son siempre valores enteros. abs.142858 360.R = fr.2857142 0.7619046 0. aprovechemos para ver las propiedades de las frecuencias.9047617 0. Si.761905 4.52380952 4.00000001 frecuencia Relativa acumulada 0.000005 Bueno ya que llegamos a este punto y con base en este ejercicio. de cada valor o clase y de las anteriores.0952381 0.8095238 23.0952381 0.2857143 34.52381 4.76190476 4.04761905 0.5238094 0.142858 85.761905 23. Si Si Si.).

55. 24. Número de datos Menos de 50 50 . el número de pisos o clases lo podemos determinar con base en el siguiente criterio entrenado. o en la experiencia. Ejemplo: n = 90 datos Raíz cuadrada de 90 = 9. es una guía que muestra para diferentes cantidades de datos.20 Otra forma muy práctica es tomando la raíz cuadrada del numero de muestras o elementos que componen la muestra de variables y aproximando el resultado al número entero inmediatamente superior. 33. 4868 Número de clases 10 Deming: Ahora veremos el Intervalo de clase “IC”. 45.250 Más de 250 Número de clases (k) 5-8 6 . 53.dm n 33.3 log n n es el tamaño de la muestra Deming: Pero bueno. no nos compliquemos la vida. 38. que puede ser una barata. 33= 21personas IC = 57 – 24 21 IC = 4. estos datos se agrupan en subconjuntos o subclases El número de clases o pisos o niveles (NC) se puede calcular NC = 1 + 3. 28. el número recomendado de clases o pisos a utilizar así. 29. 30. el cual es la diferencia entre el dato mayor (DM) y el dato menor (dm) de la serie dividida por el número de clase o pisos que se ha determinado con anticipación Deming: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos agruparlos en 8 niveles o números de clase (NC) Chulo: El intervalo de clase de cada nivel o piso es IC = DM . 33.12 10 .125 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . 45.Cuando la muestra está integrada por un número mayor de datos. 57. 28. Chulo: para la extracción de la raíz cuadrada puede utilizar la calculadora. 38. 38.10 7 . 38. 24. 33.100 101 . 38. Usted puede utilizar la siguiente tabla.

000 28. o una milésima o valor que haga diferenciar del anterior rango - Deming: Muy bien.125 Los siguientes niveles se va sumando el “Índice de confianza”.626 48.501 44. en este caso 57.250 36.751 52.126 32.125 4.376 40. tomemos la fórmula nos sirve y nos servirá muchísimo. ahora trabajemos la desviación estándar Chulo: ¿Qué tanto están separados los datos del promedio o media? Deming: Esto se puede saber con la desviación estándar (S) que expresa qué tanto se dispersan los datos en relación a la media La desviación estándar es la medida de dispersión más adecuada para la estadística descriptiva.125 4.125 4.00 años.125 Inter.125 4. no se la aprenda. analícela y entiéndala Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .125 4. S = 1 ∑( xi − x ) 2 n −1 Deming: Con base en esta formula definamos la desviación estándar.251 36. usted por su parte trate de definirla.375 40. Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior y sumándole una unidad.750 52.625 48.875 57. de clase 28.876 IC 4. Es el valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor Chulo: Bueno nos tratamos de confundir ¿verdad? Será que lo podemos hacer más fácil Deming: por supuesto.125 al anterior mayor valor del rango y se le sigue sumando hasta llegar al valor de la variable máxima.000 Deming: Observe usted que precisamente la información de las edades de los 21 funcionarios quedó toda incluida en 8 niveles.125 32. - Que en la primera clase inicia con la menor edad 24 años y se le agrega el “intervalo de clase” de 4.125 4.500 44. en este caso 4.125 4.125 y se logra el primer rango o sea hasta 28. o una centésima.Clase 1 2 3 4 5 6 7 8 Deming: ¿Qué observa usted? Chulo: valor base 24.

el resultado es 9.2381/20 90.2619051 Raíz cuadrada 9. los resultados corresponden a unas muestras.5 años ese valor corresponde al valor de lo que está separado del promedio y corresponde a una sola desviación Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . 2 2 2 1 1 5 5 2 1 1 1 21 fr.809 Media = 36.092481 262.5006 Desviación estándar = 9.912481 407.598481 60.191 16.809 1.092405 134.362481 14.Xmedia)2 6 328.676481 fr.542405 7. no es para preocuparse cuando lo eleve al cuadrado quedará positivo (ver columna 5) Estudiante.809 -8. tenga en cuenta que para el ejercicio en particular las edades tomadas no es el de la totalidad de los funcionarios de la entidad sino que corresponde a unas muestras.809 (fr.980481 46.148481 330.809 -3.(Xi.191 (Xi-media)2 5 164.912481 407. ya ha llegado a saber calcular la desviación estándar. todo dividido por el número de las muestras.418481 67.508481 1.676481 1805.148481 330. por lo tanto así la cantidad de 21 es superior a 20.(Xi-media)2)n-1 1805.2381/21-1 1805.191 18.2381 Media = 773/21 = 36.184962 262. Deming: Cuando la desviación estándar es para población se toma toda la cantidad como valor de n o sea el total de la población Bueno sigamos con la misma información para calcular la desviación estándar Xi 1 24 28 29 30 33 38 45 53 55 57 Sumatorias frec.Chulo: Es la raíz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la media o promedio de todas las variables (X con palito).070481 77.809 -7. * Xi 3 48 56 29 30 165 190 90 53 55 57 773 (Xi-media) 4 -12. por eso el cálculo de la desviación se hizo con n= 20 (21 – 1) Ahora.140962 155.362481 72.980481 46.191 8.5 años Observemos los siguientes aspectos El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo. por lo tanto se le descuenta una muestra.809 -6. absol fr.191 20.196962 60.

la representación gráfica debe ayudar a cumplir con dicho objetivo. Histograma de frecuencias o Diagrama de distribución Estos diagramas constan de dos líneas: a. se pueden hacer varios análisis que facilitarán la toma de decisiones Chulo: sigamos aprovechando esta información para utilizar otra gráfica u otras gráficas: Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . Representación gráfica 1. son varias las gráficas que se recomiendan utilizar.Una de las ventajas de la estadística. es que debe ser fácilmente interpretada por las partes interesadas. una llamada abscisa que normalmente corresponde a las variables de Xi b. otra llamada ordenada normalmente corresponde a las variables de Yi Volvamos a tomar la distribución de frecuencias de la información de las edades de los funcionarios de una entidad pública Para las edades de los 21 funcionarios lo tomamos como valores de Xi Para mostrar la cantidad de funcionarios de cada edad lo tomamos como valores de Yi Hacemos entonces la gráfica EDADES Xi 24 28 29 30 33 38 45 53 55 57 Frecuencia Yi 2 2 1 1 5 5 2 1 1 1 Histograma 6 5 4 3 2 1 0 24 28 29 30 33 38 45 53 55 57 e Frecuencia Chulo: ¡Qué fácil de entender la información de manera gráfica! ¿Verdad? Ahora podemos observar con esta gráfica que la mayoría de los funcionarios están en la edad de 33 años y de 38 años.

762 55 1 4.524 28 2 9.762 6 23.762 30 1 4.524 2 9.810 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .762 33 5 23.762 7 9.762 1 9.762 57 1 4. haga de cuenta que el 100% de la información es el total del pastel.524 10 4.810 38 5 23.762 4 4.810 45 2 9.2.524 53 1 4.810 5 23.762 8 4. cada una de las edades tiene una frecuencia o cantidad de funcionarios que tienen esa edad y corresponde a un porcentaje del total SERIE 1 2 3 4 5 6 7 8 9 10 EDADES Frecuencia Porcentaje 24 2 9. La gráfica de pastel o circular Como su nombre lo indica.524 3 4.762 Porcentaje 9 4.524 29 1 4.

pocas de ellas son conocidas en la industria y menos en actividades de servicios. puede utilizar este diagrama Chulo: Es ¡súper fácil!. pero es muy práctico cuando en un informe ejecutivo a falta de espacio para hacer un histograma o un círculo llamado pastel. Tema 4: Herramientas estadísticas para aseguramiento de la calidad 2 4 9 2 . b. tales como: a. además. son muy sencillas y muy importantes. Diagrama causa-efecto. es una herramienta que visualiza toda la información Usted puede también utilizar otras gráficas como la de una barra horizontal donde muestra del total del 100% los diferentes porcentajes para cada edad El anterior diagrama es poco utilizado. Diagramas de Pareto Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . las gráficas nos ayudan a comprender mejor la información.Deming: ¿Cómo le parece? Verdad qué es una gran ayuda visual. se trata de herramientas estadísticas y análisis de uso general.5 2 8 9 2 .5 Deming: Estas herramientas.

Diagramas de causa – efecto Ley de Mecánica Clásica (Isaac Newton) A toda acción corresponde una reacción Deming: En muchos casos se resuelven los problemas sin conocer las causas de los mismos y mucho menos. se denomina. que como que las reúne o clasifica. Diagramas de flujo de procesos d. lo más común es de acuerdo a las llamadas cinco Ms. también. Plantillas para recolección de datos. eliminando repeticiones(esto se puede hacer mediante tarjetas) Dibujar el diagrama resultante Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . donde con base en la gráfica. Reunir a las personas que conocen del problema y realizar una lluvia de ideas. diagrama de espina de pescado Deming: Los pasos para la construcción del diagrama espina de pescado son: • • • • Determinar claramente el efecto o problema a estudiar. se tiene en cuenta a las personas que hacen los procesos.c. se plantean las causas y se van clasificando de acuerdo al grupo de una causa principal. se va escuchando el comentario que va haciendo el personal. Administración por efectos” Para el buen uso de este diagrama se recomienda la práctica del Breakstorming. Este diagrama por su forma. Seleccionar las causas aportadas por todos los participantes. lo cual es una práctica perjudicial. e. • • Las causas que potencialmente van generando un determinado efecto se presentan en forma jerarquizada. El buen uso de esta herramienta corresponde a “Administración por causas vs. relacionándolas en las causas principales. que corresponde a la participación activa de todo el personal involucrado directa e indirectamente. Control estadístico de procesos a. previamente establecida.

el 80% de los problemas se deben al 20% de las causas Chulo: Que conocimientos de estadística tenemos que tener para diseñar una gráfica de pareto 1. 2. Diagrama de Pareto Son representaciones de la densidad y la distribución de variables aleatorias nominales.b. relacione la frecuencia o repetición de cada causa en un periodo determinado. Deming: Usualmente opera la regla del 80 – 20. por ejemplo. pues también lo puede hacer por los costos que originan esas causas En desorden número 1 2 3 4 5 6 7 8 9 10 11 Causa ausencia Se enfermó la suegra Se enfermó un hijo Se enfermó el perro Accidente casero Enfermedad de gripa Citación juzgado Enfermedad migraña Inundación de la casa Guayabo Robo en la casa Otros cantidad de casos 10 13 8 35 75 5 53 7 3 1 6 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . las causas por las cuales los funcionarios de una entidad dejaron de asistir al trabajo en los primeros seis meses del año 2008. Con base en la estadística. los tipos de defectos por los cuales un producto es rechazado por mala calidad o en caso práctico. usualmente causas de falla en sistemas o. Recopilación de la información sobre las diferentes causas o motivos de un problema. defectos en productos o servicios Las causas se ordenan de modo de distinguir cuales son las más importantes. 3. Organice las causas por orden de frecuencia o costos.

4629 2.04629 0.0324 0.999839 Composición porcentual 34. El ítem “otros” debe ubicarse en el último renglón.74 97. independiente de su magnitud de frecuencias o de costos.389 0.35 96.01389 0.72 59.47 86.04 95.02315 0.45 81.72 24.162 0.53 16. En orden Numero causa 5 7 4 2 1 3 8 6 9 10 11 Causa Ausencia Enfermedad de gripa Enfermedad migraña Accidente casero Se enfermó un hijo Se enfermó la suegra Se enfermó el perro Inundación de la casa Citación juzgado Guayabo Robo en la casa Otros cantidad de casos 75 53 35 13 10 8 7 5 3 1 6 216 Total acumulado 75 128 163 176 186 194 201 206 209 210 216 frecuencia relativa 0.2453 0.629 3.8 93.2 99.02778 0.2 6.24 2.9839 Porcentaje acumulado 34.037 0.02 4.0602 0.004629 0.98 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .315 1.1 89.7 3.Total 216 Chulo: Las causas están en desorden con relación a las frecuencias de ocurrencias Ahora hay que ordenar las causas de acuerdo al peso o cantidad de frecuencias. cuando se hace con costos.778 99.25 75.3472 0.

80 70 60 50 40 30 20 10 0 120 100 80 60 40 20 0 % Acumu… Tema 5: REGRESIÓN Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .

ajustándolo a un modelo lineal. si la función que liga X e Y fuese de tipo lineal. partiendo de datos conocidos o sea de años ya pasados se puede calcular lo esperado en una fecha futura. X e Y como una relación de tipo funcional. Disponemos de 20 pacientes de quienes se ha registrado: Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . Y aumenta. Para empezar. Si el resultado de a es positivo la tendencia es que X aumenta y. b=ΣY–aΣX n Deming: Observe el siguiente ejemplo para efectuar el cálculo de una regresión. o sea. responde a la forma general Y=aX+b a y b: son constantes que tienen un significado particular para analizar b: determina el punto donde la línea corta al eje de las Y a: determina la pendiente de la recta a = n Σ XY – (Σ X) (Σ Y) (n Σ x2) – (Σ X)2 Si el resultado de a es negativo la tendencia es que X aumenta y. es inversamente proporcional. se utilizan dos variables. Y disminuye.Deming: La magia de la estadística radica en que se puede predecir un tiempo futuro a partir de unas variables conocidas en tiempo presente. Es decir. Supongamos que queremos analizar la variable Nivel de Colesterol con relación a la edad de las personas.

13 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .(∑X)2) 1.74289446)(725))/20 4539.74 * 61 + 226.(a∑X))/n) ((5456) .742894 ((∑Y) .99 y = aX + b 333. o sea el X es 61 años y = aX + b y = aX + b 1.74 X.99 Cuál será el valor de colesterol para una persona de 61 años.• • Nivel de colesterol en plasma sanguíneo (mg/100ml) Edad (años) paciente Edad Colesterol n Xi Yi Xi * Yi 1 80 350 28000 2 30 190 5700 3 42 263 11046 4 50 320 16000 5 45 280 12600 6 35 198 6930 7 18 232 4176 8 32 320 10240 9 49 303 14847 10 35 220 7700 11 50 405 20250 12 20 190 3800 13 40 230 9200 14 30 227 6810 15 30 440 13200 16 23 318 7314 17 35 212 7420 18 18 340 6120 19 22 195 4290 20 41 223 9143 ∑ 725 5456 204786 X2 6400 900 1764 2500 2025 1225 324 1024 2401 1225 2500 400 1600 900 900 529 1225 324 484 1681 30331 n∑X*Y (∑X)(∑Y) n∑X2 (∑X)2 a = a = b = b= b = b= 204786 3955600 606020 (725)2 (n(∑X*Y)-(∑X)(Y))/((n∑X2) .(1. + b 1.9 / 20 226.

6 uno se encuentra en franco riesgo de sufrir un ataque cardiaco. Colesterol bueno.1172 Serie1 Lineal (Serie1) Recomendación: Cuando se tiene la información se debe presentar un informe que sirva para tomar decisiones.  La relación colesterol total dividida por el HDL debe ser inferior a 5 para estar exento de riesgo coronario Ejemplo: si se tiene un colesterol total de 260mg/100ml de sangre y un HDL de 30mg/100ml de sangre. su relación o índice (en la semana 3 desarrollaremos con mayor detalle el concepto de Índice) es 260/30 = 8. son los encargados de remover y retirar el exceso de colesterol LDL y llevarlo al hígado para su eliminación.09 R2 = 0. medición que debe hacerse por lo menos una vez cada año  • • • Los valores: Deseables debe ser < 130 mg/100 ml de sangre Riesgo potencial: 130 – 160 mg/100ml de sangre Riesgo alto: > 160 mg/100ml de sangre  HDL. para nuestro caso:  Colesterol es una grasa orgánica llamada liproteína de alta densidad o LDL.73x + 210. para lo cual se recomienda analizar los datos e investigar sobre el tema de la información. Ojo Ataque cardiaco Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .Gráfica 500 450 400 350 300 250 200 150 0 20 40 60 80 100 y = 1.

Deming: La desviación estándar es una medida del grado de dispersión de los datos del valor promedio. tomemos la fórmula S= 1 ∑i − ) ( x x2 n 1 − Deming: Con base en esta fórmula definamos la desviación estándar. todo dividido por el número de las muestras. Dicho de otra manera. si se tiene un LDL de 130mg/ml de sangre y HDL de 45mg/100ml de sangre el índice es de 2. Se debe estar en valor inferior a 3 para estar libre de sufrir infarto Ejemplo. se puede hacer proyección de producción para un futuro con base en los datos conocidos y establecer presupuestos de recursos sabiendo los elementos que se necesitan para un solo producto. haber usted por su parte trate de definirla. el "promedio" o variación esperada con respecto de la media aritmética.1 Desviación estándar Chulo: ¿Recuerda lo que vimos anteriormente sobre el concepto de desviación estándar?. simplemente. Deming: La importancia de utilizar la regresión es muy grande. Es el valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor Deming: Para que lo entienda mejor. entiéndala Chulo: Es la raíz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la media o promedio de todas las variables (Xi con palito). Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . bueno recordémoslo Deming: La desviación estándar es la medida de dispersión más adecuada para la estadística descriptiva. analícela. no se la aprenda. con ella puede el estadístico que somos nosotros encontrar valores del futuro o valores que no se tienen con el uso de valores conocidos. y una desviación pequeña indica que los datos están agrupados cerca a la media. Una desviación estándar grande indica que los puntos están lejos de la media. la desviación estándar es. ¡eso es buenísimo! Chulo: Por ejemplo.88 se encuentra en que no se tiene mayor riesgo de sufrir un ataque cardiaco Chulo: Nos damos cuenta de la importancia de la estadística y sobretodo de entender los resultados para tomar decisiones y sobre todo acciones a tiempo. a esto se le llama “explosión de materiales” 4. lo haremos más fácil.

196962 60. Chulo: Cuando la desviación estándar es para población se toma toda la cantidad como valor de n Sigamos con la misma información para calcular la desviación estándar Xi 1 24 28 29 30 33 38 45 53 55 57 Sumatorias frec.676481 fr.809 -6.598481 60. 6.191 (Xi-media)2 5 164.148481 330.542405 7. 14.809 -3. 8.5 años Observemos los siguientes aspectos El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo.070481 77.2619051 Raíz cuadrada 9.2381/21-1 1805.Por ejemplo.418481 67.980481 46.191 8. Sus desviaciones estándar son 7. 5 y 1.(Xi-media)2)n-1 1805.676481 1805.912481 407.191 20.5006 Desviación estándar = 9. Bueno ya hemos llegado a saber calcular la desviación estándar. 2 2 2 1 1 5 5 2 1 1 1 21 fr.148481 330. si la cantidad es 21 se le descuenta una muestra.809 (fr. 14). no es para preocuparse cuando lo eleve al cuadrado quedará positivo (ver columna 5) Chulo: Para el ejercicio en particular las edades tomadas no son de la totalidad de los funcionarios de la entidad.184962 262.5 años ese valor corresponde al valor de lo que está separado del promedio y corresponde a una sola desviación Veamos una gráfica de las desviaciones estándar bajo la curva normal Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .809 1.(Xi-media)2 6 328.140962 155.092481 262. 14) y (6.809 -8. las tres muestras (0.191 18. por lo tanto. sino que.980481 46. absol fr. el resultado es 9. corresponden a unas muestras.912481 407. respectivamente.2381 Media = 773/21 = 36. (0.362481 72. 8. 8) cada una tiene una media de 7. por eso el cálculo de la desviación se hizo con n= 20 (21 – 1). 6.809 Media = 36. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7.092405 134.809 -7.508481 1. 0. * Xi 3 48 56 29 30 165 190 90 53 55 57 773 (Xi-media) 4 -12.2381/20 90.362481 14.191 16.

vea la gráfica de la distribución que usted tiene atrás Media aritmética.1S = 34. es exactamente igual a la otra mitad de la campana.27% de todas las variables.725 % de las variables tomadas Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 . cubre todo un 68.La información total de las variables se encuentra dentro de esta curva Media aritmética. Xmedia + 2 S = 47.725% de todas las variables tomadas Media aritmética. eso sucede cuando la curva es completamente normal.135 %.725 %.135% de todas las variables tomadas Media aritmética. claro está que. Xmedia + 1 S = 34. 135 % de las variable Esto quiere decir que. o sea cubre el 34. Deming: Ahora cubramos dos desviaciones. X media – 2S = 47. que la mitad de la curva que tiene la forma de una campana. o sea cubre también el 34. o sea cubre el 47.725 %. si al valor del promedio le agregamos una desviación y también le quitamos una desviación. es decir. X media .135 %. o sea cubre el 47.

claro está que eso sucede cuando la curva es completamente normal.308 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .865% de todas las variables tomadas Media aritmética. o sea cubre el 49. queda un 0.Esto quiere decir que si al valor del promedio le agregamos 2 desviaciones y también le quitamos dos desviaciones.725 %. Deming: Como nos damos cuenta.27% o sea que el marcapasos que le compramos a la abuela sea de los que quedaron por fuera de control o sea que tiene una probabilidad de error del 0.27% de que el marcapasos no funcione y eso corresponde a un tiempo de 236. Xmedia + 3 S = 47.5) = 46. cubre todo un 95.45% de todas las variables.5 años Xmedia + 1S = 36.5) = 27.1(9.85 días.27% 10 años x 365 días x 24 horas x 60 min. X media – 3S = 47. el fabricante puede contestarle “En la producción de los marcapasos de hizo control de calidad y el rango de desviación cubriendo tres desviaciones a la izquierda del valor nominal (valor exacto esperado) y tres desviaciones a la derecha del valor nominal. claro está que eso sucede cuando la curva es completamente normal.865 % de las variables tomadas Esto quiere decir que si al valor del promedio le agregamos 3 desviaciones y también le quitamos tres desviaciones.725 %. tenemos la necesidad de comprarle a la abuela un marcapasos cuyo tiempo esperado de que funcione es de diez años.809 + 1(9.73% de todas las variables. Chulo: Verifiquemos a ver si la tendencia esperada se presenta en el ejemplo que estamos desarrollando. o sea cubre el 49. Deming: Por ejemplo. Hagamos el cálculo de un error de 0.27% por fuera del cubrimiento de control. el control cubrió el 99.809 y la desviación estándar es igual a 9. El promedio de las variables del caso que estamos desarrollando es X media = 36. pues cada día el cliente o los clientes tanto internos como externos son y deben ser más exigentes.000 minutos que se espera funcione correctamente De los 5´256. Media aritmética. tanto a la izquierda como a la derecha de la media o sea del centro de la curva normal de forma de campana.309 Xmedia – 1S 36. = 5´256. Deming: Ahora con tres desviaciones.52 horas o sea 9. esto es preocupante.000 minutos tenemos la probabilidad del 0. y en esos días sin marcapasos la abuela se murió.73 de los marcapasos elaborados o sea que estuvimos muy de malas.809 . Si usted hace reclamo ante la empresa que le vendió el marcapasos. cubre todo un 99.

5) = 55. 2 2 1 1 5 5 2 1 1 1 21 De acuerdo a la información recopilada en el cuadro anterior son 16 los funcionarios del total de 21 o sea 16/21 corresponde a un 76%.5) = 17. ¡Bueno!. la tendencia para una distribución completamente normal seria el 68.309 años Xi edad 24 28 29 30 33 38 45 53 55 57 frec. pero la distribución nuestra no es completamente normal así que cumple la tendencia.Preguntémonos entonces ¿Cuántos funcionarios están entre la edad de 27.308 y 46. absol fr.08 años son 20 Xi 24 28 29 30 33 38 45 53 55 57 frec.08 años Xmedia – 2S 36.809 . 2 2 1 1 5 5 2 1 1 1 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .27 %. una nueva pregunta ¿cuántos funcionarios están? .08 años Los funcionarios que están entre 17.2(9. absol fr.08 y 55.809 + 2(9. si a la información le agregamos y le quitamos al mismo momento dos desviaciones Xmedia + 2S = 36.

59 años y 65.45%. se cumple entonces la tendencia ¿verdad? ¡Bueno!.73% Chulo: Bueno hemos entendido ¿verdad? Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010 .5 = 65.809 + 28.5) = 7.39 años son todos o sea el 100% del total de funcionarios. el valor esperado era del 99.3(9.Deming: El porcentaje de funcionarios que estén en este rango corresponden a 20 personas y esta cantidad corresponde a 20/21 = 95. si a la información le agregamos y le quitamos al mismo momento tres desviaciones Xmedia + 3S = 36. una tercer pregunta ¿cuántos funcionarios están? .59 años Los funcionarios que están entre 7.5) = 36.2381%.305 años Xmedia – 3S 36.809 . el valor esperado para una distribución completamente normal es de 95.809 + 3(9.