You are on page 1of 53

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERU

FACULTAD DE INGENIERIA DE MINAS
UNIDAD DE POST GRADO

ESTADISTICA APLICADA A LA INVESTIGACION INGENIERIL (1)

Ing. Ms. Eli Teobaldo Caro Meza

HUANCAYO ± 2010 - I

MÉTODOS ESTADÍSTICOS
Son herramientas eficaces para mejorar un proceso y reducir productos defectuosos. Las herramientas estadísticas dan objetividad y precisión a las observaciones. Las premisas de la manera de pensar estadística son: ‡ Déle mayor importancia a los hechos que a los conceptos abstractos. ‡ No exprese los hechos en términos de sentimientos o ideas. Utilice cifras derivados de los resultados específicos de la observación. ‡ Los resultados de las observaciones, acompañados como están por el error y la variación, son parte de un todo oculto. Encontrar ese todo oculto es la finalidad última de la observación. ‡ Acepte como información confiable, la distribución normal que aparece cuando hay un gran número de observación

¿QUÉ CAUSA PRODUCTOS DEFECTUOSOS? El que causa productos defectuosos son las variaciones predominantes de cuatro elementos: material, condición de máquina, método de trabajo e inspecciones. ‡ material.- no tienen uniformidad, varían en densidad, espesor, acabado, etc. ‡ condiciones de máquina.- las máquinas sufren desgastes durante el proceso de producción. ‡ métodos de trabajo.- cada persona tiene un método de trabajo, algunos son cuidadosos otros no. ‡ inspecciones.- el control se realiza con diferente grado de equipos poca o alta precisión

DIAGNÓSTICO DE LOS PROCESOS
El diagnóstico es el proceso de encontrar causa de los productos defectuosos. Se realiza de diversas formas: ‡ Intuición ‡ Experiencia ‡ Análisis estadístico ‡ Investigación experimental Las dos últimas requieren actitud de observación. Recomendamos hacerlo mediante las dos últimas.

OBTENCIÓN DE DATOS
Para observar o medir un determinado fenómeno se debe tener en cuenta lo siguiente: ‡ Objetivos claros.- responde a esta pregunta ¿qué se va hacer con ella? ‡ ¿cuál es el propósito? .- será el de comparar datos, observar un comportamiento , etc. ‡ ¿son confiables las mediciones?.- utilizar técnicas adecuadas, procedimientos correctos. ‡ forma apropiada de recolección de datos.tener en cuenta el origen de datos, que se puedan usar fácilmente, o registrar adecuadamente.

OBJETIVO DE LA ESTADISTICA ‡ Estudiar de cómo debe ser utilizada información para mostrar los hechos e evidenciarlos. ‡ Comprender objetivamente los fenómenos y objetos que nos rodean. ‡ Nos da comprensión para emitir una decisión de calidad

DEFINICION DE ESTADISTICA
‡ Es la ciencia aplicada que nos proporciona un conjunto de métodos, técnicas o procedimientos para: - recopilar, - organizar (clasificar, agrupar), - presentar, y - analizar datos con el fin de describirlos o de realizar generalizaciones validas.

PARTES DE LA ESTADISTICA
‡ ESTADISTICA DESCRIPTIVA Conjunto de métodos estadísticos que se relacionan con el resumen y descripción de los datos, como tablas, graficas, y el análisis mediante algunos cálculos. ‡ ESTADISTICA INFERENCIAL Es el conjunto de métodos con los que se hace la generalización o la inferencia sobre una población utilizando una muestra. Por lo que es necesario que estas sean dadas con una medida de confiabilidad que es la PROBABILIDAD. -

POBLACION
‡ DEFINICION: ‡ Es un conjunto de elementos de personas, objetos, etc. en los que se puede observar o medir una o mas características de naturaleza cualitativa o cuantitativa. ‡ A cada elemento de la población se le denomina unidad elemental o unidad estadística. ‡ El resultado de observar o medir una característica en una unidad estadística se denomina dato estadístico, valor observado o simplemente observación.

POBLACION
‡ PARAMETRO: ‡ Son las medidas descriptivas que resume una característica definida de la población, así por ejemplo media ( ) o la varianza ( 2), etc. calculados a partir de datos observados de toda la población. ‡ TIPOS DE POBLACION: ‡ POBLACION FINITA: Si tiene un numero determinado (finito) de elementos (N). ‡ POBLACION INFINITA: Si tiene un numero indeterminado (infinito) de elementos.

TRABAJO ESTADISTICO O INVESTIGACION ESTADISTICA ‡ ES UN PROCESO QUE PASA GENERALMENTE POR LA SIGUIENTES ETAPAS: ‡ Formulación del problema o la tarea ‡ Diseño del experimento. ‡ Recopilación de datos. ‡ Clasificación, fabulación y descripción de resultados. ‡ Generalización o inferencia.

MUESTRA
‡ Después de definir la tarea o investigación estadística a realizar, se debe decidir entre investigar toda la población o solo una parte ella. El primer procedimiento se llama censo y el segundo muestreo. ‡ DEFINICION: ‡ Es una parte de la población seleccionada de acuerdo a un plan o una regla. (Un método de selección de muestras representativas es al azar) ‡ ESTADIGRAFOS: ‡ Son medidas descriptivas de una característica definida en una muestra aleatoria, tal como la media (X) o la varianza (S2), etc. calculadas a partir de datos observados en la muestra.

VARIABLES ESTADISTICAS
‡ Son características que se observa o mide en las unidades estadísticas de una población tiene diversos valores de naturaleza cualitativa o cuantitativa.
± Ejemplo:
‡ GENERO: Hombre o mujer (tiene dos valores) ‡ PESO: Tiene infinitos valores

‡ DEFINICION: Es una característica definida en una población y que asume por lo menos dos valores. Estos valores pueden ser de cualidad o de cantidad. La variable se denota por una letra del alfabeto.

ESCALAS DE MEDICION
‡ DEFINICION: ‡ Son los distintos niveles de valores que las variables estadísticas asignan a las unidades estadísticas en estudio. Son los siguientes:
± NOMINAL ± ORDINAL ± DE INTERVALO ± DE RAZON

ESCALA NOMINAL
‡ DEFINICION: Las variables estadísticas están en esta escala, si estos solo clasifican a las unidades estadísticas en iguales o diferentes (= o ). (Ejm.) ‡ El método estadístico con datos obtenidos en escala nominal consiste básicamente en obtener el numero (o porcentaje) de estos casos en cada modalidad y obtener la moda (valor de mayor frecuencia)

ESCALA ORDINAL
‡ DEFINICION: ‡ Las variables estadísticas están en el nivel de escala ordinal si están en escala nominal y si además ordenan a las unidades estadísticas por la característica definida que se observa (=, , < o >). Ejm. ‡ El método estadístico con datos obtenidos en escala ordinal consiste básicamente en obtener el numero (o porcentaje) de casos en cada categoría, así como, obtener la moda, la mediana, y el coeficiente de correlación por rangos.

ESCALA DE INTERVALOS
‡ DEFINICION: Es una escala ordinal que asigna a las unidades estadísticas valores numéricos, que son mediciones realizadas con respecto a un cero arbitrario (o cero móvil). Ejm. ‡ Con los valores de una escala de intervalos se puede comparar la diferencia de las mediciones de dos unidades estadísticas con otra diferencia. Sea x1, x2, x3 de una variable X, se verifica la relación:
x3  x1 !c x2  x1

donde c es una constante. ‡ Con los valores de esta escala son validas pues, las relaciones de igualdad, de no igualdad y de orden (=, , < o >). Además son validas las operaciones de adición y sustracción entre los valores de la escala, y la multiplicación y división entre las diferencias de dos valores de la escala. Pero no es validad la multiplicación y división entre los valores mismos de la escala.

PROPIEDAD DE LA ESCALA DE INTERVALOS: ‡ Si una variable estadística T tiene sus valores x en escala de intervalos, entonces, x permanece invariante ante la transformación: Y = ax + b donde a y b son constantes arbitrarias. Es decir si los valores x están en escala de intervalos, entonces y es la misma escala de intervalos.

ESCALA DE RAZON
‡ DEFINICION: Es una escala de intervalos que asigna a las unidades estadísticas valores numéricos, que son mediciones realizadas con respecto a un cero real. Este cero significa ausencia total de la característica que se observa. ‡ Los valores de esta escala se obtienen en general, por mediciones que son conteos o por mediciones continuas tales como longitud, peso etc.

‡ Con los valores de una variable en escala de razón se puede comparar cuantas veces la medida de una unidad estadística es igual a la medida de otra unidad estadística. Sea x1 y x2 dos valores de una variable X en la escala de razón, entonces se verifica: x2 ! c x1 donde c es una constante y x1  0.

PROPIEDAD DE UNA ESCALA DE RAZON: Si una variable estadística T tiene sus valores x en escala de razón, entonces, x permanece invariante ante la transformación: Y = ax donde, a es una constante arbitraria. Es decir si los valores x están en escala de razón, entonces y es la misma escala de razón NOTA: La aplicación de métodos estadísticos cuantitativos requiere que la variable se mida por lo menos en escala de intervalos.

CLASIFICACION DE VARIABLES
‡ Las variables se clasifican en cualitativas o cuantitativas (matemáticas)
± VARIABLE CUALITATIVA: ± Sus valores son cualidades. Estos valores están en el nivel de la escala nominal u ordinal (profesión, genero, grado instrucción etc). No se realiza operaciones aritméticas. ± VARIABLE CUANTITATIVA: ± Sus valores son numéricos. Estos valores están en la escala de intervalo o de razón (temperatura, tiempo de vida util, ingreso mensual, etc.) ± Se clasifican en:
‡ V. C. DISCRETA: Es aquella cuyos valores posibles no admiten otros (números naturales, se obtiene por conteo). ‡ V. C. CONTINUA: Es aquella que puede tomar cualquier valor entre dos valores de la variable (salarió, peso, tiempo, etc)

DISTRIBUCION DE FRECUENCIAS
‡ Después de la recopilación de los datos de una tarea o investigación estadística, estos son pasados a una hoja de datos.
U.E. x1 x2 x3 x4

‡ Los datos son organizados y agrupados en un cuadro numérico y presentados en graficas estadísticas. ‡ El cuadro numérico de una sola variable estadística se denomina distribución de frecuencias.

A. DISTRIBUCION DE FRECUENCIAS DE VARIABLES CUALITATIVAS
‡ Si la variable X es cualitativa, observada en una muestra de n unidades estadísticas de una población que origina k cualidades diferentes C1, C2, «,Ck, la tabulación o agrupación de estos n datos, es la distribución de frecuencias.
± FRECUENCIA ABSOLUTA (fi):Numero de datos que resulta del conteo en la categoría respectiva Ci (i = 1, 2, «, k). La sumatoria de todas las fi es igual a n. ± FRECUENCIA RELATIVA (hi): Se define en cada categoría Ci por hi = fi/n. Su sumatoria es igual a uno ± FRECUENCIA PORCENTAJE (pi): pi = hi x 100%, Su sumatoria es igual a 100.

DISTRIBUCION DE FRECUENCIAS DE VARIABLES CUALITATIVAS
Categorías de la Variable X Frecuencias Frecuencias Frecuencias Porcentajes Relativas Absolutas pi hi fi

C1 C2 « Ck TOTAL

f1 f2 « fk n

h1 h2 « hk 1.00

p1 p2 « pk 100

‡ GRAFICA DE LA DISTRIBUCION DE VARIABLE CUALITATIVA:
± Existe una gran variedad de graficas para la distribucion de frecuencias de variable cualitativa, las mas comunes son la de barras separadas y la de sectores circulares. ± Si la escala es nominal las cualidades pueden ser colocadas en cualquier orden. Pero si el nivel de la escala es ordinal las cualidades deben ir ordenadas.

B. DISTRIBUCION DE FRECUENCIAS DE VARIABLE CUANTITATIVA DISCRETA
‡ Si n valores de una variable discreta X observados en una muestra de una población, tienen k (k ” n) valores distintos, x1, x2, «, xk, que se repiten respectivamente f1, f2, «, fk veces, entonces, la organización o agrupación de estos n datos origina la distribución de frecuencias. ‡ GRAFICA DE LA DISTRIBUCION DE VARIABLE DISCRETA: La representación grafica mas común de una distribución de frecuencias de variable discreta es denominada de bastón.

DISTRIBUCION DE FRECUENCIAS DE VARIABLE DISCRETA
Valores de la Frecuencias Frecuencias Frecuencias Porcentajes Relativas Absolutas Variable pi hi fi X

x1 x2 « xk TOTAL

f1 f2 « fk N

h1 h2 « hk 1.00

p1 p2 « pk 100

C. DISTRIBUCION DE FRECUENCIAS POR INTERVALOS O CLASES
‡ Esta distribución se aplica cuando la variable estadística cuantitativa es continua o cuando el numero de valores distintos de una variable discreta es muy grande. ‡ La amplitud (A) de los intervalos, se obtiene dividiendo el rango (R) de valores de los datos en k intervalos y determinando el numero de datos que contiene cada intervalo.

DISTRIBUCION DE FRECUENCIAS POR INTERVALOS O CLASES
Frecuencias Intervalos Absolutas Conteo Ii fi Frecuencias Relativas hi Frecuencias Porcentajes pi

I1 I2 « Ik TOTAL

///« ///« « ///«

f1 f2 « fk N

h1 h2 « hk 1.00

p1 p2 « pk 100

DISTRIBUCION DE FRECUENCIAS POR INTERVALOS O CLASES
Frecuencias Intervalos Absolutas Conteo Ii fi Frecuencias Relativas hi Frecuencias Porcentajes pi

I1 I2 « Ik TOTAL

///« ///« « ///«

f1 f2 « fk N

h1 h2 « hk 1.00

p1 p2 « pk 100

‡ Para construir la distribución de frecuencias por intervalos hay varios procedimientos, pero se recomienda:
± Elegir no menos de 4 ni mas de 20 intervalos, con menos de 4 se puede omitir características, con mas de 20 se puede complicar innecesariamente los cálculos. (Todos los intervalos deben tener la misma amplitud. La amplitud debe ser entero en lo posible) ± El numero de intervalos elegidos, debe originar una distribución de frecuencias monomodal. Es decir, una distribución cuyas frecuencias van aumentando progresivamente hasta una frecuencia máx33ima y luego van disminuyendo también progresivamente.

CONSTRUCCION DE LA DISTRIBUCION DE FRECUENCIAS
1. Determinar el rango (R) de los datos que se definen: R = Xmax ± Xmin Donde: Xmax= dato máximo, Xmin= dato mínimo Determinar el numero de intervalos, k, la regla de Sturges nos da un valor aproximado: k = 1 + 3,3 log (n), n • 10 redondeando el numero obtenido al entero inmediato mayor. Determinar la amplitud A del intervalo: R , kA • R. A! k

2.

3.

4. Determinar los extremos de intervalos de a siguiente manera: I1 = [Xmin , Xmin + A[ I2 = [Xmin + A, Xmin + 2A[ I3 = [Xmin + 2A, Xmin + 3A[ « Ik = [Xmin + (k ± 1)A, Xmin + kA] por lo que podemos considerar: Xmax = Xmin + kA

los

‡ MARCA DE CLASE: La marca de clase o marca de intervalo : Ii=[Li , Ui[ es el numero mi , que se define como el punto medio del intervalo.

Li  U i mi ! 2
La marca de clase es el valor representativo de todos los datos contenidos en el intervalo.

‡ GRAFICO DE INTERVALOS:

LA

DISTRIBUCION

DE

± HISTOGRAMA: Es una grafica básica que consiste en barras rectangulares. Representa a las frecuencias absolutas, relativas o porcentaje. Se usa generalmente las marcas de clase. ± POLIGONO DE FRECUENCIAS: Es una grafica que se obtiene uniendo con segmentos de recta los puntos determinados por la absisa (marca de clase) y la ordenada (frecuencia respectiva) ± CURVA DE FRECUENCIAS: La curva de frecuencias es una grafica ³avanzada´ de una distribución de frecuencias, que se obtiene del polígono de frecuencias ³suavizando´ sus puntos angulosos.

Las curvas de frecuencias pueden tener una gran variedad de formas, algunas son las siguientes:

‡ DISTRIBUCIONES SIMETRICAS:

‡ DISTRIBUCION ASIMETRICA

‡ DISTRIBUCION MULTIMODAL

DISTRIBUCION DE FRECUENCIAS ACUMULADAS
‡ F. ACUMULADA ABSOLUTA (Fi) Suma consecutiva de las frecuencias absolutas (fi) ‡ F. ACUMULADA RELATIVA (Hi) Suma consecutiva de las frecuencias relativas (hi) ‡ F. ACUMULADA PORCENTAJE (Pi %) Suma consecutiva de las frecuencias porcentajes (pi)

INTRODUCCION: ‡ Las medidas de tendencia central, denominadas también promedios, ubican el centro de los datos, como la media aritmética (la media geométrica, la media armónica), la mediana y la moda. LA MEDIANA (Me) ‡ Es el valor mediano (dato) de una serie de valores observados, que separa a la serie de datos ordenados (en forma creciente o decreciente) en dos partes de igual numero de datos. ‡ La mediana depende del numero de orden de los datos y no de los valores de estos datos.

MEDIDAS DE TENDENCIA CENTRAL

CALCULO DE LA MEDIANA
‡ MEDIANA DE DATOS NO AGRUPADOS Para hallar la mediana de n valores no agrupados de una variable cuantitativa es:
1. Se ordenan los datos en forma creciente. 2. Luego se ubica el valor central Me. Si n es impar, la mediana es el dato ordenado del centro. Pero si n es par, la Me es la semisuma de los dos valores ordenados centrales. Ejm: Calcule la Me para las siguientes series de datos: a) 120, 3, 14, 1, 99, 7, 30, 2000, 16 b) 30, 77, 3, 300, 36, 11, 10000, 29

SOLUCION:
a) Ordenando los 9 datos tenemos:
1, 3, 7, 14, 16, 30, 99, 120, 2000 La Me es el quinto dato ordenado que separa a la serie en 2 grupos de 4 datos cada uno. Esto es: Me = 16

‡

Ordenando los 8 datos tenemos:
3, 11, 29, 30, 36, 77, 300, 10000 La Me en este caso puede ser cualquier numero situado entre 30 y 36, ya que este separa a los datos en grupos de 4 cada uno. Pero se conviene:

30  36 Me ! ! 33 2

‡

MEDIANA DE DATOS AGRUPADOS:
a) Si los valores de una variable discreta se agrupa en una distribución de frecuencias de la forma ³dato frecuencia´, el calculo de la Me me hace siguiendo el método de datos no agrupados. Como los datos ya están ordenados, solo bastara ubicar su centro. Ejm:
Numero de Hijos

xi

F. Absolutas fi

0 1 2 3 4

1 4 7 6 2

Ubicando la Mediana será: Me = 2

b) Si los valores de la variable se agrupan en una distribución de frecuencias por intervalos, la mediana se determina aproximadamente por interpolación de manera que la mitad inferior (50%) de los datos agrupados sean menores o iguales que la mediana.

1.

2.

Se ubica el intervalo que contiene a la mediana en la mitad inferior del total de las frecuencias: 0,5 x n, (50% del total de las frecuencias de cualquier tipo). La mediana Me [Li, Ui[ y esta dada por: Me=Li+a donde, a se obtiene por interpolación (semejanza de triángulos ABE y ACD), esto es:

a (f i ! A fi
Luego:

y

(f i a! xA fi

(f i Me ! Li  ( x A) fi

Ejm: En la siguiente distribución de frecuencias calcule la mediana:
Ii [26, 34[ [34, 42[ [42, 50[ [50, 58[ [58, 66[ [66, 74[ [74, 82] fi 1 2 4 10 16 8 4 45 Fi 1 3 7 17 33 41 45

SOLUCION:
‡ La mitad inferior de los n = 45, es 22,5 (0,5xn). ‡ Esta mitad inferior esta entre las frecuencias acumuladas 17 y 33 que se corresponden con el intervalo [58, 66[ ‡ En este intervalo, Li=58, fi=16, A=8, Fi-1=17 ‡ ¨fi = 0,5xn ± Fi-1 = 22,5 ± 17 = 5,5 ‡ Luego:

(f i ¨ 5,5 ¸ Me ! Li  ( xA) ! 58  © x8 ¹ ! 60,75 fi ª 16 º

PROPIEDADES DE LA MEDIANA
1) La mediana, solo depende del numero de datos ordenados y no del valor de los datos. Por lo tanto no es sesgada por algún valor aislado grande o pequeño. La mediana puede ser calculada para distribuciones de frecuencia con intervalos de diferente amplitud, siempre que se pueda determinar el limite inferior Li del intervalo que contiene a la Me. La Me puede ser calculada para variables con valores en escala ordinal. La suma de las diferencias (en valor absoluto) de n datos con respecto a su mediana es minima. En caso de datos sin agrupar es:
n

2)

3) 4)

§ x  c ! minimo; si c es la mediana de los x
i i !1

i

Ejemplo:
‡ Cinco personas que viven en lugares situados a distancias en kilometros a lo largo de una carretera en linea recta como seindica en la figura que sigue, deben reunirse en algun punto de la carretera. Determine el lugar de reunion de manera que el costo total del transporte sea minimo, si el costo de cada transporte es proporcional al recorrido.

SOLUCION:
‡ Si A es el origen, entonces, las coordenadas de A, B, C, D, y E son respectivamente: x1= 0, x2= 20, x3= 35, x4=41 y x5=51 ‡ Sea K el punto de reunión. Dado que el costo es proporcional al recorrido, podemos elegir sin perdida de generalidad la proporcionalidad igual a 1, entonces:
5

Costo total de transporte ! § xi  K
i !1

‡ Este costo es mínimo, si K es la mediana de los 5 valores: 0, 20, 35, 41, 51, esto es si K = 35. Luego deben reunirse en el lugar C, a 35 km de A.