Professional Documents
Culture Documents
i
j
j i
f F
01
es decir se suman las frecuencias
anteriores a un valor dado, por tanto la acumulada al final coincide con la poblacin N.
- Distribucin por datos no agrupados es cuando se especifican todos y cada uno de los
valores de la variable.
- Distribucin por datos agrupados los valores de la variable se miden en intervalos , la
amplitud del intervalo es la diferencia entre el extremo superior e inferior del intervalo y la
suma de las amplitudes de todos los intervalos es igual al recorrido ( diferencia entre el
valor mayor y el menor de la distribucin).
- Marca de clase de un intervalo es la semisuma de los extremos del intervalo y es el valor
que sustituye a todo el intervalo
2
1 l l
x
i i
i
siendo el intervalo [li-1 , li ].
Histograma para datos agrupados en intervalos
El rea de cada rectngulo nos da la frecuencia del intervalo, por tanto la base es la amplitud
y la altura la densidad de frecuencia de dada uno di
MEDIDAS DE POSICIN
Se trata de resumir la informacin en un nico nmero.
16
Las medidas de posicin pueden ser:
De tendencia central o promedios
1. Media
2. Mediana
3. Moda
De tendencia no central
1. Cuartiles.
MEDIDAS DE TENDENCIA CENTRAL: MEDIA
La media puede ser:
Aritmtica simple o ponderada
Media Cuadrtica
Media Geomtrica
Media Armnica
Media aritmtica simple
Se suman de todos los valores de la variable ponderados por sus frecuencias absolutas y
divididas todo ello por el nmero total de observaciones
La media aritmtica es siempre el centro de gravedad de la distribucin y es siempre un valor
que entra dentro del campo de variacin de la variable.
Si los datos estn agrupados en intervalos se toma la marca de clase de cada intervalo para
su clculo.
Media Aritmtica ponderada
Es igual que la media aritmtica simple, pero se pondera cada valor de la variable por un
coeficiente distinto de la frecuencia absoluta.
MEDIANA
Es el valor de la variable que ocupa el lugar central de la distribucin, es decir el valor de la
variable que deja el 50% de observaciones hacia la izquierda y el 50% a la derecha.
Para poder hallar la mediana, lo primero que hay que hacer es ordenar los valores de la
variable de forma creciente, y escribir los valores de las frecuencias acumuladas Fi.
Distinguiremos dos casos, datos no agrupados y datos agrupados.
Para datos no agrupados
Se calcula primero el 50% de la poblacin N/2, se lleva ese valor a la columna de frecuencias
absolutas acumuladas.
MODA
Es el valor de la variable que ms veces se repite. En algunos casos existen varias modas,
pero normalmente es una, si son dos se llama bimodal.
Para datos no agrupados
La moda es el valor de la variable correspondiente a la mayor frecuencia absoluta.
17
Para datos agrupados en intervalos
Se halla la densidad de frecuencia de cada uno de los intervalos (di) y el de mayor densidad
de frecuencia se selecciona como intervalo modal, para determinar el valor de la Moda, se
aplica la siguiente frmula, basada en la proporcionalidad:
CUARTILES
Son medidas de posicin que no tiene porqu ser central. Hay varios tipos de cuartiles:
1.- Cuartiles Son valores de la variable que dividen a la distribucin en cuatro partes iguales,
por lo tanto los cuartiles son tres C1 que deja por detrs de l al 25% de la poblacin, C2 que
divide a la poblacin en dos partes iguales y C3 que deja detrs de l al 75% de la poblacin.
2.- Deciles Son valores e la variable que dividen a la distribucin en diez partes iguales, por
lo tanto los deciles son nueve, D1 deja al 10% antes, D2 al 20% y as sucesivamente hasta D9
que deja al 90% antes y al 10% despus de l.
MEDIDAS DE DISPERSIN
Las medidas de dispersin nos indican el mayor o menor alejamiento de los valores de una
variable respecto a un promedio. Casi siempre acompaando a un promedio debe ir una
medida de dispersin que nos indica la mayor o menor representatividad del promedio.
Las medidas de dispersin absoluta ms utilizadas son:
Recorrido
Recorrido Intercuartlico
Desviacin Media
Varianza
Desviacin Tpica
DESVIACIN TPICA (Sx)
Es la raz cuadrada positiva de la varianza y es la medida de dispersin ms utilizada.
Clases de medidas de dispersin relativas
Se caracterizan por ser adimensionales, la ms importante es el coeficiente de variacin de
Pearson, nos indica la mayor o menor homogeneidad de los datos respecto de la media y por
lo tanto nos da la representatividad de la media en la distribucin.
MEDIDAS DE FORMA
Hacen referencia a la forma de la distribucin, simtrica, asimetra a la derecha o a la
izquierda.
Coeficiente de asimetra de Pearson, slo se puede utilizar en distribuciones
campaniformes (forma de campana) y unimodales Este coeficiente puede ser:
0 entonces la media igual que la moda, distribucin simtrica
>0 entonces la media mayor que la moda, asimetra a la derecha positiva
<0 entonces la media menor que la moda asimetra a la izquierda negativa
Coeficiente de asimetra de Fisher, tiene la ventaja de que se puede hallar para todas
las distribuciones, aunque su clculo es complicado y laborioso.
Este coeficiente puede ser:
18
0 entonces la distribucin es simtrica
>0 entonces asimetra a la derecha
<0 entonces asimetra a la izquierda.
Curtosis hace referencia al mayor o menor apuntamiento que tiene una distribucin
de frecuencias respecto a una distribucin Normal, por lo tanto slo se estudia en
distribuciones campaniformes , para compararlas con la campana de Gauss, su calculo
tambin es muy laborioso.
Este coeficiente puede ser:
0 la curva es igual que la normal, se llama Mesocrtica
>0 la curva es ms puntiaguda que la normal se llama Leptocrtica
<0 la curva es ms aplastada que la normal, se llama Platicrtica
2. DIAGRAMA DE CORRELACIN
Son grficos que permiten determinar el nivel de dispersin o correlacin que existeb entre dos
variables.
Usos:
Seleccionar variables fuertemente correlacionadas.
Determinar los rangos que permiten fijar condiciones de control entre dos variables.
Para comparar los resultados de experimentos.
Mtodo para elaborar el diagrama de correlacin:
Determinar las variables a correlacionar y recolectar datos.
Graficar los pares de datos.
Determinar el coeficiente de correlacin.
Interpretar el diagrama de dispersin.
Si las variables (X e Y) que se relacionan, se llevan a graficarlas en un plano cartesiano,
obtendremos una nube de puntos de diversas representaciones y correspondindoles a cada
diagrama de dispersin su respectivo coeficiente de correlacin el mismo que slo variar entre
-1.00 <= r <= +1.00
19
EJEMPLO DE APLICACIN
Se desea saber la existencia de correlacin entre los dos tajeos en cuanto de pies perforados
por tonelada.
TAJEO 1
(pp/t)
TAJEO 2
(pp/t)
1,20 1,30
1,30 1,35
1,15 1,20
1,20 1,17
1,35 1,39
Tiene correlacin fuerte y es positiva.
Valor de correlacin: 0,87
3. REGRESIN LINEAL SIMPLE
El Anlisis de Regresin es un modelo estadstico de pronstico, esto se refiere a describir
y evaluar la relacin entre una variable dada (generalmente llamada la variable dependiente o
relacionada) y una o ms variables (generalmente llamadas variables independientes).
Uso del Anlisis de Regresin.
El anlisis de la regresin puede predecir el resultado de un indicador dominante
determinado del negocio (variable relacionada) basado en sus interacciones con otros
factores directivos (las variables explicativas). Por ejemplo: permite que usted prediga el
volumen de ventas, usando la cantidad anterior de publicidad y el nmero de personal de ventas
que usted emplea. Por supuesto, un modelo verdadero necesitara ms variables y es mucho
ms complejo.
Nadie puede realmente ver el futuro. Como sea, los mtodos estadsticos modernos, los
modelos economtricos y el software de inteligencia de negocio se pueden utilizar para
pronosticar y para estimar qu va a suceder en el futuro.
Los modelos del Anlisis de Regresin se utilizan para ayudarnos a predecir el valor de una
variable desconocida, con unas o ms otras variables que valores puedan ser predeterminados.
Pasos al interior del Anlisis de Regresin. Proceso
La primera etapa del proceso es identificar la variable que debemos predecir (la variable
relacionada). Entonces realizamos el Anlisis de Regresin mltiple, centrndose en las
variables que deseamos utilizar como predictores (variables explicativas). El Anlisis de
1.15
1.2
1.25
1.3
1.35
1.4
1.45
1.1 1.15 1.2 1.25 1.3 1.35 1.4
Series1
20
Regresin mltiple entonces identificar la relacin entre la variable relacionada y las variables
explicativas. Entonces, finalmente esto se presenta como modelo (frmula).
Cuando la variable dependiente es cuantitativa (por ejemplo, el nmero de especies) y la
relacin entre ambas variables sigue una lnea recta, la funcin es del tipo y= c + bx, en donde c
es el intercepto o valor del punto de corte de la lnea de regresin con el eje de la variable
dependiente (una medida del nmero de especies existente cuando la variable ambiental tiene
su mnimo valor) y b es la pendiente o coeficiente de regresin (la tasa de incremento del
nmero de especies con cada unidad de la variable ambiental considerada).
Si la relacin no es lineal pueden transformarse los valores de una o ambas variables para
intentar linearizarla. Si no es posible convertir la relacin en lineal, puede comprobarse el grado
de ajuste de una funcin polinomial ms compleja. La funcin polinomial ms sencilla es la
cuadrtica (y= c + bx + bx2) que describe una parbola, pero puede usarse una funcin cbica u
otra de un orden aun mayor capaz de conseguir un ajuste casi perfecto a los datos. Cuando la
variable dependiente se expresa en datos cualitativos
Ejemplo de aplicacin
Deseamos determinar la funcin de variacin del precio de la plata.
MES
Precio de
metales
(US$/oz)
Enero 22,2
Febrero 22,0
Marzo 21,9
Abril 23,4
Mayo 20,8
Junio 20,5
Julio 20,1
y = -0.3714x + 23.043
R = 0.4867
18.0
19.0
20.0
21.0
22.0
23.0
24.0
1 2 3 4 5 6 7
Series1
Lineal (Series1)
21
SESIN IV: GRFICO DE CONTROL
MODALIDAD: PRESENCIAL
OBJETIVO: GRAFICAR E INTERPRETAR EL GRFICO DE CONTROL
ACTIVIDAD: RESUELVE EL EXAMEN
1. GRFICO DE CONTROL
Son grficos compuestos por una lnea central y un par de lmites de control, donde se registra
los valores caractersticos de un proceso, para determinar si este se encuentra bajo control.
Usos:
Evaluar y determinar si el proceso est fuera de control o no.
Mantener la estabilidad de un proceso.
Identificar las causas que generan los puntos fuera de control
Verificar la efectividad de las acciones de mejora realizadas a un proceso.
Mtodo para elaborar:
Recolectar datos, determinar medias y rangos.
Calcular lmites de control.
Generar el grfico de control.