You are on page 1of 100

Estadística Aplicada 2.

Tema 1. Estimación Puntual y
Bondad del Ajuste

Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste

1

Tema 1. Parte 1
Estimación Puntual

Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste

2

Índice
• 
• 
• 
• 
• 

Concepto de Inferencia Estadística
Muestreo Aleatorio y definiciones
Estimación de parámetros
Propiedades deseables de un estimador
Estimadores
–  Estimador de Máxima Verosimilitud
–  Método de los Momentos

Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste

3

A destacar las diferencias entre población y muestra (véase transparencia siguiente) Estadística Aplicada 2. Tema 1. •  Para obtener estas conclusiones disponemos de una muestra de la población. •  A partir de la muestra debemos extraer conclusiones de toda la población que nos permitan tomar decisiones.Concepto de Inferencia Estadística •  Métodos utilizados para obtener conclusiones para una población. Estimación Puntual y Bondad del Ajuste 4 .

000 observaciones de la población anterior. Representación mediante histograma con 100 divisiones.Ejemplo 1 Normal con µ=0. σ=1 Muestra aleatoria de 10. Tema 1. Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 5 .

Por tanto estimamos que σˆ = 1 .004 Estadística Aplicada 2. •  Pero: yˆ = 0. Por tanto.Ejemplo de Estimación Puntual •  Visualmente podríamos intentar extraer conclusiones de la población a partir de la muestra: –  La muestra parece seguir una distribución normal. Estimación Puntual y Bondad del Ajuste 6 . Tema 1. S = 1. –  Parece simétrica y centrada en el 0. estimamos que yˆ = 0 . –  Parece que el 95% de los datos se hayan comprendidos entre el -2 y el 2.005 .

•  También se aprovechará para establecer una convención en el uso de algunos símbolos. por lo que se recordará alguna de la nomenclatura del tema introducida en una asignatura anterior (Estadística Aplicada 1).Muestreo Aleatorio •  El caso anteriormente representado es frecuente en muchos problemas: –  Intentamos obtener conclusiones de la población partiendo de una muestra de sus individuos. •  Este problema ya ha sido introducido con anterioridad. Tema 1. Estimación Puntual y Bondad del Ajuste 7 . Estadística Aplicada 2.

•  Muestra aleatoria: Un subconjunto de observaciones independientes y con idéntica distribución. •  Estadístico: Función obtenida a través de las observaciones de la muestra.…. Un=g(X1. Tema 1. Normalmente se indica como IID (Independent and Identically Distributed). Estimación Puntual y Bondad del Ajuste 8 .Xn) Estadística Aplicada 2.Definiciones •  Población: Es el conjunto de elementos sobre el que se realizan las observaciones. •  Muestra: Subconjunto de observaciones disponibles.

Estimación Puntual y Bondad del Ajuste 9 .Definiciones •  Estimador: Estadístico cuyas realizaciones proporcionan una aproximación del valor de un parámetro poblacional que se desconoce. •  Estimación: Realización de un estimador. •  E s t i m a d o r P u n t u a l : E s t i m a d o r q u e proporciona un valor único. Tema 1. •  Estimación Puntual: Realización de un estimador puntual. Estadística Aplicada 2.

Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 10 . •  Usaremos µˆ y σˆ para referirnos a estimaciones puntuales de la media y desviación estándar de una población. Tema 1. •  Usaremos Var(X) o V(x) para representar la varianza de una variable aleatoria.Convenciones •  Usaremos µ y σ para referirnos a la media y a la desviación estándar de la población. •  Usaremos X y S para referirnos a sus equivalentes de una muestra.

En la literatura se utiliza θ para referirse a una estimación (un caso particular) y Θ para referirse al estadístico (al caso general). •  Por abuso de notación no se distingue entre θ y Θ. aunque cabe indicar que existen diferencias. Tema 1.Convenciones •  Usaremos θ para referirnos al parámetro que deseamos estimar y por θˆ a la estimación realizada del parámetro. Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 11 .

Ejemplo 2
•  La variable aleatoria X tiene una distribución
con media no conocida µ.
•  La media de la muestra X es un estimador
puntual de µ.
•  Se dispone del valor de las siguientes
observaciones de una muestra aleatoria:
x1 = 10; x2 = 13; x3 = 11; x4 = 8; x5 = 11

•  Determine el valor de un estimador de µ .

Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste

12

Aplicaciones
•  Los problemas de estimación aparecen con
frecuencia. Los más habituales son los
siguientes:
–  Media de la población ( µ )
–  Varianza de la población ( σ 2 )
–  Proporciones ( p ) (porcentaje de la población que
cumple una condición)
–  Diferencias entre poblaciones ( µ1 − µ2 ó p1 − p2 ).

•  En general, nos interesará determinar alguno
de los parámetros que define la distribución
Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste

13

Ejemplo 2 (retomado)
•  Es importante destacar que el promedio de las
observaciones no es el único estimador
posible.
•  Otros estimadores (que podrían ser lógicos
según las circunstancias) para la media
poblacional son:
–  La mediana de la muestra (si la población se rige
mediante una ley normal).
–  La moda de la muestra (ley normal).
–  La media tras eliminar valores extremos (p.ej. el
mayor y menor valor).
Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste

14

se debe optar por el mejor estimador posible según algunas propiedades del estimador que puedan resultar deseables. Tema 1. •  Las propiedades deseadas están asociadas los conceptos de: –  Consistencia. Estadística Aplicada 2. –  Varianza. Estimación Puntual y Bondad del Ajuste 15 .Propiedades de los Estimadores •  Ante la situación anterior. –  Sesgo.

no al método de cálculo.….Xn) es un estimador consistente si converge en probabilidad a θ . Estimación Puntual y Bondad del Ajuste 16 . P U n !! →θ •  Esto significa que dado un ε>0 y 0<δ<1. existe un valor de N tal que si n>N se verifica: P ( Un − θ ≥ ε ) ≤ δ Coloquialmente. Estadística Aplicada 2.Consistencia •  Se dice que un estadístico Un=g(X1. Tema 1. el error se debe a la falta de información.

…. Estadística Aplicada 2.Sesgo •  Se dice que un estadístico Un=g(X1. Tema 1. insesgado) de θ si: E (U ) = θ •  Se dice que un estadístico es sesgado en caso contrario y E (U ) − θ es conocido como el sesgo del estimador. •  Conviene distinguir entre estadísticos con sesgo positivo E (U ) > θ . de los que muestran sesgo negativo E (U ) < θ .Xn) es un estimador sin sesgo (no sesgado. Estimación Puntual y Bondad del Ajuste 17 .

el valor de una observación de la muestra escogida al azar. ¿Es un estimador sesgado? ¿Es un estimador consistente? Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste 18 . •  Decide utilizar como estimador de la media.Ejemplo 3 •  Dispone de una muestra aleatoria de observaciones obtenidas de una población que sigue una distribución normal.

n 1 2 2 •  Recordemos: S = ∑ ( xi − x ) n i=1 Estadística Aplicada 2. es un estimador consistente pero sesgado de la varianza poblacional σ2. Estimación Puntual y Bondad del Ajuste 19 . Tema 1.Ejemplo 4 •  Mostrar que la varianza muestral no corregida.

Ejemplo 5 (Pregunta examen) •  Se somete a un número de componentes a su nivel extremo de funcionamiento. por tanto se anota cuándo cada componente deja de funcionar. por ejemplo 8 horas. y utilizar el hecho que algunos componentes sobrevivan todo el experimento durante el cálculo del estimador de la vida útil. Estadística Aplicada 2. Tema 1. El objetivo es estimar el valor medio que puede esperarse que el componente soporte ese estado. Estimación Puntual y Bondad del Ajuste 20 . •  Un planteamiento simple requiere esperar hasta que todos los elementos cedan •  Existe la posibilidad de fijar un tiempo de duración del experimento.

Estimación Puntual y Bondad del Ajuste 21 . la estimación que obtendríamos sería sesgada. •  Explique por qué si utilizara los datos que aparecen en la hoja y un estimador insesgado de la distribución exponencial.Ejemplo 5 (Pregunta examen) •  Se conoce que la distribución de fallas del motor sigue una distribución exponencial y se desea estimar el valor de su parámetro. Tema 1. Estadística Aplicada 2.

Estimación Puntual y Bondad del Ajuste 22 . •  La varianza de la población. ya que permite comparar estimadores sin sesgo. Tema 1. nos resulta de interés.Varianza •  Un estimador puntual es una variable aleatoria y por tanto puede considerarse como una observación de una población con su propia distribución. Estadística Aplicada 2. como medida de dispersión de las observaciones.

•  El estimador representado en negro es preferible al representado en rojo. Tema 1.Varianza •  La figura representa la distribución de dos estimadores sin sesgo. Estimación Puntual y Bondad del Ajuste 23 . Estadística Aplicada 2.

•  Entre todos los estimadores sin sesgo es preferible el de menor varianza. Estadística Aplicada 2. que es conocido como estimador insesgado de varianza mínima. •  Para muchas distribuciones y parámetros se conoce dicho estimador.Varianza •  Entre dos estimadores sin sesgo es preferible aquél con menor varianza. Estimación Puntual y Bondad del Ajuste 24 . •  Se dice que el estimador con menor varianza es el más eficiente. Tema 1.

Ejemplo 6 •  Disponemos de una muestra aleatoria con 2n muestras tomadas de una población con media η y varianza σ2. Estimación Puntual y Bondad del Ajuste 25 . •  Se dispone de los dos siguientes estimadores de la media: 1 n θ1 = ∑ xi n i=1 1 2n θ2 = xi ∑ 2n i=1 •  Determine cuál de los dos estimadores es preferible Estadística Aplicada 2. Tema 1.

el estimador representado en rojo es un estimador sin sesgo.Varianza •  A veces el problema no es tan sencillo. Tema 1. Estimación Puntual y Bondad del Ajuste 26 . Por ejemplo. mientras que el representado en negro sobreestima el parámetro Estadística Aplicada 2.

•  Algunos estimadores tienden (se aproximan asintóticamente) a esta distribución. Tema 1. Estimación Puntual y Bondad del Ajuste 27 . Estadística Aplicada 2.Asintóticamente normal •  En muchas ocasiones es interesante estudiar la distribución que sigue las estimaciones de un estimador. •  En tal caso es interesante que el estimador siga una ley normal con media θ.

Error estándar de un estimador
•  Se entiende como error estándar de un
estimador a su desviación estándar.

()

σ θˆ = Var θˆ

Nota. Éste es un caso claro en
que debería usarse Θ

•  Si en el error estándar intervienen parámetros
que deben estimarse, entonces se habla de un
error estándar estimado del estimador σˆ θˆ (sθˆ ) .

Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste

28

Ejemplo 7
•  Sea X una variable aleatoria de media µ y
varianza σ 2 . Dispone de dos muestras
aleatorias de la población de tamaños m y n
respectivamente, y medias muestrales X e Y
respectivamente. Considere el siguiente
estimador conjunto:
µˆ = aX + (1− a)Y

0 < a <1

•  ¿Cuál es el valor de a que minimiza el error
estándar?
Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste

29

Métodos de estimación puntual
•  Contamos con un listado de las propiedades
que deseamos que tengan nuestros
estimadores, que nos permitirían decidir cuál
es el mejor estimador, pero carecemos de
herramientas sistemáticas para generarlos. A
continuación se proponen dos métodos
frecuentemente utilizados (método de
momentos y método de máxima
verosimilitud) y se comentará otro método
que se utilizará en los capítulos siguientes
(estimación por mínimos cuadrados)
Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste

30

Estimación Puntual y Bondad del Ajuste 31 . Tema 1. •  Cada parámetro a estimar corresponde con una variable del sistema de ecuaciones.Método de momentos •  Consiste en igualar el momento muestral con el momento poblacional. por lo que será necesario una ecuación por parámetro a estimar. La igualación nos llevará a una ecuación (o sistema de ecuaciones) cuya resolución nos reportará el estimador. Estadística Aplicada 2.

n ∑ (x − x ) k i i=1 n Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 32 . Tema 1. n k x ∑ i=1 i n –  Momento centrado en la media.Momentos muestrales •  Existen dos tipos de momentos: –  Momento centrado en el origen.

Estimación Puntual y Bondad del Ajuste 33 . k " E ( xi − µ ) $ # % Estadística Aplicada 2. E !" x k #$ –  Momento centrado en la media.Momentos poblacionales •  Sus equivalentes son los siguientes: –  Momento centrado en el origen. Tema 1.

Ejemplos de momentos •  Momentos centrados en el origen: –  E[x0]=1 –  E[x1]=µ ∑ n x i=1 i n 1 =X •  Momentos centrados en la media: –  E[(x-µ)0]=1 –  E[(x-µ)1]=0 –  E[(x-µ)2]=σ2 n ∑ (x − x ) i=1 Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste i n 2 =S 2 34 . Tema 1.

Estimación Puntual y Bondad del Ajuste 35 . indicando el número de trabajadores que se ausentaron el día indicado. Tema 1.Ejemplo 8 •  El absentismo laboral en una gran empresa puede aproximarse a una distribución binomial negativa. Operarios Ocasiones 0 1 2 3 4 5 6 26 72 81 91 63 47 21 7 9 8 5 9 2 10 3 •  Estime los parámetros de la distribución Estadística Aplicada 2. •  La empresa dispone de los datos de absentismo de los últimos 420 días.

•  r representa el número de sucesos antes de parar el experimento.Ejemplo 8 (info. Tema 1. Estimación Puntual y Bondad del Ajuste 36 . Binomial negativa) •  La distribución binomial negativa tiene dos parámetros: r y p. 1− p E(x) = r ⋅ p 1− p V (x) = r ⋅ 2 p •  k es el número de sucesos negativos antes de conseguir r éxitos. •  p probabilidad que un suceso deba ser tenido en cuenta en r. Estadística Aplicada 2.

Método de máxima verosimilitud •  Aunque el método de momentos es un método muy atractivo. •  Además. que lo transforman en un método atractivo desde un punto de vista puramente teórico. Estimación Puntual y Bondad del Ajuste 37 . Estadística Aplicada 2. Tema 1. en la práctica el método más frecuente es el método máxima verosimilitud. el método no tiene mayores dificultades para los casos en que el método de momentos pudiera parecer preferible). •  Esto se debe a algunas propiedades del método y de los estimadores que produce.

Tema 1.Método de máxima verosimilitud La idea del método es la siguiente: •  El estimador debe tomar un único valor. •  Para cada muestra. Estadística Aplicada 2. •  Si combinamos las probabilidades de cada valor para un único estimador tenemos una medida de cómo de probable (verosímil) es el valor. cada estimación tiene una probabilidad diferente de que produzca ese valor en la muestra. Estimación Puntual y Bondad del Ajuste 38 .

5. Estadística Aplicada 2. Tema 1. 10%èa+2 •  Disponemos de la siguiente muestra 3. 20%èa-1.Ejemplo 9 •  Supongamos una población que sigue la siguiente distribución discreta: •  10%èa-2. 4. 4.20èa+1. Estimación Puntual y Bondad del Ajuste 39 . 3 •  Determine si el mejor estimador para a es 3 o 4 (existen otros valores posibles para a pero no serán considerados).40èa.

….Xn ( x1 . •  Notación: X1... xn ) = ∏ p Xi ( xi ) IID i=1 Estadística Aplicada 2....... xn ) = f X1 ..Xn ( x1 . el objetivo será buscar el valor que maximiza la función de verosimilitud (Likelihood function). xn ) = ∏ f Xi ( xi ) IID i=1 n L(x1 ...Método de máxima verosimilitud •  En general. xn ) = p X1 ............. Tema 1. Estimación Puntual y Bondad del Ajuste 40 .Xn es una muestra de la población cuya distribución está representada por una variable aleatoria X n L(x1 ..

Estimación Puntual y Bondad del Ajuste 41 . Estadística Aplicada 2.Método de máxima verosimilitud •  La maximización de la función anterior corresponde a un problema de optimización clásico. Tema 1. •  En muchas ocasiones nos referimos a los estimadores generador por el método con las siglas MLE (Maximum Likelihood Estimator). •  A continuación se exponen las propiedades principales del método que hacen que sea el más utilizado al estimar parámetros.

•  Los MLE son asintóticamente normales. el método converge al valor verdadero del parámetro cuando el tamaño muestrales grandes. Tema 1. •  Los MLE son consistentes. pero en caso que lo sean es posible corregir el sesgo mediante un factor de corrección. Esto es. Estimación Puntual y Bondad del Ajuste 42 . las estimaciones del MLE siguen una distribución normal (más tras los ejemplos).Propiedades •  Los MLE pueden ser sesgados. cuando crece el tamaño de la muestra. Estadística Aplicada 2. Esto es.

() •  Esta propiedad no tiene por qué tenerla cualquier estimador. Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 43 . entonces g θˆ es un estimador de g(θ). •  Ejemplo: si Bˆ es un MLE del área de un cuadrado Aˆ = Bˆ es un MLE del área de sus lados. si θˆ es un MLE de θ. Tema 1.Propiedades •  Los MLE son invariantes. •  Esto es.

Estimación Puntual y Bondad del Ajuste 44 . ( n−r ) ⎛ r ⎞ L = ⎜ ∏ f X ( t. λ )⎟ ⋅ ⎡⎣1− FX (T . Tema 1. r es el número de componentes que no sobreviven el experimento. λ ) ⎤⎦ ⎝ i=1 ⎠ Estadística Aplicada 2. t es el instante de tiempo donde falla el motor y T es el instante de tiempo donde se censura el experimento. donde n es el número de componentes utilizados en el experimento.Ejemplo 10 (Pregunta Examen) •  Continuamos con la pregunta del examen planteada en el ejemplo 5 •  Explique por qué la función de máxima verosimilitud de un experimento con censura es la mostrada en la ecuación siguiente.

Estadística Aplicada 2. Tema 1.Ejemplo 10 (Pregunta Examen) •  Determine una fórmula para el estimador de máxima verosimilitud del parámetro de la distribución. Estimación Puntual y Bondad del Ajuste 45 .

e− λ ⋅ λ x f ( x) = x! •  ¿Encuentra lógico el resultado? Estadística Aplicada 2.Ejemplo 11 •  Encuentre el MLE del parámetro de una ley exponencial. Estimación Puntual y Bondad del Ajuste 46 . Tema 1. f ( x ) = λ ⋅ e− λ x •  Encuentre el MLE del parámetro de una ley de Poisson.

σ ) = e 2πσ Estadística Aplicada 2. Tema 1.Ejemplo 12 •  Encuentre el MLE de los parámetros de una ley normal. Estimación Puntual y Bondad del Ajuste 2 x− µ ) ( − 2σ 2 47 . 1 fx ( x. µ.

Estimación Puntual y Bondad del Ajuste 48 . x ∈[ 0.θ ) = .Ejemplo 13 •  Calcule el MLE de una distribución uniforme continua. Tema 1.θ ] θ Estadística Aplicada 2. 1 fx ( x.

6. 1 fx ( x. 7. 4. 3. β ) = . 5. Tema 1.α . x ∈[α . 5. 4. β ] β −α Estadística Aplicada 2. 9. 6. Estimación Puntual y Bondad del Ajuste 49 .Ejemplo 14 •  Calcule los estimadores de momentos y máxima verosimilitud de una distribución uniforme basándose en la siguiente muestra: 1.

2 ln f X ( X.θ ) / + ∂θ . Cota de Crámer-Rao Estadística Aplicada 2.Propiedad asintótica de los MLE •  Si θˆ es un MLE del parámetro θ de una muestra aleatoria X1.θ )) / ( .& ln f X ( X.…. +% ∂θ = 1 * ∂2 −nE . θˆ sigue una N(µ.Xn.σ2) µ =θ 2 σ = 1 2 *$ ∂ ' nE . Tema 1. Estimación Puntual y Bondad del Ajuste 50 . entonces para una n suficientemente grande.

Estimación Puntual y Bondad del Ajuste 51 .Intervalos de confianza •  Sea θ un parámetro de una distribución y θˆ un estimador del parámetro. Si el estimador: –  Sigue aproximadamente una distribución normal –  Es aproximadamente insesgado –  Tiene una desviación estándar σ θˆ que puede ser estimada a través de la muestra •  Entonces: θˆ − θ σ θˆ sigue aproximadamente una distribución normal Estadística Aplicada 2. Tema 1.

Intervalos de confianza •  De esta manera. un intervalo de confianza aproximado de θ es: θˆ − zα /2σ θˆ ≤ θ ≤ θˆ + zα /2σ θˆ Las propiedades antes enunciadas de los estimadores de máxima verosimilitud permiten calcular el intervalo de confianza de la manera mostrada. Estimación Puntual y Bondad del Ajuste 52 . para muestras grandes. Tema 1. Estadística Aplicada 2.

Ejemplo 15 •  Una empresa minera ha observado el número de averías por semana de sus máquinas excavadoras. Estimación Puntual y Bondad del Ajuste 53 . Tema 1. Operarios Ocasiones 0 1 2 3 4 59 26 24 18 12 5 5 6 4 7 3 9 3 11 2 •  Realice una estimación del parámetro p y determine un intervalo de confianza del 90% Estadística Aplicada 2. Dicha muestra constituye un total de 156 observaciones y la empresa cree que se las averías distribuyen mediante una distribución geométrica.

–  El método de máxima verosimilitud es más general que el método de mínimos cuadrados. Tema 1. Estimación Puntual y Bondad del Ajuste 54 .Nota final sobre MLE •  Aunque en los siguientes dos temas (regresión y análisis de varianza) usaremos estimadores basados en mínimos cuadrados. –  Esto no es así cuando los errores no se comportan así. la estimación realizada por ambos estimadores es idéntica. Estadística Aplicada 2. cuando los errores (residuos) se distribuye según una ley normal de media 0.

Parte 2 Bondad del Ajuste Estadística Aplicada 2. Tema 1.Tema 1. Estimación Puntual y Bondad del Ajuste 55 .

Tema 1.Índice •  •  •  •  •  •  •  •  •  Concepto de los gráficos de probabilidad Procedimiento Gráficos P-P (probabilidad-probabilidad) Gráficos Q-Q (cuantil-cuantil) Gráfico Normal Concepto de prueba de bondad del ajuste Prueba de Chi-Cuadrado Prueba de Kolmogorov-Smirnov Prueba de Anderson-Darling Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 56 .

permitiendo comparar visualmente ambas curvas. •  Se superpone los datos de entrada y la distribución ajustada en un mismo gráfico. •  Permiten determinar si la distribución ajustada coincide con los datos de entrada en áreas específicas (colas. Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 57 . Tema 1.Concepto de gráfico de probabilidad •  La idea de los gráficos de probabilidad es comparar la función de distribución acumulada (CDF) de los datos con las CDFs teóricas. parte central…).

•  El primer paso a seguir para la creación del gráfico consiste en ordenar las observaciones de la muestra en orden no decreciente (ascendente): X(1)≤X(2) ≤…≤X(n). Tema 1. Estadística Aplicada 2.Gráfico Probabilidad-Probabilidad •  Los gráficos Probabilidad-Probabilidad (P-P Plot) comparan la distribución acumulada empírica de la muestra con la distribución acumulada de la variable aleatoria. •  A partir del orden anterior se determina la función de masa acumulada CDF de la muestra. Estimación Puntual y Bondad del Ajuste 58 .

Gráfico Probabilidad-Probabilidad •  Para la estimación se utiliza la fórmula siguiente: nro. Tema 1. Estadística Aplicada 2.de Xi ' s ≤ x Fn (x(i ) ) = n •  Como los datos están ordenados Fn(X(i))=i/n. •  Esta función presenta como inconveniente que otorga probabilidad 1 a un valor finito (lo cual contradice la definición de muchas distribuciones. por lo que sería necesaria una corrección para evitar este fenómeno. Estimación Puntual y Bondad del Ajuste 59 .

Gráfico Probabilidad-Probabilidad •  Una corrección posible consiste en considerar que las observación corresponde a todo un segmento de puntos de la CDF (al proceder de una muestra de tamaño discreto pero aproximar una distribución posiblemente continua) y situar su valor en el punto medio del segmento. Tema 1. 0.5 en vez de i. Estimación Puntual y Bondad del Ajuste Usar i-0. 60 .5 i − 0.5 ! Fn (x(i ) ) = Fn (x(i ) ) − = n n Estadística Aplicada 2.

•  Un buen ajuste equivaldría a la recta y=x. ésta se grafica respecto a la teórica Fˆn (x(i ) ) (que se obtiene de buscar el valor de la muestra en la CDF de la distribución). Estadística Aplicada 2.Gráfico Probabilidad-Probabilidad •  Una vez se dispone de la CDF empírica. Tema 1. Estimación Puntual y Bondad del Ajuste 61 . •  Mide diferencias significativas de ajuste en el “centro” de la muestra. •  El método descrito puede usarse tanto para distribuciones discretas y continuas.

0.7. •  Realice un gráfico P-P de las observaciones respecto a la distribución teórica.1.Ejemplo 16 •  D i s p o n e d e u n a m u e s t r a c o n o c h o observaciones cuyos valores son: 0.75. 0.35. 0.5. Estimación Puntual y Bondad del Ajuste 62 .8 y 0. 0. 0. Tema 1.9. 0.1].3. •  Cree que las observaciones corresponden a una población regida por la distribución uniforme [0. Estadística Aplicada 2.

Tema 1. •  Los gráficos Q-Q sirven para evidenciar diferencias significativas de ajuste en la “cola” de la muestra. •  Un buen ajuste equivaldría a la recta y=x. Estimación Puntual y Bondad del Ajuste 63 .Gráfico Cuantil-Cuantil •  Los gráficos Cuantil-Cuantil (Q-Q Plot) comparan los cuantiles (percentiles) de la distribución empírica de la muestra con los de la distribución de la variable aleatoria. Estadística Aplicada 2. •  Un cuantil indica el valor observado en el que se alcanza un valor de probabilidad acumulada (el cuantil) de la muestra.

5)/n.n. •  Sólo validos para distribuciones continuas (¿por qué no son válidos para distribuciones discretas?). 0<qi<1. Tema 1. Estimación Puntual y Bondad del Ajuste 64 . Estadística Aplicada 2. i=1.Gráfico Percentil-Percentil •  Se grafica los cuantiles de la muestra (las observaciones de ella xqiS = F!n −1 (qi ) con respecto a cuantil teórico xqiM = Fˆ −1 ( qi ) donde qi=(i-0.….

Colas Amplificadas (Q-Q Plot) Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste 65 .

Tema 1.Centro Amplificado (P-P Plot) Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 66 .

En otras palabras: qi' = F!n (Yi ). la muestra incluye observaciones idénticas. Estadística Aplicada 2.Corrección para repetición de datos •  En ocasiones. –  Para la v.a: qi=(proporción de Xj≤Yi)-0.5/n. •  El gráfico adaptado modifica los valores como sigue: –  Para la muestra: definir Yi que corresponde a los valores de Xi eliminando repeticiones ordenados de forma creciente. especialmente en distribuciones discretas. Estimación Puntual y Bondad del Ajuste 67 . Tema 1.

Tema 1. ¿Parece un ajuste adecuado? ¿Por qué?.Ejemplo 17 •  Utilice los datos de la hoja “Interarrival Times” para crear gráficos P-P y Q-Q asumiendo que dichos datos siguen una distribución teórica exponencial. ¿Parece un ajuste adecuado? ¿Por qué? Estadística Aplicada 2. •  Utilice los datos de la hoja “Demand Sizes” para crear un gráfico de P-P asumiendo que dichos datos siguen una distribución teórica geométrica. Estimación Puntual y Bondad del Ajuste 68 .

Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 69 . •  El gráfico normal es la herramienta que aporta Minitab para graficar posibles desviaciones entre distribuciones teóricas y las observaciones. •  Está especialmente pensada para graficar posibles desviaciones respecto a la ley normal. es el gráfico Normal.Gráfico Normal •  Una tercera alternativa para representar diferencias entre distribuciones teóricas y las observaciones de una muestra. Tema 1.

•  Si los puntos representados parecen configurar una recta. •  El eje Y presenta la probabilidad acumulada de de la distribución teórica (véase cómo en el gráfico P-P). Tema 1. •  La escala del eje Y no es lineal. es conveniente trazar una recta para estimar si los puntos forman parte o no de la distribución Estadística Aplicada 2. entonces el gráfico normal indica que existe una •  Tras representar los puntos en la hoja. lo que obliga a utilizar papel especial para realizar el gráfico. Estimación Puntual y Bondad del Ajuste 70 .Gráfico Normal •  El eje X presenta los valores de la serie.

Papel normal Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste 71 .

Ejemplo de gráfico normal Puede verse que a veces los ejes se cambian Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 72 . Tema 1.

4. 6.48.68.46. 2. 4. 2.29.93.94. Estimación Puntual y Bondad del Ajuste 73 .Ejemplo 18. 6. 3.86 Nota: El ajuste de Minitab para la distribución teórica acumulada es un poco diferente al practicado en clase Estadística Aplicada 2. Tema 1. 5.64. Continuación •  Determine a través de un gráfico normal si las siguientes observaciones pueden proceder de una ley normal. 3.53. 2.92.

Ejemplo 18. Estimación Puntual y Bondad del Ajuste 74 . Tema 1. Respuesta Minitab Estadística Aplicada 2.

68   95%   Estadística Aplicada 2.  teórica   2.46   55%   4.  Ac.92   45%   4.53   85%   6.86   75%   6.48   5%   2.64   15%   2.29   35%   3.94   25%   3. Tema 1.93   65%   5.Manual Observación   Prob. Estimación Puntual y Bondad del Ajuste 75 .

Estimación Puntual y Bondad del Ajuste 76 . •  La prueba puede ser usada para comprobar la siguiente hipótesis: H0: Las observaciones Xi son v.a. Tema 1. IID con función de distribución Fˆ.Concepto de prueba de ajuste •  Una prueba de bondad del ajuste es una prueba formal que permite evaluar si un conjunto de observaciones forman una muestra independiente de una distribución particular. •  A continuación se comenta la estructura y propiedades de estas pruebas. Estadística Aplicada 2.

•  Estas pruebas no son muy potentes para muestras pequeñas o de tamaño moderado ya que son insensibles a diferencias sutiles.Estructura y Propiedades •  En primer lugar. quiere decir que no se rechaza. no rechazar la hipótesis nula no quiere decir que sea cierta. Tema 1. Estadística Aplicada 2. •  Por otro lado. para muestras muy grandes rechazarán sistemáticamente H0 ya que en la práctica los ajustes nunca son perfectos. Estimación Puntual y Bondad del Ajuste 77 . •  Deben tomarse como un aproximación sistemática a la detección de errores.

Prueba de Chi-Cuadrado •  Propuesta por Pearson en 1900.ak]. Estimación Puntual y Bondad del Ajuste 78 . Tema 1. pero el resultado varía según su elección.….a1) y ak puede ser -∞ y entonces [ak-1. a0 puede ser -∞. Estadística Aplicada 2. •  El método no fija el número de intervalos ni su longitud. y entonces el primer intervalo es (a0. [a 1 .ak).a 1 ). [ak-1.a 2 ). •  Es una prueba muy general que sirve para datos continuos y discretos. •  Se debe dividir el rango de la distribución en k intervalos adjacentes [a 0 .

Procedimiento de cálculo Chi-Cuadrado •  Una vez definidos los intervalos (más sobre ello a continuación) se cuenta el número de observaciones en cada intervalo y se compara con el valor que la distribución predice. –  Sea pj la proporción esperada de datos en el jésimo intervalo. pj = ∫ aj a j−1 fˆ (x) dx aj p j = ∑ x=a pˆ (x) j−1 Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste 79 . –  Sea Nj el número de datos observados en el intervalo j.

•  Si la distribución ajustada en H0 es correcta. Estadística Aplicada 2.Procedimiento de cálculo Chi-Cuadrado •  Por lo tanto npj sería el número de datos esperados en el j-ésimo intervalo. Tema 1. el estadístico tiene una distribución chi-cuadrado con k-1 grados de libertad (si no existen parámetros por observar). •  Si H0 es correcta debemos esperar que Nj≈npj •  Utilizamos como estadístico Chi-Cuadrado. Estimación Puntual y Bondad del Ajuste 80 .

Aceptación o Rechazo de H0 •  Se opta por rechazar la hipótesis nula si: Puede reportarse p-valor •  En realidad. Estadística Aplicada 2. Tema 1. el estadístico tiene una distribución aproximada entre chi-cuadrado con k-1 grados de libertad y chi-cuadrado con k-m-1 grados de libertad donde m es el número de parámetros estimados. Estimación Puntual y Bondad del Ajuste 81 . •  Si k es grande y m pequeña (como acostumbra a suceder) la diferencia de grados de libertad no es importante por lo que no se varía la condición de rechazo.

Tema 1.Aceptación o Rechazo de H0 Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 82 .

Tema 1. Estimación Puntual y Bondad del Ajuste k = !"1+ log 2 n #$ 83 . •  Para distribuciones continuas. •  Pueden plantearse algunas recomendaciones: –  Conviene que los intervalos sean equiprobables. esto obliga a invertir la distribución •  Para distribuciones discretas.Determinación de k •  Problema difícil sin respuesta universal. es suficiente con que las probabilidades sean aproximadamente iguales –  El número de intervalos •  Es deseable que npj >5 •  Es conveniente que n ≤ k ≤ n 5 •  Se sugiere (distribuciones continuas): Estadística Aplicada 2.

–  Asintóticamente válida si se utiliza un MLE para estimar los parámetros. Tema 1.Pros y Contras de la Prueba •  Ventajas: –  Completamente General. •  Inconvenientes: –  La elección de intervalos puede modificar el resultado de la prueba. –  Sólo puede utilizarse si el número de observaciones es relativamente grande n>40. Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 84 .

para concluir en base al valor p de la prueba si parece adecuado el ajuste de los datos a una distribución teórica exponencial. Tema 1. Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 85 .Ejemplo 19 •  Utilice los datos de la hoja “Interarrival Times” para realizar un procedimiento de prueba Chi-Cuadrado. para concluir en base al valor p de la prueba si parece adecuado el ajuste de los datos a una distribución teórica geométrica. •  Utilice los datos de la hoja “Demand Sizes” para realizar un procedimiento de prueba Chi-Cuadrado.

Tema 1. •  No es tan sensible al tamaño de la muestra. Por tanto.Prueba de Kolmogorov-Smirnov •  Esta prueba está diseñada para su uso con distribuciones continuas. Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 86 . –  Es difícil de implementar con distribuciones discretas •  No requiere de la determinación de intervalos. es aconsejable para cualquier valor de n (obviamente finito). •  La prueba se diseñó para muestras de las que se conocía los parámetros de la distribución con los que se quería comprobar la hipótesis nula.

•  La CDF empírica Fn(x) se define como la proporción de muestras Xi tales que su valor es menor a x. •  Se utiliza para comparar las CDF empíricas y teóricas. •  Por otro lado disponemos de la CDF de la distribución teórica. esto es: Fn(X(i))=i/n. Tema 1. que se obtienen el acumulado del ˆ .Fundamentos de la prueba •  Intenta formalizar el método de los gráficos de probabilidad. valor empírico en la distribución F(x) ˆ •  La prueba investigará si para todo n Fn ( x ) = F(x) Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 87 .

primero definimos la distancia entre ambas funciones ˆ Fn ( x ) − F(x) •  Y su distancia máxima ˆ sup x Fn ( x ) − F(x) •  La prueba se basa en esta distancia máxima pero el cálculo se realiza utilizando otras medidas (se aprovecha que la muestra es discreta). Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 88 . Tema 1.Fundamentos de la prueba •  Para ello.

consideramos que el ajuste es muy pobre. •  El rechazo de H0 se produce si Dn modificado es mayor que dn. Estimación Puntual y Bondad del Ajuste 89 . Éste último es una constante cuyo valor depende de la distribución teórica y de si los parámetros de la distribución son conocidos o estimados. Estadística Aplicada 2.Procedimiento de cálculo de la prueba •  Se calcula Dn: i ˆ D = max − F(X(i) ) 1≤i≤n n + n i −1 ˆ D = max F(X(i) ) − 1≤i≤n n − n Dn = max { D . D + n − n } •  Si Dn es muy grande. Tema 1.1-α .

Estimación Puntual y Bondad del Ajuste 90 .Ejemplo gráfico Estadística Aplicada 2. Tema 1.

Estimación Puntual y Bondad del Ajuste 91 . Tema 1.Ejemplo gráfico Estadística Aplicada 2.

Tablas de valores críticos Estadística Aplicada 2. Tema 1. Estimación Puntual y Bondad del Ajuste 92 .

Tablas de valores críticos Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 93 . Tema 1.

Estimación Puntual y Bondad del Ajuste 94 .Tablas de valores críticos Estadística Aplicada 2. Tema 1.

Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 95 . Tema 1. para concluir si parece adecuado el ajuste de los datos a una distribución exponencial. realice un análisis de sensibilidad del nivel de significación de la prueba. Adicionalmente.Ejemplo 20 •  Utilice los datos de la hoja “Interarrival Times” para realizar un procedimiento de prueba K-S.

–  A-D asigna mayor importancia a las colas. •  El método define un peso (ponderación) con mínimo 1 igual a 4 justo en la mediana.Prueba de Anderson-Darling •  Tal como Kolmogorov-Smirnov mide discrepancias entre la distribución empírica y la observada. Estimación Puntual y Bondad del Ajuste ˆ #1− F(x) ˆ % F(x) $ & 96 . –  Esto hace que el método sea más sensible y potente en diferencias en los extremos. Tema 1. aunque en ocasiones resulte más interesante estudiar el ajuste en las colas. Ψ(x) = Estadística Aplicada 2. •  Diferencias: –  K-S otorga la misma importancia a todas las observaciones de la muestra.

Procedimiento de cálculo de la prueba •  El peso corresponde a: Ψ(x) = 1 ˆ #1− F(x) ˆ % F(x) $ & •  Y el estadístico de prueba (An2) corresponde a: ∞ 2 A = n ∫ "# Fn ( x ) − Fˆ ( x ) $% ψ ( x ) fˆ ( x ) dx = 2 n −∞ ∑ ( 2i − 1){ln Fˆ ( X( ) ) + ln "#1− Fˆ ( X( n − i=1 i n Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste n+1−i ) )$%} − n 97 . Tema 1.

Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 98 .Diagnóstico de la prueba •  El rechazo de H0 se produce si: –  An2 modificado para el caso respectivo es mayor que an. Tema 1.1-α que es una constante cuyo valor depende de la distribución y del origen de los parámetros.

Adicionalmente. para concluir si parece adecuado el ajuste de los datos a una distribución exponencial. Tema 1. realice un análisis de sensibilidad del nivel de significación de la prueba.Ejemplo 21 •  Utilice los datos de la hoja “Interarrival Times” para realizar un procedimiento de prueba A-D. Estadística Aplicada 2. Estimación Puntual y Bondad del Ajuste 99 .

Estadística Aplicada 2. Tema 1. •  Utilice MINITAB para detectar si la muestra coincide con el modelo. •  Se supone que las desviaciones del proceso de fabricación son causados por el efecto de múltiples causas provocando una distribución que se asemeja a una Gaussiana. Estimación Puntual y Bondad del Ajuste 100 .Ejemplo 22 •  Los datos de la hoja “desviaciones” incluye la diferencia entre el diámetro deseado y el encontrado en las cabeza de una muestra de tornillos fabricados en una empresa.