Estadística descriptiva - Inferencia estadística

Estadística descriptiva Inferencia estadística

Una introducción básica, breve y elemental

Jorge Moretti Mayo de 2009

SOCIEDAD DE EDUCACIÓN MATEMÁTICA URUGUAYA Jornada de Educación Matemática (JEM 29) Enseñanza de Estadística en el tercer año de bachillerato Un enfoque posible

I - Introducción En este documento presentamos algunos temas que son objeto de la Estadística Descriptiva y de la Inferencia Estadística; la primera de esas ramas de la Estadística se ocupa de construir métodos de descripción numérica de conjuntos numerosos y la segunda de procedimientos para realizar estimaciones de ciertas características de una población a partir de una muestra extraída de la misma. En lo que se refiere a la Estadística Descriptiva nuestra atención se dirigirá hacia algunas representaciones gráficas asociadas a variables estadísticas reales y a ciertas características de tendencia central, dispersión y concentración de esas variables. En lo que respecta a la Inferencia Estadística, nos preocuparemos por algunos procedimientos de estimación y daremos un ejemplo de prueba de hipótesis (esto último en un apéndice). En todos los casos nuestras variables estarán definidas en conjuntos finitos. II – Estadística Descriptiva A – Un ejemplo 1 – Media, moda, mediana y mediala de una variable estadística cuantitativa En la tabla que sigue aparecen los datos sobre el ingreso durante el último mes de cincuenta hogares de un barrio de Montevideo.
Tabla 1 - Datos de ingresos de cincuenta hogares Ingreso (en miles de pesos) 4 10 8 12 7 15 9 13 17 6 8 18 20 16 21 6 10 Ingreso (en miles de pesos) 18 4 20 17 9 4 7 13 15 18 10 10 15 16 8 12 22 Ingreso (en miles de pesos) 9 18 22 10 12 13 15 18 10 20 15 13 10 16 6 7 632

Hogar 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Hogar 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Hogar 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Total

1

Lo anterior, que es una forma de ver una función real cuyo dominio es el conjunto de los cincuenta hogares que se han investigado, puede resumirse en la próxima tabla (esa función es un caso de variable estadística cuantitativa).
Tabla 2 - Un resumen de los ingresos de los cincuenta hogares Frecuencia Ingreso 4 6 7 8 9 10 12 13 15 16 17 18 20 21 22 Total Absoluta 3 3 3 3 3 7 3 4 5 3 2 5 3 1 2 50 Relativa 0,06 0,06 0,06 0,06 0,06 0,14 0,06 0,08 0,10 0,06 0,04 0,10 0,06 0,02 0,04 1,00 Absoluta 3 6 9 12 15 22 25 29 34 37 39 44 47 48 50 Relativa 0,06 0,12 0,18 0,24 0,30 0,44 0,50 0,58 0,68 0,74 0,78 0,88 0,94 0,96 1,00 Frecuencia acumulada Ingreso acumulado Parte del Valor ingreso total 12 0,02 30 0,05 51 0,08 75 0,12 102 0,16 172 0,27 208 0,33 260 0,41 335 0,53 383 0,61 417 0,66 507 0,80 567 0,90 588 0,93 632 1,00

Nota : Los valores de la última columna han sido redondeados a dos cifras decimales.

Resulta útil la interpretación de nuestra segunda tabla. Por ejemplo, el renglón correspondiente al ingreso 13 nos permite afirmar lo siguiente: 1) Cuatro de los cincuenta hogares tuvieron un ingreso mensual de trece mil pesos y ellos son el 8 % del total de hogares. 2) Hay veintinueve hogares cuyo ingreso mensual no superó los trece mil pesos y ellos son el 58 % del total de hogares. 3) La suma de los ingresos de los veintinueve hogares anteriores fue de doscientos sesenta mil pesos, el 41 % del total de los ingresos de todos los hogares. O sea que el 58 % de los hogares (los de menor ingreso) tuvieron el 41 % del total de los ingresos. Y ahora vamos tras cuatro números que pretenden describir la tabla anterior, resumiendo aún más los datos originales de los ingresos. Media del ingreso ¿Cuál es el promedio del ingreso por hogar? Debido a que el total de los ingresos de los 50 hogares asciende a 632 mil pesos, 632 resulta que el promedio del ingreso por hogar es de = 12,64 mil pesos. A este 50 número lo llamaremos media de la función ingreso. Moda del ingreso ¿Cuál es el ingreso más frecuente? Alcanza con recorrer la columna titulada “Frecuencia relativa” de la tabla 2 para concluir que el ingreso más frecuente es diez mil pesos. A ese número lo llamaremos moda de la función ingreso.
2

Mediana del ingreso ¿Hay algún ingreso tal que la mitad de los hogares tengan un ingreso que no lo supera y la otra mitad un ingreso que sí lo supera? Si ahora recorremos la columna titulada “Frecuencia acumulada relativa” de la tabla 2, vemos que el ingreso que responde a la pregunta anterior es doce mil pesos. A ese número lo llamaremos mediana de la función ingreso. Mediala del ingreso ¿Hay algún ingreso tal que los hogares que tengan un ingreso que no lo supera tienen un ingreso total igual al de los que sí lo supera? La columna titulada “Ingreso acumulado, Parte del ingreso total” de la tabla 2 nos indica que debemos responder negativamente ya que el número 0,50 no se encuentra allí. Entre los números mayores a 0,50 que aparecen en esa columna hay uno que es el menor; nos estamos refiriendo a 0,53 que corresponde a un ingreso de quince mil pesos. A ese ingreso lo llamaremos mediala de la función ingreso. Los hogares cuyo ingreso no supera a quince mil pesos son el 68 % del total de hogares y, en conjunto, tienen un ingreso que es el 53 % del ingreso total. Ejercicio 1 Interpreta el renglón correspondiente al ingreso 15 de la tabla 2. Ejercicio 2 Un funcionario de una empresa de transporte visita una fábrica de neumáticos para realizar una importante compra de neumáticos. Le pregunta al encargado de ventas sobre la duración de los mismos y éste le comunica que puede darle algunos indicadores estadísticos sobre tal duración. Concretamente le pregunta: ¿Prefiere que le informe sobre la media, la moda o la mediana? ¿Cuál indicador le conviene solicitar al comprador? (te sugerimos que no te apures en la respuesta). Ejercicio 3 La empresa del ejercicio anterior lleva estadísticas, desde hace varios años, de la duración de dos marcas de neumáticos. Tiene los siguientes datos: Neumático A: media 25.000 Km y mediana 27.000 Km Neumático B: media 27.000 Km y mediana 25.000 Km Se sabe que las dos marcas se veden al mismo precio. ¿Qué marca le recomendarías a la empresa? ¿Por qué? Ejercicio 4 Un supermercado tiene información sobre las ventas durante el último mes de cada uno de sus productos y ha calculado la media, la moda, la mediana y la mediala de la función ventas. ¿Cuál o cuáles de esos indicadores puede serle de más utilidad? (nuevamente te pedimos que pienses atentamente tu respuesta). Ejercicio 5 Consigue o elabora algo similar a la tabla 1 y calcula la media, la moda, la mediana y la mediala de la correspondiente función.

2 – Función de cuantía, función de distribución y función de concentración de una variable estadística cuantitativa A partir de la variable ingreso de nuestro ejemplo podemos definir algunas funciones útiles en Estadística, las funciones de cuantía, de distribución y de concentración.
3

Función de cuantía Los valores de la variable ingreso son los elementos del conjunto B = {4, 6, ..., 21, 22}. Para cada uno de esos ingresos hemos calculado en la tabla 2 la frecuencia relativa de los correspondientes hogares. Podemos definir una función de dominio B tal que la imagen de la función en cada elemento de B sea la respectiva ⎧ 0,06 si x = 4 ⎪ 0,06 si x = 6 ⎪ ⎪ . frecuencia relativa. O sea, f : B → R tal que f(x) = ⎨ ... ⎪ 0,02 si x = 21 ⎪ ⎪ 0,04 si x = 22 ⎩

A esta función f la llamaremos función de cuantía de la variable ingreso.

Función de distribución A partir de las frecuencias relativas acumuladas que aparecen en la tabla 2 si x < 4 ⎧0 ⎪0,06 si 4 ≤ x < 6 ⎪ ⎪0,12 si 6 ≤ x < 7 ⎪ . definimos una segunda función así: F : R → R tal que F( x ) = ⎨... ⎪0.94 si 20 ≤ x < 21 ⎪ ⎪0.96 si 21 ≤ x < 22 ⎪1 si x ≥ 22 ⎩

A esta función F la llamaremos función de distribución de la variable ingreso.

4

Función de concentración La última función que definiremos con nuestra variable ingreso es la función de concentración. Aquí necesitamos algo más que la tabla 2. Ordenemos los cincuenta hogares según los valores crecientes de sus ingresos y notemos que: 1 - El primero de esos hogares tiene una frecuencia relativa de y un ingreso de 50 4 del ingreso total de los cincuenta hogares. cuatro mil pesos, lo cual es 632 2 - Los dos primeros hogares tienen una frecuencia relativa de y en conjunto 50 8 del ingreso total de los acumulan un ingreso de ocho mil pesos, lo cual es 632 cincuenta hogares. - Y así sucesivamente hasta llegar a los cincuenta hogares.

Lo anterior motiva la definición de nuestra tercera función: 1 ⎧ si 0 ≤ x < ⎪0 50 ⎪ ⎪ 4 si 1 ≤ x < 2 ⎪ 632 50 50 ⎪ 8 2 3 ⎪ si ≤x< ⎪ 632 50 50 ⎪ C : [0 ,1] → R tal que C( x ) = ⎨ ... ⎪ 588 48 49 ⎪ si ≤x< 50 50 ⎪ 632 ⎪ 620 49 si ≤ x <1 ⎪ 50 ⎪ 632 ⎪ 632 ⎪ 632 si x = 1 ⎩ A esta función C la llamaremos función de concentración de la variable ingreso.
5

Con relación a la función de concentración, el estadístico italiano Corrado Gini ha sugerido el cálculo de un índice que lleva su nombre y que definió como el doble del área de la región del plano encerrada entre la función de concentración y la recta de ecuación y = x.
Ejercicio 6 Para la variable ingreso con la que estamos trabajando: 1) Comprueba que la media del ingreso es ∑ x f ( x ) , donde B = {4, 6, ..., 21, 22}.
x ∈B

2) Comprueba que la moda del ingreso es el x (o los x) donde f toma su mayor valor. 3) Comprueba que la mediana del ingreso es el menor x tal que F(x) ≥ 0,5. 4) ¿Cómo puedes obtener la mediala del ingreso a partir de la función de concentración?
Ejercicio 7 1) Calcula el índice de Gini para la variable ingreso del ejemplo. Con el fin de sistematizar ese cálculo te sugerimos que completes una tabla con el siguiente cabezal:
Hogar Frecuencia relativa acumulada Ingreso acumulado Valor Parte del ingreso total

2) ¿Cuál tendría que haber sido la variable ingreso de modo que el índice de Gini fuera lo menor posible? ¿Cuánto vale el índice de Gini para tal variable?
Ejercicio 8 1) Selecciona los veinticinco hogares del ejemplo que tienen menor ingreso y para ellos calcula la media, la moda, la mediana, la mediala y el índice de Gini de la nueva variable ingreso. Representa gráficamente las funciones de cuantía, de distribución y de concentración. 2) Igual que en la parte anterior para los veinticinco hogares de mayor ingreso. 3) ¿Hay algo que te haya sorprendido en los resultados anteriores?

6

B – Variables estadísticas cuantitativas definidas en conjuntos finitos

Y ya en el final de esta sección, generalizaremos los conceptos que hemos desarrollado en el apartado anterior. Nuestro punto de partida está integrado por un conjunto finito A = {a1 , a 2 , ... , a n } y una función X : A → R a la que llamaremos variable estadística cuantitativa. Con ello estamos en condiciones de establecer las notaciones y definiciones que detallamos a continuación. 1 - Subconjuntos de A A las imágenes de los elementos de A según la función X los representaremos así: X(a1 ) = b1 , X(a 2 ) = b 2 , ... , X(an ) = bn . Al recorrido de la función X, o sea al conjunto de los valores que toma esa función, lo simbolizaremos mediante B = {x1 , x 2 , ... , x t }, donde x1 < x 2 < ... < x t . Es claro que B tiene a lo sumo tantos elementos como A, pero puede ocurrir que tenga menos (eso pasó en nuestro ejemplo debido a que la variable que allí consideramos no era inyectiva). Para cada i entre 1 y t, definimos el conjunto A i como aquél formado por los elementos de A cuyo valor según X es x i , o sea A i = {a / a ∈ A , X(a) = x i } . Con el fin de recordar este concepto usaremos la notación A i = ( X = x i ) . Para cada i entre 1 y t llamaremos frecuencia relativa del conjunto ( X = x i ) al # (X = xi ) número fr( X = x i ) = fi = (recordemos que n es el cardinal de A, o sea n n = #(A)). 2 - Función de cuantía, media, moda, varianza y desviación estándar Definimos la función de cuantía de X asÍ: f X : B → R tal que f X ( x i ) = fi .

La media de X es el número M( X) =

j =1

∑ bj
n

n

= ∑ x i fi =
i =1

t

x ∈B

∑ x f X (x) .

Una moda de X es un valor de X en el que f X toma su valor mayor (puede haber una o varias modas). La varianza de X es el número V( X) = M(( X − M( X))2 ) , o sea la media de los cuadrados de las diferencias entre los valores de la variable X y la media de esa variable. La desviación estándar de X es el número σ( X) = V( X) . Entre las propiedades de la media y la varianza se destacan las que enunciamos en el próximo teorema.
7

Teorema 1 - Propiedades de la media y de la varianza Sean: ♣ X e Y variables estadísticas cuantitativas definidas en A = {a1 , a 2 , ... , a n } . ♣ k un número. ♣ c un número positivo. Entonces: M1 M( X + k ) = M( X) + k M2 M(k X) = k M( X) M3 M( X + Y ) = M( X) + M( Y ) M4 M( ( X − k )2 ) = M( X 2 ) − (M( X))2 + (M( X) − k ) 2

V1 V2 V3 V4 V5 V6

V( X) ≥ 0 y V( X) = 0 si y sólo si X es constante V( X + k ) = V( X) V(k X) = k 2 V( X) V( X + Y ) = V( X) + V( Y ) + 2 ( M( XY) − M( X) M( Y ) ) V( X) = M( X 2 ) − (M( X))2 V( X) fr( | X − M( X) | ≥ c ) ≤ (desigualdad de Tchebycheff) c2

Ejercicio 9 1) Calcula la varianza y la desviación estándar de la variable ingreso del ejemplo. 2) Igual al punto anterior para las dos variables con las que trabajaste en el ejercicio 8 Te sugerimos que completes una tabla con el cabezal que aparece a continuación (ten en cuenta la propiedad V5) y que verifiques tus resultados con una calculadora con funciones estadísticas.
xi fi x i fi

x i 2 fi

Ejercicio 10 Sea X la variable ingreso del ejemplo. 1) Usa la tabla 2 (página 2) para calcular fr(| X − M( X) | ≥ c ) para cada uno de los siguientes valores de c: c = 5, c = 6 y c = 7. 2) ¿Qué te permite afirmar la desigualdad de Tchebycheff sobre cada una de las tres frecuencias relativas del punto anterior? Ejercicio 11 Sea X una variable estadística cuantitativa y k un número positivo. Usa la

desigualdad de Tchebycheff para probar que fr( | X − M( X) | < k σ( X)) ≥ 1 −

1 k2

.

Ejercicio 12 Con el fin de resumir los valores de una variable estadística cuantitativa X en un solo número puedes elegir cualquiera (por ejemplo la media, la moda, la mediana, la mediala, o algún otro que sin duda tomarías entre el menor y el mayor valor de X). Supone que has elegido un tal número k y que luego, para tener una idea de la dispersión de los valores de X respecto a ese k, calculas la media de los cuadrados de las diferencias entre los valores de X y k.
8

1) Atento a la propiedad M4, ¿cuál sería el “mejor” k que puedes elegir? 2) Para ese k, ¿cuánto vale la media de los cuadrados de las diferencias entre los valores de X y k? 3 - Función de distribución y mediana Definimos la función de distribución de X asÍ: ⎧0 si x < x1 ⎪ q ⎪ FX : R → R tal que FX ( x ) = ⎨ ∑ fi si x q ≤ x < x q +1 (q = 1, 2 ,..., t − 1) ⎪ i =1 ⎪ si x ≥ x t ⎩1 Lo anterior es lo mismo que FX : R → R tal que FX ( x ) = fr( X ≤ x ) . El menor entre todos los x que verifican FX ( x ) ≥ 0,5 es la mediana de X. 4 - Función de concentración, mediala e índice de Gini Para definir la función de concentración de X exigimos que X sea una variable no negativa con al menos algún valor positivo (tal es el caso de la variable ingreso de nuestro ejemplo). Establecido lo anterior, ordenemos X(a1 ) = b1 , X(a 2 ) = b 2 , ... , X(an ) = bn en forma creciente; obtenemos de esa manera una lista de n números (c 1 , c 2 ,..., c n ) , la cual vamos acumulando así: T1 = c 1, T2 = c 1 + c 2 , ..., Tn = c 1 + c 2 + ... + c n . Ahora estamos en condiciones de definir la función de concentración de X: 1 ⎧ si 0 ≤ x < ⎪0 n ⎪ Tq q q +1 ⎪ C X : [0 ,1] → R tal que C X ( x ) = ⎨ si ≤x< (q = 1, 2 ,..., n − 1) n n ⎪ Tn ⎪1 si x = 1 ⎪ ⎩
Ejercicio 13 Sea X una variable estadística cuantitativa definida en A = {a1 , a 2 , ... , a n } tal que es no negativa y tiene al menos algún valor positivo. 1) ¿Cómo definirías la mediala de X? 2) ¿Cómo definirías el índice de Gini? 3) Verifica que el índice de Gini puede calcularse con la siguiente fórmula:

1+

2 2 n − ∑ Tq n n Tn q = 1

4) ¿Cómo debe ser la variable X para que el índice de Gini sea lo menor posible? ¿Cuánto vale el índice de Gini para tal variable?
Ejercicio 14 Se lanzan dos monedas, cada una de las cuales tiene una C (cara) de un lado y una N (número) del otro. El conjunto de los resultados posibles del experimento es A = {(C, C), (C,N), (N, C), (N,N)} . Nos interesa el número de caras que se obtienen al

9

realizar dicho experimento, por lo que consideramos la variable estadística X : A → R tal que X ((C, C)) = 2 , X ((C,N)) = 1, X ((N, C)) = 1 y X ((N,N)) = 0 . 1) Representa gráficamente la función de cuantía, la función de distribución y la función de concentración de X. 2) Calcula la media, la moda, la mediana, la mediala y el índice de Gini de X.
III – Inferencia Estadística A – Ejemplo 1: Un ejemplo del modelo binomial

Supongamos que tenemos una urna con ocho bolillas, dos de las cuales son rojas y las otras seis blancas. O sea U = { r1 , r2 , b1 , b 2 , b 3 , b 4 , b 5 , b 6 }. Estamos interesados en extraer tres bolillas de la urna, de a una y con reposición, y en contar el número de bolillas rojas que obtenemos. Es claro que ese número varía entre 0 y 3 (podemos obtener tres bolillas rojas a pesar de que sólo hay dos en la urna debido al procedimiento que usamos para extraer las bolillas). Cada resultado de nuestro experimento lo podemos representar mediante una terna ordenada cuyas componentes son elementos de U. Así por ejemplo, el resultado “salió la bolilla r2 en la primera extracción y la bolilla b 5 en la segunda y en la tercera extracción” lo representamos así: (r2 , b 5 , b 5 ) . En ese resultado, el número de bolillas rojas es uno. Ahora bien: ♣ ¿Cuántos resultados distintos hay? La respuesta es 8 3 = 512 . El conjunto de todos los resultados posibles tiene 512 elementos, lo cual no hace atractiva la tarea de escribirlos todos. A ese conjunto lo representaremos con el símbolo Ω . Estamos interesados en contar el número de bolillas rojas que obtenemos. Pensamos pues en una función definida en Ω que a cada resultado le asocia el número de bolillas rojas que allí hay. A esa función la representaremos mediante la letra X. ¿En cuántos resultados el número de bolillas rojas es cero?

La respuesta es 6 3 = 216 . El subconjunto de Ω en el que X vale 0 tiene 216 elementos. Ya sabemos que a ese subconjunto lo representamos con el símbolo (X = 0). ¿En cuántos resultados el número de bolillas rojas es uno?
3 La respuesta es C 1 . 2 . 6 2 = 216 . Entonces (X = 1) tiene 216 elementos. ¿En cuántos resultados el número de bolillas rojas es dos?

La respuesta es C 3 . 2 2 . 6 = 72 . 2 Entonces (X = 2) tiene 72 elementos. Finalmente, ¿en cuántos resultados el número de bolillas rojas es tres? La respuesta es 2 3 = 8 . Entonces (X = 3) tiene 8 elementos.

Es útil que observes que las respuestas a las cuatro últimas preguntas pueden resumirse así: el número de elementos del subconjunto de Ω en el que la variable X vale x, o sea el número de elementos de (X = x), es C x 2 x 6 3 − x ( x = 0, 1, 2, 3).
3

10

Debido a que es razonable admitir que los elementos de Ω son equiprobables, podemos calcular la probabilidad de (X = x) para cada x. En efecto:
Pr( X = x ) = C x 2 x 6 3−x
3

83

=

C x 2 x 6 3−x
3

8 x 8 3−x

3 ⎛2⎞ =Cx⎜ ⎟

x

⎝8⎠

⎛6⎞ ⎜ ⎟ ⎝8⎠

3−x

para x = 0, 1, 2, 3. 2 es la 8

Lo anterior suele escribirse así: Pr( X = x ) = C 3 p x (1 − p) 3 − x , donde p = x proporción de bolillas rojas en la urna.

En este ejemplo nos encontramos con lo que se llama el modelo probabilístico 2 binomial de parámetros n = 3 y p = . 8 Para finalizar, aprovechemos los resultados que obtuvimos para hallar la media y la varianza de la variable X. X 0 1 2 3 Total Pr( X = x ) 27/64 27/64 9/64 1/64 1 x Pr( X = x ) 0/64 27/64 18/64 3/64 3/4 x 2 Pr( X = x ) 0/64 27/64 36/64 9/64 9/8 M( X) = 3/4 M( X 2 ) = 9/8 V( X) = 9/8 – (3/4) 2 = 9/16

Ejercicio 15 1) Representa gráficamente la función de cuantía y la función de distribución de la variable X del ejemplo que acabamos de analizar. 2) ¿Cuál es la moda y cuál la mediana de esa variable? B – El modelo binomial

Diremos que una variable X tiene distribución binomial de parámetros p y n (p es un real entre 0 y 1 y n es un natural mayor que 0) cuando: ♦ El recorrido de X es el conjunto B = {0,1, 2 ,..., n}.

♦ La función de cuantía de X es f X ( x ) = C n p x (1 − p)n − x (x ∈ B). x Si pensamos en la urna del ejemplo 1, nos interesará referirnos a la variable X con distribución binomial de parámetros r, b y n ( r, b y n son naturales mayores que 0).
(x ∈ B). (r + b)n A continuación presentamos algunas características del modelo binomial. En ese caso tenemos que f X ( x ) =
C n r x bn − x x

11

Tabla 3 - X tiene distribución binomial de parámetros p y n Condición de p y n p ∈ R, 0 < p < 1 ; n ∈ N, n > 0 Recorrido de X 0, 1, ..., n Función de cuantía f ( x ) = C n p x (1 − p)n − x
X x

p (n − x ) f X (x) (1 − p) ( x + 1) x = 0, 1, ..., n -1 np Media de X n p (1 − p) Varianza de X Moda de X Caso 1: p (n + 1) no es entero E ( p (n + 1) ) Caso 2: p (n + 1) es entero p (n + 1) − 1 y p (n + 1) Intervalo de confianza para p con nivel Extremo inferior de confianza ϕ n (2 X + k 2 ) − k 4 n X (n − X) + k 2 n 2 Fórmula de recurrencia f X ( x + 1) =
2 n (n + k 2 ) Extremo superior n (2 X + k 2 ) + k 4 n X (n − X) + k 2 n 2 2 n (n + k 2 )

Estimador máximo verosímil de p

⎧ 10 si ϕ = 0,90 ⎪ ⎪ k = ⎨ 20 si ϕ = 0,95 ⎪ 10 si ϕ = 0,99 ⎪ ⎩ X n

12

Tabla 4 - X tiene distribución binomial de parámetros r, b y n Condición de r, b y n r, b y n son naturales positivos Recorrido de X 0, 1, ..., n Función de cuantía C n r x bn − x x f X (x) = (r + b)n Fórmula de recurrencia r (n − x ) f X ( x + 1) = f X (x) b ( x + 1) x = 0, 1, ..., n -1 Media de X nr r +b Varianza de X nr b

(r + b) 2 r (n + 1) no es entero r +b ⎛ r (n + 1) ⎞ E⎜ ⎟ ⎝ r +b ⎠ r (n + 1) Caso 2: es entero r +b r (n + 1) r (n + 1) −1 y r +b r +b Intervalo de confianza para r con nivel Extremo inferior de confianza ϕ n (2 X + k 2 ) − k 4 n X (n − X) + k 2n 2 (r + b) 2 n (n + k 2 ) Extremo superior Moda de X Caso 1:
(r + b) n (2 X + k 2 ) + k 4 n X (n − X) + k 2n 2 2 n (n + k 2 )

Estimador máximo verosímil de r

⎧ 10 si ϕ = 0,90 ⎪ ⎪ k = ⎨ 20 si ϕ = 0,95 ⎪ 10 si ϕ = 0,99 ⎪ ⎩ x (r + b) no es entero Caso 1: n ⎛ x (r + b) ⎞ ⎛ x (r + b) ⎞ E⎜ ⎟ +1 ⎟ y/o E ⎜ n n ⎝ ⎠ ⎠ ⎝ Hay que calcular los correspondientes valores de f X para decidir x (r + b) es entero Caso 2: n x (r + b) n

13

Ejercicio 16 Sea X una variable con distribución binomial de parámetros r = 10, b = 5 y n = 6. 1) Calcula f X (0) y usa la fórmula de recurrencia de la tabla 4 (o de la tabla 3) para calcular f X ( x ) para cada uno de los restantes x. 2) Verifica los resultados de la media, la varianza y la moda que consta en la tabla 4. Ejercicio 17 Igual que el ejercicio anterior para la variable X con distribución binomial de parámetros r = 10, b = 5 y n = 4. C – Una aplicación del modelo binomial (estimación de un parámetro)

Supongamos que tenemos una urna con cien bolillas, cada una de las cuales es roja o blanca, y que de allí hemos extraído veinte bolillas de a una y con reposición. Obtuvimos seis bolillas rojas. ¿Qué podemos afirmar sobre el número de bolillas rojas en la urna? Veamos cómo contestar a la pregunta anterior. 1) La variable X que cuenta el número de bolillas rojas extraídas tiene distribución binomial de parámetros r, b y n. No sabemos cuánto valen r y b pero sí conocemos n (n = 20) y r + b (r + b = 100). 2) Al elegir k = 10 en el ejercicio 11 (página 8) llegamos a lo siguiente: 1 fr( | X − M( X) | < 10 σ( X)) ≥ 1 − = 0,90 . 10 Por lo tanto estamos casi seguros (nuestro nivel de confianza es de 90 %) que al extraer veinte bolillas de la urna obtendremos un valor de X que verifica la desigualdad | X − M( X) | < 10 σ( X) (*). El valor de X que obtuvimos fue seis. 3) Si en la desigualdad (*) sustituimos M(X) y σ(X) por sus valores y luego despejamos r, llegamos a un intervalo cuyos extremos son los que figuran en la tabla 4, renglón titulado “Intervalo de confianza para r con nivel de confianza ϕ” (en nuestro caso es ϕ = 0,90). 4) Podemos calcular los extremos del intervalo del punto anterior ya que contamos con todo lo necesario para hacerlo: r + b = 100, n = 20, X = 6 y k = 10 . Después de dedicarle algo de tiempo a las cuentas obtuvimos los siguientes resultados. Extremo inferior del intervalo ≅ 9,38 Extremo superior del intervalo ≅ 63,95 5) Por lo tanto afirmamos que r verifica 10 ≤ r ≤ 63. No estamos seguros de ello pero sí confiamos en que así sea. Hemos llegado a lo que en Estadística se llama una estimación mediante un intervalo de confianza. 6) Un enfoque distinto al que hemos expuesto comienza considerando la probabilidad de lo que obtuvimos, o sea Pr( X = 6) = f X (6) = . 100 20 Como esa probabilidad depende de r, la idea es hallar r de modo que sea lo mayor posible. En el renglón titulado “Estimador máximo verosímil de r” de la tabla 4 se da ese destacado r (o esos destacados r). En nuestro caso, haciendo las cuentas claro está, obtenemos r = 30. Ahora estamos ante lo que en Estadística se llama la estimación máximo verosímil.
C 20 r 6 (100 − r )14 6

14

Ejercicio 18 Usa el ejercicio 11 (página 8) para justificar el renglón titulado “Intervalo de confianza para p con nivel de confianza ϕ” en la tabla 3. D – Ejemplo 2: Un ejemplo del modelo hipergeométrico

Consideremos nuevamente la urna U del ejemplo 1. Ahora extraeremos tres bolillas de la urna, de a una y sin reposición. Al igual que en la primera parte del ejemplo 1, nos interesa contar el número de bolillas rojas que obtenemos. En este caso ese número varía entre 0 y 2. Cada resultado de nuestro experimento lo podemos representar mediante una terna ordenada cuyas componentes son elementos de U distintos entre sí. Por ejemplo, el resultado “salió la bolilla r2 en la primera extracción, la bolilla b 5 en la segunda extracción y la bolilla b1 en la tercera extracción” lo representamos así: (r2 , b 5 , b1 ) . En ese resultado, el número de bolillas rojas es uno. Planteemos y contestemos algunas preguntas: ♣ ¿Cuántos resultados distintos hay? La respuesta es A 8 = 8 x 7 x 6 = 336 . 3 El conjunto Ω de todos los resultados posibles tiene 336 elementos. Estamos interesados en contar el número de bolillas rojas que obtenemos, o sea en la función X definida en Ω que a cada resultado le asocia el número de bolillas rojas que allí hay. ¿En cuántos resultados el número de bolillas rojas es cero?
6 La respuesta es A 3 = 120 . El subconjunto de Ω en el que X vale 0, o sea (X = 0), tiene 120 elementos. ¿En cuántos resultados el número de bolillas rojas es uno?

La respuesta es 3 . 2 . A 6 = 180 . 2

Entonces (X = 1) tiene 180 elementos. ¿En cuántos resultados el número de bolillas rojas es dos? La respuesta es 3 . 2 . 6 = 36 . Entonces (X = 2) tiene 36 elementos.

Es interesante que notes que las respuestas a las tres últimas preguntas pueden resumirse así: el número de elementos del subconjunto de Ω en el que la variable
6 X vale x, o sea el número de elementos de (X = x), es C 3 A 2 A 3 − x ( x = 0, 1, 2). x x Debido a que es razonable admitir que los elementos de Ω son equiprobables, podemos calcular la probabilidad de (X = x) para cada x. En efecto:

Pr( X = x ) =

6 C 3 A 2 A 3−x x x

A3

8

=

6 C 2 C 3−x x

C3

8

para x = 0, 1, 2.

En este ejemplo estamos ante el modelo probabilístico llamado hipergeométrico de parámetros r = 2, b = 6 y n = 3. Usemos los resultados que obtuvimos para hallar la media y la varianza de la variable X.

15

x 0 1 2 Total

Pr( X = x ) 10/28 15/28 3/28 1

x Pr( X = x ) 0/28 15/28 6/28 3/4

x 2 Pr( X = x ) 0/28 15/28 12/28 27/28

M( X) = 3/4 M( X 2 ) = 27/28 V( X) = 45/112

Para finalizar con el ejemplo, corresponde que destaquemos un hecho sorprendente. La fórmula Pr( X = x ) =
6 C 2 C 3−x x 8

nos muestra que el experimento

C3 de extraer de la urna tres bolillas de a una y sin reposición motiva una distribución de probabilidades que es la del experimento de extraer de la urna tres bolillas simultáneamente (en este experimento, cada resultado es un conjunto de tres elementos de U).
Ejercicio 19 1) Representa gráficamente la función de cuantía y la función de distribución de la variable X del ejemplo 2. 2) ¿Cuál es la moda y cuál la mediana de esa variable? E – El modelo hipergeométrico

Diremos que una variable X tiene distribución hipergeométrica de parámetros r, b y n (r, b y n son naturales mayores que 0 y n ≤ r + b) cuando: ♦ El recorrido de X es el conjunto B = {u, u + 1, ..., v} , donde u es el mayor entre los números 0 y n – b y v es el menor entre los números r y n. ♦ La función de cuantía de X es f X ( x ) =
b C r Cn − x x

C r +b n

(x ∈ B).

En la próxima tabla resumimos algunas características de este modelo.

16

Tabla 5 - X tiene distribución hipergeométrica de parámetros r, b y n Condición de r, b y n r, b y n son naturales positivos ; n ≤ r + b u , u + 1,..., v Recorrido de X u es el mayor entre 0 y n – b y v es el menor entre r y n b Función de cuantía C r Cn − x x f X (x) = C r +b n

Fórmula de recurrencia

Media de X Varianza de X

(r − x ) (n − x ) fX (x) ( x + 1) (b − n + x + 1) x = u, u + 1, ..., v -1 rn r +b r b n (r + b − n) f X ( x + 1) =

(r + b) 2 (r + b − 1) Moda de X (r + 1) (n + 1) no es entero Caso 1: r +b+2 ⎛ (r + 1) (n + 1) ⎞ E⎜ ⎟ ⎝ r +b+2 ⎠ (r + 1) (n + 1) es entero Caso 2: r +b+2 (r + 1) (n + 1) (r + 1) (n + 1) −1 y r +b+2 r +b+2 Intervalo de confianza para r con Extremo inferior nivel de confianza ϕ n (2 X + k 2 ρ 2 ) − k ρ 4 n X (n − X) + k 2 ρ 2 n 2 (r + b) 2 n (n + k 2 ρ 2 ) Extremo superior
(r + b) n (2 X + k 2 ρ 2 ) + k ρ 4 n X (n − X) + k 2 ρ 2 n 2 2 n (n + k 2 ρ 2 )
r +b−n r + b −1

k según la tabla 4 y ρ = Estimador máximo verosímil de r Caso 1:

x (r + b + 1) no es entero n ⎛ x (r + b + 1) ⎞ E⎜ ⎟ n ⎠ ⎝ x (r + b + 1) es entero y x < n Caso 2: n x (r + b + 1) x (r + b + 1) −1 y n n Caso 3: x = n r+b

17

Ejercicio 20 X es una variable con distribución hipergeométrica de parámetros r = 10, b = 5 y n = 6 y u es el menor valor del recorrido de X. 1) Calcula f X (u) y usa la fórmula de recurrencia de la tabla 5 para calcular f X ( x ) para cada uno de los restantes x. 2) Verifica los resultados de la media, la varianza y la moda que consta en la tabla 5. Ejercicio 21 Igual que el ejercicio anterior para la variable X con distribución hipergeométrica de parámetros r = 10, b = 5 y n = 4. Ejercicio 22 Redacta un apartado titulado “Una aplicación del modelo hipergemétrico (estimación de un parámetro)” que sea similar al C. F – La ley de los grandes números para la distribución binomial

Hay una importante propiedad, llamada la ley de los grandes números, que en el caso de la distribución binomial tiene el enunciado que presentamos a continuación.

Teorema 2 – Ley de los grandes números para la distribución binomial Sean: ♣ X una variable con distribución binomial de parámetros n y p. ♣ c y ε números positivos. Entonces existe algún número natural j tal que para cualquier n ≥ j y cualquier p se ⎞ ⎛ X cumple que Pr ⎜ ⎟ ⎜ n −p ≥ c⎟ < ε . ⎠ ⎝

Ejercicio 23 1) Demuestra el teorema anterior (te sugerimos que apliques la desigualdad de X 1 y que tengas en cuenta que p (1 − p) ≤ ∀ p). Tchebycheff a la variable n 4 2) ¿Cómo interpretarías ese teorema?

18

Respuestas a algunos ejercicios Ejercicio 7 3911 1) ≅ 0,25 15800

2) La variable ingreso tendría que ser constante; en ese 1 caso el índice de Gini vale = 0,02 . 50

Ejercicio 8

Concepto Media Moda Mediana Mediala Índice de Gini

Los veinticinco hogares de menor ingreso 8,32 10 9 10 259 ≅ 0,20 1300

Los veinticinco hogares de mayor ingreso 16,96 15 y 18 17 18 693 ≅ 0,13 5300

Ejercicio 9

Conjunto Los cincuenta hogares Los veinticinco hogares de menor ingreso Los veinticinco hogares de mayor ingreso
Ejercicio 10

Varianza 25,1504 5,5776 7,3984

Desviación estándar 5,0150 2,3617 2,7200

Frecuencia fr X − M( X) ≥ 5
fr X − M( X) ≥ 6 fr X − M( X) ≥ 7

Valor 0,40 0,24 0,18

Acotación de Tchebycheff 1,01 0,70 0,51

Ejercicio 14 La media, la moda, la mediana y la mediala valen 1. El índice de Gini vale 5/8. Ejercicio 15 Hay dos modas: 0 y 1. La mediana es 1.

19

Ejercicio 16 x 0

1 2 3 4 5 6

f X (x) 1 729 12 729 60 729 160 729 240 729 192 729 64 729

Ejercicio 17 x 0

1 2 3 4

f X (x) 1 81 8 81 24 81 32 81 16 81

Ejercicio 19 La moda y la mediana valen 1. Ejercicio 20 x 1 Ejercicio 21 x 0

2 3 4 5 6

f X (x) 2 1001 45 1001 240 1001 420 1001 252 1001 42 1001

1 2 3 4

f X (x) 1 273 20 273 90 273 120 273 42 273

20

Apéndice 1 – Algunas demostraciones

A continuación presentamos la demostración de cada una de las propiedades que constan en el teorema 1 (página 8) y de los resultados que aparecen en la Tabla 3 (página 12).
1 - Teorema 1

Con el fin de demostrar las tres primeras partes del teorema 1, tenemos en cuenta que X e Y son variables estadísticas cuantitativas definidas en A = {a1 , a 2 , ... , a n } y que k es un número. Escribimos, además, X(a j ) = b j y Y(a j ) = c j para j = 1, 2, ..., n.
M1 – M( X + k ) = M( X) + k Notemos, en primer lugar, que ( X + k ) (a j ) = b j + k .

Por lo tanto:
j =1

∑ (b j + k ) ∑ b j + ∑ k ∑ b j + n k ∑ b j
n =
j =1 j =1

n

n

n

n

n

M( X + k ) =

n

=

j =1

n

=

j =1

n

+ k = M( X) + k .

M2 – M(k X) = k M( X) Ahora observemos que (k X) (a j ) = k b j .

En consecuencia:
j =1

∑ kbj
n =

n

k ∑b j
j =1

n

M(k X) =

n

=k

j =1

∑b j
n = k M( X) .

n

M3 – M( X + Y ) = M( X) + M( Y ) Comencemos recordando que ( X + Y ) (a j ) = b j + c j . Por lo tanto:
j =1

∑ (b j + c j )
n =

n

M( X + Y ) =

j =1

∑b j + ∑ c j
j =1

n

n

n

=

j =1

∑b j
n +

n

j =1

∑c j
n = M( X) + M( Y ) .

n

M4 – M( ( X − k )2 ) = M( X 2 ) − (M( X))2 + (M( X) − k ) 2 Para demostrar esta propiedad comenzamos usando las tres anteriores, luego de

desarrollar ( X − k )2 . M( ( X − k )2 ) = M( X 2 − 2 k X + k 2 ) = M( X 2 + ( −2 k X + k 2 )) . M( ( X − k )2 ) = M( X 2 ) + M( −2 k X + k 2 ) . M( ( X − k )2 ) = M( X 2 ) + M( −2 k X) + k 2 . M( ( X − k ) 2 ) = M( X 2 ) − 2 k M( X) + k 2 . Aquí usamos M3 Aquí usamos M1 Aquí usamos M2

Ahora restamos y sumamos (M( X))2 en la expresión que aparece a la derecha en la igualdad anterior. Con ello llegamos a lo siguiente: M( ( X − k )2 ) = M( X 2 ) − (M( X))2 + (M( X))2 − 2 k M( X) + k 2 .
21

Concluimos la demostración observando que (M( X))2 − 2 k M( X) + k 2 = (M( X) − k ) 2 .
V1 – V( X) ≥ 0 y V( X) = 0 si y sólo si X es constante Recordemos que V(X) es la media de los cuadrados de las diferencias entre los

valores de la variable X y la media de esa variable, es decir V( X) = M(( X − M( X))2 ) . En consecuencia, si X(a j ) = b j para j = 1, 2, ..., n, tenemos que:

≥ 0 pues el numerador es una suma de números no n negativos y el denominador es un número positivo. Además, V( X) = 0 si y sólo si cada uno de los n sumandos del numerador es cero, o sea si b j = M( X) para j = 1, 2, ..., n. Esto significa que X es constante.
V2 – V( X + k ) = V( X) En la demostración de esta propiedad sólo necesitamos recordar la definición de varianza y la propiedad M1. En efecto:

V( X) =

j =1

∑ (b j − M( X))2

n

V( X + k ) = M(( X + k − M( X + k ))2 ) = M(( X + k − (M( X) + k ))2 ) = M(( X − M( X))2 ) = V( X) .
V3 – V(k X) = k 2 V( X) En este caso usaremos la definición de varianza y la propiedad M2.

Df

M1

Df

V(k X) = M((k X − M(k X))2 ) = M((k X − k M( X))2 ) = M(k 2 ( X − M( X))2 )

Df

M2

M2 y Df

=

k 2 V( X) .

V4 – V( X + Y ) = V( X) + V( Y ) + 2 ( M( XY) − M( X) M( Y ) ) Y ahora, además de la definición de varianza, tendremos en cuenta las propiedades M1, M2 Y M3 y haremos varias cuentas.

V( X + Y ) = M(( X + Y − M( X + Y ))2 ) = M(( X + Y − (M( X) + M( Y )))2 ) .
V( X + Y ) = M(( X − M( X) + ( Y − M( Y )) 2 ) . V( X + Y ) = M(( X − M( X)) 2 + ( Y − M( Y )) 2 + 2 ( X − M( X)) ( Y − M( Y )) .
V( X + Y ) = M(( X − M( X)) 2 ) + M(( Y − M( Y )) 2 ) + M(2 ( X − M( X)) ( Y − M( Y )) . V( X + Y ) = V( X) + V( Y ) + 2 M( ( X − M( X)) ( Y − M( Y )) . V( X + Y ) = V( X) + V( Y ) + 2 M ( X Y − X M( Y ) − YM( X) + M( X) M( Y )) .
Df y M2 M3

Df

M3

V( X + Y ) = V( X) + V( Y ) + 2 (M ( X Y ) − M( X) M( Y ) − M( Y ) M( X) + M( X) M( Y )) . V( X + Y ) = V( X) + V( Y ) + 2 (M ( X Y ) − M( X) M( Y )) .

M1 , M2 y M3

V5 – V( X) = M( X 2 ) − (M( X))2

Ya sabemos que M( ( X − k )2 ) = M( X 2 ) − (M( X))2 + (M( X) − k ) 2 (propiedad M4). Si en la igualdad anterior sustituimos k por M(X) nos queda: V( X) = M( ( X − M( X))2 ) = M( X 2 ) − (M( X))2 .

22

(desigualdad de Tchebycheff) c2 Comenzamos partiendo en dos el conjunto A en el que está definida la variable X: A 1 = (| X − M( X) | ≥ c ) y A 2 = (| X − M( X) | < c ) . V( X) La desigualdad de Tchebycheff afirma que fr( A 1 ) ≤ . Para convencernos de c2 ello, razonamos de la siguiente manera:
V( X) = M(( X − M( X))2 ) = A.
V( X) =
a∈ A1

V6 – fr( | X − M( X) | ≥ c ) ≤

V( X)

a∈ A

∑ ( X(a) − M( X))2
n , donde n es el número de elementos de

∑ ( X(a) − M( X))2 + ∑ ( X(a) − M( X))2
a∈ A 2

n

a∈ A1

∑ ( X(a) − M( X))2
n

.

Si a ∈ A 1 se cumple que | X(a) − M( X) | ≥ c , es decir ( X(a) − M( X))2 ≥ c 2 . Por lo tanto resulta que:
V( X) ≥
a∈ A1

∑ ( X(a) − M( X))2
n ≥

a∈ A1

∑ c2
n =

c 2.

a∈ A1

∑1
= c 2 fr( A 1 ) .

n

En resumen, V( X) ≥ c 2 fr ( A 1 ) . Esto último es lo mismo que fr( A 1 ) ≤
2 - Tabla 3

V( X) c2

.

En la tabla 3 presentamos algunas características de la distribución binomial. Aquí nos ocuparemos en justificar los resultados que allí aparecen. En todo lo que sigue X es una variable que tiene distribución binomial de parámetros p y n.
Fórmula de recurrencia Hay una fórmula que permite calcular el valor de la función de cuantía de X en cada número del recorrido de X, salvo el primero, a partir del valor de esa función en el número anterior de ese recorrido. Esa fórmula es la siguiente: p (n − x ) f X ( x ) para x = 0, 1, ..., n –1. f X ( x + 1) = (1 − p) ( x + 1) f ( x + 1) p (n − x ) para x = 0, 1, ..., n –1 (lo = A continuación verificaremos que X fX (x) (1 − p) ( x + 1) cual es lo mismo que la fórmula de recurrencia que nos interesa).

Ya que f X ( x ) = C n p x (1 − p)n − x , tenemos que f X ( x + 1) = C n +1 p x +1 (1 − p)n − x −1 . x x Por lo tanto:
n x +1 (1 − p)n − x − 1 C n +1 p f X ( x + 1) C x +1 p x = = f X (x) C n p x (1 − p)n − x C n (1 − p) x x

(*).

Simplifiquemos ahora el cociente

C n +1 x Cn x

.

23

C n +1 x Cn x

=

n! n! (n − x )! x ! n−x : = = (n − x − 1)! ( x + 1)! (n − x )! x ! (n − x − 1)! ( x + 1)! x + 1

(**) .

f ( x + 1) p (n − x ) . De las igualdades (*) y (**) deducimos que X = fX (x) (1 − p) ( x + 1)

Moda de X La moda de X es el valor de X para el que se obtiene el mayor valor de la función de cuantía de X (puede ocurrir que haya más de un valor de X con esa propiedad; cuando eso ocurre tenemos que la moda de X no es única). Nos interesa, pues, hallar el mayor de los valores de la función de cuantía de X, o sea el máximo de f X . Con ese fin resolveremos la inecuación f X ( x + 1) > f X ( x ) , o f ( x + 1) > 1 (pues los valores de f X son positivos). lo que es lo mismo: X fX (x) f ( x + 1) p (n − x ) p (n − x ) , por lo cual planteamos >1. = Ya sabemos que X fX (x) (1 − p) ( x + 1) (1 − p) ( x + 1) p (n − x ) Tuvimos en cuenta que >1 ⇔ p (n − x ) > (1 − p) ( x + 1) (1 − p) ( x + 1) (1 − p) ( x + 1) > 0 .

p (n − x ) > (1 − p) ( x + 1) ⇔ p n − p x > x + 1 − p x − p ⇔ p (n + 1) > x + 1 Lo anterior nos permite afirmar lo que sigue: 1) Si x es tal que x + 1 < p (n + 1) resulta que f X ( x + 1) > f X ( x ) . O sea que para cada uno de esos x el valor de f X es menor que el de f X en el siguiente x. Por lo tanto, ninguno de esos x es la moda de X. 2) Si x es tal que x + 1 = p (n + 1) resulta que f X ( x + 1) = f X ( x ) . O sea que para ese x el valor de f X es igual al de f X en el siguiente x. Estamos suponiendo que hay un tal x, para lo cual necesitamos que p (n + 1) sea un número natural (si eso no es así, concluimos que los valores de f X son distintos entre sí). 3) Si x es tal que x + 1 > p (n + 1) resulta que f X ( x + 1) < f X ( x ) . O sea que para cada uno de esos x el valor de f X es mayor que el de f X en el siguiente x. Por lo tanto, ninguno de los respectivos x + 1 es la moda de X. La conclusión de lo que antecede es justamente lo que se establece en la Tabla 3 sobre la moda de X.
Media de X Veremos cuatro formas de llegar a la media de X. Primera demostración - Aplicación de habilidades con números combinatorios Atentos a la definición de media de una variable (página 7), debemos calcular la

siguiente suma:

x =0

n

x f X ( x) =

x =0

∑ x C n p x (1 − p)n − x . x
x =0

n

Notemos, en primer lugar, que

n

x C n p x (1 − p)n − x = x

x =1

∑ x C n p x (1 − p)n − x x

n

pues

el primer sumando de la primera suma es 0.

24

Al poner x = z + 1 en
n

x =1

∑ x C n p x (1 − p)n − x = ∑ (z + 1) C n +1 p z +1 (1 − p)n − z −1 . x z
z=0

x =1 n −1

∑ x C n p x (1 − p)n − x x

n

nos queda lo siguiente:

Ahora observemos que: ( z + 1) C n +1 = ( z + 1) z Por lo tanto:
n −1 z=0 n −1
z=0

n! n (n − 1)! = = n C n −1 . z (n − z − 1)! ( z + 1)! (n − z − 1)! z !
n −1

( z + 1) C n +1 p z +1 (1 − p)n − z −1 = z

∑ (z + 1) C n +1 p z +1 (1 − p)n − z −1 = n p ∑ C n −1 p z (1 − p)n − z −1 = n p . z z
z=0 n −1 z=0

z=0 n −1

∑ n p C n −1 p z (1 − p)n − z −1 z

La última igualdad se debe a que

∑ C n −1 p z (1 − p)n − z −1 = 1 ya que esa suma es z

la de todos los valores de la función de cuantía de una distribución binomial cuyos parámetros son n – 1 y p. En resumen, M( x ) = n p . Para finalizar importa que señalemos que en el razonamiento anterior supusimos que n > 1 (si n fuera 1, es casi inmediato comprobar que M(X) = p).
Segunda demostración - Aplicación de la fórmula de recurrencia

Recordemos, para comenzar, que M( X) =

x =0

∑ x f X (x) .

n

La fórmula de recurrencia que ya conocemos nos lleva a escribir lo siguiente: (1 − p) ( x + 1) f X ( x + 1) = p (n − x ) f X ( x ) para x = 0, 1, 2, ..., n –1. Por lo tanto:
n −1 x =0

∑ (1 − p) ( x + 1) f X ( x + 1) =
n −1 x =0

n −1

(1 − p)

∑ ( x + 1) f X ( x + 1) = p ∑ (n f X( x ) − x f X ( x )) .
x =0

x =0 n −1

∑ p (n − x) f X ( x) .

n −1 ⎛ n −1 ⎞ ( x + 1) f X ( x + 1) = p ⎜ n ∑ f X( x ) − ∑ x f X ( x ) ⎟ . ∑ ⎜ ⎟ x =0 x=0 ⎝ x =0 ⎠ En la igualdad anterior aparecen tres sumas: la que está a la izquierda es “casi” M(X) (le falta el primer sumando), la primera de las dos que están la derecha es “casi” la suma de todos los valores de la función de cuantía de X (le falta el último sumando) y la segunda es “casi” la media de X (también le falta el último sumando). Debido a ello resulta que: (1 − p) (M( X) − 0 f X (0)) = p ( n (1 − f X (n)) − (M( X) − n f x (n))) . (1 − p) M( X) = p ( n − M( X)) ; M( X) = n p .

(1 − p)

n −1

Tercera demostración - Aplicación de variables 0 - 1 Supongamos que tenemos una urna U con r bolillas rojas y b blancas y que de ella extraemos n bolillas, de a una y con reposición. En el conjunto de todos los
25

resultados posibles de nuestro experimento, al que simbolizamos con Ω , definimos una variable X que nos indica el número de bolillas rojas extraídas. Ya sabemos r que esa variable tiene distribución binomial de parámetros p y n, donde p = r +b (es conveniente que vuelvas a leer el ejemplo 1 en las páginas 10 y 11). En Ω definimos otras n variables así: ⎧ 1 si en la extracción número i sale roja X i (ω) = ⎨ (i = 1, 2, ..., n). ⎩ 0 en caso contrario Es claro que X = X1 + X 2 + ... + Xn . Debido a lo anterior tenemos que M( X) = M( X1 ) + M( X 2 ) + ... + M( X n ) . Pasemos, pues, a calcular la media de cada variable X i . M( X i ) = 1.Pr( Xi = 1) + 0 .Pr( X i = 0) = p + 0 = p . En consecuencia, M( X) = M( X1 ) + M( X 2 ) + ... + M( X n ) = p + p + ... + p = n p .
Cuarta demostración - Aplicación de la derivación

Consideremos la función g definida así: g( t ) = Entonces g ' ( t ) = Ahora bien, g( t ) =
x=0

x=0

∑ e x t f X ( x)

n

para cada t ∈ R.

x=0

∑ x e x t f X ( x ) y g ' (0 ) = ∑
n

n

x =0

∑ x f X ( x) = M( X) . ∑ C n (e t p) x (1 − p)n − x . x
n

n

∑ e x t fX (x) =

n

x =0

e x t C n p x (1 − p)n − x = x

x=0

La fórmula del binomio de Newton implica que g( t ) = (e t p + 1 − p)n . Por lo tanto, g ' ( t ) = n (e t p + 1 − p)n −1 e t p y g ' (0) = n p .
Varianza de X La justificación de la fórmula de la varianza de X puede hacerse por cualquiera de las cuatro formas que hemos desarrollado en el caso de la media de X. Confiamos en que intentarás trabajar, al menos, con una de esas formas y al respecto pueden serte útiles los siguientes comentarios:

1) Salvo en la tercera forma, recuerda que V( X) = M( X 2 ) − (M( X))2 . Puesto que M(X) ya la conoces, debes calcular M( X 2 ) . 2) En la tercera forma, es conveniente que uses la propiedad V4 (generalizada a la suma de n variables), que observes que Xi 2 = Xi y que pruebes que M( X i X j ) = p 2 si i ≠ j.
Intervalo de confianza para p

En el ejercicio 11 (página 8) te convenciste de que fr( | X − M( X) | < k σ( X)) ≥ 1 − donde X una variable estadística cuantitativa y k un número positivo. ⎧0,90 si k = 10 ⎪ ⎪ En particular, fr( | X − M( X) | < k σ( X)) ≥ ⎨0,95 si k = 20 . ⎪0,99 si k = 10 ⎪ ⎩

1 k2

,

26

En el caso que X tenga distribución binomial de parámetros p y n tenemos que: ( | X − M( X) | < k σ( X)) = ( | X − np | < k n p (1 − p) ) . Los cálculos que siguen justifican los extremos del intervalo que constan en la Tabla 3. En efecto:
( | X − np | < k n p (1 − p) ) ( | X − np | < k n p (1 − p) )

⇔ ⇔

(( X − np) 2 < k 2 n p (1 − p)) ( X 2 − 2 X n p + n2 p 2 < k 2 n p − k 2 n p 2 )

( | X − np | < k n p (1 − p) ) ⇔ (n (n + k 2 ) p 2 − n (2 X + k 2 ) p + X 2 ) < 0 La resolución de la última inecuación nos lleva al resultado que estábamos buscando.

Estimador máximo verosímil de p La función de cuantía de la variable con distribución normal de parámetros p y n

es f X ( x ) = C n p x (1 − p)n − x . x El problema que ahora nos planteamos es el siguiente: supuestos conocidos n y x, ¿cuál es el valor de p que maximiza f X ( x ) ? Con el fin de contestar a la pregunta anterior, consideramos la función h definida así: h(p) = C n p x (1 − p)n − x para cada p entre 0 y 1. x h ' (p) = C n ( x p x −1 (1 − p)n − x − p x (n − x ) (1 − p)n − x −1 ) . x h ' (p) = C n p x −1 (1 − p)n − x −1 ( x (1 − p) − p (n − x )) . x h ' (p) = C n p x −1 (1 − p)n − x −1 ( x − p n) . x El signo de esa derivada es el que presentamos en el esquema que sigue (tuvimos en cuenta que p está entre 0 y 1 y supusimos que x no es 0 ni n). + + + + + + + + 0 - - - - - - - - - ⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯|⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯ Signo de h ' (p) 0 x/n 1 Lo anterior nos conduce a afirmar que el valor de p que maximiza f X ( x ) es x . n

Para finalizar este apéndice es útil que hagamos unos comentarios, previendo tu interés en justificar los resultados que aparecen en la Tabla 5 (página 17): 1) La demostración de la fórmula de recurrencia sólo requiere hacer cuentas. 2) La justificación del resultado sobre la moda puede hacerse en forma similar a la que desarrollamos en el caso de la distribución binomial. 3) La forma más “elegante” y “rápida” de demostrar los resultados sobre la media y la varianza es similar a la tercera que vimos en el caso de la distribución binomial (la cuarta resulta inoperante). Si optas por esa tercera forma, lo cual te r r (r − 1) y que M( X i X j ) = si sugerimos, deberás probar que M( X i ) = r +b (r + b) (r + b − 1) i ≠ j. 4) Para el intervalo de confianza para r hay que tener un poco más de paciencia que en el caso de la distribución binomial, pero sólo se trata de hacer cuentas. 5) Finalmente, para el estimador máximo verosímil de r no es posible usar criterios de maximización de funciones de una variable real; hay que razonar en forma similar a la que justifica el resultado sobre la moda.
27

Apéndice 2 – Un ejemplo de prueba de hipótesis Enunciado del problema del horticultor y el rabdomante

Pablo es un horticultor que desea regar sus cultivos y con ese fin debe encontrar un lugar en sus tierras donde hacer un pozo. Pedro, un presunto experto de la zona en esa tarea, le ofrece sus servicios (remunerados, claro está). Pablo duda de las habilidades que Pedro manifiesta tener y decide someterlo a prueba. Pablo ha ideado tres posibles experimentos para probar a Pedro y se da cuenta que puede cometer dos errores al tomar una decisión: decidir que Pedro es un experto cuando en realidad no lo es (en este caso lo contrata) o decidir que es un farsante cuando realmente no lo es (en este caso no lo contrata). No tiene dudas sobre que de esos dos errores posibles, el peor es el primero. Decisión de Pablo Lo contrata No lo contrata Error (el peor) Acierto Acierto Error

Hipótesis H0 H1

Pedro Farsante Experto

Con el fin de optar por uno de los tres experimentos que se le han ocurrido, Pablo nos pide que opinemos sobre el estudio que hizo de los mismos.
Resolución parcial del problema del horticultor y el rabdomante Primer experimento

Definición del experimento Pablo le presenta a Pedro diez barriles, de los cuales cinco tienen agua y los otros no. Le informa de ello a Pedro y le pide que los clasifique. Análisis del experimento Pablo supone que Pedro clasifica los barriles al azar, observa que el posible número de aciertos de Pedro varía entre 0 y 5 y calcula la probabilidad de cada uno de esos aciertos. Aciertos 0 1 2 3 4 5 Total Probabilidad 1/252 25/252 100/252 100/252 25/252 1/252 1 Comentario Si X es la variable que indica el número de aciertos de Pedro y P(X=x) es la probabilidad de que Pedro acierte x veces (x = 0, 1, 2, 3, 4, 5) se cumple que P( X = x ) = C 5 C 5−x x 5 C 10 5

(C ) =

5 2 x C 10 5

Criterio de decisión Atento a lo anterior, Pablo decide contratar a Pedro si éste clasifica correctamente al menos cuatro barriles. Con ello, la probabilidad de que se encuentre ante el peor 26 error es ≅ 0,103 . 252

28

Segundo experimento

Definición del experimento Pablo agrupa los diez barriles de a pares, uno con agua y otro sin agua. Le informa de ello a Pedro y le pide que indique cuál de los dos barriles de cada pareja tiene agua.
Tercer experimento

Definición del experimento Pablo le presenta a Pedro los diez barriles y le dice que cinco tienen agua y los otros no. Le pide que vaya clasificando cada barril y le informa que la prueba termina ante el primer acierto. Y ya en el final, te planteamos algunas preguntas con la esperanza que las contestes: 1) ¿Cuál sería un criterio de decisión razonable para el segundo experimento? ¿Y cuál para el tercero? 2) ¿Cuál de los tres experimentos le recomendarías a Pablo?

jmoretti@ccee.edu.uy jmoretti@hotmail.com

29

Sign up to vote on this title
UsefulNot useful