Professional Documents
Culture Documents
Teorema
del lmite central
P03/75057/01008
P03/75057/01008
FUOC P03/75057/01008
FUOC P03/75057/01008
ndice
ndice
Sesin 1
Sesin 1
La t de Student .................................................................................. 8
La t de Student .................................................................................. 8
2. Resumen ................................................................................................... 10
2. Resumen ................................................................................................... 10
Ejercicios ....................................................................................................... 11
Ejercicios ....................................................................................................... 11
Sesin 2
Sesin 2
3. Resumen ................................................................................................... 19
3. Resumen ................................................................................................... 19
Ejercicios ....................................................................................................... 20
Ejercicios ....................................................................................................... 20
FUOC P03/75057/01008
FUOC P03/75057/01008
al azar, los hemos medido y hemos calculado la media de las alturas de los es-
al azar, los hemos medido y hemos calculado la media de las alturas de los es-
muestral.
muestral.
Veremos que si sabemos que la variable que se estudia es normal, entonces la me-
Veremos que si sabemos que la variable que se estudia es normal, entonces la me-
dia muestral tambin es normal, pero con desviacin tpica menor. Y tambin
dia muestral tambin es normal, pero con desviacin tpica menor. Y tambin
Supongamos que tenemos una muestra x1, ..., xn de una variable aleatoria nor-
Supongamos que tenemos una muestra x1, ..., xn de una variable aleatoria nor-
x = 1
--n
x = 1
--n
xi .
i = 1
Observad que...
... para una coleccin de muestras, tendremos la correspondiente coleccin de medias
muestrales x 1 , ..., x k .
xi .
i = 1
Desviacin poblacional
y desviacin muestral
La desviacin poblacional es la
desviacin real de la variable,
que en este caso suponemos
conocida. Cuando calculamos
la desviacin a partir de muestras, hablamos de desviacin
muestral.
con valores menores, y que cuanto mayor sea la muestra, ms cercano ser el
con valores menores, y que cuanto mayor sea la muestra, ms cercano ser el
Observad que...
... para una coleccin de muestras, tendremos la correspondiente coleccin de medias
muestrales x 1 , ..., x k .
Desviacin poblacional
y desviacin muestral
La desviacin poblacional es la
desviacin real de la variable,
que en este caso suponemos
conocida. Cuando calculamos
la desviacin a partir de muestras, hablamos de desviacin
muestral.
FUOC P03/75057/01008
FUOC P03/75057/01008
Pensemos ahora que tenemos una muestra de cien estudiantes de la UOC. Ha-
Pensemos ahora que tenemos una muestra de cien estudiantes de la UOC. Ha-
cemos diez grupos de diez estudiantes y hacemos la media aritmtica para cada
cemos diez grupos de diez estudiantes y hacemos la media aritmtica para cada
Parece razonable pensar que la media de estos nuevos datos sera tambin 172.
Parece razonable pensar que la media de estos nuevos datos sera tambin 172.
Por otra parte, tambin parece razonable pensar que estos nuevos valores sean
Por otra parte, tambin parece razonable pensar que estos nuevos valores sean
ms cercanos a 172 que los datos originales, ya que en cada una de las medias
ms cercanos a 172 que los datos originales, ya que en cada una de las medias
Demostracin
La demostracin de este
resultado es consecuencia de
una importante propiedad de
las variables aleatorias normales. La propiedad es la siguiente: si X e Y son variables
aleatorias independientes con
leyes
2
X
------------
------n
X
------------
------n
respectivamente, entonces
X + Y tiene una ley:
2
N ( 1 + 2 , 1 + 2 )
En nuestro ejemplo la variable que recoge todas las posibles medias de cada
grupo de diez estudiantes sigue una distribucin normal de media 172 cm y des-
grupo de diez estudiantes sigue una distribucin normal de media 172 cm y des-
mayor es la muestra, menor resulta la desviacin tpica y, por tanto, hay me-
mayor es la muestra, menor resulta la desviacin tpica y, por tanto, hay me-
nos dispersin.
nos dispersin.
------n
Observad que...
... el error estndar es cada
vez menor cuanto mayor es el
tamao de la muestra.
------n
Consideremos las alturas de los estudiantes de la UOC. Supongamos que sabemos que se trata de una variable aleatoria normal de media 172 cm y desviacin tpica 11 cm y que hemos
tomado una muestra de trescientos estudiantes al azar. Entonces podemos contestar preguntas del tipo siguiente:
Consideremos las alturas de los estudiantes de la UOC. Supongamos que sabemos que se trata de una variable aleatoria normal de media 172 cm y desviacin tpica 11 cm y que hemos
tomado una muestra de trescientos estudiantes al azar. Entonces podemos contestar preguntas del tipo siguiente:
11 - = 0,635
------------300
La demostracin de este
resultado es consecuencia de
una importante propiedad de
las variables aleatorias normales. La propiedad es la siguiente: si X e Y son variables
aleatorias independientes con
leyes
2
N ( 1 , 1 ) y N ( 2 , 2 )
respectivamente, entonces
X + Y tiene una ley:
2
N ( 1 + 2 , 1 + 2 )
En nuestro ejemplo la variable que recoge todas las posibles medias de cada
Demostracin
N ( 1 , 1 ) y N ( 2 , 2 )
11 - = 0,635
------------300
Observad que...
... el error estndar es cada
vez menor cuanto mayor es el
tamao de la muestra.
FUOC P03/75057/01008
FUOC P03/75057/01008
X 172
2
P ( X < 170 ) = P -------------------- < --------------- = P ( Z < 3,149 ) = 0,0008
0.635 0,635
X 172
2
P ( X < 170 ) = P -------------------- < --------------- = P ( Z < 3,149 ) = 0,0008
0.635 0,635
b) Cul es la probabilidad de que la distancia entre la media muestral (de esta muestra
de trescientos estudiantes) y la media poblacional, 172 cm, sea menor que 1 cm?
b) Cul es la probabilidad de que la distancia entre la media muestral (de esta muestra
de trescientos estudiantes) y la media poblacional, 172 cm, sea menor que 1 cm?
Por un razonamiento parecido (si la distancia entre dos nmeros a y b ha de ser menor
que k, se debe cumplir: |a b| < k):
Por un razonamiento parecido (si la distancia entre dos nmeros a y b ha de ser menor
que k, se debe cumplir: |a b| < k):
1
X
1
P ( X < 1 ) = P ( 1 < X < 1 ) = P --------------- < --------------- < --------------- = P ( 1,57 < Z < 1,57 )
0,635 0,635 0,635
1
X
1
P ( X < 1 ) = P ( 1 < X < 1 ) = P --------------- < --------------- < --------------- = P ( 1,57 < Z < 1,57 )
0,635 0,635 0,635
donde Z es una variable aleatoria normal (0,1). Si buscamos en las tablas de la ley normal
(0,1), vemos que esta probabilidad es igual a 0,8836.
donde Z es una variable aleatoria normal (0,1). Si buscamos en las tablas de la ley normal
(0,1), vemos que esta probabilidad es igual a 0,8836.
Tenemos as una probabilidad del 0,8836 de obtener un valor para la media muestral que
difiera en menos de 1 cm del valor real de la media cuando tomamos una muestra de trescientos individuos.
Tenemos as una probabilidad del 0,8836 de obtener un valor para la media muestral que
difiera en menos de 1 cm del valor real de la media cuando tomamos una muestra de trescientos individuos.
Observad que en ninguna parte hemos utilizado el hecho de que la media fuese exactamente 172 cm. Es decir, si sabemos que la variable altura sigue una normal con una
desviacin tpica de 11 cm y tomamos una muestra de trescientos estudiantes, sabemos
que la diferencia entre su media y la media poblacional (que quiz no conozcamos) ser
menor de 1 cm con una probabilidad del 0,8836.
Observad que en ninguna parte hemos utilizado el hecho de que la media fuese exactamente 172 cm. Es decir, si sabemos que la variable altura sigue una normal con una
desviacin tpica de 11 cm y tomamos una muestra de trescientos estudiantes, sabemos
que la diferencia entre su media y la media poblacional (que quiz no conozcamos) ser
menor de 1 cm con una probabilidad del 0,8836.
X
------------11-----n
X
------------11-----n
se distribuye como una normal (0,1). Por otra parte, si observamos las tablas, nos damos
cuenta de que si Z es una normal (0,1):
se distribuye como una normal (0,1). Por otra parte, si observamos las tablas, nos damos
cuenta de que si Z es una normal (0,1):
Por tanto:
Por tanto:
X
11
11
0,95 = P 1,96 < ------------- < 1,96 = P 1,96 ------- < X < 1,96 -------
11
n
n
------
X
11
11
0,95 = P 1,96 < ------------- < 1,96 = P 1,96 ------- < X < 1,96 -------
11
n
n
------
n
Y si imponemos que la diferencia X debe ser menor que 1 cm, obtenemos:
11
1,96 ------- < 1
n
2
Por tanto, n > 11 1,96 , y as: n > ( 11 1,96 ) = 464,8 . Entonces, si tomamos 465 individuos para llevar a cabo el estudio, sabemos que la diferencia entre la media muestral
que obtendremos y la media real ser menor de 1 cm, con una probabilidad del 0,95. Fijaos en que cuanto mayor sea el tamao de la muestra, menor ser la diferencia entre la
media muestral y la poblacional.
Por tanto, n > 11 1,96 , y as: n > ( 11 1,96 ) = 464,8 . Entonces, si tomamos 465 individuos para llevar a cabo el estudio, sabemos que la diferencia entre la media muestral
que obtendremos y la media real ser menor de 1 cm, con una probabilidad del 0,95. Fijaos en que cuanto mayor sea el tamao de la muestra, menor ser la diferencia entre la
media muestral y la poblacional.
FUOC P03/75057/01008
FUOC P03/75057/01008
X i n
i = 1
---------------------------n
X i n
---------------------------n
i = 1
La t de Student
La t de Student
cosas:
Observad que...
2
1 n
------------ ( x i x )
n 1i = 1
s =
Observad que...
2
1 n
------------ ( x i x )
n 1i = 1
de la desviacin.
de la desviacin.
XIX
demostraron
XIX
demostraron
la normal (0,1), es decir, los valores que toma esta variable estn un
poco ms dispersos. No obstante, cuanto mayor es el nmero de grados
de libertad, n, ms se aproxima la distribucin tn de Student a la distribucin normal (0,1). Consideraremos que podemos aproximar la tn por
una normal estndar para n > 100.
El valor real y la
distribucin tn de Student
Observad que cuando conocemos el valor autntico de , la
variable X sigue siempre una
distribucin normal, pero su
varianza depende de n.
la normal (0,1), es decir, los valores que toma esta variable estn un
poco ms dispersos. No obstante, cuanto mayor es el nmero de grados
de libertad, n, ms se aproxima la distribucin tn de Student a la distribucin normal (0,1). Consideraremos que podemos aproximar la tn por
una normal estndar para n > 100.
W.S. Gosset
W.S. Gosset trabajaba en la
empresa cervecera Guinness
y utilizaba el seudnimo
de Student para firmar sus
trabajos.
El valor real y la
distribucin tn de Student
Observad que cuando conocemos el valor autntico de , la
variable X sigue siempre una
distribucin normal, pero su
varianza depende de n.
FUOC P03/75057/01008
FUOC P03/75057/01008
s
Error estndar = ------n
s
Error estndar = ------n
X
------------s
------n
X
------------s
------n
de libertad.
de libertad.
Las tablas que nos dan la distribucin de la t de Student son parecidas a las de
Las tablas que nos dan la distribucin de la t de Student son parecidas a las de
los grados de libertad tenemos una distribucin diferente, las tablas habituales
los grados de libertad tenemos una distribucin diferente, las tablas habituales
slo nos sirven para ocho probabilidades determinadas (para otros valores hay
slo nos sirven para ocho probabilidades determinadas (para otros valores hay
10
FUOC P03/75057/01008
10
FUOC P03/75057/01008
que utilizar algn software apropiado). La forma de utilizar las tablas es la si-
que utilizar algn software apropiado). La forma de utilizar las tablas es la si-
Una empresa indica en un paquete de arroz que el peso medio del paquete es de 900 gramos. En una inspeccin hemos analizado el peso en gramos de 10 paquetes de arroz y
hemos obtenido los datos siguientes:
Una empresa indica en un paquete de arroz que el peso medio del paquete es de 900 gramos. En una inspeccin hemos analizado el peso en gramos de 10 paquetes de arroz y
hemos obtenido los datos siguientes:
890
895
901
894
893
895
893
904
896
899
890
895
901
894
893
895
893
904
896
899
Es razonable pensar que el peso en gramos de un paquetede arroz es una variable aleatoria
normal con media del peso que indica el paquete, y con una desviacin tpica determinada. Es decir, de media los paquetes deberan tener 900 gramos, pero a causa de los errores de medida de los aparatos que los llenan, algunos contendrn un poco ms de 900
gramos y otros, un poco menos. Supongamos, pues, que la variable de inters (el peso del
paquete) es normal, pero no sabemos nada de su desviacin tpica. Con nuestros datos
podemos estimar la desviacin tpica y obtenemos:
Es razonable pensar que el peso en gramos de un paquetede arroz es una variable aleatoria
normal con media del peso que indica el paquete, y con una desviacin tpica determinada. Es decir, de media los paquetes deberan tener 900 gramos, pero a causa de los errores de medida de los aparatos que los llenan, algunos contendrn un poco ms de 900
gramos y otros, un poco menos. Supongamos, pues, que la variable de inters (el peso del
paquete) es normal, pero no sabemos nada de su desviacin tpica. Con nuestros datos
podemos estimar la desviacin tpica y obtenemos:
s = 4,19
s = 4,19
3
X
3
P ( X > 3 ) = 1 P ( 3 < X < 3 ) = 1 P ------------ < ------------- < ------------ =
4,19
------------ 4,19
------------ 4,19
------------
10
10
10
3
X
3
P ( X > 3 ) = 1 P ( 3 < X < 3 ) = 1 P ------------ < ------------- < ------------ =
4,19
------------ 4,19
------------ 4,19
------------
10
10
10
donde ya sabemos que t9 es una t de Student con nueve grados de libertad. Podemos calcular
esta probabilidad en las tablas:
donde ya sabemos que t9 es una t de Student con nueve grados de libertad. Podemos calcular
esta probabilidad en las tablas:
Entonces:
Entonces:
1 P(2,26 < t9 < 2,26) = 1 0,95 = 0,05
Por tanto, a partir de estos datos, todo parece indicar que la empresa engaa a sus clientes. En efecto, si se toma una muestra de tamao 10, la probabilidad de que la diferencia
entre la media muestral y la real sea mayor de slo 3 gramos es de un 5%. En cambio, la
media de nuestra muestra es de 896 gramos, 4 gramos menos que la cantidad que indica
el paquete.
Por tanto, a partir de estos datos, todo parece indicar que la empresa engaa a sus clientes. En efecto, si se toma una muestra de tamao 10, la probabilidad de que la diferencia
entre la media muestral y la real sea mayor de slo 3 gramos es de un 5%. En cambio, la
media de nuestra muestra es de 896 gramos, 4 gramos menos que la cantidad que indica
el paquete.
En este caso los valores que nos han aparecido nos han permitido utilizar las tablas. En
otras ocasiones necesitaremos utilizar el ordenador.
En este caso los valores que nos han aparecido nos han permitido utilizar las tablas. En
otras ocasiones necesitaremos utilizar el ordenador.
2. Resumen
2. Resumen
Student.
Student.
11
FUOC P03/75057/01008
11
FUOC P03/75057/01008
Ejercicios
Ejercicios
mal de media de 3.000 pesos y varianza 500. Supongamos que el gasto de cada
mal de media de 3.000 pesos y varianza 500. Supongamos que el gasto de cada
deberan ganar para tener una seguridad del 99% de que no gastarn ms de
deberan ganar para tener una seguridad del 99% de que no gastarn ms de
2. Hemos hecho una encuesta entre los hombres de una poblacin determina-
2. Hemos hecho una encuesta entre los hombres de una poblacin determina-
poblacin sigue una distribucin normal de media 72 kg. Para saber si los datos
poblacin sigue una distribucin normal de media 72 kg. Para saber si los datos
que hemos obtenido son fiables, pesamos a cuatro de los encuestados y obtene-
que hemos obtenido son fiables, pesamos a cuatro de los encuestados y obtene-
mos una media de 77,57 kg, con una desviacin tpica de 3,5 kg. Tenemos su-
mos una media de 77,57 kg, con una desviacin tpica de 3,5 kg. Tenemos su-
ficientes motivos para pensar que los encuestados han mentido cuando nos han
ficientes motivos para pensar que los encuestados han mentido cuando nos han
dicho su peso?
dicho su peso?
Solucionario
Solucionario
1. Llamamos XA al gasto anual. Puesto que el gasto mensual XM sigue una ley
1. Llamamos XA al gasto anual. Puesto que el gasto mensual XM sigue una ley
500 y
12 500 = 77,4597
12 3.000 = 36.000 y
500 y
12 500 = 77,4597
X A 36.000
- sigue una distribucin normal estndar.
sabemos que ------------------------------77,4597
X A 36.000
- sigue una distribucin normal estndar.
sabemos que ------------------------------77,4597
Por tanto, la probabilidad de que la familia Robles gaste menos de 37.000 pe-
Por tanto, la probabilidad de que la familia Robles gaste menos de 37.000 pe-
sos es:
sos es:
77,4597
77,4597
que:
que:
X A 36.000 G 36.000
P ( XA < G ) = P ------------------------------- < ----------------------------- = 0,99
77,4597
77,4597
X A 36.000 G 36.000
P ( XA < G ) = P ------------------------------- < ----------------------------- = 0,99
77,4597
77,4597
Si observamos las tablas de la normal, vemos que la cantidad:
G 36.000
----------------------------77,4597
12
FUOC P03/75057/01008
12
FUOC P03/75057/01008
G 36.000
----------------------------- = 2,33
77,4597
G 36.000
----------------------------- = 2,33
77,4597
obtenemos que es preciso que G = 36.180,4811 para tener una seguridad del
obtenemos que es preciso que G = 36.180,4811 para tener una seguridad del
cuatro de los encuestados al azar, la media del peso de estos individuos difiera
cuatro de los encuestados al azar, la media del peso de estos individuos difiera
bemos calcular:
bemos calcular:
P ( X 5,57 )
P ( X 5,57 )
Si esta probabilidad fuese pequea, nos indicara que los encuestados segura-
Si esta probabilidad fuese pequea, nos indicara que los encuestados segura-
mente han mentido sobre su peso. Con la ayuda de las tablas, calculamos la
mente han mentido sobre su peso. Con la ayuda de las tablas, calculamos la
5,57 X 5,57
------------ < ------------- < ------------ =
3,5
3,5
3,5
---------------------4
4
4
5,57 X 5,57
------------ < ------------- < ------------ =
3,5
3,5
3,5
---------------------4
4
4
As pues, parece que nos han mentido, ya que la probabilidad de que la diferencia
As pues, parece que nos han mentido, ya que la probabilidad de que la diferencia
entre las medias de los pesos que nos han dicho y 72 es muy pequea, del orden
entre las medias de los pesos que nos han dicho y 72 es muy pequea, del orden
de 0,05.
de 0,05.
Observad que podemos hacer todos estos clculos con las tablas de la t de Student.
Observad que podemos hacer todos estos clculos con las tablas de la t de Student.
FUOC P03/75057/01008
13
FUOC P03/75057/01008
13
error estndar. Este hecho nos permite calcular probabilidades cuando tene-
error estndar. Este hecho nos permite calcular probabilidades cuando tene-
mos una muestra de una variable con distribucin normal y desviacin tpica
mos una muestra de una variable con distribucin normal y desviacin tpica
riable de inters sigue una distribucin normal o no, o cuando sabemos seguro
riable de inters sigue una distribucin normal o no, o cuando sabemos seguro
Cuando la muestra es lo bastante grande, la solucin nos viene dada por uno
Cuando la muestra es lo bastante grande, la solucin nos viene dada por uno
otros premios, devuelve el importe jugado a todos los nmeros que acaban en
otros premios, devuelve el importe jugado a todos los nmeros que acaban en
Consideremos la variable X(n), que no da el nmero de veces que nos han devuelto el importe jugado cuando se han realizado n sorteos. En este caso sabemos que
la variable aleatoria X(n) sigue una distribucin binomial de parmetros n y p =
0,1. En efecto, se han hecho n sorteos (es decir, se ha repetido un mismo expe-
Binomial
Si X sigue una distribucin
binomial de parmetros n y p,
entonces:
Consideremos la variable X(n), que no da el nmero de veces que nos han devuelto el importe jugado cuando se han realizado n sorteos. En este caso sabemos que
la variable aleatoria X(n) sigue una distribucin binomial de parmetros n y p =
0,1. En efecto, se han hecho n sorteos (es decir, se ha repetido un mismo expe-
Binomial
Si X sigue una distribucin
binomial de parmetros n y p,
entonces:
k
nk
P ( X = k ) = n p ( 1 p )
k
k
nk
P ( X = k ) = n p ( 1 p )
k
que nos devuelvan el dinero es p = 1/10 = 0,1 (probabilidad de xito). Sin em-
que nos devuelvan el dinero es p = 1/10 = 0,1 (probabilidad de xito). Sin em-
FUOC P03/75057/01008
14
FUOC P03/75057/01008
14
Si ahora consideramos n = 10, los posibles valores van del 0 al 10, y el grfico
Si ahora consideramos n = 10, los posibles valores van del 0 al 10, y el grfico
15
FUOC P03/75057/01008
15
FUOC P03/75057/01008
Vemos, pues, que el perfil de este grfico cada vez se parece ms al de la funcin
Vemos, pues, que el perfil de este grfico cada vez se parece ms al de la funcin
ma X(n):
ma X(n):
n p = 0,1 n
y la varianza:
n p = 0,1 n
y la varianza:
stos sern los parmetros de la variable aleatoria normal que aproxima la dis-
stos sern los parmetros de la variable aleatoria normal que aproxima la dis-
Este resultado nos permite simplificar bastante los clculos en algunas situa-
Este resultado nos permite simplificar bastante los clculos en algunas situa-
ciones.
ciones.
Ejemplo de la lotera
Ejemplo de la lotera
k
365 k
P ( X ( 365 ) = k ) = 365 ( 0,1 ) ( 0,9 )
k
k
365 k
P ( X ( 365 ) = k ) = 365 ( 0,1 ) ( 0,9 )
k
En cambio, si renunciamos a pedir que la probabilidad sea exacta y nos conformamos con
una muy buena aproximacin, podemos utilizar el hecho de que la distribucin de X(365)
se puede aproximar por una normal de parmetros = 365 0,1 = 36,5 y 2 = 365 0,09 =
32,85. As:
En cambio, si renunciamos a pedir que la probabilidad sea exacta y nos conformamos con
una muy buena aproximacin, podemos utilizar el hecho de que la distribucin de X(365)
se puede aproximar por una normal de parmetros = 365 0,1 = 36,5 y 2 = 365 0,09 =
32,85. As:
( 365 ) 36,5- 50
36,5-
P ( X ( 365 ) 50 ) = P X
-----------------------------------------------------------
32,85
32,85
( 365 ) 36,5- 50
36,5-
P ( X ( 365 ) 50 ) = P X
-----------------------------------------------------------
32,85
32,85
16
FUOC P03/75057/01008
16
FUOC P03/75057/01008
y si llamamos Z a una variable aleatoria normal (0,1), esta probabilidad ser aproximadamente:
y si llamamos Z a una variable aleatoria normal (0,1), esta probabilidad ser aproximadamente:
50 36,5
P Z ------------------------- = P ( Z 2,36 ) = 0,0091
32,85
50 36,5
P Z ------------------------- = P ( Z 2,36 ) = 0,0091
32,85
Por tanto, la probabilidad aproximada de que nos devuelvan el dinero cincuenta veces o
ms a lo largo del ao es nicamente del 0,0091.
Por tanto, la probabilidad aproximada de que nos devuelvan el dinero cincuenta veces o
ms a lo largo del ao es nicamente del 0,0091.
Observad que hemos calculado P(X(365) 50), pero que esta cantidad es la misma que
P(X(365) 49,5), ya que la variable slo toma valores naturales. Fijaos en que si la aproximamos por la normal, obtendremos:
Observad que hemos calculado P(X(365) 50), pero que esta cantidad es la misma que
P(X(365) 49,5), ya que la variable slo toma valores naturales. Fijaos en que si la aproximamos por la normal, obtendremos:
32,85
32,85
32,85
32,85
49,5 36,5
= P Z ------------------------------- = P ( Z 2,26 ) = 0,0119
32,85
49,5 36,5
= P Z ------------------------------- = P ( Z 2,26 ) = 0,0119
32,85
que es una cantidad ligeramente diferente de la obtenida antes. Se dice que este valor se
ha obtenido haciendo una correccin de continuidad, ya que aproximamos una variable discreta por una continua. Podemos considerar buenos los dos resultados.
que es una cantidad ligeramente diferente de la obtenida antes. Se dice que este valor se
ha obtenido haciendo una correccin de continuidad, ya que aproximamos una variable discreta por una continua. Podemos considerar buenos los dos resultados.
Hemos visto que cuando n es grande, podemos aproximar una binomial (n,p)
Hemos visto que cuando n es grande, podemos aproximar una binomial (n,p)
por una normal de parmetros = np y = np(1 p). Por otro lado, sabemos
por una normal de parmetros = np y 2 = np(1 p). Por otro lado, sabemos
Puesto que hemos visto que la suma de n distribuciones de Bernoulli de parmetro p, que es una binomial (n,p), es aproximadamente una distribucin normal con media np y varianza np(1 p), est claro que la proporcin (que es la
suma de las n distribuciones de Bernoulli dividida por n), tendr esperanza p y desviacin tpica p ( 1 p ) n.
Ejemplo de la lotera
En el ejemplo de la lotera podemos pensar que X(n), el nmero de veces que nos han
devuelto el dinero en n sorteos,
es una suma de n variables,
cada una de las cuales vale 1
si aquel da concreto nos han
devuelto el dinero, y 0 en caso
contrario. La suma de las n variables nos da el nmero de veces que nos han devuelto el
dinero en los n sorteos, y si
dividimos por n obtenemos la
proporcin de sorteos en los
que esto sucede.
Utilidad de las
proporciones
La estadstica cada vez se
utiliza ms y las encuestas
aparecen todos los da en los
diarios. Nos interesa saber
qu proporcin de electores
votarn a un determinado partido, qu proporcin de ciudadanos rechaza un determinado
plan o una determinada ley
que est preparando el gobierno, qu proporcin de consumidores estarn interesados en
un nuevo producto que queremos lanzar al mercado, etc.
Puesto que hemos visto que la suma de n distribuciones de Bernoulli de parmetro p, que es una binomial (n,p), es aproximadamente una distribucin normal con media np y varianza np(1 p), est claro que la proporcin (que es la
suma de las n distribuciones de Bernoulli dividida por n), tendr esperanza p y desviacin tpica p ( 1 p ) n.
Ejemplo de la lotera
En el ejemplo de la lotera podemos pensar que X(n), el nmero de veces que nos han
devuelto el dinero en n sorteos,
es una suma de n variables,
cada una de las cuales vale 1
si aquel da concreto nos han
devuelto el dinero, y 0 en caso
contrario. La suma de las n variables nos da el nmero de veces que nos han devuelto el
dinero en los n sorteos, y si
dividimos por n obtenemos la
proporcin de sorteos en los
que esto sucede.
Utilidad de las
proporciones
La estadstica cada vez se
utiliza ms y las encuestas
aparecen todos los da en los
diarios. Nos interesa saber
qu proporcin de electores
votarn a un determinado partido, qu proporcin de ciudadanos rechaza un determinado
plan o una determinada ley
que est preparando el gobierno, qu proporcin de consumidores estarn interesados en
un nuevo producto que queremos lanzar al mercado, etc.
17
FUOC P03/75057/01008
17
FUOC P03/75057/01008
0,3 ( 1 0,3 )
N 0,3; -------------------------------- = N ( 0,3; 0,0005 )
400
0,3 ( 1 0,3 )
N 0,3; -------------------------------- = N ( 0,3; 0,0005 )
400
Para calcular la probabilidad de que la proporcin de habitantes a favor sea mayor del 40%,
deberamos hacer:
Para calcular la probabilidad de que la proporcin de habitantes a favor sea mayor del 40%,
deberamos hacer:
p 0,3
0,4 0,3
P ( p > 0,4 ) = P ----------------------- > ------------------------ = P ( Z > 4,47 ) = 0
0,0005
0,0005
p 0,3
0,4 0,3
P ( p > 0,4 ) = P ----------------------- > ------------------------ = P ( Z > 4,47 ) = 0
0,0005
0,0005
Tambin hemos visto que si las variables originales siguen una distribucin de
Tambin hemos visto que si las variables originales siguen una distribucin de
El ltimo resultado es cierto sea cual sea la distribucin de los datos originales.
El ltimo resultado es cierto sea cual sea la distribucin de los datos originales.
El teorema del lmite central dice que si una muestra es lo bastante grande (n > 30), sea cual sea la distribucin de la variable de inters, la distribucin de la media muestral ser aproximadamente una normal. Adems,
la media ser la misma que la de la variable de inters, y la desviacin t-
Qu significa n bastante
grande?
Consideraremos que n es lo
bastante grande cuando,
como mnimo, n > 30.
El teorema del lmite central dice que si una muestra es lo bastante grande (n > 30), sea cual sea la distribucin de la variable de inters, la distribucin de la media muestral ser aproximadamente una normal. Adems,
la media ser la misma que la de la variable de inters, y la desviacin t-
Qu significa n bastante
grande?
Consideraremos que n es lo
bastante grande cuando,
como mnimo, n > 30.
18
FUOC P03/75057/01008
18
FUOC P03/75057/01008
a) Cul es la probabilidad de que la media de los tiempos de entrega de hoy est entre
30 y 35 minutos?
a) Cul es la probabilidad de que la media de los tiempos de entrega de hoy est entre
30 y 35 minutos?
b) Cul es la probabilidad de que, en total, para los doscientos paquetes hayan estado
ms de 115 horas?
b) Cul es la probabilidad de que, en total, para los doscientos paquetes hayan estado
ms de 115 horas?
Por el teorema del lmite central sabemos que la media muestral se comporta como una
normal de esperanza 35 y desviacin tpica:
Por el teorema del lmite central sabemos que la media muestral se comporta como una
normal de esperanza 35 y desviacin tpica:
8
-------------- = 0,566
200
8
-------------- = 0,566
200
30 35 X 35 35 35
P ( 30 X 35 ) = P ------------------- ----------------- -------------------
0,566
0,566
0,566
30 35 X 35 35 35
P ( 30 X 35 ) = P ------------------- ----------------- -------------------
0,566
0,566
0,566
35 Z 35
35 = P ( 8,83 Z 0 ) = P ( Z 0 ) P ( Z 8,83 ) =
P 30
------------------------------------ 0,566
0,566
35 Z 35
35 = P ( 8,83 Z 0 ) = P ( Z 0 ) P ( Z 8,83 ) =
P 30
------------------------------------ 0,566
0,566
= 0,5 0 = 0,5
= 0,5 0 = 0,5
donde Z es una normal (0,1). Es decir, tenemos una probabilidad aproximada del 0,4616
de que la media del tiempo de entrega de hoy haya estado entre 30 y 35 minutos.
donde Z es una normal (0,1). Es decir, tenemos una probabilidad aproximada del 0,4616
de que la media del tiempo de entrega de hoy haya estado entre 30 y 35 minutos.
Por lo que respecta a la segunda pregunta, de entrada debemos pasar las horas a minutos,
ya que sta es la unidad con la que nos viene dada la variable. Observad que 115 horas por
60 minutos nos dan 6.900 minutos. Se nos pide que calculemos la probabilidad siguiente:
Por lo que respecta a la segunda pregunta, de entrada debemos pasar las horas a minutos,
ya que sta es la unidad con la que nos viene dada la variable. Observad que 115 horas por
60 minutos nos dan 6.900 minutos. Se nos pide que calculemos la probabilidad siguiente:
6.900
P X > --------------- = P ( X > 34,5 )
200
6.900
P X > --------------- = P ( X > 34,5 )
200
y como que sabemos que la media se distribuye aproximadamente como una normal de
media 35 y desviacin tpica 0,566 (supondremos siempre que la distribucin de la media
es normal, ya sea porque la variable de inters es normal o porque la muestra es lo bastante grande), esta probabilidad se puede aproximar por la probabilidad de una distribucin normal estndar Z:
y como que sabemos que la media se distribuye aproximadamente como una normal de
media 35 y desviacin tpica 0,566 (supondremos siempre que la distribucin de la media
es normal, ya sea porque la variable de inters es normal o porque la muestra es lo bastante grande), esta probabilidad se puede aproximar por la probabilidad de una distribucin normal estndar Z:
Uno de los casos ms habituales en los que podemos aplicar el teorema del l-
Uno de los casos ms habituales en los que podemos aplicar el teorema del l-
sucesivas.
sucesivas.
este intervalo nos indicarn que existe alguna anomala en el proceso de pro-
este intervalo nos indicarn que existe alguna anomala en el proceso de pro-
19
FUOC P03/75057/01008
19
FUOC P03/75057/01008
de control.
de control.
ramos una muestra de esta variable de tamao n, los lmites de control ven-
ramos una muestra de esta variable de tamao n, los lmites de control ven-
error estndar a lado y lado de la media. Por tanto, la longitud del intervalo es
error estndar a lado y lado de la media. Por tanto, la longitud del intervalo es
Por qu tomamos este intervalo? Si aplicamos el teorema del lmite central so-
Por qu tomamos este intervalo? Si aplicamos el teorema del lmite central so-
de 0,001 (esto significa que un valor fuera de este intervalo, si el proceso fun-
de 0,001 (esto significa que un valor fuera de este intervalo, si el proceso fun-
cionase correctamente, se puede dar slo con una probabilidad de 0,001). Por
cionase correctamente, se puede dar slo con una probabilidad de 0,001). Por
Consideremos una mquina que llena tarros de yogur. Supongamos que, de media, cada tarro contiene 125 gramos de yogur con una desviacin tpica de 1,5 gramos. Todas las semanas hacemos un control de la mquina: analizamos una muestra de treinta tarros y
calculamos la media de cada uno. En este ejemplo el error estndar es:
Consideremos una mquina que llena tarros de yogur. Supongamos que, de media, cada tarro contiene 125 gramos de yogur con una desviacin tpica de 1,5 gramos. Todas las semanas hacemos un control de la mquina: analizamos una muestra de treinta tarros y
calculamos la media de cada uno. En este ejemplo el error estndar es:
1,5
----------- = 0,274
30
1,5
----------- = 0,274
30
As pues, si la media de las muestras semanales de tamao 30 est entre estos dos valores, consideraremos que todo est correcto, mentras que si es inferior a 124,18 o superior a 125,82
supondremos que hay alguna anomala en el proceso de produccin, y habr que revisarlo.
As pues, si la media de las muestras semanales de tamao 30 est entre estos dos valores, consideraremos que todo est correcto, mentras que si es inferior a 124,18 o superior a 125,82
supondremos que hay alguna anomala en el proceso de produccin, y habr que revisarlo.
Por cierto, fijaos en que para hacer este control de calidad slo se desperdician treinta yogures
a la semana.
Por cierto, fijaos en que para hacer este control de calidad slo se desperdician treinta yogures
a la semana.
3. Resumen
3. Resumen
teorema del lmite central. Lo hemos desarrollado a partir del estudio de una
teorema del lmite central. Lo hemos desarrollado a partir del estudio de una
20
FUOC P03/75057/01008
20
FUOC P03/75057/01008
Ejercicios
Ejercicios
Se ha dispuesto que cuando el proceso est bajo control, el dimetro de las balas
Se ha dispuesto que cuando el proceso est bajo control, el dimetro de las balas
es de 1 cm, con una desviacin tpica de 0,003 cm. Cada hora se toman muestras
es de 1 cm, con una desviacin tpica de 0,003 cm. Cada hora se toman muestras
de nueve balas y se miden sus dimetros. Los dimetros de media de diez mues-
de nueve balas y se miden sus dimetros. Los dimetros de media de diez mues-
1,0006
0,9997
0,9992
1,0012
1,0008
1,0006
0,9997
0,9992
1,0012
1,0008
1,0012
1,0018
1,0016
1,0020
1,0022
1,0012
1,0018
1,0016
1,0020
1,0022
Estableced cules son los lmites de control y explicad qu podis concluir so-
Estableced cules son los lmites de control y explicad qu podis concluir so-
Solucionario
Solucionario
1. Dado que la muestra es grande, por el teorema del lmite central podemos
1. Dado que la muestra es grande, por el teorema del lmite central podemos
tpica el error estndar. Por tanto, la probabilidad que nos preguntan, que es:
tpica el error estndar. Por tanto, la probabilidad que nos preguntan, que es:
0,01 X 0,01
P ( X < 0,01 ) = P ( 0,01 < X < 0,01 ) = P ------------ < ------------- < ------------ =
0,05 0,05
0,05
------------ ------------ ------------
98
98
98
0,01 X 0,01
P ( X < 0,01 ) = P ( 0,01 < X < 0,01 ) = P ------------ < ------------- < ------------ =
0,05 0,05
0,05
------------ ------------ ------------
98
98
98
X
= P 1,98 < ------------- < 1,98
0,05
-----------
98
X
= P 1,98 < ------------- < 1,98
0,05
-----------
98
0,003
------- = --------------- = 0,001
n
10
0,003
------- = --------------- = 0,001
n
10
FUOC P03/75057/01008
21
FUOC P03/75057/01008
21
Por tanto, los lmites de control sern 1,003 y 0,997. Observemos que absoluta-
Por tanto, los lmites de control sern 1,003 y 0,997. Observemos que absoluta-
mente todas las medias que hemos obtenido de las sucesivas muestras estn
mente todas las medias que hemos obtenido de las sucesivas muestras estn
dentro del intervalo formado por los dos lmites de control. Es decir, no hay nin-
dentro del intervalo formado por los dos lmites de control. Es decir, no hay nin-
gn dato superior a 1,003 ni ningn dato inferior a 0,997. Por tanto, podemos
gn dato superior a 1,003 ni ningn dato inferior a 0,997. Por tanto, podemos
concluir que el proceso de control ha sido correcto durante el tiempo que lo he-
concluir que el proceso de control ha sido correcto durante el tiempo que lo he-