You are on page 1of 31

Simulación de Sistemas – Semestre 2008 -1

Abrril 2009
Simulación de Sistemas

Generación de Números y Variables Aleatorias
Ing. Eduardo Carbajal L.
Agenda
Generación de números y variables aleatorias
1. Generación de Números Aleatorios
2. Pruebas de aleatoriedad.
3. Generación de variables aleatorias
4. Pruebas de bondad de ajuste: Kolmogorov - Smirnov y Chi
cuadrado (_
2
)



Lecturas: Ross, Cap. 3, 4 y 5
Banks, Cap. 8 y 9
Law, Cap. 6
Tomando en cuenta los números aleatorios generados previamente
Ri que siguen una distribución uniforme, es posible emplear método
que permitan generar variables aleatorias.
Métodos y variables generadas
¿Qué métodos existen?
Existen métodos generales así como métodos particulares para
distribuciones específicas
¿Qué métodos emplearemos
 Método de la transformada inversa
 Método de Aceptación y rechazo
 Método de Convolución
¿Qué tipo de variables aleatorias pueden generarse?
Mayoritariamente variables aleatorias continuas y discretas,
aunque algunos métodos permiten generar variables que no
pertenecen enteramente a ninguna de las categorías
mencionadas previamente
Generación de variables aleatorias
El método de la transformada inversa utiliza la distribución acumulada F(x)
de la distribución que se desea simular.
Generación de variables aleatorias
Método de la Transformada Inversa
Una de las características de F(x) es que se encuentra definida en el
intervalo (0,1). Por tanto, se puede generar un número aleatorio uniforme
R ~ U(0,1), con el cual se ingresa por la ordenada (eje y) y se intercepta
la curva F(x). El número X correspondiente a la abscisa (eje x) del punto de
intersección, es un número aleatorio que tiene la distribución deseada.
x
x=F (R)
-1
1
R
) ( ) (
1
R x ó R x F
F
÷
= =
Distribuciones continuas
Generación de variables aleatorias
Método de la Transformada Inversa
La función de probabilidad acumulada F(x) para una distribución
continua presenta una gráfica continua. En este caso se aplica
directamente la función inversa sobre Ri para calcular el valor de la
variable.
OBS: F(x) es la función de probabilidad acumulada
f(x) para las dist. continuas se llama función de densidad
F(x) se calcula integrando f(x)
x
x=F (R)
-1
1
R
) ( ) (
1
R x ó R x F
F
÷
= =
Distribuciones discretas
Generación de variables aleatorias
Método de la Transformada Inversa
La función de probabilidad acumulada F(x) para una distribución
continua presenta una gráfica discontinua. En este caso se emplea la
función inversa generalizada, debido a que por estas discontinuidades
no tiene función inversa propiamente dicha.
Dado un R, se procede a tomar como la inversa de R, al menor x, tal que
F(x) = R
OBS: F(x) es la función de probabilidad acumulada
f(x) para las dist. continuas se llama función de densidad
F(x) se calcula como la sumatoria de f(x) desde 0 hasta x
R1
x1
R2
x2
Generación de variables aleatorias
Método de la Transformada Inversa
Notación: X ~ Bernoulli (p)

Distribución de Bernoulli
1. Generar un número aleatorio R ~ U(0,1)
2. Si R <= p x = 1 , en caso contrario x = 0
Método de generación:
Función de probabilidad:

donde p : probabilidad de éxito
( )
. 1 , 0 ,
1 ) (
1
=
÷ =
÷
x
p p x P
x x
Generación de variables aleatorias
Método de la Transformada Inversa
Notación: X ~ Uniforme(a,b)

Distribución Uniforme
1. Generar un número aleatorio R ~ U(0,1)
2. Hallar X = a + (b-a)*R.
Método de generación:
Función de probabilidad:

0 , si x < a
F(x) = (x-a)/(b-a) , si x Є [a,b]
1 , si x > b
Generación de variables aleatorias
Método de la Transformada Inversa
Notación: X ~ Exponencial(b)

Distribución Exponencial
1. Generar un número aleatorio R ~ U(0,1)
2. Hallar X = (-
1
/
b
)*ln(1 – R)
Método de generación:
Función de probabilidad:

F(x)= 1 – e
-bx
, x ≥ 0
Generación de variables aleatorias
Método de la Transformada Inversa
Notación: X ~ Weibull(a,B)

Distribución Weibull
1. Generar un número aleatorio R ~ U(0,1)
2. Hallar X = α (- ln( 1 – R))^(1/β)
Método de generación:
Función de probabilidad:

F(x) = 1 – e
-(x/α)^β

Generación de variables aleatorias
Método de la Transformada Inversa
Notación: X ~ Triangular(a,b,c)

Distribución Triangular
1. Generar un número aleatorio R ~ U(0,1)
2. Hallar
Método de generación:
Función de probabilidad:

(x-a)
2
/ [(b-a)(c-a)] para a≤x≤b
F(x)=
1 - (x-c)
2
/[(c-b)(c-a)] para b≤x≤c
R 0.46 0.37 0.04 0.01 0.58
Genere variables aleatorias triangulares con parámetros a=0, b=1, y c=2 empleando los siguientes
números aleatorios

La inversa en función de R de la distribución triangular es:
Reemplazando los parámetros:
0 +((1-0)(2-0) R )
0.5
, R <= (1-0)/(2-0)  (2R)
0.5
,R <= 0.5


X =
2 - [(2-1)(2-0)(1-R)]
0.5
,R <= (1-0)/(2-0)  2 - (2-2R)
0.5
,R >= 0.5


Empleando entonces los aleatorios dados:
R1=0.46
R2=0.37
R3=0.04
R4=0.01
R5=0.58
< 0.5
< 0.5
< 0.5
< 0.5
>0.5
X1 = (2(0.46))
0.5
= 0.96


X2 = (2(0.37))
0.5
= 0.86


X3 = (2(0.04))
0.5
= 0.28


X4 = (2(0.01))
0.5
= 0.14


X5 = 2-(2(1-0.58))
0.5
= 1.08


El método de aceptación y rechazo utiliza la función de densidad f(x)
de la distribución que se desea generar.
Generación de variables aleatorias
Método de Aceptación y Rechazo
Procedimiento a seguir:
1. Obtener tres valores que
acoten dicha funcion f(x):

C, que la acote superiormente, es decir
C ≥ f(x) para todo x
A, que la acote por la izquierda , es
decir A ≤ x, para todo x,
B, que la acote por la derecha, es decir
x≤ B para todo x.

Generalmente, el eje x
acota inferiormente a la
función.
x
f(x)
y
C
A B
2. Generar un número
aleatorio R entre [0,1].
3. Si R cumple con la regla de
transformación, R ≤ f(x) /
C, entonces el valor de x
sigue la distribución
requerida y es aceptado,
de lo contrario, se rechaza
dicho número.
4. Se repite el algoritmo
hasta generar la cantidad
de variables deseadas.
R
x
Cada par de números
aleatorios generados, no
necesariamente genera un
valor de una variable aleatoria.
Depende si cae en la región de
aceptación (debajo de la curva
f(x)) o de rechazo (por encima
de la curva f(x)). Por lo tanto,
se necesitan en promedio,
tres números aleatorios para
generar un valor de la variable
aleatoria.
El método de convolución permite generar variables aleatorias en función
a una combinación lineal ponderada de otras variables aleatorias. El
método entonces requiere que la variable aleatoria a ser generada Yi,
pueda expresarse como una suma lineal ponderada de otras variables
aleatorias Xi.
Generación de variables aleatorias
Método de Convolución
bi es una constante que refleja la ponderación de la variable xi
en la combinación lineal.
Procedimiento a seguir:
1. Se generan números aleatorios (R
1
,R
2
,...,R
k
, … )
2. Con uno (o mas, dependiendo del método a utilizar) de los números
aleatorios, se generan las variables aleatorias componentes
(x
1
,x
2
,...x
k
) usando alguno de los métodos anteriores.
3. Se obtiene un valor de la variable por suma lineal de las variables
aleatorias componentes.
Y = b
1
*x
1
+ b
2
*x
2
+…+b
k
*x
k

Variables que se generan con este método:
Normal, Binomial, Poisson, Gamma, Erlang
Generación de variables aleatorias
Método de Convolución
Notación: X ~ B (n,p)

Distribución Binomial
1. Generar las variables X
1
, X
2
,............X
n
~ Bernoulli (p)
2. Generar Y como la suma de (X
1
+ X
2
+ .... + X
n
)
Método de generación:
Función de probabilidad:

( )
¦
)
¦
`
¹
¦
¹
¦
´
¦
=
|
|
.
|

\
|
=
÷
÷
. . ; 0
,...., 1 , 0 ;
) (
1
c c en
n x
x
n
x P
p p
x n x
donde p : probabilidad de éxito
Generación de variables aleatorias
Método de Convolución
Notación: X ~ P (λ)

Distribución Poisson
1. Se inicializa x=0 y t=0.
2. Se genera una variable aleatoria X~ exp(1/ λ).
3. Se actualiza t = t + X
4. Si t ≤ T entonces Y = Y+1
5. Se repite el algoritmo a partir del 2do punto, hasta que t > T.
El valor de Y generado, sigue una distribución Poisson.
Método de generación:
Función de probabilidad:

¦
)
¦
`
¹
¦
¹
¦
´
¦
=
=
÷
. . 0
,... 2 , 1 , 0
!
) (
c c en
x
x
x P
e
x ì
o
Donde
x : número de eventos que ocurren en un intervalo de tiempo
λ : número promedio de eventos en un tiempo dado
) ( ~
1
~
1
ì
o
Poisson x Exp
Y
·
|
.
|

\
|
Generación de variables aleatorias
Método de Convolución
Notación: X ~ N( μ, σ)

Distribución Normal
1. Se generan doce números aleatorios X con distribución U(0,1).
2. Generar Z como la suma Z = ( X
1
+ X
2
+ …… + X
12
) – 6
3. Donde Z es una variable normal estándar con media igual 0 y
varianza igual a 1. Esto se obtiene, ya que la media de cada
variable X es ½ y la varianza es igual a
1
/
12
.
4. Para generar una variable Y~ N( μ, σ), utilizar la regla de
transformación Y = (Z * σ) + μ
Método de generación:
Generación de variables aleatorias
Método de Convolución
Distribución Chi cuadrado
1. Generar Z, que son variables aleatorias normales estándar.
2. Elevar al cuadrado cada variable Z generada.
3. Para generar una variable chi-cuadrado de grado de libertad
“n”, suma n variables Z
2.

Método de generación:
o
_
o
2
,r crítico
¿
=
=
k
i
i
k
Z
1
2
2
_
Z Z Z Z
2
4
2
3
2
2
2
1
2
4
+ + + =
_
Por ejemplo:

Generación de variables aleatorias
Métodos para la Distr. Normal Estándar
Notación: X ~ N (0,1)


1. Propuesta de Marsaglia-Brax
2. Propuesta de Box Muller
Función de probabilidad:

}
· ÷
÷
=
x
dt
t
x F
e
2
2
2
1
) (
t
Dado que la inversa resulta complicada de calcular se emplean otros
métodos en este caso particular. Los métodos son:
Generación de variables aleatorias
Métodos para la Distr. Normal Estándar
1. Se generan dos números aleatorios R1 y R2.
2. Se calcula v1= 2R1 – 1 y v2=2R2 – 1
3. Se calcula s = v1
2
+ v2
2

4. Si s≤1, entonces se calcula Zi = vi * [ -2 ln(s) / s]
0.5

Propuesta de Marsaglia Brax
Método de generación:
OBS: Los Zi que se obtiene bajo este método son
variables aleatorias normales estándar
Generación de variables aleatorias
Métodos para la Distr. Normal Estándar
1. Generamos dos números aleatorios R
1
y R
2
, obteniendo el valor
de Z
1
ó Z
2
(usar solo una de las dos fórmulas)






OBSERVACIÓN:
A partir de Z
i
(obtenidos por cualquiera de ambos métodos) podemos
hallar una variable que se ajuste a una distribución .
Propuesta de Box Muller
Método de generación:
) , ( o µ N
) 1 , 0 ( ~
) 2 ( ) ln( 2
) 2 ( ) ln( 2
2 1 2
2 1 1
N
Sen Sen
Cos Cos
R R Z
R R Z
¦
¦
)
¦
¦
`
¹
¦
¦
¹
¦
¦
´
¦
÷ = =
.
÷ = =
t 0 |
t 0 |
o
µ ÷
=
X
Z
µ o + = Z x
Sabemos que Despejando obtenemos:
Ejercicios Propuestos:
1. Usando el algoritmo discutido en clase y los siguientes números aleatorios, genere tres
valores de una variable aleatoria Poisson con media 1.35. Muestre sus cálculos y use en orden
los números aleatorios.

Orden 1 2 3 4 5 6 7 8
R 0.3551 0.7798 0.9458 0.5903 0.3161 0.8578 0.7891 0.9019
Orden 9 10 11 12 13 14 15 16
R 0.0819 0.3291 0.8250 0.8486 0.7983 0.8845 0.7132 0.0630
2. Generar 10 variables aleatorias normales (utilizando ambos métodos) con parámetros µ =
5 y o = 1, a partir de los siguientes números aleatorios (por par de columnas)
0.0717 0.4407 0.6028 0.4347
0.0586 0.3652 0.1870 0.4518
0.9935 0.6713 0.4459 0.8944
0.7855 0.0377 0.8648 0.6402
0.8240 0.4240 0.9294 0.9358
Pruebas de Bondad de Ajuste
Definición
Son pruebas de hipótesis que permiten validar si la distribución de la frecuencia
observada de conjunto de datos puede aproximarse a una distribución teórica dada. Las
hipótesis que emplean estas pruebas son:
H
0
: La variable aleatoria se ajusta a la distribución candidata con
los parámetros estimados
H
1
: La variable aleatoria no se ajusta.
Las pruebas de hipótesis que emplearemos son:
Kolmogorov Smirnov
Chi Cuadrado
Características
Pruebas de Bondad de Ajuste
Prueba Kolmogorov-Smirnov (K-S)

 No depende de una distribución específica, no se sabe a priori la forma de
la distribución de donde se sacan los datos.
 Aplicable solamente a variables aleatorias continuas, pues es un
supuesto de la prueba.
 Calcula las diferencias en valor absoluto entre las frecuencias acumuladas
relativas observadas y las esperadas en cada clase.
 Se busca la mayor diferencia (D
max
) y se compara con valor crítico de
tablas.
 Se puede aplicar para todo tamaño de muestras, pequeñas o
grandes
 Otra ventaja es que permite construir límites de confianza para la
distribución acumulada completa.


Procedimiento (1)
Pruebas de Bondad de Ajuste
Prueba Kolmogorov-Smirnov (K-S)
 Se halla una tabla de frecuencias para los “n” datos históricos. Se sugiere
tomar k intervalos donde k siga la regla siguiente:





 Para cada uno de los “k” intervalos obtenidos, se halla la frecuencia observada
Oi, para i=1,…k.

 Se divide cada frecuencia observada por el número total de datos “n”. A este
resultado se le llama la probabilidad observada del intervalo i. (POi)

 Se calcula la probabilidad acumulada observada de cada intervalo (OAi).

 Se propone una distribución de probabilidad de acuerdo con la forma de la
tabla de frecuencias obtenida. (Elaborar histograma)
¹
´
¦
+
= =
caso otro en ) log( 2 . 3 1
grande muy es no n si
intervalos de Número
n
n
k
Procedimiento (2)
Pruebas de Bondad de Ajuste
Prueba Kolmogorov-Smirnov (K-S)
 Con la distribución propuesta se calcula la probabilidad esperada para cada uno
de los intervalos (PEi).

 Se calcula la probabilidad acumulada esperada (EAi) para cada intervalo de clase

 Se calcula la diferencia absoluta entre OAi y EAi para cada intervalo y se
selecciona la máxima diferencia, llamándola D
max
.

D
máx
= | OAi – EAi|
máx

Donde: OAi: frecuencia acumulada relativa de la clase i observada
EAi: frecuencia acumulada relativa de la clase i esperada

 El estimado Dmax se compara con un valor límite porporcionado en tabla, con n
datos y a un nivel de confiabilidad de (1 – α). Si el estimador D
max
es menor o
igual al valor límite de la tabla, entonces no se puede rechazar que la
información histórica sigue la distribución propuesta.
12.36 14.15 6.76 14.46 7.47
5.71 16.83 5.17 0.03 19.65
16.79 19.33 17.46 15.45 16.08
18.01 11.99 10.72 11.51 11.99
5.12 20.18 11.53 19.8 9.51
7.69 18.73 20.41 15.1 8.04
19.41 6.31 6.21 9.83 14.66
8.58 15.83 12.52 16.39 6.57
8.42 12.87 8.03 9.6 5.42
15.56 18.04 8.97 17.11 7.79
10 12 16 18 14
18 17 15 19 13
n = 60
k = raíz(60) = 7.74  8
Se toman 8 intervalos, se calcula el valor máximo y mínimo
observados en los datos:
Mínimo = 0.03
Máximo =20.41
Rango de valores =20.41 -0.03 = 20.38
Amplitud de cada intervalo = Rango/k = 20.38/8 =2.5475
Límite de
Clase
Inferior
Límite de
Clase
Superior
Número de
Datos en
Clase
Frecuencia
Relativa
Observada
Frecuencia
Acumulada
Observada
Frecuencia
Acumulada
Teórica
Estadístico
K-S








Verifique si los datos siguientes siguen una distribución uniforme empleando una prueba K-S
0.03 2.5775
2.5775 5.125
5.125 7.6725
7.6725 10.22
10.22 12.768
12.768 15.315
15.315 17.863
17.863 20.41
12.36 14.15 6.76 14.46 7.47
5.71 16.83 5.17 0.03 19.65
16.79 19.33 17.46 15.45 16.08
18.01 11.99 10.72 11.51 11.99
5.12 20.18 11.53 19.8 9.51
7.69 18.73 20.41 15.1 8.04
19.41 6.31 6.21 9.83 14.66
8.58 15.83 12.52 16.39 6.57
8.42 12.87 8.03 9.6 5.42
15.56 18.04 8.97 17.11 7.79
10 12 16 18 14
18 17 15 19 13
1
12.36 14.15 6.76 14.46 7.47
5.71 16.83 5.17 0.03 19.65
16.79 19.33 17.46 15.45 16.08
18.01 11.99 10.72 11.51 11.99
5.12 20.18 11.53 19.8 9.51
7.69 18.73 20.41 15.1 8.04
19.41 6.31 6.21 9.83 14.66
8.58 15.83 12.52 16.39 6.57
8.42 12.87 8.03 9.6 5.42
15.56 18.04 8.97 17.11 7.79
10 12 16 18 14
18 17 15 19 13
1
12.36 14.15 6.76 14.46 7.47
5.71 16.83 5.17 0.03 19.65
16.79 19.33 17.46 15.45 16.08
18.01 11.99 10.72 11.51 11.99
5.12 20.18 11.53 19.8 9.51
7.69 18.73 20.41 15.1 8.04
19.41 6.31 6.21 9.83 14.66
8.58 15.83 12.52 16.39 6.57
8.42 12.87 8.03 9.6 5.42
15.56 18.04 8.97 17.11 7.79
10 12 16 18 14
18 17 15 19 13
8
12.36 14.15 6.76 14.46 7.47
5.71 16.83 5.17 0.03 19.65
16.79 19.33 17.46 15.45 16.08
18.01 11.99 10.72 11.51 11.99
5.12 20.18 11.53 19.8 9.51
7.69 18.73 20.41 15.1 8.04
19.41 6.31 6.21 9.83 14.66
8.58 15.83 12.52 16.39 6.57
8.42 12.87 8.03 9.6 5.42
15.56 18.04 8.97 17.11 7.79
10 12 16 18 14
18 17 15 19 13
11
12.36 14.15 6.76 14.46 7.47
5.71 16.83 5.17 0.03 19.65
16.79 19.33 17.46 15.45 16.08
18.01 11.99 10.72 11.51 11.99
5.12 20.18 11.53 19.8 9.51
7.69 18.73 20.41 15.1 8.04
19.41 6.31 6.21 9.83 14.66
8.58 15.83 12.52 16.39 6.57
8.42 12.87 8.03 9.6 5.42
15.56 18.04 8.97 17.11 7.79
10 12 16 18 14
18 17 15 19 13
8
12.36 14.15 6.76 14.46 7.47
5.71 16.83 5.17 0.03 19.65
16.79 19.33 17.46 15.45 16.08
18.01 11.99 10.72 11.51 11.99
5.12 20.18 11.53 19.8 9.51
7.69 18.73 20.41 15.1 8.04
19.41 6.31 6.21 9.83 14.66
8.58 15.83 12.52 16.39 6.57
8.42 12.87 8.03 9.6 5.42
15.56 18.04 8.97 17.11 7.79
10 12 16 18 14
18 17 15 19 13
8
12.36 14.15 6.76 14.46 7.47
5.71 16.83 5.17 0.03 19.65
16.79 19.33 17.46 15.45 16.08
18.01 11.99 10.72 11.51 11.99
5.12 20.18 11.53 19.8 9.51
7.69 18.73 20.41 15.1 8.04
19.41 6.31 6.21 9.83 14.66
8.58 15.83 12.52 16.39 6.57
8.42 12.87 8.03 9.6 5.42
15.56 18.04 8.97 17.11 7.79
10 12 16 18 14
18 17 15 19 13
11
12
Dividir
cada
término
entre n
0.017
0.017
0.133
0.183
0.133
0.133
0.183
0.200
0.017
0.033
0.167
0.350
0.483
0.617
0.800
1.000
La frecuencia relativa de la uniforme hace que
cada intervalo sea equiprobable, con
probabilidad 1/k = 1/8 = 0.125
0.125
0.250
0.375
0.500
0.625
0.750
0.875
1.000
D
máx
= | OAi –
EAi|
máx

0.108
0.217
0.208
0.150
0.142
0.133
0.075
0.000
Estadístico es el valor absoluto
de la diferencia entre la
Observada Acumulada y la
Acumulada Teórica
= 0.217
Valor crítico de tablas para 60 datos y a 0.05 = 0.17
Como Dmax = 0.217 > Valor crítico de tablas = 0.17 -> Se rechaza Ho
Es decir hay evidencias para rechazar la hipótesis nula que afirma que la muestra sigue una
distribución exponencial
Características
Pruebas de Bondad de Ajuste
Prueba Chi Cuadrado

 Para probar hipótesis que muestra aleatoria de tamaño n de la V.A X
sigue una distribución específica.
 Formaliza la idea intuitiva de comparar el histograma de la
información con la forma de la densidad o masa candidata.
 Válida para tamaños de muestra grande, para distribuciones
discretas o continuas.
 Intuitivamente: compara frecuencias observadas contra frecuencias
teóricas o esperadas mediante. Dicho estadístico es mayor o igual
acero. Si las observadas y teóricas se parecen entonces el valor será
pequeño.
 Estadístico: Medida de discrepancia


Procedimiento (1)
Pruebas de Bondad de Ajuste
Prueba Chi Cuadrado
 Hallar la tabla de frecuencias para los n datos con k intervalos



 Para cada uno de los k intervalos obtenidos hallar la frecuencia
observada O
i
.
 Se propone una distribución de probabilidad de acuerdo con la forma
de la tabla.
 Con la distribución candidata calcular frecuencia esperada de cada
intervalo E
i
.
 Si dicha frecuencia es menor a 5, agrupar.


¹
´
¦
+
= =
caso otro en ) log( 2 . 3 1
grande muy es no n si
intervalos de Número
n
n
k
Observaciones
Pruebas de Bondad de Ajuste
Prueba Chi Cuadrado
 Si la distribución candidata es discreta entonces pi = p(xi) = P(X=xi) y cada
valor en Rx de la V.A debería ser un intervalo.
 Si la distribución es continua utilizar la diferencia de acumuladas.
 Para cada clase:


 Estadístico teórico: χ
2

α, k`-r-1
donde r es el número de parámetros
estimados y k’ es el número final de intervalos luego de revisar que
ninguno tenga frecuencia esperada menor a 5
 Se acepta Ho, si X2 observado ≤ X2 teórico
( )
E
E O
X
i
i
i i
÷
=
2
2
Procedimiento (2)
0.46 0.67 0.12 0.21 0.44 0.87 0.89 0.25 0.9 0.34
0.22 0.74 0.94 0.74 0.81 0.7 0.64 0.79 0.76 0.83
0.99 0.02 0.52 0.73 0.41 0.56 0.67 0.77 0.99 0.96
0.78 0.05 0.45 0.31 0.05 0.56 0.82 0.17 0.3 0.47
0.39 0.42 0.65 0.37 0.93 0.82 0.19 0.23 0.71 0.79
0.18 0.49 0.1 0.42 0.66 0.05 0.46 0.99 0.17 0.99
0.75 0.49 0.69 0.34 0.28 0.81 0.01 0.54 0.51 0.37
0.73 0.05 0.96 0.58 0.94 0.3 0.97 0.56 0.43 0.72
0.79 0.62 0.4 0.19 0.64 0.4 0.24 0.84 0.39 0.06
0.29 0.78 0.6 0.11 0.47 0.64 0.88 0.97 0.26 0.18
Verifique si los datos siguientes siguen una distribución uniforme empleando una prueba Chi-Cuadrado
n = 100
k = raíz(100) = 10
Se toman 10 intervalos, se calcula el valor
máximo y mínimo observados en los datos:
Mínimo = 0.01
Máximo = 0.99
Rango de valores =0.99 -0.01 = 0.98
Amplitud de cada intervalo = Rango/k =
0.98/10 = 0.098
Intervalo
Límite de Clase
Inferior
Límite de Clase
Superior
Oi
Ei
Oi - Ei
(Oi - Ei)
2

(O
i
- E
i
)
2

Ei
1
2
3
4
5
6
7
8
9
10

0.01
0.108
0.206
0.304
0.402
0.500
0.598
0.696
0.794
0.892
0.108
0.206
0.304
0.402
0.500
0.598
0.696
0.794
0.892
0.99
0.46 0.67 0.12 0.21 0.44 0.87 0.89 0.25 0.9 0.34
0.22 0.74 0.94 0.74 0.81 0.7 0.64 0.79 0.76 0.83
0.99 0.02 0.52 0.73 0.41 0.56 0.67 0.77 0.99 0.96
0.78 0.05 0.45 0.31 0.05 0.56 0.82 0.17 0.3 0.47
0.39 0.42 0.65 0.37 0.93 0.82 0.19 0.23 0.71 0.79
0.18 0.49 0.1 0.42 0.66 0.05 0.46 0.99 0.17 0.99
0.75 0.49 0.69 0.34 0.28 0.81 0.01 0.54 0.51 0.37
0.73 0.05 0.96 0.58 0.94 0.3 0.97 0.56 0.43 0.72
0.79 0.62 0.4 0.19 0.64 0.4 0.24 0.84 0.39 0.06
0.29 0.78 0.6 0.11 0.47 0.64 0.88 0.97 0.26 0.18
8
0.46 0.67 0.12 0.21 0.44 0.87 0.89 0.25 0.9 0.34
0.22 0.74 0.94 0.74 0.81 0.7 0.64 0.79 0.76 0.83
0.99 0.02 0.52 0.73 0.41 0.56 0.67 0.77 0.99 0.96
0.78 0.05 0.45 0.31 0.05 0.56 0.82 0.17 0.3 0.47
0.39 0.42 0.65 0.37 0.93 0.82 0.19 0.23 0.71 0.79
0.18 0.49 0.1 0.42 0.66 0.05 0.46 0.99 0.17 0.99
0.75 0.49 0.69 0.34 0.28 0.81 0.01 0.54 0.51 0.37
0.73 0.05 0.96 0.58 0.94 0.3 0.97 0.56 0.43 0.72
0.79 0.62 0.4 0.19 0.64 0.4 0.24 0.84 0.39 0.06
0.29 0.78 0.6 0.11 0.47 0.64 0.88 0.97 0.26 0.18
8
0.46 0.67 0.12 0.21 0.44 0.87 0.89 0.25 0.9 0.34
0.22 0.74 0.94 0.74 0.81 0.7 0.64 0.79 0.76 0.83
0.99 0.02 0.52 0.73 0.41 0.56 0.67 0.77 0.99 0.96
0.78 0.05 0.45 0.31 0.05 0.56 0.82 0.17 0.3 0.47
0.39 0.42 0.65 0.37 0.93 0.82 0.19 0.23 0.71 0.79
0.18 0.49 0.1 0.42 0.66 0.05 0.46 0.99 0.17 0.99
0.75 0.49 0.69 0.34 0.28 0.81 0.01 0.54 0.51 0.37
0.73 0.05 0.96 0.58 0.94 0.3 0.97 0.56 0.43 0.72
0.79 0.62 0.4 0.19 0.64 0.4 0.24 0.84 0.39 0.06
0.29 0.78 0.6 0.11 0.47 0.64 0.88 0.97 0.26 0.18
10
0.46 0.67 0.12 0.21 0.44 0.87 0.89 0.25 0.9 0.34
0.22 0.74 0.94 0.74 0.81 0.7 0.64 0.79 0.76 0.83
0.99 0.02 0.52 0.73 0.41 0.56 0.67 0.77 0.99 0.96
0.78 0.05 0.45 0.31 0.05 0.56 0.82 0.17 0.3 0.47
0.39 0.42 0.65 0.37 0.93 0.82 0.19 0.23 0.71 0.79
0.18 0.49 0.1 0.42 0.66 0.05 0.46 0.99 0.17 0.99
0.75 0.49 0.69 0.34 0.28 0.81 0.01 0.54 0.51 0.37
0.73 0.05 0.96 0.58 0.94 0.3 0.97 0.56 0.43 0.72
0.79 0.62 0.4 0.19 0.64 0.4 0.24 0.84 0.39 0.06
0.29 0.78 0.6 0.11 0.47 0.64 0.88 0.97 0.26 0.18
9
0.46 0.67 0.12 0.21 0.44 0.87 0.89 0.25 0.9 0.34
0.22 0.74 0.94 0.74 0.81 0.7 0.64 0.79 0.76 0.83
0.99 0.02 0.52 0.73 0.41 0.56 0.67 0.77 0.99 0.96
0.78 0.05 0.45 0.31 0.05 0.56 0.82 0.17 0.3 0.47
0.39 0.42 0.65 0.37 0.93 0.82 0.19 0.23 0.71 0.79
0.18 0.49 0.1 0.42 0.66 0.05 0.46 0.99 0.17 0.99
0.75 0.49 0.69 0.34 0.28 0.81 0.01 0.54 0.51 0.37
0.73 0.05 0.96 0.58 0.94 0.3 0.97 0.56 0.43 0.72
0.79 0.62 0.4 0.19 0.64 0.4 0.24 0.84 0.39 0.06
0.29 0.78 0.6 0.11 0.47 0.64 0.88 0.97 0.26 0.18
12
0.46 0.67 0.12 0.21 0.44 0.87 0.89 0.25 0.9 0.34
0.22 0.74 0.94 0.74 0.81 0.7 0.64 0.79 0.76 0.83
0.99 0.02 0.52 0.73 0.41 0.56 0.67 0.77 0.99 0.96
0.78 0.05 0.45 0.31 0.05 0.56 0.82 0.17 0.3 0.47
0.39 0.42 0.65 0.37 0.93 0.82 0.19 0.23 0.71 0.79
0.18 0.49 0.1 0.42 0.66 0.05 0.46 0.99 0.17 0.99
0.75 0.49 0.69 0.34 0.28 0.81 0.01 0.54 0.51 0.37
0.73 0.05 0.96 0.58 0.94 0.3 0.97 0.56 0.43 0.72
0.79 0.62 0.4 0.19 0.64 0.4 0.24 0.84 0.39 0.06
0.29 0.78 0.6 0.11 0.47 0.64 0.88 0.97 0.26 0.18
7
0.46 0.67 0.12 0.21 0.44 0.87 0.89 0.25 0.9 0.34
0.22 0.74 0.94 0.74 0.81 0.7 0.64 0.79 0.76 0.83
0.99 0.02 0.52 0.73 0.41 0.56 0.67 0.77 0.99 0.96
0.78 0.05 0.45 0.31 0.05 0.56 0.82 0.17 0.3 0.47
0.39 0.42 0.65 0.37 0.93 0.82 0.19 0.23 0.71 0.79
0.18 0.49 0.1 0.42 0.66 0.05 0.46 0.99 0.17 0.99
0.75 0.49 0.69 0.34 0.28 0.81 0.01 0.54 0.51 0.37
0.73 0.05 0.96 0.58 0.94 0.3 0.97 0.56 0.43 0.72
0.79 0.62 0.4 0.19 0.64 0.4 0.24 0.84 0.39 0.06
0.29 0.78 0.6 0.11 0.47 0.64 0.88 0.97 0.26 0.18
10
0.46 0.67 0.12 0.21 0.44 0.87 0.89 0.25 0.9 0.34
0.22 0.74 0.94 0.74 0.81 0.7 0.64 0.79 0.76 0.83
0.99 0.02 0.52 0.73 0.41 0.56 0.67 0.77 0.99 0.96
0.78 0.05 0.45 0.31 0.05 0.56 0.82 0.17 0.3 0.47
0.39 0.42 0.65 0.37 0.93 0.82 0.19 0.23 0.71 0.79
0.18 0.49 0.1 0.42 0.66 0.05 0.46 0.99 0.17 0.99
0.75 0.49 0.69 0.34 0.28 0.81 0.01 0.54 0.51 0.37
0.73 0.05 0.96 0.58 0.94 0.3 0.97 0.56 0.43 0.72
0.79 0.62 0.4 0.19 0.64 0.4 0.24 0.84 0.39 0.06
0.29 0.78 0.6 0.11 0.47 0.64 0.88 0.97 0.26 0.18
15
0.46 0.67 0.12 0.21 0.44 0.87 0.89 0.25 0.9 0.34
0.22 0.74 0.94 0.74 0.81 0.7 0.64 0.79 0.76 0.83
0.99 0.02 0.52 0.73 0.41 0.56 0.67 0.77 0.99 0.96
0.78 0.05 0.45 0.31 0.05 0.56 0.82 0.17 0.3 0.47
0.39 0.42 0.65 0.37 0.93 0.82 0.19 0.23 0.71 0.79
0.18 0.49 0.1 0.42 0.66 0.05 0.46 0.99 0.17 0.99
0.75 0.49 0.69 0.34 0.28 0.81 0.01 0.54 0.51 0.37
0.73 0.05 0.96 0.58 0.94 0.3 0.97 0.56 0.43 0.72
0.79 0.62 0.4 0.19 0.64 0.4 0.24 0.84 0.39 0.06
0.29 0.78 0.6 0.11 0.47 0.64 0.88 0.97 0.26 0.18
9
12
Cada intervalo tiene una probabilidad Esperada o Teòricade 1/k = 10
pues se esta probando si ajustan a una distribución exponencial. Ei
se expresa en termino de frecuencia por lo tanto es el producto de la
probabilidad y el número total de datos analizados
10
10
10
10
10
10
10
10
10
10
-2
-2
0
-1
2
-3
0
5
-1
2
Como no hay ningún Ei menor que 5 no es necesario agrupar
intervalos k´ = k = 10
4
4
0
1
4
9
0
25
1
4
0.4
0.4
0
0.1
0.4
0.9
0
2.5
0.1
0.4
Total = 5.2
El valor de tablas que corresponde a χ
2

0.05, 10-2-1
es 6.346




Como χ
2
observado (5.2) es menor que χ
2
teórico (6.346) no se rechaza Ho, es decir no hay
evidencias para rechazar que la muestra sigue una distribución uniforme entre 0.01 y 0.99

Agenda

Generación de números y variables aleatorias 1. Generación de Números Aleatorios 2. Pruebas de aleatoriedad. 3. Generación de variables aleatorias 4. Pruebas de bondad de ajuste: Kolmogorov - Smirnov y Chi cuadrado (2)

Lecturas: Ross, Cap. 3, 4 y 5 Banks, Cap. 8 y 9 Law, Cap. 6

Generación de variables aleatorias
Métodos y variables generadas
Tomando en cuenta los números aleatorios generados previamente Ri que siguen una distribución uniforme, es posible emplear método que permitan generar variables aleatorias.

¿Qué métodos existen? Existen métodos generales así como métodos particulares para distribuciones específicas ¿Qué tipo de variables aleatorias pueden generarse?
Mayoritariamente variables aleatorias continuas y discretas, aunque algunos métodos permiten generar variables que no pertenecen enteramente a ninguna de las categorías mencionadas previamente ¿Qué métodos emplearemos  Método de la transformada inversa  Método de Aceptación y rechazo  Método de Convolución

1 F ( x)  R ó x  F ( R) 1 R x=F -1 (R) x . Una de las características de F(x) es que se encuentra definida en el intervalo (0.1). El número X correspondiente a la abscisa (eje x) del punto de intersección. con el cual se ingresa por la ordenada (eje y) y se intercepta la curva F(x). es un número aleatorio que tiene la distribución deseada. se puede generar un número aleatorio uniforme R ~ U(0.1).Generación de variables aleatorias Método de la Transformada Inversa El método de la transformada inversa utiliza la distribución acumulada F(x) de la distribución que se desea simular. Por tanto.

Generación de variables aleatorias Método de la Transformada Inversa Distribuciones continuas La función de probabilidad acumulada F(x) para una distribución continua presenta una gráfica continua. OBS: F(x) es la función de probabilidad acumulada f(x) para las dist. continuas se llama función de densidad F(x) se calcula integrando f(x) 1 F ( x)  R ó x  F ( R) 1 R x=F -1 (R) x . En este caso se aplica directamente la función inversa sobre Ri para calcular el valor de la variable.

se procede a tomar como la inversa de R. al menor x. Dado un R. tal que F(x) = R OBS: F(x) es la función de probabilidad acumulada f(x) para las dist. continuas se llama función de densidad F(x) se calcula como la sumatoria de f(x) desde 0 hasta x R1 R2 x2 x1 . debido a que por estas discontinuidades no tiene función inversa propiamente dicha.Generación de variables aleatorias Método de la Transformada Inversa Distribuciones discretas La función de probabilidad acumulada F(x) para una distribución continua presenta una gráfica discontinua. En este caso se emplea la función inversa generalizada.

donde p : probabilidad de éxito Método de generación: 1.1) 2. en caso contrario x = 0 . Si R <= p x = 1 . Generar un número aleatorio R ~ U(0.1.Generación de variables aleatorias Método de la Transformada Inversa Distribución de Bernoulli Notación: X ~ Bernoulli (p) Función de probabilidad: P( x) p 1 p  x 1 x . x  0.

1) 2. si x < a .b] .Generación de variables aleatorias Método de la Transformada Inversa Distribución Uniforme Notación: X ~ Uniforme(a. si x > b Método de generación: 1. si x Є [a. .b) Función de probabilidad: F(x) = 0 (x-a)/(b-a) 1 . Hallar X = a + (b-a)*R. Generar un número aleatorio R ~ U(0.

1) 2.Generación de variables aleatorias Método de la Transformada Inversa Distribución Exponencial Notación: X ~ Exponencial(b) Función de probabilidad: F(x)= 1 – e-bx . Hallar X = (-1/b)*ln(1 – R) . x ≥ 0 Método de generación: 1. Generar un número aleatorio R ~ U(0.

B) Función de probabilidad: F(x) = 1 – e-(x/α)^β Método de generación: 1. Hallar X = α (.1) 2.ln( 1 – R))^(1/β) . Generar un número aleatorio R ~ U(0.Generación de variables aleatorias Método de la Transformada Inversa Distribución Weibull Notación: X ~ Weibull(a.

Generar un número aleatorio R ~ U(0. Hallar .1) 2.(x-c)2/[(c-b)(c-a)] para b≤x≤c Método de generación: 1.c) Función de probabilidad: F(x)= (x-a)2 / [(b-a)(c-a)] para a≤x≤b 1 .b.Generación de variables aleatorias Método de la Transformada Inversa Distribución Triangular Notación: X ~ Triangular(a.

5 Empleando entonces los aleatorios dados: R1=0.37 0.96 X2 = (2(0.5 = 1.5 X1 = (2(0.46 < 0.01 < 0. R <= (1-0)/(2-0)  (2R) 0.5 .R <= 0. y c=2 empleando los siguientes números aleatorios R 0.5 = 0.5 R2=0.04 < 0.(2-2R) 0.46 0.58 La inversa en función de R de la distribución triangular es: Reemplazando los parámetros: 0 +((1-0)(2-0) R ) 0.04 0.58 >0.[(2-1)(2-0)(1-R)] 0.37)) 0.5 = 0.5 X= 2 .5 R3=0.R <= (1-0)/(2-0)  2 .Genere variables aleatorias triangulares con parámetros a=0.01 0.5 R5=0. b=1.28 R4=0.5 = 0.86 X3 = (2(0.04)) 0.5 .08 .01)) 0.14 X5 = 2-(2(1-0.5 X4 = (2(0.R >= 0.46)) 0.58)) 0.5 = 0.37 < 0.5 .5 .

Generación de variables aleatorias Método de Aceptación y Rechazo El método de aceptación y rechazo utiliza la función de densidad f(x) de la distribución que se desea generar. necesariamente genera de 3. es aceptación x. es decir/ valor de una variable aleatoria. se rechaza de la curva todo x. Si R cumple con la regla un C. que la acote superiormente. el eje x para números el algoritmo acota inferiormente a la generar ungenerar la cantidad hasta valor de la variable función. Generar par un valores número números que aleatorios dicha entre [0. Procedimiento a seguir: 1. que la acote por y derecha. dicho número. no acoten R funcion f(x): aleatorio generados. para todo x. que la acote por la izquierda .1]. y C f(x) R A x B x . entoncesen la región x cae el A. de variables deseadas. de para f(x)). encima x≤ B lo contrario. Generalmente. la curva sigue la de decir A ≤ (debajo distribución f(x))requerida la es aceptado. se necesitan en promedio. Obtener tres de Cada 2. tres Se repite aleatorios 4. transformación. o de rechazo (por es decir B. aleatoria. Por lo tanto. R ≤ f(x) C ≥ f(x) Depende sipara todo x valor dede C.

El método entonces requiere que la variable aleatoria a ser generada Yi. Gamma.. … ) 2. pueda expresarse como una suma lineal ponderada de otras variables aleatorias Xi. Se obtiene un valor de la variable por suma lineal de las variables aleatorias componentes. se generan las variables aleatorias componentes (x1. 3.xk) usando alguno de los métodos anteriores. Y = b1*x1+ b2*x2 +…+bk*xk bi es una constante que refleja la ponderación de la variable xi en la combinación lineal. Variables que se generan con este método: Normal.R2. Binomial.Generación de variables aleatorias Método de Convolución El método de convolución permite generar variables aleatorias en función a una combinación lineal ponderada de otras variables aleatorias...Rk. Erlang . dependiendo del método a utilizar) de los números aleatorios.. Se generan números aleatorios (R1..x2. Con uno (o mas.. Procedimiento a seguir: 1.. Poisson.

Generación de variables aleatorias Método de Convolución Distribución Binomial Notación: X ~ B (n. en c.n   .. X2 ...  donde p : probabilidad de éxito Método de generación: 1. x  0...1. Generar Y como la suma de (X1 + X2 + ..Xn ~ Bernoulli (p) 2... + Xn ) . Generar las variables X1 ..........c..p) Función de probabilidad:  n  x   p P( x)   x     0  1 p n x  ...

   en c. Y  x ~ Poisson( ) .1. El valor de Y generado.. 3. 2. Si t ≤ T entonces Y = Y+1 5. hasta que t > T. Se inicializa x=0 y t=0.  Donde x : número de eventos que ocurren en un intervalo de tiempo λ : número promedio de eventos en un tiempo dado 1 ~ Exp   1   Método de generación: 1. Se genera una variable aleatoria X~ exp(1/ λ). Se repite el algoritmo a partir del 2do punto. sigue una distribución Poisson...2.c. Se actualiza t = t + X 4.Generación de variables aleatorias Método de Convolución Distribución Poisson Notación: X ~ P (λ) Función de probabilidad:  x   e P( x)   x!  0   x  0.

σ) Método de generación: 1. 4. ya que la media de cada variable X es ½ y la varianza es igual a 1/12. σ).1). Donde Z es una variable normal estándar con media igual 0 y varianza igual a 1. Para generar una variable Y~ N( μ. 2. utilizar la regla de transformación Y = (Z * σ) + μ . Se generan doce números aleatorios X con distribución U(0. Generar Z como la suma Z = ( X1 + X2 + …… + X12) – 6 3. Esto se obtiene.Generación de variables aleatorias Método de Convolución Distribución Normal Notación: X ~ N( μ.

Para generar una variable chi-cuadrado de grado de libertad “n”. Elevar al cuadrado cada variable Z generada. . 3. que son variables aleatorias normales estándar. suma n variables Z 2. Generar Z.r  Zi i 1 k 2 Por ejemplo:  Z Z Z Z 2 4 2 2 2 2 1 3 2 4 Método de generación: 1.Generación de variables aleatorias Método de Convolución Distribución Chi cuadrado    2 k 2 c rític o  . 2.

Generación de variables aleatorias Métodos para la Distr. Normal Estándar Notación: X ~ N (0. Propuesta de Marsaglia-Brax 2.1) Función de probabilidad: 2 F ( x)    x 1 2 e  t 2 dt Dado que la inversa resulta complicada de calcular se emplean otros métodos en este caso particular. Los métodos son: 1. Propuesta de Box Muller .

Se generan dos números aleatorios R1 y R2. entonces se calcula Zi = vi * [ -2 ln(s) / s] 0.Generación de variables aleatorias Métodos para la Distr. 4. Se calcula v1= 2R1 – 1 y v2=2R2 – 1 Se calcula s = v1 2 + v2 2 Si s≤1. 3. Normal Estándar Propuesta de Marsaglia Brax Método de generación: 1. 2.5 OBS: Los Zi que se obtiene bajo este método son variables aleatorias normales estándar .

 ) .Generación de variables aleatorias Métodos para la Distr. Generamos dos números aleatorios R1 y R2. obteniendo el valor de Z1 ó Z2 (usar solo una de las dos fórmulas) Z  Cos   2 ln( R )Cos(2 R ) 1 2  1       ~ N (0.1)    Sen   2 ln( R1) Sen(2 R 2)  Z 2   OBSERVACIÓN: A partir de Zi (obtenidos por cualquiera de ambos métodos) podemos hallar una variable que se ajuste a una distribución N ( . Normal Estándar Propuesta de Box Muller Método de generación: 1. Sabemos que Z  X    Despejando obtenemos: x  Z   .

4459 0.9458 0.9935 0.9358 .8648 0.3551 0.7798 0. Orden R Orden R 1 2 3 4 5 6 7 8 0.0630 2.Ejercicios Propuestos: 1.8578 0. Muestre sus cálculos y use en orden los números aleatorios.9019 9 10 11 12 13 14 15 16 0. Usando el algoritmo discutido en clase y los siguientes números aleatorios.4518 0.8944 0.35.7891 0.3161 0.3652 0.1870 0.4407 0.6028 0.8240 0.6713 0.8250 0.0586 0.0819 0.7983 0.8486 0.6402 0.8845 0. genere tres valores de una variable aleatoria Poisson con media 1. a partir de los siguientes números aleatorios (por par de columnas) 0.7132 0. Generar 10 variables aleatorias normales (utilizando ambos métodos) con parámetros  = 5 y  = 1.4240 0.3291 0.0377 0.4347 0.9294 0.0717 0.5903 0.7855 0.

Pruebas de Bondad de Ajuste Definición Son pruebas de hipótesis que permiten validar si la distribución de la frecuencia observada de conjunto de datos puede aproximarse a una distribución teórica dada. Las pruebas de hipótesis que emplearemos son: Kolmogorov Smirnov Chi Cuadrado . Las hipótesis que emplean estas pruebas son: H0 : La variable aleatoria se ajusta a la distribución candidata con los parámetros estimados H1: La variable aleatoria no se ajusta.

Pruebas de Bondad de Ajuste Prueba Kolmogorov-Smirnov (K-S) Características  No depende de una distribución específica.  Se puede aplicar para todo tamaño de muestras.  Calcula las diferencias en valor absoluto entre las frecuencias acumuladas relativas observadas y las esperadas en cada clase.  Aplicable solamente a variables aleatorias continuas.  Se busca la mayor diferencia (Dmax) y se compara con valor crítico de tablas. pues es un supuesto de la prueba. . pequeñas o grandes  Otra ventaja es que permite construir límites de confianza para la distribución acumulada completa. no se sabe a priori la forma de la distribución de donde se sacan los datos.

 Se divide cada frecuencia observada por el número total de datos “n”.Pruebas de Bondad de Ajuste Prueba Kolmogorov-Smirnov (K-S) Procedimiento (1)  Se halla una tabla de frecuencias para los “n” datos históricos. Se sugiere tomar k intervalos donde k siga la regla siguiente:  n si n no es muy grande Número de intervalos  k   1  3.  Se propone una distribución de probabilidad de acuerdo con la forma de la tabla de frecuencias obtenida. (POi)  Se calcula la probabilidad acumulada observada de cada intervalo (OAi).…k. (Elaborar histograma) . A este resultado se le llama la probabilidad observada del intervalo i.2 log(n) en otro caso  Para cada uno de los “k” intervalos obtenidos. para i=1. se halla la frecuencia observada Oi.

 Se calcula la probabilidad acumulada esperada (EAi) para cada intervalo de clase  Se calcula la diferencia absoluta entre OAi y EAi para cada intervalo y se selecciona la máxima diferencia. Donde: Dmáx = | OAi – EAi| máx OAi: frecuencia acumulada relativa de la clase i observada EAi: frecuencia acumulada relativa de la clase i esperada  El estimado Dmax se compara con un valor límite porporcionado en tabla.Pruebas de Bondad de Ajuste Prueba Kolmogorov-Smirnov (K-S) Procedimiento (2)  Con la distribución propuesta se calcula la probabilidad esperada para cada uno de los intervalos (PEi). Si el estimador Dmax es menor o igual al valor límite de la tabla. . llamándola Dmax. con n datos y a un nivel de confiabilidad de (1 – α). entonces no se puede rechazar que la información histórica sigue la distribución propuesta.

65 16.108 0.99 9.217 Como Dmax = 0.08 11.87 18.01 5.000 Dmáx = | OAi – EAi| máx = 0.22 12.99 20.350 0.17 -> Se rechaza Ho Es decir hay evidencias para rechazar la hipótesis nula que afirma que la muestra sigue una distribución exponencial .15 16.125 7.863 20.11 18 19 7.375 0.863 2.017 0.56 10 18 14.200 0.075 0.750 0.41 1 1 8 11 8 8 11 12 0.03 15.46 0.6 17.017 0.52 8.625 0.53 20.125 Frecuencia Acumulada Observada Frecuencia Acumulada Teórica Estadístico K-S Estadístico es el valor absoluto de la diferencia entre la Observada Acumulada y la Acumulada Teórica Límite de Clase Inferior Límite de Clase Superior Número de Datos en Clase Frecuencia Relativa Observada 0.167 0.17 17.5775 5.500 0.315 17. con probabilidad 1/k = 1/8 = 0.125 7.03 Máximo =20.483 0.39 9.04 12 17 6.000 0.142 0.18 18.768 15.183 0.74  8 Se toman 8 intervalos.12 7.45 11.83 16.69 19.217 > Valor crítico de tablas = 0.42 15.5775 5. se calcula el valor máximo y mínimo observados en los datos: Mínimo = 0.217 0.36 5.41 Rango de valores =20.05 = 0.38 Amplitud de cada intervalo = Rango/k = 20.6725 10.38/8 =2.51 19.033 0.58 8.03 = 20.66 6.315 17.42 7.017 0.71 16.800 1.22 12.51 8.133 0.875 1.000 0.97 16 15 14.617 0.Verifique si los datos siguientes siguen una distribución uniforme empleando una prueba K-S 12.57 5.31 15.73 6.1 9.03 2.21 12.150 0.133 0.183 0.72 11.8 15.03 8.79 18.17 Dividir cada término entre n La frecuencia relativa de la uniforme hace que cada intervalo sea equiprobable.46 10.83 19.133 0.5475 Valor crítico de tablas para 60 datos y a 0.47 19.41 6.768 15.04 14.208 0.41 8.250 0.33 11.6725 10.41 -0.76 5.125 0.79 14 13 n = 60 k = raíz(60) = 7.83 12.133 0.

 Formaliza la idea intuitiva de comparar el histograma de la información con la forma de la densidad o masa candidata.  Intuitivamente: compara frecuencias observadas contra frecuencias teóricas o esperadas mediante.Pruebas de Bondad de Ajuste Prueba Chi Cuadrado Características  Para probar hipótesis que muestra aleatoria de tamaño n de la V.  Válida para tamaños de muestra grande. Si las observadas y teóricas se parecen entonces el valor será pequeño.  Estadístico: Medida de discrepancia . para distribuciones discretas o continuas.A X sigue una distribución específica. Dicho estadístico es mayor o igual acero.

2 log(n) en otro caso  Para cada uno de los k intervalos obtenidos hallar la frecuencia observada Oi.Pruebas de Bondad de Ajuste Prueba Chi Cuadrado Procedimiento (1)  Hallar la tabla de frecuencias para los n datos con k intervalos  n si n no es muy grande Número de intervalos  k   1  3. .  Se propone una distribución de probabilidad de acuerdo con la forma de la tabla.  Si dicha frecuencia es menor a 5.  Con la distribución candidata calcular frecuencia esperada de cada intervalo Ei. agrupar.

k`-r-1  Se acepta Ho. .Pruebas de Bondad de Ajuste Prueba Chi Cuadrado Procedimiento (2)  Para cada clase: X  Estadístico teórico: χ2 2 i  Oi  Ei E i 2 donde r es el número de parámetros estimados y k’ es el número final de intervalos luego de revisar que ninguno tenga frecuencia esperada menor a 5 α. si X2 observado ≤ X2 teórico Observaciones  Si la distribución candidata es discreta entonces pi = p(xi) = P(X=xi) y cada valor en Rx de la V.A debería ser un intervalo.  Si la distribución es continua utilizar la diferencia de acumuladas.

56 0.58 0.108 0.11 0.81 0.71 0.78 0.06 Rango de valores =0.1 0.5 0.67 0.98 0.23 0.46 0.05 0.21 0.Ei)2 Ei 0.83 k = raíz(100) = 10 0.44 0.18 Amplitud de cada intervalo = Rango/k = Cada intervalo tiene una probabilidad Esperada o Teòricade 1/k = 10 0.29 0.598 0.65 0.87 0.37 0.22 0.3 0.12 0.4 0.34 0.88 0.3 0.25 0.76 0.892 0.98/10 = 0.99 Mínimo = 0. se calcula el valor 0.01 0.42 0.696 0.43 0.47 0.37 Máximo = 0.73 0.2 2 observado (5.64 0.02 0.346) no se rechaza Ho.01 y 0.47 0.69 0.01 0.99 8 8 10 9 12 7 10 15 9 12 10 10 10 10 10 10 10 10 10 -2 -2 0 -1 2 -3 0 5 -1 4 4 0 1 4 9 0 25 1 0.99 10 2 .402 0.1 0.346 (Oi .73 0.82 0.05 0.94 0. es decir no hay Como χ evidencias para rechazar que la muestra sigue una distribución uniforme entre 0.81 0.66 0.892 0.79 0.49 0.99 0.39 0.500 0.304 0.598 0.99 0.49 0.05.Ei) 2 0.4 Total = 5.99 0.46 0.45 0.51 0.64 0.17 0.01 0.4 0.99 0.64 0.1 2 3 4 5 6 7 8 9 10 4 0.E i (Oi .97 0.79 0.52 0.696 0.97 0.4 0 0.67 0.77 0.098 pues se esta probando si ajustan a una distribución exponencial.24 0.26 0.206 0.99 -0.794 0.82 0. 10-2-1 Oi .28 0.74 0.4 0.304 0.9 0 2.794 0.9 0.96 Se toman 10 intervalos.41 0.39 0.108 0.6 0.Verifique si los datos siguientes siguen una distribución uniforme empleando una prueba Chi-Cuadrado 0.05 0.31 0.17 0.19 0.18 0.78 0. Ei se expresa en termino de frecuencia por lo tanto es el producto de la probabilidad y el número total de datos analizados Como no hay ningún Ei menor que 5 no es necesario agrupar intervalos k´ = k = 10 Intervalo 1 Límite de Clase Límite de Clase Inferior Superior Oi Ei El valor de tablas que corresponde a χ2 es 6.89 0.96 0.19 0.34 n = 100 0.62 0.79 máximo y mínimo observados en los datos: 0.72 0.206 0.2) es menor que χ2 teórico (6.05 0.56 0.54 0.42 0.75 0.7 0.93 0.402 0.74 0.4 0.01 = 0.94 0.500 0.84 0.56 0.