You are on page 1of 37

Prácticas de

Simulación con Excel


Introducción

Este documento contiene los enunciados de las prácticas a resolver por


los alumnos de la asignatura SIMULACION

El formato de presentación será Excel, en concreto en un único libro que


contendrá una única hoja para cada uno de los problemas que se hayan re-
suelto.
El nombre de fichero Excel será:
apellido1_apellido2_nombre_EA1.xls
sin acentos ni mayúsculas, por ejemplo:
gomez_perez_jesus_EA1.xls
cada hoja se nombrará como P# siendo # el nº del problema que se resuelve
en dicha hoja.

el enunciado concreto del problema dependerá del nº del DNI del alumno.

Los enunciados que hay que resolver aparecen en la tabla siguiente:


Enunciados Carácter
Del nº 1 al nº 10 (ambos incluidos) Obligatorio
Del nº 11 al nº 17 (ambos incluidos) Hay que elegir 5
Nº 18 Los que opten a Matricula de Honor

2
1) Generar una muestra de tamaño n=1000 de la distribución enunciada. Obtener la
función de probabilidad, la función de distribución, el histograma de ambas, y
comparar las frecuencias observadas (empíricas) con las que cabría esperar (teó-
ricas).
Caso a resolver DNI acabado en
Uniforme discreta U[1;6] 0,1
Poisson (media=2) 2,3
Poisson (tasa=1 cada 12 minutos) 4,5
Binomial (n=12; p=0,35) 6,7
Binomial negativa (r=2, p=1/12) 8,9
Poisson (media=12) Modelo

Guía:
Excel cuenta con una función para la distribución y densidad de Poisson,
cuenta también con la posibilidad de obtener muestras aleatorias así distribui-
das (Herramientas + Análisis de Datos + Generación de números aleatorios).
En cualquier caso es posible obtener números que se distribuyan según
una Poisson aleatorios utilizando la fórmula siguiente:
BINOM.CRIT(λ/0,001;0,001;ALEATORIO())

Utilizaremos la primera opción llamando


al módulo de Análisis de Datos

3
Una vez obtenidos los números aleatorios (que hemos
colocado en la columna A) procedemos al análisis de la muestra
usando la función Frecuencia. Antes creamos la columna X,
que recogerá los posibles valores de la variable: empezamos en
0 y arrastramos creando una serie hasta un número suficiente
de valores, por ejemplo 3 sigmas a la derecha de la media, es
decir
12 + (3·120,5)≈20

4
Creamos también la columna N, en
la que pondremos el resultado de usar
Frecuencia, para que recoja la frecuencia
absoluta de los datos

A continuación creamos una nueva columna (f) para


recoger las frecuencias relativas, lo que haremos dividiendo
las absolutas entre el número total de observaciones que
habremos calculado en un celda aparte sumando las
frecuencias relativas.

Con estos datos ya podemos crear los gráficos de la


muestra.

140
N

120

100

80

60

40

20

0
0

10

11

12

13

14

15

16

17

18

19

20

5
Falta compararlos con las frecuencias teóricas. Para saberlas usamos la
función que tiene Excel relacionada con la probabilidad de una v.a. de Poisson:

Recordamos que la función de cuantía de la distribución Poisson(λ) es:


e −λ λ X
p =
(x) x!
La función de distribución es:
λnn= X
F =e ∑ −λ

(x) n = 0 n!

La función de Excel que nos da ambas es:


POISSON(x ; media ; acumulado)

• x el valor que toma la variable;


• media, el parámetro λ;
• acumulado es un valor lógico que determina la forma de la función. Si el ar-
gumento acumulado es VERDADERO, devuelve la función de distribución; si es
FALSO, devuelve la función de masa de probabilidad.

6
Para calcular las frecuencias absolutas multiplicamos las relativas por el
tamaño de la muestra.
El resultado final será parecido al siguiente:

X N f f T eó N teór
0 0 0,000 0,0000 0 140
1 0 0,000 0,0001 0 Comparación
2 1 0,001 0,0004 0
3 1 0,001 0,0018 2
4 9 0,009 0,0053 5 120
5 16 0,016 0,0127 13
6 30 0,030 0,0255 25
7 36 0,037 0,0437 43 100
8 76 0,077 0,0655 64
9 115 0,117 0,0874 86
10 94 0,096 0,1048 103
11 87 0,088 0,1144 113 80
12 110 0,112 0,1144 113
13 120 0,122 0,1056 104
14 88 0,089 0,0905 89 60
15 60 0,061 0,0724 71
16 59 0,060 0,0543 53
17 39 0,040 0,0383 38
18 20 0,020 0,0255 25 40
19 14 0,014 0,0161 16
20 9 0,009 0,0097 10
16 0,016 0,0000 20

0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Si bien, debido a los diferentes números aleatorios generados en cada
ordenador, los resultados no serán nuca idénticos a los anteriores.

7
2) Generar una muestra de tamaño n=1000 de la distribución enunciada. Obtener la
función de probabilidad, la función de distribución, el histograma de ambas, y
comparar las frecuencias observadas (empíricas) con las que cabría esperar (teó-
ricas).
Caso a resolver DNI acabado en
Uniforme continua U[-2;2] 0,1
Exponencial (media=12) 2,3
Exponencial (tasa=1 cada 12 minutos) 4,5
Beta (2,3) 6,7
Gamma (r=2, s=3) 8,9
Normal (μ=12; σ=2) Modelo

Guía:
A diferencia del ejemplo anterior, aunque podríamos hacerlo también
puesto que el módulo de números aleatorios también tiene la distribución Nor-
mal, generaremos nosotros la muestra aleatoria usando la función inversa que
tiene Excel.
Así en la primera celda de la primera columna introduciremos la fórmula
correspondiente

y la iremos arrastrando hasta la fila 1000, para generar la muestra de ese ta-
maño.
X N f
6,0 3 0,003
6,5 3 0,003
7,0 2 0,002
7,5 5 0,005
8,0 10 0,010
8,5 9 0,009
9,0 29 0,029
Haremos como en el ejercicio anterior la distribu- 9,5 42 0,042
ción de frecuencias observadas en la muestra, para lo 10,0 53 0,053
cual crearemos la columna N de posibles valores: 10,5 82 0,082
11,0 69 0,069
μ ± 3σ 11,5 93 0,093
12,0 79 0,079
y utilizaremos la función Frecuencia para contar las fre- 12,5 110 0,110
cuencias relativas 13,0 89 0,089
13,5 96 0,096
14,0 64 0,064
14,5 52 0,052
15,0 39 0,039
15,5 31 0,031
16,0 14 0,014
16,5 12 0,012
17,0 8 0,008
17,5 2 0,002
18,0 3 0,003
18,5 1 0,001
19,0 0 0,000
19,5 0 0,000
20,0 0 0,000

8
Para obtener la distribución de las frecuencias teóricas, utilizaremos la
función DISTR.NORM que tiene Excel:

Sin embargo, a diferencia de como haríamos en el caso de las


discretas calculamos primero la función de distribución (Acumulado=TRUE)
para estimar la función de densidad a partir de los valores de esta:

9
Una vez hecho esto tendremos tanto la distribución empíricas como la
teórica:
1000 1000,0

X N f F f N(Teó)
6,0 3 0,003 0,0013 0,0013 1,3
6,5 3 0,003 0,0030 0,0016 1,6
7,0 2 0,002 0,0062 0,0032 3,2
7,5 5 0,005 0,0122 0,0060 6,0
8,0 10 0,010 0,0228 0,0105 10,5
8,5 9 0,009 0,0401 0,0173 17,3
9,0 29 0,029 0,0668 0,0267 26,7
9,5 42 0,042 0,1056 0,0388 38,8
10,0 53 0,053 0,1587 0,0530 53,0
10,5 82 0,082 0,2266 0,0680 68,0
11,0 69 0,069 0,3085 0,0819 81,9
11,5 93 0,093 0,4013 0,0928 92,8
12,0 79 0,079 0,5000 0,0987 98,7
12,5 110 0,110 0,5987 0,0987 98,7
13,0 89 0,089 0,6915 0,0928 92,8
13,5 96 0,096 0,7734 0,0819 81,9
14,0 64 0,064 0,8413 0,0680 68,0
14,5 52 0,052 0,8944 0,0530 53,0
15,0 39 0,039 0,9332 0,0388 38,8
15,5 31 0,031 0,9599 0,0267 26,7
16,0 14 0,014 0,9772 0,0173 17,3
16,5 12 0,012 0,9878 0,0105 10,5
17,0 8 0,008 0,9938 0,0060 6,0
17,5 2 0,002 0,9970 0,0032 3,2
18,0 3 0,003 0,9987 0,0016 1,6
18,5 1 0,001 0,9994 0,0008 0,8
19,0 0 0,000 0,9998 0,0003 0,3
19,5 0 0,000 0,9999 0,0001 0,1
20,0 0 0,000 1,0000 0,0001 0,1

con lo cual ya podremos hacer la comparación gráfica de una y otras, tanto en


frecuencias absolutas:

10
como en frecuencias relativas:

o en las Funciones de distribución sin más que añadir una nueva columna, F, a
las frecuencias empríricas que recoja las sumas de éstas:

1000 1000,0
1,000
X N f F F f N(Teó)
6,0 1 0,001 0,001 0,0013 0,0013 1,3
0,900
6,5 1 0,001 0,002 0,0030 0,0016 1,6
7,0 4 0,004 0,006 0,0062 0,0032 3,2
0,800
7,5 2 0,002 0,008 0,0122 0,0060 6,0
8,0 12 0,012 0,020 0,0228 0,0105 10,5
0,700
8,5 20 0,020 0,040 0,0401 0,0173 17,3
9,0 24 0,024 0,064 0,0668 0,0267 26,7
0,600
9,5 42 0,042 0,106 0,1056 0,0388 38,8
10,0 55 0,055 0,161 0,1587 0,0530 53,0
0,500
10,5 65 0,065 0,226 0,2266 0,0680 68,0
11,0 85 0,085 0,311 0,3085 0,0819 81,9
0,400
11,5 94 0,094 0,405 0,4013 0,0928 92,8
12,0 94 0,094 0,499 0,5000 0,0987 98,7
0,300
12,5 107 0,107 0,606 0,5987 0,0987 98,7
13,0 88 0,088 0,694 0,6915 0,0928 92,8
0,200
13,5 82 0,082 0,776 0,7734 0,0819 81,9
14,0 57 0,057 0,833 0,8413 0,0680 68,0
0,100
14,5 56 0,056 0,889 0,8944 0,0530 53,0
15,0 42 0,042 0,931 0,9332 0,0388 38,8
0,000
15,5 30 0,030 0,961 0,9599 0,0267 26,7
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

16,0 24 0,024 0,985 0,9772 0,0173 17,3


16,5 7 0,007 0,992 0,9878 0,0105 10,5
17,0 3 0,003 0,995 0,9938 0,0060 6,0
17,5 3 0,003 0,998 0,9970 0,0032 3,2
18,0 1 0,001 0,999 0,9987 0,0016 1,6
18,5 0 0,000 0,999 0,9994 0,0008 0,8
19,0 0 0,000 0,999 0,9998 0,0003 0,3
19,5 1 0,001 1,000 0,9999 0,0001 0,1
20,0 0 0,000 1,000 1,0000 0,0001 0,1
0

11
3) Sea X una variable aleatoria definida de la forma siguiente
⎧ X1 ≈ Poisson (λ1 )

X = X1 + X 2 + X 3 ⇒ ⎨X 2 ≈ Poisson (λ 2 )
⎪ X ≈ Poisson (λ )
⎩ 3 3
a) Generar 1000 valores de X.
b) Ajustar a Poisson y comparar ambas distribuciones empírica y ajustada de
forma gráfica.
c) Comparar la ajustada con la que se deduce de la propiedad aditiva de Pois-
son.
Caso a resolver
DNI acabado en λ1 λ2 λ3
nº par 12 15 21
nº impar 6 9 7
modelo 2 3 4
Guía
Recordamos lo siguiente sobre la Poisson:

Generación.
Excel cuenta con una función para la distribución y densidad de Poisson, cuenta tam-
bién con la posibilidad de obtener muestras aleatorias así distribuidas (Herramientas +
Análisis de Datos + Generación de números aleatorios). En cualquier caso es posible
obtener números aleatorios que se distribuyan según una Poisson de parámetro λ, utili-
zando la fórmula siguiente:
BINOM.CRIT(λ/0,001;0,001;ALEATORIO())
Caracterización.
El parámetro λ puede ser estimado fácilmente de la forma siguiente:
ˆ=x
λ
(n)

Simulamos las 3 variables usando la


fórmula anterior

Tabulamos X desde 0 hasta 20 y calculamos las


frecuencias empíricas F con la función Frecuencia:

Calculamos la función de probabilidad estimada de X


Emp dividiendo la frecuencia de cada valor por el
numero total de observaciones.

Calculamos primero la media de los datos y


calculamos después las frecuencias teóricas de
X usando la función Poisson :

12
Finalmente tenemos todos los datos necesarios para poder representar ambas
funciones

X F Emp Teo Teo


0 0 0,000 0,000 0
1 1 0,001 0,001 1
2 2 0,002 0,005 5
3 20 0,020 0,015 15
4 43 0,043 0,033 33
5 66 0,066 0,060 60
6 81 0,081 0,090 90
7 117 0,117 0,116 116
8 127 0,127 0,131 131
9 119 0,119 0,132 132
10 125 0,125 0,119 119
11 97 0,097 0,098 98
12 73 0,073 0,074 74
13 45 0,045 0,051 51
14 31 0,031 0,033 33
15 24 0,024 0,020 20
16 11 0,011 0,011 11
17 7 0,007 0,006 6
18 6 0,006 0,003 3
19 3 0,003 0,001 1
20 1 0,001 0,001 1
1
1000

Con lo que ya podemos obtener los gráficos correspondientes:

140 Emp Teo

120

100

80

60

40

20

0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

13
4) Sea X una variable aleatoria definida de la forma siguiente
⎧a = 5

Y = ( a ⋅ X1 ) ⇒ ⎨
⎪ X Exponencial ( media = 4 )
⎩ 1

Caso a resolver
DNI acabado en a Media
nº par 12 2
nº impar 6 6
modelo 5 4
a) Generar 1000 valores de Y.
b) Ajustar a Exponencial y comparar de forma gráfica los resultados obte-
nidos en la simulación con los teóricos.

Generación.
Excel no cuenta con una función para la inversa de la función de distribución,
sin embargo, la generación de variables aleatorias puede hacerse utilizando la
fórmula siguiente:
Media* -LN(ALEATORIO())
Media 4 Media*a 20
a 5
X N f f1 f2
0,00 0 0
2,00 97 0,117 0,045 0,114
4,00 95 0,114 0,041 0,103
6,00 83 0,100 0,037 0,093
8,00 67 0,081 0,034 0,084
10,00 68 0,082 0,030 0,076
12,00 47 0,057 0,027 0,069
14,00 49 0,059 0,025 0,063
16,00 60 0,072 0,022 0,057
18,00 45 0,054 0,020 0,051
20,00 30 0,036 0,018 0,046
22,00 29 0,035 0,017 0,042
24,00 32 0,039 0,015 0,038
26,00 25 0,030 0,014 0,034
28,00 22 0,027 0,012 0,031
30,00 26 0,031 0,011 0,028
32,00 26 0,031 0,010 0,025
34,00 15 0,018 0,009 0,023
36,00 14 0,017 0,008 0,021
170
830 1 0,397 1

Definimos los nombres Media y a y empleamos la fórmula para generar los valores
de Y

14
Generamos la tabla de frecuencias empíricas relativas (f) y de frecuencias teóricas
(f1) usando FRECUENCIA, DISTR.EXP teniendo en cuenta que:

Si X ≅ Exp(λ) → aX ≅ Exp(λ·a)

será necesario ajustar f1, dividiendo por su suma para “pasar de discreto a continuo”
así la probabilidad teórica que usamos para la comparación es f2

f1 ( X )
f2 ( X ) =
∑ f (X)
1

Finalmente utilizamos gráficos de dispersión para dibujar las frecuencias teóricas y


empíricas.

El resultado será parecido al siguiente:

Media 4 Media*a 20
a 5
X N f f1 f2 0,12 f2
0,00 0 0 f
2,00 81 0,096 0,045 0,114
4,00 78 0,093 0,041 0,103 0,10
6,00 89 0,106 0,037 0,093
8,00 66 0,078 0,034 0,084
10,00 68 0,081 0,030 0,076 0,08
12,00 56 0,066 0,027 0,069
14,00 73 0,087 0,025 0,063
16,00 49 0,058 0,022 0,057 0,06
18,00 42 0,050 0,020 0,051
20,00 42 0,050 0,018 0,046
22,00 25 0,030 0,017 0,042 0,04
24,00 32 0,038 0,015 0,038
26,00 32 0,038 0,014 0,034
28,00 26 0,031 0,012 0,031
0,02
30,00 20 0,024 0,011 0,028
32,00 26 0,031 0,010 0,025
34,00 19 0,023 0,009 0,023
0,00
36,00 19 0,023 0,008 0,021
0

10

15

20

25

30

35

40

157
843 1 0,397 1

15
5) Sea X una variable aleatoria definida de la forma siguiente
⎧ Y ≈ Exponencia l (m1 )
X = min {Y1 ; Y2 } ⇒ ⎨ 1
⎩ Y2 ≈ Exponencia l (m2 )

DNI acabado en m1 m2
nº par 12 2
nº impar 6 6
modelo 5 4

a) Generar 1000 valores de Y.


b) Ajustar a Exponencial y comparar de forma gráfica los resultados obtenidos en
la simulación con los teóricos.

Definimos los nombres Media1 y Media2 y


empleamos la fórmula para generar los va-
lores de Y usando la función MIN

X N f f1 f2
0,0 0 0,000 Generamos la tabla de frecuencias empíricas relativas
0,5 236 0,217 0,450 0,205 (f) y de frecuencias teóricas (f1) usando FRECUENCIA,
1,0 156 0,144 0,359 0,164
1,5 153 0,141 0,287 0,131
DISTR.EXP y teniendo en cuenta que
2,0 108 0,099 0,229 0,104
2,5 83 0,076 0,183 0,083
Y1 Exp ( λ1 ) ⎫ ⎛ ⎞
3,0 90 0,083 0,146 0,067 ⎜ ⎟
⎪ 1
3,5 54 0,050 0,117 0,053
⎬ min {Y1 , Y2 } Exp ⎜ ⎟
4,0 47 0,043 0,093 0,042
⎜ 1 + 1 ⎟
4,5 35 0,032 0,074 0,034 Y2 Exp ( λ 2 ) ⎪⎭ ⎜λ ⎟
5,0 23 0,021 0,059 0,027 ⎝ 1 λ2 ⎠
5,5 20 0,018 0,047 0,022
6,0 15 0,014 0,038 0,017
0,25
6,5 18 0,017 0,030 0,014 f2 f
7,0 13 0,012 0,024 0,011
7,5 14 0,013 0,019 0,009
8,0 11 0,010 0,015 0,007 0,20
8,5 4 0,004 0,012 0,006
9,0 6 0,006 0,010 0,004
14
1086 1 2,19 1 0,15

Al compensar f1, igual que en el 0,10


ejercicio anterior, obtendremos las dos
frecuencias a comparar, las que hemos
0,05
llamado f2 y f.

0,00
0

10

16
6) Sea X una variable aleatoria definida de la forma siguiente

⎧ Y ≈ Gamma (5;1)
Y = (Y1 + Y2 ) ⇔ ⎨ 1
⎩ Y2 ≈ Gamma (4 ;1)

a) Generar 1000 valores de Y.


b) Ajustar a Gamma y comparar de forma gráfica los resultados obtenidos en la
simulación con los teóricos.
Generación.
Excel cuenta con una función para la inversa de la función de distribución Gamma, la
generación de variables aleatorias puede hacerse utilizando la fórmula siguiente:

DISTR.GAMMA.INV(ALEATORIO();r,β)

r1+r2 9
r1 4
Definimos los parámetros del problema r2 5
Lambda 1

Generamos los valores de


Y1 e Y2 y los sumamos
para obtener Y

X N f f1 f2
0,0 0 0,000
1,0 0 0,000 0,000 0,000
2,0 0 0,000 0,000 0,000
3,0 2 0,002 0,001 0,001
Construimos la tabla de frecuencias como en los anteriores 4,0 17 0,017 0,008 0,008
5,0 52 0,052 0,030 0,030
teniendo en cuenta que : 6,0 95 0,095 0,065 0,066
7,0 129 0,130 0,103 0,104
8,0 121 0,122 0,130 0,132

Y1 ≈ Gamma (r1 ;1)⎫


9,0 138 0,139 0,140 0,141

⎬ ⇒ (Y1 + Y2 ) ≈ Gamma (r1 + r2 ;1)


10,0 137 0,138 0,132 0,133
( )
Y2 ≈ Gamma r2 ;1 ⎭ 11,0
12,0
86
83
0,086
0,083
0,113
0,089
0,114
0,090
13,0 47 0,047 0,066 0,066
14,0 34 0,034 0,046 0,046
15,0 22 0,022 0,030 0,031
16,0 16 0,016 0,019 0,020
17,0 10 0,010 0,012 0,012
18,0 6 0,006 0,007 0,007
5
995 1 0,99 1

17
Para calcular la frecuencia teórica usamos la función DISTR.GAMMA

Como en los problemas anteriores es necesario normalizar f1, calculada como

f1 ( X )
f2 ( X ) =
∑ f (X)
1

Finalmente realizamos el gráfico de dispersión de ambas frecuencias

0,16 f2 f

0,14

0,12

0,10

0,08

0,06

0,04

0,02

0,00
0

10

12

14

16

18

20

18
7) Se tienen 2 urnas A={5r,3b,8a} y B={3r,5b}. Se lanza un dado, si sale un 2 o un
6 se elige la urna B, en caso contrario la A.
a) ¿Qué probabilidad hay de elegir una bola roja?.
b) Simular 100 veces, estimar P(roja) y comparar con los resultados teóricos.

Guía:

Este problema fue resuelto en clase

Por comodidad crearemos una variable


U=Aleatorio() en Nombre> Definir para
usarla en los cálculos posteriores

Para calcular el resultado podemos usar SI anidados

Una vez hechas las réplicas sólo queda contar y dividir:

Roja 148 "=SUMA(A:A)"


Total 500 "=CONTAR(A:A)"
Probabilidad 0,30

19
8) Sea el siguiente juego: el jugador elige un número del conjunto {1, 2, 3, 4, 5, 6}.
Se lanza tres veces un dado equilibrado. Si el número elegido aparece 1, 2 o 3 ve-
ces entonces gana $200, $300 o $400 . Si su número no sale pierde $100. Resol-
ver primero en teórico después simular y comparar los resultados.
a) Calcular la distribución de la ganancia
b) Calcular la ganancia media.
c) Calcular la varianza de la ganancia.

Guía:

La variable X= nº de veces que sale nuestro número, es B(n=3;p=1/6). Calculamos


la función de cuantía usando:

a partir de ella calculamos la ganancia G(x) y X P(x) G(x) G(x)2


0 0,5787 -100 10000
la ganancia al cuadrado G(x)2 para calcular la 1 0,3472 200 40000
media y la varianza: 2 0,0694 300 90000
3 0,0046 400 160000

para la media usaremos la función


Sumaproducto:

para la varianza hacemos los cálculos


teniendo en cuenta que

V(X)=E(X2)-[E(X)]2

20
Simulamos los dados mediante:

Una forma rápida de hacer el cálculo del


beneficio es media fórmulas matriciales:

y usando la función Indice le asignamos


el beneficio calculado anteriormente

Como alternativa a la fórmula matricial podemos usar SI anidados

Si suponemos que el número elegido es el 1, el resultado final debe ser parecido a


este:

Teórica 34,26
Media
Estimada 40,30

Teórica 25492,97
Varianza
Estimada 26372,28

aunque, debido a los diferentes número aleatorios generados, los resultados no serán
exactamente los mismos.

21
9) Una acción tiene un precio inicial de $100 Cada día su cotización puede subir 1€
o bajar esa misma cantidad. La probabilidad de subir es del 35%.
a) Calcular la distribución de su precio al cabo de 31 días.
b) Comparar el resultado de la simulación con el teórico, de forma gráfica y
por la comparación de la media y la varianza observada y teórica.

Guía
• Hay al menos dos formas distintas de abordar el problema: se
puede simular cada uno de los 31 dias, usando Aleatorio() y
comparando con 0,35, o se puede considerar que el número de
subidas durante 31 días es una v.a. binomial B(n=31 , p=0,35).
• El precio final será 100+x-(31-x)=69+2x, siendo x la realización
de la v.a. binomial o la suma de la Bernouilli individuales.
El resultado gráfico, análogo al explicado en el problema 1, podría ser
de la forma siguiente:

250

200

150

100

50

0
69
71
73
75
77
79
81
83
85
87
89
91
93
95
97
99
101
103
105
107
109
111
113

Para comparar la media y varianza observada con las teóricas recordamos que la
media y varianza de una binomial B(n,p) son (respectivamente):
E (x) = n ⋅ p ; Var ( x ) = n ⋅ p ⋅ (1 − p)

también que:
E ( ax + b ) = a ⋅ E ( x ) + b ; Var ( ax + b ) = a2 ⋅ Var ( x )

22
10)Una compañía de seguros tiene una cartera con tres tipos de pólizas A, B y C. Ca-
da una de ellas tiene una reclamación media diferente aunque las tres siguen una
distribución uniforme U[a,b]. Los datos de los parámetros y del número de clientes
en cada tipo de póliza se dan en la tabla siguiente:
Póliza
A B C
a 1 5 10
b 15 15 20
Clientes 200 500 300

a) Calcular la distribución de la reclamación total.


b) Comparar el resultado de la simulación con el teórico.

Guía
Este problema se puede abordar de varias formas. En primer lugar se puede
intentar simular cada una de las reclamaciones individuales y sumar los im-
portes para calcular la reclamación total, para ello necesitaríamos 1000 co-
lumnas que habría que sumar, lo cual no es práctico.
Se recomienda, bien usar una combinación de las funciones FILA e INDIREC-
TO que, junto con SUMA y SI, al ser combinadas en una fórmula matricial en
la forma siguiente:
=SUMA(SI(FILA(INDIRECTO("1:200"));ALEATORIO()*15;0))
proporcionan, en una única operación, tantos sumandos “uniformes” como
indique el rango de INDIRECTO (200 en el ejemplo); bien usar una aproxi-
mación basada en TCL.

23
11)Un comerciante vende calendarios. Cada calendario se compra a $1,2 y se vende
a un precio de $2,4. Por cada calendario comprado pero no vendido se recupera
un importe de $0,6. La demanda diaria de calendarios sigue una distribución uni-
forme entre 100 y 300.
a) Calcular el pedido óptimo de calendarios que debe hacer el comerciante.
b) Una vez determinado éste, calcular la distribución, la media y la varianza
del beneficio obtenido.

Guía
Calcular el Beneficio (B) en función de lo demandado y lo fabricado
⎧⎪Si pedido > demandado → B = (NO Vendido * PDev ) + ( Vendido * PVen )

⎪⎩Si pedido ≤ demandado → B = ( Vendido * PVen )
siempre
B = B − ( pedido * PCom )
A continuación ponderar B para cada posible demanda y estimar el beneficio
para cada cifra de pedido

24
12) (Hossack) Un periódico publica la noticia de que los hombres tienen una pro-
pensión a sufrir accidentes de tráfico que resulta ser el doble de la que tienen las
mujeres. Intentando demostrar la falsedad de tal afirmación un marido pacta con
su mujer el siguiente juego: “Durante los próximos diez años llevaremos cuenta
de los accidentes de tráfico que tengamos cada uno, al final de ese período te pa-
garé 1000€ por cada accidente que yo haya tenido más que vosotras dos (refi-
riéndose a ella y a la hija de ambos)”.
Supóngase que los datos que ofreció el periódico fueron los siguientes:
• Accidentes de hombres ≈ Poisson de media 1 cada 10 años,
• Accidentes de mujeres ≈ Poisson de media 1 cada 20 años
(Como ocurre en la más cruda realidad, el marido sólo paga, no recibe dinero en
caso de que las mujeres tengan más accidentes que él).

a) ¿Cómo es la distribución del pago esperado del marido?.


b) ¿Cuál será el pago medio?.
c) Resolver el problema teóricamente y comparar los resultados teóricos y los ob-
tenidos mediante simulación.

Guía:

Para resolver el apartado c) téngase en cuenta que:


Y1 ≈ Poisson (λ1 )⎫
⎬ ⇒ (Y1 + Y2 ) ≈ Poisson (λ1 + λ 2 )
Y2 ≈ Poisson λ 2 ⎭( )
y que es lógico suponer que ambos accidentes los del marido y los de ambas mujeres
son independientes de manera que la distribución conjunta será:
⎧ ⎧0 ≤ AcMar ≤ 7
⎪Poisson ( λ1 ) ⋅ Poisson ( λ 2 ) ⎨
f ( AcMar , AcMuj ) =⎨ ⎩ 0 ≤ AcMuj ≤ 7

⎩ 0 resto

a partir de lo anterior es posible determinar la función de probabilidad de la variable


pedida:
Y = 1000 ⋅ max ( 0; AcMar − AcMuj )

25
Para los apartados a) y b) basta con simular un número suficiente de veces:

para el apartado c) se puede crear la distribución conjunta de frecuencias de ambas


variables y calcular la distribución de la diferencia

26
13)El número mensual de reclamaciones de un determinado grupo de pólizas sigue
una distribución Poisson de parámetro 4; a su vez, cada una de esas posibles re-
clamaciones tiene un importe que se distribuye según una exponencial de pará-
metro (media) igual a 12.
a) Calcular la distribución del total de reclamaciones mensuales.
b) Calcular el resultado teórico y comparar

140

120

100
El resultado a) debería ser
parecido a este:
80

60

40

20

0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200

1,0

0,9
El resultado b) debería ser parecido 0,8
a este:
0,7

0,6

0,5

0,4

0,3

0,2

0,1

0,0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200

27
Guía:
para el apartado a)
• Simular primero la Poisson,
• En columnas siguientes un número suficiente de exponenciales.
• Usar la función de Excel DESREF junto con SUMA para calcular la suma men-
sual de las exponenciales dadas por la Poisson.

para el apartado b)
Por la teoría sabemos que la suma de exponenciales es una distribución Gamma.

(Rec Mensual | Λ = s ) ≈ Gamma(s , λ ) y Λ ≈ Poisson(υ)

El número de sumandos que integran la Gamma es el resultado de una Poisson, de


manera que habrá que:

1) Calcular la densidad de la Gamma para un rango razonable del importe de las


reclamaciones, para cada una de los posibles valores del parámetro s:
s ≈ Poisson (4).
2) Ponderar estos valores por los de la función de cuantía de la Poisson.
3) Agregarlos todos para obtener la función de distribución de la reclamación
mensual.
∞ ∞
⎧ Y ≈ Poisson(λ1 )
F( Y ) = ∑ p(y1 ) ⋅ ∫ λ 2e − λ 2 y 2 dy 2 ⇐ ⎨ 1
i= 0 0 ⎩ Y2 ≈ Poisson(λ 2 )

28
29
14) El número de reclamaciones de un determinado grupo de pólizas sigue una dis-
tribución Poisson (λ), donde λ es a su vez una variable aleatoria que se distribuye
según una Gamma (5 ; 2):
a) Calcular la distribución de la variable aleatoria “número de reclamaciones”.
b) Realizar el test de bondad del ajuste a una Binomial Negativa que se deduce
de los datos anteriores.
c) Realizar el test de bondad del ajuste a la Binomial Negativa teóricamente espe-
rada.

Guía

Para realizar el apartado a):


• Simular primero la gamma para obtener un valor.
• Utilizar este valor para simula la Poisson.

Para realizar el apartado b):


• Calcula media μ y varianza σ de la distribución simulada.
• Calcular los parámetros de la BN(r,p) de la forma siguiente:

⎧ μ2 μ⎫
⎨r̂ = ; ˆ=
p ⎬
⎩ μ − σ2 σ2 ⎭

• Calcular la función de probabilidad usando la fórmula correspondiente1:

Γ (r + x )
p (x) = pr (1 − p )
x

Γ (r ) Γ ( x + 1)

Para realizar el apartado c):


• La teoría nos dice que:

Si,
(X Λ = λ ) ≈ Poisson(λ ) y Λ ≈ Gamma(r , α)
entonces :
⎛ 1α ⎞
X ≈ BN⎜⎜ r , ⎟⎟
⎝ 1 α +1⎠

1
Para calcular la función Gamma en Excel hay que usar dos funciones concatenadas EXP y GAM-
MA.LN de esta forma:
Γ ( x ) = EXP ( GAMMA.LN ( x ) ) ≡ e
Ln ⎣⎡Γ ( x ) ⎤⎦

ya que Excel no tiene una función Gamma pero si el logaritmo neperiano de ésta, por lo que hay
que “deshacerlo”.

30
El resultado final debería ser parecido al siguiente (en el, por comodidad,
se han utilizado gráficas continuas para representar distribuciones de probabilidad
de variables aleatorias de carácter discreto):

90 Emp Teo Ajus

80

70

60

50

40

30

20

10

0
0

10

15

20

25

LICENCIATURA EN CC. ACTUARIALES Y FINANCIERAS 31


15)Sea la siguiente cartera de pólizas de vehículos:
≥25 ≥25 <25 <25
Familiar Deportivo Familiar Deportivo
r 6,000 1,601 12,950 12,540
α 0,970 0,892 0,987 0,978
N 5826 1281 3570 1622
€ 1020 1486 1097 1413

siendo:
• ≥25 el asegurado tiene 25 años o más de edad,
• <25 el asegurado tiene 24 años o menos edad,
• Familiar, Deportivo tipo de vehículo,
• (r,α) los parámetros de la distribución Binomial negativa que describe
la distribución del número de reclamaciones anuales que hace cada uno
de los asegurados,
• N el número de pólizas suscritas, es decir el número de asegurados en
esas condiciones concretas,
• $ la reclamación media por asegurado.

a) Estimar la distribución del monto total anual de las reclamaciones

32
16)Una compañía de seguros tiene una cartera con 3 tipos de pólizas: La primera
cubre un máximo de $12.000 y tiene una franquicia de $600, es decir que los pa-
gos P1 por reclamaciones de este tipo de póliza, D1, son de la forma siguiente:
⎧0 si R 1 ≤ 600

P1 = ⎨R1 − 600 si 600 < R 1 < 12.000
⎪11.400 si R1 ≥ 12.000

La segunda cubre un máximo de 11.250€ y paga las 2/3 partes del daño D2:
⎧ 3R 2
⎪ 4 si R 2 < 15.000

P2 = ⎨
⎪11.250 si R 2 ≥ 15.000


La tercera es de la forma siguiente:
⎧0 si R 3 < 500

P3 = ⎨
⎪R si R 3 ≥ 500
⎩ 3
Por experiencia anterior se sabe que las distribuciones de los daños son de la for-
ma siguiente:
⎧D1 ≅ Exp ( λ = 5000 )

⎨D2 ≅ Exp ( λ = 6000 )
⎪D ≅ Exp ( λ = 1000 )
⎩ 3
Se esperan 15 reclamaciones: 8 de D1, 4 de D2 y 3 de D3.

a) ¿A qué cantidad debe ascender la reserva de la compañía para que la probabi-


lidad de que pueda hacer frente a la reclamación total sea del 80%?

Guía
Se trata de una aplicación típica del TCL, las v.a.s. de los pagos son modificacio-
nes de una exponencial, de la media de ésta:

E[x ] = ∫ x ⋅ λe −λx dx
0

podríamos deducir la media de cada una de ellas, por ejemplo la de P1 seria


⎡⎛ 600 ⎞ ⎛ 12000 ⎞ ⎛ ∞
⎞⎤
E[P1 ] = 8 ⋅ ⎢⎜⎜ ∫ 0 ⋅ λe −λx dx ⎟⎟ + ⎜⎜ ∫ (x − 600 ) ⋅ λe −λx dx ⎟⎟ + ⎜⎜11.400 ∫ x ⋅ λe −λx dx ⎟⎟⎥
⎢⎣⎝ 0 ⎠ ⎝ 600 ⎠ ⎝ 12000 ⎠⎥⎦
Podríamos también deducir, con un mayor esfuerzo, la varianza y una vez
hechas las operaciones correspondientes, deducir la media y la varianza de la
normal a la que se aproxima - en virtud del TCL - la distribución del pago total.

33
Aún así, la aproximación a la distribución Normal no sería demasiado buena: se
trata de una suma de pocas variables aleatorias y éstas son muy sesgadas. En es-
tas situaciones el recurso a la simulación del pago es la mejor solución.
La simulación es muy sencilla, basta simular primero las exponenciales de las
reclamaciones iniciales (R1, R2 y R3) y a partir de éstas, aplicando los criterios de
pago de la compañía, calcular los pagos (P1, P2 y P3) que finalmente se harán.

Para responder a la pregunta sobre la reserva necesaria para afrontar los pa-
gos bastará aplicar la función PERCENTIL sobre los datos simulados.

34
17)Una empresa sabe que la demanda diaria en kilogramos del producto que fabrica
sigue una distribución Pareto(3,2) mientras que la oferta de ese mismo producto
se distribuye según una distribución Normal(3;0,5). Tiene un coste de $0,05 por
kilo fabricado y no vendido y de $0,5 por kilo demandado y no servido:
a) Calcular la distribución de la diferencia entre demanda (D) y oferta (O) es decir
de la variable D-O.
b) Calcular la distribución de las ganancias o pérdidas.

Guía:
Generación de Pareto:
La notación habitual es X∼Par(α,β), ambos parámetros son de escala. En la lite-
ratura aparecen descritos diversos métodos para generar v.a. de Pareto. En Ex-
cel es posible obtener v.a. a través de cualquiera de las fórmulas siguientes:
=β*((1/(1-ALEATORIO()))^(1/α))
=β*(ALEATORIO()^(-1/α))

Generación de Normal:
Excel cuenta con la función inversa de la distribución:

=DISTR.NORM.INV(ALEATORIO();μ;σ)

35
36
18)Una compañía de seguros de automóviles tiene un sistema bonus-malus, o de
descuento por buen conductor. Hay varios tramos de descuento para el pago anu-
la de una póliza por la que se comienza pagando $250:

1 2 3 4 5 6 7
0% 10% 20% 30% 40% 50% 60%

si durante un plazo de un año no se hace ninguna reclamación, se aumenta un


tramo de descuento al año siguiente, hasta el descuento máximo del 60% que se
alcanza al llegar al 7º tramo. Mientras que si, durante un plazo de un año, se hace
una única reclamación (o más de una) se vuelve al comienzo de la escala, es de-
cir, al 0% de descuento del primer tramo.

Se está en proceso de decidir si cambiar o no este sistema por otro análogo. Este
nuevo sistema tendría sólo 4 tramos de descuento:

1 2 3 4
0% 20% 40% 60%

Pero, a diferencia del anterior, sólo se retrocede un puesto en la escala por recla-
mación, es decir si durante un año no hay reclamaciones se gana un 20% de des-
cuento, si hay una reclamación se pierde un 20% de descuento. El descuento no
puede ser superior al 60% ni negativo. También sería diferente la prima que pasa-
ría de $250 a $(250+75) .

Se sabe que el número de accidentes que ocurren anualmente sigue una distribu-
ción de Poisson de parámetro 0,1 por año, mientras que la distribución del impor-
te de las reclamaciones se distribuye de forma LogNormal(μ = 6,012 ; σ = 1,792).

También hay que tener en cuenta que las reclamaciones que no le interesan al
cliente no se realizan, por ejemplo en el primer sistema, un cliente que éste en el
tramo 4 (30%) perdería este descuento si hiciera una reclamación así que si el
daño que recibe es inferior a lo que pierde no le interesa reclamar.
Las pérdidas mínimas por sistema y tramo son las siguientes:

Tramo 1 2 3 4 5 6 7
Importe 25 50 75 100 125 150 150

Tramo 1 2 3 4
Importe 125 175 175 125

a) Decidir qué sistema es el mejor para la compañía, si la póliza está suscrita por
1000 clientes.

37