Teor´ıa de valores extremos: Una

introducc´on

Fernando Velasco Luna

Laboratorio de Investigaci´on y Asesor´ıa Estad´ıstica, LINAE
Facultad de Estad´ıstica e Inform´atica
Universidad Veracruzana
Sergio Hern´andez Gonz´alez

Laboratorio de Investigaci´on y Asesor´ıa Estad´ıstica, LINAE
Facultad de Estad´ıstica e Inform´atica
Universidad Veracruzana
La teor´ıa de valores extremos est´a relacionada con aspectos probabil´ıticos y estad´ısticos
relacionados con valores muy altos o muy bajos en una sucesi´on de variables aleato-
rias. La teor´ıa de valores extremos tiene aplicaciones en una gran variedad de ´areas.
Este art´ıculo presenta una introducci´on a la teor´ıa de valores extremos y sus ´areas de
aplicaci´on.
Extreme value theory is concerned with probabilistic and statistical questions related
to very high or very low values in sequences of random variables. Extreme value theory
has applications in a variety of areas. This paper presents an introduction to extreme
value theory and its areas of applications.
Palabras clave: Teor´ıa de valores Extremos, Leyes de L´ımites, M´aximo, M´ınimo.
Keywords: Extreme value Theory, Limit Laws, Maximum, Minimum.
1. Introducci´on
La teor´ıa de valores extremos se ha desarrollado r´apidamente en las ´ ultimas dos
d´ecadas tanto desde el punto de vista metodol´ogico como del de las aplicaciones.
La mayor´ıa de los estudios estad´ısticos tratan de la modelaci´on del promedio de la
distribuci´on de la variable de inter´es, dicho promedio se estima a partir de la me-
dia muestral, por otra parte el teorema del l´ımite central proporciona un valioso
resultado relacionado con el comportamiento asint´otico de la media muestral. En
la teor´ıa de los valores extremos el inter´es principal no est´a en el promedio, sino
en los valores m´as bajos o m´as altos de la variable bajo estudio, es decir, el inter´es
est´a en los eventos asociados a la cola de la distribuci´on. Por ejemplo en estudios de
oceanograf´ıa, es necesario estudiar el comportamiento de corrientes marinas extremas,
en estad´ıstica ambiental es necesario analizar niveles altos de ozono en determinada
regi´on, en climatolog´ıa es necesario conocer el comportamiento de velocidades ex-
tremas de huracanes, en ingenieria, el aumento del flujo de un r´ıo, en finanzas, un
gran decremento o aumento del valor de una acci´on en el mercado, valores m´aximos

Recibido el 15 de enero de 2007 y aceptado el 21 de febrero de 2007

Direcci´on postal: Av. Xalapa Esq. Manuel Avila Camacho s/n. C.P. 91020. Xalapa Veracruz,
M´exico. Correo electr´onico: fvelasco@uv.mx

Direcci´on postal: Av. Xalapa Esq. Manuel Avila Camacho s/n. C.P. 91020. Xalapa Veracruz,
M´exico. Correo electr´onico: sehernandez@uv.mx
Revista de Ciencias B´ asicas UJAT, volumen 6 n´ umero 1 (Junio 2007) p 10–16
Teor´ıa de valores extremos: Una introducc´on 11
o m´ınimos en un portafolio de inversi´on, etc. Cualquier tipo de pregunta relacionada
con las situaciones antes mencionadas tendr´a que involucrar un manejo adecuado
de la informaci´on con que se cuente y de una aplicaci´on cuidadosa de herramientas
anal´ıticas para llevar acabo el proceso de an´alisis e inferencia. Este comportamiento
de los valores m´as altos o m´as bajos es importante en varios campos los cuales in-
cluyen, la ingenier´ıa [7], la oceanograf´ıa [1, 21], el medioambiente [17, 20, 22], la
Hidrolog´ıa, [16], la climatolog´ıa [5, 11, 23], las finanzas [10, 13], entre otros. En la
actualidad se cuenta con software estad´ıstico para el an´alisis de valores extremos. Un
tratamiento y abundantes referencias acerca de la teor´ıa de valores extremos se puede
encontrar en [3, 6].
Un enfoque para la modelaci´on de valores extremos es a partir de la distribuci´on
de Valores Extremos Generalizada. Esta distribuci´on se ajusta a los valores m´aximos
o m´ınimos de datos. Otro enfoque para el an´alisis de valores extremos es a partir
del an´alisis de excedentes sobre umbrales. En este trabajo se trata el primer enfoque
en el caso univariado. Cabe mencionar que la teor´ıa para modelos para extremos
multivariados se ha desarrollado con los trabajos de [4, 7, 18, 19]. Se tiene que
mencionar que el an´alisis de datos extremos tambi´en ha sido llevado a cabo desde el
punto de vista Bayesiano, ver, [2, 8, 9].
2. Preliminares
Sean X
1
, X
2
, ..., X
n
variables aleatorias independientes con funci´on de distribuci´on
acumulativa com´ un F (x), es decir, F (x) = P (X
i
≤ x). La teor´ıa de valores ex-
tremos estudia el comportamiento de los valores m´aximo y m´ınimo de X
1
, X
2
, ..., X
n
.
Definanse Y
n
= max {X
1
, X
2
, ..., X
n
}, y Y
1
= min {X
1
, X
2
, ..., X
n
}. Los extremos
son definidos como el m´aximo y el m´ınimo de las n variables aleatorias. ¿Cu´al es la
distribuci´on de los valores extremos, es decir, de los valores m´aximo y m´ınimo Y
1
y
Y
n
?.
Teorema 1. Sean X
1
, X
2
, ..., X
n
variables aleatorias independientes con funci´on de
distribuci´on com´ un F (x).
Definanse Y
n
= max {X
1
, X
2
, ..., X
n
}, y Y
1
= min {X
1
, X
2
, ..., X
n
}. Entonces las
distribuciones de Y
1
y Y
n
est´an dadas por
L
n
(x) = 1 −(1 −F (x))
n
(1)
y
H
n
(x) = (F (x))
n
(2)
respectivamente.
Revista de Ciencias B´ asicas UJAT, 6(1)Junio 2007 p 10–16
12 Fernando Velasco Luna y Sergio Hern´andez Gonz´alez
Prueba. La distribuci´on del m´ aximo es H
n
(x) = (F (x))
n
, como se demuestra a
continuaci´on,
H
n
(x) = P (Y
n
≤ x)
= P {X
1
≤ x, X
2
≤ x, ..., X
n
≤ x}
= P {X
1
≤ x} P {X
2
≤ x} · · · P {X
n
≤ x}
=
n

i=1
P {X
i
≤ x}
= (F (x))
n
,
y la distribuci´on del m´ınimo por L
n
(x) = 1 −(1 −F (x))
n
:
L
n
(x) = P (Y
1
≤ x) = 1 −P (Y
1
> x)
= 1 −P {X
1
> x, X
2
> x, ..., X
n
> x}
= 1 −P {X
1
> x} P {X
2
> x} · · · P {X
n
> x}
= 1 −
n

i=1
P {X
i
> x}
= 1 −(1 −F (x))
n
.
Definici´on 1. Una sucesi´on de variables aleatorias X
1
, X
2
, ... con funci´on de dis-
tribuci´on F
1
, F
2
, ... respectivamente, se dice que converge en distribuci´on a la variable
aleatoria X, teniendo funci´on de distribuci´on F, denotado como X
n
d
−→X, si
F
n
(x) −→F (x) cuando n −→∞
para todo punto de continuidad x de F.
Definici´on 2. Una variable aleatoria X tiene una distribuci´on Normal con par´ametros
µ y σ
2
, denotado por X ∼ N
_
µ, σ
2
_
, si su funci´on de densidad tiene la forma
f (x) =
1

2πσ
exp
_
1
2
_
x −µ
σ
__
, −∞< x < ∞
Si X ∼ N
_
µ, σ
2
_
, entonces la variable
_
x−µ
σ
_
∼ N (0, 1), la cual se denomina
distribuci´on normal estandard. La variable
_
x−µ
σ
_
generalmente se denota por Z.
En la teor´ıa estad´ıstica un resultado de suma importancia relacionado con la media
muestral es el teorema central del l´ımite el cual se menciona a continuaci´on.
Teorema 2. Sea X
1
, X
2
, ..., X
n
una sucesi´on de tama˜ no n de variables independien-
tes e identicamente distribuidas con funci´on de distribuci´on F cuya media esta dada
por µ y con varianza σ
2
> 0. Entonces se tiene que
_
n

i=1
X
i
−nµ
_
σ/

n
d
−→Z
donde Z ∼ N (0, 1).
Revista de Ciencias B´ asicas UJAT, 6(1)Junio 2007 p 10–16
Teor´ıa de valores extremos: Una introducc´on 13
3. Distribuciones asint´oticas de valores extremos
Ya se conoce que las distribuciones del m´aximo y del m´ınimo est´an dadas por
L
n
(x) = 1 −(1 −F (x))
n
, H
n
(x) = (F (x))
n
. (3)
En principio, el conocimiento de F (x) es suficiente para determinar la distribuci´on
de Y
1
y de Y
n
. Sin embargo, no siempre L
n
(x) y H
n
(x) tienen una forma simple.
Adem´as la funci´on de distribuci´on F es desconocida. Una posibilidad es usar t´ecnicas
estad´ısticas standard para estimar F de los datos observados, y entonces sustituir esta
estimaci´on en (3). Desafortunadamente, por el hecho de que en la obtenci´on de L
n
(x)
y H
n
(x), F (x) se eleva a la n-´esima potencia, peque˜ nas discrepancias en la estimaci´on
de F conllevan a grandes discrepancias de L
n
(x) y H
n
(x).
Un enfoque alternativo es aceptar que F es desconocida, y estudiar la distribuci´on
asint´otica de los extremos Y
1
y Y
n
, cuando n es grande. Esto es similar a la pr´actica
usual de aproximar la distribuci´on de la media muestral para la distribuci´on normal, lo
cual esta justificado por el teorema central del l´ımite. A este respecto, los resultados
heuristicos fundamentales fueron descubiertos por Fisher y Tippett en 1928, [12],
m´as tarde desde un punto de vista riguroso por Gnedenko en 1943, [14]. Gnedenko
baso los fundamentos matem´aticos de la teor´ıa de los valores extremos en la clase
de leyes l´ımites de extremos. Los resultados asint´oticos m´as importantes sobre el
comportamiento del m´ınimo y del m´aximo de un conjunto de variables aleatorias. Las
distribuciones L
n
(x) y H
n
(x), cuando n −→∞, son conocidas como las distribuciones
asint´oticas de los valores extremos.
El resultado m´as general nos dice que seleccionando adecuadamente sucesiones
{a
n
} , {b
n
} , {A
n
} y {B
n
} las distribuciones l´ımite de (Y
1
−a
n
) /b
n
y de (Y
n
−A
n
) /B
n
,
pertenecen a la familia de distribuciones Generalizadas del valor Extremo.
Definanse
L(x) = Lim
n−→∞
L
n
(a
n
+b
n
x) = Lim
n−→∞
P
_
(Y
1
−a
n
)
b
n
≤ x
_
(4)
y
H (x) = Lim
n−→∞
H
n
(A
n
+B
n
x) = Lim
n−→∞
P
_
(Y
1
−A
n
)
B
n
≤ x
_
(5)
Resultados m´as espec´ıficos establecen que tanto las distribuciones l´ımite L como
H pueden tener solamente una de tres posibles formas, independientemente de la
distribuci´on original de las observaciones. El siguiente teorema establece lo anterior
para el m´aximo Y
n
.
Teorema 3 (Fisher-Tippett, Gnedenko) Sea {X
n
} una sucesi´on de variables independientes
e identicamente distribuidas. Si existen sucesiones de constantes de normalizaci´on
A
n
en los reales, B
n
> 0, constantes µ y σ > 0, y una funci´on de distribuci´on H no
degenerada tal que
Lim
n−→∞
P
_
(Y
n
−A
n
)
B
n
≤ x
_
= H (x) , (6)
Revista de Ciencias B´ asicas UJAT, 6(1)Junio 2007 p 10–16
14 Fernando Velasco Luna y Sergio Hern´andez Gonz´alez
para todo punto de continuidad x, entonces H pertenece a algunos de los siguientes
tres tipos de distribuci´on,
Frechet : H
(1)
(x) =
_
exp
_

_
x−µ
σ
_
−1/ξ
_
, x > µ, ξ > 0
0, x ≤ µ, ξ > 0
(7)
Weibull : H
(2)
(x) =
_
exp
_

_

x−µ
σ
_
1/ξ
_
, x > µ, ξ > 0
1, x ≥ µ, ξ > 0
(8)
Gumbel : H
(3)
(x) = exp
_
−exp
_

x −µ
σ
__
, −∞< x < ∞ (9)
La demostraci´on del teorema anterior se basa en los resultados de Gnedenko y
Kolmogorov que se encuentran en su trabajo de 1954 sobre teoremas l´ımite para
sumas de variables aleatorias independientes [15].
Con respecto a la distribuci´on asint´otica del valor m´ınimo Y
1
, se tienen resultados
an´alogos a los presentados hasta ahora para el valor m´aximo. Si ahora se cumple
Lim
n−→∞
P
_
(Y
1
−a
n
)
b
n
≤ x
_
= L(x) , (10)
para algunas sucesiones de constantes de normalizaci´on a
n
en los reales, b
n
> 0,
constantes µ y σ > 0, y una funci´ on de distribuci´on L no degenerada, para todo punto
de continuidad x, entonces L pertenece a alguno de los tres tipos de distribuci´on,
Frechet : L
(1)
(x) = 1 −exp
_

_
x −µ
σ
_
1/ξ
_
x > µ, ξ > 0 (11)
Weibull : L
(2)
(x) = 1 −exp
_

_

x −µ
σ
_
−1/ξ
_
x ≤ µ, ξ > 0 (12)
Gumbel : L
(3)
(x) = 1 −exp
_
−exp
_
x −µ
σ
__
−∞< x < ∞, ξ > 0 (13)
4. Dominio de atracci´on
Dependiendo de cu´al sea la distribuci´on l´ımite del m´aximo de una sucesi´on de varia-
bles aleatorias independientes con distribuci´on com´ un F (x), se dice que F pertenece
al dominio de atracci´on de H
(i)
, i = 1, 2, 3, lo cual se denota con F ∈ D
_
H
(i)
_
.
Es importante hacer notar que no es necesario conocer la forma exacta de F para
determinar a que dominio de atracci´on pertenece. El comportamiento en la cola de
F (x) determina su dominio de atracci´on.
Con estos ´ ultimos resultados se tiene que si F es una distribuci´on exponencial,
normal o Weibull (F (x) = 1 −exp (−x
α
) , x ≥ 0, α > 0), entonces F ∈ D
_
H
(3)
_
, y si
F es uniforme, F ∈ D
_
H
(2)
_
. Tambi´en se cumple una propiedad de autocerradura,
pues H
(i)
∈ D
_
H
(i)
_
. En cuanto a los valores extremos m´ınimos se tiene que si F
es una distribuci´on normal, F ∈ D
_
L
(3)
_
, y si F es exponencial, uniforme o Weibull,
entonces F ∈ D
_
L
(1)
_
.
Revista de Ciencias B´ asicas UJAT, 6(1)Junio 2007 p 10–16
Teor´ıa de valores extremos: Una introducc´on 15
5. Familia de distribuciones del valor extremo generalizadas
Las tres distribuciones anteriores para el m´aximo pueden ser combinadas en una
familia teniendo distribuci´on de la forma
H (x) = exp
_

_
1 +ξ
_
x −µ
σ
__
−1/ξ
_
, (14)
definida en el conjunto {x : 1 +ξ (x −µ) /σ > 0}, donde los par´ametros satisfacen
−∞ < µ < ∞, σ > 0, y −∞ < ξ < ∞, esta es la familia de distribuciones del
valor extremo generalizada para el m´aximo. El modelo tiene tres par´ametros: un
par´ametro de localizaci´on, µ; un par´ametro de escala, σ; y un par´ametro de forma ξ.
Las clase Fr´echet corresponde al caso ξ > 0 y la clase Weibull corresponden al caso
ξ < 0. Para ξ = 0, es definida como el limite de (14) cuando ξ −→0, correspondiente
a la familia Gumbel con funci´on de distribuci´on
H (x) = exp
_
−exp
_

_
x −µ
σ
___
, −∞< x < ∞. (15)
La familia de distribuciones del valor extremo generalizada para el m´ınimo esta
dada por:
L(x) = 1 −exp
_

_
1 −ξ
_
x −µ
σ
__
−1/ξ
_
,
definida en el conjunto {x : 1 −ξ (x −µ) /σ > 0} .
Referencias
[1] Barao, M. I. and Tawn, J. A. “Extremal Analysis of short Series with Outliers: sea
levels and athletics records”. Applied Statistics, 48(4), 1999, 469-487.
[2] Behrens, C. N., Lopes, H. F., and Gamerman, D. “Bayesian Analysis of Extreme Events
with Threshold Estimation”. Statistical Modelling, 4, 2004, 227-244.
[3] Beirlant, J., Goegebeur, Y., Segers, J. y otros. Statistics of extremes. Theory and
Applications. Wiley, London, 2004.
[4] Bortot, P., Coles, S., and Tawn, J. A. “The Multivariate Gaussian Tail Model: An
Application to Oceanographic Data”. Journal of the Royal Statistical Society: Series
C (Applied Statistics), 49(1), 2000, 31-49.
[5] Casson, E, and Coles, S. “Simulation and Extremal Analysis of Hurricane Events”.
Journal of the Royal Statistical Society: Series C (Applied Statistics), 49(3), 2000,
227-245.
[6] Coles, S. An Introduction to Statistical Modeling of Extreme Values. Springer-Verlag,
London, 2001.
[7] Coles, S., and Tawn, J. A. “Statistical Methods for Multivariate Extremes: An Appli-
cation to Structural Design”. Journal of the Royal Statistical Society: Series C (Applied
Statistics), 43(1), 1994, 1-48.
[8] Coles, S., and Tawn, J. A. “A Bayesian Analysis of Extreme Rainfall Data”. Journal
of the Royal Statistical Society: Series C (Applied Statistics), 45(4), 1996, 463-478.
Revista de Ciencias B´ asicas UJAT, 6(1)Junio 2007 p 10–16
16 Fernando Velasco Luna y Sergio Hern´andez Gonz´alez
[9] Coles, S., and Pericchi, L. “Anticipating Catastrophes Through Extreme Value Mod-
elling”. Journal of the Royal Statistical Society: Series C (Applied Statistics), 52(4),
2003, 405-416.
[10] Chavez-Demoulin. V, and Embrechts, P. “Smooth Extremal Models in Finance and
Insurance”. The Journal of Risk and Insurance, 71(2), 2004, 183-199.
[11] Davison, A. C., and Ramesh, N. I. “Local Likelihood Smoothing of Sample Extremes”.
Journal of the Royal Statistical Society: Series B (Statistical Methodology), 62(1), 2000,
191-208.
[12] Fisher, R. A., and Tippett, L.H.C. “On the Estimation of the Frequency Distribu-
tions of the Largest or Smallest Member of a Sample”. Proceeding of the Cambridge
Philosophical Society, 24, 1928, 180-190.
[13] Finkenst¨adt, B. and Rootz´en, H. Extreme Values in Finance, Telecommunications, and
the Enviroment. Chapman & Hall, Boca Raton, Florida, 2004.
[14] Gnedenko, B. V. “Sur la Distribution Limite du Terme Maximum d’une S´erie
Al´eatoire”. Annals of Mathematics, 44, 1943, 423-453.
[15] Gnedenko, B. V. and Kolmogorov, A. N. Limit Distributions for Sums of Independent
Random Variables. Addison-Wesley, 1954 (Translated from Russian).
[16] Katz, R. W., Parlange, M. B., and Naveau, P. “Statistics of Extremes in Hydrology”.
Advances in Water Resources, 25(8), 2002, 1287-1304.
[17] Ledford, A. W., and Tawn, J. A. “Diagnostics for Dependence within Time Series
Extremes”. Journal of the Royal Statistical Society: Series B (Statistical Methodology),
65(2), 2003, 521-543.
[18] Nadarajah, S., Anderson, C. W., and Tawn, J. A. “Ordered Multivariate Extremes”.
Journal of the Royal Statistical Society: Series B (Statistical Methodology), 60(2), 1998,
473-496.
[19] Nadarajah, S. “Simulation of Multivariate Extreme Values”. Journal of Statistical Com-
putation and Simulation, 62(4), 1999, 395-410.
[20] Pauli, F., and Coles, S. “Penalized Likelihood Inference in Extreme Value Analyses”.
Journal of Applied Statistics, 28(5), 2001, 547-560.
[21] Robinson, M. E. and Tawn, J. A. “Statistics for Extreme Sea Currents”. Applied Statis-
tics, 46(2), 1997, 183-205.
[22] Robinson, M. E. and Tawn, J. A. “Extremal Analysis of Processes Sampled at Different
Frequencies”. Journal of the Royal Statistical Society: Series B (Statistical Methodol-
ogy), 62(1), 2000, 117-135.
[23] Walshaw, D. “Modeling Extreme wind Speeds in Regions prone to Hurricanes”. Applied
Statistics, 49(1), 2000, 51-62.
Revista de Ciencias B´ asicas UJAT, 6(1)Junio 2007 p 10–16

La teor´ de valores exu ıa tremos estudia el comportamiento de los valores m´ximo y m´ a ınimo de X1 . F (x) = P (Xi ≤ x).. Los extremos son definidos como el m´ximo y el m´ a ınimo de las n variables aleatorias. 19]. 18.. n n (1) (2) ´ Revista de Ciencias Basicas UJAT. 9]. Sean X1 . Otro enfoque para el an´lisis de valores extremos es a partir a del an´lisis de excedentes sobre umbrales. X2 . Xn variables aleatorias independientes con funci´n de distribuci´n o o acumulativa com´n F (x).Teor´ de valores extremos: Una introducc´n ıa o 11 o m´ ınimos en un portafolio de inversi´n. Un a tratamiento y abundantes referencias acerca de la teor´ de valores extremos se puede ıa encontrar en [3. . .. la oceanograf´ [1.. Cualquier tipo de pregunta relacionada o con las situaciones antes mencionadas tendr´ que involucrar un manejo adecuado a de la informaci´n con que se cuente y de una aplicaci´n cuidadosa de herramientas o o anal´ ıticas para llevar acabo el proceso de an´lisis e inferencia. ıa actualidad se cuenta con software estad´ ıstico para el an´lisis de valores extremos. ver. 7. 11. Cabe mencionar que la teor´ para modelos para extremos ıa multivariados se ha desarrollado con los trabajos de [4.. 22]. X2 .. Xn }. X2 .. Definanse Yn = max {X1 . X2 . entre otros.. 21].. Este comportamiento a de los valores m´s altos o m´s bajos es importante en varios campos los cuales ina a cluyen. . y Y1 = min {X1 . Teorema 1.. y Y1 = min {X1 . 6(1)Junio 2007 p 10–16 . la ıa ıa Hidrolog´ [16]. . [2. .. En la ıa. Preliminares Sean X1 . la climatolog´ [5.. X2 . Se tiene que mencionar que el an´lisis de datos extremos tambi´n ha sido llevado a cabo desde el a e punto de vista Bayesiano.. 23]. Xn . 6]. es decir. 8. ¿Cu´l es la a distribuci´n de los valores extremos.. X2 . . las finanzas [10.. Un enfoque para la modelaci´n de valores extremos es a partir de la distribuci´n o o de Valores Extremos Generalizada. de los valores m´ximo y m´ o a ınimo Y1 y Yn ?. etc. Xn }... 2. En este trabajo se trata el primer enfoque a en el caso univariado. 20.. Entonces las distribuciones de Y1 y Yn est´n dadas por a Ln (x) = 1 − (1 − F (x)) y Hn (x) = (F (x)) respectivamente. el medioambiente [17. . Xn variables aleatorias independientes con funci´n de o distribuci´n com´n F (x).. o u Definanse Yn = max {X1 . Esta distribuci´n se ajusta a los valores m´ximos o a o m´ ınimos de datos. X2 . la ingenier´ [7]. Xn }.. es decir. 13]. Xn }..

. ´ Revista de Ciencias Basicas UJAT. Definici´n o 1. o Hn (x) = P (Yn ≤ x) = P {X1 ≤ x.. la cual se denomina generalmente se denota por Z. . entonces la variable distribuci´n normal estandard. 6(1)Junio 2007 p 10–16 . 1). si o o Fn (x) −→ F (x) para todo punto de continuidad x de F . −∞<x<∞ Si X ∼ N µ. X2 . σ 2 . La variable o ∼ N (0.. respectivamente. y la distribuci´n del m´ o ınimo por Ln (x) = 1 − (1 − F (x)) : Ln (x) = P (Y1 ≤ x) = 1 − P (Y1 > x) = 1 − P {X1 > x.. Xn > x} = 1 − P {X1 > x} P {X2 > x} · · · P {Xn > x} n n =1− i=1 P {Xi > x} n = 1 − (1 − F (x)) . teniendo funci´n de distribuci´n F . X2 > x... denotado por X ∼ N µ. Una sucesi´n de variables aleatorias X1 . denotado como Xn −→ X. σ 2 . o Teorema 2. X2 . . Entonces se tiene que n Xi − nµ i=1 √ σ/ n −→ Z d donde Z ∼ N (0. X2 ≤ x. . se dice que converge en distribuci´n a la variable o o d aleatoria X. si su funci´n de densidad tiene la forma o f (x) = √ 1 exp 2πσ 1 2 x−µ σ x−µ σ x−µ σ . 1). .. Xn una sucesi´n de tama˜ o n de variables independieno n tes e identicamente distribuidas con funci´n de distribuci´n F cuya media esta dada o o por µ y con varianza σ 2 > 0.. F2 . . En la teor´ estad´ ıa ıstica un resultado de suma importancia relacionado con la media muestral es el teorema central del l´ ımite el cual se menciona a continuaci´n.. como se demuestra a o a continuaci´n. con funci´n de diso o tribuci´n F1 . Una variable aleatoria X tiene una distribuci´n Normal con par´metros o a µ y σ 2 . Sea X1 .... La distribuci´n del m´ximo es Hn (x) = (F (x)) . Definici´n o cuando n −→ ∞ 2. Xn ≤ x} = P {X1 ≤ x} P {X2 ≤ x} · · · P {Xn ≤ x} n n = i=1 P {Xi ≤ x} n = (F (x)) .12 Fernando Velasco Luna y Sergio Hern´ndez Gonz´lez a a Prueba..

Gnedenko) Sea {Xn } una sucesi´n de variables independientes o e identicamente distribuidas. o El resultado m´s general nos dice que seleccionando adecuadamente sucesiones a {an } . [12]. constantes µ y σ > 0. {An } y {Bn } las distribuciones l´ ımite de (Y1 − an ) /bn y de (Yn − An ) /Bn . Distribuciones asint´ticas de valores extremos o Ya se conoce que las distribuciones del m´ximo y del m´ a ınimo est´n dadas por a Ln (x) = 1 − (1 − F (x)) . Sin embargo. A este respecto. cuando n −→ ∞. Definanse L (x) = Lim Ln (an + bn x) = Lim P n−→∞ n−→∞ (Y1 − an ) ≤x bn (Y1 − An ) ≤x Bn (4) y H (x) = Lim Hn (An + Bn x) = Lim P n−→∞ n−→∞ (5) Resultados m´s espec´ a ıficos establecen que tanto las distribuciones l´ ımite L como H pueden tener solamente una de tres posibles formas. Desafortunadamente. peque˜as discrepancias en la estimaci´n e n o de F conllevan a grandes discrepancias de Ln (x) y Hn (x). Si existen sucesiones de constantes de normalizaci´n o An en los reales. [14]. Una posibilidad es usar t´cnicas a o o e estad´ ısticas standard para estimar F de los datos observados. m´s tarde desde un punto de vista riguroso por Gnedenko en 1943. 6(1)Junio 2007 p 10–16 . no siempre Ln (x) y Hn (x) tienen una forma simple. n Hn (x) = (F (x)) . Gnedenko a baso los fundamentos matem´ticos de la teor´ de los valores extremos en la clase a ıa de leyes l´ ımites de extremos. independientemente de la distribuci´n original de las observaciones. Bn > 0. Los resultados asint´ticos m´s importantes sobre el o a comportamiento del m´ ınimo y del m´ximo de un conjunto de variables aleatorias. lo o o cual esta justificado por el teorema central del l´ ımite. cuando n es grande. a Teorema 3 (Fisher-Tippett.Teor´ de valores extremos: Una introducc´n ıa o 13 3. n (3) En principio. Adem´s la funci´n de distribuci´n F es desconocida. pertenecen a la familia de distribuciones Generalizadas del valor Extremo. F (x) se eleva a la n-´sima potencia. y una funci´n de distribuci´n H no o o degenerada tal que (Yn − An ) ≤ x = H (x) . los resultados heuristicos fundamentales fueron descubiertos por Fisher y Tippett en 1928. {bn } . son conocidas como las distribuciones asint´ticas de los valores extremos. El siguiente teorema establece lo anterior o para el m´ximo Yn . Un enfoque alternativo es aceptar que F es desconocida. el conocimiento de F (x) es suficiente para determinar la distribuci´n o de Y1 y de Yn . y entonces sustituir esta estimaci´n en (3). por el hecho de que en la obtenci´n de Ln (x) o o y Hn (x). Las a distribuciones Ln (x) y Hn (x). y estudiar la distribuci´n o asint´tica de los extremos Y1 y Yn . Esto es similar a la pr´ctica o a usual de aproximar la distribuci´n de la media muestral para la distribuci´n normal. (6) Lim P n−→∞ Bn ´ Revista de Ciencias Basicas UJAT.

α > 0). 1/ξ . ´ o normal o Weibull (F (x) = 1 − exp (−xα ) . y una funci´n de distribuci´n L no degenerada. Si ahora se cumple a a Lim P (Y1 − an ) ≤x bn = L (x) . entonces L pertenece a alguno de los tres tipos de distribuci´n. (10) n−→∞ para algunas sucesiones de constantes de normalizaci´n an en los reales. entonces H pertenece a algunos de los siguientes tres tipos de distribuci´n. 6(1)Junio 2007 p 10–16 . se dice que F pertenece o u al dominio de atracci´n de H (i) .14 Fernando Velasco Luna y Sergio Hern´ndez Gonz´lez a a para todo punto de continuidad x. bn > 0. (8) (9) Gumbel : H (3) (x) = exp − exp − x−µ σ La demostraci´n del teorema anterior se basa en los resultados de Gnedenko y o Kolmogorov que se encuentran en su trabajo de 1954 sobre teoremas l´ ımite para sumas de variables aleatorias independientes [15]. F ∈ D H (2) . lo cual se denota con F ∈ D H (i) . y si F es exponencial. entonces F ∈ D H (3) . o Frechet : L(1) (x) = 1 − exp − x−µ σ x−µ σ 1/ξ x > µ. Con respecto a la distribuci´n asint´tica del valor m´ o o ınimo Y1 . o constantes µ y σ > 0. o Es importante hacer notar que no es necesario conocer la forma exacta de F para determinar a que dominio de atracci´n pertenece. ξ > 0 x ≤ µ. ξ > 0 x > µ. ξ > 0 x ≥ µ. ξ > 0 . ξ > 0 −1/ξ (11) Weibull : L(2) (x) = 1 − exp − − Gumbel : L(3) (x) = 1 − exp − exp x ≤ µ. x ≥ 0. entonces F ∈ D L(1) . y si F es uniforme. Dominio de atracci´n o Dependiendo de cu´l sea la distribuci´n l´ a o ımite del m´ximo de una sucesi´n de variaa o bles aleatorias independientes con distribuci´n com´n F (x). para todo punto o o de continuidad x.ξ > 0 (12) (13) x−µ σ 4. Tambi´n se cumple una propiedad de autocerradura. En cuanto a los valores extremos m´ ınimos se tiene que si F (3) es una distribuci´n normal. ´ Revista de Ciencias Basicas UJAT. o Con estos ultimos resultados se tiene que si F es una distribuci´n exponencial. i = 1. e pues H (i) ∈ D H (i) . uniforme o Weibull. 3. x > µ. 2. El comportamiento en la cola de o F (x) determina su dominio de atracci´n. ξ > 0 − ∞ < x < ∞. −∞ < x < ∞ (7) Weibull : H (2) (x) = exp − − x−µ σ 1. x−µ −1/ξ σ . o Frechet : H (1) (x) = exp − 0. F ∈ D L o . se tienen resultados an´logos a los presentados hasta ahora para el valor m´ximo.

and Tawn. Journal of the Royal Statistical Society: Series C (Applied Statistics). 48(4). Journal of the Royal Statistical Society: Series C (Applied Statistics). [6] Coles. esta es la familia de distribuciones del valor extremo generalizada para el m´ximo. y un par´metro de forma ξ. 49(3). J. A. S. 6(1)Junio 2007 p 10–16 . 4. E. Lopes. −∞ < x < ∞. S. D. [7] Coles. N. A. and Coles. 43(1). 463-478. and Tawn. J. “Statistical Methods for Multivariate Extremes: An Application to Structural Design”. 1996. Segers. donde los par´metros satisfacen a −∞ < µ < ∞. F. un par´metro de escala. 49(1). 227-244. correspondiente a la familia Gumbel con funci´n de distribuci´n o o H (x) = exp − exp − x−µ σ . µ. [5] Casson. A. and Gamerman. “A Bayesian Analysis of Extreme Rainfall Data”. 2001. I. London.. Wiley. Goegebeur. Coles. J. σ. [8] Coles. 45(4). A. El modelo tiene tres par´metros: un a a par´metro de localizaci´n. C. y otros. Familia de distribuciones del valor extremo generalizadas Las tres distribuciones anteriores para el m´ximo pueden ser combinadas en una a familia teniendo distribuci´n de la forma o H (x) = exp − 1 + ξ x−µ σ −1/ξ . S. σ > 0. 1-48. 2000. S. Statistical Modelling. “Simulation and Extremal Analysis of Hurricane Events”. Journal of the Royal Statistical Society: Series C (Applied Statistics). 2004. J. London. Referencias [1] Barao. J..Teor´ de valores extremos: Una introducc´n ıa o 15 5. 1994. a o a a Las clase Fr´chet corresponde al caso ξ > 0 y la clase Weibull corresponden al caso e ξ < 0. [3] Beirlant. “Bayesian Analysis of Extreme Events with Threshold Estimation”. Applied Statistics. Springer-Verlag. [4] Bortot. (15) La familia de distribuciones del valor extremo generalizada para el m´ ınimo esta dada por: −1/ξ x−µ .. An Introduction to Statistical Modeling of Extreme Values. 2004. and Tawn. Theory and Applications. L (x) = 1 − exp − 1 − ξ σ definida en el conjunto {x : 1 − ξ (x − µ) /σ > 0} . 1999. and Tawn.. 31-49. Para ξ = 0. Y. S. (14) definida en el conjunto {x : 1 + ξ (x − µ) /σ > 0}. P. “Extremal Analysis of short Series with Outliers: sea levels and athletics records”.. J. 227-245.. [2] Behrens. Journal of the Royal Statistical Society: Series C (Applied Statistics). 2000. y −∞ < ξ < ∞. ´ Revista de Ciencias Basicas UJAT. “The Multivariate Gaussian Tail Model: An Application to Oceanographic Data”. M. H. 469-487.. es definida como el limite de (14) cuando ξ −→ 0.. Statistics of extremes.

2004. Extreme Values in Finance. Proceeding of the Cambridge Philosophical Society. 62(1). E. [23] Walshaw. Journal of the Royal Statistical Society: Series C (Applied Statistics). A. Limit Distributions for Sums of Independent Random Variables. and Tawn. W. 49(1). e [15] Gnedenko. 60(2). N. S. and Pericchi. V. Boca Raton. Chapman & Hall.. and Kolmogorov. 25(8). A. B.. and Coles. A. “Diagnostics for Dependence within Time Series Extremes”. 46(2). Advances in Water Resources. Parlange. 2000. [12] Fisher. 52(4). and a e the Enviroment. 547-560. [14] Gnedenko. J. and Tawn. 1998. [16] Katz. C. H. [21] Robinson. 1954 (Translated from Russian). [11] Davison. 395-410. 2004. and Naveau. [19] Nadarajah. 473-496. V. S. [17] Ledford. R. 24. W. B. [10] Chavez-Demoulin. D.. [20] Pauli. W. Telecommunications. Journal of the Royal Statistical Society: Series B (Statistical Methodology). Applied Statistics. M. 1928. N. Annals of Mathematics. “Sur la Distribution Limite du Terme Maximum d’une S´rie e Al´atoire”. Journal of Statistical Computation and Simulation. Applied Statistics. 62(4). 1943. P. and Embrechts.C. [18] Nadarajah.. B. 2003. 6(1)Junio 2007 p 10–16 . [13] Finkenst¨dt. The Journal of Risk and Insurance. [22] Robinson. Journal of the Royal Statistical Society: Series B (Statistical Methodology). S. Anderson. and Tawn. 1997. 28(5). 2001. ´ Revista de Ciencias Basicas UJAT. 183-205. “Anticipating Catastrophes Through Extreme Value Modelling”. 2000. I. L. L. V. M. 191-208.H. J. 62(1). and Tawn.. 1999. “On the Estimation of the Frequency Distributions of the Largest or Smallest Member of a Sample”. 65(2). 2000.. J. “Statistics for Extreme Sea Currents”. 51-62. S.. P. “Extremal Analysis of Processes Sampled at Different Frequencies”. “Modeling Extreme wind Speeds in Regions prone to Hurricanes”. Addison-Wesley. Journal of Applied Statistics. 180-190. 2002. 71(2). “Penalized Likelihood Inference in Extreme Value Analyses”. “Smooth Extremal Models in Finance and Insurance”. 183-199. M. F. 44. “Simulation of Multivariate Extreme Values”. A. B. and Rootz´n. E. A.16 Fernando Velasco Luna y Sergio Hern´ndez Gonz´lez a a [9] Coles. 2003. Journal of the Royal Statistical Society: Series B (Statistical Methodology). “Statistics of Extremes in Hydrology”. “Local Likelihood Smoothing of Sample Extremes”. 1287-1304. and Tippett. Journal of the Royal Statistical Society: Series B (Statistical Methodology). 423-453. “Ordered Multivariate Extremes”. R. A. J.. A. Florida. and Ramesh. 521-543. A. 117-135. 405-416. C..