You are on page 1of 7

ANÁLISIS DE FRECUENCIAS DE GASTOS MÁXIMOS ANUALES, USANDO LA

DISTRIBUCIÓN DE VALORES EXTREMOS TIPO I, EMPLEANDO DISTINTAS


TÉCNICAS DE ESTIMACIÓN DE PARÁMETROS

Torres Cadena, Jorge Luis1


1
Coordinación de Hidráulica, Universidad Nacional Autónoma de México
Correo electrónico: 1jorgltc@hotmail.com
1
Arquitectura #34, Col. Copilco Universidad, C. P. 04360, Coyoacán, México, D. F.
Tel. 5524964500

Resumen

En este trabajo se presenta la función de distribución de probabilidad de valores extremos tipo I empleando
distintas técnicas de estimación de parámetros como las siguientes: estimadores por momentos, estimadores
por máxima verosimilitud, estimadores por momentos – L y estimadores por máxima entropía. Los métodos
se desarrollan con algoritmos muy particulares que generan distintos parámetros de posición y escala, y en
consecuencia, modifica los eventos de diseño calculados para cada técnica de estimación. La complejidad de
cada técnica radica en los procesos iterativos en que se sustente cada método y en los criterios de
convergencia adoptados para cada caso. Se concluye que para cada distribución de probabilidad se deben
aplicar el mayor número de técnicas de estimación de parámetros y finalmente elegir aquella que genere el
menor error aplicando criterios de bondad de ajuste.

Palabras clave: análisis de frecuencia, distribución Gumbel, estimación de


parámetros.

Introducción

El análisis y diseño de una estructura hidráulica depende fundamentalmente de la variable de impulso que
genera el evento que se desea controlar. Sin embargo existe una gran incertidumbre en la determinación de la
magnitud de un evento de diseño para el cual se diseñará la estructura. En el caso de variables hidrológicas
deben de emplearse técnicas de probabilidad y estadística que ayudan enormemente a analizar el
comportamiento aleatorio de la naturaleza, en especial con el estudio de variables meteorológicas como
temperatura y precipitación o gastos en cauces naturales

Existen varias técnicas de distribución de probabilidad para variables aleatorias, sin embargo, no todas pueden
aplicarse a variables hidrológicas. Además debe de añadirse el comportamiento no homogéneo que puede
presentar cada muestra de datos en estudio, en donde quizás se encuentren dos o más poblaciones en un
mismo registro, comportamiento solo determinable mediantes pruebas de homogeneidad.

Entre las distribuciones de probabilidad, para una población, más comunes aplicables en hidrología se
encuentran (Escalante y Reyes, 2005 Técnicas estadísticas en hidrología): Distribución Normal; LogNormal
2 y 3 parámetros; Gamma 2 y 3 parámetros; Log Pearson tipo III, y General de Valores Extremos tipo I
(Gumbel), tipo II (Fréchet) y tipo III (Weibull). Cada distribución emplea distintas técnicas de estimación de
parámetros como: técnica de mínimos cuadrados, momentos, máxima verosimilitud, momentos – L o máxima
entropía. Dichas técnicas dependen de la función de distribución y la función de densidad asociada a cada tipo
de distribución, de tal forma que para una distribución de probabilidad sólo pueden aplicarse un cierto número
de técnicas de estimación de parámetros.

Debido a la incertidumbre mencionada anteriormente y a la aleatoriedad de variables meteorológicas, deben


emplearse al menos todas las distribuciones, indicadas en el párrafo anterior, con cada una de las técnicas de
estimación de parámetros; este tipo de análisis deriva en realizar alrededor de 20 procedimientos para
determinar aquella distribución de mejor ajuste que refleje el mejor comportamiento de los registros de datos
analizados.

El objetivo de este trabajo es mostrar la variabilidad que puede existir en el evento de diseño calculado para
registros de gastos, aplicando únicamente la distribución de valores extremos tipo I (Gumbel), empleando las
siguientes técnicas de estimación de parámetros: estimadores por momentos, por máxima verosimilitud,
momentos – L y máxima entropía.

Desarrollo

La distribución de la función de valores extremos tipo I (Gumbel) para una población y para máximos es:
Fx= e-e-x-υ α [1]
La función de densidad asociada es:
fx= 1αe-x-υ α e-e-x-υ α [2]
-∞ < x < ∞,  > 0

Donde:
υ : Parámetro de ubicación
α : Parámetro de escala

Media = Ex= υ + 0.5772α [3]


Varianza = σ2= π2α26 [4]
Coeficiente asimetría = γ=1.1396 [5]
Coeficiente de Curtosis = κ =5.4002 [6]

La variable reducida, o variable estandarizada, Gumbel es:


yi=xi-υ α [7]

Técnicas de estimación de parámetros para la distribución Gumbel.

Estimadores por momentos


υ = x- 0.45S [8]
α=6πS=0.78S [9]

Estimadores por máxima verosimilitud


Considerando la variable reducida y el siguiente proceso iterativo
P=n- i=1ne-yi [10]
R=n-i=1nyi+i=1nyie-yi [11]

El criterio de convergencia es:


Pα≈0 y Rα≈0 [12]

Incrementos
δυ j= 1.11Pj-0.26Rjαjn [13]
δαj= 0.26Pj-0.61Rjαjn

Nuevos valores
υ j+1= υ j+δυ j [14]
αj+1= αj+δαj

Estimadores por momentos – L


υ = λ 1- 0.577216α [15]
α=λ 2in 2 [16]

Estimadores por máxima entropía


Considerando la variable reducida se tiene el siguiente proceso iterativo
P=1ni=1nyi [17]
R=1ni=1ne-yi [18]

El criterio de convergencia es:


|0.577216 – P|  0 y |1 – R|  0 [19]

Incrementos
δυ j= Pj- 0.577216δαj [20]
δαj= 0.4228+ Pj+lnRj

Nuevos valores
υ j+1= υ j+δυ j [21]
αj+1= αj+δαj

Estimación de eventos
xt= υ - αln-ln1-1T [22]

Error Estándar de Ajuste


EE=i=1nQij-Qij2n-mp12 [23]
Donde:
n: tamaño de la muestra
Qij: eventos estimados por determinada distribución de probabilidad
Qij: evento registrado ordenado de mayor a menor que se le asigna un período de retorno
T=n+1m y p=1-1T
mp: número de parámetros de la distribución de probabilidad

Registros de gastos de estación Corona.

La estación Corona se encuentra en las coordenadas geográficas 98°57'8.15"O – 23°56'31.57"N. Se ubica en


la región Hidrológica No. 25, San Fernando – Soto la Marina, en el estado de Tamaulipas.

Los registros hidrométricos fueron obtenidos del programa BANDAS (Banco Nacional de Datos de Aguas
Superficiales) elaborado por el Instituto Mexicano de Tecnología del Agua (IMTA). A los registros de la
estación Corona se aplicaron previamente los análisis de verificación de cantidad y calidad de la información,
pruebas de independencia y pruebas de homogeneidad.

Se obtienen los estadísticos muestrales de la serie Qij: x,̄ S2, S, g, k, Cv, prefiriendo los no sesgados dado que
los registros de las estaciones se consideran de poca extensión. Además se obtienen los estadísticos por
probabilidad pesada y momentos – L, necesarios para calcular los estimadores de determinadas técnicas de
distribución de probabilidad.

El cálculo de los estadísticos fue realizado en el programa AFDE 2010, desarrollado en plataforma Visual
Basic.

x̄ = 372.9958 g = 1.2361
S2 = 79313.2341 k = 1.3213
S = 281.6261 Cv = 0.7550

Resultados y discusión

Estimadores por momentos. QT(1)


Aplicando las ecuaciones [8] y [9] en [22]
υ = 372.9958- 0.45281.6261= 246.2641

α=6π281.6261=219.5830
QT1=246.2641-219.5830 Ln⁡-ln1-1/T

Estimadores por máxima verosimilitud. QT(2)


Aplicando las ecuaciones [10] a [14] en [22]
QT2=251.6093-189.3856 Ln⁡-ln1-1/T

Estimadores por momentos – L. QT(3)


Aplicando las ecuaciones [15] a [16] en [22]
υ = 372.9958- 0.577216(218.2271) = 247.0316
α=151.2635Ln 2=218.2271

QT3=247.0316-218.2271 Ln⁡-ln1-1/T

Estimadores por máxima entropía. QT(4)


Aplicando las ecuaciones [17] a [21] en [22]
QT4=247.6014-262.6324 Ln⁡-ln1-1/T

En la Tabla 1 se muestra la variación que existe para cada gasto calculado con las distintas técnicas de
estimación de parámetros. Puede notarse, en la Figura 1, que a partir del décimo año calculado, los resultados
comienzan a divergir respecto a los datos registrados en la estación Corona.

Tabla 1. Eventos QT (m3/s) calculados por distintas técnicas de estimación de parámetros


Orden Q (m3/s) T (años) P(1-1/T) QT(1) QT(2) QT(3) QT(4)

1 1260 38.0000 0.9737 1042.095 1037.948 937.9959 1199.455

2 936.2 19.0000 0.9474 886.9034 883.7151 804.1468 1013.838

3 834.722 12.6667 0.9211 794.813 792.1933 724.7208 903.6936

4 819 9.5000 0.8947 728.511 726.3007 667.5368 824.3931

5 659 7.6000 0.8684 676.3038 674.4159 622.5092 761.9506

6 652.8 6.3333 0.8421 632.9774 631.357 585.1412 710.1301

7 618.111 5.4286 0.8158 595.7543 594.3638 553.0371 665.6094

8 584.519 4.7500 0.7895 562.9637 561.7757 524.7558 626.3901

9 576.04 4.2222 0.7632 533.5341 532.5278 499.3735 591.1908

10 537.464 3.8000 0.7368 506.7319 505.8911 476.2571 559.134

11 527.1 3.4545 0.7105 1042.0947 1037.9481 937.9959 1199.4550

12 525.2 3.1667 0.6842 886.9034 883.7151 804.1468 1013.8384

13 507 2.9231 0.6579 794.8130 792.1933 724.7208 903.6936

14 458 2.7143 0.6316 728.5110 726.3007 667.5368 824.3931

15 411.508 2.5333 0.6053 676.3038 674.4159 622.5092 761.9506

16 292.9 2.3750 0.5789 632.9774 631.3570 585.1412 710.1301

17 290 2.2353 0.5526 595.7543 594.3638 553.0371 665.6094


Orden Q (m3/s) T (años) P(1-1/T) QT(1) QT(2) QT(3) QT(4)

18 254.88 2.1111 0.5263 562.9637 561.7757 524.7558 626.3901

19 249.5 2.0000 0.5 533.5341 532.5278 499.3735 591.1908

20 245.2 1.9000 0.4737 506.7319 505.8911 476.2571 559.1340

21 209 1.8095 0.4474 482.0220 481.3338 454.9454 529.5798

22 202.68 1.7273 0.4211 459.0270 458.4808 435.1127 502.0766

23 202.2 1.6522 0.3947 437.4299 437.0170 416.4857 476.2454

24 194.9 1.5833 0.3684 417.0014 416.7147 398.8666 451.8119

25 194 1.5200 0.3421 397.5469 397.3803 382.0874 428.5432

26 191.182 1.4615 0.3158 378.9232 378.8716 366.0249 406.2684

27 188.08 1.4074 0.2895 360.9868 361.0459 350.5551 384.8155

28 167.986 1.3571 0.2632 343.6244 343.7907 335.5805 364.0492

29 153 1.3103 0.2368 326.7441 327.0147 321.0216 343.8595

30 132.969 1.2667 0.2105 310.2513 310.6237 306.7969 324.1333

31 125.66 1.2258 0.1842 294.0612 294.5336 292.8333 304.7691

32 123.533 1.1875 0.1579 278.1154 278.6863 279.0804 285.6972

33 112.067 1.1515 0.1316 262.3147 262.9831 265.4526 266.7987

34 99.382 1.1176 0.1053 246.5794 247.3450 251.8813 247.9785

35 92.56 1.0857 0.0789 230.8669 231.7296 238.3296 229.1856

36 89.202 1.0556 0.0526 215.0528 216.0131 224.6903 210.2712

37 83.3 1.0270 0.0263 199.0817 200.1407 210.9156 191.1689

Se observa que para un período de retorno de 38 años, existe una variación de 261.4591 m 3/s, valor realmente
significativo para el diseño de una estructura de control; por tal motivo deben emplearse técnicas de bondad
de ajuste que ayuden a determinar la mejor técnica de estimación de parámetros. Aplicando le expresión (23),
se obtiene el error estándar de ajuste para cada técnica de estimación de parámetros.

Por momentos EEA = 67.0572 m3/s


EEA = 66.5027 m3/s Por máxima entropía
Por máxima verosimilitud EEA = 69.9242 m3/s
EEA = 87.0493 m3/s
Por momentos – L

Se concluye que la técnica de estimación de parámetros que proporciona el mejor ajuste para una distribución
Gumbel, es el de momentos. En la figura 1 se aprecian dos poblaciones de eventos, por lo que además debe de
aplicarse técnicas de distribución mezcladas o multivariadas, que quedan fuera del alcance de este trabajo.

Figura 1. Gastos calculados por las distintas técnicas de estimación de parámetros de


la distribución Gumbel.
En la Tabla 2 se indican finalmente los gastos de diseño para diferentes períodos de retorno. Ejemplificando
para estructuras diseñadas con períodos de retorno de 50 años, se observa que existe una variación, de más de
280m3/s, entre el gasto del menor valor calculado con la técnica de máxima verosimilitud y la técnica de
máxima entropía.

Tabla 2. Eventos de diseño QT (m3/s) de la distribución Gumbel para diferentes períodos de retorno.
Q(m3/s) Q(m3/s) Q(m3/s) Q(m3/s)
T(años) 1/Tr P(1-1/T)
Momentos Mom-L Max ver Max ent

2 0.5 0.5 326.7441 327.0147 321.0216 343.8595

5 0.2 0.8 575.6254 574.3592 535.6763 641.5342

10 0.1 0.9 740.4064 738.1227 677.7964 838.6207

20 0.05 0.95 898.4684 895.2087 814.1214 1027.6708

50 0.02 0.98 1103.0634 1098.5403 990.5802 1272.3767

100 0.01 0.99 1256.3786 1250.9088 1122.8112 1455.7494

500 0.002 0.998 1610.6665 1603.0090 1428.3768 1879.4957

1000 0.001 0.999 1762.9797 1754.3818 1559.7437 2061.6701

5000 0.0002 0.9998 2116.4728 2105.6921 1864.6238 2484.4657

10000 0.0001 0.9999 2268.6871 2256.9665 1995.9053 2666.5217

En el proceso de cálculo se puede corroborar la complejidad que conlleva realizar los procesos iterativos para
determinadas técnicas de estimación de parámetros. Sin embargo, los avances en la tecnología implementada
en equipos de cómputo, permiten desarrollar nuevas técnicas que requieren una gran cantidad de procesos
numéricos a realizar.

Algunas técnicas sólo dependen de los estadísticos muestrales para obtener los parámetros de alguna
distribución, sin embargo, otras técnicas requieren complejos algoritmos, en donde los equipos de cómputo
resultan verdaderamente indispensables, para su solución. Dado que en las técnicas de máxima verosimilitud
y máxima entropía, es inherente una serie de iteraciones por métodos numéricos para encontrar alguna
solución, se optó por implementar una serie de algoritmos asentados en plataforma Visual Basic para obtener
de forma más precisa los parámetros requeridos.

Conclusiones

La variación en los resultados obtenidos por las diferentes técnicas podría conducir a sub-dimensionar o
sobre-dimensionar futuras obras hidráulicas; es decir, se arriesgaría notablemente la seguridad de la obra en
donde realmente existirá una mayor probabilidad de que eventos extremos excedan las condiciones para la
cual fue diseñada, o caso contrario, la obra tendría un costo de construcción muy elevado, cuando la
probabilidad de que suceda un evento mayor al calculado es sumamente bajo.

Existen varias técnicas para estimar los parámetros de alguna distribución de probabilidad. Algunas técnicas
requieren procesos más elaborados que otras, sin embargo, el implemento de computadoras permiten
desarrollar eficientemente los algoritmos necesarios para la convergencia de alguna solución. Dada la
incertidumbre de los fenómenos meteorológicos, es necesario implementar el mayor número de técnicas de
estimación de parámetros y elegir, mediante criterios bondad de ajuste, aquella técnica que refleje el mejor
ajuste respecto a los registros originales de la muestra.
Referencias

Escalante, C., y Reyes, L., (2005), Técnicas estadísticas en hidrología, Facultad de Ingeniería, Universidad
Nacional Autónoma de México, México, 298 p.

Kite, G.W. (1988), Frequency and Risk Analyses in Hydrology, Water Resources Publications, Littleton,
Colorado.

Haan, C.T. (1977), Statistical Methods in Hydrology, The Iowa State University Press, Ames, Iowa.

IMTA, (2002), Banco Nacional de Datos de Aguas Superficiales (BANDAS), Región hidrológica 25, México.

You might also like