You are on page 1of 19

1

Distribuzione di probabilit dei valori estremi ( legge di Gumbel)



1. Premesse
Indicando con x i valori assunti da una generica grandezza idrologica:
si considera X come una variabile casuale;
si ammette che le condizioni ambientali per cui la X in passato ha assunto determinati valori
siano restate immutate e resteranno immutate anche in futuro, almeno per i tempi che interessano in
sede applicativa;
si definisce popolazione della X l'insieme di tutti i valori che in dette condizioni ambientali
la x ha assunto per il passato o potr assumere in futuro;
si considera la serie statistica costituita dagli n valori x
1
, x
2
..... ,x
i
....... , x
n
assunti dalla x in
una determinata stazione di misura, registrati e pubblicati dal S.I.I. nel periodo di osservazione,
come un campione di dimensione n tratto a caso dalla popolazione della x.
Ci premesso, scopo dell'indagine sar quello di risalire dalla composizione del campione,
nota, a quella della popolazione, incognita, tenendo per bene in conto che, per difetto di
campionatura, la composizione del primo pu scostarsi, pi o meno, da quella della seconda.
Cercheremo di raggiungere tale scopo applicando la metodologia consueta nelle analisi
statistiche attraverso fasi successive:
1) formulazione di un ipotesi di lavoro in riguardo alla composizione della popolazione
della x, individuando quale fra le leggi gi studiate dal calcolo delle probabilit meglio si adatta a
descrivere detta popolazione;
2) precisazione dell'ipotesi di lavoro avanzata, calcolando le grandezze statistiche, funzione
degli n valori osservati della X, che costituiscano le migliori stime dei parametri che caratterizzano
quella legge di probabilit, e che, quindi, permettano di trarre dal campione la massima
informazione in riguardo alla popolazione da cui esso tratto;
2
3) verifica dell'ipotesi di lavoro, controllando se gli scarti che si riscontrano fra
composizione della popolazione, definita al punto 2), e composizione del campione debbano o
meno ritenersi significativi, e cio se sono o non inferiori agli scarti massimi che potrebbero
verificarsi se l'ipotesi fosse valida;
4) determinazione dell'intervallo fiduciario entro cui ci si deve attendere che ricada il
valore x

della x che nella popolazione corrisponde ad una assegnata probabilit comulata :


l'ampiezza dell'intervallo fiduciario costituisce una misura dell'indeterminatezza con cui
possibile conoscere x, tanto maggiore quanto pi piccola la dimensione n del campione.
Infine, una volta che avremo individuato un'ipotesi di lavoro accettabile in riguardo alla
popolazione della X, come conseguenza della stessa potremo anche trarre induzioni in riguardo a
quanto potr avvenire in futuro in un campione, di dimensione assegnata, eventualmente anche
diversa da n, tratto dalla stessa popolazione. In particolare, facendo riferimento al
proporzionamento di una data opera, si potr stabilire con quale rischio in un assegnata durata si
potranno determinare condizioni pi gravose di quelle assunte a base del progetto.

2. Legge doppio - esponenziale o di Gumbel
2.1. Si assume come variabile il massimo valore x z
k
= raggiunto da un'altra generica
variabile z, definita variabile originaria, fra k osservazioni tratte a caso dalla popolazione della z,
o pi brevemente in un campione di dimensione k.
Posto che dalla popolazione della z possono pensarsi tratti infiniti campioni di dimensione k e
posto che z
k
assume di volta in volta valori diversi, alla distribuzione della variabile originaria z
si pu associare quella del valore massimo in un campione di dimensione k.
La funzione di ripartizione (x) del massimo valore x z
k
= , raggiunto dalla variabile
originaria z in un campione di dimensione k, misura la probabilit che x risulti inferiore o al pi
3
eguale a un assegnato valore. Se fosse nota la funzione di ripartizione (z) della z, (x) si potrebbe
dedurre in base al quinto assioma del calcolo delle probabilit a mezzo della relazione:
( ) ( )
| |
x z z
k
k
= = (1)
se le k osservazioni che costituiscono il campione sono ognuna indipendente dall'altra.
In effetti la (z) raramente nota. Quando per si considerino campioni di grande
dimensione, sicch i valori massimi z
k
risultano spostati nel campo dei valori pi grandi della x, ai
fini applicativi sufficiente conoscere l'andamento della (z) in prossimit dei valori massimi e
dedurre da questo l'andamento assunto dalla (x) per diversi valori di k, in particolare esaminando
se essa tende a una forma asintotica al crescere di k all'infinito.
Nel campo dell'idrologia la (z) risulta generalmente di tipo esponenziale, cio:
se si considera il valore di z che ci si deve attendere che venga superato una volta su k (estremo
atteso), per cui:
( )
| |
k z 1 1 = = (2)
se si considera il parametro ( ) = = k z che misura la rapidit con cui varia al variare di k
(intensit di funzione);
sviluppando in serie di Taylor la funzione (z) in prossimit di , si pu dimostrare che per grandi
valori di z, quale che sia (z), risulta:
( )
( )
z
k
e
x
=

1
1

(3)
( )
( )
x
k
e
x
k
=

(

1
1

(4)
che tende, per k alla funzione asintotica:
( )
( )
x e
e
x
=


(5)
4
che viene perci definita legge asintotica del massimo valore, o legge doppio esponenziale o
legge di Gumbel, dallo studioso che per primo l'ha applicata all'idrologia.


2. Variabile ridotta e carta probabilistica
2.1. Se si considera la variabile:
y = (x - ) (10)
posto che y funzione lineare di x, risulta:
( ) ( ) x y e
e
y
= =


(11)
x
y

= + =

1 1
ln ln (12)
se si indicano con x


e con y

i valori di x e di y che corrispondono a uno stesso valore di .


Mentre la funzione di ripartizione (x) funzione, oltre che del valore assunto da x, anche dei
valori assunti da e da , viceversa la funzione di ripartizione (y) funzione soltanto del valore
assunto da y, che assume quindi il significato di variabile ridotta.
Di conseguenza la legge doppio-esponenziale pu essere rappresentata a mezzo di una retta
in una speciale carta probabilistica, in cui si riportino come ascisse le x e come ordinate le y, usando
per l'una e l'altra variabile delle scale lineari, indicando, per, come ordinate, anzich le y, i valori
di (y) che corrispondono ad y nella relazione (11) (Fig.1).
5
0,999
0,998
0,995
0,99
0,98
0,95
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,05
0,01
5
10
20
50
500
100
1000
x
(x)
T
(x)

Fig. 1: Esempio di carta probabilistica di Gumbel
2.2. Come pu osservarsi dalle figure 2-a e 2-b, in cui si sono rappresentati in diagrammi
cartesiani gli andamenti assunti rispettivamente dalle funzioni:
( ) y e
y e
y
=


(13)
( ) y e
e
y
=


(11)
a differenza di quanto avviene per una variabile distribuita secondo la legge normale del caso, se la
x distribuita secondo la legge doppio-esponenziale, la funzione (y) risulta asimmetrica rispetto
all'ordinata passante per il valore modale
y
~
.
6

0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
-4 -2 0 2 4 6 8 10
y
(
y
)

Fig. 2a. Rappresentazione della funzione di probabiit elementare della variabile ridotta y
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-4 -2 0 2 4 6 8 10
y
(
y
)

Fig. 2b. Rappresentazione della funzione di probabiit cumulata della variabile ridotta y

A causa di tale asimmetria, moda
~
y mediana y
0,5
e media = (y) della y risultano diverse
l'una dall'altra, essendo:

~
y = 0 con (0) = 0,368 (14)
y
0.50

= 0,36651 con (0,36651) = 0,500 (15)
= 0,57722 con (0,57722) = 0,570 (16)
A sua volta lo scarto quadratico medio della y dato da:
7

y
= (y) =

6
= 1,28255 (17)
D'altro canto dalla retta (x) riportata in Fig.1 si riconosce che i frattili y
0,025
e y
0,975
,
corrispondenti a valori di (y) pari rispettivamente a 0,025 e a 0,975, non risultano simmetrici
rispetto alla moda
~
y = 0, cos come avverrebbe per la distribuzione normale, ma pari a:
y
0,025
= -1,305 (18)
y
0,975
= +3,675
Inoltre, posto che (0) = 0,368 :
a differenza di quanto avviene per la distribuzione normale, in cui il 95% dei valori della variabile
compreso fra y
0,025
e y
0,975
si ripartisce in pari eguali al disotto e al disopra del valore modale.
Nella distribuzione doppio-esponenziale, nell'intervallo compreso fra y
0,025
e
~
y ricade il
(36,8-2,5) = 34,3% della popolazione, mentre, nell'intervallo delimitato da
~
y e da y
0,975

ne ricade il
(97,5 - 36,8)=60,7%

2.3. Per dedurre la probabilit cumulata (x) corrispondente a un assegnato valore x di una
variabile distribuita secondo la legge doppio esponenziale, essendo nota la funzione (y) data dalla
(11), basta conoscere i valori assunti dai parametri ed . Fissato infatti un valore di x, basta
calcolare a mezzo della (10) il valore di y che corrisponde ad x, assumendo poi:
( ) ( ) x y e
e
y
= =


(11)
Se viceversa si vuol conoscere il valore x

di x cui corrisponde un assegnato valore di , o,
pi brevemente, il frattile x

di un assegnato valore di , basta calcolare il valore y

di y che
risulta frattile dello stesso valore di , ricordando che :
x
y

= + =

1 1
ln ln (12)
8
In Tab. I sono riportati i frattili x

di assegnati valori di , espressi in funzione di ed . In


particolare, in base alle (14) (15) (16), indicando con
~
x , con x
0,50
e con = M(x) rispettivamente la
moda, la mediana e la media della x, risultano:

~
x = con = 0,368
x
0 50
0 36651
,
,
= +

con = 0,500

= +
0 57722 ,
con = 0,570

x

(12)

T
0,025 - 1,305/ 1,03
0,368 1,58
0,500 + 0,366/ 2
0,570 + 0,577/ 2,33
0,800 + 1,500/ 5
0,900 + 2,250/ 10
0,950 + 2,970/ 20
0,967 + 3,384/ 30
0,975 + 3,676/ 40
0,980 + 3,902/ 50
0,990 + 4,600/ 100
0,998 + 6,214/ 500
0,999 + 6,907/ 1000
Tab. I. Legge doppio-esponenziale:
Valori di x corrispondenti ad assegnati valori della probabilit cumulata F o del periodo di ritorno T.

D'altra parte i parametri ed sono legati alla media e allo scarto quadratico medio
( ) x
x
= della x dalle relazioni

1 6
1 28255


= =
x
x
,
(19)
= - 0,450
x
(20)



9

3. Interpretazione di una singola serie di dati.
Formulazione dell'ipotesi di lavoro
3.1. Disposti gli n dati che costituiscono il campione in ordine crescente indicando con x
(1)
il
pi piccolo di essi, e con x
(2)
,x
(3)
,...,x
(i)
,...,x
(n)
quelli successivi, si calcola per ogni x
(i)
la frequenza
cumulata:

( )
( )
F x
i
n
i
=
+1
(43)
e si riportano in carta probabilistica di Gumbel i punti (x
(i)
, F(x
(i)
)).
Se i punti empirici si dispongono su un andamento pressocch rettilineo, propenderemo per
l'ipotesi che la (5) bene si adatti ad interpretare la distribuzione di probabilit della x. In caso
contrario, se i punti si dispongono intorno a una curva, propenderemo per unaltra ipotesi di lavoro,
quale pu essere quella rappresentata dalla (36) o unaltra ancora.

Precisazione dell'ipotesi di lavoro: stima dei parametri ed
3.2. Dalla relazione (5), per la stima dei parametri si ricorre usualmente o al metodo dei
momenti (M) di semplice applicazione o al metodo della massima verosimiglianza (MV), pi
efficiente degli altri metodi di stima, ma che presenta difficolt di risoluzione.
Con il metodo M, tenendo presente la (19) e la (20) le stime
1
e di ed a di si ottengono in
funzione della media x e dello scarto quadratico medio s
x
degli n dati disponibili dalle relazioni:
e = x - 0,450 s
x
(44)

1
128255 a
s
x
=
.
(45)

1
Lo stesso simbolo e oltre che per la stima empirica di , stato adoperato anche per indicare la base dei
logaritmi neperiani. L'uso dello stesso simbolo nei due diversi significati non pu, per, creare confusioni nella
interpetrazione del testo.

10
Note le stime e ed a dei parametri ed della distribuzione si ottiene immediatamente in
base alla (12) la retta P(x), che in carta probabilistica di Gumbel meglio interpola i punti empirici
[x; F(x)]. Non pu escludersi, per, che la retta P(x), essendo stata dedotta da un campione di
dimensione limitata, si scosti, anche se di poco dalla retta che rappresenterebbe la funzione di
ripartizione (x) della popolazione della x. Alla P(x) perci va dato il significato di stima empirica
della (x).
In particolare per ogni fissato valore di , una stima del frattile x

di si ottiene in base al
valore x

che nella retta P(x) corrisponde a P = , pari secondo la (12) o la (14) rispettivamente a:
x
P
= e + y
P
/a per P = (46)
x
P

= x + k
P
s
x
per P = (47)
Posto che dalla popolazione della x possono pensarsi tratti infiniti campioni di dimensione n e
posto che e ed 1/a, e quindi x
P
, assumono di volta in volta valori diversi la x
P
deve essere
considerata una variabile casuale caratterizzata dalla sua distribuzione di probabilit, definita
distribuzione di campionatura di x
P
. In particolare si dimostra che x
P
pu ammettersi distribuita
praticamente secondo la legge normale del caso, con media e varianza pari rispettivamente a:

( )
M x x
p
=

(48)
( ) ( ) Var x x
x
n
K K
n
n
p p p p
= = + + +

|
\

|
.
|


2
2
2
1 114 0 6 05
1
. . . (49)
Con il metodo MV le stime e ed
1
a
si ottengono dagli n valori x
1
, x
2
,... x
n
a disposizione
mediante le relazioni:

1
1
1
a
x
x e
e
i
i
n
ax
ax
i
n
i
i
=
=

(50)

11
e
n
e
ae ax
i
n
i

=
=
1
1
(51)
L'equazione (50) nell'incognita a implicita e perci presenta difficolt numeriche di
risoluzione, che peraltro possono essere facilmente superate con l'ausilio di un eleboratore
elettronico.

Verifica dell'ipotesi di lavoro
3.3. Precisata l'ipotesi di lavoro, ammettendo che la distribuzione di probabilit cumulata
della variabile x sia rappresentata dalla funzione P(x), ottenuta ponendo nella (5) le stime e ed 1/a
dei parametri ed 1/, necessario verificare se gli scarti fra la P(x) e la distribuzione di frequenze
cumulate F(x) del campione debbano o meno ritenersi significativi in termini probabilistici (test di
adattamento). I test pi adottati sono quelli del chi-quadrato e di Kolmogorov.

3.4. Per applicare il test del chi-quadrato si suddivide il campo di variazione della x in k
classi e si mettono a confronto le frequenze f
i
, e le probabilit p
i

che corrispondono a ciascuna
classe i rispettivamente nella serie empirica di cui disponiamo e nella popolazione di cui P(x) ci d
la composizione.
Se gli intervalli di classe si assumono equiprobabili, cio di lunghezza (x
i+1
-x
i
) diversa ma con
probabilit corrispondente costante
1
:
( ) ( ) p P x P x
i
k
i
k k
i i i
= =
+
=
+1
1 1
(54)
quando si considerino n osservazioni, il numero np
i
di esse che ci si deve attendere che ricada in
ciascuna classe costante e pari ad
n
k
.

1
Se la x distribuita secondo la legge doppio esponenziale, si ha quindi: x e
a
k
i
i
=
1
lnln
12
Indicando con n
i
il numero di valori effettivamente osservati della x compresi fra x
i+1
ed x
i
, la
grandezza

( )
X
n np
np
k
n
n n
i i
i i
k
i
i
k
2
1
2
2
1
=

=

= =
(55)
si pu ammettere che risulti distribuita come la grandezza statistica
2
con un numero di gradi
di libert f pari a k-3
1
, purch siano sufficientemente grandi sia il numero k di classi sia il numero
n
k
di valori che ci si deve attendere in ciascuna classe. Generalmente basta assumere k 5 e pari
al massimo fra i numeri interi per cui risulta n/k 5
In definitiva si accetta l'ipotesi di lavoro con il livello di significativit,
(2)
se
2
risulta
inferiore al valore critico
0
2
di
2
corrispondente ad una probabilit cumulata (1-) (Tab. II).

n k f
0
2
25 - 29 5 2 5,99
30 - 34 6 3 7,81
35 - 39 7 4 9,49
40 - 44 8 5 11,10
45 - 49 9 6 12,60
50 - 54 10 7 14,10
Tabella II
Valori critici
0
2
del chi-quadrato per un livello di significativit = 0,05.

Disposti gli n dati osservati della variabile x in ordine crescente, il test di kolmogorov mette
a confronto per ogni valore x
i

la frequenza cumulata ( ) F x
i
e la probabilit cumulata P(x
i
)
corrispondente ad x
i
in base all'ipotesi avanzata, e calcola la grandezza statistica:
D = max |F(x
i
) - P(x
i
)| (56)
pari alla massima differenza in valore assoluto tra F(x
i
) e P(x
i
).

1
Un grado di libert perduto per il vincolo p
i
t
=
=
1
1
altri due gradi di libert per le relazioni che permettono di
stimare i parametri della distribuzione
2
Il livello di significativit la probabilit di rigettare l'ipotesi quando essa vera.
13
Si accetta l'ipotesi di lavoro con il livello di significativit se D risulta inferiore al valore
critico D
0
corrispondente alla probabilit cumulata 1 - , valore che dipende solo dalla dimensione
n del campione, mentre risulta indipendente dalla distribuzione della x (Tab.III).
Nel caso che i parametri che definiscono la P(x) devono essere stimati dal campione, cos
come accade di norma nelle indagini idrologiche, i valori D
0
riportati in Tabella III sono
leggermente inferiori dei reali valori critici di quantit che per non sono note. Il test di
Kolmogorov in questo caso perci approssimato.
Esso presenta il vantaggio che pu essere effettuato anche per via grafica, rappresentando su
carta probabilistica le curve di controllo della F(x), definite in base alle relazioni
F
1
(x) = P(x) - D
0
e F
2
(x) = P(x) + D
0
.

Tabella III
n D
0
5 0,56
10 0,41
15 0,34
20 0,29
25 0,27
30 0,24
35 0,23
40 0,21
45 0,2
50 0,19
> 50 1.36/n
Tabella III
Valori critici D
0
della statistica di Kolmogorov per un livello di significativit = 0,05.

Determinazione della fascia fiduciaria della (x)
3.5. Come gi si detto al paragrafo 3.2, la retta P(x), stimata con il metodo della massima
verosimiglianza, che meglio interpola i punti empirici [x; F(x)] compendia tutta l'informazione che
il singolo campione di cui disponiamo pu fornirci nei riguardi della funzione di ripartizione (x),


14
che caratterizza la popolazione della x. Trattandosi, per, di un campione di dimensione limitata
non pu escludersi che, per difetto di campionatura, la P(x), pur essendo la migliore stima della
(x) che pu trarsi da esso, si scosti anche se di poco dalla (x)
1
.
Pi precisamente, ricordando che la (x) non nota e indicando al solito per un assegnato
valore di :
con x

, frattile di , il valore di x che nella popolazione corrisponde a ;


con x
P
, per P = , stima di x

dedotta dal campione di dimensione n di cui disponiamo, il
valore di x che corrisponde a un valore di P pari a ;
si definiscono:
limiti fiduciari x
1
e x
2
di x

i

valori estremi fra cui ci si deve attendere che ricada x


tenuto conto che il campione di dimensione n ne ha dato la stima x
P
, per P = ;
intervallo fiduciario di x

, l'intervallo compreso tra x


1
e x
2
;
fascia fiduciaria della (x), la fascia del piano che nella carta probabilistica di Gumbel
risulta delimitata dalle curve che collegano i punti corrispondenti ai limiti fiduciari, ed entro cui ci
si deve attendere che ricada la retta che rappresenterebbe, ove mai fosse nota, l'effettivo andamento
della (x).
Tutto ci premesso, in base al calcolo delle probabilit si dimostra che per ogni valore di :
1) la x
P
, per P = , pu essere tratta alla stregua di una variabile casuale distribuita
approssimativamente secondo la legge normale con media M(x
P
) = x

con varianza
2
(x
P
) data
dalla (49) o (53) a seconda che la stima di x
P
sia stata dedotta dal campione di dimensione n con il
metodo dei momenti o con il metodo della massima verosimiglianza;
2) lo scarto massimo che ci si pu attendere fra x
P
e x

a meno di una probabilit pari a


(livello fiduciario), che al solito si assume pari al 5%, pari in valore assoluto a:

1
Come ovvio lo scostamento che ci si deve attendere tra la P(x) e la (x) risulta maggiore se per la stima della P(x) si
adotta il metodo dei momenti, meno efficiente del metodo migliore di stima, cio del metodo della massima
verosimiglianza (par.7.2).
15
( ) x x x P
P P
=


max
2 per (57)
3) noto x
P
, i limiti fiduciari x
1
e x
2
della x

, come innanzi definiti, risultano pari


rispettivamente a:

( )
x x x
P P 1
2

( )
x x x
P P 2
2 + (58)
Come ovvio, giusta la definizione datane, x
1
e x
2
rappresentano rispettivamente il valore
minimo e il valore massimo che potrebbe avere x

, tenuto conto che il campione di cui disponiamo


ne ha dato la stima x
P
, per P = . Con grande probabilit, per x

non coincide n con x
1
, n con
x
2
, ma con un valore intermedio, contenuto cio nell'intervallo fiduciario delimitato da x
1
e da
x
2
, e pi vicino ad x
P
.
L'ampiezza dell'intervallo fiduciario della x

, pari circa a 4(x


P
), costituisce una misura
dell'indeterminatezza con cui possibile conoscere x

, risultando tanto maggiore, come si pu


vedere dalla (49) e dalla (53):
al diminuire della dimensione n del campione;
al diminuire dell'efficienza del metodo di stima adottato;
all'aumentare della variabilit della x;
all'aumentare del valore assoluto assunto dalla variabile ridotta y, e cio dello scostamento
di dal valore 0,368, a cui corrisponde per la (14) il valore y=0.







4. Esempio di applicazione della metodologia al caso delle portate al colmo del fiume Sele.
16
a) Si considera la serie storica dei massimi annuali delle portate al colmo di piena registrati nella
stazione del Sele ad Albanella nel periodo tra il 1929 e il 1970 (tab. IV), con un periodo di
osservazione n = 39 anni. Si formula lipotesi di lavoro che detta serie sia distribuita secondo la
legge di Gumbel, per cui si procede alla rappresentazione dei punti
( )
| |
x F x
i i
;
sulla carta
probabilistica.
Anno Q (m
3
/s) Anno Q (m
3
/s) Anno Q (m
3
/s)
1929 405 1943 - 1957 391
1930 470 1944 - 1958 517
1931 930 1945 - 1959 661
1932 256 1946 642 1960 362
1933 720 1947 1470 1961 737
1934 376 1948 504 1962 887
1935 1540 1949 478 1963 983
1936 1040 1950 714 1964 627
1937 843 1951 2035 1965 470
1938 1240 1952 1390 1966 997
1939 856 1953 564 1967 638
1940 842 1954 455 1968 782
1941 940 1955 266 1969 869
1942 773 1956 538 1970 936
Tab. IV. Sele ad Albanella: massimi annuali delle portate al colmo di piena Q
c
.

Disposti gli n dati in ordine crescente, si associa a ciascun valore Q(i) la propria frequenza
cumulata (Tab. V) :

( )
( )
F Q
i
n
i
=
+1
(43)
e quindi si riportano in carta probabilistica di Gumbel i punti (Q(i), F(Q(i))) (Fig. 5).
i Q (m
3
/s) F(Q
(i)
) i Q (m
3
/s) F(Q
(i)
) i Q (m
3
/s) F(Q
(i)
)
1 256 0.025 14 564 0.350 27 869 0.675
2 266 0.050 15 627 0.375 28 887 0.700
3 362 0.075 16 638 0.400 29 930 0.725
4 376 0.100 17 642 0.425 30 936 0.750
5 391 0.125 18 661 0.450 31 940 0.775
6 405 0.150 19 714 0.475 32 983 0.800
7 455 0.175 20 720 0.500 33 997 0.825
8 470 0.200 21 737 0.525 34 1040 0.850
9 470 0.225 22 773 0.550 35 1240 0.875
10 478 0.250 23 782 0.575 36 1390 0.900
11 504 0.275 24 842 0.600 37 1470 0.925
12 517 0.300 25 843 0.625 38 1540 0.950
13 538 0.325 26 856 0.650 39 2035 0.975
Tab. V. Sele ad Albanella: frequenze cumulate per i massimi
annuali delle portate al colmo di piena.
17
0,999
0,998
0,995
0,99
0,98
0,95
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,05
0,01
5
10
20
50
500
100
1000
-
2
0
0 0
2
0
0
4
0
0
6
0
0
8
0
0
1
0
0
0
1
2
0
0
1
4
0
0
1
6
0
0
1
8
0
0
2
0
0
0
2
2
0
0
Q (m
3
/s)
(Q)
T
(x)

Fig. 5. Sele ad Albanella : rappresentazione delle frequenze cumulate dei massimi al colmo di piena
e della stima della funzione di ripartizione P(x) di (x).

b) Precisazione dell'ipotesi di lavoro
Si applica il metodo dei momenti per ricavare le stime e di ed a di , in funzione della
media
x
e dello scarto quadratico medio sx, ottenute dagli n dati a mezzo delle relazioni:
e = x - 0,450 s
x
(44)

1
128255 a
s
x
=
.
(45)
Le stime e ed a dei parametri ed (Tab. VI) della distribuzione a mezzo delle relazioni (44) e
(45) permettono di rappresentare la P(x) che in carta probabilistica di Gumbel meglio interpola i
punti empirici [x; F(x)] e rappresenta una stima della (x) (Fig. 5).
18

Per la serie in oggetto si ottengono i seguenti valori dei parametri:

x
772.9
s
x
375.8
0.0034
603.8
Tab. VI. Media, scarto quadratico medio e valori dei parametri della distribuzione di Gumbel
per la serie dei massimi annuali di portata al colmo di piena registrati nella stazione del Sele ad Albanella.


c) verifica dell'ipotesi di lavoro
Per verificare se gli scarti fra la distribuzione di frequenze cumulate F(x) e la funzione P(x)
siano da addebitare a scarti di campionatura e non siano significativi in termini probabilistici si
applica il test del chi-quadrato.
Si suddivide il campo di variazione della Q in k classi equiprobabili in modo che sia verificata
la relazione :
n/k 5
I limiti degli intervalli di classe si ottengono in funzione della probabilit cumulata i/k di
ciascuna classe i (Tab. VI) a mezzo della relazione :
Q
k
i
i
=

1
ln ln
Il numero di osservazioni che ci si deve attendere che ricada in ciascuna classe costante e
pari ad
n
k
.
Classe 1/k i/k Q
i
n
i
1 0.143 0.143 408.9 6
2 0.143 0.286 537.8 6
3 0.143 0.429 652.4 5
4 0.143 0.571 773.9 5
5 0.143 0.714 922.9 6
6 0.143 0.857 1151.5 6
7 0.143 1.000 5
Tab. VI
Indicando con n
i
il numero di valori effettivamente osservati nella generica classe Q
i+1
Q
i
, si
calcola la grandezza X
2
pari a :
19

( )
X
n np
np
k
n
n n
i i
i i
k
i
i
k
2
1
2
2
1
=

=

= =
(55)
che risulta pari a :
X
2
7
39
219 39 0 308 = = .
In definitiva si accetta l'ipotesi di lavoro avendo fissato il livello di significativit pari a
0.05, confrontando il valore
2
calcolato con il valore critico
0
2
di
2
corrispondente ad una
probabilit cumulata (1-) (Tab. II), che in corrispondenza del numero di gradi di libert k -3 = 4
pari a
0
2
= 9,49. Poich X
2
<
0
2
, lipotesi di lavoro pu essere accettata.