Metodi Numerici v2.2

Indice
1 Generalità sui metodi numerici 3

1.1 Analisi degli errori . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Condizionamento di un problema numerico . . . . . . . . . . 5
1.3 Stabilità di un algoritmo . . . . . . . . . . . . . . . . . . . . . 9
1.4 Criteri di convergenza e troncamento di processi iterativi . . . 12
2 Metodi numerici 16
2.1 Metodi di risoluzione di equazioni lineari con sorgente . . . . 16
2.1.1 Metodo di Jacobi . . . . . . . . . . . . . . . . . . . . . 16
2.1.2 Metodo di Gauss-Seidel . . . . . . . . . . . . . . . . . 23
2.1.3 Metodo di Jacobi vs Metodo di Gauss . . . . . . . . . 24
2.1.4 Metodo SOR . . . . . . . . . . . . . . . . . . . . . . . 25
2.1.5 Shift tra metodo di Jacobi e metodo SOR . . . . . . . 28
2.1.6 Ordinamento dei nodi di usso . . . . . . . . . . . . . 29
2.2 Risoluzione di sistemi di equazioni non lineari . . . . . . . . . 30
2.2.1 Metodo di Newton per la risoluzione di sistemi non
lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Metodi per problemi agli autovalori . . . . . . . . . . . . . . . 31
2.3.1 Scomposizione QR di una matrice . . . . . . . . . . . 31
2.3.2 metodo QR . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.3 Metodo delle potenze . . . . . . . . . . . . . . . . . . 33
2.4 Proprietà spettrali delle matrici di interazione . . . . . . . . . 38
2.5 Approssimazione di dati sperimentali . . . . . . . . . . . . . . 39
2.5.1 Funzioni spline . . . . . . . . . . . . . . . . . . . . . . 39
2.6 Integrazione numerica . . . . . . . . . . . . . . . . . . . . . . 42
2.7 Equazioni integrali . . . . . . . . . . . . . . . . . . . . . . . . 50
3 Metodi numerici per lingegneria nucleare 52
3.1 Introduzione alla tecnologia ed alla sica nucleare . . . . . . . 52
3.1.1 Il concetto di criticità e le sue implicazioni . . . . . . . 55
3.1.2 Fenomeni non stazionari . . . . . . . . . . . . . . . . . 56
3.1.3 Limportanza neutronica ed i metodi per lo studio di
problemi pseudo-stazionari . . . . . . . . . . . . . . . 57
1
3.2 Il consumo del combustibile nucleare . . . . . . . . . . . . . . 60
3.3 Dierenze nite ni . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.1 Diusione monodimensionale monogruppo . . . . . . . 61
3.3.2 Problemi con sorgente . . . . . . . . . . . . . . . . . . 65
3.3.3 Non omogeneità dello spazio . . . . . . . . . . . . . . 66
3.3.4 Diusione bidimensionale monogruppo . . . . . . . . . 69
3.3.5 Diusione multigruppo . . . . . . . . . . . . . . . . . . 72
3.3.6 Accelerazione della convergenza delle iterazioni esterne 85
3.4 Metodi Coarse Mesh . . . . . . . . . . . . . . . . . . . . . . . 88
3.4.1 Metodi Quabox . . . . . . . . . . . . . . . . . . . . . . 89
3.4.2 Metodi Cubbox . . . . . . . . . . . . . . . . . . . . . . 92
3.5 Elementi di cinetica neutronica . . . . . . . . . . . . . . . . . 93
3.6 Elementi di Trasporto neutronico . . . . . . . . . . . . . . . . 101
3.6.1 Formulazione integrale . . . . . . . . . . . . . . . . . . 102
A Aggiustamento di sezioni durto 106
A.1 Introduzione alle basi di dati . . . . . . . . . . . . . . . . . . 106
A.2 Elementi di statistica . . . . . . . . . . . . . . . . . . . . . . . 108
A.3 Aggiornamento di dati dierenziali a partire da dati integrali 112
A.4 Teoria delle perturbazioni . . . . . . . . . . . . . . . . . . . . 116
2
Capitolo 1
Generalità sui metodi
numerici
1.1 Analisi degli errori
Lanalisi numerica di un problema sico porta necessariamente alla pro-
duzione di un certo numero di errori, dei quali è necessario conoscere lentità
al ne di ridurla al minimo Esistono varie tipologie di errore:
Errori di idealizzazione : Derivano dalla decisione di trascurare deter-
minati elementi del problema sico di partenza per semplicità
Errori di matematizzazione : Derivano dalla semplicazione delle equazioni
allo scopo di ottenere un modello matematico pi` u facile da trattare.
Questa perdita di informazioni è di dicile recupero
Errori numerici : Risiedono intrinsecamente nella risoluzione numerica
di un problema. Sono costituiti ad esempio dalla discretizzazione
temporale e spaziale del problema
Errori sui dati di input : Derivano come facilmente comprensibile da
eventuali incertezze o imprecisioni sui dati di input
Errori di calcolo numerico : Derivano da tutte le approssimazioni ef-
fettuate allinterno della risoluzione del problema numerico, come il
troncamento di processi iterativi
Errori di misura : Derivano dal fatto che nel momento in cui si vanno a
confrontare i dati numerici con quelli sperimentali questi ultimi saran-
no inevitabilmente soggetti ad un errore di misura. In questa fase è
opportuno ricordare che grande attenzione deve essere posta nelluti-
lizzo degli strumenti, in particolare evitando che essi vengano utilizzati
al di fuori del loro range
3
Errori di arrotondamento : Derivano dal fatto che un calcolatore può
memorizzare solo un numero nito di cifre decimali.
Viene qui approfondito il discorso legato agli errori di arrotondamen-
to. Linsieme detto dei numeri di macchina è di fatto un sottoinsieme
dellinsieme dei numeri reali. Allinterno di un calcolatore i numeri sono
immagazzinati in virgola mobile, ovvero sottoforma di un modulo e di
una potenza in base 10
1
che diventa virgola mobile normalizzata ove
il modulo della mantissa è sempre 0.1 < [a[ < 1. Denito t il numero di cifre
decimali della mantissa, si avrà ovviamente che le dimensioni dellinsieme
dei numeri di macchina aumentano con laumentare di t. Si ha banalmente
che per t = A R, ovvero se t tende ad innito non commetto
errori di arrotondamento
2
.
Vediamo meglio come è possibile denire lerrore di arrotondamento.
Si denisce loperatore somma per il calcolatore, dato da
x y = (x +y)(1 +) con[[ eps
Si ricordi però che un calcolatore opera solo con numeri di macchina. Si
denisce dunque che se x non appartiene a tale insieme, esisterà un suo ar-
rotondamento opportuno che lo porterà a diventare un numero di macchina
In generale avremo che eps 10
22
. Apparentemente è una quantità
molto piccola, ma se le operazioni sono associate a fattori di amplicazione
dellerrore derivanti dal cattivo condizionamento del problema può risultare
rilevante la propagazione di tale errore.
Si supponga ora
y = a +b +c con y = fl((a +b) +c)
ove loperazione indica operazione reale eseguita in virgola mobile.
Chiamando = fl(a + b) risultato in virgola mobile della somma tra
parentesi, esso varrà
= (a +b)(1 +
1
)
da cui
y = fl( +c) =
= ( +c)(1 +
2
) =
= (a +b +c)[1 +
a +b
a +b +c
1
(1 +
2
) +
2
]
Si denisce ora
y
tale per cui y = (a +b +c)(1 +
y
)
1
ad esempio il numero 439 diventa 0.439 10
2
2
Per maggiore completezza è necessario precisare che è necessario che anche il numero
di cifre per lesponente di 10 deve tendere ad innito anchè linsieme dei numeri di
macchina tenda a quello dei numeri reali
4
Si può ragionevolmente pensare di trascurare il termine contenente la
moltiplicazione di due innitesimi, in modo da ottenere
y
=
a +b
a +b +c
1
+
2
Si vede dunque che i due errori sono pesati con pesi diversi. In particolare,
nel caso in esame, lerrore sulla seconda operazione pesa pi` u di quello sulla
prima.
Due algoritmi diversi accumuleranno errori di arrotondamento in modo
diverso. Tuttavia questa considerazione perde di validità ove il valore di t
tenda ad innito. Questa condizione è denita di computer ideale ovvero
algoritmo indipendente.
In un computer reale invece, anche avendo in input solo numeri di
macchina, sono in genere sucienti pochi passaggi per rendere nuovamente
necessaria una approssimazione, dando luogo ad errori di arrotondamento.
La quanticazione di tali errori è data da eps = 5 10
t
, ove tale valore è di
fatto il massimo errore di arrotondamento che posso avere per ogni calcolo,
ed è detto sensibilit` a del computer.
Va ricordato che un problema numerico è disgiunto dalla strategia che
viene utilizzata per risolverlo. In sostanza il problema numerico e lalgorit-
mo che verrà ad esso applicato per ricavare la soluzione sono slegati luno
dallaltro.
1.2 Condizionamento di un problema numerico
Elemento importante da studiare è il condizionamento di un problema
numerico, che di fatto esprime la sua suscettibilità ad oscillazioni ed errori
sui dati di input. Un problema mal condizionato non può essere risolto a
cuor leggero, in quanto non si può essere sicuri delladabilità dei risultati
ottenuti. Questo problema risulta di particolare interesse nei problemi nu-
cleari soprattutto per via di alcune grandezze sperimentali, come le sezioni
durto e le lunghezze di diusione, il cui valore è facilmente soggetto ad
incertezze anche importanti.
La maggior parte dei problemi di condizionamento è legata alla sensi-
bilità del computer. Essa è denita in maniera tale per cui a + b = a se
b < , ove è proprio la sensibilità del computer.
Si prenda una generica funzione:
(x) =
_
_
_
1
(x
1
....x
n
)
.
.
.
n
(x
1
....x
n
)
_
_
_
Si chiami ora x il valore approssimato, aetto da incertezza, tale che x =
[x x[ e denisco
x
i
=
|x x|
x
la perturbazione o incertezza relativa.
5
Ovviamente nella realtà il valore di tale perturbazione relativa non è noto,
in quanto x stesso non è noto. In generale tuttavia, quantomeno sui dati in
ingresso, si può eettivamente quanticare tanto x quanto x
Il risultato desiderato è una quanticazione del condizionamento del
problema, vale a dire una relazione del tipo y = f(x)
Un esempio per procedere è utilizzare uno sviluppo in serie di Taylor
troncato al primordine.
y
i
= [ y
i
y
i
[ =
i
( x)
i
x =
n
j=1
( x
j
x
j
)
i
x
j
+ [...]
Il poter supporre che le entità [x x[ siano piccole permette di approssimare
la serie al primordine. Evidentemente questo non è sempre vero: ove le
siano dellordine del 30% del valore nominale, questa approssimazione non
è pi` u valida.
Il vettore y dato dalle singole componenti delle perturbazioni in uscita
sarà dunque dato da:
y =
_
_
_
1
x
1

1
x
n
.
.
.
.
.
.
.
.
.
m
x
1

m
x
n
_
_
_
_
_
_
x
1
.
.
.
x
n
_
_
_
Che, in forma matriciale, diventa:
y = D(x) x
Ove D(x) rappresenta la jacobiana della trasformazione calcolata in x.
Si ricorda a questo proposito che la jacobiana, calcolata in un punto preciso,
è una matrice di numeri a tutti gli eetti, ed in questo caso costituisce il
fattore di amplicazione della perturbazione assoluta in ingresso
e dipende solo dalla denizione del problema numerico, e non dallalgorit-
mo scelto per la risoluzione. In particolare lelemento a
i,j
rappresenta il
fattore di amplicazione con cui la componente i-esima del vettore in uscita
viene inuenzata dalla perturbazione della j-sima componente del vettore di
input
Dunque, come già detto in precedenza e qui dimostrato, il condiziona-
mento di un problema è algoritmo indipendente.
Eettuando discorsi analoghi sugli errori relativi si ottiene il fattore di
amplicazione delle perturbazioni relative in ingresso:
y
i
=
n
i=1
x
j
(
i
x
j
)
x
j
i
Il condizionamento del problema tuttavia non è uguale per tutti i valori
di input, ma potrebbe essere buono rispetto ad alcuni e meno rispetto ad
6
altri. Poichè il fattore di amplicazione non è un numero ma una matrice,
utilizzando un tipo di norma piuttosto che unaltra si potranno evidenziare
in modo pi` u o meno marcato eventuali picchi di condizionamento. Si noti
che, seppure la libertà di scelta della norma da utilizzare è ampia, loperatore
norma di una matrice deve rispettare determinate proprietà che ne perme-
ttono il confronto con vettori ed altre matrici. Un esempio classico di norma
è |A| =
_
a
2
i,j
, ma una possibile alternativa è anche |A| = max([a
i,j
[).
Si prenda un esempio di problema: (x, y) = x y, da cui avremo
xy
=
x
x y
x

y
x y
y
Da questo si vede che se (x y) tende a zero i fattori di amplicazione
aumentano enormemente.
Se il problema è lineare, esso è scrivibile come
Ax = b
Lo studio del condizionamento di un problema lineare sarà esprimibile dalla
soluzione del problema A(x+x) = (b +b), ove b dipende dalla sensibilità
dello strumento.
La matrice A invece è una caratteristica del problema numerico e non
varia con il termine sorgente. Ovviamente indipendentemente dal valore
della perturbazione, il problema è risolvibile (in questo caso, con problema
linere e non omogeneo) solo se det(A) ,= 0
|x|
|x|
|A||A
1
|
|b|
|b|
Infatti si avrà che:
Ax +Ax = b +b
Che, ricordando la dicitura iniziale del problema (che rimane ovviamente
valida anche in seguito alla perturbazione) diventa:
Ax = b x = A
1
b
Passando al confronto tra norme si ottiene:
|x| = |A
1
b| |A
1
||b|
Ricordando che vale anche che:
|b| = |Ax |A||b|
Si ottiene che, dividendo ambo i membri della disequazione precedente per
la norma di b, si ottiene:
|deltax|
|A||x|
|A
1
|
|b|
|b|
7
Dalla quale si deriva facilmente quanto si voleva dimostrare
Il valore |A||A
1
| è denito fattore di amplificazione, e dipende
da A. Pi` u tale fattore è alto, peggiore sarà il condizionamento del problema.
Si tenga ben presente il fatto che nora non è mai stato fatto alcun cenno
ad algoritmi o a metodi di risoluzione del problema. Il condizionamento di
un problema è infatti algoritmo indipendente, ed è invece strettamente
legato al problema sico di partenza.
In tutti questi passaggi si noti che gli errori considerati non sono nec-
essariamente quelli sui dati in ingresso. Il vettore x di input può essere
contenuto in una qualsiasi fase del problema, e dunque lerrore ad esso as-
sociato potrebbe essere, ad esempio, lerrore di arrotondamento derivante
dallapprossimazione del risultato del calcolo precedente.
Questo insieme di considerazioni prende il nome di backward anal-
ysis ed ha la funzione di validare problemi ed algoritmi in funzione del
condizionamento del problema. Il punto chiave del problema risiede ove un
eventuale errore di calcolo porti ad ottnere comunque risultati plausibili, il
che rende dicile accorgersi della presenza di un errore dalla semplice analisi
dei risultati.
Prendiamo un esempio molto comune: ci si trova davanti ad un poli-
nomio di grado n del quale si vogliono identicare gli zeri. Questo è un
problema spesso non lineare, il cui condizionamento raramente è buono, e
tanto peggiore quanto pi` u alto è il grado n del polinomio, anche se non tutti
gli zeri sono condizionati allo stesso modo. In generale infatti avremo che
un generico zero
i
di un polinomio è mal condizionato se:
_
P
n
i
0
In generale ove ci troviamo di fronte ad un problema mal condizionato non
è possibile risolverlo cos` comè tramite algoritmi. Si rivela in questi casi
necessario andare a variare ciò che è stato fatto a monte, cercando ad esempio
di ridurre gli errori iniziali (idealizzazione, matematizzazione, ecc.) o a
riconsiderare il problema dallinizio. Tuttavia nessuna di queste opzioni
fornisce garanzie sul risultato nale.
Spesso accade dunque che un problema del tipo P
n
(x) = 0 venga trasfor-
mato in un problema Ax = x, ove i due non hanno niente in comune se
non la soluzione.
3
3
Si noti come tutti i discorsi fatti no ad ora per gli errori possano essere applicati in
maniera perfettamente analoga a delle perturbazioni volontarie, come potrebbe essere
ad esempio il voler testare come il punto di funzionamento di un sistema è inuenzato dal
variare dei parametri operativi
8
1.3 Stabilità di un algoritmo
Si prenda ora un passaggio qualunque del processo risolutivo di un problema
numerico. Ogni singola operazione di un algoritmo si presenterà come una
specie di micro-problema numerico, in cui in ingresso si ha il risultato di
tutte le operazioni che stanno a monte che sarà, evidentemente, soggetto ad
una incertezza legata agli arrotondamenti precedenti. Sarà dunque neces-
sario anche lo studio del condizionamento di tale micro-problema, denito
condizionamento locale. In questa visione dunque un algoritmo non è
altro che una serie di micro-problemi numerici, che vanno studiati localmente
dal punto di vista del condizionamento.
Un esempio banale di questo concetto è loperazione xy. Tale problema
è fortemente mal condizionato.
Supposto che in una qualsiasi operazione x
1
, x
2
, ..., x
n
sia il vettore
dei dati in ingresso ed y
1
, y
2
, ..., y
m
sia il vettore di uscita, si può denire
y = (x) il problema numerico, che sarà caratterizzato da:
: D R
m
D R
n
y R
m
x R
n
_
y
i
=
i
(x
1
, ....x
n
)
i = 1 : m
Cosa è invece lalgoritmo? Si avrà che
(i)
: D
(i)
D
(i+1)
con i = 0 : r e D
(j)
R
n
j
=
(r)
(r1)

(1)
(0)
Dunque se il dato di ingresso è x
0
, si avrà che il dato in uscita sarà
(0)
x
0
= x
1

(1)
x
1
= x
2
...
(r)
x
r
= x
r+1
Per risolvere un problema numerico si possono applicare molti algoritmi
diversi. Al di là delle questioni che vedremo in seguito sul costo e la velocità
di convergenza di un algoritmo, è importante a priori assicurarsi che esso sia
ben fatto, dallinglese robust.
Per vericare la stabilità di un algoritmo si tengono in conto gli arroton-
damenti in virgola mobile ed il condizionamento del problema che si vuole
andare a risolvere.
Si supponga di avere un algoritmo composto da r funzioni
(i)
, ciascuna
delle quali sia derivabile e continua nel suo dominio. Si denisce inoltre
una nuova funzione
(i)
come la trasformazione residua, data dalla
composizione di tutte le
(j)
con i j r. Ne deriva che
(0)

Sapendo che vale
D(f g)
x
= D(f)
x
D(g)
x
9
è possibile denire le jacobiane di e , ed in particolare si può dire che:
D(x) = D
(r)
(x
(r)
)D
(r1)
(x
(r1)
) D
(0)
(x
(0)
)
D
(i)
(x
(i)
) = D
(r)
(x
(r)
)D
(r1)
(x
(r1)
) D
(i)
(x
(i)
)
Si ricorda che, nel momento in cui si parla di un algoritmo, si parla di un
computer reale , il che porta a dire che il numero di cifre della mantissa è
nito. Si avrà dunque a che fare con grandezze approssimate del tipo:
x
(i+1)
= fl(
(i)
( x
(i)
))
Quello che ora è necessario calcolare è il valore di x
i
ad un i-esimo passaggio
di un algoritmo, che sarà dato dal valore approssimato ottenuto meno il
valore esatto:
x
(i+1)
= [fl(
(i)
x
(i)
)
(i)
x
(i)
]
Sommando e sottraendo la quantità [
(i)
x
(i)
] si ottiene:
x
(i+1)
= [fl(
(i)
( x
(i)
))
(i)
( x
(i)
)] + [
(i)
( x
(i)
)
(i)
(x
(i)
)]
Il secondo termine tra parentesi quadre rappresenta il condizionamento lo-
cale del problema
(i)
, e sarà dunque uguale a
[
(i)
( x
(i)
)
(i)
(x
(i)
)] = D
(i)
(x
(i)
) x
(i)
Ne consegue che lerrore nale non sarà semplicemente la somma degli errori
di arrotondamento, ma conterrà anche il contributo del condizionamento di
ogni step dellalgoritmo considerato.
Per calcolare invece il contributo dato dal primo termine tra parentesi
quadre si deve svolgere come segue. Essendo
(i)
una funzione a pi` u variabili,
si potrà scrivere:
(i)
=
_
(i)
1
(u)
(i)
2
(u)
.
.
.
(i)
n
(u)
_
_
Prendendo la j-esima di queste funzioni e analizzando il suo operare su u in
virgola mobile si ottiene un risultato aetto dal seguente errore:
fl(
(i)
j
(u)) = (1 +
j
)(
(i)
j
(u)) con [
j
[ eps
Mettendo il tutto in una equazione pi` u compatta si potrà dunque scrivere:
fl(
(i)
(u)) = (I +E
(i+1)
)(
(i)
(u))
Con
E
(i+1)
=
_
_
_
(i+1)
1
0
.
.
.
0
(i+1)
n
_
_
_
10
Questa è dunque lespressione che interessa, ricordando che al posto di u ci
sarà x
(i)
. In realtà si adotterà qui lapprossimazione di supporre lerrore di
arrotondamento piccolo, andando cioè a confondere x
(i)
con x
(i)
. Dunque in
denitiva
[fl(
(i)
x
(i)
(i)
( x
(i)
)] E
i+1
(i)
(x
(i)
)
Il termine a destra delluguale è chiamato anche
i+1
ed è chiamato errore
assoluto di arrotondamento che nasce dal calcolo in virgola mobile di
In denitiva, sommando i due fattori, si ottiene:

x
(i+1)
E
i+1
(i)
(x
(i)
) +D
(i)
(x
(i)
) x
(i)
Quanto varrà in denitiva y ? Sarà legato sia al microcondizionamento
che al macrocondizionamento, nonchè agli errori di arrotondamento. Chia-
mando
i
lerrore di arrotondamento alli-esima iterazione si avrà che:
per i=0 x
(0)
= x
per i=1 x
(1)
= D
(0)
(x
(0)
)x +
1
per i=2 x
(2)
= D
(1)
(x
(1)
)[D
(0)
(x)x +
1
] +
2
Si vede dunque che gli errori non si sommano ma si propagano. Dunque
inne ricordando della proprietà della jacobiana di una composizione di
funzioni, varrà che:
y = D(x)x +
r
i=0
D
(i)
(x
(i)
)
i
+E
r+1
y
Si avrà dunque un primo contributo, dato dal macrocondizionamento del
problema ed indipendente dallalgoritmo, pi` u un termine dato dalle oper-
azioni interne dellalgoritmo costituito da una composizione degli errori e
della jacobiana della funzione composta . Questa seconda parte è quella
legata dunque alla stabilità dellalgoritmo, che sarà considerato accettabile
ove lincertezza legata allalgoritmo è confrontabile con quella generata a
priori dal problema numerico. Si dirà in questo caso che lalgoritmo è ben
fatto o robusto. Si faccia attenzione tuttavia al fatto che il concetto di ro-
bustezza e stabilità di un algoritmo è indipendente da quello di convergenza
del problema, che è invece calcolata in termini ideali.
Venendo inne al termine E
r+1
y, si vede che esso rappresenta la coda del-
lerrore, larrotondamento sullultimo step dellalgoritmo, è evidentemente
sempre presente ed il suo valore è maggiorato da E
r+1
y eps[y[. Si avrà in-
oltre che qualunque sia il problema o lalgoritmo, a meno che in ingresso non
si abbiano solo numeri di macchina esisterà anche un arrotondamento sui
dati in ingresso. Si denisce in denitiva errore inevitabile la quantità:
(0)
y = eps([D(x)[[x[ +[y[)
11
Comunque sia fatto lalgoritmo, non è possibile andare al di sotto di questo
errore, ed è per questo usato come termine di paragone.
Si tenga conto che, in generale, non è possibile analizzare per intero, step
per step, la stabilità di un algoritmo che abbia qualche migliaio di passaggi.
Quel che si fa è, in generale, analizzare soltanto le situazioni considerate
potenzialmente critiche.
1.4 Criteri di convergenza e troncamento di pro-
cessi iterativi
Uno dei problemi principali in analisi numerica è quello di stabilire un cri-
terio per determinare la convergenza di un problema iterativo. Tale proced-
imento è purtroppo eettuabile a priori solo nella risoluzione di problemi
lineari. Per quanto riguarda invece i problemi non lineari questo non è
sempre vero.
Altra questione non da poco conto è quella di stabilire un criterio per il
troncamento di un processo iterativo. Posto infatti che lalgoritmo porti a
convergenza, ci si chiede quale sia il momento per arrestare il calcolo, de-
nendo cos` la soluzione che, pur non essendo quella esatta, verrà considerata
come denitiva.
Bisogna fare attenzione alle caratteristiche intrinsecamente diverse di
dierenti algoritmi, che potranno convergere pi` u o meno velocemente gli uni
rispetto agli altri. Risulta dunque in genere inopportuno arrestare un pro-
cesso iterativo dopo un numero arbitrario di iterazioni, poichè la soluzione
potrà essere troppo o troppo poco precisa a seconda della velocità di conver-
genza dellalgoritmo utilizzato. Per questo è opportuno stabilire dei criteri
di convergenza che diano informazioni su quale sia il momento migliore per
il troncamento
4
.
Riguardo la velocità di convergenza è opportuno fare un discorso ulte-
riore. In numerica ogni cosa si paga, e di conseguenza un algoritmo che
converge pi` u velocemente sarà, in genere, pi` u costoso, ovvero presenterà
allinterno di ogni iterazione calcoli pi` u complessi od in numero maggiore.
Il numero totale delle operazioni eettuate da un algoritmo è infatti quan-
ticabile come NxM, ove N è il numero di iterazioni ed M è il numero di
operazioni per iterazione.
La scelta dellalgoritmo da utilizzare non è dunque banale e richiede accu-
rate considerazioni di rapporto costi-beneci. Una strategia spesso attuata
è inoltre quella di utilizzare dierenti algoritmi in cascata per la risoluzione
dello stesso problema.
4
Esistono poi casi particolari, come si vedrà in seguito a proposito della teoria della
diusione, ove invece viene imposto un numero ssato di iterazioni. Le ragioni di questa
scelta saranno pi` u evidenti quando ne verranno chiarite le implicazioni nel relativo capitolo
12
Esistono inoltre procedure di accelerazione di algoritmi lenti, che perme-
ttono di ridurre il numero di iterazioni senza incrementare eccessivamente il
numero di operazioni per iterazione.
Importante è segnalare che le zone dellasse delle iterazioni non sono
tutte uguali, ed in particolare è possibile denirne due:
Zona delle prime iterazioni : qui si ha elevata dierenza tra due soluzioni
successive. Tale zona non è assestata, avvengono sconvolgimenti notevoli,
e spesso non è possibile eettuare considerazioni sulla convergenza di
un algoritmo, che è inuenzata anche dal termine forzante.
Zona asintotica : qui vi sono pochi sconvolgimenti, ma la convergenza è
lenta e vi è dierenza molto limitata tra due soluzioni successive. Dal-
laltro lato è però la velocità di convergenza è molto spesso stimabile
a priori e dipende solo dalla matrice di iterazione dellalgoritmo.
Soermandosi sulla zona asintotica si nota che un algoritmo molto lento
potrebbe indurre a credere di trovarsi già prossimi alla convergenza, quando
invece se ne è ancora ben lontani
Una soluzione a tale problema è quella di utilizzare il residuo, ovvero la
dierenza dalleguaglianza che si ottiene andando a sostituire la soluzione ap-
prossimata nellequazione di partenza. Lentità di tale residuo darà dunque,
generalmente, informazioni utili sulla qualità della soluzione ottenuta.
Si prenda ad esempio un generico problema del tipo Ax = b. Si densice
x soluzione esatta del problema, ove invece x
n
ne è la soluzione approssimata
alln-esima iterazione. Ne viene che:
A x
b =
0
Ax
n

b = r ,=
0
Calcolare il valore di | r | può come detto aiutare a valutare il livello di
convergenza della soluzione.
Il problema del residuo tuttavia è che, per come esso è stato sinora
denito, si tratta di una quantità assolulta, il che implica che la sua in-
terpretazione non è immediata. Tale criterio verrà in generale utilizzato in
AND con altri criteri di convergenza.
Per quel che riguarda i criteri sulla soluzione in se, esistono in generale
due approcci:
Norma : Non conoscendo la soluzione si utilizza uno pseudo-errore relativo:
|
m+1
m
|
|
m+1
|

N
Tramite questo metodo si perde il dettaglio sulla singola componente,
concentrandosi invece sullinsieme dei valori. Esistono ovviamente
numerose norme che possono essere applicate per questo criterio
13
Puntuale : In questo caso non si mescolano tra loro le componenti, ma per
ciascuna viene valutata la convergenza:
[
m+1
i

m
i
[
[
m+1
i
[

P,i
i
Il problema è ora chiaramente spostato sul valore dellerrore massimo da
imporre per il troncamento del processo iterativo, la cui scelta sarà ovvia-
mente data dal rapporto costo/beneci. Il criterio puntuale è, ad esempio,
pi` u stringente e porterà in generale ad ottenere una soluzione pi` u precisa
ma al costo di un numero maggiore di iterazioni. La scelta verrà comunque
eettuata soprattutto in base a considerazioni siche. Nel caso, ad esempio,
del calcolo delle sezioni durto medie sullintervallo energetico non è richi-
esta la convergenza puntuale. Nel caso invece di sistemi di sicurezza ove vi
sono vari parametri sotto controllo, sarà necessario applicare un criterio di
convergenza puntuale per evitare imprecisione elevata su parametri molto
delicati. Si noti in ogni caso che è possibile anche utilizzare pi` u criteri di
convergenza, ad esempio puntuale su alcune elementi del vettore soluzione
e in norma sulla soluzione presa interamente.
Quali sono le possibilità che si hanno nel caso di fallimento di un algo-
ritmo?
Nel caso in cui lalgoritmo diverga, ovvero non fornisca una soluzione,
la causa può avere due nature distinte:
Natura sica: cè un errore nella denizione del problema sico
che rende la soluzione non consistente
Natura numerica: cè un errore nellalgoritmo
Laltro caso è quello in cui lalgoritmo fornisce comunque una soluzione,
diversa tuttavia da quella esatta. Questi sono in eetti i casi pi` u peri-
colosi, perchè se in un contesto di modellizzazione di fenomeni osservati
sperimentalmente è facile eettuare una verica accorgendosi deller-
rore
5
, dallaltro lato se sono in fase di progettazione non è possibile
fare questo controllo diretto no a che non è realizzato un prototipo
6
.
5
Oggigiorno il grande sviluppo dei metodi numerici e la loro sempre maggiore ad-
abilit` a stanno portando al vericarsi di condizioni opposte: talvolta è, in eetti, il metodo
numerico che viene utilizzato per validare una determinata procedura sperimentale e non
viceversa. Altro aspetto del potenziamento dei metodi numerici è che essi hanno talvol-
ta permesso di prevedere fenomeni che solo successivamente è stato possibile osservare
sperimentalmente
6
Anche in questo caso comunque non sempre le condizioni sono agevoli, anzi. Le situ-
azioni tipiche dei reattori nucleari sono infatti particolarmente negative: non soltanto i
prototipi sono particolarmente dispendiosi, ma anche una volta che questi vengono realiz-
zati non è aatto facile eettuare misure di usso neutronico per validare i calcoli numerici
tramite dati sperimentali. Le uniche apparecchiature che permettono di eettuare tale op-
14
erazione sono i TIP (Travelling Incore Probes), sonde che viaggiano in canali dedicati e
che permettono lottenimento di misure discrete. Dal punto di vista sperimentale spesso
vengono realizzati dei sistemi di prova, poco corrispondenti alla versione industriale del
progetto, ma la cui natura semplice e ben nota permette di agevolare la validazione dei
modelli numerici. Sistemi di questo tipo sono detti benchmarks
15
Capitolo 2
Metodi numerici
2.1 Metodi di risoluzione di equazioni lineari con
sorgente
2.1.1 Metodo di Jacobi
Il metodo di Jacobi è un algoritmo iterativo che converge alla soluzione di
un problema lineare non omogeneo. Esso costituisce lalgoritmo base, di cui
si vedranno in seguito le evoluzioni. Viene in genere utilizzato solo nella fase
turbolenta delle prime iterazioni per sgrossare la soluzione.
Supponiamo di operare con una matrice a diagonale dominante. Si vedrà
nelle prossime righe come eettivamente questa condizione è garanzia della
convergenza dellalgoritmo.
Il metodo di Jacobi prevede di spezzare la matrice A di interazione del
problema in due matrici:
Una matrice D, diagonale e facilmente invertibile
1
Una matrice E, tale che A = D - E
Dunque il problema diventa:
D = E +S
Il calcolo di D
1
è molto semplice, dunque potrò scrivere per questo prob-
lema:
= D
1
E +D
1
S
Ricordiamo che la moltiplicazione di una matrice o vettore qualsiasi per una
matrice diagonale mi fornisce come risultato il prodotto di ciascun elemento
di ogni riga per lelemento della diagonale corrispondente.
1
si ricorda che una matrice diagonale è invertibile solo se tutti i suoi elementi sulla
diagonale sono diversi da 0. Al tempo stesso è anche dimostrabile che, data una matrice
invertibile, è sempre possibile eettuare permutazioni di riga e di colonna che portino
allottenimento di una matrice avente solo elementi non nulli sulla diagonale
16
Chiamerò ora:
B = D
1
E matrice di iterazione
2
q = D
1
S
Da cui risulterà
= B +q
Si vede che, per come è costruita, la matrice B è a diagonale nulla ed i suoi
elementi diversi da zero sono sempre negativi ed inferiori ad 1 in modulo,
essendo essi deniti come b
ij
=
a
ij
a
ii
i ,= j
Da tutto questo segue che |B|
< 1. La norma innito è infatti denita

come il valore massimo tra le somme degli elementi delle righe di una matrice
(max(
i
[a
ij
[).
Nel momento in cui si trasforma quanto detto in un processo iterativo
opero unassegnazione, che mi porta ad una scrittura di questo tipo:
(m+1)
= B
(m)
+q
Dunque si utilizza ogni volta il usso delliterazione m-esima per calcolare
quello delliterazione successiva. E stato dunque dato il via ad un processo
iterativo.
Si può dimostrare che tale metodo porterebbe, dopo un numero innito
di iterazioni, alla soluzione esatta.
Si prenda lequazione di iterazione e si sottragga ad entrambi i membri
la soluzione esatta. Ne verrà:
(m+1)
= B
(m)
+q
Ma essendo = B +q, si avrà
(m+1)
= B
(m)
+q B q = B(
(m)
)
Lo scopo è chiaramente quello che sia
|
(m+1)
| < |
(m)
|
Partendo ora con
(0)
= 0, Ne seguirà che:
_
(1)
= q
(2)
= B
(1)
+q
.
.
.
(n+1)
= B
n
+q
2
da non confondere con la matrice di interazione, la matrice del problema orginiario,
che nel nostro caso è A
17
Per come sono denite, le iterazioni possono anche essere scritte come:
_
(1)
= q
(2)
= Bq +q
.
.
.
(n+1)
= q +Bq +B
2
q + +B
n
q
Si vede dunque che il usso neutronico alln-esima iterazione dipende solo
da B e da q. Da qui si vede che si ha di fatto una specie di serie geometrica
matriciale, che nella pratica converge solo se |B| < 1.
Dunque la soluzione di partenza è proprio il termine forzante, mentre
ogni iterazione andrà ad anare la soluzione aggiungendo ulteriori termini.
Attenzione però: il fatto che B sia cos` importante non è necessariamente
una buona notizia. La matrice B è infatti strettamente dipendente da A,
la quale è legata a sua volta alla sica del problema. Dunque se B non
converge, ci sarà poco da fare: sarà necessario trovare una soluzione a monte
dellimpostazione del problema sico.
Si può ora notare un altro dettaglio. Andando infatti a prendere lultimo
termine di ogni iterazione e li mettiamo a vettore, ho di fatto costruito il
metodo delle potenze (vedi paragrafo 2.3.3 a pagina 33), che mi permette di
calcolare gli autovalori di una matrice. Dunque lultimo termine dellultima
iterazione tenderà, per numero innito di iterazioni, a divenire parallelo all
0
autosoluzione fondamentale del problema
B =
Ove è lautovalore di modulo massimo e lautovettore corrispondente.
Questo discorso, per ora apparentemente di scarsa utilità, verrà utilizzato
quando si parlerà del metodo SOR che costituisce, di fatto, un upgrade del
metodo di Jacobi.
Si dimostra ora un teorema di fondamentale importanza per questi prob-
lemi:
Teorema 1 Condizione necessaria e suciente anche il metodo di Jacobi
converga è che (B) < 1
Da qui deriva il fatto della convergenza del problema se la sua matrice di in-
terazione è a diagonale dominante: si ha infatti una serie di consequenzialità
a cascata che ci dicono che:
Se la matrice A è a diagonale dominante, allora vale che |B|
< 1
Se |B|
< 1 allora (B) < 1

3
Se (B) < 1 allora il metodo di Jacobi converge, tanto pi` u velocemente
quanto pi` u il valore del raggio spettrale è piccolo
3
Questo vale in realtà per ogni norma di matrice compatibile con una di vettore
18
Si vuole ora dimostrare il concetto fondamentale che sta alla base degli
studi di convergenza del metodo di Jacobi: che la convergenza di tale metodo
è associata al raggio spettrale della matrice di iterazione
Per farlo è necessario denire ed enunciare le proprietà di una categoria
di matrici, dette matrici irriducibili
Denizione 1 Una matrice quadrata è irriducibile se per ogni coppia di i,j
distinti esiste almeno una successione nita di interi, compresi tra 1 ed n
(dove n è la dimensione della matrice) che va da i a j del tipo
i = m
0
m
1
m
2
m
q
= j
tale che:
a
m
0
,m
1
, a
m
1
,m
2
, , a
m
(q1)
,m
1
sono tutti diversi da 0
Non è facile dimostrare che una matrice è irriducibile, mentre molto pi` u
facile è dimostrare che una matrice non lo è. Di fatto comunque, a livello
logico, lirriducibilità di una matrice indica il fatto che tutti i nodi sono
in qualche modo collegati tra loro. Ecco dunque perchè irriducibile: se un
problema sico è rappresentato da una matrice riducibile, esso può essere
spacchettato (e dunque, ridotto) in pi` u problemi di ordine inferiore.
Teoricamente sarebbe necessario dimostrare che per ogni coppia di el-
ementi della discretizzazione esite un percorso fatto di linee verticali od
orizzontali che collegano tali elementi passando solo attraverso elementi non
nulli. Il problema è che dimostrarlo per tutte le coppie possibili non è aatto
facile.
Quale potrebbe essere un problema riducibile? Si tratta ad esempio del
caso, sempre in ambito nucleare, di due zone di materiali diversi separate
da una barriera di un materiale assorbitore perfetto. La matrice legata a
tale problema sarà dunque riducibile in quanto ciò che accade ai neutroni
nella zona 1 non inuenza in alcun modo ciò che invece avviene nella zona
2.
4
.
Teorema 2 Se una matrice è riducibile è sempre possibile, permutando
opportunamente righe e colonne, portarla ad una forma di tipo diagonale a
blocchi:
_

A
1

0
0

A
2
_
Viene ora mostrata una prima applicazione della proprietà di irriducibilità
di una matrice:
4
Un esempio pratico di sistemi caratterizzati da matrici di riducibili sono i cosiddetti
rubbiatroni, ove si opera in modo da creare delle specie di gabbie stagne per i neutroni
per determinate energie
19
Teorema 3 Se una matrice A è irriducibile, allora anchè valga che |B|
<
1 è suciente che la dominanza stretta della diagonale della matrice A
sia valida per uno dei suoi elementi, mentre gli altri basta che soddisno
luguaglianza
Dunque la convergenza di un problema avente come matrice di interazione
una matrice irriducibile è assicurata anche se non è a diagonale dominante
Si procede ora alla dimostrazione vera e propria della convergenza del
metodo di Jacobi
Noto che:
(m)
=
(m)

(m+1)
= B
(m)
= = B
m
(1)
Se B è una matrice simmetrica, esiste una n-upla di assi ortogonali rispetto
ai quali essa assume forma diagonale. Essa è dunque diagonalizzabile
5
, ove
gli elementi di tale diagonale risultano essere gli autovalori del problema as-
sociato alla matrice stessa mentre i versori degli assi della n-upla ortogonale
saranno gli autovettori, che formeranno un sistema completo ortonormale
(vedi teorema 4 a pagina 32).
Si prenda ora il vettore
(1)
. Poichè se la matrice è reale e simmetrica
gli autovettori del problema agli autovalori B = formano una base
ortonormale (vedi capitolo 2.4 a pagina 38) sarà sempre possibile scrivere il
vettore errore assoluto come combinazione lineare di tali autovettori:
(1)
=
n
h=1
c
(1)
h

h
Dunque
(m+1)
= B
m
n
h=1
c
(1)
h

h
=
=
n
h=1
c
(1)
h
B
m
h
=
=
n
h=1
c
(1)
h

m
h
ove la j-esima componente di sarà dunque
(m+1)
j
=
n
h=1
c
(1)
h

m
h

h,j
Ma se (B) < 1, allora qualunque autovalore ha modulo inferiore ad 1.
Ne deriva evidentemente che, per m , il valore di
(m)
tenderà a 0,
5
tali autovalori saranno ripetuti ove essi abbiano molteplicit` a > 1
20
e dunque la soluzione tenderà alla soluzione esatta. Attenzione che dalla
stessa equazione si evince anche che non tutti gli elementi del vettore degli
errori andranno a 0 con la stessa velocità, che dipende infatti dallautovalore
corrispondente (pi` u il modulo è elevato, pi` u lenta è la convergenza).
Dimostrato che la condizione di (B) < 1 è necessaria, di dimostra ora
che essa è suciente. Si prenda un termine forzante q tale per cui lerrore
alla prima iterazione sia tale che
(1)
|
1
Ma se eettivamente questo è vero, allora si può scrivere:
(m+1)
j
= c
(1)
1

m
1

1,j
Che ovvimante tende a 0 per m che tende ad innito se e solo [
1
[ < 1
6
.
Si può fare questo ragionamento per ogni
i
il che porta a poter dire che
tale condizione è necessaria.
7
Dopo aver dimostrato che la condizione di (B) < 1 è, in generale,
necessaria e suciente per la convergenza del metodo di Jacobi, accerti-
amoci ora che il raggio spettrale della matrice di iterazione mi dà anche
una quanticazione della velocità di convergenza del metodo (nella zona
asintotica).
Si supponga ora che
1
sia lautovalore di modulo massimo. Questo
implicherà dunque che [
1
[ = (B) e che [
j
[ < (B) j ,= 1. Si può
dunque scrivere, come fatto in precedenza ma esplicitando il termine relativo
6
Cosa accade se la matrice di partenza A e reale e simmetrica? Questo implica che
gli autovalori del problema A = sono a coppie in modulo uguale e segno opposto.
Avremo cos` dunque che, per la convergenza, dovr` o considerare sempre due autovalori
invece di uno. Al posto della equazione appena scritta avremo che il calcolo dellerrore
sar` a eettuato sulla norma, e potremo scrivere che:
(m+1)
C(B)
m
7
Si noti che questo discorso è stato eettuato per dei termini forzanti specici, ovvero
tali per cui lerrore risulti parallelo ad un autovettore. Questo per potersi porre nel caso
pi` u sfortunato, e di conseguenza denire una regola generale. Esisteranno dunque dei
valori di q per cui tale condizione non sar` a, invece, necessaria. Basti pensare al caso in
cui, per assurdo,
1
> 1 ma
(1)

1
. In questo caso il valore dellerrore allm-esima
iterazione sarà dato da:
(m+1)
j
=
n
h=2
c
(1)
h

m
h

h,j
Ma dunque lunico autovalore maggiore di 1 non interverr` a nella sommatoria e di con-
seguenza avr` o convergenza pur essendo la condizione di (B) < 1 non rispettata. Tuttavia
nel mondo reale bisogna ricordarsi che non solo che il calcolatore commette errori di ar-
rotondamento e non conosce la quantit` a 0, e di conseguenza il concetto di ortogonalità
è mantenuto solo per poche iterazioni
21
allautovalore di modulo massimo, che :
(m+1)
j
=
m
1
[c
(1)
1

1,j
+
n
h=2
c
(1)
h
(
1
)
m
h,j
]
Si vede chiaramente che, per m , sarà
m+1
j

m
1
c
(1)
1

1,j
In quanto il termine

h
1
m
tende a 0. Maggiore sarà il valore dellh-esimo
autovalore, maggiore sarà la resistenza al contributo corrispondente a calare
con le iterazioni. A questo proposito si denisce rapporto di dominanza
il modulo del rapporto tra il secondo autovalore di modulo maggiore e lau-
tovalore di modulo massimo (
|
2
|
|
1
|
). Tanto pi` u tale rapporto di dominanza
è elevato tanto pi` u è necessario aspettare anchè lerrore alla m-esima it-
erazione sia parallelelizzato al contributo dellautovalore fondamentale.
Anche il rapporto di dominanza, come il raggio spettrale, è denito dalla
sica del problema (oltre che dalla scelta dellalgoritmo). Il punto è che, in
sica della diusione, i due autovalori di modulo maggiore sono molto vicini
tra loro.
Si denisce velocit` a di convergenza asintotica il valore
8
:
R
= ln (B)
Si suppunga a questo punto di trovarsi in zona asintotica, ad una iterazione
m
0
. Comè possibile capire quante altre iterazioni bisogna fare per ridurre
lerrore di un fattore 100? Questo sarà come dire che
(B)
m
< 0.01
da cui si otterrà che dovrà essere:
m >
4, 76
ln (B)
Il metodo di Jacobi è dunque cos` esplicitato: molto semplice e lineare.
Si vuole ora però analizzarne i punti deboli, in modo tale da poter capire
ove si possa lavorare per cercare di migliorarlo.
Il suo handicap fondamentale è legato alla sua scarsa ottimizzazione
nellutilizzo delle informazioni disponibili. Si prenda infatti una generica m-
esima iterazione. Arrivati al calcolo di
(m+1)
i
si avrà a disposizione già una
serie di informazioni di qualità, vale a dire tutti i ussi della m+1-esima
iterazione no al
(m+1)
i1
.
Il metodo di Jacobi è dunque detto delle iterazioni successive poichè
per ogni iterazione uso solo informazioni vecchie. Il punto di novità del
metodo di Gauss-Seidel è proprio quello di utilizzare, per il calcolo del usso
aggiornato, anche le informazioni nuove.
8
Si noti che questa non costituisce un calcolo della velocit` a di convergenza ma solo una
sua stima, utile per confrontare tra loro dierenti algoritmi
22
2.1.2 Metodo di Gauss-Seidel
Come è dunque possibile eettuare un upgrading del metodo di Jacobi,
con poco sforzo e grande risultato? In un generico nodo (prendiamo ad
esempio l11
, supponendo che i nodi adiacenti nelle direzioni N S W E siano

rispettivamente 15, 7, 10, 12) sarà funzione del usso nei 4 nodi adiacenti,
ovvero
15
10 11 12
14
11
= f(
7
,
10
,
12
,
15
)
Trasportato nella riga corrispondente allinterno delle iterazioni del metodo
di Jacobi avremo:
(m+1)
11
= f(
(m)
7
,
(m)
10
,
(m)
12
,
(m)
15
)
Tuttavia, poichè allinterno di ogni iterazione i ussi sono calcolati in modo
ordinato dal primo allultimo, al momento di calcolare il usso in 11 avremo
già noti i valori allm+1-esima iterazione del usso in 7 e 10. Si può dunque
sostituire a tali valori il valore del usso m+1-esimo
La matrice B del metodo di Jacobi è del tipo:
B = T +T
=
_
_
_
0 T
.
.
.
T 0
_
_
_
Ove le matrici T e T
sono evidentemente rispettivamente triangolare infe-

riore e superiore.
Con il sistema originario dato da:
= B +q
Che può essere riscritto come:
= (T +T
) +q
Sfruttando quanto detto riguardo il metodo di Gauss Seidel, ovvero che per
il calcolo della i-esima componente sono già state calcolate le i-1 componenti
precedenti, il processo iterativo relativo al metodo di Gauss-Seidel diverrà,
a seguito del processo di assegnazione, della forma:
(I T)
(m+1)
= T
(m)
+q
Da cui
(m+1)
= (I T)
1
T
(m)
+ (I T)
1
q
23
Risulterà dunque, sottraendo membro a membro lespressione iterativa e
lespressione esatta:
(m+1)
= (I T)
1
T
(m)
Ove (I T)
1
T
è la matrice di iterazione del metodo di Gauss-Seidel.

Si vedano ora le equazioni per componenti: per il metodo di Jacobi si
aveva:
(m+1)
i
=
n
j=1
a
ij
a
ii
(m)
j
+q
i
Con Gauss-Seidel bisogna invece spezzare le sommatorie, poichè una sarà
riferita al nuovo ed unaltra al vecchio:
(m+1)
i
=
i1
j=1
a
ij
a
ii
(m+1)
j

n
j=i+1
a
ij
a
ii
(m)
j
+q
i
Il metodo di Gauss-Seidel risulta dunque, asintoticamente, pi` u ecace.
Si dimostra infatti che la sua velocità di convergenza è pari a (B)
2
Si noti che lutilizzo del metodo di Gauss-Seidel non incrementa lo sforzo
computazionale: il numero di operazioni per iterazione è lo stesso del metodo
di Jacobi.
2.1.3 Metodo di Jacobi vs Metodo di Gauss
Dunque il metodo di Gauss-Seidel converge pi` u velocemente di quello di
Jacobi, e lo fa a costo zero. La domanda che sorge legittima è la seguente:
perchè si parla ancora di metodo di Jacobi? Un motivo esiste: il metodo di
Gauss-Seidel introduce una asimmetria nel sistema, in quanto il usso in ogni
nodo verrà calcolato utilizzando informazioni di qualità diversa a seconda
della direzione. Questo è un difetto che risulta pienamente accettabile nella
zona asintotica, ma non in quella delle prime iterazioni ove si andrà invece in
generale ad utilizzare il metodo di Jacobi. In un caso particolarmente felice
ove il valore di (B) fosse particolarmente ridotto, ci si potrebbe addirittura
ritrovare nella condizione di convergenza talmente veloce da rendere inutile
se non dannosa lapplicazione del metodo di Gauss-Seidel.
Esistono però altre condzioni in cui si utilizza Jacobi piuttosto che Gauss-
Seidel, e sono quelle in cui vi sono due catene di iterazioni una dentro lal-
tra. In questo caso è possibile che il processo iterativo interno sia tale da
richiedere ununica iterazione per ogni iterazione esterna
9
. In questo caso si
andrà ovviamente ad applicare Jacobi, sempre per la stessa ragione: nelle
fasi iniziali di applicazione di un algoritmo la convergenza non è garantita
ed è necessario evitare di introdurre asimmetrie nella risoluzione. Lappli-
cazione del metodo di Gauss-Seidel in questo frangente potrebbe portare
allottenimento di soluzioni non siche.
9
Si tratta come vedermo del caso della teoria della diusione
24
Altra situazione caratteristica è quella dellapplicazione dei due metodi
a scacchiera. In questo modo, calcolando il usso tramite Jacobi solo sui
nodi neri ci si ritrova che tutti i nodi bianchi sono circondati solo da
informazioni nuove che possono cos` essere utilizzate per calcolarvi il us-
so. Questo metodo di fatto è migliore di quello di Jacobi anche alle prime
iterazioni. Si vede inoltre che la velocità di convergenza del metodo a scac-
chiera nella zona asintotica è esattamente la stessa di quella del metodo di
Gauss-Seidel standard.
2.1.4 Metodo SOR
Il metodo SOR lavora tramite estrapolazione, ovvero un processo di
creazione di informazioni sulla base di altre di cui si è già in possesso. Questo
passaggio, a dierenza di quello che portava dal metodo di Jacobi a quello di
Gauss-Seidel, include un costo. Ne segue che tale metodo, dotato di velocità
di convergenza superiori, è adatto ad un uso nelle fasi nali di anamento
della soluzione, dopo aver sgrossato il problema tramite luso dei metodi
visti in precedenza.
Il metodo SOR è anche detto di sovrarilassamento, e si basa sul forzare
lupgrade della soluzione da un passaggio allaltro. Riscrivendo infatti levoluzione
dellerrore relativo tramite metodo di Gauss-Seidel:
[
(m+1)
(m)
]
GS
= T
(m+1)
+T
(m)
+q
(m)
Partendo da questo presupposto, lupgrade della soluzione tramite metodo
SOR diventa:
[
(m+1)
(m)
]
SOR
= [
(m+1)
(m)
]
GS
Ove ovviamente il caso di = 1 porta al riottenimento al metodo di Gauss-
Seidel. è detto parametro di forzamento
Espandendo quanto scritto si ottiene:
(m+1)
= T
(m+1)
+ [(1 )I +T
]
(m)
+q
Da cui, in forma esplicita:
(m+1)
=
matrice di iterazione
..
(I T)
1
[(1 )I +T
]
(m)
+ (I T)
1
q
Si può dimostrare che il valore ottimale per è dato da:
opt
=
2
1 +
_
1 (B)
2
E visto che si può fare, facciamolo.
25
Lobbiettivo è trovare unespressione per il raggio spettrale della matrice
di iterazione del metodo SOR. Una volta fatto questo, il passaggio successivo
sarà evidentemente quello di minimizzare tale valore, che come sappiamo
rappresenta la velocità con cui lalgoritmo tende a convergenza. Il problema
sarà del tipo
J
=
ove ciò che ci si pregge di calcolare è il di modulo massimo. Richiamando
la denizione della matrice di iterazione:
J
= (I T)
1
[(1 )I +T
]
Se ne può ricavare una ulteriore equazione agli autovalori. Infatti vale
J
=
(I T)
1
[(1 )I +T
] =
[(1 )I +T
] = (I T)
+T
= T
(T +T
) =
1 +

Si può ora riscriverla componente per componente, tramite il doppio
indice, ove con i simboli dei punti cardinali si indicheranno gli elementi delle
matrici posizionati adiacenti allelemento di interesse. Dunque
W
i,j
i1,j
+S
i,j
i,j1
+E
i,j
i+1,j
+N
i,j
i,j+1
=
1 +

i,j
Viene ora sfruttata larbitrarietà degli autovettori per scrivere un legame
tra e , al ne di ottenere una espressione simile a quella scritta per il
metodo di Jacobi e poter dunque confrontare i due algoritmi. Si userà in
particolare che
ij
=
ij
i+j
2
_
per Jacobi W
i,j
i1,j
+N
i,j
i,j+1
+E
i,j
i+1,j
+S
i,j
i,j1
=
i,j
per SOR W
i,j
i1,j
+N
i,j
i,j+1
+E
i,j
i+1,j
+S
i,j
i,j1
=
1+

i,j
Confrontando i due ottengo:
=
1 +
Risolvendo per , diventa
= 1 +
2
=
2
+ 1 +
2
+ 2 2 2
2
(2 +
2
2
2) + ( 1)
2
= 0
26
da cui si avranno due soluzioni:
1,2
= (1

2
2
2
)
_
(1

2
2
2
)
2
(1 )
2
=
= (1

2
2
2
)
_
4
4
+
2
2
=
= (1

2
2
2
)
_
2
4
+ 1
Ponendosi nel caso tipico di matrice simmetrica gli autovalori di B saranno
tutti reali. Essendo inoltre che, per ipotesi,
2
< 1 (altrimenti la conver-
genza del metodo di Jacobi non è assicurata) e > 1 (altrimenti il metodo
SOR rallenterebbe la convergenza invece di accelerarla
10
), è cos` denito
lintervallo di variazione di
Si studino ora i tre casi separatamente, avendo chiamato
0
il valore di
che annulla il discriminante dellequazione:
0
=
2
1 +
1
2
si ottengono 3 casi possibili:
Per =
0
avremo che:
= 1
0
+

2
2
0
2
che, sostituendo il valore di
0
, diviene
=
0
1
Per
0
< < 2 si ha < 0, il che porta ad ottenere per due radici
complesse coniugate. Attraverso gli opportuni passaggi si ottiene che
[
1
[ = [
2
[ = 1
che, essendo per ipotesi >
0
, darà luogo ad un valore di maggiore
che nel caso precedente
Per 1 < <
0
si ottengono due soluzioni reali distinte, delle quali
quella di modulo maggiore sarà legata al discriminante preso come
positivo, che ci permette di ottenere:
1
= (1 +
1
2
2
) +
_
1 +

2
2
4
Si vede che questo genera un andamento il cui minimo risulta essere
situato proprio in =
0
10
Attenzione, questo non è sempre vero. A volte infatti gli algoritmi vengono rallentati
invece che accelerati, in particolare in quei casi ove ho fenomeni che si svolgono su scale
temporali distinte, ed il rischio è che le qualit` a dei risultati non risultino coerenti. Un
esempio tipico è laccoppiamento di fenomeni elettro-magnetici, estremamente veloci, ed
i fenomeni termo-uidodinamici, pi` u lenti
27
Dunque è stato dimostrato come il valore ottimale per sia dato da:
opt
=
0
=
2
1 +
1
2
Ecco dunque identicato il costo aggiuntivo del metodo SOR: se no ad ora si
era parlato del raggio spettrale della matrice B come qualcosa che identica-
va la velocità di convergenza dellalgoritmo, senza però mai aver manifestato
la necessità di calcolarlo, ecco che qui è invece necessario conoscerne il valore
al ne di applicare il metodo SOR in maniera ottimale assicurandosi cos` la
migliore velocità di convergenza possibile.
Bisogna in questa fase ricordare le ipotesi fatte per ottenere questo
risultato:
Griglia strutturata
Matrice simmetrica
Si può dimostrare, ma non verrà fatto in questa sede, che il valore della
velocità di convergenza del metodo SOR dipende dalla numerazione scelta,
ed in particolare quella che garantisce i risultati migliori è la numerazione
naturale.
2.1.5 Shift tra metodo di Jacobi e metodo SOR
Ci si pone nella condizione tipica in cui si utilizza il metodo di Jacobi nella
fase iniziale, per lo sgrossamento della soluzione, per poi passare al meto-
do SOR per lanamento nale. Sorgerà dunque la questione su quando
abbandonare il primo metodo per passare al secondo.
Si vede che in base al problema da risolvere
11
varierà la velocità di con-
vergenza del metodo di Jacobi. Pi` u tale velocità è elevata, minore sarà il
numero di iterazioni necessario per il passaggio al metodo SOR.
Esiste tuttavia un altro elemento. Ricordiamo infatti quanto detto in mo-
do molto innocente allinizio della descrizione del metodo di Jacobi, ovvero
che gli ultimi elementi di ogni iterazione successiva costituiscono di fatto
lapplicazione del metodo delle potenze sulla matrice B che porta al calcolo
degli autovalori della stessa. Appare ora evidente che dunque, nellappli-
care Jacobi, si opera involontariamente il calcolo iterativo di B
n
q, il che
permette di calcolare un valore approssimato di (B) che si potrà dunque
utilizzare per il calcolo di
opt
. Questa riessione dice dunque che al ne di
determinare il momento per lo shift da metodo di Jacobi e metodo SOR non
ci si concentrerà soltanto sulla convergenza del metodo di Jacobi in sè, ma
anche su quella del metodo delle potenze per il calcolo di (B), il cui valore
è fondamentale per la corretta applicazione del metodo SOR
11
e dunque in base alla matrice A la matrice B (B)
28
2.1.6 Ordinamento dei nodi di usso
Si accennerà nelle pagine successive alla necessità, una volta che si passa ad
una logica multidimensionale, della scelta di una numerazione per i nodi di
usso in modo da passare da una forma del tipo i, j ad una
l
, che mi
permette lutilizzo standard di vettori e matrici.
A questo proposito sono mostrate di seguito le tre tipologie pi` u utiliz-
zate, a ciascuna delle quali è associata la corrispondente forma della matrice
risultante:
Numerazione naturale
_
3 4
1 2
_

_
_
_
_
0 X X 0
X 0 0 X
X 0 0 X
0 X X 0
_
_
_
_
Numerazione a scacchiera
_
4 2
1 3
_

_
_
_
_
0 0 X X
0 0 X X
X X 0 0
X X 0 0
_
_
_
_
Numerazione ciclica
_
4 3
1 2
_

_
_
_
_
0 X 0 X
X 0 X 0
0 X 0 X
X 0 X 0
_
_
_
_
Tutte e tre le matrici avranno gli stessi autovalori (0 con molteplicità 2
e 2X con molteplicità 1. Per lapplicazione del metodo di Jacobi le tre
strategie sono equivalenti, nel senso che portano alla stessa identica velocità
a convergenza. Per quanto riguarda invece il metodo di Gauss-Seidel avremo
che, per (B) = 0.5, sarà:
J
GS
= 0.25 con numerazione naturale (come da considerazioni prece-
denti pari a (B)
2
)
J
GS
= 0.25 con numerazione a scacchiera (come da considerazioni
precedenti pari a (B)
2
)
J
GS
= 0.28 con numerazione ciclica
29
2.2 Risoluzione di sistemi di equazioni non lineari
I processi non lineari vengono trattati, in analisi numerica, tramite una
linearizzazione iterativa. Lidea è dunque quella di, partendo da una f(x) =
0 con f(x) non lineare, andare a risolvere una

f(x) = 0, con

f(x) ovviamente
parente stretta di f(x).
Questo procedimento comporta ovviamente una complicazione della risoluzione,
che aumenta con laumentare del numero delle equazioni.
2.2.1 Metodo di Newton per la risoluzione di sistemi non
lineari
Si supponga di avere un generico sistema di equazioni non lineare.
f(x) =
_
_
f
1
(x
1
, x
2
, , x
n
)
f
2
(x
1
, x
2
, , x
n
)
.
.
.
f
n
(x
1
, x
2
, , x
n
)
= 0
La prima cosa che viene in mente di fronte ad un sistema non lineare è
quella di linearizzarlo tramite uno sviluppo in serie di Taylor troncato al
primordine.
Si chiami la soluzione esatta e x
(i)
la soluzione approssimata alla i-
esima iterazione. Si avrà ovviamente che f() = 0 ed invece f(x
(i)
) ,= 0 .
Essendo dunque x
(i)
una approssimazione di , sarà lecito supporre che i
due vettori siano molto vicini tra loro, di modo da poter calcolare tramite
linearizzazione in serie di Taylor la funzione nellintorno di x
(i)
. Vale infatti
che, trascurando i termini di grado superiore al primo, si ottiene un sistema
del tipo:
_
_
f
1
(x
(i)
) + (
1
x
(i)
1
)(
f
1
x
1
)
x=x
(i) + + (
n
x
(i)
n
)(
f
1
x
n
)
x=x
(i) 0
f
2
(x
(i)
) + (
1
x
(i)
1
)(
f
2
x
1
)
x=x
(i) + + (
n
x
(i)
n
)(
f
2
x
n
)
x=x
(i) 0
.
.
.
f
n
(x
(i)
) + (
1
x
(i)
1
)(
f
n
x
1
)
x=x
(i) + + (
n
x
(i)
n
)(
f
n
x
n
)
x=x
(i) 0
Se in questo sistema operiamo una assegnazione potremo innescare un pro-
cedimento iterativo. In particolare otterremo questo scrivendo:
_
_
f
1
(x
(i)
) +h
(i)
1
(
f
1
x
1
)
x=x
(i) + +h
(i)
n
(
f
1
x
n
)
x=x
(i) 0
f
2
(x
(i)
) +h
(i)
1
(
f
2
x
1
)
x=x
(i) + +h
(i)
n
(
f
2
x
n
)
x=x
(i) 0
.
.
.
f
n
(x
(i)
) +h
(i)
1
(
f
n
x
1
)
x=x
(i) + +h
(i)
n
(
f
n
x
n
)
x=x
(i) 0
30
Di questo sistema lunica incognita è proprio h
(i)
, ove si è denito h
(i)
j
=
(x
(i+1)
j
x
(i)
j
) Denendo il passaggio da una iterazione allaltra in modo che
x
(i+1)
= x
(i)
+h
(i)
è possibile innescare un processo iterativo, i cui passaggi
saranno:
1. Calcolo dello Jacobiano nel punto x
(i)
2. Calcolo delle f(x
(i)
)
3. Calcolo di h tramite soluzione del sistema
4. Aggiornamento di x
(i+1)
Un problema di tale procedimento è che, ove il numero delle incognite sia
elevato, J può diventare molto grande. Se le sue dimensioni sono ridotte
sarà possibile scriverlo in forma analitica (di fatto manualmente), mentre
ove le dimensioni aumentino si passerà in genere ad una scrittura in forma
numerica:
(
f
j
x
k
)
x=x
(i) = B
(i)
j,k
=
f
j
(x
(i)
+e
k
h
jk
) f
j
(x
(i)
)
e
k
h
jk
Importante è la valutazione dellintervallo di discretizzazione. Se questo
è troppo grande, si perde ovviamente in precisione, mentre ove questo sia
troppo piccolo si corre il rischio di cancellazione numerica. Come sempre la
scelta risulterà dal compromesso giudicato migliore.
Di fatto la scrittura dello Jacobiano e la risoluzione del problema associ-
ato sono le fasi pi` u critiche del processo iterativo. Per questo una possibilità
è quella di non aggiornarlo ad ogni iterazione. La risoluzione del problema
avente lo Jacobiano come matrice di iterazione dipende dallo Jacobiano stes-
so: se si tratta di una matrice si usano metodi diretti, in caso contrario si
privilegiano invece metodi iterativi. Tuttavia, qualunque sia il metodo scel-
to ed il caso specico, questo metodo di risoluzione converge con estrema
dicoltà.
2.3 Metodi per problemi agli autovalori
2.3.1 Scomposizione QR di una matrice
Si denisce trasformazione di similitudine una qualsiasi trasformazione
del tipo:
B = SAS
1
Caratteristiche peculiari di questa trasformazione sono che:
La matrice A e la matrice B hanno gli stessi autovalori
31
Dato x autovalore di A, y= Sx è autovettore della nuova matrice B
Lutilità di tali trasformazioni di similitudine è data anche dai seguenti
teoremi:
Teorema 4 Data una matrice A reale e simmetrica, esiste una matrice
ortogonale V
1
tale che
D = V
1
AV
T
1
ove D è una matrice diagonale
Teorema 5 Data una matrice A reale, esiste una matrice ortogonale V
2
tale che
H = V
2
AV
T
2
ove H è una matrice di Hessenberg, che diventa tridiagonale se A è simmet-
rica
Si denisce a questo punto una nuova tipologia di matrice, detta riflet-
tore, nella maniera seguente:
U = I 2uu
T
con
u
T
u = 1
Si dimostra facilmente che tale matrice presenta le seguenti proprietà:
è simmetrica (U
T
= U)
è ortogonale (U
T
= U
1
)
è involutoria (U
2
= 1)
Ulteriore proprietà di tale matrice, che utilizzeremo in seguito, è enunciata
dal seguente teorema:
Teorema 6 Dato un generico vettore non nullo x, esiste un riettore ele-
mentare U tale che
Ux = e
1
Dove
_
_
_
u = x +e
1
e
1
= (1, 0, , 0)
T
=
x
t
x
Dalle considerazioni precedenti si è visto che è possibile costruire delle
matrici U tali che, moltiplicate per un vettore, ne annullano tutte le com-
ponenti tranne la prima. Si può dunque pensare di costruire una matrice
U
1
tale che moltiplicata per una generica matrice A fornisca, in uscita, una
matrice con tutti gli elementi della prima colonna nulli fatta eccezione per
la prima riga. Moltiplicando poi per una analoga U
2
, si possono annullare
32
anche tutti gli elementi della seconda colonna ad eccezione dei primi due. Il
metodo di costruzione della generica matrice U
k
è il seguente:
_
I
k1
0
0 U
(nk+1)
1
_
Il risultato nale di tutte le moltiplicazioni sarà dunque una matrice triango-
lare superiore, che verrà chiamata R. Moltiplicando invece tra loro tutti gli
n-1 riettori otterremo una matrice Q
T
che risulterà ortogonale, in quanto
prodotto di matrici ortogonali. Avrò quindi che:
Q
T
A = R A = QR
Si tratta dunque di un processo che permette di ottenere un risultato analogo
alla decomposizione di Gauss, avendo come unica pecca lutilizzo di 2n
3
/3
operazioni, il doppio esatto di quelle necessarie per la decomposizione di
Gauss.
2.3.2 metodo QR
Il metodo QR è di tipo iterativo. Si denisce A
1
la matrice A, e calcoliamo
delle nuove matrici secondo il processo seguente:
1. Decomposizione della matrice alli-esima iterazione: A
i
= Q
i
R
i
2. Calcolo della matrice per literazione successiva: A
i+1
= R
i
Q
i
Tutte le matrici cos` calcolate risulteranno simili ad A, in quanto risul-
teranno di fatto dalla moltiplicazione a destra per le Q
i
ed a sinistra per le
loro trasposte:
A
i+1
= (Q
1
Q
2
Q
i
)
T
A(Q
1
Q
2
Q
i
)
Trattandosi di operazioni di similitudine, si conservano gli autovalori! Si può
dimostrare che la matrice A
n
tenderà allinnito a diventare una matrice
triangolare superiore, i cui autovalori saranno gli elementi della diagonale
principale.
Il problema di questo calcolo è che è lungo e dispendioso. Il procedimento
pi` u generalmente utilizzato è quello di trattare preventivamente la matrice
A, cercando di farla diventare tridiagonale o di Hessenberg, per poi applicare
il metodo QR ad una condizione ove si ha un numero consistente di elementi
nulli.
2.3.3 Metodo delle potenze
Il metodo delle potenze è un algoritmo di tipo iterativo che converge ad
un vettore parallelo allautovettore fondamentale della matrice di interesse.
Può essere applicato a problemi di tipo:
33
A =
A = B
D() = 0
Ove nel terzo caso non è garantita la linearità del problema rispetto agli
autovalori.
Il metodo delle potenze è un algoritmo iterativo che, a convergenza,
fornisce una stima dellautovettore fondamentale, utile in particolare
per due classi speciche di problemi:
Problemi agli autovalori di fusione neutronica in mezzo moltiplicante
Utilizzo in metodi per la risoluzione di sistemi di equazioni non omo-
genei
Si supponga che la matrice M abbia un insieme completo di autovettori.
A partire da tale ipotesi si può dimostrare che la successione M
m
converge
allautovalore di modulo massimo qualunque sia q.
Si supponga inoltre che la matrice M abbia tutti autovalori distinti: es-
isterà dunque uno ed un solo autovalore avente modulo superiore a tutti gli
altri. Avendo inoltre imposto che la matrice M abbia un set completo di
autovettori, è ragionevolmente possibile supporre di poter scrivere
q =
n
h=1
c
h
h
Ove i
h
sono evidentemente gli autovettori della matrice M.
12
Si avrà dunque che:
M
m
q =
n
h=1
c
h
M
m
h
=
=
n
h=1
c
h
m
h

h
=
=
m
1
[c
1
1
+
n
h=2
1
c
h
h
]
Ma dunque, poichè la sommatoria tenderà a 0 per indice m che tende ad
innito, il vettore M
m
q tenderà a diventare parallelo a
1
. Come per quanto
detto relativamente al metodo di Jacobi, si avrà anche qui un termine (quel-
lo legato al secondo autovalore di modulo massimo) che resisterà a questa
12
Tale scrittura equivale a dire che è sempre possibile scrivere un qualunque vettore q
come combinazione lineare degli autovettori della matrice M
34
convergenza pi` u di tutti gli altri con una forza quanticata dal rapporto
di dominanza
Attenzione però. Nei passaggi precedenti è stato dimostrato che il meto-
do converge ad un vettore parallelo allautovettore fondamentale, ma si vede
che compare nella formula risolutiva lelemento
m
1
che moltiplica tutta le-
quazione. Risulta dunque evidente che per
1
> 1 la formula tenderà a
divergere per m grandi, mentre per
1
< 1 essa tenderà a 0. Per ot-
tenere dunque una soluzione è opportuno, ricordandosi che gli autovettori
sono deniti a meno di una costante moltiplicativa arbitraria, normaliz-
zare la soluzione ad ogni step iterativo. Per quanto visto prima, è evidente
che anchè la soluzione converga ad un valore reale diverso da 0 è neces-
sario che il termine a destra elevato allm-esima potenza sia il pi` u possi-
bile vicino ad uno. Verrà dunque introdotto come elemento normalizzante
per ogni iterazione lautovalore di modulo massimo calcolato alliterazione
precedente.
A questo punto però sarà necessario capire come calcolare il raggio spet-
trale. Si è infatti dimostrato che il vettore M
m
q tende a diventare parallelo
allautovettore fondamentale, ma non è ancora stato fatto il passo succes-
sivo. Infatti se il problema di partenza è lineare sarà possibile sfruttare il
fatto che se associato a è soluzione al problema agli autovalori, allora lo
stesso varrà per c, ovvero qualunque vettore è soluzione del problema agli
autovalori a patto che sia parallelo ad uno dei suoi autovettori. Sulla base di
queste considerazioni si potrà dunque dire che, supponendo di essere giunti
a convergenza allm-esima iterazione:
M(M
m
q)
1
(M
m
q)
Ove il vettore M
m
q corrisponde al generale multiplo di autovettore c
Dallequazione precedente si può dunque dedurre che
1

(M
m+1
q)
1
(M
m
q)
1
(M
m+1
q)
2
(M
m
q)
2

(M
m+1
q)
n
(M
m
q)
n
Si ha infatti che a convergenza i due vettori M
m
q ed MM
m
q devono essere
paralleli in quanto uguali a meno di una costante moltiplicativa (lautoval-
ore). Questo fornisce dunque un ecace criterio di convergenza per il mio
metodo iterativo, che si potrà basare sulla similitudine tra i vari rapporti
tra le componenti. Quando essi saranno sucientemente simili tra loro si
potrà nalmente considerare di essere giunto a convergenza e poter dunque
troncare il processo iterativo.
Occorre tuttavia quanticare questa vicinanza. Si ricorre in generale
ad una imposizione sul numero delle cifre della mantissa che devono essere
uguali. Si ha in questo modo imposto una sorta di errore relativo, che infatti
non dipende dal valore in sè della quantità.
13
. Occorre tuttavia fare come
13
Si tratta evidentemente in questo caso di un criterio di convergenza puntuale. Esistono
anche criteri di convergenza in norma che saranno in generale meno stringenti
35
sempre grande attenzione agli algoritmi molto lenti, che portano ad avere le
soluzioni di due iterazioni successive molto vicine tra loro. In questo caso
si rischia che il criterio di convergenza, per quanto stringente, non porti a
selezionare una soluzione realmente vicina a quella cercata. In casi come
questo è dunque sempre opportuno andare a sostituire i risultati ottenuti
nellequazione di partenza per vericarne leettiva veridicità.
Rimane tuttavia il dubbio legato alla scelta di quale degli n valori pos-
sibili scegliere per lautovalore, ognuno dei quali è di fatto teoricamente
equivalente (se mi trovassi di fronte alla soluzione analitica essi sarebbero
infatti tutti uguali). Una possibilità è data dalloperazione seguente:
1

< M
m+1
q, I >
< M
m
q, I >
=
n
i=1
(M
m+1
q)
i
n
i=1
(M
m
q)
i
Tale operazione fornisce infatti una stima dellautovalore fondamentale pi` u
precisa, a parità di iterazione, di qualunque stima eettuata dal semplice
rapporto delle componenti.
Si nota però che questo calcolo sta equiparando tra loro tutte le compo-
nenti dellautovettore fondamentale. Tuttavia, se per la matematica le vari-
abili sono tutte uguali, cos` non è per la sica e lingegneria. Esisterà dunque
un modo per sfruttare ciò che si conosce riguardo la sica del problema al
ne di rendere ancora pi` u precisa la soluzione.
Si introducono dunque i quozienti di Rayleigh, deniti in modo che:
1

< q
(m+1)
, q
(m)
>
< q
(m)
, q
(m)
>
oppure
1

< q
(m+1)
, q
(m+1)
>
< q
(m)
, q
(m+1)
>
avendo utilizzato quella che viene detta una pesatura alla Galerkin, che
prevede lutilizzo della stessa classe funzionale della soluzione per la pesatua
delle componenti.
In neutronica questo corrisponde al tenere in considerazione il fatto che i
neutroni, in un sistema critico, hanno importanza dierente a seconda della
posizione del reattore in cui si trovano, ed in particolare risulteranno in gen-
erale pi` u importanti nelle zone ove essi sono pi` u numerosi. Sarebbe dunque
in teoria pi` u corretto usare limportanza come funzione peso, ma questo
richiederebbe la soluzione del problema aggiunto, aumentando cos` il cos-
to computazionale in modo non giusticato dai risultati ottenuti. Solo nel
caso monodimensionale, poichè limportanza coincide con il usso neutron-
ico, pesando secondo Galerkin si ottiene una pesatura tramite importanza
neutronica.
Veniamo allanalisi di un caso particolarmente sfortunato. Per dare il via
allalgoritmo iterativo sarà necessario imporre una soluzione di tentativo,
vale a dire il termine q. Cosa accade se tale termine è, sfortunatamente,
perpendicolare allautovettore fondamentale? Si avrà in questo caso infatti
36
che:
q =
n
h=2
c
h
h
che non ha componente lungo lautovettore fondamentale e dunque non po-
tra mai convergere ad esso. Il metodo delle potenze convergerà in questo
caso verso il secondo autovalore di modulo massimo.
Questo sarà vero però solo dal punto di vista matematico. Dal punto
di vista numerico infatti la perpendicolarità perfetta non esiste (non es-
iste infatti il concetto di zero, ma al massimo delle quantità molto piccole),
ed infatti basterà una iterazione anchè gli errori di arrotondamento del
calcolatore portino ad ottenere come Mq un vettore non perfettamente per-
pendicolare a
1
. Si avrà in questo caso tuttavia una convergenza molto
lenta, caso non favorevole ma comunque migliore della convergenza ad un
valore sbagliato. Attenzione però che il rischio esiste comunque: troncando
il processo dopo un numero insuciente di iterazioni, il vettore soluzione
sarà molto pi` u vicino a
2
che a
1
, con le dovute conseguenze.
Si ricorda ora però che, allinizio del paragrafo, si è detto che il metodo
delle potenze è utilizzato per risolvere ogni tipo di problema agli autovalori,
mentre per quanto visto nora si è visto solo come risolvere problemi agli au-
tovalori classici ma non. Per poter estendere tale metodo anche ai problemi
generalizzati è necessario essere in grado di provare lesistenza della matrice
B
1
, ove B è la matrice del problema agli autovalori generalizzato:
Ax = Bx
Come risolvere a questo punto il problema? Sarà necessario ricondursi al
caso precedente, andando a scrivere dunque:
B
1
Ax = x
ed applicando il metodo delle potenze nella maniera seguente:
B
1
Aq
(0)
= q
(1)
Ecco dunque che il problema si è complicato notevolmente. Si avranno due
cicli di iterazioni concatenati luno dentro laltro:
Un ciclo di iterazioni esterne:
B
1
Aq
(0)
= q
(1)
B
1
Aq
(1)
= q
(2)
Un ciclo di iterazioni interne:
Aq
(0)
= Bq
(1)
37
Ritrovandosi un processo iterativo interno, anche il valore di q
(1)
non è
esatto ma approssimato rispetto allaggiornamento della soluzione.
Si potrebbe a questo punto pensare di fare unoperazione di questo tipo:
calcolare allinzio, una volta per tutte, linversa di B e utilizzarla per tutte
le iterazioni esterne. Ci si libererebbe cos` di un processo iterativo tramite
un quantitativo di calcoli che, seppure elevato, sarebbe presumibilmente
inferiore alla somma di tutte le iterazioni interne.
Per capire perchè tale procedimento spesso non è attuato bisogna andare
ad analizzare il contenuto sico del problema. Se dal punto di vista matem-
atico il discorso è teoricamente corretto, considerando le implicazioni siche
ci si accorge che si andrebbe a risolvere i due problemi su due piani diversi,
e dunque a mischiare informazioni di qualità molto dierenti. Perdendo il
parallelismo sico, la convergenza non è pi` u garantita. Si vedrà in seguito
come questa problematica appare in maniera molto evidente nel caso della
risoluzione numerica delle equazioni della diusione neutronica multigruppo.
Questo discorso si attua però solo ove la matrice B sia sparsa, e dunque
risolvibile tramite algoritmi di tipo iterativo. Ove invece B sia una matrice
densa verrà utilizzato, come già detto in precedenza, un metodo diretto, che
porterà forzatamente allottenimento della soluzione esatta.
2.4 Proprietà spettrali delle matrici di interazione
Si denisce matrice di interazione una matrice i cui coecienti hanno un
signicato sico.
Si enunciano di seguito alcune proprietà e teoremi di matrici che risul-
teranno utili nel seguito:
Se la matrice M è reale e simmetrica o complessa ma Hermi-
tiana, allora tutti gli autovalori di M sono reali e tutti gli autovettori
corrispondenti sono tra loro perpendicolari
Se la matrice M è reale e simmetrica e denita positiva
14
, allora
tutti i suoi autovalori sono positivi e reali
Se M è reale e simmetrica e semi-denita positiva
15
, allora tutti
i suoi autovalori saranno non negativi
Si denicono invece matrici positive (Da notare la dierenza con le
matrici denite positive) matrici i cui elementi sono tutti positivi. Riguardo
le matrici positive esiste un teorema di rilevante importanza:
Teorema 7 (di Perròn) Data una matrice M positiva, anche non simmet-
rica, vale che:
14
una matrice è denita positiva se,

=
0, si ha che (< M
, >) > 0
15
una matrice è semi-denita positiva se,

=
0, si ha che (< M
, >) 0
38
1. lautovalore fondamentale è positivo ed ha sempre molteplicità 1 (ovvero
i
con m(
i
) = 1 tale che
1
> [
j
[ j ,= 1)
2. Allautovalore fondamentale
1
corrisponde, a meno di una costante
moltiplicativa arbitraria, un unico autovettore
1
avente componenti
tutte positive
16
. Lautovettore fondamentale è lunico a godere di tale
proprietà.
3. Se un qualsiasi elemento della matrice M cresce, allora
1
autovalore
fondamentale della matrice M
avrà modulo maggiore di

1
Possiamo allo stesso modo denire matrici ad elementi non negativi
o matrici semipositive le matrici aventi solo termini positivi o nulli. Per
esse vale invece il seguente teorema:
Teorema 8 (di Frobenius) Data una matrice semipositiva valgono le pro-
prietà enunciate dal teorema 7 a patto che la matrice sia anche irriducibile.
Si faccia però attenzione che la condizione espressa dal punto 1 del teorema
di Perron include una maggiorazione semplice e non stretta:
1
[
j
[.
2.5 Approssimazione di dati sperimentali
Esistono numerosi modi per approssimare dei dati sperimentali. Uno dei pi` u
comuni è quello dellinterpolazione, ove essendo in possesso di n punti sper-
imentali potremo approssimarli con un polinomio di grado n-1. Purtroppo
la determinazione dei coecienti di tali polinomi costituisce un sistema di
equazioni lineare e non omogeneo
Altra via per lapprossimazione dei dati è il metodo dei minimi quadrati,
dal quale non si otterrà una funzione interpolante. Tale sistema è general-
mente utilizzato ove sia presente una quantità molto elevata di dati sper-
imentali, caso in cui non è pensabile il ricorso ad una interpolazione. Si
tenga conto comunque che nel caso della determinazione dei coecienti del-
la funzione approssimata tramite il metodo dei minimi quadrati il problema
è tanto pi` u mal condizionato quanto pi` u grande è il numero n di punti sper-
imentali a disposizione. Useremo in questi casi i polinomi di Hermite e
le funzioni spline.
2.5.1 Funzioni spline
Le funzioni spline sono dei metodi utilizzati per linterpolazione di punti.
Abbiamo infatti visto come una semplice interpolazione polinomiale spesso
non è adeguata ed è dunque opportuno ricorrere ad altri metodi.
16
ovviamente a meno di una costante moltiplicativa arbitraria. Questo corrisponde a
dire che hanno tutte lo stesso segno
39
Supponiamo dunque di avere N+1 punti, ciascuno identicato da una
coppia (x
i
, y
i
), compresi in un intervallo [a,b] tale che a x
0
< x
1
< <
x
n
b
In linea teorica è sempre possibile, come detto, trovare un polinomio di
grado N in grado di interpolare esattamente gli N+1 punti sperimentali, i
cui coecienti sono determinabili risolvendo il sistema di equazioni avente
come matrice di coecienti una matrice di Van der Monde. In eetti però,
oltre al fatto che tale problema è spesso e volentieri mal condizionato, tale
tipo di approssimazione non è necessariamente la pi` u adatta.
Un alternativa può essere quella di usare una serie di funzioni lineari, il
che mi fornisce di fatto una linea spezzata. La funzione interpolante sarà in
questo modo del tipo:
f
n
(x) =
(x
i+1
x)y
i
+ (x x
i
)y
i+1
x
i+1
x
i
per x
i
< x <
i+1
Una funzione di questo tipo è semplice da implementare, poco costosa, ma
ha un grosso problema: la sua derivata non è continua.
Prendiamo ora un altro esempio, quello in cui la soluzione interpolante
è un arco di parabola: prenderò cos` i nodi a tre a tre invece che a due
a due, ottenendo però in generale una rappresentazione poco realistica e
continuando ad avere la discontinuità nella derivata, anche se questa volta
a nodi alterni.
Deniamo ora le funzioni interpolanti di tipo spline. Diremo che una
funzione S
d
(x), con d 1 è una funzione spline di ordine d associata ai
punti x
i
, y
i
su di un intervallo [a,b] se:
S
d
(x)è un polinomio di grado d in ogni intervallo [x
i
, x
i+1
]
Ogni derivata k-esima per k d 1 è continua
Le funzioni che vedremo in quanto in genere maggiormente usate sono le
spline di ordine 3, per le quali avremo discontinuità a partire dalla derivata
terza.
Nelle spline cubiche avremo che
_
_
_
S
3
(x
i
) = y
i
per i = 0 : n
S
3
(x) = a
i
+b
i
x +c
i
x
2
+d
i
x
3
x [x
i1
, x
i
] per i = 1 : n
S
(k)+
3
(x
i
) = S
(k)+
3
(x
i
) per i = 1 : n 1, k = 0, 1, 2
Ove di fatto le prime condizioni corrispondono al passaggio della funzione per
i nodi (n+1 condizioni), le seconde allimporre che la funzione interpolante
sia un polinomio di terzo grado (4n incognite) e la terza alla continuità della
funzione e delle sue derivate prima e seconda (3n-3 condizioni). Avremo
dunque in totale 4n incognite e 4n-2 condizioni. Rimangono dunque due
40
condizioni da imporre a piacere, che saranno generalmente ad esempio lim-
posizione dei valori della derivata della funzione agli estremi del dominio di
integrazione.
Si tratta ora dunque apparentemente di risolvere un sistema abbastan-
za impegnativo di 4n equazioni ed incognite. In realtà tramite opportune
trasformazioni è possibile ridurre tali dimensioni sensibilmente
Deniamo una nuova incognita: M
i
= S
3
(x
i
). Essendo la mia spline un
polinomio di terzo grado, il polinomio risultante da una derivata seconda
sarà lineare. Dunque avremo che:
S
3
(x) =
(x
i
x)M
i1
+ (x x
i1
)M
i
x
i
x
i1
Potrò dunque scrivere la mia funzione integrando due volte ed ottenendo
cos`
S
3
(x) =
(x
i
x)
3
M
i1
+ (x x
i1
)
3
M
i
6(x
i
x
i1
)
+C
i
(x x
i1
) +D
i
Imponendo la condizione di passaggio per i punti sperimentali ottengo
_
C
i
=
y
i
y
i1
h
i
h
i
M
i
M
i1
6
D
i
= y
i1

h
2
i
6
M
i1
Da cui lequazione diventa:
S
3
(x) =
(x
i
x)
3
M
i1
+(xx
i1
)
3
M
i
6h
i
+
+[
y
i
y
i1
h
i
h
i
M
i
M
i1
6
](x x
i1
) +y
i1

h
2
i
6
M
i1
Non resta altro che denire i valori degli M
i
, che si ottengono imponendo la
continuità della derivata prima.
Si vede che apparentemente due condizioni non sono state utilizzate. In
realtà la continuità della derivata 0-esima (ovvero della funzione interpolante
stessa) è assicurata dallimposizione del passaggio per gli n+1 punti, mentre
la continuità della derivata seconda negli stessi nodi è assicurata dal fatto
che essa stessa è stata scelta come incognita.
Imponiamo dunque la continuità della derivata prima:
(x
i
x)
2
M
i1
+(xx
i1
)
2
M
i
2h
i
+ [
y
i
y
i1
h
i
h
i
M
i
M
i1
6
] =
=
(x
i+1
x)
2
M
i
+(xx
i
)
2
M
i+1
2h
i+1
+
y
i+1
y
i
h
i+1
h
i
M
i+1
M
i
6
Semplicando si ottiene:
h
i
M
i1
+ 2(h
i
+h
i+1
)M
i
+h
i+1
M
i+1
=
6
h
i+1
(y
i+1
y
i
)
6
h
i
(y
i
y
i1
)
41
Il sistema che ne deriva è di tipo tridiagonale simmetrico e dunque sostanzial-
mente facile da risolvere tramite il metodo della doppia passata. Si noti in-
oltre come la matrice del sistema sia a diagonale dominante, il che assicura
la convergenza dellalgoritmo.
Vediamo ora quali sono le due condizioni aggiuntive che possiamo im-
porre. In generale ci saranno 3 possibili strategia adottabili:
1. Imporre il valore della derivata prima agli estremi
2. Imporre il valore della derivata seconda agli estremi. In questo ca-
so, viste le incognite che sono state scelte, questo è il sistema che
permette la risoluzione pi` u semplice in quanto consiste nellimporre i
valori di due delle incognite a priori. Si parla in questo caso di spline
naturali. Tale condizione è ad esempio impostata di default nel soft-
ware Matlab, ma si faccia attenzione che non sempre è sicamente
rappresentativa
3. Nel caso di andamento periodico si impone luguaglianza agli estremi
delle derivate prime e seconde. In questo caso tuttavia si perde la
tridiagonalità della matrice
2.6 Integrazione numerica
Come si calcola un integrale in modo numerico?
Avremo
I =
_
b
a
f(x)dx
Il modo pi` u semplice per tale calcolo è dato dalle formule di Newton-
Cotes, ove scelti dei nodi x
i
vengono calcolati dei pesi
i
tali per cui il mio
integrale è approssimato da una sommatoria del tipo:
I =
n
i=1
f(x
i
)
i
Lentità dellerrore generato dallapprossimazione dipende dal numero n di
nodi. Queste sono formule di quadratura di tipo interpolatorio polino-
miale, di conseguenza un numero n di nodi corrisponderà ad un polinomio
interpolante di grado n-1 che passi esattamente attraverso tutti questi punti.
Se i nodi sono equidistanti, come è nel caso delle formule di Newton-Cotes,
tale grado di precisione è pari a (n-1). Tale informazione corrisponde di fatto
a dire che tale metodo mi consente di integrare con esattezza equazioni di
grado pari o inferiore ad (n-1).
Lobbiettivo di studi avanzati nel calcolo numerico è quello di aumentare
tale grado di precisione. Le formule Newton-Cotes sono infatti ormai obso-
lete. Laumento di precisione tuttavia, come sempre, non è a costo nullo.
42
Per applicare un metodo numerico è necessario di fatto sostituire la
funzione integranda con unaltra funzione pi` u facile da integrare. Per fare
questo, è necessario scegliere tale funzione ed applicarvi le opportune con-
dizioni al contorno per il calcolo dei coecienti. In particolare nel caso delle
formule Newton-Cotes tale operazione era eettuata imponendo n condizioni
nel calcolo dei pesi. Tali condizioni sono del tipo:
_
b
a
x
k
dx =
n
i=1
i
x
k
i
Questo corrisponde a pretendere che i miei pesi mi permettano di interpolare
esattamente tutte le funzioni di base dello spazio vettoriale dei polinomi di
grado n-1. Ho in questo modo scritto una matrice di tipo Van der monde,
ovvero del tipo:
_
_
_
_
_
1 1 1
x
1
x
2
x
n
.
.
.
.
.
.
.
.
.
x
n1
1
x
n1
2
x
n1
n
_
_
_
_
_
_
_
_
_
_
2
.
.
.
n
_
_
_
_
_
=
_
_
_
_
_
b a
b
2
a
2
2
.
.
.
b
n
a
n
n
_
_
_
_
_
Si vede dunque che il problema si riduce alla risoluzione di una matrice di
Van der Monde, che sappiamo essere fortemente mal condizionata per n
elevati. In particolare tale sistema è generalmente utilizzato per n 4. Tale
formula di quadratura ha dunque potenzialità limitate.
Veniamo ora ad ulteriori considerazioni. Supponiamo di dover calcolare
lintegrale
I =
_
b
a
(x)f(x)dx
Questa volta ho due funzioni. In realtà sono funzioni create in maniera tale
da avere:
una parte ((x)) ove ho posto tutte le singolarità della funzione inte-
granda, ma anche tutto il contenuto sico del problema.
una parte (f(x)) regolare
Stiamo dunque di fatto trattando del caso visto inizialmente, ove a p cor-
risponde K ed a f corrisponde .
Lidea è però quella di vedere come eettuare un upgrade delle for-
mule Newton-Cotes, ovvero di ottenere un grado di precisione nellapprossi-
mazione dellintegrale superiore a (n-1).
Una possibilità è quella di abbandonare limposizione a priori dei nodi.
Questi dunque non soltanto saranno incognite di equazioni, ma non saranno
pi` u evidentemente equidistanti. Si tratta dunque a questo punto di imporre
non pi` u soltanto n condizioni per il calcolo dei pesi, ma anche ulteriori n
43
condizioni per il posizionamento dei nodi. Otterrò dunque un sistema del
tipo:
_
b
a
(x)x
k
dx =
n
i=1
i
(
i
)
k
per k = 0...2n 1
Ove i
i
sono i pesi ed i
i
sono i nodi. Il problema, che da un lato fornirà
generalmente una soluzione pi` u precisa, è però diventato pi` u complesso:
non soltanto le condizioni sono diventate 2n, e dunque è raddoppiata la
dimensione del sistema da risolvere, ma è diventato non lineare. In questo
diventa dunque fondamentale lutilizzo di polinomi ortogonali, ai quali sono
associate formule di quadratura dette gaussiane
Lobbiettivo che ci si pone, aumentando il numero dei gradi di libertà, è
quello di ottenere un gradi di precisione maggiore, in particolare passando
da n-1 a 2n-1, ovvero essere in grado di integrare in maniera esatta polinomi
di grado pari o minore a 2n-1. Dunque andrò ad imporre tale condizione
che, chiamati m
k
=
_
b
a
(x)x
k
dx, permette di ottenere il seguente sistema
di equazioni:
_
1
+
2
+ +
n
= m
0
1
+
2
2
+ +
n
n
= m
1
.
.
.
2n1
1
+
2
2n1
2
+ +
n
2n1
n
= m
2n1
Ho cos` imposto 2n condizioni. A supporto della funzionalità di questi
sistemi esistono alcuni teoremi che enunceremo qui di seguito:
Teorema 9 Nellipotesi in cui (x) 0 x [a, b] , ovvero sempre non
negativo, e in cui tutti gli m
k
esistano per ogni k tra 0 e 2n-1, il sistema
di equazioni non lineari che ne deriva ha una soluzione unica ed univoca,
ovvero esiste uno ed un solo set di
i
e
i
che forniscano un polinomio
interpolante di grado di precisione 2n-1
Si noti che procedendo in questa maniera i nodi non sono pi` u equidistanti
tra loro. Questo diventa di importanza molto rilevante ove essi vadano a cor-
rispondere con la discretizzazione di un dominio. Tali formule di quadratura
dovrebbero però, quantomeno in linea teorica, attuare un processo di dis-
cretizzazione intelligente, ovvero tale da addensare la discretizzazione ove
la funzione ha variazioni pi` u sensibili e a renderla meno tta ove invece la
funzione sia pi` u regolare.
Il problema è che ora la matrice da risolvere è ancora pi` u complessa e,
comunque, mal condizionata. A questo proposito entra in gioco un teorema
fondamentale per lintegrazione numerica:
Teorema 10 Anchè la formula di quadratura sia gaussiana, ovvero abbia
grado di precisione pari a 2n-1, deve essere che Linsieme dei
i
coincida
44
con linsieme degli zeri del polinomio P
n
(x) ortogonale in [a, b] rispetto alla
funzione peso (x)
Deniamo ora meglio i polinomi ortogonali
Prendiamo un intervallo [a,b], non necessariamente nito, sul quale deni-
amo una funzione peso (x) che sia a segno costante su tutto lintervallo e
della quale esistano i momenti, deniti come:
M
k
=
_
b
a
(x)x
k
dx < per k = 1, 2...
Individuo quindi una classe di polinomi P
0
(x), P
1
(x)....P
(
x) che sarà detta
ortogonale su [a,b] rispetto alla funzione peso (x) se
_
b
a
(x)P
n
(x)P
m
(x)dx =
_
0 n ,= m
cost n = m
Tale costante sarà uguale per tutti gli n, ed un set di polinomi è denito
ortonormale ove tale costante sia uguale ad 1. In ogni caso tale costante
sarà sempre positiva in quanto abbiamo supposto la non negatività del-
la funzione peso p(x) su tutto lintervallo [a,b]. La scelta dellintervallo e
della funzione peso individua inequivocabilmente una classe di polinomi or-
togonali a meno di coecienti costanti e non nulli. In generale i polinomi
ortogonali sono deniti in base ad una formula di ricorrenza a tre termini,
del tipo:
_
_
_
P
1
(x) = 0
P
0
(x) = 1
P
n+1
(x) = (x a
n
)P
n
(x) b
n
P
n1
(x)
Si vede dunque che una volta deniti lintervallo [a,b], la funzione peso e i
valori dei coecienti a
n
e b
n
tutti i polinomi ortogonali sono determinabili
in maniera univoca. Si vede inoltre come dentro la denizione di un generico
P
n+1
siano coinvolti tutti i polinomi di ordine inferiore.
Linteresse che risiede nei polinomi ortogonali è dato dalle proprietà dei
loro zeri. Si ha infatti che:
Per ogni n 1, P
n
(x) possiede n zeri reali e distinti tutti contenuti
nellintervallo [a,b]
Tra due zeri consecutivi di P
n
(x) ne è incluso uno solo di P
n1
(x)
Prendiamo ora un generico polinomio Q
m
(x). Esso sarà rappresentabile in
modo univoco tramite una combinazione lineare di polinomi ortogonali:
Q
m
(x) =
m
i=0
c
k
P
k
(x)
45
Per il calcolo dei coecienti posso semplicemente sfruttare lortogonalità
dei polinomi: per il calcolo di un generico c
k
è suciente moltiplicare ambo
i membri per il corrispondente polinomio P
k
(x) e per la funzione peso ed
integrare da entrambe le parti su [a,b]. Se ne ottiene:
c
k
=
_
b
a
(x)Q
m
(x)P
k
(x)dx
_
b
a
(x)P
2
k
(x)dx
Dalla proprietà di ortogonalità dei polinomi si può anche ricavare che:
_
b
a
(x)P
n
(x)q
m
(x)dx = 0 m < n
Questo è dovuto al fatto che io posso sempre scrivere
Q
m
(x) =
m
i=0
c
k
P
k
(x)
Ma essendo ogni volta i diverso da n, per lortogonalità dei polinomi linte-
grale è sempre nullo.
Vediamo ora alcune classi di polinomi ortogonali: I Polinomi di Leg-
endre hanno
(x) = 1
[a, b] = [1, 1]
Il fatto che la funzione peso abbia valore unitario mi dice che tutti gli in-
tervalli in cui posso suddividere la mia funzione originaria hanno la stessa
importanza. I polinomi di Legendre sono deniti dalla seguente formula di
ricorrenza a tre termini:
_
_
_
P
0
(x) = 1
P
1
(x) = x
(n + 1)P
n+1
(x) = (2n + 1)xP
n
(x) nP
n1
(x)
Sono dei polinomi particolarmente importanti perchè sono molto adatti nel-
la discretizzazione di particelle libere in geometria sferica, soprattutto ove
si voglia discretizzare la variabile angolare. Un esempio è lequazione del
trasporto, ove la velocità di un neutrone sarà data in generale da v = v
.
Gli zeri dei polinomi di Legendre corrisponderanno alle direzioni di volo delle
particelle.
I Polinomi di Jacobi sono unaltra categoria di polinomi ortogonali,
aventi:
(x) = (1 x)
(1 +x)
[a, b] = [1, 1]
46
Si vede evidentemente che per = = 0 la scrittura degenera nei polinomi
di Legendre, che costituiscono dunque un caso particolare di polinomi di
Jacobi.
Per polinomi di Jacobi con = =
1
2
ho i Polinomi ti Tcheby-
chev di prima specie, che vedremo in seguito utilizzati come supporto per
laccelerazione della convergenza di algoritmi lenti. Per invece = =
1
2
si hanno i polinomi di Tchebychev di seconda specie che servono ad
approssimare funzioni speciali, come la E
1
.
I Polinomi di Laguerre hanno invece:
(x) = e
x
[a, b] = [0, +[
e sono usati in problemi di rilevazione satellitare e di fenomeni radiativi (si
noti a questo proposito la presenza del termine esponenziale)
I Polinomi di Hermite, hanno inne:
= e
x
2
[a, b] =] , +[
Dunque ciò che ci interessa è trovare gli zeri di tali polinomi. Per farlo
conosciamo, di base, almeno quattro modi diversi:
Bisezione
Regula falsi
Secanti
Newton
In realtà non si andranno mai ad usare tali metodi, ma ne esistono di appositi
per i polinomi ortogonali.
Dunque dal problema
_
b
a
(x)f(x)dx =
i
f(
i
) +err
sono passato prima a:
_
1
+
2
+ +
n
= m
0
1
+
2
2
+ +
n
n
= m
1
.
.
.
2n1
1
+
2
2n1
2
+ +
n
2n1
n
= m
2n1
ed inne a:
P
n
(
i
) = 0
47
Ove P
n
è il polinomio ortogonale scelto allinizio del problema in funzione
dellintervallo di integrazione e della funzione peso. La risoluzione del prob-
lema intermedio è dunque inutile, visto che le soluzioni sono date dagli zeri
del polinomio. Dunque di fatto posso ottenere i valori dei nodi, grazie ai
quali andrò a calcolare i pesi.
Andiamo per esempio a vedere cosa succede utilizzando i polinomi di
Legendre: otterremo una equazione nella forma:
_
1
1
1 f(x)dx
i
f(
i
)
Si vede che in questo caso la funzione peso è pari ad uno, e dunque di fatto
non dà alcun peso dierente ai vari intervalli. Si parla in questo caso di
formule di Gauss-Legendre
Stesso discorso può essere eettuato per altri sistemi, ottenendo ad
esempio le formule di Gauss-Laguerre:
_

0
e
x
f(x)dx
i
f(
i
)
ove i nodi sono in questo caso dati dagli zeri del polinomio di Laguerre.
I risultati portano a situazioni dierenti. Nel caso delle formule di Gauss-
Legendre ottengo un addensamento dei nodi ai bordi del dominio, con ten-
denza tanto pi` u marcata quanto pi` u n è grande (nonostante la funzione peso
sia costante).
Attenzione dunque. La scelta della formula di quadratura non è casuale,
ma eettuata in base al legame sico ed alle esigenze computazionali
17
Ho dunque trasformato il mio problema in un problema di ricerca di
zeri di polinomi omogenei. Attenzione però: tale problema è molto mal
condizionato, soprattutto ove la derivata prima del polinomio sia piccola e
dove il numero di zeri n sia elevato.
Maledizione! Dunque neanche questo terzo problema numerico sarà quel-
lo che andremo, in denitiva, a risolvere. Dovremo di fatto ripensare il
17
Ritornando a quanto detto sulla propagazione degli errori, le formule di ricorrenza a
tre termini sono esattamente uno dei punti potenzialmente problematici di un algoritmo
dei quali andranno dunque studiati condizionamento e stabilita. Dunque in eetti quando
andremo ad inserire una formula di ricorrenza a tre termini, non lo faremo secondo la
denizione vista in precedenza, ma tramite lalgoritmo di Clanshaw, che trasforma
quello precedente in uno pi` u stabile:
y
m+2
= y
m+1
= 0
y
k
= (A
k
x + B
k
)y
k+1
C
k
y
k+2
+ c
k
y
0
k
0
= Q
m
( x)
Si tratta di un algoritmo ricorsivo allindietro, ove devono essere noti i coecienti ricorsivi
del polinomio ortogonale. Il risultato che si ottiene utilizzato questo tipo di algoritmi è
adabile
48
problema numerico dallinizio, in modo tale da ottenere le stesse soluzioni
del problema che ci siamo posti, rendendolo però pi` u facile da risolvere.
La prima operazione da eettuare è una normalizzazione dei polinomi,
in modo tale che
_
b
a
(x)P
2
m
(x)dx = 1
Ottenendo cos` un insieme di polinomi ortonormali. In questo modo la
formula di ricorrenza assume la forma:
P
m+1
(x) = (A
m
x +B
m
)P
m
(x)
A
m
A
m1
P
m1
Che si può riscrivere nella forma
xP
m
(x) =
1
A
m
P
m+1

B
m
A
m
P
m
(x) +
1
A
m1
P
m1
che, rinominando opportunamente i coecienti come:
m
=
1
A
m
e
m
=
B
m
A
m
diventa
xP
m
(x) =
m
P
m+1
+
m
P
m
(x) +
m1
P
m1
Posso dunque riscrivere il tutto in forma matriciale, del tipo:
x
P(x) =

T

P(x) +
n1
P
n
(x)e
n
con e
n
n1
= 0, 0, , 1
Se calcoliamo tale espressione nei nodi
i
, sapendo che questi sono tali da
essere zeri di P
n
, otteniamo la forma nale:
P(
i
) =

T

P(
i
)
Questo non è altro che un problema agli autovalori di tipo classico ove gli
zeri del polinomio P
n
(x) coincidono con gli autovalori del problema stesso.
Questo è dunque, in denitiva, il vero problema che andremo a risol-
vere. La matrice T è in eetti tridiagonale e simmetrica, il che come detto
rende possibile ottenere la risoluzione tramite lapplicazione del metodo della
doppia passata. I pesi sono inne determinati, una volta noti gli autovalori
del problema e di conseguenza i nodi
i
, dallequazione:
i
=
1
n1
j=0
[P
j
(
i
)
2
]
49
2.7 Equazioni integrali
Ci si riferisce in particolare alle cosiddette equazioni di Frehdolm di
seconda specie. Non è ovviamente lunico tipo esistente, ma ve ne sono
altre come le equazioni integrali di Volterra. Caratteristica peculiare delle
equazioni di Frehdolm è quella di basarsi su integrali deniti. Un tipico
esempio di equazione di Frehdolm di seconda specie è il seguente:
(x) = h(x) +
_
K(x, y)(y)dy
Con riferimento alla simbologia dellequazione precedente, abbiamo che:
(x) è la funzione incognita
h(x) è il termine forzante
K(x, y) è il nucleo o kernel della funzione di integrazione, ove in pratica
è situata la sica del problema.
18
Ove il termine forzante sia assente, lequazione di partenza viene ricon-
dotta (come visto nel paragrafo precedente) ad una equazione integrale
agli autovalori, del tipo:
Ax = x oppure Ax = Bx
tali casi si riconducono entrambi alla risoluzione di un problema del tipo
D()x =
0, ove D() è una matrice dipendente da parametro. Il caso

pi` u agevole, ma anche in geneale quello meno interessante, è quello ove tale
dipendenza sia lineare.
Quelli enunciati no ad ora sono problemi matematici. Per passare al
problema numerico sarà necessario introdurre degli errori di idealizzazione.
Partiamo dal kernel, ove come detto è nascosta la sica del problema.
Sulla base di questo dovremo procedere allintegrazione scegliendo oppor-
tunamente la formula di quadratura. Una volta eettuata tale operazione
la risoluzione dellequazione integrale diventerà un problema algebrico del
tipo:
(x) h(x) +
n
i=1
i
k(x, y
i
)(y
i
)
Tuttavia è necessario abbandonare lidea di calcolare direttamente la soluzione
esatta (x). Ciò che riuscirò ad ottenere sarà sempre e comunque una
soluzione approssimata. Andrò dunque a sostituire alla mia (x) una
n
(x)
dove lindice n mi dà informazioni sulla precisione del polinomio interpolante.
18
Tale nucleo pu` o essere singolare nel dominio di integrazione; in questo caso la
risoluzione diventa maggiormente complessa
50
La scelta di n dipende dal problema sico e, come sempre, dal rapporto
costi-beneci.
Una volta eettuato tale passaggio otterrò che la mia equazione sarà
divenuta della forma:
n
(x) h(x) +
n
i=1
i
k(x, y
i
)
n
(y
i
)
Occorre a questo punto ricordare che, nel calcolo numerico, non si opera
quasi mai nel continuo, ma si opera un processo di discretizzazione per
arrivare ad un numero nito di nodi in cui sarà calcolata la funzione. Si
tratterà dunque di andare a collocare i nodi, che sono i punti in cui imporrò
lesattezza della mia equazione. Otterrò cos` una forma del tipo:
n
(x
i
) = h(x
i
) +
n
i=1
i
k(x
i
, y
i
)
n
(y
i
)
In questo caso il circa uguale è stato sostituito con un uguale in quanto
stiamo imponendo proprio che la nostra approssimazione sia esatta nei nodi
scelti.
Sono dunque di fronte ad un problema lineare non omogeneo del tipo
i
[
ij
+
i
k(x
i
, y
i
)]
n
(x
i
) = h(x
i
)
che assume di fatto una forma del tipo Ax=b. Trattandosi di un problema
non omogeneo esso sarà risolvibile solo se det(A) ,= 0, e come qualsiasi
problema numerico è necessario accertarsi del buon condizionamento della
matrice A. Una volta eettuata tale verica, esisteranno come sempre le due
strade:
se la matrice è sparsa, si opererà iterativamente
se la matrice è densa, si opererà tramite metodi diretti
In generale sarà pi` u probabile, nel caso di equazioni integrali, trovarsi di
fronte a matrici dense. Un esempio tipico di questo caso è la trasmissione dei
segnali, ove nonostante si abbia una attenuazione esponenziale del segnale è
teoricamente necessario tenere conto di ogni possibile sorgente, il che porta
ad avere matrici quasi interamente non nulle.
51
Capitolo 3
Metodi numerici per
lingegneria nucleare
3.1 Introduzione alla tecnologia ed alla sica nu-
cleare
Un reattore nucleare è identicato da un punto di funzionamento. Possiamo
supporre che esistono varie zone:
Sicure
di Allarme
Incidentali
Il produttore deve tendenzialmente adattarsi alle richieste di carico della
rete. Questo dipende tuttavia anche da numerosi altri fattori: in Italia ci
si aspetta che eventuali centrali nucleari di nuova costruzione opererebbero
in modo tale da supportare il carico di base, lavorando quindi in condizioni
teoricamente ottimali. In un contesto pi` u generale tuttavia anche i gestori
nucleari dovranno adattarsi alle richieste di rete, il che li porterà a porsi
in punti di funzionamento dierenti dallottimale. Il punto chiave è che
è necessario assicurarsi che tali variazioni del punto di funzionamento non
portino a spostarsi al di fuori della zona sicura. Si noti che pi` u i miei codici
di controllo sono ecaci e precisi, pi` u la zona denita sicura potrà essere
estesa. Dunque, come è accaduto di recente in Svezia, a volte per aumentare
la potenza prodotta dalle centrli è suciente migliorarne il controllo in modo
da potersi spingere in sicurezza in zone di funzionamento prima inaccessibili.
Nelle pagine che seguono ci si concentrerà sullo studio di piccoli transitori
e piccole oscillazioni attorno ad un valore costante. Si noti che, nonostante
tali fenomeni verranno visti in riferimento al nucleare, non sono aatto di
esso esclusivi, ma anzi esistono altri casi di controllo simile
1
.
1
Si vedano ad esempio i problemi legati al ripple di corrente
52
Ammettiamo inizialmente di avere un sistema molto semplice, di cui
supporremo di conoscere con precisione la geometria (considerata invari-
ante nel tempo, anche se questo è vero solo no ad un certo punto) e la
composizione materiale (che invece varia nel tempo in modo marcato).
Supponiamo inoltre che:
Ogni neutrone uscito è perduto; non vi è dunque rientro di neutroni
Non ci sono neutroni entranti nel sistema dallesterno: nè, come detto,
riessi nè generati da una sorgente esterno
Queste ipotesi ci permettono di considerare un problema omogeneo
Utilizzeremo come ultieriore astrazione quella di supporre che i neutroni
siano già presenti nel sistema, ovvero ci dimenticheremo dei transitori di
avviamento. Allinterno di questo sistema i neutroni interagiranno con il
materiale nucleare (e non) presente e potranno avere determinate iterazioni
piuttosto di altre a seconda della loro probabilità, quanticata dalla sezione
durto.
Sappiamo dalla sica nucleare che linterazione di un neutrone con un
nucleo può dare luogo alla scomparsa del neutrone stesso ed alla produzione
di una trasmutazione del nucleo di partenza. Delle reazioni di questo tipo
quella di maggior interesse sarà quella di fissione. In questo caso il neu-
trone, catturato da un nucleo ssile, porta alla formazione di un nucleo
composto ed instabile che, in tempi trascurabili, si scinderà in pi` u nuclei di
dimensioni inferiori provocando la produzione di radiazioni ed altri neutroni.
Questo tipo di fenomeni ci porta a comprendere come, in eetti, il supporre
composizione materiale costante sarebbe una approssimazione troppo forte.
Non tutti i tipi di interazione tuttavia danno luogo a questo tipo di
fenomeni, ed anzi quelli in generale pi` u frequenti saranno quelli in cui il
neutrone rimbalza contro i nuclei del materiale in cui si muove, dando cos`
luogo a scattering. Lo scattering è, per natura, un fenomeno isotropiz-
zante; Tutte le sezioni durto che vedremo, invece, sono da considerarsi in
materiale isotropo.
2
Al ne del controllo del reattore, e lo ripeteremo pi` u volte, sono fonda-
mentali i neutroni ritardati. I fenomeni di emissione rapida sono infatti
troppo veloci per essere controllati, mentre lincidenza dei fenomeni di emis-
sione ritardata è, seppure piccola, sucientemente elevata da consentire il
controllo delle reazioni.
Il nostro obbiettivo sarebbe quello di mantenere la potenza prodotta
costante. Tuttavia, per quanto detto, un sistema nucleare per fare ciò avrà
2
La dierenza tra isotropo e isotropizzante è sottile ma sostanziale. Lo scattering è
un fenomeno isotropizzante nel senso che la direzione di volo del neutrone in uscita ha
probabilit` a indipendente dallangolo solido. Un materiale è invece detto isotropo rispetto
ad un fenomeno ove tale fenomeno ha una probabilit` a di avvenire equa indipendentemente
dallangolo solido di volo
53
bisogno di un quantitativo elevato di sistemi di controllo e regolazione, che
comunque saranno in grado di assicurare tale costanza di produzione solo in
prima approssimazione.
Esistono fondamentalmente tre tipi di sitemi di controllo:
Barre di controllo : Sono sistemi a movimentazione elettromeccanica, di
cui esistono a loro volta diverse tipologie:
Per lo spegnimento rapido (scram)
Per la macro regolazione (abbassamento / innalzamento richieste
di rete)
Per la micro regolazione (o regolazione ne, sempre in moto per
il controllo del k eettivo)
Controllo chimico : Si parla in questo caso del cosiddetto avvelenamen-
to del refrigerante per via chimica, in generale tramite dissoluzione di
sali di boro
Controllo sico-chimico Alcune pastiglie inserite allinterno degli elemen-
ti di combustibile sono realizzate con dei materiali assorbitori (ad
esempio ossido di gadolinio)
Dei tre sistemi descritti lultimo è lunico non online, ovvero che non può
essere modicato a piacimento una volta che gli elementi di combustibile
sono stati montati. Tale sistema è in generale usato per regolare la presenza
di neutroni in determinate zone del reattore ed a determinate energie.
I veleni di cui si è parlato nora sono bruciabili. Ciò implica che essi si
consumano dopo luso. Dunque, in fase progettuale, la concentrazione degli
ossidi di gadolinio nelle pastiglie deve essere calcolata tenendo in conto della
progressiva diminuzione del loro quantitativo nel tempo. Il fenomeno per
cui i sistemi di controllo non online sono pi` u ecaci allinizio della vita del
reattore che alla ne è detto rilascio di reattivit` a.
Si tenga conto comunque che i metodi numerici associati alla risoluzione
dellequazione della diusione multigruppo non permettono nè il controllo
di centrale nè la progettazione. Essi sono infatti applicati a problemi meno
critici, ed in particolare alla programmazione della sostituzione delle barre
di combustibile
3
.
3
Ci si potrebbe in realtà chiedere per quale ragione il consumo non pu` o essere pro-
grammato in anticipo sfruttando i metodi pi` u precisi che vengono utilizzati in fase di
progettazione. Questo non accade in quanto durante la vita di un reattore, esso non opera
sempre in condizioni nominali, ma seguendo una serie di fasi a potenze dierenti ed andr` a
incontro ad un largo numero di transitori, pi` u o meno traumatici, che renderanno im-
possibile la previsione a priori del consumo di combustibile. Questa dunque dovr` a essere
programmata tenendo in considerazione, seppure in maniera approssimativa, la vita del
reattore che precede la sostituzione. Si ricorda inoltre che transitori veloci sono molto
pericolosi, in quanto possono provocare la formazione di cricche allinterno degli elemen-
54
3.1.1 Il concetto di criticità e le sue implicazioni
Come può un sistema rimanere, da un istante allaltro, stabile? Quando il
numero di neutroni che nascono da ssione per unità di volume e di tempo è
sempre uguale a quelli che muoiono (sono assorbiti od escono dal sistema),
per unità di volume e di tempo diremo che il sistema è critico.
4
Ci stiamo dunque preoccupando dello studio di criticità di un sistema
moltiplicante tramite le equazioni della diusione multigruppo in 3D. Cercher-
emo in questa sede di analizzare lo sforzo computazionale che questo implica.
Torniamo ora al concetto di criticità. Stiamo parlando di un sistema
moltiplicante ove dobbiamo essere in grado di mantenere le reazioni a cate-
na senza che queste diminuiscano od aumentino di intensità oltre certi livelli.
Assumendo, come detto, composizione variabile, se il sistema è critico al-
listante t non lo sarà mai anche allistante t + t, a meno di non cambiare
qualcosa nel sistema.
Cosa succede quando porto questi ragionamenti in una logica computazionale?
Otterrò come noto dei risultati rappresentativi della realtà sica, ma non
esatti, e di questo dovrò ovviamente tenerne in conto poichè si parla di
sistemi molto sensibili agli errori, in particolare riguardo lo scostamento
dalla criticità. Ogni volta che tale spostamento supera una soglia anche
apparentemente molto piccola i problemi non possono pi` u essere considerati
stazionari, e ci si sposterà in unaltra classe di problemi, detti di cinetica
neutronica. In teoria infatti ogni volta che ci troveremo in condizioni di
k
eff
,= 1 non potremo pi` u parlare di criticità e ci troveremo in condizioni
cinetiche e, dunque, non stazionarie.
Allinterno degli studi di criticità è importante ritornare alla realtà anche
dal punto di vista geometrico. Il nostro dominio non sarà pi` u dunque una
sfera perfetta ma un sistema complesso che abbia il pi` u possibile le sem-
bianze del reattore reale che vogliamo andare a studiare. Questo avrà anche
implicazioni di tipo energetico legate, ad esempio, alla termodinamica della
sottrazione del calore o al variare delleetto moderante in funzione della
fase del moderatore.
Come detto lobbiettivo sarà quello di portarsi in condizioni di potenza
termica costante. Nella realt` a delle cose non è tuttavia possibile raggiungere
ti di combustibile che portano alla fuoriuscita dei prodotti di ssione e la conseguente
contaminazione del circuito primario. Questo evento pu` o determinare la necessit` a della
sostituzione anticipata di un elemento di combustibile. La criticit` a della guaina che cir-
conda le barre duranio al ne di contenere i prodotti di ssione è tale che le saldature
presenti in detta guaina sono controllate ai raggi X una per una in fase di produzione
4
La criticit` a di un reattore dipende esclusivamente dalla sua geometria e dalla sua
composizione materiale in un determinato istante, e non dal numero di neutroni che vi
sono contenuto. Quindi, almeno a livello concettuale, un reattore pu` o essere critico anche
in totale assenza di neutroni, la cui presenza serve solo (e non è poco) alla produzione di
energia. La presenza di neutroni, e le conseguenti iterazioni che essi hanno con il materiale,
andranno istantaneamente a modicare la composizione materiale del sistema, provocando
cos` la perdit` a di criticit` a dello stesso.
55
tale obiettivo, e il sistema tenderà di conseguenza ad oscillare continuamente
tra condizioni di lieve (si spera) sotto e sopracriticità.
La criticità è dunque raggiungibile solo agendo sui sistemi di controllo,
che permettono di variare la composizione materiale del sistema a piacimen-
to. Esistono invece sistemi di sicurezza intrinseca e passiva il cui com-
pito sarà quello di far raggiungere al sistema livelli fortemente sottocritici
nel minor tempo possibile.
In generale a sistema sovracritico corrisponde una crescita di potenza,
mentre ad un sistema sottocritico corrisponde un calo della stessa. Questa
corrispondenza, seppur frequente, non è tuttavia univoca. Una delle ra-
gioni dellincidente di Chernobyl è stata anche una condizione di apparente
sottocriticità associata tuttavia ad un aumento di popolazione neutronica.
Gli incidenti di criticit` a sono situazioni in cui la criticità di un
sistema è raggiunta involontariamente, e sono evidentemente molto peri-
colose. Sono situazioni tipiche ad esempio dei processi di ritrattamento del
combustibile, ove si può per errore congurare un sistema (ad esempio di
stoccaggio intermedio) in modo tale che questo risulti avere casualmente
k
eff
> 1.
5 6
3.1.2 Fenomeni non stazionari
La semplicazione di pseudo-stazionarietà è accettabile solo in determinati
casi, mentre in altri non è realistica. Alcuni esempi sono:
Transitorie Si tratta di fasi non-stazionarie non pericolose, generate dal-
lattività volontaria di regolazione derivante dalla gestione del sistema.
Si parla in particolare delle fasi di
Avviamento
Spegnimento
Regolazione del carico
Incidentali Si tratta in questo caso delle condizioni in cui è necessario
spegnere rapidamente il reattore. Tale operazione è denita scram, ed
è sensibilmente dierente dallle operazioni di spegnimento standard.
Lincidente pi` u grave che possa vericarsi in una centrale nucleare è il
LOCA (Loss Of Cooling Accident), ove si ha una perdita immediata
di praticamente tutto il liquido refrigerante.
5
Lultimo incidente di questo tipo è avvenuto in Giappone nel 1999. Questi incidenti
sono potenzialmente molto gravi e portano allemissione di forti quantit` a di radiazioni
e di neutroni, con possibilit` a anche di innesco di reazioni esplosive
6
Un caso molto particolare è quello di una zona mineraria del Gabon, ove nel tempo
si sono naturalmente ripetute pi` u volte per pi` u di un milione di anni delle situazioni di
criticit` a naturale. Si noti che luranio 235 è in generale presente in natura in quantitativi
molto bassi, in media con arricchimenti inferiori allo 0,7%
56
Approfondiamo, per completezza, qualche cenno legato ai fenomeni tran-
sitori, ai quali sono infatti legate delle condizioni in cui il gestore di una
centrale vorrà portarsi deliberatamente in condizioni sovracritiche.
Cosa succede ad esempio allaccensione? Supponiamo di aver appena
spento il reattore per la ricarica e di volerne garantire lattività continuativa
per un quantitativo compreso tra 18 e 36 mesi. Allinizio di tale periodo il
sistema, privo di barre di controllo, sarà dunque fortemente sovracritico per
due ragioni:
Per poter garantire per il numero di mesi richiesti il mantenimento
della criticità, anche in presenza di sistemi di controllo
Per poter accendere il sistema
Supponiamo dunque di avere, in t=0, usso neutronico nullo. Per accen-
dere il sistema dovrò, in qualche modo, buttarci dentro dei neutroni. Una
volta completata questa fase dovrò poi utilizzare i sistemi di controllo per
aumentare la potenza passo a passo no al valore richiesto.
7
Veniamo ora invece al caso della regolazione, ovvero ad esempio del
caso in cui la rete richieda un aumento di potenza. Tale procedimento risulta
essere analogo alle procedure di accensione e spegnimento, ove dunque il
livello di potenza richiesto non è raggiunto tramite un unico passaggio ma
attraverso diversi piccoli salti.
3.1.3 Limportanza neutronica ed i metodi per lo studio di
problemi pseudo-stazionari
Immaginiamo di avere un sistema estremamente semplice, sul quale faremo
le seguenti supposizioni:
sferico
critico
geometria e compisizione materiale ben note e costanti nel tempo
trascuriamo i problemi prettamente tecnici, come la strategia scelta
per la sottrazione del calore e via dicendo
poniamo tale sistema sotto al Gran Sasso, ove dunque potremo pensare
che non vi siano neutroni
7
teoricamente si dovrebbero avere problemi di questo tipo anche in fase di spegnimento
o calo di potenza, ma in pratica tali operazioni sono molto meno delicate in quanto un
eccesso di scostamento dalla criticit` a provocherebbe solo uno spegnimento troppo brusco
e non una esplosione. Nonostante ci` o si tenga comunque in conto che per lintegrit` a del
sistema pi` u i transitori sono lenti, meglio è
57
Supponiamo ora di poter generare allinterno di tale sistema delle sorgenti
di neutroni puntiformi in maniera totalmente arbitraria. Chiamerò tali sor-
genti S
1
ed S
2
, e le posizionerò in due sistemi altrimenti identici, in due
posizioni diverse (immaginiamo S
1
esattamente al centro del sistema ed S
2
in prossimità del conne). La domanda che ci poniamo è la seguente: i due
sistemi si comporteranno in maniera dierente?
Ricordando la supposizione iniziale di criticità e geometria e compo-
sizione materiale costanti, avrò che i due reattori, dopo il transitorio iniziale,
si porteranno a due condizioni di equilibrio dierenti tra loro, con potenze
P
1
e P
2
prodotte diverse. In eetti il punto chiave sta nel fatto che i neutroni
prodotti dalla seconda sorgente, essendo essa posizionata pi` u vicina alla fron-
tiera, tenderanno con maggiore facilità ad uscire dal sistema rispetto a quelli
prodotti dalla prima sorgente. Si vede dunque che, a livello neutronico, non
tutte le zone del rettore sono uguali. Deniamo dunque importanza di un
neutrone come il contributo che esso può dare allottenimento del-
la potenza asintotica del sistema. Essa è una funzione dellenergia del
neutrone, della sua direzione di volo ma anche della sua posizione, come
appena detto. A parità dunque delle prime due variabili, un neutrone pi` u
vicino al cuore del sistema sarà generalmente pi` u importante di uno posto
in prossimità della periferia
8
.
Conoscere limportanza che i neutroni hanno in una determinata zona
del reattore è fondamentale ai ni della progettazione delle barre di controllo
ed in generale dei sistemi di sicurezza e regolazione. Il loro intervento sarà
infatti tanto pi` u ecace tanto maggiore è limportanza dei neutroni che essi
andranno ad assorbire. Avremo dunque, ad esempio, che le barre di controllo
per lo scram sono posizionate al centro del reattore.
Torniamo al sistema sferico critico ideale. Cosa accadrebbe se andassimo
a modicare la geometria o la composizione materiale? Non è dicile intuire
che:
Se andiamo ad aumentare larricchimento, si avrà uno spostamento
verso la sovracriticità del sistema
Se andiamo ad aumentare il raggio della sfera andremo a diminuire
il rapporto supercie / volume e dunque a diminuire lincidenza delle
fughe sul bilancio neutronico, il che porta anche in questo caso ad uno
spostamento verso la sovracriticità
Se passiamo dunque al problema numerico corrispondente, avremo in
generale due tipi di autovalori:
Materiale
8
In diusione monodimensionale importanza e usso neutronico coincidono. Questo
mostra come, almeno come linea generale, che le zone ad importanza maggiore sono quelle
ove vi sono pi` u neutroni
58
Geometrico
Questo mi dice che di fatto che per modicare la criticità del sistema potrò
andare ad operare sia sulla geometria che sulla composizione geometrica
dello stesso. Questa operazione non è tuttavia agevole.
Torniamo ora alla buona vecchia analisi numerica. Il ne è quello di ge-
stire i programmi di ricarica del combustibile di un reattore tramite la mod-
ellizzazione numerica dei fenomeni che avvengono al suo interno. Dunque
vorrò studiare quale sarà, istante per istante, il contenuto in U
235
, in Pu
239
e
Pu
241
, il quantitativo di veleni ancora presenti, allinterno di una panorami-
ca 3D del reattore, che potremo al pi` u semplicare sfruttandone la geometria
circolare ed andando dunque a studiarne solo un quarto della sezione, es-
trapolando i risultati al resto del sistema. Per fare questo useremo dunque
dei codici di calcolo in diusione 3D multigruppo.
Ne esistono fondamentalmente due macro-famiglie:
Dierenze nite ni ove viene attuata una discretizzazione spinta del do-
minio spaziale. In questo caso il passo tra due nodi adiacenti è dellor-
dine di grandezza del libero cammino medio dei neutroni. Tale sistema
è molto oneroso dal punto di vista computazionale, ma eettuando
importanti approssimazioni sul usso neutronico (in particolare con-
siderandolo lineare tra due nodi adiacenti) tale complessità è ridotta
a livelli accettabili.
Coarse mesh s ove si applica una logica opposta: la discretizzazione spaziale
è molto grossolana, molto pi` u grande rispetto al libero cammino medio
dei neutroni
9
. Per mantenere un livello di precisione accettabile si
sceglie tuttavia di aumentare il contenuto della denizione locale del
usso neutronico, che sarà generalmente una funzione polinomiale di
grado 2 o 3. Il problema è che questo porta a problemi di tipo non
lineare, per i quali non esiste ad oggi una dimostrazione di esistenza
ed unicità della soluzione. Nonostante questo tali metodi, introdotti
nel 1972, sono oggi molto usati nellambito della programmazione delle
ricariche del combustibile.
Parleremo sempre di condizioni di pseudo-criticità, il che ci porterà a
risolvere problemi agli autovalori generati dallomogeneità del problema di
partenza. Lipotesi di pseudo-criticità ci permetterà quindi di dimenticarci
di fatto della dipendenza dal tempo.
9
si ricorda che il libero cammino medio di un neutrone è funzione della sua energia,
teoricamente in modo continuo, in pratica in modo discreto nel momento in cui il dominio
energetico è suddiviso in un numero nito di gruppi
59
3.2 Il consumo del combustibile nucleare
Veniamo ad alcune considerazioni sul combustibile nucleare. Sappiamo bene
che, purtroppo, nel momento in cui è necessario il suo ricambio, esso è ben
lontano dallessere esaurito. La sostituzione degli elementi di combustibile
infatti, a dierenza della maggior parte degli altri sistemi energetici, non
è legata allesaurimento del combustibile ma allincapacità di garantire la
criticità del reattore. Nei momenti immediatamente successivi alla ricarica
il reattore è fortemente sovracritico, e la reattività, inizialmente controllata
dai sistemi di controllo, è rilasciata con il consumarsi del combustibile.
10
La condizione ideale che si vorrebbe raggiungere allinterno di un reat-
tore nucleare è quella di reattività il pi` u possibile uniforme sulle varie di-
rezioni. Tuttavia questa condizione è dicile da raggiungere, sia nei PWR
che, soprattutto, nei BWR
11
.
Prendiamo un generico reattore, arricchito al 2-4%. Dovrò tenere in con-
to, con il passare del tempo, non solo del consumo di U
235
ma anche della
produzione di Pu
239
e Pu
241
, a loro volta ssili. Dunque il depauperamento
della quantità di materiale ssile allinterno del reattore è frutto di un bi-
lancio tra consumo di uranio e produzione di plutonio
12
. Tale bilancio non
è costante durante la vita del reattore, ed anche se in generale il consumo
di uranio è preponderante, esiste una fase della vita del combustibile, la
cui intensità e durata variano da reattore a reattore, in cui la formazione
di plutonio prevale sul consumo di uranio. Tale fase è detta plutonium
build-up
13
Quando si genera plutonio allinterno di un sistema, esso vi immette
reattività. Questo dunque corrisponde ad una sorta di lieve estrazione
10
Si vuole qui ricordare inoltre che, in generale, alle operazioni di sostituzione del com-
bustibile sono associate anche delle fasi di movimentazione delle barre non ancora esaurite
in modo da ottimizzarne il consumo
11
nei BWR lebollizione dellacqua allinterno del reattore provoca una forte diminuzione
di densit` a di moderatore nella parte alta del reattore, alla quale corrisponde unaltrettanto
marcata diminuzione di reattivit` a
12
I calcoli legati alla diusione neutronica sono sempre basati sullipotesi che i prodotti di
ssione non diondano allinterno del materiale ma restino l` dove sono. Questo, in realt` a,
non è propriamente vero, ma il loro livello di diusione è molto ridotto, e considerato
trascurabile rispetto invece a quello dei neutroni
13
Nei reattori per la produzione di energia tale plutonio viene consumato direttamente
allinterno del reattore. Esistono tuttavia dei reattori, detti plutonigeni, che sono invece
pensati per massimizzare la produzione di plutonio, che viene successivamente estratto
ed utilizzato per ni militari. A questo proposito esistono anche reattori pensati per
il processo inverso, ovvero per essere alimentati tramite il materiale nucleare di orgine
militare. 7 dei 58 reattori francesi sono adatti anche a questo scopo, ma tale possibilit` a
richiede ulteriori accortezze in ambito di sicurezza e controllo, in quanto la reazione di
ssione del plutonio è molto meno controllabile di quella delluranio ((U
235
) 0.65,
(Pu
239
) 0.22). Questo implica che in ogni caso i combustibili a base di plutonio (o
comunque contenenti parti non trascurabili di plutonio) non sono mai utilizzati da soli
allinterno del reattore, ma opportunamente mischiati a combustibile tradizionale
60
delle barre di controllo, il tutto legato anche alla maggiore dicoltà del
controllo delle reazioni di ssione delluranio.
Vediamo anche altri tipi di reattori. Ad esempio sappiamo che i CANDU,
per come sono pensati, sono particolarmente facili da controllare. Tuttavia,
dallaltro lato, la gestione del combustibile è pessima, ovvero il combustibile
è sostituito quando il suo contenuto energetico è ancora molto elevato in
relazione al suo contenuto iniziale. Questo gli è tuttavia permesso dal fatto
che tali reattori sono alimentati ad uranio naturale e permettono il ricambio
del combustibile senza dover ricorrere allo spegnimento del reattore.
3.3 Dierenze nite ni
Per quanto visto avremo dunque due livelli di discretizzazione:
Spaziale : nel passaggio ad un approccio numerico perdiamo come noto la
continuità dello spazio, il che ci porterà a calcolare le grandezze siche
solo in alcuni punti
Energetica : ho come detto un numero nito G di intervalli monoenergetici
Dunque lordine di discretizzazione del mio problema sarà N
x
N
y
N
z
G, il
cui valore può facilmente essere molto elevato.
3.3.1 Diusione monodimensionale monogruppo
Veniamo ora alla scrittura del problema, preoccupandoci quantomeno in-
izialmente del caso pi` u basilare, monodimensionale e monogruppo. Avrò un
problema del tipo:
_
_
_
D
d
2
dx
2

a
+

f
k
= 0
(0) = (a) = 0
Ove i dierenti termini assumono il seguente signicato:
D
d
2
dx
2
rappresenta il depapuperamento del bilancio dato dalle fughe. Tale
termine non è intrinsecamente negativo, ma lo sarà sempre (o quasi)
nei bilanci che andremo a considerare
a
rappresenta il depauperamento dato dagli assorbimenti. Questo ter-
mine è sempre negativo, in quanto risulta dal prodotto di due termini
deniti positivi cambiato di segno
f
rappresenta il termine di ssione, ed è sempre positivo in quanto
prodotto di tre quantità denite positive.
61
Supponiamo ora di eliminare il k da tale equazione.
Tale problema sarà ovviamente risolto dalla soluzione banale di us-
so neutronico nullo. Una soluzione non banale può esistere soltanto se la
composizione materiale e la geometria del sistema sono tali da renderlo
critico.
Da qui nasce appunto la natura del k: esso corrisponde allautovalore
che, sicamente, non funge ad altro che a riequilibratore del fenomeno si-
co. Dunque io prendo un problema che, inizialmente, non rappresenterà una
situazione di criticità, e lo modicherò tramite un parametro in modo tale
da rendere il sistema critico. Una volta fatto questo andrò a determinare il
valore di tale parametro che, per come è stato inserito, mi dirà che il sis-
tema è sottocritico se inferiore ad uno e sovracritico se superiore ad uno. Ho
cos` risolto magistralmente il problema della non stazionarietà, forzando il
problema a diventare stazionario: il bilancio neutronico diusivo è dunque
sempre nullo, anche se nella realtà sica delle cose non sarà cos`, ma ri-
esco comunque a quanticare lo scostamento dalla criticità. Chiaramente
la veridicità di tale approssimazione è garantita solo per k molto vicino ad
uno. Uno scostamento eccessivo provocherebbe il vericarsi di fenomeni
fortemente non-stazionari, il che richiederebbe lo studio del fenomeno sotto
un approccio dierente.
La geometria del sistema viene in questo caso considerata allinterno
delle condizioni al contorno alle pareti, ove abbiamo imposto usso nullo.
14
Dal punto di vista sico, in questo caso lautovalore è attribuito al ter-
mine di ssione
f
. Questa non è lunica soluzione possibile: potrei, ad
esempio, inserire il k nelle condizioni al contorno, imponendo che il usso
si annulli in (0 +x) e (a x) ove lautovalore diventa, in questo caso, x
e viene chiamato autovalore geometrico. Lo scopo è sempre lo stesso:
forzare la criticità del sistema, andando però questa volta a modicarne la
geometria piuttosto che la composizione materiale.
15
Il problema della scelta dellautovalore geometrico è che il sistema che
ne risulta è ancora pi` u dicile da studiare dal punto di vista numerico in
quanto implica una modica delle dimensioni del dominio e, di conseguenza,
della sua discretizzazione. La dipendenza della matrice del problema da k
non è pi` u lineare, e la risoluzione ne risente. Tale modello è utilizzato in
generale per altri scopi, come ad esempio per comprendere in che modo un
sistema critico reagisce ad una variazione della geometria del sistema, ad
esempio in caso di incidente.
14
Lapprossimazione di usso nullo alle pareti è detta di affacciamento al vuoto, ed
è realistica solo ove non vi sia un riettore. In generale, pur non considerando la presenza
di un riettore, andremo a sostituire tale condizione con lannullamento del usso su di
un conne estrapolato
15
inserire il k allinterno del termine di ssione corrisponde infatti a diminuire il o il
f
, il che non corrisponde ad altro che ad una sostituzione ideale del materiale ssile con
un altro avente propriet` a dierenti
62
Ulteriore posizione che lautovalore potrebbe assumere è landare a mod-
icare la densità del materiale, in modo da variare i valori di
a
e
f
. Il
problema in questo caso risiede nel fatto che ogni modica della densità
materiale andrebbe ad agire in due direzioni opposte sul sistema, il che
complica nettamente la comprensione di quali siano le reali conseguenze.
Inoltre si avrà, anche in questo caso, lintroduzione di una non linearità del
problema. Anche in questo caso dunque si ha una maggiore complessità
della risoluzione, nonostante il suo signicato sico sia, teoricamente, pi` u
realistico.
Se andassi a risolvere il problema analiticamente, otterrei
(x) = C sin

a
x con k =

f
a
+D(
a
)
2
Volendo invece procedere dal punto di vista numerico, andrò ad introdurre
una discretizzazione spaziale, identicando cos` un certo numero di nodi ove
andrò a calcolare il usso neutronico Avrò dunque che esisteranno degli x
i
tali che (x
i
) =
i
. In questo modo le derivate diventeranno del tipo:
(
d
2
dx
2
)
x
i
=
(
d
dx
)
x
i+
1
2
(
d
dx
)
x
i
1
2
h
Si parla in questo caso di differenze finite centrate. Ho però in ques-
ta forma la presenza di denizioni del usso al di fuori dei nodi preimpo-
stati. Tale apparente incongruenza viene eliminata tramite la denizione
delle derivate prime:
(
d
dx
)
x
i+
1
2
=

i+1

i
h
e (
d
dx
)
x
i
1
2
=

i

i1
h
da cui in denitiva la derivata seconda rispetto ad x calcolata in x
i
vale:
(
d
2
dx
2
)
x
i
=

i+1
2
i
+
i1
h
2
Considerando D come omogeneo, possiamo denire dunque un sistema di
equazioni dato da:
_
_
_
D
i+1
2
i
+
i1
h
2

a
i
+

f
k

i
= 0
0
=
n+1
= 0
Tuttavia stiamo qui come detto imponendo una condizione poco realistica
di usso nullo al contorno. In questo punto verrà in realtà eettuato un
upgrade del problema diusivo tramite sontenuto sico proveniente dalla
teoria del trasporto. In pratica andrò a denire un contorno estrap-
olato, diverso dal contorno sico, sul quale il usso è nullo, basato sulla
63
estrapolazione lineare dei risultati ottenuti dalla teoria del trasporto. Le
ipotesi sulle quali la teoria della diusione è basata, infatti, non sono ver-
icate alla frontiera del dominio, ove è dunque necessario ricorrere ad altri
strumenti. Una volta determinata la frontiera estrapolata, lequazione della
diusione verrà risolta non sul dominio sico ma sul dominio estrapolato,
ove potremo nalmente in modo realistico imporre lannullamento del usso
neutronico.
Avremo che, al contorno, le condizioni diverranno del tipo:
_

0
(r
0
) +
0
(
d
dr
)
r
0
= 0
N
(r
N
) +
N
(
d
dr
)
r
N
= 0
Ove e dipendono dalla geometria scelta.
Scegliendo
0
= 1 e
0
= d otteniamo:
(r
0
) d(
d
dr
)
r
0
= 0
dove chiameremo d distanza estrapolata, ed in essa risiederà il costo
aggiuntivo del mio upgrading.
16
Ho dunque ottenuto una equazione agli autovalori, ovvero un problema
del tipo D()
= 0
La diusione rappresenta un problema sico di tipo locale: ciò che accade
nel nodo i è direttamente collegato a ciò che accade nei nodi (i+1) ed (i-
1). Questa considerazione, apparentemente banale, provoca in realtà delle
conseguenze importanti sul tipo di problema numerico che dovremo andare
a risolvere. Problemi di trasporto sono infatti invece non di tipo locale:
tutti i punti sono direttamente collegati agli altri punti. In sica diusiva
andremo dunque a risolvere equazioni con formulazioni:
a tre punti (1D) matrici tridiagonali
a cinque punti (2D) matrici pentadiagonali
a sette punti (3D) matrici eptadiagonali
17
Vediamo dunque che avremo, nel caso diusivo, matrici sparse, che ci
porteranno ad approcci di tipo iterativo per la loro risoluzione. Questa è,
in generale, una buona notizia, soprattutto ove la matrice sia sparsa ma
ordinata, come nel nostro caso.
16
Purtroppo nemmeno la teoria del trasporto è esatta, e di conseguenza anche il valore
di d calcolato in questo modo costituirà unapprossimazione, e il suo valore cambia a
seconda di come ho applicato tale teoria e di come ne ho risolto le equazioni
17
Lottenimento di matrici multidiagonali dipende dalla numerazione scelta. Nel caso
monodimensionale la numerazione è ovvia, mentre nei casi bi e tridimensionale non è cos`,
e sar` a opportuno scegliere una numerazione adeguata per ottenere eettivamente matrici
multidiagonali
64
Dalle equazioni notiamo inoltre che il termine di assorbimento e quello
di ssione sono posizionati solo sulla diagonale, mentre il termine legato alla
diusività D è posizionato sia sulla diagonale che fuori. Si vede in eetti
che per questo tipo di matrici la condizione di dominanza diagonale è
automaticamente assicurata. Andando infatti a trascurare il termine di
ssione otteniamo che la condizione di diagonale dominante è soddisfatta
se:
[ 2
D
h
2

a
[ > [
D
h
2
[ +[
D
h
2
[
Si vede chiaramente che questo è sempre vero, il che ci garantisce, come
conseguenza, la convergenza dei metodi iterativi utilizzati.
Questo vale per problemi:
Monoenergetici
Monodimensionali
Omogenei
ove per omogenei si intende il fatto che le proprietà del sistema non variano
nello spazio.
Nella realtà sarebbe dunque possibile, in alcuni punti, avere
a
= 0 e
dunque ottenere una matrice a semi-diagonale dominante.
3.3.2 Problemi con sorgente
Facciamo ora un excursus sui problemi non omogenei, ovvero in presenza
di un termine forzante. Questo ci servirà, in seguito, a trattare i problemi
multigruppo, in quanto vedremo che per ogni gruppo energetico i neutroni
rallentati nei gruppi precedenti risulteranno, matematicamente, come una
sorgente esterna.
Avremo dunque di fronte un problema del tipo (considerando problema
monodimensionale, monoenergetico e con dominio omogeneo, senza ssione
ma con sorgente):
D
2
+
a
= S
Che diventa, in seguito alla discretizzazione:
_
_
_
D
i+1
2
i
+
i1
h
2
+
a
i
= S
i
0
=
n+1
= 0
Dando luogo come detto ad una matrice tridiagonale.
In casi come questi, ovvero di fronte ad un problema non omogeneo
e con matrice tridiagonale utilizzeremo un metodo diretto: il metodo
della doppia passata. Tale soluzione verrà tuttavia applicata soltanto in
logica monodimensionale. Quando passeremo a 2 o a 3 dimensioni, dovendo
65
operare con matrici pi` u ricche di elementi non nulli, si ricorrerà in genere
ad algoritmi di tipo iterativo.
Si rivela utile in questa fase evidenziare come deve essere eettuato lin-
serimento delle condizioni al contorno. Si vede infatti che le equazioni dis-
cretizzate si risolvono in formule a tre punti, ma nei due nodi agli estremi
del dominio si avranno a disposizione solo due valori: il usso nel punto
stesso e quello nel punto pi` u interno del dominio.
Si andrà dunque in questo caso ad imporre la condizione di annullamento
sul contorno estrapolato.
Per farlo conviene integrare lequazione della diusione sul volume cen-
trato sullultimo nodo ai conni del dominio (si supponga in questo caso r
0
).
_
V
0
nD
d
2
dx
2
dx
_
V
0
a
dx +
_
V
0
Sdx = 0
Da cui si ottiene che il primo integrale diventa:
_
V
0
nD
d
2
dx
2
dx = D
+
0
A
+
0
_
d
dr
_
r
1
2
D
+
0
A
+
0
_
d
dr
_
r
0
= D
+
0
A
+
0
1

0
h
0
+D
+
0
A
0
0
Ove si è utilizzata la condizione al contorno che recita:
0
(r
0
) +
0
(
d
dr
)
r
0
= 0
Ne viene che lequazione discretizzata nellultimo nodo risulta nella forma:
[D
+
0
A
0
0
V
0
D
+
0
A
+
0
h
0
V
0
+
+
a,0
]
0
+D
+
0
A
+
0
1
h
0
V
0
+S
0
3.3.3 Non omogeneità dello spazio
Il generico reattore non sarà composto interamente dallo stesso materiale.
Avremo dunque che i valori di
a
,
f
e D varieranno da punto a punto,
ed anche in maniera marcata: basti pensare alle dierenze che tali valori
presenteranno tra il materiale nucleare e, ad esempio, il moderatore.
Faremo in generale la supposizione che tali parametri varieranno come
delle funzioni a gradino, in modo tale che esse risultino costanti allinterno
di ogni macro-intervallo.
Come fare per introdurre tale complicazione?
Esistono fondamentalmente due strategie dierenti
Una possibilità è scegliere di posizionare alcuni nodi di usso in
corrispondenza delle discontinuità materiali. Esisteranno ovviamente
molti altri nodi di discretizzazione, ma la caratteristica di questo metodo
66
è appunto quella di imporre che alcuni di questi nodi siano posizionati ove
abbiamo il cambiamento dei valori delle costanti nucleari.
Prendiamo un nodo r
i
centrato su di una discontinuità, e chiamiamo V
i
il volume di materiale attorno a r
i
e racchiuso dalle superci A
+
i
ed A
i
posizionate rispettivamente sulle ascisse r
i+
1
2
=
r
i
+r
i+1
2
e r
i
1
2
=
r
i
+r
i1
2
.
Prendo ora lequazione della diusione e la integro sul tale volumetto V
i
,
ottenendo un bilancio integrale diffusivo.
_
V
i
(D
)dV +
_
V
i
a
dV =
_
V
i
SdV
Il primo integrale diventa, sfruttando il teorema della divergenza
_
V
i
(D
)dV =
_
A
+
i
D
d
du
dA+
_
A
i
D
d
du
dA =
= D
+
i
A
+
i
(
d
dr
)
r
i+
1
2
+D
i
A
i
(
d
dr
)
r
i
1
2
Se a questo punto introduciamo la linearità del usso tra due nodi adia-
centi, il che sta alla base dellapproccio diusivo tramite dierenze nite
ni, possiamo ottenere delle equazioni che possono essere espresse in forma
matriciale come abbiamo fatto sino ad ora, con la sola dierenza che non ci
sarà un unico valore per le costanti materiali in tutta la matrice, ma valori
dierenti.
La prima e lultima equazione avranno, come ovvio, soltanto due elementi
invece che tre. Questo è legato alla scelta di condizioni di annullamento del
usso al contorno: lo stesso accade in 2D, ove avremo in generale 5 elementi,
tranne per i nodi di bordo ove saranno 4 e i nodi di spigolo ove inne avremo
3 elementi non nulli.
Per la risoluzione del problema è a questo punto necessaria la scelta della
formula di quadratura da utilizzare. Esse si dividono in due macro categorie:
Chiuse , ove gli estremi del dominio sono utilizzati come nodi
Aperte , ove è invece vero il contrario
Dunque nel nostro caso non è infatti scontata la scelta: se nellapproccio
puramente diusivo era stato imposto lannullamento del usso neutronico
al contorno, a seguito dellupgrading tramite teoria del trasporto questo non
è pi` u vero, e di conseguenza si potrà scegliere anche di applicare formule di
quadratura aperte.
Lecacia di una discretizzazione di questo tipo dipenderà evidentemente
da
regolarità della funzione
numero di intervalli
67
Da qui la scelta del libero cammino medio neutronico come ordine di grandez-
za della discretizzazione
18
: per poter supporre usso lineare tra un nodo e
laltro è necessario che la maglia sia molto ne.
Nel secondo caso le discontinuità non sono posizionate sui nodi di usso,
ma nei nodi ttizi del tipo r
i+
1
2
e r
i
1
2
, in modo che il volume di
materiale V
i
centrato in r
i
si ritrovi ad avere costanti materiali uniformi al
suo interno. La discontinuità dunque in questo caso non è concentrata in
mezzo al volume, ma ai suoi bordi, ove avremo dunque discontinuità della
derivata. Infatti:
D
i
A
+
i
(
d
dr
)
r
i+
1
2
D
i
A
i
(
d
dr
)
r
+
i
1
2
a
_
V
i
dV +
_
V
i
SdV = 0
Si vede come in questo caso compaia soltanto un valore delle costanti nucleari
D e
a
, in quanto esse sono costanti allinterno del volumetto, ma come al
contempo sia necessario il lato in cui viene calcolata la derivata, che è infatti
discontinua sulle due superci di conne.
In questo modo compaiono però delle derivate in nodi che non esistono:
esse andranno calcolate come
(
d
dr
)
r
i+
1
2
r
i+
1
2
i
h
i
2
e (
d
dr
)
r
+
i
1
2
i

r
i
1
2
h
i
2
Questa denizione è già migliore della precedente, ma continuo ad avere il
calcolo di delle grandezze (questa volta il usso neutronico) in nodi ttizi.
Per riportarmi ad una formula a tre punti canonica utilizzerò limposizione
della saldatura della corrente neutronica.
J = D
D
i
(
i+
1
2
)
+
= D
i+1
(
i+
1
2
)
e, di conseguenza,
essendo D
i
,= D
i+1

+
i+
1
2
,=

i+
1
2
In eetti un qualsiasi problema matematico deve, per essere risolto, avere
un numero di condizioni al contorno imposte pari al numero di gradi di
libertà
19
. Avendo imposto, per ogni intervallo, la linearità del usso, dovrò
imporre al suo contorno due condizioni, che mi serviranno a determinare le
costanti A e B date da:
= Ar +B
18
Si noti che a questo punto sar` a necessario il calcolo di , che dipender` a dalla sezione
durto di assorbimento e, di conseguenza, anche dallenergia dei neutroni
19
Da qui naturalmente segue che, andando ad aumentare la precisione della modelliz-
zazione e dunque il grado del polinomio interpolante, dovr` o andare ad imporre una nuova
condizione al contorno per ogni volume elementare
68
La prima condizione è già stata imposta tramite lequazione di bilancio
del usso neutronico, la prima che abbiamo scritto. Ora imporremo la sal-
datura sulle interfacce del volume. Quello che potrebbe in prima battuta
apparire come un ipervincolare il problema (una condizione di continuità del
usso neutronico e due di saldatura della corrente, una per ogni supercie di
conne), si rivela ben presto essere in realtà solo unapparenza. Ogni con-
dizione vale infatti per due volumi, e di conseguenza il numero nale delle
condizioni che andremo ad applicare è esattamente quello richiesto. Se ne
ottiene il seguente sistema:
_
_
D
i
r
i+
1
2
i
h
i
2
= D
i+1
i+1
r
i+
1
2
h
i+1
2
D
i1
r
i
1
2
i1
h
i1
2
= D
i
r
i
1
2
h
i
2
Tramite sostituzione è poi possibile esplicitare il valore del usso nei nodi
intermedi in funzione di quello nei nodi reali. Si tratta in eetti di un sistema
a due equazioni in due incognite.
3.3.4 Diusione bidimensionale monogruppo
Vediamo ora cosa accade andando a muoverci in un dominio a due di-
mensioni. Manterremo la maggiore complessità legata alla non uniformità
delle costanti nucleari sul dominio, in particolare riferendoci alla prima
strategia scelta per tale modellizzazione, ovvero imponendo dei nodi di
discretizzazione in corrispondenza delle discontinuità delle costanti nucleari.
Lequazione in forma analitica sarà del tipo (con sorgente ma senza
termine di ssione):
D(
x
2
+

2
2
y
) +
a
= S
Da cui si ottiene, a seguito della discretizzazione del dominio spaziale:
D[
i+1,j
2
i,j
+
i1,j
h
2
x
+

i,j+1
2
i,j
+
i,j1
h
2
y
] +
a
i,j
= S
i,j
Avrò dunque, per un generico punto posizionato allinterno del dominio,
cinque nodi di interesse: il nodo stesso pi` u i quattro ad esso adiacenti nelle
due direzioni geometriche.
Il punto ora è trovare il modo per passare dalla matrice
i,j
al vettore
l
, scegliendo una numerazione opportuna tale per cui la matrice nale
dei coecienti risulti il pi` u semplice possibile. Cerchiamo inoltre di inserire
anche in questo contesto i discorsi eettuati a proposito della non uniformità
delle costanti nucleari.
69
Anche in questo caso andrò a denire dei nodi intermedi, attorno ad
r
i,j
= x
i
, y
j
. Tali nodi saranno gli spigoli del quadrato rappresentante il
volumetto elementare costruito attorno ad r
i,j
.
Supponiamo che tale nodo sia sede di una discontinuità delle costanti
nucleari, tale per cui il volume elementare costruito attorno ad esso abbia
il massimo possibile di zone dierenti, vale a dire quattro, che chiameremo
I, II, III, IV secondo la stessa logica con cui sono numerati i quadrati in un
diagramma cartesiano.
II I
r
i
III IV
Integriamo ora lequazione della diusione sul volume elementare V
i,j
.
Prendiamo ad esempio la derivata seconda lungo x:
_
V
i,j
x
D
x
dxdy =
_
y
j+
1
2
y
j
1
2
dy
_
x
i+
1
2
x
i
1
2
dx(

x
D
x
) =
=
_
y
j+
1
2
y
j
1
2
dy(D
x
)
x
i+
1
2
x
i
1
2
_
y
j+
1
2
y
j
1
2
dy[D
i+
1
2
,j
i+1,j

i,j
h
x
i
D
i
1
2
,j
i,j

i1,j
h
x
i1
=
= [
1
2
h
y
j1
D
i,j1
+
1
2
h
y
j
D
i,j
]
i+1,j

i,j
h
x
i
+
[
1
2
h
y
j1
D
i1,j1
+
1
2
h
y
j
D
i1,j
]
i,j

i1,j
h
x
i1
Ove è stata introdotta la non uniformità del coeciente D dividendo il
dominio di integrazione nei quattro settori del volume elementare V
i,j
in
modo tale che in ogni sotto-dominio il valore di D risulti uniforme
20
. Il
risultato è assolutamente analogo per quanto riguarda la derivata seconda
lungo y.
Il termine contenente la sezione durto di assorbimento sarà invece molto
pi` u agevole nel calcolo, e darà una serie di quattro contributi, dierenti
per ogni sotto-dominio del volume elementare. Il primo di tali contributi
(mostrato a titolo di esempio, essendo gli altri perfettamente anologhi) è
20
Si chiariscono di seguito i signicati degli indici e delle zone:
Zona Indicedizona spigoloesterno

I (i, j) (x
i+
1
2
, y
j+
1
2
II (i 1, j) (x
i
1
2
, y
j+
1
2
III (i 1, j 1) (x
i
1
2
, y
j
1
2
IV (i, j 1) (x
i+
1
2
, y
j
1
2
70
dato da:
1
4
h, x
i
h, y
j
ai,j
i,j
Se il volume preso in considerazione è un volume di bordo, dovrò imporvi
le condizioni al contorno, come sempre a scelta tra:
Annullamento sul contorno
Annullamento sul contorno estrapolato
Prendiamo un caso test: supponiamo in questa occasione di usare un
algoritmo di risoluzione chiuso, andando però ad utilizzare la condizione
al contorno di annullamento sul contorno estrapolato, ed utilizzando una
griglia semplicata dotata di solo 9 nodi disposti in un quadrato 3x3.
Dalla scrittura delle equazioni e dalla scelta di un metodo di numerazione
naturale (
11
=
1
,
12
=
2
,
21
=
4
), otteniamo un sistema del tipo
seguente (ove alle X corrispondono gli elementi di matrice diversi da 0)
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
X X 0 X 0 0 0 0 0
X X X 0 X 0 0 0 0
0 X X 0 0 X 0 0 0
X 0 0 X X 0 X 0 0
0 X 0 X X X 0 X 0
0 0 X 0 X X 0 0 X
0 0 0 X 0 0 X X 0
0 0 0 0 X 0 X X 0
0 0 0 0 0 X 0 X X
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
9
_
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
S
1
S
2
S
3
S
4
S
5
S
6
S
7
S
8
S
9
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Ne risulta in questo modo una matrice pentadiagonale, ordinata e
simmetrica a blocchi, ove ogni blocco 3x3 è a sua volta simmetrico e tridi-
agonale. Si tratta inoltre di una matrice centrosimmetrica. Linsieme di
queste caratteristiche la rendono, in generale, di agevole risoluzione.
21
An-
diamo ora a risolvere il problema. Supporremo per A alcune caratteristiche
particolari:
Elementi della diagonale non nulli: a
ii
> 0 i
Matrice simmetrica
21
A tale scopo si veda il paragrafo 2.1 a pagina 16 per una trattazione approfondita dei
seguenti algoritmi:
Jacobi
Gauss
SOR
71
Elementi fuori dalla diagonale negativi: a
i,j
< 0 i ,= j
Matrice a diagonale dominante: [a
ii
[ >
j
[a
i,j
[ i
Opereremo tramite metodi iterativi: ne consegue che, tra i dati in ingres-
so, dovrò avere anche un usso di tentativo
(0)
. Dovrò inoltre imporre uno
o pi` u criteri di convergenza per decidere quando interrompere il processo
iterativo
3.3.5 Diusione multigruppo
Vediamo ora di passare alla fase successiva. Partendo dal caso pi` u standard,
con discretizzazione spaziale monodimensionale ed a costanti nucleari uni-
formi su tutto il dominio, siamo passati al considerare una discretizzazione
a due dimensioni e alla introduzione di costanti nucleari variabili allinterno
del dominio.
Introduciamo ora un ulteriore elemento di complicazione. Sappiamo
bene infatti che nei reattori termici i neutroni, emessi con una energia media
di circa 2 MeV, subiscono una serie di urti che li portano ad arrivare alle
energie termiche (pari a circa 0.025 eV), alle quali essi raggiungono una sor-
ta di equilibrio no a quando non terminano la loro vita a seguito di fughe,
eventi di ssione o assorbimenti.
Finora non ci siamo preoccupati di denire lenergia dei neutroni: essa
non è infatti mai comparsa esplicitamente nelle equazioni scritte, e non è
mai stato necessario no ad ora tirarla in ballo. Questa situazione è però
solo apparente. Ogni volta che scriviamo lequazione della diusione, infatti,
introduciamo delle grandezze, dette sezioni durto, il cui valore non varia
soltanto a seconda del materiale considerato, ma anche a seconda dellenergia
del neutrone incidente.
Di fronte dunque ad un intervallo energetico che va dai meV ai MeV,
come dobbiamo comportarci?
La soluzione risiede in una discretizzazione energetica. Essa cor-
risponde a dividere lo spettro energetico in un numero nito di gruppi, a
ciascuno dei quali verrà assegnato un valore medio dellenergia. Da quel
momento in poi, tutti i neutroni la cui energia è compresa allinterno del-
lintervallo relativo ad un determinato gruppo saranno considerati come se
avessero energia esattamente pari a quella media del gruppo stesso.
Il passaggio di discretizzazione energetica non è semplice, ed il numero
di gruppi dipenderà dal tipo di reattore.
22
22
Preso un generico problema, la cui soluzione sar` a (r, E), esso verr` a discretizzato
nel dominio spaziale lungo x,y e z tramite rispettivamente N,M ed L nodi e nello spettro
energetico in un numero G di gruppi. Lordine del problema da risolvere sar` a cos` diventato
NxMxLxG. Questo evidenzia la necessit` a di ridurre al minimo il numero di gruppi che
utilizziamo per la discretizzazione dello spettro energetico, nel rispetto della precisione
richiesta sui risultati ottenuti. Tale valore è in genere assegnato pari a 3 - 4 per i reattori
termici, 7 - 10 per i reattori a gas e circa 20 per i reattori veloci
72
Indicheremo in generale con 1 il gruppo avente energia pi` u elevata e con G
quello ad energia pi` u bassa
23
. Il gruppo G sarà dunque il gruppo termico,
ovvero nella condizione in cui i neutroni sono in equilibrio termodinamico
con il mezzo in cui diondono. Questo implica che, in linea teorica, essi
potrebbero trovarsi ad incrementare la propria energia in seguito ad un
urto. In tutte le considerazioni che seguono in realtà ignoreremo questa
possibilità (che ci provocherebbe, come vedremo in seguito, limpossibilità
di risolvere le equazioni relative ai vari gruppi in cascata), e considereremo
soltanto fenomeni di down-scattering, ovvero di urti di scattering che
portano ad una diminuzione dellenergia del neutrone.
24
Supponiamo ora di porci nella condizione di G = 3: avrò dunque tre
gruppi, rappresentativi di tre zone energetiche:
Zona di energia da ssione
Zona di rallentamento
Zona di termalizzazione
25
Dunque la sorgente dei neutroni è contenuta nel gruppo 1, e per arrivare
alla zona di ssione dovranno rallentare no alle energie termiche evitando
le fughe e gli assorbimenti
Denisco spettro di fissione (E) la distribuzione che mi dice con
quale probabilità i neutroni verranno emessi da ssione con determinate en-
ergie. Di questi neutroni (E) indica il numero di quelli emessi istantanea-
mente, detti neutroni pronti. Entrambi questi valori saranno inuenzati
non soltanto dallenergia, ma anche (soprattutto per il numero di neutroni)
dal tipo di nucleo ssile che li ha generati.
Prendiamo un generico gruppo intermedio. Esso si vedrà arrivare dalle
energie superiori i neutroni che hanno subito rallentamento a seguito di urti
di scattering.
26
Il bilancio neutronico relativo a tale gruppo dovrà tenere in
conto di:
23
Questa convenzione deriva dalla logica di seguire i neutroni dalla loro emissione no
al loro assorbimento: essi sono infatti emessi alle alte energie per poi essere assorbiti, nella
pi` u parte dei casi, ad energie inferiori
24
Tale approssimazione è ben supportata in tutte le zone energetiche tranne in quella
termica. Qui i neutroni hanno mediamente la stessa energia della matrice materiale in cui
si muovono, e i gli urti di up-scattering sono dunque tendenzialmente pi` u frequenti che
nelle altre zone
25
La zona di termalizzazione è quella dove le sezioni durto di ssione sono maggiori:
stiamo infatti parlando di un reattore termico, progettato in modo che i neutroni vengano
rallentati dal moderatore al ne di raggiungere lenergia termica ove la sezione durto
di ssione dellU
235
è maggiore. Esiste anche la possibilt` a di avere ssioni ad energie
superiori, ma lincidenza percentuale di tali eventi è di molto inferiore
26
Si noti qui che non tutti gli urti di scattering provocano luscita del neutrone dal
gruppo energetico. Nel caso di invarianza del gruppo energetico a seguito dellurto si
parla di fenomeni di in-scattering. Pi` u la discretizzazione energetica è ne, migliore
sar` a lapprossimazione di urti a salto energetico basso
73
Perdite per leakage : Termine di pozzo. Dovrò tenere in conto di un
coeciente di diusione D
g
diverso per ogni gruppo poichè in generale
la capacità di diusione dei neutroni in un mezzo dipenderà dalla loro
energia
Perdite per assorbimento :Termine di pozzo legato alla sezione durto
di assorbimento e che include sia la cattura che la ssione
Comparsa di neutroni : Termine di sorgente legato sia alle reazioni di
ssione che hanno origine nel gruppo g (si faccia riferimento alla fun-
zione di distribuzione (E)) sia a tutti i neutroni proveniente da gruppi
con indice di gruppo inferiore
Perdite per rallentamento : Termine di pozzo che porta i neutroni dal
gruppo g ai gruppi di indice superiore
Messo in equazioni questo diverrà:
_
_
1
v
g
g
t
=
leakage
..
(
D
g
g
)
assorbimento
..
a,g
g
+
+
comparsa
..
G
=1
s,g
g
+
G
=1
g
(
f
)
g

g
+
rallentamento
..
s,g
g
+S
g
g = 1 G
Ove abbiamo in questo caso introdotto la notazione del tipo (r, E
g
, t) =
g
(r, t). Si noti come per ora il termine di comparsa neutronica tenga
in conto, quantomeno in linea di principio, dellup-scattering, in quanto la
sommatoria è estesa su tutti i gruppi energetici.
Considerando il problema stazionario e privo di sorgenti esterne si ottiene
_
_
0 = (
D
g
g
)
a,g
g

s,g
g
+
G
g
=1

s,g
g
+
+
g
G
g
=1
(
f
)
g

g
g = 1 G
sistema simil-diusivo ove tutte le equazioni sono accoppiate tra loro.
27
Evidentemente tale sistema ha come soluzione la soluzione banale = 0.
Dovrò dunque risolvere un problema agli autovalori, ed esisterà una soluzione
27
Ovviamente il sistema sar` a chiuso solo a seguito dellimposizione delle condizioni al
contorno. Si evidenzia tuttavia qui il fatto che, ove esse siano imposte sul contorno es-
trapolato, si ha una ulteriore dipendenza dal gruppo energetico in quanto la distanza di
estrapolazione è funzione della sezione durto di assorbimento la quale è a sua volta, come
detto, funzione dellenergia
74
geometrica e materiale che mi assicurerà la criticità e dunque la presenza di
una soluzione diversa dal vettore nullo.
Andremo dunque a risolvere il problema:
A = kB
Che diventerà un problema del tipo
D(k) = 0
lineare, ove dunque la dipendenza della matrice D dal parametro k è lineare.
Andiamo ora a vedere come ottenere i valori da assegnare alle varie
costanti che dovremo utilizzare per ogni gruppo energetico. avremo che:
g
=
_
E
g1
E
g
(E)dE
s,g
g
=
1
_
E
g1
E
g
dE
_
E
g
1
E
g
dE
s,E
E
(r, E
)
(
f
)
g
=
1
g
_
E
g1
E
g
(E)
f
(E)(r, E)dE
g
=
_
E
g1
E
g
(r, E)dE
D
g
=
_
E
g1
E
g
D(E)
(r, E)dE
_
E
g1
E
g
(r, E)dE
t,g
=
1
g
_
E
g1
E
g
t
(E)(r, E)dE
Denisco inoltre sezione durto di rimozione la quantità:
r,g
=
t,g

s,gg
Che di fatto corrisponde alla sezione durto totale meno quella relativa allin-
scattering. Questo termine riunisce dentro di sè tutti i termini di pozzo
allinterno del gruppo g, fatta eccezione per le fughe.
Da queste denizioni risultano una serie di problemi:
Le medie che devo calcolare dipendono dalle soluzioni del problema
stesso
Allinterno del calcolo delle medie mantengo una dipendenza dalla po-
sizione non discretizzata, che rischio mi vada a complicare ulterior-
mente le cose
La soluzione a questi problemi deriva del seguente teorema:
75
Teorema 11 (di separabilità spazio-energetica)
(r, E) = (r), (E)
Questo è vero solo nelle parti pi` u interne del reattore. Nelle zone di bor-
do, tale approssimazione non è accettabile. Tramite lapplicazione di questo
teorema posso cos` eliminare la dipendenza spaziale dalle medie. Infatti:
( )
g
=
1
g
_
( )(r, E) =
1
_
E
( )dE =
=
1
_
E
( )dE
Liberatomi dunque del problema della dipendenza spaziale, non pos-
so dire lo stesso riguardo la funzione , tuttora incognita. Per trovarla
eettuerò, tramite teoria del trasporto, delle simulazioni iterative che mi
porteranno ad ottenere un valore accettabile per
28
.
Denizione processo iterativo esterno
Date le denizioni per le dierenti variabili e costanti che andremo ad uti-
lizzare in funzione del gruppo energetico, si può ripartire da una equazione
di questo tipo:
_
_
(
D
g
(r)
g
(r))
r,g
(r)
g
(r) +
<g

s,g
g
(r)
g
(r) +
g
(r) = 0
g
(
R) +d
g
(
d
g
dr
)
R
= 0
g = 1 G
Ove è stato denito il termine (r) =
G
g
=1
(
f
)
g
(r)
g
(r) densit` a di
emissione da fissione.
Si noti come il usso neutronico (supponendo di dare una numerazione
unica alla discretizzazione spaziale di modo che
i,j,k
diventi semplicemente
l
) sia rappresentato da un vettore a due dimensioni: infatti per ogni
g
corrispondente al usso nel g-esimo gruppo avremo N M L componen-
ti rappresentanti i vari nodi spaziali. Dunque ognuna delle equazioni del
sistema scritto sopra sarà di fatto a sua volta una equazione vettoriale.
Per quanto riguarda le iterazioni esterne, esse rappresentano la risoluzione
del problema dal punto di vista della discretizzazione energetica. Si tratta di
un problema agli autovalori, risolto di fatto tramite il metodo delle potenze.
Andiamo a scrivere le equazioni, viste no ad ora solo per componenti,
in forma matriciale.
Introduciamo i seguenti operatori:
28
si utilizzano in questo caso criteri di convergenza in norma, in quanto non interessa il
comportamento puntuale ma quello medio
76
loperatore A denisce le perdite per fughe e rimozioni
A =
_
_
_
_
_
_
_
_
_
(D
1
r,1
(r))
.
.
.

0
.
.
.
0
.
.
.
(D
G
r,G
(r))
_
_
_
_
_
_
_
_
_
loperatore R rappresenta il rallentamento. Sarà di fatto una matrice
triangolare inferiore a diagonale nulla in quanto abbiamo escluso i
fenomeni di in-scattering ed up-scattering
R =
_
_
_
_
_
_
_
_
_
_
0
s,12
(r)
.
.
.

0
s,13
(r)
s,23
(r)
.
.
.
.
.
.
.
.
.
.
.
. 0
_
_
_
_
_
_
_
_
_
_
Loperatore M è rappresenta la moltiplicazione ed è legato alle sezioni
durto di ssione
M =
_
_
_
_
_
_
_
_
_
1
(
f
)
1
(r)
1
(
f
)
2
(r)
1
(
f
)
g
(r)
2
(
f
)
1
(r)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
G
(
f
)
1
(r)
G
(
f
)
G
(r)
_
_
_
_
_
_
_
_
_
Chiamo inne L loperatore A + R operatore di diffusione in
ambito multigruppo
Il problema è dunque riscrivibile in denitiva in forma matriciale come:
(A+R) +
1
k
M = 0
Dove, ricordando che (A + R) = L e denendo inne H = L
1
posso
giungere alla scrittura nale
(HM) = k
Giungendo dunque nuovamente ad un problema agli autovalori classico.
Ovviamente tale scrittura apparentemente semplice ha un prezzo, contenuto
nel calcolo di L
1
.
77
Si prosegue qui con il ragionamento fatto a proposito del metodo delle
potenze. Potrei investire un numero pur rilevante di operazioni per il calcolo
di H, sapendo però cos` di aver eliminato uno dei due processi iterativi
concatenati ed essendomi cos` risparmiato, in denitiva, un quantitativo
considerevole di operazioni. Il problema dellapplicazione di questo metodo,
già descritto nellambito del metodo delle potenze, è qui ancora pi` u evidente:
applicando un metodo diretto si perderebbe il parallelo sico-numerico, ove
lindice delle iterazioni esterne corrisponde alle generazioni neutroniche.
Come risolvo dunque tale problema? Utilizzando il metodo delle potenze
dovrò, per quanto detto, normalizzare la soluzione allautovalore di modulo
massimo, per evitare che essa diverga. Ma poichè tale autovalore è proprio
il k che stiamo cercando, potrò scrivere (avendo denito C = H M):
(n+1)
=
C
k
(n)
(n)
Il problema si sposterà dunque sullottenimento di una legge di riaggiorna-
mento per k su base sica.
Dimentichiamoci per un po che k corrisponde al k
eff
del mio problema,
e supponiamo ora che esso sia solo il parametro di normalizzazione. Suppor-
remo di denirlo in modo tale che, per evitare che il problema esploda, nel
passare da uniterazione allaltra il totale dei neutroni prodotti da ssione
rimanga costante. In questottica la formula di aggiornamento sarà data da:
,
(n+1)
,

f
|
k
(n+1)
=
,
(n)
,

f
|
k
(n)
da cui:
k
(n+1)
= k
(n)
,
(n+1)
,

f
|
,
(n)
,

f
|
Ove ho denito con ,, | il prodotto scalare sia sulla discretizzazione spaziale
che su quella energetica:
,
(n+1)
,

f
| =
G
g=1
N
i=1
(n+1)
g
( r
i
)(
f
)
g
( r
i
)
Da cui risulta che:
,
(n+1)
,

f
| =<
(n+1)
, 1 >
Da cui:
29
k
(n+1)
= k
(n)
<
(n+1)
, 1 >
<
(n)
, 1 >
29
Si noti che qui non stiamo dando alcun peso dierente alle varie zone del reattore. Una
possibilità ulteriore sarebbe quella, come accennato parlando del metodo delle potenze, di
introdurre una pesatura, ad esempio secondo Galerkin
78
Che si può scrivere anche come:
<

(n+1)
k
(n+1)
, 1 >=<

(n)
k
(n)
, 1 >
Che corrisponde a dire che la sorgente eettiva di emissione normal-
izzata è costante iterazione dopo iterazione. In questo modo k diventa
il rapporto tra i neutroni generati tra due iterazioni - generazioni successiva.
Questo è ancora pi` u visibile se andiamo ad eliminare k
(n)
ottenendo:
k
(n+1)
= k
(n)
,
1
k
(n)
C

(n)
,

f
|
,

(n)
,

f
|
=
,C

(n)
,

f
|
,

(n)
,

f
|
Potremmo anche vederla, per dare una ulteriore dimostrazione, nella maniera
seguente:
k
(n+1)
=
<
(n+1)
, 1 >
<
1
k
(n)
(n)
, 1 >
Che ci dice che, di fatto, il k di una generica iterazione è dato dal rapporto tra
il numero di neutroni da ssione prodotti in quella iterazione (non normaliz-
zati) ed il numero di neutroni provenienti dalliterazione precedente (ovvero
il numero di neutroni prodotti alliterazione precedente, normalizzati).
Sarà ora opportuno dimostrare che il k che stiamo cos` calcolando è
veramente il k
eff
del mio sistema nucleare e non un semplice elemento di
normalizzazione. Dunque:
(2)
=
1
k
(1)
C
(1)
Da cui, alln-esima iterazione:
(n)
=
1
k
(1)
k
(2)
k
(n1)
C
n1
(1)
Che, sostituendo il valore di
(1)
vale
(n)
=
1
k
(1)
k
(2)
k
(n1)
C
n1
[c
1
1
+
h2
c
h
h
]
Da cui otteniamo
(n)
=
k
n1
k
(1)
k
(2)
k
(n1)
[c
1
1
+
h2
(
h
k
)
n1
c
h
h
]
Che, moltiplicando per la matrice C ed applicando nuovamente lo stesso
procedimento, ottengo:
C
(n)
=
k
n
k
(1)
k
(2)
k
(n1)
[c
1
1
+
h2
(
h
k
)
n
c
h
h
]
79
Dunque il rapporto che stiamo cercando e che denisce laggiornamento del
mio ciclo di iterazioni diventa:
k
(n+1)
=
,C

(n)
,

f
|
,

(n)
,

f
|
=
=
k
n
k
n1
c
1
,
1
,
f
| +
h2
,
h
,
f
|(
h
k
)
n
c
1
,
1
,
f
| +
h2
,
h
,
f
|(
h
k
)
n1
Tale valore tenderà inevitabilmente a k per innite iterazioni in quanto i
termini legati alle sommatorie, essendo moltiplicati per la potenza di un
numero inferiore ad 1 in modulo, tenderanno a zero.
Vediamo inne di dimostrare a che valore convergerà
(n)
Ripartiamo dalla seguente scrittura:
(n)
=
k
n1
k
(1)
k
(2)
k
(n1)
[c
1
1
+
h2
(
h
k
)
n1
c
h
h
]
Se moltiplico scalarmente da entrambe le parti per il vettore

f
,
(n)
,
f
| =
k
n1
k
(1)
k
(2)
k
(n1)
[c
1
,
1
,
f
| +
h2
(
h
k
)
n1
c
h
,
h
,
f
|]
Ricorando che ,
(n)
,
f
| =<
(n)
, I > e moltiplicando ambo i membri per
k
k
(n)
si ottiene:
k
k
(n)
<
(n)
, I >=
k
n
k
(1)
k
(2)
k
(n)
[c
1
<
1
, I > +
h2
(
h
k
)
n1
c
h
<
h
, I >]
Ricordando che, date le condizioni di normalizzazione scelte, la densita di
emissione eettiva da ssione normalizzata è costante da una iterazione al-
laltra, e ricordando che il termine di sommatoria tende a zero per tendenza
del numero di iterazioni allinnito, ottengo che:
lim
n
k
k
(n)
<
(n)
, I >=
k
n
k
(1)
k
(2)
k
(n)
c
1
<
1
, I >
da cui
lim
n
k
n
k
(1)
k
(n)
c
1
=
<
(n)
, I >
k
(n)
k
<
1
, I >
=
=
<
(1)
, I >
k
(1)
k
<
1
, I >
Se supponiamo di essere giunti sucientemente vicini alla convergenza,
sappiamo che il nostro
(n)
sarà sucientemente parallelo allautovettore
fondamentale da poter scrivere che:
C
(n)
= k
(n)
80
che, sostutuito nellequazione precedente porta alla forma
lim
n
(n+1)
= lim
n
C
k
(n)
(n)
=
= lim
n
k
k
(n)
(n)
= lim
n
k
n
k
(1)
k
(n)
c
1
1
=
=
<
(1)
, I >
k
(1)
k
<
1
, I >
1
Ma sempre considerando la costanza della densità di emissione eettiva e
ricordando che dopo innite iterazioni i valori n-esimi tendono al valore
esatto, ottengo:
lim
n
(n)
=
1
autovettore fondamentale. Dunque la mia soluzione, tramite la condizione di
normalizzazione imposta, non tende ad un vettore parallelo allautovettore
fondamentale, ma esattamente ad esso.
Denizione del processo iterativo interno
Ci siamo no ad ora preoccupati soltanto delle iterazioni esterne, e ci
siamo imbattuti in un problema di importanza rilevante: la soluzione delle
equazioni per il problema agli autovalori richiede, per il calcolo della matrice
di iterazione per il metodo delle potenze, linversione di una matrice di di-
mensioni raguardevoli. Si è inoltre detto come linversione diretta di tale ma-
trice non porti ad ottenere i risultati sperati, perchè impedisce di mantenere
il parallello sico-matematico tra iterazioni e generazioni neutroniche.
La soluzione è dunque quella di risolvere un problema iterativo inter-
no che dovrebbe teoricamente portare allottenimento della matrice di iter-
azione cercata.
In questo caso tuttavia non si tratta pi` u di un problema agli autovalori.
Il termine legato alla ssione verrà infatti considerato, per ogni equazione,
come un valore noto e non dipendente dal usso neutronico. Il problema
diventerà dunque non omogeneo.
Vediamo nel dettaglio come procede il calcolo. Supponiamo di conoscere
la soluzione di tentativo, dunque tanto
(0)
G
quanto
(0)
G
ed anche il k
(0)
.
Questo mi implica la possibilità di calcolare lequazione per il gruppo 1:
_

D
1
1

r,1
1
+
1
k
(0)
S
(0)
i
= 0
S
(0)
1
=
1
(0)
(r)
Ove si è indicato con S
(0)
i
il termine (r)
(0)
0
Si tratta dunque di un prob-
lema diusivo non omogeneo, risolto il quale avrò un
(1)
1
, valore aggiornato
81
per il usso che verrà anche utilizzato per il calcolo del termine sorgente per
il gruppo successivo.
Vediamo dunque che per ogni gruppo energetico potrò scrivere un sis-
tema del tipo
A = S
Procedo successivamente come per quanto visto per il metodo di Jacobi:
divido A in due matrici delle quali una diagonale, che porto dallaltro lato
invertendola ed innescando cos` un processo iterativo del tipo
(n+1)
= B
(n)
+Q
Ove la matrice B è la matrice di iterazione.
Sorge ora un dubbio importante: quante iterazioni fare per i due cicli?
30
In primo luogo, è inutile aumentare eccessivamente il numero delle
iterazioni interne: andrei a migliorare sempre di pi` u la precisione di un
problema intrinsecamente sbagliato. Si manifesta quindi qui lesigenza
di ridurre al minimo le iterazioni interne
Daltro canto, trattandosi di due problemi concatenati, non ci basta
avere la certezza della convergenza dei due metodi separatamente, ma
ci serve essere sicuri che entrambi convergano simultaneamente. Di
particolare importanza sarà dunque linuenza delle iterazioni interne
sulla convergenza dellalgoritmo esterno
Ci chiediamo dunque se esiste una soglia per il numero delle iterazioni
interne per ogni iterazione esterna che ci garantisca la convergenza dellal-
goritmo esterno. Si può dimostrare che la condzione meravigliosa che carat-
terizza il problema della diusione multigruppo è che tale soglia esiste, ma
è ssata ad una sola iterazione. Vediamo perche.
Il problema che ci preggiamo di risolvere è sempre lo stesso:
L
(n+1)
=
1
k
(n)
M
(n)
Che diventa, di fatto:
L
(n+1)
= Q
(n)
Ricordiamo ancora una volta che, al momento della risoluzione del
problema interno, Q
(n)
è considerato noto pari al termine sorgente.
Gli indici di iterazione che compaiono nelle equazioni precedenti
sono relativi alle iterazioni esterne
30
Esiste una possibilit` a che potrebbe provocare il fallimento di ogni calcolo: quella per
cui lerrore sul termine sorgente sia tale da provocare la non convergenza del problema
interno. Questa situazione, che dipende dal condizionamento del problema, non si veri-
ca nel caso diusivo in quanto il problema numerico legato alla risoluzione multigruppo
dellequazione della diusione è robusto
82
Ai ni della risoluzione iterativa il problema verrà scomposto nella maniera
seguente
31
= J +Y Q
Da questa forma posso ricavare tramite alcuni passaggi una espressione per
Y. Infatti so che:
_
= (I J)
1
Y Q
= L
1
Q
L
1
= (I J)
1
Y Y = L
1
(I J)
Dunque posso riscrivere il sistema, tornando allalgoritmo iterativo, nella
maniera seguente:
[m+1]
= J
[m]
(I J)L
1
Q
Alliterazione successiva otterrò
[m+2]
= J
2
[m]
+ (I +J)Y Q
Da cui
[m+n]
= J
n
[m]
+ (I +J +J
2
+ +J
n1
)Y Q
con
(I +J +J
2
+ +J
n1
) =
i=0
J
i
i=n
J
i
Ma essendo J una matrice avente proprietà particolari, ed in particolare
raggio spettrale inferiore ad uno (altrimenti la convergenza non è garantita),
posso supporre che la serie scritta nellequazione precedente converga a
i=0
J
i
= (I J)
1
e
i=n
J
i
= (I J)
1
J
n
Da cui
[m+n]
= J
n
[m]
+ (I J)
1
(I J
n
)Y Q
Che, sostituendo lespressione per Y, vale:
[m+n]
= J
n
[m]
(I J
n
)L
1
Q
Quindi si vede che in realtà non faccio n iterazioni: faccio una unica iter-
azione che conta come n, a patto di saper calcolare la potenza n-esima della
matrice J. Questo modo di operare è detto a blocchi di iterazioni.
Riprendiamo il nostro algoritmo esterno, ove vale la corrispondenza:
Q =
1
k
(n)
M
(n)
31
non si è qui specicato alcun particolare algoritmo risolutivo: la matrice J potrebbe
essere quella caratteristica di uno qualunque tra i metodi visti sino ad ora
83
Supponiamo dunque di fermarci dopo m iterazioni interne, e di procedere
esternamente. Dunque
(n+1)
= [J
m
(1 J
m
)L
1
M
k
(n)
]
(n)
Per m , poichè abbiamo imposto che la matrice J converge, avremo che
(n+1)
= L
1
M
k
(n)
(n)
C = L
1
M
Nel caso invece di m iterazioni avrò che loperatore matriciale approssima-
to sarà dato da:
32
C
m
= [J
m
(1 J
m
)L
1
M
k
(n)
]
Si noti dunque come laver svolto m iterazioni interne corrisponde, nella
pratica delle cose, ad aver svolto un calcolo iterativo della matrice C (il cui
valore è incognito) della quale avremo dunque utilizzato un valore aggiornato
allm-esima iterazione. Tutto il problema ritorna dunque al punto: si era
partiti dallidea di non saper calcolare la matrice C e si è visto che, tramite
uno ciclo iterativo interno, si è riusciti a procedere ad una sua stima, che sarà
logicamente tanto pi` u precisa tanto pi` u alto è il numero delle iterazioni
33
.
Perchè tale espressione non provochi la perdita di sicità del problema,
deve ancora essere valido che applicando tale operatore allautovettore fon-
damentale si ottiene nuovamente lautovettore fondamentale. Questo equiv-
ale a vericare che il problema approssimato allm-esima iterazione sia anco-
ra un problema agli autovalori avente come soluzione gli stessi autovettori del
problema esatto. In eetti, ricordando che per lipotesi di base del problema
= L
1 M
k
, si ottiene
= [J
m
(1 J
m
)L
1
M
k
]
= J
m
L
1
M
k
+J
m
L
1
M
k
= J
m
+ J
m
Dunque anche loperatore matriciale nito ha come soluzione lo stesso au-

tovettore delloperatore ottenuto dopo innite iterazioni. Dunque qualunque
numero non nullo di iterazioni porta allottenimento di un opertore sica-
mente accettabile, anche se ovviamente non correto, il che mi permette, se
necessario, di ridurre ad un minimo di 1 il numero di iterazioni interne.
In denitiva ciò che si opera è la strategia seguente:
32
Si noti come in tutte le considerazioni fatte no ad ora compaia il termine L
1
anche
nelle espressioni approssimate della risoluzione del problema. Questa è ovviamente solo
una scrittura formale, in quanto se fossimo in grado di calcolre il valore di tale matrice
inversa non si andrebbe ad innescare alcun processo iterativo
33
Questo procedimento è lillustrazione nel dettaglio di quanto accennato nel capitolo
sul metodo delle potenze riguardo la risoluzione di equazioni agli autovalori generalizzate
84
Nella zona delle prime iterazioni si fa una sola iterazione interna per
ogni iterazione esterna, in modo da non sprecare tempo di calcolo per
anare inutilmente una soluzione che so già essere sbagliata
Nella zona di congergenza asintotica dellalgoritmo posso aumentare il
numero di iterazioni interne: da un lato perchè è evidente che questo
porti ad una maggiore precisione della soluzione, e dallaltro perchè
saranno in questa fase presenti delle approssimazioni di k tali da poter-
mi permettere di utilizzare metodi di convergenza accelearti per le
iterazioni interne
Il modo di procedere in questi casi prevederà dunque di svolgere una
sola iterazione interna per ogni iterazione esterna nelle fasi iniziali, per non
sprecare tempo per ottenere soluzioni di base sbagliate. Giunto in una fase
pi` u stabile della convergenza andrò invece ad aumentare il numero delle
iterazioni interne per migliorare la precisione della soluzione.
Dunque ripercorriamo le fasi risolutive:
1. Impongo una soluzione di tentativo: k
(0)
,
(0)
2. Utilizzo tale soluzione di tentativo per il calcolo di
(1)
1
, la cui equazione
risulta di fatto disgiunta dalle altre
3. Utilizzo il usso cos` calcolato per il calcolo di
(1)
2
, tenendo in conto
del solo down-scattering
4. Procedendo di questo passo calcolo tutte le componenti del vettore
(1)
5. Aggiorno tutti i valori che mi serviranno per ripartire con le iterazioni
esterne, vale a dire k e
3.3.6 Accelerazione della convergenza delle iterazioni esterne
Se i sistemi sono particolarmente grandi ci troveremo in una soluzione ove il
rapporto di dominanza è molto prossimo ad 1, il che provocherebbe, se non
prendessimo alcun provvedimento, una convergenza troppo lenta.
Oltre che prestare molta attenzione ai criteri di convergenza, che potreb-
bero essere fuorviati da una riduzione precoce dello pseudo-errore relativo,
Vediamo dunque alcuni sistemi per accelerare la convergenza
Metodo di Wielaudt
s
Si tratta di un metodo concettualmente semplice ma di dicile appli-
cazione. Abbiamo visto no ad ora che è opportuno normalizzare la soluzione
ad ogni iterazione, per evitare che, dopo un numero cospicuo di iterazioni,
85
essa tenda a divergere allinnito o a convergere al vettore nullo. Supponi-
amo però di interrompere questa pratica dopo un certo numero di iterazioni,
e comunque in un momento in cui ci troviamo già nella zona asintotica del
metodo iterativo.
Il metodo di Wielaudt parte dalla conoscenza di un valore k* approssi-
mazione per eccesso del valore vero di k. Tale valore può provenire sia da
precedenti iterazioni che da calcoli indipendenti.
Scriviamo dunque un nuovo problema:
k
C = k
k (k
I C) = (k
k)
Sarà dunque un nuovo problema agli autovalori, ove la matrice (k
I C) è
sempre invertibile in quanto abbiamo supposto k* maggiore dellautovalore
di modulo massimo e dunque la matrice risultante sarà sempre a diagonale
dominante.
Il problema agli autovalori potrà anche essere riscritto come:
(k
I C)
1
=
1
k
Ove la matrice (k
I C)
1
ha gli stessi autovettori della matrice C, ed i
suoi autovalori sono dati da
1
k
k
h
Facciamo un esempio. Supponiamo:
k
= 1.01 k = 1.00 k
2
= 0.99
tale per cui il rapporto di dominanza del problema originario vale 0.99. La
stessa quantità, applicando il metodo di Wielaudt, diventa pari a:
1
1.010.99
1
1.011.00
= 0.5
Applicando dunque il metodo delle potenze al problema modicato la ve-
locità di convergenza è enormemente pi` u alta.
Tuttavia cè però un punto, pi` u o meno nascosto, in cui è contenuto il
maggior costo dellalgoritmo. Si tratta in questo caso della matrice (k
I
C)
1
per il cui calcolo è necessario utilizzare ancora una volta il metodo
delle potenze, cosa che non sempre risulta rapido e semplice. Avrò dunque,
in questo caso, tre algoritmi iterativi incantenati luno dentro laltro. Il
punto sta ovviamente nelleettuare le opportune valutazioni per vericare
se lapplicazione di tale metodo sia conveniente o meno.
Metodo di Tchebychev
Il metodo di Tchebychev non si basa sullalterazione della matrice dei co-
ecienti. Supponiamo di essere arrivati ad una N-esima iterazione essendo
dunque in possesso di un valore k*.
86
In base a quanto detto, avremo che:
(N+1)
=
1
k
C
(N)
Da cui, continuando ad applicare il metodo delle potenze interrompendo
però il processo di aggiornamento del termine normalizzante, si ottiene:
(N+n)
= [
1
k
C]
n
(N)
Supponiamo ora di sostituire al posto della potenza n-esima del rapporto
[
1
k
C] un generico polinonmio P
n
di n+1 elementi, ciascuno composto da
un coeciente e da una potenza di [
1
k
C]. Il calcolo dei coecienti sarà

eettuato imponendo come condizione il fatto che P
n
(1) = 1, come deve
essere perchè sia mantenuto il signicato sico.
34
Supponiamo inoltre di poter scrivere, come spesso abbiamo fatto in
precedenza, la soluzione alla N-esima iterazione come composizione lineare
degli autovettori della matrice C.
Sfruttiamo ora una proprietà notevole dei problemi agli autovalori: par-
tendo dal generico problema A = posso scrivere che:
f(A) = f()
A patto che f sia una funzione sucientemente regolare.
35
Nel nostro caso posso allora scrivere che
(N+n)
= c
1
P
n
(
C
k
)
1
+
h
c
h
P
n
(
C
k
)
h

c
1
P
n
(
k
k
)
1
+
h
c
h
P
n
(
k
h
k
)
h
Ma poichè sappiamo che il rapporto
k
k
1 possiamo scrivere:
(N+n)
= c
1
1
+
h
c
h
P
n
(
k
h
k
)
h
Le mie condizioni saranno date da
_
h2
c
h
P
n
(
k
h
k
)
h
= 0
P
n
(1) = 1
Dunque una volta trovati gli n+1 coecienti del polinomio p
n
potrò calco-
larmi la soluzione esatta, dopo sole N iterazioni. Ma questo è teoricamente
impossibile, dove sta linganno?
34
Il passaggio è qui molto logico: stiamo approssimando una potenza, che dunque
qualunque sia lesponente varrà 1 se la base è 1
35
Abbiamo già applicato questa regola pi` u volte, sempre con f(A) = A
m
87
Evidentemente nellutilizzo, come incognite, dei k
h
che ovviamente non
conosciamo. Non posso dunque imporre condizioni tali per cui il contributo
degli autovettori di indice superiore ad 1 sia nullo. Però posso fare in modo
che esso sia il pi` u piccolo possibile. Si tratta dunque di cercare i coecienti
per il polinomio tali da minimizzare il massimo dei valori del polinomio,
ovvero:
min
a
0
, ,a
n+1
(max(0 x )[P
n
(x)[)
Si può dimostrare che la soluzione di questo problema di ricerca di minimo
(problemi minmax) porta ai polinomi di Tchebychev ortogonali:
_
_
_
c
0
(t) = 1
c
1
(t) = t
c
n+1
(t) = 2tc
n
(t) c
n1
(t)
La velocità di convergenza del metodo di Tchebychev è oscillante in funzione
del rapporto di dominanza, ma si vede che, ad esempio, dopo 5 iterazioni
di un metodo avente = 0.95, avremo che il metodo non accelerato vedrà
il termine legato al secondo autovalore di modulo massimo ridotto a
5
=
0.774, mentre il polinomio di Tchebychev corrispondentemente applicato
darà luogo ad un fattore di attenuazione pari a 0.204 .
Uno dei problemi di tale metodo è la presenza di una formula ricorsiva
a tre termini, ove in particolare le sottrazioni tra elementi possono generare
rischi di esplosione dellalgoritmo.
3.4 Metodi Coarse Mesh
Fino ad ora è stato mostrato come risolvere problemi di sica neutronica
tramite la teoria della diusione utilizzando metodi alle dierenze nite ni.
Questo corrispondeva, in buona sostanza, ad approssimare il usso in ogni
maglia nel modo pi` u semplice possibile (lineare), riguadagnando in termini
di precisione diminuendo al minimo le dimensioni delle maglie stesse.
Il principio che sta alla base dei metodi coarse mesh è esattamente lop-
posto. Le maglie sono di dimensioni molto maggiori rispetto al libero cam-
mino medio, è ciò su cui si punta maggiormente è una qualità migliore della
funzione interpolante
Questo genera di per sè un problema. Nel momento in cui le maglie au-
mentano di dimensioni, esse tenderanno inevitabilmente a contenere al loro
interno materiali dierenti tra loro, perdendo cos` lomogeneità del dominio.
Per evitare di risolvere problemi in presenza di costanti nucleari non unifor-
mi viene in generale forzata luniformità del sistema: i volumi elementari del
metodo coarse mesh vengono omogeneizzati,
36
ottenendo cos` costanti nu-
36
Una volta ottenuti i valori delle costanti sui volumi omogenei lapproccio utilizzato
è quello di tipo b, ovvero in cui non prendo i nodi in corrispondenza delle discontinuit` a
materiali ma al centro dei volumi considerati omogenei
88
cleari mediate, per il calcolo delle quali si ricorre ancora una volta alla teoria
del trasporto. Si andrà poi a risolvere il tutto tramite la teoria diusione
multigruppo.
Ipotizzeremo dunque che il usso si comporti in modo pi` u complesso,
come un polinomio di 2
o di terzo grado, invece che linearmente.

37
Da un
lato la riduzione del numero di maglie mi riduce enormemente il numero di
elementi delle matrici che andrò a risolvere. Dallaltro la non-linearità del
usso provoca una non-linearità anche nei problemi ad esso associati, con
conseguente maggiore complicazione della risoluzione e, soprattutto, con
dicoltà molto maggiore di garantire a priori la convergenza del metodo
risolutivo.
Partiamo ancora una volta dal caso monocinetico, in quanto lespansione
al caso multigruppo presenta le stesse caratteristiche e problematiche viste
per le dierenze nite ni. Andremo dunque a scrivere, nel caso 3D, un
numero di equazioni pari al numero di volumi di controllo presi in consid-
erazione, ciascuna delle quali vedrà comparire al suo interno 7 incognite;
si andrà in seguito ad imporre le condizioni di saldatura e le condizioni al
contorno.
Esistono fondamentalmente due approcci distinti per i metodi coarse
mesh, in base allordine dei polinomi scelti come funzioni interpolanti:
Quabox se si sceglie di utilizzare polinomi di 2
grado
Cubox se la scelta ricade invece su polinomi di 3
grado
3.4.1 Metodi Quabox
Per ragioni che saranno pi` u chiare in seguito andrò a scrivere il usso
in funzione delle tre variabili adimensionali , , denite nella maniera
seguente:
=
x x
i
h
x
i
=
y y
i
h
y
j
=
z z
i
h
z
l
Ove r
i
= x
i
, y
i
, z
i
è la coordinata del nodo i-esimo. Di tutte le forme
quadratiche che potrei scrivere tramite tali variabili quella che otterrò sarà
del tipo:
(, , ) =
ijl
[1 +a
x
ijl
+b
x
ijl
2
+a
y
ijl
+b
y
ijl
2
+a
z
ijl
+b
z
ijl
2
]
Dovrò dunque andare ad imporre 7 condizioni per i 7 parametri utilizzati:
Una condizione di soddisfacimento del bilancio integrale sul volume di
controllo
37
Si noti che una prima conseguenza di questo fatto sar` a la necessit` a di andare ad
imporre un numero maggiore di condizioni al contorno
89
Una condizione di saldatura del usso neutronico e della corrente
neutronica per ogni interfaccia
Avrei dunque in totale, per ogni volume di controllo, 1 + (2 6) condizioni.
Ma ricordando che ogni condizione allinterfaccia è imposta due volte, una su
ogni lato della faccia stessa, otteniamo esattamente le 7 condizioni necessarie
per la corretta denizione del problema.
Cominciamo ad esplicitare il calcolo dei coecienti scrivendo il valore
del usso allinterfaccia lungo x. Si avrà che:
_
_
_
i+
1
2
,j,l
=
ijl
[1 +
a
x
ijl
2
+
b
x
ijl
4
i
1
2
,j,l
=
ijl
[1
a
x
ijl
2
+
b
x
ijl
4
]
Sommando e sottraendo membro a membro si ottengono i valori dei due
coecienti a e b lungo x in funzione del usso allinterfaccia.
a
x
ijl
=
i+
1
2
,j,l

i
1
2
,j,l
i,j,l
b
x
ijl
=
i+
1
2
,j,l
2
i,j,l
+
i
1
2
,j,l
i,j,l
Vedremo in seguito che poichè questultimo non è noto e non è presente tra
le incognite, si utilizzano le condizioni di saldatura sulla corrente neutronica
per riscrivere le costanti in funzione del usso ai nodi.
Riprendiamo lequazione della diusione. La prima delle condizioni al
contorno impone il bilancio integrale, del quale ci apprestiamo a calcolare le
varie componenti.
Partiamo dalla componente delle fughe. Avremo che, applicando il
teorema della divergenza:
_
V
ijl
dV =
_
S
ijl
(D
)ndS
= D
ijl
x
_
x
i+
1
2
x
i
1
2
h
y
j
h
z
l
+ [y] + [z]
Ove i termini tra parentesi quadre sono gli omologhi di quanto scrit-
to lungo x nelle direzioni y e z. Potrò a questo punto inserire la
dipendenza dalla variabile , per cui si avrà che:
x
=

x
=
=
1
h
x
i
=
=
ijl
[
a
x
h
x
i
+
2b
x
h
x
i
] =
=
ijl
[
a
x
h
x
i
+
2b
x
(x x
i
)
h
2
x
i
]
90
Sostituendo questa espressione nel calcolo del bilancio integrale delle
fughe si avrà che tutti i coecienti a scompaiono in quanto non dipen-
denti da x. Dunque otterremo, in denitiva, che:
_
V
ijl
dV = 2D
ijl
V
ijl
ijl
[
b
x
h
2
x
i
+
b
y
h
2
y
j
+
b
z
h
2
z
l
]
Passando al termine successivo si ottiene che il bilancio integrale for-
nisce:
_
V
ijl
(
f
k

a
)dV = (
f
k

a
)
ijl
_
V
ijl
dV =
= (
f
k

a
)
ijl
ijl
V
ijl
_
V
ijl
(1 +b
x
2
+b
y
2
+b
z
2
)ddd
Ove ancora una volta i termini dispari sono stati eliminati poichè la
loro integrazione porta ad un contributo nullo. Si ottiene dunque che:
_
V
ijl
(
f
k

a
)dV = (
f
k

a
)
ijl
ijl
(1 +
b
x
+b
y
+b
z
12
)V
ijl
Abbiamo cos` ottenuto la prima delle 7 condizioni, quella legata allannul-
lamento del bilancio integrale, che coinvolge solo i coecienti dei termini
quadratici.
Se andiamo ora a scrivere il bilancio integrale completo otteniamo, aven-
do sostituito le espressioni calcolate in precedenza per i coecienti quadratici
_
[D
ijl
+
h
2
x
i
24
(
f
k

a
)
ijl
]
i+
1
2
,j,l
2
i,j,l
+
i
1
2
,j,l
i,j,l
_
+y+z+(
f
k

a
)
ijl
ijl
Si nota che, come detto, rimane la dipendenza dalle condizioni allinter-
faccia, che dovrà essere eliminata imponendo la continuità della corrente
neutronica
38
Dovremo dunque imporre che:
D
ijl
(
x
)
x
i+
1
2
= D
i+1,j,l
(
x
)
x
+
i+1
1
2
Andando a scrivere la derivata allinterfaccia nella maniera seguente:
_
x
_
x
i+
1
2
=
ijl
_
a
x
h
x
i
+
2b
x
(x x
i
)
h
2
x
i
_
x
i+
1
2
=
=
1
h
x
i
(3
i+
1
2
,j,l
4
i,j,l
+
i
1
2
,j,l
)
38
Si noti come la scelta degli indici provoca lautomatica verica della condizione di
continuit` a del usso neutronico:
(i)+
1
2
,j,l
=
(i+1)
1
2
,j,l
91
Che, inserito opportunamente nella condizione di saldatura, fornisce lespres-
sione (implicita) per il usso neutronico allinterfaccia:
i+
1
2
,j,l
=
_
_
4(1
i
1
2
,j,l
4
ijl
)
3(1 +
h
x
i
D
i+1,j,l
h
x
i+1
D
ijl
)
_
ijl
+
_
_
4(1
i+
3
2
,j,l
4
i+1,j,l
)
3(1 +
h
x
i+1
D
i,j,l
h
x
i
D
i+1,j,l
)
_
ijl
Ho dunque in denitiva un legame decisamente complesso del tipo
i+
1
2
,j,l
=
f(
ijl
,
i+1,j,l
). Si nota abbastanza velocemente che, se due mesh adiacenti
hanno stessa ampiezza e stessi valori per le costanti nucleari (in questo caso
in eetti è suciente che sia uguale il coeciente di diusione, ma questo
di fatto a stesso materiale) si ottiene che il usso allinterfaccia non è altro
che la media aritmetica dei ussi calcolati nei due nodi adiacenti.
Il problema principale della forma ottenuta è che i coecienti stessi
dipendono, a loro volta, da ussi alle interfacce. Si ha cos` un problema
non lineare, ove dunque la matrice dei coecienti D sarà, nel problema
agli autovalori che andremo a risolvere, dipendente dagli autovalori stessi in
maniera non lineare, ed anche dalla stessa soluzione che dobbiamo ottenere.
Risolvere problemi di questo tipo è molto complesso. La sola possibilità
è quella di procedere iterativamente, ove per eliminare i ussi alle interfacce
per ln-esima iterazione utilizzo i valori calcolati alla (n-1)-esima iterazione.
Dunque la matrice diterazione varierà ad ogni ciclo dellalgoritmo, con-
dizione tipica degli algoritmi per la risoluzione di problemi non lineari. Si
tratta di calcoli pesanti e complessi, la cui convergenza non è garantita ma
che, nonostante tutto questo, funzionano e vengono correntemente utilizzati.
In generale i problemi di questo tipo, in logica multigruppo, si risolver-
anno con lo stesso principio applicato per le dierenze nite ni: vi saranno
due processi iterativi uno dentro laltro. Il problema non è pi` u complesso in
linea di principio, si opererà con matrici di dimensioni inferiori ma con mag-
giore complessità di risoluzione. Lunico elemento eettivamente distintivo
sta nel fatto che, in questo caso, non è possibile risolvere le equazioni per i
vari gruppi energetici a cascata. Essse sono infatti accoppiate tra loro ed
andranno dunque risolte in modo combinato.
3.4.2 Metodi Cubbox
Cosa accade se lapprossimazione del usso diviene di terzo grado? Si di-
mostra che, scegliendo opportunamente la forma del termine di terzo grado
come (
2
1
4
) i coecienti lineari e quadratici rimangono gli stessi che nel
caso Quabox, e che il passo aggiuntivo consiste esclusivamente nel calcolo dei
coecienti di ordine cubico. A nostro vantaggio va il fatto che, utilizzando
questa forma particolare, il termine di terzordine non aggiunge contributi
nel bilancio integrale.
Nonostante questa apparente inoensività tali termini sono tuttavia nec-
essari, poichè si dimostra che spesso una semplice approsimazione al secondo
92
ordine non è suciente. Sappiamo in ogni caso che se vogliamo aggiungere
un grado di libertà sarà necessario imporre una condizione al contorno ad-
dizionale. In questo caso utilizzeremo delle funzioni peso: dovrà dunque
essere vero che:
_
V
ijl
_
+ (
f
k

a
)
_
dV = 0
ove si ritornerà al semplice bilancio neutronico per = 1. Utilizzando invece
pesi opportuni potrò calcolare i tre termini aggiuntivi; si dimostra che tali
pesi sono del tipo (
2
1
4
), che applicati nelle tre direzioni forniscono le tre
condizioni al contorno aggiuntive necessarie per la chiusura del problema.
39
Otterrò cos` una forma del tipo:
c
x
= (f
x
ijl
)
i+
1
2
,j,l

i
1
2
,j,l
ijl
Ove, come era lecito attendersi, compaiono ancora una volta le condizioni
alle interfacce, che andranno a complicare ulteriormente il problema.
3.5 Elementi di cinetica neutronica
Si è parlato nora di fenomeni pseudo-stazionari, ovvero dove le operazioni
permettessero di distaccarsi solo in maniera marginale dalla criticità. Quan-
do questa ipotesi non è vericata non è pi` u possibile utilizzare lapproccio
visto no ad ora e diventa necessario lutilizzo di equazioni dierenti, di-
namiche, bastate sulla cinetica neutronica. Studieremo in particolare la
cinetica puntiforme
Cominciamo dalla denizione del k
eff
, il mio metro di criticità di un
reattore. Esso può essere di fatto denito in due modi equivalenti basati
però su lose diverse:
secondo il life cycle
secondo il neutron balance
Il risultato è naturalmente lo stesso, ma lapproccio è diverso. Nel secondo
caso mi limito infatti a fare il rapporto tra i neutroni che si generano da
ssione ed i neutroni perduti in un certo lasso di tempo, operando cos`
niente pi` u di un bilancio neutronico.
Attenzione però. Non bisogna dimenticare che da ssione non escono
soltanto i neutroni pronti. Alcuni nuclei gli generati dalla ssione, essendo
instabili, possono dare luogo ad ulteriore emissione di neutroni dopo un
39
Si parla ancora una volta di pesatura alla Galerkin. Tale imposizione non ha signicato
sico ma solo matematico
93
certo lasso di tempo. Tali neutroni sono detti neutroni ritardati e sono
di primaria importanza per il controllo delle reazioni nucleari.
I neutroni ritardati vengono alla luce in una situazione in cui il usso
neutronico si è già evoluto, ed è dunque diverso da quello che vi era al mo-
mento della generazione dei loro progenitori. Si dice dunque che i neutroni
ritardati tendono a ricordare il usso neutronico che li ha generati.
Come ne terremo dunque in conto ai ni del calcolo del k
eff
?
Considereremo inizialmente due popolazioni:
La popolazione di neutroni pronti, n
La popolazione di progenitori di neutroni ritardati, c
i
A cosa devo il pedice i? Al fatto che esistono molto tipi diversi di progenitori
che danno luogo ad emissione di neutroni, ma che lo fanno con tempi diversi.
In generale essi sono divisi in 6 gruppi o famiglie, per le quali il ritardo di
emissione va da un massimo di circa 80 s ad un minimo dellordine dei ms.
Tenendo dunque in conto anche del contributo dei neutroni ritardati
avremo che il k
eff
diventa:
k
eff
=
n +
i
c
i
neutroni scomparsi
Si vede come la scelta di utilizzare lapproccio di bilancio neutronico per
il calcolo del k
eff
sia dettata anche dalla necessità di tenere in conto dei
neutroni ritardati. Applicando una logica del tipo ciclo di vita non sarebbe
invece facile distinguere da che generazione essi provengono.
Indicheremo con l o tmg il tempo medio di generazione, in generale
dierente dalla vita media dei neutroni. Tali quantità sono invece uguali
solo ove il reattore sia critico, ed avremo dunque una nuova denizione del
k
eff
come k
eff
=
l
0
l
. Tali quantità potranno essere dunque confuse quando
si opera in regime di pseudocriticità. In realtà avremo che l
0
è una costante,
mentre l varia assieme al k
eff
.
Potremmo tuttavia ora chiederci se, dopo tutto quanto detto sino ad ora,
le due denizioni di k
eff
siano eettivamente equivalenti o meno.
Supponendo per semplicità di trovarsi allinterno di un reattore termico,
suddividiamo la vita di un neutrone in tappe ben denite. Avendo poi
denito l
0
come la vita media di un neutrone, sarà possibile dire anche
che l
0
=
percorso
velocità
, ma essendo la lunghezza del cammino percorso da un
neutrone inversamente proporzionale alla sezione durto di assorbimento
40
potremo in denitiva dire che l
0

1
a
v
. Si può dunque vedere che, per
40
Trascureremo in questa fase il rallentamento del neutrone, poichè i tempi caratteris-
tici della sua termalizzazione sono molto pi` u veloci di quelli tipici dellassorbimento: la
velocit` a di un neutrone termico è molto inferiore di quella di un neutrone ancora in fase
di rallentamento
94
come sono strutturati i reattori termici, in questo caso è abbastanza agevole
identicare le generazioni di neutroni distinte. Possiamo dunque supporre
ragionevolmente che tutti i neutroni emessi nella fase 1 saranno assorbiti
nella fase 2, di modo che la denizione sul ciclo di vita risulti uguale a
quella sul bilancio neutronico.
La moltiplicazione del numero di neutroni che abbiamo in un tempo t è
data da:
M(t) = k
t
l
Facciamo un esempio numerico. Se prendiamo lacqua come moderatore,
avremo, per t = 1s, l = 10
4
s
41
Dunque, supponendo inoltre k=1.001,
otterremo (utilizzando le opportune approssimazioni):
M(t) = 1.001
10000
(e
0.001
)
10000
e
10
Si vede dunque che anche per un valore di k
eff
molto prossimo ad uno, dopo
appena un secondo la cinetica del reattore ha portato alla moltiplicazione
della popolazione neutronica di un fattore e
10
.
Questo calcolo è stato eettuato in assenza di neutroni ritardati, in pre-
senza dei quali il valore di l diventa circa 0.08, il che riduce di molto il fattore
di moltiplicazione visto prima.
Deniamo ora una serie di quantità (ove per neutroni prodotti si intende
la totalità dei neutroni prodotti ad una determinata generazione):
k
eff
=
n prodotti
n persi
k
ex
= k
eff
1 =
n prodotti - n persi
n persi
=
k
eff
1
k
eff
=
n prodotti - n persi
n prodotti
(reattività)
=
precursori di n ritardati
n prodotti
=
n pronti - n persi
n prodotti
l
0
=
n esistenti
n persi(per unità di tempo)
l =
n esistenti
n prodotti(per unità di tempo)
In base a queste denizioni avremo che:
dn
dt
=

l
n(t) +
i
c
i
(t)
41
questo dipende dal fatto che lacqua ha una sezione durto di assorbimento elevata.
Utilizzando la grate avremmo avuto che l = 10
3
s
95
Ovvero la variazione del numero di neutroni per unità di tempo è pari alla
produzione di neutroni pronti pi` u la somma delle produzioni dei neutroni
ritardati provenienti da tutte le famiglie meno i neutroni persi.
42
Il termine
legato ai neutroni ritardati contiene la popolazione allistante t moltiplicata
per lopportuna costante di decadimento, e deriva da:
dc
i
dt
=
i
c
i
+

i
l
n(t)
Supponiamo ora di avere un gradino di reattività nellistante t=0, tale per
cui = 0 per t 0 e = p per t > 0
Fintanto che tale gradino è inferiore a , sono ancora in grado di control-
lare il reattore. A risposta di tale gradino ho infatti un incremento rapido per
un tempo
l
, dopo il quale la popolazione neutronica continua ad aumentare

ma in modo molto regolare e in entità inferiore. Il salto iniziale è denito
prompt jump, ed è tale per cui n(t) =

n
0
. La chiave di tale processo
è che se fosse invece > , la risposta della popolazione neutronica non
prevederebbe tale assestamento, ma si manterrebbe di rapido incremento.
Dunque è qui che risiede il fenomeno fondamentale che permette il controllo
delle reazioni a catena solo grazie alla presenza dei neutroni ritardati.
Abbiamo detto in precedenza che il tempo di risposta l passa da circa
10
4
a 0.08 nel momento in cui si considerano i neutroni ritardati. Ma
perchè?
Questo è dovuto al fatto che il valore reale di l è dato da
l = l +
i
ove la sommatoria a secondo membro diventa di fatto preponderante. Ma
come si arriva a tale scrittura?
Ripartiamo dalla
dn
dt
=

l
n(t) +
i
c
i
(t)
supponendo per ora , e l indipendenti dal tempo, anche se per la reattività
si tratta di una approssimazione particolarmente forte. Supponiamo inoltre
di avere allistante iniziale
dc
i
dt
= 0 e
dn
dt
= 0
Otterremo di conseguenza (tramite lapplicazione della trasformata di
Laplace)
= ls
i
s
i
s +
i
42
Si tenga conto che nel momento in cui vado a studiare fenomeni dipendenti dal tempo
sorgono problemi detti di stiffness, rigidit` a, legati allaccoppiamento di fenomeni aventi
tempi caratteristici dierenti tra loro. In questo caso appare chiaro che i fenomeni legati
ai neutroni pronti sono molto pi` u veloci di quelli legati ai neutroni ritardati, provocando
il vericarsi della situazione sopra enunciata, con conseguente grande attenzione che deve
essere posta al momento della discretizzazione del dominio temporale
96
Dunque una volta ssato ho tante soluzioni quanti sono i valori di
i
pi` u una, dunque di fatto 7. Dallo studio della funzione notiamo inoltre che
tali soluzioni sono tutte reali e danno luogo ad un andamento monotono a
tratti. Se procediamo con lantitrasformazione otteniamo che:
n(t) =
7
j=1
A
j
e
s
j
t
Il problema si concentra dunque sulla soluzione s
j
avente valore pi` u grande.
Se supponiamo che tale valore sia, in modulo, trascurabile rispetto a
i
otteniamo
43
s
1
=

l +
i
Si ha dunque che:
l = l +
i
=
= l(1 ) +
i
l +
i
=
= (1 )l +
i
(l +
1
i
)
Dunque l è la media pesata sulle popolazioni neutroniche dei tempi medi di
vita dei neutroni pronti e dei neutroni ritardati.
Si vede da quanto scritto che il reattore ha una cinetica sua, e dunque non
è possibile variarne le condizioni operative oltre ad una certa velocità limite.
Questo è molto importante soprattutto in condizioni di pericolo, ove è nec-
essario provocare lo spegnimento repentino del reattore. Essa sarà dunque
limitata dal valore della costante di decadimento dei neutroni ritardati di
modulo inferiore
44
43
Cosa accadrebbe se > ? Ci troveremo allinterno della zona asintotica di s
1
, il cui
valore sarà dunque molto elevato. Otterremo di conseguenza che nella equazione
= + ls
i
s +
i
il grande valore di s porta il contributo della sommatoria a divenire trascurabile, in modo
che otteniamo per s
1
:
s
1

l
44
Questo aspetto deve essere tenuto in conto in particolare quando si sceglie di ridurre il
numero delle famiglie di progenitori per la semplicazione dei calcoli, mediando le relative
costanti di decadimento. In generale è necessario mantenere isolata la famiglia avente la
costante di modulo inferiore in quanto essa è quella avente ruolo chiave nei transitori
97
Vediamo ad esempio cosa accade scegliendo di operare con due macro-
famiglie:
_
_
1
v
(r,t)
t
= D
2
(r, t)
a
(r, t) +p
f
(1 )(r, t) +p[
1
c
1
(r, t) +
2
c
2
(r, t)]
c
1
t
=
1
c
1
(r, t) +
1
p
f
(r, t)
c
2
t
=
2
c
2
(r, t) +
2
p
f
(r, t)
Con:
p fattore di sopravvivenza alle catture di risonanza
fattore di moltiplicazione veloce
45
Se ne ottiene che:
c
1
= c
10
(r)e
1
t
+
1
_
t
0
(r, t
)e
1
(tt
)
dt
Si vede dunque che i neutroni ritardati risentono del usso calcolato allis-
tante t-t, come mostrato dal termine di convoluzione, che rappresenta il
ricordo dei neutroni ritardati.
Se andiamo ad ipotizzare di poter scrivere:
_
_
(r, t) = F(r)(t)
c
i
(r, t) = F(r)C
i
(t)
2
F(r) +B
2
G
F(r) = 0
G
i
=
C
i
45
tale fattore è tenuto in conto solo per i neutroni pronti, in quanto i neutroni ritardati
sono emessi con energie inferiori e la probabilit` a che essi diano luogo a ssioni veloce è
trascurabile
98
Otteniamo che il sistema precedente può essere scritto nella forma
46
_
_
d
dt
=
1
l
t
[(1 )k
eff
1](t) +
k
e
ff
l
t
[
1
G
1
(t) +
2
G
2
(t)]
dG
1
dt
=
1
G
1
(t) +
1
(t)
dG
2
dt
=
1
G
2
(t) +
2
(t)
La soluzione del sistema sarà data da
d
dt
_
_
(t)
G
1
(t)
G
2
(t)
_
_
=
_
_
1
l
t
[(1 )k
eff
1]
1
l
t
k
eff
1
1
l
t
k
eff
1

1
0
2
0
2
_
_
_
_
(t)
G
1
(t)
G
2
(t)
_
_
Che in forma matriciale è esprimibile come:
dx(t)
dt
=

Ax(t)
Tale sistema è risolto evidentemente da una forma di tipo esponenziale,
ovvero:
x(t) =
3
i=1
T
i
x(0)e
i
t
i
Tale problema è pi` u facilmente risolvibile applicando alle funzioni una trasfor-
mazione secondo Laplace. In questo modo, chiamando la nuova variabile
46
sono qui di seguito esplicitati i passaggi che permettono di arrivare a questa forma,
che potranno sembrare semplici ai pi` u ma che vengono mostrati per completezza:
1
v
(r, t)
t
= D
2
F(r)(t)
a
F(r)(t) + p
f
(1 )F(r)(t) + p[
1
F(r)C
i
(t) +
2
F(r)C
i
(t) =
= DB
2
G
F(r)(t)
a
F(r)(t) + p
f
(1 )F(r)(t) + p[
1
F(r)C
i
(t) +
2
F(r)C
i
(t) =
1
v
(r, t)
t
= DB
2
G
(t)
a
F(r)(t) + p
f
(1 )(t) + p[
1
C
i
(t) +
2
C
i
(t) =
t
= v
a
[(L
2
B
2
+ 1) + (1 )
a
p](t) + pv
f
[
1
G
1
+
2
G
2
] =
= v
a
(L
2
B
2
+ 1)[
(1 )
(l
2
B
2
+ 1)
a
p 1](t) + pv
f
[
1
G
1
+
2
G
2
]
L
2
B
2
+ 1
L
2
B
2
+ 1
=
=
1
l
t
[(1 )k
eff
1](t) +
k
eff
l
t
[
1
G
1
(t) +
2
G
2
(t)]
Ove si è usato che:
L
2
=
D
a
1
l
t
= v
a
(1 + L
2
B
2
)
k
eff
=
p
f
a
(1 + L
2
B
2
)
per la cui dimostrazione si rimanda a testi e corsi di sica del reattore
99
delle funzioni trasformate, otterrò un sistema del tipo seguente:
i
x =

A x
Questo risulta essere nè pi` u nè meno che un problema agli autovalori, ove
gli
i
sono gli autovalori e i
i
le autofunzioni.
Per la seconda e la terza riga del problema (quelle relative ai progenitori)
si ottiene che:
_

1
(1) (
1
+
2
)(2) = 0
2
(1) (
2
+
3
)(3) = 0
Da cui si ottiene che, se il primo elemento dellautovettore è normalizzato
ad 1, vale:
T
= 1,

1
1
+
2
,

2
2
+
3
Per determinare inne gli

k
devo risolvere lequazione determinan-
tale che assume la forma:
_
F() =
l
t
1+l
t
+
1
1+l
t
2
i=1
i
+
i
F() =
k
eff
1
k
eff
Ove ho di fatto eguagliato due espressioni per la reattività del sistema.
Questo ci permette (vedi graco su appunti) di determinare gli autoval-
ori della matrice A. Dallanalisi dei risultati si possono trarre le seguenti
conclusioni
47
:
Se la reattività è nulla, anche il primo degli autovalori avrà modulo nul-
lo. Il sistema evolverà quindi in termini molto meno incisivi (ma nonos-
tante ciò si muove: dunque nemmeno se il sistema fosse perfettamente
critico avremmo completa stazionarietà, se non asintoticamente).
Se la reattività è maggiore di 0, il primo degli autovalori è positivo, ed
il sistema tende (asintoticamente) ad esplodere
se inne la reattività è negativa anche il primo degli autovalori è nega-
tivo, il che porta allo spegnimento del reattore. Si vede che la velocità
di tale spegnimento è proporzionale al termine pi` u resistente (ovvero
1
), il cui valore limite (raggiungibile solo per reattività innitamente
negativa) è dato da
1
. Ecco dunque spiegato il limite alla velocità di
spegnimento del reattore.
47
Si noti come solo il primo dei 3 autovettori ha elementi sempre positivi, in quanto sia
1
che
2
sono maggiori dellautovalore, il cui valore limite negativo è proprio
1
. Tale
funzione è dunque lunica ad avere un signicato sico
100
3.6 Elementi di Trasporto neutronico
Fino a questo momento abbiamo parlato di modellizzazione della sica neu-
tronica del reattore tramite lequazione della diusione, facendo riferimento
alla teoria del trasporto come ad un sistema che, a costo di maggiore comp-
lessità, permette di ottenere calcoli di precisione superiore. Vediamo ora di
eettuare un discorso introduttivo sul trasporto neutronico che permetta di
comprenderne i principi di base.
Lequazione del trasporto pi` u generica, applicabile a diversi campi della
sica, è detta equazione di Boltzmann e non è lineare. Tale non linearità
nasce in generale dal considerare le interazioni tra le particelle che fanno
parte della popolazione che stiamo considerando. Caratterstica del trasporto
neutronico è quella di ignorare tali collisioni, di modo che lequazione del
trasporto neutronico risulterà essere invece lineare.
Esistono due tipi di formulazione per lequazione del trasporto neutron-
ico:
Integrale : tale formulazione permette di ottenere i valori mediati delle
sezioni durto da utilizzare in teoria della diusione.
Integro-Dierenziale : tale formulazione è la pi` u usata per la proget-
tazione dei sistemi nucleari
48
Vediamo ora alcune dierenze tipiche tra lapproccio diusivo e quello
trasportistico:
Direzione di volo dei neutroni : Il primo elemento di maggiore preci-
sione legato alla teoria del trasporto rispetto allapproccio diusivo è
il tenere in conto anche della direzione di volo dei neutroni. Avre-
mo dunque a che fare con un usso neutronico angolare (r, E.
) al
posto del consueto usso neutronico (r, E). Questo mi permette di
tenere in conto del fatto che, dopo ogni evento, un neutrone avrà una
direzione di volo diversa da quella di partenza.
49
Parallelismo sico-matematico : Anche lequazione del trasporto è gen-
eralmente risolta tramite tecniche di tipo iterativo
50
. Caratteristica
tipica della forma integro-dierenziale è quella di mantenere un par-
allelismo tra iterazioni e collisioni neutroniche, ove invece in forma
integrale è molto pi` u dicile trovare una correlazione di questo tipo.
48
Il codice attualmente in uso presso il CEA per il trasporto neutronico è lApollo II
49
Lequazione del trasporto in forma integrale prevede una integrazione sulla direzione
di volo. Il risultato dunque di tale operazione sar` a un usso indipendente da tale variabile,
il che crea un forte parallelo con la teoria della diusione e permette di utilizzare i risultati
ottenuti in teoria del trasporto per migliorarla
50
Come soluzione di tentativo viene spesso utilizzato il risultato ottenuto con modelli
diusivi
101
Nel caso diusivo si era invece visto come tale parallelismo era sempre
garantito
Località del fenomeno Si è detto pi` u volte in precedenza che lapproccio
diusivo è di tipo locale: tutti i punti del dominio sono collegati tra
loro indirettamente, ma solo i nodi tra loro adiacenti presentano una
dipendenza diretta. Questo si ripercuote, a livello numerico, nellavere
a che fare con matrici sparse. Nel caso della teoria del trasporto,
invece, vengono tenuti in considerazione anche i fenomeni a distanza.
Dunque un neutrone posto in un generico punto del reattore potrebbe,
seppure con probabilità estremamente bassa, raggiungere un qualsiasi
altro punto del reattore. Conseguenza di tale approccio è lavere a che
fare con matrici dense.
3.6.1 Formulazione integrale
Sotto le ipotesi di:
Problema stazionario
Mezzo isotropo
Fenomeni di scattering di natura isotropizzante
Sorgente isotropa
Si può scrivere lequazione del trasporto neutronico in forma integrale nel
modo seguente:
(r, E) =
_
V
_
[
_

0
(
, E
)(
, E
)f(
, E
E) +S(
, E
)]dE
_
e
l
op
(
r,E)
4[r

r
[
2
dV
Ove si è dunque supposto di poter scrivere (viste le ipotesi)

_
f(
, E
E,

) =
1
4
f(
, E
E)
S(r, E,
) =
1
4
S(r, E)
Lequazione che compare nellespressione del usso tra parentesi quadre è
una equazione di Frehdolm di seconda specie.
La funzione f rappresenta la probabilità che un neutrone avente energia
E e direzione di volo
esca da un evento di interazione con energia E e

direzione di volo .
51
Risulterà dunque che: f(r, E
E) è dato dalla
somma dei seguenti contributi:
Scattering:
_
S
(r, E
)
(r, E)
f
S
(r, E
E)
_
51
In realt` a non si parla mai di avere esattamente energia E o E, o direzione di volo
lungo o
, ma sempre di valori compresi in un intorno dE o d del punto considerato

102
Cattura: (
c
)
52
Fissione:
_
f
(r, E
)
(r, E)
f
f
(r, E
E)(r, E
)
_
Reazioni n.2n:
_
2
n,2n
(r, E
)
(r, E)
f
n,2n
(r, E
E)
_
Dovrà inoltre valere chiaramente che:
_

0
f(r, E
)dE
= 1
Il termine esponenziale è invece legato allattenuazione del segnale,
descrive la diminuzione di probabilità che un neutrone arrivi a distanze
sempre maggiori senza subire eventi di qualunque tipo. Allinterno di tale
termine è contenuto il parametro lop lunghezza ottica del sistema,
che rappresenta come neutroni aventi energie diverse vedono il sistema in
modo diverso. Risulterà di fatto che:
l
op
(
r, E) = (E)[r [
[
Se introduciamo lipotesi di mezzo omogeneo, possiamo far scomparire
la dipendenza delle sezioni durto dalla posizione. Lequazione si presenterà
dunque nella forma:
(r, E) =
_
V
[
_

0
(E
)(
, E
)f(E
E)dE
+S(
, E
)]
e
(E)|r|
|
4[r

r
[
2
dV
Il problema sarà a questo punto andare a discretizzare tale equazione a

livello spaziale ed energetico. Tale operazione è tanto pi` u dicile quanto
pi` u problematica è la natura del nucleo (o kernel) dellequazione integrale
che è dato, in questo caso, dal termine:
e
(E)|r|
|
4[r

r
[
2
Eettuando la discretizzazione della variabile energetica dovremo denire
delle sezioni durto mediate. Si denisce:
g
=
_
g
dE
_
g
dE[(E
E)(r, E
)]
_
g
(r, E
)dE
52
Questo termine non compare nellespressione precedente in quanto, evidentemente, la
cattura neutronica non provoca riemissione di neutroni e di conseguenza non dar` a luogo
ad alcun contributo
103
Se supponiamo di implementare nellequazione la discretizzazione ener-
getica, andando ad aggiungere a tutte le semplicazioni fatte sino ad ora il
trascurare le reazioni n,2n, si ottiene:
_

g
(r) =
_
V
[
G
g
=1

g
g
(
) +
G
g
=1
(
f
)
g

g
(
) +S
g
(
)]
e
(E)|r|
|
4|r
|
2
dV
g = 1 : G
Il passo successivo, ultima operazione prima della risoluzione numerica,
sarà quello di discretizzare nello spazio. Per farlo si utilizzano delle for-
mule di quadratura tramite polinomi (Newton Cotes) o tramite polinomi
ortogonali (Formule di Gauss).
Facciamo un esempio in geometria monodimensionale:
g
(x) =
_
a
a
_
_
G
=1
g
(x
) +
G
=1
(
f
)
g

g
(x
)
_
_
1
2
E
1
(
g
[x x
[dV
Ove E
1
è la funzione esponenziale integrale di ordine 1, un tipo di
polinomio ortogonale appartenente alle funzioni speciali. Tali funzioni
hanno proprietà interessanti ma sono singolari nel dominio. Tali funzioni
sono denite nel modo seguente:
E
n
(z) =
_

1
e
zt
t
n
dt
Nel nostro caso vale:
E
1
(z) = ln z
i=0
(1)
n
z
n
n n!
con costante di Eulero Mascherani che vale circa 0.57721 Tale
espressione costituisce il nucleo dellequazione. Esso è singolare (a causa del
logaritmo) in x. Tale singolarità è detta debole in quanto è moderatamente
facile da risolvere.
Ciò che si va a fare spesso è tuttavia lutilizzare una serie di polinomi
ortogonali al posto della funzione esponenziale integrale. Lapprossimazione
è infatti lecita e ben posta, in quanto sono entrambi polinomi ortogonali,
ma si ha in pi` u una migliore conoscenza della funzione. Andremo dunque a
scrivere che, utilizzando i polinomi di Tchebychev (modicati in modo tale
da adattarne il dominio alla funzione di interesse)
E
1
(z) = ln z
n=0
a
n
T
n
(
z
8
)
con:
_
_
_
T
0
= 1
T
1
= 2t 1
T
n+1
= (4t + 2)T
n
(t) T
n1
(t)
104
Tale approssimazione diventa eettivamente tale solo nel momento in cui la
sommatoria sui polinomi viene portata ad un numero nito di termini.
Non considerando pi` u la presenza di una sorgente avremo ottenuto un
problema agli autovalori del tipo H
k
K
= 0
Approfondiamo anche in questo caso la scelta dellautovalore. Si era
accennato, a proposito della diusione, della possibilità di posizionare lau-
tovalore in altri punti dellequazione, attribuendogli cos` un dierente signi-
cato sico. Questo può essere fatto anche in teoria del trasporto:
Scegliendo come autovalore = k si va ad inuenzare la molteplic-
it` a da fissione
Scegliendo come autovalore = si va ad agire sulla collisionalit` a.
Scegliendo come autovlaore = si va inne ad agire sulla densità
del materiale. Questultimo caso è particolarmente interessante per
modellizzare situazioni incidentali (ove questa apparente incoerenza
diventa eettivamente realistica dal punto di vista sico). Il problema
è che le equazioni diventano, in questo caso, non lineari.
105
Appendice A
Aggiustamento di sezioni
durto
A.1 Introduzione alle basi di dati
La presenza di studi legati allaggiustamento delle sezioni durto deriva
principalmente dalla grande incertezza esistente su tali valori, ai quali nei
database è sempre associato uno scostamento, il cui valore quantica di
quanto il valore reale può allontanarsi da quello nominale. Ogni valore
contenuto allinterno di tale intervallo è considerato in accordo con i dati
sperimentali. Questo sistema ci ricorda innanzitutto dellimportanza del
condizionamento di un problema: la presenza nota di incertezze nei dati
in ingresso mi porta alla necessità di assicurarmi che tale imprecisione non
mini la mia possibilità di risolvere il mio problema numerico.
Negli anni 70 è stato eettuato un enorme lavoro di aggiustamento
statistico delle sezioni durto basato sui dati provenienti da decine di labora-
tori diversi, in cui è stata tenuta in conto ladabilità di ogni dato tramite
schemi precisi, tenenti in conto ad esempio la qualità dellattrezzatura e
ladabilità dei dati di input utilizzati e, soprattutto, delle inuenze che si
generano tra i dierenti laboratori.
1
Per le sperimentazioni sulle sezioni durto vengono spesso utilizzati reat-
tori particolari, di forma sferica, pensati per avere una ottima conoscenza
della geometria. Lo scopo è quello di rendere il sistema il pi` u semplice pos-
sibile per eliminare ogni tipo di incertezze, in modo da portersi concentrare
sulla misurazione delle sezioni durto. In generale il risultato di tali esper-
imenti (detti esperimenti integrali per via del tipo di grandezze che si
1
Si faccia lesempio di un laboratorio (Lab 1) che eettui degli esperimenti a partire dai
dati ottenuti da altri due (Lab 2 e Lab 3). Al ne di quanticare ladabilit` a dei risultati
ottenuti dal Lab 1 sar` a dunque necessario anche tenere in conto di quale sia ladabilit` a
dei dati dei Lab 2 e Lab 3 e la loro inuenza sul processo utilizzato dal Lab 1 al ne
dellottenimento dei suoi risultati
106
vogliono misurare) vengono confrontati con simulazioni numeriche, al ne
di validare i modelli utilizzati per ottenere queste ultime.
La libreria pi` u nota in sica neutronica è la ENDF, mantenuta dai lab-
oratori del sito di Los Alamos. Vi sono contenuti, per ogni nucleo di inter-
esse nucleare e per ogni tipo di sezione duro, dati per circa 50000 punti
energetici. La libreria ENDF si divide in pi` u sezioni:
ENDF-A che contiene i dati grezzi provenienti dai vari laboratori. Si tratta
di dati sparpagliati e disordinati
ENDF-B contiene i dati contenuti in ENDF-A opportunamente ordinati,
organizzati, interpolati ed estrapolati al ne di poter essere material-
mente utilizzabili. La fase di lavoro che porta dal database di tipo A
a quello di tipo B è detta evaluation
ENDF-C contiene inne i dati sulla correttezza e ladabilità di ogni dato
contenuto in ENDF-B
Tali dati sono purtroppo ben lontani dallessere corretti e completi. Se
già incertezze sono presenti su quei nuclidi ben noti e facili da studiare, si
hanno i maggiori problemi per le specie che hanno vita molto breve. Queste
infatti sono dicili da studiare, ma il loro impatto sui bilanci può essere
comunque rilevante ed è dunque opportuno tenerne in conto.
Attualmente i metodi numerici ed i calcolatori per attuarli hanno miglio-
rato enormemente le loro prestazioni, e sarebbe dunque un peccato spre-
care un tale potenziale a causa di dati di partenza imprecisi. Se ad es-
empio imponessi con successo ad un algoritmo un margine di errore dello
0.001% rischierei di scoprire che tale errore è in realtà dellordine del punto
percentuale a causa di imprecisione sui dati di input.
Il punto principale è che i parametri dierenziali, quali sono ad esempio
le sezioni durto, sono molto dicili da misurare. Molto pi` u agevole (quan-
tomeno in relativo) è invece la misurazione dei parametri integrali, come
potrebbe essere la criticità di un sistema. In eetti uno degli esperimenti
tipici in questo ambito è quello di costruirsi dei benchmark in modo tale
che questi risultino critici. Essendo nota la loro composizione sia dal punto
di vista materiale che geometrico, i dati che li riguardano sono poi utilizzati
per testare le librerie di sezioni durto, tramite le quali è possibile calco-
lare un valore per il k
eff
di tali sistemi che, nellipotesi che i calcoli siano
corretti, dovrebbe essere identicamente pari ad 1.
Purtroppo questo non accade quasi mai. Ed allora, posto che in un
sistema cos` noto e semplicato le interferenze sulla soluzione provocate da
incertezze di vario tipo sono pressochè escluse, si può pensare di utilizzare
il dato misurato per ottenere un miglioramento delle librerie.
In generale tuttavia ogni esperimento contiene, al suo interno, uno spazio
ad N-1 dimensioni di possibili nuove librerie che portano al perfetto soddis-
107
facimento del calcolo ad esso associato (ove N è il numero di parametri con-
tenuti nella libreria). Come fare per scegliere quale di tutti queste innite
possibilità è quella da utilizzare per aggiornare la libreria?
Nel prossimo paragrafo sono introdotte (o ricordate, a seconda delle
conoscenze di chi legge) alcune nozioni basilari di statistica e probabilità,
utili per la comprensione di quanto segue. Nel paragrafo successivo sarà
invece arontato in modo diretto il problema dellaggiornamento della libre-
ria.
A.2 Elementi di statistica
Supponiamo di avere due misure della stessa quantità x eettuate da due
laboratori distinti:
_
x = x
1

1
x = x
2

2
Supponiamo che entrambi i laboratori siano adabili. Come faccio ora a
scegliere che valore usare?
Dovrò utilizzare una media di qualche tipo, sia per determinare il valore
medio reale che per la deviazione standard. Dunque, nella forma:
x = c
1
x
1
+ (1 c
1
) x
2
sto cercando il valore opportuno per c
1
. Il mio obiettivo sarà quello di
minimizzare la deviazione standard. Essendo che:
2
x
= E[(x x)
2
]
si avrà
2
x
= E[x c
1
x
1
(1 c
1
) x
2
]
2
=
= E[c
1
x c
1
x +x c
1
x
1
x
2
+c
1
x
2
]
2
=
= E[c
1
(x x
1
) + (1 c
1
)(x x
2
)]
2
=
= c
2
1
E(x x
1
)
2
+ (1 c
1
)
2
E(x x
2
)
2
+ 2c
1
(1 c
1
)E(x x
1
)E(x x
2
)
= c
2
1
2
1
+ (1 c
1
)
2
2
2
+ 2c
1
(1 c
1
)E(x x
1
)E(x x
2
)
Se però i due laboratori sono indipendenti lultimo termine è nullo, e la var-
ianza della media pesata è pari alla media delle varianze pesata sui quadrati
dei pesi della media.
2
Andiamo dunque ad analizzare come ottenere il peso migliore in questo
caso semplicato. Per farlo dovremo annullare la derivata rispetto ai pesi
2
Questo ovviamente non è detto: anzi, nel caso pi` u generale i laboratori saranno col-
legati tra loro, ed i risultati delluno inuenzeranno in qualche modo quelli dellaltro e
viceversa
108
dellespressione ottenuta, in modo tale da ottenere il valore del peso c
1
che
minimizzi la varianza:
d
2
x
dc
1
= 2c
1
2
1
2(1 c
1
)
2
2
= 0
Da cui ottengo:
c
1
=

2
2
2
1
+
2
2
Se invece non elmino la covarianza ottengo:
c
1
=

2
2

12
2
1
+
2
2
2
12
Dunque se i due laboratori non sono indipendenti tra loro potrei perno
avere un peso negativo. Questo corrisponderebbe al caso in cui siamo
a conoscenza del fatto che uno dei due laboratori ha inuenzato pesan-
temente laltro in una direzione specica, e ci costringerà a muoverci in
quella opposta. Generalizzando per n laboratori ottengo la matrice di
correlazione:
_
_
_
_
_
2
1

12

1n
21

2
2
.
.
.
.
.
.
n1

2
n
_
_
_
_
_
Prendiamo ora un caso distinto: supponiamo di avere due misure di due
grandezze diverse:
x
1
= x
1

1
x
2
= x
2

2
Supponiamo ora che le grandezze di interesse siano invece:
y
1
= x
1
+x
2
e y
2
= x
1
x
2
Supponiamo ora che le due misure di partenza siano state fatte in modo tale
da dare luogo a distribuzioni di probabilità di tipo gaussiano (il teorema
del limite centrale ci dice che questo è vero sotto determinate condizioni).
Dunque potrò scrivere:
x
1
e
(x
1
x
1
)
2
2
2
1
x
2
e
(x
2
x
2
)
2
2
2
2
La funzione di distribuzione associata ad entrambe le variabili sarà del tipo
f(x
1
, x
2
) e
(x
1
x
1
)
2
2
2
1
(x
2
x
2
)
2
2
2
2
109
Questo però è valido soltanto se le due variabili sono tra loro indipendenti,
come abbiamo supposto vero per le due grandezze misurate sperimental-
mente. Se però vogliamo scrivere una espressione analoga per le variabili
dipendenti, vale a dire y
1
e y
2
x
1
=
y
1
+y
2
2
x
2
=
y
1
y
2
2
Sostituendo tale espressione in quanto scritto prima ottengo una forma di
questo tipo:
f(y
1
, y
2
) = exp
1
4
[(
1
4
2
1
+
1
4
2
2
)(y
1
y
1
)
2
+ (
1
4
2
1
+
+
1
4
2
2
)(y
2
y
2
)
2
+ (
1
2
2
1
1
2
2
1
)(y
1
y
1
)(y
2
y
2
)
Ancora una volta esiste un termine legato alla correlazione tra le due misure.
Si veda come in questo caso si abbia comunque una correlazione tra le due
variabili dipendenti, nonostante i dati sperimentali siano indipendenti.
Questo è forzatamente generato dal fatto che tanto y
1
quanto y
2
dipendano
dalle stesse variabili. Abbiamo dunque allesponente una forma quadratica,
in cui il termine generalmente noto come doppio prodotto è legato alla
covarianza.
La forma quadratica scritta in precedenza è scrivibile anche in forma
matriciale
(y y)
T
M(y y)
.
Vogliamo ora calcolare la deviazione standard di
y1
2
y1
= E[(y
1
y
1
)
2
] =
= E[(x
1
+x
2
) ( x
1
+ x
2
)]
2
=
=
2
1
+
2
2
+ 2
12
Ove, come al solito, se i due eventi non sono correlati, lultimo termine
scompare.
Da calcoli analoghi si pu` o arrivare a scrivere che:
2
y1
=
2
y2
e
y1,y2
= E[(y
1
y
1
)(y
2
y
2
)] =
2
1

2
2
Da cui posso costruire la matrice:
C
y
=
_

2
y1

y1,y2
y1,y2

2
y2
_
=
_

2
1
+
2
2

2
1

2
2
2
1

2
2

2
1
+
2
2
_
110
Tale matrice non è una matrice qualunque. Notiamo intanto che essa è
denita positiva e dunque sempre invertibile, e tale che C
1
y
= M
Ho cos` ottenuto lespressione della funzione di distribuzione di y. Potrò
inoltre normalizzarla ad 1, ovvero renderla tale che
_
f(y)dx = 1
Si dimostra che, a questo ne, devo moltiplicare per un opportuno fattore,
tale per cui ottengo:
f(y) =
_
det(M)
(2)
N
2
_
exp[
1
2
(x x)
T
M(x x)]
Si noti che tale equazione è valida per qualunque vettore y funzione di
un generico vettore x. Ciò che varierà con la dipendenza tra i due insiemi di
variabili sarà la matrice M che genera la forma quadratica nellesponenziale.
Prendiamo ora una generica funzione r = r(p) Voglio ora trovare un
modo di esprimere quanto r sia sensibile alle incertezze su p. Scriverò dunque
che:
r( p +
p
) = r +
r
Da cui:
r
S
p
La matrice S, basata sul troncamento al primordine della serie di Taylor
associata a r(p), è detta matrice di sensitivit` a del problema, ed è di
fatto costituita dalle derivate parziali delle varie componenti del vettore r
secondo le variabili contenute nel vettore p.
3
Quello che mi interessa, nota la matrice S, è valutare lentità di
r
. Essa
sarà quanticata dal parametro C
r
:
C
r
= <
r
T
r
>=
= < (S
p
)(S
p
)
T
>=
= < S
p
T
p
S
T
>=
= S <
p
T
p
> S
T
=
= SC
p
S
T
Tale procedimento è detto sandwich rule, e denice la propagazione
delle incertezze
3
Il calcolo di tale matrice, avente dimensioni I x N, sembra a prima vista un compito
arduo. In realt` a posso eettuare tale calcolo in modo molto rapido e semplice
111
A.3 Aggiornamento di dati dierenziali a partire
da dati integrali
Supponiamo ora di avere una libreria p composta da N elementi, con N
molto grande. Tale libreria è utilizzata per ricavare dei parametri integrali
r in numero I molto minore di N. Supponiamo per ora che p ed r non siano
correlati.
Supponiamo di essere in grado di calcolare r con un modello esatto, in
modo tale dunque che lerrore sulla risposta risulterà dipendere soltanto da
p.
Il nostro scopo è quello di aggiornare la libreria. Come accennato in
precedenza, il discorso ora si ribalta: misuro r sperimentalmente e mi pongo
il problema di utilizzare il confrontro tra il valore numerico e quello sperimen-
tale per ottenere un aggiornamento per i dati di partenza. In particolare il
modo utilizzato per scegliere quale sia il valore opportuno per laggiornamen-
to della libreria sarà quello di minima distanza dallorginale: supponendo
dunque che i dati di partenza fossero scorretti ma comunque sensati, lidea
è quella di fare in modo di soddisfare le condizioni sperimentali andando
tuttavia a modicare la libreria di partenza il meno possibile. Questo modo
di procedere è detto principio della massima verosimiglianza.
Denisco dunque:
p la libreria originaria
p
la libreria soddisfacente la prova sperimentale

r(p) la risposta, ovvero il parametro integrale r calcolato in funzione del-
linsieme dei valori contenuti nella libreria p
S
n
=
r
p
n
lelemento del vettore di sensibilità, che mi dice come la risposta
r è inuenzata dalln-esimo parametro della libreria p
d = r(p) r la dierenza tra il valore della risposta ottenuta numericamente
utilizzando i dati della libreria non aggiornata e lo stesso valore cal-
colato sperimentalmente (o tramite libreria aggiornata: i due valori in
questo primo caso coincidono)
x = p
p la dierenza tra la libreria vecchia e quella aggiornata. Queso

è il valore che ci imponiamo di minimizzare.
Supponendo che, comunque, la libreria di partenza non sia troppo im-
precisa, e che dunque il risultato proveniente da essa non sia troppo lontano
da quello reale, posso linearizzare la dierenza tra i due valori, scrivendo
che:
r(p
) r(p) +
r
p
(p
p)
112
Che, ricorrendo alla notazione introdotta in precedenza, può essere anche
scritta come;
sx +d = 0
Il mio obbiettivo è, come detto, quello di ridurre al minimo il valore di x.
Il mio problema è dunque quello di trovare un x che soddis lequazione
sx +d = 0 ed al tempo stesso minimizzi il valore di x
2
. Per farlo il metodo
principe è quello dei moltiplicatori di Lagrange, che mi permette di passare
istantaneamente da un problema di minimo condizionato ad uno di minimo
incondizionato. Lespressione da minimizzare diverrà dunque:
R(x) = x
T
x + 2(sx +d)
Ove il coeciente 2 è posto per comodità e non inuenza la correttezza del
metodo. Si ottiene cos` che, derivando:
R
x
= 2(x
T
+s) = 0
Tale espressione costituisce , insieme allequazione di partenza, N+1 equazioni
per la determinazione delle N+1 incognite: le x e il moltiplicatore . Si
ottiene dunque che:
x = s
T
Che, sostituito nella sx +d = 0 fornisce:
ss
T
+d = 0
da cui:
=
d
ss
T
ed, inne:
x =
d
ss
T
s
T
Questo risultato può e deve essere esteso al caso in cui non si abbia una sola
risposta r, ma un vettore di I componenti integrali (in numero inferiore alle
N componenti della libreria). Ciò che ne risulta è assolutamente identico al
caso precedente, ove al posto del vettore s e del suo trasposto compariranno
la matrice S e trasposta.
Bisogna tuttavia notare che le considerazioni eettuate sino ad ora sono
relative a dati privi di incertezze. Questo non è ovviamente il caso di una
situazione reale, ed è opportuno dunque estendere il calcolo al caso pi` u
realistico in cui i dati presi in considerazione sono aetti da incertezze.
Partiamo da alcune considerazioni teoriche. Ci aspetteremo che, tra i
vari paramtri contenuti nella libreria che vogliamo aggiornare, ve ne saranno
di pi` u e meno precisi, ovvero alcuni valori avranno dati di incertezza pi` u
ampi di altri. In questottica appare chiaro che, al ne di un aggiustamento,
113
cercheremo di concentrare la nostra opera sui dati pi` u incerti, che sappiamo
essere da un lato pi` u bisognosi e dallaltro pi` u facilmente responsabili
dellerrore.
Per questo ciò che andremo ad utilizzare non sarà il dato in sè, ma il suo
rapporto con la sua stessa deviazione standard. In questo modo abbiamo da
un lato adimensionalizzato i parametri in ingresso, e dallaltro siamo sicuri
di aver tenuto in conto anche della incertezza su di essi. Possiamo dunque
denire subito:
1
=
x
1
2
=
x
2
2

Da cui risulta che, in forma matriciale, x =
r(p
) = r(p +x) = r(p + )

Risolvendo il problema, ed accorgendosi che la matrice
2
non è altro che
la matrice di sensibilit` a C, otteniamo:
x = CS
T
(SCS
T
)
1
d
Finora si è lavorato imponendo lesatta uguaglianza tra il risultato sper-
imentale e la risposta ottenuta tramite la libreria aggiornata. Questa im-
posizione è in verità poco realistica, in quanto le incertezze di calcolo mi
impediranno generalmente di ottenere una eguaglianza esatta. Sarà dunque
necessario supporre tali valori come dierenti e cercare successivamente di
minimizzare la loro dierenza.
r(p
) =,= r
Ovvero che il risultato numerico ottenuto tramite lutilizzo della libreria ag-
giornata (e supposto dunque esatto), denito con r, è diverso dal risultato
sperimentale, denito con r. Se a questo punto riprendiamo lequazione di
partenza:
r(p
) = r(p) +S(p
p)
e sottraiamo membro a membro il valore del risultato sperimentale:
r(p
) r = r(p) r +S(p p
)
Otteniamo, deniendo y = r(p
) r si ottiene:
y = Sx +d
Andiamo ora a fare come nel caso precedente. Essendovi incertezza anche
su r, dovrò denire un nuovo vettore che tenga conto del fatto che le variabili
integrali di r soggette ad incertezza maggiore dovranno di fatto contare di
meno. Ecco dunque che scrivo y =
r
, da cui, ricorrendo ancora una volta
ai moltiplicatori di Lagrange:
R =
T
+
T
+ 2
T
(S
p

r
)
114
Ove ho quindi imposto la condizione di minimizzare non solo il valore di
(p p
) ma anche quello di (r(p
) r. Si arriva tramite i passaggi visti in

precedenza a scrivere che
4
:
x = C
p
S
T
(C
r
+SC
p
S
T
)
1
d y = C
r
(C
r
+SC
p
S
T
)
1
d
Vediamo però ora di vedere la cosa da un punto di vista pi` u formale. Def-
inite delle distribuzioni gaussiane per p ed r (entrambi sono infatti soggetti
ad incertezza, a dierenza di p che è la libreria vera ed r che è il cor-
rispondente risposta esatta), potremo scrivere la densità di probabilità
a due variabili per p ed r, supponendo che entrambe siano delle gaussiane
centrate sui valori esatti p ed r :
f(p, r) exp
1
2
[(p p
)
T
C
1
p
(p p
)] + [( r r
)
T
C
1
r
( r r
)]
Il problema è legato alla determinazione di p, libreria teoricamente esatta
e praticamente incognita. Per procedere denisco x = p p
e y = r r
,
da cui lesponente dellesponenziale diventa:
Q = x
T
C
1
p
x +y
t
C
1
r
y
Tale valore, per la risoluzione del problema, dovrà essere minimizzato. Uti-
lizzeremo ancora una volta i moltiplicatori di Lagrange, denendo cos` un
nuovo problema Q
Q
= x
T
C
1
p
x +y
t
C
1
r
y + 2
T
(Sx y)
Cercherò il minimo per x ed y, derivando lungo entrambe le direzioni, il che
mi fornisce i valori:
_
Q
x
= 2C
1
p
x + 2S
T
x = C
p
S
T
y
= 2C
1
r
y y = C
r
Essendo d = y Sx ottengo che:

d = C
r
+SC
p
S
T
In questa espressione lunico elemento che non conosco è . Esplicitando

lequazione per e sostituendo nel valore di ottimo trovato per x ottengo
x = C
p
S
T
(C
r
+SC
p
S
T
)
1
d
4
Si noti la dierenza tra C
r
e C
r
. Il primo rappresenta la matrice di covarianza della
risposta numerica, ottenibile di conseguenza come funzione della matrice di covarianza
della libreria C
p
; il secondo rappresenta invece la matrice di covarianza della misurazione
sperimentale, che nulla ha a che vedere, a priori, con le librerie numeriche
115
da cui, in denitiva
p
= p C
p
S
T
(C
r
+SC
p
S
T
)
1
d
Ecco dunque trovata unespressione per la variazione che dovrò dare alle
variabili p in funzione del confronto tra i dati sperimentali e i calcoli numerici
sui valori integrali. Questo metodo richiede linversione di una matrice, ma
si vede come le dimensioni di tal matrice siano di ordine I, quindi molto
ridotto rispetto alle dimensioni N del vettore p.
La base di tale teoria è la linearità delle perturbazioni, o meglio la
possibilità di linearizzarle senza troppi sconvolgimenti.
A.4 Teoria delle perturbazioni
Ravetto parte da un problema agli autovalori, tanto per fare le cose semplici.
Prendiamo ciò che dicono le dispense, e partiamo da un banale problema
del tipo:
H = S
ove supporremo, per dare un senso pratico ai conti, che H sia loperatore
dellequazione del trasporto neutronico, sia il usso neutronico stesso e
S sia una generica sorgente. Deniamo inoltre la variabile sperimentale r
(response) che dipenderà dal usso neutronico e che è di fatto utilizzata per
misurarlo. Sarà dunque:
r = D
Supponiamo ora che vi siano delle variazioni nelloperatore H che porteranno
inevitabilmente ad una diversità nella soluzione. Dunque avremo che:
(H
0
+H)(
0
+) = S
che diventa, essendo S = H
0
0
.
H
0
= H
0
Ove il pedice 0 indica loperatore non perturbato. La perturbazione sul
usso genererà anche una perturbazione nella risposta, data da:
r = r r
0
=
= (D) D(
0
) =
= (D)
Il punto risiede ora nella valutazione del termine . Per farlo ricorriamo al
problema aggiunto, denito come tale per cui
(g, Af) = (f, A
T
g)
116
ove g ed f sono due generiche funzioni.
Dunque se H = 0 è lequazione per il trasporto in forma omogenea,
allora H
T
= 0 è lequazione aggiunta, ove la sua soluzione sarà il usso

aggiunto.
A questo punto posso supporre di risolvere anche il problema aggiunto,
per il quale devo ancora imporre una sorgente, essendo infatti stato denito
no ad ora in termini omogenei. Supporrò dunque che la mia
sia soluzione
del problema aggiunto H
T
= D. Potrò cos` andarlo a sostituire ottenendo:

r = D = H
T
che, sfruttando la denizione di operatore aggiunto, diventa:

r =
H
Ricordando quanto scritto in precedenza posso inne scrivere:
r =
H
0

0
H
0
Da cui ineetti posso trarre il valore cercato di r senza passare per la
risoluzione di problemi perturbati ma soltanto utilizzando le soluzioni non
perturbate del problema diretto e del problema aggiunto.
Lo stesso può essere applicato ad un generico problema agli autovalori
A x = k B x. In questo caso andrò a risolvere il problema:
(A+
A
)(x +
x
) = (k +
k
)(B +
B
)(x +
x
)
Lo scopo della mia ricerca sarebbe quello di ottenere il valore per
k
senza
passare per (x +
x
), ovvero senza essere costretto a risolvere il problema
perturbato.
Se facciamo il prodotto di tutti i termini, tralasciando gli innitesimi di
ordine superiore al primo, otterremo:
Ax +A
x
+
A
x = kBx +kB
x
+k
B
x +
k
Bx
Ricordando che il problema originario recita A x = k B x, posso scrivere:
A
x
+
A
x = kB
x
+k
B
x +
k
Bx
Denisco ora operatore aggiunto, denito in modo tale che, date
f e g due generiche funzioni, sarà:
< g, f >=<
T
g, f >
Vado dunque a risolvere il problema aggiunto:
A
T
x
= kB
T
x
117
ove k rimane tale in quanto risulta proprietà degli operatori aggiunti quella
di mantenere gli autovalori degli operatori originari.
A questo punto moltiplichiamo tutta lequazione scalarmente per la soluzione
del problema agginto x
, ottenendo cos`:
x
, A
x
+x
,
A
x = kx
, B
x
+kx
,
B
x +
k
x
.Bx
Sfruttando le proprietà degli operatori aggiunti ottengo che il primo termine
a destra delluguale ed il primo a sinistra diventano:
x
, A
x
= A
T
x
,
x
e kx
, B
x
= kB
T
x
,
x
Che sommati tra loro danno contributo nullo in quanto rappresentano le-
qauzione delloperatore aggiunto:
A
T
x
kx
B
T
x
,
x
= 0
Ci siamo cos` liberati della perturbazione della soluzione
x
, e possiamo
scrivere che:
k
=
x
,
A
x k
,
B
x
x
, Bx
ove ancora una volta è necessario utilizzare solo le perturbazioni note e le
soluzioni del problema di partenza e del suo aggiunto.
118

Metodi Numerici v2.2

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Metodi Numerici v2.2

Uploaded by

Copyright:

Available Formats

Indice

1 Generalit`a sui metodi numerici 3

In denitiva, sommando i due fattori, si ottiene:

< 1. La norma innito `e infatti denita

< 1 allora (B) < 1

, supponendo che i nodi adiacenti nelle direzioni N S W E siano

sono evidentemente rispettivamente triangolare infe-

`e la matrice di iterazione del metodo di Gauss-Seidel.

Risolvendo per , diventa

avr`a modulo maggiore di

0, ove D() `e una matrice dipendente da parametro. Il caso

Zona Indicedizona spigoloesterno

Dunque anche loperatore matriciale nito ha come soluzione lo stesso au-

C]. Il calcolo dei coecienti sar`a

o di terzo grado, invece che linearmente.

, dopo il quale la popolazione neutronica continua ad aumentare

Per determinare inne gli

Ove si `e dunque supposto di poter scrivere (viste le ipotesi)

esca da un evento di interazione con energia E e

, ma sempre di valori compresi in un intorno dE o d del punto considerato

Il problema sar`a a questo punto andare a discretizzare tale equazione a

la libreria soddisfacente la prova sperimentale

p la dierenza tra la libreria vecchia e quella aggiornata. Queso

) = r(p +x) = r(p + )

) ma anche quello di (r(p

) r. Si arriva tramite i passaggi visti in

Essendo d = y Sx ottengo che:

In questa espressione lunico elemento che non conosco `e . Esplicitando

= 0 `e lequazione aggiunta, ove la sua soluzione sar`a il usso

= D. Potr`o cos` andarlo a sostituire ottenendo:

che, sfruttando la denizione di operatore aggiunto, diventa:

You might also like