You are on page 1of 118

Indice

1 Generalit`a sui metodi numerici 3
1.1 Analisi degli errori . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Condizionamento di un problema numerico . . . . . . . . . . 5
1.3 Stabilit`a di un algoritmo . . . . . . . . . . . . . . . . . . . . . 9
1.4 Criteri di convergenza e troncamento di processi iterativi . . . 12
2 Metodi numerici 16
2.1 Metodi di risoluzione di equazioni lineari con sorgente . . . . 16
2.1.1 Metodo di Jacobi . . . . . . . . . . . . . . . . . . . . . 16
2.1.2 Metodo di Gauss-Seidel . . . . . . . . . . . . . . . . . 23
2.1.3 Metodo di Jacobi vs Metodo di Gauss . . . . . . . . . 24
2.1.4 Metodo SOR . . . . . . . . . . . . . . . . . . . . . . . 25
2.1.5 Shift tra metodo di Jacobi e metodo SOR . . . . . . . 28
2.1.6 Ordinamento dei nodi di flusso . . . . . . . . . . . . . 29
2.2 Risoluzione di sistemi di equazioni non lineari . . . . . . . . . 30
2.2.1 Metodo di Newton per la risoluzione di sistemi non
lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Metodi per problemi agli autovalori . . . . . . . . . . . . . . . 31
2.3.1 Scomposizione QR di una matrice . . . . . . . . . . . 31
2.3.2 metodo QR . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.3 Metodo delle potenze . . . . . . . . . . . . . . . . . . 33
2.4 Propriet`a spettrali delle matrici di interazione . . . . . . . . . 38
2.5 Approssimazione di dati sperimentali . . . . . . . . . . . . . . 39
2.5.1 Funzioni spline . . . . . . . . . . . . . . . . . . . . . . 39
2.6 Integrazione numerica . . . . . . . . . . . . . . . . . . . . . . 42
2.7 Equazioni integrali . . . . . . . . . . . . . . . . . . . . . . . . 50
3 Metodi numerici per l’ingegneria nucleare 52
3.1 Introduzione alla tecnologia ed alla fisica nucleare . . . . . . . 52
3.1.1 Il concetto di criticit`a e le sue implicazioni . . . . . . . 55
3.1.2 Fenomeni non stazionari . . . . . . . . . . . . . . . . . 56
3.1.3 L’importanza neutronica ed i metodi per lo studio di
problemi pseudo-stazionari . . . . . . . . . . . . . . . 57
1
3.2 Il consumo del combustibile nucleare . . . . . . . . . . . . . . 60
3.3 Differenze finite fini . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.1 Diffusione monodimensionale monogruppo . . . . . . . 61
3.3.2 Problemi con sorgente . . . . . . . . . . . . . . . . . . 65
3.3.3 Non omogeneit`a dello spazio . . . . . . . . . . . . . . 66
3.3.4 Diffusione bidimensionale monogruppo . . . . . . . . . 69
3.3.5 Diffusione multigruppo . . . . . . . . . . . . . . . . . . 72
3.3.6 Accelerazione della convergenza delle iterazioni esterne 85
3.4 Metodi Coarse Mesh . . . . . . . . . . . . . . . . . . . . . . . 88
3.4.1 Metodi Quabox . . . . . . . . . . . . . . . . . . . . . . 89
3.4.2 Metodi Cubbox . . . . . . . . . . . . . . . . . . . . . . 92
3.5 Elementi di cinetica neutronica . . . . . . . . . . . . . . . . . 93
3.6 Elementi di Trasporto neutronico . . . . . . . . . . . . . . . . 101
3.6.1 Formulazione integrale . . . . . . . . . . . . . . . . . . 102
A Aggiustamento di sezioni d’urto 106
A.1 Introduzione alle basi di dati . . . . . . . . . . . . . . . . . . 106
A.2 Elementi di statistica . . . . . . . . . . . . . . . . . . . . . . . 108
A.3 Aggiornamento di dati differenziali a partire da dati integrali 112
A.4 Teoria delle perturbazioni . . . . . . . . . . . . . . . . . . . . 116
2
Capitolo 1
Generalit`a sui metodi
numerici
1.1 Analisi degli errori
L’analisi numerica di un problema fisico porta necessariamente alla pro-
duzione di un certo numero di errori, dei quali `e necessario conoscere l’entit`a
al fine di ridurla al minimo Esistono varie tipologie di errore:
Errori di idealizzazione : Derivano dalla decisione di trascurare deter-
minati elementi del problema fisico di partenza per semplicit`a
Errori di matematizzazione : Derivano dalla semplificazione delle equazioni
allo scopo di ottenere un modello matematico pi` u facile da trattare.
Questa perdita di informazioni `e di difficile recupero
Errori numerici : Risiedono intrinsecamente nella risoluzione numerica
di un problema. Sono costituiti ad esempio dalla discretizzazione
temporale e spaziale del problema
Errori sui dati di input : Derivano come facilmente comprensibile da
eventuali incertezze o imprecisioni sui dati di input
Errori di calcolo numerico : Derivano da tutte le approssimazioni ef-
fettuate all’interno della risoluzione del problema numerico, come il
troncamento di processi iterativi
Errori di misura : Derivano dal fatto che nel momento in cui si vanno a
confrontare i dati numerici con quelli sperimentali questi ultimi saran-
no inevitabilmente soggetti ad un errore di misura. In questa fase `e
opportuno ricordare che grande attenzione deve essere posta nell’uti-
lizzo degli strumenti, in particolare evitando che essi vengano utilizzati
al di fuori del loro range
3
Errori di arrotondamento : Derivano dal fatto che un calcolatore pu`o
memorizzare solo un numero finito di cifre decimali.
Viene qui approfondito il discorso legato agli errori di arrotondamen-
to. L’insieme detto dei numeri di macchina `e di fatto un sottoinsieme
dell’insieme dei numeri reali. All’interno di un calcolatore i numeri sono
immagazzinati in virgola mobile, ovvero sottoforma di un modulo e di
una potenza in base 10
1
che diventa virgola mobile normalizzata ove
il modulo della mantissa `e sempre 0.1 < [a[ < 1. Definito t il numero di cifre
decimali della mantissa, si avr`a ovviamente che le dimensioni dell’insieme
dei numeri di macchina aumentano con l’aumentare di t. Si ha banalmente
che per t → ∞ =⇒ A → R, ovvero se t tende ad infinito non commetto
errori di arrotondamento
2
.
Vediamo meglio come `e possibile definire l’errore di arrotondamento.
Si definisce l’operatore somma per il calcolatore, dato da
x y = (x +y)(1 +) con[[ ≤ eps
Si ricordi per`o che un calcolatore opera solo con numeri di macchina. Si
definisce dunque che se x non appartiene a tale insieme, esister`a un suo ar-
rotondamento opportuno che lo porter`a a diventare un numero di macchina
In generale avremo che eps ∼ 10
−22
. Apparentemente `e una quantit`a
molto piccola, ma se le operazioni sono associate a fattori di amplificazione
dell’errore derivanti dal cattivo condizionamento del problema pu`o risultare
rilevante la propagazione di tale errore.
Si supponga ora
y = a +b +c con ˜ y = fl((a +b) +c)
ove l’operazione “fl” indica operazione reale eseguita in virgola mobile.
Chiamando η = fl(a + b) risultato in virgola mobile della somma tra
parentesi, esso varr`a
η = (a +b)(1 +
1
)
da cui
˜ y = fl(η +c) =
= (η +c)(1 +
2
) =
= (a +b +c)[1 +
a +b
a +b +c

1
(1 +
2
) +
2
]
Si definisce ora
y
tale per cui ˜ y = (a +b +c)(1 +
y
)
1
ad esempio il numero 439 diventa 0.439 · 10
2
2
Per maggiore completezza `e necessario precisare che `e necessario che anche il numero
di cifre per l’esponente di 10 deve tendere ad infinito affinch`e l’insieme dei numeri di
macchina tenda a quello dei numeri reali
4
Si pu`o ragionevolmente pensare di trascurare il termine contenente la
moltiplicazione di due infinitesimi, in modo da ottenere

y
=
a +b
a +b +c

1
+
2
Si vede dunque che i due errori sono pesati con pesi diversi. In particolare,
nel caso in esame, l’errore sulla seconda operazione pesa pi` u di quello sulla
prima.
Due algoritmi diversi accumuleranno errori di arrotondamento in modo
diverso. Tuttavia questa considerazione perde di validit`a ove il valore di t
tenda ad infinito. Questa condizione `e definita di computer ideale ovvero
algoritmo indipendente.
In un computer reale invece, anche avendo in input solo numeri di
macchina, sono in genere sufficienti pochi passaggi per rendere nuovamente
necessaria una approssimazione, dando luogo ad errori di arrotondamento.
La quantificazione di tali errori `e data da eps = 5 10
−t
, ove tale valore `e di
fatto il massimo errore di arrotondamento che posso avere per ogni calcolo,
ed `e detto sensibilit` a del computer.
Va ricordato che un problema numerico `e disgiunto dalla strategia che
viene utilizzata per risolverlo. In sostanza il problema numerico e l’algorit-
mo che verr`a ad esso applicato per ricavare la soluzione sono slegati l’uno
dall’altro.
1.2 Condizionamento di un problema numerico
Elemento importante da studiare `e il condizionamento di un problema
numerico, che di fatto esprime la sua suscettibilit`a ad oscillazioni ed errori
sui dati di input. Un problema mal condizionato non pu`o essere risolto a
cuor leggero, in quanto non si pu`o essere sicuri dell’affidabilit`a dei risultati
ottenuti. Questo problema risulta di particolare interesse nei problemi nu-
cleari soprattutto per via di alcune grandezze sperimentali, come le sezioni
d’urto e le lunghezze di diffusione, il cui valore `e facilmente soggetto ad
incertezze anche importanti.
La maggior parte dei problemi di condizionamento `e legata alla sensi-
bilit`a del computer. Essa `e definita in maniera tale per cui a + b = a se
b < , ove `e proprio la sensibilit`a del computer.
Si prenda una generica funzione:
ϕ(x) =
_
_
_
ϕ
1
(x
1
....x
n
)
.
.
.
ϕ
n
(x
1
....x
n
)
_
_
_
Si chiami ora ˜ x il valore approssimato, affetto da incertezza, tale che ∆x =
[x − ˜ x[ e definisco
x
i
=
|x−˜ x|
x
la perturbazione o incertezza relativa.
5
Ovviamente nella realt`a il valore di tale perturbazione relativa non `e noto,
in quanto x stesso non `e noto. In generale tuttavia, quantomeno sui dati in
ingresso, si pu`o effettivamente quantificare tanto x quanto ˜ x
Il risultato desiderato `e una quantificazione del condizionamento del
problema, vale a dire una relazione del tipo ∆y = f(∆x)
Un esempio per procedere `e utilizzare uno sviluppo in serie di Taylor
troncato al prim’ordine.
∆y
i
= [˜ y
i
−y
i
[ = ϕ
i
(˜ x) −ϕ
i
x =
n

j=1
(˜ x
j
−x
j
)
∂ϕ
i
∂x
j
+ [...]
Il poter supporre che le entit`a [x−˜ x[ siano piccole permette di approssimare
la serie al prim’ordine. Evidentemente questo non `e sempre vero: ove le
siano dell’ordine del 30% del valore nominale, questa approssimazione non
`e pi` u valida.
Il vettore ∆y dato dalle singole componenti delle perturbazioni in uscita
sar`a dunque dato da:
∆y =
_
_
_
∂ϕ
1
∂x
1

∂ϕ
1
∂x
n
.
.
.
.
.
.
.
.
.
∂ϕ
m
∂x
1

∂ϕ
m
∂x
n
_
_
_
_
_
_
∆x
1
.
.
.
∆x
n
_
_
_
Che, in forma matriciale, diventa:
∆y = Dϕ(x) ∆x
Ove Dϕ(x) rappresenta la jacobiana della trasformazione calcolata in x.
Si ricorda a questo proposito che la jacobiana, calcolata in un punto preciso,
`e una matrice di numeri a tutti gli effetti, ed in questo caso costituisce il
fattore di amplificazione della perturbazione assoluta in ingresso
e dipende solo dalla definizione del problema numerico, e non dall’algorit-
mo scelto per la risoluzione. In particolare l’elemento ¦a
i,j
¦ rappresenta il
fattore di amplificazione con cui la componente i-esima del vettore in uscita
viene influenzata dalla perturbazione della j-sima componente del vettore di
input
Dunque, come gi`a detto in precedenza e qui dimostrato, il condiziona-
mento di un problema `e algoritmo indipendente.
Effettuando discorsi analoghi sugli errori relativi si ottiene il fattore di
amplificazione delle perturbazioni relative in ingresso:

y
i
=
n

i=1

x
j
(
∂ϕ
i
∂x
j
)
x
j
ϕ
i
Il condizionamento del problema tuttavia non `e uguale per tutti i valori
di input, ma potrebbe essere buono rispetto ad alcuni e meno rispetto ad
6
altri. Poich`e il fattore di amplificazione non `e un numero ma una matrice,
utilizzando un tipo di norma piuttosto che un’altra si potranno evidenziare
in modo pi` u o meno marcato eventuali picchi di condizionamento. Si noti
che, seppure la libert`a di scelta della norma da utilizzare `e ampia, l’operatore
“norma” di una matrice deve rispettare determinate propriet`a che ne perme-
ttono il confronto con vettori ed altre matrici. Un esempio classico di norma
`e |A| =
_

a
2
i,j
, ma una possibile alternativa `e anche |A| = max([a
i,j
[).
Si prenda un esempio di problema: ϕ(x, y) = x −y, da cui avremo

x−y
=
x
x −y

x

y
x −y

y
Da questo si vede che se (x − y) tende a zero i fattori di amplificazione
aumentano enormemente.
Se il problema `e lineare, esso `e scrivibile come
Ax = b
Lo studio del condizionamento di un problema lineare sar`a esprimibile dalla
soluzione del problema A(x+δx) = (b +δb), ove δb dipende dalla sensibilit`a
dello strumento.
La matrice A invece `e una caratteristica del problema numerico e non
varia con il termine sorgente. Ovviamente indipendentemente dal valore
della perturbazione, il problema `e risolvibile (in questo caso, con problema
linere e non omogeneo) solo se det(A) ,= 0
|δx|
|x|
≤ |A||A
−1
|
|δb|
|b|
Infatti si avr`a che:
Ax +Aδx = b +δb
Che, ricordando la dicitura iniziale del problema (che rimane ovviamente
valida anche in seguito alla perturbazione) diventa:
Aδx = δb → δx = A
−1
δb
Passando al confronto tra norme si ottiene:
|δx| = |A
−1
δb| ≤ |A
−1
||δb|
Ricordando che vale anche che:
|b| = |Ax ≤ |A||b|
Si ottiene che, dividendo ambo i membri della disequazione precedente per
la norma di b, si ottiene:
|deltax|
|A||x|
≤ |A
−1
|
|δb|
|b|
7
Dalla quale si deriva facilmente quanto si voleva dimostrare
Il valore |A||A
−1
| `e definito fattore di amplificazione, e dipende
da A. Pi` u tale fattore `e alto, peggiore sar`a il condizionamento del problema.
Si tenga ben presente il fatto che finora non `e mai stato fatto alcun cenno
ad algoritmi o a metodi di risoluzione del problema. Il condizionamento di
un problema `e infatti algoritmo indipendente, ed `e invece strettamente
legato al problema fisico di partenza.
In tutti questi passaggi si noti che gli errori considerati non sono nec-
essariamente quelli sui dati in ingresso. Il vettore x di input pu`o essere
contenuto in una qualsiasi fase del problema, e dunque l’errore ad esso as-
sociato potrebbe essere, ad esempio, l’errore di arrotondamento derivante
dall’approssimazione del risultato del calcolo precedente.
Questo insieme di considerazioni prende il nome di backward anal-
ysis ed ha la funzione di validare problemi ed algoritmi in funzione del
condizionamento del problema. Il punto chiave del problema risiede ove un
eventuale errore di calcolo porti ad ottnere comunque risultati plausibili, il
che rende difficile accorgersi della presenza di un errore dalla semplice analisi
dei risultati.
Prendiamo un esempio molto comune: ci si trova davanti ad un poli-
nomio di grado n del quale si vogliono identificare gli zeri. Questo `e un
problema spesso non lineare, il cui condizionamento raramente `e buono, e
tanto peggiore quanto pi` u alto `e il grado n del polinomio, anche se non tutti
gli zeri sono condizionati allo stesso modo. In generale infatti avremo che
un generico zero µ
i
di un polinomio `e mal condizionato se:
_
∂P
n
∂µ
_
µ
i
→ 0
In generale ove ci troviamo di fronte ad un problema mal condizionato non
`e possibile risolverlo cos`ı com’`e tramite algoritmi. Si rivela in questi casi
necessario andare a variare ci`o che `e stato fatto a monte, cercando ad esempio
di ridurre gli errori iniziali (idealizzazione, matematizzazione, ecc.) o a
riconsiderare il problema dall’inizio. Tuttavia nessuna di queste opzioni
fornisce garanzie sul risultato finale.
Spesso accade dunque che un problema del tipo P
n
(x) = 0 venga trasfor-
mato in un problema Ax = λx, ove i due non hanno niente in comune se
non la soluzione.
3
3
Si noti come tutti i discorsi fatti fino ad ora per gli errori possano essere applicati in
maniera perfettamente analoga a delle perturbazioni “volontarie”, come potrebbe essere
ad esempio il voler testare come il punto di funzionamento di un sistema `e influenzato dal
variare dei parametri operativi
8
1.3 Stabilit`a di un algoritmo
Si prenda ora un passaggio qualunque del processo risolutivo di un problema
numerico. Ogni singola operazione di un algoritmo si presenter`a come una
specie di micro-problema numerico, in cui in ingresso si ha il risultato di
tutte le operazioni che stanno a monte che sar`a, evidentemente, soggetto ad
una incertezza legata agli arrotondamenti precedenti. Sar`a dunque neces-
sario anche lo studio del condizionamento di tale micro-problema, definito
condizionamento locale. In questa visione dunque un algoritmo non `e
altro che una serie di micro-problemi numerici, che vanno studiati localmente
dal punto di vista del condizionamento.
Un esempio banale di questo concetto `e l’operazione x−y. Tale problema
`e fortemente mal condizionato.
Supposto che in una qualsiasi operazione ¦x
1
, x
2
, ..., x
n
¦ sia il vettore
dei dati in ingresso ed ¦y
1
, y
2
, ..., y
m
¦ sia il vettore di uscita, si pu`o definire
y = ϕ(x) il problema numerico, che sar`a caratterizzato da:
ϕ : D →R
m
D ⊆ R
n
y ∈ R
m
x ∈ R
n
_
y
i
= ϕ
i
(x
1
, ....x
n
)
i = 1 : m
Cosa `e invece l’algoritmo? Si avr`a che
ϕ
(i)
: D
(i)
→ D
(i+1)
con i = 0 : r e D
(j)
⊆ R
n
j
ϕ = ϕ
(r)
ϕ
(r−1)
ϕ
(1)
ϕ
(0)
Dunque se il dato di ingresso `e x
0
, si avr`a che il dato in uscita sar`a
ϕ
(0)
x
0
= x
1
−→ ϕ
(1)
x
1
= x
2
... −→ ϕ
(r)
x
r
= x
r+1
Per risolvere un problema numerico si possono applicare molti algoritmi
diversi. Al di l`a delle questioni che vedremo in seguito sul costo e la velocit`a
di convergenza di un algoritmo, `e importante a priori assicurarsi che esso sia
ben fatto, dall’inglese robust.
Per verificare la stabilit`a di un algoritmo si tengono in conto gli arroton-
damenti in virgola mobile ed il condizionamento del problema che si vuole
andare a risolvere.
Si supponga di avere un algoritmo composto da r funzioni ϕ
(i)
, ciascuna
delle quali sia derivabile e continua nel suo dominio. Si definisce inoltre
una nuova funzione ψ
(i)
come la trasformazione residua, data dalla
composizione di tutte le ϕ
(j)
con i ≤ j ≤ r. Ne deriva che ψ
(0)
≡ ϕ
Sapendo che vale
D(f ◦ g)
x
= D(f)
x
D(g)
x
9
`e possibile definire le jacobiane di ϕ e ψ, ed in particolare si pu`o dire che:
Dϕ(x) = Dϕ
(r)
(x
(r)
)Dϕ
(r−1)
(x
(r−1)
) Dϕ
(0)
(x
(0)
)

(i)
(x
(i)
) = Dϕ
(r)
(x
(r)
)Dϕ
(r−1)
(x
(r−1)
) Dϕ
(i)
(x
(i)
)
Si ricorda che, nel momento in cui si parla di un algoritmo, si parla di un
computer reale , il che porta a dire che il numero di cifre della mantissa `e
finito. Si avr`a dunque a che fare con grandezze approssimate del tipo:
˜ x
(i+1)
= fl(ϕ
(i)
(˜ x
(i)
))
Quello che ora `e necessario calcolare `e il valore di ∆x
i
ad un i-esimo passaggio
di un algoritmo, che sar`a dato dal valore approssimato ottenuto meno il
valore esatto:
∆x
(i+1)
= [fl(ϕ
(i)
˜ x
(i)
) −ϕ
(i)
x
(i)
]
Sommando e sottraendo la quantit`a [ϕ
(i)
˜ x
(i)
] si ottiene:
∆x
(i+1)
= [fl(ϕ
(i)
(˜ x
(i)
)) −ϕ
(i)
(˜ x
(i)
)] + [ϕ
(i)
(˜ x
(i)
) −ϕ
(i)
(x
(i)
)]
Il secondo termine tra parentesi quadre rappresenta il condizionamento lo-
cale del problema ϕ
(i)
, e sar`a dunque uguale a

(i)
(˜ x
(i)
) −ϕ
(i)
(x
(i)
)] = Dϕ
(i)
(x
(i)
) ∆x
(i)
Ne consegue che l’errore finale non sar`a semplicemente la somma degli errori
di arrotondamento, ma conterr`a anche il contributo del condizionamento di
ogni step dell’algoritmo considerato.
Per calcolare invece il contributo dato dal primo termine tra parentesi
quadre si deve svolgere come segue. Essendo ϕ
(i)
una funzione a pi` u variabili,
si potr`a scrivere:
ϕ
(i)
=
_
¸
¸
¸
¸
_
ϕ
(i)
1
(u)
ϕ
(i)
2
(u)
.
.
.
ϕ
(i)
n
(u)
_
¸
¸
¸
¸
_
Prendendo la j-esima di queste funzioni e analizzando il suo operare su u in
virgola mobile si ottiene un risultato affetto dal seguente errore:
fl(ϕ
(i)
j
(u)) = (1 +
j
)(ϕ
(i)
j
(u)) con [
j
[ ≤ eps
Mettendo il tutto in una equazione pi` u compatta si potr`a dunque scrivere:
fl(ϕ
(i)
(u)) = (I +E
(i+1)
)(ϕ
(i)
(u))
Con
E
(i+1)
=
_
_
_

(i+1)
1
0
.
.
.
0
(i+1)
n
_
_
_
10
Questa `e dunque l’espressione che interessa, ricordando che al posto di u ci
sar`a ˜ x
(i)
. In realt`a si adotter`a qui l’approssimazione di supporre l’errore di
arrotondamento piccolo, andando cio`e a confondere ˜ x
(i)
con x
(i)
. Dunque in
definitiva
[fl(ϕ
(i)
˜ x
(i)
−ϕ
(i)
(˜ x
(i)
)] · E
i+1
ϕ
(i)
(x
(i)
)
Il termine a destra dell’uguale `e chiamato anche α
i+1
ed `e chiamato errore
assoluto di arrotondamento che nasce dal calcolo in virgola mobile di
ϕ
In definitiva, sommando i due fattori, si ottiene:
∆x
(i+1)
· E
i+1
ϕ
(i)
(x
(i)
) +Dϕ
(i)
(x
(i)
) ∆x
(i)
Quanto varr`a in definitiva ∆y ? Sar`a legato sia al microcondizionamento
che al macrocondizionamento, nonch`e agli errori di arrotondamento. Chia-
mando α
i
l’errore di arrotondamento all’i-esima iterazione si avr`a che:
• per i=0 ∆x
(0)
= ∆x
• per i=1 ∆x
(1)
= Dϕ
(0)
(x
(0)
)∆x +α
1
• per i=2 ∆x
(2)
= Dϕ
(1)
(x
(1)
)[Dϕ
(0)
(x)∆x +α
1
] +α
2
Si vede dunque che gli errori non si sommano ma si propagano. Dunque
infine ricordando della propriet`a della jacobiana di una composizione di
funzioni, varr`a che:
∆y = Dϕ(x)∆x +
r

i=0

(i)
(x
(i)

i
+E
r+1
y
Si avr`a dunque un primo contributo, dato dal macrocondizionamento del
problema ed indipendente dall’algoritmo, pi` u un termine dato dalle oper-
azioni interne dell’algoritmo costituito da una composizione degli errori e
della jacobiana della funzione composta ψ. Questa seconda parte `e quella
legata dunque alla stabilit`a dell’algoritmo, che sar`a considerato accettabile
ove l’incertezza legata all’algoritmo `e confrontabile con quella generata a
priori dal problema numerico. Si dir`a in questo caso che l’algoritmo `e ben
fatto o robusto. Si faccia attenzione tuttavia al fatto che il concetto di ro-
bustezza e stabilit`a di un algoritmo `e indipendente da quello di convergenza
del problema, che `e invece calcolata in termini ideali.
Venendo infine al termine E
r+1
y, si vede che esso rappresenta la coda del-
l’errore, l’arrotondamento sull’ultimo step dell’algoritmo, `e evidentemente
sempre presente ed il suo valore `e maggiorato da E
r+1
y ≤ eps[y[. Si avr`a in-
oltre che qualunque sia il problema o l’algoritmo, a meno che in ingresso non
si abbiano solo numeri di macchina esister`a anche un arrotondamento sui
dati in ingresso. Si definisce in definitiva errore inevitabile la quantit`a:

(0)
y = eps([Dϕ(x)[[x[ +[y[)
11
Comunque sia fatto l’algoritmo, non `e possibile andare al di sotto di questo
errore, ed `e per questo usato come termine di paragone.
Si tenga conto che, in generale, non `e possibile analizzare per intero, step
per step, la stabilit`a di un algoritmo che abbia qualche migliaio di passaggi.
Quel che si fa `e, in generale, analizzare soltanto le situazioni considerate
potenzialmente critiche.
1.4 Criteri di convergenza e troncamento di pro-
cessi iterativi
Uno dei problemi principali in analisi numerica `e quello di stabilire un cri-
terio per determinare la convergenza di un problema iterativo. Tale proced-
imento `e purtroppo effettuabile a priori solo nella risoluzione di problemi
lineari. Per quanto riguarda invece i problemi non lineari questo non `e
sempre vero.
Altra questione non da poco conto `e quella di stabilire un criterio per il
troncamento di un processo iterativo. Posto infatti che l’algoritmo porti a
convergenza, ci si chiede quale sia il momento per arrestare il calcolo, de-
finendo cos`ı la soluzione che, pur non essendo quella esatta, verr`a considerata
come definitiva.
Bisogna fare attenzione alle caratteristiche intrinsecamente diverse di
differenti algoritmi, che potranno convergere pi` u o meno velocemente gli uni
rispetto agli altri. Risulta dunque in genere inopportuno arrestare un pro-
cesso iterativo dopo un numero arbitrario di iterazioni, poich`e la soluzione
potr`a essere troppo o troppo poco precisa a seconda della velocit`a di conver-
genza dell’algoritmo utilizzato. Per questo `e opportuno stabilire dei criteri
di convergenza che diano informazioni su quale sia il momento migliore per
il troncamento
4
.
Riguardo la velocit`a di convergenza `e opportuno fare un discorso ulte-
riore. In numerica ogni cosa si paga, e di conseguenza un algoritmo che
converge pi` u velocemente sar`a, in genere, pi` u “costoso“, ovvero presenter`a
all’interno di ogni iterazione calcoli pi` u complessi od in numero maggiore.
Il numero totale delle operazioni effettuate da un algoritmo `e infatti quan-
tificabile come NxM, ove N `e il numero di iterazioni ed M `e il numero di
operazioni per iterazione.
La scelta dell’algoritmo da utilizzare non `e dunque banale e richiede accu-
rate considerazioni di rapporto costi-benefici. Una strategia spesso attuata
`e inoltre quella di utilizzare differenti algoritmi in cascata per la risoluzione
dello stesso problema.
4
Esistono poi casi particolari, come si vedr`a in seguito a proposito della teoria della
diffusione, ove invece viene imposto un numero fissato di iterazioni. Le ragioni di questa
scelta saranno pi` u evidenti quando ne verranno chiarite le implicazioni nel relativo capitolo
12
Esistono inoltre procedure di accelerazione di algoritmi lenti, che perme-
ttono di ridurre il numero di iterazioni senza incrementare eccessivamente il
numero di operazioni per iterazione.
Importante `e segnalare che le zone dell’asse delle iterazioni non sono
tutte uguali, ed in particolare `e possibile definirne due:
Zona delle prime iterazioni : qui si ha elevata differenza tra due soluzioni
successive. Tale zona non `e assestata, avvengono sconvolgimenti notevoli,
e spesso non `e possibile effettuare considerazioni sulla convergenza di
un algoritmo, che `e influenzata anche dal termine forzante.
Zona asintotica : qui vi sono pochi sconvolgimenti, ma la convergenza `e
lenta e vi `e differenza molto limitata tra due soluzioni successive. Dal-
l’altro lato `e per`o la velocit`a di convergenza `e molto spesso stimabile
a priori e dipende solo dalla matrice di iterazione dell’algoritmo.
Soffermandosi sulla zona asintotica si nota che un algoritmo molto lento
potrebbe indurre a credere di trovarsi gi`a prossimi alla convergenza, quando
invece se ne `e ancora ben lontani
Una soluzione a tale problema `e quella di utilizzare il residuo, ovvero la
differenza dall’eguaglianza che si ottiene andando a sostituire la soluzione ap-
prossimata nell’equazione di partenza. L’entit`a di tale residuo dar`a dunque,
generalmente, informazioni utili sulla qualit`a della soluzione ottenuta.
Si prenda ad esempio un generico problema del tipo Ax = b. Si definsice
x soluzione esatta del problema, ove invece x
n
ne `e la soluzione approssimata
all’n-esima iterazione. Ne viene che:
A¯ x −

b =

0
Ax
n

b = r ,=

0
Calcolare il valore di | r | pu`o come detto aiutare a valutare il livello di
convergenza della soluzione.
Il problema del residuo tuttavia `e che, per come esso `e stato sinora
definito, si tratta di una quantit`a assolulta, il che implica che la sua in-
terpretazione non `e immediata. Tale criterio verr`a in generale utilizzato in
AND con altri criteri di convergenza.
Per quel che riguarda i criteri sulla soluzione in s´e, esistono in generale
due approcci:
Norma : Non conoscendo la soluzione si utilizza uno pseudo-errore relativo:

m+1
−Φ
m
|

m+1
|

N
Tramite questo metodo si perde il dettaglio sulla singola componente,
concentrandosi invece sull’insieme dei valori. Esistono ovviamente
numerose norme che possono essere applicate per questo criterio
13
Puntuale : In questo caso non si mescolano tra loro le componenti, ma per
ciascuna viene valutata la convergenza:

m+1
i
−Φ
m
i
[

m+1
i
[

P,i
∀i
Il problema `e ora chiaramente spostato sul valore dell’errore massimo da
imporre per il troncamento del processo iterativo, la cui scelta sar`a ovvia-
mente data dal rapporto costo/benefici. Il criterio puntuale `e, ad esempio,
pi` u stringente e porter`a in generale ad ottenere una soluzione pi` u precisa
ma al costo di un numero maggiore di iterazioni. La scelta verr`a comunque
effettuata soprattutto in base a considerazioni fisiche. Nel caso, ad esempio,
del calcolo delle sezioni d’urto medie sull’intervallo energetico non `e richi-
esta la convergenza puntuale. Nel caso invece di sistemi di sicurezza ove vi
sono vari parametri sotto controllo, sar`a necessario applicare un criterio di
convergenza puntuale per evitare imprecisione elevata su parametri molto
delicati. Si noti in ogni caso che `e possibile anche utilizzare pi` u criteri di
convergenza, ad esempio puntuale su alcune elementi del vettore soluzione
e in norma sulla soluzione presa interamente.
Quali sono le possibilit`a che si hanno nel caso di fallimento di un algo-
ritmo?
• Nel caso in cui l’algoritmo diverga, ovvero non fornisca una soluzione,
la causa pu`o avere due nature distinte:
– Natura fisica: c’`e un errore nella definizione del problema fisico
che rende la soluzione non consistente
– Natura numerica: c’`e un errore nell’algoritmo
• L’altro caso `e quello in cui l’algoritmo fornisce comunque una soluzione,
diversa tuttavia da quella esatta. Questi sono in effetti i casi pi` u peri-
colosi, perch`e se in un contesto di modellizzazione di fenomeni osservati
sperimentalmente `e facile effettuare una verifica accorgendosi dell’er-
rore
5
, dall’altro lato se sono in fase di progettazione non `e possibile
fare questo controllo diretto fino a che non `e realizzato un prototipo
6
.
5
Oggigiorno il grande sviluppo dei metodi numerici e la loro sempre maggiore affid-
abilit` a stanno portando al verificarsi di condizioni opposte: talvolta `e, in effetti, il metodo
numerico che viene utilizzato per validare una determinata procedura sperimentale e non
viceversa. Altro aspetto del potenziamento dei metodi numerici `e che essi hanno talvol-
ta permesso di prevedere fenomeni che solo successivamente `e stato possibile osservare
sperimentalmente
6
Anche in questo caso comunque non sempre le condizioni sono agevoli, anzi. Le situ-
azioni tipiche dei reattori nucleari sono infatti particolarmente negative: non soltanto i
prototipi sono particolarmente dispendiosi, ma anche una volta che questi vengono realiz-
zati non `e affatto facile effettuare misure di flusso neutronico per validare i calcoli numerici
tramite dati sperimentali. Le uniche apparecchiature che permettono di effettuare tale op-
14
erazione sono i TIP (Travelling Incore Probes), sonde che viaggiano in canali dedicati e
che permettono l’ottenimento di misure discrete. Dal punto di vista sperimentale spesso
vengono realizzati dei sistemi di prova, poco corrispondenti alla versione industriale del
progetto, ma la cui natura semplice e ben nota permette di agevolare la validazione dei
modelli numerici. Sistemi di questo tipo sono detti benchmarks
15
Capitolo 2
Metodi numerici
2.1 Metodi di risoluzione di equazioni lineari con
sorgente
2.1.1 Metodo di Jacobi
Il metodo di Jacobi `e un algoritmo iterativo che converge alla soluzione di
un problema lineare non omogeneo. Esso costituisce l’algoritmo base, di cui
si vedranno in seguito le evoluzioni. Viene in genere utilizzato solo nella fase
turbolenta delle prime iterazioni per sgrossare la soluzione.
Supponiamo di operare con una matrice a diagonale dominante. Si vedr`a
nelle prossime righe come effettivamente questa condizione `e garanzia della
convergenza dell’algoritmo.
Il metodo di Jacobi prevede di spezzare la matrice A di interazione del
problema in due matrici:
• Una matrice D, diagonale e facilmente invertibile
1
• Una matrice E, tale che A = D - E
Dunque il problema diventa:
DΦ = EΦ +S
Il calcolo di D
−1
`e molto semplice, dunque potr`o scrivere per questo prob-
lema:
Φ = D
−1
EΦ +D
−1
S
Ricordiamo che la moltiplicazione di una matrice o vettore qualsiasi per una
matrice diagonale mi fornisce come risultato il prodotto di ciascun elemento
di ogni riga per l’elemento della diagonale corrispondente.
1
si ricorda che una matrice diagonale `e invertibile solo se tutti i suoi elementi sulla
diagonale sono diversi da 0. Al tempo stesso `e anche dimostrabile che, data una matrice
invertibile, `e sempre possibile effettuare permutazioni di riga e di colonna che portino
all’ottenimento di una matrice avente solo elementi non nulli sulla diagonale
16
Chiamer`o ora:
• B = D
−1
E matrice di iterazione
2
• q = D
−1
S
Da cui risulter`a
Φ = BΦ +q
Si vede che, per come `e costruita, la matrice B `e a diagonale nulla ed i suoi
elementi diversi da zero sono sempre negativi ed inferiori ad 1 in modulo,
essendo essi definiti come b
ij
= −
a
ij
a
ii
∀ i ,= j
Da tutto questo segue che |B|

< 1. La norma infinito `e infatti definita
come il valore massimo tra le somme degli elementi delle righe di una matrice
(max(

i
[a
ij
[).
Nel momento in cui si trasforma quanto detto in un processo iterativo
opero un’assegnazione, che mi porta ad una scrittura di questo tipo:
Φ
(m+1)
= BΦ
(m)
+q
Dunque si utilizza ogni volta il flusso dell’iterazione m-esima per calcolare
quello dell’iterazione successiva. E’ stato dunque dato il via ad un processo
iterativo.
Si pu`o dimostrare che tale metodo porterebbe, dopo un numero infinito
di iterazioni, alla soluzione esatta.
Si prenda l’equazione di iterazione e si sottragga ad entrambi i membri
la soluzione esatta. Ne verr`a:
Φ
(m+1)
−Φ = BΦ
(m)
+q −Φ
Ma essendo Φ = BΦ +q, si avr`a
Φ
(m+1)
−Φ = BΦ
(m)
+q −BΦ −q = B(Φ
(m)
−Φ)
Lo scopo `e chiaramente quello che sia

(m+1)
−Φ| < |Φ
(m)
−Φ|
Partendo ora con Φ
(0)
= 0, Ne seguir`a che:
_
¸
¸
¸
_
¸
¸
¸
_
Φ
(1)
= q
Φ
(2)
= BΦ
(1)
+q
.
.
.
Φ
(n+1)
= BΦ
n
+q
2
da non confondere con la matrice di interazione, la matrice del problema orginiario,
che nel nostro caso `e A
17
Per come sono definite, le iterazioni possono anche essere scritte come:
_
¸
¸
¸
_
¸
¸
¸
_
Φ
(1)
= q
Φ
(2)
= Bq +q
.
.
.
Φ
(n+1)
= q +Bq +B
2
q + +B
n
q
Si vede dunque che il flusso neutronico all’n-esima iterazione dipende solo
da B e da q. Da qui si vede che si ha di fatto una specie di serie geometrica
matriciale, che nella pratica converge solo se |B| < 1.
Dunque la soluzione di partenza `e proprio il termine forzante, mentre
ogni iterazione andr`a ad affinare la soluzione aggiungendo ulteriori termini.
Attenzione per`o: il fatto che B sia cos`ı importante non `e necessariamente
una buona notizia. La matrice B `e infatti strettamente dipendente da A,
la quale `e legata a sua volta alla fisica del problema. Dunque se B non
converge, ci sar`a poco da fare: sar`a necessario trovare una soluzione a monte
dell’impostazione del problema fisico.
Si pu`o ora notare un altro dettaglio. Andando infatti a prendere l’ultimo
termine di ogni iterazione e li mettiamo a vettore, ho di fatto costruito il
metodo delle potenze (vedi paragrafo 2.3.3 a pagina 33), che mi permette di
calcolare gli autovalori di una matrice. Dunque l’ultimo termine dell’ultima
iterazione tender`a, per numero infinito di iterazioni, a divenire parallelo all’
ϕ
0
autosoluzione fondamentale del problema
Bϕ = µϕ
Ove µ `e l’autovalore di modulo massimo e ϕ l’autovettore corrispondente.
Questo discorso, per ora apparentemente di scarsa utilit`a, verr`a utilizzato
quando si parler`a del metodo SOR che costituisce, di fatto, un upgrade del
metodo di Jacobi.
Si dimostra ora un teorema di fondamentale importanza per questi prob-
lemi:
Teorema 1 Condizione necessaria e sufficiente affinch´e il metodo di Jacobi
converga `e che ρ(B) < 1
Da qui deriva il fatto della convergenza del problema se la sua matrice di in-
terazione `e a diagonale dominante: si ha infatti una serie di consequenzialit`a
a cascata che ci dicono che:
• Se la matrice A `e a diagonale dominante, allora vale che |B|

< 1
• Se |B|

< 1 allora ρ(B) < 1
3
• Se ρ(B) < 1 allora il metodo di Jacobi converge, tanto pi` u velocemente
quanto pi` u il valore del raggio spettrale `e piccolo
3
Questo vale in realt`a per ogni norma di matrice compatibile con una di vettore
18
Si vuole ora dimostrare il concetto fondamentale che sta alla base degli
studi di convergenza del metodo di Jacobi: che la convergenza di tale metodo
`e associata al raggio spettrale della matrice di iterazione
Per farlo `e necessario definire ed enunciare le propriet`a di una categoria
di matrici, dette matrici irriducibili
Definizione 1 Una matrice quadrata `e irriducibile se per ogni coppia di i,j
distinti esiste almeno una successione finita di interi, compresi tra 1 ed n
(dove n `e la dimensione della matrice) che va da i a j del tipo
i = m
0
→ m
1
→ m
2
→ → m
q
= j
tale che:
a
m
0
,m
1
, a
m
1
,m
2
, , a
m
(q−1)
,m
1
sono tutti diversi da 0
Non `e facile dimostrare che una matrice `e irriducibile, mentre molto pi` u
facile `e dimostrare che una matrice non lo `e. Di fatto comunque, a livello
logico, l’irriducibilit`a di una matrice indica il fatto che tutti i nodi sono
in qualche modo collegati tra loro. Ecco dunque perch`e irriducibile: se un
problema fisico `e rappresentato da una matrice riducibile, esso pu`o essere
spacchettato (e dunque, ridotto) in pi` u problemi di ordine inferiore.
Teoricamente sarebbe necessario dimostrare che per ogni coppia di el-
ementi della discretizzazione esite un percorso fatto di linee verticali od
orizzontali che collegano tali elementi passando solo attraverso elementi non
nulli. Il problema `e che dimostrarlo per tutte le coppie possibili non `e affatto
facile.
Quale potrebbe essere un problema riducibile? Si tratta ad esempio del
caso, sempre in ambito nucleare, di due zone di materiali diversi separate
da una barriera di un materiale assorbitore perfetto. La matrice legata a
tale problema sar`a dunque riducibile in quanto ci`o che accade ai neutroni
nella zona 1 non influenza in alcun modo ci`o che invece avviene nella zona
2.
4
.
Teorema 2 Se una matrice `e riducibile `e sempre possibile, permutando
opportunamente righe e colonne, portarla ad una forma di tipo diagonale a
blocchi:
_
ˆ
A
1
ˆ
0
ˆ
0
ˆ
A
2
_
Viene ora mostrata una prima applicazione della propriet`a di irriducibilit`a
di una matrice:
4
Un esempio pratico di sistemi caratterizzati da matrici di riducibili sono i cosiddetti
rubbiatroni, ove si opera in modo da creare delle specie di “gabbie stagne” per i neutroni
per determinate energie
19
Teorema 3 Se una matrice A `e irriducibile, allora affinch`e valga che |B|

<
1 `e sufficiente che la dominanza stretta della diagonale della matrice A
sia valida per uno dei suoi elementi, mentre gli altri basta che soddisfino
l’uguaglianza
Dunque la convergenza di un problema avente come matrice di interazione
una matrice irriducibile `e assicurata anche se non `e a diagonale dominante
Si procede ora alla dimostrazione vera e propria della convergenza del
metodo di Jacobi
Noto che:

(m)
= Φ −Φ
(m)

(m+1)
= B
(m)
= = B
m

(1)
Se B `e una matrice simmetrica, esiste una n-upla di assi ortogonali rispetto
ai quali essa assume forma diagonale. Essa `e dunque diagonalizzabile
5
, ove
gli elementi di tale diagonale risultano essere gli autovalori del problema as-
sociato alla matrice stessa mentre i versori degli assi della n-upla ortogonale
saranno gli autovettori, che formeranno un sistema completo ortonormale
(vedi teorema 4 a pagina 32).
Si prenda ora il vettore
(1)
. Poich`e se la matrice `e reale e simmetrica
gli autovettori del problema agli autovalori Bϕ = λϕ formano una base
ortonormale (vedi capitolo 2.4 a pagina 38) sar`a sempre possibile scrivere il
vettore errore assoluto come combinazione lineare di tali autovettori:

(1)
=
n

h=1
c
(1)
h
ϕ
h
Dunque

(m+1)
= B
m
n

h=1
c
(1)
h
ϕ
h
=
=
n

h=1
c
(1)
h
B
m
ϕ
h
=
=
n

h=1
c
(1)
h
λ
m
ϕ
h
ove la j-esima componente di sar`a dunque

(m+1)
j
=
n

h=1
c
(1)
h
λ
m
h
ϕ
h,j
Ma se ρ(B) < 1, allora qualunque autovalore λ ha modulo inferiore ad 1.
Ne deriva evidentemente che, per m → ∞, il valore di
(m)
tender`a a 0,
5
tali autovalori saranno ripetuti ove essi abbiano molteplicit` a > 1
20
e dunque la soluzione tender`a alla soluzione esatta. Attenzione che dalla
stessa equazione si evince anche che non tutti gli elementi del vettore degli
errori andranno a 0 con la stessa velocit`a, che dipende infatti dall’autovalore
corrispondente (pi` u il modulo `e elevato, pi` u lenta `e la convergenza).
Dimostrato che la condizione di ρ(B) < 1 `e necessaria, di dimostra ora
che essa `e sufficiente. Si prenda un termine forzante q tale per cui l’errore
alla prima iterazione sia tale che

(1)
| ϕ
1
Ma se effettivamente questo `e vero, allora si pu`o scrivere:

(m+1)
j
= c
(1)
1
λ
m
1
ϕ
1,j
Che ovvimante tende a 0 per m che tende ad infinito se e solo [λ
1
[ < 1
6
.
Si pu`o fare questo ragionamento per ogni ϕ
i
il che porta a poter dire che
tale condizione `e necessaria.
7
Dopo aver dimostrato che la condizione di ρ(B) < 1 `e, in generale,
necessaria e sufficiente per la convergenza del metodo di Jacobi, accerti-
amoci ora che il raggio spettrale della matrice di iterazione mi d`a anche
una quantificazione della velocit`a di convergenza del metodo (nella zona
asintotica).
Si supponga ora che λ
1
sia l’autovalore di modulo massimo. Questo
implicher`a dunque che [λ
1
[ = ρ(B) e che [λ
j
[ < ρ(B) ∀j ,= 1. Si pu`o
dunque scrivere, come fatto in precedenza ma esplicitando il termine relativo
6
Cosa accade se la matrice di partenza A ´e reale e simmetrica? Questo implica che
gli autovalori del problema Aϕ = λϕ sono a coppie in modulo uguale e segno opposto.
Avremo cos`ı dunque che, per la convergenza, dovr` o considerare sempre due autovalori
invece di uno. Al posto della equazione appena scritta avremo che il calcolo dell’errore
sar` a effettuato sulla norma, e potremo scrivere che:

(m+1)
∼ Cρ(B)
m
7
Si noti che questo discorso `e stato effettuato per dei termini forzanti specifici, ovvero
tali per cui l’errore risulti parallelo ad un autovettore. Questo per potersi porre nel caso
pi` u sfortunato, e di conseguenza definire una regola generale. Esisteranno dunque dei
valori di q per cui tale condizione non sar` a, invece, necessaria. Basti pensare al caso in
cui, per assurdo, λ
1
> 1 ma
(1)
⊥ ϕ
1
. In questo caso il valore dell’errore all’m-esima
iterazione sar`a dato da:

(m+1)
j
=
n

h=2
c
(1)
h
λ
m
h
ϕ
h,j
Ma dunque l’unico autovalore maggiore di 1 non interverr` a nella sommatoria e di con-
seguenza avr` o convergenza pur essendo la condizione di ρ(B) < 1 non rispettata. Tuttavia
nel mondo reale bisogna ricordarsi che non solo che il calcolatore commette errori di ar-
rotondamento e non conosce la quantit` a “0”, e di conseguenza il concetto di ortogonalit`a
`e mantenuto solo per poche iterazioni
21
all’autovalore di modulo massimo, che :

(m+1)
j
= λ
m
1
[c
(1)
1
ϕ
1,j
+
n

h=2
c
(1)
h
(
λ
h
λ
1
)
m
ϕ
h,j
]
Si vede chiaramente che, per m → ∞, sar`a

m+1
j
· λ
m
1
c
(1)
1
ϕ
1,j
In quanto il termine
λ
h
λ
1
m
tende a 0. Maggiore sar`a il valore dell’h-esimo
autovalore, maggiore sar`a la resistenza al contributo corrispondente a calare
con le iterazioni. A questo proposito si definisce rapporto di dominanza
il modulo del rapporto tra il secondo autovalore di modulo maggiore e l’au-
tovalore di modulo massimo (

2
|

1
|
). Tanto pi` u tale rapporto di dominanza
`e elevato tanto pi` u `e necessario aspettare affinch`e l’errore alla m-esima it-
erazione sia parallelelizzato al contributo dell’autovalore fondamentale.
Anche il rapporto di dominanza, come il raggio spettrale, `e definito dalla
fisica del problema (oltre che dalla scelta dell’algoritmo). Il punto `e che, in
fisica della diffusione, i due autovalori di modulo maggiore sono molto vicini
tra loro.
Si definisce velocit` a di convergenza asintotica il valore
8
:
R

= −ln ρ(B)
Si suppunga a questo punto di trovarsi in zona asintotica, ad una iterazione
m
0
. Com’`e possibile capire quante altre iterazioni bisogna fare per ridurre
l’errore di un fattore 100? Questo sar`a come dire che
ρ(B)
m
< 0.01
da cui si otterr`a che dovr`a essere:
m >
4, 76
−ln ρ(B)
Il metodo di Jacobi `e dunque cos`ı esplicitato: molto semplice e lineare.
Si vuole ora per`o analizzarne i punti deboli, in modo tale da poter capire
ove si possa lavorare per cercare di migliorarlo.
Il suo handicap fondamentale `e legato alla sua scarsa ottimizzazione
nell’utilizzo delle informazioni disponibili. Si prenda infatti una generica m-
esima iterazione. Arrivati al calcolo di Φ
(m+1)
i
si avr`a a disposizione gi`a una
serie di informazioni “di qualit`a”, vale a dire tutti i flussi della m+1-esima
iterazione fino al Φ
(m+1)
i−1
.
Il metodo di Jacobi `e dunque detto “delle iterazioni successive” poich`e
per ogni iterazione uso solo informazioni “vecchie”. Il punto di novit`a del
metodo di Gauss-Seidel `e proprio quello di utilizzare, per il calcolo del flusso
aggiornato, anche le informazioni nuove.
8
Si noti che questa non costituisce un calcolo della velocit` a di convergenza ma solo una
sua stima, utile per confrontare tra loro differenti algoritmi
22
2.1.2 Metodo di Gauss-Seidel
Come `e dunque possibile effettuare un upgrading del metodo di Jacobi,
con poco sforzo e grande risultato? In un generico nodo (prendiamo ad
esempio l’11

, supponendo che i nodi adiacenti nelle direzioni N S W E siano
rispettivamente 15, 7, 10, 12) sar`a funzione del flusso nei 4 nodi adiacenti,
ovvero
15
10 11 12
14
Φ
11
= f(Φ
7
, Φ
10
, Φ
12
, Φ
15
)
Trasportato nella riga corrispondente all’interno delle iterazioni del metodo
di Jacobi avremo:
Φ
(m+1)
11
= f(Φ
(m)
7
, Φ
(m)
10
, Φ
(m)
12
, Φ
(m)
15
)
Tuttavia, poich`e all’interno di ogni iterazione i flussi sono calcolati in modo
ordinato dal primo all’ultimo, al momento di calcolare il flusso in 11 avremo
gi`a noti i valori all’m+1-esima iterazione del flusso in 7 e 10. Si pu`o dunque
sostituire a tali valori il valore del flusso m+1-esimo
La matrice B del metodo di Jacobi `e del tipo:
B = T +T

=
_
_
_
0 T

.
.
.
T 0
_
_
_
Ove le matrici T e T

sono evidentemente rispettivamente triangolare infe-
riore e superiore.
Con il sistema originario dato da:
Φ = BΦ +q
Che pu`o essere riscritto come:
Φ = (T +T

)Φ +q
Sfruttando quanto detto riguardo il metodo di Gauss Seidel, ovvero che per
il calcolo della i-esima componente sono gi`a state calcolate le i-1 componenti
precedenti, il processo iterativo relativo al metodo di Gauss-Seidel diverr`a,
a seguito del processo di assegnazione, della forma:
(I −T)Φ
(m+1)
= T

Φ
(m)
+q
Da cui
Φ
(m+1)
= (I −T)
−1
T

Φ
(m)
+ (I −T)
−1
q
23
Risulter`a dunque, sottraendo membro a membro l’espressione iterativa e
l’espressione esatta:

(m+1)
= (I −T)
−1
T

(m)
Ove (I −T)
−1
T

`e la matrice di iterazione del metodo di Gauss-Seidel.
Si vedano ora le equazioni per componenti: per il metodo di Jacobi si
aveva:
Φ
(m+1)
i
= −
n

j=1
a
ij
a
ii
Φ
(m)
j
+q
i
Con Gauss-Seidel bisogna invece spezzare le sommatorie, poich`e una sar`a
riferita al “nuovo” ed un’altra al “vecchio”:
Φ
(m+1)
i
= −
i−1

j=1
a
ij
a
ii
Φ
(m+1)
j

n

j=i+1
a
ij
a
ii
Φ
(m)
j
+q
i
Il metodo di Gauss-Seidel risulta dunque, asintoticamente, pi` u efficace.
Si dimostra infatti che la sua velocit`a di convergenza `e pari a ρ(B)
2
Si noti che l’utilizzo del metodo di Gauss-Seidel non incrementa lo sforzo
computazionale: il numero di operazioni per iterazione `e lo stesso del metodo
di Jacobi.
2.1.3 Metodo di Jacobi vs Metodo di Gauss
Dunque il metodo di Gauss-Seidel converge pi` u velocemente di quello di
Jacobi, e lo fa a costo zero. La domanda che sorge legittima `e la seguente:
perch`e si parla ancora di metodo di Jacobi? Un motivo esiste: il metodo di
Gauss-Seidel introduce una asimmetria nel sistema, in quanto il flusso in ogni
nodo verr`a calcolato utilizzando informazioni di qualit`a diversa a seconda
della direzione. Questo `e un difetto che risulta pienamente accettabile nella
zona asintotica, ma non in quella delle prime iterazioni ove si andr`a invece in
generale ad utilizzare il metodo di Jacobi. In un caso particolarmente felice
ove il valore di ρ(B) fosse particolarmente ridotto, ci si potrebbe addirittura
ritrovare nella condizione di convergenza talmente veloce da rendere inutile
se non dannosa l’applicazione del metodo di Gauss-Seidel.
Esistono per`o altre condzioni in cui si utilizza Jacobi piuttosto che Gauss-
Seidel, e sono quelle in cui vi sono due catene di iterazioni una dentro l’al-
tra. In questo caso `e possibile che il processo iterativo interno sia tale da
richiedere un’unica iterazione per ogni iterazione esterna
9
. In questo caso si
andr`a ovviamente ad applicare Jacobi, sempre per la stessa ragione: nelle
fasi iniziali di applicazione di un algoritmo la convergenza non `e garantita
ed `e necessario evitare di introdurre asimmetrie nella risoluzione. L’appli-
cazione del metodo di Gauss-Seidel in questo frangente potrebbe portare
all’ottenimento di soluzioni non fisiche.
9
Si tratta come vedermo del caso della teoria della diffusione
24
Altra situazione caratteristica `e quella dell’applicazione dei due metodi
a scacchiera. In questo modo, calcolando il flusso tramite Jacobi solo sui
nodi “neri” ci si ritrova che tutti i nodi “bianchi” sono circondati solo da
informazioni nuove che possono cos`ı essere utilizzate per calcolarvi il flus-
so. Questo metodo di fatto `e migliore di quello di Jacobi anche alle prime
iterazioni. Si vede inoltre che la velocit`a di convergenza del metodo “a scac-
chiera” nella zona asintotica `e esattamente la stessa di quella del metodo di
Gauss-Seidel standard.
2.1.4 Metodo SOR
Il metodo SOR lavora tramite estrapolazione, ovvero un processo di
creazione di informazioni sulla base di altre di cui si `e gi`a in possesso. Questo
passaggio, a differenza di quello che portava dal metodo di Jacobi a quello di
Gauss-Seidel, include un costo. Ne segue che tale metodo, dotato di velocit`a
di convergenza superiori, `e adatto ad un uso nelle fasi finali di affinamento
della soluzione, dopo aver sgrossato il problema tramite l’uso dei metodi
visti in precedenza.
Il metodo SOR `e anche detto di sovrarilassamento, e si basa sul forzare
l’upgrade della soluzione da un passaggio all’altro. Riscrivendo infatti l’evoluzione
dell’errore relativo tramite metodo di Gauss-Seidel:

(m+1)
−Φ
(m)
]
GS
= TΦ
(m+1)
+T

Φ
(m)
+q −Φ
(m)
Partendo da questo presupposto, l’upgrade della soluzione tramite metodo
SOR diventa:

(m+1)
−Φ
(m)
]
SOR
= ω[Φ
(m+1)
−Φ
(m)
]
GS
Ove ovviamente il caso di ω = 1 porta al riottenimento al metodo di Gauss-
Seidel. ω `e detto parametro di forzamento
Espandendo quanto scritto si ottiene:
Φ
(m+1)
= ωTΦ
(m+1)
+ [(1 −ω)I +ωT


(m)
+ωq
Da cui, in forma esplicita:
Φ
(m+1)
=
matrice di iterazione
¸ .. ¸
(I −ωT)
−1
[(1 −ω)I +ωT

] Φ
(m)
+ (I −ωT)
−1
ωq
Si pu`o dimostrare che il valore ottimale per ω `e dato da:
ω
opt
=
2
1 +
_
1 −ρ(B)
2
E visto che si pu`o fare, facciamolo.
25
L’obbiettivo `e trovare un’espressione per il raggio spettrale della matrice
di iterazione del metodo SOR. Una volta fatto questo, il passaggio successivo
sar`a evidentemente quello di minimizzare tale valore, che come sappiamo
rappresenta la velocit`a con cui l’algoritmo tende a convergenza. Il problema
sar`a del tipo
J
ω
ψ = γψ
ove ci`o che ci si prefigge di calcolare `e il γ di modulo massimo. Richiamando
la definizione della matrice di iterazione:
J
ω
= (I −ωT)
−1
[(1 −ω)I +ωT

]
Se ne pu`o ricavare una ulteriore equazione agli autovalori. Infatti vale
J
ω
ψ = γψ
(I −ωT)
−1
[(1 −ω)I +ωT

]ψ = γψ
[(1 −ω)I +ωT

]ψ = (I −ωT)γψ
ψ −ωψ +ωT

ψ = γψ −ωTψ
(γT +T

)ψ =
γ −1 +ω
ω
ψ
Si pu`o ora riscriverla componente per componente, tramite il doppio
indice, ove con i simboli dei punti cardinali si indicheranno gli elementi delle
matrici posizionati adiacenti all’elemento di interesse. Dunque
γW
i,j
ψ
i−1,j
+γS
i,j
ψ
i,j−1
+E
i,j
ψ
i+1,j
+N
i,j
ψ
i,j+1
=
ω −1 +γ
ω
ψ
i,j
Viene ora sfruttata l’arbitrariet`a degli autovettori per scrivere un legame
tra ψ e Φ, al fine di ottenere una espressione simile a quella scritta per il
metodo di Jacobi e poter dunque confrontare i due algoritmi. Si user`a in
particolare che ψ
ij
= Φ
ij
γ

i+j
2
_
per Jacobi W
i,j
Φ
i−1,j
+N
i,j
Φ
i,j+1
+E
i,j
Φ
i+1,j
+S
i,j
Φ
i,j−1
= λΦ
i,j
per SOR W
i,j
Φ
i−1,j
+N
i,j
Φ
i,j+1
+E
i,j
Φ
i+1,j
+S
i,j
Φ
i,j−1
=
ω−1+γ
ω

γ
Φ
i,j
Confrontando i due ottengo:
λ =
ω −1 +γ
ω

γ
Risolvendo per γ, diventa
λω

γ = ω −1 +γ
λ
2
ω
2
γ = ω
2
+ 1 +γ
2
+ 2ωγ −2ω −2γ
γ
2
−(2 +λ
2
ω
2
−2ω) + (ω −1)
2
= 0
26
da cui si avranno due soluzioni:
γ
1,2
= (1 −ω −
λ
2
ω
2
2
) ±
_
(1 −ω −
λ
2
ω
2
2
)
2
−(1 −ω)
2
=
= (1 −ω −
λ
2
ω
2
2
) ±
_
λ
4
ω
4
4

2
ω
2
−ωλ
2
ω
2
=
= (1 −ω −
λ
2
ω
2
2
) ±λω
_
λ
2
ω
2
4
+ 1 −ω
Ponendosi nel caso tipico di matrice simmetrica gli autovalori di B saranno
tutti reali. Essendo inoltre che, per ipotesi, λ
2
< 1 (altrimenti la conver-
genza del metodo di Jacobi non `e assicurata) e ω > 1 (altrimenti il metodo
SOR rallenterebbe la convergenza invece di accelerarla
10
), `e cos`ı definito
l’intervallo di variazione di ω
Si studino ora i tre casi separatamente, avendo chiamato ω
0
il valore di
ω che annulla il discriminante dell’equazione:
ω
0
=
2
1 +

1 −λ
2
si ottengono 3 casi possibili:
• Per ω = ω
0
avremo che:
γ = 1 −ω
0
+
λ
2
ω
2
0
2
che, sostituendo il valore di ω
0
, diviene
γ = ω
0
−1
• Per ω
0
< ω < 2 si ha ∆ < 0, il che porta ad ottenere per γ due radici
complesse coniugate. Attraverso gli opportuni passaggi si ottiene che

1
[ = [γ
2
[ = ω −1
che, essendo per ipotesi ω > ω
0
, dar`a luogo ad un valore di γ maggiore
che nel caso precedente
• Per 1 < ω < ω
0
si ottengono due soluzioni reali distinte, delle quali
quella di modulo maggiore sar`a legata al discriminante preso come
positivo, che ci permette di ottenere:
γ
1
= (1 −ω +
1
2
λ
2
ω
2
) +λω
_
1 −ω +
λ
2
ω
2
4
Si vede che questo genera un andamento il cui minimo risulta essere
situato proprio in ω = ω
0
10
Attenzione, questo non `e sempre vero. A volte infatti gli algoritmi vengono rallentati
invece che accelerati, in particolare in quei casi ove ho fenomeni che si svolgono su scale
temporali distinte, ed il rischio `e che le “qualit` a” dei risultati non risultino coerenti. Un
esempio tipico `e l’accoppiamento di fenomeni elettro-magnetici, estremamente veloci, ed
i fenomeni termo-fluidodinamici, pi` u lenti
27
Dunque `e stato dimostrato come il valore ottimale per ω sia dato da:
ω
opt
= ω
0
=
2
1 +

1 −λ
2
Ecco dunque identificato il costo aggiuntivo del metodo SOR: se fino ad ora si
era parlato del raggio spettrale della matrice B come qualcosa che identifica-
va la velocit`a di convergenza dell’algoritmo, senza per`o mai aver manifestato
la necessit`a di calcolarlo, ecco che qui `e invece necessario conoscerne il valore
al fine di applicare il metodo SOR in maniera ottimale assicurandosi cos`ı la
migliore velocit`a di convergenza possibile.
Bisogna in questa fase ricordare le ipotesi fatte per ottenere questo
risultato:
• Griglia strutturata
• Matrice simmetrica
Si pu`o dimostrare, ma non verr`a fatto in questa sede, che il valore della
velocit`a di convergenza del metodo SOR dipende dalla numerazione scelta,
ed in particolare quella che garantisce i risultati migliori `e la numerazione
naturale.
2.1.5 Shift tra metodo di Jacobi e metodo SOR
Ci si pone nella condizione tipica in cui si utilizza il metodo di Jacobi nella
fase iniziale, per lo sgrossamento della soluzione, per poi passare al meto-
do SOR per l’affinamento finale. Sorger`a dunque la questione su quando
abbandonare il primo metodo per passare al secondo.
Si vede che in base al problema da risolvere
11
varier`a la velocit`a di con-
vergenza del metodo di Jacobi. Pi` u tale velocit`a `e elevata, minore sar`a il
numero di iterazioni necessario per il passaggio al metodo SOR.
Esiste tuttavia un altro elemento. Ricordiamo infatti quanto detto in mo-
do molto innocente all’inizio della descrizione del metodo di Jacobi, ovvero
che gli ultimi elementi di ogni iterazione successiva costituiscono di fatto
l’applicazione del metodo delle potenze sulla matrice B che porta al calcolo
degli autovalori della stessa. Appare ora evidente che dunque, nell’appli-
care Jacobi, si opera involontariamente il calcolo iterativo di B
n
q, il che
permette di calcolare un valore approssimato di ρ(B) che si potr`a dunque
utilizzare per il calcolo di ω
opt
. Questa riflessione dice dunque che al fine di
determinare il momento per lo shift da metodo di Jacobi e metodo SOR non
ci si concentrer`a soltanto sulla convergenza del metodo di Jacobi in s`e, ma
anche su quella del metodo delle potenze per il calcolo di ρ(B), il cui valore
`e fondamentale per la corretta applicazione del metodo SOR
11
e dunque in base alla matrice A → la matrice B → ρ(B)
28
2.1.6 Ordinamento dei nodi di flusso
Si accenner`a nelle pagine successive alla necessit`a, una volta che si passa ad
una logica multidimensionale, della scelta di una numerazione per i nodi di
flusso in modo da passare da una forma del tipo Φi, j ad una Φ
l
, che mi
permette l’utilizzo standard di vettori e matrici.
A questo proposito sono mostrate di seguito le tre tipologie pi` u utiliz-
zate, a ciascuna delle quali `e associata la corrispondente forma della matrice
risultante:
Numerazione naturale
_
3 4
1 2
_

_
_
_
_
0 X X 0
X 0 0 X
X 0 0 X
0 X X 0
_
_
_
_
Numerazione a scacchiera
_
4 2
1 3
_

_
_
_
_
0 0 X X
0 0 X X
X X 0 0
X X 0 0
_
_
_
_
Numerazione ciclica
_
4 3
1 2
_

_
_
_
_
0 X 0 X
X 0 X 0
0 X 0 X
X 0 X 0
_
_
_
_
Tutte e tre le matrici avranno gli stessi autovalori (0 con molteplicit`a 2
e ±2X con molteplicit`a 1. Per l’applicazione del metodo di Jacobi le tre
strategie sono equivalenti, nel senso che portano alla stessa identica velocit`a
a convergenza. Per quanto riguarda invece il metodo di Gauss-Seidel avremo
che, per ρ(B) = 0.5, sar`a:
• J
GS
= 0.25 con numerazione naturale (come da considerazioni prece-
denti pari a ρ(B)
2
)
• J
GS
= 0.25 con numerazione a scacchiera (come da considerazioni
precedenti pari a ρ(B)
2
)
• J
GS
= 0.28 con numerazione ciclica
29
2.2 Risoluzione di sistemi di equazioni non lineari
I processi non lineari vengono trattati, in analisi numerica, tramite una
linearizzazione iterativa. L’idea `e dunque quella di, partendo da una f(x) =
0 con f(x) non lineare, andare a risolvere una
ˆ
f(x) = 0, con
ˆ
f(x) ovviamente
parente stretta di f(x).
Questo procedimento comporta ovviamente una complicazione della risoluzione,
che aumenta con l’aumentare del numero delle equazioni.
2.2.1 Metodo di Newton per la risoluzione di sistemi non
lineari
Si supponga di avere un generico sistema di equazioni non lineare.
f(x) =
_
¸
¸
¸
_
¸
¸
¸
_
f
1
(x
1
, x
2
, , x
n
)
f
2
(x
1
, x
2
, , x
n
)
.
.
.
f
n
(x
1
, x
2
, , x
n
)
= 0
La prima cosa che viene in mente di fronte ad un sistema non lineare `e
quella di linearizzarlo tramite uno sviluppo in serie di Taylor troncato al
prim’ordine.
Si chiami ξ la soluzione esatta e x
(i)
la soluzione approssimata alla i-
esima iterazione. Si avr`a ovviamente che f(ξ) = 0 ed invece f(x
(i)
) ,= 0 .
Essendo dunque x
(i)
una approssimazione di ξ, sar`a lecito supporre che i
due vettori siano molto “vicini” tra loro, di modo da poter calcolare tramite
linearizzazione in serie di Taylor la funzione nell’intorno di x
(i)
. Vale infatti
che, trascurando i termini di grado superiore al primo, si ottiene un sistema
del tipo:
_
¸
¸
¸
¸
_
¸
¸
¸
¸
_
f
1
(x
(i)
) + (ξ
1
−x
(i)
1
)(
∂f
1
∂x
1
)
x=x
(i) + + (ξ
n
−x
(i)
n
)(
∂f
1
∂x
n
)
x=x
(i) · 0
f
2
(x
(i)
) + (ξ
1
−x
(i)
1
)(
∂f
2
∂x
1
)
x=x
(i) + + (ξ
n
−x
(i)
n
)(
∂f
2
∂x
n
)
x=x
(i) · 0
.
.
.
f
n
(x
(i)
) + (ξ
1
−x
(i)
1
)(
∂f
n
∂x
1
)
x=x
(i) + + (ξ
n
−x
(i)
n
)(
∂f
n
∂x
n
)
x=x
(i) · 0
Se in questo sistema operiamo una assegnazione potremo innescare un pro-
cedimento iterativo. In particolare otterremo questo scrivendo:
_
¸
¸
¸
¸
_
¸
¸
¸
¸
_
f
1
(x
(i)
) +h
(i)
1
(
∂f
1
∂x
1
)
x=x
(i) + +h
(i)
n
(
∂f
1
∂x
n
)
x=x
(i) · 0
f
2
(x
(i)
) +h
(i)
1
(
∂f
2
∂x
1
)
x=x
(i) + +h
(i)
n
(
∂f
2
∂x
n
)
x=x
(i) · 0
.
.
.
f
n
(x
(i)
) +h
(i)
1
(
∂f
n
∂x
1
)
x=x
(i) + +h
(i)
n
(
∂f
n
∂x
n
)
x=x
(i) · 0
30
Di questo sistema l’unica incognita `e proprio h
(i)
, ove si `e definito h
(i)
j
=
(x
(i+1)
j
−x
(i)
j
) Definendo il passaggio da una iterazione all’altra in modo che
x
(i+1)
= x
(i)
+h
(i)
`e possibile innescare un processo iterativo, i cui passaggi
saranno:
1. Calcolo dello Jacobiano nel punto x
(i)
2. Calcolo delle f(x
(i)
)
3. Calcolo di h tramite soluzione del sistema
4. Aggiornamento di x
(i+1)
Un problema di tale procedimento `e che, ove il numero delle incognite sia
elevato, J pu`o diventare molto grande. Se le sue dimensioni sono ridotte
sar`a possibile scriverlo in forma analitica (di fatto manualmente), mentre
ove le dimensioni aumentino si passer`a in genere ad una scrittura in forma
numerica:
(
∂f
j
∂x
k
)
x=x
(i) = B
(i)
j,k
=
f
j
(x
(i)
+e
k
h
jk
) −f
j
(x
(i)
)
e
k
h
jk
Importante `e la valutazione dell’intervallo di discretizzazione. Se questo
`e troppo grande, si perde ovviamente in precisione, mentre ove questo sia
troppo piccolo si corre il rischio di cancellazione numerica. Come sempre la
scelta risulter`a dal compromesso giudicato migliore.
Di fatto la scrittura dello Jacobiano e la risoluzione del problema associ-
ato sono le fasi pi` u critiche del processo iterativo. Per questo una possibilit`a
`e quella di non aggiornarlo ad ogni iterazione. La risoluzione del problema
avente lo Jacobiano come matrice di iterazione dipende dallo Jacobiano stes-
so: se si tratta di una matrice si usano metodi diretti, in caso contrario si
privilegiano invece metodi iterativi. Tuttavia, qualunque sia il metodo scel-
to ed il caso specifico, questo metodo di risoluzione converge con estrema
difficolt`a.
2.3 Metodi per problemi agli autovalori
2.3.1 Scomposizione QR di una matrice
Si definisce trasformazione di similitudine una qualsiasi trasformazione
del tipo:
B = SAS
−1
Caratteristiche peculiari di questa trasformazione sono che:
• La matrice A e la matrice B hanno gli stessi autovalori
31
• Dato x autovalore di A, y= Sx `e autovettore della nuova matrice B
L’utilit`a di tali trasformazioni di similitudine `e data anche dai seguenti
teoremi:
Teorema 4 Data una matrice A reale e simmetrica, esiste una matrice
ortogonale V
1
tale che
D = V
1
AV
T
1
ove D `e una matrice diagonale
Teorema 5 Data una matrice A reale, esiste una matrice ortogonale V
2
tale che
H = V
2
AV
T
2
ove H `e una matrice di Hessenberg, che diventa tridiagonale se A `e simmet-
rica
Si definisce a questo punto una nuova tipologia di matrice, detta riflet-
tore, nella maniera seguente:
U = I −2uu
T
con

u
T
u = 1
Si dimostra facilmente che tale matrice presenta le seguenti propriet`a:
• `e simmetrica (U
T
= U)
• `e ortogonale (U
T
= U
−1
)
• `e involutoria (U
2
= 1)
Ulteriore propriet`a di tale matrice, che utilizzeremo in seguito, `e enunciata
dal seguente teorema:
Teorema 6 Dato un generico vettore non nullo x, esiste un riflettore ele-
mentare U tale che
Ux = −σe
1
Dove
_
_
_
u = x +σe
1
e
1
= (1, 0, , 0)
T
σ = ±

x
t
x
Dalle considerazioni precedenti si `e visto che `e possibile costruire delle
matrici U tali che, moltiplicate per un vettore, ne annullano tutte le com-
ponenti tranne la prima. Si pu`o dunque pensare di costruire una matrice
U
1
tale che moltiplicata per una generica matrice A fornisca, in uscita, una
matrice con tutti gli elementi della prima colonna nulli fatta eccezione per
la prima riga. Moltiplicando poi per una analoga U
2
, si possono annullare
32
anche tutti gli elementi della seconda colonna ad eccezione dei primi due. Il
metodo di costruzione della generica matrice U
k
`e il seguente:
_
I
k−1
0
0 U
(n−k+1)
1
_
Il risultato finale di tutte le moltiplicazioni sar`a dunque una matrice triango-
lare superiore, che verr`a chiamata R. Moltiplicando invece tra loro tutti gli
n-1 riflettori otterremo una matrice Q
T
che risulter`a ortogonale, in quanto
prodotto di matrici ortogonali. Avr`o quindi che:
Q
T
A = R −→ A = QR
Si tratta dunque di un processo che permette di ottenere un risultato analogo
alla decomposizione di Gauss, avendo come unica pecca l’utilizzo di 2n
3
/3
operazioni, il doppio esatto di quelle necessarie per la decomposizione di
Gauss.
2.3.2 metodo QR
Il metodo QR `e di tipo iterativo. Si definisce A
1
la matrice A, e calcoliamo
delle nuove matrici secondo il processo seguente:
1. Decomposizione della matrice all’i-esima iterazione: A
i
= Q
i
R
i
2. Calcolo della matrice per l’iterazione successiva: A
i+1
= R
i
Q
i
Tutte le matrici cos`ı calcolate risulteranno simili ad A, in quanto risul-
teranno di fatto dalla moltiplicazione a destra per le Q
i
ed a sinistra per le
loro trasposte:
A
i+1
= (Q
1
Q
2
Q
i
)
T
A(Q
1
Q
2
Q
i
)
Trattandosi di operazioni di similitudine, si conservano gli autovalori! Si pu`o
dimostrare che la matrice A
n
tender`a all’infinito a diventare una matrice
triangolare superiore, i cui autovalori saranno gli elementi della diagonale
principale.
Il problema di questo calcolo `e che `e lungo e dispendioso. Il procedimento
pi` u generalmente utilizzato `e quello di trattare preventivamente la matrice
A, cercando di farla diventare tridiagonale o di Hessenberg, per poi applicare
il metodo QR ad una condizione ove si ha un numero consistente di elementi
nulli.
2.3.3 Metodo delle potenze
Il metodo delle potenze `e un algoritmo di tipo iterativo che converge ad
un vettore parallelo all’autovettore fondamentale della matrice di interesse.
Pu`o essere applicato a problemi di tipo:
33
• AΦ = λΦ
• AΦ = λBΦ
• D(λ)Φ = 0
Ove nel terzo caso non `e garantita la linearit`a del problema rispetto agli
autovalori.
Il metodo delle potenze `e un algoritmo iterativo che, a convergenza,
fornisce una stima dell’autovettore fondamentale, utile in particolare
per due classi specifiche di problemi:
• Problemi agli autovalori di fusione neutronica in mezzo moltiplicante
• Utilizzo in metodi per la risoluzione di sistemi di equazioni non omo-
genei
Si supponga che la matrice M abbia un insieme completo di autovettori.
A partire da tale ipotesi si pu`o dimostrare che la successione M
m
converge
all’autovalore di modulo massimo qualunque sia q.
Si supponga inoltre che la matrice M abbia tutti autovalori distinti: es-
ister`a dunque uno ed un solo autovalore avente modulo superiore a tutti gli
altri. Avendo inoltre imposto che la matrice M abbia un set completo di
autovettori, `e ragionevolmente possibile supporre di poter scrivere
q =
n

h=1
c
h
ϕ
h
Ove i ϕ
h
sono evidentemente gli autovettori della matrice M.
12
Si avr`a dunque che:
M
m
q =
n

h=1
c
h
M
m
ϕ
h
=
=
n

h=1
c
h
µ
m
h
ϕ
h
=
= µ
m
1
[c
1
ϕ
1
+
n

h=2
µ
h
µ
1
c
h
ϕ
h
]
Ma dunque, poich`e la sommatoria tender`a a 0 per indice m che tende ad
infinito, il vettore M
m
q tender`a a diventare parallelo a ϕ
1
. Come per quanto
detto relativamente al metodo di Jacobi, si avr`a anche qui un termine (quel-
lo legato al secondo autovalore di modulo massimo) che resister`a a questa
12
Tale scrittura equivale a dire che `e sempre possibile scrivere un qualunque vettore q
come combinazione lineare degli autovettori della matrice M
34
convergenza pi` u di tutti gli altri con una “forza” quantificata dal rapporto
di dominanza
Attenzione per`o. Nei passaggi precedenti `e stato dimostrato che il meto-
do converge ad un vettore parallelo all’autovettore fondamentale, ma si vede
che compare nella formula risolutiva l’elemento µ
m
1
che moltiplica tutta l’e-
quazione. Risulta dunque evidente che per µ
1
> 1 la formula tender`a a
divergere per m grandi, mentre per µ
1
< 1 essa tender`a a 0. Per ot-
tenere dunque una soluzione `e opportuno, ricordandosi che gli autovettori
sono definiti a meno di una costante moltiplicativa arbitraria, normaliz-
zare la soluzione ad ogni step iterativo. Per quanto visto prima, `e evidente
che affinch`e la soluzione converga ad un valore reale diverso da 0 `e neces-
sario che il termine a destra elevato all’m-esima potenza sia il pi` u possi-
bile vicino ad uno. Verr`a dunque introdotto come elemento normalizzante
per ogni iterazione l’autovalore di modulo massimo calcolato all’iterazione
precedente.
A questo punto per`o sar`a necessario capire come calcolare il raggio spet-
trale. Si `e infatti dimostrato che il vettore M
m
q tende a diventare parallelo
all’autovettore fondamentale, ma non `e ancora stato fatto il passo succes-
sivo. Infatti se il problema di partenza `e lineare sar`a possibile sfruttare il
fatto che se ϕ associato a µ `e soluzione al problema agli autovalori, allora lo
stesso varr`a per cϕ, ovvero qualunque vettore `e soluzione del problema agli
autovalori a patto che sia parallelo ad uno dei suoi autovettori. Sulla base di
queste considerazioni si potr`a dunque dire che, supponendo di essere giunti
a convergenza all’m-esima iterazione:
M(M
m
q) · µ
1
(M
m
q)
Ove il vettore M
m
q corrisponde al generale multiplo di autovettore cϕ
Dall’equazione precedente si pu`o dunque dedurre che
µ
1
·
(M
m+1
q)
1
(M
m
q)
1
·
(M
m+1
q)
2
(M
m
q)
2
· ·
(M
m+1
q)
n
(M
m
q)
n
Si ha infatti che a convergenza i due vettori M
m
q ed MM
m
q devono essere
paralleli in quanto uguali a meno di una costante moltiplicativa (l’autoval-
ore). Questo fornisce dunque un efficace criterio di convergenza per il mio
metodo iterativo, che si potr`a basare sulla similitudine tra i vari rapporti
tra le componenti. Quando essi saranno sufficientemente simili tra loro si
potr`a finalmente considerare di essere giunto a convergenza e poter dunque
troncare il processo iterativo.
Occorre tuttavia quantificare questa vicinanza. Si ricorre in generale
ad una imposizione sul numero delle cifre della mantissa che devono essere
uguali. Si ha in questo modo imposto una sorta di errore relativo, che infatti
non dipende dal valore in s`e della quantit`a.
13
. Occorre tuttavia fare come
13
Si tratta evidentemente in questo caso di un criterio di convergenza puntuale. Esistono
anche criteri di convergenza in norma che saranno in generale meno stringenti
35
sempre grande attenzione agli algoritmi molto lenti, che portano ad avere le
soluzioni di due iterazioni successive molto vicine tra loro. In questo caso
si rischia che il criterio di convergenza, per quanto stringente, non porti a
selezionare una soluzione realmente vicina a quella cercata. In casi come
questo `e dunque sempre opportuno andare a sostituire i risultati ottenuti
nell’equazione di partenza per verificarne l’effettiva veridicit`a.
Rimane tuttavia il dubbio legato alla scelta di quale degli n valori pos-
sibili scegliere per l’autovalore, ognuno dei quali `e di fatto teoricamente
equivalente (se mi trovassi di fronte alla soluzione analitica essi sarebbero
infatti tutti uguali). Una possibilit`a `e data dall’operazione seguente:
µ
1
·
< M
m+1
q, I >
< M
m
q, I >
=

n
i=1
(M
m+1
q)
i

n
i=1
(M
m
q)
i
Tale operazione fornisce infatti una stima dell’autovalore fondamentale pi` u
precisa, a parit`a di iterazione, di qualunque stima effettuata dal semplice
rapporto delle componenti.
Si nota per`o che questo calcolo sta equiparando tra loro tutte le compo-
nenti dell’autovettore fondamentale. Tuttavia, se per la matematica le vari-
abili sono tutte uguali, cos`ı non `e per la fisica e l’ingegneria. Esister`a dunque
un modo per sfruttare ci`o che si conosce riguardo la fisica del problema al
fine di rendere ancora pi` u precisa la soluzione.
Si introducono dunque i quozienti di Rayleigh, definiti in modo che:
µ
1
·
< q
(m+1)
, q
(m)
>
< q
(m)
, q
(m)
>
oppure µ
1
·
< q
(m+1)
, q
(m+1)
>
< q
(m)
, q
(m+1)
>
avendo utilizzato quella che viene detta una pesatura alla Galerkin, che
prevede l’utilizzo della stessa classe funzionale della soluzione per la pesatua
delle componenti.
In neutronica questo corrisponde al tenere in considerazione il fatto che i
neutroni, in un sistema critico, hanno importanza differente a seconda della
posizione del reattore in cui si trovano, ed in particolare risulteranno in gen-
erale pi` u importanti nelle zone ove essi sono pi` u numerosi. Sarebbe dunque
in teoria pi` u corretto usare l’importanza come funzione peso, ma questo
richiederebbe la soluzione del problema aggiunto, aumentando cos`ı il cos-
to computazionale in modo non giustificato dai risultati ottenuti. Solo nel
caso monodimensionale, poich`e l’importanza coincide con il flusso neutron-
ico, pesando secondo Galerkin si ottiene una pesatura tramite importanza
neutronica.
Veniamo all’analisi di un caso particolarmente sfortunato. Per dare il via
all’algoritmo iterativo sar`a necessario imporre una soluzione di tentativo,
vale a dire il termine q. Cosa accade se tale termine `e, sfortunatamente,
perpendicolare all’autovettore fondamentale? Si avr`a in questo caso infatti
36
che:
q =
n

h=2
c
h
ϕ
h
che non ha componente lungo l’autovettore fondamentale e dunque non po-
tra mai convergere ad esso. Il metodo delle potenze converger`a in questo
caso verso il secondo autovalore di modulo massimo.
Questo sar`a vero per`o solo dal punto di vista matematico. Dal punto
di vista numerico infatti la perpendicolarit`a perfetta non esiste (non es-
iste infatti il concetto di zero, ma al massimo delle quantit`a molto piccole),
ed infatti baster`a una iterazione affinch`e gli errori di arrotondamento del
calcolatore portino ad ottenere come Mq un vettore non perfettamente per-
pendicolare a ϕ
1
. Si avr`a in questo caso tuttavia una convergenza molto
lenta, caso non favorevole ma comunque migliore della convergenza ad un
valore sbagliato. Attenzione per`o che il rischio esiste comunque: troncando
il processo dopo un numero insufficiente di iterazioni, il vettore soluzione
sar`a molto pi` u vicino a ϕ
2
che a ϕ
1
, con le dovute conseguenze.
Si ricorda ora per`o che, all’inizio del paragrafo, si `e detto che il metodo
delle potenze `e utilizzato per risolvere ogni tipo di problema agli autovalori,
mentre per quanto visto finora si `e visto solo come risolvere problemi agli au-
tovalori classici ma non. Per poter estendere tale metodo anche ai problemi
generalizzati `e necessario essere in grado di provare l’esistenza della matrice
B
−1
, ove B `e la matrice del problema agli autovalori generalizzato:
Ax = λBx
Come risolvere a questo punto il problema? Sar`a necessario ricondursi al
caso precedente, andando a scrivere dunque:
B
−1
Ax = λx
ed applicando il metodo delle potenze nella maniera seguente:
B
−1
Aq
(0)
= q
(1)
Ecco dunque che il problema si `e complicato notevolmente. Si avranno due
cicli di iterazioni concatenati l’uno dentro l’altro:
• Un ciclo di iterazioni esterne:
B
−1
Aq
(0)
= q
(1)
→ B
−1
Aq
(1)
= q
(2)
• Un ciclo di iterazioni interne:
Aq
(0)
= Bq
(1)
37
Ritrovandosi un processo iterativo interno, anche il valore di q
(1)
non `e
esatto ma approssimato rispetto all’aggiornamento della soluzione.
Si potrebbe a questo punto pensare di fare un’operazione di questo tipo:
calcolare all’inzio, una volta per tutte, l’inversa di B e utilizzarla per tutte
le iterazioni esterne. Ci si libererebbe cos`ı di un processo iterativo tramite
un quantitativo di calcoli che, seppure elevato, sarebbe presumibilmente
inferiore alla somma di tutte le iterazioni interne.
Per capire perch`e tale procedimento spesso non `e attuato bisogna andare
ad analizzare il contenuto fisico del problema. Se dal punto di vista matem-
atico il discorso `e teoricamente corretto, considerando le implicazioni fisiche
ci si accorge che si andrebbe a risolvere i due problemi su due piani diversi,
e dunque a mischiare informazioni di qualit`a molto differenti. Perdendo il
parallelismo fisico, la convergenza non `e pi` u garantita. Si vedr`a in seguito
come questa problematica appare in maniera molto evidente nel caso della
risoluzione numerica delle equazioni della diffusione neutronica multigruppo.
Questo discorso si attua per`o solo ove la matrice B sia sparsa, e dunque
risolvibile tramite algoritmi di tipo iterativo. Ove invece B sia una matrice
densa verr`a utilizzato, come gi`a detto in precedenza, un metodo diretto, che
porter`a forzatamente all’ottenimento della soluzione esatta.
2.4 Propriet`a spettrali delle matrici di interazione
Si definisce matrice di interazione una matrice i cui coefficienti hanno un
significato fisico.
Si enunciano di seguito alcune propriet`a e teoremi di matrici che risul-
teranno utili nel seguito:
• Se la matrice M `e reale e simmetrica o complessa ma Hermi-
tiana, allora tutti gli autovalori di M sono reali e tutti gli autovettori
corrispondenti sono tra loro perpendicolari
• Se la matrice M `e reale e simmetrica e definita positiva
14
, allora
tutti i suoi autovalori sono positivi e reali
• Se M `e reale e simmetrica e semi-definita positiva
15
, allora tutti
i suoi autovalori saranno non negativi
Si definicono invece matrici positive (Da notare la differenza con le
matrici definite positive) matrici i cui elementi sono tutti positivi. Riguardo
le matrici positive esiste un teorema di rilevante importanza:
Teorema 7 (di Perr`on) Data una matrice M positiva, anche non simmet-
rica, vale che:
14
una matrice `e definita positiva se, ∀

Φ =

0, si ha che (< M

Φ, Φ >) > 0
15
una matrice `e semi-definita positiva se, ∀

Φ =

0, si ha che (< M

Φ, Φ >) ≥ 0
38
1. l’autovalore fondamentale `e positivo ed ha sempre molteplicit`a 1 (ovvero
∃λ
i
con m(λ
i
) = 1 tale che λ
1
> [λ
j
[ ∀j ,= 1)
2. All’autovalore fondamentale λ
1
corrisponde, a meno di una costante
moltiplicativa arbitraria, un unico autovettore ϕ
1
avente componenti
tutte positive
16
. L’autovettore fondamentale `e l’unico a godere di tale
propriet`a.
3. Se un qualsiasi elemento della matrice M cresce, allora λ

1
autovalore
fondamentale della matrice M

avr`a modulo maggiore di λ
1
Possiamo allo stesso modo definire matrici ad elementi non negativi
o matrici semipositive le matrici aventi solo termini positivi o nulli. Per
esse vale invece il seguente teorema:
Teorema 8 (di Frobenius) Data una matrice semipositiva valgono le pro-
priet`a enunciate dal teorema 7 a patto che la matrice sia anche irriducibile.
Si faccia per`o attenzione che la condizione espressa dal punto 1 del teorema
di Perron include una maggiorazione semplice e non stretta: λ
1
≥ [λ
j
[.
2.5 Approssimazione di dati sperimentali
Esistono numerosi modi per approssimare dei dati sperimentali. Uno dei pi` u
comuni `e quello dell’interpolazione, ove essendo in possesso di n punti sper-
imentali potremo approssimarli con un polinomio di grado n-1. Purtroppo
la determinazione dei coefficienti di tali polinomi costituisce un sistema di
equazioni lineare e non omogeneo
Altra via per l’approssimazione dei dati `e il metodo dei minimi quadrati,
dal quale non si otterr`a una funzione interpolante. Tale sistema `e general-
mente utilizzato ove sia presente una quantit`a molto elevata di dati sper-
imentali, caso in cui non `e pensabile il ricorso ad una interpolazione. Si
tenga conto comunque che nel caso della determinazione dei coefficienti del-
la funzione approssimata tramite il metodo dei minimi quadrati il problema
`e tanto pi` u mal condizionato quanto pi` u grande `e il numero n di punti sper-
imentali a disposizione. Useremo in questi casi i polinomi di Hermite e
le funzioni spline.
2.5.1 Funzioni spline
Le funzioni spline sono dei metodi utilizzati per l’interpolazione di punti.
Abbiamo infatti visto come una semplice interpolazione polinomiale spesso
non `e adeguata ed `e dunque opportuno ricorrere ad altri metodi.
16
ovviamente a meno di una costante moltiplicativa arbitraria. Questo corrisponde a
dire che hanno tutte lo stesso segno
39
Supponiamo dunque di avere N+1 punti, ciascuno identificato da una
coppia (x
i
, y
i
), compresi in un intervallo [a,b] tale che a ≡ x
0
< x
1
< <
x
n
≡ b
In linea teorica `e sempre possibile, come detto, trovare un polinomio di
grado N in grado di interpolare esattamente gli N+1 punti sperimentali, i
cui coefficienti sono determinabili risolvendo il sistema di equazioni avente
come matrice di coefficienti una matrice di Van der Monde. In effetti per`o,
oltre al fatto che tale problema `e spesso e volentieri mal condizionato, tale
tipo di approssimazione non `e necessariamente la pi` u adatta.
Un alternativa pu`o essere quella di usare una serie di funzioni lineari, il
che mi fornisce di fatto una linea spezzata. La funzione interpolante sar`a in
questo modo del tipo:
f
n
(x) =
(x
i+1
−x)y
i
+ (x −x
i
)y
i+1
x
i+1
−x
i
per x
i
< x <
i+1
Una funzione di questo tipo `e semplice da implementare, poco costosa, ma
ha un grosso problema: la sua derivata non `e continua.
Prendiamo ora un altro esempio, quello in cui la soluzione interpolante
`e un arco di parabola: prender`o cos`ı i nodi a tre a tre invece che a due
a due, ottenendo per`o in generale una rappresentazione poco realistica e
continuando ad avere la discontinuit`a nella derivata, anche se questa volta
a nodi alterni.
Definiamo ora le funzioni interpolanti di tipo spline. Diremo che una
funzione S
d
(x), con d ≥ 1 `e una funzione spline di ordine d associata ai
punti ¦x
i
, y
i
¦su di un intervallo [a,b] se:
• S
d
(x)`e un polinomio di grado d in ogni intervallo [x
i
, x
i+1
]
• Ogni derivata k-esima per k ≤ d −1 `e continua
Le funzioni che vedremo in quanto in genere maggiormente usate sono le
spline di ordine 3, per le quali avremo discontinuit`a a partire dalla derivata
terza.
Nelle spline cubiche avremo che
_
_
_
S
3
(x
i
) = y
i
per i = 0 : n
S
3
(x) = a
i
+b
i
x +c
i
x
2
+d
i
x
3
∀x ∈ [x
i−1
, x
i
] per i = 1 : n
S
(k)+
3
(x
i
) = S
(k)+
3
(x
i
) per i = 1 : n −1, k = 0, 1, 2
Ove di fatto le prime condizioni corrispondono al passaggio della funzione per
i nodi (n+1 condizioni), le seconde all’imporre che la funzione interpolante
sia un polinomio di terzo grado (4n incognite) e la terza alla continuit`a della
funzione e delle sue derivate prima e seconda (3n-3 condizioni). Avremo
dunque in totale 4n incognite e 4n-2 condizioni. Rimangono dunque due
40
condizioni da imporre a piacere, che saranno generalmente ad esempio l’im-
posizione dei valori della derivata della funzione agli estremi del dominio di
integrazione.
Si tratta ora dunque apparentemente di risolvere un sistema abbastan-
za impegnativo di 4n equazioni ed incognite. In realt`a tramite opportune
trasformazioni `e possibile ridurre tali dimensioni sensibilmente
Definiamo una nuova incognita: M
i
= S

3
(x
i
). Essendo la mia spline un
polinomio di terzo grado, il polinomio risultante da una derivata seconda
sar`a lineare. Dunque avremo che:
S

3
(x) =
(x
i
−x)M
i−1
+ (x −x
i−1
)M
i
x
i
−x
i−1
Potr`o dunque scrivere la mia funzione integrando due volte ed ottenendo
cos`ı
S
3
(x) =
(x
i
−x)
3
M
i−1
+ (x −x
i−1
)
3
M
i
6(x
i
−x
i−1
)
+C
i
(x −x
i−1
) +D
i
Imponendo la condizione di passaggio per i punti sperimentali ottengo
_
C
i
=
y
i
−y
i−1
h
i
−h
i
M
i
−M
i−1
6
D
i
= y
i−1

h
2
i
6
M
i−1
Da cui l’equazione diventa:
S
3
(x) =
(x
i
−x)
3
M
i−1
+(x−x
i−1
)
3
M
i
6h
i
+
+[
y
i
−y
i−1
h
i
−h
i
M
i
−M
i−1
6
](x −x
i−1
) +y
i−1

h
2
i
6
M
i−1
Non resta altro che definire i valori degli M
i
, che si ottengono imponendo la
continuit`a della derivata prima.
Si vede che apparentemente due condizioni non sono state utilizzate. In
realt`a la continuit`a della derivata 0-esima (ovvero della funzione interpolante
stessa) `e assicurata dall’imposizione del passaggio per gli n+1 punti, mentre
la continuit`a della derivata seconda negli stessi nodi `e assicurata dal fatto
che essa stessa `e stata scelta come incognita.
Imponiamo dunque la continuit`a della derivata prima:
(x
i
−x)
2
M
i−1
+(x−x
i−1
)
2
M
i
2h
i
+ [
y
i
−y
i−1
h
i
−h
i
M
i
−M
i−1
6
] =
=
(x
i+1
−x)
2
M
i
+(x−x
i
)
2
M
i+1
2h
i+1
+
y
i+1
−y
i
h
i+1
−h
i
M
i+1
−M
i
6
Semplificando si ottiene:
h
i
M
i−1
+ 2(h
i
+h
i+1
)M
i
+h
i+1
M
i+1
=
6
h
i+1
(y
i+1
−y
i
) −
6
h
i
(y
i
−y
i−1
)
41
Il sistema che ne deriva `e di tipo tridiagonale simmetrico e dunque sostanzial-
mente facile da risolvere tramite il metodo della doppia passata. Si noti in-
oltre come la matrice del sistema sia a diagonale dominante, il che assicura
la convergenza dell’algoritmo.
Vediamo ora quali sono le due condizioni aggiuntive che possiamo im-
porre. In generale ci saranno 3 possibili strategia adottabili:
1. Imporre il valore della derivata prima agli estremi
2. Imporre il valore della derivata seconda agli estremi. In questo ca-
so, viste le incognite che sono state scelte, questo `e il sistema che
permette la risoluzione pi` u semplice in quanto consiste nell’imporre i
valori di due delle incognite a priori. Si parla in questo caso di spline
naturali. Tale condizione `e ad esempio impostata di default nel soft-
ware “Matlab”, ma si faccia attenzione che non sempre `e fisicamente
rappresentativa
3. Nel caso di andamento periodico si impone l’uguaglianza agli estremi
delle derivate prime e seconde. In questo caso tuttavia si perde la
tridiagonalit`a della matrice
2.6 Integrazione numerica
Come si calcola un integrale in modo numerico?
Avremo
I =
_
b
a
f(x)dx
Il modo pi` u semplice per tale calcolo `e dato dalle formule di Newton-
Cotes, ove scelti dei nodi x
i
vengono calcolati dei pesi ω
i
tali per cui il mio
integrale `e approssimato da una sommatoria del tipo:
I =
n

i=1
f(x
i

i
L’entit`a dell’errore generato dall’approssimazione dipende dal numero n di
nodi. Queste sono formule di quadratura di tipo interpolatorio polino-
miale, di conseguenza un numero n di nodi corrisponder`a ad un polinomio
interpolante di grado n-1 che passi esattamente attraverso tutti questi punti.
Se i nodi sono equidistanti, come `e nel caso delle formule di Newton-Cotes,
tale grado di precisione `e pari a (n-1). Tale informazione corrisponde di fatto
a dire che tale metodo mi consente di integrare con esattezza equazioni di
grado pari o inferiore ad (n-1).
L’obbiettivo di studi avanzati nel calcolo numerico `e quello di aumentare
tale grado di precisione. Le formule Newton-Cotes sono infatti ormai obso-
lete. L’aumento di precisione tuttavia, come sempre, non `e a costo nullo.
42
Per applicare un metodo numerico `e necessario di fatto sostituire la
funzione integranda con un’altra funzione pi` u facile da integrare. Per fare
questo, `e necessario scegliere tale funzione ed applicarvi le opportune con-
dizioni al contorno per il calcolo dei coefficienti. In particolare nel caso delle
formule Newton-Cotes tale operazione era effettuata imponendo n condizioni
nel calcolo dei pesi. Tali condizioni sono del tipo:
_
b
a
x
k
dx =
n

i=1
ω
i
x
k
i
Questo corrisponde a pretendere che i miei pesi mi permettano di interpolare
esattamente tutte le funzioni di base dello spazio vettoriale dei polinomi di
grado n-1. Ho in questo modo scritto una matrice di tipo Van der monde,
ovvero del tipo:
_
_
_
_
_
1 1 1
x
1
x
2
x
n
.
.
.
.
.
.
.
.
.
x
n−1
1
x
n−1
2
x
n−1
n
_
_
_
_
_
_
_
_
_
_
ω
1
ω
2
.
.
.
ω
n
_
_
_
_
_
=
_
_
_
_
_
b −a
b
2
−a
2
2
.
.
.
b
n
−a
n
n
_
_
_
_
_
Si vede dunque che il problema si riduce alla risoluzione di una matrice di
Van der Monde, che sappiamo essere fortemente mal condizionata per n
elevati. In particolare tale sistema `e generalmente utilizzato per n ≤ 4. Tale
formula di quadratura ha dunque potenzialit`a limitate.
Veniamo ora ad ulteriori considerazioni. Supponiamo di dover calcolare
l’integrale
I =
_
b
a
ω(x)f(x)dx
Questa volta ho due funzioni. In realt`a sono funzioni create in maniera tale
da avere:
• una parte (ω(x)) ove ho posto tutte le singolarit`a della funzione inte-
granda, ma anche tutto il contenuto fisico del problema.
• una parte (f(x)) regolare
Stiamo dunque di fatto trattando del caso visto inizialmente, ove a p cor-
risponde K ed a f corrisponde ϕ.
L’idea `e per`o quella di vedere come effettuare un upgrade delle for-
mule Newton-Cotes, ovvero di ottenere un grado di precisione nell’approssi-
mazione dell’integrale superiore a (n-1).
Una possibilit`a `e quella di abbandonare l’imposizione a priori dei nodi.
Questi dunque non soltanto saranno incognite di equazioni, ma non saranno
pi` u evidentemente equidistanti. Si tratta dunque a questo punto di imporre
non pi` u soltanto n condizioni per il calcolo dei pesi, ma anche ulteriori n
43
condizioni per il posizionamento dei nodi. Otterr`o dunque un sistema del
tipo:
_
b
a
ω(x)x
k
dx =
n

i=1
λ
i

i
)
k
per k = 0...2n −1
Ove i λ
i
sono i pesi ed i µ
i
sono i nodi. Il problema, che da un lato fornir`a
generalmente una soluzione pi` u precisa, `e per`o diventato pi` u complesso:
non soltanto le condizioni sono diventate 2n, e dunque `e raddoppiata la
dimensione del sistema da risolvere, ma `e diventato non lineare. In questo
diventa dunque fondamentale l’utilizzo di polinomi ortogonali, ai quali sono
associate formule di quadratura dette gaussiane
L’obbiettivo che ci si pone, aumentando il numero dei gradi di libert`a, `e
quello di ottenere un gradi di precisione maggiore, in particolare passando
da n-1 a 2n-1, ovvero essere in grado di integrare in maniera esatta polinomi
di grado pari o minore a 2n-1. Dunque andr`o ad imporre tale condizione
che, chiamati m
k
=
_
b
a
ω(x)x
k
dx, permette di ottenere il seguente sistema
di equazioni:
_
¸
¸
¸
_
¸
¸
¸
_
λ
1

2
+ +λ
n
= m
0
λ
1
µ
1

2
µ
2
+ +λ
n
µ
n
= m
1
.
.
.
λ
1
µ
2n−1
1

2
µ
2n−1
2
+ +λ
n
µ
2n−1
n
= m
2n−1
Ho cos`ı imposto 2n condizioni. A supporto della funzionalit`a di questi
sistemi esistono alcuni teoremi che enunceremo qui di seguito:
Teorema 9 Nell’ipotesi in cui ω(x) ≥ 0 ∀x ∈ [a, b] , ovvero sempre non
negativo, e in cui tutti gli m
k
esistano per ogni k tra 0 e 2n-1, il sistema
di equazioni non lineari che ne deriva ha una soluzione unica ed univoca,
ovvero esiste uno ed un solo set di ¦λ
i
¦ e ¦µ
i
¦ che forniscano un polinomio
interpolante di grado di precisione 2n-1
Si noti che procedendo in questa maniera i nodi non sono pi` u equidistanti
tra loro. Questo diventa di importanza molto rilevante ove essi vadano a cor-
rispondere con la discretizzazione di un dominio. Tali formule di quadratura
dovrebbero per`o, quantomeno in linea teorica, attuare un processo di dis-
cretizzazione “intelligente”, ovvero tale da addensare la discretizzazione ove
la funzione ha variazioni pi` u sensibili e a renderla meno fitta ove invece la
funzione sia pi` u regolare.
Il problema `e che ora la matrice da risolvere `e ancora pi` u complessa e,
comunque, mal condizionata. A questo proposito entra in gioco un teorema
fondamentale per l’integrazione numerica:
Teorema 10 Affinch`e la formula di quadratura sia gaussiana, ovvero abbia
grado di precisione pari a 2n-1, deve essere che L’insieme dei µ
i
coincida
44
con l’insieme degli zeri del polinomio P
n
(x) ortogonale in [a, b] rispetto alla
funzione peso ω(x)
Definiamo ora meglio i polinomi ortogonali
Prendiamo un intervallo [a,b], non necessariamente finito, sul quale defini-
amo una funzione peso ω(x) che sia a segno costante su tutto l’intervallo e
della quale esistano i momenti, definiti come:
M
k
=
_
b
a
ω(x)x
k
dx < ∞ per k = 1, 2...
Individuo quindi una classe di polinomi ¦P
0
(x), P
1
(x)....P
(
x)¦ che sar`a detta
ortogonale su [a,b] rispetto alla funzione peso ω(x) se
_
b
a
ω(x)P
n
(x)P
m
(x)dx =
_
0 n ,= m
cost n = m
Tale costante sar`a uguale per tutti gli n, ed un set di polinomi `e definito
ortonormale ove tale costante sia uguale ad 1. In ogni caso tale costante
sar`a sempre positiva in quanto abbiamo supposto la non negativit`a del-
la funzione peso p(x) su tutto l’intervallo [a,b]. La scelta dell’intervallo e
della funzione peso individua inequivocabilmente una classe di polinomi or-
togonali a meno di coefficienti costanti e non nulli. In generale i polinomi
ortogonali sono definiti in base ad una formula di ricorrenza a tre termini,
del tipo:
_
_
_
P
−1
(x) = 0
P
0
(x) = 1
P
n+1
(x) = (x −a
n
)P
n
(x) −b
n
P
n−1
(x)
Si vede dunque che una volta definiti l’intervallo [a,b], la funzione peso e i
valori dei coefficienti a
n
e b
n
tutti i polinomi ortogonali sono determinabili
in maniera univoca. Si vede inoltre come dentro la definizione di un generico
P
n+1
siano coinvolti tutti i polinomi di ordine inferiore.
L’interesse che risiede nei polinomi ortogonali `e dato dalle propriet`a dei
loro zeri. Si ha infatti che:
• Per ogni n ≥ 1, P
n
(x) possiede n zeri reali e distinti tutti contenuti
nell’intervallo [a,b]
• Tra due zeri consecutivi di P
n
(x) ne `e incluso uno solo di P
n−1
(x)
Prendiamo ora un generico polinomio Q
m
(x). Esso sar`a rappresentabile in
modo univoco tramite una combinazione lineare di polinomi ortogonali:
Q
m
(x) =
m

i=0
c
k
P
k
(x)
45
Per il calcolo dei coefficienti posso semplicemente sfruttare l’ortogonalit`a
dei polinomi: per il calcolo di un generico c
k
`e sufficiente moltiplicare ambo
i membri per il corrispondente polinomio P
k
(x) e per la funzione peso ed
integrare da entrambe le parti su [a,b]. Se ne ottiene:
c
k
=
_
b
a
ω(x)Q
m
(x)P
k
(x)dx
_
b
a
ω(x)P
2
k
(x)dx
Dalla propriet`a di ortogonalit`a dei polinomi si pu`o anche ricavare che:
_
b
a
ω(x)P
n
(x)q
m
(x)dx = 0 ∀m < n
Questo `e dovuto al fatto che io posso sempre scrivere
Q
m
(x) =
m

i=0
c
k
P
k
(x)
Ma essendo ogni volta i diverso da n, per l’ortogonalit`a dei polinomi l’inte-
grale `e sempre nullo.
Vediamo ora alcune classi di polinomi ortogonali: I Polinomi di Leg-
endre hanno
• ω(x) = 1
• [a, b] = [−1, 1]
Il fatto che la funzione peso abbia valore unitario mi dice che tutti gli in-
tervalli in cui posso suddividere la mia funzione originaria hanno la stessa
importanza. I polinomi di Legendre sono definiti dalla seguente formula di
ricorrenza a tre termini:
_
_
_
P
0
(x) = 1
P
1
(x) = x
(n + 1)P
n+1
(x) = (2n + 1)xP
n
(x) −nP
n−1
(x)
Sono dei polinomi particolarmente importanti perch`e sono molto adatti nel-
la discretizzazione di particelle libere in geometria sferica, soprattutto ove
si voglia discretizzare la variabile angolare. Un esempio `e l’equazione del
trasporto, ove la velocit`a di un neutrone sar`a data in generale da v = v

Ω.
Gli zeri dei polinomi di Legendre corrisponderanno alle direzioni di volo delle
particelle.
I Polinomi di Jacobi sono un’altra categoria di polinomi ortogonali,
aventi:
• ω(x) = (1 −x)
α
(1 +x)
β
• [a, b] = [−1, 1]
46
Si vede evidentemente che per α = β = 0 la scrittura degenera nei polinomi
di Legendre, che costituiscono dunque un caso particolare di polinomi di
Jacobi.
Per polinomi di Jacobi con α = β = −
1
2
ho i Polinomi ti Tcheby-
chev di prima specie, che vedremo in seguito utilizzati come supporto per
l’accelerazione della convergenza di algoritmi lenti. Per invece α = β =
1
2
si hanno i polinomi di Tchebychev di seconda specie che servono ad
approssimare funzioni speciali, come la E
1
.
I Polinomi di Laguerre hanno invece:
• ω(x) = e
−x
• [a, b] = [0, +∞[
e sono usati in problemi di rilevazione satellitare e di fenomeni radiativi (si
noti a questo proposito la presenza del termine esponenziale)
I Polinomi di Hermite, hanno infine:
• ω = e
−x
2
• [a, b] =] −∞, +∞[
Dunque ci`o che ci interessa `e trovare gli zeri di tali polinomi. Per farlo
conosciamo, di base, almeno quattro modi diversi:
• Bisezione
• Regula falsi
• Secanti
• Newton
In realt`a non si andranno mai ad usare tali metodi, ma ne esistono di appositi
per i polinomi ortogonali.
Dunque dal problema
_
b
a
ω(x)f(x)dx =

i
λ
i
f(µ
i
) +err
sono passato prima a:
_
¸
¸
¸
_
¸
¸
¸
_
λ
1

2
+ +λ
n
= m
0
λ
1
µ
1

2
µ
2
+ +λ
n
µ
n
= m
1
.
.
.
λ
1
µ
2n−1
1

2
µ
2n−1
2
+ +λ
n
µ
2n−1
n
= m
2n−1
ed infine a:
P
n

i
) = 0
47
Ove P
n
`e il polinomio ortogonale scelto all’inizio del problema in funzione
dell’intervallo di integrazione e della funzione peso. La risoluzione del prob-
lema intermedio `e dunque inutile, visto che le soluzioni sono date dagli zeri
del polinomio. Dunque di fatto posso ottenere i valori dei nodi, grazie ai
quali andr`o a calcolare i pesi.
Andiamo per esempio a vedere cosa succede utilizzando i polinomi di
Legendre: otterremo una equazione nella forma:
_
1
−1
1 f(x)dx ·

i
λ
i
f(µ
i
)
Si vede che in questo caso la funzione peso `e pari ad uno, e dunque di fatto
non d`a alcun peso differente ai vari intervalli. Si parla in questo caso di
formule di Gauss-Legendre
Stesso discorso pu`o essere effettuato per altri sistemi, ottenendo ad
esempio le formule di Gauss-Laguerre:
_

0
e
−x
f(x)dx ·

i
λ
i
f(µ
i
)
ove i nodi sono in questo caso dati dagli zeri del polinomio di Laguerre.
I risultati portano a situazioni differenti. Nel caso delle formule di Gauss-
Legendre ottengo un addensamento dei nodi ai bordi del dominio, con ten-
denza tanto pi` u marcata quanto pi` u n `e grande (nonostante la funzione peso
sia costante).
Attenzione dunque. La scelta della formula di quadratura non `e casuale,
ma effettuata in base al legame fisico ed alle esigenze computazionali
17
Ho dunque trasformato il mio problema in un problema di ricerca di
zeri di polinomi omogenei. Attenzione per`o: tale problema `e molto mal
condizionato, soprattutto ove la derivata prima del polinomio sia piccola e
dove il numero di zeri n sia elevato.
Maledizione! Dunque neanche questo terzo problema numerico sar`a quel-
lo che andremo, in definitiva, a risolvere. Dovremo di fatto ripensare il
17
Ritornando a quanto detto sulla propagazione degli errori, le formule di ricorrenza a
tre termini sono esattamente uno dei punti potenzialmente problematici di un algoritmo
dei quali andranno dunque studiati condizionamento e stabilita. Dunque in effetti quando
andremo ad inserire una formula di ricorrenza a tre termini, non lo faremo secondo la
definizione vista in precedenza, ma tramite l’algoritmo di Clanshaw, che trasforma
quello precedente in uno pi` u stabile:



y
m+2
= y
m+1
= 0
y
k
= (A
k
¯ x + B
k
)y
k+1
−C
k
y
k+2
+ c
k
y
0
k
0
= Q
m
(¯ x)
Si tratta di un algoritmo ricorsivo all’indietro, ove devono essere noti i coefficienti ricorsivi
del polinomio ortogonale. Il risultato che si ottiene utilizzato questo tipo di algoritmi `e
affidabile
48
problema numerico dall’inizio, in modo tale da ottenere le stesse soluzioni
del problema che ci siamo posti, rendendolo per`o pi` u facile da risolvere.
La prima operazione da effettuare `e una normalizzazione dei polinomi,
in modo tale che
_
b
a
ω(x)P
2
m
(x)dx = 1
Ottenendo cos`ı un insieme di polinomi ortonormali. In questo modo la
formula di ricorrenza assume la forma:
P
m+1
(x) = (A
m
x +B
m
)P
m
(x) −
A
m
A
m−1
P
m−1
Che si pu`o riscrivere nella forma
xP
m
(x) =
1
A
m
P
m+1

B
m
A
m
P
m
(x) +
1
A
m−1
P
m−1
che, rinominando opportunamente i coefficienti come:
α
m
=
1
A
m
e β
m
= −
B
m
A
m
diventa
xP
m
(x) = α
m
P
m+1

m
P
m
(x) +α
m−1
P
m−1
Posso dunque riscrivere il tutto in forma matriciale, del tipo:
x

P(x) =
ˆ
T

P(x) +α
n−1
P
n
(x)e
n
con e
n
α
n−1
= ¦0, 0, , 1¦
Se calcoliamo tale espressione nei nodi µ
i
, sapendo che questi sono tali da
essere zeri di P
n
, otteniamo la forma finale:
µ
i

P(µ
i
) =
ˆ
T

P(µ
i
)
Questo non `e altro che un problema agli autovalori di tipo classico ove gli
zeri del polinomio P
n
(x) coincidono con gli autovalori del problema stesso.
Questo `e dunque, in definitiva, il vero problema che andremo a risol-
vere. La matrice T `e in effetti tridiagonale e simmetrica, il che come detto
rende possibile ottenere la risoluzione tramite l’applicazione del metodo della
doppia passata. I pesi sono infine determinati, una volta noti gli autovalori
del problema e di conseguenza i nodi µ
i
, dall’equazione:
λ
i
=
1

n−1
j=0
[P
j

i
)
2
]
49
2.7 Equazioni integrali
Ci si riferisce in particolare alle cosiddette equazioni di Frehdolm di
seconda specie. Non `e ovviamente l’unico tipo esistente, ma ve ne sono
altre come le equazioni integrali di Volterra. Caratteristica peculiare delle
equazioni di Frehdolm `e quella di basarsi su integrali definiti. Un tipico
esempio di equazione di Frehdolm di seconda specie `e il seguente:
ϕ(x) = h(x) +
_
K(x, y)ϕ(y)dy
Con riferimento alla simbologia dell’equazione precedente, abbiamo che:
ϕ(x) `e la funzione incognita
h(x) `e il termine forzante
K(x, y) `e il nucleo o kernel della funzione di integrazione, ove in pratica
`e situata la fisica del problema.
18
Ove il termine forzante sia assente, l’equazione di partenza viene ricon-
dotta (come visto nel paragrafo precedente) ad una equazione integrale
agli autovalori, del tipo:
Ax = λx oppure Ax = λBx
tali casi si riconducono entrambi alla risoluzione di un problema del tipo
D(λ)x =

0, ove D(λ) `e una matrice dipendente da parametro. Il caso
pi` u agevole, ma anche in geneale quello meno interessante, `e quello ove tale
dipendenza sia lineare.
Quelli enunciati fino ad ora sono problemi matematici. Per passare al
problema numerico sar`a necessario introdurre degli errori di idealizzazione.
Partiamo dal kernel, ove come detto `e nascosta la fisica del problema.
Sulla base di questo dovremo procedere all’integrazione scegliendo oppor-
tunamente la formula di quadratura. Una volta effettuata tale operazione
la risoluzione dell’equazione integrale diventer`a un problema algebrico del
tipo:
ϕ(x) · h(x) +
n

i=1
ω
i
k(x, y
i
)ϕ(y
i
)
Tuttavia `e necessario abbandonare l’idea di calcolare direttamente la soluzione
esatta ϕ(x). Ci`o che riuscir`o ad ottenere sar`a sempre e comunque una
soluzione approssimata. Andr`o dunque a sostituire alla mia ϕ(x) una ϕ
n
(x)
dove l’indice n mi d`a informazioni sulla precisione del polinomio interpolante.
18
Tale nucleo pu` o essere singolare nel dominio di integrazione; in questo caso la
risoluzione diventa maggiormente complessa
50
La scelta di n dipende dal problema fisico e, come sempre, dal rapporto
costi-benefici.
Una volta effettuato tale passaggio otterr`o che la mia equazione sar`a
divenuta della forma:
ϕ
n
(x) · h(x) +
n

i=1
ω
i
k(x, y
i

n
(y
i
)
Occorre a questo punto ricordare che, nel calcolo numerico, non si opera
quasi mai nel continuo, ma si opera un processo di discretizzazione per
arrivare ad un numero finito di nodi in cui sar`a calcolata la funzione. Si
tratter`a dunque di andare a collocare i nodi, che sono i punti in cui imporr`o
l’esattezza della mia equazione. Otterr`o cos`ı una forma del tipo:
ϕ
n
(x
i
) = h(x
i
) +
n

i=1
ω
i
k(x
i
, y
i

n
(y
i
)
In questo caso il “circa uguale” `e stato sostituito con un uguale in quanto
stiamo imponendo proprio che la nostra approssimazione sia esatta nei nodi
scelti.
Sono dunque di fronte ad un problema lineare non omogeneo del tipo

i

ij

i
k(x
i
, y
i
)]ϕ
n
(x
i
) = h(x
i
)
che assume di fatto una forma del tipo Ax=b. Trattandosi di un problema
non omogeneo esso sar`a risolvibile solo se det(A) ,= 0, e come qualsiasi
problema numerico `e necessario accertarsi del buon condizionamento della
matrice A. Una volta effettuata tale verifica, esisteranno come sempre le due
strade:
• se la matrice `e sparsa, si operer`a iterativamente
• se la matrice `e densa, si operer`a tramite metodi diretti
In generale sar`a pi` u probabile, nel caso di equazioni integrali, trovarsi di
fronte a matrici dense. Un esempio tipico di questo caso `e la trasmissione dei
segnali, ove nonostante si abbia una attenuazione esponenziale del segnale `e
teoricamente necessario tenere conto di ogni possibile sorgente, il che porta
ad avere matrici quasi interamente non nulle.
51
Capitolo 3
Metodi numerici per
l’ingegneria nucleare
3.1 Introduzione alla tecnologia ed alla fisica nu-
cleare
Un reattore nucleare `e identificato da un punto di funzionamento. Possiamo
supporre che esistono varie zone:
• Sicure
• di Allarme
• Incidentali
Il produttore deve tendenzialmente adattarsi alle richieste di carico della
rete. Questo dipende tuttavia anche da numerosi altri fattori: in Italia ci
si aspetta che eventuali centrali nucleari di nuova costruzione opererebbero
in modo tale da supportare il carico di base, lavorando quindi in condizioni
teoricamente ottimali. In un contesto pi` u generale tuttavia anche i gestori
nucleari dovranno adattarsi alle richieste di rete, il che li porter`a a porsi
in punti di funzionamento differenti dall’ottimale. Il punto chiave `e che
`e necessario assicurarsi che tali variazioni del punto di funzionamento non
portino a spostarsi al di fuori della zona sicura. Si noti che pi` u i miei codici
di controllo sono efficaci e precisi, pi` u la zona definita sicura potr`a essere
estesa. Dunque, come `e accaduto di recente in Svezia, a volte per aumentare
la potenza prodotta dalle centrli `e sufficiente migliorarne il controllo in modo
da potersi spingere in sicurezza in zone di funzionamento prima inaccessibili.
Nelle pagine che seguono ci si concentrer`a sullo studio di piccoli transitori
e piccole oscillazioni attorno ad un valore costante. Si noti che, nonostante
tali fenomeni verranno visti in riferimento al nucleare, non sono affatto di
esso esclusivi, ma anzi esistono altri casi di controllo simile
1
.
1
Si vedano ad esempio i problemi legati al ripple di corrente
52
Ammettiamo inizialmente di avere un sistema molto semplice, di cui
supporremo di conoscere con precisione la geometria (considerata invari-
ante nel tempo, anche se questo `e vero solo fino ad un certo punto) e la
composizione materiale (che invece varia nel tempo in modo marcato).
Supponiamo inoltre che:
• Ogni neutrone uscito `e perduto; non vi `e dunque rientro di neutroni
• Non ci sono neutroni entranti nel sistema dall’esterno: n`e, come detto,
riflessi n`e generati da una sorgente esterno
Queste ipotesi ci permettono di considerare un problema omogeneo
Utilizzeremo come ultieriore astrazione quella di supporre che i neutroni
siano gi`a presenti nel sistema, ovvero ci dimenticheremo dei transitori di
avviamento. All’interno di questo sistema i neutroni interagiranno con il
materiale nucleare (e non) presente e potranno avere determinate iterazioni
piuttosto di altre a seconda della loro probabilit`a, quantificata dalla sezione
d’urto.
Sappiamo dalla fisica nucleare che l’interazione di un neutrone con un
nucleo pu`o dare luogo alla scomparsa del neutrone stesso ed alla produzione
di una trasmutazione del nucleo di partenza. Delle reazioni di questo tipo
quella di maggior interesse sar`a quella di fissione. In questo caso il neu-
trone, catturato da un nucleo fissile, porta alla formazione di un nucleo
composto ed instabile che, in tempi trascurabili, si scinder`a in pi` u nuclei di
dimensioni inferiori provocando la produzione di radiazioni ed altri neutroni.
Questo tipo di fenomeni ci porta a comprendere come, in effetti, il supporre
composizione materiale costante sarebbe una approssimazione troppo forte.
Non tutti i tipi di interazione tuttavia danno luogo a questo tipo di
fenomeni, ed anzi quelli in generale pi` u frequenti saranno quelli in cui il
neutrone rimbalza contro i nuclei del materiale in cui si muove, dando cos`ı
luogo a scattering. Lo scattering `e, per natura, un fenomeno isotropiz-
zante; Tutte le sezioni d’urto che vedremo, invece, sono da considerarsi in
materiale isotropo.
2
Al fine del controllo del reattore, e lo ripeteremo pi` u volte, sono fonda-
mentali i neutroni ritardati. I fenomeni di emissione rapida sono infatti
troppo veloci per essere controllati, mentre l’incidenza dei fenomeni di emis-
sione ritardata `e, seppure piccola, sufficientemente elevata da consentire il
controllo delle reazioni.
Il nostro obbiettivo sarebbe quello di mantenere la potenza prodotta
costante. Tuttavia, per quanto detto, un sistema nucleare per fare ci`o avr`a
2
La differenza tra isotropo e isotropizzante `e sottile ma sostanziale. Lo scattering `e
un fenomeno isotropizzante nel senso che la direzione di volo del neutrone in uscita ha
probabilit` a indipendente dall’angolo solido. Un materiale `e invece detto isotropo rispetto
ad un fenomeno ove tale fenomeno ha una probabilit` a di avvenire equa indipendentemente
dall’angolo solido di volo
53
bisogno di un quantitativo elevato di sistemi di controllo e regolazione, che
comunque saranno in grado di assicurare tale costanza di produzione solo in
prima approssimazione.
Esistono fondamentalmente tre tipi di sitemi di controllo:
Barre di controllo : Sono sistemi a movimentazione elettromeccanica, di
cui esistono a loro volta diverse tipologie:
• Per lo spegnimento rapido (scram)
• Per la macro regolazione (abbassamento / innalzamento richieste
di rete)
• Per la micro regolazione (o regolazione fine, sempre in moto per
il controllo del k effettivo)
Controllo chimico : Si parla in questo caso del cosiddetto avvelenamen-
to del refrigerante per via chimica, in generale tramite dissoluzione di
sali di boro
Controllo fisico-chimico Alcune pastiglie inserite all’interno degli elemen-
ti di combustibile sono realizzate con dei materiali assorbitori (ad
esempio ossido di gadolinio)
Dei tre sistemi descritti l’ultimo `e l’unico non online, ovvero che non pu`o
essere modificato a piacimento una volta che gli elementi di combustibile
sono stati montati. Tale sistema `e in generale usato per regolare la presenza
di neutroni in determinate zone del reattore ed a determinate energie.
I veleni di cui si `e parlato finora sono bruciabili. Ci`o implica che essi si
consumano dopo l’uso. Dunque, in fase progettuale, la concentrazione degli
ossidi di gadolinio nelle pastiglie deve essere calcolata tenendo in conto della
progressiva diminuzione del loro quantitativo nel tempo. Il fenomeno per
cui i sistemi di controllo non online sono pi` u efficaci all’inizio della vita del
reattore che alla fine `e detto rilascio di reattivit` a.
Si tenga conto comunque che i metodi numerici associati alla risoluzione
dell’equazione della diffusione multigruppo non permettono n`e il controllo
di centrale n`e la progettazione. Essi sono infatti applicati a problemi meno
critici, ed in particolare alla programmazione della sostituzione delle barre
di combustibile
3
.
3
Ci si potrebbe in realt`a chiedere per quale ragione il consumo non pu` o essere pro-
grammato in anticipo sfruttando i metodi pi` u precisi che vengono utilizzati in fase di
progettazione. Questo non accade in quanto durante la vita di un reattore, esso non opera
sempre in condizioni nominali, ma seguendo una serie di fasi a potenze differenti ed andr` a
incontro ad un largo numero di transitori, pi` u o meno traumatici, che renderanno im-
possibile la previsione a priori del consumo di combustibile. Questa dunque dovr` a essere
programmata tenendo in considerazione, seppure in maniera approssimativa, la vita del
reattore che precede la sostituzione. Si ricorda inoltre che transitori veloci sono molto
pericolosi, in quanto possono provocare la formazione di cricche all’interno degli elemen-
54
3.1.1 Il concetto di criticit`a e le sue implicazioni
Come pu`o un sistema rimanere, da un istante all’altro, stabile? Quando il
numero di neutroni che nascono da fissione per unit`a di volume e di tempo `e
sempre uguale a quelli che muoiono (sono assorbiti od escono dal sistema),
per unit`a di volume e di tempo diremo che il sistema `e critico.
4
Ci stiamo dunque preoccupando dello studio di criticit`a di un sistema
moltiplicante tramite le equazioni della diffusione multigruppo in 3D. Cercher-
emo in questa sede di analizzare lo sforzo computazionale che questo implica.
Torniamo ora al concetto di criticit`a. Stiamo parlando di un sistema
moltiplicante ove dobbiamo essere in grado di mantenere le reazioni a cate-
na senza che queste diminuiscano od aumentino di intensit`a oltre certi livelli.
Assumendo, come detto, composizione variabile, se il sistema `e critico al-
l’istante t non lo sar`a mai anche all’istante t + ∆t, a meno di non cambiare
qualcosa nel sistema.
Cosa succede quando porto questi ragionamenti in una logica computazionale?
Otterr`o come noto dei risultati rappresentativi della realt`a fisica, ma non
esatti, e di questo dovr`o ovviamente tenerne in conto poich`e si parla di
sistemi molto sensibili agli errori, in particolare riguardo lo scostamento
dalla criticit`a. Ogni volta che tale spostamento supera una soglia anche
apparentemente molto piccola i problemi non possono pi` u essere considerati
stazionari, e ci si sposter`a in un’altra classe di problemi, detti di cinetica
neutronica. In teoria infatti ogni volta che ci troveremo in condizioni di
k
eff
,= 1 non potremo pi` u parlare di criticit`a e ci troveremo in condizioni
cinetiche e, dunque, non stazionarie.
All’interno degli studi di criticit`a `e importante ritornare alla realt`a anche
dal punto di vista geometrico. Il nostro dominio non sar`a pi` u dunque una
sfera perfetta ma un sistema complesso che abbia il pi` u possibile le sem-
bianze del reattore reale che vogliamo andare a studiare. Questo avr`a anche
implicazioni di tipo energetico legate, ad esempio, alla termodinamica della
sottrazione del calore o al variare dell’effetto moderante in funzione della
fase del moderatore.
Come detto l’obbiettivo sar`a quello di portarsi in condizioni di potenza
termica costante. Nella realt` a delle cose non `e tuttavia possibile raggiungere
ti di combustibile che portano alla fuoriuscita dei prodotti di fissione e la conseguente
contaminazione del circuito primario. Questo evento pu` o determinare la necessit` a della
sostituzione anticipata di un elemento di combustibile. La criticit` a della guaina che cir-
conda le barre d’uranio al fine di contenere i prodotti di fissione `e tale che le saldature
presenti in detta guaina sono controllate ai raggi X una per una in fase di produzione
4
La criticit` a di un reattore dipende esclusivamente dalla sua geometria e dalla sua
composizione materiale in un determinato istante, e non dal numero di neutroni che vi
sono contenuto. Quindi, almeno a livello concettuale, un reattore pu` o essere critico anche
in totale assenza di neutroni, la cui presenza serve solo (e non `e poco) alla produzione di
energia. La presenza di neutroni, e le conseguenti iterazioni che essi hanno con il materiale,
andranno istantaneamente a modificare la composizione materiale del sistema, provocando
cos`ı la perdit` a di criticit` a dello stesso.
55
tale obiettivo, e il sistema tender`a di conseguenza ad oscillare continuamente
tra condizioni di lieve (si spera) sotto e sopracriticit`a.
La criticit`a `e dunque raggiungibile solo agendo sui sistemi di controllo,
che permettono di variare la composizione materiale del sistema a piacimen-
to. Esistono invece sistemi di sicurezza intrinseca e passiva il cui com-
pito sar`a quello di far raggiungere al sistema livelli fortemente sottocritici
nel minor tempo possibile.
In generale a sistema sovracritico corrisponde una crescita di potenza,
mentre ad un sistema sottocritico corrisponde un calo della stessa. Questa
corrispondenza, seppur frequente, non `e tuttavia univoca. Una delle ra-
gioni dell’incidente di Chernobyl `e stata anche una condizione di apparente
sottocriticit`a associata tuttavia ad un aumento di popolazione neutronica.
Gli incidenti di criticit` a sono situazioni in cui la criticit`a di un
sistema `e raggiunta involontariamente, e sono evidentemente molto peri-
colose. Sono situazioni tipiche ad esempio dei processi di ritrattamento del
combustibile, ove si pu`o per errore configurare un sistema (ad esempio di
stoccaggio intermedio) in modo tale che questo risulti avere casualmente
k
eff
> 1.
5 6
3.1.2 Fenomeni non stazionari
La semplificazione di pseudo-stazionariet`a `e accettabile solo in determinati
casi, mentre in altri non `e realistica. Alcuni esempi sono:
Transitorie Si tratta di fasi non-stazionarie non pericolose, generate dal-
l’attivit`a volontaria di regolazione derivante dalla gestione del sistema.
Si parla in particolare delle fasi di
• Avviamento
• Spegnimento
• Regolazione del carico
Incidentali Si tratta in questo caso delle condizioni in cui `e necessario
spegnere rapidamente il reattore. Tale operazione `e definita scram, ed
`e sensibilmente differente dallle operazioni di spegnimento “standard”.
L’incidente pi` u grave che possa verificarsi in una centrale nucleare `e il
LOCA (Loss Of Cooling Accident), ove si ha una perdita immediata
di praticamente tutto il liquido refrigerante.
5
L’ultimo incidente di questo tipo `e avvenuto in Giappone nel 1999. Questi incidenti
sono potenzialmente molto gravi e portano all’emissione di forti quantit` a di radiazioni γ
e di neutroni, con possibilit` a anche di innesco di reazioni esplosive
6
Un caso molto particolare `e quello di una zona mineraria del Gabon, ove nel tempo
si sono naturalmente ripetute pi` u volte per pi` u di un milione di anni delle situazioni di
criticit` a naturale. Si noti che l’uranio 235 `e in generale presente in natura in quantitativi
molto bassi, in media con arricchimenti inferiori allo 0,7%
56
Approfondiamo, per completezza, qualche cenno legato ai fenomeni tran-
sitori, ai quali sono infatti legate delle condizioni in cui il gestore di una
centrale vorr`a portarsi deliberatamente in condizioni sovracritiche.
Cosa succede ad esempio all’accensione? Supponiamo di aver appena
spento il reattore per la ricarica e di volerne garantire l’attivit`a continuativa
per un quantitativo compreso tra 18 e 36 mesi. All’inizio di tale periodo il
sistema, privo di barre di controllo, sar`a dunque fortemente sovracritico per
due ragioni:
• Per poter garantire per il numero di mesi richiesti il mantenimento
della criticit`a, anche in presenza di sistemi di controllo
• Per poter accendere il sistema
Supponiamo dunque di avere, in t=0, flusso neutronico nullo. Per accen-
dere il sistema dovr`o, in qualche modo, buttarci dentro dei neutroni. Una
volta completata questa fase dovr`o poi utilizzare i sistemi di controllo per
aumentare la potenza passo a passo fino al valore richiesto.
7
Veniamo ora invece al caso della regolazione, ovvero ad esempio del
caso in cui la rete richieda un aumento di potenza. Tale procedimento risulta
essere analogo alle procedure di accensione e spegnimento, ove dunque il
livello di potenza richiesto non `e raggiunto tramite un unico passaggio ma
attraverso diversi piccoli salti.
3.1.3 L’importanza neutronica ed i metodi per lo studio di
problemi pseudo-stazionari
Immaginiamo di avere un sistema estremamente semplice, sul quale faremo
le seguenti supposizioni:
• sferico
• critico
• geometria e compisizione materiale ben note e costanti nel tempo
• trascuriamo i problemi prettamente tecnici, come la strategia scelta
per la sottrazione del calore e via dicendo
• poniamo tale sistema sotto al Gran Sasso, ove dunque potremo pensare
che non vi siano neutroni
7
teoricamente si dovrebbero avere problemi di questo tipo anche in fase di spegnimento
o calo di potenza, ma in pratica tali operazioni sono molto meno delicate in quanto un
eccesso di scostamento dalla criticit` a provocherebbe solo uno spegnimento troppo brusco
e non una esplosione. Nonostante ci` o si tenga comunque in conto che per l’integrit` a del
sistema pi` u i transitori sono lenti, meglio `e
57
Supponiamo ora di poter generare all’interno di tale sistema delle sorgenti
di neutroni puntiformi in maniera totalmente arbitraria. Chiamer`o tali sor-
genti S
1
ed S
2
, e le posizioner`o in due sistemi altrimenti identici, in due
posizioni diverse (immaginiamo S
1
esattamente al centro del sistema ed S
2
in prossimit`a del confine). La domanda che ci poniamo `e la seguente: i due
sistemi si comporteranno in maniera differente?
Ricordando la supposizione iniziale di criticit`a e geometria e compo-
sizione materiale costanti, avr`o che i due reattori, dopo il transitorio iniziale,
si porteranno a due condizioni di equilibrio differenti tra loro, con potenze
P
1
e P
2
prodotte diverse. In effetti il punto chiave sta nel fatto che i neutroni
prodotti dalla seconda sorgente, essendo essa posizionata pi` u vicina alla fron-
tiera, tenderanno con maggiore facilit`a ad uscire dal sistema rispetto a quelli
prodotti dalla prima sorgente. Si vede dunque che, a livello neutronico, non
tutte le zone del rettore sono uguali. Definiamo dunque importanza di un
neutrone come il contributo che esso pu`o dare all’ottenimento del-
la potenza asintotica del sistema. Essa `e una funzione dell’energia del
neutrone, della sua direzione di volo ma anche della sua posizione, come
appena detto. A parit`a dunque delle prime due variabili, un neutrone pi` u
vicino al cuore del sistema sar`a generalmente pi` u importante di uno posto
in prossimit`a della periferia
8
.
Conoscere l’importanza che i neutroni hanno in una determinata zona
del reattore `e fondamentale ai fini della progettazione delle barre di controllo
ed in generale dei sistemi di sicurezza e regolazione. Il loro intervento sar`a
infatti tanto pi` u efficace tanto maggiore `e l’importanza dei neutroni che essi
andranno ad assorbire. Avremo dunque, ad esempio, che le barre di controllo
per lo scram sono posizionate al centro del reattore.
Torniamo al sistema sferico critico ideale. Cosa accadrebbe se andassimo
a modificare la geometria o la composizione materiale? Non `e difficile intuire
che:
• Se andiamo ad aumentare l’arricchimento, si avr`a uno spostamento
verso la sovracriticit`a del sistema
• Se andiamo ad aumentare il raggio della sfera andremo a diminuire
il rapporto superficie / volume e dunque a diminuire l’incidenza delle
fughe sul bilancio neutronico, il che porta anche in questo caso ad uno
spostamento verso la sovracriticit`a
Se passiamo dunque al problema numerico corrispondente, avremo in
generale due tipi di autovalori:
• Materiale
8
In diffusione monodimensionale importanza e flusso neutronico coincidono. Questo
mostra come, almeno come linea generale, che le zone ad importanza maggiore sono quelle
ove vi sono pi` u neutroni
58
• Geometrico
Questo mi dice che di fatto che per modificare la criticit`a del sistema potr`o
andare ad operare sia sulla geometria che sulla composizione geometrica
dello stesso. Questa operazione non `e tuttavia agevole.
Torniamo ora alla buona vecchia analisi numerica. Il fine `e quello di ge-
stire i programmi di ricarica del combustibile di un reattore tramite la mod-
ellizzazione numerica dei fenomeni che avvengono al suo interno. Dunque
vorr`o studiare quale sar`a, istante per istante, il contenuto in U
235
, in Pu
239
e
Pu
241
, il quantitativo di veleni ancora presenti, all’interno di una panorami-
ca 3D del reattore, che potremo al pi` u semplificare sfruttandone la geometria
circolare ed andando dunque a studiarne solo un quarto della sezione, es-
trapolando i risultati al resto del sistema. Per fare questo useremo dunque
dei codici di calcolo in diffusione 3D multigruppo.
Ne esistono fondamentalmente due macro-famiglie:
Differenze finite fini ove viene attuata una discretizzazione spinta del do-
minio spaziale. In questo caso il passo tra due nodi adiacenti `e dell’or-
dine di grandezza del libero cammino medio dei neutroni. Tale sistema
`e molto oneroso dal punto di vista computazionale, ma effettuando
importanti approssimazioni sul flusso neutronico (in particolare con-
siderandolo lineare tra due nodi adiacenti) tale complessit`a `e ridotta
a livelli accettabili.
Coarse mesh s ove si applica una logica opposta: la discretizzazione spaziale
`e molto grossolana, molto pi` u grande rispetto al libero cammino medio
dei neutroni
9
. Per mantenere un livello di precisione accettabile si
sceglie tuttavia di aumentare il contenuto della definizione locale del
flusso neutronico, che sar`a generalmente una funzione polinomiale di
grado 2 o 3. Il problema `e che questo porta a problemi di tipo non
lineare, per i quali non esiste ad oggi una dimostrazione di esistenza
ed unicit`a della soluzione. Nonostante questo tali metodi, introdotti
nel 1972, sono oggi molto usati nell’ambito della programmazione delle
ricariche del combustibile.
Parleremo sempre di condizioni di pseudo-criticit`a, il che ci porter`a a
risolvere problemi agli autovalori generati dall’omogeneit`a del problema di
partenza. L’ipotesi di pseudo-criticit`a ci permetter`a quindi di dimenticarci
di fatto della dipendenza dal tempo.
9
si ricorda che il libero cammino medio di un neutrone `e funzione della sua energia,
teoricamente in modo continuo, in pratica in modo discreto nel momento in cui il dominio
energetico `e suddiviso in un numero finito di gruppi
59
3.2 Il consumo del combustibile nucleare
Veniamo ad alcune considerazioni sul combustibile nucleare. Sappiamo bene
che, purtroppo, nel momento in cui `e necessario il suo ricambio, esso `e ben
lontano dall’essere esaurito. La sostituzione degli elementi di combustibile
infatti, a differenza della maggior parte degli altri sistemi energetici, non
`e legata all’esaurimento del combustibile ma all’incapacit`a di garantire la
criticit`a del reattore. Nei momenti immediatamente successivi alla ricarica
il reattore `e fortemente sovracritico, e la reattivit`a, inizialmente controllata
dai sistemi di controllo, `e rilasciata con il consumarsi del combustibile.
10
La condizione ideale che si vorrebbe raggiungere all’interno di un reat-
tore nucleare `e quella di reattivit`a il pi` u possibile uniforme sulle varie di-
rezioni. Tuttavia questa condizione `e difficile da raggiungere, sia nei PWR
che, soprattutto, nei BWR
11
.
Prendiamo un generico reattore, arricchito al 2-4%. Dovr`o tenere in con-
to, con il passare del tempo, non solo del consumo di U
235
ma anche della
produzione di Pu
239
e Pu
241
, a loro volta fissili. Dunque il depauperamento
della quantit`a di materiale fissile all’interno del reattore `e frutto di un bi-
lancio tra consumo di uranio e produzione di plutonio
12
. Tale bilancio non
`e costante durante la vita del reattore, ed anche se in generale il consumo
di uranio `e preponderante, esiste una fase della vita del combustibile, la
cui intensit`a e durata variano da reattore a reattore, in cui la formazione
di plutonio prevale sul consumo di uranio. Tale fase `e detta plutonium
build-up
13
Quando si genera plutonio all’interno di un sistema, esso vi immette
reattivit`a. Questo dunque corrisponde ad una sorta di lieve “estrazione”
10
Si vuole qui ricordare inoltre che, in generale, alle operazioni di sostituzione del com-
bustibile sono associate anche delle fasi di movimentazione delle barre non ancora esaurite
in modo da ottimizzarne il consumo
11
nei BWR l’ebollizione dell’acqua all’interno del reattore provoca una forte diminuzione
di densit` a di moderatore nella parte alta del reattore, alla quale corrisponde un’altrettanto
marcata diminuzione di reattivit` a
12
I calcoli legati alla diffusione neutronica sono sempre basati sull’ipotesi che i prodotti di
fissione non diffondano all’interno del materiale ma restino l`ı dove sono. Questo, in realt` a,
non `e propriamente vero, ma il loro livello di diffusione `e molto ridotto, e considerato
trascurabile rispetto invece a quello dei neutroni
13
Nei reattori per la produzione di energia tale plutonio viene consumato direttamente
all’interno del reattore. Esistono tuttavia dei reattori, detti plutonigeni, che sono invece
pensati per massimizzare la produzione di plutonio, che viene successivamente estratto
ed utilizzato per fini militari. A questo proposito esistono anche reattori pensati per
il processo inverso, ovvero per essere alimentati tramite il materiale nucleare di orgine
militare. 7 dei 58 reattori francesi sono adatti anche a questo scopo, ma tale possibilit` a
richiede ulteriori accortezze in ambito di sicurezza e controllo, in quanto la reazione di
fissione del plutonio `e molto meno controllabile di quella dell’uranio (β(U
235
) 0.65,
β(Pu
239
) 0.22). Questo implica che in ogni caso i combustibili a base di plutonio (o
comunque contenenti parti non trascurabili di plutonio) non sono mai utilizzati da soli
all’interno del reattore, ma opportunamente mischiati a combustibile tradizionale
60
delle barre di controllo, il tutto legato anche alla maggiore difficolt`a del
controllo delle reazioni di fissione dell’uranio.
Vediamo anche altri tipi di reattori. Ad esempio sappiamo che i CANDU,
per come sono pensati, sono particolarmente facili da controllare. Tuttavia,
dall’altro lato, la gestione del combustibile `e pessima, ovvero il combustibile
`e sostituito quando il suo contenuto energetico `e ancora molto elevato in
relazione al suo contenuto iniziale. Questo gli `e tuttavia permesso dal fatto
che tali reattori sono alimentati ad uranio naturale e permettono il ricambio
del combustibile senza dover ricorrere allo spegnimento del reattore.
3.3 Differenze finite fini
Per quanto visto avremo dunque due livelli di discretizzazione:
Spaziale : nel passaggio ad un approccio numerico perdiamo come noto la
continuit`a dello spazio, il che ci porter`a a calcolare le grandezze fisiche
solo in alcuni punti
Energetica : ho come detto un numero finito G di intervalli monoenergetici
Dunque l’ordine di discretizzazione del mio problema sar`a N
x
N
y
N
z
G, il
cui valore pu`o facilmente essere molto elevato.
3.3.1 Diffusione monodimensionale monogruppo
Veniamo ora alla scrittura del problema, preoccupandoci quantomeno in-
izialmente del caso pi` u basilare, monodimensionale e monogruppo. Avr`o un
problema del tipo:
_
_
_
D
d
2
Φ
dx
2
−Σ
a
Φ +
νΣ
f
k
Φ = 0
Φ(0) = Φ(a) = 0
Ove i differenti termini assumono il seguente significato:
D
d
2
Φ
dx
2
rappresenta il depapuperamento del bilancio dato dalle fughe. Tale
termine non `e intrinsecamente negativo, ma lo sar`a sempre (o quasi)
nei bilanci che andremo a considerare
Σ
a
Φ rappresenta il depauperamento dato dagli assorbimenti. Questo ter-
mine `e sempre negativo, in quanto risulta dal prodotto di due termini
definiti positivi cambiato di segno
νΣ
f
Φ rappresenta il termine di fissione, ed `e sempre positivo in quanto
prodotto di tre quantit`a definite positive.
61
Supponiamo ora di eliminare il k da tale equazione.
Tale problema sar`a ovviamente risolto dalla soluzione banale di flus-
so neutronico nullo. Una soluzione non banale pu`o esistere soltanto se la
composizione materiale e la geometria del sistema sono tali da renderlo
critico.
Da qui nasce appunto la natura del k: esso corrisponde all’autovalore
che, fisicamente, non funge ad altro che a riequilibratore del fenomeno fisi-
co. Dunque io prendo un problema che, inizialmente, non rappresenter`a una
situazione di criticit`a, e lo modificher`o tramite un parametro in modo tale
da rendere il sistema critico. Una volta fatto questo andr`o a determinare il
valore di tale parametro che, per come `e stato inserito, mi dir`a che il sis-
tema `e sottocritico se inferiore ad uno e sovracritico se superiore ad uno. Ho
cos`ı risolto magistralmente il problema della non stazionariet`a, forzando il
problema a diventare stazionario: il bilancio neutronico diffusivo `e dunque
sempre nullo, anche se nella realt`a fisica delle cose non sar`a cos`ı, ma ri-
esco comunque a quantificare lo scostamento dalla criticit`a. Chiaramente
la veridicit`a di tale approssimazione `e garantita solo per k molto vicino ad
uno. Uno scostamento eccessivo provocherebbe il verificarsi di fenomeni
fortemente non-stazionari, il che richiederebbe lo studio del fenomeno sotto
un approccio differente.
La geometria del sistema viene in questo caso considerata all’interno
delle condizioni al contorno alle pareti, ove abbiamo imposto flusso nullo.
14
Dal punto di vista fisico, in questo caso l’autovalore `e attribuito al ter-
mine di fissione νΣ
f
Φ. Questa non `e l’unica soluzione possibile: potrei, ad
esempio, inserire il k nelle condizioni al contorno, imponendo che il flusso
si annulli in (0 +δx) e (a −δx) ove l’autovalore diventa, in questo caso, δx
e viene chiamato autovalore geometrico. Lo scopo `e sempre lo stesso:
forzare la criticit`a del sistema, andando per`o questa volta a modificarne la
geometria piuttosto che la composizione materiale.
15
Il problema della scelta dell’autovalore geometrico `e che il sistema che
ne risulta `e ancora pi` u difficile da studiare dal punto di vista numerico in
quanto implica una modifica delle dimensioni del dominio e, di conseguenza,
della sua discretizzazione. La dipendenza della matrice del problema da k
non `e pi` u lineare, e la risoluzione ne risente. Tale modello `e utilizzato in
generale per altri scopi, come ad esempio per comprendere in che modo un
sistema critico reagisce ad una variazione della geometria del sistema, ad
esempio in caso di incidente.
14
L’approssimazione di flusso nullo alle pareti `e detta di affacciamento al vuoto, ed
`e realistica solo ove non vi sia un riflettore. In generale, pur non considerando la presenza
di un riflettore, andremo a sostituire tale condizione con l’annullamento del flusso su di
un confine estrapolato
15
inserire il k all’interno del termine di fissione corrisponde infatti a diminuire il ν o il
Σ
f
, il che non corrisponde ad altro che ad una sostituzione ideale del materiale fissile con
un altro avente propriet` a differenti
62
Ulteriore posizione che l’autovalore potrebbe assumere `e l’andare a mod-
ificare la densit`a del materiale, in modo da variare i valori di Σ
a
e Σ
f
. Il
problema in questo caso risiede nel fatto che ogni modifica della densit`a
materiale andrebbe ad agire in due direzioni opposte sul sistema, il che
complica nettamente la comprensione di quali siano le reali conseguenze.
Inoltre si avr`a, anche in questo caso, l’introduzione di una non linearit`a del
problema. Anche in questo caso dunque si ha una maggiore complessit`a
della risoluzione, nonostante il suo significato fisico sia, teoricamente, pi` u
realistico.
Se andassi a risolvere il problema analiticamente, otterrei
Φ(x) = C sin
π
a
x con k =
νΣ
f
Σ
a
+D(
π
a
)
2
Volendo invece procedere dal punto di vista numerico, andr`o ad introdurre
una discretizzazione spaziale, identificando cos`ı un certo numero di nodi ove
andr`o a calcolare il flusso neutronico Avr`o dunque che esisteranno degli x
i
tali che Φ(x
i
) = Φ
i
. In questo modo le derivate diventeranno del tipo:
(
d
2
Φ
dx
2
)
x
i
=
(

dx
)
x
i+
1
2
−(

dx
)
x
i−
1
2
h
Si parla in questo caso di differenze finite centrate. Ho per`o in ques-
ta forma la presenza di definizioni del flusso al di fuori dei nodi preimpo-
stati. Tale apparente incongruenza viene eliminata tramite la definizione
delle derivate prime:
(

dx
)
x
i+
1
2
=
Φ
i+1
−Φ
i
h
e (

dx
)
x
i−
1
2
=
Φ
i
−Φ
i−1
h
da cui in definitiva la derivata seconda rispetto ad x calcolata in x
i
vale:
(
d
2
Φ
dx
2
)
x
i
=
Φ
i+1
−2Φ
i
+ Φ
i−1
h
2
Considerando D come omogeneo, possiamo definire dunque un sistema di
equazioni dato da:
_
_
_
D
Φ
i+1
−2Φ
i

i−1
h
2
−Σ
a
Φ
i
+
νΣ
f
k
Φ
i
= 0
Φ
0
= Φ
n+1
= 0
Tuttavia stiamo qui come detto imponendo una condizione poco realistica
di flusso nullo al contorno. In questo punto verr`a in realt`a effettuato un
upgrade del problema diffusivo tramite sontenuto fisico proveniente dalla
teoria del trasporto. In pratica andr`o a definire un contorno estrap-
olato, diverso dal contorno fisico, sul quale il flusso `e nullo, basato sulla
63
estrapolazione lineare dei risultati ottenuti dalla teoria del trasporto. Le
ipotesi sulle quali la teoria della diffusione `e basata, infatti, non sono ver-
ificate alla frontiera del dominio, ove `e dunque necessario ricorrere ad altri
strumenti. Una volta determinata la frontiera estrapolata, l’equazione della
diffusione verr`a risolta non sul dominio fisico ma sul dominio estrapolato,
ove potremo finalmente in modo realistico imporre l’annullamento del flusso
neutronico.
Avremo che, al contorno, le condizioni diverranno del tipo:
_
γ
0
Φ(r
0
) +δ
0
(

dr
)
r
0
= 0
γ
N
Φ(r
N
) +δ
N
(

dr
)
r
N
= 0
Ove δ e γ dipendono dalla geometria scelta.
Scegliendo γ
0
= 1 e δ
0
= −d otteniamo:
Φ(r
0
) −d(

dr
)
r
0
= 0
dove chiameremo d distanza estrapolata, ed in essa risieder`a il costo
aggiuntivo del mio upgrading.
16
Ho dunque ottenuto una equazione agli autovalori, ovvero un problema
del tipo D(λ)Φ
λ
= 0
La diffusione rappresenta un problema fisico di tipo locale: ci`o che accade
nel nodo i `e direttamente collegato a ci`o che accade nei nodi (i+1) ed (i-
1). Questa considerazione, apparentemente banale, provoca in realt`a delle
conseguenze importanti sul tipo di problema numerico che dovremo andare
a risolvere. Problemi di trasporto sono infatti invece non di tipo locale:
tutti i punti sono direttamente collegati agli altri punti. In fisica diffusiva
andremo dunque a risolvere equazioni con formulazioni:
• a tre punti (1D) → matrici tridiagonali
• a cinque punti (2D) → matrici pentadiagonali
• a sette punti (3D) → matrici eptadiagonali
17
Vediamo dunque che avremo, nel caso diffusivo, matrici sparse, che ci
porteranno ad approcci di tipo iterativo per la loro risoluzione. Questa `e,
in generale, una buona notizia, soprattutto ove la matrice sia sparsa ma
ordinata, come nel nostro caso.
16
Purtroppo nemmeno la teoria del trasporto `e esatta, e di conseguenza anche il valore
di d calcolato in questo modo costituir`a un’approssimazione, e il suo valore cambia a
seconda di come ho applicato tale teoria e di come ne ho risolto le equazioni
17
L’ottenimento di matrici multidiagonali dipende dalla numerazione scelta. Nel caso
monodimensionale la numerazione `e ovvia, mentre nei casi bi e tridimensionale non `e cos`ı,
e sar` a opportuno scegliere una numerazione adeguata per ottenere effettivamente matrici
multidiagonali
64
Dalle equazioni notiamo inoltre che il termine di assorbimento e quello
di fissione sono posizionati solo sulla diagonale, mentre il termine legato alla
diffusivit`a D `e posizionato sia sulla diagonale che fuori. Si vede in effetti
che per questo tipo di matrici la condizione di dominanza diagonale `e
automaticamente assicurata. Andando infatti a trascurare il termine di
fissione otteniamo che la condizione di diagonale dominante `e soddisfatta
se:
[ −2
D
h
2
−Σ
a
[ > [
D
h
2
[ +[
D
h
2
[
Si vede chiaramente che questo `e sempre vero, il che ci garantisce, come
conseguenza, la convergenza dei metodi iterativi utilizzati.
Questo vale per problemi:
• Monoenergetici
• Monodimensionali
• Omogenei
ove per omogenei si intende il fatto che le propriet`a del sistema non variano
nello spazio.
Nella realt`a sarebbe dunque possibile, in alcuni punti, avere Σ
a
= 0 e
dunque ottenere una matrice a semi-diagonale dominante.
3.3.2 Problemi con sorgente
Facciamo ora un excursus sui problemi non omogenei, ovvero in presenza
di un termine forzante. Questo ci servir`a, in seguito, a trattare i problemi
multigruppo, in quanto vedremo che per ogni gruppo energetico i neutroni
rallentati nei gruppi precedenti risulteranno, matematicamente, come una
sorgente esterna.
Avremo dunque di fronte un problema del tipo (considerando problema
monodimensionale, monoenergetico e con dominio omogeneo, senza fissione
ma con sorgente):
−D∇
2
Φ + Σ
a
Φ = S
Che diventa, in seguito alla discretizzazione:
_
_
_
−D
Φ
i+1
−2Φ
i

i−1
h
2
+ Σ
a
Φ
i
= S
i
Φ
0
= Φ
n+1
= 0
Dando luogo come detto ad una matrice tridiagonale.
In casi come questi, ovvero di fronte ad un problema non omogeneo
e con matrice tridiagonale utilizzeremo un metodo diretto: il metodo
della doppia passata. Tale soluzione verr`a tuttavia applicata soltanto in
logica monodimensionale. Quando passeremo a 2 o a 3 dimensioni, dovendo
65
operare con matrici pi` u ricche di elementi non nulli, si ricorrer`a in genere
ad algoritmi di tipo iterativo.
Si rivela utile in questa fase evidenziare come deve essere effettuato l’in-
serimento delle condizioni al contorno. Si vede infatti che le equazioni dis-
cretizzate si risolvono in formule a tre punti, ma nei due nodi agli estremi
del dominio si avranno a disposizione solo due valori: il flusso nel punto
stesso e quello nel punto pi` u interno del dominio.
Si andr`a dunque in questo caso ad imporre la condizione di annullamento
sul contorno estrapolato.
Per farlo conviene integrare l’equazione della diffusione sul volume cen-
trato sull’ultimo nodo ai confini del dominio (si supponga in questo caso r
0
).
_
V
0
nD
d
2
Φ
dx
2
dx −
_
V
0
Σ
a
Φdx +
_
V
0
Sdx = 0
Da cui si ottiene che il primo integrale diventa:
_
V
0
nD
d
2
Φ
dx
2
dx = D
+
0
A
+
0
_

dr
_
r
1
2
−D
+
0
A
+
0
_

dr
_
r
0
= D
+
0
A
+
0
Φ
1
−Φ
0
h
0
+D
+
0
A
0
γ
0
δ
0
Φ
0
Ove si `e utilizzata la condizione al contorno che recita:
γ
0
Φ(r
0
) +δ
0
(

dr
)
r
0
= 0
Ne viene che l’equazione discretizzata nell’ultimo nodo risulta nella forma:
[D
+
0
A
0
γ
0
δ
0
V
0

D
+
0
A
+
0
h
0
V
0
+ Σ
+
a,0

0
+D
+
0
A
+
0
Φ
1
h
0
V
0
+S
0
3.3.3 Non omogeneit`a dello spazio
Il generico reattore non sar`a composto interamente dallo stesso materiale.
Avremo dunque che i valori di Σ
a
, Σ
f
e D varieranno da punto a punto,
ed anche in maniera marcata: basti pensare alle differenze che tali valori
presenteranno tra il materiale nucleare e, ad esempio, il moderatore.
Faremo in generale la supposizione che tali parametri varieranno come
delle funzioni a gradino, in modo tale che esse risultino costanti all’interno
di ogni macro-intervallo.
Come fare per introdurre tale complicazione?
Esistono fondamentalmente due strategie differenti
Una possibilit`a `e scegliere di posizionare alcuni nodi di flusso in
corrispondenza delle discontinuit`a materiali. Esisteranno ovviamente
molti altri nodi di discretizzazione, ma la caratteristica di questo metodo
66
`e appunto quella di imporre che alcuni di questi nodi siano posizionati ove
abbiamo il cambiamento dei valori delle costanti nucleari.
Prendiamo un nodo r
i
centrato su di una discontinuit`a, e chiamiamo V
i
il volume di materiale attorno a r
i
e racchiuso dalle superfici A
+
i
ed A

i
posizionate rispettivamente sulle ascisse r
i+
1
2
=
r
i
+r
i+1
2
e r
i−
1
2
=
r
i
+r
i−1
2
.
Prendo ora l’equazione della diffusione e la integro sul tale volumetto V
i
,
ottenendo un bilancio integrale diffusivo.

_
V
i
¯
∇(D
¯
∇Φ)dV +
_
V
i
Σ
a
ΦdV =
_
V
i
SdV
Il primo integrale diventa, sfruttando il teorema della divergenza
_
V
i
¯
∇(D
¯
∇Φ)dV =
_
A
+
i
D

du
dA+
_
A

i
D

du
dA =
= D
+
i
A
+
i
(

dr
)
r
i+
1
2
+D

i
A

i
(

dr
)
r
i−
1
2
Se a questo punto introduciamo la linearit`a del flusso tra due nodi adia-
centi, il che sta alla base dell’approccio diffusivo tramite differenze finite
fini, possiamo ottenere delle equazioni che possono essere espresse in forma
matriciale come abbiamo fatto sino ad ora, con la sola differenza che non ci
sar`a un unico valore per le costanti materiali in tutta la matrice, ma valori
differenti.
La prima e l’ultima equazione avranno, come ovvio, soltanto due elementi
invece che tre. Questo `e legato alla scelta di condizioni di annullamento del
flusso al contorno: lo stesso accade in 2D, ove avremo in generale 5 elementi,
tranne per i nodi di bordo ove saranno 4 e i nodi di spigolo ove infine avremo
3 elementi non nulli.
Per la risoluzione del problema `e a questo punto necessaria la scelta della
formula di quadratura da utilizzare. Esse si dividono in due macro categorie:
Chiuse , ove gli estremi del dominio sono utilizzati come nodi
Aperte , ove `e invece vero il contrario
Dunque nel nostro caso non `e infatti scontata la scelta: se nell’approccio
puramente diffusivo era stato imposto l’annullamento del flusso neutronico
al contorno, a seguito dell’upgrading tramite teoria del trasporto questo non
`e pi` u vero, e di conseguenza si potr`a scegliere anche di applicare formule di
quadratura aperte.
L’efficacia di una discretizzazione di questo tipo dipender`a evidentemente
da
• regolarit`a della funzione
• numero di intervalli
67
Da qui la scelta del libero cammino medio neutronico come ordine di grandez-
za della discretizzazione
18
: per poter supporre flusso lineare tra un nodo e
l’altro `e necessario che la maglia sia molto fine.
Nel secondo caso le discontinuit`a non sono posizionate sui nodi di flusso,
ma nei nodi “fittizi” del tipo r
i+
1
2
e r
i−
1
2
, in modo che il volume di
materiale V
i
centrato in r
i
si ritrovi ad avere costanti materiali uniformi al
suo interno. La discontinuit`a dunque in questo caso non `e concentrata in
mezzo al volume, ma ai suoi bordi, ove avremo dunque discontinuit`a della
derivata. Infatti:
D
i
A
+
i
(

dr
)
r

i+
1
2
−D
i
A

i
(

dr
)
r
+
i−
1
2
−Σ
a
_
V
i
ΦdV +
_
V
i
SdV = 0
Si vede come in questo caso compaia soltanto un valore delle costanti nucleari
D e Σ
a
, in quanto esse sono costanti all’interno del volumetto, ma come al
contempo sia necessario il lato in cui viene calcolata la derivata, che `e infatti
discontinua sulle due superfici di confine.
In questo modo compaiono per`o delle derivate in nodi che non esistono:
esse andranno calcolate come
(

dr
)
r

i+
1
2
·
Φ
r
i+
1
2
−Φ
i
h
i
2
e (

dr
)
r
+
i−
1
2
·
Φ
i
−Φ
r
i−
1
2
h
i
2
Questa definizione `e gi`a migliore della precedente, ma continuo ad avere il
calcolo di delle grandezze (questa volta il flusso neutronico) in nodi fittizi.
Per riportarmi ad una formula a tre punti canonica utilizzer`o l’imposizione
della saldatura della corrente neutronica.

J = D

∇Φ −→ D
i
(

∇Φ
i+
1
2
)
+
= D
i+1
(

∇Φ
i+
1
2
)

e, di conseguenza,
essendo D
i
,= D
i+1
−→

∇Φ
+
i+
1
2
,=

∇Φ

i+
1
2
In effetti un qualsiasi problema matematico deve, per essere risolto, avere
un numero di condizioni al contorno imposte pari al numero di gradi di
libert`a
19
. Avendo imposto, per ogni intervallo, la linearit`a del flusso, dovr`o
imporre al suo contorno due condizioni, che mi serviranno a determinare le
costanti A e B date da:
Φ = Ar +B
18
Si noti che a questo punto sar` a necessario il calcolo di λ, che dipender` a dalla sezione
d’urto di assorbimento e, di conseguenza, anche dall’energia dei neutroni
19
Da qui naturalmente segue che, andando ad aumentare la precisione della modelliz-
zazione e dunque il grado del polinomio interpolante, dovr` o andare ad imporre una nuova
condizione al contorno per ogni volume elementare
68
La prima condizione `e gi`a stata imposta tramite l’equazione di bilancio
del flusso neutronico, la prima che abbiamo scritto. Ora imporremo la sal-
datura sulle interfacce del volume. Quello che potrebbe in prima battuta
apparire come un ipervincolare il problema (una condizione di continuit`a del
flusso neutronico e due di saldatura della corrente, una per ogni superficie di
confine), si rivela ben presto essere in realt`a solo un’apparenza. Ogni con-
dizione vale infatti per due volumi, e di conseguenza il numero finale delle
condizioni che andremo ad applicare `e esattamente quello richiesto. Se ne
ottiene il seguente sistema:
_
¸
¸
_
¸
¸
_
D
i
Φ
r
i+
1
2
−Φ
i
h
i
2
= D
i+1
Φ
i+1
−Φ
r
i+
1
2
h
i+1
2
D
i−1
Φ
r
i−
1
2
−Φ
i−1
h
i−1
2
= D
i
Φ
i
−Φ
r
i−
1
2
h
i
2
Tramite sostituzione `e poi possibile esplicitare il valore del flusso nei nodi
intermedi in funzione di quello nei nodi reali. Si tratta in effetti di un sistema
a due equazioni in due incognite.
3.3.4 Diffusione bidimensionale monogruppo
Vediamo ora cosa accade andando a muoverci in un dominio a due di-
mensioni. Manterremo la maggiore complessit`a legata alla non uniformit`a
delle costanti nucleari sul dominio, in particolare riferendoci alla prima
strategia scelta per tale modellizzazione, ovvero imponendo dei nodi di
discretizzazione in corrispondenza delle discontinuit`a delle costanti nucleari.
L’equazione in forma analitica sar`a del tipo (con sorgente ma senza
termine di fissione):
−D(

2
Φ
∂x
2
+

2
Φ

2
y
) + Σ
a
Φ = S
Da cui si ottiene, a seguito della discretizzazione del dominio spaziale:
−D[
Φ
i+1,j
−2Φ
i,j
+ Φ
i−1,j
h
2
x
+
Φ
i,j+1
−2Φ
i,j
+ Φ
i,j−1
h
2
y
] + Σ
a
Φ
i,j
= S
i,j
Avr`o dunque, per un generico punto posizionato all’interno del dominio,
cinque nodi di interesse: il nodo stesso pi` u i quattro ad esso adiacenti nelle
due direzioni geometriche.
Il punto ora `e trovare il modo per passare dalla matrice Φ
i,j
al vettore
Φ
l
, scegliendo una numerazione opportuna tale per cui la matrice finale
dei coefficienti risulti il pi` u semplice possibile. Cerchiamo inoltre di inserire
anche in questo contesto i discorsi effettuati a proposito della non uniformit`a
delle costanti nucleari.
69
Anche in questo caso andr`o a definire dei nodi intermedi, attorno ad
r
i,j
= ¦x
i
, y
j
¦. Tali nodi saranno gli spigoli del quadrato rappresentante il
volumetto elementare costruito attorno ad r
i,j
.
Supponiamo che tale nodo sia sede di una discontinuit`a delle costanti
nucleari, tale per cui il volume elementare costruito attorno ad esso abbia
il massimo possibile di zone differenti, vale a dire quattro, che chiameremo
I, II, III, IV secondo la stessa logica con cui sono numerati i quadrati in un
diagramma cartesiano.
II I
r
i
III IV
Integriamo ora l’equazione della diffusione sul volume elementare V
i,j
.
Prendiamo ad esempio la derivata seconda lungo x:
_
V
i,j

∂x
D
∂Φ
∂x
dxdy =
_
y
j+
1
2
y
j−
1
2
dy
_
x
i+
1
2
x
i−
1
2
dx(

∂x
D
∂Φ
∂x
) =
=
_
y
j+
1
2
y
j−
1
2
dy(D
∂Φ
∂x
)
x
i+
1
2
x
i−
1
2
·
·
_
y
j+
1
2
y
j−
1
2
dy[D
i+
1
2
,j
Φ
i+1,j
−Φ
i,j
h
x
i
−D
i−
1
2
,j
Φ
i,j
−Φ
i−1,j
h
x
i−1
=
= [
1
2
h
y
j−1
D
i,j−1
+
1
2
h
y
j
D
i,j
]
Φ
i+1,j
−Φ
i,j
h
x
i
+
− [
1
2
h
y
j−1
D
i−1,j−1
+
1
2
h
y
j
D
i−1,j
]
Φ
i,j
−Φ
i−1,j
h
x
i−1
Ove `e stata introdotta la non uniformit`a del coefficiente D dividendo il
dominio di integrazione nei quattro settori del volume elementare V
i,j
in
modo tale che in ogni sotto-dominio il valore di D risulti uniforme
20
. Il
risultato `e assolutamente analogo per quanto riguarda la derivata seconda
lungo y.
Il termine contenente la sezione d’urto di assorbimento sar`a invece molto
pi` u agevole nel calcolo, e dar`a una serie di quattro contributi, differenti
per ogni sotto-dominio del volume elementare. Il primo di tali contributi
(mostrato a titolo di esempio, essendo gli altri perfettamente anologhi) `e
20
Si chiariscono di seguito i significati degli indici e delle zone:













Zona Indicedizona spigoloesterno
I (i, j) (x
i+
1
2
, y
j+
1
2
II (i −1, j) (x
i−
1
2
, y
j+
1
2
III (i −1, j −1) (x
i−
1
2
, y
j−
1
2
IV (i, j −1) (x
i+
1
2
, y
j−
1
2
70
dato da:
1
4
h, x
i
h, y
j
Σ
ai,j
Φ
i,j
Se il volume preso in considerazione `e un volume di bordo, dovr`o imporvi
le condizioni al contorno, come sempre a scelta tra:
• Annullamento sul contorno
• Annullamento sul contorno estrapolato
Prendiamo un caso test: supponiamo in questa occasione di usare un
algoritmo di risoluzione chiuso, andando per`o ad utilizzare la condizione
al contorno di annullamento sul contorno estrapolato, ed utilizzando una
griglia semplificata dotata di solo 9 nodi disposti in un quadrato 3x3.
Dalla scrittura delle equazioni e dalla scelta di un metodo di numerazione
naturale ( Φ
11
= Φ
1

12
= Φ
2

21
= Φ
4
), otteniamo un sistema del tipo
seguente (ove alle X corrispondono gli elementi di matrice diversi da 0)
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
X X 0 X 0 0 0 0 0
X X X 0 X 0 0 0 0
0 X X 0 0 X 0 0 0
X 0 0 X X 0 X 0 0
0 X 0 X X X 0 X 0
0 0 X 0 X X 0 0 X
0 0 0 X 0 0 X X 0
0 0 0 0 X 0 X X 0
0 0 0 0 0 X 0 X X
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Φ
1
Φ
2
Φ
3
Φ
4
Φ
5
Φ
6
Φ
7
Φ
8
Φ
9
_
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
S
1
S
2
S
3
S
4
S
5
S
6
S
7
S
8
S
9
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Ne risulta in questo modo una matrice pentadiagonale, ordinata e
simmetrica a blocchi, ove ogni blocco 3x3 `e a sua volta simmetrico e tridi-
agonale. Si tratta inoltre di una matrice centrosimmetrica. L’insieme di
queste caratteristiche la rendono, in generale, di agevole risoluzione.
21
An-
diamo ora a risolvere il problema. Supporremo per A alcune caratteristiche
particolari:
• Elementi della diagonale non nulli: a
ii
> 0 ∀ i
• Matrice simmetrica
21
A tale scopo si veda il paragrafo 2.1 a pagina 16 per una trattazione approfondita dei
seguenti algoritmi:
• Jacobi
• Gauss
• SOR
71
• Elementi fuori dalla diagonale negativi: a
i,j
< 0 ∀ i ,= j
• Matrice a diagonale dominante: [a
ii
[ >

j
[a
i,j
[ ∀ i
Opereremo tramite metodi iterativi: ne consegue che, tra i dati in ingres-
so, dovr`o avere anche un flusso di tentativo Φ
(0)
. Dovr`o inoltre imporre uno
o pi` u criteri di convergenza per decidere quando interrompere il processo
iterativo
3.3.5 Diffusione multigruppo
Vediamo ora di passare alla fase successiva. Partendo dal caso pi` u standard,
con discretizzazione spaziale monodimensionale ed a costanti nucleari uni-
formi su tutto il dominio, siamo passati al considerare una discretizzazione
a due dimensioni e alla introduzione di costanti nucleari variabili all’interno
del dominio.
Introduciamo ora un ulteriore elemento di complicazione. Sappiamo
bene infatti che nei reattori termici i neutroni, emessi con una energia media
di circa 2 MeV, subiscono una serie di urti che li portano ad arrivare alle
energie termiche (pari a circa 0.025 eV), alle quali essi raggiungono una sor-
ta di equilibrio fino a quando non terminano la loro vita a seguito di fughe,
eventi di fissione o assorbimenti.
Finora non ci siamo preoccupati di definire l’energia dei neutroni: essa
non `e infatti mai comparsa esplicitamente nelle equazioni scritte, e non `e
mai stato necessario fino ad ora tirarla in ballo. Questa situazione `e per`o
solo apparente. Ogni volta che scriviamo l’equazione della diffusione, infatti,
introduciamo delle grandezze, dette sezioni d’urto, il cui valore non varia
soltanto a seconda del materiale considerato, ma anche a seconda dell’energia
del neutrone incidente.
Di fronte dunque ad un intervallo energetico che va dai meV ai MeV,
come dobbiamo comportarci?
La soluzione risiede in una discretizzazione energetica. Essa cor-
risponde a dividere lo spettro energetico in un numero finito di gruppi, a
ciascuno dei quali verr`a assegnato un valore medio dell’energia. Da quel
momento in poi, tutti i neutroni la cui energia `e compresa all’interno del-
l’intervallo relativo ad un determinato gruppo saranno considerati come se
avessero energia esattamente pari a quella media del gruppo stesso.
Il passaggio di discretizzazione energetica non `e semplice, ed il numero
di gruppi dipender`a dal tipo di reattore.
22
22
Preso un generico problema, la cui soluzione sar` a Φ(r, E), esso verr` a discretizzato
nel dominio spaziale lungo x,y e z tramite rispettivamente N,M ed L nodi e nello spettro
energetico in un numero G di gruppi. L’ordine del problema da risolvere sar` a cos`ı diventato
NxMxLxG. Questo evidenzia la necessit` a di ridurre al minimo il numero di gruppi che
utilizziamo per la discretizzazione dello spettro energetico, nel rispetto della precisione
richiesta sui risultati ottenuti. Tale valore `e in genere assegnato pari a 3 - 4 per i reattori
termici, 7 - 10 per i reattori a gas e circa 20 per i reattori veloci
72
Indicheremo in generale con 1 il gruppo avente energia pi` u elevata e con G
quello ad energia pi` u bassa
23
. Il gruppo G sar`a dunque il gruppo termico,
ovvero nella condizione in cui i neutroni sono in equilibrio termodinamico
con il mezzo in cui diffondono. Questo implica che, in linea teorica, essi
potrebbero trovarsi ad incrementare la propria energia in seguito ad un
urto. In tutte le considerazioni che seguono in realt`a ignoreremo questa
possibilit`a (che ci provocherebbe, come vedremo in seguito, l’impossibilit`a
di risolvere le equazioni relative ai vari gruppi in cascata), e considereremo
soltanto fenomeni di down-scattering, ovvero di urti di scattering che
portano ad una diminuzione dell’energia del neutrone.
24
Supponiamo ora di porci nella condizione di G = 3: avr`o dunque tre
gruppi, rappresentativi di tre “zone energetiche”:
• Zona di energia da fissione
• Zona di rallentamento
• Zona di termalizzazione
25
Dunque la sorgente dei neutroni `e contenuta nel gruppo 1, e per arrivare
alla zona di fissione dovranno rallentare fino alle energie termiche evitando
le fughe e gli assorbimenti
Definisco spettro di fissione χ(E) la distribuzione che mi dice con
quale probabilit`a i neutroni verranno emessi da fissione con determinate en-
ergie. Di questi neutroni ν(E) indica il numero di quelli emessi istantanea-
mente, detti neutroni pronti. Entrambi questi valori saranno influenzati
non soltanto dall’energia, ma anche (soprattutto per il numero di neutroni)
dal tipo di nucleo fissile che li ha generati.
Prendiamo un generico gruppo intermedio. Esso si vedr`a arrivare dalle
energie superiori i neutroni che hanno subito rallentamento a seguito di urti
di scattering.
26
Il bilancio neutronico relativo a tale gruppo dovr`a tenere in
conto di:
23
Questa convenzione deriva dalla logica di seguire i neutroni dalla loro emissione fino
al loro assorbimento: essi sono infatti emessi alle alte energie per poi essere assorbiti, nella
pi` u parte dei casi, ad energie inferiori
24
Tale approssimazione `e ben supportata in tutte le zone energetiche tranne in quella
termica. Qui i neutroni hanno mediamente la stessa energia della matrice materiale in cui
si muovono, e i gli urti di up-scattering sono dunque tendenzialmente pi` u frequenti che
nelle altre zone
25
La zona di termalizzazione `e quella dove le sezioni d’urto di fissione sono maggiori:
stiamo infatti parlando di un reattore termico, progettato in modo che i neutroni vengano
rallentati dal moderatore al fine di raggiungere l’energia termica ove la sezione d’urto
di fissione dell’U
235
`e maggiore. Esiste anche la possibilt` a di avere fissioni ad energie
superiori, ma l’incidenza percentuale di tali eventi `e di molto inferiore
26
Si noti qui che non tutti gli urti di scattering provocano l’uscita del neutrone dal
gruppo energetico. Nel caso di invarianza del gruppo energetico a seguito dell’urto si
parla di fenomeni di in-scattering. Pi` u la discretizzazione energetica `e fine, migliore
sar` a l’approssimazione di urti a salto energetico basso
73
Perdite per leakage : Termine di pozzo. Dovr`o tenere in conto di un
coefficiente di diffusione D
g
diverso per ogni gruppo poich`e in generale
la capacit`a di diffusione dei neutroni in un mezzo dipender`a dalla loro
energia
Perdite per assorbimento :Termine di pozzo legato alla sezione d’urto
di assorbimento e che include sia la cattura che la fissione
Comparsa di neutroni : Termine di sorgente legato sia alle reazioni di
fissione che hanno origine nel gruppo g (si faccia riferimento alla fun-
zione di distribuzione χ(E)) sia a tutti i neutroni proveniente da gruppi
con indice di gruppo inferiore
Perdite per rallentamento : Termine di pozzo che porta i neutroni dal
gruppo g ai gruppi di indice superiore
Messo in equazioni questo diverr`a:
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
1
v
g
∂Φ
g
∂t
=
leakage
¸ .. ¸
−(−

∇D
g

∇Φ
g
)
assorbimento
¸ .. ¸
−Σ
a,g
Φ
g
+
+
comparsa
¸ .. ¸
G

g

=1
Σ
s,g

→g
Φ
g
+
G

g

=1
χ
g
(νΣ
f
)
g
Φ
g
+
rallentamento
¸ .. ¸
−Σ
s,g
Φ
g
+S
g
g = 1 G
Ove abbiamo in questo caso introdotto la notazione del tipo Φ(r, E
g
, t) =
Φ
g
(r, t). Si noti come per ora il termine di comparsa neutronica tenga
in conto, quantomeno in linea di principio, dell’up-scattering, in quanto la
sommatoria `e estesa su tutti i gruppi energetici.
Considerando il problema stazionario e privo di sorgenti esterne si ottiene
_
¸
¸
¸
_
¸
¸
¸
_
0 = −(−

∇D
g

∇Φ
g
) −Σ
a,g
Φ
g
−Σ
s,g
Φ
g
+

G
g

=1
Σ
s,g

→g
Φ
g
+
+ χ
g

G
g

=1
(νΣ
f
)
g
Φ
g

g = 1 G
sistema simil-diffusivo ove tutte le equazioni sono accoppiate tra loro.
27
Evidentemente tale sistema ha come soluzione la soluzione banale Φ = 0.
Dovr`o dunque risolvere un problema agli autovalori, ed esister`a una soluzione
27
Ovviamente il sistema sar` a chiuso solo a seguito dell’imposizione delle condizioni al
contorno. Si evidenzia tuttavia qui il fatto che, ove esse siano imposte sul contorno es-
trapolato, si ha una ulteriore dipendenza dal gruppo energetico in quanto la distanza di
estrapolazione `e funzione della sezione d’urto di assorbimento la quale `e a sua volta, come
detto, funzione dell’energia
74
geometrica e materiale che mi assicurer`a la criticit`a e dunque la presenza di
una soluzione diversa dal vettore nullo.
Andremo dunque a risolvere il problema:
AΦ = kBΦ
Che diventer`a un problema del tipo
D(k)Φ = 0
lineare, ove dunque la dipendenza della matrice D dal parametro k `e lineare.
Andiamo ora a vedere come ottenere i valori da assegnare alle varie
costanti che dovremo utilizzare per ogni gruppo energetico. avremo che:
χ
g
=
_
E
g−1
E
g
χ(E)dE
Σ
s,g

→g
=
1
Φ
g

_
E
g−1
E
g
dE
_
E
g

−1
E
g

dE

Σ
s,E

→E
Φ(r, E

)
(νΣ
f
)
g
=
1
Φ
g
_
E
g−1
E
g
ν(E)Σ
f
(E)Φ(r, E)dE
Φ
g
=
_
E
g−1
E
g
Φ(r, E)dE
D
g
=
_
E
g−1
E
g
D(E)

∇Φ(r, E)dE
_
E
g−1
E
g

∇Φ(r, E)dE
Σ
t,g
=
1
Φ
g
_
E
g−1
E
g
Σ
t
(E)Φ(r, E)dE
Definisco inoltre sezione d’urto di rimozione la quantit`a:
Σ
r,g
= Σ
t,g
−Σ
s,g→g
Che di fatto corrisponde alla sezione d’urto totale meno quella relativa all’in-
scattering. Questo termine riunisce dentro di s`e tutti i termini di pozzo
all’interno del gruppo g, fatta eccezione per le fughe.
Da queste definizioni risultano una serie di problemi:
• Le medie che devo calcolare dipendono dalle soluzioni del problema
stesso
• All’interno del calcolo delle medie mantengo una dipendenza dalla po-
sizione non discretizzata, che rischio mi vada a complicare ulterior-
mente le cose
La soluzione a questi problemi deriva del seguente teorema:
75
Teorema 11 (di separabilit`a spazio-energetica)
Φ(r, E) = ψ(r), ϕ(E)
Questo `e vero solo nelle parti pi` u interne del reattore. Nelle zone di bor-
do, tale approssimazione non `e accettabile. Tramite l’applicazione di questo
teorema posso cos`ı eliminare la dipendenza spaziale dalle medie. Infatti:
( )
g
=
1
Φ
g
_
( )Φ(r, E) =
1
ψϕ
_
E
( )ψϕdE =
=
1
ϕ
_
E
( )ϕdE
Liberatomi dunque del problema della dipendenza spaziale, non pos-
so dire lo stesso riguardo la funzione ϕ, tuttora incognita. Per trovarla
effettuer`o, tramite teoria del trasporto, delle simulazioni iterative che mi
porteranno ad ottenere un valore accettabile per ϕ
28
.
Definizione processo iterativo esterno
Date le definizioni per le differenti variabili e costanti che andremo ad uti-
lizzare in funzione del gruppo energetico, si pu`o ripartire da una equazione
di questo tipo:
_
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
_
−(−

∇D
g
(r)

∇Φ
g
(r)) −Σ
r,g
(r)Φ
g
(r) +

g

<g
Σ
s,g

→g
(r)Φ
g
(r) +χ
g
ψ(r) = 0
Φ
g
(

R) +d
g
(

g
dr
)

R
= 0
g = 1 G
Ove `e stato definito il termine ψ(r) =

G
g

=1
(νΣ
f
)
g
(r)Φ
g
(r) densit` a di
emissione da fissione.
Si noti come il flusso neutronico (supponendo di dare una numerazione
unica alla discretizzazione spaziale di modo che Φ
i,j,k
diventi semplicemente
Φ
l
) sia rappresentato da un vettore a due dimensioni: infatti per ogni Φ
g
corrispondente al flusso nel g-esimo gruppo avremo N M L componen-
ti rappresentanti i vari nodi spaziali. Dunque ognuna delle equazioni del
sistema scritto sopra sar`a di fatto a sua volta una equazione vettoriale.
Per quanto riguarda le iterazioni esterne, esse rappresentano la risoluzione
del problema dal punto di vista della discretizzazione energetica. Si tratta di
un problema agli autovalori, risolto di fatto tramite il metodo delle potenze.
Andiamo a scrivere le equazioni, viste fino ad ora solo per componenti,
in forma matriciale.
Introduciamo i seguenti operatori:
28
si utilizzano in questo caso criteri di convergenza in norma, in quanto non interessa il
comportamento puntuale ma quello medio
76
• l’operatore A definisce le perdite per fughe e rimozioni
A =
_
_
_
_
_
_
_
_
_

∇(D
1

∇−Σ
r,1
(r))
.
.
.
ˆ
0
.
.
.
ˆ
0
.
.
.

∇(D
G

∇−Σ
r,G
(r))
_
_
_
_
_
_
_
_
_
• l’operatore R rappresenta il rallentamento. Sar`a di fatto una matrice
triangolare inferiore a diagonale nulla in quanto abbiamo escluso i
fenomeni di in-scattering ed up-scattering
R =
_
_
_
_
_
_
_
_
_
_
0
Σ
s,1→2
(r)
.
.
.
ˆ
0
Σ
s,1→3
(r) Σ
s,2→3
(r)
.
.
.
.
.
.
.
.
.
.
.
. 0
_
_
_
_
_
_
_
_
_
_
• L’operatore M `e rappresenta la moltiplicazione ed `e legato alle sezioni
d’urto di fissione
M =
_
_
_
_
_
_
_
_
_
χ
1
(νΣ
f
)
1
(r) χ
1
(νΣ
f
)
2
(r) χ
1
(νΣ
f
)
g
(r)
χ
2
(νΣ
f
)
1
(r)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
χ
G
(νΣ
f
)
1
(r) χ
G
(νΣ
f
)
G
(r)
_
_
_
_
_
_
_
_
_
• Chiamo infine L l’operatore A + R operatore di diffusione in
ambito multigruppo
Il problema `e dunque riscrivibile in definitiva in forma matriciale come:
(A+R)Φ +
1
k
MΦ = 0
Dove, ricordando che (A + R) = L e definendo infine H = −L
−1
posso
giungere alla scrittura “finale”
(HM)Φ = kΦ
Giungendo dunque nuovamente ad un problema agli autovalori classico.
Ovviamente tale scrittura apparentemente semplice ha un prezzo, contenuto
nel calcolo di L
−1
.
77
Si prosegue qui con il ragionamento fatto a proposito del metodo delle
potenze. Potrei investire un numero pur rilevante di operazioni per il calcolo
di H, sapendo per`o cos`ı di aver eliminato uno dei due processi iterativi
concatenati ed essendomi cos`ı risparmiato, in definitiva, un quantitativo
considerevole di operazioni. Il problema dell’applicazione di questo metodo,
gi`a descritto nell’ambito del metodo delle potenze, `e qui ancora pi` u evidente:
applicando un metodo diretto si perderebbe il parallelo fisico-numerico, ove
l’indice delle iterazioni esterne corrisponde alle generazioni neutroniche.
Come risolvo dunque tale problema? Utilizzando il metodo delle potenze
dovr`o, per quanto detto, normalizzare la soluzione all’autovalore di modulo
massimo, per evitare che essa diverga. Ma poich`e tale autovalore `e proprio
il k che stiamo cercando, potr`o scrivere (avendo definito C = H M):
Φ
(n+1)
=
C
k
(n)
Φ
(n)
Il problema si sposter`a dunque sull’ottenimento di una legge di riaggiorna-
mento per k su base fisica.
Dimentichiamoci per un po’ che k corrisponde al k
eff
del mio problema,
e supponiamo ora che esso sia solo il parametro di normalizzazione. Suppor-
remo di definirlo in modo tale che, per evitare che il problema esploda, nel
passare da un’iterazione all’altra il totale dei neutroni prodotti da fissione
rimanga costante. In quest’ottica la formula di aggiornamento sar`a data da:
,

Φ
(n+1)
,

νΣ
f
|
k
(n+1)
=
,

Φ
(n)
,

νΣ
f
|
k
(n)
da cui:
k
(n+1)
= k
(n)
,

Φ
(n+1)
,

νΣ
f
|
,

Φ
(n)
,

νΣ
f
|
Ove ho definito con ,, | il prodotto scalare sia sulla discretizzazione spaziale
che su quella energetica:
,

Φ
(n+1)
,

νΣ
f
| =
G

g=1
N

i=1
Φ
(n+1)
g
( r
i
)(νΣ
f
)
g
( r
i
)
Da cui risulta che:
,

Φ
(n+1)
,

νΣ
f
| =< ψ
(n+1)
, 1 >
Da cui:
29
k
(n+1)
= k
(n)
< ψ
(n+1)
, 1 >
< ψ
(n)
, 1 >
29
Si noti che qui non stiamo dando alcun peso differente alle varie zone del reattore. Una
possibilit`a ulteriore sarebbe quella, come accennato parlando del metodo delle potenze, di
introdurre una pesatura, ad esempio secondo Galerkin
78
Che si pu`o scrivere anche come:
<
ψ
(n+1)
k
(n+1)
, 1 >=<
ψ
(n)
k
(n)
, 1 >
Che corrisponde a dire che la sorgente effettiva di emissione normal-
izzata `e costante iterazione dopo iterazione. In questo modo k diventa
il rapporto tra i neutroni generati tra due iterazioni - generazioni successiva.
Questo `e ancora pi` u visibile se andiamo ad eliminare k
(n)
ottenendo:
k
(n+1)
= k
(n)
,
1
k
(n)
C

Φ
(n)
,

νΣ
f
|
,

Φ
(n)
,

νΣ
f
|
=
,C

Φ
(n)
,

νΣ
f
|
,

Φ
(n)
,

νΣ
f
|
Potremmo anche vederla, per dare una ulteriore dimostrazione, nella maniera
seguente:
k
(n+1)
=
< ψ
(n+1)
, 1 >
<
1
k
(n)
ψ
(n)
, 1 >
Che ci dice che, di fatto, il k di una generica iterazione `e dato dal rapporto tra
il numero di neutroni da fissione prodotti in quella iterazione (non normaliz-
zati) ed il numero di neutroni provenienti dall’iterazione precedente (ovvero
il numero di neutroni prodotti all’iterazione precedente, normalizzati).
Sar`a ora opportuno dimostrare che il k che stiamo cos`ı calcolando `e
veramente il k
eff
del mio sistema nucleare e non un semplice elemento di
normalizzazione. Dunque:
Φ
(2)
=
1
k
(1)

(1)
Da cui, all’n-esima iterazione:
Φ
(n)
=
1
k
(1)
k
(2)
k
(n−1)
C
n−1
Φ
(1)
Che, sostituendo il valore di Φ
(1)
vale
Φ
(n)
=
1
k
(1)
k
(2)
k
(n−1)
C
n−1
[c
1
ϕ
1
+

h≥2
c
h
ϕ
h
]
Da cui otteniamo
Φ
(n)
=
k
n−1
k
(1)
k
(2)
k
(n−1)
[c
1
ϕ
1
+

h≥2
(
λ
h
k
)
n−1
c
h
ϕ
h
]
Che, moltiplicando per la matrice C ed applicando nuovamente lo stesso
procedimento, ottengo:

(n)
=
k
n
k
(1)
k
(2)
k
(n−1)
[c
1
ϕ
1
+

h≥2
(
λ
h
k
)
n
c
h
ϕ
h
]
79
Dunque il rapporto che stiamo cercando e che definisce l’aggiornamento del
mio ciclo di iterazioni diventa:
k
(n+1)
=
,C

Φ
(n)
,

νΣ
f
|
,

Φ
(n)
,

νΣ
f
|
=
=
k
n
k
n−1
c
1

1
, νΣ
f
| +

h≥2

h
, νΣ
f
|(
λ
h
k
)
n
c
1

1
, νΣ
f
| +

h≥2

h
, νΣ
f
|(
λ
h
k
)
n−1
Tale valore tender`a inevitabilmente a k per infinite iterazioni in quanto i
termini legati alle sommatorie, essendo moltiplicati per la potenza di un
numero inferiore ad 1 in modulo, tenderanno a zero.
Vediamo infine di dimostrare a che valore converger`a Φ
(n)
Ripartiamo dalla seguente scrittura:
Φ
(n)
=
k
n−1
k
(1)
k
(2)
k
(n−1)
[c
1
ϕ
1
+

h≥2
(
λ
h
k
)
n−1
c
h
ϕ
h
]
Se moltiplico scalarmente da entrambe le parti per il vettore

νΣ
f

(n)
, νΣ
f
| =
k
n−1
k
(1)
k
(2)
k
(n−1)
[c
1

1
, νΣ
f
| +

h≥2
(
λ
h
k
)
n−1
c
h

h
, νΣ
f
|]
Ricorando che ,Φ
(n)
, νΣ
f
| =< ψ
(n)
, I > e moltiplicando ambo i membri per
k
k
(n)
si ottiene:
k
k
(n)
< ψ
(n)
, I >=
k
n
k
(1)
k
(2)
k
(n)
[c
1
< ψ
1
, I > +

h≥2
(
λ
h
k
)
n−1
c
h
< ψ
h
, I >]
Ricordando che, date le condizioni di normalizzazione scelte, la densita di
emissione effettiva da fissione normalizzata `e costante da una iterazione al-
l’altra, e ricordando che il termine di sommatoria tende a zero per tendenza
del numero di iterazioni all’infinito, ottengo che:
lim
n→∞
k
k
(n)
< ψ
(n)
, I >=
k
n
k
(1)
k
(2)
k
(n)
c
1
< ψ
1
, I >
da cui
lim
n→∞
k
n
k
(1)
k
(n)
c
1
=
< ψ
(n)
, I >
k
(n)
k
< ψ
1
, I >
=
=
< ψ
(1)
, I >
k
(1)
k
< ψ
1
, I >
Se supponiamo di essere giunti sufficientemente vicini alla convergenza,
sappiamo che il nostro Φ
(n)
sar`a sufficientemente parallelo all’autovettore
fondamentale da poter scrivere che:

(n)
= kΦ
(n)
80
che, sostutuito nell’equazione precedente porta alla forma
lim
n→∞
Φ
(n+1)
= lim
n→∞
C
k
(n)
Φ
(n)
=
= lim
n→∞
k
k
(n)
Φ
(n)
= lim
n→∞
k
n
k
(1)
k
(n)
c
1
φ
1
=
=
< ψ
(1)
, I >
k
(1)
k
< ψ
1
, I >
ϕ
1
Ma sempre considerando la costanza della densit`a di emissione effettiva e
ricordando che dopo infinite iterazioni i valori n-esimi tendono al valore
esatto, ottengo:
lim
n→∞
Φ
(n)
= ϕ
1
autovettore fondamentale. Dunque la mia soluzione, tramite la condizione di
normalizzazione imposta, non tende ad un vettore parallelo all’autovettore
fondamentale, ma esattamente ad esso.
Definizione del processo iterativo interno
Ci siamo fino ad ora preoccupati soltanto delle iterazioni esterne, e ci
siamo imbattuti in un problema di importanza rilevante: la soluzione delle
equazioni per il problema agli autovalori richiede, per il calcolo della matrice
di iterazione per il metodo delle potenze, l’inversione di una matrice di di-
mensioni raguardevoli. Si `e inoltre detto come l’inversione diretta di tale ma-
trice non porti ad ottenere i risultati sperati, perch`e impedisce di mantenere
il parallello fisico-matematico tra iterazioni e generazioni neutroniche.
La soluzione `e dunque quella di risolvere un problema iterativo inter-
no che dovrebbe teoricamente portare all’ottenimento della matrice di iter-
azione cercata.
In questo caso tuttavia non si tratta pi` u di un problema agli autovalori.
Il termine legato alla fissione verr`a infatti considerato, per ogni equazione,
come un valore noto e non dipendente dal flusso neutronico. Il problema
diventer`a dunque non omogeneo.
Vediamo nel dettaglio come procede il calcolo. Supponiamo di conoscere
la soluzione di tentativo, dunque tanto Φ
(0)
G
quanto ψ
(0)
G
ed anche il k
(0)
.
Questo mi implica la possibilit`a di calcolare l’equazione per il gruppo 1:
_

∇D
1

∇Φ
1
−Σ
r,1
Φ
1
+
1
k
(0)
S
(0)
i
= 0
S
(0)
1
= χ
1
ψ
(0)
(r)
Ove si `e indicato con S
(0)
i
il termine ψ(r)
(0)
χ
0
Si tratta dunque di un prob-
lema diffusivo non omogeneo, risolto il quale avr`o un Φ
(1)
1
, valore aggiornato
81
per il flusso che verr`a anche utilizzato per il calcolo del termine sorgente per
il gruppo successivo.
Vediamo dunque che per ogni gruppo energetico potr`o scrivere un sis-
tema del tipo
AΦ = S
Procedo successivamente come per quanto visto per il metodo di Jacobi:
divido A in due matrici delle quali una diagonale, che porto dall’altro lato
invertendola ed innescando cos`ı un processo iterativo del tipo
Φ
(n+1)
= BΦ
(n)
+Q
Ove la matrice B `e la matrice di iterazione.
Sorge ora un dubbio importante: quante iterazioni fare per i due cicli?
30
• In primo luogo, `e inutile aumentare eccessivamente il numero delle
iterazioni interne: andrei a migliorare sempre di pi` u la precisione di un
problema intrinsecamente sbagliato. Si manifesta quindi qui l’esigenza
di ridurre al minimo le iterazioni interne
• D’altro canto, trattandosi di due problemi concatenati, non ci basta
avere la certezza della convergenza dei due metodi separatamente, ma
ci serve essere sicuri che entrambi convergano simultaneamente. Di
particolare importanza sar`a dunque l’influenza delle iterazioni interne
sulla convergenza dell’algoritmo esterno
Ci chiediamo dunque se esiste una soglia per il numero delle iterazioni
interne per ogni iterazione esterna che ci garantisca la convergenza dell’al-
goritmo esterno. Si pu`o dimostrare che la condzione meravigliosa che carat-
terizza il problema della diffusione multigruppo `e che tale soglia esiste, ma
`e fissata ad una sola iterazione. Vediamo perch´e.
Il problema che ci prefiggiamo di risolvere `e sempre lo stesso:
−LΦ
(n+1)
=
1
k
(n)

(n)
Che diventa, di fatto:
−LΦ
(n+1)
= Q
(n)
Ricordiamo ancora una volta che, al momento della risoluzione del
problema interno, Q
(n)
`e considerato noto pari al termine sorgente.
Gli indici di iterazione che compaiono nelle equazioni precedenti
sono relativi alle iterazioni esterne
30
Esiste una possibilit` a che potrebbe provocare il fallimento di ogni calcolo: quella per
cui l’errore sul termine sorgente sia tale da provocare la non convergenza del problema
interno. Questa situazione, che dipende dal condizionamento del problema, non si verifi-
ca nel caso diffusivo in quanto il problema numerico legato alla risoluzione multigruppo
dell’equazione della diffusione `e robusto
82
Ai fini della risoluzione iterativa il problema verr`a scomposto nella maniera
seguente
31
Φ = JΦ +Y Q
Da questa forma posso ricavare tramite alcuni passaggi una espressione per
Y. Infatti so che:
_
Φ = (I −J)
−1
Y Q
Φ = −L
−1
Q
→ −L
−1
= (I −J)
−1
Y → Y = −L
−1
(I −J)
Dunque posso riscrivere il sistema, tornando all’algoritmo iterativo, nella
maniera seguente:
Φ
[m+1]
= JΦ
[m]
−(I −J)L
−1
Q
All’iterazione successiva otterr`o
Φ
[m+2]
= J
2
Φ
[m]
+ (I +J)Y Q
Da cui
Φ
[m+n]
= J
n
Φ
[m]
+ (I +J +J
2
+ +J
n−1
)Y Q
con
(I +J +J
2
+ +J
n−1
) =

i=0
J
i

i=n
J
i
Ma essendo J una matrice avente propriet`a particolari, ed in particolare
raggio spettrale inferiore ad uno (altrimenti la convergenza non `e garantita),
posso supporre che la serie scritta nell’equazione precedente converga a

i=0
J
i
= (I −J)
−1
e

i=n
J
i
= (I −J)
−1
J
n
Da cui
Φ
[m+n]
= J
n
Φ
[m]
+ (I −J)
−1
(I −J
n
)Y Q
Che, sostituendo l’espressione per Y, vale:
Φ
[m+n]
= J
n
Φ
[m]
−(I −J
n
)L
−1
Q
Quindi si vede che in realt`a non faccio n iterazioni: faccio una unica iter-
azione che conta come n, a patto di saper calcolare la potenza n-esima della
matrice J. Questo modo di operare `e detto a blocchi di iterazioni.
Riprendiamo il nostro algoritmo esterno, ove vale la corrispondenza:
Q =
1
k
(n)

(n)
31
non si `e qui specificato alcun particolare algoritmo risolutivo: la matrice J potrebbe
essere quella caratteristica di uno qualunque tra i metodi visti sino ad ora
83
Supponiamo dunque di fermarci dopo m iterazioni interne, e di procedere
esternamente. Dunque
Φ
(n+1)
= [J
m
−(1 −J
m
)L
−1
M
k
(n)

(n)
Per m → ∞, poich`e abbiamo imposto che la matrice J converge, avremo che
Φ
(n+1)
= −L
−1
M
k
(n)
Φ
(n)
→ C = L
−1
M
Nel caso invece di m iterazioni avr`o che l’operatore matriciale “approssima-
to” sar`a dato da:
32
C
m
= [J
m
−(1 −J
m
)L
−1
M
k
(n)
]
Si noti dunque come l’aver svolto m iterazioni interne corrisponde, nella
pratica delle cose, ad aver svolto un calcolo iterativo della matrice C (il cui
valore `e incognito) della quale avremo dunque utilizzato un valore aggiornato
all’m-esima iterazione. Tutto il problema ritorna dunque al punto: si era
partiti dall’idea di non saper calcolare la matrice C e si `e visto che, tramite
uno ciclo iterativo interno, si `e riusciti a procedere ad una sua stima, che sar`a
logicamente tanto pi` u precisa tanto pi` u alto `e il numero delle iterazioni
33
.
Perch`e tale espressione non provochi la perdita di fisicit`a del problema,
deve ancora essere valido che applicando tale operatore all’autovettore fon-
damentale si ottiene nuovamente l’autovettore fondamentale. Questo equiv-
ale a verificare che il problema approssimato all’m-esima iterazione sia anco-
ra un problema agli autovalori avente come soluzione gli stessi autovettori del
problema esatto. In effetti, ricordando che per l’ipotesi di base del problema
ϕ = −L
−1 M
k

ϕ, si ottiene
ϕ = [J
m
−(1 −J
m
)L
−1
M
k


ϕ = J
m
ϕ −L
−1
M
k

ϕ +J
m
L
−1
M
k

ϕ
ϕ = J
m
ϕ +ϕ −J
m
ϕ
Dunque anche l’operatore matriciale “finito” ha come soluzione lo stesso au-
tovettore dell’operatore ottenuto dopo infinite iterazioni. Dunque qualunque
numero non nullo di iterazioni porta all’ottenimento di un opertore fisica-
mente accettabile, anche se ovviamente non correto, il che mi permette, se
necessario, di ridurre ad un minimo di 1 il numero di iterazioni interne.
In definitiva ci`o che si opera `e la strategia seguente:
32
Si noti come in tutte le considerazioni fatte fino ad ora compaia il termine L
−1
anche
nelle espressioni approssimate della risoluzione del problema. Questa `e ovviamente solo
una scrittura formale, in quanto se fossimo in grado di calcolre il valore di tale matrice
inversa non si andrebbe ad innescare alcun processo iterativo
33
Questo procedimento `e l’illustrazione nel dettaglio di quanto accennato nel capitolo
sul metodo delle potenze riguardo la risoluzione di equazioni agli autovalori generalizzate
84
• Nella zona delle prime iterazioni si fa una sola iterazione interna per
ogni iterazione esterna, in modo da non sprecare tempo di calcolo per
affinare inutilmente una soluzione che so gi`a essere sbagliata
• Nella zona di congergenza asintotica dell’algoritmo posso aumentare il
numero di iterazioni interne: da un lato perch`e `e evidente che questo
porti ad una maggiore precisione della soluzione, e dall’altro perch`e
saranno in questa fase presenti delle approssimazioni di k tali da poter-
mi permettere di utilizzare metodi di convergenza accelearti per le
iterazioni interne
Il modo di procedere in questi casi preveder`a dunque di svolgere una
sola iterazione interna per ogni iterazione esterna nelle fasi iniziali, per non
sprecare tempo per ottenere soluzioni di base sbagliate. Giunto in una fase
pi` u stabile della convergenza andr`o invece ad aumentare il numero delle
iterazioni interne per migliorare la precisione della soluzione.
Dunque ripercorriamo le fasi risolutive:
1. Impongo una soluzione di tentativo: k
(0)
, ψ
(0)
2. Utilizzo tale soluzione di tentativo per il calcolo di Φ
(1)
1
, la cui equazione
risulta di fatto disgiunta dalle altre
3. Utilizzo il flusso cos`ı calcolato per il calcolo di Φ
(1)
2
, tenendo in conto
del solo down-scattering
4. Procedendo di questo passo calcolo tutte le componenti del vettore
Φ
(1)
5. Aggiorno tutti i valori che mi serviranno per ripartire con le iterazioni
esterne, vale a dire k e ψ
3.3.6 Accelerazione della convergenza delle iterazioni esterne
Se i sistemi sono particolarmente grandi ci troveremo in una soluzione ove il
rapporto di dominanza `e molto prossimo ad 1, il che provocherebbe, se non
prendessimo alcun provvedimento, una convergenza troppo lenta.
Oltre che prestare molta attenzione ai criteri di convergenza, che potreb-
bero essere fuorviati da una riduzione precoce dello pseudo-errore relativo,
Vediamo dunque alcuni sistemi per accelerare la convergenza
Metodo di Wielaudt
s
Si tratta di un metodo concettualmente semplice ma di difficile appli-
cazione. Abbiamo visto fino ad ora che `e opportuno normalizzare la soluzione
ad ogni iterazione, per evitare che, dopo un numero cospicuo di iterazioni,
85
essa tenda a divergere all’infinito o a convergere al vettore nullo. Supponi-
amo per`o di interrompere questa pratica dopo un certo numero di iterazioni,
e comunque in un momento in cui ci troviamo gi`a nella zona asintotica del
metodo iterativo.
Il metodo di Wielaudt parte dalla conoscenza di un valore k* approssi-
mazione per eccesso del valore vero di k. Tale valore pu`o provenire sia da
precedenti iterazioni che da calcoli indipendenti.
Scriviamo dunque un nuovo problema:
k

Φ −CΦ = k

Φ −kΦ → (k

I −C)Φ = (k

−k)Φ
Sar`a dunque un nuovo problema agli autovalori, ove la matrice (k

I −C) `e
sempre invertibile in quanto abbiamo supposto k* maggiore dell’autovalore
di modulo massimo e dunque la matrice risultante sar`a sempre a diagonale
dominante.
Il problema agli autovalori potr`a anche essere riscritto come:
(k

I −C)
−1
Φ =
1
k

−k
Φ
Ove la matrice (k

I − C)
−1
ha gli stessi autovettori della matrice C, ed i
suoi autovalori sono dati da
1
k

−k
h
Facciamo un esempio. Supponiamo:
k

= 1.01 k = 1.00 k
2
= 0.99
tale per cui il rapporto di dominanza del problema originario vale 0.99. La
stessa quantit`a, applicando il metodo di Wielaudt, diventa pari a:
1
1.01−0.99
1
1.01−1.00
= 0.5
Applicando dunque il metodo delle potenze al problema modificato la ve-
locit`a di convergenza `e enormemente pi` u alta.
Tuttavia c’`e per`o un punto, pi` u o meno nascosto, in cui `e contenuto il
maggior costo dell’algoritmo. Si tratta in questo caso della matrice (k

I −
C)
−1
per il cui calcolo `e necessario utilizzare ancora una volta il metodo
delle potenze, cosa che non sempre risulta rapido e semplice. Avr`o dunque,
in questo caso, tre algoritmi iterativi incantenati l’uno dentro l’altro. Il
punto sta ovviamente nell’effettuare le opportune valutazioni per verificare
se l’applicazione di tale metodo sia conveniente o meno.
Metodo di Tchebychev
Il metodo di Tchebychev non si basa sull’alterazione della matrice dei co-
efficienti. Supponiamo di essere arrivati ad una N-esima iterazione essendo
dunque in possesso di un valore k*.
86
In base a quanto detto, avremo che:
Φ
(N+1)
=
1
k


(N)
Da cui, continuando ad applicare il metodo delle potenze interrompendo
per`o il processo di aggiornamento del termine normalizzante, si ottiene:
Φ
(N+n)
= [
1
k

C]
n
Φ
(N)
Supponiamo ora di sostituire al posto della potenza n-esima del rapporto
[
1
k

C] un generico polinonmio P
n
di n+1 elementi, ciascuno composto da
un coefficiente e da una potenza di [
1
k

C]. Il calcolo dei coefficienti sar`a
effettuato imponendo come condizione il fatto che P
n
(1) = 1, come deve
essere perch`e sia mantenuto il significato fisico.
34
Supponiamo inoltre di poter scrivere, come spesso abbiamo fatto in
precedenza, la soluzione alla N-esima iterazione come composizione lineare
degli autovettori della matrice C.
Sfruttiamo ora una propriet`a notevole dei problemi agli autovalori: par-
tendo dal generico problema Aϕ = λϕ posso scrivere che:
f(A)ϕ = f(λ)ϕ
A patto che f sia una funzione sufficientemente regolare.
35
Nel nostro caso posso allora scrivere che
Φ
(N+n)
= c
1
P
n
(
C
k


1
+

h
c
h
P
n
(
C
k


h
·
· c
1
P
n
(
k
k


1
+

h
c
h
P
n
(
k
h
k


h
Ma poich`e sappiamo che il rapporto
k
k

· 1 possiamo scrivere:
Φ
(N+n)
= c
1
ϕ
1
+

h
c
h
P
n
(
k
h
k


h
Le mie condizioni saranno date da
_
h≥2
c
h
P
n
(
k
h
k


h
= 0
P
n
(1) = 1
Dunque una volta trovati gli n+1 coefficienti del polinomio p
n
potr`o calco-
larmi la soluzione esatta, dopo sole N iterazioni. Ma questo `e teoricamente
impossibile, dove sta l’inganno?
34
Il passaggio `e qui molto logico: stiamo approssimando una potenza, che dunque
qualunque sia l’esponente varr`a 1 se la base `e 1
35
Abbiamo gi`a applicato questa regola pi` u volte, sempre con f(A) = A
m
87
Evidentemente nell’utilizzo, come incognite, dei k
h
che ovviamente non
conosciamo. Non posso dunque imporre condizioni tali per cui il contributo
degli autovettori di indice superiore ad 1 sia nullo. Per`o posso fare in modo
che esso sia il pi` u piccolo possibile. Si tratta dunque di cercare i coefficienti
per il polinomio tali da minimizzare il massimo dei valori del polinomio,
ovvero:
min
a
0
,··· ,a
n+1
(max(0 ≤ x ≤ σ)[P
n
(x)[)
Si pu`o dimostrare che la soluzione di questo problema di ricerca di minimo
(problemi minmax) porta ai polinomi di Tchebychev ortogonali:
_
_
_
c
0
(t) = 1
c
1
(t) = t
c
n+1
(t) = 2tc
n
(t) −c
n−1
(t)
La velocit`a di convergenza del metodo di Tchebychev `e oscillante in funzione
del rapporto di dominanza, ma si vede che, ad esempio, dopo 5 iterazioni
di un metodo avente σ = 0.95, avremo che il metodo non accelerato vedr`a
il termine legato al secondo autovalore di modulo massimo ridotto a σ
5
=
0.774, mentre il polinomio di Tchebychev corrispondentemente applicato
dar`a luogo ad un fattore di attenuazione pari a 0.204 .
Uno dei problemi di tale metodo `e la presenza di una formula ricorsiva
a tre termini, ove in particolare le sottrazioni tra elementi possono generare
rischi di esplosione dell’algoritmo.
3.4 Metodi Coarse Mesh
Fino ad ora `e stato mostrato come risolvere problemi di fisica neutronica
tramite la teoria della diffusione utilizzando metodi alle differenze finite fini.
Questo corrispondeva, in buona sostanza, ad approssimare il flusso in ogni
maglia nel modo pi` u semplice possibile (lineare), riguadagnando in termini
di precisione diminuendo al minimo le dimensioni delle maglie stesse.
Il principio che sta alla base dei metodi coarse mesh `e esattamente l’op-
posto. Le maglie sono di dimensioni molto maggiori rispetto al libero cam-
mino medio, `e ci`o su cui si punta maggiormente `e una qualit`a migliore della
funzione interpolante
Questo genera di per s`e un problema. Nel momento in cui le maglie au-
mentano di dimensioni, esse tenderanno inevitabilmente a contenere al loro
interno materiali differenti tra loro, perdendo cos`ı l’omogeneit`a del dominio.
Per evitare di risolvere problemi in presenza di costanti nucleari non unifor-
mi viene in generale forzata l’uniformit`a del sistema: i volumi elementari del
metodo coarse mesh vengono “omogeneizzati”,
36
ottenendo cos`ı costanti nu-
36
Una volta ottenuti i valori delle costanti sui volumi omogenei l’approccio utilizzato
`e quello di tipo b, ovvero in cui non prendo i nodi in corrispondenza delle discontinuit` a
materiali ma al centro dei volumi considerati omogenei
88
cleari mediate, per il calcolo delle quali si ricorre ancora una volta alla teoria
del trasporto. Si andr`a poi a risolvere il tutto tramite la teoria diffusione
multigruppo.
Ipotizzeremo dunque che il flusso si comporti in modo pi` u complesso,
come un polinomio di 2

o di terzo grado, invece che linearmente.
37
Da un
lato la riduzione del numero di maglie mi riduce enormemente il numero di
elementi delle matrici che andr`o a risolvere. Dall’altro la non-linearit`a del
flusso provoca una non-linearit`a anche nei problemi ad esso associati, con
conseguente maggiore complicazione della risoluzione e, soprattutto, con
difficolt`a molto maggiore di garantire a priori la convergenza del metodo
risolutivo.
Partiamo ancora una volta dal caso monocinetico, in quanto l’espansione
al caso multigruppo presenta le stesse caratteristiche e problematiche viste
per le differenze finite fini. Andremo dunque a scrivere, nel caso 3D, un
numero di equazioni pari al numero di volumi di controllo presi in consid-
erazione, ciascuna delle quali vedr`a comparire al suo interno 7 incognite;
si andr`a in seguito ad imporre le condizioni di saldatura e le condizioni al
contorno.
Esistono fondamentalmente due approcci distinti per i metodi coarse
mesh, in base all’ordine dei polinomi scelti come funzioni interpolanti:
Quabox se si sceglie di utilizzare polinomi di 2

grado
Cubox se la scelta ricade invece su polinomi di 3

grado
3.4.1 Metodi Quabox
Per ragioni che saranno pi` u chiare in seguito andr`o a scrivere il flusso
in funzione delle tre variabili adimensionali ξ, η, ζ definite nella maniera
seguente:
ξ =
x −x
i
h
x
i
η =
y −y
i
h
y
j
ζ =
z −z
i
h
z
l
Ove r
i
= x
i
, y
i
, z
i
`e la coordinata del nodo i-esimo. Di tutte le forme
quadratiche che potrei scrivere tramite tali variabili quella che otterr`o sar`a
del tipo:
Φ(ξ, η, ζ) = Φ
ijl
[1 +a
x
ijl
ξ +b
x
ijl
ξ
2
+a
y
ijl
η +b
y
ijl
η
2
+a
z
ijl
ζ +b
z
ijl
ζ
2
]
Dovr`o dunque andare ad imporre 7 condizioni per i 7 parametri utilizzati:
• Una condizione di soddisfacimento del bilancio integrale sul volume di
controllo
37
Si noti che una prima conseguenza di questo fatto sar` a la necessit` a di andare ad
imporre un numero maggiore di condizioni al contorno
89
• Una condizione di saldatura del flusso neutronico e della corrente
neutronica per ogni interfaccia
Avrei dunque in totale, per ogni volume di controllo, 1 + (2 6) condizioni.
Ma ricordando che ogni condizione all’interfaccia `e imposta due volte, una su
ogni lato della faccia stessa, otteniamo esattamente le 7 condizioni necessarie
per la corretta definizione del problema.
Cominciamo ad esplicitare il calcolo dei coefficienti scrivendo il valore
del flusso all’interfaccia lungo x. Si avr`a che:
_
_
_
Φ
i+
1
2
,j,l
= Φ
ijl
[1 +
a
x
ijl
2
+
b
x
ijl
4
Φ
i−
1
2
,j,l
= Φ
ijl
[1 −
a
x
ijl
2
+
b
x
ijl
4
]
Sommando e sottraendo membro a membro si ottengono i valori dei due
coefficienti a e b lungo x in funzione del flusso all’interfaccia.
a
x
ijl
=
Φ
i+
1
2
,j,l
−Φ
i−
1
2
,j,l
Φ
i,j,l
b
x
ijl
=
Φ
i+
1
2
,j,l
−2Φ
i,j,l
+ Φ
i−
1
2
,j,l
Φ
i,j,l
Vedremo in seguito che poich`e quest’ultimo non `e noto e non `e presente tra
le incognite, si utilizzano le condizioni di saldatura sulla corrente neutronica
per riscrivere le costanti in funzione del flusso ai nodi.
Riprendiamo l’equazione della diffusione. La prima delle condizioni al
contorno impone il bilancio integrale, del quale ci apprestiamo a calcolare le
varie componenti.
• Partiamo dalla componente delle fughe. Avremo che, applicando il
teorema della divergenza:
_
V
ijl

∇D

∇ΦdV =
_
S
ijl
(D

∇Φ)ndS
= D
ijl
¦
_
∂Φ
∂x
_
x
i+
1
2
x
i−
1
2
h
y
j
h
z
l
+ [y] + [z]¦
Ove i termini tra parentesi quadre sono gli omologhi di quanto scrit-
to lungo x nelle direzioni y e z. Potr`o a questo punto inserire la
dipendenza dalla variabile ξ, per cui si avr`a che:
∂Φ
∂x
=
∂Φ
∂ξ
∂ξ
∂x
=
=
1
h
x
i
∂Φ
∂ξ
=
= Φ
ijl
[
a
x
h
x
i
+
2b
x
ξ
h
x
i
] =
= Φ
ijl
[
a
x
h
x
i
+
2b
x
(x −x
i
)
h
2
x
i
]
90
Sostituendo questa espressione nel calcolo del bilancio integrale delle
fughe si avr`a che tutti i coefficienti a scompaiono in quanto non dipen-
denti da x. Dunque otterremo, in definitiva, che:
_
V
ijl

∇D

∇ΦdV = 2D
ijl
V
ijl
Φ
ijl
[
b
x
h
2
x
i
+
b
y
h
2
y
j
+
b
z
h
2
z
l
]
• Passando al termine successivo si ottiene che il bilancio integrale for-
nisce:
_
V
ijl
(
νΣ
f
k
−Σ
a
)ΦdV = (
νΣ
f
k
−Σ
a
)
ijl
_
V
ijl
ΦdV =
= (
νΣ
f
k
−Σ
a
)
ijl
Φ
ijl
V
ijl
_
V
ijl
(1 +b
x
ξ
2
+b
y
η
2
+b
z
ζ
2
)dξdηdζ
Ove ancora una volta i termini dispari sono stati eliminati poich`e la
loro integrazione porta ad un contributo nullo. Si ottiene dunque che:
_
V
ijl
(
νΣ
f
k
−Σ
a
)ΦdV = (
νΣ
f
k
−Σ
a
)
ijl
Φ
ijl
(1 +
b
x
+b
y
+b
z
12
)V
ijl
Abbiamo cos`ı ottenuto la prima delle 7 condizioni, quella legata all’annul-
lamento del bilancio integrale, che coinvolge solo i coefficienti dei termini
quadratici.
Se andiamo ora a scrivere il bilancio integrale completo otteniamo, aven-
do sostituito le espressioni calcolate in precedenza per i coefficienti quadratici
_
[D
ijl
+
h
2
x
i
24
(
νΣ
f
k
−Σ
a
)
ijl
]
Φ
i+
1
2
,j,l
−2Φ
i,j,l
+ Φ
i−
1
2
,j,l
Φ
i,j,l
_
+¦y¦+¦z¦+(
νΣ
f
k
−Σ
a
)
ijl
Φ
ijl
Si nota che, come detto, rimane la dipendenza dalle condizioni all’inter-
faccia, che dovr`a essere eliminata imponendo la continuit`a della corrente
neutronica
38
Dovremo dunque imporre che:
−D
ijl
(
∂Φ
∂x
)
x

i+
1
2
= −D
i+1,j,l
(
∂Φ
∂x
)
x
+
i+1−
1
2
Andando a scrivere la derivata all’interfaccia nella maniera seguente:
_
∂Φ
∂x
_
x

i+
1
2
= Φ
ijl
_
a
x
h
x
i
+
2b
x
(x −x
i
)
h
2
x
i
_
x

i+
1
2
=
=
1
h
x
i
(3Φ
i+
1
2
,j,l
−4Φ
i,j,l
+ Φ
i−
1
2
,j,l
)
38
Si noti come la scelta degli indici provoca l’automatica verifica della condizione di
continuit` a del flusso neutronico:
Φ
(i)+
1
2
,j,l
= Φ
(i+1)−
1
2
,j,l
91
Che, inserito opportunamente nella condizione di saldatura, fornisce l’espres-
sione (implicita) per il flusso neutronico all’interfaccia:
Φ
i+
1
2
,j,l
=
_
¸
_
4(1 −
Φ
i−
1
2
,j,l

ijl
)
3(1 +
h
x
i
D
i+1,j,l
h
x
i+1
D
ijl
)
_
¸
_
Φ
ijl
+
_
¸
_
4(1 −
Φ
i+
3
2
,j,l

i+1,j,l
)
3(1 +
h
x
i+1
D
i,j,l
h
x
i
D
i+1,j,l
)
_
¸
_
Φ
ijl
Ho dunque in definitiva un legame decisamente complesso del tipo Φ
i+
1
2
,j,l
=
f(Φ
ijl
, Φ
i+1,j,l
). Si nota abbastanza velocemente che, se due mesh adiacenti
hanno stessa ampiezza e stessi valori per le costanti nucleari (in questo caso
in effetti `e sufficiente che sia uguale il coefficiente di diffusione, ma questo
di fatto a stesso materiale) si ottiene che il flusso all’interfaccia non `e altro
che la media aritmetica dei flussi calcolati nei due nodi adiacenti.
Il problema principale della forma ottenuta `e che i coefficienti stessi
dipendono, a loro volta, da flussi alle interfacce. Si ha cos`ı un problema
non lineare, ove dunque la matrice dei coefficienti D sar`a, nel problema
agli autovalori che andremo a risolvere, dipendente dagli autovalori stessi in
maniera non lineare, ed anche dalla stessa soluzione che dobbiamo ottenere.
Risolvere problemi di questo tipo `e molto complesso. La sola possibilit`a
`e quella di procedere iterativamente, ove per eliminare i flussi alle interfacce
per l’n-esima iterazione utilizzo i valori calcolati alla (n-1)-esima iterazione.
Dunque la matrice d’iterazione varier`a ad ogni ciclo dell’algoritmo, con-
dizione tipica degli algoritmi per la risoluzione di problemi non lineari. Si
tratta di calcoli pesanti e complessi, la cui convergenza non `e garantita ma
che, nonostante tutto questo, funzionano e vengono correntemente utilizzati.
In generale i problemi di questo tipo, in logica multigruppo, si risolver-
anno con lo stesso principio applicato per le differenze finite fini: vi saranno
due processi iterativi uno dentro l’altro. Il problema non `e pi` u complesso in
linea di principio, si operer`a con matrici di dimensioni inferiori ma con mag-
giore complessit`a di risoluzione. L’unico elemento effettivamente distintivo
sta nel fatto che, in questo caso, non `e possibile risolvere le equazioni per i
vari gruppi energetici “a cascata”. Essse sono infatti accoppiate tra loro ed
andranno dunque risolte in modo combinato.
3.4.2 Metodi Cubbox
Cosa accade se l’approssimazione del flusso diviene di terzo grado? Si di-
mostra che, scegliendo opportunamente la forma del termine di terzo grado
come ξ(ξ
2

1
4
) i coefficienti lineari e quadratici rimangono gli stessi che nel
caso Quabox, e che il passo aggiuntivo consiste esclusivamente nel calcolo dei
coefficienti di ordine cubico. A nostro vantaggio va il fatto che, utilizzando
questa forma particolare, il termine di terz’ordine non aggiunge contributi
nel bilancio integrale.
Nonostante questa apparente inoffensivit`a tali termini sono tuttavia nec-
essari, poich`e si dimostra che spesso una semplice approsimazione al secondo
92
ordine non `e sufficiente. Sappiamo in ogni caso che se vogliamo aggiungere
un grado di libert`a sar`a necessario imporre una condizione al contorno ad-
dizionale. In questo caso utilizzeremo delle funzioni peso: dovr`a dunque
essere vero che:
_
V
ijl
_

∇D

∇Φ + (
νΣ
f
k
−Σ
a
)
_
ΦωdV = 0
ove si ritorner`a al semplice bilancio neutronico per ω = 1. Utilizzando invece
pesi opportuni potr`o calcolare i tre termini aggiuntivi; si dimostra che tali
pesi sono del tipo ξ(ξ
2

1
4
), che applicati nelle tre direzioni forniscono le tre
condizioni al contorno aggiuntive necessarie per la chiusura del problema.
39
Otterr`o cos`ı una forma del tipo:
c
x
= (f
x
ijl
)
Φ
i+
1
2
,j,l
−Φ
i−
1
2
,j,l
Φ
ijl
Ove, come era lecito attendersi, compaiono ancora una volta le condizioni
alle interfacce, che andranno a complicare ulteriormente il problema.
3.5 Elementi di cinetica neutronica
Si `e parlato finora di fenomeni pseudo-stazionari, ovvero dove le operazioni
permettessero di distaccarsi solo in maniera marginale dalla criticit`a. Quan-
do questa ipotesi non `e verificata non `e pi` u possibile utilizzare l’approccio
visto fino ad ora e diventa necessario l’utilizzo di equazioni differenti, di-
namiche, bastate sulla cinetica neutronica. Studieremo in particolare la
cinetica puntiforme
Cominciamo dalla definizione del k
eff
, il mio “metro” di criticit`a di un
reattore. Esso pu`o essere di fatto definito in due modi equivalenti basati
per`o su filosfie diverse:
• secondo il life cycle
• secondo il neutron balance
Il risultato `e naturalmente lo stesso, ma l’approccio `e diverso. Nel secondo
caso mi limito infatti a fare il rapporto tra i neutroni che si generano da
fissione ed i neutroni perduti in un certo lasso di tempo, operando cos`ı
niente pi` u di un bilancio neutronico.
Attenzione per`o. Non bisogna dimenticare che da fissione non escono
soltanto i neutroni pronti. Alcuni nuclei figli generati dalla fissione, essendo
instabili, possono dare luogo ad ulteriore emissione di neutroni dopo un
39
Si parla ancora una volta di pesatura alla Galerkin. Tale imposizione non ha significato
fisico ma solo matematico
93
certo lasso di tempo. Tali neutroni sono detti neutroni ritardati e sono
di primaria importanza per il controllo delle reazioni nucleari.
I neutroni ritardati vengono alla luce in una situazione in cui il flusso
neutronico si `e gi`a evoluto, ed `e dunque diverso da quello che vi era al mo-
mento della generazione dei loro progenitori. Si dice dunque che i neutroni
ritardati tendono a ricordare il flusso neutronico che li ha generati.
Come ne terremo dunque in conto ai fini del calcolo del k
eff
?
Considereremo inizialmente due popolazioni:
• La popolazione di neutroni pronti, n
• La popolazione di progenitori di neutroni ritardati, c
i
A cosa devo il pedice i? Al fatto che esistono molto tipi diversi di progenitori
che danno luogo ad emissione di neutroni, ma che lo fanno con tempi diversi.
In generale essi sono divisi in 6 gruppi o famiglie, per le quali il ritardo di
emissione va da un massimo di circa 80 s ad un minimo dell’ordine dei ms.
Tenendo dunque in conto anche del contributo dei neutroni ritardati
avremo che il k
eff
diventa:
k
eff
=
n +

i
c
i
neutroni scomparsi
Si vede come la scelta di utilizzare l’approccio di bilancio neutronico per
il calcolo del k
eff
sia dettata anche dalla necessit`a di tenere in conto dei
neutroni ritardati. Applicando una logica del tipo “ciclo di vita” non sarebbe
invece facile distinguere da che generazione essi provengono.
Indicheremo con l o tmg il tempo medio di generazione, in generale
differente dalla vita media dei neutroni. Tali quantit`a sono invece uguali
solo ove il reattore sia critico, ed avremo dunque una nuova definizione del
k
eff
come k
eff
=
l
0
l
. Tali quantit`a potranno essere dunque confuse quando
si opera in regime di pseudocriticit`a. In realt`a avremo che l
0
`e una costante,
mentre l varia assieme al k
eff
.
Potremmo tuttavia ora chiederci se, dopo tutto quanto detto sino ad ora,
le due definizioni di k
eff
siano effettivamente equivalenti o meno.
Supponendo per semplicit`a di trovarsi all’interno di un reattore termico,
suddividiamo la vita di un neutrone in tappe ben definite. Avendo poi
definito l
0
come la vita media di un neutrone, sar`a possibile dire anche
che l
0
=
percorso
velocit`a
, ma essendo la lunghezza del cammino percorso da un
neutrone inversamente proporzionale alla sezione d’urto di assorbimento
40
potremo in definitiva dire che l
0
·
1
Σ
a
v
. Si pu`o dunque vedere che, per
40
Trascureremo in questa fase il rallentamento del neutrone, poich`e i tempi caratteris-
tici della sua termalizzazione sono molto pi` u veloci di quelli tipici dell’assorbimento: la
velocit` a di un neutrone termico `e molto inferiore di quella di un neutrone ancora in fase
di rallentamento
94
come sono strutturati i reattori termici, in questo caso `e abbastanza agevole
identificare le generazioni di neutroni distinte. Possiamo dunque supporre
ragionevolmente che tutti i neutroni emessi nella fase 1 saranno assorbiti
nella fase 2, di modo che la definizione sul ciclo di vita risulti uguale a
quella sul bilancio neutronico.
La moltiplicazione del numero di neutroni che abbiamo in un tempo t `e
data da:
M(t) = k
t
l
Facciamo un esempio numerico. Se prendiamo l’acqua come moderatore,
avremo, per t = 1s, l = 10
−4
s
41
Dunque, supponendo inoltre k=1.001,
otterremo (utilizzando le opportune approssimazioni):
M(t) = 1.001
10000
· (e
0.001
)
10000
· e
10
Si vede dunque che anche per un valore di k
eff
molto prossimo ad uno, dopo
appena un secondo la cinetica del reattore ha portato alla moltiplicazione
della popolazione neutronica di un fattore e
10
.
Questo calcolo `e stato effettuato in assenza di neutroni ritardati, in pre-
senza dei quali il valore di l diventa circa 0.08, il che riduce di molto il fattore
di moltiplicazione visto prima.
Definiamo ora una serie di quantit`a (ove per neutroni prodotti si intende
la totalit`a dei neutroni prodotti ad una determinata generazione):
k
eff
=
n prodotti
n persi
k
ex
= k
eff
−1 =
n prodotti - n persi
n persi
ρ =
k
eff
−1
k
eff
=
n prodotti - n persi
n prodotti
(reattivit`a)
β =
precursori di n ritardati
n prodotti
ρ −β =
n pronti - n persi
n prodotti
l
0
=
n esistenti
n persi(per unit`a di tempo)
l =
n esistenti
n prodotti(per unit`a di tempo)
In base a queste definizioni avremo che:
dn
dt
=
ρ −β
l
n(t) +

i
λ
i
c
i
(t)
41
questo dipende dal fatto che l’acqua ha una sezione d’urto di assorbimento elevata.
Utilizzando la grafite avremmo avuto che l = 10
−3
s
95
Ovvero la variazione del numero di neutroni per unit`a di tempo `e pari alla
produzione di neutroni pronti pi` u la somma delle produzioni dei neutroni
ritardati provenienti da tutte le famiglie meno i neutroni persi.
42
Il termine
legato ai neutroni ritardati contiene la popolazione all’istante t moltiplicata
per l’opportuna costante di decadimento, e deriva da:
dc
i
dt
= −λ
i
c
i
+
β
i
l
n(t)
Supponiamo ora di avere un gradino di reattivit`a nell’istante t=0, tale per
cui ρ = 0 per t ≤ 0 e ρ = p per t > 0
Fintanto che tale gradino `e inferiore a β, sono ancora in grado di control-
lare il reattore. A risposta di tale gradino ho infatti un incremento rapido per
un tempo
l
β
, dopo il quale la popolazione neutronica continua ad aumentare
ma in modo molto regolare e in entit`a inferiore. Il salto iniziale `e definito
prompt jump, ed `e tale per cui n(t) =
β
β−ρ
n
0
. La chiave di tale processo
`e che se fosse invece ρ > β, la risposta della popolazione neutronica non
prevederebbe tale assestamento, ma si manterrebbe di rapido incremento.
Dunque `e qui che risiede il fenomeno fondamentale che permette il controllo
delle reazioni a catena solo grazie alla presenza dei neutroni ritardati.
Abbiamo detto in precedenza che il tempo di risposta l passa da circa
10
−4
a 0.08 nel momento in cui si considerano i neutroni ritardati. Ma
perch`e?
Questo `e dovuto al fatto che il valore reale di l `e dato da
ˆ
l = l +

i
β
i
λ
i
ove la sommatoria a secondo membro diventa di fatto preponderante. Ma
come si arriva a tale scrittura?
Ripartiamo dalla
dn
dt
=
ρ −β
l
n(t) +

i
λ
i
c
i
(t)
supponendo per ora β, ρ e l indipendenti dal tempo, anche se per la reattivit`a
si tratta di una approssimazione particolarmente forte. Supponiamo inoltre
di avere all’istante iniziale
dc
i
dt
= 0 e
dn
dt
= 0
Otterremo di conseguenza (tramite l’applicazione della trasformata di
Laplace)
ρ = ls −

i

i
s +λ
i
42
Si tenga conto che nel momento in cui vado a studiare fenomeni dipendenti dal tempo
sorgono problemi detti di stiffness, rigidit` a, legati all’accoppiamento di fenomeni aventi
tempi caratteristici differenti tra loro. In questo caso appare chiaro che i fenomeni legati
ai neutroni pronti sono molto pi` u veloci di quelli legati ai neutroni ritardati, provocando
il verificarsi della situazione sopra enunciata, con conseguente grande attenzione che deve
essere posta al momento della discretizzazione del dominio temporale
96
Dunque una volta fissato ρ ho tante soluzioni quanti sono i valori di λ
i
pi` u una, dunque di fatto 7. Dallo studio della funzione notiamo inoltre che
tali soluzioni sono tutte reali e danno luogo ad un andamento monotono a
tratti. Se procediamo con l’antitrasformazione otteniamo che:
n(t) =
7

j=1
A
j
e
s
j
t
Il problema si concentra dunque sulla soluzione s
j
avente valore pi` u grande.
Se supponiamo che tale valore sia, in modulo, trascurabile rispetto a λ
i
otteniamo
43
s
1
=
ρ
l +

i
β
i
λ
i
Si ha dunque che:
ˆ
l = l +

i
β
i
λ
i
=
= l(1 −β) +

i
β
i
l +

i
β
i
λ
i
=
= (1 −β)l +

i
β
i
(l +
1
λ
i
)
Dunque l `e la media pesata sulle popolazioni neutroniche dei tempi medi di
vita dei neutroni pronti e dei neutroni ritardati.
Si vede da quanto scritto che il reattore ha una cinetica sua, e dunque non
`e possibile variarne le condizioni operative oltre ad una certa velocit`a limite.
Questo `e molto importante soprattutto in condizioni di pericolo, ove `e nec-
essario provocare lo spegnimento repentino del reattore. Essa sar`a dunque
limitata dal valore della costante di decadimento dei neutroni ritardati di
modulo inferiore
44
43
Cosa accadrebbe se ρ > β? Ci troveremo all’interno della zona asintotica di s
1
, il cui
valore sar`a dunque molto elevato. Otterremo di conseguenza che nella equazione
ρ = β + ls −

i
λ
i
β
i
s + λ
i
il grande valore di s porta il contributo della sommatoria a divenire trascurabile, in modo
che otteniamo per s
1
:
s
1

ρ −β
l
44
Questo aspetto deve essere tenuto in conto in particolare quando si sceglie di ridurre il
numero delle famiglie di progenitori per la semplificazione dei calcoli, mediando le relative
costanti di decadimento. In generale `e necessario mantenere isolata la famiglia avente la
costante di modulo inferiore in quanto essa `e quella avente ruolo chiave nei transitori
97
Vediamo ad esempio cosa accade scegliendo di operare con due macro-
famiglie:
_
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
_
1
v
∂Φ(r,t)
∂t
= D∇
2
Φ(r, t) −Σ
a
Φ(r, t) +pνΣ
f
ε(1 −β)Φ(r, t) +p[λ
1
c
1
(r, t) +λ
2
c
2
(r, t)]
∂c
1
∂t
= −λ
1
c
1
(r, t) +β
1
pνΣ
f
εΦ(r, t)
∂c
2
∂t
= −λ
2
c
2
(r, t) +β
2
pνΣ
f
εΦ(r, t)
Con:
p fattore di sopravvivenza alle catture di risonanza
ε fattore di moltiplicazione veloce
45
Se ne ottiene che:
c
1
= c
10
(r)e
−λ
1
t

1
νΣ
f
ε
_
t
0
Φ(r, t

)e
−λ
1
(t−t

)
dt

Si vede dunque che i neutroni ritardati risentono del flusso calcolato all’is-
tante t-t’, come mostrato dal termine di convoluzione, che rappresenta il
“ricordo“ dei neutroni ritardati.
Se andiamo ad ipotizzare di poter scrivere:
_
¸
¸
_
¸
¸
_
Φ(r, t) = F(r)ϕ(t)
c
i
(r, t) = F(r)C
i
(t)

2
F(r) +B
2
G
F(r) = 0
G
i
=
C
i
νΣ
f
ε
45
tale fattore `e tenuto in conto solo per i neutroni pronti, in quanto i neutroni ritardati
sono emessi con energie inferiori e la probabilit` a che essi diano luogo a fissioni veloce `e
trascurabile
98
Otteniamo che il sistema precedente pu`o essere scritto nella forma
46
_
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
_

dt
=
1
l
t
[(1 −β)k
eff
−1]ϕ(t) +
k
e
ff
l
t

1
G
1
(t) +λ
2
G
2
(t)]
dG
1
dt
= −λ
1
G
1
(t) +β
1
ϕ(t)
dG
2
dt
= −λ
1
G
2
(t) +β
2
ϕ(t)
La soluzione del sistema sar`a data da
d
dt
_
_
ϕ(t)
G
1
(t)
G
2
(t)
_
_
=
_
_
1
l
t
[(1 −β)k
eff
−1]
1
l
t
k
eff
λ
1
1
l
t
k
eff
λ
1
β
1
−λ
1
0
β
2
0 −λ
2
_
_

_
_
ϕ(t)
G
1
(t)
G
2
(t)
_
_
Che in forma matriciale `e esprimibile come:
dx(t)
dt
=
ˆ
Ax(t)
Tale sistema `e risolto evidentemente da una forma di tipo esponenziale,
ovvero:
x(t) =
3

i=1
µ
T
i
x(0)e
α
i
t
µ
i
Tale problema `e pi` u facilmente risolvibile applicando alle funzioni una trasfor-
mazione secondo Laplace. In questo modo, chiamando α la nuova variabile
46
sono qui di seguito esplicitati i passaggi che permettono di arrivare a questa forma,
che potranno sembrare semplici ai pi` u ma che vengono mostrati per completezza:
1
v
∂Φ(r, t)
∂t
= D∇
2
F(r)ϕ(t) −Σ
a
F(r)ϕ(t) + pνΣ
f
ε(1 −β)F(r)ϕ(t) + p[λ
1
F(r)C
i
(t) + λ
2
F(r)C
i
(t) =
= −DB
2
G
F(r)ϕ(t) −Σ
a
F(r)ϕ(t) + pνΣ
f
ε(1 −β)F(r)ϕ(t) + p[λ
1
F(r)C
i
(t) + λ
2
F(r)C
i
(t) =
1
v
∂ϕ(r, t)
∂t
= −DB
2
G
ϕ(t) −Σ
a
F(r)ϕ(t) + pνΣ
f
ε(1 −β)ϕ(t) + p[λ
1
C
i
(t) + λ
2
C
i
(t) =
∂ϕ
t
= vΣ
a
[−(L
2
B
2
+ 1) + (1 −β)
νΣ
f
Σ
a
εp]ϕ(t) + pvνΣ
f
ε[λ
1
G
1
+ λ
2
G
2
] =
= vΣ
a
(L
2
B
2
+ 1)[
(1 −β)
(l
2
B
2
+ 1)
νΣ
f
Σ
a
εp −1]ϕ(t) + pvνΣ
f
ε[λ
1
G
1
+ λ
2
G
2
]
L
2
B
2
+ 1
L
2
B
2
+ 1
=
=
1
l
t
[(1 −β)k
eff
−1]ϕ(t) +
k
eff
l
t

1
G
1
(t) + λ
2
G
2
(t)]
Ove si `e usato che:
L
2
=
D
Σ
a
1
l
t
= vΣ
a
(1 + L
2
B
2
)
k
eff
=
pενΣ
f
Σ
a
(1 + L
2
B
2
)
per la cui dimostrazione si rimanda a testi e corsi di fisica del reattore
99
delle funzioni trasformate, otterr`o un sistema del tipo seguente:
α
i
˜ x =
ˆ
A˜ x
Questo risulta essere n`e pi` u n`e meno che un problema agli autovalori, ove
gli α
i
sono gli autovalori e i µ
i
le autofunzioni.
Per la seconda e la terza riga del problema (quelle relative ai progenitori)
si ottiene che:
_
β
1
µ(1) −(λ
1

2
)µ(2) = 0
β
2
µ(1) −(λ
2

3
)µ(3) = 0
Da cui si ottiene che, se il primo elemento dell’autovettore `e normalizzato
ad 1, vale:
µ
T
= ¦1,
β
1
λ
1

2
,
β
2
λ
2

3
¦
Per determinare infine gli α
k
devo risolvere l’equazione determinan-
tale che assume la forma:
_
F(α) =
l
t
α
1+l
t
α
+
1
1+l
t
α

2
i=1
αβ
i
α+λ
i
F(α) =
k
eff
−1
k
eff
Ove ho di fatto eguagliato due espressioni per la reattivit`a del sistema.
Questo ci permette (vedi grafico su appunti) di determinare gli autoval-
ori della matrice A. Dall’analisi dei risultati si possono trarre le seguenti
conclusioni
47
:
• Se la reattivit`a `e nulla, anche il primo degli autovalori avr`a modulo nul-
lo. Il sistema evolver`a quindi in termini molto meno incisivi (ma nonos-
tante ci`o si muove: dunque nemmeno se il sistema fosse perfettamente
critico avremmo completa stazionariet`a, se non asintoticamente).
• Se la reattivit`a `e maggiore di 0, il primo degli autovalori `e positivo, ed
il sistema tende (asintoticamente) ad esplodere
• se infine la reattivit`a `e negativa anche il primo degli autovalori `e nega-
tivo, il che porta allo spegnimento del reattore. Si vede che la velocit`a
di tale spegnimento `e proporzionale al termine pi` u resistente (ovvero
α
1
), il cui valore limite (raggiungibile solo per reattivit`a infinitamente
negativa) `e dato da λ
1
. Ecco dunque spiegato il limite alla velocit`a di
spegnimento del reattore.
47
Si noti come solo il primo dei 3 autovettori ha elementi sempre positivi, in quanto sia
λ
1
che λ
2
sono maggiori dell’autovalore, il cui valore limite negativo `e proprio −λ
1
. Tale
funzione `e dunque l’unica ad avere un significato fisico
100
3.6 Elementi di Trasporto neutronico
Fino a questo momento abbiamo parlato di modellizzazione della fisica neu-
tronica del reattore tramite l’equazione della diffusione, facendo riferimento
alla teoria del trasporto come ad un sistema che, a costo di maggiore comp-
lessit`a, permette di ottenere calcoli di precisione superiore. Vediamo ora di
effettuare un discorso introduttivo sul trasporto neutronico che permetta di
comprenderne i principi di base.
L’equazione del trasporto pi` u generica, applicabile a diversi campi della
fisica, `e detta equazione di Boltzmann e non `e lineare. Tale non linearit`a
nasce in generale dal considerare le interazioni tra le particelle che fanno
parte della popolazione che stiamo considerando. Caratterstica del trasporto
neutronico `e quella di ignorare tali collisioni, di modo che l’equazione del
trasporto neutronico risulter`a essere invece lineare.
Esistono due tipi di formulazione per l’equazione del trasporto neutron-
ico:
Integrale : tale formulazione permette di ottenere i valori mediati delle
sezioni d’urto da utilizzare in teoria della diffusione.
Integro-Differenziale : tale formulazione `e la pi` u usata per la proget-
tazione dei sistemi nucleari
48
Vediamo ora alcune differenze tipiche tra l’approccio diffusivo e quello
trasportistico:
Direzione di volo dei neutroni : Il primo elemento di maggiore preci-
sione legato alla teoria del trasporto rispetto all’approccio diffusivo `e
il tenere in conto anche della direzione di volo dei neutroni. Avre-
mo dunque a che fare con un flusso neutronico angolare Φ(r, E.

Ω) al
posto del consueto flusso neutronico Φ(r, E). Questo mi permette di
tenere in conto del fatto che, dopo ogni evento, un neutrone avr`a una
direzione di volo diversa da quella di partenza.
49
Parallelismo fisico-matematico : Anche l’equazione del trasporto `e gen-
eralmente risolta tramite tecniche di tipo iterativo
50
. Caratteristica
tipica della forma integro-differenziale `e quella di mantenere un par-
allelismo tra iterazioni e collisioni neutroniche, ove invece in forma
integrale `e molto pi` u difficile trovare una correlazione di questo tipo.
48
Il codice attualmente in uso presso il CEA per il trasporto neutronico `e l’Apollo II
49
L’equazione del trasporto in forma integrale prevede una integrazione sulla direzione
di volo. Il risultato dunque di tale operazione sar` a un flusso indipendente da tale variabile,
il che crea un forte parallelo con la teoria della diffusione e permette di utilizzare i risultati
ottenuti in teoria del trasporto per migliorarla
50
Come soluzione di tentativo viene spesso utilizzato il risultato ottenuto con modelli
diffusivi
101
Nel caso diffusivo si era invece visto come tale parallelismo era sempre
garantito
Localit`a del fenomeno Si `e detto pi` u volte in precedenza che l’approccio
diffusivo `e di tipo locale: tutti i punti del dominio sono collegati tra
loro indirettamente, ma solo i nodi tra loro adiacenti presentano una
dipendenza diretta. Questo si ripercuote, a livello numerico, nell’avere
a che fare con matrici sparse. Nel caso della teoria del trasporto,
invece, vengono tenuti in considerazione anche i fenomeni a distanza.
Dunque un neutrone posto in un generico punto del reattore potrebbe,
seppure con probabilit`a estremamente bassa, raggiungere un qualsiasi
altro punto del reattore. Conseguenza di tale approccio `e l’avere a che
fare con matrici dense.
3.6.1 Formulazione integrale
Sotto le ipotesi di:
• Problema stazionario
• Mezzo isotropo
• Fenomeni di scattering di natura isotropizzante
• Sorgente isotropa
Si pu`o scrivere l’equazione del trasporto neutronico in forma integrale nel
modo seguente:
Φ(r, E) =
_
V
_
[
_

0
Σ(

r

, E

)Φ(

r

, E

)f(

r

, E

→ E) +S(

r

, E

)]dE

_
e
l
op
(

r

→r,E)
4π[r −

r

[
2
dV

Ove si `e dunque supposto di poter scrivere (viste le ipotesi)
_
f(

r

, E

→ E,



Ω) =
1

f(

r

, E

→ E)
S(r, E,

Ω) =
1

S(r, E)
L’equazione che compare nell’espressione del flusso tra parentesi quadre `e
una equazione di Frehdolm di seconda specie.
La funzione f rappresenta la probabilit`a che un neutrone avente energia
E’ e direzione di volo Ω

esca da un evento di interazione con energia E e
direzione di volo Ω.
51
Risulter`a dunque che: f(r, E

→ E) `e dato dalla
somma dei seguenti contributi:
• Scattering:
_
Σ
S
(r, E

)
Σ(r, E)
f
S
(r, E

→ E)
_
51
In realt` a non si parla mai di avere esattamente energia E o E’, o direzione di volo
lungo Ω o Ω

, ma sempre di valori compresi in un intorno dE o dΩ del punto considerato
102
• Cattura: (Σ
c
)
52
• Fissione:
_
Σ
f
(r, E

)
Σ(r, E)
f
f
(r, E

→ E)ν(r, E

)
_
• Reazioni n.2n:
_
2
Σ
n,2n
(r, E

)
Σ(r, E)
f
n,2n
(r, E

→ E)
_
Dovr`a inoltre valere chiaramente che:
_

0
f(r, E

)dE

= 1
Il termine esponenziale `e invece legato all’attenuazione del segnale,
descrive la diminuzione di probabilit`a che un neutrone arrivi a distanze
sempre maggiori senza subire eventi di qualunque tipo. All’interno di tale
termine `e contenuto il parametro “lop” lunghezza ottica del sistema,
che rappresenta come neutroni aventi energie diverse vedono il sistema in
modo diverso. Risulter`a di fatto che:
l
op
(

r

→r, E) = Σ(E)[r −[

r

[
Se introduciamo l’ipotesi di mezzo omogeneo, possiamo far scomparire
la dipendenza delle sezioni d’urto dalla posizione. L’equazione si presenter`a
dunque nella forma:
Φ(r, E) =
_
V
[
_

0
Σ(E

)Φ(

r

, E

)f(E

→ E)dE

+S(

r

, E

)]
e
Σ(E)|r−|

r

|
4π[r −

r

[
2
dV

Il problema sar`a a questo punto andare a discretizzare tale equazione a
livello spaziale ed energetico. Tale operazione `e tanto pi` u difficile quanto
pi` u problematica `e la natura del nucleo (o kernel) dell’equazione integrale
che `e dato, in questo caso, dal termine:
e
Σ(E)|r−|

r

|
4π[r −

r

[
2
Effettuando la discretizzazione della variabile energetica dovremo definire
delle sezioni d’urto mediate. Si definisce:
Σ
g

→g
=
_
g

dE

_
g
dE[Σ(E

→ E)Φ(r, E

)]
_
g

Φ(r, E

)dE

52
Questo termine non compare nell’espressione precedente in quanto, evidentemente, la
cattura neutronica non provoca riemissione di neutroni e di conseguenza non dar` a luogo
ad alcun contributo
103
Se supponiamo di implementare nell’equazione la discretizzazione ener-
getica, andando ad aggiungere a tutte le semplificazioni fatte sino ad ora il
trascurare le reazioni n,2n, si ottiene:
_
Φ
g
(r) =
_
V
[

G
g

=1
Σ
g

→g
Φ
g
(

r

) +

G
g

=1
(νΣ
f
)
g
Φ
g
(

r

) +S
g
(

r

)]
e
Σ(E)|r−|

r

|
4π|r−

r

|
2
dV

g = 1 : G
Il passo successivo, ultima operazione prima della risoluzione numerica,
sar`a quello di discretizzare nello spazio. Per farlo si utilizzano delle for-
mule di quadratura tramite polinomi (Newton Cotes) o tramite polinomi
ortogonali (Formule di Gauss).
Facciamo un esempio in geometria monodimensionale:
Φ
g
(x) =
_
a
−a
_
_
G

g

=1
Σ
g

→g
Φ
g
(x

) +
G

g

=1
(νΣ
f
)
g
Φ
g
(x

)
_
_
1
2
E
1

g
[x −x

[dV

Ove E
1
`e la funzione esponenziale integrale di ordine 1, un tipo di
polinomio ortogonale appartenente alle funzioni speciali. Tali funzioni
hanno propriet`a interessanti ma sono singolari nel dominio. Tali funzioni
sono definite nel modo seguente:
E
n
(z) =
_

1
e
−zt
t
n
dt
Nel nostro caso vale:
E
1
(z) = −γ −ln z −

i=0
(−1)
n
z
n
n n!
con γ costante di Eulero Mascherani che vale circa 0.57721 Tale
espressione costituisce il nucleo dell’equazione. Esso `e singolare (a causa del
logaritmo) in x’. Tale singolarit`a `e detta debole in quanto `e moderatamente
facile da risolvere.
Ci`o che si va a fare spesso `e tuttavia l’utilizzare una serie di polinomi
ortogonali al posto della funzione esponenziale integrale. L’approssimazione
`e infatti lecita e ben posta, in quanto sono entrambi polinomi ortogonali,
ma si ha in pi` u una migliore conoscenza della funzione. Andremo dunque a
scrivere che, utilizzando i polinomi di Tchebychev (modificati in modo tale
da adattarne il dominio alla funzione di interesse)
E
1
(z) = −γ −ln z −

n=0
a
n
T

n
(
z
8
)
con:
_
_
_
T

0
= 1
T

1
= 2t −1
T

n+1
= (4t + 2)T

n
(t) −T

n−1
(t)
104
Tale approssimazione diventa effettivamente tale solo nel momento in cui la
sommatoria sui polinomi viene portata ad un numero finito di termini.
Non considerando pi` u la presenza di una sorgente avremo ottenuto un
problema agli autovalori del tipo H
k
Φ
K
= 0
Approfondiamo anche in questo caso la scelta dell’autovalore. Si era
accennato, a proposito della diffusione, della possibilit`a di posizionare l’au-
tovalore in altri punti dell’equazione, attribuendogli cos`ı un differente signi-
ficato fisico. Questo pu`o essere fatto anche in teoria del trasporto:
• Scegliendo come autovalore λ = k si va ad influenzare la molteplic-
it` a da fissione
• Scegliendo come autovalore λ = γ si va ad agire sulla collisionalit` a.
• Scegliendo come autovlaore λ = δ si va infine ad agire sulla densit`a
del materiale. Quest’ultimo caso `e particolarmente interessante per
modellizzare situazioni incidentali (ove questa apparente incoerenza
diventa effettivamente realistica dal punto di vista fisico). Il problema
`e che le equazioni diventano, in questo caso, non lineari.
105
Appendice A
Aggiustamento di sezioni
d’urto
A.1 Introduzione alle basi di dati
La presenza di studi legati all’aggiustamento delle sezioni d’urto deriva
principalmente dalla grande incertezza esistente su tali valori, ai quali nei
database `e sempre associato uno scostamento, il cui valore quantifica di
quanto il valore reale pu`o allontanarsi da quello nominale. Ogni valore
contenuto all’interno di tale intervallo `e considerato in accordo con i dati
sperimentali. Questo sistema ci ricorda innanzitutto dell’importanza del
condizionamento di un problema: la presenza nota di incertezze nei dati
in ingresso mi porta alla necessit`a di assicurarmi che tale imprecisione non
mini la mia possibilit`a di risolvere il mio problema numerico.
Negli anni ’70 `e stato effettuato un enorme lavoro di aggiustamento
statistico delle sezioni d’urto basato sui dati provenienti da decine di labora-
tori diversi, in cui `e stata tenuta in conto l’affidabilit`a di ogni dato tramite
schemi precisi, tenenti in conto ad esempio la qualit`a dell’attrezzatura e
l’affidabilit`a dei dati di input utilizzati e, soprattutto, delle influenze che si
generano tra i differenti laboratori.
1
Per le sperimentazioni sulle sezioni d’urto vengono spesso utilizzati reat-
tori particolari, di forma sferica, pensati per avere una ottima conoscenza
della geometria. Lo scopo `e quello di rendere il sistema il pi` u semplice pos-
sibile per eliminare ogni tipo di incertezze, in modo da portersi concentrare
sulla misurazione delle sezioni d’urto. In generale il risultato di tali esper-
imenti (detti esperimenti integrali per via del tipo di grandezze che si
1
Si faccia l’esempio di un laboratorio (Lab 1) che effettui degli esperimenti a partire dai
dati ottenuti da altri due (Lab 2 e Lab 3). Al fine di quantificare l’affidabilit` a dei risultati
ottenuti dal Lab 1 sar` a dunque necessario anche tenere in conto di quale sia l’affidabilit` a
dei dati dei Lab 2 e Lab 3 e la loro influenza sul processo utilizzato dal Lab 1 al fine
dell’ottenimento dei suoi risultati
106
vogliono misurare) vengono confrontati con simulazioni numeriche, al fine
di validare i modelli utilizzati per ottenere queste ultime.
La libreria pi` u nota in fisica neutronica `e la ENDF, mantenuta dai lab-
oratori del sito di Los Alamos. Vi sono contenuti, per ogni nucleo di inter-
esse nucleare e per ogni tipo di sezione d’uro, dati per circa 50’000 punti
energetici. La libreria ENDF si divide in pi` u sezioni:
ENDF-A che contiene i dati grezzi provenienti dai vari laboratori. Si tratta
di dati sparpagliati e disordinati
ENDF-B contiene i dati contenuti in ENDF-A opportunamente ordinati,
organizzati, interpolati ed estrapolati al fine di poter essere material-
mente utilizzabili. La fase di lavoro che porta dal database di tipo A
a quello di tipo B `e detta evaluation
ENDF-C contiene infine i dati sulla correttezza e l’affidabilit`a di ogni dato
contenuto in ENDF-B
Tali dati sono purtroppo ben lontani dall’essere corretti e completi. Se
gi`a incertezze sono presenti su quei nuclidi ben noti e facili da studiare, si
hanno i maggiori problemi per le specie che hanno vita molto breve. Queste
infatti sono difficili da studiare, ma il loro impatto sui bilanci pu`o essere
comunque rilevante ed `e dunque opportuno tenerne in conto.
Attualmente i metodi numerici ed i calcolatori per attuarli hanno miglio-
rato enormemente le loro prestazioni, e sarebbe dunque un peccato spre-
care un tale potenziale a causa di dati di partenza imprecisi. Se ad es-
empio imponessi con successo ad un algoritmo un margine di errore dello
0.001% rischierei di scoprire che tale errore `e in realt`a dell’ordine del punto
percentuale a causa di imprecisione sui dati di input.
Il punto principale `e che i parametri differenziali, quali sono ad esempio
le sezioni d’urto, sono molto difficili da misurare. Molto pi` u agevole (quan-
tomeno in relativo) `e invece la misurazione dei parametri integrali, come
potrebbe essere la criticit`a di un sistema. In effetti uno degli esperimenti
tipici in questo ambito `e quello di “costruirsi” dei benchmark in modo tale
che questi risultino critici. Essendo nota la loro composizione sia dal punto
di vista materiale che geometrico, i dati che li riguardano sono poi utilizzati
per “testare” le librerie di sezioni d’urto, tramite le quali `e possibile calco-
lare un valore per il k
eff
di tali sistemi che, nell’ipotesi che i calcoli siano
corretti, dovrebbe essere identicamente pari ad 1.
Purtroppo questo non accade quasi mai. Ed allora, posto che in un
sistema cos`ı noto e semplificato le interferenze sulla soluzione provocate da
incertezze di vario tipo sono pressoch`e escluse, si pu`o pensare di utilizzare
il dato misurato per ottenere un miglioramento delle librerie.
In generale tuttavia ogni esperimento contiene, al suo interno, uno spazio
ad N-1 dimensioni di possibili nuove librerie che portano al perfetto soddis-
107
facimento del calcolo ad esso associato (ove N `e il numero di parametri con-
tenuti nella libreria). Come fare per scegliere quale di tutti queste infinite
possibilit`a `e quella da utilizzare per aggiornare la libreria?
Nel prossimo paragrafo sono introdotte (o ricordate, a seconda delle
conoscenze di chi legge) alcune nozioni basilari di statistica e probabilit`a,
utili per la comprensione di quanto segue. Nel paragrafo successivo sar`a
invece affrontato in modo diretto il problema dell’aggiornamento della libre-
ria.
A.2 Elementi di statistica
Supponiamo di avere due misure della stessa quantit`a x effettuate da due
laboratori distinti:
_
x = ¯ x
1
±σ
1
x = ¯ x
2
±σ
2
Supponiamo che entrambi i laboratori siano affidabili. Come faccio ora a
scegliere che valore usare?
Dovr`o utilizzare una media di qualche tipo, sia per determinare il valore
medio “reale” che per la deviazione standard. Dunque, nella forma:
˜ x = c
1
¯ x
1
+ (1 −c
1
)¯ x
2
sto cercando il valore opportuno per c
1
. Il mio obiettivo sar`a quello di
minimizzare la deviazione standard. Essendo che:
σ
2
x
= E[(x − ˜ x)
2
]
si avr`a
σ
2
x
= E[x −c
1
¯ x
1
−(1 −c
1
)¯ x
2
]
2
=
= E[c
1
x −c
1
x +x −c
1
¯ x
1
− ¯ x
2
+c
1
¯ x
2
]
2
=
= E[c
1
(x − ¯ x
1
) + (1 −c
1
)(x − ¯ x
2
)]
2
=
= c
2
1
E(x − ¯ x
1
)
2
+ (1 −c
1
)
2
E(x − ¯ x
2
)
2
+ 2c
1
(1 −c
1
)E(x − ¯ x
1
)E(x − ¯ x
2
)
= c
2
1
σ
2
1
+ (1 −c
1
)
2
σ
2
2
+ 2c
1
(1 −c
1
)E(x − ¯ x
1
)E(x − ¯ x
2
)
Se per`o i due laboratori sono indipendenti l’ultimo termine `e nullo, e la var-
ianza della media pesata `e pari alla media delle varianze pesata sui quadrati
dei pesi della media.
2
Andiamo dunque ad analizzare come ottenere il peso migliore in questo
caso semplificato. Per farlo dovremo annullare la derivata rispetto ai pesi
2
Questo ovviamente non `e detto: anzi, nel caso pi` u generale i laboratori saranno col-
legati tra loro, ed i risultati dell’uno influenzeranno in qualche modo quelli dell’altro e
viceversa
108
dell’espressione ottenuta, in modo tale da ottenere il valore del peso c
1
che
minimizzi la varianza:

2
x
dc
1
= 2c
1
σ
2
1
−2(1 −c
1

2
2
= 0
Da cui ottengo:
c
1
=
σ
2
2
σ
2
1

2
2
Se invece non elmino la covarianza ottengo:
c
1
=
σ
2
2
−σ
12
σ
2
1

2
2
−2σ
12
Dunque se i due laboratori non sono indipendenti tra loro potrei perfino
avere un peso negativo. Questo corrisponderebbe al caso in cui siamo
a conoscenza del fatto che uno dei due laboratori ha influenzato pesan-
temente l’altro in una direzione specifica, e ci costringer`a a muoverci in
quella opposta. Generalizzando per n laboratori ottengo la matrice di
correlazione:
_
_
_
_
_
σ
2
1
σ
12
σ
1n
σ
21
σ
2
2
.
.
.
.
.
.
σ
n1
σ
2
n
_
_
_
_
_
Prendiamo ora un caso distinto: supponiamo di avere due misure di due
grandezze diverse:
x
1
= ¯ x
1
±σ
1
x
2
= ¯ x
2
±σ
2
Supponiamo ora che le grandezze di interesse siano invece:
y
1
= x
1
+x
2
e y
2
= x
1
−x
2
Supponiamo ora che le due misure di partenza siano state fatte in modo tale
da dare luogo a distribuzioni di probabilit`a di tipo gaussiano (il teorema
del limite centrale ci dice che questo `e vero sotto determinate condizioni).
Dunque potr`o scrivere:
x
1
∼ e

(x
1
− ¯ x
1
)
2

2
1
x
2
∼ e

(x
2
− ¯ x
2
)
2

2
2
La funzione di distribuzione associata ad entrambe le variabili sar`a del tipo
f(x
1
, x
2
) ∼ e

(x
1
− ¯ x
1
)
2

2
1

(x
2
− ¯ x
2
)
2

2
2
109
Questo per`o `e valido soltanto se le due variabili sono tra loro indipendenti,
come abbiamo supposto vero per le due grandezze misurate sperimental-
mente. Se per`o vogliamo scrivere una espressione analoga per le variabili
dipendenti, vale a dire y
1
e y
2
x
1
=
y
1
+y
2
2
x
2
=
y
1
−y
2
2
Sostituendo tale espressione in quanto scritto prima ottengo una forma di
questo tipo:
f(y
1
, y
2
) = exp¦ −
1
4
[(
1

2
1
+
1

2
2
)(y
1
− ¯ y
1
)
2
+ (
1

2
1
+
+
1

2
2
)(y
2
− ¯ y
2
)
2
+ (
1

2
1

1

2
1
)(y
1
− ¯ y
1
)(y
2
− ¯ y
2

Ancora una volta esiste un termine legato alla correlazione tra le due misure.
Si veda come in questo caso si abbia comunque una correlazione tra le due
variabili “dipendenti”, nonostante i dati sperimentali siano indipendenti.
Questo `e forzatamente generato dal fatto che tanto y
1
quanto y
2
dipendano
dalle stesse variabili. Abbiamo dunque all’esponente una forma quadratica,
in cui il termine generalmente noto come “doppio prodotto” `e legato alla
covarianza.
La forma quadratica scritta in precedenza `e scrivibile anche in forma
matriciale
(y − ¯ y)
T
M(y − ¯ y)
.
Vogliamo ora calcolare la deviazione standard di σ
y1
σ
2
y1
= E[(y
1
− ¯ y
1
)
2
] =
= E¦[(x
1
+x
2
) −(¯ x
1
+ ¯ x
2
)]
2
¦ =
= σ
2
1

2
2
+ 2σ
12
Ove, come al solito, se i due eventi non sono correlati, l’ultimo termine
scompare.
Da calcoli analoghi si pu` o arrivare a scrivere che:
σ
2
y1
= σ
2
y2
e
σ
y1,y2
= E[(y
1
− ¯ y
1
)(y
2
− ¯ y
2
)] = σ
2
1
−σ
2
2
Da cui posso costruire la matrice:
C
y
=
_
σ
2
y1
σ
y1,y2
σ
y1,y2
σ
2
y2
_
=
_
σ
2
1

2
2
σ
2
1
−σ
2
2
σ
2
1
−σ
2
2
σ
2
1

2
2
_
110
Tale matrice non `e una matrice qualunque. Notiamo intanto che essa `e
definita positiva e dunque sempre invertibile, e tale che C
−1
y
= M
Ho cos`ı ottenuto l’espressione della funzione di distribuzione di y. Potr`o
inoltre normalizzarla ad 1, ovvero renderla tale che
_
f(y)dx = 1
Si dimostra che, a questo fine, devo moltiplicare per un opportuno fattore,
tale per cui ottengo:
f(y) =
_
det(M)
(2ϕ)
N
2
_
exp[−
1
2
(x − ¯ x)
T
M(x − ¯ x)]
Si noti che tale equazione `e valida per qualunque vettore y funzione di
un generico vettore x. Ci`o che varier`a con la dipendenza tra i due insiemi di
variabili sar`a la matrice M che genera la forma quadratica nell’esponenziale.
Prendiamo ora una generica funzione r = r(p) Voglio ora trovare un
modo di esprimere quanto r sia sensibile alle incertezze su p. Scriver`o dunque
che:
r(¯ p +δ
p
) = ¯ r +δ
r
Da cui:
δ
r
· Sδ
p
La matrice S, basata sul troncamento al prim’ordine della serie di Taylor
associata a r(p), `e detta matrice di sensitivit` a del problema, ed `e di
fatto costituita dalle derivate parziali delle varie componenti del vettore r
secondo le variabili contenute nel vettore p.
3
Quello che mi interessa, nota la matrice S, `e valutare l’entit`a di δ
r
. Essa
sar`a quantificata dal parametro C
r
:
C
r
= < δ
r
δ
T
r
>=
= < (Sδ
p
)(Sδ
p
)
T
>=
= < Sδ
p
δ
T
p
S
T
>=
= S < δ
p
δ
T
p
> S
T
=
= SC
p
S
T
Tale procedimento `e detto sandwich rule, e definice la propagazione
delle incertezze
3
Il calcolo di tale matrice, avente dimensioni I x N, sembra a prima vista un compito
arduo. In realt` a posso effettuare tale calcolo in modo molto rapido e semplice
111
A.3 Aggiornamento di dati differenziali a partire
da dati integrali
Supponiamo ora di avere una libreria p composta da N elementi, con N
molto grande. Tale libreria `e utilizzata per ricavare dei parametri integrali
r in numero I molto minore di N. Supponiamo per ora che p ed r non siano
correlati.
Supponiamo di essere in grado di calcolare r con un modello esatto, in
modo tale dunque che l’errore sulla risposta risulter`a dipendere soltanto da
p.
Il nostro scopo `e quello di aggiornare la libreria. Come accennato in
precedenza, il discorso ora si ribalta: misuro r sperimentalmente e mi pongo
il problema di utilizzare il confrontro tra il valore numerico e quello sperimen-
tale per ottenere un aggiornamento per i dati di partenza. In particolare il
modo utilizzato per scegliere quale sia il valore opportuno per l’aggiornamen-
to della libreria sar`a quello di minima distanza dall’orginale: supponendo
dunque che i dati di partenza fossero scorretti ma comunque sensati, l’idea
`e quella di fare in modo di soddisfare le condizioni sperimentali andando
tuttavia a modificare la libreria di partenza il meno possibile. Questo modo
di procedere `e detto principio della massima verosimiglianza.
Definisco dunque:
p la libreria originaria
p

la libreria soddisfacente la prova sperimentale
r(p) la risposta, ovvero il parametro integrale r calcolato in funzione del-
l’insieme dei valori contenuti nella libreria p
S
n
=
∂r
∂p
n
l’elemento del vettore di sensibilit`a, che mi dice come la risposta
r `e influenzata dall’n-esimo parametro della libreria p
d = r(p) − ˜ r la differenza tra il valore della risposta ottenuta numericamente
utilizzando i dati della libreria non aggiornata e lo stesso valore cal-
colato sperimentalmente (o tramite libreria aggiornata: i due valori in
questo primo caso coincidono)
x = p

−p la differenza tra la libreria “vecchia” e quella aggiornata. Queso
`e il valore che ci imponiamo di minimizzare.
Supponendo che, comunque, la libreria di partenza non sia troppo im-
precisa, e che dunque il risultato proveniente da essa non sia troppo lontano
da quello reale, posso linearizzare la differenza tra i due valori, scrivendo
che:
r(p

) · r(p) +
∂r
∂p
(p

−p)
112
Che, ricorrendo alla notazione introdotta in precedenza, pu`o essere anche
scritta come;
sx +d = 0
Il mio obbiettivo `e, come detto, quello di ridurre al minimo il valore di x.
Il mio problema `e dunque quello di trovare un x che soddisfi l’equazione
sx +d = 0 ed al tempo stesso minimizzi il valore di x
2
. Per farlo il metodo
principe `e quello dei moltiplicatori di Lagrange, che mi permette di passare
istantaneamente da un problema di minimo condizionato ad uno di minimo
incondizionato. L’espressione da minimizzare diverr`a dunque:
R(x) = x
T
x + 2λ(sx +d)
Ove il coefficiente 2 `e posto per comodit`a e non influenza la correttezza del
metodo. Si ottiene cos`ı che, derivando:
∂R
∂x
= 2(x
T
+λs) = 0
Tale espressione costituisce , insieme all’equazione di partenza, N+1 equazioni
per la determinazione delle N+1 incognite: le x e il moltiplicatore λ. Si
ottiene dunque che:
x = −λs
T
Che, sostituito nella sx +d = 0 fornisce:
−λss
T
+d = 0
da cui:
λ =
d
ss
T
ed, infine:
x = −
d
ss
T
s
T
Questo risultato pu`o e deve essere esteso al caso in cui non si abbia una sola
risposta r, ma un vettore di I componenti integrali (in numero inferiore alle
N componenti della libreria). Ci`o che ne risulta `e assolutamente identico al
caso precedente, ove al posto del vettore s e del suo trasposto compariranno
la matrice S e trasposta.
Bisogna tuttavia notare che le considerazioni effettuate sino ad ora sono
relative a dati privi di incertezze. Questo non `e ovviamente il caso di una
situazione reale, ed `e opportuno dunque estendere il calcolo al caso pi` u
realistico in cui i dati presi in considerazione sono affetti da incertezze.
Partiamo da alcune considerazioni teoriche. Ci aspetteremo che, tra i
vari paramtri contenuti nella libreria che vogliamo aggiornare, ve ne saranno
di pi` u e meno precisi, ovvero alcuni valori avranno dati di incertezza pi` u
ampi di altri. In quest’ottica appare chiaro che, al fine di un aggiustamento,
113
cercheremo di concentrare la nostra opera sui dati pi` u incerti, che sappiamo
essere da un lato pi` u “bisognosi” e dall’altro pi` u facilmente responsabili
dell’errore.
Per questo ci`o che andremo ad utilizzare non sar`a il dato in s`e, ma il suo
rapporto con la sua stessa deviazione standard. In questo modo abbiamo da
un lato adimensionalizzato i parametri in ingresso, e dall’altro siamo sicuri
di aver tenuto in conto anche della incertezza su di essi. Possiamo dunque
definire subito:
ξ
1
=
x
1
σ
1
ξ
2
=
x
2
σ
2

Da cui risulta che, in forma matriciale, x = Σξ
r(p

) = r(p +x) = r(p + Σξ)
Risolvendo il problema, ed accorgendosi che la matrice Σ
2
non `e altro che
la matrice di sensibilit` a C, otteniamo:
x = −CS
T
(SCS
T
)
−1
d
Finora si `e lavorato imponendo l’esatta uguaglianza tra il risultato sper-
imentale e la risposta ottenuta tramite la libreria aggiornata. Questa im-
posizione `e in verit`a poco realistica, in quanto le incertezze di calcolo mi
impediranno generalmente di ottenere una eguaglianza esatta. Sar`a dunque
necessario supporre tali valori come differenti e cercare successivamente di
minimizzare la loro differenza.
r(p

) =,= ˜ r
Ovvero che il risultato numerico ottenuto tramite l’utilizzo della libreria ag-
giornata (e supposto dunque “esatto), definito con r’, `e diverso dal risultato
sperimentale, definito con ˜ r. Se a questo punto riprendiamo l’equazione di
partenza:
r(p

) = r(p) +S(p

−p)
e sottraiamo membro a membro il valore del risultato sperimentale:
r(p

) − ˜ r = r(p) − ˜ r +S(p −p

)
Otteniamo, definiendo y = r(p

) − ˜ r si ottiene:
y = Sx +d
Andiamo ora a fare come nel caso precedente. Essendovi incertezza anche
su r, dovr`o definire un nuovo vettore che tenga conto del fatto che le variabili
integrali di r soggette ad incertezza maggiore dovranno di fatto contare di
meno. Ecco dunque che scrivo y = Σ
r
η, da cui, ricorrendo ancora una volta
ai moltiplicatori di Lagrange:
R = ξ
T
ξ +η
T
η + 2λ
T
(SΣ
p
ξ −Σ
r
η)
114
Ove ho quindi imposto la condizione di minimizzare non solo il valore di
(p − p

) ma anche quello di (r(p

) − ˜ r. Si arriva tramite i passaggi visti in
precedenza a scrivere che
4
:
x = −C
p
S
T
(C
˜ r
+SC
p
S
T
)
−1
d y = C
˜ r
(C
˜ r
+SC
p
S
T
)
−1
d
Vediamo per`o ora di vedere la cosa da un punto di vista pi` u formale. Def-
inite delle distribuzioni gaussiane per p ed r (entrambi sono infatti soggetti
ad incertezza, a differenza di p’ che `e la libreria ”vera“ ed r’ che `e il cor-
rispondente risposta ”esatta“), potremo scrivere la densit`a di probabilit`a
a due variabili per p ed r, supponendo che entrambe siano delle gaussiane
centrate sui valori ”esatti” p’ ed r’ :
f(p, r) ∼ exp¦−
1
2
[(p −p

)
T
C
−1
p
(p −p

)] + [(˜ r −r

)
T
C
−1
r
(˜ r −r

)]¦
Il problema `e legato alla determinazione di p’, libreria teoricamente esatta
e praticamente incognita. Per procedere definisco x = p − p

e y = ˜ r − r

,
da cui l’esponente dell’esponenziale diventa:
Q = x
T
C
−1
p
x +y
t
C
−1
˜ r
y
Tale valore, per la risoluzione del problema, dovr`a essere minimizzato. Uti-
lizzeremo ancora una volta i moltiplicatori di Lagrange, definendo cos`ı un
nuovo problema Q’
Q

= x
T
C
−1
p
x +y
t
C
−1
˜ r
y + 2λ
T
(Sx −y)
Cercher`o il minimo per x ed y, derivando lungo entrambe le direzioni, il che
mi fornisce i valori:
_
∂Q

∂x
= 2C
−1
p
x + 2S
T
λ → x = −C
p
S
T
λ
∂Q

∂y
= 2C
−1
˜ r
y −λ → y = −C
˜ r
λ
Essendo d = y −Sx ottengo che:
d = C
˜ r
λ +SC
p
S
T
λ
In questa espressione l’unico elemento che non conosco `e λ. Esplicitando
l’equazione per λ e sostituendo nel valore di ottimo trovato per x ottengo
x = −C
p
S
T
(C
˜ r
+SC
p
S
T
)
−1
d
4
Si noti la differenza tra C
r
e C
˜ r
. Il primo rappresenta la matrice di covarianza della
risposta numerica, ottenibile di conseguenza come funzione della matrice di covarianza
della libreria C
p
; il secondo rappresenta invece la matrice di covarianza della misurazione
sperimentale, che nulla ha a che vedere, a priori, con le librerie numeriche
115
da cui, in definitiva
p

= p −C
p
S
T
(C
˜ r
+SC
p
S
T
)
−1
d
Ecco dunque trovata un’espressione per la variazione che dovr`o dare alle
variabili p in funzione del confronto tra i dati sperimentali e i calcoli numerici
sui valori integrali. Questo metodo richiede l’inversione di una matrice, ma
si vede come le dimensioni di tal matrice siano di ordine I, quindi molto
ridotto rispetto alle dimensioni N del vettore p.
La base di tale teoria `e la linearit`a delle perturbazioni, o meglio la
possibilit`a di linearizzarle senza troppi sconvolgimenti.
A.4 Teoria delle perturbazioni
Ravetto parte da un problema agli autovalori, tanto per fare le cose semplici.
Prendiamo ci`o che dicono le dispense, e partiamo da un banale problema
del tipo:
Hψ = S
ove supporremo, per dare un senso pratico ai conti, che H sia l’operatore
dell’equazione del trasporto neutronico, ψ sia il flusso neutronico stesso e
S sia una generica sorgente. Definiamo inoltre la variabile sperimentale r
(response) che dipender`a dal flusso neutronico e che `e di fatto utilizzata per
misurarlo. Sar`a dunque:
r = Dψ
Supponiamo ora che vi siano delle variazioni nell’operatore H che porteranno
inevitabilmente ad una diversit`a nella soluzione. Dunque avremo che:
(H
0
+δH)(ψ
0
+δψ) = S
che diventa, essendo S = H
0
ψ
0
.
H
0
δψ = −δHψ
0
Ove il pedice 0 indica l’operatore non perturbato. La perturbazione sul
flusso generer`a anche una perturbazione nella risposta, data da:
δr = r −r
0
=
= (Dψ) −D(ψ
0
) =
= (Dδψ)
Il punto risiede ora nella valutazione del termine δψ. Per farlo ricorriamo al
problema aggiunto, definito come tale per cui
(g, Af) = (f, A
T
g)
116
ove g ed f sono due generiche funzioni.
Dunque se Hψ = 0 `e l’equazione per il trasporto in forma omogenea,
allora H
T
ψ

= 0 `e l’equazione aggiunta, ove la sua soluzione sar`a il flusso
aggiunto.
A questo punto posso supporre di risolvere anche il problema aggiunto,
per il quale devo ancora imporre una sorgente, essendo infatti stato definito
fino ad ora in termini omogenei. Supporr`o dunque che la mia ψ

sia soluzione
del problema aggiunto H
T
ψ

= D. Potr`o cos`ı andarlo a sostituire ottenendo:
δr = δψD = δψH
T
ψ

che, sfruttando la definizione di operatore aggiunto, diventa:
δr = ψ

Hδψ
Ricordando quanto scritto in precedenza posso infine scrivere:
δr = −ψ

δHψ
0
· −ψ

0
δHψ
0
Da cui ineffetti posso trarre il valore cercato di δr senza passare per la
risoluzione di problemi perturbati ma soltanto utilizzando le soluzioni non
perturbate del problema diretto e del problema aggiunto.
Lo stesso pu`o essere applicato ad un generico problema agli autovalori
A x = k B x. In questo caso andr`o a risolvere il problema:
(A+δ
A
)(x +δ
x
) = (k +δ
k
)(B +δ
B
)(x +δ
x
)
Lo scopo della mia ricerca sarebbe quello di ottenere il valore per δ
k
senza
passare per (x + δ
x
), ovvero senza essere costretto a risolvere il problema
perturbato.
Se facciamo il prodotto di tutti i termini, tralasciando gli infinitesimi di
ordine superiore al primo, otterremo:
Ax +Aδ
x

A
x = kBx +kBδ
x
+kδ
B
x +δ
k
Bx
Ricordando che il problema originario recita A x = k B x, posso scrivere:

x

A
x = kBδ
x
+kδ
B
x +δ
k
Bx
Definisco ora ξ operatore aggiunto, definito in modo tale che, date
f e g due generiche funzioni, sar`a:
< g, ξf >=< ξ
T
g, f >
Vado dunque a risolvere il problema aggiunto:
A
T
x

= kB
T
x

117
ove k rimane tale in quanto risulta propriet`a degli operatori aggiunti quella
di mantenere gli autovalori degli operatori originari.
A questo punto moltiplichiamo tutta l’equazione scalarmente per la soluzione
del problema agginto x

, ottenendo cos`ı:
¸x

, Aδ
x
¸ +¸x

, δ
A
x¸ = k¸x

, Bδ
x
¸ +k¸x

, δ
B
x¸ +δ
k
¸x

.Bx¸
Sfruttando le propriet`a degli operatori aggiunti ottengo che il primo termine
a destra dell’uguale ed il primo a sinistra diventano:
¸x

, Aδ
x
¸ = ¸A
T
x

, δ
x
¸ e k¸x

, Bδ
x
¸ = k¸B
T
x

, δ
x
¸
Che sommati tra loro danno contributo nullo in quanto rappresentano l’e-
qauzione dell’operatore aggiunto:
¸A
T
x

−kx

B
T
x

, δ
x
¸ = 0
Ci siamo cos`ı liberati della perturbazione della soluzione δ
x
, e possiamo
scrivere che:
δ
k
=
¸x

, δ
A
x¸ −k¸ψ

, δ
B

¸x

, Bx¸
ove ancora una volta `e necessario utilizzare solo le perturbazioni note e le
soluzioni del problema di partenza e del suo aggiunto.
118

3.2 3.3

3.4

3.5 3.6

Il consumo del combustibile nucleare . . . . . . . . . . . . . . Differenze finite fini . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Diffusione monodimensionale monogruppo . . . . . . . 3.3.2 Problemi con sorgente . . . . . . . . . . . . . . . . . . 3.3.3 Non omogeneit` dello spazio . . . . . . . . . . . . . . a 3.3.4 Diffusione bidimensionale monogruppo . . . . . . . . . 3.3.5 Diffusione multigruppo . . . . . . . . . . . . . . . . . . 3.3.6 Accelerazione della convergenza delle iterazioni esterne Metodi Coarse Mesh . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Metodi Quabox . . . . . . . . . . . . . . . . . . . . . . 3.4.2 Metodi Cubbox . . . . . . . . . . . . . . . . . . . . . . Elementi di cinetica neutronica . . . . . . . . . . . . . . . . . Elementi di Trasporto neutronico . . . . . . . . . . . . . . . . 3.6.1 Formulazione integrale . . . . . . . . . . . . . . . . . .

60 61 61 65 66 69 72 85 88 89 92 93 101 102 106 106 108 112 116

A Aggiustamento di sezioni d’urto A.1 Introduzione alle basi di dati . . . . . . . . A.2 Elementi di statistica . . . . . . . . . . . . . A.3 Aggiornamento di dati differenziali a partire A.4 Teoria delle perturbazioni . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . da dati integrali . . . . . . . . . .

2

Capitolo 1

Generalit` sui metodi a numerici
1.1 Analisi degli errori

L’analisi numerica di un problema fisico porta necessariamente alla produzione di un certo numero di errori, dei quali ` necessario conoscere l’entit` e a al fine di ridurla al minimo Esistono varie tipologie di errore: Errori di idealizzazione : Derivano dalla decisione di trascurare determinati elementi del problema fisico di partenza per semplicit` a Errori di matematizzazione : Derivano dalla semplificazione delle equazioni allo scopo di ottenere un modello matematico pi` facile da trattare. u Questa perdita di informazioni ` di difficile recupero e Errori numerici : Risiedono intrinsecamente nella risoluzione numerica di un problema. Sono costituiti ad esempio dalla discretizzazione temporale e spaziale del problema Errori sui dati di input : Derivano come facilmente comprensibile da eventuali incertezze o imprecisioni sui dati di input Errori di calcolo numerico : Derivano da tutte le approssimazioni effettuate all’interno della risoluzione del problema numerico, come il troncamento di processi iterativi Errori di misura : Derivano dal fatto che nel momento in cui si vanno a confrontare i dati numerici con quelli sperimentali questi ultimi saranno inevitabilmente soggetti ad un errore di misura. In questa fase ` e opportuno ricordare che grande attenzione deve essere posta nell’utilizzo degli strumenti, in particolare evitando che essi vengano utilizzati al di fuori del loro range

3

Errori di arrotondamento : Derivano dal fatto che un calcolatore pu` o memorizzare solo un numero finito di cifre decimali. Viene qui approfondito il discorso legato agli errori di arrotondamento. L’insieme detto dei numeri di macchina ` di fatto un sottoinsieme e dell’insieme dei numeri reali. All’interno di un calcolatore i numeri sono immagazzinati in virgola mobile, ovvero sottoforma di un modulo e di una potenza in base 10 1 che diventa virgola mobile normalizzata ove il modulo della mantissa ` sempre 0.1 < |a| < 1. Definito t il numero di cifre e decimali della mantissa, si avr` ovviamente che le dimensioni dell’insieme a dei numeri di macchina aumentano con l’aumentare di t. Si ha banalmente che per t → ∞ =⇒ A → R, ovvero se t tende ad infinito non commetto errori di arrotondamento2 . Vediamo meglio come ` possibile definire l’errore di arrotondamento. e Si definisce l’operatore somma per il calcolatore, dato da x y = (x + y)(1 + ) con| | ≤ eps

Si ricordi per` che un calcolatore opera solo con numeri di macchina. Si o definisce dunque che se x non appartiene a tale insieme, esister` un suo ara rotondamento opportuno che lo porter` a diventare un numero di macchina a In generale avremo che eps ∼ 10−22 . Apparentemente ` una quantit` e a molto piccola, ma se le operazioni sono associate a fattori di amplificazione dell’errore derivanti dal cattivo condizionamento del problema pu` risultare o rilevante la propagazione di tale errore. Si supponga ora y =a+b+c con y = f l((a + b) + c) ˜

ove l’operazione “fl” indica operazione reale eseguita in virgola mobile. Chiamando η = f l(a + b) risultato in virgola mobile della somma tra parentesi, esso varr` a η = (a + b)(1 + 1 ) da cui y = f l(η + c) = ˜ = (η + c)(1 +
2)

= a+b 1 (1 + a+b+c
y) 2)

= (a + b + c)[1 + Si definisce ora
1 2

+

2]

y

tale per cui y = (a + b + c)(1 + ˜

ad esempio il numero 439 diventa 0.439 · 102 Per maggiore completezza ` necessario precisare che ` necessario che anche il numero e e di cifre per l’esponente di 10 deve tendere ad infinito affinch` l’insieme dei numeri di e macchina tenda a quello dei numeri reali

4

Si pu` ragionevolmente pensare di trascurare il termine contenente la o moltiplicazione di due infinitesimi, in modo da ottenere
y

=

a+b a+b+c

1

+

2

Si vede dunque che i due errori sono pesati con pesi diversi. In particolare, nel caso in esame, l’errore sulla seconda operazione pesa pi` di quello sulla u prima. Due algoritmi diversi accumuleranno errori di arrotondamento in modo diverso. Tuttavia questa considerazione perde di validit` ove il valore di t a tenda ad infinito. Questa condizione ` definita di computer ideale ovvero e algoritmo indipendente. In un computer reale invece, anche avendo in input solo numeri di macchina, sono in genere sufficienti pochi passaggi per rendere nuovamente necessaria una approssimazione, dando luogo ad errori di arrotondamento. La quantificazione di tali errori ` data da eps = 5 · 10−t , ove tale valore ` di e e fatto il massimo errore di arrotondamento che posso avere per ogni calcolo, ` ed ` detto sensibilita del computer. e Va ricordato che un problema numerico ` disgiunto dalla strategia che e viene utilizzata per risolverlo. In sostanza il problema numerico e l’algoritmo che verr` ad esso applicato per ricavare la soluzione sono slegati l’uno a dall’altro.

1.2

Condizionamento di un problema numerico

Elemento importante da studiare ` il condizionamento di un problema e numerico, che di fatto esprime la sua suscettibilit` ad oscillazioni ed errori a sui dati di input. Un problema mal condizionato non pu` essere risolto a o cuor leggero, in quanto non si pu` essere sicuri dell’affidabilit` dei risultati o a ottenuti. Questo problema risulta di particolare interesse nei problemi nucleari soprattutto per via di alcune grandezze sperimentali, come le sezioni d’urto e le lunghezze di diffusione, il cui valore ` facilmente soggetto ad e incertezze anche importanti. La maggior parte dei problemi di condizionamento ` legata alla sensie bilit` del computer. Essa ` definita in maniera tale per cui a + b = a se a e b < , ove ` proprio la sensibilit` del computer. e a Si prenda una generica funzione:   ϕ1 (x1 ....xn )   . . ϕ(x) =   . ϕn (x1 ....xn ) Si chiami ora x il valore approssimato, affetto da incertezza, tale che ∆x = ˜ x |x − x| e definisco xi = |x−˜| la perturbazione o incertezza relativa. ˜ x 5

Ovviamente nella realt` il valore di tale perturbazione relativa non ` noto, a e in quanto x stesso non ` noto. In generale tuttavia, quantomeno sui dati in e ingresso, si pu` effettivamente quantificare tanto x quanto x o ˜ Il risultato desiderato ` una quantificazione del condizionamento del e problema, vale a dire una relazione del tipo ∆y = f (∆x) Un esempio per procedere ` utilizzare uno sviluppo in serie di Taylor e troncato al prim’ordine.
n

∆yi = |˜i − yi | = ϕi (˜) − ϕi x = y x
j=1

(˜j − xj ) x

∂ϕi + [...] ∂xj

Il poter supporre che le entit` |x − x| siano piccole permette di approssimare a ˜ la serie al prim’ordine. Evidentemente questo non ` sempre vero: ove le e siano dell’ordine del 30% del valore nominale, questa approssimazione non ` pi` valida. e u Il vettore ∆y dato dalle singole componenti delle perturbazioni in uscita sar` dunque dato da: a  ∂ϕ1  ∂ϕ1   · · · ∂xn ∆x1 ∂x1  . .  .  .. .  .  ∆y =  . . . . .
∂ϕm ∂x1

···

∂ϕm ∂xn

∆xn

Che, in forma matriciale, diventa: ∆y = Dϕ(x) · ∆x Ove Dϕ(x) rappresenta la jacobiana della trasformazione calcolata in x. Si ricorda a questo proposito che la jacobiana, calcolata in un punto preciso, ` una matrice di numeri a tutti gli effetti, ed in questo caso costituisce il e fattore di amplificazione della perturbazione assoluta in ingresso e dipende solo dalla definizione del problema numerico, e non dall’algoritmo scelto per la risoluzione. In particolare l’elemento {ai,j } rappresenta il fattore di amplificazione con cui la componente i-esima del vettore in uscita viene influenzata dalla perturbazione della j-sima componente del vettore di input Dunque, come gi` detto in precedenza e qui dimostrato, il condizionaa mento di un problema ` algoritmo indipendente. e Effettuando discorsi analoghi sugli errori relativi si ottiene il fattore di amplificazione delle perturbazioni relative in ingresso:
n yi

=
i=1

xj (

∂ϕi xj ) ∂xj ϕi

Il condizionamento del problema tuttavia non ` uguale per tutti i valori e di input, ma potrebbe essere buono rispetto ad alcuni e meno rispetto ad 6

si ottiene: deltax ≤ A−1 A x 7 δb b . Se il problema ` lineare. ricordando la dicitura iniziale del problema (che rimane ovviamente valida anche in seguito alla perturbazione) diventa: Aδx = δb → δx = A−1 δb A−1 · δb b Passando al confronto tra norme si ottiene: δx = A−1 δb ≤ A−1 Ricordando che vale anche che: b = Ax ≤ A b δb Si ottiene che. dividendo ambo i membri della disequazione precedente per la norma di b.altri. l’operatore a e “norma” di una matrice deve rispettare determinate propriet` che ne permea ttono il confronto con vettori ed altre matrici. Poich` il fattore di amplificazione non ` un numero ma una matrice. y) = x − y. da cui avremo x−y = x x−y x − y x−y y Da questo si vede che se (x − y) tende a zero i fattori di amplificazione aumentano enormemente. esso ` scrivibile come e e Ax = b Lo studio del condizionamento di un problema lineare sar` esprimibile dalla a soluzione del problema A(x + δx) = (b + δb). Si noti u che. Un esempio classico di norma ` A = e a2 . e e utilizzando un tipo di norma piuttosto che un’altra si potranno evidenziare in modo pi` o meno marcato eventuali picchi di condizionamento. e i. il problema ` risolvibile (in questo caso. ove δb dipende dalla sensibilit` a dello strumento. ma una possibile alternativa ` anche A = max(|ai. con problema e linere e non omogeneo) solo se det(A) = 0 δx ≤ A x Infatti si avr` che: a Ax + Aδx = b + δb Che. Ovviamente indipendentemente dal valore della perturbazione. seppure la libert` di scelta della norma da utilizzare ` ampia. La matrice A invece ` una caratteristica del problema numerico e non e varia con il termine sorgente.j Si prenda un esempio di problema: ϕ(x.j |).

Il punto chiave del problema risiede ove un eventuale errore di calcolo porti ad ottnere comunque risultati plausibili. ad esempio. Prendiamo un esempio molto comune: ci si trova davanti ad un polinomio di grado n del quale si vogliono identificare gli zeri. come potrebbe essere ad esempio il voler testare come il punto di funzionamento di un sistema ` influenzato dal e variare dei parametri operativi 3 8 . il cui condizionamento raramente ` buono. l’errore di arrotondamento derivante dall’approssimazione del risultato del calcolo precedente. Questo ` un e problema spesso non lineare. e e tanto peggiore quanto pi` alto ` il grado n del polinomio. e dunque l’errore ad esso associato potrebbe essere. In tutti questi passaggi si noti che gli errori considerati non sono necessariamente quelli sui dati in ingresso. u e a Si tenga ben presente il fatto che finora non ` mai stato fatto alcun cenno e ad algoritmi o a metodi di risoluzione del problema. In generale infatti avremo che un generico zero µi di un polinomio ` mal condizionato se: e ∂Pn ∂µ →0 µi In generale ove ci troviamo di fronte ad un problema mal condizionato non ` possibile risolverlo cos` com’` tramite algoritmi. peggiore sar` il condizionamento del problema. matematizzazione. Il vettore x di input pu` essere o contenuto in una qualsiasi fase del problema. Questo insieme di considerazioni prende il nome di backward analysis ed ha la funzione di validare problemi ed algoritmi in funzione del condizionamento del problema.3 Si noti come tutti i discorsi fatti fino ad ora per gli errori possano essere applicati in maniera perfettamente analoga a delle perturbazioni “volontarie”. ove i due non hanno niente in comune se non la soluzione. Si rivela in questi casi e ı e necessario andare a variare ci` che ` stato fatto a monte. ed ` invece strettamente e e legato al problema fisico di partenza. Pi` tale fattore ` alto. Il condizionamento di un problema ` infatti algoritmo indipendente.) o a riconsiderare il problema dall’inizio. Spesso accade dunque che un problema del tipo Pn (x) = 0 venga trasformato in un problema Ax = λx. cercando ad esempio o e di ridurre gli errori iniziali (idealizzazione.Dalla quale si deriva facilmente quanto si voleva dimostrare Il valore A A−1 ` definito fattore di amplificazione. anche se non tutti u e gli zeri sono condizionati allo stesso modo. ecc. Tuttavia nessuna di queste opzioni fornisce garanzie sul risultato finale. il che rende difficile accorgersi della presenza di un errore dalla semplice analisi dei risultati. e dipende e da A.

. .. che vanno studiati localmente dal punto di vista del condizionamento.3 Stabilit` di un algoritmo a Si prenda ora un passaggio qualunque del processo risolutivo di un problema numerico. Si definisce inoltre una nuova funzione ψ (i) come la trasformazione residua.. x2 . Un esempio banale di questo concetto ` l’operazione x−y.. . ` importante a priori assicurarsi che esso sia e ben fatto. e Supposto che in una qualsiasi operazione {x1 . data dalla composizione di tutte le ϕ(j) con i ≤ j ≤ r.. Ne deriva che ψ (0) ≡ ϕ Sapendo che vale D(f ◦ g)x = D(f )x D(g)x 9 ..xn ) i=1:m Cosa ` invece l’algoritmo? Si avr` che e a ϕ(i) : D(i) → D(i+1) con i=0:r e D(j) ⊆ Rnj ϕ = ϕ(r) ϕ(r−1) · · · ϕ(1) ϕ(0) Dunque se il dato di ingresso ` x0 . xn } sia il vettore dei dati in ingresso ed {y1 . Tale problema e ` fortemente mal condizionato. si pu` definire o y = ϕ(x) il problema numerico. Ogni singola operazione di un algoritmo si presenter` come una a specie di micro-problema numerico. y2 .. si avr` che il dato in uscita sar` e a a ϕ(0) x0 = x1 −→ ϕ(1) x1 = x2 . soggetto ad a una incertezza legata agli arrotondamenti precedenti. evidentemente. Sar` dunque necesa sario anche lo studio del condizionamento di tale micro-problema. In questa visione dunque un algoritmo non ` e altro che una serie di micro-problemi numerici. Al di l` delle questioni che vedremo in seguito sul costo e la velocit` a a di convergenza di un algoritmo. dall’inglese robust. −→ ϕ(r) xr = xr+1 Per risolvere un problema numerico si possono applicare molti algoritmi diversi.. ym } sia il vettore di uscita. in cui in ingresso si ha il risultato di tutte le operazioni che stanno a monte che sar`. Si supponga di avere un algoritmo composto da r funzioni ϕ(i) ... ciascuna delle quali sia derivabile e continua nel suo dominio.. definito condizionamento locale. che sar` caratterizzato da: a ϕ : D → Rm D ⊆ Rn y ∈ Rm x ∈ Rn yi = ϕi (x1 . . Per verificare la stabilit` di un algoritmo si tengono in conto gli arrotona damenti in virgola mobile ed il condizionamento del problema che si vuole andare a risolvere.1.

il che porta a dire che il numero di cifre della mantissa ` e finito.  . ed in particolare si pu` dire che: e o Dϕ(x) = Dϕ(r) (x(r) )Dϕ(r−1) (x(r−1) ) · · · Dϕ(0) (x(0) ) Dψ (i) (x(i) ) = Dϕ(r) (x(r) )Dϕ(r−1) (x(r−1) ) · · · Dϕ(i) (x(i) ) Si ricorda che. u si potr` scrivere: a  (i)  ϕ1 (u)  (i)   ϕ2 (u)  (i)   ϕ = .` possibile definire le jacobiane di ϕ e ψ. si parla di un computer reale . . .   ϕn (u) Prendendo la j-esima di queste funzioni e analizzando il suo operare su u in virgola mobile si ottiene un risultato affetto dal seguente errore: f l(ϕj (u)) = (1 + (i) (i) j )(ϕj (u)) (i) con | j | ≤ eps Mettendo il tutto in una equazione pi` compatta si potr` dunque scrivere: u a f l(ϕ(i) (u)) = (I + E(i+1) )(ϕ(i) (u)) Con   E(i+1) =  0 10 (i+1) 1 0 . Si avr` dunque a che fare con grandezze approssimate del tipo: a x(i+1) = f l(ϕ(i) (˜(i) )) ˜ x Quello che ora ` necessario calcolare ` il valore di ∆xi ad un i-esimo passaggio e e di un algoritmo. ma conterr` anche il contributo del condizionamento di a ogni step dell’algoritmo considerato. nel momento in cui si parla di un algoritmo. che sar` dato dal valore approssimato ottenuto meno il a valore esatto: ∆x(i+1) = [f l(ϕ(i) x(i) ) − ϕ(i) x(i) ] ˜ Sommando e sottraendo la quantit` [ϕ(i) x(i) ] si ottiene: a ˜ ∆x(i+1) = [f l(ϕ(i) (˜(i) )) − ϕ(i) (˜(i) )] + [ϕ(i) (˜(i) ) − ϕ(i) (x(i) )] x x x Il secondo termine tra parentesi quadre rappresenta il condizionamento locale del problema ϕ(i) .. Per calcolare invece il contributo dato dal primo termine tra parentesi quadre si deve svolgere come segue. Essendo ϕ(i) una funzione a pi` variabili. (i+1) n    . e sar` dunque uguale a a [ϕ(i) (˜(i) ) − ϕ(i) (x(i) )] = Dϕ(i) (x(i) ) · ∆x(i) x Ne consegue che l’errore finale non sar` semplicemente la somma degli errori a di arrotondamento.

Si dir` in questo caso che l’algoritmo ` ben a e fatto o robusto. e Venendo infine al termine Er+1 y. nonch` agli errori di arrotondamento. Chiae mando αi l’errore di arrotondamento all’i-esima iterazione si avr` che: a • per i=0 ∆x(0) = ∆x • per i=1 ∆x(1) = Dϕ(0) (x(0) )∆x + α1 • per i=2 ∆x(2) = Dϕ(1) (x(1) )[Dϕ(0) (x)∆x + α1 ] + α2 Si vede dunque che gli errori non si sommano ma si propagano. ricordando che al posto di u ci e sar` x(i) . Dunque in e ˜ definitiva [f l(ϕ(i) x(i) − ϕ(i) (˜(i) )] Ei+1 ϕ(i) (x(i) ) ˜ x Il termine a destra dell’uguale ` chiamato anche αi+1 ed ` chiamato errore e e assoluto di arrotondamento che nasce dal calcolo in virgola mobile di ϕ In definitiva. l’arrotondamento sull’ultimo step dell’algoritmo. sommando i due fattori. andando cio` a confondere x(i) con x(i) . dato dal macrocondizionamento del a problema ed indipendente dall’algoritmo. si ottiene: ∆x(i+1) Ei+1 ϕ(i) (x(i) ) + Dϕ(i) (x(i) ) · ∆x(i) Quanto varr` in definitiva ∆y ? Sar` legato sia al microcondizionamento a a che al macrocondizionamento. In realt` si adotter` qui l’approssimazione di supporre l’errore di a ˜ a a arrotondamento piccolo. ` evidentemente e sempre presente ed il suo valore ` maggiorato da Er+1 y ≤ eps|y|. a meno che in ingresso non si abbiano solo numeri di macchina esister` anche un arrotondamento sui a dati in ingresso. che sar` considerato accettabile a a ove l’incertezza legata all’algoritmo ` confrontabile con quella generata a e priori dal problema numerico. pi` un termine dato dalle operu azioni interne dell’algoritmo costituito da una composizione degli errori e della jacobiana della funzione composta ψ. Questa seconda parte ` quella e legata dunque alla stabilit` dell’algoritmo. Dunque infine ricordando della propriet` della jacobiana di una composizione di a funzioni. varr` che: a r ∆y = Dϕ(x)∆x + i=0 Dψ (i) (x(i) )αi + Er+1 y Si avr` dunque un primo contributo. Si faccia attenzione tuttavia al fatto che il concetto di robustezza e stabilit` di un algoritmo ` indipendente da quello di convergenza a e del problema. che ` invece calcolata in termini ideali. Si definisce in definitiva errore inevitabile la quantit`: a ∆(0) y = eps(|Dϕ(x)||x| + |y|) 11 . Si avr` ine a oltre che qualunque sia il problema o l’algoritmo. si vede che esso rappresenta la coda dell’errore.Questa ` dunque l’espressione che interessa.

come si vedr` in seguito a proposito della teoria della a diffusione. Le ragioni di questa scelta saranno pi` evidenti quando ne verranno chiarite le implicazioni nel relativo capitolo u 4 12 . in genere. La scelta dell’algoritmo da utilizzare non ` dunque banale e richiede accue rate considerazioni di rapporto costi-benefici. Una strategia spesso attuata ` inoltre quella di utilizzare differenti algoritmi in cascata per la risoluzione e dello stesso problema.4 Criteri di convergenza e troncamento di processi iterativi Uno dei problemi principali in analisi numerica ` quello di stabilire un crie terio per determinare la convergenza di un problema iterativo. ove N ` il numero di iterazioni ed M ` il numero di e e operazioni per iterazione. Tale procedimento ` purtroppo effettuabile a priori solo nella risoluzione di problemi e lineari. u Il numero totale delle operazioni effettuate da un algoritmo ` infatti quane tificabile come NxM. definendo cos` la soluzione che. Per quanto riguarda invece i problemi non lineari questo non ` e sempre vero. Altra questione non da poco conto ` quella di stabilire un criterio per il e troncamento di un processo iterativo. ed ` per questo usato come termine di paragone. non ` possibile andare al di sotto di questo e errore. ove invece viene imposto un numero fissato di iterazioni. poich` la soluzione e potr` essere troppo o troppo poco precisa a seconda della velocit` di convera a genza dell’algoritmo utilizzato. Per questo ` opportuno stabilire dei criteri e di convergenza che diano informazioni su quale sia il momento migliore per il troncamento4 . In numerica ogni cosa si paga. Bisogna fare attenzione alle caratteristiche intrinsecamente diverse di differenti algoritmi. non ` possibile analizzare per intero. che potranno convergere pi` o meno velocemente gli uni u rispetto agli altri. 1. Posto infatti che l’algoritmo porti a convergenza. Riguardo la velocit` di convergenza ` opportuno fare un discorso ultea e riore. in generale. step e per step. ovvero presenter` u a u a all’interno di ogni iterazione calcoli pi` complessi od in numero maggiore. la stabilit` di un algoritmo che abbia qualche migliaio di passaggi. Risulta dunque in genere inopportuno arrestare un processo iterativo dopo un numero arbitrario di iterazioni. ci si chiede quale sia il momento per arrestare il calcolo. e di conseguenza un algoritmo che converge pi` velocemente sar`. pi` “costoso“. a Quel che si fa `. in generale.Comunque sia fatto l’algoritmo. Esistono poi casi particolari. verr` considerata ı a come definitiva. pur non essendo quella esatta. analizzare soltanto le situazioni considerate e potenzialmente critiche. e Si tenga conto che.

per come esso ` stato sinora e e definito. informazioni utili sulla qualit` della soluzione ottenuta. si tratta di una quantit` assolulta. e e spesso non ` possibile effettuare considerazioni sulla convergenza di e un algoritmo. concentrandosi invece sull’insieme dei valori. e Zona asintotica : qui vi sono pochi sconvolgimenti. Dale l’altro lato ` per` la velocit` di convergenza ` molto spesso stimabile e o a e a priori e dipende solo dalla matrice di iterazione dell’algoritmo. Il problema del residuo tuttavia ` che. ove invece xn ne ` la soluzione approssimata e all’n-esima iterazione. Esistono ovviamente numerose norme che possono essere applicate per questo criterio 13 . Per quel che riguarda i criteri sulla soluzione in s´. Importante ` segnalare che le zone dell’asse delle iterazioni non sono e tutte uguali. ma la convergenza ` e lenta e vi ` differenza molto limitata tra due soluzioni successive. Soffermandosi sulla zona asintotica si nota che un algoritmo molto lento potrebbe indurre a credere di trovarsi gi` prossimi alla convergenza.Esistono inoltre procedure di accelerazione di algoritmi lenti. che permettono di ridurre il numero di iterazioni senza incrementare eccessivamente il numero di operazioni per iterazione. L’entit` di tale residuo dar` dunque. quando a invece se ne ` ancora ben lontani e Una soluzione a tale problema ` quella di utilizzare il residuo. esistono in generale e due approcci: Norma : Non conoscendo la soluzione si utilizza uno pseudo-errore relativo: Φm+1 − Φm ≤ Φm+1 N Tramite questo metodo si perde il dettaglio sulla singola componente. che ` influenzata anche dal termine forzante. Tale zona non ` assestata. Tale criterio verr` in generale utilizzato in e a AND con altri criteri di convergenza. a Si prenda ad esempio un generico problema del tipo Ax = b. a a generalmente. avvengono sconvolgimenti notevoli. il che implica che la sua ina terpretazione non ` immediata. Ne viene che: A¯ − b = 0 x Axn − b = r = 0 Calcolare il valore di r pu` come detto aiutare a valutare il livello di o convergenza della soluzione. ovvero la e differenza dall’eguaglianza che si ottiene andando a sostituire la soluzione approssimata nell’equazione di partenza. ed in particolare ` possibile definirne due: e Zona delle prime iterazioni : qui si ha elevata differenza tra due soluzioni successive. Si definsice x soluzione esatta del problema.

La scelta verr` comunque a effettuata soprattutto in base a considerazioni fisiche. ad esempio. Nel caso invece di sistemi di sicurezza ove vi sono vari parametri sotto controllo.i ∀i Il problema ` ora chiaramente spostato sul valore dell’errore massimo da e imporre per il troncamento del processo iterativo. e pi` stringente e porter` in generale ad ottenere una soluzione pi` precisa u a u ma al costo di un numero maggiore di iterazioni. Nel caso. Si noti in ogni caso che ` possibile anche utilizzare pi` criteri di e u convergenza. ma per ciascuna viene valutata la convergenza: |Φm+1 − Φm | i i ≤ |Φm+1 | i P. perch` se in un contesto di modellizzazione di fenomeni osservati e sperimentalmente ` facile effettuare una verifica accorgendosi dell’ere rore5 . la causa pu` avere due nature distinte: o – Natura fisica: c’` un errore nella definizione del problema fisico e che rende la soluzione non consistente – Natura numerica: c’` un errore nell’algoritmo e • L’altro caso ` quello in cui l’algoritmo fornisce comunque una soluzione. Le uniche apparecchiature che permettono di effettuare tale op5 14 . e diversa tuttavia da quella esatta. dall’altro lato se sono in fase di progettazione non ` possibile e fare questo controllo diretto fino a che non ` realizzato un prototipo6 . sar` necessario applicare un criterio di a convergenza puntuale per evitare imprecisione elevata su parametri molto delicati. il metodo a e numerico che viene utilizzato per validare una determinata procedura sperimentale e non viceversa. del calcolo delle sezioni d’urto medie sull’intervallo energetico non ` richie esta la convergenza puntuale. in effetti. Altro aspetto del potenziamento dei metodi numerici ` che essi hanno talvole ta permesso di prevedere fenomeni che solo successivamente ` stato possibile osservare e sperimentalmente 6 Anche in questo caso comunque non sempre le condizioni sono agevoli.Puntuale : In questo caso non si mescolano tra loro le componenti. Questi sono in effetti i casi pi` periu colosi. Il criterio puntuale `. Quali sono le possibilit` che si hanno nel caso di fallimento di un algoa ritmo? • Nel caso in cui l’algoritmo diverga. ovvero non fornisca una soluzione. ad esempio. ma anche una volta che questi vengono realizzati non ` affatto facile effettuare misure di flusso neutronico per validare i calcoli numerici e tramite dati sperimentali. e Oggigiorno il grande sviluppo dei metodi numerici e la loro sempre maggiore affidabilit` stanno portando al verificarsi di condizioni opposte: talvolta `. anzi. ad esempio puntuale su alcune elementi del vettore soluzione e in norma sulla soluzione presa interamente. la cui scelta sar` ovviaa mente data dal rapporto costo/benefici. Le situazioni tipiche dei reattori nucleari sono infatti particolarmente negative: non soltanto i prototipi sono particolarmente dispendiosi.

ma la cui natura semplice e ben nota permette di agevolare la validazione dei modelli numerici. Dal punto di vista sperimentale spesso vengono realizzati dei sistemi di prova. poco corrispondenti alla versione industriale del progetto. sonde che viaggiano in canali dedicati e che permettono l’ottenimento di misure discrete. Sistemi di questo tipo sono detti benchmarks 15 .erazione sono i TIP (Travelling Incore Probes).

si ricorda che una matrice diagonale ` invertibile solo se tutti i suoi elementi sulla e diagonale sono diversi da 0. Supponiamo di operare con una matrice a diagonale dominante. Esso costituisce l’algoritmo base. Il metodo di Jacobi prevede di spezzare la matrice A di interazione del problema in due matrici: • Una matrice D. Si vedr` a nelle prossime righe come effettivamente questa condizione ` garanzia della e convergenza dell’algoritmo. data una matrice e invertibile. Al tempo stesso ` anche dimostrabile che. dunque potr` scrivere per questo probe o lema: Φ = D−1 EΦ + D−1 S Ricordiamo che la moltiplicazione di una matrice o vettore qualsiasi per una matrice diagonale mi fornisce come risultato il prodotto di ciascun elemento di ogni riga per l’elemento della diagonale corrispondente. di cui si vedranno in seguito le evoluzioni. tale che A = D . Viene in genere utilizzato solo nella fase turbolenta delle prime iterazioni per sgrossare la soluzione.Capitolo 2 Metodi numerici 2.1 2.1.E Dunque il problema diventa: DΦ = EΦ + S Il calcolo di D−1 ` molto semplice. diagonale e facilmente invertibile1 • Una matrice E. ` sempre possibile effettuare permutazioni di riga e di colonna che portino e all’ottenimento di una matrice avente solo elementi non nulli sulla diagonale 1 16 .1 Metodi di risoluzione di equazioni lineari con sorgente Metodo di Jacobi Il metodo di Jacobi ` un algoritmo iterativo che converge alla soluzione di e un problema lineare non omogeneo.

E’ stato dunque dato il via ad un processo iterativo.  . per come ` costruita. Si prenda l’equazione di iterazione e si sottragga ad entrambi i membri la soluzione esatta. la matrice del problema orginiario. alla soluzione esatta. Nel momento in cui si trasforma quanto detto in un processo iterativo opero un’assegnazione. la matrice B ` a diagonale nulla ed i suoi e e elementi diversi da zero sono sempre negativi ed inferiori ad 1 in modulo. che mi porta ad una scrittura di questo tipo: Φ(m+1) = BΦ(m) + q Dunque si utilizza ogni volta il flusso dell’iterazione m-esima per calcolare quello dell’iterazione successiva. Ne seguir` che: a  (1)  Φ =q   (2)  Φ = BΦ(1) + q  . Ne verr`: a Φ(m+1) − Φ = BΦ(m) + q − Φ Ma essendo Φ = BΦ + q.  . che nel nostro caso ` A e 17 . dopo un numero infinito o di iterazioni.Chiamer` ora: o • B = D−1 E matrice di iterazione2 • q = D−1 S Da cui risulter` a Φ = BΦ + q Si vede che. Si pu` dimostrare che tale metodo porterebbe. si avr` a Φ(m+1) − Φ = BΦ(m) + q − BΦ − q = B(Φ(m) − Φ) Lo scopo ` chiaramente quello che sia e Φ(m+1) − Φ < Φ(m) − Φ Partendo ora con Φ(0) = 0.  (n+1) Φ = BΦn + q 2 da non confondere con la matrice di interazione. La norma infinito ` infatti definita e come il valore massimo tra le somme degli elementi delle righe di una matrice (max( i |aij |). a essendo essi definiti come bij = − aij ∀ i = j ii Da tutto questo segue che B ∞ < 1.

di fatto. tanto pi` velocemente u quanto pi` il valore del raggio spettrale ` piccolo u e 3 Questo vale in realt` per ogni norma di matrice compatibile con una di vettore a 18 . La matrice B ` infatti strettamente dipendente da A. allora vale che B e • Se B ∞ ∞ <1 < 1 allora ρ(B) < 13 • Se ρ(B) < 1 allora il metodo di Jacobi converge. ci sar` poco da fare: sar` necessario trovare una soluzione a monte a a dell’impostazione del problema fisico.  (n+1) Φ = q + Bq + B 2 q + · · · + B n q Si vede dunque che il flusso neutronico all’n-esima iterazione dipende solo da B e da q.Per come sono definite. ho di fatto costruito il metodo delle potenze (vedi paragrafo 2.3. un upgrade del a metodo di Jacobi. per numero infinito di iterazioni.3 a pagina 33). per ora apparentemente di scarsa utilit`. a divenire parallelo all’ a ϕ0 autosoluzione fondamentale del problema Bϕ = µϕ Ove µ ` l’autovalore di modulo massimo e ϕ l’autovettore corrispondente. Andando infatti a prendere l’ultimo o termine di ogni iterazione e li mettiamo a vettore. verr` utilizzato a a quando si parler` del metodo SOR che costituisce.  . che mi permette di calcolare gli autovalori di una matrice. le iterazioni possono anche essere scritte come:  (1)  Φ =q   (2)  Φ = Bq + q  . che nella pratica converge solo se B < 1. Da qui si vede che si ha di fatto una specie di serie geometrica matriciale. Dunque l’ultimo termine dell’ultima iterazione tender`. Si pu` ora notare un altro dettaglio. Si dimostra ora un teorema di fondamentale importanza per questi problemi: Teorema 1 Condizione necessaria e sufficiente affinch´ il metodo di Jacobi e converga ` che ρ(B) < 1 e Da qui deriva il fatto della convergenza del problema se la sua matrice di interazione ` a diagonale dominante: si ha infatti una serie di consequenzialit` e a a cascata che ci dicono che: • Se la matrice A ` a diagonale dominante. mentre e ogni iterazione andr` ad affinare la soluzione aggiungendo ulteriori termini. e Questo discorso. a Attenzione per`: il fatto che B sia cos` importante non ` necessariamente o ı e una buona notizia. Dunque se B non e converge. e la quale ` legata a sua volta alla fisica del problema. Dunque la soluzione di partenza ` proprio il termine forzante.  .

· · · . Di fatto comunque. di due zone di materiali diversi separate da una barriera di un materiale assorbitore perfetto. compresi tra 1 ed n (dove n ` la dimensione della matrice) che va da i a j del tipo e i = m0 → m1 → m2 → · · · → mq = j tale che: am0 . Teorema 2 Se una matrice ` riducibile ` sempre possibile. am(q−1) . dette matrici irriducibili Definizione 1 Una matrice quadrata ` irriducibile se per ogni coppia di i. Ecco dunque perch` irriducibile: se un e problema fisico ` rappresentato da una matrice riducibile. ridotto) in pi` problemi di ordine inferiore. u Teoricamente sarebbe necessario dimostrare che per ogni coppia di elementi della discretizzazione esite un percorso fatto di linee verticali od orizzontali che collegano tali elementi passando solo attraverso elementi non nulli.Si vuole ora dimostrare il concetto fondamentale che sta alla base degli studi di convergenza del metodo di Jacobi: che la convergenza di tale metodo ` associata al raggio spettrale della matrice di iterazione e Per farlo ` necessario definire ed enunciare le propriet` di una categoria e a di matrici. a livello e e logico. La matrice legata a tale problema sar` dunque riducibile in quanto ci` che accade ai neutroni a o nella zona 1 non influenza in alcun modo ci` che invece avviene nella zona o 2. Il problema ` che dimostrarlo per tutte le coppie possibili non ` affatto e e facile.m1 sono tutti diversi da 0 Non ` facile dimostrare che una matrice ` irriducibile. esso pu` essere e o spacchettato (e dunque. ove si opera in modo da creare delle specie di “gabbie stagne” per i neutroni per determinate energie 4 19 . 4 . mentre molto pi` e e u facile ` dimostrare che una matrice non lo `.m1 . portarla ad una forma di tipo diagonale a blocchi: ˆ A1 ˆ 0 ˆ ˆ A2 0 Viene ora mostrata una prima applicazione della propriet` di irriducibilit` a a di una matrice: Un esempio pratico di sistemi caratterizzati da matrici di riducibili sono i cosiddetti rubbiatroni.j e distinti esiste almeno una successione finita di interi. l’irriducibilit` di una matrice indica il fatto che tutti i nodi sono a in qualche modo collegati tra loro. Quale potrebbe essere un problema riducibile? Si tratta ad esempio del caso. sempre in ambito nucleare. am1 . permutando e e opportunamente righe e colonne.m2 .

il valore di (m) tender` a 0. ove e gli elementi di tale diagonale risultano essere gli autovalori del problema associato alla matrice stessa mentre i versori degli assi della n-upla ortogonale saranno gli autovettori. che formeranno un sistema completo ortonormale (vedi teorema 4 a pagina 32). esiste una n-upla di assi ortogonali rispetto e ai quali essa assume forma diagonale. Poich` se la matrice ` reale e simmetrica e e gli autovettori del problema agli autovalori Bϕ = λϕ formano una base ortonormale (vedi capitolo 2. mentre gli altri basta che soddisfino l’uguaglianza Dunque la convergenza di un problema avente come matrice di interazione una matrice irriducibile ` assicurata anche se non ` a diagonale dominante e e Si procede ora alla dimostrazione vera e propria della convergenza del metodo di Jacobi Noto che: (m) = Φ − Φ(m) → (m+1) =B (m) = · · · = Bm (1) Se B ` una matrice simmetrica. allora qualunque autovalore λ ha modulo inferiore ad 1. per m → ∞. allora affinch` valga che B ∞ < e e 1 ` sufficiente che la dominanza stretta della diagonale della matrice A e sia valida per uno dei suoi elementi. Si prenda ora il vettore (1) . a 5 tali autovalori saranno ripetuti ove essi abbiano molteplicit` > 1 a 20 . Ne deriva evidentemente che.4 a pagina 38) sar` sempre possibile scrivere il a vettore errore assoluto come combinazione lineare di tali autovettori: n (1) = h=1 ch ϕh (1) Dunque n (m+1) = B = m h=1 ch ϕh = ch B m ϕh = (1) (1) n h=1 n = h=1 ch λm ϕh (1) ove la j-esima componente di sar` dunque a n (m+1) j = h=1 ch λm ϕh.j h (1) Ma se ρ(B) < 1. Essa ` dunque diagonalizzabile5 .Teorema 3 Se una matrice A ` irriducibile.

come fatto in precedenza ma esplicitando il termine relativo Cosa accade se la matrice di partenza A ´ reale e simmetrica? Questo implica che e gli autovalori del problema Aϕ = λϕ sono a coppie in modulo uguale e segno opposto.e dunque la soluzione tender` alla soluzione esatta.j 1 (1) Che ovvimante tende a 0 per m che tende ad infinito se e solo |λ1 | < 1 6 . Al posto della equazione appena scritta avremo che il calcolo dell’errore sar` effettuato sulla norma. In questo caso il valore dell’errore all’m-esima iterazione sar` dato da: a n (m+1) j 7 = h=2 ch λm ϕh. e potremo scrivere che: a (m+1) 6 ∼ Cρ(B)m Si noti che questo discorso ` stato effettuato per dei termini forzanti specifici. ovvero e tali per cui l’errore risulti parallelo ad un autovettore. Basti pensare al caso in a cui. Tuttavia o nel mondo reale bisogna ricordarsi che non solo che il calcolatore commette errori di arrotondamento e non conosce la quantit` “0”.j h (1) Ma dunque l’unico autovalore maggiore di 1 non interverr` nella sommatoria e di cona seguenza avr` convergenza pur essendo la condizione di ρ(B) < 1 non rispettata. Si supponga ora che λ1 sia l’autovalore di modulo massimo. necessaria. Esisteranno dunque dei u valori di q per cui tale condizione non sar`. Questo per potersi porre nel caso pi` sfortunato. per la convergenza. accertiamoci ora che il raggio spettrale della matrice di iterazione mi d` anche a una quantificazione della velocit` di convergenza del metodo (nella zona a asintotica). e di conseguenza definire una regola generale. invece. in generale. Si prenda un termine forzante q tale per cui l’errore e alla prima iterazione sia tale che (1) ϕ1 Ma se effettivamente questo ` vero. che dipende infatti dall’autovalore a corrispondente (pi` il modulo ` elevato. e di conseguenza il concetto di ortogonalit` a a ` mantenuto solo per poche iterazioni e 21 . u e u e Dimostrato che la condizione di ρ(B) < 1 ` necessaria. Si pu` fare questo ragionamento per ogni ϕi il che porta a poter dire che o tale condizione ` necessaria. di dimostra ora e che essa ` sufficiente. Avremo cos` dunque che. per assurdo. pi` lenta ` la convergenza). dovr` considerare sempre due autovalori ı o invece di uno. allora si pu` scrivere: e o (m+1) j = c1 λm ϕ1. λ1 > 1 ma (1) ⊥ ϕ1 . Attenzione che dalla a stessa equazione si evince anche che non tutti gli elementi del vettore degli errori andranno a 0 con la stessa velocit`. Si pu` a o dunque scrivere.7 e Dopo aver dimostrato che la condizione di ρ(B) < 1 `. Questo implicher` dunque che |λ1 | = ρ(B) e che |λj | < ρ(B) ∀j = 1. e necessaria e sufficiente per la convergenza del metodo di Jacobi.

e ı Si vuole ora per` analizzarne i punti deboli. ad una iterazione m0 . che : n (m+1) j = (1) λm [c1 ϕ1. Si noti che questa non costituisce un calcolo della velocit` di convergenza ma solo una a sua stima. Arrivati al calcolo di Φi si avr` a disposizione gi` una a a serie di informazioni “di qualit`”. in e fisica della diffusione.j 1 (1) a In quanto il termine λh tende a 0.j ] λ1 Si vede chiaramente che. anche le informazioni nuove. maggiore sar` la resistenza al contributo corrispondente a calare a con le iterazioni. ` definito dalla e fisica del problema (oltre che dalla scelta dell’algoritmo). Maggiore sar` il valore dell’h-esimo λ1 autovalore. Il punto di novit` del a metodo di Gauss-Seidel ` proprio quello di utilizzare. sar` a m+1 j m λm c1 ϕ1. i due autovalori di modulo maggiore sono molto vicini tra loro. in modo tale da poter capire o ove si possa lavorare per cercare di migliorarlo. per m → ∞. vale a dire tutti i flussi della m+1-esima a (m+1) iterazione fino al Φi−1 .j 1 + h=2 ch ( (1) λh m ) ϕh. utile per confrontare tra loro differenti algoritmi 8 22 . per il calcolo del flusso e aggiornato. 76 − ln ρ(B) Il metodo di Jacobi ` dunque cos` esplicitato: molto semplice e lineare.all’autovalore di modulo massimo. Tanto pi` tale rapporto di dominanza u |λ1 | ` elevato tanto pi` ` necessario aspettare affinch` l’errore alla m-esima ite ue e erazione sia parallelelizzato al contributo dell’autovalore fondamentale. ` Si definisce velocita di convergenza asintotica il valore8 : R∞ = − ln ρ(B) Si suppunga a questo punto di trovarsi in zona asintotica. Il metodo di Jacobi ` dunque detto “delle iterazioni successive” poich` e e per ogni iterazione uso solo informazioni “vecchie”. Anche il rapporto di dominanza. Il suo handicap fondamentale ` legato alla sua scarsa ottimizzazione e nell’utilizzo delle informazioni disponibili. A questo proposito si definisce rapporto di dominanza il modulo del rapporto tra il secondo autovalore di modulo maggiore e l’autovalore di modulo massimo ( |λ2 | ). Si prenda infatti una generica m(m+1) esima iterazione. come il raggio spettrale.01 da cui si otterr` che dovr` essere: a a m> 4. Il punto ` che. Com’` possibile capire quante altre iterazioni bisogna fare per ridurre e l’errore di un fattore 100? Questo sar` come dire che a ρ(B)m < 0.

supponendo che i nodi adiacenti nelle direzioni N S W E siano rispettivamente 15. B = T + T∗ =   . e con poco sforzo e grande risultato? In un generico nodo (prendiamo ad esempio l’11◦ . Φ12 . 7. Si pu` dunque a o sostituire a tali valori il valore del flusso m+1-esimo La matrice B del metodo di Jacobi ` del tipo: e   0 T∗   . Φ15 ) (m) (m) (m) (m) Tuttavia. ovvero che per il calcolo della i-esima componente sono gi` state calcolate le i-1 componenti a precedenti.. Φ10 . a ovvero 15 10 11 12 14 Φ11 = f (Φ7 . il processo iterativo relativo al metodo di Gauss-Seidel diverr`. T 0 Ove le matrici T e T ∗ sono evidentemente rispettivamente triangolare inferiore e superiore. Φ12 .1. Φ15 ) Trasportato nella riga corrispondente all’interno delle iterazioni del metodo di Jacobi avremo: Φ11 (m+1) = f (Φ7 . Φ10 . poich` all’interno di ogni iterazione i flussi sono calcolati in modo e ordinato dal primo all’ultimo. 12) sar` funzione del flusso nei 4 nodi adiacenti.2. della forma: (I − T )Φ(m+1) = T ∗ Φ(m) + q Da cui Φ(m+1) = (I − T )−1 T ∗ Φ(m) + (I − T )−1 q 23 . al momento di calcolare il flusso in 11 avremo gi` noti i valori all’m+1-esima iterazione del flusso in 7 e 10. Con il sistema originario dato da: Φ = BΦ + q Che pu` essere riscritto come: o Φ = (T + T ∗ )Φ + q Sfruttando quanto detto riguardo il metodo di Gauss Seidel. a a seguito del processo di assegnazione. 10.2 Metodo di Gauss-Seidel Come ` dunque possibile effettuare un upgrading del metodo di Jacobi.

In questo caso ` possibile che il processo iterativo interno sia tale da e richiedere un’unica iterazione per ogni iterazione esterna9 . sempre per la stessa ragione: nelle a fasi iniziali di applicazione di un algoritmo la convergenza non ` garantita e ed ` necessario evitare di introdurre asimmetrie nella risoluzione. In un caso particolarmente felice ove il valore di ρ(B) fosse particolarmente ridotto. ci si potrebbe addirittura ritrovare nella condizione di convergenza talmente veloce da rendere inutile se non dannosa l’applicazione del metodo di Gauss-Seidel. asintoticamente. pi` efficace. Esistono per` altre condzioni in cui si utilizza Jacobi piuttosto che Gausso Seidel. 2. L’applie cazione del metodo di Gauss-Seidel in questo frangente potrebbe portare all’ottenimento di soluzioni non fisiche. In questo caso si andr` ovviamente ad applicare Jacobi. e sono quelle in cui vi sono due catene di iterazioni una dentro l’altra. ma non in quella delle prime iterazioni ove si andr` invece in a generale ad utilizzare il metodo di Jacobi.3 Metodo di Jacobi vs Metodo di Gauss Dunque il metodo di Gauss-Seidel converge pi` velocemente di quello di u Jacobi.Risulter` dunque. e Si vedano ora le equazioni per componenti: per il metodo di Jacobi si aveva: n aij (m) (m+1) Φi =− Φ + qi aii j j=1 Con Gauss-Seidel bisogna invece spezzare le sommatorie.1. poich` una sar` e a riferita al “nuovo” ed un’altra al “vecchio”: i−1 Φi (m+1) =− j=1 aij (m+1) Φ − aii j n j=i+1 aij (m) Φ + qi aii j Il metodo di Gauss-Seidel risulta dunque. Questo ` un difetto che risulta pienamente accettabile nella e zona asintotica. La domanda che sorge legittima ` la seguente: e perch` si parla ancora di metodo di Jacobi? Un motivo esiste: il metodo di e Gauss-Seidel introduce una asimmetria nel sistema. u Si dimostra infatti che la sua velocit` di convergenza ` pari a ρ(B)2 a e Si noti che l’utilizzo del metodo di Gauss-Seidel non incrementa lo sforzo computazionale: il numero di operazioni per iterazione ` lo stesso del metodo e di Jacobi. 9 Si tratta come vedermo del caso della teoria della diffusione 24 . in quanto il flusso in ogni nodo verr` calcolato utilizzando informazioni di qualit` diversa a seconda a a della direzione. e lo fa a costo zero. sottraendo membro a membro l’espressione iterativa e a l’espressione esatta: (m+1) = (I − T )−1 T ∗ (m) Ove (I − T )−1 T ∗ ` la matrice di iterazione del metodo di Gauss-Seidel.

dotato di velocit` a di convergenza superiori. ω ` detto parametro di forzamento e Espandendo quanto scritto si ottiene: Φ(m+1) = ωT Φ(m+1) + [(1 − ω)I + ωT ∗ ]Φ(m) + ωq Da cui. facciamolo. e si basa sul forzare e l’upgrade della soluzione da un passaggio all’altro. o 25 .Altra situazione caratteristica ` quella dell’applicazione dei due metodi e a scacchiera.1. In questo modo. ovvero un processo di creazione di informazioni sulla base di altre di cui si ` gi` in possesso. ` adatto ad un uso nelle fasi finali di affinamento e della soluzione. Questo metodo di fatto ` migliore di quello di Jacobi anche alle prime e iterazioni. in forma esplicita: matrice di iterazione Φ(m+1) = (I − ωT )−1 [(1 − ω)I + ωT ∗ ] Φ(m) + (I − ωT )−1 ωq Si pu` dimostrare che il valore ottimale per ω ` dato da: o e ωopt = 2 1+ 1 − ρ(B)2 E visto che si pu` fare. Questo e a passaggio. l’upgrade della soluzione tramite metodo SOR diventa: [Φ(m+1) − Φ(m) ]SOR = ω[Φ(m+1) − Φ(m) ]GS Ove ovviamente il caso di ω = 1 porta al riottenimento al metodo di GaussSeidel. include un costo.4 Metodo SOR Il metodo SOR lavora tramite estrapolazione. calcolando il flusso tramite Jacobi solo sui nodi “neri” ci si ritrova che tutti i nodi “bianchi” sono circondati solo da informazioni nuove che possono cos` essere utilizzate per calcolarvi il flusı so. Ne segue che tale metodo. Si vede inoltre che la velocit` di convergenza del metodo “a scaca chiera” nella zona asintotica ` esattamente la stessa di quella del metodo di e Gauss-Seidel standard. a differenza di quello che portava dal metodo di Jacobi a quello di Gauss-Seidel. dopo aver sgrossato il problema tramite l’uso dei metodi visti in precedenza. Riscrivendo infatti l’evoluzione dell’errore relativo tramite metodo di Gauss-Seidel: [Φ(m+1) − Φ(m) ]GS = T Φ(m+1) + T ∗ Φ(m) + q − Φ(m) Partendo da questo presupposto. Il metodo SOR ` anche detto di sovrarilassamento. 2.

j Φi.j + Ni. il passaggio successivo sar` evidentemente quello di minimizzare tale valore.j Φi+1. Una volta fatto questo.j Φi−1.j ψi−1.j+1 + Ei.j + Ni.j + Si.j + Si.j+1 + Ei.j ω Viene ora sfruttata l’arbitrariet` degli autovettori per scrivere un legame a tra ψ e Φ.j−1 = λΦi.j ψi.j + γSi.j Φi. Il problema a sar` del tipo a Jω ψ = γψ ove ci` che ci si prefigge di calcolare ` il γ di modulo massimo. al fine di ottenere una espressione simile a quella scritta per il metodo di Jacobi e poter dunque confrontare i due algoritmi. che come sappiamo a rappresenta la velocit` con cui l’algoritmo tende a convergenza.j ψi+1.j−1 = ω−1+γ Φi. ove con i simboli dei punti cardinali si indicheranno gli elementi delle matrici posizionati adiacenti all’elemento di interesse.j ψi.j Φi+1. Infatti vale o Jω ψ = γψ (I − ωT ) −1 [(1 − ω)I + ωT ∗ ]ψ = γψ [(1 − ω)I + ωT ∗ ]ψ = (I − ωT )γψ ψ − ωψ + ωT ∗ ψ = γψ − ωT ψ γ−1+ω (γT + T ∗ )ψ = ψ ω Si pu` ora riscriverla componente per componente. tramite il doppio o indice.j Φi. Dunque γWi.j Φi.j−1 + Ei.j Φi−1.j ω γ Confrontando i due ottengo: λ= Risolvendo per γ.j √ per SOR Wi.j + Ni.L’obbiettivo ` trovare un’espressione per il raggio spettrale della matrice e di iterazione del metodo SOR. Richiamando o e la definizione della matrice di iterazione: Jω = (I − ωT )−1 [(1 − ω)I + ωT ∗ ] Se ne pu` ricavare una ulteriore equazione agli autovalori. Si user` in a i+j particolare che ψij = Φij γ − 2 per Jacobi Wi.j+1 = ω−1+γ ψi. diventa √ λω γ = ω − 1 + γ λ2 ω 2 γ = ω 2 + 1 + γ 2 + 2ωγ − 2ω − 2γ γ 2 − (2 + λ2 ω 2 − 2ω) + (ω − 1)2 = 0 26 ω−1+γ √ ω γ .

Essendo inoltre che. estremamente veloci. ed e i fenomeni termo-fluidodinamici. il che porta ad ottenere per γ due radici complesse coniugate. ` cos` definito e ı l’intervallo di variazione di ω Si studino ora i tre casi separatamente. ed il rischio ` che le “qualit`” dei risultati non risultino coerenti. Un e a esempio tipico ` l’accoppiamento di fenomeni elettro-magnetici. A volte infatti gli algoritmi vengono rallentati e invece che accelerati. essendo per ipotesi ω > ω0 . pi` lenti u 27 . che ci permette di ottenere: 1 γ1 = (1 − ω + λ2 ω 2 ) + λω 2 1−ω+ λ2 ω 2 4 2 λ2 ω0 2 2 √ 1 + 1 − λ2 Si vede che questo genera un andamento il cui minimo risulta essere situato proprio in ω = ω0 10 Attenzione.da cui si avranno due soluzioni: γ1. delle quali quella di modulo maggiore sar` legata al discriminante preso come a positivo. dar` luogo ad un valore di γ maggiore a che nel caso precedente • Per 1 < ω < ω0 si ottengono due soluzioni reali distinte. sostituendo il valore di ω0 . questo non ` sempre vero.2 = (1 − ω − = (1 − ω − = (1 − ω − λ2 ω 2 2 ) λ2 ω 2 2 ) λ2 ω 2 2 ) ± ± (1 − ω − λ4 ω 4 4 λ2 ω 2 2 2 ) − (1 − ω)2 = + λ2 ω 2 − ωλ2 ω 2 = +1−ω ± λω λ2 ω 2 4 Ponendosi nel caso tipico di matrice simmetrica gli autovalori di B saranno tutti reali. diviene γ = ω0 − 1 • Per ω0 < ω < 2 si ha ∆ < 0. avendo chiamato ω0 il valore di ω che annulla il discriminante dell’equazione: ω0 = si ottengono 3 casi possibili: • Per ω = ω0 avremo che: γ = 1 − ω0 + che. per ipotesi. λ2 < 1 (altrimenti la convergenza del metodo di Jacobi non ` assicurata) e ω > 1 (altrimenti il metodo e SOR rallenterebbe la convergenza invece di accelerarla10 ). Attraverso gli opportuni passaggi si ottiene che |γ1 | = |γ2 | = ω − 1 che. in particolare in quei casi ove ho fenomeni che si svolgono su scale temporali distinte.

Si vede che in base al problema da risolvere11 varier` la velocit` di cona a vergenza del metodo di Jacobi. Esiste tuttavia un altro elemento. il cui valore ` fondamentale per la corretta applicazione del metodo SOR e 11 e dunque in base alla matrice A → la matrice B → ρ(B) 28 . nell’applicare Jacobi. il che permette di calcolare un valore approssimato di ρ(B) che si potr` dunque a utilizzare per il calcolo di ωopt .Dunque ` stato dimostrato come il valore ottimale per ω sia dato da: e ωopt = ω0 = 2 √ 1 + 1 − λ2 Ecco dunque identificato il costo aggiuntivo del metodo SOR: se fino ad ora si era parlato del raggio spettrale della matrice B come qualcosa che identificava la velocit` di convergenza dell’algoritmo.1. Questa riflessione dice dunque che al fine di determinare il momento per lo shift da metodo di Jacobi e metodo SOR non ci si concentrer` soltanto sulla convergenza del metodo di Jacobi in s`. Sorger` dunque la questione su quando a abbandonare il primo metodo per passare al secondo. Pi` tale velocit` ` elevata. ovvero che gli ultimi elementi di ogni iterazione successiva costituiscono di fatto l’applicazione del metodo delle potenze sulla matrice B che porta al calcolo degli autovalori della stessa. 2. ma non verr` fatto in questa sede. per lo sgrossamento della soluzione. ecco che qui ` invece necessario conoscerne il valore a e al fine di applicare il metodo SOR in maniera ottimale assicurandosi cos` la ı migliore velocit` di convergenza possibile. senza per` mai aver manifestato a o la necessit` di calcolarlo. minore sar` il u a e a numero di iterazioni necessario per il passaggio al metodo SOR. ma a e anche su quella del metodo delle potenze per il calcolo di ρ(B). a Bisogna in questa fase ricordare le ipotesi fatte per ottenere questo risultato: • Griglia strutturata • Matrice simmetrica Si pu` dimostrare. a ed in particolare quella che garantisce i risultati migliori ` la numerazione e naturale. che il valore della o a velocit` di convergenza del metodo SOR dipende dalla numerazione scelta. Ricordiamo infatti quanto detto in modo molto innocente all’inizio della descrizione del metodo di Jacobi. Appare ora evidente che dunque. si opera involontariamente il calcolo iterativo di B n q. per poi passare al metodo SOR per l’affinamento finale.5 Shift tra metodo di Jacobi e metodo SOR Ci si pone nella condizione tipica in cui si utilizza il metodo di Jacobi nella fase iniziale.

Per quanto riguarda invece il metodo di Gauss-Seidel avremo che. j ad una Φl . della scelta di una numerazione per i nodi di flusso in modo da passare da una forma del tipo Φi.6 Ordinamento dei nodi di flusso Si accenner` nelle pagine successive alla necessit`. per ρ(B) = 0.5. nel senso che portano alla stessa identica velocit` a a convergenza.28 con numerazione ciclica 29 . sar`: a • JGS = 0. una volta che si passa ad a a una logica multidimensionale. che mi permette l’utilizzo standard di vettori e matrici.1.25 con numerazione naturale (come da considerazioni precedenti pari a ρ(B)2 ) • JGS = 0. A questo proposito sono mostrate di seguito le tre tipologie pi` utilizu zate. a ciascuna delle quali ` associata la corrispondente forma della matrice e risultante: Numerazione naturale  3 4 1 2 →  0 X X 0  X 0 0 X     X 0 0 X  0 X X 0 Numerazione a scacchiera 4 2 1 3  0 0 X X  0 0 X X     X X 0 0  X X 0 0  → Numerazione ciclica 4 3 1 2  0 X 0 X  X 0 X 0     0 X 0 X  X 0 X 0  → Tutte e tre le matrici avranno gli stessi autovalori (0 con molteplicit` 2 a e ±2X con molteplicit` 1.25 con numerazione a scacchiera (come da considerazioni precedenti pari a ρ(B)2 ) • JGS = 0. Per l’applicazione del metodo di Jacobi le tre a strategie sono equivalenti.2.

   (i) ∂f (i) fn (x(i) ) + h1 ( ∂fn )x=x(i) + · · · + hn ( ∂xn )x=x(i) 0 ∂x1 n 30 . Questo procedimento comporta ovviamente una complicazione della risoluzione. xn ) La prima cosa che viene in mente di fronte ad un sistema non lineare ` e quella di linearizzarlo tramite uno sviluppo in serie di Taylor troncato al prim’ordine. trascurando i termini di grado superiore al primo.   f1 (x1 . xn )    f2 (x1 . Vale infatti che. Si chiami ξ la soluzione esatta e x(i) la soluzione approssimata alla iesima iterazione. · · · .2. in analisi numerica. che aumenta con l’aumentare del numero delle equazioni.  .1 Metodo di Newton per la risoluzione di sistemi non lineari Si supponga di avere un generico sistema di equazioni non lineare. x2 . a Essendo dunque x(i) una approssimazione di ξ. x2 . · · · . 2. L’idea ` dunque quella di. xn ) f (x) = =0 .    (i) (i) ∂f fn (x(i) ) + (ξ1 − x1 )( ∂fn )x=x(i) + · · · + (ξn − xn )( ∂xn )x=x(i) 0 ∂x1 n Se in questo sistema operiamo una assegnazione potremo innescare un procedimento iterativo. In particolare otterremo questo scrivendo:  (i) ∂f (i) ∂f1  f1 (x(i) ) + h1 ( ∂x1 )x=x(i) + · · · + hn ( ∂xn )x=x(i) 0  1    f2 (x(i) ) + h(i) ( ∂f2 ) (i) + · · · + h(i) ( ∂f2 ) (i) 0 n ∂xn x=x 1 ∂x1 x=x  .2. Si avr` ovviamente che f (ξ) = 0 ed invece f (x(i) ) = 0 . sar` lecito supporre che i a due vettori siano molto “vicini” tra loro. di modo da poter calcolare tramite linearizzazione in serie di Taylor la funzione nell’intorno di x(i) . andare a risolvere una f (x) = 0. · · · . .   fn (x1 .2 Risoluzione di sistemi di equazioni non lineari I processi non lineari vengono trattati.  . x2 . tramite una linearizzazione iterativa. con f (x) ovviamente parente stretta di f (x).  . . partendo da una f (x) = e ˆ ˆ 0 con f (x) non lineare. si ottiene un sistema del tipo:  (i) ∂f (i) ∂f1  f1 (x(i) ) + (ξ1 − x1 )( ∂x1 )x=x(i) + · · · + (ξn − xn )( ∂xn )x=x(i) 0  1   (i)  f2 (x(i) ) + (ξ1 − x(i) )( ∂f2 ) (i) + · · · + (ξn − xn )( ∂f2 ) (i) 0 1 ∂x1 x=x ∂xn x=x  .  .

Se questo e ` troppo grande. questo metodo di risoluzione converge con estrema difficolt`. Se le sue dimensioni sono ridotte o sar` possibile scriverlo in forma analitica (di fatto manualmente). Per questo una possibilit` u a ` quella di non aggiornarlo ad ogni iterazione.3 2.Di questo sistema l’unica incognita ` proprio h(i) .1 Metodi per problemi agli autovalori Scomposizione QR di una matrice Si definisce trasformazione di similitudine una qualsiasi trasformazione del tipo: B = SAS −1 Caratteristiche peculiari di questa trasformazione sono che: • La matrice A e la matrice B hanno gli stessi autovalori 31 . ove si ` definito hj e e (i+1) (i) (xj − xj ) Definendo il passaggio da x(i+1) = x(i) + h(i) ` possibile innescare e (i) = una iterazione all’altra in modo che un processo iterativo. Come sempre la scelta risulter` dal compromesso giudicato migliore.k = ∂xk ek hjk Importante ` la valutazione dell’intervallo di discretizzazione. mentre ove questo sia e troppo piccolo si corre il rischio di cancellazione numerica. Calcolo di h tramite soluzione del sistema 4. si perde ovviamente in precisione. in caso contrario si privilegiano invece metodi iterativi. Calcolo dello Jacobiano nel punto x(i) 2. La risoluzione del problema e avente lo Jacobiano come matrice di iterazione dipende dallo Jacobiano stesso: se si tratta di una matrice si usano metodi diretti. a 2. Aggiornamento di x(i+1) Un problema di tale procedimento ` che. Calcolo delle f (x(i) ) 3. i cui passaggi saranno: 1. a Di fatto la scrittura dello Jacobiano e la risoluzione del problema associato sono le fasi pi` critiche del processo iterativo. Tuttavia. J pu` diventare molto grande. qualunque sia il metodo scelto ed il caso specifico. ove il numero delle incognite sia e elevato.3. mentre a ove le dimensioni aumentino si passer` in genere ad una scrittura in forma a numerica: ( fj (x(i) + ek hjk ) − fj (x(i) ) ∂fj (i) )x=x(i) = Bj.

una matrice con tutti gli elementi della prima colonna nulli fatta eccezione per la prima riga. · · · . moltiplicate per un vettore. 0.• Dato x autovalore di A. ` enunciata a e dal seguente teorema: Teorema 6 Dato un generico vettore non nullo x. ne annullano tutte le componenti tranne la prima. esiste una matrice ortogonale V2 tale che H = V2 AV2T ove H ` una matrice di Hessenberg. Moltiplicando poi per una analoga U2 . si possono annullare 32 . nella maniera seguente: √ U = I − 2uuT con uT u = 1 Si dimostra facilmente che tale matrice presenta le seguenti propriet`: a • ` simmetrica (U T = U ) e • ` ortogonale (U T = U −1 ) e • ` involutoria (U 2 = 1) e Ulteriore propriet` di tale matrice. in uscita. esiste una matrice ortogonale V1 tale che D = V1 AV1T ove D ` una matrice diagonale e Teorema 5 Data una matrice A reale. che utilizzeremo in seguito. y= Sx ` autovettore della nuova matrice B e L’utilit` di tali trasformazioni di similitudine ` data anche dai seguenti a e teoremi: Teorema 4 Data una matrice A reale e simmetrica. Si pu` dunque pensare di costruire una matrice o U1 tale che moltiplicata per una generica matrice A fornisca. che diventa tridiagonale se A ` simmete e rica Si definisce a questo punto una nuova tipologia di matrice. esiste un riflettore elementare U tale che U x = −σe1 Dove   u = x + σe1 e1 = (1. 0)T √  σ = ± xt x Dalle considerazioni precedenti si ` visto che ` possibile costruire delle e e matrici U tali che. detta riflettore.

in quanto risulı teranno di fatto dalla moltiplicazione a destra per le Qi ed a sinistra per le loro trasposte: Ai+1 = (Q1 Q2 · · · Qi )T A(Q1 Q2 · · · Qi ) Trattandosi di operazioni di similitudine.3. in quanto a prodotto di matrici ortogonali. avendo come unica pecca l’utilizzo di 2n3 /3 operazioni. cercando di farla diventare tridiagonale o di Hessenberg. si conservano gli autovalori! Si pu` o dimostrare che la matrice An tender` all’infinito a diventare una matrice a triangolare superiore. Il metodo di costruzione della generica matrice Uk ` il seguente: e Ik−1 0 (n−k+1) 0 U1 Il risultato finale di tutte le moltiplicazioni sar` dunque una matrice triangoa lare superiore.2 metodo QR Il metodo QR ` di tipo iterativo. Avr` quindi che: o QT A = R −→ A = QR Si tratta dunque di un processo che permette di ottenere un risultato analogo alla decomposizione di Gauss. 2. Il problema di questo calcolo ` che ` lungo e dispendioso. che verr` chiamata R. Moltiplicando invece tra loro tutti gli a n-1 riflettori otterremo una matrice QT che risulter` ortogonale. Decomposizione della matrice all’i-esima iterazione: Ai = Qi Ri 2. per poi applicare il metodo QR ad una condizione ove si ha un numero consistente di elementi nulli. i cui autovalori saranno gli elementi della diagonale principale. e calcoliamo e delle nuove matrici secondo il processo seguente: 1.3 Metodo delle potenze Il metodo delle potenze ` un algoritmo di tipo iterativo che converge ad e un vettore parallelo all’autovettore fondamentale della matrice di interesse.3. il doppio esatto di quelle necessarie per la decomposizione di Gauss. 2. Pu` essere applicato a problemi di tipo: o 33 .anche tutti gli elementi della seconda colonna ad eccezione dei primi due. Il procedimento e e pi` generalmente utilizzato ` quello di trattare preventivamente la matrice u e A. Calcolo della matrice per l’iterazione successiva: Ai+1 = Ri Qi Tutte le matrici cos` calcolate risulteranno simili ad A. Si definisce A1 la matrice A.

12 Si avr` dunque che: a n M mq = h=1 n ch M m ϕh = ch µm ϕh = h h=1 n = = µm [c1 ϕ1 1 + h=2 µh ch ϕh ] µ1 Ma dunque. Come per quanto infinito. utile in particolare per due classi specifiche di problemi: • Problemi agli autovalori di fusione neutronica in mezzo moltiplicante • Utilizzo in metodi per la risoluzione di sistemi di equazioni non omogenei Si supponga che la matrice M abbia un insieme completo di autovettori. A partire da tale ipotesi si pu` dimostrare che la successione M m converge o all’autovalore di modulo massimo qualunque sia q. poich` la sommatoria tender` a 0 per indice m che tende ad e a m q tender` a diventare parallelo a ϕ . il vettore M a 1 detto relativamente al metodo di Jacobi.• AΦ = λΦ • AΦ = λBΦ • D(λ)Φ = 0 Ove nel terzo caso non ` garantita la linearit` del problema rispetto agli e a autovalori. ` ragionevolmente possibile supporre di poter scrivere e n q= h=1 ch ϕh Ove i ϕh sono evidentemente gli autovettori della matrice M. Avendo inoltre imposto che la matrice M abbia un set completo di autovettori. Il metodo delle potenze ` un algoritmo iterativo che. e fornisce una stima dell’autovettore fondamentale. si avr` anche qui un termine (quela lo legato al secondo autovalore di modulo massimo) che resister` a questa a Tale scrittura equivale a dire che ` sempre possibile scrivere un qualunque vettore q e come combinazione lineare degli autovettori della matrice M 12 34 . Si supponga inoltre che la matrice M abbia tutti autovalori distinti: esister` dunque uno ed un solo autovalore avente modulo superiore a tutti gli a altri. a convergenza.

supponendo di essere giunti a a convergenza all’m-esima iterazione: M (M m q) µ1 (M m q) Ove il vettore M m q corrisponde al generale multiplo di autovettore cϕ Dall’equazione precedente si pu` dunque dedurre che o µ1 (M m+1 q)1 (M m q)1 (M m+1 q)2 (M m q)2 ··· (M m+1 q)n (M m q)n Si ha infatti che a convergenza i due vettori M m q ed M M m q devono essere paralleli in quanto uguali a meno di una costante moltiplicativa (l’autovalore).convergenza pi` di tutti gli altri con una “forza” quantificata dal rapporto u di dominanza Attenzione per`. allora lo e stesso varr` per cϕ. che infatti non dipende dal valore in s` della quantit`. che si potr` basare sulla similitudine tra i vari rapporti a tra le componenti. mentre per µ1 < 1 essa tender` a 0. Per ota tenere dunque una soluzione ` opportuno.13 . ma non ` ancora stato fatto il passo succese sivo. ` evidente e che affinch` la soluzione converga ad un valore reale diverso da 0 ` necese e sario che il termine a destra elevato all’m-esima potenza sia il pi` possiu bile vicino ad uno. ma si vede che compare nella formula risolutiva l’elemento µm che moltiplica tutta l’e1 quazione. Infatti se il problema di partenza ` lineare sar` possibile sfruttare il e a fatto che se ϕ associato a µ ` soluzione al problema agli autovalori. ovvero qualunque vettore ` soluzione del problema agli a e autovalori a patto che sia parallelo ad uno dei suoi autovettori. Occorre tuttavia quantificare questa vicinanza. Occorre tuttavia fare come e a Si tratta evidentemente in questo caso di un criterio di convergenza puntuale. Esistono anche criteri di convergenza in norma che saranno in generale meno stringenti 13 35 . Sulla base di queste considerazioni si potr` dunque dire che. Nei passaggi precedenti ` stato dimostrato che il metoo e do converge ad un vettore parallelo all’autovettore fondamentale. Si ha in questo modo imposto una sorta di errore relativo. Per quanto visto prima. A questo punto per` sar` necessario capire come calcolare il raggio speto a trale. Si ricorre in generale ad una imposizione sul numero delle cifre della mantissa che devono essere uguali. normalizzare la soluzione ad ogni step iterativo. Questo fornisce dunque un efficace criterio di convergenza per il mio metodo iterativo. Risulta dunque evidente che per µ1 > 1 la formula tender` a a divergere per m grandi. Si ` infatti dimostrato che il vettore M m q tende a diventare parallelo e all’autovettore fondamentale. Verr` dunque introdotto come elemento normalizzante a per ogni iterazione l’autovalore di modulo massimo calcolato all’iterazione precedente. ricordandosi che gli autovettori e sono definiti a meno di una costante moltiplicativa arbitraria. Quando essi saranno sufficientemente simili tra loro si potr` finalmente considerare di essere giunto a convergenza e poter dunque a troncare il processo iterativo.

Cosa accade se tale termine `. ed in particolare risulteranno in generale pi` importanti nelle zone ove essi sono pi` numerosi. Tuttavia. per quanto stringente. Esister` dunque ı e a un modo per sfruttare ci` che si conosce riguardo la fisica del problema al o fine di rendere ancora pi` precisa la soluzione. non porti a selezionare una soluzione realmente vicina a quella cercata. Si nota per` che questo calcolo sta equiparando tra loro tutte le compoo nenti dell’autovettore fondamentale. a vale a dire il termine q. In neutronica questo corrisponde al tenere in considerazione il fatto che i neutroni. u Si introducono dunque i quozienti di Rayleigh. a parit` di iterazione. che prevede l’utilizzo della stessa classe funzionale della soluzione per la pesatua delle componenti. pesando secondo Galerkin si ottiene una pesatura tramite importanza neutronica. Per dare il via all’algoritmo iterativo sar` necessario imporre una soluzione di tentativo. sfortunatamente. I > n m+1 q) i i=1 (M n (M m q)i i=1 Tale operazione fornisce infatti una stima dell’autovalore fondamentale pi` u precisa. ognuno dei quali ` di fatto teoricamente e equivalente (se mi trovassi di fronte alla soluzione analitica essi sarebbero infatti tutti uguali). Solo nel caso monodimensionale. In questo caso si rischia che il criterio di convergenza. q (m+1) > avendo utilizzato quella che viene detta una pesatura alla Galerkin. Sarebbe dunque u u in teoria pi` corretto usare l’importanza come funzione peso. a Rimane tuttavia il dubbio legato alla scelta di quale degli n valori possibili scegliere per l’autovalore. q (m+1) > < q (m) . In casi come questo ` dunque sempre opportuno andare a sostituire i risultati ottenuti e nell’equazione di partenza per verificarne l’effettiva veridicit`. definiti in modo che: µ1 < q (m+1) . q (m) > oppure µ1 < q (m+1) . hanno importanza differente a seconda della posizione del reattore in cui si trovano. in un sistema critico.sempre grande attenzione agli algoritmi molto lenti. se per la matematica le variabili sono tutte uguali. di qualunque stima effettuata dal semplice a rapporto delle componenti. e perpendicolare all’autovettore fondamentale? Si avr` in questo caso infatti a 36 . cos` non ` per la fisica e l’ingegneria. ma questo u richiederebbe la soluzione del problema aggiunto. Una possibilit` ` data dall’operazione seguente: ae µ1 < M m+1 q. poich` l’importanza coincide con il flusso neutrone ico. che portano ad avere le soluzioni di due iterazioni successive molto vicine tra loro. I > = < M m q. Veniamo all’analisi di un caso particolarmente sfortunato. q (m) > < q (m) . aumentando cos` il cosı to computazionale in modo non giustificato dai risultati ottenuti.

il vettore soluzione sar` molto pi` vicino a ϕ2 che a ϕ1 . a ed infatti baster` una iterazione affinch` gli errori di arrotondamento del a e calcolatore portino ad ottenere come M q un vettore non perfettamente perpendicolare a ϕ1 . andando a scrivere dunque: B −1 Ax = λx ed applicando il metodo delle potenze nella maniera seguente: B −1 Aq (0) = q (1) Ecco dunque che il problema si ` complicato notevolmente. si ` detto che il metodo o e delle potenze ` utilizzato per risolvere ogni tipo di problema agli autovalori. a u Si ricorda ora per` che. caso non favorevole ma comunque migliore della convergenza ad un valore sbagliato. ma al massimo delle quantit` molto piccole). con le dovute conseguenze. Questo sar` vero per` solo dal punto di vista matematico. e mentre per quanto visto finora si ` visto solo come risolvere problemi agli aue tovalori classici ma non. Il metodo delle potenze converger` in questo a caso verso il secondo autovalore di modulo massimo. Si avr` in questo caso tuttavia una convergenza molto a lenta.che: q= n ch ϕh h=2 che non ha componente lungo l’autovettore fondamentale e dunque non potra mai convergere ad esso. Per poter estendere tale metodo anche ai problemi generalizzati ` necessario essere in grado di provare l’esistenza della matrice e B −1 . Si avranno due e cicli di iterazioni concatenati l’uno dentro l’altro: • Un ciclo di iterazioni esterne: B −1 Aq (0) = q (1) • Un ciclo di iterazioni interne: Aq (0) = Bq (1) → B −1 Aq (1) = q (2) 37 . Attenzione per` che il rischio esiste comunque: troncando o il processo dopo un numero insufficiente di iterazioni. all’inizio del paragrafo. ove B ` la matrice del problema agli autovalori generalizzato: e Ax = λBx Come risolvere a questo punto il problema? Sar` necessario ricondursi al a caso precedente. Dal punto a o di vista numerico infatti la perpendicolarit` perfetta non esiste (non esa iste infatti il concetto di zero.

Ritrovandosi un processo iterativo interno. allora tutti gli autovalori di M sono reali e tutti gli autovettori corrispondenti sono tra loro perpendicolari • Se la matrice M ` reale e simmetrica e definita positiva14 . che a a porter` forzatamente all’ottenimento della soluzione esatta. Si potrebbe a questo punto pensare di fare un’operazione di questo tipo: calcolare all’inzio. ∀ Φ = 0. allora e tutti i suoi autovalori sono positivi e reali • Se M ` reale e simmetrica e semi-definita positiva15 . Si enunciano di seguito alcune propriet` e teoremi di matrici che risula teranno utili nel seguito: • Se la matrice M ` reale e simmetrica o complessa ma Hermie tiana. ∀ Φ = 0. sarebbe presumibilmente inferiore alla somma di tutte le iterazioni interne. anche non simmeto rica. Se dal punto di vista matematico il discorso ` teoricamente corretto. si ha che (< M Φ. anche il valore di q (1) non ` e esatto ma approssimato rispetto all’aggiornamento della soluzione.4 Propriet` spettrali delle matrici di interazione a Si definisce matrice di interazione una matrice i cui coefficienti hanno un significato fisico. allora tutti e i suoi autovalori saranno non negativi Si definicono invece matrici positive (Da notare la differenza con le matrici definite positive) matrici i cui elementi sono tutti positivi. Questo discorso si attua per` solo ove la matrice B sia sparsa. a 2. Per capire perch` tale procedimento spesso non ` attuato bisogna andare e e ad analizzare il contenuto fisico del problema. seppure elevato. si ha che (< M Φ. Perdendo il a parallelismo fisico. Ci si libererebbe cos` di un processo iterativo tramite ı un quantitativo di calcoli che. vale che: 14 15 una matrice ` definita positiva se. l’inversa di B e utilizzarla per tutte le iterazioni esterne. considerando le implicazioni fisiche e ci si accorge che si andrebbe a risolvere i due problemi su due piani diversi. un metodo diretto. Φ >) ≥ 0 e 38 . Φ >) > 0 e una matrice ` semi-definita positiva se. Si vedr` in seguito e u a come questa problematica appare in maniera molto evidente nel caso della risoluzione numerica delle equazioni della diffusione neutronica multigruppo. Riguardo le matrici positive esiste un teorema di rilevante importanza: Teorema 7 (di Perr`n) Data una matrice M positiva. la convergenza non ` pi` garantita. una volta per tutte. e dunque a mischiare informazioni di qualit` molto differenti. come gi` detto in precedenza. e dunque o risolvibile tramite algoritmi di tipo iterativo. Ove invece B sia una matrice densa verr` utilizzato.

Tale sistema ` generala e mente utilizzato ove sia presente una quantit` molto elevata di dati spera imentali. un unico autovettore ϕ1 avente componenti tutte positive16 . a Si faccia per` attenzione che la condizione espressa dal punto 1 del teorema o di Perron include una maggiorazione semplice e non stretta: λ1 ≥ |λj |. l’autovalore fondamentale ` positivo ed ha sempre molteplicit` 1 (ovvero e a ∃λi con m(λi ) = 1 tale che λ1 > |λj | ∀j = 1) 2. Per esse vale invece il seguente teorema: Teorema 8 (di Frobenius) Data una matrice semipositiva valgono le propriet` enunciate dal teorema 7 a patto che la matrice sia anche irriducibile. a 3.5. allora λ∗ autovalore 1 fondamentale della matrice M ∗ avr` modulo maggiore di λ1 a Possiamo allo stesso modo definire matrici ad elementi non negativi o matrici semipositive le matrici aventi solo termini positivi o nulli. Purtroppo la determinazione dei coefficienti di tali polinomi costituisce un sistema di equazioni lineare e non omogeneo Altra via per l’approssimazione dei dati ` il metodo dei minimi quadrati. Questo corrisponde a dire che hanno tutte lo stesso segno 16 39 . a meno di una costante moltiplicativa arbitraria. Useremo in questi casi i polinomi di Hermite e le funzioni spline. caso in cui non ` pensabile il ricorso ad una interpolazione.1 Funzioni spline Le funzioni spline sono dei metodi utilizzati per l’interpolazione di punti. Si e tenga conto comunque che nel caso della determinazione dei coefficienti della funzione approssimata tramite il metodo dei minimi quadrati il problema ` tanto pi` mal condizionato quanto pi` grande ` il numero n di punti spere u u e imentali a disposizione. ove essendo in possesso di n punti spere imentali potremo approssimarli con un polinomio di grado n-1. Se un qualsiasi elemento della matrice M cresce. e e ovviamente a meno di una costante moltiplicativa arbitraria. 2. All’autovalore fondamentale λ1 corrisponde.5 Approssimazione di dati sperimentali Esistono numerosi modi per approssimare dei dati sperimentali.1. Uno dei pi` u comuni ` quello dell’interpolazione. Abbiamo infatti visto come una semplice interpolazione polinomiale spesso non ` adeguata ed ` dunque opportuno ricorrere ad altri metodi. L’autovettore fondamentale ` l’unico a godere di tale e propriet`. 2. e dal quale non si otterr` una funzione interpolante.

k = 0.Supponiamo dunque di avere N+1 punti. yi ). i cui coefficienti sono determinabili risolvendo il sistema di equazioni avente come matrice di coefficienti una matrice di Van der Monde. Avremo dunque in totale 4n incognite e 4n-2 condizioni. ottenendo per` in generale una rappresentazione poco realistica e o continuando ad avere la discontinuit` nella derivata. In effetti per`. 1. trovare un polinomio di e grado N in grado di interpolare esattamente gli N+1 punti sperimentali.b] se: • Sd (x)` un polinomio di grado d in ogni intervallo [xi . Rimangono dunque due 40 . come detto. yi }su di un intervallo [a. quello in cui la soluzione interpolante ` un arco di parabola: prender` cos` i nodi a tre a tre invece che a due e o ı a due. Nelle spline cubiche avremo che  per i = 0 : n  S3 (xi ) = yi S3 (x) = ai + bi x + ci x2 + di x3 ∀x ∈ [xi−1 . per le quali avremo discontinuit` a partire dalla derivata a terza. xi ] per i = 1 : n  (k)+ (k)+ S3 (xi ) = S3 (xi ) per i = 1 : n − 1. o oltre al fatto che tale problema ` spesso e volentieri mal condizionato. ciascuno identificato da una coppia (xi . Definiamo ora le funzioni interpolanti di tipo spline. e u Un alternativa pu` essere quella di usare una serie di funzioni lineari. 2 Ove di fatto le prime condizioni corrispondono al passaggio della funzione per i nodi (n+1 condizioni). anche se questa volta a a nodi alterni. poco costosa. ma e ha un grosso problema: la sua derivata non ` continua. xi+1 ] e • Ogni derivata k-esima per k ≤ d − 1 ` continua e Le funzioni che vedremo in quanto in genere maggiormente usate sono le spline di ordine 3.b] tale che a ≡ x0 < x1 < · · · < xn ≡ b In linea teorica ` sempre possibile. tale e tipo di approssimazione non ` necessariamente la pi` adatta. e Prendiamo ora un altro esempio. le seconde all’imporre che la funzione interpolante sia un polinomio di terzo grado (4n incognite) e la terza alla continuit` della a funzione e delle sue derivate prima e seconda (3n-3 condizioni). La funzione interpolante sar` in a questo modo del tipo: fn (x) = (xi+1 − x)yi + (x − xi )yi+1 xi+1 − xi per xi < x <i+1 Una funzione di questo tipo ` semplice da implementare. con d ≥ 1 ` una funzione spline di ordine d associata ai e punti {xi . il o che mi fornisce di fatto una linea spezzata. Diremo che una funzione Sd (x). compresi in un intervallo [a.

In realt` tramite opportune a trasformazioni ` possibile ridurre tali dimensioni sensibilmente e Definiamo una nuova incognita: Mi = S3 (xi ). a Si vede che apparentemente due condizioni non sono state utilizzate. Essendo la mia spline un polinomio di terzo grado. che si ottengono imponendo la continuit` della derivata prima. che saranno generalmente ad esempio l’imposizione dei valori della derivata della funzione agli estremi del dominio di integrazione. e Imponiamo dunque la continuit` della derivata prima: a (xi −x)2 Mi−1 +(x−xi−1 )2 Mi + [ yi −yii−1 − hi Mi −Mi−1 ] = 2hi h 6 (xi+1 −x)2 Mi +(x−xi )2 Mi+1 yi+1 −yi Mi+1 −Mi = + hi+1 − hi 2hi+1 6 Semplificando si ottiene: hi Mi−1 + 2(hi + hi+1 )Mi + hi+1 Mi+1 = 41 6 hi+1 (yi+1 − yi ) − 6 (yi − yi−1 ) hi .condizioni da imporre a piacere. il polinomio risultante da una derivata seconda sar` lineare. In realt` la continuit` della derivata 0-esima (ovvero della funzione interpolante a a stessa) ` assicurata dall’imposizione del passaggio per gli n+1 punti. Dunque avremo che: a S3 (x) = (xi − x)Mi−1 + (x − xi−1 )Mi xi − xi−1 Potr` dunque scrivere la mia funzione integrando due volte ed ottenendo o cos` ı S3 (x) = (xi − x)3 Mi−1 + (x − xi−1 )3 Mi + Ci (x − xi−1 ) + Di 6(xi − xi−1 ) Imponendo la condizione di passaggio per i punti sperimentali ottengo Ci = yi −yi−1 hi Di = yi−1 − Da cui l’equazione diventa: h2 i 6 Mi−1 − hi Mi −Mi−1 6 S3 (x) = (xi −x)3 Mi−1 +(x−xi−1 )3 Mi + 6hi yi −yi−1 Mi −Mi−1 ](x +[ hi − hi 6 − xi−1 ) + yi−1 − h2 i 6 Mi−1 Non resta altro che definire i valori degli Mi . Si tratta ora dunque apparentemente di risolvere un sistema abbastanza impegnativo di 4n equazioni ed incognite. mentre e la continuit` della derivata seconda negli stessi nodi ` assicurata dal fatto a e che essa stessa ` stata scelta come incognita.

L’obbiettivo di studi avanzati nel calcolo numerico ` quello di aumentare e tale grado di precisione. In generale ci saranno 3 possibili strategia adottabili: 1. e 42 . Tale informazione corrisponde di fatto e a dire che tale metodo mi consente di integrare con esattezza equazioni di grado pari o inferiore ad (n-1). e tale grado di precisione ` pari a (n-1).6 Integrazione numerica Come si calcola un integrale in modo numerico? Avremo b I= a f (x)dx Il modo pi` semplice per tale calcolo ` dato dalle formule di Newtonu e Cotes. Tale condizione ` ad esempio impostata di default nel softe ware “Matlab”. di conseguenza un numero n di nodi corrisponder` ad un polinomio a interpolante di grado n-1 che passi esattamente attraverso tutti questi punti. Imporre il valore della derivata seconda agli estremi. Si parla in questo caso di spline naturali. viste le incognite che sono state scelte. L’aumento di precisione tuttavia. come sempre. Le formule Newton-Cotes sono infatti ormai obsolete. Imporre il valore della derivata prima agli estremi 2. Nel caso di andamento periodico si impone l’uguaglianza agli estremi delle derivate prime e seconde. come ` nel caso delle formule di Newton-Cotes. Queste sono formule di quadratura di tipo interpolatorio polinomiale. In questo caso. questo ` il sistema che e permette la risoluzione pi` semplice in quanto consiste nell’imporre i u valori di due delle incognite a priori. Vediamo ora quali sono le due condizioni aggiuntive che possiamo imporre. In questo caso tuttavia si perde la tridiagonalit` della matrice a 2.Il sistema che ne deriva ` di tipo tridiagonale simmetrico e dunque sostanziale mente facile da risolvere tramite il metodo della doppia passata. non ` a costo nullo. Se i nodi sono equidistanti. ma si faccia attenzione che non sempre ` fisicamente e rappresentativa 3. Si noti inoltre come la matrice del sistema sia a diagonale dominante. il che assicura la convergenza dell’algoritmo. ove scelti dei nodi xi vengono calcolati dei pesi ωi tali per cui il mio integrale ` approssimato da una sommatoria del tipo: e n I= i=1 f (xi )ωi L’entit` dell’errore generato dall’approssimazione dipende dal numero n di a nodi.

a Veniamo ora ad ulteriori considerazioni. Una possibilit` ` quella di abbandonare l’imposizione a priori dei nodi. ma anche tutto il contenuto fisico del problema.Per applicare un metodo numerico ` necessario di fatto sostituire la e funzione integranda con un’altra funzione pi` facile da integrare.   . Supponiamo di dover calcolare l’integrale b I= a ω(x)f (x)dx Questa volta ho due funzioni. In particolare tale sistema ` generalmente utilizzato per n ≤ 4. ` necessario scegliere tale funzione ed applicarvi le opportune cone dizioni al contorno per il calcolo dei coefficienti. ma non saranno pi` evidentemente equidistanti.  . Per fare u questo. Ho in questo modo scritto una matrice di tipo Van der monde.. ovvero di ottenere un grado di precisione nell’approssimazione dell’integrale superiore a (n-1). In realt` sono funzioni create in maniera tale a da avere: • una parte (ω(x)) ove ho posto tutte le singolarit` della funzione intea granda. xn−1 xn−1 · · · 2 1 xn−1 n ωn bn −an n Si vede dunque che il problema si riduce alla risoluzione di una matrice di Van der Monde.  . • una parte (f(x)) regolare Stiamo dunque di fatto trattando del caso visto inizialmente.  . In particolare nel caso delle formule Newton-Cotes tale operazione era effettuata imponendo n condizioni nel calcolo dei pesi. . . ma anche ulteriori n u 43 . Tale e formula di quadratura ha dunque potenzialit` limitate. ae Questi dunque non soltanto saranno incognite di equazioni. che sappiamo essere fortemente mal condizionata per n elevati. . L’idea ` per` quella di vedere come effettuare un upgrade delle fore o mule Newton-Cotes.  . Tali condizioni sono del tipo: b n x dx = a i=1 k ωi xk i Questo corrisponde a pretendere che i miei pesi mi permettano di interpolare esattamente tutte le funzioni di base dello spazio vettoriale dei polinomi di grado n-1. ove a p corrisponde K ed a f corrisponde ϕ.  =  .  . . Si tratta dunque a questo punto di imporre u non pi` soltanto n condizioni per il calcolo dei pesi. . ovvero del tipo:      b−a 1 1 ··· 1 ω1 2 2  x1 x2 · · · xn   ω2   b −a       2  . .

ovvero tale da addensare la discretizzazione ove la funzione ha variazioni pi` sensibili e a renderla meno fitta ove invece la u funzione sia pi` regolare. chiamati mk = a ω(x)x di equazioni:   λ1 + λ2 + · · · + λn = m0    λ1 µ1 + λ2 µ2 + · · · + λn µn = m1 . ovvero sempre non negativo. Tali formule di quadratura dovrebbero per`. Questo diventa di importanza molto rilevante ove essi vadano a corrispondere con la discretizzazione di un dominio. attuare un processo di diso cretizzazione “intelligente”. A questo proposito entra in gioco un teorema fondamentale per l’integrazione numerica: Teorema 10 Affinch` la formula di quadratura sia gaussiana..2n − 1 Ove i λi sono i pesi ed i µi sono i nodi. Otterr` dunque un sistema del o tipo: b n ω(x)x dx = a i=1 k λi (µi )k per k = 0. e dunque ` raddoppiata la e dimensione del sistema da risolvere. in particolare passando da n-1 a 2n-1. ` per` diventato pi` complesso: u e o u non soltanto le condizioni sono diventate 2n. Il problema. quantomeno in linea teorica.condizioni per il posizionamento dei nodi. permette di ottenere il seguente sistema che. il sistema di equazioni non lineari che ne deriva ha una soluzione unica ed univoca..   . 2n−1  2n−1 2n−1 = m + · · · + λn µn + λ2 µ 2 λ1 µ1 2n−1 Ho cos` imposto 2n condizioni. Dunque andr` ad imporre tale condizione o b k dx. ovvero esiste uno ed un solo set di {λi } e {µi } che forniscano un polinomio interpolante di grado di precisione 2n-1 Si noti che procedendo in questa maniera i nodi non sono pi` equidistanti u tra loro. e e u comunque. u Il problema ` che ora la matrice da risolvere ` ancora pi` complessa e. deve essere che L’insieme dei µi coincida 44 . ovvero abbia e grado di precisione pari a 2n-1. ovvero essere in grado di integrare in maniera esatta polinomi di grado pari o minore a 2n-1. ai quali sono associate formule di quadratura dette gaussiane L’obbiettivo che ci si pone. e in cui tutti gli mk esistano per ogni k tra 0 e 2n-1. ` a e quello di ottenere un gradi di precisione maggiore. aumentando il numero dei gradi di libert`. A supporto della funzionalit` di questi ı a sistemi esistono alcuni teoremi che enunceremo qui di seguito: Teorema 9 Nell’ipotesi in cui ω(x) ≥ 0 ∀x ∈ [a. mal condizionata. b] . In questo e diventa dunque fondamentale l’utilizzo di polinomi ortogonali.  . ma ` diventato non lineare. che da un lato fornir` a generalmente una soluzione pi` precisa.

La scelta dell’intervallo e della funzione peso individua inequivocabilmente una classe di polinomi ortogonali a meno di coefficienti costanti e non nulli. In generale i polinomi ortogonali sono definiti in base ad una formula di ricorrenza a tre termini. ed un set di polinomi ` definito a e ortonormale ove tale costante sia uguale ad 1. non necessariamente finito.con l’insieme degli zeri del polinomio Pn (x) ortogonale in [a.P( x)} che sar` detta a ortogonale su [a. P1 (x). del tipo:   P−1 (x) = 0 P0 (x) = 1  Pn+1 (x) = (x − an )Pn (x) − bn Pn−1 (x) Si vede dunque che una volta definiti l’intervallo [a. In ogni caso tale costante sar` sempre positiva in quanto abbiamo supposto la non negativit` dela a la funzione peso p(x) su tutto l’intervallo [a.. Individuo quindi una classe di polinomi {P0 (x). Esso sar` rappresentabile in a modo univoco tramite una combinazione lineare di polinomi ortogonali: m Qm (x) = i=0 ck Pk (x) 45 .. Pn (x) possiede n zeri reali e distinti tutti contenuti nell’intervallo [a.b]. definiti come: b Mk = a ω(x)xk dx < ∞ per k = 1. b] rispetto alla funzione peso ω(x) Definiamo ora meglio i polinomi ortogonali Prendiamo un intervallo [a. 2. sul quale definiamo una funzione peso ω(x) che sia a segno costante su tutto l’intervallo e della quale esistano i momenti.b] rispetto alla funzione peso ω(x) se b ω(x)Pn (x)Pm (x)dx = a 0 n=m cost n = m Tale costante sar` uguale per tutti gli n. Si vede inoltre come dentro la definizione di un generico Pn+1 siano coinvolti tutti i polinomi di ordine inferiore. L’interesse che risiede nei polinomi ortogonali ` dato dalle propriet` dei e a loro zeri..b].b] • Tra due zeri consecutivi di Pn (x) ne ` incluso uno solo di Pn−1 (x) e Prendiamo ora un generico polinomio Qm (x). Si ha infatti che: • Per ogni n ≥ 1...b]. la funzione peso e i valori dei coefficienti an e bn tutti i polinomi ortogonali sono determinabili in maniera univoca.

Un esempio ` l’equazione del e trasporto. per l’ortogonalit` dei polinomi l’intea grale ` sempre nullo. I polinomi di Legendre sono definiti dalla seguente formula di ricorrenza a tre termini:   P0 (x) = 1 P1 (x) = x  (n + 1)Pn+1 (x) = (2n + 1)xPn (x) − nPn−1 (x) Sono dei polinomi particolarmente importanti perch` sono molto adatti nele la discretizzazione di particelle libere in geometria sferica. 1] 46 . 1] Il fatto che la funzione peso abbia valore unitario mi dice che tutti gli intervalli in cui posso suddividere la mia funzione originaria hanno la stessa importanza. e Vediamo ora alcune classi di polinomi ortogonali: I Polinomi di Legendre hanno • ω(x) = 1 • [a.Per il calcolo dei coefficienti posso semplicemente sfruttare l’ortogonalit` a dei polinomi: per il calcolo di un generico ck ` sufficiente moltiplicare ambo e i membri per il corrispondente polinomio Pk (x) e per la funzione peso ed integrare da entrambe le parti su [a. I Polinomi di Jacobi sono un’altra categoria di polinomi ortogonali. Se ne ottiene: ck = b a ω(x)Qm (x)Pk (x)dx b 2 a ω(x)Pk (x)dx Dalla propriet` di ortogonalit` dei polinomi si pu` anche ricavare che: a a o b ω(x)Pn (x)qm (x)dx = 0 a ∀m < n Questo ` dovuto al fatto che io posso sempre scrivere e m Qm (x) = i=0 ck Pk (x) Ma essendo ogni volta i diverso da n. aventi: • ω(x) = (1 − x)α (1 + x)β • [a. b] = [−1. b] = [−1. ove la velocit` di un neutrone sar` data in generale da v = v Ω. a a Gli zeri dei polinomi di Legendre corrisponderanno alle direzioni di volo delle particelle. soprattutto ove si voglia discretizzare la variabile angolare.b].

Per invece α = β = 1 2 si hanno i polinomi di Tchebychev di seconda specie che servono ad approssimare funzioni speciali.  . almeno quattro modi diversi: • Bisezione • Regula falsi • Secanti • Newton In realt` non si andranno mai ad usare tali metodi. hanno infine: • ω = e−x 2 • [a.Si vede evidentemente che per α = β = 0 la scrittura degenera nei polinomi di Legendre. b] =] − ∞. che costituiscono dunque un caso particolare di polinomi di Jacobi. ma ne esistono di appositi a per i polinomi ortogonali. di base. I Polinomi di Laguerre hanno invece: • ω(x) = e−x • [a.   2n−1 2n−1 = m λ1 µ2n−1 + λ2 µ2 + · · · + λn µn 2n−1 1 ed infine a: Pn (µi ) = 0 47 . Per farlo o e conosciamo. Per polinomi di Jacobi con α = β = − 1 ho i Polinomi ti Tcheby2 chev di prima specie. +∞[ e sono usati in problemi di rilevazione satellitare e di fenomeni radiativi (si noti a questo proposito la presenza del termine esponenziale) I Polinomi di Hermite. come la E1 . che vedremo in seguito utilizzati come supporto per l’accelerazione della convergenza di algoritmi lenti. Dunque dal problema b ω(x)f (x)dx = a i λi f (µi ) + err sono passato prima a:   λ1 + λ2 + · · · + λn = m0    λ1 µ1 + λ2 µ2 + · · · + λn µn = m1 . b] = [0. +∞[ Dunque ci` che ci interessa ` trovare gli zeri di tali polinomi.  .

Nel caso delle formule di GaussLegendre ottengo un addensamento dei nodi ai bordi del dominio. ma tramite l’algoritmo di Clanshaw. La scelta della formula di quadratura non ` casuale. visto che le soluzioni sono date dagli zeri e del polinomio. I risultati portano a situazioni differenti. soprattutto ove la derivata prima del polinomio sia piccola e dove il numero di zeri n sia elevato. Dunque in effetti quando andremo ad inserire una formula di ricorrenza a tre termini. Dovremo di fatto ripensare il Ritornando a quanto detto sulla propagazione degli errori. ove devono essere noti i coefficienti ricorsivi del polinomio ortogonale. non lo faremo secondo la definizione vista in precedenza. o Andiamo per esempio a vedere cosa succede utilizzando i polinomi di Legendre: otterremo una equazione nella forma: 1 1 · f (x)dx −1 i λi f (µi ) Si vede che in questo caso la funzione peso ` pari ad uno. con tendenza tanto pi` marcata quanto pi` n ` grande (nonostante la funzione peso u u e sia costante). Il risultato che si ottiene utilizzato questo tipo di algoritmi ` e affidabile 17 48 . ottenendo ad o esempio le formule di Gauss-Laguerre: ∞ 0 e−x f (x)dx i λi f (µi ) ove i nodi sono in questo caso dati dagli zeri del polinomio di Laguerre. in definitiva. Attenzione per`: tale problema ` molto mal o e condizionato. a risolvere. Si parla in questo caso di a formule di Gauss-Legendre Stesso discorso pu` essere effettuato per altri sistemi. La risoluzione del problema intermedio ` dunque inutile. che trasforma quello precedente in uno pi` stabile: u   ym+2 = ym+1 = 0 yk = (Ak x + Bk )yk+1 − Ck yk+2 + ck ¯  y0 k0 = Qm (¯) x Si tratta di un algoritmo ricorsivo all’indietro. e ma effettuata in base al legame fisico ed alle esigenze computazionali17 Ho dunque trasformato il mio problema in un problema di ricerca di zeri di polinomi omogenei. Dunque di fatto posso ottenere i valori dei nodi.Ove Pn ` il polinomio ortogonale scelto all’inizio del problema in funzione e dell’intervallo di integrazione e della funzione peso. Maledizione! Dunque neanche questo terzo problema numerico sar` quela lo che andremo. e dunque di fatto e non d` alcun peso differente ai vari intervalli. grazie ai quali andr` a calcolare i pesi. Attenzione dunque. le formule di ricorrenza a tre termini sono esattamente uno dei punti potenzialmente problematici di un algoritmo dei quali andranno dunque studiati condizionamento e stabilita.

il che come detto e rende possibile ottenere la risoluzione tramite l’applicazione del metodo della doppia passata. in definitiva. dall’equazione: λi = 1 n−1 2 j=0 [Pj (µi ) ] 49 . In questo modo la ı formula di ricorrenza assume la forma: Pm+1 (x) = (Am x + Bm )Pm (x) − Che si pu` riscrivere nella forma o xPm (x) = 1 Bm 1 Pm+1 − Pm (x) + Pm−1 Am Am Am−1 Am Pm−1 Am−1 che. il vero problema che andremo a risole vere. una volta noti gli autovalori del problema e di conseguenza i nodi µi . e in modo tale che b 2 ω(x)Pm (x)dx = 1 a Ottenendo cos` un insieme di polinomi ortonormali. I pesi sono infine determinati. sapendo che questi sono tali da essere zeri di Pn . Questo ` dunque. otteniamo la forma finale: ˆ µi P (µi ) = T P (µi ) Questo non ` altro che un problema agli autovalori di tipo classico ove gli e zeri del polinomio Pn (x) coincidono con gli autovalori del problema stesso. o u La prima operazione da effettuare ` una normalizzazione dei polinomi. in modo tale da ottenere le stesse soluzioni del problema che ci siamo posti. · · · .problema numerico dall’inizio. 0. 1} 1 Am e βm = − Bm Am Se calcoliamo tale espressione nei nodi µi . rinominando opportunamente i coefficienti come: αm = diventa xPm (x) = αm Pm+1 + βm Pm (x) + αm−1 Pm−1 Posso dunque riscrivere il tutto in forma matriciale. rendendolo per` pi` facile da risolvere. La matrice T ` in effetti tridiagonale e simmetrica. del tipo: ˆ xP (x) = T P (x) + αn−1 Pn (x)en con en αn−1 = {0.

a 18 Tale nucleo pu` essere singolare nel dominio di integrazione. Ci` che riuscir` ad ottenere sar` sempre e comunque una o o a soluzione approssimata. ma anche in geneale quello meno interessante. yi )ϕ(yi ) Tuttavia ` necessario abbandonare l’idea di calcolare direttamente la soluzione e esatta ϕ(x). Quelli enunciati fino ad ora sono problemi matematici.2. 18 e Ove il termine forzante sia assente. l’equazione di partenza viene ricondotta (come visto nel paragrafo precedente) ad una equazione integrale agli autovalori. Non ` ovviamente l’unico tipo esistente. a Partiamo dal kernel. abbiamo che: ϕ(x) ` la funzione incognita e h(x) ` il termine forzante e K(x. Caratteristica peculiare delle equazioni di Frehdolm ` quella di basarsi su integrali definiti. ove come detto ` nascosta la fisica del problema. del tipo: Ax = λx oppure Ax = λBx tali casi si riconducono entrambi alla risoluzione di un problema del tipo D(λ)x = 0. ` quello ove tale u e dipendenza sia lineare. ove in pratica e ` situata la fisica del problema. e Sulla base di questo dovremo procedere all’integrazione scegliendo opportunamente la formula di quadratura. Andr` dunque a sostituire alla mia ϕ(x) una ϕn (x) o dove l’indice n mi d` informazioni sulla precisione del polinomio interpolante.7 Equazioni integrali Ci si riferisce in particolare alle cosiddette equazioni di Frehdolm di seconda specie. y)ϕ(y)dy Con riferimento alla simbologia dell’equazione precedente. Il caso e pi` agevole. Per passare al problema numerico sar` necessario introdurre degli errori di idealizzazione. ma ve ne sono e altre come le equazioni integrali di Volterra. Una volta effettuata tale operazione la risoluzione dell’equazione integrale diventer` un problema algebrico del a tipo: n ϕ(x) h(x) + i=1 ωi k(x. ove D(λ) ` una matrice dipendente da parametro. Un tipico e esempio di equazione di Frehdolm di seconda specie ` il seguente: e ϕ(x) = h(x) + K(x. y) ` il nucleo o kernel della funzione di integrazione. in questo caso la o risoluzione diventa maggiormente complessa 50 .

La scelta di n dipende dal problema fisico e, come sempre, dal rapporto costi-benefici. Una volta effettuato tale passaggio otterr` che la mia equazione sar` o a divenuta della forma:
n

ϕn (x)

h(x) +
i=1

ωi k(x, yi )ϕn (yi )

Occorre a questo punto ricordare che, nel calcolo numerico, non si opera quasi mai nel continuo, ma si opera un processo di discretizzazione per arrivare ad un numero finito di nodi in cui sar` calcolata la funzione. Si a tratter` dunque di andare a collocare i nodi, che sono i punti in cui imporr` a o l’esattezza della mia equazione. Otterr` cos` una forma del tipo: o ı
n

ϕn (xi ) = h(xi ) +
i=1

ωi k(xi , yi )ϕn (yi )

In questo caso il “circa uguale” ` stato sostituito con un uguale in quanto e stiamo imponendo proprio che la nostra approssimazione sia esatta nei nodi scelti. Sono dunque di fronte ad un problema lineare non omogeneo del tipo [δij + ωi k(xi , yi )]ϕn (xi ) = h(xi )
i

che assume di fatto una forma del tipo Ax=b. Trattandosi di un problema non omogeneo esso sar` risolvibile solo se det(A) = 0, e come qualsiasi a problema numerico ` necessario accertarsi del buon condizionamento della e matrice A. Una volta effettuata tale verifica, esisteranno come sempre le due strade: • se la matrice ` sparsa, si operer` iterativamente e a • se la matrice ` densa, si operer` tramite metodi diretti e a In generale sar` pi` probabile, nel caso di equazioni integrali, trovarsi di a u fronte a matrici dense. Un esempio tipico di questo caso ` la trasmissione dei e segnali, ove nonostante si abbia una attenuazione esponenziale del segnale ` e teoricamente necessario tenere conto di ogni possibile sorgente, il che porta ad avere matrici quasi interamente non nulle.

51

Capitolo 3

Metodi numerici per l’ingegneria nucleare
3.1 Introduzione alla tecnologia ed alla fisica nucleare

Un reattore nucleare ` identificato da un punto di funzionamento. Possiamo e supporre che esistono varie zone: • Sicure • di Allarme • Incidentali Il produttore deve tendenzialmente adattarsi alle richieste di carico della rete. Questo dipende tuttavia anche da numerosi altri fattori: in Italia ci si aspetta che eventuali centrali nucleari di nuova costruzione opererebbero in modo tale da supportare il carico di base, lavorando quindi in condizioni teoricamente ottimali. In un contesto pi` generale tuttavia anche i gestori u nucleari dovranno adattarsi alle richieste di rete, il che li porter` a porsi a in punti di funzionamento differenti dall’ottimale. Il punto chiave ` che e ` necessario assicurarsi che tali variazioni del punto di funzionamento non e portino a spostarsi al di fuori della zona sicura. Si noti che pi` i miei codici u di controllo sono efficaci e precisi, pi` la zona definita sicura potr` essere u a estesa. Dunque, come ` accaduto di recente in Svezia, a volte per aumentare e la potenza prodotta dalle centrli ` sufficiente migliorarne il controllo in modo e da potersi spingere in sicurezza in zone di funzionamento prima inaccessibili. Nelle pagine che seguono ci si concentrer` sullo studio di piccoli transitori a e piccole oscillazioni attorno ad un valore costante. Si noti che, nonostante tali fenomeni verranno visti in riferimento al nucleare, non sono affatto di esso esclusivi, ma anzi esistono altri casi di controllo simile1 .
1

Si vedano ad esempio i problemi legati al ripple di corrente

52

Ammettiamo inizialmente di avere un sistema molto semplice, di cui supporremo di conoscere con precisione la geometria (considerata invariante nel tempo, anche se questo ` vero solo fino ad un certo punto) e la e composizione materiale (che invece varia nel tempo in modo marcato). Supponiamo inoltre che: • Ogni neutrone uscito ` perduto; non vi ` dunque rientro di neutroni e e • Non ci sono neutroni entranti nel sistema dall’esterno: n`, come detto, e riflessi n` generati da una sorgente esterno e Queste ipotesi ci permettono di considerare un problema omogeneo Utilizzeremo come ultieriore astrazione quella di supporre che i neutroni siano gi` presenti nel sistema, ovvero ci dimenticheremo dei transitori di a avviamento. All’interno di questo sistema i neutroni interagiranno con il materiale nucleare (e non) presente e potranno avere determinate iterazioni piuttosto di altre a seconda della loro probabilit`, quantificata dalla sezione a d’urto. Sappiamo dalla fisica nucleare che l’interazione di un neutrone con un nucleo pu` dare luogo alla scomparsa del neutrone stesso ed alla produzione o di una trasmutazione del nucleo di partenza. Delle reazioni di questo tipo quella di maggior interesse sar` quella di fissione. In questo caso il neua trone, catturato da un nucleo fissile, porta alla formazione di un nucleo composto ed instabile che, in tempi trascurabili, si scinder` in pi` nuclei di a u dimensioni inferiori provocando la produzione di radiazioni ed altri neutroni. Questo tipo di fenomeni ci porta a comprendere come, in effetti, il supporre composizione materiale costante sarebbe una approssimazione troppo forte. Non tutti i tipi di interazione tuttavia danno luogo a questo tipo di fenomeni, ed anzi quelli in generale pi` frequenti saranno quelli in cui il u neutrone rimbalza contro i nuclei del materiale in cui si muove, dando cos` ı luogo a scattering. Lo scattering `, per natura, un fenomeno isotropize zante; Tutte le sezioni d’urto che vedremo, invece, sono da considerarsi in materiale isotropo.2 Al fine del controllo del reattore, e lo ripeteremo pi` volte, sono fondau mentali i neutroni ritardati. I fenomeni di emissione rapida sono infatti troppo veloci per essere controllati, mentre l’incidenza dei fenomeni di emissione ritardata `, seppure piccola, sufficientemente elevata da consentire il e controllo delle reazioni. Il nostro obbiettivo sarebbe quello di mantenere la potenza prodotta costante. Tuttavia, per quanto detto, un sistema nucleare per fare ci` avr` o a
2 La differenza tra isotropo e isotropizzante ` sottile ma sostanziale. Lo scattering ` e e un fenomeno isotropizzante nel senso che la direzione di volo del neutrone in uscita ha probabilit` indipendente dall’angolo solido. Un materiale ` invece detto isotropo rispetto a e ad un fenomeno ove tale fenomeno ha una probabilit` di avvenire equa indipendentemente a dall’angolo solido di volo

53

che renderanno imu possibile la previsione a priori del consumo di combustibile. in quanto possono provocare la formazione di cricche all’interno degli elemen- 54 . sempre in moto per il controllo del k effettivo) Controllo chimico : Si parla in questo caso del cosiddetto avvelenamento del refrigerante per via chimica. la vita del reattore che precede la sostituzione. Questo non accade in quanto durante la vita di un reattore.bisogno di un quantitativo elevato di sistemi di controllo e regolazione. Questa dunque dovr` essere a programmata tenendo in considerazione. 3 Ci si potrebbe in realt` chiedere per quale ragione il consumo non pu` essere proa o grammato in anticipo sfruttando i metodi pi` precisi che vengono utilizzati in fase di u progettazione. pi` o meno traumatici. di cui esistono a loro volta diverse tipologie: • Per lo spegnimento rapido (scram) • Per la macro regolazione (abbassamento / innalzamento richieste di rete) • Per la micro regolazione (o regolazione fine. Essi sono infatti applicati a problemi meno e critici. I veleni di cui si ` parlato finora sono bruciabili. Esistono fondamentalmente tre tipi di sitemi di controllo: Barre di controllo : Sono sistemi a movimentazione elettromeccanica. ovvero che non pu` e o essere modificato a piacimento una volta che gli elementi di combustibile sono stati montati. in generale tramite dissoluzione di sali di boro Controllo fisico-chimico Alcune pastiglie inserite all’interno degli elementi di combustibile sono realizzate con dei materiali assorbitori (ad esempio ossido di gadolinio) Dei tre sistemi descritti l’ultimo ` l’unico non online. Tale sistema ` in generale usato per regolare la presenza e di neutroni in determinate zone del reattore ed a determinate energie. seppure in maniera approssimativa. che comunque saranno in grado di assicurare tale costanza di produzione solo in prima approssimazione. la concentrazione degli ossidi di gadolinio nelle pastiglie deve essere calcolata tenendo in conto della progressiva diminuzione del loro quantitativo nel tempo. e Si tenga conto comunque che i metodi numerici associati alla risoluzione dell’equazione della diffusione multigruppo non permettono n` il controllo e di centrale n` la progettazione. ed in particolare alla programmazione della sostituzione delle barre di combustibile3 . Dunque. esso non opera sempre in condizioni nominali. in fase progettuale. Ci` implica che essi si e o consumano dopo l’uso. Il fenomeno per cui i sistemi di controllo non online sono pi` efficaci all’inizio della vita del u ` reattore che alla fine ` detto rilascio di reattivita. ma seguendo una serie di fasi a potenze differenti ed andr` a incontro ad un largo numero di transitori. Si ricorda inoltre che transitori veloci sono molto pericolosi.

se il sistema ` critico ale l’istante t non lo sar` mai anche all’istante t + ∆t. un reattore pu` essere critico anche o in totale assenza di neutroni. la cui presenza serve solo (e non ` poco) alla produzione di e energia. ma non o a esatti. ı a a 55 . e non dal numero di neutroni che vi sono contenuto. detti di cinetica a neutronica. per unit` di volume e di tempo diremo che il sistema ` critico. a Assumendo. Il nostro dominio non sar` pi` dunque una a u sfera perfetta ma un sistema complesso che abbia il pi` possibile le semu bianze del reattore reale che vogliamo andare a studiare. All’interno degli studi di criticit` ` importante ritornare alla realt` anche ae a dal punto di vista geometrico.3. stabile? Quando il o numero di neutroni che nascono da fissione per unit` di volume e di tempo ` a e sempre uguale a quelli che muoiono (sono assorbiti od escono dal sistema).1. e di questo dovr` ovviamente tenerne in conto poich` si parla di o e sistemi molto sensibili agli errori. Questo evento pu` determinare la necessit` della o a sostituzione anticipata di un elemento di combustibile. a meno di non cambiare a qualcosa nel sistema. Nella realt` delle cose non ` tuttavia possibile raggiungere a e ti di combustibile che portano alla fuoriuscita dei prodotti di fissione e la conseguente contaminazione del circuito primario. Ogni volta che tale spostamento supera una soglia anche a apparentemente molto piccola i problemi non possono pi` essere considerati u stazionari. Cercheremo in questa sede di analizzare lo sforzo computazionale che questo implica. Torniamo ora al concetto di criticit`. alla termodinamica della sottrazione del calore o al variare dell’effetto moderante in funzione della fase del moderatore. In teoria infatti ogni volta che ci troveremo in condizioni di kef f = 1 non potremo pi` parlare di criticit` e ci troveremo in condizioni u a cinetiche e. in particolare riguardo lo scostamento dalla criticit`. Stiamo parlando di un sistema a moltiplicante ove dobbiamo essere in grado di mantenere le reazioni a catena senza che queste diminuiscano od aumentino di intensit` oltre certi livelli. almeno a livello concettuale. Quindi. Come detto l’obbiettivo sar` quello di portarsi in condizioni di potenza a termica costante. La criticit` della guaina che cira conda le barre d’uranio al fine di contenere i prodotti di fissione ` tale che le saldature e presenti in detta guaina sono controllate ai raggi X una per una in fase di produzione 4 La criticit` di un reattore dipende esclusivamente dalla sua geometria e dalla sua a composizione materiale in un determinato istante.1 Il concetto di criticit` e le sue implicazioni a Come pu` un sistema rimanere. da un istante all’altro. come detto. La presenza di neutroni. dunque. composizione variabile. e ci si sposter` in un’altra classe di problemi. andranno istantaneamente a modificare la composizione materiale del sistema.4 a e Ci stiamo dunque preoccupando dello studio di criticit` di un sistema a moltiplicante tramite le equazioni della diffusione multigruppo in 3D. e le conseguenti iterazioni che essi hanno con il materiale. Questo avr` anche a implicazioni di tipo energetico legate. provocando cos` la perdit` di criticit` dello stesso. Cosa succede quando porto questi ragionamenti in una logica computazionale? Otterr` come noto dei risultati rappresentativi della realt` fisica. ad esempio. non stazionarie.

e sono evidentemente molto perie colose. Esistono invece sistemi di sicurezza intrinseca e passiva il cui compito sar` quello di far raggiungere al sistema livelli fortemente sottocritici a nel minor tempo possibile. ove nel tempo e si sono naturalmente ripetute pi` volte per pi` di un milione di anni delle situazioni di u u criticit` naturale. ed e ` sensibilmente differente dallle operazioni di spegnimento “standard”. ove si ha una perdita immediata di praticamente tutto il liquido refrigerante. Questa corrispondenza. a Si parla in particolare delle fasi di • Avviamento • Spegnimento • Regolazione del carico Incidentali Si tratta in questo caso delle condizioni in cui ` necessario e spegnere rapidamente il reattore. ove si pu` per errore configurare un sistema (ad esempio di o stoccaggio intermedio) in modo tale che questo risulti avere casualmente kef f > 1. non ` tuttavia univoca.7% 56 . e il sistema tender` di conseguenza ad oscillare continuamente a tra condizioni di lieve (si spera) sotto e sopracriticit`. ae che permettono di variare la composizione materiale del sistema a piacimento. 5 6 3. Sono situazioni tipiche ad esempio dei processi di ritrattamento del combustibile. Una delle rae gioni dell’incidente di Chernobyl ` stata anche una condizione di apparente e sottocriticit` associata tuttavia ad un aumento di popolazione neutronica.2 Fenomeni non stazionari La semplificazione di pseudo-stazionariet` ` accettabile solo in determinati ae casi. con possibilit` anche di innesco di reazioni esplosive a 6 Un caso molto particolare ` quello di una zona mineraria del Gabon. mentre in altri non ` realistica. a La criticit` ` dunque raggiungibile solo agendo sui sistemi di controllo. Alcuni esempi sono: e Transitorie Si tratta di fasi non-stazionarie non pericolose. mentre ad un sistema sottocritico corrisponde un calo della stessa. Questi incidenti e sono potenzialmente molto gravi e portano all’emissione di forti quantit` di radiazioni γ a e di neutroni. 5 L’ultimo incidente di questo tipo ` avvenuto in Giappone nel 1999. generate dall’attivit` volontaria di regolazione derivante dalla gestione del sistema. e L’incidente pi` grave che possa verificarsi in una centrale nucleare ` il u e LOCA (Loss Of Cooling Accident). in media con arricchimenti inferiori allo 0. a ` Gli incidenti di criticita sono situazioni in cui la criticit` di un a sistema ` raggiunta involontariamente.tale obiettivo. Si noti che l’uranio 235 ` in generale presente in natura in quantitativi a e molto bassi. seppur frequente. Tale operazione ` definita scram.1. In generale a sistema sovracritico corrisponde una crescita di potenza.

All’inizio di tale periodo il sistema.Approfondiamo. Una o volta completata questa fase dovr` poi utilizzare i sistemi di controllo per o aumentare la potenza passo a passo fino al valore richiesto. 3. ove dunque potremo pensare che non vi siano neutroni 7 teoricamente si dovrebbero avere problemi di questo tipo anche in fase di spegnimento o calo di potenza. qualche cenno legato ai fenomeni transitori. sar` dunque fortemente sovracritico per a due ragioni: • Per poter garantire per il numero di mesi richiesti il mantenimento della criticit`. buttarci dentro dei neutroni.3 L’importanza neutronica ed i metodi per lo studio di problemi pseudo-stazionari Immaginiamo di avere un sistema estremamente semplice. in qualche modo. in t=0. Per accendere il sistema dovr`. flusso neutronico nullo. ai quali sono infatti legate delle condizioni in cui il gestore di una centrale vorr` portarsi deliberatamente in condizioni sovracritiche. anche in presenza di sistemi di controllo a • Per poter accendere il sistema Supponiamo dunque di avere. sul quale faremo le seguenti supposizioni: • sferico • critico • geometria e compisizione materiale ben note e costanti nel tempo • trascuriamo i problemi prettamente tecnici. ma in pratica tali operazioni sono molto meno delicate in quanto un eccesso di scostamento dalla criticit` provocherebbe solo uno spegnimento troppo brusco a e non una esplosione. Nonostante ci` si tenga comunque in conto che per l’integrit` del o a sistema pi` i transitori sono lenti. privo di barre di controllo. Tale procedimento risulta essere analogo alle procedure di accensione e spegnimento. per completezza. a Cosa succede ad esempio all’accensione? Supponiamo di aver appena spento il reattore per la ricarica e di volerne garantire l’attivit` continuativa a per un quantitativo compreso tra 18 e 36 mesi. ove dunque il livello di potenza richiesto non ` raggiunto tramite un unico passaggio ma e attraverso diversi piccoli salti.1. ovvero ad esempio del caso in cui la rete richieda un aumento di potenza. meglio ` u e 57 .7 Veniamo ora invece al caso della regolazione. come la strategia scelta per la sottrazione del calore e via dicendo • poniamo tale sistema sotto al Gran Sasso.

almeno come linea generale. si avr` uno spostamento a verso la sovracriticit` del sistema a • Se andiamo ad aumentare il raggio della sfera andremo a diminuire il rapporto superficie / volume e dunque a diminuire l’incidenza delle fughe sul bilancio neutronico. tenderanno con maggiore facilit` ad uscire dal sistema rispetto a quelli a prodotti dalla prima sorgente. essendo essa posizionata pi` vicina alla fronu tiera. un neutrone pi` a u vicino al cuore del sistema sar` generalmente pi` importante di uno posto a u in prossimit` della periferia8 . avr` che i due reattori. ad esempio. e le posizioner` in due sistemi altrimenti identici. come appena detto. Torniamo al sistema sferico critico ideale. Chiamer` tali soro genti S1 ed S2 . che le barre di controllo per lo scram sono posizionate al centro del reattore. che le zone ad importanza maggiore sono quelle ove vi sono pi` neutroni u 58 . Avremo dunque. In effetti il punto chiave sta nel fatto che i neutroni prodotti dalla seconda sorgente. Questo mostra come. avremo in generale due tipi di autovalori: • Materiale 8 In diffusione monodimensionale importanza e flusso neutronico coincidono. dopo il transitorio iniziale. a livello neutronico. il che porta anche in questo caso ad uno spostamento verso la sovracriticit` a Se passiamo dunque al problema numerico corrispondente. della sua direzione di volo ma anche della sua posizione. a Conoscere l’importanza che i neutroni hanno in una determinata zona del reattore ` fondamentale ai fini della progettazione delle barre di controllo e ed in generale dei sistemi di sicurezza e regolazione. Si vede dunque che.Supponiamo ora di poter generare all’interno di tale sistema delle sorgenti di neutroni puntiformi in maniera totalmente arbitraria. Il loro intervento sar` a infatti tanto pi` efficace tanto maggiore ` l’importanza dei neutroni che essi u e andranno ad assorbire. Definiamo dunque importanza di un neutrone come il contributo che esso pu` dare all’ottenimento delo la potenza asintotica del sistema. in due o posizioni diverse (immaginiamo S1 esattamente al centro del sistema ed S2 in prossimit` del confine). Cosa accadrebbe se andassimo a modificare la geometria o la composizione materiale? Non ` difficile intuire e che: • Se andiamo ad aumentare l’arricchimento. Essa ` una funzione dell’energia del e neutrone. o si porteranno a due condizioni di equilibrio differenti tra loro. con potenze P1 e P2 prodotte diverse. A parit` dunque delle prime due variabili. La domanda che ci poniamo ` la seguente: i due a e sistemi si comporteranno in maniera differente? Ricordando la supposizione iniziale di criticit` e geometria e compoa sizione materiale costanti. non tutte le zone del rettore sono uguali.

il quantitativo di veleni ancora presenti. in pratica in modo discreto nel momento in cui il dominio energetico ` suddiviso in un numero finito di gruppi e 9 59 . Nonostante questo tali metodi. Per fare questo useremo dunque dei codici di calcolo in diffusione 3D multigruppo. che sar` generalmente una funzione polinomiale di a grado 2 o 3. che potremo al pi` semplificare sfruttandone la geometria u circolare ed andando dunque a studiarne solo un quarto della sezione. Coarse mesh s ove si applica una logica opposta: la discretizzazione spaziale ` molto grossolana. Il fine ` quello di gee stire i programmi di ricarica del combustibile di un reattore tramite la modellizzazione numerica dei fenomeni che avvengono al suo interno. molto pi` grande rispetto al libero cammino medio e u 9 . e Torniamo ora alla buona vecchia analisi numerica. Tale sistema ` molto oneroso dal punto di vista computazionale. all’interno di una panoramica 3D del reattore. Parleremo sempre di condizioni di pseudo-criticit`. ma effettuando e importanti approssimazioni sul flusso neutronico (in particolare considerandolo lineare tra due nodi adiacenti) tale complessit` ` ridotta ae a livelli accettabili. il che ci porter` a a a risolvere problemi agli autovalori generati dall’omogeneit` del problema di a partenza. L’ipotesi di pseudo-criticit` ci permetter` quindi di dimenticarci a a di fatto della dipendenza dal tempo. istante per istante. Questa operazione non ` tuttavia agevole. Dunque vorr` studiare quale sar`. estrapolando i risultati al resto del sistema. Per mantenere un livello di precisione accettabile si dei neutroni sceglie tuttavia di aumentare il contenuto della definizione locale del flusso neutronico. si ricorda che il libero cammino medio di un neutrone ` funzione della sua energia. in P u239 e o a P u241 . Il problema ` che questo porta a problemi di tipo non e lineare. introdotti a nel 1972.• Geometrico Questo mi dice che di fatto che per modificare la criticit` del sistema potr` a o andare ad operare sia sulla geometria che sulla composizione geometrica dello stesso. il contenuto in U 235 . per i quali non esiste ad oggi una dimostrazione di esistenza ed unicit` della soluzione. e teoricamente in modo continuo. In questo caso il passo tra due nodi adiacenti ` dell’ore dine di grandezza del libero cammino medio dei neutroni. sono oggi molto usati nell’ambito della programmazione delle ricariche del combustibile. Ne esistono fondamentalmente due macro-famiglie: Differenze finite fini ove viene attuata una discretizzazione spinta del dominio spaziale.

ed anche se in generale il consumo e di uranio ` preponderante. esso ` ben e e lontano dall’essere esaurito. Nei momenti immediatamente successivi alla ricarica a il reattore ` fortemente sovracritico. in cui la formazione a di plutonio prevale sul consumo di uranio.10 e La condizione ideale che si vorrebbe raggiungere all’interno di un reattore nucleare ` quella di reattivit` il pi` possibile uniforme sulle varie die a u rezioni.65. Tale bilancio non ` costante durante la vita del reattore. Sappiamo bene che. 7 dei 58 reattori francesi sono adatti anche a questo scopo. detti plutonigeni. a differenza della maggior parte degli altri sistemi energetici. arricchito al 2-4%. Dunque il depauperamento della quantit` di materiale fissile all’interno del reattore ` frutto di un bia e lancio tra consumo di uranio e produzione di plutonio12 . ma opportunamente mischiati a combustibile tradizionale 10 60 . ma tale possibilit` a richiede ulteriori accortezze in ambito di sicurezza e controllo. che viene successivamente estratto ed utilizzato per fini militari. La sostituzione degli elementi di combustibile infatti. Tuttavia questa condizione ` difficile da raggiungere. e considerato e e trascurabile rispetto invece a quello dei neutroni 13 Nei reattori per la produzione di energia tale plutonio viene consumato direttamente all’interno del reattore. purtroppo.22). esiste una fase della vita del combustibile. soprattutto. ma il loro livello di diffusione ` molto ridotto. ovvero per essere alimentati tramite il materiale nucleare di orgine militare. β(P u239 ) 0. Esistono tuttavia dei reattori. che sono invece pensati per massimizzare la produzione di plutonio. Dovr` tenere in cono to. in quanto la reazione di fissione del plutonio ` molto meno controllabile di quella dell’uranio (β(U 235 ) e 0. inizialmente controllata e a dai sistemi di controllo. alle operazioni di sostituzione del combustibile sono associate anche delle fasi di movimentazione delle barre non ancora esaurite in modo da ottimizzarne il consumo 11 nei BWR l’ebollizione dell’acqua all’interno del reattore provoca una forte diminuzione di densit` di moderatore nella parte alta del reattore. in generale. ı a non ` propriamente vero. Tale fase ` detta plutonium e build-up13 Quando si genera plutonio all’interno di un sistema.3. esso vi immette reattivit`. in realt`. Questo dunque corrisponde ad una sorta di lieve “estrazione” a Si vuole qui ricordare inoltre che. nel momento in cui ` necessario il suo ricambio. alla quale corrisponde un’altrettanto a marcata diminuzione di reattivit` a 12 I calcoli legati alla diffusione neutronica sono sempre basati sull’ipotesi che i prodotti di fissione non diffondano all’interno del materiale ma restino l` dove sono. A questo proposito esistono anche reattori pensati per il processo inverso. non solo del consumo di U 235 ma anche della produzione di P u239 e P u241 . Prendiamo un generico reattore. a loro volta fissili. Questo implica che in ogni caso i combustibili a base di plutonio (o comunque contenenti parti non trascurabili di plutonio) non sono mai utilizzati da soli all’interno del reattore.2 Il consumo del combustibile nucleare Veniamo ad alcune considerazioni sul combustibile nucleare. sia nei PWR e che. la e cui intensit` e durata variano da reattore a reattore. Questo. non ` legata all’esaurimento del combustibile ma all’incapacit` di garantire la e a criticit` del reattore. ` rilasciata con il consumarsi del combustibile. con il passare del tempo. e la reattivit`. nei BWR11 .

Vediamo anche altri tipi di reattori. dall’altro lato. Ad esempio sappiamo che i CANDU. sono particolarmente facili da controllare. per come sono pensati.3 Differenze finite fini Per quanto visto avremo dunque due livelli di discretizzazione: Spaziale : nel passaggio ad un approccio numerico perdiamo come noto la continuit` dello spazio. ed ` sempre positivo in quanto e prodotto di tre quantit` definite positive. monodimensionale e monogruppo. la gestione del combustibile ` pessima. 3. il che ci porter` a calcolare le grandezze fisiche a a solo in alcuni punti Energetica : ho come detto un numero finito G di intervalli monoenergetici Dunque l’ordine di discretizzazione del mio problema sar` Nx Ny Nz G.1 Diffusione monodimensionale monogruppo Veniamo ora alla scrittura del problema.delle barre di controllo. ovvero il combustibile e ` sostituito quando il suo contenuto energetico ` ancora molto elevato in e e relazione al suo contenuto iniziale. o 3. a 2 61 . Questo termine ` sempre negativo. Tale dx2 termine non ` intrinsecamente negativo. il tutto legato anche alla maggiore difficolt` del a controllo delle reazioni di fissione dell’uranio. Avr` un u o problema del tipo:  2 νΣ  D d Φ − Σa Φ + k f Φ = 0 dx2  Φ(0) = Φ(a) = 0 Ove i differenti termini assumono il seguente significato: D d Φ rappresenta il depapuperamento del bilancio dato dalle fughe. Tuttavia. in quanto risulta dal prodotto di due termini e definiti positivi cambiato di segno νΣf Φ rappresenta il termine di fissione.3. il a cui valore pu` facilmente essere molto elevato. Questo gli ` tuttavia permesso dal fatto e che tali reattori sono alimentati ad uranio naturale e permettono il ricambio del combustibile senza dover ricorrere allo spegnimento del reattore. ma lo sar` sempre (o quasi) e a nei bilanci che andremo a considerare Σa Φ rappresenta il depauperamento dato dagli assorbimenti. preoccupandoci quantomeno inizialmente del caso pi` basilare.

per come ` stato inserito. inizialmente. andando per` questa volta a modificarne la a o geometria piuttosto che la composizione materiale. e lo modificher` tramite un parametro in modo tale a o da rendere il sistema critico.15 Il problema della scelta dell’autovalore geometrico ` che il sistema che e ne risulta ` ancora pi` difficile da studiare dal punto di vista numerico in e u quanto implica una modifica delle dimensioni del dominio e. Tale problema sar` ovviamente risolto dalla soluzione banale di flusa so neutronico nullo. forzando il ı a problema a diventare stazionario: il bilancio neutronico diffusivo ` dunque e sempre nullo. Una volta fatto questo andr` a determinare il o valore di tale parametro che. non rappresenter` una a situazione di criticit`. Una soluzione non banale pu` esistere soltanto se la o composizione materiale e la geometria del sistema sono tali da renderlo critico. In generale. Uno scostamento eccessivo provocherebbe il verificarsi di fenomeni fortemente non-stazionari. Dunque io prendo un problema che. in questo caso. anche se nella realt` fisica delle cose non sar` cos` ma ria a ı. Da qui nasce appunto la natura del k: esso corrisponde all’autovalore che. ad e esempio. Lo scopo ` sempre lo stesso: e forzare la criticit` del sistema. il che non corrisponde ad altro che ad una sostituzione ideale del materiale fissile con un altro avente propriet` differenti a 14 62 . come ad esempio per comprendere in che modo un sistema critico reagisce ad una variazione della geometria del sistema. il che richiederebbe lo studio del fenomeno sotto un approccio differente. andremo a sostituire tale condizione con l’annullamento del flusso su di un confine estrapolato 15 inserire il k all’interno del termine di fissione corrisponde infatti a diminuire il ν o il Σf . non funge ad altro che a riequilibratore del fenomeno fisico. mi dir` che il sise a tema ` sottocritico se inferiore ad uno e sovracritico se superiore ad uno. della sua discretizzazione. Ho e cos` risolto magistralmente il problema della non stazionariet`. Questa non ` l’unica soluzione possibile: potrei. La geometria del sistema viene in questo caso considerata all’interno delle condizioni al contorno alle pareti. ed e ` realistica solo ove non vi sia un riflettore. inserire il k nelle condizioni al contorno. Chiaramente a la veridicit` di tale approssimazione ` garantita solo per k molto vicino ad a e uno. pur non considerando la presenza e di un riflettore. ove abbiamo imposto flusso nullo. ad esempio in caso di incidente.14 Dal punto di vista fisico. in questo caso l’autovalore ` attribuito al tere mine di fissione νΣf Φ. L’approssimazione di flusso nullo alle pareti ` detta di affacciamento al vuoto. e la risoluzione ne risente. di conseguenza. Tale modello ` utilizzato in e u e generale per altri scopi. δx e viene chiamato autovalore geometrico.Supponiamo ora di eliminare il k da tale equazione. fisicamente. esco comunque a quantificare lo scostamento dalla criticit`. imponendo che il flusso si annulli in (0 + δx) e (a − δx) ove l’autovalore diventa. La dipendenza della matrice del problema da k non ` pi` lineare.

Tale apparente incongruenza viene eliminata tramite la definizione delle derivate prime: ( dΦ Φi+1 − Φi )xi+ 1 = dx h 2 e ( dΦ Φi − Φi−1 )xi− 1 = dx h 2 da cui in definitiva la derivata seconda rispetto ad x calcolata in xi vale: ( d2 Φ Φi+1 − 2Φi + Φi−1 ) = 2 xi dx h2 Considerando D come omogeneo. diverso dal contorno fisico.Ulteriore posizione che l’autovalore potrebbe assumere ` l’andare a mode ificare la densit` del materiale. Inoltre si avr`. il che complica nettamente la comprensione di quali siano le reali conseguenze. In pratica andr` a definire un contorno estrapo olato. in modo da variare i valori di Σa e Σf . possiamo definire dunque un sistema di equazioni dato da:  Φ −2Φ +Φ νΣ  D i+1 h2i i−1 − Σa Φi + k f Φi = 0  Φ0 = Φn+1 = 0 Tuttavia stiamo qui come detto imponendo una condizione poco realistica di flusso nullo al contorno. otterrei π Φ(x) = C sin x a con k= νΣf Σa + D( π )2 a Volendo invece procedere dal punto di vista numerico. anche in questo caso. Il a problema in questo caso risiede nel fatto che ogni modifica della densit` a materiale andrebbe ad agire in due direzioni opposte sul sistema. In questo punto verr` in realt` effettuato un a a upgrade del problema diffusivo tramite sontenuto fisico proveniente dalla teoria del trasporto. pi` u realistico. l’introduzione di una non linearit` del a a problema. teoricamente. identificando cos` un certo numero di nodi ove ı andr` a calcolare il flusso neutronico Avr` dunque che esisteranno degli xi o o tali che Φ(xi ) = Φi . andr` ad introdurre o una discretizzazione spaziale. basato sulla e 63 . Ho per` in queso ta forma la presenza di definizioni del flusso al di fuori dei nodi preimpostati. In questo modo le derivate diventeranno del tipo: ( dΦ )xi+ 1 − ( dΦ )xi− 1 dx dx d2 Φ 2 2 ( 2 ) xi = dx h Si parla in questo caso di differenze finite centrate. Anche in questo caso dunque si ha una maggiore complessit` a della risoluzione. nonostante il suo significato fisico sia. Se andassi a risolvere il problema analiticamente. sul quale il flusso ` nullo.

una buona notizia. soprattutto ove la matrice sia sparsa ma ordinata. Questa considerazione.estrapolazione lineare dei risultati ottenuti dalla teoria del trasporto. Scegliendo γ0 = 1 e δ0 = −d otteniamo: Φ(r0 ) − d( dΦ )r = 0 dr 0 dove chiameremo d distanza estrapolata. ove ` dunque necessario ricorrere ad altri e strumenti. Nel caso monodimensionale la numerazione ` ovvia. e sar` opportuno scegliere una numerazione adeguata per ottenere effettivamente matrici a multidiagonali 16 64 . infatti. Purtroppo nemmeno la teoria del trasporto ` esatta. e di conseguenza anche il valore e di d calcolato in questo modo costituir` un’approssimazione. Le ipotesi sulle quali la teoria della diffusione ` basata. al contorno. Problemi di trasporto sono infatti invece non di tipo locale: tutti i punti sono direttamente collegati agli altri punti. mentre nei casi bi e tridimensionale non ` cos` e e ı. Avremo che. le condizioni diverranno del tipo: γ0 Φ(r0 ) + δ0 ( dΦ )r0 = 0 dr γN Φ(rN ) + δN ( dΦ )rN = 0 dr Ove δ e γ dipendono dalla geometria scelta. e il suo valore cambia a a seconda di come ho applicato tale teoria e di come ne ho risolto le equazioni 17 L’ottenimento di matrici multidiagonali dipende dalla numerazione scelta. come nel nostro caso. Questa `. a ove potremo finalmente in modo realistico imporre l’annullamento del flusso neutronico. non sono vere ificate alla frontiera del dominio. matrici sparse. Una volta determinata la frontiera estrapolata. apparentemente banale. In fisica diffusiva andremo dunque a risolvere equazioni con formulazioni: • a tre punti (1D) → matrici tridiagonali • a cinque punti (2D) → matrici pentadiagonali • a sette punti (3D) → matrici eptadiagonali17 Vediamo dunque che avremo. che ci porteranno ad approcci di tipo iterativo per la loro risoluzione. nel caso diffusivo. l’equazione della diffusione verr` risolta non sul dominio fisico ma sul dominio estrapolato. e in generale. Ho dunque ottenuto una equazione agli autovalori. provoca in realt` delle a conseguenze importanti sul tipo di problema numerico che dovremo andare a risolvere. ed in essa risieder` il costo a 16 aggiuntivo del mio upgrading. ovvero un problema del tipo D(λ)Φλ = 0 La diffusione rappresenta un problema fisico di tipo locale: ci` che accade o nel nodo i ` direttamente collegato a ci` che accade nei nodi (i+1) ed (ie o 1).

In casi come questi. Avremo dunque di fronte un problema del tipo (considerando problema monodimensionale. come e conseguenza. ovvero di fronte ad un problema non omogeneo e con matrice tridiagonale utilizzeremo un metodo diretto: il metodo della doppia passata. ovvero in presenza di un termine forzante. senza fissione ma con sorgente): −D 2 Φ + Σa Φ = S Che diventa. avere Σa = 0 e a dunque ottenere una matrice a semi-diagonale dominante. Questo vale per problemi: • Monoenergetici • Monodimensionali • Omogenei ove per omogenei si intende il fatto che le propriet` del sistema non variano a nello spazio. come una sorgente esterna. a trattare i problemi a multigruppo. la convergenza dei metodi iterativi utilizzati. matematicamente. dovendo 65 .2 Problemi con sorgente Facciamo ora un excursus sui problemi non omogenei. il che ci garantisce. mentre il termine legato alla diffusivit` D ` posizionato sia sulla diagonale che fuori. in seguito. Nella realt` sarebbe dunque possibile. Andando infatti a trascurare il termine di fissione otteniamo che la condizione di diagonale dominante ` soddisfatta e se: D D D | − 2 2 − Σa | > | 2 | + | 2 | h h h Si vede chiaramente che questo ` sempre vero. in quanto vedremo che per ogni gruppo energetico i neutroni rallentati nei gruppi precedenti risulteranno. in alcuni punti. Questo ci servir`.3. Si vede in effetti a e che per questo tipo di matrici la condizione di dominanza diagonale ` e automaticamente assicurata. monoenergetico e con dominio omogeneo. Tale soluzione verr` tuttavia applicata soltanto in a logica monodimensionale. in seguito alla discretizzazione:  Φ −2Φ +Φ  −D i+1 h2i i−1 + Σa Φi = Si  Φ0 = Φn+1 = 0 Dando luogo come detto ad una matrice tridiagonale. 3. Quando passeremo a 2 o a 3 dimensioni.Dalle equazioni notiamo inoltre che il termine di assorbimento e quello di fissione sono posizionati solo sulla diagonale.

a Avremo dunque che i valori di Σa . Come fare per introdurre tale complicazione? Esistono fondamentalmente due strategie differenti Una possibilit` ` scegliere di posizionare alcuni nodi di flusso in ae corrispondenza delle discontinuit` materiali.3. ed anche in maniera marcata: basti pensare alle differenze che tali valori presenteranno tra il materiale nucleare e. u Si andr` dunque in questo caso ad imporre la condizione di annullamento a sul contorno estrapolato.3 Non omogeneit` dello spazio a Il generico reattore non sar` composto interamente dallo stesso materiale. Esisteranno ovviamente a molti altri nodi di discretizzazione. Si vede infatti che le equazioni discretizzate si risolvono in formule a tre punti. Faremo in generale la supposizione che tali parametri varieranno come delle funzioni a gradino.operare con matrici pi` ricche di elementi non nulli. ma la caratteristica di questo metodo 66 .0 0 δ0 V0 h0 V0 h0 V0 3. ad esempio. Si rivela utile in questa fase evidenziare come deve essere effettuato l’inserimento delle condizioni al contorno. il moderatore. si ricorrer` in genere u a ad algoritmi di tipo iterativo. Per farlo conviene integrare l’equazione della diffusione sul volume centrato sull’ultimo nodo ai confini del dominio (si supponga in questo caso r0 ). in modo tale che esse risultino costanti all’interno di ogni macro-intervallo. ma nei due nodi agli estremi del dominio si avranno a disposizione solo due valori: il flusso nel punto stesso e quello nel punto pi` interno del dominio. d2 Φ nD 2 dx − Sdx = 0 Σa Φdx + dx V0 V0 V0 Da cui si ottiene che il primo integrale diventa: nD V0 d2 Φ + dx = D0 A+ 0 dx2 + = D0 A+ 0 dΦ dr + − D0 A+ 0 r1 2 dΦ dr r0 Φ1 − Φ0 γ0 + + D 0 A0 Φ 0 h0 δ0 Ove si ` utilizzata la condizione al contorno che recita: e γ0 Φ(r0 ) + δ0 ( dΦ )r = 0 dr 0 Ne viene che l’equazione discretizzata nell’ultimo nodo risulta nella forma: + [D0 A0 Φ1 γ0 D + A+ + − 0 0 + Σ+ ]Φ0 + D0 A+ + S0 a. Σf e D varieranno da punto a punto.

possiamo ottenere delle equazioni che possono essere espresse in forma matriciale come abbiamo fatto sino ad ora. ma valori a differenti. ove avremo in generale 5 elementi. e di conseguenza si potr` scegliere anche di applicare formule di e u a quadratura aperte. come ovvio. − Vi ¯ (D ¯ Φ)dV + Vi Σa ΦdV = Vi SdV Il primo integrale diventa. soltanto due elementi invece che tre. Per la risoluzione del problema ` a questo punto necessaria la scelta della e formula di quadratura da utilizzare. L’efficacia di una discretizzazione di questo tipo dipender` evidentemente a da • regolarit` della funzione a • numero di intervalli 67 . il che sta alla base dell’approccio diffusivo tramite differenze finite fini. a seguito dell’upgrading tramite teoria del trasporto questo non ` pi` vero. ove ` invece vero il contrario e Dunque nel nostro caso non ` infatti scontata la scelta: se nell’approccio e puramente diffusivo era stato imposto l’annullamento del flusso neutronico al contorno. ottenendo un bilancio integrale diffusivo. 2 2 2 2 Prendo ora l’equazione della diffusione e la integro sul tale volumetto Vi . Questo ` legato alla scelta di condizioni di annullamento del e flusso al contorno: lo stesso accade in 2D. La prima e l’ultima equazione avranno. e chiamiamo Vi a il volume di materiale attorno a ri e racchiuso dalle superfici A+ ed A− i i posizionate rispettivamente sulle ascisse ri+ 1 = ri +ri+1 e ri− 1 = ri +ri−1 . sfruttando il teorema della divergenza ¯ (D ¯ Φ)dV Vi = A+ i D dΦ dA + du A− i D dΦ dA = du + = D i A+ ( i dΦ dΦ − )ri+ 1 + Di A− ( )ri− 1 i dr dr 2 2 Se a questo punto introduciamo la linearit` del flusso tra due nodi adiaa centi.` appunto quella di imporre che alcuni di questi nodi siano posizionati ove e abbiamo il cambiamento dei valori delle costanti nucleari. tranne per i nodi di bordo ove saranno 4 e i nodi di spigolo ove infine avremo 3 elementi non nulli. Prendiamo un nodo ri centrato su di una discontinuit`. con la sola differenza che non ci sar` un unico valore per le costanti materiali in tutta la matrice. ove gli estremi del dominio sono utilizzati come nodi Aperte . Esse si dividono in due macro categorie: Chiuse .

J =D Φ e. La discontinuit` dunque in questo caso non ` concentrata in a e mezzo al volume. ma come al contempo sia necessario il lato in cui viene calcolata la derivata. per ogni intervallo. per essere risolto. Infatti: D i A+ ( i dΦ dΦ )r− − Di A− ( )r+ − Σa i dr i+ 1 dr i− 1 2 2 ΦdV + Vi Vi SdV = 0 Si vede come in questo caso compaia soltanto un valore delle costanti nucleari D e Σa . ma continuo ad avere il e a calcolo di delle grandezze (questa volta il flusso neutronico) in nodi fittizi. Per riportarmi ad una formula a tre punti canonica utilizzer` l’imposizione o della saldatura della corrente neutronica. essendo Di = Di+1 −→ Φ+ 1 = i+ 2 −→ Di ( Φi+ 1 )+ = Di+1 ( Φi+ 1 )− 2 2 Φ− 1 i+ 2 In effetti un qualsiasi problema matematico deve. in quanto esse sono costanti all’interno del volumetto. e Nel secondo caso le discontinuit` non sono posizionate sui nodi di flusso. in modo che il volume di 2 2 materiale Vi centrato in ri si ritrovi ad avere costanti materiali uniformi al suo interno. dovr` andare ad imporre una nuova o condizione al contorno per ogni volume elementare 18 68 . la linearit` del flusso.Da qui la scelta del libero cammino medio neutronico come ordine di grandezza della discretizzazione18 : per poter supporre flusso lineare tra un nodo e l’altro ` necessario che la maglia sia molto fine. a ma nei nodi “fittizi” del tipo ri+ 1 e ri− 1 . ma ai suoi bordi. che ` infatti e discontinua sulle due superfici di confine. di conseguenza. di conseguenza. Avendo imposto. andando ad aumentare la precisione della modellizzazione e dunque il grado del polinomio interpolante. anche dall’energia dei neutroni 19 Da qui naturalmente segue che. dovr` a a o imporre al suo contorno due condizioni. ove avremo dunque discontinuit` della a derivata. che dipender` dalla sezione a a d’urto di assorbimento e. che mi serviranno a determinare le costanti A e B date da: Φ = Ar + B Si noti che a questo punto sar` necessario il calcolo di λ. In questo modo compaiono per` delle derivate in nodi che non esistono: o esse andranno calcolate come ( dΦ )− dr ri+ 1 2 Φri+ 1 − Φi 2 hi 2 e ( dΦ )+ dr ri− 1 2 Φi − Φri− 1 2 hi 2 Questa definizione ` gi` migliore della precedente. avere un numero di condizioni al contorno imposte pari al numero di gradi di libert`19 .

j + Φi−1.La prima condizione ` gi` stata imposta tramite l’equazione di bilancio e a del flusso neutronico. a seguito della discretizzazione del dominio spaziale: −D[ Φi+1. in particolare riferendoci alla prima strategia scelta per tale modellizzazione. Il punto ora ` trovare il modo per passare dalla matrice Φi. 69 . Se ne e ottiene il seguente sistema:  Φr 1 −Φi Φi+1 −Φr 1 i+ 2   Di i+h2 = Di+1  hi+1 i Φr −Φi−1 Φi −Φr 1  i− 2  Di−1 i− 1 2  = Di hi−1 hi 2 2 2 2 Tramite sostituzione ` poi possibile esplicitare il valore del flusso nei nodi e intermedi in funzione di quello nei nodi reali.j − 2Φi. a L’equazione in forma analitica sar` del tipo (con sorgente ma senza a termine di fissione): −D( ∂2Φ ∂2Φ + 2 ) + Σa Φ = S ∂x2 ∂ y Da cui si ottiene.j = Si.j 2 hx h2 y Avr` dunque. una per ogni superficie di confine). la prima che abbiamo scritto.3.j + Φi. Ogni cona dizione vale infatti per due volumi. o cinque nodi di interesse: il nodo stesso pi` i quattro ad esso adiacenti nelle u due direzioni geometriche. Cerchiamo inoltre di inserire u anche in questo contesto i discorsi effettuati a proposito della non uniformit` a delle costanti nucleari. ovvero imponendo dei nodi di discretizzazione in corrispondenza delle discontinuit` delle costanti nucleari. si rivela ben presto essere in realt` solo un’apparenza.j−1 + ] + Σa Φi.j Φi. scegliendo una numerazione opportuna tale per cui la matrice finale dei coefficienti risulti il pi` semplice possibile.j al vettore e Φl . 3.4 Diffusione bidimensionale monogruppo Vediamo ora cosa accade andando a muoverci in un dominio a due dimensioni. Si tratta in effetti di un sistema a due equazioni in due incognite. per un generico punto posizionato all’interno del dominio. e di conseguenza il numero finale delle condizioni che andremo ad applicare ` esattamente quello richiesto. Quello che potrebbe in prima battuta apparire come un ipervincolare il problema (una condizione di continuit` del a flusso neutronico e due di saldatura della corrente. Ora imporremo la saldatura sulle interfacce del volume. Manterremo la maggiore complessit` legata alla non uniformit` a a delle costanti nucleari sul dominio.j+1 − 2Φi.

j ] + 2 2 hxi Φi. j − 1) (xi− 1 . yj+ 1 2 2   III (i − 1.j − Φi. differenti u a per ogni sotto-dominio del volume elementare. IV secondo la stessa logica con cui sono numerati i quadrati in un diagramma cartesiano.j − Φi.j 1 1 = [ hyj−1 Di.j 2 yj+ 1 yj− 1 2 Φi+1. che chiameremo I. j) (xi+ 1 . yj }. II I ri III IV Integriamo ora l’equazione della diffusione sul volume elementare Vi.Anche in questo caso andr` a definire dei nodi intermedi.j Φi. yj− 1 2 2 70 .j ] 2 2 hxi−1 Ove ` stata introdotta la non uniformit` del coefficiente D dividendo il e a dominio di integrazione nei quattro settori del volume elementare Vi. essendo gli altri perfettamente anologhi) ` e 20 Si chiariscono di seguito i significati degli indici e delle zone:   Zona Indicedizona spigoloesterno   I  (i. e dar` una serie di quattro contributi. III.j = 2 hxi hxi−1 Φi+1. II.j−1 + hyj Di. j − 1) (xi+ 1 .j in modo tale che in ogni sotto-dominio il valore di D risulti uniforme20 . Il primo di tali contributi (mostrato a titolo di esempio.j yj− 1 2 2 xi− 1 2 ∂ ∂Φ D )= ∂x ∂x yj+ 1 yj− 1 2 2 ∂Φ xi+ 1 dy(D )x 2 ∂x i− 1 2 dy[Di+ 1 . Supponiamo che tale nodo sia sede di una discontinuit` delle costanti a nucleari.j 1 1 − [ hyj−1 Di−1.j . attorno ad o ri. tale per cui il volume elementare costruito attorno ad esso abbia il massimo possibile di zone differenti. Tali nodi saranno gli spigoli del quadrato rappresentante il volumetto elementare costruito attorno ad ri. yj− 1   2 2   IV (i. vale a dire quattro.j = {xi .j−1 + hyj Di−1. Prendiamo ad esempio la derivata seconda lungo x: ∂ ∂Φ D dxdy = ∂x ∂x = yj+ 1 2 dy xi+ 1 2 dx( Vi.j − Di− 1 .j − Φi−1. yj+ 1   2 2 II (i − 1.j − Φi−1.j . j) (xi− 1 . Il risultato ` assolutamente analogo per quanto riguarda la derivata seconda e lungo y. Il termine contenente la sezione d’urto di assorbimento sar` invece molto a pi` agevole nel calcolo.

di agevole risoluzione. Dalla scrittura delle equazioni e dalla scelta di un metodo di numerazione naturale ( Φ11 = Φ1 . L’insieme di queste caratteristiche la rendono. dovr` imporvi e o le condizioni al contorno.j 4 Se il volume preso in considerazione ` un volume di bordo. Supporremo per A alcune caratteristiche particolari: • Elementi della diagonale non nulli: aii > 0 • Matrice simmetrica A tale scopo si veda il paragrafo 2. otteniamo un sistema del tipo seguente (ove alle X corrispondono gli elementi di matrice diversi da 0)   X X 0 X 0 0 0 0 0  X X X 0 X 0 0 0 0  Φ   S  1 1    0 X X 0 0 X 0 0 0  Φ   S  2  2     Φ   S   3    3       X 0 0 X X 0 X 0 0   Φ4   S4         0 X 0 X X X 0 X 0   Φ5  =  S5         0 0 X 0 X X 0 0 X   Φ6   S6           Φ7   S7        0 0 0 X 0 0 X X 0   Φ8   S8     0 0 0 0 X 0 X X 0  Φ9 S9 0 0 0 0 0 X 0 X X Ne risulta in questo modo una matrice pentadiagonale.Φ12 = Φ2 .1 a pagina 16 per una trattazione approfondita dei seguenti algoritmi: • Jacobi • Gauss • SOR 21 ∀ i 71 . in generale. ed utilizzando una griglia semplificata dotata di solo 9 nodi disposti in un quadrato 3x3. Si tratta inoltre di una matrice centrosimmetrica. ordinata e simmetrica a blocchi.dato da: 1 h. yj Σai.Φ21 = Φ4 ).21 Andiamo ora a risolvere il problema. andando per` ad utilizzare la condizione o al contorno di annullamento sul contorno estrapolato. come sempre a scelta tra: • Annullamento sul contorno • Annullamento sul contorno estrapolato Prendiamo un caso test: supponiamo in questa occasione di usare un algoritmo di risoluzione chiuso. xi h.j Φi. ove ogni blocco 3x3 ` a sua volta simmetrico e tridie agonale.

subiscono una serie di urti che li portano ad arrivare alle energie termiche (pari a circa 0. Essa corrisponde a dividere lo spettro energetico in un numero finito di gruppi. Dovr` inoltre imporre uno o o o pi` criteri di convergenza per decidere quando interrompere il processo u iterativo 3. alle quali essi raggiungono una sorta di equilibrio fino a quando non terminano la loro vita a seguito di fughe. siamo passati al considerare una discretizzazione a due dimensioni e alla introduzione di costanti nucleari variabili all’interno del dominio. la cui soluzione sar` Φ(r. Da quel a momento in poi.• Elementi fuori dalla diagonale negativi: ai. 7 . nel rispetto della precisione richiesta sui risultati ottenuti. Di fronte dunque ad un intervallo energetico che va dai meV ai MeV. Introduciamo ora un ulteriore elemento di complicazione.22 a Preso un generico problema. dette sezioni d’urto. Finora non ci siamo preoccupati di definire l’energia dei neutroni: essa non ` infatti mai comparsa esplicitamente nelle equazioni scritte. Il passaggio di discretizzazione energetica non ` semplice. Ogni volta che scriviamo l’equazione della diffusione. L’ordine del problema da risolvere sar` cos` diventato a ı NxMxLxG. Partendo dal caso pi` standard. Questa situazione ` per` e o solo apparente. E). u con discretizzazione spaziale monodimensionale ed a costanti nucleari uniformi su tutto il dominio. Sappiamo bene infatti che nei reattori termici i neutroni.j < 0 ∀ i = j • Matrice a diagonale dominante: |aii | > j |ai.y e z tramite rispettivamente N. a ciascuno dei quali verr` assegnato un valore medio dell’energia.j | ∀ i Opereremo tramite metodi iterativi: ne consegue che. ma anche a seconda dell’energia del neutrone incidente. e non ` e e mai stato necessario fino ad ora tirarla in ballo. esso verr` discretizzato a a nel dominio spaziale lungo x. infatti. dovr` avere anche un flusso di tentativo Φ(0) . Questo evidenzia la necessit` di ridurre al minimo il numero di gruppi che a utilizziamo per la discretizzazione dello spettro energetico. emessi con una energia media di circa 2 MeV.M ed L nodi e nello spettro energetico in un numero G di gruppi. tra i dati in ingresso. ed il numero e di gruppi dipender` dal tipo di reattore. come dobbiamo comportarci? La soluzione risiede in una discretizzazione energetica.025 eV).4 per i reattori e termici.10 per i reattori a gas e circa 20 per i reattori veloci 22 72 . il cui valore non varia soltanto a seconda del materiale considerato.3. introduciamo delle grandezze.5 Diffusione multigruppo Vediamo ora di passare alla fase successiva. tutti i neutroni la cui energia ` compresa all’interno dele l’intervallo relativo ad un determinato gruppo saranno considerati come se avessero energia esattamente pari a quella media del gruppo stesso. eventi di fissione o assorbimenti. Tale valore ` in genere assegnato pari a 3 .

Indicheremo in generale con 1 il gruppo avente energia pi` elevata e con G u quello ad energia pi` bassa23 . Esiste anche la possibilt` di avere fissioni ad energie e a superiori. ma l’incidenza percentuale di tali eventi ` di molto inferiore e 26 Si noti qui che non tutti gli urti di scattering provocano l’uscita del neutrone dal gruppo energetico. e i gli urti di up-scattering sono dunque tendenzialmente pi` frequenti che u nelle altre zone 25 La zona di termalizzazione ` quella dove le sezioni d’urto di fissione sono maggiori: e stiamo infatti parlando di un reattore termico. e considereremo soltanto fenomeni di down-scattering.26 Il bilancio neutronico relativo a tale gruppo dovr` tenere in a conto di: 23 Questa convenzione deriva dalla logica di seguire i neutroni dalla loro emissione fino al loro assorbimento: essi sono infatti emessi alle alte energie per poi essere assorbiti. Questo implica che. Qui i neutroni hanno mediamente la stessa energia della matrice materiale in cui si muovono. Entrambi questi valori saranno influenzati non soltanto dall’energia. ma anche (soprattutto per il numero di neutroni) dal tipo di nucleo fissile che li ha generati. in linea teorica. Esso si vedr` arrivare dalle a energie superiori i neutroni che hanno subito rallentamento a seguito di urti di scattering. migliore u e sar` l’approssimazione di urti a salto energetico basso a 73 . progettato in modo che i neutroni vengano rallentati dal moderatore al fine di raggiungere l’energia termica ove la sezione d’urto di fissione dell’U 235 ` maggiore. u a ovvero nella condizione in cui i neutroni sono in equilibrio termodinamico con il mezzo in cui diffondono. Pi` la discretizzazione energetica ` fine. Il gruppo G sar` dunque il gruppo termico.24 Supponiamo ora di porci nella condizione di G = 3: avr` dunque tre o gruppi. detti neutroni pronti. Nel caso di invarianza del gruppo energetico a seguito dell’urto si parla di fenomeni di in-scattering. e per arrivare e alla zona di fissione dovranno rallentare fino alle energie termiche evitando le fughe e gli assorbimenti Definisco spettro di fissione χ(E) la distribuzione che mi dice con quale probabilit` i neutroni verranno emessi da fissione con determinate ena ergie. essi potrebbero trovarsi ad incrementare la propria energia in seguito ad un urto. nella pi` parte dei casi. Prendiamo un generico gruppo intermedio. Di questi neutroni ν(E) indica il numero di quelli emessi istantaneamente. In tutte le considerazioni che seguono in realt` ignoreremo questa a possibilit` (che ci provocherebbe. rappresentativi di tre “zone energetiche”: • Zona di energia da fissione • Zona di rallentamento • Zona di termalizzazione25 Dunque la sorgente dei neutroni ` contenuta nel gruppo 1. come vedremo in seguito. l’impossibilit` a a di risolvere le equazioni relative ai vari gruppi in cascata). ovvero di urti di scattering che portano ad una diminuzione dell’energia del neutrone. ad energie inferiori u 24 Tale approssimazione ` ben supportata in tutte le zone energetiche tranne in quella e termica.

ed esister` una soluzione o a Ovviamente il sistema sar` chiuso solo a seguito dell’imposizione delle condizioni al a contorno. Si evidenzia tuttavia qui il fatto che. Eg . come e e detto. Dovr` tenere in conto di un o coefficiente di diffusione Dg diverso per ogni gruppo poich` in generale e la capacit` di diffusione dei neutroni in un mezzo dipender` dalla loro a a energia Perdite per assorbimento :Termine di pozzo legato alla sezione d’urto di assorbimento e che include sia la cattura che la fissione Comparsa di neutroni : Termine di sorgente legato sia alle reazioni di fissione che hanno origine nel gruppo g (si faccia riferimento alla funzione di distribuzione χ(E)) sia a tutti i neutroni proveniente da gruppi con indice di gruppo inferiore Perdite per rallentamento : Termine di pozzo che porta i neutroni dal gruppo g ai gruppi di indice superiore Messo in equazioni questo diverr`: a                      leakage 1 ∂Φg vg ∂t assorbimento + rallentamento χg (νΣf )g Φg + g =1 = −(− Dg Φg ) −Σa.g Φg comparsa G G + g =1 Σs. dell’up-scattering. Si noti come per ora il termine di comparsa neutronica tenga in conto.Perdite per leakage : Termine di pozzo. funzione dell’energia 27 74 . si ha una ulteriore dipendenza dal gruppo energetico in quanto la distanza di estrapolazione ` funzione della sezione d’urto di assorbimento la quale ` a sua volta.g Φg + G =1 Σs.g →g Φg +  g   + χg G =1 (νΣf )g Φg g     g = 1···G sistema simil-diffusivo ove tutte le equazioni sono accoppiate tra loro.g Φg − Σs.27 Evidentemente tale sistema ha come soluzione la soluzione banale Φ = 0. quantomeno in linea di principio.g Φg +Sg g = 1···G Ove abbiamo in questo caso introdotto la notazione del tipo Φ(r. t) = Φg (r. ove esse siano imposte sul contorno estrapolato. in quanto la sommatoria ` estesa su tutti i gruppi energetici.g →g Φg + −Σs. e Considerando il problema stazionario e privo di sorgenti esterne si ottiene   0 = −(− Dg Φg ) − Σa. Dovr` dunque risolvere un problema agli autovalori. t).

g→g Che di fatto corrisponde alla sezione d’urto totale meno quella relativa all’inscattering. E)dE Eg Eg−1 1 Φg Σt (E)Φ(r. avremo che: Eg−1 χg = Eg χ(E)dE 1 Φg 1 Φg Eg−1 Eg −1 Σs.g = Σt.g →g = (νΣf )g = Φg = Dg = Σt.E →E Φ(r. Questo termine riunisce dentro di s` tutti i termini di pozzo e all’interno del gruppo g.geometrica e materiale che mi assicurer` la criticit` e dunque la presenza di a a una soluzione diversa dal vettore nullo. E)dE Eg Eg−1 Φ(r. fatta eccezione per le fughe. E)dE Eg Eg−1 Φ(r. Andremo dunque a risolvere il problema: AΦ = kBΦ Che diventer` un problema del tipo a D(k)Φ = 0 lineare. E)dE Eg Definisco inoltre sezione d’urto di rimozione la quantit`: a Σr.g = dE Eg Eg−1 Eg dE Σs. Da queste definizioni risultano una serie di problemi: • Le medie che devo calcolare dipendono dalle soluzioni del problema stesso • All’interno del calcolo delle medie mantengo una dipendenza dalla posizione non discretizzata. e Andiamo ora a vedere come ottenere i valori da assegnare alle varie costanti che dovremo utilizzare per ogni gruppo energetico. E ) ν(E)Σf (E)Φ(r.g − Σs. E)dE Eg Eg−1 D(E) Φ(r. ove dunque la dipendenza della matrice D dal parametro k ` lineare. che rischio mi vada a complicare ulteriormente le cose La soluzione a questi problemi deriva del seguente teorema: 75 .

tale approssimazione non ` accettabile. a Per quanto riguarda le iterazioni esterne.g →g (r)Φg (r) + χg ψ(r) = 0      dΦg  Φg (R) + dg ( dr )R = 0      g = 1···G ` Ove ` stato definito il termine ψ(r) = G =1 (νΣf )g (r)Φg (r) densita di e g emissione da fissione. Per trovarla effettuer`. Infatti: ı ( )g = 1 Φg ( )Φ(r. tuttora incognita. E) = ψ(r). non posso dire lo stesso riguardo la funzione ϕ.Teorema 11 (di separabilit` spazio-energetica) a Φ(r. Introduciamo i seguenti operatori: si utilizzano in questo caso criteri di convergenza in norma.g (r)Φg (r) + g <g Σs. Andiamo a scrivere le equazioni. ϕ(E) Questo ` vero solo nelle parti pi` interne del reattore. in forma matriciale. Nelle zone di bore u do.j. Si noti come il flusso neutronico (supponendo di dare una numerazione unica alla discretizzazione spaziale di modo che Φi. in quanto non interessa il comportamento puntuale ma quello medio 28 76 . delle simulazioni iterative che mi o porteranno ad ottenere un valore accettabile per ϕ 28 . viste fino ad ora solo per componenti. Tramite l’applicazione di questo e teorema posso cos` eliminare la dipendenza spaziale dalle medie. si pu` ripartire da una equazione o di questo tipo:   −(− Dg (r) Φg (r)) − Σr. tramite teoria del trasporto. Si tratta di un problema agli autovalori. E) = = 1 ( )ψϕdE = ψϕ E 1 ( )ϕdE ϕ E Liberatomi dunque del problema della dipendenza spaziale.k diventi semplicemente Φl ) sia rappresentato da un vettore a due dimensioni: infatti per ogni Φg corrispondente al flusso nel g-esimo gruppo avremo N × M × L componenti rappresentanti i vari nodi spaziali. risolto di fatto tramite il metodo delle potenze. esse rappresentano la risoluzione del problema dal punto di vista della discretizzazione energetica. Dunque ognuna delle equazioni del sistema scritto sopra sar` di fatto a sua volta una equazione vettoriale. Definizione processo iterativo esterno Date le definizioni per le differenti variabili e costanti che andremo ad utilizzare in funzione del gruppo energetico.

1→3 (r) Σs.. ˆ  .1 (r))·  .     . χG (νΣf )1 (r) χG (νΣf )G (r) • Chiamo infine L l’operatore A + R operatore di diffusione in ambito multigruppo Il problema ` dunque riscrivibile in definitiva in forma matriciale come: e 1 (A + R)Φ + M Φ = 0 k Dove.G (r))·          • l’operatore R rappresenta il rallentamento. 0     .   .   . A= . . Ovviamente tale scrittura apparentemente semplice ha un prezzo.  Σs.... 77 . . . .• l’operatore A definisce le perdite per fughe e rimozioni  (D1 − Σr. . M =  . contenuto nel calcolo di L−1 .1→2 (r)  ˆ .. R =  Σs. Sar` di fatto una matrice a triangolare inferiore a diagonale nulla in quanto abbiamo escluso i fenomeni di in-scattering ed up-scattering   0   .   .  ˆ .. .     . ricordando che (A + R) = L e definendo infine H = −L−1 posso giungere alla scrittura “finale” (HM )Φ = kΦ Giungendo dunque nuovamente ad un problema agli autovalori classico... .   χ2 (νΣf )1 (r) ..2→3 (r)     . 0 (DG − Σr.  . . 0 • L’operatore M ` rappresenta la moltiplicazione ed ` legato alle sezioni e e d’urto di fissione   χ1 (νΣf )1 (r) χ1 (νΣf )2 (r) · · · · · · χ1 (νΣf )g (r)   . .   . . 0   . .

normalizzare la soluzione all’autovalore di modulo o massimo. sapendo per` cos` di aver eliminato uno dei due processi iterativi o ı concatenati ed essendomi cos` risparmiato.Si prosegue qui con il ragionamento fatto a proposito del metodo delle potenze. un quantitativo ı considerevole di operazioni. Una possibilit` ulteriore sarebbe quella. 1 > < ψ (n) . nel passare da un’iterazione all’altra il totale dei neutroni prodotti da fissione rimanga costante. Come risolvo dunque tale problema? Utilizzando il metodo delle potenze dovr`. νΣf = Da cui risulta che: Φ(n+1) . νΣf =< ψ (n+1) . ad esempio secondo Galerkin 78 . In quest’ottica la formula di aggiornamento sar` data da: a Φ(n+1) . νΣf = k (n+1) k (n) da cui: k (n+1) = k (n) Φ(n+1) . 1 > Da cui:29 k (n+1) = k (n) 29 < ψ (n+1) . Potrei investire un numero pur rilevante di operazioni per il calcolo di H. potr` scrivere (avendo definito C = H M): o Φ(n+1) = C (n) Φ k (n) Il problema si sposter` dunque sull’ottenimento di una legge di riaggiornaa mento per k su base fisica. per evitare che essa diverga. Supporremo di definirlo in modo tale che. e supponiamo ora che esso sia solo il parametro di normalizzazione. il prodotto scalare sia sulla discretizzazione spaziale che su quella energetica: G N (n+1) Φg (ri )(νΣf )g (ri ) g=1 i=1 Φ (n+1) . di a introdurre una pesatura. νΣf Φ(n) . Dimentichiamoci per un po’ che k corrisponde al kef f del mio problema. Il problema dell’applicazione di questo metodo. 1 > Si noti che qui non stiamo dando alcun peso differente alle varie zone del reattore. per evitare che il problema esploda. ` qui ancora pi` evidente: a e u applicando un metodo diretto si perderebbe il parallelo fisico-numerico. in definitiva. νΣf Ove ho definito con . νΣf Φ(n) . ove l’indice delle iterazioni esterne corrisponde alle generazioni neutroniche. per quanto detto. gi` descritto nell’ambito del metodo delle potenze. come accennato parlando del metodo delle potenze. Ma poich` tale autovalore ` proprio e e il k che stiamo cercando.

ottengo: CΦ(n) = kn λh [c ϕ + ( )n ch ϕh ] (1) k (2) · · · k (n−1) 1 1 k k h≥2 79 . νΣf Φ(n) . Questo ` ancora pi` visibile se andiamo ad eliminare k (n) ottenendo: e u k (n+1) = k (n) 1 C Φ(n) . νΣf k(n) = C Φ(n) .Che si pu` scrivere anche come: o < ψ (n) ψ (n+1) . 1 > k (n+1) = 1 < k(n) ψ (n) . νΣf Φ(n) . di fatto. nella maniera seguente: < ψ (n+1) . νΣf Potremmo anche vederla. all’n-esima iterazione: Φ(n) = 1 k (1) k (2) · · · k (n−1) C n−1 Φ(1) 1 k (1) CΦ(1) Che. 1 > Che ci dice che. sostituendo il valore di Φ(1) vale Φ(n) = Da cui otteniamo Φ(n) = k n−1 λh [c1 ϕ1 + ( )n−1 ch ϕh ] k k (1) k (2) · · · k (n−1) h≥2 1 C n−1 [c1 ϕ1 + ch ϕh ] k (1) k (2) · · · k (n−1) h≥2 Che. moltiplicando per la matrice C ed applicando nuovamente lo stesso procedimento. il k di una generica iterazione ` dato dal rapporto tra e il numero di neutroni da fissione prodotti in quella iterazione (non normalizzati) ed il numero di neutroni provenienti dall’iterazione precedente (ovvero il numero di neutroni prodotti all’iterazione precedente.generazioni successiva. 1 >=< (n) . per dare una ulteriore dimostrazione. Dunque: Φ(2) = Da cui. normalizzati). 1 > k (n+1) k Che corrisponde a dire che la sorgente effettiva di emissione normalizzata ` costante iterazione dopo iterazione. Sar` ora opportuno dimostrare che il k che stiamo cos` calcolando ` a ı e veramente il kef f del mio sistema nucleare e non un semplice elemento di normalizzazione. In questo modo k diventa e il rapporto tra i neutroni generati tra due iterazioni .

νΣf ( λh )n k ϕh . νΣf + k n−1 c1 ϕ1 . νΣf + h≥2 h≥2 = ϕh . ottengo che: n→∞ lim k k (n) < ψ (n) . I >] k k (1) k (2) · · · k (n) h≥2 Ricordando che. I >= kn c1 < ψ1 . I >= kn λh [c1 < ψ1 . νΣf + ( )n−1 ch ϕh . νΣf ] k k (1) k (2) · · · k (n−1) h≥2 Ricorando che Φ(n) . sappiamo che il nostro Φ(n) sar` sufficientemente parallelo all’autovettore a fondamentale da poter scrivere che: CΦ(n) = kΦ(n) 80 . date le condizioni di normalizzazione scelte. I > k (1) < ψ1 .Dunque il rapporto che stiamo cercando e che definisce l’aggiornamento del mio ciclo di iterazioni diventa: k (n+1) = C Φ(n) . e ricordando che il termine di sommatoria tende a zero per tendenza del numero di iterazioni all’infinito. νΣf = k n−1 λh [c1 ϕ1 . la densita di emissione effettiva da fissione normalizzata ` costante da una iterazione ale l’altra. I > k = < ψ1 . Vediamo infine di dimostrare a che valore converger` Φ(n) a Ripartiamo dalla seguente scrittura: Φ(n) = λh k n−1 ( )n−1 ch ϕh ] [c ϕ + (1) k (2) · · · k (n−1) 1 1 k k h≥2 Se moltiplico scalarmente da entrambe le parti per il vettore νΣf Φ(n) . νΣf = k n c1 ϕ1 . essendo moltiplicati per la potenza di un numero inferiore ad 1 in modulo. I > k (1) k (2) · · · k (n) < ψ (n) . νΣf ( λh )n−1 k Tale valore tender` inevitabilmente a k per infinite iterazioni in quanto i a termini legati alle sommatorie. I > k (n) < ψ (1) . I > e moltiplicando ambo i membri per k si ottiene: k(n) k k (n) < ψ (n) . I > + ( )n−1 ch < ψh . νΣf =< ψ (n) . I > k da cui kn c1 = n→∞ k (1) · · · k (n) lim = Se supponiamo di essere giunti sufficientemente vicini alla convergenza. tenderanno a zero. νΣf Φ(n) .

Questo mi implica la possibilit` di calcolare l’equazione per il gruppo 1: a D1 Φ1 − Σr. sostutuito nell’equazione precedente porta alla forma n→∞ lim Φ(n+1) = C (n) Φ = n→∞ k (n) k = lim (n) Φ(n) n→∞ k kn = lim (1) c1 φ1 = n→∞ k · · · k (n) < ψ (1) . non tende ad un vettore parallelo all’autovettore fondamentale. e ci siamo imbattuti in un problema di importanza rilevante: la soluzione delle equazioni per il problema agli autovalori richiede. valore aggiornato o 81 . a Vediamo nel dettaglio come procede il calcolo. l’inversione di una matrice di dimensioni raguardevoli. perch` impedisce di mantenere e il parallello fisico-matematico tra iterazioni e generazioni neutroniche. ottengo: lim Φ(n) = ϕ1 n→∞ autovettore fondamentale. per ogni equazione. per il calcolo della matrice di iterazione per il metodo delle potenze. Dunque la mia soluzione. Si ` inoltre detto come l’inversione diretta di tale mae trice non porti ad ottenere i risultati sperati. Definizione del processo iterativo interno Ci siamo fino ad ora preoccupati soltanto delle iterazioni esterne. In questo caso tuttavia non si tratta pi` di un problema agli autovalori. I > k = ϕ1 (1) < ψ1 . La soluzione ` dunque quella di risolvere un problema iterativo intere no che dovrebbe teoricamente portare all’ottenimento della matrice di iterazione cercata. dunque tanto ΦG quanto ψG ed anche il k (0) . ma esattamente ad esso.che. Il problema diventer` dunque non omogeneo. u Il termine legato alla fissione verr` infatti considerato. I > k lim Ma sempre considerando la costanza della densit` di emissione effettiva e a ricordando che dopo infinite iterazioni i valori n-esimi tendono al valore esatto. risolto il quale avr` un Φ1 . Supponiamo di conoscere (0) (0) la soluzione di tentativo. a come un valore noto e non dipendente dal flusso neutronico. tramite la condizione di normalizzazione imposta.1 Φ1 + (0) S1 (0) (0) 1 S k(0) i =0 = χ1 ψ (0) (r) Ove si ` indicato con Si il termine ψ(r)(0) χ0 Si tratta dunque di un probe (1) lema diffusivo non omogeneo.

e e Il problema che ci prefiggiamo di risolvere ` sempre lo stesso: e −LΦ(n+1) = Che diventa. non ci basta avere la certezza della convergenza dei due metodi separatamente. e Sorge ora un dubbio importante: quante iterazioni fare per i due cicli?30 • In primo luogo. trattandosi di due problemi concatenati.per il flusso che verr` anche utilizzato per il calcolo del termine sorgente per a il gruppo successivo. non si verifica nel caso diffusivo in quanto il problema numerico legato alla risoluzione multigruppo dell’equazione della diffusione ` robusto e 1 k (n) M Φ(n) 82 . Q(n) ` considerato noto pari al termine sorgente. che dipende dal condizionamento del problema. e Gli indici di iterazione che compaiono nelle equazioni precedenti sono relativi alle iterazioni esterne 30 Esiste una possibilit` che potrebbe provocare il fallimento di ogni calcolo: quella per a cui l’errore sul termine sorgente sia tale da provocare la non convergenza del problema interno. Si manifesta quindi qui l’esigenza di ridurre al minimo le iterazioni interne • D’altro canto. di fatto: −LΦ(n+1) = Q(n) Ricordiamo ancora una volta che. Si pu` dimostrare che la condzione meravigliosa che carato terizza il problema della diffusione multigruppo ` che tale soglia esiste. ma ci serve essere sicuri che entrambi convergano simultaneamente. Vediamo perch´. Vediamo dunque che per ogni gruppo energetico potr` scrivere un siso tema del tipo AΦ = S Procedo successivamente come per quanto visto per il metodo di Jacobi: divido A in due matrici delle quali una diagonale. ` inutile aumentare eccessivamente il numero delle e iterazioni interne: andrei a migliorare sempre di pi` la precisione di un u problema intrinsecamente sbagliato. Questa situazione. Di particolare importanza sar` dunque l’influenza delle iterazioni interne a sulla convergenza dell’algoritmo esterno Ci chiediamo dunque se esiste una soglia per il numero delle iterazioni interne per ogni iterazione esterna che ci garantisca la convergenza dell’algoritmo esterno. al momento della risoluzione del problema interno. che porto dall’altro lato invertendola ed innescando cos` un processo iterativo del tipo ı Φ(n+1) = BΦ(n) + Q Ove la matrice B ` la matrice di iterazione. ma e ` fissata ad una sola iterazione.

tornando all’algoritmo iterativo. vale: Φ[m+n] = J n Φ[m] − (I − J n )L−1 Q Quindi si vede che in realt` non faccio n iterazioni: faccio una unica itera azione che conta come n. ed in particolare a raggio spettrale inferiore ad uno (altrimenti la convergenza non ` garantita). ove vale la corrispondenza: Q= 31 1 k (n) M Φ(n) non si ` qui specificato alcun particolare algoritmo risolutivo: la matrice J potrebbe e essere quella caratteristica di uno qualunque tra i metodi visti sino ad ora 83 . Infatti so che: Φ = (I − J)−1 Y Q Φ = −L−1 Q → −L−1 = (I −J)−1 Y → Y = −L−1 (I −J) Dunque posso riscrivere il sistema. e Riprendiamo il nostro algoritmo esterno. sostituendo l’espressione per Y. a patto di saper calcolare la potenza n-esima della matrice J. Questo modo di operare ` detto a blocchi di iterazioni. nella maniera seguente: Φ[m+1] = JΦ[m] − (I − J)L−1 Q All’iterazione successiva otterr` o Φ[m+2] = J 2 Φ[m] + (I + J)Y Q Da cui Φ[m+n] = J n Φ[m] + (I + J + J 2 + · · · + J n−1 )Y Q con (I + J + J 2 + · · · + J n−1 ) = i=0 ∞ ∞ Ji − i=n Ji Ma essendo J una matrice avente propriet` particolari. e posso supporre che la serie scritta nell’equazione precedente converga a ∞ ∞ J i = (I − J)−1 i=0 e i=n J i = (I − J)−1 J n Da cui Φ[m+n] = J n Φ[m] + (I − J)−1 (I − J n )Y Q Che.Ai fini della risoluzione iterativa il problema verr` scomposto nella maniera a seguente31 Φ = JΦ + Y Q Da questa forma posso ricavare tramite alcuni passaggi una espressione per Y.

Dunque qualunque numero non nullo di iterazioni porta all’ottenimento di un opertore fisicamente accettabile. ricordando che per l’ipotesi di base del problema ϕ = −L−1 M ϕ. avremo che e Φ(n+1) = [J m − (1 − J m )L−1 M (n) Φ → C = L−1 M k (n) Nel caso invece di m iterazioni avr` che l’operatore matriciale “approssimao to” sar` dato da:32 a M Cm = [J m − (1 − J m )L−1 (n) ] k Si noti dunque come l’aver svolto m iterazioni interne corrisponde. di ridurre ad un minimo di 1 il numero di iterazioni interne. tramite e uno ciclo iterativo interno. In effetti. il che mi permette. in quanto se fossimo in grado di calcolre il valore di tale matrice inversa non si andrebbe ad innescare alcun processo iterativo 33 Questo procedimento ` l’illustrazione nel dettaglio di quanto accennato nel capitolo e sul metodo delle potenze riguardo la risoluzione di equazioni agli autovalori generalizzate 32 84 . ad aver svolto un calcolo iterativo della matrice C (il cui valore ` incognito) della quale avremo dunque utilizzato un valore aggiornato e all’m-esima iterazione. e di procedere esternamente. u u e Perch` tale espressione non provochi la perdita di fisicit` del problema. poich` abbiamo imposto che la matrice J converge. anche se ovviamente non correto. Tutto il problema ritorna dunque al punto: si era partiti dall’idea di non saper calcolare la matrice C e si ` visto che. nella pratica delle cose. se necessario. In definitiva ci` che si opera ` la strategia seguente: o e Si noti come in tutte le considerazioni fatte fino ad ora compaia il termine L−1 anche nelle espressioni approssimate della risoluzione del problema. che sar` e a logicamente tanto pi` precisa tanto pi` alto ` il numero delle iterazioni33 . Questa ` ovviamente solo e una scrittura formale. Questo equivale a verificare che il problema approssimato all’m-esima iterazione sia ancora un problema agli autovalori avente come soluzione gli stessi autovettori del problema esatto. Dunque M ]Φ(n) k (n) Per m → ∞. si ` riusciti a procedere ad una sua stima. e a deve ancora essere valido che applicando tale operatore all’autovettore fondamentale si ottiene nuovamente l’autovettore fondamentale. si ottiene k∗ Φ(n+1) = −L−1 ϕ = [J m − (1 − J m )L−1 ϕ = J m ϕ − L−1 M ]ϕ k∗ M M ϕ + J m L−1 ∗ ϕ ∗ k k ϕ = J mϕ + ϕ − J mϕ Dunque anche l’operatore matriciale “finito” ha come soluzione lo stesso autovettore dell’operatore ottenuto dopo infinite iterazioni.Supponiamo dunque di fermarci dopo m iterazioni interne.

Utilizzo tale soluzione di tentativo per il calcolo di Φ1 . Aggiorno tutti i valori che mi serviranno per ripartire con le iterazioni esterne. Utilizzo il flusso cos` calcolato per il calcolo di Φ2 . Vediamo dunque alcuni sistemi per accelerare la convergenza Metodo di Wielaudt s Si tratta di un metodo concettualmente semplice ma di difficile applicazione.• Nella zona delle prime iterazioni si fa una sola iterazione interna per ogni iterazione esterna. per non sprecare tempo per ottenere soluzioni di base sbagliate. vale a dire k e ψ (1) (1) 3. che potrebbero essere fuorviati da una riduzione precoce dello pseudo-errore relativo.6 Accelerazione della convergenza delle iterazioni esterne Se i sistemi sono particolarmente grandi ci troveremo in una soluzione ove il rapporto di dominanza ` molto prossimo ad 1. Oltre che prestare molta attenzione ai criteri di convergenza. dopo un numero cospicuo di iterazioni. e dall’altro perch` e saranno in questa fase presenti delle approssimazioni di k tali da potermi permettere di utilizzare metodi di convergenza accelearti per le iterazioni interne Il modo di procedere in questi casi preveder` dunque di svolgere una a sola iterazione interna per ogni iterazione esterna nelle fasi iniziali. in modo da non sprecare tempo di calcolo per affinare inutilmente una soluzione che so gi` essere sbagliata a • Nella zona di congergenza asintotica dell’algoritmo posso aumentare il numero di iterazioni interne: da un lato perch` ` evidente che questo ee porti ad una maggiore precisione della soluzione. 85 . il che provocherebbe.3. Impongo una soluzione di tentativo: k (0) . se non e prendessimo alcun provvedimento. una convergenza troppo lenta. Dunque ripercorriamo le fasi risolutive: 1. ψ (0) 2. Procedendo di questo passo calcolo tutte le componenti del vettore Φ(1) 5. Giunto in una fase pi` stabile della convergenza andr` invece ad aumentare il numero delle u o iterazioni interne per migliorare la precisione della soluzione. per evitare che. Abbiamo visto fino ad ora che ` opportuno normalizzare la soluzione e ad ogni iterazione. tenendo in conto ı del solo down-scattering 4. la cui equazione risulta di fatto disgiunta dalle altre 3.

5 Applicando dunque il metodo delle potenze al problema modificato la velocit` di convergenza ` enormemente pi` alta. applicando il metodo di Wielaudt. Tale valore pu` provenire sia da o precedenti iterazioni che da calcoli indipendenti. Il metodo di Wielaudt parte dalla conoscenza di un valore k* approssimazione per eccesso del valore vero di k.01 k = 1. Metodo di Tchebychev Il metodo di Tchebychev non si basa sull’alterazione della matrice dei coefficienti. pi` o meno nascosto.99. Supponiamo di essere arrivati ad una N-esima iterazione essendo dunque in possesso di un valore k*. Si tratta in questo caso della matrice (k ∗ I − C)−1 per il cui calcolo ` necessario utilizzare ancora una volta il metodo e delle potenze. ove la matrice (k ∗ I − C) ` a e sempre invertibile in quanto abbiamo supposto k* maggiore dell’autovalore di modulo massimo e dunque la matrice risultante sar` sempre a diagonale a dominante.99 1 1. o in questo caso.01−1. cosa che non sempre risulta rapido e semplice. tre algoritmi iterativi incantenati l’uno dentro l’altro.00 k2 = 0. a e u Tuttavia c’` per` un punto. Supponiamo per` di interrompere questa pratica dopo un certo numero di iterazioni. diventa pari a: a 1 1. 86 .99 tale per cui il rapporto di dominanza del problema originario vale 0. Il punto sta ovviamente nell’effettuare le opportune valutazioni per verificare se l’applicazione di tale metodo sia conveniente o meno. ed i 1 suoi autovalori sono dati da k∗ −kh Facciamo un esempio. Scriviamo dunque un nuovo problema: k ∗ Φ − CΦ = k ∗ Φ − kΦ → (k ∗ I − C)Φ = (k ∗ − k)Φ Sar` dunque un nuovo problema agli autovalori. o e comunque in un momento in cui ci troviamo gi` nella zona asintotica del a metodo iterativo.00 = 0. Avr` dunque. La stessa quantit`. Il problema agli autovalori potr` anche essere riscritto come: a (k ∗ I − C)−1 Φ = 1 Φ k∗ − k Ove la matrice (k ∗ I − C)−1 ha gli stessi autovettori della matrice C. in cui ` contenuto il e o u e maggior costo dell’algoritmo. Supponiamo: k ∗ = 1.essa tenda a divergere all’infinito o a convergere al vettore nullo.01−0.

come deve essere perch` sia mantenuto il significato fisico. continuando ad applicare il metodo delle potenze interrompendo per` il processo di aggiornamento del termine normalizzante. dove sta l’inganno? Il passaggio ` qui molto logico: stiamo approssimando una potenza. Il calcolo dei coefficienti sar` a effettuato imponendo come condizione il fatto che Pn (1) = 1. che dunque e qualunque sia l’esponente varr` 1 se la base ` 1 a e 35 Abbiamo gi` applicato questa regola pi` volte.34 e Supponiamo inoltre di poter scrivere. dopo sole N iterazioni. Ma questo ` teoricamente e impossibile. avremo che: Φ(N +1) = 1 CΦ(N ) k∗ Da cui. Sfruttiamo ora una propriet` notevole dei problemi agli autovalori: para tendo dal generico problema Aϕ = λϕ posso scrivere che: f (A)ϕ = f (λ)ϕ A patto che f sia una funzione sufficientemente regolare. sempre con f (A) = Am a u 34 87 . ciascuno composto da un coefficiente e da una potenza di [ k1∗ C].In base a quanto detto. come spesso abbiamo fatto in precedenza. si ottiene: o Φ(N +n) = [ 1 n (N ) C] Φ k∗ Supponiamo ora di sostituire al posto della potenza n-esima del rapporto [ k1∗ C] un generico polinonmio Pn di n+1 elementi. la soluzione alla N-esima iterazione come composizione lineare degli autovettori della matrice C. Nel nostro caso posso allora scrivere che Φ(N +n) = c1 Pn ( C )ϕ1 + k∗ ch Pn ( h 35 C )ϕh k∗ kh )ϕh k∗ k c1 Pn ( ∗ )ϕ1 + k Ma poich` sappiamo che il rapporto e k k∗ ch Pn ( h 1 possiamo scrivere: ch Pn ( h Φ(N +n) = c1 ϕ1 + Le mie condizioni saranno date da kh )ϕh k∗ kh h≥2 ch Pn ( k∗ )ϕh =0 Pn (1) = 1 Dunque una volta trovati gli n+1 coefficienti del polinomio pn potr` calcoo larmi la soluzione esatta.

perdendo cos` l’omogeneit` del dominio. mentre il polinomio di Tchebychev corrispondentemente applicato dar` luogo ad un fattore di attenuazione pari a 0. in buona sostanza. riguadagnando in termini u di precisione diminuendo al minimo le dimensioni delle maglie stesse. ovvero: mina0 . a Uno dei problemi di tale metodo ` la presenza di una formula ricorsiva e a tre termini. Non posso dunque imporre condizioni tali per cui il contributo degli autovettori di indice superiore ad 1 sia nullo. Nel momento in cui le maglie aue mentano di dimensioni. Questo corrispondeva. ove in particolare le sottrazioni tra elementi possono generare rischi di esplosione dell’algoritmo. avremo che il metodo non accelerato vedr` a il termine legato al secondo autovalore di modulo massimo ridotto a σ 5 = 0. esse tenderanno inevitabilmente a contenere al loro interno materiali differenti tra loro. come incognite. Si tratta dunque di cercare i coefficienti u per il polinomio tali da minimizzare il massimo dei valori del polinomio.Evidentemente nell’utilizzo. ad esempio. ı a Per evitare di risolvere problemi in presenza di costanti nucleari non uniformi viene in generale forzata l’uniformit` del sistema: i volumi elementari del a metodo coarse mesh vengono “omogeneizzati”.4 Metodi Coarse Mesh Fino ad ora ` stato mostrato come risolvere problemi di fisica neutronica e tramite la teoria della diffusione utilizzando metodi alle differenze finite fini.774. dopo 5 iterazioni di un metodo avente σ = 0.95.an+1 (max(0 ≤ x ≤ σ)|Pn (x)|) Si pu` dimostrare che la soluzione di questo problema di ricerca di minimo o (problemi minmax) porta ai polinomi di Tchebychev ortogonali:   c0 (t) = 1 c1 (t) = t  cn+1 (t) = 2tcn (t) − cn−1 (t) La velocit` di convergenza del metodo di Tchebychev ` oscillante in funzione a e del rapporto di dominanza. ad approssimare il flusso in ogni maglia nel modo pi` semplice possibile (lineare).204 . dei kh che ovviamente non conosciamo. Per` posso fare in modo o che esso sia il pi` piccolo possibile. Le maglie sono di dimensioni molto maggiori rispetto al libero cammino medio. ovvero in cui non prendo i nodi in corrispondenza delle discontinuit` e a materiali ma al centro dei volumi considerati omogenei 36 88 . ma si vede che. 3. Il principio che sta alla base dei metodi coarse mesh ` esattamente l’ope posto.36 ottenendo cos` costanti nuı Una volta ottenuti i valori delle costanti sui volumi omogenei l’approccio utilizzato ` quello di tipo b. ` ci` su cui si punta maggiormente ` una qualit` migliore della e o e a funzione interpolante Questo genera di per s` un problema.··· .

Si andr` poi a risolvere il tutto tramite la teoria diffusione a multigruppo. per il calcolo delle quali si ricorre ancora una volta alla teoria del trasporto. Partiamo ancora una volta dal caso monocinetico. Di tutte le forme e quadratiche che potrei scrivere tramite tali variabili quella che otterr` sar` o a del tipo: Φ(ξ. un numero di equazioni pari al numero di volumi di controllo presi in considerazione. invece che linearmente. ζ definite nella maniera seguente: x − xi y − yi z − zi ξ= η= ζ= h xi hyj hzl Ove ri = xi . a si andr` in seguito ad imporre le condizioni di saldatura e le condizioni al a contorno.37 Da un lato la riduzione del numero di maglie mi riduce enormemente il numero di elementi delle matrici che andr` a risolvere. ciascuna delle quali vedr` comparire al suo interno 7 incognite. u come un polinomio di 2◦ o di terzo grado. soprattutto. Esistono fondamentalmente due approcci distinti per i metodi coarse mesh. Ipotizzeremo dunque che il flusso si comporti in modo pi` complesso. Dall’altro la non-linearit` del o a flusso provoca una non-linearit` anche nei problemi ad esso associati. η. η. ζ) = Φijl [1 + axijl ξ + bxijl ξ 2 + ayijl η + byijl η 2 + azijl ζ + bzijl ζ 2 ] Dovr` dunque andare ad imporre 7 condizioni per i 7 parametri utilizzati: o • Una condizione di soddisfacimento del bilancio integrale sul volume di controllo Si noti che una prima conseguenza di questo fatto sar` la necessit` di andare ad a a imporre un numero maggiore di condizioni al contorno 37 89 . yi . Andremo dunque a scrivere. con difficolt` molto maggiore di garantire a priori la convergenza del metodo a risolutivo.4. in quanto l’espansione al caso multigruppo presenta le stesse caratteristiche e problematiche viste per le differenze finite fini. zi ` la coordinata del nodo i-esimo.1 Metodi Quabox Per ragioni che saranno pi` chiare in seguito andr` a scrivere il flusso u o in funzione delle tre variabili adimensionali ξ. in base all’ordine dei polinomi scelti come funzioni interpolanti: Quabox se si sceglie di utilizzare polinomi di 2◦ grado Cubox se la scelta ricade invece su polinomi di 3◦ grado 3. con a conseguente maggiore complicazione della risoluzione e. nel caso 3D.cleari mediate.

l − Φi− 1 .l Vedremo in seguito che poich` quest’ultimo non ` noto e non ` presente tra e e e le incognite. • Partiamo dalla componente delle fughe. Si avr` che: a   Φ 1 = Φijl [1 + axijl + bxijl i+ 2 .j.l − 2Φi. Potr` a questo punto inserire la o dipendenza dalla variabile ξ.j.l 2 4  Φ 1 = Φijl [1 − axijl + bxijl ] i− 2 . 1 + (2 · 6) condizioni. applicando il teorema della divergenza: D ΦdV Vijl = Sijl (D Φ)ndS ∂Φ ∂x xi+ 1 2 = Dijl { hyj hzl + [y] + [z]} xi− 1 2 Ove i termini tra parentesi quadre sono gli omologhi di quanto scritto lungo x nelle direzioni y e z.j. per cui si avr` che: a ∂Φ ∂x ∂Φ ∂ξ = ∂ξ ∂x 1 ∂Φ = = hxi ∂ξ ax 2bx ξ = Φijl [ + ]= hxi hxi ax 2bx (x − xi ) = Φijl [ + ] hxi h2 i x = 90 . Ma ricordando che ogni condizione all’interfaccia ` imposta due volte.l 2 2 Φi. Cominciamo ad esplicitare il calcolo dei coefficienti scrivendo il valore del flusso all’interfaccia lungo x.l 2 2 Φi. Avremo che. Riprendiamo l’equazione della diffusione. si utilizzano le condizioni di saldatura sulla corrente neutronica per riscrivere le costanti in funzione del flusso ai nodi.• Una condizione di saldatura del flusso neutronico e della corrente neutronica per ogni interfaccia Avrei dunque in totale. otteniamo esattamente le 7 condizioni necessarie per la corretta definizione del problema.j.l bxijl = Φi+ 1 .j.l 2 4 Sommando e sottraendo membro a membro si ottengono i valori dei due coefficienti a e b lungo x in funzione del flusso all’interfaccia. una su e ogni lato della faccia stessa. per ogni volume di controllo.l + Φi− 1 .j. axijl = Φi+ 1 . La prima delle condizioni al contorno impone il bilancio integrale.j.j. del quale ci apprestiamo a calcolare le varie componenti.j.

l ) 2 2 hxi 38 Si noti come la scelta degli indici provoca l’automatica verifica della condizione di continuit` del flusso neutronico: a Φ(i)+ 1 .j. avendo sostituito le espressioni calcolate in precedenza per i coefficienti quadratici [Dijl + Φi+ 1 .j.l = Φ(i+1)− 1 .l k Si nota che.j. Se andiamo ora a scrivere il bilancio integrale completo otteniamo.l h2 i νΣf νΣf x 2 2 ( − Σa )ijl ] +{y}+{z}+( −Σa )ijl Φijl 24 k Φi. rimane la dipendenza dalle condizioni all’interfaccia.l − 4Φi.j. che: D ΦdV = 2Dijl Vijl Φijl [ Vijl by bx bz + 2 + 2] 2 hxi hyj hzl • Passando al termine successivo si ottiene che il bilancio integrale fornisce: νΣf νΣf ( − Σa )ΦdV = ( − Σa )ijl ΦdV = k k Vijl Vijl = ( νΣf − Σa )ijl Φijl Vijl k (1 + bx ξ 2 + by η 2 + bz ζ 2 )dξdηdζ Vijl Ove ancora una volta i termini dispari sono stati eliminati poich` la e loro integrazione porta ad un contributo nullo.Sostituendo questa espressione nel calcolo del bilancio integrale delle fughe si avr` che tutti i coefficienti a scompaiono in quanto non dipena denti da x. che coinvolge solo i coefficienti dei termini quadratici.l + Φi− 1 . che dovr` essere eliminata imponendo la continuit` della corrente a a 38 Dovremo dunque imporre che: neutronica −Dijl ( ∂Φ ∂Φ )x− = −Di+1.j.l ( ) + 1 ∂x i+ 2 ∂x xi+1− 1 2 ax 2bx (x − xi ) + hxi h2 i x Andando a scrivere la derivata all’interfaccia nella maniera seguente: ∂Φ ∂x x− 1 i+ 2 = Φijl = = x− i+ 1 2 1 (3Φi+ 1 . come detto. Si ottiene dunque che: ( Vijl νΣf νΣf bx + by + bz − Σa )ΦdV = ( − Σa )ijl Φijl (1 + )Vijl k k 12 Abbiamo cos` ottenuto la prima delle 7 condizioni. Dunque otterremo. in definitiva. quella legata all’annulı lamento del bilancio integrale.l − 2Φi.j.j.l + Φi− 1 .l 2 2 91 .j.j.j.

Dunque la matrice d’iterazione varier` ad ogni ciclo dell’algoritmo. in questo caso. poich` si dimostra che spesso una semplice approsimazione al secondo e 92 . 3. cona dizione tipica degli algoritmi per la risoluzione di problemi non lineari.l  ijl Di. ove dunque la matrice dei coefficienti D sar`. ma questo e di fatto a stesso materiale) si ottiene che il flusso all’interfaccia non ` altro e che la media aritmetica dei flussi calcolati nei due nodi adiacenti. Nonostante questa apparente inoffensivit` tali termini sono tuttavia neca essari.j. A nostro vantaggio va il fatto che.j.j. Essse sono infatti accoppiate tra loro ed andranno dunque risolte in modo combinato.j. ove per eliminare i flussi alle interfacce e per l’n-esima iterazione utilizzo i valori calcolati alla (n-1)-esima iterazione. La sola possibilit` e a ` quella di procedere iterativamente. Si tratta di calcoli pesanti e complessi.l Φi− 1 . dipendente dagli autovalori stessi in maniera non lineare. Il problema non ` pi` complesso in e u linea di principio. Φi+1.j. inserito opportunamente nella condizione di saldatura. scegliendo opportunamente la forma del termine di terzo grado 1 come ξ(ξ 2 − 4 ) i coefficienti lineari e quadratici rimangono gli stessi che nel caso Quabox.4.l ).j. si operer` con matrici di dimensioni inferiori ma con maga giore complessit` di risoluzione.2 Metodi Cubbox Cosa accade se l’approssimazione del flusso diviene di terzo grado? Si dimostra che. a loro volta.j. In generale i problemi di questo tipo. nonostante tutto questo.l  ijl hx 2 3(1 + hx Dijl ) 3(1 + hxi+1i+1.l =  hxi Di+1. e che il passo aggiuntivo consiste esclusivamente nel calcolo dei coefficienti di ordine cubico. fornisce l’espressione (implicita) per il flusso neutronico all’interfaccia:     Φi+ 3 . Si ha cos` un problema ı non lineare. in logica multigruppo. Si nota abbastanza velocemente che. se due mesh adiacenti hanno stessa ampiezza e stessi valori per le costanti nucleari (in questo caso in effetti ` sufficiente che sia uguale il coefficiente di diffusione. il termine di terz’ordine non aggiunge contributi nel bilancio integrale.j. si risolveranno con lo stesso principio applicato per le differenze finite fini: vi saranno due processi iterativi uno dentro l’altro. Il problema principale della forma ottenuta ` che i coefficienti stessi e dipendono.l )   4(1 − 4Φijl )  Φ + Φ Φi+ 1 .l = 2 f (Φijl . la cui convergenza non ` garantita ma e che.Che. Risolvere problemi di questo tipo ` molto complesso. non ` possibile risolvere le equazioni per i e vari gruppi energetici “a cascata”. da flussi alle interfacce.j. utilizzando questa forma particolare. funzionano e vengono correntemente utilizzati.l 2 2  4(1 − 4Φi+1.l ) D i+1 i Ho dunque in definitiva un legame decisamente complesso del tipo Φi+ 1 . ed anche dalla stessa soluzione che dobbiamo ottenere. L’unico elemento effettivamente distintivo a sta nel fatto che. nel problema a agli autovalori che andremo a risolvere.

ma l’approccio ` diverso. dinamiche. u Attenzione per`. Esso pu` essere di fatto definito in due modi equivalenti basati o per` su filosfie diverse: o • secondo il life cycle • secondo il neutron balance Il risultato ` naturalmente lo stesso. compaiono ancora una volta le condizioni alle interfacce. Alcuni nuclei figli generati dalla fissione. In questo caso utilizzeremo delle funzioni peso: dovr` dunque a essere vero che: D Φ+( Vijl νΣf − Σa ) ΦωdV = 0 k ove si ritorner` al semplice bilancio neutronico per ω = 1. bastate sulla cinetica neutronica. operando cos` ı niente pi` di un bilancio neutronico. il mio “metro” di criticit` di un a reattore. Utilizzando invece a pesi opportuni potr` calcolare i tre termini aggiuntivi. ovvero dove le operazioni e permettessero di distaccarsi solo in maniera marginale dalla criticit`. Studieremo in particolare la cinetica puntiforme Cominciamo dalla definizione del kef f .l − Φi− 1 .5 Elementi di cinetica neutronica Si ` parlato finora di fenomeni pseudo-stazionari.ordine non ` sufficiente. come era lecito attendersi.l 2 2 Φijl Ove. che applicati nelle tre direzioni forniscono le tre condizioni al contorno aggiuntive necessarie per la chiusura del problema. si dimostra che tali o 1 pesi sono del tipo ξ(ξ 2 − 4 ). 3. Quana do questa ipotesi non ` verificata non ` pi` possibile utilizzare l’approccio e e u visto fino ad ora e diventa necessario l’utilizzo di equazioni differenti.j.39 Otterr` cos` una forma del tipo: o ı cx = (fxijl ) Φi+ 1 . Sappiamo in ogni caso che se vogliamo aggiungere e un grado di libert` sar` necessario imporre una condizione al contorno ada a dizionale. Non bisogna dimenticare che da fissione non escono o soltanto i neutroni pronti. Tale imposizione non ha significato fisico ma solo matematico 93 . possono dare luogo ad ulteriore emissione di neutroni dopo un 39 Si parla ancora una volta di pesatura alla Galerkin. Nel secondo e e caso mi limito infatti a fare il rapporto tra i neutroni che si generano da fissione ed i neutroni perduti in un certo lasso di tempo. essendo instabili. che andranno a complicare ulteriormente il problema.j.

a suddividiamo la vita di un neutrone in tappe ben definite. Indicheremo con l o tmg il tempo medio di generazione. Applicando una logica del tipo “ciclo di vita” non sarebbe invece facile distinguere da che generazione essi provengono. ci A cosa devo il pedice i? Al fatto che esistono molto tipi diversi di progenitori che danno luogo ad emissione di neutroni. In realt` avremo che l0 ` una costante. Tali quantit` sono invece uguali a solo ove il reattore sia critico. le due definizioni di kef f siano effettivamente equivalenti o meno.certo lasso di tempo. sar` possibile dire anche a percorso che l0 = . a a e mentre l varia assieme al kef f . per Trascureremo in questa fase il rallentamento del neutrone. Come ne terremo dunque in conto ai fini del calcolo del kef f ? Considereremo inizialmente due popolazioni: • La popolazione di neutroni pronti. dopo tutto quanto detto sino ad ora. ma essendo la lunghezza del cammino percorso da un velocit` a neutrone inversamente proporzionale alla sezione d’urto di assorbimento40 1 o potremo in definitiva dire che l0 Σa v . Si pu` dunque vedere che. Avendo poi definito l0 come la vita media di un neutrone. per le quali il ritardo di emissione va da un massimo di circa 80 s ad un minimo dell’ordine dei ms. Si dice dunque che i neutroni ritardati tendono a ricordare il flusso neutronico che li ha generati. poich` i tempi caratterise tici della sua termalizzazione sono molto pi` veloci di quelli tipici dell’assorbimento: la u velocit` di un neutrone termico ` molto inferiore di quella di un neutrone ancora in fase a e di rallentamento 40 94 . I neutroni ritardati vengono alla luce in una situazione in cui il flusso neutronico si ` gi` evoluto. ed avremo dunque una nuova definizione del kef f come kef f = ll0 . Tenendo dunque in conto anche del contributo dei neutroni ritardati avremo che il kef f diventa: kef f = n + i ci neutroni scomparsi Si vede come la scelta di utilizzare l’approccio di bilancio neutronico per il calcolo del kef f sia dettata anche dalla necessit` di tenere in conto dei a neutroni ritardati. Potremmo tuttavia ora chiederci se. In generale essi sono divisi in 6 gruppi o famiglie. Supponendo per semplicit` di trovarsi all’interno di un reattore termico. ed ` dunque diverso da quello che vi era al moe a e mento della generazione dei loro progenitori. Tali quantit` potranno essere dunque confuse quando a si opera in regime di pseudocriticit`. in generale differente dalla vita media dei neutroni. Tali neutroni sono detti neutroni ritardati e sono di primaria importanza per il controllo delle reazioni nucleari. n • La popolazione di progenitori di neutroni ritardati. ma che lo fanno con tempi diversi.

001. Definiamo ora una serie di quantit` (ove per neutroni prodotti si intende a la totalit` dei neutroni prodotti ad una determinata generazione): a kef f = n prodotti n persi n prodotti .00110000 (e0. il che riduce di molto il fattore di moltiplicazione visto prima.08. supponendo inoltre k=1.n persi n persi kex = kef f − 1 = ρ= β = kef f −1 kef f = n prodotti . in questo caso ` abbastanza agevole e identificare le generazioni di neutroni distinte. dopo appena un secondo la cinetica del reattore ha portato alla moltiplicazione della popolazione neutronica di un fattore e10 . Utilizzando la grafite avremmo avuto che l = 10−3 s 95 . otterremo (utilizzando le opportune approssimazioni): M (t) = 1. avremo. Se prendiamo l’acqua come moderatore. l = 10−4 s41 Dunque.n persi n prodotti ρ−β = l0 = l = n esistenti n persi(per unit` di tempo) a n esistenti n prodotti(per unit` di tempo) a In base a queste definizioni avremo che: dn ρ−β = n(t) + dt l 41 λi ci (t) i questo dipende dal fatto che l’acqua ha una sezione d’urto di assorbimento elevata. Possiamo dunque supporre ragionevolmente che tutti i neutroni emessi nella fase 1 saranno assorbiti nella fase 2. per t = 1s.come sono strutturati i reattori termici.n persi (reattivit`) a n prodotti precursori di n ritardati n prodotti n pronti . La moltiplicazione del numero di neutroni che abbiamo in un tempo t ` e data da: t M (t) = k l Facciamo un esempio numerico. Questo calcolo ` stato effettuato in assenza di neutroni ritardati.001 )10000 e10 Si vede dunque che anche per un valore di kef f molto prossimo ad uno. di modo che la definizione sul ciclo di vita risulti uguale a quella sul bilancio neutronico. in pree senza dei quali il valore di l diventa circa 0.

la risposta della popolazione neutronica non e prevederebbe tale assestamento. Ma come si arriva a tale scrittura? Ripartiamo dalla dn ρ−β = n(t) + dt l λi ci (t) i supponendo per ora β. Ma 10 perch`? e Questo ` dovuto al fatto che il valore reale di l ` dato da e e ˆ= l + l i βi λi ove la sommatoria a secondo membro diventa di fatto preponderante. dopo il quale la popolazione neutronica continua ad aumentare ma in modo molto regolare e in entit` inferiore. ed ` tale per cui n(t) = β−ρ n0 . e deriva da: dci βi = −λi ci + n(t) dt l Supponiamo ora di avere un gradino di reattivit` nell’istante t=0. Supponiamo inoltre di avere all’istante iniziale dci = 0 e dn = 0 dt dt Otterremo di conseguenza (tramite l’applicazione della trasformata di Laplace) sβi ρ = ls − s + λi i Si tenga conto che nel momento in cui vado a studiare fenomeni dipendenti dal tempo sorgono problemi detti di stiffness. anche se per la reattivit` a si tratta di una approssimazione particolarmente forte. provocando u il verificarsi della situazione sopra enunciata. tale per a cui ρ = 0 per t ≤ 0 e ρ = p per t > 0 Fintanto che tale gradino ` inferiore a β. con conseguente grande attenzione che deve essere posta al momento della discretizzazione del dominio temporale 42 96 .42 Il termine legato ai neutroni ritardati contiene la popolazione all’istante t moltiplicata per l’opportuna costante di decadimento.08 nel momento in cui si considerano i neutroni ritardati. La chiave di tale processo e ` che se fosse invece ρ > β. ma si manterrebbe di rapido incremento. In questo caso appare chiaro che i fenomeni legati ai neutroni pronti sono molto pi` veloci di quelli legati ai neutroni ritardati.Ovvero la variazione del numero di neutroni per unit` di tempo ` pari alla a e produzione di neutroni pronti pi` la somma delle produzioni dei neutroni u ritardati provenienti da tutte le famiglie meno i neutroni persi. Dunque ` qui che risiede il fenomeno fondamentale che permette il controllo e delle reazioni a catena solo grazie alla presenza dei neutroni ritardati. A risposta di tale gradino ho infatti un incremento rapido per l un tempo β . legati all’accoppiamento di fenomeni aventi a tempi caratteristici differenti tra loro. rigidit`. Abbiamo detto in precedenza che il tempo di risposta l passa da circa −4 a 0. ρ e l indipendenti dal tempo. Il salto iniziale ` definito a e β prompt jump. sono ancora in grado di controle lare il reattore.

Dunque una volta fissato ρ ho tante soluzioni quanti sono i valori di λi pi` una. u Se supponiamo che tale valore sia. dunque di fatto 7. il cui valore sar` dunque molto elevato. Essa sar` dunque a limitata dal valore della costante di decadimento dei neutroni ritardati di modulo inferiore44 Cosa accadrebbe se ρ > β? Ci troveremo all’interno della zona asintotica di s1 . Se procediamo con l’antitrasformazione otteniamo che: 7 n(t) = j=1 Aj e s j t Il problema si concentra dunque sulla soluzione sj avente valore pi` grande. Otterremo di conseguenza che nella equazione a ρ = β + ls − i 43 λi βi s + λi il grande valore di s porta il contributo della sommatoria a divenire trascurabile. trascurabile rispetto a λi otteniamo43 ρ s1 = β l + i λi i Si ha dunque che: ˆ = l+ l i βi = λi βi l + i i = l(1 − β) + = (1 − β)l + i βi = λi βi (l + 1 ) λi Dunque l ` la media pesata sulle popolazioni neutroniche dei tempi medi di e vita dei neutroni pronti e dei neutroni ritardati. Dallo studio della funzione notiamo inoltre che u tali soluzioni sono tutte reali e danno luogo ad un andamento monotono a tratti. e dunque non ` possibile variarne le condizioni operative oltre ad una certa velocit` limite. e a Questo ` molto importante soprattutto in condizioni di pericolo. in modo che otteniamo per s1 : ρ−β s1 l Questo aspetto deve essere tenuto in conto in particolare quando si sceglie di ridurre il numero delle famiglie di progenitori per la semplificazione dei calcoli. ove ` nece e essario provocare lo spegnimento repentino del reattore. mediando le relative costanti di decadimento. In generale ` necessario mantenere isolata la famiglia avente la e costante di modulo inferiore in quanto essa ` quella avente ruolo chiave nei transitori e 44 97 . Si vede da quanto scritto che il reattore ha una cinetica sua. in modulo.

come mostrato dal termine di convoluzione. t) + p[λ1 c1 (r. t)       ∂c2 ∂t Con: p fattore di sopravvivenza alle catture di risonanza ε fattore di moltiplicazione veloce45 Se ne ottiene che: c1 = c10 (r)e−λ1 t + β1 νΣf ε 0 t Φ(r. t) = −λ2 c2 (r. in quanto i neutroni ritardati e sono emessi con energie inferiori e la probabilit` che essi diano luogo a fissioni veloce ` a e trascurabile 45 98 . t) + β2 pνΣf εΦ(r. t) + β1 pνΣf εΦ(r. t) − Σa Φ(r. t) + pνΣf ε(1 − β)Φ(r. che rappresenta il “ricordo“ dei neutroni ritardati. t)]  v ∂t     ∂c1 ∂t = −λ1 c1 (r. t) + λ2 c2 (r. t) = F (r)C (t) i i 2 F (r) + B 2 F (r) = 0  G   Ci Gi = νΣf ε tale fattore ` tenuto in conto solo per i neutroni pronti. t) = F (r)ϕ(t)   c (r.t) = D 2 Φ(r.Vediamo ad esempio cosa accade scegliendo di operare con due macrofamiglie:   1 ∂Φ(r. Se andiamo ad ipotizzare di poter scrivere:   Φ(r. t )e−λ1 (t−t ) dt Si vede dunque che i neutroni ritardati risentono del flusso calcolato all’istante t-t’.

t) v ∂t ∂ϕ t = = = = = = D 2 46 F (r)ϕ(t) − Σa F (r)ϕ(t) + pνΣf ε(1 − β)F (r)ϕ(t) + p[λ1 F (r)Ci (t) + λ2 F (r)Ci (t) = 2 −DBG F (r)ϕ(t) − Σa F (r)ϕ(t) + pνΣf ε(1 − β)F (r)ϕ(t) + p[λ1 F (r)Ci (t) + λ2 F (r)Ci (t) = 2 −DBG ϕ(t) − Σa F (r)ϕ(t) + pνΣf ε(1 − β)ϕ(t) + p[λ1 Ci (t) + λ2 Ci (t) = vΣa [−(L2 B 2 + 1) + (1 − β) νΣf εp]ϕ(t) + pvνΣf ε[λ1 G1 + λ2 G2 ] = Σa (1 − β) νΣf L2 B 2 + 1 εp − 1]ϕ(t) + pvνΣf ε[λ1 G1 + λ2 G2 ] 2 2 = vΣa (L2 B 2 + 1)[ 2 2 (l B + 1) Σa L B +1 1 kef f [(1 − β)kef f − 1]ϕ(t) + [λ1 G1 (t) + λ2 G2 (t)] lt lt D Σa vΣa (1 + L2 B 2 ) pενΣf Σa (1 + L2 B 2 ) Ove si ` usato che: e L2 1 lt kef f = = = per la cui dimostrazione si rimanda a testi e corsi di fisica del reattore 99 . chiamando α la nuova variabile sono qui di seguito esplicitati i passaggi che permettono di arrivare a questa forma. t) v ∂t 1 ∂ϕ(r.Otteniamo che il sistema precedente pu` essere scritto nella forma46 o   dϕ = l1 [(1 − β)kef f − 1]ϕ(t) + kelf f [λ1 G1 (t) + λ2 G2 (t)]  dt t t     dG1 = −λ1 G1 (t) + β1 ϕ(t)  dt     dG2  dt = −λ1 G2 (t) + β2 ϕ(t) La soluzione del sistema sar` data da a    1 ϕ(t) lt [(1 − β)kef f − 1] d  = G1 (t) β1 dt G2 (t) β2 1 lt kef f λ1 1 lt kef f λ1   −λ1 0 0 −λ2  ϕ(t)  ·  G1 (t)  G2 (t) Che in forma matriciale ` esprimibile come: e dx(t) ˆ = Ax(t) dt Tale sistema ` risolto evidentemente da una forma di tipo esponenziale. e ovvero: 3 x(t) = i=1 µT x(0)eαi t µi i Tale problema ` pi` facilmente risolvibile applicando alle funzioni una trasfore u mazione secondo Laplace. che potranno sembrare semplici ai pi` ma che vengono mostrati per completezza: u 1 ∂Φ(r. In questo modo.

a • Se la reattivit` ` maggiore di 0. Si noti come solo il primo dei 3 autovettori ha elementi sempre positivi. otterr` un sistema del tipo seguente: o ˆx αi x = A˜ ˜ Questo risulta essere n` pi` n` meno che un problema agli autovalori. il primo degli autovalori ` positivo. Dall’analisi dei risultati si possono trarre le seguenti conclusioni47 : • Se la reattivit` ` nulla. Ecco dunque spiegato il limite alla velocit` di e a spegnimento del reattore. ed ae e il sistema tende (asintoticamente) ad esplodere • se infine la reattivit` ` negativa anche il primo degli autovalori ` negaae e tivo. λ1 + α2 λ2 + α3 Per determinare infine gli αk devo risolvere l’equazione determinantale che assume la forma: F (α) = F (α) = lt α 1 1+lt α + 1+lt α kef f −1 kef f 2 αβi i=1 α+λi Ove ho di fatto eguagliato due espressioni per la reattivit` del sistema. ove e u e gli αi sono gli autovalori e i µi le autofunzioni. Tale e funzione ` dunque l’unica ad avere un significato fisico e 47 100 . Per la seconda e la terza riga del problema (quelle relative ai progenitori) si ottiene che: β1 µ(1) − (λ1 + α2 )µ(2) = 0 β2 µ(1) − (λ2 + α3 )µ(3) = 0 Da cui si ottiene che. anche il primo degli autovalori avr` modulo nulae a lo. Il sistema evolver` quindi in termini molto meno incisivi (ma nonosa tante ci` si muove: dunque nemmeno se il sistema fosse perfettamente o critico avremmo completa stazionariet`. vale: β2 β1 . il che porta allo spegnimento del reattore. il cui valore limite negativo ` proprio −λ1 . se non asintoticamente). il cui valore limite (raggiungibile solo per reattivit` infinitamente a negativa) ` dato da λ1 . a Questo ci permette (vedi grafico su appunti) di determinare gli autovalori della matrice A. Si vede che la velocit` a di tale spegnimento ` proporzionale al termine pi` resistente (ovvero e u α1 ).delle funzioni trasformate. } µT = {1. se il primo elemento dell’autovettore ` normalizzato e ad 1. in quanto sia λ1 che λ2 sono maggiori dell’autovalore.

E).6 Elementi di Trasporto neutronico Fino a questo momento abbiamo parlato di modellizzazione della fisica neutronica del reattore tramite l’equazione della diffusione. a costo di maggiore complessit`. Il risultato dunque di tale operazione sar` un flusso indipendente da tale variabile. E. permette di ottenere calcoli di precisione superiore.3. a Esistono due tipi di formulazione per l’equazione del trasporto neutronico: Integrale : tale formulazione permette di ottenere i valori mediati delle sezioni d’urto da utilizzare in teoria della diffusione.Ω) al posto del consueto flusso neutronico Φ(r. di modo che l’equazione del e trasporto neutronico risulter` essere invece lineare. e u Il codice attualmente in uso presso il CEA per il trasporto neutronico ` l’Apollo II e L’equazione del trasporto in forma integrale prevede una integrazione sulla direzione di volo. Caratterstica del trasporto neutronico ` quella di ignorare tali collisioni. Questo mi permette di tenere in conto del fatto che. Integro-Differenziale : tale formulazione ` la pi` usata per la progete u tazione dei sistemi nucleari48 Vediamo ora alcune differenze tipiche tra l’approccio diffusivo e quello trasportistico: Direzione di volo dei neutroni : Il primo elemento di maggiore precisione legato alla teoria del trasporto rispetto all’approccio diffusivo ` e il tenere in conto anche della direzione di volo dei neutroni. Vediamo ora di a effettuare un discorso introduttivo sul trasporto neutronico che permetta di comprenderne i principi di base. applicabile a diversi campi della u fisica. Avremo dunque a che fare con un flusso neutronico angolare Φ(r. un neutrone avr` una a direzione di volo diversa da quella di partenza. Tale non linearit` e e a nasce in generale dal considerare le interazioni tra le particelle che fanno parte della popolazione che stiamo considerando. facendo riferimento alla teoria del trasporto come ad un sistema che. a il che crea un forte parallelo con la teoria della diffusione e permette di utilizzare i risultati ottenuti in teoria del trasporto per migliorarla 50 Come soluzione di tentativo viene spesso utilizzato il risultato ottenuto con modelli diffusivi 49 48 101 . Caratteristica tipica della forma integro-differenziale ` quella di mantenere un pare allelismo tra iterazioni e collisioni neutroniche. dopo ogni evento. ove invece in forma integrale ` molto pi` difficile trovare una correlazione di questo tipo. L’equazione del trasporto pi` generica.49 Parallelismo fisico-matematico : Anche l’equazione del trasporto ` gene eralmente risolta tramite tecniche di tipo iterativo50 . ` detta equazione di Boltzmann e non ` lineare.

E → E) L’equazione che compare nell’espressione del flusso tra parentesi quadre ` e una equazione di Frehdolm di seconda specie.51 Risulter` dunque che: f (r. nell’avere a che fare con matrici sparse. raggiungere un qualsiasi a altro punto del reattore. o direzione di volo a lungo Ω o Ω . E → E) + S(r . seppure con probabilit` estremamente bassa. E → E) Σ(r. E )Φ(r .6. ma solo i nodi tra loro adiacenti presentano una dipendenza diretta.E) 4π|r − r |2 dV Ove si ` dunque supposto di poter scrivere (viste le ipotesi) e f (r . E → E) ` dato dalla a e somma dei seguenti contributi: • Scattering: 51 ΣS (r.Nel caso diffusivo si era invece visto come tale parallelismo era sempre garantito Localit` del fenomeno Si ` detto pi` volte in precedenza che l’approccio a e u diffusivo ` di tipo locale: tutti i punti del dominio sono collegati tra e loro indirettamente. E → E. a livello numerico. E) 1 4π f (r . Nel caso della teoria del trasporto. La funzione f rappresenta la probabilit` che un neutrone avente energia a E’ e direzione di volo Ω esca da un evento di interazione con energia E e direzione di volo Ω. Conseguenza di tale approccio ` l’avere a che e fare con matrici dense. ma sempre di valori compresi in un intorno dE o dΩ del punto considerato 102 . E ) fS (r. invece. Dunque un neutrone posto in un generico punto del reattore potrebbe. E.1 Formulazione integrale Sotto le ipotesi di: • Problema stazionario • Mezzo isotropo • Fenomeni di scattering di natura isotropizzante • Sorgente isotropa Si pu` scrivere l’equazione del trasporto neutronico in forma integrale nel o modo seguente: ∞ Φ(r. Ω) = 4π S(r. Ω → Ω) = 1 S(r. Questo si ripercuote. E )]dE elop (r →r. E )f (r . E) = V [ 0 Σ(r . 3. E) In realt` non si parla mai di avere esattamente energia E o E’. vengono tenuti in considerazione anche i fenomeni a distanza.

2n (r. E) = Σ(E)|r − |r | Se introduciamo l’ipotesi di mezzo omogeneo. dal termine: e eΣ(E)|r−|r | 4π|r − r |2 Effettuando la discretizzazione della variabile energetica dovremo definire delle sezioni d’urto mediate. E) = V [ 0 Σ(E )Φ(r . evidentemente. E → E)ν(r.2n (r. E ) Σ(r. la cattura neutronica non provoca riemissione di neutroni e di conseguenza non dar` luogo a ad alcun contributo 103 . in questo caso. e descrive la diminuzione di probabilit` che un neutrone arrivi a distanze a sempre maggiori senza subire eventi di qualunque tipo.2n: 2 Dovr` inoltre valere chiaramente che: a ∞ f (r. E )dE = 1 0 Il termine esponenziale ` invece legato all’attenuazione del segnale. e che rappresenta come neutroni aventi energie diverse vedono il sistema in modo diverso. E) Σn. E )dE 52 Questo termine non compare nell’espressione precedente in quanto. Risulter` di fatto che: a lop (r → r. E ) fn. Tale operazione ` tanto pi` difficile quanto e u pi` problematica ` la natura del nucleo (o kernel) dell’equazione integrale u e che ` dato.• Cattura: (Σc )52 • Fissione: Σf (r. E )] g Φ(r. possiamo far scomparire la dipendenza delle sezioni d’urto dalla posizione. E )f (E → E)dE + S(r . E) • Reazioni n. All’interno di tale termine ` contenuto il parametro “lop” lunghezza ottica del sistema. E ) ff (r. Si definisce: Σg →g = g dE g dE[Σ(E → E)Φ(r. E )] eΣ(E)|r−|r | 4π|r − r |2 dV Il problema sar` a questo punto andare a discretizzare tale equazione a a livello spaziale ed energetico. E → E) Σ(r. L’equazione si presenter` a dunque nella forma: ∞ Φ(r.

andando ad aggiungere a tutte le semplificazioni fatte sino ad ora il trascurare le reazioni n. L’approssimazione ` infatti lecita e ben posta. Ci` che si va a fare spesso ` tuttavia l’utilizzare una serie di polinomi o e ortogonali al posto della funzione esponenziale integrale. Per farlo si utilizzano delle fora mule di quadratura tramite polinomi (Newton Cotes) o tramite polinomi ortogonali (Formule di Gauss). ultima operazione prima della risoluzione numerica.57721 Tale espressione costituisce il nucleo dell’equazione. si ottiene: Φg (r) = g=1:G Il passo successivo. un tipo di e polinomio ortogonale appartenente alle funzioni speciali. Tali funzioni hanno propriet` interessanti ma sono singolari nel dominio. in quanto sono entrambi polinomi ortogonali.Se supponiamo di implementare nell’equazione la discretizzazione energetica. sar` quello di discretizzare nello spazio. e ma si ha in pi` una migliore conoscenza della funzione. Andremo dunque a u scrivere che.2n. utilizzando i polinomi di Tchebychev (modificati in modo tale da adattarne il dominio alla funzione di interesse) ∞ E1 (z) = −γ − ln z − n=0 ∗ z an Tn ( ) 8 con:  ∗  T0 = 1 T ∗ = 2t − 1  1 ∗ ∗ ∗ Tn+1 = (4t + 2)Tn (t) − Tn−1 (t) 104 . Tale singolarit` ` detta debole in quanto ` moderatamente ae e facile da risolvere. Esso ` singolare (a causa del e logaritmo) in x’. Facciamo un esempio in geometria monodimensionale:   G G a 1  Φg (x) = Σg →g Φg (x ) + (νΣf )g Φg (x ) E1 (Σg |x − x |dV 2 −a g =1 g =1 V[ G g =1 Σg →g Φg (r ) + G g =1 (νΣf )g Φg (r ) + Sg (r )] e Σ(E)|r−|r | 4π|r−r |2 dV Ove E1 ` la funzione esponenziale integrale di ordine 1. Tali funzioni a sono definite nel modo seguente: ∞ En (z) = 1 e−zt dt tn ∞ Nel nostro caso vale: E1 (z) = −γ − ln z − i=0 (−1)n zn n · n! con γ costante di Eulero Mascherani che vale circa 0.

Tale approssimazione diventa effettivamente tale solo nel momento in cui la sommatoria sui polinomi viene portata ad un numero finito di termini. attribuendogli cos` un differente signiı ficato fisico. • Scegliendo come autovlaore λ = δ si va infine ad agire sulla densit` a del materiale. Si era accennato. della possibilit` di posizionare l’aua tovalore in altri punti dell’equazione. Il problema ` che le equazioni diventano. a proposito della diffusione. Questo pu` essere fatto anche in teoria del trasporto: o • Scegliendo come autovalore λ = k si va ad influenzare la molteplic` ita da fissione ` • Scegliendo come autovalore λ = γ si va ad agire sulla collisionalita. e 105 . non lineari. in questo caso. Non considerando pi` la presenza di una sorgente avremo ottenuto un u problema agli autovalori del tipo Hk ΦK = 0 Approfondiamo anche in questo caso la scelta dell’autovalore. Quest’ultimo caso ` particolarmente interessante per e modellizzare situazioni incidentali (ove questa apparente incoerenza diventa effettivamente realistica dal punto di vista fisico).

Appendice A Aggiustamento di sezioni d’urto A. tenenti in conto ad esempio la qualit` dell’attrezzatura e a l’affidabilit` dei dati di input utilizzati e.1 Introduzione alle basi di dati La presenza di studi legati all’aggiustamento delle sezioni d’urto deriva principalmente dalla grande incertezza esistente su tali valori. Questo sistema ci ricorda innanzitutto dell’importanza del condizionamento di un problema: la presenza nota di incertezze nei dati in ingresso mi porta alla necessit` di assicurarmi che tale imprecisione non a mini la mia possibilit` di risolvere il mio problema numerico. in modo da portersi concentrare sulla misurazione delle sezioni d’urto. ai quali nei database ` sempre associato uno scostamento. pensati per avere una ottima conoscenza della geometria. a Negli anni ’70 ` stato effettuato un enorme lavoro di aggiustamento e statistico delle sezioni d’urto basato sui dati provenienti da decine di laboratori diversi. il cui valore quantifica di e quanto il valore reale pu` allontanarsi da quello nominale. in cui ` stata tenuta in conto l’affidabilit` di ogni dato tramite e a schemi precisi. Al fine di quantificare l’affidabilit` dei risultati a ottenuti dal Lab 1 sar` dunque necessario anche tenere in conto di quale sia l’affidabilit` a a dei dati dei Lab 2 e Lab 3 e la loro influenza sul processo utilizzato dal Lab 1 al fine dell’ottenimento dei suoi risultati 1 106 . In generale il risultato di tali esperimenti (detti esperimenti integrali per via del tipo di grandezze che si Si faccia l’esempio di un laboratorio (Lab 1) che effettui degli esperimenti a partire dai dati ottenuti da altri due (Lab 2 e Lab 3). di forma sferica. delle influenze che si a generano tra i differenti laboratori. Ogni valore o contenuto all’interno di tale intervallo ` considerato in accordo con i dati e sperimentali. Lo scopo ` quello di rendere il sistema il pi` semplice pose u sibile per eliminare ogni tipo di incertezze. soprattutto.1 Per le sperimentazioni sulle sezioni d’urto vengono spesso utilizzati reattori particolari.

vogliono misurare) vengono confrontati con simulazioni numeriche. e Attualmente i metodi numerici ed i calcolatori per attuarli hanno migliorato enormemente le loro prestazioni. Si tratta di dati sparpagliati e disordinati ENDF-B contiene i dati contenuti in ENDF-A opportunamente ordinati. mantenuta dai labu e oratori del sito di Los Alamos. Ed allora. uno spazio ad N-1 dimensioni di possibili nuove librerie che portano al perfetto soddis107 . per ogni nucleo di interesse nucleare e per ogni tipo di sezione d’uro. dati per circa 50’000 punti energetici. Se gi` incertezze sono presenti su quei nuclidi ben noti e facili da studiare. organizzati. In effetti uno degli esperimenti a tipici in questo ambito ` quello di “costruirsi” dei benchmark in modo tale e che questi risultino critici. ma il loro impatto sui bilanci pu` essere o comunque rilevante ed ` dunque opportuno tenerne in conto. Queste infatti sono difficili da studiare. La libreria pi` nota in fisica neutronica ` la ENDF. posto che in un sistema cos` noto e semplificato le interferenze sulla soluzione provocate da ı incertezze di vario tipo sono pressoch` escluse. i dati che li riguardano sono poi utilizzati per “testare” le librerie di sezioni d’urto. dovrebbe essere identicamente pari ad 1. sono molto difficili da misurare. Purtroppo questo non accade quasi mai. Essendo nota la loro composizione sia dal punto di vista materiale che geometrico. al fine di validare i modelli utilizzati per ottenere queste ultime. La libreria ENDF si divide in pi` sezioni: u ENDF-A che contiene i dati grezzi provenienti dai vari laboratori. come e potrebbe essere la criticit` di un sistema. si a hanno i maggiori problemi per le specie che hanno vita molto breve. In generale tuttavia ogni esperimento contiene.001% rischierei di scoprire che tale errore ` in realt` dell’ordine del punto e a percentuale a causa di imprecisione sui dati di input. interpolati ed estrapolati al fine di poter essere materialmente utilizzabili. al suo interno. quali sono ad esempio e le sezioni d’urto. Il punto principale ` che i parametri differenziali. La fase di lavoro che porta dal database di tipo A a quello di tipo B ` detta evaluation e ENDF-C contiene infine i dati sulla correttezza e l’affidabilit` di ogni dato a contenuto in ENDF-B Tali dati sono purtroppo ben lontani dall’essere corretti e completi. Vi sono contenuti. nell’ipotesi che i calcoli siano corretti. Molto pi` agevole (quanu tomeno in relativo) ` invece la misurazione dei parametri integrali. si pu` pensare di utilizzare e o il dato misurato per ottenere un miglioramento delle librerie. e sarebbe dunque un peccato sprecare un tale potenziale a causa di dati di partenza imprecisi. tramite le quali ` possibile calcoe lare un valore per il kef f di tali sistemi che. Se ad esempio imponessi con successo ad un algoritmo un margine di errore dello 0.

nel caso pi` generale i laboratori saranno cole u legati tra loro. Nel paragrafo successivo sar` a invece affrontato in modo diretto il problema dell’aggiornamento della libreria. ed i risultati dell’uno influenzeranno in qualche modo quelli dell’altro e viceversa 2 108 .2 Elementi di statistica Supponiamo di avere due misure della stessa quantit` x effettuate da due a laboratori distinti: x = x1 ± σ1 ¯ x = x2 ± σ2 ¯ Supponiamo che entrambi i laboratori siano affidabili. sia per determinare il valore o medio “reale” che per la deviazione standard. nella forma: x = c1 x1 + (1 − c1 )¯2 ˜ ¯ x sto cercando il valore opportuno per c1 . Come faccio ora a scegliere che valore usare? Dovr` utilizzare una media di qualche tipo. Dunque. A. a utili per la comprensione di quanto segue. Come fare per scegliere quale di tutti queste infinite possibilit` ` quella da utilizzare per aggiornare la libreria? ae Nel prossimo paragrafo sono introdotte (o ricordate. Il mio obiettivo sar` quello di a minimizzare la deviazione standard. a seconda delle conoscenze di chi legge) alcune nozioni basilari di statistica e probabilit`. Per farlo dovremo annullare la derivata rispetto ai pesi Questo ovviamente non ` detto: anzi. e la varo e ianza della media pesata ` pari alla media delle varianze pesata sui quadrati e dei pesi della media.facimento del calcolo ad esso associato (ove N ` il numero di parametri cone tenuti nella libreria).2 Andiamo dunque ad analizzare come ottenere il peso migliore in questo caso semplificato. Essendo che: 2 σx = E[(x − x)2 ] ˜ si avr` a 2 σx = E[x − c1 x1 − (1 − c1 )¯2 ]2 = ¯ x = E[c1 x − c1 x + x − c1 x1 − x2 + c1 x2 ]2 = ¯ ¯ ¯ = E[c1 (x − x1 ) + (1 − c1 )(x − x2 )]2 = ¯ ¯ = c2 E(x − x1 )2 + (1 − c1 )2 E(x − x2 )2 + 2c1 (1 − c1 )E(x − x1 )E(x − x2 ) ¯ ¯ ¯ ¯ 1 2 2 = c2 σ1 + (1 − c1 )2 σ2 + 2c1 (1 − c1 )E(x − x1 )E(x − x2 ) ¯ ¯ 1 Se per` i due laboratori sono indipendenti l’ultimo termine ` nullo.

. e ci costringer` a muoverci in a quella opposta.  .dell’espressione ottenuta..  . x2 ) ∼ e − (x1 −x1 )2 ¯ (x −x )2 ¯ − 2 22 2 2σ1 2σ2 109 . Questo corrisponderebbe al caso in cui siamo a conoscenza del fatto che uno dei due laboratori ha influenzato pesantemente l’altro in una direzione specifica. Generalizzando per n laboratori ottengo la matrice di correlazione:  2  σ1 σ12 · · · σ1n  σ21 σ 2  2    . σn1 2 σn Prendiamo ora un caso distinto: supponiamo di avere due misure di due grandezze diverse: x1 = x1 ± σ1 ¯ x2 = x2 ± σ2 ¯ Supponiamo ora che le grandezze di interesse siano invece: y1 = x1 + x2 e y2 = x 1 − x 2 Supponiamo ora che le due misure di partenza siano state fatte in modo tale da dare luogo a distribuzioni di probabilit` di tipo gaussiano (il teorema a del limite centrale ci dice che questo ` vero sotto determinate condizioni).  . e Dunque potr` scrivere: o x1 ∼ e − (x1 −x1 )2 ¯ 2 2σ1 x2 ∼ e − (x2 −x2 )2 ¯ 2 2σ2 La funzione di distribuzione associata ad entrambe le variabili sar` del tipo a f (x1 . in modo tale da ottenere il valore del peso c1 che minimizzi la varianza: 2 dσx 2 2 = 2c1 σ1 − 2(1 − c1 )σ2 = 0 dc1 Da cui ottengo: c1 = 2 σ1 2 σ2 2 + σ2 Se invece non elmino la covarianza ottengo: c1 = 2 σ2 − σ12 2 2 σ1 + σ2 − 2σ12 Dunque se i due laboratori non sono indipendenti tra loro potrei perfino avere un peso negativo.

come al solito. Da calcoli analoghi si pu` arrivare a scrivere che: o 2 2 σy1 = σy2 e 2 2 σy1. nonostante i dati sperimentali siano indipendenti. se i due eventi non sono correlati. Si veda come in questo caso si abbia comunque una correlazione tra le due variabili “dipendenti”.y2 2 σy1. Questo ` forzatamente generato dal fatto che tanto y1 quanto y2 dipendano e dalle stesse variabili. y2 ) = exp{ − + 1 1 1 1 [( 2 + 2 )(y1 − y1 )2 + ( 2 + ¯ 4 4σ1 4σ2 4σ1 1 1 1 ¯ 2 ¯ ¯ 2 )(y2 − y2 ) + ( 2σ 2 − 2σ 2 )(y1 − y1 )(y2 − y2 )} 4σ2 1 1 Ancora una volta esiste un termine legato alla correlazione tra le due misure. oe come abbiamo supposto vero per le due grandezze misurate sperimentalmente. La forma quadratica scritta in precedenza ` scrivibile anche in forma e matriciale (y − y )T M (y − y ) ¯ ¯ . vale a dire y1 e y2 x1 = y1 + y2 2 x2 = y1 − y2 2 Sostituendo tale espressione in quanto scritto prima ottengo una forma di questo tipo: f (y1 .y2 σy2 = 110 2 2 2 2 σ1 + σ2 σ1 − σ2 2 2 2 2 σ1 − σ2 σ1 + σ2 . Vogliamo ora calcolare la deviazione standard di σy1 2 σy1 = E[(y1 − y1 )2 ] = ¯ = E{[(x1 + x2 ) − (¯1 + x2 )]2 } = x ¯ 2 2 = σ1 + σ2 + 2σ12 Ove.Questo per` ` valido soltanto se le due variabili sono tra loro indipendenti. Se per` vogliamo scrivere una espressione analoga per le variabili o dipendenti. l’ultimo termine scompare. in cui il termine generalmente noto come “doppio prodotto” ` legato alla e covarianza.y2 = E[(y1 − y1 )(y2 − y2 )] = σ1 − σ2 ¯ ¯ Da cui posso costruire la matrice: Cy = 2 σy1 σy1. Abbiamo dunque all’esponente una forma quadratica.

Potr` ı o inoltre normalizzarla ad 1. devo moltiplicare per un opportuno fattore. ed ` di e e fatto costituita dalle derivate parziali delle varie componenti del vettore r secondo le variabili contenute nel vettore p. sembra a prima vista un compito arduo.3 Quello che mi interessa. Notiamo intanto che essa ` e e −1 definita positiva e dunque sempre invertibile. avente dimensioni I x N. a questo fine. e definice la propagazione e delle incertezze Il calcolo di tale matrice. e tale che Cy = M Ho cos` ottenuto l’espressione della funzione di distribuzione di y. basata sul troncamento al prim’ordine della serie di Taylor ` associata a r(p). ` valutare l’entit` di δr . ovvero renderla tale che f (y)dx = 1 Si dimostra che.Tale matrice non ` una matrice qualunque. Ci` che varier` con la dipendenza tra i due insiemi di o a variabili sar` la matrice M che genera la forma quadratica nell’esponenziale. Scriver` dunque o che: r(¯ + δp ) = r + δr p ¯ Da cui: δr Sδp La matrice S. a Prendiamo ora una generica funzione r = r(p) Voglio ora trovare un modo di esprimere quanto r sia sensibile alle incertezze su p. nota la matrice S. tale per cui ottengo: f (y) = det(M ) (2ϕ) N 2 1 ¯ ¯ exp[− (x − x)T M (x − x)] 2 Si noti che tale equazione ` valida per qualunque vettore y funzione di e un generico vettore x. ` detta matrice di sensitivita del problema. In realt` posso effettuare tale calcolo in modo molto rapido e semplice a 3 111 . Essa e a sar` quantificata dal parametro Cr : a T Cr = < δr δr >= = < (Sδp )(Sδp )T >= T = < Sδp δp S T >= T = S < δp δp > S T = = SCp S T Tale procedimento ` detto sandwich rule.

scrivendo che: ∂r r(p ) r(p) + (p − p) ∂p 112 . con N molto grande. in modo tale dunque che l’errore sulla risposta risulter` dipendere soltanto da a p. Supponiamo per ora che p ed r non siano correlati. posso linearizzare la differenza tra i due valori. Questo modo di procedere ` detto principio della massima verosimiglianza.3 Aggiornamento di dati differenziali a partire da dati integrali Supponiamo ora di avere una libreria p composta da N elementi. Supponiamo di essere in grado di calcolare r con un modello esatto. comunque. Il nostro scopo ` quello di aggiornare la libreria. In particolare il modo utilizzato per scegliere quale sia il valore opportuno per l’aggiornamento della libreria sar` quello di minima distanza dall’orginale: supponendo a dunque che i dati di partenza fossero scorretti ma comunque sensati. Queso ` il valore che ci imponiamo di minimizzare. l’idea ` quella di fare in modo di soddisfare le condizioni sperimentali andando e tuttavia a modificare la libreria di partenza il meno possibile. e che dunque il risultato proveniente da essa non sia troppo lontano da quello reale. che mi dice come la risposta a r ` influenzata dall’n-esimo parametro della libreria p e ∂r ∂pn d = r(p) − r la differenza tra il valore della risposta ottenuta numericamente ˜ utilizzando i dati della libreria non aggiornata e lo stesso valore calcolato sperimentalmente (o tramite libreria aggiornata: i due valori in questo primo caso coincidono) x = p − p la differenza tra la libreria “vecchia” e quella aggiornata. Come accennato in e precedenza. ovvero il parametro integrale r calcolato in funzione dell’insieme dei valori contenuti nella libreria p Sn = l’elemento del vettore di sensibilit`. la libreria di partenza non sia troppo imprecisa. Tale libreria ` utilizzata per ricavare dei parametri integrali e r in numero I molto minore di N. il discorso ora si ribalta: misuro r sperimentalmente e mi pongo il problema di utilizzare il confrontro tra il valore numerico e quello sperimentale per ottenere un aggiornamento per i dati di partenza. e Definisco dunque: p la libreria originaria p la libreria soddisfacente la prova sperimentale r(p) la risposta. e Supponendo che.A.

In quest’ottica appare chiaro che. ove al posto del vettore s e del suo trasposto compariranno la matrice S e trasposta. N+1 equazioni per la determinazione delle N+1 incognite: le x e il moltiplicatore λ. Si ottiene dunque che: x = −λsT Che. derivando: ı ∂R = 2(xT + λs) = 0 ∂x Tale espressione costituisce . ma un vettore di I componenti integrali (in numero inferiore alle N componenti della libreria). al fine di un aggiustamento. ricorrendo alla notazione introdotta in precedenza. come detto. Ci` che ne risulta ` assolutamente identico al o e caso precedente. tra i vari paramtri contenuti nella libreria che vogliamo aggiornare. ve ne saranno di pi` e meno precisi. Bisogna tuttavia notare che le considerazioni effettuate sino ad ora sono relative a dati privi di incertezze. pu` essere anche o scritta come. sx + d = 0 Il mio obbiettivo `. che mi permette di passare e istantaneamente da un problema di minimo condizionato ad uno di minimo incondizionato. x=− 113 d ssT .Che. e Il mio problema ` dunque quello di trovare un x che soddisfi l’equazione e sx + d = 0 ed al tempo stesso minimizzi il valore di x2 . ed ` opportuno dunque estendere il calcolo al caso pi` e u realistico in cui i dati presi in considerazione sono affetti da incertezze. insieme all’equazione di partenza. Ci aspetteremo che. ovvero alcuni valori avranno dati di incertezza pi` u u ampi di altri. L’espressione da minimizzare diverr` dunque: a R(x) = xT x + 2λ(sx + d) Ove il coefficiente 2 ` posto per comodit` e non influenza la correttezza del e a metodo. sostituito nella sx + d = 0 fornisce: −λssT + d = 0 da cui: λ= ed. Partiamo da alcune considerazioni teoriche. Questo non ` ovviamente il caso di una e situazione reale. quello di ridurre al minimo il valore di x. Si ottiene cos` che. Per farlo il metodo principe ` quello dei moltiplicatori di Lagrange. infine: d T s ssT Questo risultato pu` e deve essere esteso al caso in cui non si abbia una sola o risposta r.

In questo modo abbiamo da un lato adimensionalizzato i parametri in ingresso. definito con r’. Per questo ci` che andremo ad utilizzare non sar` il dato in s`. ed accorgendosi che la matrice Σ2 non ` altro che e ` la matrice di sensibilita C. ma il suo o a e rapporto con la sua stessa deviazione standard. ` diverso dal risultato e sperimentale. e dall’altro siamo sicuri di aver tenuto in conto anche della incertezza su di essi. otteniamo: x = −CS T (SCS T )−1 d Finora si ` lavorato imponendo l’esatta uguaglianza tra il risultato spere imentale e la risposta ottenuta tramite la libreria aggiornata. Questa imposizione ` in verit` poco realistica. in quanto le incertezze di calcolo mi e a impediranno generalmente di ottenere una eguaglianza esatta. da cui. Essendovi incertezza anche su r. in forma matriciale. ricorrendo ancora una volta ai moltiplicatori di Lagrange: R = ξ T ξ + η T η + 2λT (SΣp ξ − Σr η) 114 . Se a questo punto riprendiamo l’equazione di ˜ partenza: r(p ) = r(p) + S(p − p) e sottraiamo membro a membro il valore del risultato sperimentale: r(p ) − r = r(p) − r + S(p − p ) ˜ ˜ Otteniamo. definito con r. r(p ) == r ˜ Ovvero che il risultato numerico ottenuto tramite l’utilizzo della libreria aggiornata (e supposto dunque “esatto).cercheremo di concentrare la nostra opera sui dati pi` incerti. definiendo y = r(p ) − r si ottiene: ˜ y = Sx + d Andiamo ora a fare come nel caso precedente. x = Σξ r(p ) = r(p + x) = r(p + Σξ) Risolvendo il problema. che sappiamo u essere da un lato pi` “bisognosi” e dall’altro pi` facilmente responsabili u u dell’errore. Ecco dunque che scrivo y = Σr η. dovr` definire un nuovo vettore che tenga conto del fatto che le variabili o integrali di r soggette ad incertezza maggiore dovranno di fatto contare di meno. Possiamo dunque definire subito: x1 x2 ξ1 = ξ2 = ··· σ1 σ2 Da cui risulta che. Sar` dunque a necessario supporre tali valori come differenti e cercare successivamente di minimizzare la loro differenza.

Utia lizzeremo ancora una volta i moltiplicatori di Lagrange. a priori. che nulla ha a che vedere. ˜ da cui l’esponente dell’esponenziale diventa: −1 −1 Q = xT Cp x + y t Cr y ˜ Tale valore. Defo u inite delle distribuzioni gaussiane per p ed r (entrambi sono infatti soggetti ad incertezza. il secondo rappresenta invece la matrice di covarianza della misurazione sperimentale.Ove ho quindi imposto la condizione di minimizzare non solo il valore di (p − p ) ma anche quello di (r(p ) − r. il che o mi fornisce i valori: ∂Q ∂x ∂Q ∂y −1 = 2Cp x + 2S T λ → x = −Cp S T λ −1 → y = −Cr λ = 2Cr y − λ ˜ ˜ Essendo d = y − Sx ottengo che: d = Cr λ + SCp S T λ ˜ In questa espressione l’unico elemento che non conosco ` λ. Il primo rappresenta la matrice di covarianza della ˜ risposta numerica. Esplicitando e l’equazione per λ e sostituendo nel valore di ottimo trovato per x ottengo x = −Cp S T (Cr + SCp S T )−1 d ˜ Si noti la differenza tra Cr e Cr . ottenibile di conseguenza come funzione della matrice di covarianza della libreria Cp . dovr` essere minimizzato. Per procedere definisco x = p − p e y = r − r . con le librerie numeriche 4 115 . potremo scrivere la densit` di probabilit` a a a due variabili per p ed r. supponendo che entrambe siano delle gaussiane centrate sui valori ”esatti” p’ ed r’ : 1 −1 −1 f (p. Si arriva tramite i passaggi visti in ˜ 4: precedenza a scrivere che x = −Cp S T (Cr + SCp S T )−1 d ˜ y = Cr (Cr + SCp S T )−1 d ˜ ˜ Vediamo per` ora di vedere la cosa da un punto di vista pi` formale. a differenza di p’ che ` la libreria ”vera“ ed r’ che ` il core e rispondente risposta ”esatta“). r) ∼ exp{− [(p − p )T Cp (p − p )] + [(˜ − r )T Cr (˜ − r )]} r r 2 Il problema ` legato alla determinazione di p’. libreria teoricamente esatta e e praticamente incognita. definendo cos` un ı nuovo problema Q’ −1 −1 Q = xT Cp x + y t Cr y + 2λT (Sx − y) ˜ Cercher` il minimo per x ed y. derivando lungo entrambe le direzioni. per la risoluzione del problema.

che H sia l’operatore dell’equazione del trasporto neutronico. in definitiva p = p − Cp S T (Cr + SCp S T )−1 d ˜ Ecco dunque trovata un’espressione per la variazione che dovr` dare alle o variabili p in funzione del confronto tra i dati sperimentali e i calcoli numerici sui valori integrali. ma si vede come le dimensioni di tal matrice siano di ordine I.da cui. o meglio la e a possibilit` di linearizzarle senza troppi sconvolgimenti. Per farlo ricorriamo al problema aggiunto. La base di tale teoria ` la linearit` delle perturbazioni. Prendiamo ci` che dicono le dispense. quindi molto ridotto rispetto alle dimensioni N del vettore p. a A.4 Teoria delle perturbazioni Ravetto parte da un problema agli autovalori. data da: a δr = r − r0 = = (Dψ) − D(ψ0 ) = = (Dδψ) Il punto risiede ora nella valutazione del termine δψ. Dunque avremo che: a (H0 + δH)(ψ0 + δψ) = S che diventa. e partiamo da un banale problema o del tipo: Hψ = S ove supporremo. essendo S = H0 ψ0 . ψ sia il flusso neutronico stesso e S sia una generica sorgente. per dare un senso pratico ai conti. La perturbazione sul flusso generer` anche una perturbazione nella risposta. Sar` dunque: a r = Dψ Supponiamo ora che vi siano delle variazioni nell’operatore H che porteranno inevitabilmente ad una diversit` nella soluzione. Af ) = (f. H0 δψ = −δHψ0 Ove il pedice 0 indica l’operatore non perturbato. Definiamo inoltre la variabile sperimentale r (response) che dipender` dal flusso neutronico e che ` di fatto utilizzata per a e misurarlo. Questo metodo richiede l’inversione di una matrice. tanto per fare le cose semplici. definito come tale per cui (g. AT g) 116 .

ovvero senza essere costretto a risolvere il problema perturbato. sfruttando la definizione di operatore aggiunto. definito in modo tale che. Supporr` dunque che la mia ψ ∗ sia soluzione o T ψ ∗ = D. ove la sua soluzione sar` il flusso allora H e a aggiunto. e T ψ ∗ = 0 ` l’equazione aggiunta. Lo stesso pu` essere applicato ad un generico problema agli autovalori o A x = k B x. posso scrivere: Aδx + δA x = kBδx + kδB x + δk Bx Definisco ora ξ operatore aggiunto. tralasciando gli infinitesimi di ordine superiore al primo. essendo infatti stato definito fino ad ora in termini omogenei. Dunque se Hψ = 0 ` l’equazione per il trasporto in forma omogenea. Se facciamo il prodotto di tutti i termini. In questo caso andr` a risolvere il problema: o (A + δA )(x + δx ) = (k + δk )(B + δB )(x + δx ) Lo scopo della mia ricerca sarebbe quello di ottenere il valore per δk senza passare per (x + δx ). otterremo: Ax + Aδx + δA x = kBx + kBδx + kδB x + δk Bx Ricordando che il problema originario recita A x = k B x. sar`: a < g. per il quale devo ancora imporre una sorgente. date f e g due generiche funzioni.ove g ed f sono due generiche funzioni. Potr` cos` andarlo a sostituire ottenendo: del problema aggiunto H o ı δr = δψD = δψH T ψ ∗ che. diventa: δr = ψ ∗ Hδψ Ricordando quanto scritto in precedenza posso infine scrivere: δr = −ψ ∗ δHψ0 ∗ −ψ0 δHψ0 Da cui ineffetti posso trarre il valore cercato di δr senza passare per la risoluzione di problemi perturbati ma soltanto utilizzando le soluzioni non perturbate del problema diretto e del problema aggiunto. A questo punto posso supporre di risolvere anche il problema aggiunto. f > Vado dunque a risolvere il problema aggiunto: AT x∗ = kB T x∗ 117 . ξf >=< ξ T g.

δx e k x∗ . ottenendo cos` ı: x∗ . Bx ove ancora una volta ` necessario utilizzare solo le perturbazioni note e le e soluzioni del problema di partenza e del suo aggiunto. δB x + δk x∗ . δx = 0 Ci siamo cos` liberati della perturbazione della soluzione δx .Bx Sfruttando le propriet` degli operatori aggiunti ottengo che il primo termine a a destra dell’uguale ed il primo a sinistra diventano: x∗ . δA x = k x∗ . Aδx + x∗ . δA x − k ψ ∗ .ove k rimane tale in quanto risulta propriet` degli operatori aggiunti quella a di mantenere gli autovalori degli operatori originari. e possiamo ı scrivere che: x∗ . A questo punto moltiplichiamo tutta l’equazione scalarmente per la soluzione del problema agginto x∗ . 118 . Aδx = AT x∗ . Bδx = k B T x∗ . δx Che sommati tra loro danno contributo nullo in quanto rappresentano l’eqauzione dell’operatore aggiunto: AT x∗ − kx∗ B T x∗ . δB x δk = x∗ . Bδx + k x∗ .