P. 1
analisi2acquistapace

analisi2acquistapace

|Views: 285|Likes:
Published by Alberto Ciarrocchi

More info:

Published by: Alberto Ciarrocchi on Oct 17, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

01/22/2013

pdf

text

original

Sections

  • Spazi metrici
  • 1.1 Successioni di funzioni
  • 1.2 Propriet`a della convergenza uniforme
  • 1.3 Spazi con prodotto scalare
  • 1.4 Spazi normati
  • 1.5 La nozione di spazio metrico
  • 1.6 Compattezza
  • 1.7 Completezza
  • 1.8 Contrazioni
  • 1.9 Funzioni implicite
  • 1.10 Massimi e minimi vincolati
  • Sistemi differenziali
  • 2.1 Preliminari
  • 2.2 Sistemi lineari
  • 2.3 Sistemi omogenei a coefficienti costanti
  • 2.4 Equazioni lineari di ordine n
  • 2.5 Analisi qualitativa
  • Integrazione secondo Lebesgue
  • 3.1 Motivazioni
  • 3.2 Rettangoli e plurirettangoli
  • 3.3 Misura interna e misura esterna
  • 3.4 Insiemi misurabili
  • 3.5 Propriet`a della misura di Lebesgue
  • 3.6 Un insieme non misurabile
  • 3.7 Funzioni misurabili
  • 3.8 L’integrale di Lebesgue
  • 3.9 Confronto con l’integrale di Riemann
  • 3.10 Passaggio al limite sotto il segno di in-
  • 3.11 Calcolo degli integrali multipli
  • 3.12 Cambiamento di variabili
  • 3.13 Lo spazio L1
  • 3.14 Serie di Fourier
  • 3.15 Il metodo di separazione delle variabili
  • Variet`a
  • 4.1 Curve
  • 4.2 Ascissa curvilinea
  • 4.3 Geometria delle curve piane
  • 4.4 Inviluppi
  • 4.5 Curve sghembe
  • 4.6 Forme differenziali lineari
  • 4.7 Formule di Gauss-Green nel piano
  • 4.8 Superfici
  • 4.9 Geometria delle superfici
  • 4.10 Variet`a r-dimensionali
  • 4.11 Applicazioni multilineari alternanti
  • 4.12 Misura e integrazione su variet`a
  • 4.13 Forme differenziali lineari di grado r
  • 4.14 Integrazione di r-forme su r-variet`a o-

Appunti di Analisi matematica 2

Paolo Acquistapace
26 settembre 2011
Indice
1 Spazi metrici 1
1.1 Successioni di funzioni . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Propriet` a della convergenza uniforme . . . . . . . . . . . . . . 11
1.3 Spazi con prodotto scalare . . . . . . . . . . . . . . . . . . . . 18
1.4 Spazi normati . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.5 La nozione di spazio metrico . . . . . . . . . . . . . . . . . . . 29
1.6 Compattezza . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.7 Completezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.8 Contrazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1.9 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . 62
1.10 Massimi e minimi vincolati . . . . . . . . . . . . . . . . . . . . 89
2 Sistemi differenziali 97
2.1 Preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
2.2 Sistemi lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
2.3 Sistemi omogenei a coefficienti costanti . . . . . . . . . . . . . 114
2.4 Equazioni lineari di ordine n . . . . . . . . . . . . . . . . . . . 135
2.5 Analisi qualitativa . . . . . . . . . . . . . . . . . . . . . . . . 152
3 Integrazione secondo Lebesgue 189
3.1 Motivazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
3.2 Rettangoli e plurirettangoli . . . . . . . . . . . . . . . . . . . . 190
3.3 Misura interna e misura esterna . . . . . . . . . . . . . . . . . 195
3.4 Insiemi misurabili . . . . . . . . . . . . . . . . . . . . . . . . . 203
3.5 Propriet` a della misura di Lebesgue . . . . . . . . . . . . . . . 211
3.6 Un insieme non misurabile . . . . . . . . . . . . . . . . . . . . 215
3.7 Funzioni misurabili . . . . . . . . . . . . . . . . . . . . . . . . 217
3.8 L’integrale di Lebesgue . . . . . . . . . . . . . . . . . . . . . . 226
i
3.9 Confronto con l’integrale di Riemann . . . . . . . . . . . . . . 237
3.10 Passaggio al limite sotto il segno di integrale . . . . . . . . . 239
3.11 Calcolo degli integrali multipli . . . . . . . . . . . . . . . . . 248
3.12 Cambiamento di variabili . . . . . . . . . . . . . . . . . . . . . 263
3.13 Lo spazio L
1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 290
3.14 Serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . 311
3.15 Il metodo di separazione delle variabili . . . . . . . . . . . . . 350
4 Variet`a 362
4.1 Curve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
4.2 Ascissa curvilinea . . . . . . . . . . . . . . . . . . . . . . . . . 374
4.3 Geometria delle curve piane . . . . . . . . . . . . . . . . . . . 384
4.4 Inviluppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
4.5 Curve sghembe . . . . . . . . . . . . . . . . . . . . . . . . . . 401
4.6 Forme differenziali lineari . . . . . . . . . . . . . . . . . . . . . 410
4.7 Formule di Gauss-Green nel piano . . . . . . . . . . . . . . . . 425
4.8 Superfici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
4.9 Geometria delle superfici . . . . . . . . . . . . . . . . . . . . . 473
4.10 Variet` a r-dimensionali . . . . . . . . . . . . . . . . . . . . . . 495
4.11 Applicazioni multilineari alternanti . . . . . . . . . . . . . . . 501
4.12 Misura e integrazione su variet` a . . . . . . . . . . . . . . . . . 530
4.13 Forme differenziali lineari di grado r . . . . . . . . . . . . . . . 541
4.14 Integrazione di r-forme su r-variet`a orientate . . . . . . . . . . 552
Indice analitico 568
ii
Capitolo 1
Spazi metrici
1.1 Successioni di funzioni
Andiamo a considerare varie nozioni di convergenza per successioni o serie
di funzioni: alcune di queste convergenze, in particolare la convergenza uni-
forme, costituiranno il modello a cui ci rifaremo per introdurre le nozioni
astratte di spazio normato e di spazio metrico.
Sia dunque ¦f
n
¦
n∈N
una successione di funzioni a valori reali, o anche com-
plessi, definite su un un sottoinsieme A di R, oppure di R
m
, oppure di C
m
;
sia f un’altra funzione definita in A.
Definizione 1.1.1 Diciamo che la successione ¦f
n
¦ converge puntualmente
alla funzione f in A se per ogni x ∈ A la successione numerica ¦f
n
(x)¦
converge al numero f(x), ossia se
lim
n→∞
f
n
(x) = f(x) ∀x ∈ A;
in simboli, ci`o significa che
∀x ∈ A, ∀ε > 0 ∃ν ∈ N : [f
n
(x) −f(x)[ < ε ∀n ≥ ν.
Definizione 1.1.2 Diciamo che la successione ¦f
n
¦ converge uniformemen-
te alla funzione f in A se risulta
lim
n→∞
sup
x∈A
[f
n
(x) −f(x)[ = 0;
in simboli, ci`o significa che
∀ε > 0 ∃ν ∈ N : [f
n
(x) −f(x)[ < ε ∀n ≥ ν, ∀x ∈ A.
1
Osservazioni 1.1.3 (1) La differenza fra convergenza puntuale ed uniforme
sta nel quantificatore “∀x ∈ A” che si sposta dall’inizio alla fine della frase.
La conseguenza `e che l’indice ν, cio`e la soglia oltre la quale la quantit` a
[f
n
(x) −f(x)[ `e piccola, va a dipendere solo da ε, e non da ε e x. La seconda
definizione `e dunque pi` u restrittiva della prima: la convergenza uniforme
implica la puntuale.
(2) Affinch´e le f
n
convergano uniformemente a f in A occorre e basta che
per ogni ε > 0 i grafici delle f
n
siano contenuti definitivamente nell’ “intorno
tubolare del grafico di f di raggio ε”, ossia nell’insieme
¦(x, y) : x ∈ A, [y −f(x)[ < ε¦.
(3) La definizione 1.1.2 si applica anche a successioni di funzioni non limitate,
come mostra il successivo esempio 1.1.4 (3).
Esempi 1.1.4 (1) Siano A = [0, 1] e f
n
(x) = x
n
. Si ha, fissato x ∈ [0, 1],
lim
n→∞
f
n
(x) =
_
0 se x ∈ [0, 1[
1 se x = 1.
Quindi la successione ¦f
n
¦ converge puntual-
mente alla funzione
f(x) =
_
0 se x ∈ [0, 1[
1 se x = 1.
Per` o la convergenza non `e uniforme: fissato ε ∈]0, 1], `e impossibile trovare
2
ν ∈ N tale che si abbia
x
n
= [x
n
−0[ < ε ∀n ≥ ν, ∀x ∈ [0, 1[,
perch´e quando x → 1

ci` o implicherebbe 1 ≤ ε. Si osservi, tuttavia, che f
n
converge uniformemente a f in ogni intervallo della forma [0, a] con a < 1,
in quanto per un tale a risulta
sup
x∈[0,a]
x
n
= a
n
→0 per n →∞.
(2) Siano A = [0, ∞[ e f
n
(x) = e
−nx
. Allora le f
n
convergono puntualmente
in [0, ∞[ alla funzione
f(x) =
_
1 se x = 0
0 se x > 0.
La convergenza non `e uniforme in [0, ∞[ perch´e
sup
x≥0
[f
n
(x) −f(x)[ = sup
x>0
e
−nx
= 1 ∀n ∈ N,
per`o `e uniforme in ogni semiretta del tipo [a, ∞[ con a > 0, essendo
sup
x≥a
[f
n
(x) −f(x)[ = sup
x≥a
e
−nx
= e
−na
→0 per n →∞.
(3) Sia A =]0, ∞[ e poniamo f
n
(x) =
1
x
∧ n = min¦
1
x
, n¦ e g
n
(x) =
n+x
nx
.
Entrambe queste successioni convergono puntualmente a f(x) =
1
x
(si noti
che le g
n
sono funzioni illimitate), per`o la convergenza `e uniforme per le g
n
e non lo `e per le f
n
. Infatti
sup
x>0
[f
n
(x) −f(x)[ = sup
0<x<1/n
_
1
x
−n
_
= +∞,
3
sup
x>0
[g
n
(x) −f(x)[ = sup
x>0
¸
¸
¸
¸
1
x

n + x
nx
¸
¸
¸
¸
=
1
n
→0 per n →∞.
Gli esempi precedenti mostrano che la convergenza uniforme pu` o realizzarsi o
meno a seconda di come si sceglie l’insieme di definizione delle f
n
. In genere,
quindi, data una successione di funzioni definite in A, ci si chieder`a in quali
sottoinsiemi di A si ha convergenza uniforme. Il motivo di questo tipo di
richieste sta nel fatto che, a differenza della convergenza puntuale, la con-
vergenza uniforme preserva, come vedremo, diverse propriet`a delle funzioni
quali la continuit` a e l’integrabilit` a.
Accanto alle successioni di funzioni, `e naturale considerare anche le serie di
funzioni. Se ¦f
n
¦ `e una successione di funzioni definite in un insieme A con-
tenuto in R, oppure in R
m
, oppure in C
m
, la serie


n=0
f
n
`e la successione
¦s
n
¦ delle somme parziali, ove
s
n
(x) =
n

k=0
f
k
(x);
alle serie di funzioni si applicano quindi le nozioni di convergenza puntuale
ed uniforme. Utilizzando le definizioni 1.1.1 e 1.1.2, avremo:
• la serie

f
n
converge puntualmente in A se per ogni x ∈ A la serie
numerica


n=0
f
n
(x) `e convergente, ossia
∀x ∈ A, ∀ε > 0 ∃ν ∈ N :
¸
¸
¸
¸
¸

k=n+1
f
k
(x)
¸
¸
¸
¸
¸
< ε ∀n ≥ ν;
4
• la serie

f
n
converge uniformemente in A se
lim
n→∞
sup
x∈A
¸
¸
¸
¸
¸

k=n+1
f
k
(x)
¸
¸
¸
¸
¸
< ε ∀n ≥ ν, ∀x ∈ A.
Per le serie di funzioni si hanno per`o altri due tipi di convergenza:
• la serie

f
n
converge assolutamente in A se per ogni x ∈ A la serie
numerica


n=0
f
n
(x) `e assolutamente convergente, cio`e se


n=0
[f
n
(x)[
`e convergente;
• la serie

f
n
converge totalmente in A se la serie numerica

n=0
sup
x∈A
[f
n
(x)[
`e convergente.
La proposizione che segue mette a confronto i quattro tipi di convergenza.
Proposizione 1.1.5 Sia

f
n
una serie di funzioni definite su un sottoin-
sieme A di R, o di R
m
, o di C
m
. Allora:
(i) la convergenza totale implica la convergenza uniforme e quest’ultima im-
plica la convergenza puntuale;
(ii) la convergenza totale implica la convergenza assoluta e quest’ultima im-
plica la convergenza puntuale;
(iii) non vi sono implicazioni tra convergenza uniforme e assoluta, n´e val-
gono le implicazioni contrarie a quelle sopra descritte.
Dimostrazione (i) Poich´e


n=0
sup
x∈A
[f
n
(x)[ `e una serie reale convergen-
te, per il criterio di Cauchy si ha
∀ε > 0 ∃ν ∈ N :
p

k=n+1
sup
x∈A
[f
k
(x)[ < ε ∀p > n ≥ ν,
da cui a maggior ragione
sup
x∈A
¸
¸
¸
¸
¸
p

k=n+1
f
k
(x)
¸
¸
¸
¸
¸

p

k=n+1
sup
x∈A
[f
k
(x)[ < ε ∀p > n ≥ ν.
5
In particolare
¸
¸
¸
¸
¸
p

k=n+1
f
k
(x)
¸
¸
¸
¸
¸
< ε ∀p > n ≥ ν, ∀x ∈ A,
cio`e la serie


n=0
f
n
(x) verifica per ogni x ∈ A il criterio di Cauchy in R
e dunque `e convergente per ogni x ∈ A. Passando al limite per p → ∞, si
deduce che ¸
¸
¸
¸
¸

k=n+1
f
k
(x)
¸
¸
¸
¸
¸
≤ ε ∀p > n ≥ ν, ∀x ∈ A,
ossia si `e provato che
∀ε > 0 ∃ν ∈ N : sup
x∈A
¸
¸
¸
¸
¸

k=n+1
f
k
(x)
¸
¸
¸
¸
¸
≤ ε ∀n ≥ ν,
il che ci d` a la convergenza uniforme. Dalla convergenza uniforme segue in
modo ovvio la convergenza puntuale.
(ii) Se x ∈ A, l’ovvia disuguaglianza

k=n+1
[f
k
(x)[ ≤

k=n+1
sup
x∈A
[f
k
(x)[ ∀x ∈ A, ∀n ∈ N
ci fornisce la prima implicazione. La seconda `e banalmente vera per ogni
serie numerica.
(iii) Tutte le false implicazioni saranno illustrate dal seguente esempio. Con-
sideriamo la serie logaritmica

n=1
(−1)
n−1
x
n
n
,
la quale, come `e noto, converge puntualmente in ] −1, 1] con somma ln(1+x).
Inoltre la serie converge assolutamente in ] −1, 1[, mentre nei punti x = ±1
la serie dei moduli si riduce alla serie armonica e quindi diverge. Vediamo in
quali sottoinsiemi di ] −1, 1[ c’`e convergenza totale: in ] −1, 1[ no, perch´e
sup
[x[<1
¸
¸
¸
¸
(−1)
n−1
x
n
n
¸
¸
¸
¸
= sup
[x[<1
[x[
n
n
=
1
n
∀n ∈ N
+
,
6
cosicch´e la serie degli estremi superiori `e divergente. Per lo stesso motivo,
non vi pu` o essere convergenza totale in nessun intervallo del tipo ] − 1, a] o
[−a, 1[ con 0 < a < 1. Invece per ogni fissato δ ∈]0, 1[ si ha
sup
[x[≤1−δ
¸
¸
¸
¸
(−1)
n−1
x
n
n
¸
¸
¸
¸
= sup
[x[≤1−δ
[x[
n
n
=
(1 −δ)
n
n
∀n ∈ N
+
,
e dunque la serie degli estremi superiori `e convergente: quindi si ha conver-
genza totale in ogni intervallo del tipo [−1 + δ, 1 −δ] con δ ∈]0, 1[.
Vediamo infine dove c’`e convergenza uniforme. Notiamo che per x ∈ [0, 1]
la serie `e a segni alterni, con termine generale infinitesimo e decrescente in
modulo: quindi, per il criterio di Leibniz, la serie converge in [0, 1] e vale la
stima del resto:
¸
¸
¸
¸
¸

k=n+1
(−1)
k−1
x
k
k
¸
¸
¸
¸
¸

[x[
n+1
n + 1

1
n + 1
∀x ∈ [0, 1], ∀n ∈ N
+
.
Quindi
sup
x∈[0,1]
¸
¸
¸
¸
¸

k=n+1
(−1)
k−1
x
k
k
¸
¸
¸
¸
¸

1
n + 1
∀n ∈ N
+
,
il che dimostra che vi `e convergenza uniforme in [0, 1]. D’altra parte, siccome
7
vi `e convergenza totale in [−1 +δ, 1 −δ] per ogni δ ∈]0, 1[, in tali intervalli vi
`e anche, a maggior ragione, convergenza uniforme. Di conseguenza (esercizio
1.1.1) vi `e convergenza uniforme nell’unione, cio`e in tutti gli intervalli della
forma [−1 + δ, 1] con 0 < δ < 1.
`
E facile riconoscere, esaminando questo esempio, che esso coinvolge tutte le
false implicazioni citate nella proposizione, dato che i quattro tipi di conver-
genza hanno luogo in quattro insiemi a due a due distinti.
Nel caso particolare di serie di potenze, si ha il seguente risultato:
Teorema 1.1.6 Sia

a
n
z
n
una serie di potenze con raggio di convergenza
r ∈]0, ∞]. Allora la serie converge totalmente ed uniformemente in ogni
cerchio chiuso ¦z ∈ C : [z[ ≤ ρ¦ con ρ ∈]0, r[.
Dimostrazione Per [z[ ≤ ρ si ha [a
n
[[z[
n
≤ [a
n

n
qualunque sia n ∈ N,
e quindi vi `e convergenza totale nel cerchio ¦z ∈ C : [z[ ≤ ρ¦ in virt` u della
convergenza assoluta della serie nel punto z = ρ.
Esercizi 1.1
1. Si provi che se una successione di funzioni converge uniformemente in
A e in B, allora essa converge uniformemente in A ∪ B.
2. Discutere il comportamento per n → ∞ delle seguenti successioni di
funzioni:
(i) f
n
(x) = x sin
x
n
x ∈ R; (ii) f
n
(x) =
_
1 −cos
x
n
_
n
, x ∈ R;
(iii) f
n
(x) =
n

n + x
n
, x ≥ 0; (iv) f
n
(x) =
x + e
(n+1)x
e
nx
, x ∈ R;
(v) f
n
(x) = nx
2
e
−nx
, x ∈ R; (vi) f
n
(x) = (x
2
−x)
n
, x ∈ R;
(vii) f
n
(x) =
nx
1 + n
2
x
2
x ∈ R; (viii) f
n
(x) = (nx)
x/n
, x > 0;
(ix) f
n
(x) =
1
n
e
(cos nx−1)/n
, x ∈ R. (x) f
n
(x) =
xe
−nx
1 + e
−nx
, x ∈ R.
8
3. Discutere il comportamento delle seguenti serie di funzioni:
(i)

n=1
sin nx
n
2
, x ∈ R; (ii)

n=1
n
n
n! x
n
, x > 0;
(iii)

n=1
e
nx
n
, x ∈ R; (iv)

n=0
(−1)
n
2n + 1
(x
2
−1)
2n
, x ∈ R;
(v)

n=0
2
n
sin
x
3
n
, x ∈ R; (vi)

n=0
x
2
1 + n
2
x
2
, x ∈ R;
(vii)

n=1
(−1)
n+1
x
ln n
, x > 0; (viii)

n=1
n
2
x
n/2
, x > 0;
(ix)

n=1
x
n
ln
_
1 +
x
n
_
, x > −1; (x)

n=0
(ln x)
n
n
2
+ x
2
, x > 0;
(xi)

n=1
e
(n−x)/(n+x)
n
2
x
2
, x ∈ R; (xii)

n=0
x

n
, x > 0.
4. Discutere il comportamento per n → ∞ delle seguenti successioni di
funzioni definite per ricorrenza:
(i)
_
f
0
(x) = x
f
n+1
(x) =
1
2
[1 + (f
n
(x))
2
],
x ∈ [0, 1];
(ii)
_
f
0
(x) = x
f
n+1
(x) =
1
2
ln(1 + 2f
n
(x)),
x ≥ 0.
5. Discutere il comportamento per n → ∞ delle seguenti successioni di
funzioni:
(i) f
n
(x) = e
−ne
−nx
, x ∈ R; (ii) f
n
(x) = x

n
e
−x/n
, x ≥ 0;
(iii) f
n
(x) = n

x
e
−n/x
, x > 0; (iv) f
n
(x) = x
n
n
x
, x ∈ R;
(v)f
n
(x) = (n + x)
−n−x
, x > 0; (vi) f
n
(x) =
_

0
e
xt
sin t dt, x ∈ R;
(vii) f
n
(x) =
nxe
n
2
x
1+2
n
3
x
, x ∈ R; (viii) f
n
(x) = x
n
2
e
−nx
, x ∈ R.
9
6. Si provi che per ogni a ∈ R le serie

n=0
a
n
cos nx
n!
,

n=0
a
n
sin nx
n!
, x ∈ R,
sono totalmente convergenti in R e se ne calcolino le rispettive somme.
[Traccia: si faccia uso della relazione cos t + i sin t = e
it
, t ∈ R.]
7. Si dimostri che per ogni x ∈] −1, 1[, a ∈ R e b ∈ R si ha

n=0
x
n
cos(a + nb) =
cos a −x cos(a −b)
1 −2x cos b + x
2
,

n=0
x
n
sin(a + nb) =
sin a −x sin(a −b)
1 −2x cos b + x
2
.
8. Sia ¦f
n
¦ una successione convergente uniformemente ad una funzione
f nell’insieme A ⊆ R
N
. Si provi che se ¦x
n
¦ `e una successione di punti
di A, convergente a un punto x ∈ A, e se f `e continua nel punto x,
allora f
n
(x
n
) → f(x) per n → ∞.
`
E ancora vero questo risultato se
le f
n
convergono in A solo puntualmente, o se f non `e continua nel
punto?
9. Sia f una funzione continua nell’intervallo [a, b]; posto r
n
= (b −a) ∧
1
n
per ogni n ∈ N
+
, poniamo
f
n
(x) =
_
¸
_
¸
_
1
r
n
_
x+rn
x
f(t) dt se x ∈ [a, b[
f(b) se x = b.
Si provi che f
n
→f uniformemente in [a, b] per n →∞.
10. (Teorema di Abel) Sia f(z) la somma delle serie di potenze


n=0
a
n
z
n
nel cerchio C = ¦z ∈ C : [z[ < r¦. Supponiamo che la serie converga
in un punto z
0
= re

∈ ∂C, con somma S ∈ C. Si provi che allora
la serie converge uniformemente nel segmento di estremi 0 e z
0
, e che
risulta
lim
ρ→r

f(ρe

) = S.
10
1.2 Propriet`a della convergenza uniforme
Come abbiamo preannunciato, la convergenza uniforme preserva diverse pro-
priet` a funzionali. La pi` u importante di queste `e certamente la continuit`a:
questa propriet` a non `e stabile per la convergenza puntuale, come mostrano
gli esempi 1.1.4 (1) e (2), ma lo `e per la convergenza uniforme.
Teorema 1.2.1 Sia ¦f
n
¦ una successione di funzioni continue in un sot-
toinsieme A di R, o di R
m
, o di C
m
. Se f
n
→f uniformemente in A, allora
f `e continua in A.
Dimostrazione Consideriamo un punto x
0
∈ A e proviamo che f `e continua
in x
0
. Fissiamo ε > 0: per ipotesi, esiste ν ∈ N tale che
[f
n
(x) −f(x)[ < ε ∀n ≥ ν, ∀x ∈ A.
Per ogni x ∈ A possiamo scrivere
[f(x) −f(x
0
)[ ≤ [f(x) −f
ν
(x)[ +[f
ν
(x) −f
ν
(x
0
)[ +[f
ν
(x
0
) −f(x
0
)[;
il primo ed il terzo addendo sono minori di ε qualunque sia x ∈ A, mentre il
secondo, essendo f
ν
continua in A, sar` a minore di ε per tutti gli x ∈ A che
distano da x
0
meno di un opportuno δ, il quale dipende da ε, da ν e da x
0
.
Ma poich´e ν `e un indice fissato, dipendente solamente da ε e da x
0
, anche δ
dipende soltanto da ε oltre che da x
0
. Si conclude che
[f(x) −f(x
0
)[ < 3ε per [x −x
0
[ < δ,
e ci`o prova la tesi.
Il teorema precedente si pu` o enunciare in forma lievemente pi` u generale.
Teorema 1.2.2 Sia x
0
un punto d’accumulazione per un insieme A conte-
nuto in R, o R
m
, o C
m
, e sia ¦f
n
¦ una successione di funzioni definite in
A, che converge uniformemente in A ad una funzione f. Se per ogni n ∈ N
esistono i limiti
lim
x→x
0
f
n
(x) = L
n
,
allora esistono anche i due limiti
lim
x→x
0
f(x), lim
n→∞
L
n
,
e sono uguali.
11
Il senso di questo enunciato `e che, nelle ipotesi indicate, si pu` o invertire
l’ordine dei limiti:
lim
x→x
0
lim
n→∞
f
n
(x) = lim
n→∞
lim
x→x
0
f
n
(x).
Dimostrazione Proviamo anzitutto che ¦L
n
¦ `e convergente. Fissato ε > 0,
sia ν ∈ N tale che
[f
n
(x) −f(x)[ < ε ∀n ≥ ν, ∀x ∈ A.
Allora le successioni numeriche ¦f
n
(x)¦, al variare di x ∈ A, sono di Cauchy
uniformemente rispetto a x, poich´e per ogni n, m ≥ ν e per ogni x ∈ A si ha
[f
n
(x) −f
m
(x)[ ≤ [f
n
(x) −f(x)[ +[f(x) −f
m
(x)[ < 2ε;
dunque per x →x
0
si ricava
[L
n
−L
m
[ ≤ 2ε ∀n, m ≥ ν.
La successione numerica ¦L
n
¦ `e dunque di Cauchy in R e pertanto converge
a un numero reale L. Dobbiamo provare che
lim
x→x
0
f(x) = L.
Fissiamo nuovamente ε > 0 e scegliamo stavolta ν ∈ N in modo che risulti
[L
n
−L[ < ε, sup
x∈A
[f
n
(x) −f(x)[ < ε ∀n ≥ ν.
Allora per ogni x ∈ A si ha
[f(x) −L[ ≤ [f(x) −f
ν
(x)[ +[f
ν
(x) −L
ν
[ +[L
ν
−L[ < 2ε +[f
ν
(x) −L
ν
[.
D’altra parte, poich´e f
ν
(x) →L
ν
per x →x
0
, esiste δ > 0 (dipendente da ν,
ε e x
0
, dunque soltanto da ε e x
0
) tale che
x ∈ A, [x −x
0
[ < δ =⇒ [f
ν
(x) −L
ν
[ < ε;
ne segue
x ∈ A, [x −x
0
[ < δ =⇒ [f(x) −L[ < 3ε,
e la tesi `e provata.
La convergenza uniforme non preserva in generale la derivabilit`a delle fun-
zioni, come mostra il seguente
12
Esempio 1.2.3 La funzione f(x) = [x[, che non `e derivabile nel punto x = 0,
`e il limite uniforme su R delle funzioni
f
n
(x) =
_
¸
_
¸
_
[x[ se [x[ >
1
n
n
2
x
2
+
1
2n
se [x[ <
1
n
,
le quali sono derivabili in R con derivate continue, come si verifica facilmente.
Vale tuttavia il seguente importante risultato:
Teorema 1.2.4 Sia ¦f
n
¦ una successione di funzioni derivabili in [a, b], tali
che f
n
→f uniformemente in [a, b] e f
t
n
→g uniformemente in [a, b]. Allora
f `e derivabile in [a, b] e risulta f
t
= g.
Ci` o significa che nelle ipotesi del teorema si pu` o scambiare la derivazione con
il limite:
d
dx
lim
n→∞
f
n
(x) = lim
n→∞
d
dx
f
n
(x).
Dimostrazione Fissiamo x
0
∈ [a, b] e proviamo che f `e derivabile nel punto
x
0
. Applicheremo il teorema 1.2.2 alle funzioni
ϕ
n
(x) =
f
n
(x) −f
n
(x
0
)
x −x
0
, ϕ(x) =
f(x) −f(x
0
)
x −x
0
,
entrambe definite in [a, b] ¸ ¦x
0
¦, insieme del quale, chiaramente, x
0
`e punto
d’accumulazione. Verifichiamo le ipotesi del teorema 1.2.2: anzitutto si ha
lim
x→x
0
ϕ
n
(x) = f
t
n
(x
0
) ∀n ∈ N, lim
n→∞
ϕ
n
(x) = ϕ(x) ∀x ∈ [a, b] ¸ ¦x
0
¦;
13
dobbiamo verificare che ϕ
n
→ ϕ uniformemente in [a, b] ¸ ¦x
0
¦. In effetti,
fissato ε > 0 e scelto ν ∈ N in modo che sia
sup
x∈[a,b]
[f
t
n
(x) −g(x)[ < ε ∀n ≥ ν,
si ottiene
[f
t
n
(x)−f
t
m
(x)[ ≤ [f
t
n
(x)−g(x)[+[g(x)−f
t
m
(x)[ < 2ε ∀x ∈ [a, b], ∀n, m ≥ ν.
Ne segue, applicando il teorema del valor medio alla funzione f
n
− f
m
nel-
l’intervallo di estremi x e x
0
,

n
(x) −ϕ
m
(x)[ = [f
t
n
(ξ) −f
t
m
(ξ)[ < 2ε ∀x ∈ [a, b] ¸ ¦x
0
¦, ∀n, m ≥ ν,
ove ξ `e un punto fra x e x
0
. Passando al limite per m →∞ si trova

n
(x) −ϕ(x)[ ≤ 2ε ∀x ∈ [a, b] ¸ ¦x
0
¦, ∀n ≥ ν,
e dunque ϕ
n
→ϕ uniformemente. Notiamo cha abbiamo gi` a, per ipotesi, ci` o
che nel teorema 1.2.2 `e parte della tesi, e cio`e il fatto che
∃ lim
x→x
0
f
t
n
(x
0
) = g(x
0
).
Dal suddetto teorema ricaviamo che
∃ lim
x→x
0
ϕ(x) = g(x
0
),
e questo conclude la dimostrazione dato che, per definizione, tale limite `e
f
t
(x
0
).
Osservazione 1.2.5 Nella dimostrazione precedente abbiamo fatto uso del-
la sola convergenza puntuale delle f
n
, oltre che della convergenza uniforme
delle f
t
n
. In effetti, il teorema vale anche sotto le seguenti ipotesi: (a) esiste
x ∈ [a, b] tale che f
n
(x) → λ ∈ R, (b) f
t
n
→ g uniformemente in [a, b]. In
effetti, in tali ipotesi si pu` o provare facilmente che ∃ lim
n→∞
f
n
(x) = f(x) per
ogni x ∈ [a, b], e che la convergenza `e uniforme in [a, b]. Infatti, applicando
il teorema di Lagrange a f
n
−f
m
e utilizzando (b) si deduce
[f
n
(x)−f
m
(x)[ ≤ [f
n
(x)−f
m
(x)[+[f
t
n
(ξ)−f
t
m
(ξ)[ < 2ε ∀m, n ≥ ν, ∀x ∈ [a, b],
da cui segue facilmente quanto affermato. Avendo stabilito questo fatto, ci si
riconduce alla dimostrazione precedente. La convergenza uniforme delle f
n
a
f `e dunque conseguenza delle altre ipotesi: supporre che essa sia verificata a
priori non `e dunque una restrizione, ma solo una semplificazione inessenziale.
14
L’integrabilit` a secondo Riemann su intervalli limitati `e un’altra propriet`a che
viene preservata dalla convergenza uniforme.
Teorema 1.2.6 Sia ¦f
n
¦ una successione di funzioni integrabili secondo Rie-
mann nell’intervallo [a, b]. Se le f
n
convergono uniformemente in [a, b] ad
una funzione f, allora f `e integrabile su [a, b] e si ha
_
b
a
f(x) dx = lim
n→∞
_
b
a
f
n
(x) dx.
Ci` o significa che nelle ipotesi del teorema si pu`o scambiare l’integrazione con
l’operazione di limite:
lim
n→∞
_
b
a
f
n
(x) dx =
_
b
a
lim
n→∞
f
n
(x) dx.
Come vedremo, esistono teoremi di passaggio al limite ben pi` u generali di
questo, la dimostrazione dei quali richiede per`o la teoria dell’integrazione se-
condo Lebesgue.
Dimostrazione Supponiamo di sapere gi`a che f `e integrabile secondo Rie-
mann su [a, b]: allora il passaggio al limite sotto il segno di integrale si prova
facilmente. Infatti, fissato ε > 0 e scelto ν ∈ N in modo che
[f
n
(x) −f(x)[ < ε ∀x ∈ [a, b], ∀n ≥ ν,
si ottiene
¸
¸
¸
¸
_
b
a
f
n
(x) dx −
_
b
a
f(x) dx
¸
¸
¸
¸

_
b
a
[f
n
(x) −f(x)[ dx ≤ ε(b −a) ∀n ≥ ν
e la formula `e provata.
Resta dunque da verificare che f `e integrabile secondo Riemann in [a, b]. An-
zitutto notiamo che le f
n
, essendo Riemann-integrabili, sono funzioni limitate
in [a, b]; pertanto anche f `e limitata in [a, b], in quanto
[f(x)[ ≤ [f(x) −f
ν
(x)[ +[f
ν
(x)[ < ε +|f
ν
|

∀x ∈ [a, b].
Per provare che f `e Riemann-integrabile, proveremo che per ogni ε > 0 esiste
una suddivisione π : a = x
0
< x
1
< . . . < x
k
= b di [a, b], tale che la differenza
fra la somma superiore
S(π, f) =
k

i=1
M
i
(f)(x
i
−x
i−1
), ove M
i
(f) = sup
[x
i−1
,x
i
]
f,
15
e la somma inferiore
s(π, f) =
k

i=1
m
i
(f)(x
i
−x
i−1
), ove m
i
(f) = inf
[x
i−1
,x
i
]
f,
`e minore di ε. Ora, fissato ε > 0 e scelto ν ∈ N come in precedenza, dal
momento che f
ν
`e Riemann-integrabile esister` a una suddivisione π tale che
0 ≤ S(π, f
ν
) −s
(
π, f
ν
) < ε.
Per valutare S(π, f) −s(π, f), osserviamo che, per l’esercizio 1.2.1, risulta
M
i
(f) −m
i
(f) = sup¦[f(t) −f(s)[ : s, t ∈ [x
i−1
, x
i
]¦,
e quindi
M
i
(f) −m
i
(f) ≤ sup¦[f(t) −f
ν
(t)[ : t ∈ [x
i−1
, x
i
]¦ +
+ sup¦[f
ν
(t) −f
ν
(s)[ : s, t ∈ [x
i−1
, x
i
]¦ +
+ sup¦[f
ν
(s) −f(s)[ : s ∈ [x
i−1
, x
i
]¦ ≤
≤ 2ε + M
i
(f
ν
) −m
i
(f
ν
), i = 1, . . . , k.
Ne segue
S
(
π, f) −s(π, f) =
k

i=1
[M
i
(f) −m
i
(f)](x
i
−x
i−1
) ≤
≤ 2ε(b −a) + S(π, f
ν
) −s(π, f
ν
) < [2(b −a) + 1] ε,
e questo prova che f `e integrabile.
Osservazione 1.2.7 Analoghi risultati sulla continuit`a, derivabilit` a e inte-
grabilit` a valgono per le somme di serie uniformemente convergenti (esercizio
1.2.2).
Esercizi 1.2
1. Sia f una funzione reale limitata, definita sull’insieme A. Provare che
sup
A
f −inf
A
f = sup¦[f(t) −f(s)[ : s, t ∈ A¦.
16
2. Enunciare e dimostrare i teoremi di continuit` a, derivabilit` a e integra-
bilit` a per le somme di serie uniformemente convergenti.
3. Si costruisca una successione di funzioni Riemann-integrabili che con-
verga puntualmente in [a, b] ad una funzione f non Riemann-integrabile
su [a, b].
[Traccia: Sia Q∩[a, b] = ¦x
n
¦
n∈N
, e si prenda come f
n
la funzione che
vale 1 nei punti x
0
, x
1
, . . . , x
n
e vale 0 altrove.]
4. Sia x ∈ R. Provare che la successione numerica ¦sin nx¦
n∈N
ha limite
se e solo se x `e un multiplo intero di π, e che in tal caso il limite `e 0.
[Traccia: utilizzare il fatto che i numeri della forma nx+kπ sono densi
in R se e solo se x/π `e irrazionale.]
5. Discutere il comportamento delle seguenti serie di funzioni, calcolan-
done la somma nell’insieme di convergenza:
(i)

n=1
nx e
−nx
3
, x ∈ R; (ii)

n=0
(ln x)
n
n + 1
, x > 0;
(iii)

n=1
n sin
n
x, x ∈ R; (iv)

n=0
n
2
+ 1
n −i
z
2n
, z ∈ C;
(v)

n=1
n2
−n
e
(2n−1)ix
, x ∈ R; (vi)

n=0
e
n(Rez+1−z/2)
, z ∈ C;
(vii)

n=1
n + (x −x
2
)
n/2
(n −1)!
, x ∈ [0, 1]; (viii)

n=0
(−1)
n
e
−nx
2n + 1
, x ∈ R.
6. Dimostrare le seguenti uguaglianze:
(i)
_
1
0
t
n
ln(1 + t
m
) dt =

k+1
(−1)
k−1
k(mk + n + 1)
∀m, n ∈ N;
(ii)
_
1
0
ln x ln(1 −x) dx =

k=1
1
k(k + 1)
2
;
(iii)
_
1
0
arctan x
x
dx =

k=0
(−1)
k
(2k + 1)
2
;
(iv)
_
1
0
sin x ln x dx =

k=1
(−1)
k
2k (2k)!
.
17
7. Sia ¦f
n
¦ una successione di funzioni Riemann-integrabili in [a, x] per
ogni x ∈ [a, b[ ed integrabili in senso improprio su [a, b]. Si provi che se
f
n
→f uniformemente in [a, b], allora f `e integrabile in senso improprio
su [a, b] e si ha
_
b
a
f(x) dx = lim
n→∞
_
b
a
f
n
(x) dx.
[Traccia: si applichi il teorema 1.2.2 alle funzioni F
n
(x) =
_
x
a
f
n
(t) dt.]
1.3 Spazi con prodotto scalare
A partire da questo paragrafo introdurremo alcune nozioni astratte che ge-
neralizzano le situazioni e i concetti che abbiamo fin qui analizzato, come la
struttura metrica e topologica di R
m
e C
m
, la nozione di convergenza di una
successione, ed altro ancora. Ricordiamo anzitutto la definizione di spazio
vettoriale.
Definizione 1.3.1 Uno spazio vettoriale reale (o complesso) `e un insieme
X dotato della seguente struttura:
(i) `e definita su X X, a valori in X, l’operazione di somma, per la quale:
• vale la propriet`a associativa,
• vale la propriet`a commutativa,
• esiste un (unico) elemento neutro 0, che verifica u + 0 = u per
ogni u ∈ X,
• ogni elemento u ∈ X ha un (unico) opposto −u, che verifica
u + (−u) = 0;
(ii) `e definita su RX (o su CX), a valori in X, l’operazione di prodotto
per scalari, per la quale valgono, per ogni λ, µ reali (o complessi) e per
ogni u, v ∈ X, le relazioni:
• λ(µu) = (λµ)u,
• 1 u = u,
• (λ + µ)u = λu + µu,
• λ(u +v) = λu + λv.
18
Si verifica subito che dalle propriet` a elencate nella definizione seguono queste
altre:
0 u = 0, (−1)u = −u ∀u ∈ X.
Esempi banali di spazi vettoriali sono, oltre a R
m
e C
m
, l’insieme di tutte le
funzioni reali o complesse definite su un fissato insieme A, la famiglia delle
funzioni limitate definite su un insieme A, l’insieme delle funzioni continue
su un intervallo [a, b], la classe delle funzioni integrabili secondo Riemann su
un certo intervallo I, eccetera.
Nel seguito considereremo spazi vettoriali dotati di ulteriori strutture; la
prima, che costituisce la pi` u diretta generalizzazione degli spazi euclidei, `e la
nozione di prodotto scalare.
Definizione 1.3.2 Sia X uno spazio vettoriale reale o complesso. Un pro-
dotto scalare su X `e un’applicazione da X X in R (oppure da X X in
C), che denotiamo con
(u, v) →¸u, v¸
X
,
dotata delle seguenti propriet`a:
(i) ¸u, u¸
X
≥ 0 per ogni u ∈ X, e ¸u, u¸
X
= 0 se e solo se u = 0;
(ii) ¸u, v¸
X
= ¸v, u¸
X
(oppure ¸u, v¸
X
= ¸v, u¸
X
) per ogni u, v ∈ X;
(iii) ¸λu+µu

, v¸
X
= λ¸u, v¸
X
+µ¸u

, v¸
X
per ogni u, u

, v ∈ X e per ogni
λ, µ ∈ R (oppure per ogni λ, µ ∈ C).
La coppia (X, ¸, ¸
X
) si chiama spazio con prodotto scalare.
Esempi 1.3.3 (1) In R
N
`e definito il prodotto scalare
¸x, y¸
N
=
N

i=1
x
i
y
i
,
mentre in C
N
`e definito il prodotto scalare
¸x, y¸
N
=
N

i=1
x
i
y
i
.
19
(2) Nello spazio vettoriale C[a, b], costituito dalle funzioni continue definite
su [a, b] a valori reali, `e definito il prodotto scalare
¸f, g¸
C[a,b]
=
_
b
a
f(t)g(t) dt;
se le funzioni sono a valori complessi, il prodotto scalare `e
¸f, g¸
C[a,b]
=
_
b
a
f(t)g(t) dt.
(3) Consideriamo lo spazio vettoriale
2
, i cui elementi sono le successioni
reali x = ¦x
n
¦
n∈N
, tali che la serie

[x
n
[
2
`e convergente. In tale spazio `e
definito il prodotto scalare
¸x, y¸

2 =

n=0
x
n
y
n
, ove x = ¦x
n
¦
n∈N
e y = ¦y
n
¦
n∈N
;
tale serie `e assolutamente convergente (e dunque il prodotto scalare `e ben
definito) in virt` u della disuguaglianza
[x
n
y
n
[ ≤
1
2
([x
n
[
2
+[y
n
[
2
).
Se le successioni sono complesse, il prodotto scalare `e
¸x, y¸

2 =

n=0
x
n
y
n
.
Negli spazi con prodotto scalare vale una importante disuguaglianza:
Teorema 1.3.4 (disuguaglianza di Cauchy-Schwarz) Se X `e uno spa-
zio con prodotto scalare, allora si ha
[¸x, y¸
X
[ ≤ ¸x, x¸
1/2
X
¸y, y¸
1/2
X
∀x, y ∈ X.
Dimostrazione Supponiamo che X sia uno spazio vettoriale complesso: il
caso reale seguir` a a maggior ragione. Fissati x, y ∈ X, per λ ∈ C conside-
riamo la quantit`a reale non negativa ¸(x + λy), (x + λy)¸
X
: utilizzando la
definizione di prodotto scalare, si ha
0 ≤ ¸(x + λy), (x + λy)¸
X
=
= ¸x, x¸
X
+ λ¸y, x¸
X
+ λ¸x, y¸
X
+ λλ¸y, y¸
X
=
= ¸x, x¸
X
+¸λy, x¸
X
+¸λy, x¸
X
+[λ[
2
¸y, y¸
X
=
= ¸x, x¸
X
+ 2Re¸λy, x¸
X
+[λ[
2
¸y, y¸
X
.
20
Ora, se ¸y, x¸
X
= 0 la tesi del teorema `e ovvia; se invece ¸y, x¸
X
,= 0, cosicch´e
x ,= 0, scegliendo λ = −¸x, x¸
X
¸y, x¸
−1
X
si ottiene
0 ≤ ¸x, x¸
X
−2¸x, x¸
X
+
¸x, x¸
2
X
[¸y, x¸
X
[
2
¸y, y¸
X
,
che con facili conti porta alla tesi.
Esempio 1.3.5 Nel caso di C[a, b], la disuguaglianza di Cauchy-Schwarz
diventa
¸
¸
¸
¸
_
b
a
f(x)g(x) dx
¸
¸
¸
¸

__
b
a
f(x)
2
dx
_
1/2
__
b
a
g(x)
2
dx
_
1/2
∀f, g ∈ C[a, b].
Esercizi 1.3
1. Si provi che la famiglia B = ¦e
n
¦
n∈N
, ove e
n
`e la successione che vale
0 per ogni indice k ,= n e vale 1 per k = n, `e costituita da successioni
mutuamente ortogonali rispetto al prodotto scalare di
2
, ossia risulta

k=0
(e
n
)
k
(e
m
)
k
= 0 ∀m, n ∈ N con m ,= n.
2. Si provi che la famiglia T = ¦cos nx, sin nx¦
n∈N
`e costituita da funzioni
mutuamente ortogonali rispetto al prodotto scalare (reale) di C[−π, π],
ossia risulta
_
b
a
f(x)g(x) dx = 0 ∀f, g ∈ T con f ,= g.
3. Si provi che la famiglia c = ¦e
ikt
¦
k∈Z
`e costituita da funzioni mutua-
mente ortogonali rispetto al prodotto scalare (complesso) di C[−π, π],
ossia risulta
_
b
a
f(x)g(x) dx = 0 ∀f, g ∈ c con f ,= g.
4. Si provi che l’applicazione (f, g) →
_
b
a
f(t)g(t) dt non `e un prodot-
to scalare nello spazio vettoriale 1(a, b) delle funzioni reali che sono
integrabili secondo Riemann su [a, b].
21
1.4 Spazi normati
Negli spazi con prodotto scalare si pu` o parlare di vettori e di ortogonalit` a
esattamente come nel caso di R
m
e C
m
. E, come nel caso di R
m
e C
m
, si pu`o
introdurre la norma di un elemento x, che ne misura la distanza dall’origine:
essa si denota con |x| ed `e data da:
|x| =
_
¸x, x¸,
definizione che ha senso in quanto ¸x, x¸ `e un numero reale non negativo.
Dalle propriet`a del prodotto scalare segue subito che
|x| ≥ 0, e |x| = 0 ⇐⇒ x = 0,
|λx| = [λ[|x| ∀λ ∈ C, ∀x ∈ X,
mentre la subadditivit`a della norma
|x +x
t
| ≤ |x| +|x
t
| ∀x, x
t
∈ X
segue dalla disuguaglianza di Cauchy-Schwarz: infatti
|x +x
t
|
2
= ¸x +x
t
, x +x
t
¸ = ¸x, x¸ +¸x, x
t
¸ +¸x
t
, x¸ +¸x
t
, x
t
¸ =
= |x|
2
+ 2Re ¸x, x
t
¸ +|x
t
|
2
≤ |x|
2
+ 2[¸x, x
t
¸[ +|x
t
|
2

≤ |x|
2
+ 2|x||x
t
| +|x
t
|
2
= (|x| +|x
t
|)
2
.
Le propriet` a della norma sopra scritte, identiche a quelle di cui godono il
modulo in R e in C e la norma euclidea in R
m
e in C
m
, non sono legate
alla struttura indotta dai prodotti scalari: in altre parole, vi sono esempi di
funzioni | | da uno spazio vettoriale X a valori in [0, ∞[ che sono dotate di
tali propriet` a, senza per` o essere indotte da alcun prodotto scalare (esercizio
1.4.7). Un esempio `e la funzione
f → sup
t∈[a,b]
[f(t)[, f ∈ C[a, b],
che `e non negativa, nulla se e solo se f ≡ 0, e subadditiva. Questo ci
suggerisce di introdurre astrattamente la nozione di norma, nel modo che
segue.
Definizione 1.4.1 Sia X uno spazio vettoriale. Una norma su X `e una
funzione | | : X →[0, ∞[, tale che:
22
(i) |x| ≥ 0, e |x| = 0 se e solo se x = 0;
(ii) |λx| = [λ[|x| per ogni λ ∈ C e per ogni x ∈ X;
(iii) |x +x
t
| ≤ |x| +|x
t
| per ogni x, x
t
∈ X.
Se su X `e definita una norma, la coppia (X, | |) `e detta spazio normato.
Esempi 1.4.2 (1)Tutti gli spazi con prodotto scalare, e in particolare R
m
e
C
m
, sono spazi normati con la norma |x| =
_
¸x, x¸.
(2) Lo spazio vettoriale

1
=
_
x = ¦x
n
¦
n∈N
:

n=0
[x
n
[ < ∞
_
`e uno spazio normato con la norma
|x|

1 =

n=0
[x
n
[.
(3) Lo spazio vettoriale


=
_
x = ¦x
n
¦
n∈N
: sup
n∈N
[x
n
[ < ∞
_
`e uno spazio normato con la norma
|x|

∞ = sup
n∈N
[x
n
[.
(4) Per ogni p ∈]1, ∞[ consideriamo l’ insieme

p
=
_
x = ¦x
n
¦
n∈N
:

n=0
[x
n
[
p
< ∞
_
:
esso `e uno spazio vettoriale in virt` u della disuguaglianza (che deriva dalla
convessit` a di t →t
p
, t ≥ 0)

n=0
[x
n
+ y
n
[
p
≤ 2
p−1
_

n=0
[x
n
[
p
+

n=0
[y
n
[
p
_
.
23
La quantit` a
|x|

p =
_

n=0
[x
n
[
p
_1
p
verifica ovviamente le prime due propriet`a della definizione 1.4.1; `e possibile
verificarne anche la subadditivit`a, ma la cosa non `e banale (esercizi 1.4.4 e
1.4.5). Quindi si tratta di una norma, che per p = 2 `e quella indotta dal
prodotto scalare dell’esempio 1.3.3 (2).
(5) Sia K un sottoinsieme limitato e chiuso di R
m
o di C
m
. Lo spazio C(K)
delle funzioni continue definite su A `e, in virt` u del teorema di Weierstrass,
uno spazio normato con la norma
|f|

= sup
t∈A
[f(t)[;
tale quantit` a `e una norma anche sullo spazio B(K) delle funzioni limitate
su K (ma in questo caso non serve affatto che K sia chiuso e limitato). Si
noti che una successione ¦f
n
¦ contenuta in C(K), oppure in B(K), soddisfa
|f
n
−f|

→0 se e solo se essa converge uniformemente a f in K.
Se A = [a, b], altre norme sullo spazio C[a, b] sono
|f|
1
=
_
b
a
[f(t)[ dt, |f|
2
=
__
b
a
[f(t)[
2
dt
_
1
2
,
e quest’ultima `e hilbertiana, ossia indotta dal prodotto scalare dell’esempio
1.3.3 (2). Se p ∈]1, ∞[, la quantit`a
|f|
p
=
__
b
a
[f(t)[
p
dt
_
1
p
verifica ovviamente le prime due propriet`a della definizione 1.4.1; la subad-
ditivit` a `e anch’essa vera, ma la dimostrazione non `e banale (esercizio 1.4.6).
Ritroveremo queste norme, dette norme L
p
, nel capitolo 3.
(6) Se k ∈ N, lo spazio C
k
[a, b] `e lo spazio delle funzioni che sono derivabili
k volte in [a, b], con f
(k)
continua. Una norma su tale spazio `e
|f|
(k)
=
k

h=0
|f
(h)
|

;
24
le verifiche sono facili. Naturalmente anche |f|

`e una norma su C
k
[a, b],
ma `e di minore utilit` a.
(7) Nello spazio 1(a, b) delle funzioni integrabili secondo Riemann su [a, b]
la quantit` a |f|
1
precedentemente definita ha ancora ovviamente senso, ma
non `e una norma: infatti la seconda e la terza propriet` a sono vere, ma se
|f|
1
= 0 non `e detto che f sia identicamente nulla. Tuttavia, introducendo
la pi` u generale misura di Lebesgue, che allarga di molto la classe delle fun-
zioni integrabili, ed identificando fra loro le funzioni che coincidono “quasi
ovunque” (ossia al di fuori di un insieme di misura di Lebesgue nulla), `e pos-
sibile costruire uno spazio di (classi di equivalenza di) funzioni, denominato
L
1
(a, b), sul quale |f|
1
`e una norma. Infatti da |f|
1
= 0 segue che f `e
quasi ovunque nulla, e quindi f appartiene alla classe di equivalenza di 0,
ovvero f = 0 come elemento di L
1
(a, b). Tutta questa problematica verr`a
ampiamente ripresa nel capitolo 3.
Concludiamo il paragrafo con una caratterizzazione delle norme che sono
indotte da un prodotto scalare.
Proposizione 1.4.3 Sia (X, | |) uno spazio normato. La norma di X
`e indotta da un prodotto scalare se e solo se essa verifica l’ identit` a del
parallelogrammo seguente:
|x +y|
2
+|x −y|
2
= 2|x|
2
+ 2|y|
2
∀x, y ∈ X.
In tal caso il prodotto scalare `e dato da
¸x, y¸ =
1
4
(|x +y|
2
−|x −y|
2
)
se X `e reale, e da
¸x, y¸ =
1
4
_
(|x +y|
2
−|x −y|
2
) + i(|x + iy|
2
−|x −iy|
2
)
_
se X `e complesso.
Dimostrazione (=⇒) Se la norma `e indotta da un prodotto scalare, allora
per ogni x, y ∈ X si ha
|x +y|
2
+|x −y|
2
=
= |x|
2
+|y|
2
+ 2 ¸x, y¸ +|x|
2
+|y|
2
−2 ¸x, y¸ =
= 2|x|
2
+ 2|y|
2
.
25
(⇐=) Supponiamo che valga l’identit` a del parallelogrammo e consideriamo
il caso reale. Dobbiamo verificare che la quantit`a
¸x, y¸ =
1
4
(|x +y|
2
−|x −y|
2
)
verifica le propriet` a delle definizione 1.3.2, e quindi `e un prodotto scalare;
una volta stabilito ci` o, il fatto che esso induca la norma | | `e evidente.
`
E chiaro che ¸x, x¸ = |x|
2
`e non negativo ed `e nullo se e solo se x = 0.
Inoltre la simmetria `e evidente. Resta da verificare la linearit`a rispetto alla
prima variabile.
Anzitutto, per ogni x, x
t
, y ∈ X risulta
¸2x, y¸ +¸2x
t
, y¸ = 2¸x +x
t
, y¸;
infatti possiamo scrivere, utilizzando l’identit` a del parallelogrammo,
¸2x, y¸ +¸2x
t
, y¸ =
=
1
4
(|2x +y|
2
+|2x
t
+y|
2
−|2x −y|
2
−|2x
t
−y|
2
) =
=
1
8
(|2x + 2x
t
+ 2y|
2
+|2x −2x
t
|
2
) −

1
8
(|2x + 2x
t
−2y|
2
+|2x −2x
t
|
2
) =
=
1
2
(|x +x
t
+y|
2
−|x +x
t
−y|
2
) = 2 ¸x +x
t
, y¸.
Scelto allora x
t
= 0, si ottiene
¸2x, y¸ = 2¸x, y¸ ∀x, y ∈ X.
Di qui, osservando che
2¸x, y¸ + 2¸x
t
, y¸ = ¸2x, y¸ +¸2x
t
, y¸ = ¸2(x +x
t
), y¸ = 2¸x +x
t
, y¸,
si deduce immediatamente l’additivit`a.
Adesso, utilizzando l’additivit` a, un facile ragionamento per induzione mostra
che
¸nx, y¸ = n¸x, y¸ ∀x, y ∈ X, ∀n ∈ N.
26
Poi, tenuto conto che, per diretta conseguenza della definizione,
¸−x, y¸ = −¸x, y¸ ∀x, y ∈ X,
possiamo scrivere pi` u generalmente
¸kx, y¸ = k¸x, y¸ ∀x, y ∈ X, ∀k ∈ Z;
infine, notando che
_
x
n
, y
_
=
n
n
_
x
n
, y
_
=
1
n
_
n
x
n
, y
_
=
1
n
¸x, y¸ ∀x, y ∈ X, ∀n ∈ N
+
,
ricaviamo
¸λx, y¸ = λ¸x, y¸ ∀x, y ∈ X, ∀λ ∈ Q.
A questo punto non resta che utilizzare la continuit` a della norma (esercizio
1.4.1) per ottenere
¸λx, y¸ = λ¸x, y¸ ∀x, y ∈ X, ∀λ ∈ R,
il che prova la linearit`a e conclude la dimostrazione nel caso reale.
Il caso complesso segue in modo facile da quello reale e quindi il calcolo viene
omesso.
Esercizi 1.4
1. Sia X uno spazio normato. Una funzione g : X → R si dice continua
in un punto x
0
∈ X se per ogni ε > 0 esiste δ > 0 tale che
|x −x
0
| < δ =⇒ [g(x) −g(x
0
)[ < ε.
Si provi che vale la disuguaglianza
[|x| −|y|[ ≤ |x −y| ∀x, y ∈ X,
cosicch´e la norma `e una funzione continua in ogni punto di X.
2. Dimostrare la disuguaglianza di Young: se p, q > 1 con
1
p
+
1
q
= 1, allora
ab ≤
a
p
p
+
b
q
q
∀a, b ≥ 0.
[Traccia: si disegni nel rettangolo [0, a] [0, b] il grafico della funzione
y = x
p−1
e si osservi che tale relazione equivale a x = y
q−1
...]
27
3. Siano p, q ∈]1, ∞[ con
1
p
+
1
q
= 1. Provare che se x ∈
p
e y ∈
q
allora
la serie

x
n
y
n
`e assolutamente convergente e

n=0
[x
n
y
n
[ ≤
1
p
_

n=0
[x
n
[
p
_1
p
+
1
q
_

n=0
[y
n
[
q
_1
q
.
4. Siano p, q ∈]1, ∞[ con
1
p
+
1
q
= 1. Provare che se x ∈
p
e y ∈
q
allora

n=0
[x
n
y
n
[ ≤ |x|

p|y|

q .
[Traccia: applicare l’esercizio precedente agli elementi u ∈
p
, v ∈
q
definiti da u =
x
|x|
p
e v =
y
|y|
q
.]
5. Sia p ∈]1, ∞[. Provare che
|x +y|

p ≤ |x|

p +|y|

p ∀ x, y ∈
p
,
cosicch´e | |

p `e una norma nello spazio
p
.
[Traccia: poich´e ¦[x
n
+y
n
[
p
¦
n∈N
`e un elemento di
q
, ove
1
p
+
1
q
= 1, si
pu` o scrivere

n=0
[x
n
+ y
n
[
p

n=0
[x
n
[[x
n
+ y
n
[
p−1
+

n=0
[y
n
[[x
n
+ y
n
[
p−1
;
si applichi ora ai due termini a secondo membro la disuguaglianza
dell’esercizio precedente.]
6. Siano p, q > 1 con
1
p
+
1
q
= 1. Dimostrare la disuguaglianza di H¨older:
_
b
a
[f(t)g(t)[ dt ≤
__
b
a
[f(t)[
p
dt
_
1
p
__
b
a
[g(t)[
q
dt
_
1
q
∀f, g ∈ C[a, b],
e dedurne, per p ∈]1, ∞[, la disuguaglianza di Minkowski:
__
b
a
[f(t) + g(t)[
p
dt
_
1
p

__
b
a
[f(t)[
p
dt
_
1
p
+
__
b
a
[g(t)[
p
dt
_
1
p
,
28
da cui segue che per ogni p ∈ [1, ∞[ la quantit`a |f|
p
=
_
_
b
a
[g(t)[
p
dt
_1
p
`e una norma su C[a, b].
[Traccia: scimmiottare gli esercizi 1.4.4 e 1.4.5, rimpiazzando nei
ragionamenti la sommatoria con l’integrale.]
7. Si provi che la norma | |

non `e indotta da alcun prodotto scalare.
[Traccia: esibire due funzioni continue per la quali non vale l’identit`a
del parallelogrammo.]
8. Si provi che la norma uniforme non `e indotta da alcun prodotto scalare.
9. Sia p ∈ [1, ∞[. Si provi che la norma di
p
`e indotta da un prodotto
scalare se e solo se p = 2.
1.5 La nozione di spazio metrico
Gli spazi metrici sono gli ambienti pi` u generali in cui si possa parlare di
distanza fra due arbitrari punti x e y. Osserviamo che in uno spazio normato
X, tale distanza `e misurata dalla quantit` a |x−y|, esattamente come accade
in R
m
e in C
m
. Questa asserzione `e suffragata dalle seguenti propriet`a,
conseguenza immediata della definizione di norma:
• |x−y| ≥ 0 per ogni x, y ∈ X;
• |x −y| = 0 se e solo se x = y;
• |x − y| = |y − x| per ogni
x, y ∈ X;
• |x − y| ≤ |x − z| + |z − y|
per ogni x, y, z ∈ X.
La terza propriet` a si chiama disuguaglianza triangolare ed ha un’evidente
interpretazione geometrica.
Queste propriet` a sono il punto di partenza della nostra definizione astratta
di distanza.
Definizione 1.5.1 Sia X un insieme non vuoto. Una distanza, o metrica,
su X `e una funzione d : X X →R tale che:
29
(i) d(x, y) ≥ 0 per ogni x, y ∈ X;
(ii) d(x, y) = 0 se e solo se x = y;
(iii) d(x, y) = d(y, x) per ogni x, y ∈ X;
(iv) d(x, y) ≤ d(x, z) + d(z, y) per ogni x, y, z ∈ X.
Se su X `e definita una distanza d, la coppia (X, d) si dice spazio metrico.
Esempi 1.5.2 (1) Tutti gli spazi normati sono spazi metrici con la distanza
d(x, y) = |x −y|.
(2) Se X `e un insieme qualunque (non vuoto), la funzione
d(x, y) =
_
0 se x = y
1 se x ,= y
`e una distanza su X, che si chiama metrica discreta.
(3) Le funzioni
d
1
(x, y) = [ arctan x −arctan y[, d
2
(x, y) =
¸
¸
¸
¸
_
y
x
e
−t
2
dt
¸
¸
¸
¸
sono distanze su R e, a patto di porre arctan(±∞) = ±
π
2
, anche su R ∪
¦−∞, +∞¦.
(4) Lo spazio vettoriale C

[a, b] diventa uno spazio metrico con la distanza
d(f, g) =

k=0
2
−k
|f
(k)
−g
(k)
|

1 +|f
(k)
−g
(k)
|

.
L’unica verifica non banale riguarda la disuguaglianza triangolare: ma osser-
vando preliminarmente che la funzione reale t →
t
1+t
`e crescente e subadditiva
in [0, ∞[ (esercizio 1.5.3), la tesi segue dal fatto che ||

, essendo essa stessa
una norma su C

[a, b], verifica tale disuguaglianza.
Gli spazi metrici sono l’ambiente astratto giusto per generalizzare le nozioni,
fin qui adoperate solamente in R
m
o C
m
, di palla, insieme aperto, convergen-
za di successioni, punto d’accumulazione, insieme chiuso, insieme limitato,
insieme compatto, continuit` a. Negli esercizi 1.5.2, 1.5.5 e 1.6.1 si propone al
lettore di “interpretare”, in alcuni degli esempi concreti precedenti, la sfilza
di definizioni astratte che segue.
30
Definizione 1.5.3 Sia (X, d) uno spazio metrico. Se x
0
∈ X e r > 0, la
palla di centro x
0
e raggio r `e l’insieme
B(x
0
, r) = ¦x ∈ X : d(x, x
0
) < r¦.
Quando X `e uno spazio normato si ha B(x
0
, r) = ¦x ∈ X : |x −x
0
| < r¦ e
inoltre B(x
0
, r) = x
0
+B(0, r), ossia B(x
0
, r) `e il traslato di B(0, r) mediante
la traslazione y →x
0
+ y.
Definizione 1.5.4 Sia (X, d) uno spazio metrico. Se x
0
∈ X, un intorno
di x
0
`e un insieme U ⊆ X contenente x
0
e tale che esista r > 0 per cui
B(x
0
, r) ⊆ U.
In particolare, ogni palla `e intorno del suo centro ed anche di ciascun suo
punto.
Definizione 1.5.5 Sia (X, d) uno spazio metrico. Un sottoinsieme A ⊆ X
si dice aperto se per ogni x
0
∈ A esiste r > 0 tale che B(x
0
, r) ⊆ A.
Dunque un insieme `e aperto se e solo se esso `e intorno di ogni suo punto; le
palle B(x
0
, r) sono quindi aperte.
Definizione 1.5.6 Sia (X, d) uno spazio metrico e sia ¦x
n
¦ una successione
contenuta in X. Diciamo che x
n
converge ad un punto x ∈ X, o ha limite x
(e scriviamo x
n
→x) se risulta
lim
n→∞
d(x
n
, x) = 0.
Se X `e uno spazio normato, si ha x
n
→ x se e solo se |x
n
− x| → 0 per
n →∞.
Definizione 1.5.7 Sia (X, d) uno spazio metrico. Se x
0
∈ X e A ⊆ X, di-
ciamo che x
0
`e punto d’accumulazione per A se ogni intorno di x
0
contiene
almeno un punto di A diverso da x
0
. In altre parole, x
0
`e punto d’accumula-
zione per A se e solo se esiste una successione ¦x
n
¦ ⊆ A¸ ¦x
0
¦ che converge
a x
0
.
Definizione 1.5.8 Sia (X, d) uno spazio metrico. Un sottoinsieme B ⊆ X
si dice chiuso se esso contiene tutti i suoi punti d’accumulazione. In altre
parole, B `e chiuso se e solo se, per ogni successione ¦x
n
¦ ⊆ B che converge
ad un limite x ∈ X, risulta x ∈ B.
31
Non `e difficile provare (esercizio 1.5.6) la seguente
Proposizione 1.5.9 Sia (X, d) uno spazio metrico e sia A un sottoinsieme
di X. Allora A `e aperto se e solo se il suo complementare A
c
`e chiuso.
Dato un sottoinsieme E di uno spazio metrico, esso non sar` a in generale n´e
aperto, n´e chiuso. Esistono per` o il pi` u piccolo insieme chiuso contenente E
ed il pi` u grande insieme aperto contenuto in E, come risulta dalla seguente
definizione.
Definizione 1.5.10 Sia E un sottoinsieme di uno spazio metrico (X, d).
La chiusura di E `e l’insieme E costituito dall’intersezione di tutti i chiusi
contenenti E; la parte interna di E `e l’insieme

E costituito dall’unione di
tutti gli aperti contenuti in E. La frontiera di E `e l’insieme ∂E = E¸

E.
Non `e difficile verificare che

E `e l’insieme dei punti interni ad E, cio`e quegli
x ∈ E per i quali esiste una palla B(x, δ) ⊆ E; invece E `e l’insieme dei
punti aderenti ad E, ossia quegli x ∈ X tali che ogni palla B(x, δ) interseca
E. Infine ∂E `e l’insieme dei punti che sono aderenti sia ad E, sia al suo
complementare E
c
. Si noti che E e ∂E sono chiusi, mentre

E `e aperto.
Definizione 1.5.11 Un sottoinsieme A ⊆ X si dice limitato se esiste una
palla B(x
0
, R) che contiene A.
Definizione 1.5.12 Siano (X, d) e (Y, δ) due spazi metrici. Una funzione
f : X → Y si dice continua nel punto x
0
∈ X se per ogni ε > 0 esiste η > 0
tale che
d(x, x
0
) < η =⇒ δ(f(x), f(y)) < ε.
La funzione f si dice continua se `e continua in ogni punto.
Osserviamo che la nozione di continuit` a fornita nell’esercizio 1.4.1 `e un caso
speciale della definizione 1.5.12.
Esercizi 1.5
1. Sia (X, d) uno spazio metrico. Si provi che
[d(x, y) −d(z, y)[ ≤ d(x, z) ∀x, y, z ∈ X.
32
2. Disegnare le palle B(0, r) negli spazi normati (R
2
, | |
1
) e (R
2
, | |

),
ove
|(x, y)|
1
= [x[ +[y[, |(x, y)|

= max¦[x[, [y[¦.
3. Si consideri la funzione f(t) =
t
1+t
, definita per t ≥ 0. Si provi che f `e
strettamente crescente e strettamente subadditiva, ossia
f(t + s) < f(t) + f(s) ∀t > s ≥ 0.
4. Si provi che nello spazio C

[a, b] la funzione
d(f, g) =

k=0
2
−k
|f
(k)
−g
(k)
|

1 +|f
(k)
−g
(k)
|

`e una distanza. Analogamente, detto S lo spazio vettoriale delle suc-
cessioni x = ¦x
n
¦
n∈N
a valori reali o complessi, si provi che la funzione
d(x, y) =

k=0
2
−k
[x
k
−y
k
[
1 +[x
k
−y
k
[
, x, y ∈ S,
`e una distanza su S.
5. Sia (X, d) uno spazio metrico con la metrica discreta (esempio 1.5.2(2)).
(i) Provare che X `e privo di punti d’accumulazione.
(ii) Descrivere le palle, gli aperti e i chiusi rispetto a questa distanza.
(iii) Provare che ogni funzione f : (X, d) →(Y, δ), ove (Y, δ) `e un altro
spazio metrico, `e continua.
6. Sia (X, d) uno spazio metrico. Si provi che un sottoinsieme A di X `e
aperto se e solo se il suo complementare A
c
`e chiuso.
7. Sia (X, d) uno spazio metrico. Se E ⊆ X, si provi che
(E)
c
=

(E
c
),
_

E
_
c
= E
c
.
33
1.6 Compattezza
Una nozione di fondamentale importanza nelle applicazioni `e quella di insie-
me compatto, peraltro gi`a incontrata nel corso di Analisi I. Per introdurla
in maggiore generalit`a, ricordiamo alcuni fatti. Se X `e uno spazio normato,
un sottoinsieme A di X `e limitato se esiste M > 0 tale che |x| ≤ M per
ogni x ∈ A. Ricordiamo poi che, data una successione ¦x
n
¦
n∈N
contenuta
in un insieme arbitrario, una sottosuccessione di ¦x
n
¦ si ottiene selezionando
in N una sottofamiglia infinita di indici n
0
< n
1
< . . . < n
k
< n
k+1
< ... e
considerando il corrispondente sottoinsieme ¦x
n
k
¦
k∈N
⊆ ¦x
n
¦
n∈N
.
Definizione 1.6.1 Sia (X, d) uno spazio metrico. Un sottoinsieme B ⊆ X
si dice compatto per successioni, o sequenzialmente compatto, se da ogni
successione contenuta in B `e possibile estrarre una sottosuccessione che con-
verge a un punto di B; si dice invece che B `e compatto se ogni ricoprimento
aperto di B (vale a dire, ogni famiglia di aperti ¦A
i
¦
i∈I
tale che

i∈I
A
i

B) possiede un sottoricoprimento finito, cio`e esiste una sottofamiglia finita
¦A
i
1
, . . . , A
i
N
¦ la cui unione ricopre ancora B.
A prima vista le nozioni di insieme compatto per successioni e di insieme
compatto sembrano avere poco in comune; tuttavia, come vedremo, nel con-
testo degli spazi metrici esse sono equivalenti fra loro.
Osserviamo per cominciare che un insieme compatto, oppure compatto per
successioni, `e necessariamente limitato e chiuso (esercizio 1.6.2). Il viceversa
`e vero in R
m
e C
m
, ma `e falso in generale; per un esempio si rimanda agli
esercizi 1.6.3 e 1.6.4.
Dimostriamo questo fondamentale risultato:
Teorema 1.6.2 Sia (X, d) uno spazio metrico e sia K ⊆ X. Allora K `e
compatto se e solo se `e compatto per successioni.
Dimostrazione (=⇒) Sia K un compatto contenuto in X. Sia ¦x
n
¦
n∈N
una
successione contenuta in K, e sia S l’insieme dei suoi valori: se S `e finito,
allora certamente esiste una sottosuccessione di ¦x
n
¦
n∈N
che `e costante, e
dunque convergente. Quindi possiamo supporre che S sia infinito. Verifi-
chiamo che esiste x ∈ K tale che ogni intorno di x contiene infiniti elementi
di S: se infatti ci`o non accadesse, per ogni y ∈ K esisterebbe un intorno
aperto U
y
di y, con U
y
∩ S insieme finito. La famiglia ¦U
y
¦
y∈K
sarebbe
un ricoprimento aperto di K: per ipotesi, esisterebbe un sottoricoprimento
34
finito ¦U
y
1
, . . . , U
ym
¦ di K. Ma la relazione S ⊆

m
j=1
(S ∩ U
y
j
) porterebbe
all’assurdo, perch´e il primo membro sarebbe un insieme infinito e il secondo
no.
Verifichiamo adesso che esiste una sottosuccessione di ¦x
n
¦
n∈N
che converge
al punto x ∈ K sopra costruito. Sia U
k
= B
_
x,
1
k
_
: in ogni U
k
cadono infiniti
elementi di S. Scegliamo allora x
n
1
∈ S ∩ U
1
, x
n
2
∈ S ∩ U
2
(con n
2
> n
1
), e
iterando, x
n
k+1
∈ S ∩ U
k+1
(con n
k+1
> n
k
). La successione ¦x
n
k
¦
k∈N
`e una
sottosuccessione di ¦x
n
¦
n∈N
che converge a x. Ci`o prova che K `e compatto
per successioni.
(⇐=) Sia K ⊆ X un insieme compatto per successioni. Per provare la
compattezza di K faremo uso di una definizione e di un lemma.
Definizione 1.6.3 Sia (X, d) uno spazio metrico, sia K un sottoinsieme di
X e sia | = ¦U
i
¦
i∈I
un ricoprimento aperto di K. Chiamiamo numero di
Lebesgue del ricoprimento la quantit`a ε(|) definita da
ε(|) = sup¦δ ≥ 0 : ∀x ∈ K ∃i ∈ I : B(x, δ) ⊆ U
i
¦.
Osserviamo che si ha ε(|) > 0 se esiste δ > 0 tale che ogni palla B(x, δ) con
x ∈ K `e contenuta in qualche U
i
. Si noti che ε(|) ≥ 0 per ogni ricoprimento
aperto | di K e per ogni K ⊆ X; sar`a importante, naturalmente, sapere
quali sottoinsiemi K hanno ricoprimenti aperti con ε(|) > 0.
Lemma 1.6.4 Sia (X, d) uno spazio metrico e sia K un sottoinsieme di X.
Se K `e compatto per successioni, allora ogni ricoprimento aperto di K ha
numero di Lebesgue strettamente positivo.
Dimostrazione Sia ¦U
i
¦
i∈I
un ricoprimento aperto di K. Poniamo, per
ogni x ∈ K,
ε(x) = sup¦δ > 0 : ∃i ∈ I : B(x, δ) ⊆ U
i
¦,
ed osserviamo che si ha ε(x) > 0 per ogni x ∈ K. Sia ora ε = inf
x∈K
ε(x):
per provare la tesi `e sufficiente dimostrare che ε > 0.
Sia ¦x
n
¦
n∈N
⊆ K tale che lim
n→∞
ε(x
n
) = ε. Dato che K `e compatto per
successioni, possiamo estrarre una sottosuccessione ¦x
n
k
¦
k∈N
⊆ ¦x
n
¦
n∈N
tale
che x
n
k
→x

∈ K per k →∞. Dunque, esiste N ∈ N tale che
d(x
n
k
, x

) <
1
4
ε(x

) ∀k ≥ N,
cosicch´e risulta B
_
x
n
k
,
1
4
ε(x

)
_
⊆ B
_
x

,
1
2
ε(x

)
_
per ogni k ≥ N. Ma, essen-
do B
_
x

,
1
2
ε(x

)
_
⊆ U
i
per qualche i ∈ I, si ha B
_
x
n
k
,
1
4
ε(x

)
_
⊆ U
i
per ogni
35
k ≥ N e dunque
1
4
ε(x

) ≤ ε(x
n
k
) per ogni k ≥ N. Quando k →∞ si ottiene
allora 0 <
1
4
ε(x

) ≤ ε, che `e la tesi.
Torniamo alla seconda parte delle dimostrazione del teorema 1.6.2. Sia
| = ¦U
i
¦
i∈I
un ricoprimento aperto di K: per il lemma 1.6.4, il nume-
ro di Lebesgue di | `e positivo. Supponiamo per assurdo che | non abbia
sottoricoprimenti finiti. Allora, se 0 < ε < ε(|), anche il ricoprimento
aperto ¦B(x, ε)¦
x∈K
non ha alcun sottoricoprimento finito. Dunque, fissa-
to x
1
∈ K, esister` a x
2
∈ K ¸ B(x
1
, ε). Iterando, per ogni n ∈ N
+
esi-
ster` a x
n
∈ K ¸

n−1
i=1
B(x
i
, ε). In questo modo si costruisce una successione
¦x
n
¦
n∈N
⊆ K tale che d(x
n
, x
m
) > ε per ogni m, n ∈ N con n > m. Ma
allora ¦x
n
¦ non pu`o ammettere alcuna sottosuccessione convergente, contro
l’ipotesi che K sia compatto per successioni.
Esercizi 1.6
1. Si provi che R∪ ¦−∞, +∞¦, con una qualunque delle distanze d
1
e d
2
dell’esempio 1.5.2 (3), `e uno spazio metrico compatto.
2. Si provi che tutti i sottoinsiemi compatti, oppure compatti per succes-
sioni, di uno spazio metrico sono limitati e chiusi.
3. Si consideri la successione ¦e
k
¦
k∈N


, ove l’elemento e
k


`e la
successione
(e
k
)
n
=
_
0 se n ,= k
1 se n = k.
Provare che risulta
|e
k
|

= 1, |e
k
−e
h
|

= 1 ∀h, k ∈ N con h ,= k,
e che quindi l’insieme A = ¦e
k
¦
k∈N
`e limitato e privo di punti d’ac-
cumulazione, dunque chiuso. Si provi poi che A non `e compatto per
successioni.
4. Si provi che la successione ¦e
k
¦ definita nell’esercizio precedente forma
un sottoinsieme limitato e chiuso in
1
, ma non compatto per successioni
in
1
.
5. (Teorema di Weierstrass) Sia K un sottoinsieme compatto dello spazio
metrico (X, d). Si provi che se f : X → R `e una funzione continua,
allora f ha massimo e minimo su K.
36
6. Sia (X, d) uno spazio metrico compatto. Si provi che X `e separabile,
ossia esiste un sottoinsieme numerabile B che `e denso in X: ci` o significa
che B = X, o, in altre parole, per ogni x ∈ X e per ogni ε > 0 esiste
z ∈ B tale che d(z, x) < ε.
[Traccia: per ogni k ∈ N
+
, esiste un ricoprimento finito di X costituito
da palle di raggio 1/k; sia C
k
l’insieme finito costituito dai centri di tali
palle. Si verifichi che l’insieme B =


k=1
C
k
`e numerabile e denso in
X.]
7. Si provi che in uno spazio metrico separabile esiste una base di aperti
numerabile: ci` o significa che esiste una famiglia numerabile B di aperti
tale che ogni aperto di X `e unione di elementi di B.
8. (Teorema di Lindel¨off) Si provi che se uno spazio metrico X ha una
base numerabile di aperti, allora per ogni famiglia ¦A
i
¦
i∈I
di aperti di
X esiste una sottofamiglia numerabile ¦A
in
¦
n∈N
tale che
_
i∈I
A
i
=
_
n∈N
A
in
.
[Traccia: sia B una base numerabile di aperti e sia B
0
= ¦B
0
n
¦
n∈N
la
sottofamiglia degli elementi di B che sono contenuti in qualcuno degli
A
i
. Per ogni B
0
n
∈ B
0
sia i
n
∈ I un indice tale che A
in
contenga B
0
n
. Se
ne deduca che

i∈I
A
i

n∈N
A
in

n∈N
B
0
n
. Si verifichi d’altra parte
che per ogni i ∈ I e per ogni x ∈ A
i
esiste B
0
n
∈ B
0
tale che x ∈ B
0
n
, e
che di conseguenza

i∈I
A
i

n∈N
B
0
n
. Si concluda che ¦A
in
¦
n∈N
`e la
sottofamiglia cercata.]
9. Un sottoinsieme K di uno spazio metrico (X, d) si dice totalmente li-
mitato se per ogni ε > 0 esiste un insieme finito ¦y
1
, . . . , y

¦ ⊆ K tale
che K ⊆


i=1
B(y
i
, ε). Si provi che ogni insieme totalmente limitato `e
limitato, e che il viceversa `e falso in generale, ma vero in R
m
e C
m
.
[Traccia: la prima implicazione `e facile; per la seconda si conside-
ri la palla unitaria chiusa di
2
e si osservi che le successioni e
n
=
¦0, 0, . . . , 1, . . . , 0, . . .¦, ove 1 compare al posto n-simo, sono elementi
di tale palla con |e
n
−e
m
|

2 =

2 per n ,= m.]
10. Si provi che ogni sottoinsieme compatto di uno spazio metrico `e total-
mente limitato.
`
E vero il viceversa?
37
1.7 Completezza
La completezza `e una fondamentale propriet` a di cui godono gli spazi metrici
pi` u importanti. Prima di introdurla, conviene fornire un’altra definizione.
Definizione 1.7.1 Sia (X, d) uno spazio metrico e sia ¦x
n
¦ una successione
contenuta in X. Diciamo che ¦x
n
¦ `e una successione di Cauchy se per ogni
ε > 0 esiste ν ∈ N tale che
d(x
n
, x
m
) < ε ∀n, m ≥ ν.
Si vede facilmente che in uno spazio metrico ogni successione convergente `e
necessariamente una successione di Cauchy. Sia infatti ¦x
n
¦ ⊆ X tale che
x
n
→x ∈ X per n →∞: allora, fissato ε > 0, per definizione di limite esiste
ν ∈ N tale che d(x
n
, x) < ε per ogni n ≥ ν. Dunque dalla disuguaglianza
triangolare si ha
d(x
n
, x
m
) ≤ d(x
n
, x) + d(x, x
m
) < 2ε ∀n, m ≥ ν.
Non `e vero per` o, in generale, il viceversa, cio`e il fatto che le successioni di
Cauchy siano convergenti: se consideriamo ad esempio lo spazio normato
(Q, [ [), la successione ¦(1 + 1/n)
n
¦ `e una successione di Cauchy in Q, ma
non `e convergente in tale spazio, visto che il suo limite in R `e il numero
irrazionale e.
La propriet`a che le successioni di Cauchy siano convergenti, non sempre
verificata ma valida in R
m
e C
m
, `e talmente ricca di conseguenze utili e
importanti da meritare una definizione astratta a s´e stante.
Definizione 1.7.2 Uno spazio metrico (X, d) si dice completo se ogni suc-
cessione di Cauchy in X `e convergente ad un elemento di X. Uno spazio
normato completo si dice spazio di Banach; se, in pi` u, la norma `e indotta da
un prodotto scalare, esso si dice spazio di Hilbert.
Esempi 1.7.3 (1) Gli spazi euclidei R
m
e C
m
sono spazi metrici completi e
dunque spazi di Hilbert, il primo reale e il secondo complesso.
(2) Nell’esercizio 1.7.5 si prova la completezza di tutti gli spazi normati
p
,
1 ≤ p ≤ ∞, che dunque sono spazi di Banach con le rispettive norme;
2
`e
anche uno spazio di Hilbert (esercizio 1.4.9).
L’importante famiglia degli spazi metrici compatti costituisce una particolare
classe di spazi metrici completi. Vale infatti la seguente
38
Proposizione 1.7.4 Uno spazio metrico (X, d) `e compatto se e solo se esso
`e completo e totalmente limitato.
Ricordiamo che la nozione di insieme totalmente limitato `e stata introdotta
nell’esercizio 1.6.9.
Dimostrazione Supponiamo che X sia compatto. Proviamo che X `e
totalmente limitato: fissato ε > 0, consideriamo il ricoprimento aperto
¦B(x, ε)¦
x∈X
. Dato che X `e compatto, tale ricoprimento deve avere un
sottoricoprimento finito; ci`o prova che X `e totalmente limitato. Proviamo
che X `e completo: se ¦x
n
¦ ⊆ X `e una successione di Cauchy, ricordando
il teorema 1.6.2 si pu` o estrarre una sottosuccessione convergente ad un ele-
mento x ∈ X; la condizione di Cauchy implica allora che l’intera successione
converge a x, e dunque X `e completo.
Sia, viceversa, X completo e totalmente limitato e proviamo che X `e com-
patto per successioni: dal teorema 1.6.2 seguir` a la tesi. Fissiamo una suc-
cessione ¦x
n
¦
n∈N
⊆ X: dobbiamo provare che essa ha una sottosuccessio-
ne convergente. Possiamo supporre che essa assuma un insieme infinito di
valori distinti, altrimenti la tesi `e ovvia. Per totale limitatezza, per ogni
k ∈ N
+
possiamo ricoprire X con l’unione di un certo numero m
k
di pal-
le B(y
(k)
1
, 1/k), . . . , B(y
(k)
m
k
, 1/k). Scelto k = 1, fra le palle B(y
(1)
j
, 1) ce n’`e
almeno una, che denoteremo con B(y
(1)
j
1
, 1), la quale conterr` a infiniti punti
della successione ¦x
n
¦: in altre parole, esiste un sottoinsieme infinito S
1
⊆ N
tale che ¦x
n
¦
n∈S
1
⊆ B(y
(1)
j
1
, 1). Scelto k = 2, fra le palle B(y
(2)
j
, 1/2) almeno
una, che denoteremo con B(y
(2)
j
2
, 1/2), conterr`a una intera sottosuccessione
¦x
n
¦
n∈S
2
con S
2
⊆ S
1
. Iterando questo ragionamento, si costruisce una se-
quenza infinita di sottosuccessioni ¦x
n
¦
n∈S
k
⊆ ¦x
n
¦
n∈S
k−1
, in modo che, per
ciascun k ∈ N
+
, risulti ¦x
n
¦
n∈S
k
⊆ B(y
(k)
j
k
, 1/k).
Adesso indichiamo con r
k
il k-simo elemento dell’insieme S
k
(che `e ordinato
secondo l’ordinamento naturale di N); ponendo S = ¦r
1
, r
2
, . . . , r
k
, . . .¦, si
ha S ⊆ N ed inoltre, per ogni k ∈ N
+
, al pi` u i primi k − 1 termini di S, da
r
1
a r
k−1
, non appartengono a S
k
. Di conseguenza, la sottosuccessione “dia-
gonale” ¦x
n
¦
n∈S
`e una sottosuccessione della successione iniziale ¦x
n
¦
n∈N
e
soddisfa, per ogni m, n ∈ S con m > n,
d(x
m
, x
n
) ≤ d(x
m
, y
(n)
jn
) + d(y
(n)
jn
, x
n
) <
2
n
,
da cui segue che ¦x
n
¦
n∈S
`e una successione di Cauchy in X. Per comple-
tezza, essa converge ad un elemento x ∈ X, e ci` o prova che ¦x
n
¦
n∈N
ha una
39
sottosuccssione convergente. Pertanto X `e compatto.
Alcuni fra i pi` u importanti spazi normati sono completi, cio`e sono spazi di
Banach. Andiamo a verificare la completezza degli spazi funzionali C[a, b],
1(a, b), C
k
[a, b].
Teorema 1.7.5 Lo spazio normato (C[a, b], | |

) `e completo, cio`e `e uno
spazio di Banach.
Dimostrazione Utilizzeremo il fatto che la convergenza rispetto alla norma
| |

non `e altro che la convergenza uniforme in [a, b].
Sia ¦f
n
¦ una successione di Cauchy rispetto alla norma | |

: ci` o significa
che per ogni ε > 0 esiste ν ∈ N tale che
sup
[a,b]
[f
n
−f
m
[ = |f
n
−f
m
|

< ε ∀n, m ≥ ν.
In particolare, per ogni x ∈ [a, b] la successione numerica ¦f
n
(x)¦ `e di Cauchy
in R, e pertanto, essendo R uno spazio normato completo, converge ad un
numero reale che chiamiamo f(x), visto che dipende dal punto x che abbiamo
scelto in [a, b]. Resta cos`ı definita una funzione f : [a, b] →R: dalla relazione
[f
n
(x) −f
m
(x)[ ≤ |f
n
−f
m
|

< ε ∀n, m ≥ ν
segue, passando al limite per m →∞,
[f
n
(x) −f(x)[ ≤ ε ∀x ∈ [a, b], ∀n, m ≥ ν,
e quindi
sup
[a,b]
[f
n
−f[ ≤ ε ∀n ≥ ν.
Ci` o prova che |f
n
− f|

→ 0, ossia f
n
→ f uniformemente in [a, b]. Dal
fatto che ¦f
n
¦ ⊂ C[a, b] e dal teorema 1.2.1 si conclude che f ∈ C[a, b] e
pertanto abbiamo mostrato che la successsione ¦f
n
¦ converge in C[a, b].
Osserviamo che lo spazio C[a, b], munito di altre norme come ad esempio
| |
1
oppure | |
2
, non `e completo (esercizio 1.7.4).
Teorema 1.7.6 Lo spazio normato (1(a, b), | |

) `e completo, cio`e `e uno
spazio di Banach.
40
Dimostrazione Sia ¦f
n
¦ una successione di Cauchy in 1(a, b) rispetto al-
la norma | |

: esattamente come nella dimostrazione del teorema 1.7.5,
si ottiene l’esistenza di una funzione f : [a, b] → R tale che f
n
→ f uni-
formemente in [a, b]. Dal teorema 1.2.6 segue che f ∈ 1(a, b); pertanto la
successsione ¦f
n
¦ converge in 1(a, b).
Proviamo infine la completezza degli spazi C
k
[a, b], con la norma |f|
(k)
=

k
h=0
|f
(h)
|

, cominciando dal caso k = 1.
Teorema 1.7.7 Lo spazio normato (C
1
[a, b], | |
(1)
) `e completo, cio`e `e uno
spazio di Banach.
Dimostrazione Sia ¦f
n
¦ una successione di Cauchy rispetto alla norma
| |
(1)
: ci`o significa che le successioni ¦f
n
¦ e ¦f
t
n
¦ sono entrambe di Cauchy
in (C[a, b], | |

). Per la completezza di tale spazio (teorema 1.7.5), esse
convergono uniformemente in [a, b] a due funzioni f, g ∈ C[a, b]. Per il teo-
rema 1.2.4, si deduce che f `e derivabile e che f
t
= g; dato che g `e continua,
si ottiene che f ∈ C
1
[a, b] e che f
n
→f rispetto alla norma | |
(1)
. La tesi `e
provata.
Osserviamo che lo spazio C
1
[a, b] `e normato anche rispetto alla norma | |

,
per`o con questa norma tale spazio non `e completo: infatti la successione ¦f
n
¦
descritta nell’esempio 1.2.3 `e di Cauchy in (C
1
[−1, 1], | |

), ma non con-
verge ad un elemento di C
1
[−1, 1] (in effetti, essa converge uniformemente
ad una funzione che sta fuori dallo spazio C
1
[−1, 1]).
Ragionando per induzione su k, `e facile adesso dedurre il caso generale:
Teorema 1.7.8 Lo spazio normato (C
k
[a, b], | |
(k)
) `e completo, cio`e `e uno
spazio di Banach.
Dimostrazione Se k = 1, la tesi segue dal teorema 1.7.7. Supponiamo che
(C
k−1
[a, b], | |
(k−1)
) sia completo, e dimostriamo che anche (C
k
[a, b], | |
(k)
)
lo `e. Sia ¦f
n
¦ ⊂ C
k
[a, b] una successione di Cauchy: ci`o significa che ¦f
n
¦ `e
di Cauchy in (C
k−1
[a, b], | |
(k−1)
) e che ¦f
(k)
n
¦ `e di Cauchy in (C[a, b], | |

).
Per ipotesi induttiva e per il teorema 1.7.5, si ha per n →∞
f
n
→f in C
k−1
[a, b], f
(k)
n
→g in C[a, b].
In particolare, f `e di classe C
k−1
in [a, b]. Posto g
n
= f
(k−1)
n
, si ha allora
¦g
n
¦ ⊂ C
1
[a, b], e
g
n
→f
(k−1)
in C[a, b], g
t
n
→g in C[a, b];
41
per la completezza di C
1
[a, b], deduciamo f
(k)
= (f
(k−1)
)
t
= g ∈ C[a, b].
Dunque f ∈ C
k
[a, b] e f
n
→f in C
k
[a, b].
`
E spesso molto importante poter approssimare funzioni di una certa classe
con funzioni pi` u regolari: `e utile dunque avere teoremi che assicurino la den-
sit` a di certi spazi in altri. Un esempio fondamentale di questa problematica
`e fornito dal seguente
Teorema 1.7.9 Lo spazio vettoriale T dei polinomi `e denso nello spazio di
Banach (C[a, b], | |

).
Dimostrazione Dobbiamo provare che, data f ∈ C[a, b], per ogni ε > 0
esiste un polinomio P(x) tale che
max
x∈[a,b]
[f(x) −P(x)[ < ε.
Non `e restrittivo supporre che [a, b] = [0, 1]: infatti, supponendo di aver
provato la tesi in questo caso, se f ∈ C[a, b] la funzione
F(t) = f(a + t(b −a)), t ∈ [0, 1]
sta in C[0, 1]; quindi, detto Q(t) un polinomio tale che max
t∈[0,1]
[F(t)−Q(t)[ < ε,
il polinomio
P(x) = Q
_
x −a
b −a
_
, x ∈ [a, b]
verifica max
x∈[a,b]
[f(x) −P(x)[ < ε.
Sia dunque f ∈ C[0, 1]. Per ogni n ∈ N
+
definiamo l’n-esimo polinomio di
Bernstein di f:
B
n
(t) =
n

k=0
_
n
k
_
t
k
(1 −t)
n−k
f
_
k
n
_
, t ∈ [0, 1].
Si noti che B
n
ha grado non superiore a n, che B
n
(0) = f(0) e B
n
(1) = f(1)
per ogni n ∈ N
+
, e che
B
1
(t) = (1−t)f(0)+tf(1), B
2
(t) = (1−t)
2
f(0)+2t(1−t)f
_
1
2
_
+t
2
f(1), . . .
Fissato ε > 0, essendo f uniformemente continua esiste δ > 0 tale che
t, s ∈ [0, 1], [t −s[ < δ =⇒ [f(t) −f(s)[ <
ε
2
.
42
Ci` o premesso, valutiamo la differenza [B
n
(t)−f(t)[ in [0, 1]. Ricordando che,
per la formula del binomio,

n
k=0
_
n
k
_
t
k
(1 −t)
n−k
= 1, si ha
[B
n
(t) −f(t)[ =
¸
¸
¸
¸
¸
n

k=0
_
n
k
_
t
k
(1 −t)
n−k
_
f
_
k
n
_
−f(t)
_
¸
¸
¸
¸
¸
=
=
¸
¸
¸
¸
¸
¸
¸

[
k
n
−t[<δ
_
n
k
_
t
k
(1 −t)
n−k
_
f
_
k
n
_
−f(t)
_
¸
¸
¸
¸
¸
¸
¸
+
+
¸
¸
¸
¸
¸
¸
¸

[
k
n
−t[≥δ
_
n
k
_
t
k
(1 −t)
n−k
_
f
_
k
n
_
−f(t)
_
¸
¸
¸
¸
¸
¸
¸
= S
1
+ S
2
.
La prima sommatoria S
1
, utilizzando l’uniforme continuit` a, si maggiora cos`ı:
S
1

ε
2

[
k
n
−t[<δ
_
n
k
_
t
k
(1 −t)
n−k

ε
2
n

k=0
_
n
k
_
t
k
(1 −t)
n−k
=
ε
2
.
La seconda sommatoria S
2
invece si stima come segue:
S
2
≤ 2|f|

[
k
n
−t[≥δ
(k −nt)
2
δ
2
n
2
_
n
k
_
t
k
(1 −t)
n−k

≤ 2|f|

n

k=0
k
2
−2knt + n
2
t
2
δ
2
n
2
_
n
k
_
t
k
(1 −t)
n−k
.
Adesso osserviamo che se n ≥ 2, derivando rispetto a t l’identit` a
(t + y)
n
=
n

k=0
_
n
k
_
t
k
y
n−k
, t, y ∈ R,
si trova
n(t + y)
n−1
=
n

k=1
k
_
n
k
_
t
k−1
y
n−k
, t, y ∈ R,
n(n −1)(t + y)
n−2
=
n

k=2
k(k −1)
_
n
k
_
t
k−2
y
n−k
, t, y ∈ R;
43
ne segue, posto y = 1 −t e moltiplicando rispettivamente per t e per t
2
,
n

k=1
k
_
n
k
_
t
k
(1 −t)
n−k
= nt ∀t ∈ R,
n

k=2
k(k −1)
_
n
k
_
t
k
(1 −t)
n−k
= n(n −1)t
2
∀t ∈ R,
ed anche, per somma,
n

k=1
k
2
_
n
k
_
t
k
(1 −t)
n−k
= n(n −1)t
2
+ nt ∀t ∈ R.
Sostituendo nella stima per S
2
si ottiene, se n ≥ 2,
S
2

2|f|

δ
2
n
2
_
n(n −1)t
2
+ nt −2nt(nt) + n
2
t
2
¸
=
2nt(1 −t)|f|

δ
2
n
2
.
In definitiva
[B
n
(t) −f(t)[ ≤
ε
2
+
2t(1 −t)|f|

δ
2
n

ε
2
+
|f|

2nδ
2
∀t ∈ [0, 1], ∀n ≥ 2.
Dunque esiste ν ∈ N tale che |B
n
− f|

< ε per ogni n ≥ ν. Ci` o prova la
tesi.
Come ovvia conseguenza del teorema precedente si ha:
Corollario 1.7.10 Lo spazio vettoriale C

[a, b] `e denso nello spazio di Ba-
nach (C[a, b], | |

).
Passiamo adesso ad un importante risultato di compattezza, relativo allo spa-
zio C(X), cosituito dalle funzioni continue, definite su di uno spazio metrico
compatto X. Tale spazio `e normato con la norma
|f|
C(X)
= sup
x∈X
[f(x)[, f ∈ C(X),
la quale `e finita in virt` u della compattezza di X; inoltre C(X) `e uno spazio
di Banach, con dimostrazione del tutto analoga a quella del teorema 1.7.5.
Teorema 1.7.11 (di Ascoli-Arzel`a) Sia (X, d) uno spazio metrico com-
patto e sia T una famiglia di funzioni reali definite su X. Se:
44
(i) T `e equicontinua, cio`e per ogni ε > 0 esiste δ > 0 tale che
x, y ∈ X, d(x, y) < δ =⇒ [f(x) −f(y)[ < ε ∀f ∈ T,
(ii) T `e equilimitata, ossia esiste M ≥ 0 tale che
[f(x)[ ≤ M ∀f ∈ T,
allora da ogni successione ¦f
n
¦
n∈N
⊆ T si pu`o estrarre una sottosuccessione
che converge uniformemente ad una funzione continua f : X →R.
Dimostrazione Ripeteremo l’argomento utilizzato nella dimostrazione della
proposizione 1.7.4. Poich´e X `e separabile (esercizio 1.6.6), esiste un insieme
numerabile E = ¦x
n
¦
n∈N
denso in X. Poniamo S
0
= N; poich´e, per (ii),
l’insieme ¦f
n
(x
0

n∈S
0
`e limitato in R, esiste S
1
⊆ S
0
tale che la sottosuc-
cessione ¦f
n
(x
0

n∈S
1
`e convergente. Per induzione, costruito S
k
⊆ S
k−1
tale
che ¦f
n
(x
j

n∈S
k
`e convergente per ogni j = 0, 1, . . . , k −1, poich´e l’insieme
¦f
n
(x
k

n∈S
k
`e limitato in R esiste S
k+1
⊆ S
k
tale che la sottosuccessione
¦f
n
(x
k

n∈S
k+1
`e convergente (al pari delle sottosuccessioni ¦f
n
(x
j

n∈S
k+1
,
j = 0, 1, . . . , k − 1). Resta cos`ı definita un’infinita sequenza di sottosucces-
sioni, ognuna inclusa nella precedente, delle quali la k + 1-sima `e tale che
¦f
n
(x
j

n∈S
k+1
converge in R per ogni j = 0, 1, . . . , k.
Adesso, posto S = ¦r
0
, r
1
, . . . , r
k
, . . .¦, ove r
k
`e il k-simo elemento dell’insie-
me S
k
, si ha S ⊆ N ed inoltre, per ogni k ∈ N, al pi` u i primi k termini di
S, da r
0
a r
k−1
, non appartengono a S
k
. Di conseguenza, la sottosuccessione
“diagonale” ¦f
n
¦
n∈S
`e tale che ¦f
n
(x
k

n∈S
converge in R per ogni k ∈ N,
ovvero
∃ lim
n∈S, n→∞
f
n
(x) ∀x ∈ E.
Adesso proveremo che ¦f
n
(x)¦
n∈S
converge uniformemente in X. Fissiamo
ε > 0, e consideriamo il numero δ > 0 per cui vale (i). Per la compattezza
di X, il ricoprimento costituito dalle palle B(x, δ), x ∈ X, ha un sottorico-
primento finito B(y
1
, δ), . . . , B(y
N
, δ); dato che E = ¦x
n
¦
n∈N
`e denso in X,
in ciascuna palla B(y
i
, δ) cadr` a un punto x
k
i
∈ E. Quindi, in virt` u di (i)
avremo, per i = 1, . . . , N e per ogni n ∈ N:
[f
n
(x
k
i
) −f
n
(x)[ ≤ [f
n
(x
k
i
) −f
n
(y
i
)[ +[f
n
(y
i
) −f
n
(x)[ < 2ε ∀x ∈ B(y
i
, δ),
e di conseguenza, ricordando che ¦f
n
(x
k
i

n∈S
`e convergente, esiste ν
i
∈ N
tale che per n, m ≥ ν
i
e per x ∈ B(y
i
, δ) risulti
[f
n
(x)−f
m
(x)[ ≤ [f
n
(x)−f
n
(x
k
i
)[+[f
n
(x
k
i
)−f
m
(x
k
i
)[+[f
m
(x
k
i
)−f
m
(x)[ < 5ε.
45
Per qualunque x ∈ X, scelto i in modo che x ∈ B(y
i
, δ), otteniamo allora
[f
n
(x) −f
m
(x)[ < 5ε ∀n, m ∈ S con n, m ≥ max¦ν
1
, . . . , ν
N
¦.
Ci` o prova che ¦f
n
¦
n∈S
`e una successione di Cauchy rispetto alla convergenza
uniforme in X. Poich´e C(X) `e completo, la tesi `e provata.
Osservazione 1.7.12 Se lo spazio X non `e compatto, ma `e unione nume-
rabile di sottoinsiemi compatti, a parit`a delle altre ipotesi si pu`o conclude-
re, con dimostrazione analoga, che ogni successione contenuta in T ha una
sottosuccessione che converge uniformemente in ogni compatto K ⊂ X.
Serie di vettori
Negli spazi normati `e possibile considerare serie di vettori: una serie della
forma


k=0
x
k
, ove gli x
k
sono elementi di uno spazio normato X, `e la suc-
cessione ¦

n
k=0
x
k
¦
n∈N
delle sue somme parziali. Una serie `e convergente in
X al vettore x se e solo se la successione ¦

n
k=0
x
k
¦
n∈N
converge a x nelle
norma di X. Una serie


k=0
x
k
converge totalmente in X se la serie nume-
rica


k=0
|x
k
| `e convergente.
Tramite le serie di vettori `e possibile enunciare un criterio generale di com-
pletezza per gli spazi normati; una versione pi` u generale di questo criterio,
valida negli spazi metrici, `e esposta nell’esercizio 1.7.6.
Teorema 1.7.13 Sia X uno spazio normato. Allora X `e uno spazio di
Banach se e solo se per ogni successione ¦x
n
¦
n∈N
⊆ X, per la quale risulti


n=0
|x
n
| < ∞, esiste y ∈ X tale che la serie


n=0
x
n
converge a y in X,
nel senso che
lim
N→∞
_
_
_
_
_
N

n=0
x
n
−y
_
_
_
_
_
= 0.
In tal caso, si ha
|y| =
_
_
_
_
_

n=0
x
n
_
_
_
_
_

n=0
|x
n
|.
Da questo teorema segue, in particolare, che negli spazi di Banach le serie
totalmente convergenti sono convergenti; naturalmente il viceversa `e falso gi` a
nel caso di R.
46
Dimostrazione (=⇒) Sia


n=0
|x
n
| < ∞. Allora la successione delle som-
me parziali
_

N
n=0
x
n
_
N∈N
`e di Cauchy in X, dato che, per la disuguaglianza
triangolare,
_
_
_
_
_
N

n=M+1
x
n
_
_
_
_
_

N

n=M+1
|x
n
| ∀N, M ∈ N con N > M;
poich´e X `e completo, la successione
_

N
n=0
x
n
_
N∈N
converger`a ad un oppor-
tuno y ∈ X, e ci` o prova la tesi.
(⇐=) Sia ¦y
n
¦ una successione di Cauchy in X: allora per ogni k ∈ N esiste
n
k
∈ N (e non `e restrittivo supporre n
k+1
> n
k
) tale che
|y
m
−y
n
k
| < 2
−k
∀m ≥ n
k
.
Poniamo
_
x
0
= y
n
0
x
k+1
= y
n
k+1
−y
n
k
, k ∈ N;
allora ¦x
k
¦
k∈N
⊆ X, e per ogni m ∈ N si ha

m
k=0
x
k
= y
nm
e
m

k=0
|x
k
| = |y
n
0
| +
m

k=1
|y
n
k
−y
n
k−1
| ≤ |y
n
0
| +

k=0
2
−k+1
< ∞.
Quindi, per ipotesi, esiste y ∈ X tale che
m

k=0
x
k
= y
nm
→y in X;
ma dato che ¦y
n
¦ `e di Cauchy, l’intera successione ¦y
n
¦ converge a y.
Dunque X `e completo. Inoltre, per la continuit` a della norma,
|y| = lim
m→∞
_
_
_
_
_
m

k=0
x
k
_
_
_
_
_
≤ lim
m→∞
m

k=0
|x
k
| =

k=0
|x
k
|.
Esempio 1.7.14 Consideriamo lo spazio vettoriale /
m,n
delle matrici mn
a coefficienti complessi. Una norma su questo spazio `e ad esempio la seguente:
|A|
/m.n
=
¸
¸
¸
_
m

i=1
n

j=1
[a
ij
[
2
.
47
Questa norma `e hilbertiana, visto che proviene dal prodotto scalare
¸A, B¸
/m,n
=
m

i=1
n

j=1
a
ij
b
ij
,
e con essa lo spazio /
m,n
`e evidentemente isomorfo a C
mn
ed `e quindi
uno spazio di Hilbert. Si noti che, in virt` u della disuguaglianza di Cauchy-
Schwarz, per ogni x ∈ C
n
vale la relazione
[Ax[
n
=
¸
¸
¸
_
m

i=1
¸
¸
¸
¸
¸
n

j=1
a
ij
x
j
¸
¸
¸
¸
¸
2

¸
¸
¸
_
m

i=1
_
n

j=1
[a
ij
[
2
_
m

j=1
[x
j
[
2
= |A|
/m,n
[x[
n
,
dalla quale discende la continuit` a dell’applicazione lineare x →Ax.
Nel caso speciale in cui m = n, lo spazio delle matrici quadrate n n si
denota con /
n
, ed `e un’algebra rispetto al prodotto riga per colonna, cio`e
(ovviamente) si ha AB ∈ /
n
per ogni A, B ∈ /
n
; in questo caso la norma

/m,n
sopra definita `e anche “submoltiplicativa” rispetto a tale prodotto:
infatti
|AB|
/n
=
¸
¸
¸
_
n

i,j=1
¸
¸
¸
¸
¸
n

k=1
a
ik
b
kj
¸
¸
¸
¸
¸
2

¸
¸
¸
_
n

i,j=1
_
n

k=1
[a
ik
[
2
__
n

h=1
[b
hj
[
2
_
=
=
¸
¸
¸
_
n

i,k=1
[a
ik
[
2
¸
¸
¸
_
n

h,j=1
[b
hj
[
2
= |A|
/n
|B|
/n
.
In particolare, `e possibile considerare in /
n
polinomi di matrici, ossia matrici
della forma
p(A) =
N

k=0
a
k
A
k
,
le quali si ottengono sostituendo nel polinomio p(λ) =

N
k=0
a
k
λ
k
la matrice
A al posto della variabile complessa λ. Naturalmente, A
k
`e il prodotto riga
per colonna di A per se stessa k volte, e in particolare A
0
= I, ove I `e la
matrice identit`a.
`
E chiaro che ogni polinomio p induce un’applicazione, che
indichiamo con la stessa lettera in grassetto, da /
n
in s´e, data appunto da
A →p(A). Si verifica facilmente che se p e q sono polinomi, e se S = p +q,
P = p q, allora risulta
S(A) = p(A) +q(A) = q(A) +p(A), P(A) = p(A) q(A) = q(A) p(A).
48
Pi` u in generale, possiamo considerare in /
n
serie di potenze di matrici, cio`e
matrici della forma

k=0
a
k
A
k
,
ove ¦a
k
¦ `e una successione di numeri complessi; tali serie potranno converge-
re o no, e ad esse `e applicabile il criterio fornito dal teorema 1.7.13: se risulta


k=0
[a
k
[|A
k
|
/n
< ∞, allora la serie


k=0
a
k
A
k
definisce una matrice ap-
partenente a /
n
.
Consideriamo in particolare la serie “esponenziale”


k=0
A
k
k!
: essa `e conver-
gente in /
n
, dato che

k=0
|A
k
|
k!

k=0
|A|
k
k!
= e
|A|
< ∞.
Definizione 1.7.15 La matrice somma della serie


k=0
A
k
k!
si chiama ma-
trice esponenziale, e si indica col simbolo e
A
. Dunque
e
A
=

k=0
A
k
k!
.
La matrice esponenziale `e di grande importanza, come vedremo, nello studio
dei sistemi differenziali lineari. Le sue propriet`a hanno svariate analogie
con la funzione esponenziale e
t
; in particolare risulta, come abbiamo visto,
|e
A
| ≤ e
|A|
. Inoltre vale il seguente risultato:
Proposizione 1.7.16 Sia A ∈ /
n
. Allora il limite
lim
p→∞
_
I +
A
p
_
p
esiste in /
n
e coincide con e
A
.
Dimostrazione Si ha
m

k=0
A
k
k!
= lim
p→∞
m

k=0
p(p −1) (p −k + 1)
p
k
A
k
k!
= lim
p→∞
m

k=0
_
p
k
_
A
k
p
k
∀m ∈ N.
49
D’altra parte per p > m risulta
m

k=0
_
p
k
_
A
k
p
k
=
p

k=0
_
p
k
_
A
k
p
k

p

k=m+1
_
p
k
_
A
k
p
k
=
=
_
I +
A
p
_
p

p

k=m+1
_
p
k
_
A
k
p
k
,
ovvero, sempre per p > m,
_
I +
A
p
_
p
=
m

k=0
_
p
k
_
A
k
p
k
+
p

k=m+1
_
p
k
_
A
k
p
k
.
Come sappiamo, il primo addendo a secondo membro ha limite per p → ∞;
vediamo come si comporta il secondo. Si ha
p

k=m+1
_
p
k
_
A
k
p
k
=
p

k=m+1
p(p −1) . . . (p −k + 1)
p
k
A
k
k!
=
=
p

k=m+1
_
1 −
1
p
_
. . .
_
1 −
k −1
p
_
A
k
k!
.
Affermiamo che risulta
lim
p→∞
p

k=m+1
_
1 −
1
p
_
. . .
_
1 −
k −1
p
_
A
k
k!
=

k=m+1
A
k
k!
.
Infati, la differenza, in norma, si stima nel modo seguente:
_
_
_
_
_

k=m+1
_
1 −
_
1 −
1
p
_
. . .
_
1 −
k −1
p
__
A
k
k!
_
_
_
_
_
/n


k=m+1
_
1 −
_
1 −
1
p
_
. . .
_
1 −
k −1
p
__
|A|
k
/n
k!


k=m+1
_
1 −
_
1 −
k −1
p
_
k−1
_
|A|
k
/n
k!
;
50
se ora applichiamo il teorema di Lagrange alla funzione g(t) = −(1 − t)
k−1
nell’intervallo [0,
k−1
p
] ⊂ [0, 1], otteniamo, per un opportuno ξ ∈ [0, 1],
1 −
_
1 −
k −1
p
_
k−1
= g
_
k −1
p
_
−g(0) = g
t
(ξ)
k −1
p
=
= (1 −ξ)
k−2
(k −1)
2
p

(k −1)
2
p
.
Dunque

k=m+1
_
1 −
_
1 −
1
p
_
. . .
_
1 −
k −1
p
__
|A|
k
/n
k!

k=m+1
(k −1)
2
p
|A|
k
/n
k!

1
p

k=m+1
|A|
k
/n
(k −2)!
,
il che prova la nostra affermazione.
In conclusione,
∃ lim
p→∞
_
I +
A
p
_
p
= lim
p→∞
m

k=0
_
p
k
_
A
k
p
k
+ lim
p→∞
p

k=m+1
_
p
k
_
A
k
p
k
=
=
m

k=0
A
k
k!
+

k=m+1
A
k
k!
= e
tA
.
Completamento di uno spazio metrico
Se (X, d) `e uno spazio metrico non completo, `e sempre possibile immergerlo
densamente in uno spazio metrico completo (
ˆ
X,
ˆ
d) mediante un’isometria.
Vale infatti il seguente risultato astratto:
Teorema 1.7.17 Sia (X, d) uno spazio metrico. Allora esistono uno spazio
metrico completo (
ˆ
X,
ˆ
d) ed una isometria i : X →
ˆ
X tali che i(X) `e denso
in
ˆ
X. Inoltre tale isometria `e un isomorfismo se e solo se (X, d) `e completo.
Lo spazio (
ˆ
X,
ˆ
d) si dice completamento di (X, d).
Si osservi che il completamento di uno spazio metrico `e unico a meno di
isomorfismi isometrici.
Dimostrazione Denotiamo una generica successione di Cauchy ¦x
n
¦ di
51
elementi di X con il simbolo x. Introduciamo nell’insieme di tali successioni
di Cauchy la relazione seguente:
x ∼ y ⇐⇒ lim
n→∞
d(x
n
, y
n
) = 0.
`
E immediato verificare che la relazione ∼ `e riflessiva e simmetrica; in virt` u
della disuguaglianza triangolare della distanza, essa `e anche transitiva, co-
sicch´e `e una relazione di equivalenza. Denotiamo con
ˆ
X l’insieme delle classi
di equivalenza per tale relazione, che verranno indicate con [x]: pertanto
ˆ
X = ¦[x] : x `e una successione di Cauchy in X¦.
Definiamo una distanza su
ˆ
X ponendo
ˆ
d([x], [y]) = lim
n→∞
d(x
n
, y
n
).
Si osservi che tale limite esiste: infatti dalla disuguaglianza triangolare della
distanza segue che
[d(x
n
, y
n
) −d(x
m
, y
m
)[ ≤ d(x
n
, x
m
) + d(y
m
, y
n
) →0 per n, m →∞;
dunque la successione reale ¦d(x
n
, y
n
)¦, essendo di Cauchy in R, converge in
R. Inoltre il limite sopra scritto dipende solo dalle classi [x] e [y], e non dalla
scelta dei rappresentanti: infatti se x
t
∼ x e y
t
∼ y, allora
[d(x
t
n
, y
t
n
) −d(x
n
, y
n
)[ ≤ d(x
t
n
, x
n
) + d(y
n
, y
t
n
) →0 per n →∞.
Verifichiamo che
ˆ
d `e una distanza su
ˆ
X. Le propriet`a (i) e (iii) della defini-
zione 1.5.1 sono evidenti. Per la (ii) basta notare che
ˆ
d([x], [y]) = 0 ⇐⇒ lim
n→∞
d(x
n
, y
n
) = 0 ⇐⇒ x ∼ y ⇐⇒ [x] = [y].
Infine per la (iv) si ha
ˆ
d([x], [z]) = lim
n→∞
d(x
n
, z
n
) ≤
≤ lim
n→∞
d(x
n
, y
n
) + lim
n→∞
d(y
n
, z
n
) =
ˆ
d([x], [y]) +
ˆ
d([y], [z]).
Adesso definiamo l’immersione X →
ˆ
X. Se x ∈ X, la successione costante
ˆ x = ¦x, x, x, . . .¦ `e certamente di Cauchy in X: poniamo allora
i(x) = [ˆ x].
52
L’applicazione i `e un’isometria, poich´e
ˆ
d(i(x), i(y)) =
ˆ
d([ˆ x], [ˆ y]) = lim
n→∞
d(x, y) = d(x, y).
Proviamo che i(X) `e denso in
ˆ
X. Fissata [x] ∈
ˆ
X, e scelto un rappresentante
x = ¦x
n
¦
n∈N
in tale classe, consideriamo per ogni k ∈ N la successione
costante ˆ x
k
= ¦x
k
, x
k
, x
k
, . . .¦ ⊆ X, e la sua classe di equivalenza [ˆ x
k
] ∈ i(X):
si ha allora
ˆ
d([ˆ x
k
], [ˆ x]) = lim
n→∞
d(x
k
, x
n
)
(questo limite esiste poich´e ¦d(x
k
, x
n

n∈N
`e una successione di Cauchy in
R); quindi
lim
k→∞
ˆ
d([ˆ x
k
], [ˆ x]) = lim
k→∞
lim
n→∞
d(x
k
, x
n
) = 0
in quanto ¦x
n
¦
n∈N
`e di Cauchy in X. Ci`o prova la densit` a di i(X) in
ˆ
X.
Infine mostriamo che (
ˆ
X,
ˆ
d) `e completo. Sia ¦[x
k

k∈N
una successione di
Cauchy in
ˆ
X. Dunque, fissato ε > 0, esiste ν
ε
∈ N tale che
ˆ
d([x
k
], [x
h
]) < ε ∀h, k ≥ ν
ε
.
Per la densit` a gi` a dimostrata di i(X) in
ˆ
X, per ogni k ∈ N possiamo trovare
un elemento y
k
∈ X tale che per la successione costante ˆ y
k
= ¦y
k
, y
k
, y
k
, . . .¦
si abbia
ˆ
d([ˆ y
k
], [x
k
]) <
1
k
. Osserviamo ora che y = ¦y
k
¦
k∈N
`e una successione
di Cauchy in X, in quanto
d(y
k
, y
h
) =
ˆ
d([ˆ y
k
], [ˆ y
h
]) ≤

ˆ
d([ˆ y
k
], [x
k
]) +
ˆ
d([x
k
], [x
h
]) +
ˆ
d([x
h
], [ˆ y
h
]) ≤

1
k
+ ε +
1
h
< 3ε ∀k, h ≥ ν
ε

1
ε
.
Proviamo allora che
ˆ
d([x
k
], [y]) →0 per k →∞. Per ogni k ≥ ν
ε

1
ε
si ha
ˆ
d([x
k
], [y]) ≤
ˆ
d([x
k
], [ˆ y
k
]) +
ˆ
d([ˆ y
k
], [y]) ≤
1
k
+ lim
h→∞
d(y
k
, y
h
) ≤ 4ε,
da cui lim
k→∞
ˆ
d([x
k
], [y]) = 0.
Rimane da verificare che quando X `e uno spazio metrico completo l’isome-
tria i `e un isomorfismo, ossia `e surgettiva oltre che iniettiva. Sia allora X
completo; se [x] ∈
ˆ
X, sia ¦x
n
¦
n∈N
un rappresentante della classe [x]. Tale
¦x
n
¦
n∈N
, essendo una successione di Cauchy in X, converge ad un elemento
z ∈ X. Consideriamo la successione costante ˆ z = ¦z, z, z, . . .¦: essa soddisfa
[ˆ z] = [x], poich´e
ˆ
d([ˆ z], [x]) = lim
n→∞
d(z, x
n
) = 0. Pertanto i(z) = [x].
53
Esercizi 1.7
1. Si provi che se (X, d) `e uno spazio metrico completo e M `e un sot-
toinsieme chiuso non vuoto di X, allora (M, d) `e uno spazio metrico
completo.
2. Si provi che R∪ ¦−∞, +∞¦, con una qualunque delle distanze d
1
e d
2
dell’esempio 1.5.2(3), `e uno spazio metrico completo.
3. Si provi che lo spazio vettoriale B(K) delle funzioni limitate su un
qualsiasi insieme non vuoto K, dotato della norma | |

, `e uno spazio
di Banach.
4. Poniamo per ogni n ≥ 2
f
n
(x) =
_
¸
_
¸
_
1 se 0 ≤ x ≤
1
2
1 + n(
1
2
−x) se
1
2
≤ x ≤
1
2
+
1
n
0 se
1
2
+
1
n
≤ x ≤ 1.
Si provi che ¦f
n
¦ `e una successione di Cauchy in entrambi gli spazi nor-
mati (C[0, 1], | |
1
) e (C[0, 1], | |
2
), ove | |
1
e | |
2
sono le norme
definite nell’esempio 1.4.2 (5). Si provi anche che le f
n
convergono ri-
spetto a tali norme ad una funzione discontinua, e che pertanto i due
spazi normati non sono di Banach.
5. Dimostrare che gli spazi normati
p
, 1 ≤ p ≤ ∞, sono spazi di Banach.
[Traccia: se 1 ≤ p < ∞, data una successione di Cauchy ¦x
k
¦
k∈N

p
,
si provi che per ogni n ∈ N le successioni numeriche ¦x
k
)
n
¦
k∈N
sono
di Cauchy e quindi convergono ad un numero x
n
; si osservi che la
successione ¦x
n
¦
n∈N
`e un elemento x di
p
, dato che risulta per ogni
N ∈ N
_
N

n=0
[x
n
[
p
_
1
p

_
N

n=0
[x
n
−(x
k
)
n
[
p
_
1
p
+
_
N

n=0
[(x
k
)
n
[
p
_
1
p
< ε + M
con ε > 0 e M > 0 opportuni, pur di scegliere k, in dipendenza da N,
sufficientemente grande. Si deduca infine che x
k
→x in
p
per k →∞.
Nel caso p = ∞ la procedura `e analoga: occorre soltanto modificare in
maniera opportuna la maggiorazione precedente.]
54
6. Sia (X, d) uno spazio metrico. Si provi che esso `e completo se e
solo se per ogni successione ¦x
n
¦ ⊆ X, tale che la serie numerica


n=0
d(x
n+1
, x
n
) sia convergente, esiste x ∈ X per cui ¦x
n
¦ converge
a x.
7. Siano f
n
funzioni definite su [a, b], a valori in R
m
(oppure in C
m
). Sup-
poniamo che per ogni n ∈ N e t ∈ [a, b] esista la derivata f
t
n
(t) ∈ R
m
,
e che la funzione f
t
n
: [a, b] → R
m
sia continua. Si provi che se le
serie


k=0
f
n
(t) e


k=0
f
t
n
(t) sono entrambe convergenti in R
m
, uni-
formemente rispetto a t ∈ [a, b], con somme f (t) e g(t), allora f ha la
derivata f
t
: [a, b] →R
m
e risulta f
t
= g.
8. (Lemma del Dini) Sia ¦f
n
¦
n∈N
una successione monotona di funzioni
continue su [a, b]. Posto f(x) = lim
n→∞
f
n
(x), si provi che se f ∈ C[a, b]
allora la convergenza delle f
n
verso f `e uniforme.
[Traccia: Sostituendo f
n
con [f
n
−f[ possiamo supporre che la succes-
sione f
n
converga puntalmente a 0 in modo decrescente. Fissato ε > 0,
poniamo A
n
= ¦x ∈ [a, b] : f
n
(x) < ε¦: gli A
n
sono aperti crescenti
rispetto all’inclusione, la cui unione `e tutto [a, b]. Per compattezza,
esistono n
1
, . . . , n
p
∈ N tali che [a, b] ⊂

p
i=1
A
n
i
; se ne deduca la tesi.]
9. Si provi che per ogni matrice A ∈ /
n
esiste il limite (finito o infinito)
r(A) = lim
k→∞
|A
k
|
1/k
/n
.
Tale quantit`a si chiama raggio spettrale di A.
[Traccia: detto r(A) = liminf
k→∞
|A
k
|
1/k
/n
e fissato ε > 0, si fissi un
intero positivo m tale che r(A) − ε < |A
m
|
1/m
/n
< r(A) + ε; poi, se k
∈ [mh, m(h + 1)] (h ∈ N
+
), scrivendo A
k
= A
mh
A
k−mh
si verifichi che
|A
k
|
1
k
/n
≤ (r(A) + ε)
mh
k
|A|
k−mh
k
/n
,
e infine, osservato che
mh
k
≥ 1 −
m
k
e
k−mh
k

1
k
, si deduca
limsup
k→∞
|A
k
|
1/k
/n
≤ r(A) + ε.]
10. Sia (X, d) uno spazio metrico compatto e sia T un sottoinsieme com-
patto dello spazio di Banach (C(X), | |

). Si provi che gli elementi
di T formano una famiglia equicontinua ed equilimitata.
55
11. Sia ¦a
k
¦ una successione complessa e sia ρ = limsup
k→∞
[a
k
[
1
k
. Sup-
posto ρ ∈]0, ∞[, si provi che la serie


k=0
a
k
A
k
`e convergente in /
n
se r(A) <
1
ρ
e non `e convergente se r(A) >
1
ρ
, mentre nulla si pu` o dire
quando r(A) =
1
ρ
(ricordiamo che r(A) `e il raggio spettrale di A). Si
provi inoltre che per ogni δ ∈]0,
1
ρ
[ la convergenza della serie `e totale e
uniforme sull’insieme ¦A ∈ /
n
: r(A) ≤
1
ρ
−δ¦. Si formuli infine un
analogo enunciato nel caso in cui ρ = 0 oppure ρ = +∞.
12. Si provi che se le matrici A, B ∈ /
n
commutano, ossia AB = BA,
allora vale la formula del binomio
(A+B)
k
=
k

h=0
_
k
h
_
A
h
B
k−h
∀k ∈ N;
se ne deducano le relazioni
e
A+B
= e
A
e
B
, (e
A
)
−1
= e
−A
.
13. Posto J =
_
0 i
i 0
_
, si verifichi che J
2
= −I e si provi l’identit`a
e
ϑJ
= (cos ϑ)I + (sin ϑ)J ∀ϑ ∈ R.
14. Si verifichi che lo spazio metrico (R, d), ove
d(x, y) = [ arctan x −arctan y[ ∀x, y ∈ R,
(si veda l’esempio 1.5.2(3)) non `e completo; se ne determini il comple-
tamento.
15. Indichiamo con c
00
lo spazio vettoriale delle successioni definitivamente
nulle. Si verifichi che tale spazio non `e completo rispetto alla norma di

1
e si provi che il suo completamento `e isomorfo e isometrico a
1
.
16. Sia X uno spazio con prodotto scalare. Provare che il completamento
di X `e uno spazio di Hilbert rispetto al prodotto scalare
¸[x], [x
t

ˆ
X
= lim
n→∞
¸x
n
, x
t
n
¸
X
.
56
1.8 Contrazioni
Uno dei motivi che rendono importanti gli spazi metrici completi `e il fatto che
in tali spazi `e valido il “teorema delle contrazioni”, strumento fondamentale
nelle applicazioni per la sua generalit` a e versatilit`a.
Definizione 1.8.1 Sia (X, d) uno spazio metrico. Una contrazione su X `e
un’applicazione F : X →X per la quale esiste un numero λ ∈ [0, 1[ tale che
d(F(x), F(x
t
)) ≤ λd(x, x
t
) ∀x, x
t
∈ X.
Naturalmente, ogni contrazione `e una funzione uniformemente continua. Tut-
te le funzioni f : R → R di classe C
1
, con derivata limitata in valore asso-
luto da una costante minore di 1, sono contrazioni (in virt` u del teorema di
Lagrange); per esempio, le funzioni
1
2
cos x,
3
4
arctan x, ln(2 + x
2
) sono con-
trazioni su R. Un altro esempio `e il seguente: sia X = C[a, b] con la distanza
d(f, g) = |f −g|

; allora l’applicazione g →F(g), definita da
[F(g)](x) =
_
x
a
g(t) dt, x ∈ [a, b],
`e una contrazione su X se b −a < 1. Infatti se f, g ∈ C[a, b] si ha
[[F(f)](x) −[F(g)](x)[ =
¸
¸
¸
¸
_
x
a
(f(t) −g(t))dt
¸
¸
¸
¸
≤ (x−a)|f −g|

∀x ∈ [a, b],
da cui
|F(f) −F(g)|

≤ (b −a)|f −g|

∀f, g ∈ C[a, b].
Teorema 1.8.2 (delle contrazioni) Sia (X, d) uno spazio metrico comple-
to e sia F : X →X una contrazione. Allora F ha un unico punto fisso, ossia
esiste un unico punto x ∈ X tale che F(x) = x.
Dimostrazione Per ipotesi, esiste λ ∈ [0, 1[ tale che
d(F(x), F(x
t
)) ≤ λd(x, x
t
) ∀x, x
t
∈ X.
Sia x

un arbitrario punto di X. Definiamo per ricorrenza la seguente
successione:
_
x
0
= x

x
n+1
= F(x
n
), n ∈ N.
57
Osserviamo che
d(x
n+1
, x
n
) = d(F(x
n
), F(x
n−1
)) ≤ λd(x
n
, x
n−1
) ∀n ∈ N
+
,
e quindi
d(x
n+1
, x
n
) ≤ λd(x
n
, x
n−1
) ≤ λ
2
d(x
n−1
, x
n−2
) ≤ . . . ≤ λ
n
d(x
1
, x
0
) ∀n ∈ N.
Pertanto, applicando ripetutamente la disuguaglianza triangolare, se m > n
si ha
d(x
m
, x
n
) ≤
m−1

h=n
d(x
h+1
, x
h
) ≤
m−1

h=n
λ
h
d(x
1
, x

).
Poich´e la serie

λ
h
`e convergente, la successione ¦x
n
¦ `e di Cauchy in X.
Dato che X `e completo, essa converge ad un elemento x ∈ X. Proviamo che
x `e un punto fisso per F:
d(x, F(x)) ≤ d(x, x
n+1
) + d(x
n+1
, F(x)) =
= d(x, x
n+1
) + d(F(x
n
), F(x)) ≤
≤ d(x, x
n+1
) + λd(x
n
, x) ∀n ∈ N,
da cui, per n →∞, otteniamo d(x, F(x)) = 0, cio`e F(x) = x.
Proviamo che x `e l’unico punto fisso di F: se x ∈ X `e un altro punto fisso,
si ha
d(x, x) = d(F(x), F(x)) ≤ λd(x, x),
il che, essendo λ < 1, `e impossibile se x ,= x. Dunque x = x.
Una variante importante del teorema delle contrazioni, che ne aumenta note-
volmente la versatilit`a, si ha nel caso di una famiglia di contrazioni dipendenti
da un parametro (il quale pu` o essere una variabile reale o anche di tipo pi` u
generale, ad esempio vettoriale). Il succo del risultato che segue `e che se
le contrazioni hanno tutte la stessa costante, allora i rispettivi punti fissi
dipendono con continuit`a dal parametro.
Teorema 1.8.3 (delle contrazioni dipendenti da parametro) Siano
(B, δ) uno spazio metrico, (X, d) uno spazio metrico completo e T : BX →
X un’applicazione continua. Supponiamo inoltre che esista λ ∈ [0, 1[ tale che
d(T(b, x), T(b, x
t
)) ≤ λd(x, x
t
) ∀x, x
t
∈ X, ∀b ∈ B.
Allora per ogni b ∈ B esiste un unico x
b
∈ X tale che T(b, x
b
) = x
b
, e la
funzione b →x
b
, da B in X, `e continua.
58
Dimostrazione Per ciascun b ∈ B il punto fisso x
b
esiste unico per il
teorema 1.8.2. Inoltre possiamo scrivere per ogni a, b ∈ B
d(x
a
, x
b
) = d(T(a, x
a
), T(b, x
b
)) ≤
≤ d(T(a, x
a
), T(b, x
a
)) + d(T(b, x
a
), T(b, x
b
)) ≤
≤ d(T(a, x
a
), T(b, x
a
)) + λd(x
a
, x
b
).
Se ne deduce
d(x
a
, x
b
) ≤
1
1 −λ
d(T(a, x
a
), T(b, x
a
)) ∀a, b ∈ B.
Ora, tenendo fisso a ∈ B, fissiamo ε > 0: la continuit`a di T nel punto (a, x
a
)
implica che esiste η > 0 per cui
d(T(a, x
a
), T(b, x
a
)) < (1 −λ)ε se δ(a, b) < η,
e dunque d(x
a
, x
b
) < ε se δ(a, b) < η. Ci` o prova la tesi.
I teoremi 1.8.2 e 1.8.3 garantiscono l’esistenza di un’unica soluzione per l’e-
quazione F(x) − x = 0 e la sua continuit` a rispetto ai parametri presenti.
Poich´e vi `e un’innumerevole variet`a di problemi che si possono ricondurre
ad una equazione di questo tipo, `e chiara l’importanza applicativa di questi
risultati. Negli esercizi 1.8.6 e 1.8.7 si mostra come applicare il teorema delle
contrazioni per dimostrare il teorema di esistenza e unicit` a per la soluzione
del problema di Cauchy relativo a sistemi differenziali del primo ordine in
forma normale, nonch´e la continuit`a della soluzione rispetto al dato iniziale.
Esercizi 1.8
1. Sia A = ¦a
ij
¦ una matrice reale n n. Si consideri l’applicazione
lineare ϕϕϕ : R
n
→R
n
definita da ϕϕϕ(x) = Ax. Si provino le affermazioni
seguenti:
(i) se esiste α ∈]0, 1[ tale che max
_

n
j=1
[a
ij
[ : 1 ≤ i ≤ n
_
< α, allora
ϕϕϕ `e una contrazione su (R
n
, d

), ove d

(x, y) = max
1≤i≤n
[x
i
−y
i
[;
(ii) se esiste α ∈]0, 1[ tale che max ¦

n
i=1
[a
ij
[ : 1 ≤ j ≤ n¦ < α, allora
ϕϕϕ `e una contrazione su (R
n
, d
1
), ove d
1
(x, y) =

n
i=1
[x
i
−y
i
[;
(iii) se esiste α ∈]0, 1[ tale che
_

n
i,j=1
[a
ij
[
2
< α, allora ϕϕϕ `e una
contrazione su (R
n
, d
2
), ove d
2
(x, y) =
_

n
i,j=1
[x
i
−y
i
[
2
.
59
2. Sia K : [a, b] → [a, b] una funzione continua. Provare che la funzione
F : C[a, b] →C[a, b], definita da
[F(g)](x) =
_
b
a
K(x, y)g(y) dy, x ∈ [a, b],
`e una contrazione su C[a, b] purch´e
max
x∈[a,b]
_
b
a
[K(x, y)[ dy < 1.
3. Sia (X, d) uno spazio metrico completo e sia F : X → X una funzione
continua. Supponiamo che esista k ∈ N
+
tale che la k-sima iterata
F
k
= F ◦ F ◦ ◦ F sia una contrazione. Si provi che allora F ha un
unico punto fisso in X.
4. Sia K : [a, b] → [a, b] una funzione continua. Provare che la funzione
F : C[a, b] →C[a, b], definita da
[F(g)](x) =
_
x
a
K(x, y)g(y) dy, x ∈ [a, b],
ha un’opportuna iterata F
k
che `e una contrazione su C[a, b].
[Traccia: si verifichi che |F
k
(g − f)|


M
k
(b−a)
k
k!
|g − f|

per ogni
k ∈ N
+
, ove M = max
[a,b][a,b]
[K[.]
5. Si provi che la successione ¦f
n
¦ definita da
_
f
0
(x) = x
f
n+1
(x) =
1
2
ln(1 + xf
n
(x)),
x ≥ 0
converge uniformemente su [0, ∞[ e se ne determini il limite.
[Traccia: Si verifica facilmente che le f
n
sono tutte funzioni crescenti,
con 0 ≤ f
n+1
≤ f
n
. Si provi, utilizzando il teorema delle contrazio-
ni, che la funzione limite L(x) `e nulla su [0, 2] mentre `e continua, non
negativa, crescente e concava su [2, ∞[. Si applichi il lemma del Dini
per provare la convergenza uniforme in [0, a], con a sufficientemente
grande; per quanto riguarda [a, ∞[, scrivendo f
n
in funzione di f
n−2
si mostri che lim
x→∞
fn(x)
ln x
=
1
2
per ogni n ≥ 2, e che di conseguenza
lim
x→∞
(f
n
(x) − f
m
(x)) = 0 per ogni n > m. Si deduca che f
n
− f
m
`e
60
limitata su [0, ∞[ e che lo stesso accade per f
n
−L; infine si ricavi che
f
n
− L converge a 0 uniformemente in [a, ∞[. Per il calcolo di L(x) si
mostri che per x > 2 risulta x =
e
2L(x)
−1
L(x)
, che quindi, per x > 2, L(x) `e
l’inversa della funzione
e
2y
−1
y
, y > 0.]
6. Sia I ⊆ R un intervallo non vuoto e sia g : A → R
m
una funzione
continua, definita su un aperto A ⊆ R
m+1
, tale che per ogni compatto
K ⊂ A esista una costante H
K
≥ 0 per cui
[g(x, y) −g(x, u)[
m
≤ H
K
[y −u[
m
∀(x, y), (x, u) ∈ K.
Fissato un punto (x
0
, u
0
) ∈ A, siano a, b > 0 tali che, posto
R = ¦(x, u) ∈ R
m+1
: [x −x
0
[ ≤ a, [u −u
0
[
m
≤ b¦,
risulti R ⊂ A; siano inoltre M, H ≥ 0 tale che
[g(x, u)[
m
≤ M ∀(x, u) ∈ R,
[g(x, y) −g(x, u)[
m
≤ H[y −u[
m
∀(x, y), (x, u) ∈ R.
Si provi che esistono un intervallo J = [x
0
−h, x
0
+h], con 0 < h ≤ a,
e un’unica funzione u : J →R
m
di classe C
1
, tali che
u
t
(x) = g(x, u(x)) ∀x ∈ J, u(x
0
) = u
0
;
si mostri anche che il grafico di u `e tutto contenuto in R, cio`e si ha
[u(x) −u
0
[
m
≤ b ∀x ∈ J.
61
[Traccia: anzitutto si trasformi il problema di Cauchy
u
t
(x) = g(x, u(x)), u(x
0
) = u
0
nella forma integrale equivalente
u(x) = u
0
+
_
x
x
0
g(ξ, u(ξ)) dξ;
a questo proposito si ricordi che l’integrale
_
b
a
F(t)dt di una funzione
continua F : [a, b] → R
m
`e il vettore
_
_
b
a
F
1
(t) dt, . . . ,
_
b
a
F
m
(t) dt
_
, e
che vale la fondamentale disuguaglianza
¸
¸
¸
_
b
a
F(t)dt
¸
¸
¸
m

_
b
a
[F(t)[
m
dt.
Poi si provi che l’applicazione v →F(v), definita da
[F(v)](x) = u
0
+
_
x
x
0
g(ξ, v(ξ)) dξ, x ∈ J,
per h sufficientemente piccolo `e una contrazione che manda lo spazio
metrico completo (V, d) in s´e, ove V = ¦v ∈ C(J, R
m
) : sup
J
[v() −
u
0
[ ≤ b¦ e d `e la distanza associata alla norma | |

.]
7. Nelle ipotesi dell’esercizio precedente, si provi che la soluzione u del
problema di Cauchy
u
t
(x) = g(x, u(x)) ∀x ∈ J, u(x
0
) = u
0
;
dipende con continuit`a da u
0
.
[Traccia: Con riferimento alla traccia dell’esercizio precedente, ponia-
mo B = ¦u ∈ R
m
: [u−u
0
[
m
≤ b/2¦ e [T(y, u)](x) = y+
_
x
x
0
g(t, u(t)) dt
per ogni x ∈ [x
0
−h, x
0
+h]. Si verifichi che T : BV →V `e continua e
che per h sufficientemente piccolo T(y, ) `e una contrazione di costante
1/2 per ogni y ∈ B. Poi si applichi il teorema 1.8.3.]
1.9 Funzioni implicite
Un’importante applicazione del teorema delle contrazioni riguarda lo studio
dei luoghi di punti dello spazio R
N
che sono insiemi di livello di funzioni
regolari F : A ⊆ R
N
→R
k
, N > k, ove A `e un aperto:
Z
c
= ¦x ∈ A : F(x) = c¦, c ∈ R
k
.
62
Sono insiemi di questo tipo, con k = 1: le coniche in R
2
(ad esempio le ellissi
x
2
a
2
+
y
2
b
2
= 1) cos`ı come molte altre “curve” importanti; le quadriche in R
3
(ad esempio gli ellissoidi
x
2
a
2
+
y
2
b
2
+
z
2
c
2
= 1); le sfere [x[
2
N
= r
2
in qualunque
dimensione N ≥ 2, eccetera.
Ci proponiamo di vedere sotto quali ipotesi un’equazione del tipo F(x) = c `e
tale da permetterci di esplicitare k variabili in funzione delle altre N −k: ci`o
significa che, almeno localmente, l’insieme Z
c
sopra introdotto `e il grafico di
una certa funzione di N −k variabili, a valori in R
k
, funzione che `e definita
implicitamente dall’equazione F(x) = c. Come vedremo, non sempre ci`o `e
possibile, anche se F `e di classe C

(A).
Esempi 1.9.1 (1) Siano N = 2 e k = 1. Se F(x, y) = x
2
+ y
2
, allora Z
c
`e
vuoto per c < 0, Z
c
= ¦(0, 0)¦ per c = 0, e Z
c
`e la circonferenza di raggio

c
centrata nell’origine per c > 0.
(2) Se N = 2, k = 1 e F(x, y) = x
2
− y
2
, allora Z
c
`e un’iperbole equilatera
per c ,= 0 (con asintoti le rette y = ±x), mentre Z
0
`e costituito dalle due
rette y = ±x per c = 0.
Poich´e Z
c
`e l’insieme di livello 0 per la funzione F − c, non `e restrittivo
supporre c = 0 (e scrivere Z in luogo di Z
0
). Osserviamo che se Z `e la
circonferenza x
2
+ y
2
− 1 = 0, essa `e il grafico di una funzione di classe C
1
soltanto localmente e non globalmente: precisamente, per ogni (x
0
, y
0
) ∈ Z si
pu` o trovare un intorno U tale che U∩Z `e grafico della funzione y = ±

1 −x
2
,
oppure x = ±
_
1 −y
2
, ma nessuna di queste quattro rappresentazioni `e va-
lida simultaneamente in tutti i punti di Z.
La questione `e chiarita da un fondamentale risultato: il teorema delle fun-
zioni implicite, familiarmente noto come teorema del Dini. Lo enunciamo
dapprima nel caso N = 2, perch´e di natura pi` u elementare e di pi` u faci-
le dimostrazione; successivamente, per mezzo del teorema delle contrazioni,
tratteremo il caso generale.
Teorema 1.9.2 (del Dini, caso N = 2) Sia A un aperto di R
2
, sia F ∈
C
1
(A) e poniamo Z = ¦(x, y) ∈ A : F(x, y) = 0¦. Se (x
0
, y
0
) ∈ Z e
∇∇∇F(x
0
, y
0
) ,= 0, allora esiste un intorno U di (x
0
, y
0
), con U ⊂ A, tale
che Z ∩ U `e grafico di una funzione di classe C
1
. Pi` u precisamente: se
F
y
(x
0
, y
0
) ,= 0, allora esistono un intorno V di x
0
, un intorno W di y
0
(con
V W ⊂ A), ed una funzione f : V →W tale che
Z ∩ (V W) = ¦(x, f(x)) : x ∈ V ¦;
63
inoltre la funzione implicita f `e di classe C
1
e
f
t
(x) = −
F
x
(x, f(x))
F
y
(x, f(x))
∀x ∈ V.
Analogamente, se F
x
(x
0
, y
0
) ,= 0, allora esistono un intorno V di x
0
, un
intorno W di y
0
(con V W ⊂ A), ed una funzione g : W →V tale che
Z ∩ (V W) = ¦(g(y), y) : y ∈ W¦, g
t
(y) = −
F
y
(g(y), y)
F
x
(g(y), y)
∀y ∈ W.
Prima di dimostrare il teorema, facciamo alcune considerazioni.
Osservazioni 1.9.3 (1) Nel caso in cui valgono entrambe le diseguaglianze
F
x
(x
0
, y
0
) ,= 0 e F
y
(x
0
, y
0
) ,= 0, l’insieme Z ∩ (V W) pu`o essere descritto
sia dall’equazione y = f(x), sia da x = g(y); in questo caso f : V → W `e
invertibile e g = f
−1
.
(2) L’espressione delle derivate f
t
(x) e g
t
(y) si pu`o ricavare derivando ri-
spetto a x l’identit` a F(x, f(x)) = 0 e rispetto a y l’identit` a F(g(y), y) = 0,
naturalmente dopo aver accertato che le funzioni implicite f e g siano deri-
vabili.
(3) Se F `e di classe C
k
, k ≥ 2, allora le funzioni implicite f e g, se definite,
sono di classe C
k
e le loro derivate si ottengono derivando via via le espres-
sioni di f
t
(x) e g
t
(y). Ad esempio, se F `e di classe C
2
e f `e ben definita, si
ha, omettendo per semplicit` a la dipendenza da (x, f(x)),
f
tt
(x) = −
d
dx
F
x
(x, f(x))
F
y
(x, f(x))
= −
(F
xx
+ F
xy
f
t
)F
y
−F
x
(F
yx
+ F
yy
f
t
)
F
2
y
,
e riutilizzando l’espressione di f
t
(x) si trova
f
tt
(x) = −
F
2
y
F
xx
−2F
x
F
y
F
xy
+ F
2
x
F
yy
F
3
y
.
(4) La retta tangente al grafico della funzione implicita, cio`e all’insieme Z,
nel punto (x
0
, y
0
) `e data da
F
x
(x
0
, y
0
)(x −x
0
) + F
y
(x
0
, y
0
)(y −y
0
) = 0 :
infatti l’equazione di tale retta `e
y = y
0
+ f
t
(x
0
)(x −x
0
) oppure x = x
0
+ g
t
(y
0
)(y −y
0
),
64
e dalle espressioni di f
t
(x
0
) e g
t
(y
0
) si ricava in entrambi i casi l’equazione
sopra scritta. Essa era del resto prevedibile, poich´e sappiamo che il gradiente
di F, se non nullo, `e ortogonale alle curve di livello di F.
Dimostrazione del teorema 1.9.2 Sia (x
0
, y
0
) ∈ Z e supponiamo che
F
y
(x
0
, y
0
) ,= 0: allora, per continuit` a, esiste un intorno V
0
W di (x
0
, y
0
),
con V
0
W ⊂ A, nel quale si ha F
y
,= 0; si pu` o supporre, cambiando even-
tualmente F con −F, che sia F
y
> 0 in V
0
W. Non `e restrittivo supporre
che l’intorno sia del tipo W =]y
0
−k, y
0
+k[. Consideriamo la restrizione di
F lungo la retta x = x
0
, cio`e y →F(x
0
, y): essa `e una funzione strettamente
crescente (perch´e F
y
(x
0
, y) > 0) e nulla per y = y
0
, dato che (x
0
, y
0
) ∈ Z.
Dunque
F(x
0
, y) > 0 ∀y ∈]y
0
, y
0
+ k], F(x
0
, y) < 0 ∀y ∈ [y
0
−k, y
0
[.
Il teorema di permanenza del segno, applicato alle funzioni x →F(x, y
0
+k)
e x →F(x, y
0
−k), ci dice che esiste un intorno V =]x
0
−h, x
0
+h[⊆ V
0
, tale
che
F(x, y
0
+ k) > 0 ∀x ∈ V, F(x, y
0
−k) < 0 ∀x ∈ V.
Consideriamo adesso la funzione y → F(x, y), ove x `e un generico punto di
V : dato che F(x, y
0
− k) < 0 < F(x, y
0
+ k), e ricordando che F
y
(x, y) > 0
per ogni y ∈ W, in corrispondenza di x esiste un unico punto y ∈ W tale che
65
F(x, y) = 0; tale punto y, che dipende dall’x prescelto, possiamo ribattezzarlo
f(x). Resta cos`ı definita una funzione f : V → W tale che, per costruzione,
risulta F(x, f(x)) = 0 per ogni x ∈ V ; pi` u precisamente si ha
x ∈ V, y ∈ W, F(x, y) = 0 ⇐⇒ y = f(x).
La funzione f sopra introdotta `e la funzione implicita definita dall’equazione
F(x, y) = 0 nell’intorno di (x
0
, y
0
), ed in generale non `e possibile ricavarla
esplicitamente.
Dimostriamo ora che f `e continua in ogni punto di V . Consideriamo due
punti distinti x, x
t
∈ V : per definizione di f si ha F(x, f(x)) = F(x
t
, f(x
t
)) =
0. Poniamo
G(t) = F(x + t(x
t
−x), f(x) + t(f(x
t
) −f(x))), t ∈ [0, 1] :
dato che G(0) = G(1) = 0, per il teorema di Rolle esiste s ∈]0, 1[ tale che
0 = F(x
t
, f(x
t
)) −F(x), f(x)) = G(1) −G(0) =
= G
t
(s) = F
x
(ξ, η)(x
t
−x) + F
y
(ξ, η)(f(x
t
) −f(x)),
ove (ξ, η) = (x +s(x
t
−x), f(x) +s(f(x
t
) −f(x))) `e un punto opportuno del
segmento di estremi (x, f(x)) e (x
t
, f(x
t
)). Dato che V W `e un rettangolo,
si ha (ξ, η) ∈ V W ⊆ V
0
W, e quindi F
y
(ξ, η) > 0. Se ne deduce
f(x
t
) −f(x) = −
F
x
(ξ, η)
F
y
(ξ, η)
(x
t
−x),
da cui, posto M = max
V W
[F
x
[, m = min
V W
F
y
, si ricava
[f(x
t
) −f(x)[ ≤
M
m
[x
t
−x[ ∀x
t
, x ∈ V.
Ci` o prova che f `e continua, anzi lipschitziana, in V .
Adesso facciamo tendere x
t
a x: per la continuit`a appena dimostrata, si ha
f(x
t
) →f(x); di conseguenza, essendo F
x
e F
y
continue, otteniamo
lim
x

→x
f(x
t
) −f(x)
x
t
−x
= − lim
x

→x
F
x
(ξ, η)
F
y
(ξ, η)
= −
F
x
(x, f(x))
F
y
(x, f(x))
∀x ∈ V,
il che mostra che f `e anche derivabile in V , con
f
t
(x) = −
F
x
(x, f(x))
F
y
(x, f(x))
∀x ∈ V.
66
Infine, poich´e l’espressione a secondo membro `e continua, si conclude che
f ∈ C
1
(V ). La tesi `e cos`ı provata nel caso F
y
(x
0
, y
0
) ,= 0; l’altro caso, in cui
F
x
(x
0
, y
0
) ,= 0, `e perfettamente analogo.
Esempio 1.9.4 Sia F(x, y) = y ln x − x cos y; F `e definita sul semipiano
A = ¦(x, y) ∈ R
2
: x > 0¦ e
∇∇∇F(x, y) =
_
y
x
−cos y, ln x + x sin y
_
∀(x, y) ∈ A.
Nel punto (1, π/2) si ha
F
_
1,
π
2
_
= 0, ∇∇∇F
_
1,
π
2
_
=
_
π
2
, 1
_
.
Esistono dunque un intorno U = V W di (1, π/2) ed una funzione f : V →
W, invertibile, con f e f
−1
di classe C
1
, tale che
f(x) ln x−x cos f(x) = 0 ∀x ∈ V, y ln f
−1
(y)−f
−1
(y) cos y = 0 ∀y ∈ W.
Scriviamo l’equazione della retta tangente a Z = ¦(x, y) ∈ A : F(x, y) = 0¦
nel punto (1, π/2): si ha
f
t
(1) = −
F
x
(1, π/2)
F
y
(1, π/2)
= −
π
2
e la retta cercata `e data da
π
2
(x −1) +
_
y −
π
2
_
= 0.
Poich´e F ∈ C

(A), si ha f ∈ C

(V ). Volendo scrivere il polinomio di Taylor
di f di centro 1 e grado 2, occorre anzitutto calcolare le derivate seconde di
F:
F
xx
(x, y) = −
y
x
2
, F
xy
(x, y) =
1
x
+ sin y, F
yy
(x, y) = x cos y.
Derivando l’identit`a F(x, f(x)) = 0 si trova successivamente
F
x
(x, f(x)) + F
y
(x, f(x))f
t
(x) = 0,
F
xx
(x, f(x))+2F
xy
(x, f(x))f
t
(x)+F
yy
(x, f(x))[f
t
(x)]
2
+F
y
(x, f(x))f
tt
(x) = 0,
67
da cui, sostituendo i valori x = 1 e f(1) = −π/2 si ricava facilmente f
tt
(1) =
5π/2. Dunque il polinomio cercato `e
P
2
(x) = f(1) + f
t
(1)(x −1) +
f
tt
(1)
2
(x −1)
2
=
π
2

π
2
(x −1) +

4
(x −1)
2
.
In modo perfettamente analogo si pu`o verificare che il polinomio di Taylor
di g, di centro π/2 e grado 2, `e dato da
Q
2
(y) = 1 −
2
π
_
y −
π
2
_
+
12
π
2
_
y −
π
2
_
2
.
Quando le ipotesi del teorema 1.9.2 non sono verificate, l’insieme Z dove si
annulla la funzione F(x, y) pu` o avere le forme pi` u diverse. Vediamo un caso
tipico: sia F : A →R una funzione di classe C
2
e supponiamo che nel punto
(x
0
, y
0
) ∈ A risulti
F(x
0
, y
0
) = 0, ∇∇∇F(x
0
, y
0
) = 0.
Denotiamo con H la matrice Hessiana di F: se det H(x
0
, y
0
) > 0, allora F
ha in (x
0
, y
0
) un massimo relativo o un minimo relativo e, in particolare,
(x
0
, y
0
) `e un punto isolato dell’insieme Z. Se invece det H(x
0
, y
0
) < 0, F ha
in (x
0
, y
0
) un punto di sella; in questo caso vale il seguente
Teorema 1.9.5 Sia A ⊆ R
2
un aperto, sia (x
0
, y
0
) un punto di A e sia
F ∈ C
2
(A) una funzione tale che
F(x
0
, y
0
) = 0, ∇∇∇F(x
0
, y
0
) = 0, det H(x
0
, y
0
) < 0.
Allora, posto Z = ¦(x, y) ∈ A : F(x, y) = 0¦, esiste un intorno U ⊆ A di
(x
0
, y
0
) tale che Z∩U `e formato da due grafici di opportune funzioni di classe
C
1
, i quali si incontrano trasversalmente in (x
0
, y
0
), ossia le rette tangenti
ai due grafici in (x
0
, y
0
) sono diverse. In particolare, Z ∩ U non `e grafico di
alcuna funzione di una variabile.
Dimostrazione Indichiamo con Q la forma quadratica associata alla ma-
trice
_
a b
b c
_
= H(x
0
, y
0
) =
_
F
xx
(x
0
, y
0
) F
xy
(x
0
, y
0
)
F
yx
(x
0
, y
0
) F
yy
(x
0
, y
0
)
_
,
vale a dire
Q(u, v) = au
2
+ 2buv + cv
2
∀(u, v) ∈ R
2
,
68
ed osserviamo subito che il gradiente
∇∇∇Q(u, v) = 2
_
au + bv
bu + cv
_
, (u, v) ∈ R
2
,
`e nullo solo nell’origine, essendo b
2
−ac > 0. In particolare, esiste m > 0 tale
che
(a cos ϑ + b sin ϑ)
2
+ (b cos ϑ + c sin ϑ)
2
≥ m
2
∀ϑ ∈ R.
In virt` u della formula di Taylor, per ogni ε > 0 esiste r
ε
∈]0, 1[ tale che,
detto B
r
il disco di centro (x
0
, y
0
) e raggio r, per ogni (x, y) ∈ B

valgono
le relazioni, per noi fondamentali,
¸
¸
¸
¸
F(x, y) −
1
2
Q(x −x
0
, y −y
0
)
¸
¸
¸
¸
≤ ε[(x −x
0
)
2
+ (y −y
0
)
2
],
¸
¸
¸
¸
∇∇∇F(x, y) −
1
2
∇∇∇Q(x −x
0
, y −y
0
)
¸
¸
¸
¸
2
≤ ε
_
(x −x
0
)
2
+ (y −y
0
)
2
.
Da questi fatti, per cominciare, si deduce che ∇∇∇F(x, y) ,= 0 in B

¸¦(x
0
, y
0
)¦:
infatti, se in un punto (x, y) ∈ B

, diverso da (x
0
, y
0
), si avesse ∇∇∇F(x, y) = 0,
dedurremmo
[∇∇∇Q(x −x
0
, y −y
0
)[
2
≤ 2ε
_
(x −x
0
)
2
+ (y −y
0
)
2
;
quindi
_
(x −x
0
)
2
+ (y −y
0
)
2
=
¸
¸
¸
¸
H(x
0
, y
0
)
−1
H(x
0
, y
0
)
_
x −x
0
y −y
0

¸
¸
¸
2

≤ |H(x
0
, y
0
)
−1
|
/
2
¸
¸
¸
¸
_
a b
b c
__
x −x
0
y −y
0

¸
¸
¸
2
=
= |H(x
0
, y
0
)
−1
|
/
2
¸
¸
¸
¸
1
2
∇∇∇Q(x −x
0
, y −y
0
)
¸
¸
¸
¸
2

≤ ε|H(x
0
, y
0
)
−1
|
/
2
_
(x −x
0
)
2
+ (y −y
0
)
2
,
e ci` o `e assurdo se si sceglie ε in modo che sia ε|H(x
0
, y
0
)
−1
|
/
2
< 1. Dunque,
il gradiente di F non si annulla in B

¸ ¦(x
0
, y
0
)¦.
Adesso osserviamo che, posto
Q(u, v) = Q
_
u

u
2
+ v
2
,
v

u
2
+ v
2
_
, (u, v) ∈ R
2
¸ ¦(0, 0)¦,
69
l’insieme
Z
t
= ¦(x, y) ∈ B

: Q(x −x
0
, y −y
0
) = 0¦,
coincide, per omogeneit` a, con l’insieme
¦(x
0
, y
0
)¦ ∪ ¦(x, y) ∈ B

¸ ¦(x
0
, y
0
)¦ : Q(x −x
0
, y −y
0
) = 0¦,
ed `e costituito dalle soluzioni (x, y) ∈ B

dell’equazione
a(x −x
0
)
2
+ 2b(x −x
0
)(y −y
0
) + c(y −y
0
))
2
= 0.
Dunque Z
t
`e formato dall’unione di quattro segmenti uscenti da (x
0
, y
0
), vale
a dire quelli appartenenti alle rette
x −x
0
= 0, y −y
0
= −
a
2b
(x −x
0
se c = 0,
y −y
0
= (tan ϑ
1
)(x −x
0
), y −y
0
= (tan ϑ
2
)(x −x
0
) se c ,= 0,
ove
tan ϑ
1
=
−b +

b
2
−ac
c
, tan ϑ
2
=
−b −

b
2
−ac
c
.
Per fissare le idee, nel se-
guito supporremo c ,= 0:
ci` o implica che le due rette
non sono verticali. Notiamo
che uno qualunque di questi
segmenti uscenti da (x
0
, y
0
),
nei quali Q(x−x
0
, y −y
0
) =
0, taglia un semidisco in due
parti, nelle quali i segni di
Q sono opposti: altrimenti,
uno di questi segmenti sa-
rebbe costituito da punti di
massimo locale o di minimo
locale per Q, contro il fat-
to che ∇∇∇Q si annulla solo in
(0, 0).
L’idea `e che intorno al punto (x
0
, y
0
) l’insieme Z degli zeri di F deve so-
migliare molto all’insieme Z
t
sopra descritto. Per verificarlo, notiamo che,
analogamente al caso di Z
t
, se ε `e piccolo l’insieme
Z
t
ε
= ¦(x
0
, y
0
)¦ ∪ ¦(x, y) ∈ B

¸ ¦(x
0
, y
0
)¦ : [Q(x −x
0
, y −y
0
)[ < 3ε¦
70
`e l’unione di due doppi settori circolari S
ε
, Σ
ε
che si toccano solo in (x
0
, y
0
)
(e non intersecano la retta x = x
0
salvo che in tale punto), della forma
S
ε
= ¦(x, y) ∈ B

: y −y
0
= (tan ϑ)(x −x
0
), ϑ ∈ [ϑ
1
−d
ε
, ϑ
1
+ d
t
ε
]¦ ,
Σ
ε
= ¦(x, y) ∈ B

: y −y
0
= (tan ϑ)(x −x
0
), ϑ ∈ [ϑ
2
−δ
ε
, ϑ
2
+ δ
t
ε
]¦ ,
ove le quantit` a positive d
ε
, d
t
ε
, δ
ε
, δ
t
ε
tendono a 0 per ε → 0. Utilizzando
la prima delle due stime fondamentali, si vede subito che i punti di Z ∩ B

giacciono nei due doppi settori circolari sopra descritti: infatti se (x, y) ∈ B

e F(x, y) = 0 si ha
[Q(x −x
0
, y −y
0
)[ ≤ 2ε[(x −x
0
)
2
+ (y −y
0
)
2
],
da cui [Q(x −x
0
, y −y
0
)[ ≤ 2ε < 3ε.
Affermiamo che dentro ciascuna delle
quattro parti di questi doppi settori, ad
esempio in
S
+
ε
= ¦(x, y) ∈ S
ε
: x > x
0
¦,
per ogni r ∈]0, r
ε
[ vi `e esattamente
un punto (x
r
, y
r
) che ha distanza r da
(x
0
, y
0
) e che sta in Z. Supponiamo, ad
esempio, che sulla frontiera di S
+
ε
risulti
Q(x, y) =
_
3ε sulla retta y −y
0
= [tan(ϑ
1
+ d
t
ε
](x −x
0
)
−3ε sulla retta y −y
0
= [tan(ϑ
1
−d
ε
](x −x
0
)
(il segno di Q potrebbe essere l’opposto, a seconda dei segni di a, b, c). Da
qui deduciamo che F(x, y) > 0 sulla prima retta e F(x, y) < 0 sulla seconda
retta: infatti, dalla prima stima fondamentale si ha, quando (x, y) appartiene
alla prima retta,
F(x, y) ≥
1
2
Q(x−x
0
, y−y
0
)−ε[(x−x
0
)
2
+(y−y
0
)
2
] =
ε
2
[(x−x
0
)
2
+(y−y
0
)
2
],
mentre quando (x, y) appartiene alla seconda retta si ha, analogamente,
F(x, y) ≤
1
2
Q(x−x
0
, y−y
0
)+ε[(x−x
0
)
2
+(y−y
0
)
2
] = −
ε
2
[(x−x
0
)
2
+(y−y
0
)
2
].
71
Proveremo adesso quanto affermato, ossia che per ogni r ∈]0, r
ε
[ esiste un
unico punto (x
r
, y
r
) ∈ S
+
ε
, a distanza r da (x
0
, y
0
), tale che F(x
r
, y
r
) = 0.
Consideriamo la restrizione di f all’arco di centro (x
0
, y
0
) e raggio r contenuto
in S
+
ε
:
g(ϑ) = F(x
0
+ r cos ϑ, y
0
+ r sin ϑ), ϑ ∈ [ϑ
1
−d
ε
, ϑ
1
+ d
t
ε
].
Essendo g(ϑ
1
− d
ε
) < −
ε
2
r
2
e g(ϑ
1
+
d
t
ε
) >
ε
2
r
2
, per il teorema degli zeri esi-
ste almeno un punto ϑ
r
∈]ϑ
1
−d
ε
, ϑ
1
+
d
t
ε
[ tale che g(ϑ
r
) = 0. Tale punto `e
unico: se infatti vi fosse un altro punto
ϑ
t
r
∈]ϑ
1
−d
ε
, ϑ
1
+d
t
ε
[ tale che g(ϑ
t
r
) = 0,
per il teorema di Rolle troveremmo un
terzo punto ϑ
0
∈]ϑ
1
−d
ε
, ϑ
1
+d
t
ε
[ in cui
g
t

0
) = 0, ossia
r
_
∇∇∇F(x
0
+ r cos ϑ, y
0
+ r sin ϑ),
_
−sin ϑ
0
cos ϑ
0
__
2
= 0.
Notiamo per`o che per definizione di ϑ
1
si ha
0 = Q(cos ϑ
1
, sin ϑ
1
) =
_
1
2
∇∇∇Q(cos ϑ
1
, sin ϑ
1
),
_
cos ϑ
1
sin ϑ
1
__
2
e dunque
1
2
∇∇∇Q(cos ϑ
1
, sin ϑ
1
) = ±
¸
¸
¸
¸
1
2
∇∇∇Q(cos ϑ
1
, sin ϑ
1
)
¸
¸
¸
¸
2
_
−sin ϑ
1
cos ϑ
1
_
.
Ne seguirebbe, utilizzando la seconda stima fondamentale,
2mr ≤ 2
_
(ar cos ϑ
1
+ br sin ϑ
1
)
2
+ (br cos ϑ
1
+ cr sin ϑ
1
)
2
=
= [∇∇∇Q(r cos ϑ
1
, r sin ϑ
1
)[
2
=
¸
¸
¸
¸
_
∇∇∇Q(r cos ϑ
1
, r sin ϑ
1
),
_
−sin ϑ
1
cos ϑ
1
__
2
¸
¸
¸
¸


¸
¸
¸
¸
_
∇∇∇Q(r cos ϑ
1
, r sin ϑ
1
),
_
−sin ϑ
1
cos ϑ
1
__
2


_
∇∇∇Q(r cos ϑ
0
, r sin ϑ
0
),
_
−sin ϑ
0
cos ϑ
0
__
2
¸
¸
¸
¸
+
+
¸
¸
¸
¸
_
∇∇∇Q(r cos ϑ
0
, r sin ϑ
0
),
_
−sin ϑ
0
cos ϑ
0
__
2
¸
¸
¸
¸

72
≤ Kr[ϑ
1
−ϑ
0
[ +
¸
¸
¸
¸
_
∇∇∇Q(r cos ϑ
0
, r sin ϑ
0
),
_
−sin ϑ
0
cos ϑ
0
__
2

1
r
g
t

0
)
¸
¸
¸
¸

≤ Kr(d
ε
∨ d
t
ε
) +
+[∇∇∇Q(r cos ϑ
0
, r sin ϑ
0
) −∇∇∇F(x
0
+ r cos ϑ
0
, y
0
+ r sin ϑ
0
)[
2

≤ Kr(d
ε
∨ d
t
ε
) + εr,
con K costante opportuna, e dopo aver semplificato r, per ε sufficientemente
piccolo si avrebbe l’assurdo.
Abbiamo cos`ı mostrato che per ogni r ∈]0, r
ε
[ l’insieme Z ∩ S
+
ε
contiene
esattamente un punto (x
r
, y
r
) a distanza r da (x
0
, y
0
). Proviamo che l’insieme
di questi punti (x
r
, y
r
) `e il grafico della funzione che stiamo cercando. In
ciascun punto (x
r
0
, y
r
0
) il teorema 1.9.2 `e applicabile, essendo F(x
r
0
, y
r
0
) = 0
e ∇∇∇F(x
r
0
, y
r
0
) ,= 0: quindi, ciascuno di tali punti `e il centro di un intorno U
r
0
tale che Z∩U
r
0
`e il grafico di una funzione implicita f
r
0
, di classe C
2
(essendo
F di classe C
2
), della variabile x (dato che abbiamo supposto c ,= 0). I punti
(x
r
, y
r
) che sono dentro U
r
0
sono dunque punti della forma (x, f
r
0
(x)).
`
E anche chiaro, a questo punto, che se U
r
0
∩U
r
1
,= ∅ le funzioni implicite f
r
0
e f
r
1
coincidono su U
r
0
∩ U
r
1
. Si ha dunque un’unica funzione f(x), definita
in ]x
0
, x
0
+r
ε
[, di classe C
2
, tale che F(x, f(x)) = 0. Notiamo che f(x) →y
0
per x →x
+
0
, dato che il grafico di f `e contenuto in S
+
ε
.
Adesso, per concludere, vogliamo provare che f
t
(x
0
) esiste ed `e uguale a
tan ϑ
1
=
−b+

b
2
−ac
c
. A questo scopo osserviamo che
tan(ϑ
1
−dε) ≤
f(x) −y
0
x −x
0
≤ tan(ϑ
1
+ d
t
ε
) ∀x ∈]x
0
, x
0
+ r
ε
[.
Sia allora ¦x
n
¦ ⊂]x
0
, x
0
+ r
ε
[ una successione convergente a x
0
per n → ∞.
Per compattezza, esiste una sottosuccessione ¦x
n
k
¦ ⊆ ¦x
n
¦ tale che
lim
k→∞
f(x
n
k
) −y
0
x
n
k
−x
0
= λ ∈ R.
Mostriamo che λ = tan ϑ
1
. Essendo F(x, f(x)) = 0, la prima stima fonda-
mentale ci dice che
[Q(x −x
0
, y −y
0
)[ ≤ 2ε[(x −x
0
)
2
+ (f(x) −y
0
)
2
],
cio`e, raccogliendo (x −x
0
)
2
,
¸
¸
¸
¸
¸
a + 2b
f(x) −y
0
x −x
0
+ c
_
f(x) −y
0
x −x
0
_
2
¸
¸
¸
¸
¸
≤ 2ε
_
1 +
_
f(x) −y
0
x −x
0
_
2
_
.
73
Ne segue, mettendo x
n
k
al posto di x e passando al limite,
[a + 2b + cλ
2
[ ≤ 2ε(1 + λ
2
),
ove a secondo membro compare una quantit`a arbitrariamente piccola. Si
deduce quindi che a + 2b + cλ
2
= 0, ossia λ =
−b±

b
2
−ac
c
; ma dal momento
che tan(ϑ
1
− dε) ≤ λ ≤ tan(ϑ
1
+ d
t
ε
), si conclude che λ = tan ϑ
1
. Pertanto,
ogni successione ¦x
n
¦ convergente a x
0
ha una sottosuccessione ¦x
n
k
¦ tale
che
f(xn
k
)−y
0
xn
k
−x
0
→tan ϑ
1
: `e facile allora dedurre che
lim
k→∞
f(x) −y
0
x −x
0
= tan ϑ
1
.
Dunque f
t
(x
0
) `e proprio il coefficiente angolare del segmento Z ∩ S
+
ε
.
Nel caso in cui c = 0, la funzione implicita `e necessariamente della forma
x = g(y) e si trova in questo caso
g
t
(y
0
) =
−b −

b
2
−ac
a
=
1
−b+

b
2
−ac
c
,
risultato che coincide col precedente.
I discorsi sono del tutto analoghi per l’altro pezzo S

ε
di S
ε
e per l’altro
settore Σ
ε
. Ci`o conclude finalmente la dimostrazione del teorema 1.9.5.
Il teorema del Dini nel caso generale
Ed eccoci all’enunciato del teorema delle funzioni implicite nel caso generale.
Scriveremo N = r+k, R
N
= R
r
R
k
, e di conseguenza denoteremo i punti di
R
N
come (x, y), con x ∈ R
r
e y ∈ R
k
. Se F ∈ C
1
(R
r
R
k
, R
k
), denoteremo
rispettivamente con D
x
F(x, y) e con D
y
F(x, y) le matrici (rispettivamente
k r e k k)
_
∂F
i
∂x
h
(x, y)
_
i=1,...,k; h=1,...,r
,
_
∂F
i
∂y
j
(x, y)
_
i,j=1,...,k
.
Teorema 1.9.6 (del Dini, caso generale) Sia A un aperto di R
r
R
k
e
sia F ∈ C
1
(A, R
k
). Sia (x
0
, y
0
) ∈ A tale che
F(x
0
, y
0
) = 0, det D
y
F(x
0
, y
0
) ,= 0.
74
Allora esistono un intorno V di x
0
in R
r
, un intorno W di y
0
in R
k
ed una
funzione f : V →W tali che
(x, y) ∈ V W, F(x, y) = 0 ⇐⇒ y = f (x);
la funzione implicita f `e di classe C
1
e la sua matrice Jacobiana (k r) `e
Df (x) = −[D
y
F(x, f (x))]
−1
[D
x
F(x, f (x))] ∀x ∈ V.
Dimostrazione Per ipotesi F `e differenziabile nel punto (x
0
, y
0
); essendo
F(x
0
, y
0
) = 0, possiamo scrivere
F(x, y) = D
x
F(x
0
, y
0
)(x −x
0
) +D
y
F(x
0
, y
0
)(y −y
0
) +v(x, y),
ove v `e una funzione di C
1
(A, R
k
) tale che
v(x, y)
_
[x −x
0
[
2
m
+[y −y
0
[
2
k
→0 per
_
[x −x
0
[
2
m
+[y −y
0
[
2
k
→0.
Dato che, per ipotesi, la matrice D
y
F(x
0
, y
0
) `e invertibile, dalla relazione
precedente deduciamo
y = y
0
+BF(x, y) −Q(x −x
0
) −Bv(x, y) ∀(x, y) ∈ A,
ove si `e posto per comodit`a di scrittura
B = [D
y
F(x
0
, y
0
)]
−1
, Q = [D
y
F(x
0
, y
0
)]
−1
D
x
F(x
0
, y
0
).
Vogliamo applicare a questa relazione il teorema delle contrazioni. A questo
scopo poniamo
g(x) = y
0
−Q(x −x
0
), x ∈ R
m
,
G(x, y) = Bv(x, y), (x, y) ∈ A;
la g `e una applicazione affine di R
r
in R
k
, mentre la G `e una funzione di
classe C
1
(A, R
k
) con
[G(x, y)[
k
≤ |B|
/
k
[v(x, y)[
k
,
ed in particolare G `e nulla in (x
0
, y
0
), con differenziale nullo in tale punto.
Adesso osserviamo che per (x, y) ∈ A si ha
F(x, y) = 0 ⇐⇒ y = g(x) −G(x, y),
75
quindi il nostro obiettivo `e quello di trovare un intorno U di x
0
in R
m
ed un
intorno compatto V di y
0
in R
k
tali che, per ogni fissato x ∈ U, l’applicazione
T
x
(y) = g(x) −G(x, y)
trasformi V in V e sia una contrazione. Dal teorema 1.8.2 seguir`a allora che
per ogni x ∈ U esister` a un unico y ∈ V , che battezzeremo f (x), tale che
T
x
(y) = y, ossia F(x, y) = 0. Per ρ > 0 denotiamo con V
ρ
la palla di centro
x
0
in R
r
e con W
ρ
la palla di centro y
0
in R
k
, ed osserviamo che, essendo
∇∇∇G(x
0
, y
0
) = 0, si ha, posto (ξξξ
t
, ηηη
t
) = ((1 −t)x + tx
t
, (1 −t)y + ty
t
),
[G(x, y) −G(x
t
, y
t
)[
k
=
¸
¸
¸
¸
_
1
0
d
dt
G(ξξξ
t
, ηηη
t
) dt
¸
¸
¸
¸
k

=
¸
¸
¸
¸
_
1
0
[G
x
(ξξξ
t
, ηηη
t
) −G
x
(x
0
, y
0
)](x −x
t
) +
+[G
y
(ξξξ
t
, ηηη
t
) −G
y
(x
0
, y
0
)](y −y
t
)]dt
¸
¸
¸
¸
k
;
dunque esiste ρ
0
> 0 tale che [G(x, y) −G(x
t
, y
t
)[
k

1
2
[[x −x
t
[
r
+[y −y
t
[
k
]
per ogni x ∈ V
ρ
0
e y ∈ W
ρ
0
, ed in particolare
[G(x, y)[
k

1
2
[[x −x
0
[
r
+[y −y
0
[
k
] ∀x ∈ V
ρ
0
, ∀y ∈ W
ρ
0
.
Fissiamo ora ρ
1
∈]0, ρ
0
] e notiamo che per x ∈ V
ρ
1
l’applicazione T
x
manda
W
ρ
0
in s´e, a patto che ρ
1
sia sufficientemente piccolo: infatti
[T
x
(y) −y
0
[
k
= [g(x) −G(x, y) −y
0
[
k

≤ |Q|
/
k,r
[x −x
0
[
r
+
1
2
([x −x
0
[
r
+[y −y
0
[
k
) ≤

_
|Q|
/
k,r
+
1
2
_
ρ
1
+
ρ
0
2
≤ ρ
0
pur di scegliere ρ
1

ρ
0
2|Q|
M
k,r
+1
. Inoltre, per x ∈ V
ρ
1
la T
x
`e una contrazione
in W
ρ
0
, poich´e
[T
x
(y) −T
x
(y
t
)[
k
= [G(x, y) −G(x, y
t
)[
k

1
2
[y −y
t
[
k
∀y, y
t
∈ W
ρ
0
.
Essendo W
ρ
0
uno spazio metrico completo con la distanza indotta dalla nor-
ma euclidea di R
k
, si conclude che per ogni x ∈ V
ρ
1
esiste un unico punto
76
f (x) ∈ W
ρ
0
tale che T
x
(f (x)) = f (x), il che significa, per quanto detto in
precedenza, F(x, f (x)) = 0. Naturalmente si ha, in particolare, f (x
0
) = y
0
.
Abbiamo cos`ı costruito la nostra funzione implicita f : V
ρ
1
→ W
ρ
0
; ne ana-
lizzeremo adesso le propriet` a di regolarit` a. Sappiamo dal teorema 1.8.3 che
f `e continua. Quindi, anche x → det D
y
F(x, f (x)) `e continua in V
ρ
1
; allora,
essendo det D
y
F(x
0
, y
0
) ,= 0, rimpicciolendo eventualmente ρ
1
avremo
det D
y
F(x, f (x)) ,= 0 ∀x ∈ V
ρ
1
.
Proviamo che f `e differenziabile in V
ρ
1
. Sia x
t
∈ V
ρ
1
: poich´e F`e differenziabile
nel punto (x
t
, f (x
t
)) ∈ V
ρ
1
W
ρ
0
, si ha
0 = F(x, f (x)) −F(x
t
, f (x
t
)) =
= D
x
F(x
t
, f (x
t
))(x −x
t
) +D
y
F(x
t
, f (x
t
))(f (x) −f (x
t
)) +w(x, f (x)),
con
w(x, y)
_
[x −x
t
[
2
r
+[y −f (x
t
)[
2
k
→0 per
_
[x −x
t
[
2
r
+[y −f (x
t
)[
2
k
→0.
Dunque
f (x) −f (x
t
) = −D
y
F(x
t
, f (x
t
))
−1
D
x
F(x
t
, f (x
t
))(x −x
t
) −
−D
y
F(x
t
, f (x
t
))
−1
w(x, f (x)),
ed a secondo membro il primo addendo `e una funzione lineare di x − x
t
,
mentre il secondo `e infinitesimo di ordine superiore rispetto a [x − x
t
[
r
, in
virt` u delle propriet` a di w e di f . Si ha dunque
Df (x
t
) = −D
y
F(x
t
, f (x
t
))
−1
D
x
F(x
t
, f (x
t
)) ∀x
t
∈ V
ρ
1
,
e ci`o conclude la dimostrazione.
Osservazioni 1.9.7 (1) A complemento di quanto mostrato nel teorema
1.9.5, osserviamo che il teorema del Dini esprime una condizione sufficiente
per l’esistenza della funzione implicita, ma niente affatto necessaria. Basta
pensare che, nel caso k = 1, se F verifica le ipotesi del teorema del Dini,
l’insieme Z = ¦(x, y) ∈ A : F(x, y) = 0¦ `e anche l’insieme dove si annulla F
2
:
Z `e dunque grafico di una funzione implicita nonostante che D(F
2
)(x, y) = 0
per ogni (x, y) ∈ Z. Addirittura Z potrebbe essere globalmente, e non solo
77
localmente, grafico di una funzione, senza tuttavia soddisfare le ipotesi del
teorema del Dini: basta fissare g : R
r
→R di classe C
1
e porre Z = ¦(x, y) ∈
R
r+1
: (y −g(x))
2
= 0¦.
(2) Il luogo Z = ¦(x, y) ∈ R
r+k
: F(x, y) = 0¦, nelle ipotesi del teorema
1.9.6, in un intorno di (x
0
, y
0
) `e una variet`a regolare r-dimensionale di classe
C
1
, ossia l’immagine di un aperto di R
r
mediante un’applicazione di classe C
1
a valori in R
r+k
con matrice Jacobiana di rango massimo r (nel paragrafo 4.10
daremo una definizione precisa di variet` a). L’insieme Z ha nel punto (x
0
, y
0
)
un iperpiano tangente r-dimensionale, descritto dal sistema di k equazioni
D
x
F(x
0
, y
0
) (x −x
0
) +D
y
F(x
0
, y
0
) (y −y
0
) = 0.
(3) Nel caso tridimensionale, N = 3, si hanno due sole possibilit` a: r = 1 e
k = 2, ossia una sola equazione con tre incognite, oppure r = 2 e k = 1, cio`e
due equazioni con tre incognite. In entrambi questi casi il teorema del Dini
pu` o essere provato senza l’uso delle contrazioni, ma semplicemente adattando
la dimostrazione del caso bidimensionale (teorema1.9.2): si vedano gli esercizi
1.9.3 e 1.9.4.
Applicazioni localmente invertibili
Dato un sistema di k equazioni in N = r + k incognite, il teorema delle
funzioni implicite permette, come si `e visto, di ricavare k incognite in funzione
delle altre r. Cosa succede quando abbiamo N equazioni in N incognite?
In questo caso, essendo r = 0, dovrebbe essere possibile ricavare tutte le
N incognite, ossia risolvere completamente il sistema. Pi` u generalmente,
consideriamo il problema di “invertire” un sistema della forma
_
¸
¸
_
¸
¸
_
y
1
= F
1
(x
1
, . . . , x
N
)
y
2
= F
2
(x
1
, . . . , x
N
)
............................
y
N
= F
N
(x
1
, . . . , x
N
),
(in forma vettoriale, y = F(x)): vogliamo allora ricavare le N variabili x
i
in
funzione delle N variabili y
j
. Si tratta dunque di vedere se l’applicazione
x = (x
1
, . . . x
N
) →F(x) = (F
1
(x
1
, . . . x
N
), . . . , F
N
(x
1
, . . . x
N
))
`e invertibile.
In certi casi, sotto adeguate ipotesi, questo problema lo sappiamo risolvere:
78
ad esempio, quando N = 1 e F `e una funzione di classe C
1
, definita su un
intervallo I ⊆ R a valori in un altro intervallo J ⊆ R, `e noto che se F
t
,= 0
in I allora F `e strettamente monotona e dunque ha l’inversa F
−1
, la quale `e
a sua volta di classe C
1
con
(F
−1
)
t
(y) =
1
F
t
(F
−1
(y))
.
Inoltre, se N ≥ 1, se B ∈ /
N
e se F `e l’applicazione lineare
F(x) = Bx ∀x ∈ R
N
,
allora si sa che F `e invertibile se e solo se B `e non singolare, vale a dire
det B ,= 0, ed in tal caso, naturalmente, si ha F
−1
(y) = B
−1
y per ogni
y ∈ R
N
.
Nel caso generale, con N ≥ 1 e F funzione generica di classe C
1
, le cose sono
pi` u complicate e non sempre si ha l’invertibilit` a.
Esempi 1.9.8 (1) Consideriamo in R
2
la trasformazione per raggi vettori
reciproci
ξ =
x
x
2
+ y
2
, η =
y
x
2
+ y
2
,
definita per (x, y) ∈ R
2
¸ ¦(0, 0)¦. Al
vettore P = (x, y) viene associato il
vettore ad esso concorde Q = (ξ, η) ta-
le che [P[
2
[Q[
2
= 1: infatti ξ
2
+ η
2
=
1
x
2
+y
2
. In particolare, i punti interni
alla circonferenza x
2
+ y
2
= 1 vengo-
no trasformati in punti esterni, e vice-
versa. Questa applicazione `e di classe
C

, `e invertibile su tutto R
2
¸ ¦(0, 0)¦,
e l’inversa `e
x =
ξ
ξ
2
+ η
2
, y =
η
ξ
2
+ η
2
;
dunque essa stessa `e una trasformazione per raggi vettori reciproci: anzi, la
trasformazione `e l’inversa di se stessa. Si osservi che le rette x = c e y = d
sono trasformate rispettivamente nelle circonferenze
_
ξ −
1
2c
_
2
+ η
2
=
1
4c
2
, ξ
2
+
_
η −
1
2d
_
2
=
1
4d
2
,
79
e reciprocamente.
(2) La corrispondenza
x = ρ cos ϑ, y = ρ sin ϑ,
ove ρ ≥ 0 e ϑ ∈ R, fornisce la rappre-
sentazione dei punti del piano in coor-
dinate polari: come si sa, ρ =
_
x
2
+ y
2
misura la distanza del punto P = (x, y)
dall’origine O = (0, 0), mentre ϑ `e l’an-
golo che il segmento OP forma con il
semiasse delle x positive. Se ρ ≥ 0 e
ϑ ∈ R, l’applicazione
F(ρ, ϑ) = (ρ cos ϑ, ρ sin ϑ) = (x, y)
`e di classe C

ed `e surgettiva ma non iniettiva, poich´e (0, 0) = F(0, ϑ) con ϑ
arbitrario, mentre per i punti (ρ, ϑ) con ρ > 0 si ha F(ρ, ϑ) = F(ρ, ϑ + 2π).
Per` o, fissato un punto (ρ
0
, ϑ
0
) ∈]0, ∞[R, la restrizione di F ad un opportuno
intorno U di (ρ
0
, ϑ
0
) `e iniettiva; in particolare, la restrizione di F alla striscia
]0, ∞[] −π, π] ha per immagine R
2
¸ ¦(0, 0)¦, e l’inversa `e
ρ =
_
x
2
+ y
2
,
_
_
_
cos ϑ =
x

x
2
+y
2
sin ϑ =
y

x
2
+y
2
,
ossia, pi` u precisamente,
ρ =
_
x
2
+ y
2
, ϑ =
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
arctan
y
x
se x > 0
π
2
se x = 0 e y > 0

π
2
se x = 0 e y < 0
π + arctan
y
x
se x < 0 e y > 0
π se x < 0 e y = 0
−π + arctan
y
x
se x < 0 e y < 0.
(3) Questo esempio `e simile al precedente. Per (x, y) ∈ R
2
poniamo
F(x, y) = (ξ, η), ove
_
ξ = e
x
cos y
η = e
x
sin y.
80
Questa trasformazione `e di classe C

, con immagine R
2
¸¦(0, 0)¦; se proviamo
ad invertirla, troviamo
x = ln
_
ξ
2
+ η
2
,
_
_
_
cos y =
ξ

ξ
2

2
sin y =
η

ξ
2

2
,
ma `e chiaro che la y `e determinata soltanto a meno di multipli di 2π. Come
nell’esempio precedente, l’immagine della restrizione di F alla striscia R
] −π, π[ `e l’insieme R
2
¸ ¦(ξ, η) : ξ ≤ 0, η = 0¦, e l’inversa `e determinata
dalle formule sopra scritte.
Si noti che, identificando R
2
con C, la funzione F `e in effetti l’esponenziale
complessa: se (x, y) = x + iy = z si ha
F(z) = F(x + iy) = e
x
(cos y + i sin y) = e
x+iy
= e
z
.
Come si sa, la funzione e
z
`e periodica di periodo 2πi e dunque non `e iniettiva,
ma lo diventa, appunto, su una qualunque striscia del tipo R]y
0
−π, y
0
+π[.
Nel caso y
0
= 0, si ha F
−1
(e
z
) = F
−1
(ξ, η) = (x, y) con x = ln [e
z
[ e y =
arg(e
z
). Questa `e la via che permette di definire il logaritmo complesso: se
w ∈ C ¸ ¦0¦, si pone
log w = ln [w[ + i arg w;
si tratta di una funzione multivoca, ossia a pi` u valori, che diventa univo-
ca allorch´e si sceglie una determinazione dell’argomento di w. Con questa
definizione del logaritmo si ha
e
log w
= w ∀w ∈ C ¸ ¦0¦, log e
z
= z + 2kπi ∀k ∈ Z, ∀z ∈ C.
Gli esempi precedenti mostrano che in genere ci dobbiamo aspettare l’inver-
tibilit` a di opportune restrizioni di una data funzione, ossia un’invertibilit` a di
carattere locale.
Definizione 1.9.9 Siano A, B aperti di R
N
e sia F : A →B una funzione.
Fissato x
0
∈ A, diciamo che F `e localmente invertibile nel punto x
0
se
esistono un intorno U ⊆ A di x
0
ed un intorno V ⊆ B di F(x
0
) tali che F[
U
sia un’applicazione bigettiva fra U e V .
`
E evidente che tutte le funzioni invertibili sono anche localmente invertibili
in ogni punto del loro insieme di definizione. Il viceversa non vale, come
mostrano gli esempi 1.9.8 (2)-(3).
81
Teorema 1.9.10 (di invertibilit`a locale) Sia A un aperto di R
N
e sia F :
A →R
N
un’applicazione di classe C
1
. Indichiamo con J
F
(x) il determinante
della matrice Jacobiana di F(x). Se in un punto x
0
∈ A risulta J
F
(x
0
) ,= 0,
allora F `e localmente invertibile nel punto x
0
, con inversa di classe C
1
in
un opportuno intorno V di F(x
0
); inoltre risulta
DF
−1
(y) = [DF(F[
U
−1
(y))]
−1
∀y ∈ V.
Infine, se F `e di classe C
m
, allora anche F
−1
`e di classe C
m
.
Dimostrazione Poniamo y
0
= F(x
0
) e consideriamo la funzione G : A
R
N
→R
N
, definita da
G(x, y) = y −F(x).
Chiaramente G `e di classe C
1
, e
G(x
0
, y
0
) = 0, det D
x
G(x
0
, y
0
) = (−1)
N
J
F
(x
0
) ,= 0.
Quindi, per il teorema delle funzioni implicite, esistono un intorno U di x
0
,
un intorno V di y
0
ed una funzione g : V → U di classe C
1
, tali che per
(x, y) ∈ U V risulta
y −F(x) = G(x, y) = 0 ⇐⇒ x = g(y).
In altre parole, per (x, y) ∈ U V si ha y = F(x) se e solo se x = g(y), e
dunque g `e l’inversa di F[
U
. Ci`o prova che F `e localmente invertibile in x
0
.
Inoltre il teorema del Dini ci assicura che g `e di classe C
1
con
Dg(y) = −[D
x
G(g(y), y)]
−1
[D
y
G(g(y), y)] =
= −[−DF(g(y))]
−1
I
N
= [DF(F[
−1
U
(y))]
−1
∀y ∈ V.
Anche l’ultima affermazione dell’enunciato segue dal teorema del Dini: se
F ∈ C
m
, anche G ∈ C
m
e quindi la funzione implicita g, ossia F[
−1
U
, `e di
classe C
m
.
Osservazione 1.9.11 Il teorema di invertibilit` a locale non vale se si suppo-
ne che F : A → R
N
sia soltanto differenziabile. Ad esempio, per N = 1 la
funzione
82
F(x) =
_
_
_
x
2
+ x
2
sin
1
x
se x ,= 0
0 se x = 0
`e derivabile (ossia differenziabile) in ogni
punto di R, con derivata data da
F
t
(x) =
_
¸
¸
_
¸
¸
_
1
2
+ 2x sin
1
x
−cos
1
x
se x ,= 0
1
2
se x = 0,
dunque F
t
`e discontinua in 0. In tale punto si ha F
t
(0) =
1
2
,= 0, e tuttavia F
non `e localmente invertibile in 0, dato che non `e monotona in alcun intervallo
di centro 0.
Il teorema del rango
Ci rimane da considerare il caso di una funzione F : A →R
N
, di classe C
1
, ove
A `e un aperto di R
r
con r = N −k < N. In questo caso, naturalmente, non
possiamo aspettarci che F sia surgettiva: quello che vogliamo fare `e analizzare
la struttura dell’insieme F(A) ⊂ R
N
, ossia dell’immagine di F. Supporremo,
in analogia con i teoremi 1.9.6 e 1.9.10, che la matrice Jacobiana di F abbia
rango massimo r. Il “teorema del rango”, che andiamo ad enunciare, ci dice
che F(A) `e un insieme localmente isomorfo a R
r
, dotato in particolare in ogni
punto di iperpiano r-dimensionale tangente.
Teorema 1.9.12 (del rango) Sia F : A → R
N
una funzione di classe C
1
,
definita su un aperto A ⊆ R
r
ove r = N − k < N. Supponiamo che in un
punto x
0
∈ A la matrice Jacobiana DF(x
0
) abbia rango massimo r, e che in
particolare risulti
det
_
∂F
i
∂x
j
(x
0
)
_
i,j=1,...,r
,= 0.
Allora esiste un intorno U di x
0
tale che F(U) `e il grafico di una funzione
h delle r variabili x
1
, . . . , x
r
, a valori in R
k
, di classe C
1
; inoltre l’iperpiano
r-dimensionale tangente a questo grafico `e il piano per F(x
0
) generato dai
83
vettori
∂F
∂x
i
(x
0
), i = 1, . . . , r. Infine, se F ∈ C
m
, allora anche h `e di classe
C
m
.
Dimostrazione Per maggior chiarezza, scriviamo i punti di R
N
come (y, z),
ove y ∈ R
r
e z ∈ R
k
. Analogamente, scriviamo F = (f , g), ove f =
(F
1
, . . . , F
r
) e g = (F
r+1
, . . . , F
N
). I punti di F(A) sono della forma
_
y
j
= f
j
(x
1
, . . . , x
r
), j = 1, . . . , r
z
i
= g
i
(x
1
, . . . , x
r
), i = r + 1, . . . , N,
(x
1
, . . . , x
r
) ∈ A.
Nelle prime r di queste relazioni possiamo ricavare le x
i
in funzione delle y
j
:
infatti f `e una funzione localmente invertibile da un opportuno intorno U
di x
0
ad un opportuno intorno V di f (x
0
), in virt` u dell’ipotesi fatta sulla
matrice Jacobiana di F e del teorema 1.9.10. Pertanto, l’insieme F(U) pu` o
essere descritto come segue:
F(U) = ¦(y, z) ∈ F(A) : y ∈ V, z = g(f
−1
(y))¦.
Dunque F(U) `e il grafico della funzione h = g◦f
−1
, la quale `e chiaramente di
classe C
1
. Inoltre il piano r-dimensionale tangente al grafico di h nel punto
(y
0
, z
0
) = F(x
0
) `e dato dall’equazione vettoriale
z = z
0
+Dh(y
0
) (y −y
0
), y ∈ R
r
,
ovvero
_
y −y
0
z −z
0
_
=
_
I
r
D[g ◦ f
−1
](y
0
))
_
(y −y
0
) =
=
_
Df (x
0
)
Dg(x
0
)
_
[Df (x
0
)]
−1
(y −y
0
), y ∈ R
r
;
equivalentemente possiamo scrivere, scrivendo i punti di R
N
come (y, z) = u
e ponendo t = [Df (x
0
)]
−1
(y −y
0
),
u = u
0
+DF(x
0
)t, t ∈ R
r
.
Ci` o mostra che il piano tangente `e generato dagli r vettori colonna della
matrice DF(x
0
).
Infine, se supponiamo F ∈ C
m
, il teorema 1.9.10 ci dice che f
−1
∈ C
m
e
quindi anche h = g ◦ f
−1
`e di classe C
m
.
84
Osservazione 1.9.13 Il senso del teorema del rango `e il seguente: se F :
A ⊆ R
r
→ R
r+k
`e di classe C
1
con matrice Jacobiana di rango massimo r,
allora F(A) `e localmente una “copia deformata” di una palla aperta di R
r
.
In altre parole, per ogni punto x ∈ A vi `e un intorno U di x in R
r
tale che in
F(U) `e definita un’applicazione k, a valori in un aperto di R
r
, la quale `e un
omeomorfismo, vale a dire `e bigettiva e continua; in pi` u l’inversa `e di classe
C
1
. Infatti, essendo F(U) grafico di un’applicazione h, l’omeomorfismo `e
definito da k(y, h(y)) = y, cio`e dalla proiezione dei punti del grafico di h sul
piano r-dimensionale delle variabili y, e l’inversa `e l’applicazione k
−1
(y) =
(y, h(y)). L’insieme F(A) `e una variet`a r-dimensionale regolare.
Esempi 1.9.14 (1) Sia r = 1 e prendiamo A =]a, b[. Per un’applicazione F :
]a, b[→R
N
avere matrice Jacobiana di rango massimo in ogni punto significa
dire semplicemente che F
t
(t) ,= 0 per ogni t ∈]a, b[. L’applicazione F `e detta
allora curva regolare; la retta tangente in ogni punto F(t
0
) si scrive, in forma
parametrica,
x = F(t
0
) + s F
t
(t
0
), s ∈ R.
(2) Se r = 2 ed A`e un aperto connesso di R
2
, un’applicazione F ∈ C
1
(A, R
N
)
con matrice Jacobiana di rango 2 in ogni punto si chiama superficie regola-
re. Il piano tangente alla superficie in un suo punto F(s
0
, t
0
) ha equazioni
parametriche
x = F(s
0
, t
0
) + σ
∂F
∂s
(s
0
, t
0
) + τ
∂F
∂t
(s
0
, t
0
), σ, τ ∈ R.
Avr` a particolare interesse per noi lo studio del caso N = 2, r = 1, relativo alle
curve piane, e dei casi N = 3, r = 1, 2, relativi a curve e superfici immerse
in R
3
; studieremo tutto ci` o nel capitolo 4.
Come abbiamo visto, le superfici di livello relative a funzioni da R
r+k
a R
k
e
le immagini di aperti di R
r
mediante applicazioni da R
r
a R
r+k
sono esprimi-
bili localmente, sempre che le funzioni abbiano matrice Jacobiana di rango
85
massimo, come grafici di opportune funzioni di r variabili; in particolare ta-
li sottoinsiemi di R
r+k
hanno piano tangente r-dimensionale e, per questa
ragione, come si vedr` a meglio nel paragrafo 4.10, si denominano variet`a re-
golari r-dimensionali di classe C
1
(o di classe C
m
, se le funzioni coinvolte
sono di classe C
m
). Una stessa variet` a, localmente o (talvolta) globalmente,
pu` o essere vista indifferentemente in uno dei tre modi descritti. Ad esempio,
la circonferenza C in R
2
, di raggio r, centrata in (a, b) pu` o essere vista come
luogo di zeri
C = ¦(x, y) ∈ R
2
: (x −a)
2
+ (y −b)
2
−r
2
= 0¦,
come grafico
C = ¦(x, y) ∈ R
2
: y = b ±
_
r
2
−(x −a)
2
¦ ∪
∪ ¦(x, y) ∈ R
2
: x = a ±
_
r
2
−(y −b)
2
¦
o come immagine di una applicazione, ossia, come si dice, in forma parame-
trica:
C = g([0, 2π]), g(t) = (a + r cos t, b + r sin t).
Notiamo infine che la nozione di variet`a che si utilizza in geometria `e molto
pi` u generale ed anche pi` u complicata della nostra, ma andrebbe ben oltre i
nostri scopi.
Esercizi 1.9
1. Sia Z = ¦(x, y) ∈ A : F(x, y) = 0¦, ove A = ¦(x, y) ∈ R
2
: y + x > 0¦
e F(x, y) = y
3
+ ln(x + y) −xy. Si verifichi che (1, 0) ∈ Z e che in un
intorno di tale punto Z `e grafico di una funzione g(y) di classe C

; si
determini poi il polinomio di Taylor di g di centro 0 e grado 2.
2. Sia Z = ¦(x, y) ∈ R
2
: F(x, y) = 1¦, ove F(x, y) = x
3
+ y
3
− x
2
y. Si
provi che Z ha tre punti di ascissa 1, e che in un intorno di ciascuno di
essi Z `e grafico di una funzione f(x) di classe C

; si scriva il polinomio
di Taylor di queste funzioni di centro 1 e grado 2.
3. Si provi che se A `e un aperto di R
3
e F : A → R `e una funzione di
classe C
1
tale che in un punto (x
0
, y
0
, z
0
) ∈ A risulti F(x
0
, y
0
, z
0
) = 0 e
F
z
(x
0
, y
0
, z
0
) ,= 0, allora esistono un intorno U V W di (x
0
, y
0
, z
0
),
86
contenuto in A, ed una funzio-
ne f : U V → W di clas-
se C
1
, tali che per (x, y, z) in
U V W si ha F(x, y, z) = 0
se e solo se z = f(x, y). Si pro-
vi inoltre che per ogni (x, y) ∈
U V valgono le relazioni
f
x
(x, y) = −
F
x
(x, y, f(x, y))
F
z
(x, y, f(x, y))
,
f
y
(x, y) = −
F
y
(x, y, f(x, y))
F
z
(x, y, f(x, y))
.
4. Si provi che se A `e un aperto di R
3
e F, G : A → R sono funzioni di
classe C
1
tali che in un punto (x
0
, y
0
, z
0
) ∈ A risulti
_
F(x
0
, y
0
, z
0
) = 0
G(x
0
, y
0
, z
0
) = 0,
det
_
F
x
(x
0
, y
0
, z
0
) F
y
(x
0
, y
0
, z
0
)
G
x
(x
0
, y
0
, z
0
) G
y
(x
0
, y
0
, z
0
)
_
,= 0,
allora esistono un intorno U V W ⊆ A
di (x
0
, y
0
, z
0
) e due funzioni g : W → U,
h : W →V di classe C
1
, tali che per (x, y, z)
in UV W si ha F(x, y, z) = G(x, y, z) = 0
se e solo se x = g(z) e y = h(z). Si provi
inoltre che per ogni z ∈ W vale la relazione
_
g
t
(z)
h
t
(z)
_
= −
_
F
x
F
y
G
x
G
y
_
−1
_
F
z
G
z
_
,
ove tutte le funzioni a secondo membro sono calcolate in (g(z), h(z), z).
[Traccia: uno almeno fra i numeri F
x
(x
0
, y
0
, z
0
) e F
y
(x
0
, y
0
, z
0
), ad
esempio il primo, `e diverso da 0. Utilizzando l’esercizio preceden-
te, si provi che in un intorno U V W ⊆ A di (x
0
, y
0
, z
0
) si ha
F(x, y, z) = G(x, y, z) = 0 se e solo se x = k(y, z) e G(k(y, z), y, z) = 0,
87
con k funzione di classe C
1
tale che, in V W,
k
y
(y, z) = −
F
y
(k(y, z), y, z)
F
x
(k(y, z), y, z)
, k
z
(y, z) = −
F
z
(k(y, z), y, z)
F
x
(k(y, z), y, z)
.
Posto poi (y, z) = G(k(y, z), y, z), si verifichi che verifica in (y
0
, z
0
)
le ipotesi del teorema 1.9.2; se ne deduca che in U V W si ha
F(x, y, z) = G(x, y, z) = 0 se e solo se x = k(y, z) e y = h(z), con h
opportuna funzione di classe C
1
. Infine si ricavi la tesi con la h gi` a
trovata e con g(z) = k(h(z), z).]
5. Sia F : R
3
→R
2
definita da
F(x, y, z) = (sin x + sin y + sin z −1, cos x + cos y + cos z −1)
e poniamo Z = ¦(x, y, z) ∈ R
3
: F(x, y, z) = 0¦. Si provi che il punto
_
0,

6
,
π
6
_
appartiene a Z e che in un intorno di questo punto si ha
Z = ¦(y, z) : y = f(x), z = g(x)¦ per opportune funzioni f, g. Si
scrivano le equazioni della retta tangente a Z nel punto
_
0,

6
,
π
6
_
.
6. Si verifichi che l’applicazione F :]0, ∞[RR →R
3
¸¦(0, 0, 0)¦, definita
da
F(ρ, ϑ, ϕ) = (ρ sin ϑcos ϕ, ρ sin ϑsin ϕ, ρ cos ϑ)
`e localmente invertibile nel punto (1, π/4, 3π) e se ne scriva l’inversa in
un intorno di tale punto.
7. Posto F(x, y) = (x
2
− y
2
, 2xy), in quali punti di R
2
la F `e localmente
invertibile? In tal caso si scriva F
−1
.
8. Poniamo
F(t) =
_
t,
1 + t
t
,
1 −t
2
t
_
, t > 0.
Si verifichi che F `e una curva regolare, si scriva la funzione di cui F(R
+
)
`e grafico, e si mostri che F(R
+
) giace su un piano di R
3
.
9. Scrivere in forma parametrica, di grafico e di luogo di zeri i seguenti
sottoinsiemi di R
3
:
(i) il cono di altezza h, con base la circonferenza del piano z = 0 di
centro (1, 0) e raggio 1;
(ii) l’ellissoide centrato nell’origine di semiassi a, b, c;
(iii) il piano per (1, 1, 1) parallelo ai vettori (1, 0, 0) e (1, 1, 0).
88
1.10 Massimi e minimi vincolati
Sia K un compatto di R
N
e sia f : K → R una funzione continua. Per il
teorema di Weierstrass, f assume massimo e minimo su K. Come determi-
narli?
Se K ha punti interni e f `e di classe C
1
, gli eventuali punti di massimo e di
minimo interni a K sono da ricercare, come si sa dall’Analisi I, fra i punti
stazionari di f interni a K. Questo studio, tuttavia, non include gli eventuali
punti di massimo o di minimo situati sulla frontiera di K.
Il problema che ci poniamo qui `e la ricerca del massimo e del minimo di una
funzione f ∈ C
1
(A), con A aperto di R
N
, su un insieme compatto K ⊂ A,
privo di parte interna. L’insieme K, sul quale naturalmente occorrer` a fare
qualche ipotesi, `e detto vincolo, ed i valori estremi raggiunti da f su K si
diranno massimi e minimi vincolati (su K). Il termine “vincolo” indica ap-
punto che le variabili da cui dipende f sono vincolate a muoversi dentro K.
Per i nostri scopi baster` a supporre che K sia una variet` a r-dimensionale
(r < N) di classe C
1
contenuta nell’aperto A, oppure, pi` u in generale,
l’unione finita di variet`a di questo tipo.
Esempio 1.10.1 Se K `e la frontiera del quadrato di R
2
di centro l’origine
e lato 2, allora K `e l’unione di quattro segmenti di lunghezza 2, ciascuno
dei quali `e una curva regolare: ad esempio il segmento di estremi (−1, −1) e
(−1, 1) `e descritto dalla parametrizzazione x = −1, y = t, con t ∈ [−1, 1].
Definizione 1.10.2 Sia A un aperto di R
N
, sia f ∈ C
1
(A) e sia K una
variet`a r-dimensionale (r < N) di classe C
1
, contenuta in A. Un punto
x
0
∈ A si dice punto stazionario vincolato per f su K, se x
0
∈ K e se il
vettore ∇∇∇f(x
0
) `e ortogonale all’iperpiano r-dimensionale tangente a K in x
0
.
Teorema 1.10.3 Sia A un aperto di R
N
, sia f ∈ C
1
(A) e sia K una variet`a
r-dimensionale (r < N) di classe C
1
, contenuta in A. Se x
0
∈ K `e punto
di massimo o di minimo relativo per f[
K
, allora x
0
`e un punto stazionario
vincolato per f su K.
Dimostrazione Supponiamo che K sia della forma K = g(U), con U aperto
di R
r
e g funzione di classe C
1
con matrice Jacobiana di rango r in ogni punto
di U. Sar`a, in particolare, x
0
= g(y
0
), con y
0
∈ U. Dall’ipotesi fatta su x
0
segue che y
0
`e punto di massimo o di minimo locale per la funzione composta
89
F(y) = f(g(y)), y ∈ U. Quindi deve essere
D
i
F(y
0
) =
N

j=1
D
j
f(g(y
0
))D
i
g
j
(y
0
) = 0, i = 1, . . . , r,
ossia
¸∇∇∇f(x
0
), D
i
g(y
0

N
= 0, i = 1, . . . , r :
ci` o significa che ∇∇∇f(x
0
) `e ortogonale ai vettori D
1
g(y
0
), . . . , D
r
g(y
0
), i quali,
in virt` u del teorema del rango, sono i generatori del piano r-dimensionale
tangente a K nel punto x
0
. Ci` o prova che in x
0
il vettore ∇∇∇f(x
0
) `e ortogonale
a K, che `e la tesi.
Il teorema precedente mostra che la ricerca dei punti di massimo e di minimo
di una funzione f su K va limitata ai punti stazionari vincolati. Un confronto
fra i valori assunti da f in tali punti fornir`a poi i valori massimo e minimo
cercati.
Esempio 1.10.4 Cerchiamo il massimo e il minimo della funzione f(x, y) =
e
x−y
sulla circonferenza K di equazione x
2
+ y
2
= 1, che si parametrizza
ponendo (x, y) = g(t) = (cos t, sin t) con t ∈ [−π, π]. Dobbiamo trovare il
massimo e il minimo della funzione composta f(cos t, sin t) = e
cos t−sin t
, la cui
derivata si annulla quando
e
cos t−sin t
(−sin t −cos t) = 0.
Ci` o accade per t
1
= −π/4 e t
2
= 3π/4, valori che corrispondono ai punti
(x
1
, y
1
) =
_
1

2
, −
1

2
_
e (x
2
, y
2
) =
_

1

2
,
1

2
_
. Essendo g
t
(t) = (−sin t, cos t),
in corrispondenza di questi punti si ha
g
t
(t
1
) =
_
1

2
,
1

2
_
, g
t
(t
2
) =
_

1

2
, −
1

2
_
,
mentre
∇∇∇f(x
1
, y
1
) = (e
x
1
−y
1
, −e
x
1
−y
1
) =
_
e

2
, −e

2
_
,
∇∇∇f(x
2
, y
2
) = (e
x
2
−y
2
, −e
x
2
−y
2
) =
_
e


2
, −e


2
_
;
ne segue, come `e giusto,
¸∇∇∇f(x
1
, y
1
), g
t
(t
1

N
= 0, ¸∇∇∇f(x
2
, y
2
), g
t
(t
2

N
= 0.
90
Il massimo ed il minimo di f valgono
max
K
f = f(x
1
, y
1
) = e

2
, min
K
f = f(x
2
, y
2
) = e


2
.
Molto spesso la variet` a K `e data (come nell’esempio precedente) in forma di
luogo di zeri di una funzione. In questo caso pu`o essere pi` u comodo utilizzare
il metodo dei moltiplicatori, dovuto a Lagrange, che andiamo a descrivere
nell’enunciato che segue.
Teorema 1.10.5 Sia A un aperto di R
N
, sia f ∈ C
1
(A) e sia
K = ¦x ∈ A : G(x) = 0¦,
ove G : A →R
k
(k < N) `e una funzione di classe C
1
con matrice Jacobiana
DG(x) di rango massimo k in ogni punto x ∈ K. Allora un punto x
0
∈ A `e
stazionario vincolato per f su K se e solo se esiste m
0
∈ R
k
tale che (x
0
, m
0
)
`e punto stazionario (libero) in A R
k
per la funzione Lagrangiana
L(x, m) = f(x) −¸m, G(x)¸
k
.
Dimostrazione Nelle ipotesi fatte, posto r = N − k, K `e una variet` a r-
dimensionale di classe C
1
, in virt` u del teorema del Dini. Sia x
0
∈ A un punto
stazionario vincolato per f: allora si ha G(x
0
) = 0 e, per il teorema 1.10.3,
il vettore ∇∇∇f(x
0
) deve essere ortogonale al piano r-dimensionale tangente
a K in x
0
. Ma, essendo K una curva di livello della funzione G, i vettori
normali a K in x
0
sono le righe della matrice Jacobiana DG(x
0
), ossia i
vettori ∇∇∇G
1
(x
0
), . . . , ∇∇∇G
k
(x
0
). Quindi ∇∇∇f(x
0
) `e combinazione lineare di
tali vettori, e dunque esistono k numeri reali m
1
, . . . , m
k
(detti moltiplicatori)
tali che
∇∇∇f(x
0
) −
k

i=1
m
i
∇∇∇G
i
(x
0
) = 0.
In altre parole, il punto x
0
verifica le condizioni
_
D
j
f(x
0
) −

k
i=1
m
i
D
j
G
i
(x
0
) = 0, j = 1, . . . N
−G
i
(x
0
) = 0, i = 1, . . . , k,
le quali equivalgono, per definizione della Lagrangiana L e ponendo m
0
=
(m
1
, . . . , m
k
), all’annullarsi in (x
0
, m
0
) del gradiente di L rispetto alle varia-
bili x
j
e m
i
.
91
Viceversa, se un punto (x
0
, m
0
) ∈ A R
k
`e stazionario per la Lagrangiana,
ossia soddisfa il sistema sopra scritto, allora il secondo gruppo di equazioni
ci dice che x
0
∈ K, mentre il primo gruppo esprime la lineare dipendenza di
∇∇∇f(x
0
) dai vettori normali a K in x
0
. Ci`o prova che x
0
`e punto stazionario
vincolato per f su K.
Il teorema 1.10.5 ha un’interpre-
tazione geometrica. Supponiamo
k = 1, cio`e che il vincolo K sia la
superficie di livello 0 di una fun-
zione scalare G. Se consideriamo
gli insiemi di livello della funzione
f, ad un punto stazionario vinco-
lato x
0
∈ K corrisponder` a il va-
lore critico f(x
0
) = c
0
; il teorema
dice allora che, essendo i vettori
∇∇∇f(x
0
) e ∇∇∇G(x
0
) paralleli, la cur-
va di livello ¦x ∈ A : f(x) = c
0
¦
`e tangente in x
0
al vincolo K.
Gli stessi moltiplicatori hanno un loro significato geometrico, che `e descritto
nell’esercizio 1.10.12.
In sostanza, il metodo dei moltiplicatori riduce il problema della ricerca dei
punti stazionari vincolati a quello pi` u semplice di trovare i punti stazionari
liberi della Lagrangiana: il prezzo da pagare `e che si hanno delle variabili in
pi` u (i moltiplicatori).
Esempio 1.10.6 Calcoliamo, con il metodo dei moltiplicatori, il massimo
ed il minimo della funzione f(x, y) = e
x−y
sulla circonferenza x
2
+y
2
= 1, gi` a
determinati nell’esempio 1.10.4. Dobbiamo cercare i punti stazionari della
Lagrangiana
L(x, y, m) = e
x−y
−m(x
2
+ y
2
−1), (x, y, m) ∈ R
2
[−π, π].
Risulta ∇∇∇L(x, y, m) = 0 se e solo se
_
_
_
e
x−y
−2mx = 0
−e
x−y
−2my = 0
x
2
+ y
2
= 1.
92
Dalle prime due equazioni segue che m ,= 0 e 2m(x +y) = 0, da cui x = −y.
Sostituendo nella terza si trova 2x
2
= 1, ed infine i due punti
(x
1
, y
1
, m
1
) =
_
1

2
, −
1

2
,
e

2

2
_
, (x
2
, y
2
, m
2
) =
_

1

2
,
1

2
, −
e


2

2
_
.
Abbiamo cos`ı ritrovato i punti (x
1
, y
1
) e (x
2
, y
2
) ottenuti nell’esempio 1.10.4.
Osservazione 1.10.7 Nelle applicazioni occorre frequentemente trovare il
massimo e il minimo di una funzione su un insieme K che non `e una variet`a
regolare: o perch´e vi sono punti singolari nei quali manca il piano tangente, o
perch´e vi `e un bordo (ad esempio quando K = g(U), con U¸

U,= ∅), o perch´e
K `e una variet` a regolare a tratti: ci` o significa che K `e unione finita di superfici
K
i
ciascuna delle quali `e regolare (si pensi ad una superficie poliedrica). In
generale, se in qualche punto di K non sono verificate le ipotesi dei teoremi
precedenti, occorrer`a studiare a parte come si comporta la funzione in tali
punti.
Esempio 1.10.8 Sia Q il quadrato di R
2
di centro l’origine e spigolo 2.
Vogliamo calcolare il massimo e il minimo di f(x, y) = (x
2
− 1)y
2
su Q.
Anzitutto, essendo ∇∇∇f(x, y) = (2xy
2
, 2y(x
2
− 1)), l’unico punto stazionario
interno a Q `e l’origine, dove si ha f(0, 0) = 0. Analizziamo la situazione
sulla frontiera: essa `e costituita dal quattro lati
T
1
= ¦(t, −1) : t ∈] −1, 1[¦, T
2
= ¦(1, t) : t ∈] −1, 1[¦,
T
3
= ¦(t, 1) : t ∈] −1, 1[¦, T
4
= ¦(−1, t) : t ∈] −1, 1[¦,
e dai quattro vertici (−1, −1), (1, −1), (1, 1) e (−1, 1). In questo caso l’uso del
metodo dei moltiplicatori non `e conveniente, perch´e `e piuttosto complicato
rappresentare ∂Q come luogo di zeri di una funzione. Usiamo dunque le
parametrizzazioni dei lati della frontiera sopra scritte: se poniamo f
i
= f[
T
i
,
i = 1, 2, 3, 4, risulta f
2
(t) ≡ f
4
(t) ≡ 0, mentre
f
1
(t) ≡ f
3
(t) = t
2
−1, f
t
1
(t) = 2t, f
t
1
(t) = 0 ⇐⇒ t = 0,
con f
1
(0) = f(0, −1) = f
3
(0) = f(0, 1) = −1. Nei quattro vertici poi la f si
annulla. Confrontando i valori trovati nei punti considerati, si conclude che
max
Q
f = 0, min
Q
f = −1.
93
Esercizi 1.10
1. Siano a, b ∈ R non entrambi nulli. Determinare il massimo ed il minimo
della funzione f(x, y) = ax + by sulla circonferenza x
2
+ y
2
= 1.
2. Sia α > 0. Determinare il massimo ed il minimo della funzione f(x, y) =
xy sull’insieme
Γ = ¦(x, y) ∈ R
2
: x ≥ 0, y ≥ 0, x
α
+ y
α
= 1¦.
3. Determinare il massimo ed il minimo delle funzioni seguenti sui vincoli
indicati:
(i) f(x, y) = (x + 2y)
2
, K =
_
(x, y) ∈ R
2
:
x
2
4
+
y
2
3
= 1
_
;
(ii) f(x, y) = (3x + 2y)
2
, K = ¦(x, y) ∈ R
2
: 4x
2
+ y
2
= 1¦;
(iii) f(x, y, z) = xyz, K = ¦(x, y, z) ∈ R
3
: max¦x
2
+ y
2
, [z[¦ = 1¦.
4. Fra tutti i rettangoli, inscritti in una data ellisse e con lati paralleli agli
assi dell’ellisse, trovare quello di area massima.
5. Fra tutti i parallelepipedi rettangoli con superficie assegnata, trova-
re quelli di volume massimo. Cosa succede se si assegna soltanto la
superficie laterale?
6. Determinare sulla superficie di equazione z
2
−xy = 1 i punti pi` u vicini
all’origine di R
3
.
7. Trovare il massimo ed il minimo di f(x, y) = ¸x, y¸
2N
sul vincolo
K = ¦(x, y) ∈ R
2N
: [x[
N
= [y[
N
= 1¦.
8. Determinare il
max
_
N

i=1
x
i
: x
1
, . . . , x
N
> 0,
N

i=1
x
i
= S
_
,
ove S > 0, e dedurne la disuguaglianza fra media geometrica e media
aritmetica.
94
9. Determinare il
min
_
N

i=1
1
x
i
: x
1
, . . . , x
N
> 0,
N

i=1
x
i
= P
_
,
ove P > 0, e dedurne la disuguaglianza fra media armonica e media
geometrica.
10. Siano p, q > 1 con
1
p
+
1
q
= 1. Posto |x| =
_

N
i=1
[x
i
[
p
_
1/p
, si provi che
per ogni a ∈ R
N
si ha
max
_
N

i=1
a
i
x
i
: |x| = 1
_
=
_
N

i=1
[a
i
[
q
_
1/q
.
11. Sia A una matrice N N, simmetrica, a coefficienti reali, e siano
λ
1
, . . . , λ
N
gli autovalori di A, ordinati in modo decrescente. Posto
f(x) = ¸Ax, x¸
N
per ogni x ∈ R
N
, si provino i fatti seguenti:
(i) λ
1
= max
x∈M
1
f(x), ove M
1
= ¦x ∈ R
N
: [x[
N
= 1¦, ed inoltre se
y
1
∈ M
1
realizza tale massimo, allora y
1
`e autovalore di A relativo
a λ
1
;
(ii) λ
2
= max
x∈M
2
f(x), ove M
2
= ¦x ∈ R
N
: [x[
N
= 1, ¸x, y
1
¸
N
= 0¦,
ed inoltre se y
2
∈ M
2
realizza tale massimo, allora y
2
`e autovalore
di A relativo a λ
2
;
(iii) similmente, per k = 3, . . . , N si ha λ
k
= max
x∈M
k
f(x), ove
M
k
= ¦x ∈ R
N
: [x[
N
= 1, ¸x, y
j
¸
N
= 0, j = 1, . . . , k −1¦,
ed inoltre se y
k
∈ M
k
realizza tale massimo, allora y
k
`e autovalore
di A relativo a λ
k
.
(iv) ¦y
1
, . . . , y
N
¦ `e una base ortonormale di R
N
; inoltre se (ξ
1
, . . . , ξ
N
)
sono le coordinate di un generico punto x ∈ R
N
rispetto a tale
base, si ha
¸Ax, x¸
N
=
N

i=1
λ
i

i
)
2
∀x ∈ R
N
.
95
12. Sia A un aperto di R
2
e siano f, g ∈ C
2
(A). Sia inoltre (x
0
, y
0
) un
punto stazionario vincolato per f rispetto al vincolo
K = ¦(x, y) ∈ A : g(x, y) = t
0
¦,
con moltiplicatore m
0
. Dimostrare i fatti seguenti:
(i) se la Lagrangiana L(x, y, m) = f(x, y) + m(g(x, y) − t
0
) ha matri-
ce Hessiana non singolare nel punto (x
0
, y
0
, m
0
), allora esiste un
intorno I di t
0
in R tale che per ogni t ∈ I il sistema
_
_
_
f
x
(x, y) + mg
x
(x, y) = 0
f
y
(x, y) + mg
y
(x, y) = 0
g(x, y) = t
ha un’unica soluzione (x(t), y(t), m(t));
(ii) posto c(t) = f(x(t), y(t)), risulta m(t) = c
t
(t) per ogni t ∈ I.
Dunque il numero m
0
= m(t
0
) misura quanto il valore critico
f(x
0
, y
0
) `e sensibile a variazioni della funzione g rispetto al livello
t = t
0
, ossia rispetto a spostamenti di (x, y) nella direzione di
∇∇∇g(x, y).
[Traccia: si applichi il teorema del Dini. Per il calcolo di c
t
(t) `e utile
derivare l’identit`a g(x(t), y(t)) = t.]
13. Sia K = ¦(x, y) ∈ R
2
: x
2
− y
3
= 0¦. Si verifichi che la funzione
f(x, y) = x ha minimo assoluto su Z nel punto (0, 0), ma che tale
punto non `e punto stazionario vincolato per f su K. Come mai?
14. Si provi che la distanza fra un punto x
0
∈ R
N
e il piano (N − 1)-
dimensionale di equazione ¸a, x¸
N
= c, c ∈ R, `e uguale a
[¸a, x
0
¸
N
[
[a[
N
.
15. Si provi che la distanza fra un punto x
0
∈ R
N
e l’iperpiano r-dimensionale
V = ¦x ∈ R
N
: Ax = b¦ (dunque A `e una matrice N (N − r) di
rango massimo) `e uguale a
A
t
(AA
t
)
−1
(b −Ax
0
),
ove A
t
`e la matrice trasposta di A(dunque `e (N−r)N con (a
t
)
ij
= a
ji
,
i = 1, . . . , N −r, j = 1, . . . , N).
96
Capitolo 2
Sistemi differenziali
2.1 Preliminari
Abbiamo visto in Analisi I (capitolo 6) che un’equazione differenziale di or-
dine arbitrario n `e equivalente ad un sistema di n equazioni differenziali del
primo ordine, e che l’equazione `e in forma normale se e solo se il sistema `e in
forma normale. Per quest’ultimo tipo di sistemi abbiamo dato un teorema di
esistenza e unicit`a locale per la soluzione del problema di Cauchy (teorema
6.1.1), osservando anche che la soluzione dipende con continuit`a dai dati;
inoltre si `e mostrato che nel caso di sistemi lineari l’esistenza `e globale, ossia
il vettore soluzione `e definito nell’intero intervallo dove sono definiti i coeffi-
cienti del sistema. Infine abbiamo mostrato come determinare le soluzioni di
alcuni tipi di equazioni del primo ordine, nonch´e delle equazioni lineari del
secondo ordine a coefficienti costanti.
In questo capitolo studieremo pi` u sistematicamente i sistemi lineari, dei quali
descriveremo l’insieme delle soluzioni, estendendo il discorso anche alle equa-
zioni lineari di ordine arbitrario, e forniremo metodi per lo studio qualitativo
dei sistemi non lineari bi-dimensionali. Negli esercizi che seguono si illustra-
no alcuni esempi di equazioni e sistemi differenziali che scaturiscono dalle
scienze applicate e che sono risolubili con le tecniche viste in Analisi I. In
alcuni casi, le grandezze considerate sono discrete ma vengono trattate come
quantit` a continue: ci` o `e poco corretto matematicamente, ma `e giustificato
dal fatto che i risultati che si ottengono corrispondono efficacemente ai dati
sperimentali.
97
Esercizi 2.1
1. Per stimare l’efficacia di una campagna pubblicitaria, `e stato proposto
il modello che segue. L’importo x(t) delle vendite, in assenza di pub-
blicit` a, diminuisce nel tempo secondo un certo tasso costante λ > 0, e
dunque risulta
dx
dt
= −λx.
In presenza di pubblicit`a, denotiamo con A(t) l’attivit` a pubblicitaria e
con M il livello di saturazione del mercato: si ritiene che la pubblicit` a
incida su quella parte del mercato che non ha ancora acquistato il
prodotto, cosicch´e l’equazione diventa
dx
dt
= −λx + rA(t)
M −x
M
,
ove r `e una costante positiva; posto b(t) =
rA(t)
M
+λ, possiamo scrivere
dx
dt
+ b(t)x = rA(t).
Supponiamo in particolare che l’attivit`a pubblicitaria A(t) abbia il
valore costante A > 0 per un certo tempo T > 0, e poi cessi: dunque
A(t) =
_
A se 0 < t ≤ T
0 se t > T.
Si risolva l’equazione differenziale e si traccino i grafici delle funzioni
A(t) e x(t). Si confronti l’effetto di una campagna pubblicitaria intensa
e breve con quello di una pi` u moderata ma duratura.
2. Una fabbrica introduce un interessante processo innovativo. Sia N il
numero di fabbriche presenti sul territorio, e indichiamo con x(t) il
numero di quelle che, al tempo t, hanno adottato l’innovazione (in par-
ticolare x(0) = 1). Il tasso di diffusione sar` a proporzionale a x(t), ma
decrescer` a al ridursi del numero delle fabbriche che non hanno ancora
introdotto il nuovo processo. Dunque avremo
dx
dt
= ax(N −x),
ove a `e una costante positiva. Risolvere l’equazione e descrivere quali-
tativamente la soluzione.
98
3. Nella situazione dell’esercizio precedente, analizziamo l’effetto della
pubblicit` a introducendo un termine proporzionale al numero di coloro
che non hanno ancora adottato l’innovazione:
dx
dt
= (ax + b)(N −x).
Si risolva l’equazione con la condizione x(0) = 1 e se ne confronti
l’andamento con quello della soluzione dell’esercizio precedente.
4. Il modello pi` u semplice di dinamica delle popolazioni animali `e quello
della crescita malthusiana: se una popolazione `e composta da x(t) in-
dividui all’istante t, allora x
t
(t) rappresenta il suo tasso di crescita. In
questo modello, adatto a descrivere la fase iniziale dell’accrescimento
di una colonia di batteri in un brodo di coltura, si ha
x
t
(t) = µx(t), x(t
0
) = x
0
,
dove x
0
`e la popolazione all’istante iniziale t
0
e µ > 0 `e il fattore di
crescita. Si determini la soluzione del problema e si verifichi che il
modello proposto `e ragionevole solo per un breve intervallo temporale.
5. Alle condizioni dell’esercizio precedente si aggiunga l’effetto, negati-
vo sulla crescita della popolazione, dovuto all’affollamento oppure al-
la limitazione delle risorse alimentari. Si ottiene allora l’equazione
logistica
x
t
= ax −bx
2
, x(t
0
) = x
0
,
in cui le costanti a, b sono positive e b `e piccola rispetto ad a: in questo
modo il termine bx
2
non incide quando la popolazione `e scarsa. Si
risolva l’equazione e se ne faccia un’analisi qualitativa.
6. Si supponga che in un allevamento di pesci la legge di crescita sia di
tipo malthusiano, e che si effettui una pesca con prelievo h > 0 costante
nel tempo. L’equazione che governa l’allevamento `e allora
x
t
(t) = ax(t) −h, x(t
0
) = x
0
.
Si determini la soluzione e se ne analizzi il comportamento al variare
dei parametri x
0
e h.
99
7. Consideriamo il moto di una particella di massa m, legata ad una mol-
la di costante elastica k, soggetta ad una forza esterna F(t) e a una
reazione viscosa di costante µ. L’equazione del moto `e
u
tt
(t) +
µ
m
u
t
(t) +
k
m
u(t) =
F(t)
m
,
Si scriva l’insieme delle soluzioni di questa equazione al variare della
posizione iniziale u
0
e della velocit` a iniziale v
0
.
8. In un circuito elettrico di induttanza L e resistenza R, la legge di ca-
rica Q(t) di un condensatore di capacit` a C, con forza elettromotrice
applicata E(t), verifica l’equazione differenziale
LQ
tt
(t) + RQ
t
(t) +
1
C
Q(t) = E(t), t ≥ 0.
Si descrivano le soluzioni dell’equazione, supponendo E(t) = e
−t
.
9. La legge di decadimento K(t) di una sostanza radioattiva soddisfa
l’equazione differenziale
K
t
(t) = αK(t), t ≥ 0.
ove α `e una costante positiva. Si scrivano le soluzioni di questa equa-
zione.
10. Un modello semplificato per l’economia nazionale `e descritto dalle se-
guenti variabili: il prodotto interno lordo x(t), la spesa per investimenti
I(t), le spese correnti S(t), i consumi C(t). Si assume che per i consumi
si abbia C = (1 − s)x, prevedendo un coefficiente di risparmio s, e
che il prodotto interno si evolva nel tempo, rispondendo all’eccesso di
domanda, nel modo seguente:
dx
dt
= l(C + I + S −x), t ≥ 0,
ove l `e una costante positiva; per gli investimenti si assume che
dI
dt
= m
_
a
dx
dt
−I
_
,
con a, m costanti positive. Si ha dunque un sistema di due equazioni
differenziali nelle variabili x, I. Si trasformi il sistema in una equazione
del secondo ordine per x, e si specifichi quali previsioni si possono fare
per l’evoluzione del prodotto interno lordo.
100
11. Un corpo di massa m cade, incontrando una resistenza idraulica pro-
porzionale al quadrato della sua velocit`a. Il suo moto `e descritto dalla
legge
mx
tt
= mg −µ(x
t
)
2
.
Si risolva questa equazione supponendo che m = 1, g = 10, µ = 0.05,
x(0) = 100, x
t
(0) = 0 (le costanti sono espresse in unit` a di misura
coerenti).
2.2 Sistemi lineari
Un sistema differenziale lineare del primo ordine ha la forma
u
t
(t) = A(t)u(t) +f (t), t ∈ J,
ove J `e un intervallo di R (non vuoto, limitato o illimitato, aperto o chiuso),
A(t) `e una matrice n n, con n > 1, i cui coefficienti a
ij
(t) supporremo
continui su J a valori in generale complessi, e il secondo membro f `e una
funzione continua su J a valori in C
n
; l’incognita u = (u
1
, . . . , u
n
) `e una
funzione da J in C
n
di classe C
1
. La scelta di ammettere funzioni a valori
complessi `e dettata dal fatto che le soluzioni complesse entrano in ballo in
modo naturale: basta pensare che e
it
risolve l’equazione u
tt
+ u = 0, che `e a
coefficienti reali.
In forma scalare il sistema diventa
_
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
_
(u
1
)
t
(t) = a
11
(t)u
1
(t) + a
12
(t)u
2
(t) + . . . + a
1n
(t)u
n
(t) + f
1
(t),
(u
2
)
t
(t) = a
21
(t)u
1
(t) + a
22
(t)u
2
(t) + . . . + a
2n
(t)u
n
(t) + f
2
(t),
.
.
.
(u
n
)
t
(t) = a
n1
(t)u
1
(t) + a
n2
(t)u
2
(t) + . . . + a
nn
(t)u
n
(t) + f
n
(t).
Dalla linearit`a del sistema discende il principio di sovrapposizione: se v e w
risolvono
v
t
(t) = A(t)v(t) +f (t), w
t
(t) = A(t)w(t) +g(t), t ∈ J,
allora per ogni a, b ∈ C la funzione z = av + bw risolve
z
t
(t) = A(t)z(t) + af (t) + bg(t), t ∈ J.
101
In particolare, se v e w risolvono un sistema omogeneo, ossia con secondo
membro nullo, anche z = av + bw risolve lo stesso sistema: ne segue che
l’insieme
V
0
= ¦u ∈ C
1
(J, C
n
) : u
t
= Au in J¦
`e uno spazio vettoriale su C. Inoltre, se u
f
`e un’arbitraria soluzione del
sistema non omogeneo
u
t
(t) = A(t)u(t) +f (t), t ∈ J,
allora, posto
V
f
= ¦u ∈ C
1
(J, C
n
) : u
t
= Au +f in J¦,
si ha la relazione
V
f
= V
0
+u
f
,
nel senso che
V
f
= ¦u +u
f
, u ∈ V
0
¦.
Ci` o significa che V
f
`e un spazio affine contenuto in C
1
(J, C
n
), parallelo al
sottospazio vettoriale V
0
.
Consideriamo il problema di Cauchy
_
u
t
(t) = A(t)u(t) +f (t), t ∈ J,
u(t
0
) = u
0
,
con t
0
∈ J e u
0
∈ C
n
assegnati. Per le osservazioni fatte nel paragrafo
iniziale, questo problema ha una e una sola soluzione u, di classe C
1
, definita
su tutto l’intervallo J. Inoltre, se i coefficienti e il termine noto sono di classe
C
k
, k ∈ N, allora u `e di classe C
k+1
, cosicch´e se A e f sono di classe C

anche la soluzione `e di classe C

.
Sistemi lineari omogenei
Cominciamo ad analizzare i sistemi lineari omogenei, dunque con f = 0.
Proposizione 2.2.1 Sia A una matrice nn con coefficienti a
ij
∈ C(J, C).
Lo spazio vettoriale V
0
, costituito dalle soluzioni del sistema omogeneo
u
t
(t) = A(t)u(t), t ∈ J,
ha dimensione n.
102
Dimostrazione Per ogni x ∈ C
n
sia u
x
() la soluzione del problema di
Cauchy
_
u
t
(t) = A(t)u(t), t ∈ J
u(t
0
) = x.
L’applicazione S : C
n
→V
0
, definita da
S(x) = u
x
() ∀x ∈ C
n
,
`e chiaramente lineare, dato che per ogni λ, µ ∈ C e x, y ∈ C
n
si ha, in virt` u
del principio di sovrapposizione,
S(λx + µy) = u
λx+µy
() = λu
x
() + µu
y
() = λS(x) + µS(y);
inoltre S `e un isomorfismo, poich`e essa `e iniettiva (infatti, per il teorema
di unicit`a, S(0) `e la funzione identicamente nulla) e surgettiva (se v ∈ V
0
allora, sempre per unicit`a, v = S(x) con x = v(t
0
)). Dunque lo spazio V
0
`e
isomorfo a C
n
e quindi ha dimensione n.
Alla luce della proposizione precedente, per descrivere esplicitamente V
0
ba-
ster` a conoscerne una base, ossia determinare n soluzioni linearmente indi-
pendenti: una tale famiglia sar`a chiamata sistema fondamentale di soluzioni.
Come riconoscere un sistema fondamentale di soluzioni? A questo scopo
conviene dare la seguente
Definizione 2.2.2 Siano u
1
, . . . , u
n
elementi di C
1
(J, C
n
). Si chiama ma-
trice Wronskiana delle funzioni u
1
, . . . , u
n
la matrice che ha tali funzioni
come vettori colonna:
W(t) =
_
_
_
_
_
_
_
u
1
1
(t) u
1
2
(t) u
1
n
(t)
u
2
1
(t) u
2
2
(t) u
2
n
(t)
.
.
.
.
.
.
.
.
.
u
n
1
(t) u
n
2
(t) u
n
n
(t)
_
_
_
_
_
_
_
.
Si ha allora:
Teorema 2.2.3 Siano u
1
, . . . , u
n
soluzioni del sistema omogeneo
u
t
(t) = A(t)u(t), t ∈ J.
103
Allora la matrice Wronskiana di tali funzioni verifica
W
t
(t) = A(t)W(t) ∀t ∈ J;
inoltre i seguenti fatti sono equivalenti:
(i) le funzioni u
1
, . . . , u
n
sono linearmente indipendenti in V
0
;
(ii) esiste t
0
∈ J tale che det W(t
0
) ,= 0;
(iii) risulta det W(t) ,= 0 per ogni t ∈ J.
Dimostrazione Anzitutto, detti w
ij
(t) e a
ij
(t) i coefficienti di W(t) e di
A(t), si ha
dw
ij
dt
(t) =
d
dt
u
i
j
(t) =
n

k=1
a
ik
(t)u
k
j
(t) =
n

k=1
a
ik
(t)w
kj
(t),
da cui W
t
(t) = A(t)W(t).
Proviamo adesso l’equivalenza fra le condizioni (i), (ii) e (iii).
(i)=⇒(iii) Se, per assurdo, la (iii) fosse falsa, esisterebbe t
0
∈ J tale che
det W(t
0
) = 0: dunque le colonne di W(t
0
) sarebbero linearmente dipenden-
ti, ossia esisterebbero c
1
, . . . , c
n
∈ C tali che

n
i=1
c
i
u
i
(t
0
) = 0. Ne seguirebbe
che la funzione v =

n
i=1
c
i
u
i
`e un elemento di V
0
che risolve il problema di
Cauchy
_
v
t
(t) = A(t)v(t), t ∈ J
v(t
0
) = 0,
e dunque, per unicit`a, v ≡ 0, cio`e

n
i=1
c
i
u
i
≡ 0: dunque u
1
, . . . , u
n
sareb-
bero linearmente dipendenti in V
0
, contro l’ipotesi (i).
(iii)=⇒(ii) Evidente.
(ii)=⇒(i) Supponiamo, per assurdo, che esistano c
1
, . . . , c
n
∈ C tali che

n
i=1
c
i
u
i
≡ 0 in J: allora per ogni t ∈ J i vettori u
1
(t), . . . , u
n
(t) sarebbero
linearmente dipendenti in C
n
; ne seguirebbe det W(t) = 0 per ogni t ∈ J, il
che contraddirebbe (ii).
In definitiva, per stabilire se una data famiglia di n soluzioni del sistema
omogeneo `e o non `e un sistema fondamentale, `e sufficiente calcolarne il de-
terminante Wronskiano in un punto qualunque di J.
Come si `e osservato, i vettori colonna u
j
di una matrice Wronskiana W(t), a
104
determinante non nullo, formano una base di V
0
: conoscendo W(t), `e dunque
possibile scrivere l’integrale generale del sistema omogeneo, ossia l’insieme
delle sue soluzioni:
V
0
= ¦c
1
u
1
+ . . . + c
n
u
n
: c
1
, . . . , c
n
∈ C¦ = ¦W()c : c ∈ C
n
¦.
Un modo per costruire un sistema fondamentale di soluzioni `e il seguente:
se e
j
`e il j-simo elemento della base canonica di C
n
, sia u
j
la soluzione del
problema di Cauchy
_
u
t
(t) = A(t)u(t), t ∈ J
u(t
0
) = e
j
;
allora le funzioni u
j
, 1 ≤ j ≤ n, costituiscono un sistema fondamentale in
quanto, ovviamente, il loro determinante Wronskiano nel punto t
0
vale
det W(t
0
) = det I = 1.
Una matrice Wronskiana che si riduca all’identit` a in un punto τ ∈ J si denota
con W(t, τ) e si chiama matrice di transizione. Il nome nasce dal fatto che
la soluzione u(; τ, x) del problema di Cauchy
_
u
t
(t) = A(t)u(t), t ∈ J
u(τ) = x
`e data da
u(t; τ, x) = W(t, τ)x, t ∈ J;
in sostanza, W(t, τ) agisce come un operatore che fa passare dallo stato x,
realizzato al tempo τ, allo stato che si realizza al tempo t. Le principali
propriet` a della matrice di transizione sono le seguenti:
(i) W(t, t) = I per ogni t ∈ J,
(ii) W(t, s)W(s, τ) = W(t, τ) per ogni t, s, τ ∈ J,
(iii) [W(t, τ)]
−1
= W(τ, t) per ogni t, τ ∈ J.
La prima propriet` a deriva dalla definizione di matrice di transizione; la terza
`e immediata conseguenza delle due precedenti, e infine la seconda discende
dall’unicit` a della soluzione del problema di Cauchy: entrambi i membri di (ii)
105
risolvono il sistema omogeneo W
t
= AW in J e assumono il valore W(s, τ)
per t = s.
In generale, comunque, la costruzione esplicita di una matrice Wronskia-
na, e quindi di un sistema fondamentale di soluzioni, `e difficoltosa e spesso
impraticabile.
Sistemi lineari non omogenei
Passiamo ora allo studio del sistema lineare non omogeneo
u
t
(t) = A(t)u(t) +f (t), t ∈ J.
Come si `e gi` a osservato, per determinare l’insieme V
f
delle soluzioni di questo
sistema, supposto noto l’insieme V
0
delle soluzioni del sistema omogeneo, `e
sufficiente determinare un singolo elemento dell’insieme V
f
. Il metodo che
permette di costruire un elemento v di V
f
`e dovuto a Lagrange e si chiama
metodo di variazione delle costanti arbitrarie. Esso consiste nella ricerca di
una soluzione v della forma
v(t) = W(t)c(t),
dove W(t) `e la matrice Wronskiana relativa ad un sistema fondamentale di
soluzioni del sistema omogeneo, e c `e una funzione opportuna, definita su J
a valori in R
n
, di classe C
1
. Naturalmente, quando c `e un vettore costante,
la v sopra definita `e un elemento di V
0
; l’idea `e che se facciamo “variare
le costanti”, ossia prendiamo c non costante, allora `e possibile ottenere un
elemento di V
f
.
In effetti, imponendo che v sia soluzione, troviamo
0 = v
t
(t) −A(t)v(t) −f (t) = W
t
(t)c(t) +W(t)c
t
(t) −A(t)W(t)c(t) −f (t),
da cui, per definizione di matrice Wronskiana,
0 = W(t)c
t
(t) −f (t),
ossia, essendo W(t) invertibile,
c
t
(t) = W(t)
−1
f (t).
Dunque si ha, ad esempio,
c(t) =
_
t
s
W(r)
−1
f (r) dr,
106
ove s `e un arbitrario punto di J. Perci` o risulta, in definitiva,
v(t) = W(t)
_
t
s
W(r)
−1
f (r) dr.
`
E chiaro, viceversa, che la v(t) fornita da questa formula `e soluzione del
sistema v
t
(t) −A(t)v(t) = f (t).
In conclusione, detto ¦u
1
, . . . , u
n
¦ un sistema fondamentale di soluzioni del
sistema omogeneo, l’integrale generale del sistema non omogeneo `e dato da
V
f
= ¦c
1
u
1
+ . . . + c
n
u
n
+v : c
1
, . . . , c
n
∈ C¦ =
=
_
W()
_
c +
_

s
W(r)
−1
f (r) dr
_
: c ∈ C
n
_
.
Se, in particolare, cerchiamo la soluzione del problema di Cauchy
_
u
t
(t) = A(t)u(t) +f (t), t ∈ J
u(τ) = x,
converr`a scegliere s = τ ed utilizzare la matrice di transizione W(t, τ): la
soluzione del problema di Cauchy `e allora data da
u(t) = W(t, τ)x +
_
t
τ
W(t, r)f (r) dr,
che `e semplicemente la somma delle soluzioni dei due problemi
_
u
t
(t) = A(t)u(t), t ∈ J
u(τ) = x,
_
u
t
(t) = A(t)u(t) +f (t), t ∈ J
u(τ) = 0.
Dipendenza continua dai dati
Le soluzioni di un problema di Cauchy relativo ad un sistema differenziale
lineare dipendono con continuit` a dai dati, vale a dire dal secondo membro,
dai coefficienti e dal dato iniziale. Per verificare questa asserzione, iniziamo
con il seguente risultato:
Teorema 2.2.4 Fissiamo un intervallo J di R e siano A(t) una matrice
n n con coefficienti a
ij
∈ C(J, C), f una funzione appartenente a C(J, C
n
)
107
e x un vettore di C
n
. Allora per ogni t
0
∈ J la soluzione u del problema di
Cauchy
_
u
t
(t) −A(t)u(t) = f (t), t ∈ J
u(t
0
) = x
verifica, per ciascun sottointervallo chiuso e limitato I ⊆ J, contenente t
0
,
la stima seguente:
|u|
C
1
(I,C
n
)
≤ c
_
[x[
n
+|f |
C(I,C
n
)
¸
,
ove c `e una costante che dipende solo dalla matrice A, dall’intervallo I e
dalla dimensione n.
Questo teorema mostra che la soluzione u dipende in modo continuo dai dati
x e f .
Dimostrazione Dall’equazione differenziale ricaviamo subito
|u
t
|
C(I,C
n
)
≤ |A|
C(I,/n)
|u|
C(I,C
n
)
+|f |
C(I,C
n
)
;
dalla formula esplicita per la soluzione, cio`e
u(t) = W(t, t
0
)x +
_
t
t
0
W(t, r)f (r) dr,
deduciamo
|u|
C(I,C
n
)
≤ M
_
[x[
n
+|f |
C(I,C
n
)
¸
,
ove
M = sup¦|W(t, r)|
/n
: r, t ∈ I¦.
Si osservi che dalle propriet` a della matrice di transizione W(t, r) segue che
W(t, r) = I +
_
t
r
A(s)W(s, r) ds, t ∈ I,
da cui, posto A = |A|
C(I,/n)
e fissato δ ∈
¸
0,
1
A
_
, otteniamo per [t −r[ ≤ δ
|W(t, r)|
/n
≤ 1 + (t −r)A sup
[s−r[≤δ
|W(s, r)|
/n
,
e dunque
sup
[t−r[≤δ
|W(t, r)|
/n

1
1 −δA
.
108
D’altronde, se t, r ∈ I e [t−r[ > δ possiamo scrivere, definendo k = [[t−τ[/δ]
e supposto ad esempio t > r,
|W(t, r)|
/n
=
= |W(t, r + kδ)W(r + kδ, r + (k −1)δ) . . . W(r + δ, r|
/n

≤ (1 −δA)
−k−1
,
cosicch´e, detto K = [(I)/δ], avremo
M = sup¦|W(t, r)|
/n
: r, t ∈ I¦ ≤ (1 −δA)
−K−1
.
Combinando le stime ottenute per u
t
e u con la maggiorazione relativa a M,
otteniamo la tesi con
c = 1 +
2 + A
(1 −δA)
K+1
max¦(I), 1¦.
La dipendenza continua della soluzione dai coefficienti del sistema `e provata
dall’enunciato che segue.
Teorema 2.2.5 Fissiamo un intervallo J di R e siano A(t) e B(t) due
matrici n n con coefficienti a
ij
, b
ij
∈ C(J, C); siano inoltre f una funzione
appartenente a C(J, C
n
) e x un vettore di C
n
. Allora per ogni t
0
∈ J le
soluzioni u e v dei problemi di Cauchy
_
u
t
(t) −A(t)u(t) = f (t), t ∈ J;
u(t
0
) = x
_
v
t
(t) −B(t)v(t) = f (t), t ∈ J
v(t
0
) = x
verificano, per ciascun sottointervallo chiuso e limitato I ⊆ J, contenente t
0
,
la stima seguente:
|u −v|
C
1
(I,C
n
)
≤ c
t
|A−B|
C(I,/n)
_
[x[
n
+|f |
C(J,C
n
)
¸
,
ove c
t
`e una costante che dipende solo dalle matrici A e B, dall’intervallo I
e dalla dimensione n.
Dimostrazione Basta osservare che u − v `e soluzione del problema di
Cauchy
_
(u −v)
t
(t) −A(t)(u −v)(t) = (A(t) −B(t))v(t), t ∈ J;
(u −v)(t
0
) = 0,
ed applicare il teorema 2.2.4.
Chiudiamo questo paragrafo con un lemma elementare ma assai utile.
109
Lemma 2.2.6 (di Gronwall) Siano u, v funzioni continue in un intervallo
[a, b]. Supponiamo che si abbia u ≥ 0 in [a, b] e
v(x) ≤ c +
_
x
a
v(t)u(t) dt ∀x ∈ [a, b],
ove c `e una costante reale; allora risulta
v(x) ≤ c exp
__
x
a
u(t) dt
_
∀x ∈ [a, b].
Dimostrazione Definiamo
G(x) = c +
_
x
a
v(t)u(t) dt, x ∈ [a, b].
La funzione G verifica G(x) ≥ v(x) in [a, b] per ipotesi, ed inoltre G
t
(x) =
v(x)u(x) in [a, b]; ne segue G
t
(x) ≤ u(x)G(x) in [a, b]. Moltiplicando la
disequazione G
t
(x)−u(x)G(x) ≤ 0 per la funzione positiva exp
_

_
x
a
u(t) dt
_
,
si ottiene
d
dx
_
exp
_

_
x
a
u(t) dt
_
G(x)
_
≤ 0 ∀x ∈ [a, b],
da cui
exp
_

_
x
a
u(t) dt
_
G(x) ≤ G(a) ∀x ∈ [a, b]
e finalmente, essendo G(a) = c,
v(x) ≤ G(x) ≤ c exp
__
x
a
u(t) dt
_
∀x ∈ [a, b].
Osservazione 2.2.7 Il lemma di Gronwall vale anche quando le funzioni
continue u e v verificano u ≥ 0 in [a, b] e
v(x) ≤ c +
_
b
x
v(t)u(t) dt ∀x ∈ [a, b];
in tal caso la conclusione `e
v(x) ≤ c exp
__
b
x
u(t) dt
_
∀x ∈ [a, b].
La dimostrazione si fa ripetendo l’argomentazione precedente, oppure usando
il lemma 2.2.6 con le funzioni v(x) = v(a + b −x) e u(x) = u(a + b −x).
110
Esercizi 2.2
1. Determinare un sistema fondamentale di soluzioni per il sistema
_
u
t
(t) =
1
2t
u(t) −
1
2t
2
v(t)
v
t
(t) = −
1
2
u(t) +
3
2t
v(t).
[Traccia: Cercare due soluzioni linearmente indipendenti
_
u
1
(t)
v
1
(t)
_
e
_
u
2
(t)
v
2
(t)
_
di tipo polinomiale.]
2. Determinare l’insieme delle soluzioni dei sistemi seguenti:
(i)
_
u
t
(t) = u(t) −v(t) + t
v
t
(t) = v(t) −1,
(ii)
_
u
t
(t) = −v(t) + e
−t
v
t
(t) = u(t) + sin t,
(iii)
_
_
_
u
t
(t) = v(t) + 1
v
t
(t) = w(t) −1
w
t
(t) = −6w(t) −e
t
.
(iv)
_
_
_
u
t
(t) = 2u(t) −v(t) + cos t
v
t
(t) = v(t) + w(t) −sin t
w
t
(t) = v(t) −w(t).
[Traccia: si derivi un’equazione trasformando i sistemi in equazioni
differenziali del secondo ordine...]
3. Risolvere i problemi di Cauchy
_
¸
_
¸
_
u
t
(t) = −3u(t) + 2v(t) + 2e
t
v
t
(t) = −5u(t) + 4v(t) −e
3t
u(0) = 0, v(0) = 2,
_
¸
_
¸
_
u
t
(t) =
1
2t
u(t) −
1
2t
2
v(t) + t
2
v
t
(t) = −
1
2
u(t) +
3
2t
v(t) −t
u(1) = −1, v(1) = −2.
4. Scrivere tutte le soluzioni del sistema
_
u
t
(t) = au(t) + bv(t)
v
t
(t) = cu(t) + dv(t),
al variare dei parametri reali a, b, c, d.
5. (Teorema di Liouville) Si provi che il determinante w(t) di una qualsiasi
matrice Wronskiana W(t), relativa ad un sistema della forma u
t
(t) =
A(t)u(t), t ∈ J, soddisfa l’equazione differenziale
w
t
(t) = trA(t) w(t), t ∈ J,
111
ove trA(t) =

n
i=1
a
ii
(t) `e la traccia della matrice A(t) = ¦a
ij
(t)¦.
[Traccia: Si provi anzitutto che se t ∈ J si ha, per ε →0,
W(t + ε) = W(t) + εA(t)W(t) + o(ε).
Se ne deduca, utilizzando il teorema di Binet,
det W(t + ε) = det(I + εA(t)) det W(t) + o(ε).
Adesso, indicati con λ
i
, 1 ≤ i ≤ n, gli autovalori (non necessariamente
distinti) di A(t), si deduca che
det(I + εA(t)) = 1 + ε
n

i=1
λ
i
+ o(ε) = 1 + ε tr(A(t)) + o(ε)
e che, di conseguenza,
det W(t + ε) = (1 + ε tr(A(t)) det W(t) + o(ε).
Di qui si ricavi la tesi. Si noti che si poteva dimostrare questo risultato
anche utilizzando l’esercizio 2.2.12 ed il fatto che le colonne di W(t)
sono soluzioni del sistema omogeneo.]
6. Dimostrare il lemma di Gronwall nel caso di semirette [a, +∞[ oppure
] −∞, b].
7. Sia u ∈ C
1
[a, b] soluzione dell’equazione u
t
(x) = a(x)u(x) in [a, b], ove
a ∈ C[a, b] `e una funzione fissata. Si provi che o la u `e sempre diversa
da 0 in [a, b], oppure u ≡ 0 in [a, b].
8. Sia u ∈ C
1
[a, b] soluzione dell’equazione u
t
(x) = a(x)u(x) + f(x) in
[a, b], ove a, f ∈ C[a, b] sono fissate funzioni a valori reali. Si provi che
o la u `e una funzione a valori reali, oppure u(x) / ∈ R per ogni x ∈ [a, b].
9. Siano u, v due funzioni di classe C
1
in [a, b]. Supponiamo che risulti
u
t
(x) ≤ p(x)u(x) + q(x), v
t
(x) = p(x)v(x) + r(x) ∀x ∈ [a, b],
ove p, q, r sono fissate funzioni continue su [a, b]. Si provi che se u(a) ≤
u(b) e se q ≤ r in [a, b], allora u ≤ v in [a, b].
[Traccia: si adatti la dimostrazione del lemma di Gronwall.]
112
10. Sia u la soluzione massimale del problema di Cauchy
u
t
(x) = f(x, u(x)), u(x
0
) = u
0
,
ove f(x, y) `e una funzione continua su I R, ove I `e un intervallo, e
localmente lipschitziana rispetto alla variabile y uniformemente rispetto
a x. Supponiamo che risulti, per ogni punto x dell’intervallo massimale
di esistenza,
[f(x, u(x))[ ≤ K[u(x)[,
con K costante. Si provi che la soluzione u(x) `e globale, ossia definita
per ogni x ∈ I.
11. Siano u, v due funzioni di classe C
1
in [a, b]. Supponiamo che risulti
u
t
(x) ≥ f(x, u(x)), v
t
(x) = f(x, v(x)) ∀x ∈ [a, b],
ove f `e una funzione di classe C
1
in un aperto A ⊆ R
2
. Si provi che se
u(a) ≥ v(a) allora u ≥ v in [a, b].
[Traccia: Si consideri la funzione g(x) = exp
_

_
x
a
h(t) dt
_
, ove
h(t) =
_
f(t,u(t))−f(t,v(t))
u(t)−v(t)
se u(t) ,= v(t),
∂f
∂y
(t, u(t)) se u(t) = v(t),
e si verifichi che
d
dx
(g(x)[u(x) −v(x)]) ≥ 0 ∀x ∈ [a, b].
Integrando fra a e x si ricavi la tesi.]
12. Sia A(t) = ¦a
ij
(t)¦ una matrice n n di funzioni derivabili in [a, b].
Posto d(t) = det A(t), si provi che d(t) `e derivabile e che d
t
(t) =

n
i=1
d
t
i
(t), ove d
i
(t) = det A
i
(t) e A
i
(t) `e la matrice che si ottiene
da A(t) sostituendo la colonna i-esima (a
1i
(t), . . . , a
ni
(t)) con la co-
lonna delle corrispondenti derivate (a
t
1i
(t), . . . , a
t
ni
(t)). Si provi anche
l’analogo risultato in cui si usano le righe anzich´e le colonne.
113
2.3 Sistemi omogenei a coefficienti costanti
Nel caso di un sistema lineare omogeneo con coefficienti costanti, nel quale
cio`e la matrice A(t) `e indipendente da t, `e possibile costruire esplicitamente
un sistema fondamentale di soluzioni, definite sull’intero asse reale, cercan-
dole di forma esponenziale: l’ovvia motivazione di questa ricerca `e che le
funzioni esponenziali sono le uniche che abbiano le proprie derivate multiple
di se stesse.
A questo scopo, data una matrice A ∈ /
n
, consideriamo la matrice espo-
nenziale e
tA
, definita per ogni t ∈ R in virt` u della definizione 1.7.15.
Proposizione 2.3.1 Sia A ∈ /
n
. Allora:
(i) risulta e
(t+s)A
= e
tA
e
sA
per ogni t, s ∈ R, e in particolare e
0A
= I;
(ii) si ha det e
tA
= e
tr (tA)
,= 0, con [e
tA
]
−1
= e
−tA
;
(iii) esiste la matrice
d
dt
e
tA
, e vale l’identit`a
d
dt
e
tA
= Ae
tA
.
Dimostrazione (i)
`
E facile conseguenza della definizione 1.7.15; si veda
l’esercizio 1.7.12.
(ii) Per la proposizione 1.7.16,
det e
tA
= det lim
p→∞
_
I +
tA
p
_
p
= lim
p→∞
det
_
I +
tA
p
_
p
=
= lim
p→∞
_
det
_
I +
tA
p
__
p
= lim
p→∞
_
1 + tr
_
tA
p
_
+ o
_
1
p
__
p
=
= lim
p→∞
_
1 +
tr (tA)
p
_
p
= e
tr (tA)
.
La formula dell’inversa segue da (i) scegliendo s = −t.
(iii) Tenuto conto degli esercizi 1.7.11 e 1.7.7, la serie che definisce e
tA
`e
derivabile termine a termine: dunque
d
dt
e
tA
=

k=0
d
dt
t
k
A
k
k!
=

k=1
k
t
k−1
A
k
k!
= A

h=0
t
h
A
h
h!
= Ae
tA
.
Dalla proposizione precedente segue subito:
114
Corollario 2.3.2 Sia A ∈ /
n
. La matrice di transizione del sistema omo-
geneo
u
t
(t) = Au(t), t ∈ R,
`e W(t, τ) = e
(t−τ)A
. In particolare, per ogni t ∈ J le colonne di e
tA
formano
un sistema fondamentale di soluzioni, e il problema di Cauchy
_
u
t
(t) = Au(t), t ∈ R
u(τ) = x
ha l’unica soluzione u(t) = e
(t−τ)A
x.
Dimostrazione La i-sima colonna di e
tA
`e il vettore e
tA
e
i
, che `e banal-
mente soluzione del sistema in virt` u della proposizione 2.3.1. Tutte le altre
verifiche seguono allo stesso modo.
Corollario 2.3.3 Sia A ∈ /
n
e sia f una funzione continua su R a valori
in C
n
. L’insieme delle soluzioni del sistema non omogeneo
u
t
(t) = Au(t) +f (t), t ∈ R,
`e dato dalle funzioni della forma
u(t) = e
tA
c +
_
t
0
e
(t−s)A
f (s) ds, c ∈ C
n
,
e il problema di Cauchy
_
u
t
(t) = Au(t) +f (t), t ∈ R
u(τ) = x
ha l’unica soluzione
u(t) = e
(t−τ)A
x +
_
t
τ
e
(t−σ)A
f (σ) dσ.
Dimostrazione
`
E un’immediata conseguenza della formula che fornisce
l’integrale generale di un sistema non omogeneo, e del fatto che nel caso dei
coefficienti costanti la matrice di transizione `e semplicemente e
(t−s)A
.
Si noti che la relazione sopra scritta `e formalmente analoga alla formula
risolutiva dell’equazione scalare del primo ordine u
t
(t) −au(t) = f(t), con a
costante reale, sotto la condizione u(τ) = x.
115
Calcolo di e
tA
Resta ora il problema di calcolare esplicitamente la matrice e
tA
. Questo
problema non `e banale, salvo casi molto particolari; tuttavia vale la pena di
affrontarlo, vista l’importanza teorica della cosa, e ci` o sar`a fatto nel seguito.
Osserviamo per` o fin d’ora che, per fortuna, le soluzioni di un sistema diffe-
renziale lineare omogeneo possono spesso essere determinate con metodi pi` u
immediati e diretti, che analizzeremo pi` u in l`a.
Esempi 2.3.4 (1) Un caso in cui il calcolo di e
tA
`e particolarmente semplice
`e quello in cui A `e una matrice diagonale:
A = diag(λ
1
, . . . , λ
n
).
Allora, essendo A
k
= diag(λ
k
1
, . . . , λ
k
n
) per ogni k ∈ N, dalla definizione di
e
tA
segue immediatamente che
e
tA
= diag(e

1
, . . . , e
tλn
).
Pi` u in generale, se la matrice A `e diagonalizzabile, ossia esiste U ∈ /
n
invertibile tale che U
−1
AU sia diagonale, allora risulta
A = U diag(λ
1
, . . . , λ
n
) U
−1
,
e quindi A
k
= U diag(λ
k
1
, . . . , λ
k
n
) U
−1
per ogni k ∈ N; ne segue
e
tA
= U diag(e

1
, . . . , e
tλn
) U
−1
.
(2) Quando la matrice A `e triangolare superiore, ossia i suoi elementi a
ij
sono nulli per j < i, ed inoltre gli elementi della diagonale principale a
ii
sono
tutti uguali, il calcolo di e
tA
`e ancora semplice. In effetti si pu` o scrivere
A = λI +N, ove λ `e il comune valore degli a
ii
, e
N = ¦n
ij
¦ con n
ij
=
_
a
ij
se j > i
0 se j ≤ i.
La matrice N`e nilpotente, cio`e esiste m ∈ N (in questo caso, per la precisione,
m ≤ n) tale che N
m
= 0: infatti ragionando per induzione `e facile vedere
che N
h
ha nulli tutti i suoi elementi con indici i, j tali che j ≤ i + h − 1,
116
da cui N
n
= 0. Inoltre, ovviamente le matrici λI e N commutano fra loro.
Pertanto e
tA
ha la forma
e
tA
= e
tλI+N
= e
tλI
e
tN
= e

n−1

h=0
t
h
h!
N
h
.
Gli elementi della matrice e
tA
sono quindi, in questo caso, opportune com-
binazioni lineari di prodotti di esponenziali per polinomi di grado minore di
n.
Preliminari algebrici
Prima di addentrarci nel calcolo di e
tA
occorre richiamare alcuni risultati di
algebra lineare.
Sia A una matrice nn a coefficienti complessi: abbiamo visto nel paragrafo
1.7 che ad ogni polinomio q(λ) `e possibile associare la matrice q(A) mediante
la regola
q(λ) =
N

k=0
a
k
λ
k
=⇒ q(A) =
N

k=0
a
k
A
k
.
Indichiamo con p(λ) il polinomio caratteristico di A, cio`e
p(λ) = det(λI −A), λ ∈ C.
Se λ
1
, . . . , λ
k
sono gli autovalori distinti di A, e m
1
, . . . , m
k
le rispettive
molteplicit` a (1 ≤ m
j
≤ n, m
1
+ . . . + m
k
= n), si ha la fattorizzazione
p(λ) =
k

j=1
(λ −λ
j
)
m
j
∀λ ∈ C.
Sia poi m(λ) il polinomio minimo di A, ossia il polinomio che ha grado mi-
nimo fra tutti i polinomi q(λ) monici (cio`e con coefficiente del termine di
grado massimo uguale a 1) e tali che q(A) = 0. Tale polinomio `e univoca-
mente determinato e verifica evidentemente m(A) = 0; esso coincide con il
generatore dell’ideale
I = ¦q polinomio monico tale che q(A) = 0¦ :
in altre parole, I `e formato da tutti e soli i polinomi della forma m q, con q
polinomio monico qualunque. Proviamo il seguente
117
Teorema 2.3.5 (di Cayley-Hamilton) Sia A ∈ /
n
. Il polinomio carat-
teristico p della matrice A verifica p(A) = 0.
Dimostrazione Utilizzeremo un classico risultato dell’algebra lineare, se-
condo il quale ogni matrice a coefficienti complessi `e triangolabile per mezzo
di un opportuna matrice U unitaria (cio`e tale che [ det U[ = 1). Sia dunque
A ∈ /
n
e sia U ∈ /
n
una matrice unitaria tale che U
−1
AU sia triango-
lare superiore. Se rinominiamo gli autovalori distinti λ
1
, . . . , λ
k
di A come
µ
1
, . . . , µ
n
(contando quindi ciascuno di essi un numero di volte pari alla sua
molteplicit` a), la diagonale principale di U
−1
AU sar` a formata da µ
1
, . . . , µ
n
.
In particolare, denotando con V
j
il sottospazio generato dei vettori e
1
, . . . , e
j
,
si ha
(U
−1
AU−µ
1
I)e
1
= 0,
(U
−1
AU−µ
j
I)e
j
∈ V
j−1
, j = 2, . . . , N.
Proviamo la relazione
n

h=1
(U
−1
AU−µ
h
I)v = 0 ∀v ∈ C
n
.
Otterremo ci`o mostrando, per induzione, che per ogni j = 1, . . . , n risulta
j

h=1
(U
−1
AU−µ
h
I)v = 0 ∀v ∈ V
j
.
Per j = 1 la relazione precedente `e stata verificata sopra; supponiamo ora
che per un certo j ∈ ¦2, . . . , n¦ valga
j−1

h=1
(U
−1
AU−µ
h
I)v = 0 ∀v ∈ V
j−1
,
e consideriamo un elemento w ∈ V
j
, che possiamo scrivere nella forma w =
v + c e
j
, con c ∈ C e v ∈ V
j−1
. Allora si ha µ
j
v ∈ V
j−1
ed anche, essendo
U
−1
AU triangolare superiore, U
−1
AUv ∈ V
j−1
; pertanto
(U
−1
AU−µ
j
I)v ∈ V
j−1
e dunque, per ipotesi induttiva,
j

h=1
(U
−1
AU−µ
h
I)w =
j−1

h=1
(U
−1
AU−µ
h
I)(U
−1
AU−µ
j
I)v = 0.
118
D’altronde, per quanto osservato poc’anzi, (U
−1
AU − µ
j
I)e
j
∈ V
j−1
, co-
sicch´e, nuovamente per ipotesi induttiva,
j

h=1
(U
−1
AU−µ
h
I)e
j
=
j−1

h=1
(U
−1
AU−µ
h
I)(U
−1
AU−µ
j
I)e
j
= 0.
Ne segue
j

h=1
(U
−1
AU−µ
h
I)w = 0 ∀w ∈ V
j
e ci`o prova il passo induttivo.
Abbiamo cos`ı provato che
n

h=1
(U
−1
AU−µ
h
I) = 0;
tornando a scrivere µ
1
, . . . , µ
n
nella forma λ
1
, . . . , λ
k
, ci`o significa che
k

s=1
(U
−1
AU−λ
s
I)
ms
= 0
(ove m
s
`e la molteplicit`a di λ
s
), ossia
U
−1
k

s=1
(A−λ
s
I)
ms
U = 0,
e infine
p(A) =
k

s=1
(A−λ
s
I)
ms
= 0,
che `e la tesi.
In particolare, dal teorema di Cayley-Hamilton segue che il polinomio ca-
ratteristico p `e un multiplo del polinomio minimo m, il quale ha dunque la
forma
m(λ) =
k

s=1
(λ −λ
s
)
hs
,
ove gli h
s
sono interi tali che 1 ≤ h
s
≤ m
s
.
`
E facile infatti verificare che
h
s
,= 0: se v `e un autovettore non nullo relativo all’autovalore λ
s
, si vede
immediatamente che A
j
v = λ
j
s
v per ogni j, da cui 0 = m(A)v = m(λ
s
)v;
dato che v ,= 0, il numero m(λ
s
) deve essere nullo, e pertanto h
s
≥ 1.
119
Esempi 2.3.6 (1) Sia n = 2 e A = I =
_
1 0
0 1
_
. Allora p(λ) = (λ −1)
2
e
m(λ) = λ −1, in quanto m(A) = A−I = 0.
(2) Sia n = 2 e A =
_
2 0
0 3
_
. Allora necessariamente p(λ) = m(λ) =
(λ −2)(λ −3).
(3) Sia n = 3 e A =
_
_
3 0 1
3 1 2
−2 0 0
_
_
. Allora p(λ) = (λ − 1)
2
(λ − 2), ed
essendo (A−I) (A−2I) =
_
_
0 0 0
−1 0 −1
0 0 0
_
_
,= 0, deve essere m(λ) = p(λ).
Dimostriamo ora la seguente
Proposizione 2.3.7 Siano q
1
, . . . , q
m
polinomi relativamente primi; detto Q
il loro minimo comune multiplo, si ha
ker Q(A) =
m

i=1
ker q
i
(A) ∀A ∈ /
n
.
Dimostrazione Fissata A ∈ /
n
, ragioniamo per induzione su m. Sia m =
2, e mostriamo anzitutto che i nuclei di q
1
(A) e q
2
(A) hanno intersezione
banale. Sia v ∈ C
n
tale che q
1
(A)v = q
2
(A)v = 0; scelti due polinomi r
1
e r
2
tali che r
1
(λ)q
1
(λ) + r
2
(λ)q
2
(λ) ≡ 1 (essi esistono perch´e q
1
e q
2
sono
relativamente primi), si deduce
v = r
1
(A)q
1
(A)v +r
2
(A)q
2
(A)v = 0.
Ci` o prova che ker q
1
(A)∩ker q
2
(A) = ¦0¦. Adesso mostriamo che ker Q(A) =
ker q
1
(A) ⊕ker q
2
(A).
Se v ∈ ker q
1
(A)⊕ker q
2
(A), sar`a v = v
1
+v
2
, con q
1
(A)v
1
= q
2
(A)v
2
= 0;
ne segue, essendo Q multiplo sia di q
1
che di q
2
, Q(A)v
1
= Q(A)v
2
= 0,
da cui v ∈ ker Q(A). Viceversa, sia v ∈ ker Q(A): allora dalla relazione
r
1
q
1
+ r
2
q
2
≡ 1 segue
0 = Q(A)v = Q(A)r
1
(A)q
1
(A)v +Q(A)r
2
(A)q
2
(A)v.
Poniamo v
1
= r
2
(A)q
2
(A)v e v
2
= r
1
(A)q
1
(A)v; allora si ha v = v
1
+
v
2
. Inoltre, dato che Q `e il minimo comune multiplo fra q
1
e q
2
, esiste un
120
polinomio non nullo R tale che R Q = q
1
q
2
, cosicch´e
q
1
(A)v
1
= q
1
(A)r
2
(A)q
2
(A)v = r
2
(A)R(A)Q(A)v = r
2
(A)R(A)0 = 0
e similmente q
2
(A)v
2
= 0. Ci`o prova che v ∈ ker q
1
(A) ⊕ker q
2
(A).
Supponiamo ora che la tesi valga per un certo intero m, e consideriamo m+1
polinomi q
1
, . . . q
m+1
relativamente primi fra loro. Poniamo
Q = m.c.m.¦q
1
, . . . , q
m
¦, P = m.c.m.¦q
m+1
, Q¦
e osserviamo che i due polinomi Q e q
m+1
sono relativamente primi: quindi,
come abbiamo visto, l’intersezione fra i loro nuclei `e ¦0¦. Utilizzando il caso
m = 2 gi` a dimostrato, nonch´e l’ipotesi induttiva, otteniamo
ker P(A) = ker Q(A) ⊕ker q
m+1
(A) =
=
_
m

h=1
ker q
h
(A)
_
⊕ker q
m+1
(A) =
m+1

h=1
ker q
h
(A).
Corollario 2.3.8 Sia A ∈ /
n
e siano λ
1
, . . . , λ
k
i suoi autovalori distinti.
Se P `e un polinomio tale che
P(A) = 0, P(λ) =
k

j=1
(λ −λ
j
)
r
j
,
allora si ha
k

j=1
ker(A−λ
j
I)
r
j
= C
n
.
Dimostrazione La tesi `e conseguenza immediata della proposizione 2.3.7,
osservando che ker P(A) = C
n
e
P(λ) = m.c.m.¦(λ −λ
1
)
r
1
, . . . , (λ −λ
k
)
r
k
¦.
Corollario 2.3.9 Sia A ∈ /
n
e sia m(λ) =

k
j=1
(λ − λ
j
)
h
j
il polinomio
minimo di A. Allora:
(i)

k
j=1
ker(A−λ
j
I)
h
j
= C
n
;
(ii) ker(A−λ
j
I)
p
= ker(A−λ
j
I)
h
j
per ogni p ≥ h
j
e per ogni j = 1, . . . , k.
121
(iii) ker(A−λ
j
I)
p
⊂ ker(A−λ
j
I)
p+1
per ogni p < h
j
e per ogni j = 1, . . . , k.
Dimostrazione (i) Segue dal corollario 2.3.8, essendo m(A) = 0 per defi-
nizione di polinomio minimo.
(ii) Fissato j, supponiamo che sia dimker(A− λ
j
I)
p
> dimker(A− λ
j
I)
h
j
per un certo intero p > h
j
: poich´e il polinomio q(λ) = m(λ)(λ − λ
j
)
p−h
j
verifica q(A) = 0, dal corollario 2.3.8 seguirebbe che
C
n
=
_

i,=j
ker(A−λ
i
I)
h
i
_
⊕ker(A−λ
j
I)
p
,
il che `e assurdo, dato che il membro destro di questa uguaglianza ha dimen-
sione maggiore di n.
(iii) Sia, per assurdo, ker(A− λ
j
I)
p
= ker(A− λ
j
I)
p+1
per un certo intero
positivo p < h
j
.
`
E immediato riconoscere allora che
ker(A−λ
j
I)
p
= ker(A−λ
j
I)
p+1
= . . . = ker(A−λ
j
I)
h
j
;
ma allora per il corollario 2.3.8 il polinomio q(λ) =
m(λ)
(λ−λ
j
)
h
j
−p
verificherebbe
ker q(A) =
_

i,=j
ker(A−λ
i
I)
h
i
_
⊕ker(A−λ
j
I)
p
=
k

j=1
ker(A−λ
j
I)
h
j
= C
n
,
da cui q(A) = 0: ci` o `e assurdo, perch´e il grado di q `e minore del grado di
m.
Osservazione 2.3.10 Vi `e un metodo abbastanza semplice, bench´e un po’
laborioso, per calcolare esplicitamente il polinomio minimo di una matrice
A ∈ /
n
. Si calcolano, per ciascun j = 1, ..., n, i vettori
e
j
, Ae
j
, A
2
e
j
, . . . , A
d
j
e
j
,
fino al minimo intero d
j
tale che questi vettori risultino linearmente dipen-
denti. Si avr` a allora
α
0
e
j
+ α
1
Ae
j
+ . . . + α
d
j
−1
A
d
j
−1
e
j
+A
d
j
e
j
= 0
per opportuni coefficienti α
0
, . . . , α
d
j
−1
∈ C. Posto
p
j
(λ) = α
0
+ α
1
λ + . . . α
d
j
−1
λ
d
j
−1
+ λ
d
j
, j = 1, . . . , n,
122
il polinomio minimo di A `e dato da
m = m.c.m.¦p
1
, . . . , p
n
¦.
Giustifichiamo questa affermazione. Consideriamo l’ideale
I
j
= ¦q polinomio monico tale che q(A)e
j
= 0¦ :
se q ∈ I
j
`e un polinomio di grado k, allora i vettori e
j
, Ae
j
, . . . , A
k
e
j
sono
linearmente dipendenti, cosicch´e deve essere k ≥ d
j
. Ne segue che p
j
`e il
polinomio di I
j
che ha grado minimo, ossia p
j
`e un generatore di I
j
. Dato
che
n
_
j=1
I
j
= I = ¦q polinomio monico tale che q(A) = 0¦,
`e immediato vedere che ogni elemento di I `e multiplo di ciascuno dei p
j
,
e quindi anche del loro minimo comune multiplo. D’altronde, `e chiaro che
m.c.m.¦p
1
, . . . , p
n
¦ ∈ I, e dunque esso coincide col polinomio minimo m.
Esempi 2.3.11 (1) Consideriamo la matrice A =
_
1 0
−3 6
_
. Si ha
p(λ) = det(λI −A) = (λ −6)(λ −1),
e poich´e p ha due radici semplici, deve essere necessariamente m(λ) = p(λ).
(2) Sia A =
_
_
2 2 1
1 3 1
1 2 2
_
_
. Si verifica facilmente che A
2
=
_
_
7 12 6
6 13 6
6 12 7
_
_
.
Inoltre
e
1
=
_
_
1
0
0
_
_
, Ae
1
=
_
_
2
1
1
_
_
, A
2
e
1
=
_
_
7
6
6
_
_
;
dunque A
2
e
1
−6Ae
1
+ 5e
1
= 0, da cui p
1
(λ) = λ
2
−6λ + 5. Similmente
e
2
=
_
_
0
1
0
_
_
, Ae
2
=
_
_
2
3
2
_
_
, A
2
e
2
=
_
_
12
13
12
_
_
,
123
da cui, ancora, A
2
e
2
− 6Ae
2
+ 5e
2
= 0 e p
2
(λ) = λ
2
− 6λ + 5 = p
1
(λ).
Analogamente
e
3
=
_
_
0
0
1
_
_
, Ae
3
=
_
_
1
1
2
_
_
, A
2
e
3
=
_
_
6
6
7
_
_
,
e nuovamente A
2
e
3
− 6Ae
3
+ 5e
3
= 0 e p
3
(λ) = λ
2
− 6λ + 5 = p
1
(λ). In
definitiva
m(λ) = λ
2
−6λ + 5 = (λ −1)(λ −5),
mentre con facile calcolo si vede che
p(λ) = det(λI −A) = (λ −1)
2
(λ −5).
(3) Poniamo A =
_
_
i 0 1
0 i −1
1 1 −i
_
_
. Risulta, con qualche calcolo,
A
2
=
_
_
0 1 0
−1 −2 0
0 0 −1
_
_
, A
3
=
_
_
0 i −1
−i −2i 1
−1 −1 i
_
_
.
Inoltre
e
1
=
_
_
1
0
0
_
_
, Ae
1
=
_
_
i
0
1
_
_
, A
2
e
1
=
_
_
0
−1
0
_
_
, A
3
e
1
=
_
_
0
−i
−1
_
_
;
da qui si deduce con poca fatica A
3
e
1
+ iA
2
e
1
+ Ae
1
− ie
1
= 0, da cui
p
1
(λ) = λ
3
+ iλ
2
+ λ − i. Dato che questo polinomio ha grado pari alla
dimensione della matrice, si pu` o tralasciare il calcolo di p
2
e p
3
e concludere
che il polinomio minimo coincide con p
1
ed anche col polinomio caratteristico:
m(λ) = p(λ) = λ
3
+ iλ
2
+ λ −i.
Vi `e un semplice criterio per stabilire quando una matrice A `e diagonalizza-
bile:
Proposizione 2.3.12 Sia A ∈ /
n
, con autovalori distinti λ
1
, . . . , λ
k
. Al-
lora A `e diagonalizzabile se e solo se il polinomio minimo di A ha tutte radici
semplici.
124
Dimostrazione Supponiamo che
m(λ) =
k

j=1
(λ −λ
j
).
Allora, per il corollario 2.3.9(i),
k

j=1
ker(A−λ
j
I) = C
n
.
Sia m
j
la dimensione di ker(A−λ
j
I). Allora possiamo costruire una base di
C
n
della forma
¦v
(1)
1
, . . . , v
(1)
m
1
, v
(2)
1
, . . . , v
(2)
m
2
, . . . , v
(k)
1
, . . . , v
(k)
m
k
¦,
ove, per ogni j, ¦v
(j)
1
, . . . , v
(j)
m
j
¦ `e una base di ker(A−λ
j
I). Ridenominiamo
questa base come
¦w
1
, . . . , w
n
¦
e consideriamo la matrice U che ha come colonne i vettori w
i
: allora, indicato
con λ
r
i
l’autovalore di cui w
i
`e autovettore, si ha
AUe
i
= Aw
i
= λ
r
i
w
i
, i = 1, . . . , n,
da cui
U
−1
AUe
i
= λ
r
i
U
−1
w
i
= λ
r
i
e
i
, i = 1, . . . , n,
cosicch´e U
−1
AU `e diagonale.
Viceversa, supponiamo che A sia diagonalizzabile e prendiamo U tale che
U
−1
AU sia diagonale. A meno di permutazioni di indici (il che corrisponde
a considerare UV al posto di U, con V opportuna matrice unitaria) possiamo
supporre che
U
−1
AU = diag(λ
1
, . . . , λ
1
, λ
2
, . . . , λ
2
, . . . , λ
k
, . . . , λ
k
).
Per j = 1, . . . , k indichiamo con m
j
il numero di righe che contengono
l’elemento λ
j
(in particolare,

k
j=1
m
j
= n), e per i = 1, . . . , n poniamo
w
i
= Ue
i
. Allora ¦w
1
, . . . , w
n
¦ `e una base di C
n
; inoltre, essendo
λ
1
e
i
= U
−1
AUe
i
, i = 1, . . . , m
1
,
λ
2
e
i
= U
−1
AUe
i
, i = m
1
+ 1, . . . , m
1
+ m
2
,
.
.
.
.
.
.
λ
k
e
i
= U
−1
AUe
i
, i =
_

k−1
h=1
m
h
_
+ 1, . . . , n,
125
si deduce, per 1 ≤ j ≤ k e
_

j−1
h=1
m
h
_
+ 1 ≤ i ≤

j
h=1
m
h
,
λ
j
w
i
= λ
j
Ue
i
= AUe
i
= Aw
i
,
ossia
w
i
∈ ker(A−λ
j
I), i =
j−1

h=1
m
h
+ 1, . . . ,
j

h=1
m
h
, j = 1, . . . , k.
Ci` o prova che
C
n
=
k

j=1
ker(A−λ
j
I),
e da qui un facile ragionamento per assurdo, che utilizza il corollario 2.3.9,
mostra che
m(λ) =
k

j=1
(λ −λ
j
).
Calcolo esplicito di e
tA
A questo punto abbiamo acquisito tutte le premesse necessarie per il calcolo
esplicito della matrice e
tA
.
Sia dunque A ∈ /
n
, e supponiamo che essa abbia k autovalori distinti
λ
1
, . . . .λ
k
, con le rispettive molteplicit`a m
1
, . . . , m
k
tali che

k
j=1
m
j
= n.
Supporremo di conoscere tali autovalori, trascurando il fatto che in pratica
non sempre `e possibile calcolarli esattamente.
Se A `e diagonale, allora e
tA
`e stata gi` a costruita nell’esempio 2.3.4. Se
non siamo in questo caso, allora conviene determinare (utilizzando l’osser-
vazione 2.3.10 o anche, nei casi semplici, metodi pi` u diretti) il polinomio
minimo m, esaminando il quale si pu`o innanzitutto dedurre, grazie alla pro-
posizione 2.3.12, se A `e diagonalizzabile o no. In caso affermativo, si pu` o
trovare una base di C
n
fatta di autovettori, la quale `e calcolabile con poca
fatica; allora la matrice U, le cui colonne sono tali autovettori, fornisce il
cambiamento di base che diagonalizza A, e il calcolo di e
tA
si effettua come
mostrato nell’esempio 2.3.4(1). In caso contrario, se A `e triangolare supe-
riore la matrice e
tA
pu` o essere calcolata direttamente seguendo la procedura
dell’esempio 2.3.4(2); altrimenti, anzich´e ricercare la matrice U del cambia-
mento di base che triangolarizza A (impresa solitamente alquanto laboriosa),
126
si pu`o procedere come segue. Sappiamo che risulta
k

j=1
ker(A−λ
j
I)
h
j
= C
n
ove gli h
j
sono gli esponenti nella fattorizzazione del polinomio minimo. Ci` o
significa che ogni u ∈ C
n
si pu`o scrivere in modo unico nella forma
u = P
1
u + . . . P
k
u,
ove P
j
u `e la proiezione di u sul sottospazio S
j
= ker(A−λ
j
I)
h
j
. Le proiezioni
P
j
: C
n
→ C
n
sono applicazioni lineari dotate, in virt` u dell’unicit`a della
decomposizione, delle propriet`a seguenti:
P
2
j
= P
j
, P
j
P
i
= 0 per j ,= i,
k

j=1
P
j
= I, P
j
u = u ∀u ∈ S
j
.
Inoltre esse commutano con A: infatti i sottospazi S
j
sono invarianti per A,
ossia Av ∈ S
j
se v ∈ S
j
, da cui
P
j
Au = P
j
A(P
1
u + . . . P
k
u) = P
j
AP
j
u = AP
j
u ∀u ∈ C
n
.
Di conseguenza la matrice A pu` o essere decomposta nella forma A = K+P,
ove
P =
k

j=1
λ
j
P
j
, K =
k

j=1
(A−λ
j
I)P
j
.
Le matrici K e P ovviamente commutano, e inoltre K`e nilpotente, in quanto,
scelto r = max¦h
1
, . . . , h
k
¦, si ha per ogni u ∈ C
n
K
r
u =
_
k

j=1
(A−λ
j
I)P
j
_
r
u =
k

j=1
(A−λ
j
I)
r
P
j
u =
=
k

j=1
(A−λ
j
I)
r−h
j
(A−λ
j
I)
h
j
P
j
u =
k

j=1
(A−λ
j
I)
r−h
j
0 = 0.
Conviene allora determinare una base ¦v
1
, . . . , v
n
¦ di “autovettori generaliz-
zati”, ossia di elementi dei sottospazi S
j
, j = 1, . . . , k: precisamente,
v
1
, . . . , v
m
1
∈ S
1
, v
m
1
+1
, . . . , v
m
1
+m
2
∈ S
2
, . . . , v
m
1
+...+m
k−1
+1
, . . . , v
n
∈ S
k
.
127
Il calcolo di tale base `e un esercizio di routine. Sia ora U la matrice che ha
per colonne gli autovettori generalizzati v
1
, . . . , v
n
. Col passaggio a questa
base, la matrice trasformata di P `e
D = U
−1
PU = diag(λ
1
, . . . , λ
1
, λ
2
, . . . , λ
2
, . . . , λ
k
, . . . , λ
k
),
ove ciascuno dei λ
j
compare esattamente m
j
volte: infatti, scelto x = e
i
,
risulta Ue
i
= v
i
; supposto che tale vettore sia un generatore di S
j
, si ha
Pv
i
= λ
j
v
i
, da cui De
i
= U
−1
λ
j
v
i
= λ
j
e
i
. Invece la matrice trasformata di
K `e
N = U
−1
KU;
essa commuta con D ed `e ancora una matrice nilpotente, poich´e
N
r
= (U
−1
KU)
r
= U
−1
K
r
U = 0.
Da tutti questi fatti segue che
e
tA
= Ue
tN
e
tD
U
−1
=
= U diag(e

1
, . . . , e

1
, . . . , e

k
, . . . , e

k
)
k

h=0
t
h
h!
N
h
U
−1
.
Esempi 2.3.13 (1) Sia n = 3 e consideriamo
A =
_
_
−1 3 0
0 2 0
2 1 −1
_
_
.
Si verifica subito che p(λ) = (λ + 1)
2
(λ −2) , ed essendo
(A+I)(A−2I) =
_
_
0 0 0
0 0 0
−6 6 0
_
_
,= 0,
deve essere m(λ) = p(λ). Cerchiamo gli autovettori generalizzati. Per
l’autovalore λ
1
= 2 si ha h
1
= 1 e
(A−2I)v = 0 ⇐⇒
_
_
−3 3 0
0 0 0
2 1 −3
_
_
_
_
x
y
z
_
_
=
_
_
0
0
0
_
_
⇐⇒ x = y = z,
128
da cui segue che ker(A − 2I) `e generato dal vettore v
1
= (1, 1, 1). Per
l’autovalore λ
2
= −1 si ha h
2
= 2 e
(A+I)
2
v = 0 ⇐⇒
_
_
0 9 0
0 9 0
0 9 0
_
_
_
_
x
y
z
_
_
=
_
_
0
0
0
_
_
⇐⇒ y = 0,
cosicch´e ker(A + I)
2
`e generato dai vettori ortogonali v
2
= (1, 0, 0) e v
3
=
(0, 0, 1). Dopo calcoli di routine si trova
U =
_
_
1 1 0
1 0 0
1 0 1
_
_
, U
−1
=
_
_
0 1 0
1 −1 0
0 −1 1
_
_
, D =
_
_
2 0 0
0 −1 0
0 0 −1
_
_
,
N = U
−1
AU−D =
_
_
0 0 0
0 0 0
0 2 0
_
_
, N
2
= 0.
Dunque
e
tD
=
_
_
e
2t
0 0
0 e
t
0
0 0 e
t
_
_
, e
tN
= I + tN =
_
_
1 0 0
0 1 0
0 2t 1
_
_
,
ed infine
e
tA
= Ue
tD
e
tN
U
−1
=
_
_
e
−t
e
2t
−e
−t
0
0 e
2t
0
2te
−t
e
2t
−(2t + 1)e
−t
e
−t
_
_
.
Pertanto il problema di Cauchy
_
¸
¸
_
¸
¸
_
x
t
= −x + 3y
y
t
= 2y
z
t
= 2x + y −z
x(0) = 1, y(0) = 2, z(0) = −1
ha l’unica soluzione
_
_
x(t)
y(t)
z(t)
_
_
= e
tA
_
_
1
2
−1
_
_
=
_
_
2e
2t
−e
−t
2e
2t
2e
2t
−(2t + 3)e
−t
_
_
.
129
(2) Sia n = 2 e poniamo A =
_
1 1
−1 1
_
; si ha p(λ) = (λ−1−i)(λ−1+i) =
m(λ) e gli autovettori sono ad esempio v
1
= (1, i) (relativo a λ
1
= 1 + i),
v
2
= (1, −i) (relativo a λ
2
= 1 −i). Allora
U =
_
1 1
i −1
_
, U
−1
=
1
2
_
1 −i
1 i
_
, D =
_
1 + i 0
0 −1 −i
_
, N = 0,
cosicch´e
e
tA
= Ue
tD
U
−1
=
_
1 1
i −i
__
e
(1+i)t
0
0 e
(1−i)t
_

1
2
_
1 −i
1 i
_
=
=
1
2
_
e
(1+i)t
+ e
(1−i)t
−ie
(1+i)t
+ ie
(1−i)t
ie
(1+i)t
−ie
(1−i)t
e
(1+i)t
+ e
(1−i)t
_
=
_
e
t
cos t e
t
sin t
−e
t
sin t e
t
cos t
_
.
L’integrale generale del sistema u
t
(t) = Au(t) `e pertanto dato dalle funzioni
u(t) =
_
e
t
cos t e
t
sin t
−e
t
sin t e
t
cos t
__
c
1
c
2
_
, c
1
, c
2
∈ C
n
;
in particolare la soluzione del problema di Cauchy
_
_
_
x
t
= x + y
y
t
= −x + y
x(0) = 0, y(0) = −1
`e la funzione u(t) = (−e
t
sin t, −e
t
cos t).
Metodo pratico
Il calcolo di e
tA
, come si `e visto, `e alquanto laborioso, anche se non difficile.
Talvolta, per determinare l’integrale generale del sistema omogeneo u
t
(t) =
Au(t), pu`o essere preferibile seguire un’altra strada.
Sia A ∈ /
n
una matrice qualunque: tre casi sono possibili.
Caso 1 La matrice A ha autovalori λ
1
, . . . , λ
n
tutti semplici.
Si cercano soluzioni del tipo u(t) = ve
λt
, con λ ∈ C e v ∈ C
n
, e si trova
che deve essere λv = Av, cio`e λ deve essere un autovalore di A e v un
corrispondente autovettore. Si ottengono allora le n soluzioni linearmente
indipendenti
u
1
(t) = v
1
e
λ
1
t
, . . . , u
n
(t) = v
n
e
λnt
130
(in accordo col fatto che A `e diagonalizzabile), in generale complesse. Per` o,
nel caso in cui A `e una matrice reale, tenuto conto che gli autovalori non
reali compaiono a coppie coniugate ed i rispettivi autovettori sono l’uno il
coniugato dell’altro, si possono sempre trovare, modificando le u
i
per somme
e differenze, n soluzioni linearmente indipendenti reali. Infatti, supponiamo
che fra le soluzioni scritte sopra compaia la coppia
u
1
(t) = ve
λt
, u
2
(t) = ve
λt
,
e scriviamo v = x + iy, λ = α + iβ con x, y ∈ R
n
e α, β ∈ R: allora `e facile
riconoscere che
1
2
[u
1
(t) +u
2
(t)] = e
αt
[xcos βt −y sin βt]
1
2i
[u
1
(t) −u
2
(t)] = e
αt
[y cos βt +xsin βt]
e quindi possiamo sostituire la coppia u
1
(t), u
2
(t) con la coppia di soluzioni
reali
1
2
[u
1
(t) +u
2
(t)],
1
2i
[u
1
(t) −u
2
(t)].
Esempio 2.3.14 Sia n = 3 e poniamo A =
_
_
2 1 0
1 3 −1
−1 2 3
_
_
: gli autovalori
sono λ
1
= 2, λ
2
= 3+i, λ
3
= 3−i; come autovettori corrispondenti possiamo
scegliere v
1
= (1, 0, 1), v
2
= (1, 1 +i, 2 −i), v
3
= (1, 1 −i, 2 +i). Quindi tre
soluzioni linearmente indipendenti (complesse) sono
u
1
(t) = v
1
e
2t
, u
2
(t) = v
2
e
(3+i)t
, u
3
(t) = v
3
e
(3−i)t
,
e tre soluzioni linearmente indipendenti (reali) sono
w
1
(t) = e
2t
_
_
1
0
1
_
_
, w
2
(t) = e
3t
_
_
cos t
cos t −sin t
2 cos t + sin t
_
_
, w
3
(t) = e
3t
_
_
sin t
cos t + sin t
−cos t + 2 sin t
_
_
.
L’integrale generale del sistema sar` a dato dalle funzioni
u(t) = c
1
w
1
(t) + c
2
w
2
(t) + c
3
w
3
(t) =
=
_
_
_
c
1
e
2t
+ e
3t
(c
2
cos t + c
3
sin t)
e
3t
[(c
2
+ c
3
) cos t −(c
2
−c
3
) sin t]
c
1
e
2t
+ e
3t
[(2c
2
−c
3
) cos t + (c
2
+ 2c
3
) sin t]
_
_
_
, c
1
, c
2
, c
3
∈ C.
131
Caso 2 La matrice A ha (almeno) un autovalore λ
0
di molteplicit` a r > 1
uguale alla dimensione di ker(A−λ
0
I).
In questo caso il monomio (λ−λ
0
) compare con esponente 1 nella fattorizza-
zione del polinomio minimo m(λ). Si trovano allora r soluzioni linearmente
indipendenti, relative all’autovalore λ
0
, della forma
u
1
(t) = v
1
e
λ
0
t
, . . . , v
r
e
λ
0
t
,
ove ¦v
1
, . . . v
r
¦ `e una base di ker(A−λ
0
I).
Esempio 2.3.15 Sia n = 3 e poniamo A =
_
_
0 1 1
1 0 1
1 1 0
_
_
: gli autovalori
sono λ
1
= 2 e λ
0
= −1 (doppio); gli autovettori corrispondenti sono, ad
esempio, v
1
= (1, 1, 1) per λ
1
e v
2
= (1, 0, −1), v
3
= (0, 1, −1) per λ
0
. Tre
soluzioni linearmente indipendenti del sistema u
t
(t) = Au(t) sono allora
u
1
(t) = v
1
e
2t
, u
2
(t) = v
2
e
−2t
, u
3
(t) = v
3
e
−2t
,
e l’integrale generale `e dato dalle funzioni
u(t) = c
1
u
1
(t)+c
2
u
2
(t)+c
3
u
3
(t) =
_
_
c
1
e
2t
+ c
2
e
−t
c
1
e
2t
−c
3
e
−t
c
1
e
2t
−(c
2
+ c
3
)e
−t
_
_
, c
1
, c
2
, c
3
∈ C.
Caso 3 La matrice A ha (almeno) un autovalore λ
0
di molteplicit` a r > 1
maggiore della dimensione m di ker(A−λ
0
I).
In questo caso il monomio (λ − λ
0
) compare con esponente maggiore di 1
nella fattorizzazione del polinomio minimo m(λ). Gli autovettori linearmente
indipendenti v
1
, . . . , v
m
relativi a λ
0
sono solo m, meno degli r necessari
per costruire una base di ker(A − λ
0
I). Allora accanto alle m soluzioni
linearmente indipendenti
u
1
(t) = v
1
e
λ
0
t
, . . . , v
m
e
λ
0
t
,
bisogna trovarne altre r −m, che si cercano della forma
p
1
(t)e
λ
0
t
, . . . p
r−m
(t)e
λ
0
t
,
ove i p
j
(t) sono vettori linearmente indipendenti le cui componenti sono
polinomi di grado non superiore a j (1 ≤ j ≤ r −m).
132
Esempio 2.3.16 Sia n = 3 e poniamo A =
_
_
0 1 0
0 0 1
−2 3 0
_
_
: gli autovalori
sono λ
1
= −2 e λ
2
= 1 (doppio); un autovettore relativo a λ
1
`e v
1
=
(1, −2, 4), mentre lo spazio ker(A− λ
2
I) ha dimensione 1 ed `e generato ad
esempio da v
2
= (1, 1, 1). Tre soluzioni linearmente indipendenti sono
u
1
(t) = v
1
e
−2t
, u
2
(t) = v
2
e
t
, u
3
(t) = p(t)e
t
,
dove p(t) `e un vettore-polinomio di grado non superiore a 1, quindi della
forma p(t) = (a+bt, a
t
+b
t
t, a
tt
+b
tt
t). Sostituendo nel sistema u
t
(t) = Au(t)
si trova p(t) = (a + bt, a + b + bt, a + 2b + bt), e si pu` o scegliere ad esempio
a = 0, b = 1. Quindi l’integrale generale del sistema `e dato dalle funzioni
u(t) = c
1
e
−2t
_
_
1
−2
4
_
_
+ c
2
e
t
_
_
1
1
1
_
_
+ c
3
e
t
_
_
t
1 + t
2 + t
_
_
=
=
_
_
_
c
1
e
−2t
+ e
t
(c
2
+ c
3
t)
−2c
1
e
−2t
+ e
t
[c
2
+ c
3
(1 + t)]
4c
1
e
−2t
+ e
t
[c
2
+ c
3
(2 + t)]
_
_
_
.
Esercizi 2.3
1. (Sistemi differenziali di Eulero) Si consideri il sistema
u
t
(t) =
1
t
Au(t), t > 0,
ove A `e una fissata matrice nn. Si provi che l’insieme delle soluzioni
`e dato da
u(t) = e
(ln t)A
c, t > 0,
al variare di c in C
n
.
[Traccia: porre t = e
s
e z(s) = u(e
s
).]
2. Sia λ un autovalore di molteplicit` a m per una matrice A; supponiamo
che dimker(A−λI) = 1. Si provi che si possono trovare altri m autovet-
tori generalizzati linearmente indipendenti risolvendo successivamente
i sistemi Av
1
= 0, Av
2
= v
1
, . . . , Av
m
= v
m−1
.
133
3. Determinare un sistema fondamentale di soluzioni per il sistema
_
¸
_
¸
_
u
t
(t) = −v(t) + w(t)
v
t
(t) = −2u(t) −v(t) −6w(t)
w
t
(t) = −v(t) + w(t).
4. Determinare l’esponenziale delle matrici seguenti:
_
0 −1
0 0
_
,
_
0 1
−1 0
_
,
_
3 2
0 −2
_
,
_
1 −1
5 −3
_
,
_
_
0 1 0
0 0 1
0 0 1
_
_
,
_
_
2 1 0
1 4 1
0 1 2
_
_
,
_
_
2 −1 0
−1 2 −1
0 −1 2
_
_
,
_
_
_
_
0 0 −1 0
0 1 0 0
−1 0 0 0
0 0 0 1
_
_
_
_
,
_
_
_
_
0 −1 0 0
0 0 −1 0
−1 0 0 0
0 0 0 1
_
_
_
_
,
_
_
_
_
1 2 0 0
0 1 2 0
0 0 1 2
0 0 0 1
_
_
_
_
.
5. Determinare l’integrale generale del sistema u
t
(t) = Au(t), quando la
matrice A `e una delle seguenti:
_
0 −2
0 5
_
,
_
−1 1
−1 −1
_
,
_
1 3
3 −1
_
,
_
1
1
4
1 −
1
2
_
,
_
_
0 0 0
1 0 0
0 1 0
_
_
,
_
_
0 −1 0
0 0 −1
−6 11 −6
_
_
,
_
_
_
1 0
4
3
2 2 0
0 −3 4
_
_
_
,
_
_
_
_
1 −1 0 0
1 1 0 0
0 0 1 1
0 0 −1 −1
_
_
_
_
,
_
_
_
_
0 −1 0 0
1 0 0 0
0 0 0 −1
0 0 1 0
_
_
_
_
,
_
_
_
_
0 1 2 3
1 4 5 6
2 5 7 8
3 6 8 9
_
_
_
_
.
6. Determinare l’integrale generale dei seguenti sistemi:
_
u
t
(t) = 3u(t) + v(t) + sin t
v
t
(t) = v(t) −u(t) + e
2t
,
_
u
t
(t) = −4u(t) −2v(t) +
2
e
t
−1
v
t
(t) = 6u(t) + 3v(t) −
3
e
t
−1
,
134
_
u
t
(t) = iu(t) −v(t)
v
t
(t) = u(t) + iv(t) + e
it
,
_
¸
¸
_
¸
¸
_
u
t
(t) = v(t)
v
t
(t) = 2u(t) −3w(t)
w
t
(t) = z(t)
z
t
(t) = u(t) −2w(t).
7. Risolvere il sistema
_
u
tt
(t) + 5u
t
(t) + 2v
t
(t) + v(t) = 0
3u
tt
(t) + 5u(t) + v
t
(t) + 3v(t) = 0.
[Traccia Posto w(t) = u
t
(t), si trasformi il sistema in uno di tre
equazioni del primo ordine...]
8. Provare che tutte le soluzioni del sistema u
t
(t) = Au(t) verificano
lim
t→+∞
[u(t)[
n
= 0 se e solo se ciascun autovalore di A ha parte rea-
le negativa, e che in tal caso il decadimento per t → +∞ `e di tipo
esponenziale.
2.4 Equazioni lineari di ordine n
Un’equazione differenziale lineare di ordine n ha la forma
u
(n)
(t) =
n−1

k=0
a
k
(t)u
(k)
(t) + f(t), t ∈ J,
ove J `e un intervallo di R, e a
0
, a
1
, . . . , a
n−1
, f sono funzioni continue su J
a valori reali o complessi. Naturalmente, u
(0)
(t) significa u(t).
`
E facile riconoscere che se una funzione u ∈ C
n
(J, C) risolve questa equazione,
allora la funzione vettoriale
v(t) = (v
1
(t), . . . , v
n
(t)), con v
k
(t) = u
(k−1)
(t), k = 1, . . . , n,
appartiene a C
1
(J, C
n
) e risolve il sistema
v
t
(t) = A(t)v(t) +F(t), t ∈ J
ove
A(t) =
_
_
_
_
_
_
_
0 1 0 . . . 0
0 0 1 . . . 0
.
.
.
.
.
.
.
.
. . . .
.
.
.
0 0 0 . . . 1
a
0
(t) a
1
(t) a
2
(t) . . . a
n−1
(t)
_
_
_
_
_
_
_
, F(t) =
_
_
_
_
_
_
_
0
0
.
.
.
0
f(t)
_
_
_
_
_
_
_
.
135
Viceversa, se v `e una funzione appartenente a C
1
(J, C
n
) che risolve il sistema
sopra scritto, allora `e immediato verificare che la funzione u(t) = v
1
(t), pri-
ma componente del vettore v(t), appartiene a C
n
(J, C) e risolve l’equazione
differenziale di partenza.
Pertanto la teoria delle equazioni lineari di ordine n si pu`o dedurre da quella
svolta nel paragrafo 2.2 per i sistemi lineari. In particolare, vale il princi-
pio di sovrapposizione: se u, v risolvono nell’intervallo J rispettivamente le
equazioni
u
(n)
(t) =
n−1

k=0
a
k
(t)u
(k)
(t) + f(t), v
(n)
(t) =
n−1

k=0
a
k
(t)v
(k)
(t) + g(t),
allora u + v `e soluzione in J di
(u + v)
(n)
(t) =
n−1

k=0
a
k
(t)(u + v)
(k)
(t) + f(t) + g(t).
Di conseguenza, indicato con V
f
lo spazio affine delle soluzioni dell’equazione
con secondo membro f, si ha
V
f
= V
0
+ u
f
ove V
0
`e, naturalmente, lo spazio vettoriale delle soluzioni dell’equazione
omogenea e u
f
`e un fissato, arbitrario elemento di V
f
.
Inoltre, per ogni scelta di u
0
, u
1
, . . . , u
n−1
in C, il problema di Cauchy
_
¸
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
¸
_
u
(n)
(t) =

n−1
k=0
a
k
(t)u
(k)
(t) + f(t), t ∈ J,
u(t
0
) = u
0
u
t
(t
0
) = u
1
. . .
u
(n−1)
(t
0
) = u
n−1
ha soluzione unica in C
n
(J, C).
Ne segue che lo spazio V
0
ha dimensione n: una base `e data, ad esempio,
136
dalle soluzioni u
i
degli n problemi di Cauchy
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
u
(n)
i
(t) =

n−1
k=0
a
k
(t)u
(k)
i
(t), t ∈ J,
u
i
(t
0
) = 0
. . .
u
(i−1)
i
(t
0
) = 1
. . .
u
(n−1)
(t
0
) = 0,
i = 1, . . . , n.
Dati n elementi u
1
, u
2
, . . . , u
n
∈ V
0
, la matrice
W(t) =
_
_
_
_
_
_
u
1
(t) u
2
(t) . . . u
n
(t)
u
t
1
(t) u
t
2
(t) . . . u
t
n
(t)
.
.
.
.
.
. . . .
.
.
.
u
(n−1)
1
(t) u
(n−1)
2
(t) . . . u
(n−1)
n
(t)
_
_
_
_
_
_
si chiama, come nel caso dei sistemi, matrice Wronskiana relativa alle funzioni
u
1
, . . . , u
n
: essa non `e altro che la matrice Wronskiana relativa al sistema
corrispondente alla nostra equazione, poich´e ha per vettori colonna le funzioni
v
1
(t), . . . , v
n
(t) date da v
i
(t) = (u
i
(t), u
t
i
(t), . . . , u
(n−1)
i
(t)), i = 1, . . . , n.
Risulta, in virt` u del teorema di Liouville (teorema 5),
det W(t) = det W(t
0
) exp
_
t
t
0
a
n−1
(s) ds, t ∈ J,
e dunque det W(t) `e identicamente nullo in J oppure `e sempre diverso da 0
in J. In quest’ultimo caso, la n-pla di funzioni (u
1
(t), . . . , u
n
(t)) `e una base
di V
0
e si chiama, ancora, sistema fondamentale di soluzioni dell’equazione;
risulta allora
V
0
= ¦c
1
u
1
+ . . . c
n
u
n
: c
1
, . . . , c
n
∈ C¦.
Un elemento u
f
di V
f
si pu` o trovare col metodo di variazione delle costanti
arbitrarie: si ha u
f
∈ V
f
se e solo se u
f
= (u
f
, u
t
f
, . . . , u
(n−1)
f
) `e soluzione
del sistema differenziale corrispondente. Fissiamo un sistema fondamentale
di soluzioni u
1
, . . . , u
n
∈ V
f
, e sia W(t) la relativa matrice Wronskiana. Se
137
si cerca u
f
, soluzione particolare del sistema corrispondente, della forma
u
f
(t) = W(t)c(t), come sappiamo si trova la condizione
c
t
(t) = W(t)
−1
F(t),
ove F(t) = (0, 0, . . . , 0, f(t)).
Denotiamo con W
ij
(t) la matrice ottenuta da W(t) cancellando la riga i e
la colonna j; si ha allora
W(t)
−1
=
1
det W(t)
¦b
ij
(t)¦, con b
ij
(t) = (−1)
i+j
det W
ji
(t),
da cui
c
t
(t) = W(t)
−1
F(t) =
f(t)
det W(t)
_
_
_
_
_
(−1)
n+1
det W
n1
(t)
(−1)
n+2
det W
n2
(t)
.
.
.
det W
nn
(t)
_
_
_
_
_
.
In definitiva, le funzioni c
i
(t) saranno arbitrarie primitive delle funzioni sopra
indicate. Perci` o potremo scrivere la soluzione particolare u
f
nella forma
u
f
(t) = ¸W(t)c(t), e
1
¸
n
=
n

i=1
u
i
(t)
_
t
s
(−1)
(n+i)
f(r) det W
ni
(r)
det W(r)
dr,
con s ∈ J arbitrariamente fissato.
Esempio 2.4.1 Consideriamo l’equazione
u
ttt
(t) + u
t
(t) = e
it
, t ∈ R.
Andiamo a determinare l’insieme V
0
. Se u `e soluzione di u
ttt
+ u
t
= 0, la
funzione v = u
t
risolve v
tt
+ v = 0 e quindi, come si sa,
v(t) = c
1
e
it
+ c
2
e
−it
, c
1
, c
2
∈ C,
da cui u(t) =
1
i
c
1
e
it

1
i
e
−it
+ c
3
; dunque, cambiando nome alle costanti,
V
0
= ¦c
1
e
it
+ c
2
e
−it
+ c
3
, c
1
, c
2
, c
3
∈ C¦.
138
In particolare le funzioni e
it
, e
−it
, 1 costituiscono un sistema fondamentale
di soluzioni. La relativa matrice Wronskiana `e
W(t) =
_
_
e
it
e
−it
1
ie
it
−ie
−it
0
−e
it
−e
−it
0
_
_
,
e si vede facilmente che il suo determinante `e det W(t) = −2i; inoltre i
determinanti delle tre sottomatrici W
3i
(t), i = 1, 2, 3, sono dati da
det W
31
(t) = det
_
e
−it
1
−ie
−it
0
_
= ie
−it
det W
32
(t) = det
_
e
it
1
ie
it
0
_
= −ie
it
,
det W
33
(t) = det
_
e
it
e
−it
ie
it
−ie
−it
_
= −2i.
Una soluzione particolare dell’equazione assegnata sar`a della forma
u(t) = c
1
(t)e
it
+ c
2
(t)e
−it
+ c
3
(t),
con c
1
(t), c
2
(t), c
3
(t) fornite dalle relazioni
_
¸
_
¸
_
c
t
1
(t) = −
1
2i
det W
31
(t)e
it
= −
1
2
c
t
2
(t) =
1
2i
det W
32
(t)e
it
= −
1
2
e
2it
c
t
3
(t) = −
1
2i
det W
33
(t)e
it
= e
it
.
Ne segue, ad esempio,
c
1
(t) = −
1
2
t, c
2
(t) = −
1
4i
e
2it
, c
3
(t) =
1
i
e
it
.
Pertanto si trova la soluzione particolare
u(t) = −
1
2
te
it

1
4i
e
it
+
1
i
e
it
.
Dato che e
it
risolve l’equazione omogenea, si pu` o scegliere pi` u semplicemente
u(t) = −
1
2
te
it
; tenuto conto dell’espressione trovata per V
0
otteniamo allora
l’integrale generale:
V
f
=
_
c
1
e
it
+ c
2
e
−it
+ c
3

1
2
te
it
_
.
139
Proviamo infine che le soluzioni di equazioni di ordine n dipendono con
continuit`a dai coefficienti, dal secondo membro e dai valori iniziali.
Teorema 2.4.2 Fissiamo un intervallo J di R, siano a = (a
1
, . . . , a
n
) ∈
C(J, C
n
), f ∈ C(J, C) e z = (u
0
, u
1
, . . . , u
n−1
) ∈ C
n
. Allora per ogni t
0
∈ J
la soluzione u del problema di Cauchy
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
u
(n)
(t) =
n−1

k=0
a
k
(t)u
(k)
(t) + f(t), t ∈ J,
u(t
0
) = u
0
u
t
(t
0
) = u
1
. . .
u
(n−1)
(t
0
) = u
n−1
verifica, per ciascun sottointervallo chiuso e limitato I ⊆ J, contenente t
0
,
la stima seguente:
|u|
C
n
(I,C)
≤ c
_
[z[
n
+|f|
C(I,C)
¸
,
ove c `e una costante che dipende dai coefficienti a
1
, . . . , a
n
, dall’intervallo I
e dall’ordine n dell’equazione.
Dimostrazione La funzione y = (u, u
t
, . . . , u
(n−1)
) risolve il sistema dif-
ferenziale lineare equivalente all’equazione data, introdotto all’inizio del pa-
ragrafo. A tale funzione `e applicabile il teorema 2.2.4, e il risultato `e la
stima
|y|
C
1
(I,C
n
)
≤ c
_
[z[
n
+|F|
C(I,C
n
)
¸
con c dipendente dalla matrice A, da I e da n. Poich´e
|A|
C(I,/n)
=
_
n −1 +|a|
2
C(I,C
n
)
, |F|
C(I,C
n
)
= |f|
C(I,C)
,
mentre |u|
C
n
(I,C)
= |y|
C
1
(I,C
n
)
, si ottiene subito la tesi.
Teorema 2.4.3 Fissiamo un intervallo J di R e siano a = (a
1
, . . . , a
n
) e
b = (b
1
, . . . , b
n
) due funzioni di C(J, C
n
); siano inoltre f ∈ C(J, C) e z =
(u
0
, u
1
, . . . , u
n−1
) ∈ C
n
. Allora per ogni t
0
∈ J le soluzioni u e v dei problemi
140
di Cauchy
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
u
(n)
(t) =
n−1

k=0
a
k
(t)u
(k)
(t) + f(t),
u(t
0
) = u
0
u
t
(t
0
) = u
1
. . .
u
(n−1)
(t
0
) = u
n−1
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
v
(n)
(t) =
n−1

k=0
b
k
(t)v
(k)
(t) + f(t),
v(t
0
) = u
0
v
t
(t
0
) = u
1
. . .
v
(n−1)
(t
0
) = u
n−1
verificano, per ciascun sottointervallo chiuso e limitato I ⊆ J, contenente t
0
,
la stima seguente:
|u −v|
C
n
(I,C)
≤ c
t
|a −b|
C(I,C
n
)
_
[z[
n
+|f |
C(J,C
n
)
¸
,
ove c
t
`e una costante che dipende dai coefficienti a
1
, . . . , a
n
e b
1
, . . . , b
n
,
dall’intervallo I e dall’ordine n dell’equazione.
Dimostrazione Siano
_
y
t
(t) −A(t)y(t) = F(t), t ∈ J,
y(t
0
) = z
_
w
t
(t) −B(t)w(t) = f (t), t ∈ J
w(t
0
) = z
i sistemi equivalenti alle equazioni date, le cui soluzioni sono rispettivamente
y = (u, u
t
, . . . , u
(n−1)
) e w = (v, v
t
, . . . , v
(n−1)
). Per y e w, in virt` u del
teorema 2.2.5, vale la stima
|y −w|
C
1
(I,C
n
)
≤ c
t
|A−B|
C(I,C
n
2
)
_
[z[
n
+|F|
C(J,C
n
)
¸
con c
t
dipendente da A, B, I e n. Dato che
|A−B|
C(I,/n)
= |a −b|
C(I,C
n
)
,
come nella dimostrazione del teorema precedente si ottiene subito la tesi.
Equazioni lineari a coefficienti costanti
Dovendo risolvere l’equazione
u
(n)
(t) −
n−1

k=0
a
k
u
(k)
(t) = f(t), t ∈ J,
141
con a
0
, a
1
, . . . , a
n−1
costanti, ci si pu` o sempre ridurre al sistema equivalente,
cha ha a sua volta coefficienti costanti, ed applicare i metodi visti nel para-
grafo 2.3, ma `e preferibile far uso di un metodo pi` u diretto.
Cominciamo con il caso f ≡ 0. Il metodo consiste nel cercare soluzioni in
forma esponenziale-polinomiale, cio`e del tipo
u(t) = t
h
e
λt
,
con opportuni parametri h ∈ N e λ ∈ C. Andiamo ad imporre che la funzione
u risolva l’equazione differenziale omogenea. Poniamo
P(λ) = λ
n

n−1

k=0
a
k
λ
k
:
l’equazione algebrica P(λ) = 0 si chiame equazione caratteristica associata
all’equazione differenziale data, e l’operatore differenziale dato dal primo
membro di quest’ultima pu` o scriversi formalmente come P
_
d
dt
_
. Si ha allora
u
(n)
(t) −
n−1

k=0
a
k
u
(k)
(t) = P
_
d
dt
_
[t
h
e
λt
] = P
_
d
dt
_

h
∂λ
h
e
λt
;
osservando che u ∈ C

(R), si pu`o invertire l’ordine di derivazione; ricordando
la formula per la derivata h-sima di un prodotto, si ottiene
u
(n)
(t) −
n−1

k=0
a
k
u
(k)
(t) =

h
∂λ
h
P
_
d
dt
_
e
λt
=

h
∂λ
h
P(λ)e
λt
=
=
h

s=0
_
h
s
_
P
(s)
(λ)

h−s
∂λ
h−s
e
λt
=
h

s=0
_
h
s
_
P
(s)
(λ)t
h−s
e
λt
.
Questo calcolo mostra che u(t) = x
h
e
λt
`e soluzione dell’equazione omogenea
se e solo se il polinomio che compare all’ultimo membro `e identicamente nullo,
cio`e se e solo se risulta P
(j)
(λ) = 0 per j = 0, 1, . . . , h. Supponendo che P(λ)
abbia m radici distinte λ
1
, . . . , λ
m
di rispettive molteplicit` a k
1
, . . . , k
m
(con
k
i
∈ N
+
e

m
i=1
k
i
= n), si ha dunque
P
(h)

i
) = 0, h = 0, 1, . . . , k
i
−1, i = 1, . . . , m.
142
Avremo pertanto le n soluzioni
e
λ
1
t
, t e
λ
1
t
, t
k
1
−1
e
λ
1
t
,
e
λ
2
t
, t e
λ
2
t
, t
k
2
−1
e
λ
2
t
,

e
λmt
, t e
λmt
, t
km−1
e
λmt
.
Per verificare che esse costituiscono un sistema fondamentale di soluzioni del-
l’equazione omogenea, basta provare che esse sono linearmente indipendenti.
A questo scopo ci `e utile il seguente
Lemma 2.4.4 Se α ∈ C ¸ ¦0¦ e se Q(t) `e un polinomio, allora per ogni
m ∈ N si ha
d
m
dt
m
[Q(t)e
αt
] = R
m
(t)e
αt
,
ove R
m
(t) `e un polinomio cha ha lo stesso grado di Q(t).
Dimostrazione Ragioniamo per induzione. Se m = 1 la tesi `e vera: infatti
d
dt
[Q(t)e
αt
] = [Q
t
(t) + αQ(t)]e
αt
,
e poich´e α ,= 0, il grado di Q
t
+ αQ `e quello di Q. Supponiamo la tesi vera
per ogni k ∈ ¦1, . . . , m−1¦ e dimostriamola per m. Possiamo scrivere
d
m
dt
m
[Q(t)e
αt
] =
d
dt
_
d
m−1
dt
m−1
[Q(t)e
αt
]
_
,
e per l’ipotesi induttiva
d
m
dt
m
[Q(t)e
αt
] =
d
dt
[R
m−1
(t)e
αt
],
ove il grado di R
m−1
`e lo stesso di Q; utilizzando il caso m = 1 ricaviamo
allora
d
m
dt
m
[Q(t)e
αt
] = [R
t
m−1
(t) + αR
m−1
(t)]e
αt
= R
m
(t)e
αt
,
ove R
m
= R
t
m−1
+ αR
m−1
ha lo stesso grado di R
m−1
e quindi di Q.
Consideriamo allora una combinazione lineare nulla delle n funzioni scritte
in precedenza:
m

i=1
k
i
−1

h=0
c
ih
t
h
e
λ
i
t
≡ 0,
143
e proviamo che tutti i coefficienti c
ih
devono essere nulli.
Definiamo
P
i
(t) =
k
1
−1

h=0
c
ih
t
h
, i = 1, . . . , m;
per ipotesi si ha quindi
m

i=1
P
i
(t)e
λ
i
t
≡ 0.
Dimostriamo, per induzione su m, che P
i
(t) ≡ 0 per i = 1, . . . , m: ci`o
implicher` a, per il principio di identit` a dei polinomi, che tutti i c
ih
sono nulli.
Se m = 1, `e chiaro che P
1
(t) ≡ 0 come conseguenza dell’identit` a P
1
(t)e
λ
1
t

0. Supponiamo che l’enunciato valga per un certo s −1 ∈ ¦1, . . . , m−1¦, e
dimostriamolo per s. Riscriviamo l’identit` a
s

i=1
P
i
(t)e
λ
i
t
≡ 0
nella forma
P
s
(t) ≡
s−1

i=1
P
i
(t)e

i
−λs)t
,
ed osserviamo che i numeri λ
i
− λ
s
, per i = 1, . . . , s − 1, sono distinti fra
loro e diversi da 0. Detto r
s
il grado di P
s
(si ha 0 ≤ r
s
≤ k
s
), derivando
l’espressione precedente r
s
+ 1 volte otteniamo, grazie al lemma 2.4.4,
0 ≡
d
rs+1
dt
rs+1
s−1

i=1
P
i
(t)e

i
−λs)t
=
s−1

i=1
d
rs+1
dt
rs+1
[P
i
(t)e

i
−λs)t
] =
s−1

i=1
R
is
(t)e

i
−λs)t
,
ove R
is
ha lo stesso grado di P
i
. Per ipotesi induttiva, ricaviamo R
is
(t) ≡ 0,
e quindi P
s
, essendo combinazione lineare dei P
i
, `e identicamente nullo. Ci`o
completa il passo induttivo.
Dalle relazioni P
i
(t) ≡ 0, i = 1, . . . , m, segue, come si `e gi` a osservato, che
c
ih
= 0 per h = 0, . . . , k
i
−1 e i = 1, . . . , m. Ci`o prova la lineare indipendenza
delle n funzioni t
h
e
λ
i
t
.
In conclusione, l’integrale generale dell’equazione omogenea
u
(n)
(t) −
n−1

k=0
a
k
u
(k)
(t) = 0, t ∈ R,
144
`e dato da
V
0
=
_
m

i=1
k
i
−1

h=0
c
ih
t
h
e
λ
i
t
: c
ih
∈ C
_
ove, come si `e detto, i λ
i
sono le radici distinte del polinomio t → t
n

n−1
h=0
a
h
t
h
, con rispettive molteplicit` a k
i
.
Osserviamo anche che se i coefficienti dell’equazione differenziale sono reali,
allora si pu`o trovare una base di V
0
costituita da funzioni reali. Infatti in
questo caso accanto ad ogni radice λ
j
/ ∈ R vi `e l’altra radice λ
j
, complessa
coniugata della precedente: quindi, posto λ
j
= p
j
+ iq
j
, possiamo sostituire
alle due righe
e
λ
j
t
, t e
λ
j
t
, t
k
j
−1
e
λ
j
t
,
e
λ
j
t
, t e
λ
j
t
, t
k
j
−1
e
λ
j
t
le seguenti
e
p
j
t
cos(q
j
t), t e
p
j
t
cos(q
j
t), t
k
j
−1
e
p
j
t
cos(q
j
t),
e
p
j
t
sin(q
j
t), t e
p
j
t
sin(q
j
t), t
k
j
−1
e
p
j
t
sin(q
j
t),
che derivano dalle precedenti mediante evidenti combinazioni lineari.
Osservazione 2.4.5 Talvolta, anzich´e risolvere direttamente un sistema dif-
ferenziale lineare a coefficienti costanti, `e pi` u semplice trasformarlo in una
equazione lineare di ordine opportuno, che si ottiene eliminando una delle
incognite. Questo `e il cosiddetto metodo di eliminazione, che andiamo ad
illustrare.
Consideriamo il sistema del primo ordine
_
u
t
(t) = au(t) + bv(t)
v
t
(t) = cu(t) + dv(t),
con a, b, c, d ∈ C. Derivando la prima equazione, e ricavando v
t
dalla seconda,
otteniamo
u
tt
(t) = au
t
(t) + bcu(t) + bdv(t);
ricavando infine bv dalla prima equazione del sistema, arriviamo all’equazione
del secondo ordine
u
tt
(t) = (a + d)u
t
(t) + (bc −ad)u(t) = (tr A)u
t
(t) −(det A)u(t),
145
ove A `e la matrice dei coefficienti. Se essa ha due autovalori distinti λ
1
e λ
2
,
troveremo
u(t) = k
1
e
λ
1
t
+ k
2
e
λ
2
t
, k
1
, k
2
∈ C,
mentre se vi `e un solo autovalore λ avremo
u(t) = k
1
e
λt
+ k
2
te
λt
, k
1
, k
2
∈ C.
Infine, se b ,= 0, dalla prima equazione ricaviamo
v(t) =
1
b
u
t
(t) −
a
b
u(t).
Se invece b = 0 (nel qual caso, comunque, sarebbe stato inutile derivare la
prima equazione!), dobbiamo ricavare v dall’equazione differenziale v
t
(t) −
dv(t) = cu(t), il che fornisce v a meno di una terza costante arbitraria. La
ragione di questa sovrabbondanza sta nel fatto che abbiamo derivato una
equazione del sistema, il che porta in generale ad introdurre nuove soluzioni.
Di regola occorre perci` o, una volta trovate u(t) e v(t), verificare che esse sono
davvero soluzioni del sistema originario.
Esempi 2.4.6 (1) Risolviamo col metodo di eliminazione il sistema
_
u
t
(t) = 2u(t)
v
t
(t) = u(t) −v(t),
Derivando la seconda equazione e procedendo come illustrato nell’osservazio-
ne precedente, troviamo
v
tt
(t) = u
t
(t) −v
t
(t) = 2u(t) −v
t
(t) = v
t
(t) + 2v(t);
come si vede facilmente, questa equazione differenziale ha le soluzioni
v(t) = k
1
e
2t
+ k
2
e
−t
, k
1
, k
2
∈ C,
e dunque
u(t) = v
t
(t) + v(t) = 3k
1
e
2t
.
L’integrale generale del sistema `e dunque
_
u(t)
v(t)
_
=
_
3
1
_
k
1
e
2t
+
_
0
1
_
k
2
e
−t
, k
1
, k
2
∈ C.
146
(2) Consideriamo il sistema del secondo ordine
_
u
t
(t) = u(t) −v(t)
v
tt
(t) = u
t
(t) −4u(t) + 2v(t).
Possiamo facilmente trasformare questo sistema in un sistema del primo
ordine: ponendo w = v
t
abbiamo
_
_
_
u
t
(t) = u(t) −v(t)
v
t
(t) = w(t)
w
t
(t) = u
t
(t) −4u(t) + 2v(t) = −3u(t) + v(t),
e da qui in poi potremmo utilizzare i metodi visti nel paragrafo 2.3. Invece,
ricominciamo da capo e facciamo uso del metodo di eliminazione: inserendo
la prima equazione del sistema originario nella seconda, possiamo riscrivere
questa nella forma v
tt
(t) = −3u(t) + v(t). Derivandola, otteniamo
v
ttt
(t) = −3u
t
(t) + v
t
(t) = −3u(t) + 3v(t) + v
t
(t);
dato che 3u(t) = v(t) −v
tt
(t), arriviamo a
v
ttt
(t) = v
tt
(t) + v
t
(t) + 2v(t).
Questa equazione, come `e facile verificare, ha le soluzioni
v(t) = c
1
e
2t
+ c
2
e
λt
+ c
3
e
λt
, c
1
, c
2
, c
3
∈ C,
ove λ = −
1
2
+ i

3
2
. Dato che u(t) =
1
3
(v(t) − v
tt
(t)), ricaviamo anche, con
qualche calcolo,
u(t) = −c
1
e
2t
+
_
1
2
+
i
2

3
_
c
2
e
λt
+
_
1
2

i
2

3
_
e
λt
.
Dunque l’integrale generale del sistema dato `e
_
u(t)
v(t)
_
=
_
−1
1
_
c
1
e
2t
+
_
1
2
+
i
2

3
1
_
c
2
e


1
2
+i

3
2

t
+
_
1
2

i
2

3
1
_
c
3
e


1
2
−i

3
2

t
al variare di c
1
, c
2
, c
3
∈ C.
147
Consideriamo ora un’equazione differenziale a coefficienti costanti, con secon-
do membro f non nullo. Per trovare una soluzione particolare dell’equazione
non omogenea, possiamo sempre utilizzare il metodo di variazione della co-
stanti, come abbiamo fatto nell’esempio 2.4.1; tuttavia quando il secondo
membro `e di tipo particolare, conviene seguire un’altra strada. Supponiamo
che f sia della forma f(t) = P
n
(t)e
λt
, con P
n
polinomio di grado n e λ ∈ R.
Allora possiamo cercare una soluzione particolare u
f
dello stesso tipo di f:
precisamente, si cercher` a u
f
della forma
u
f
(t) = t
h
Q
n
(t)e
λt
,
ove Q
n
`e un polinomio dello stesso grado n, mentre h `e la molteplicit` a di λ
come radice del polinomio caratteristico dell’equazione; se in particolare λ
non `e radice, sar`a h = 0. Similmente, se f(t) = P
n
(t)e
αt
(a cos βt + b sin βt),
con P
n
polinomio di grado n, α, β ∈ R e a, b costanti, si cercher` a u
f
della
forma
u
f
(t) = t
h
Q
n
(t)e
αt
(Acos βt + Bsin βt),
ove Q
n
`e un polinomio dello stesso grado n, A e B sono costanti e h `e la
molteplicit` a di α ±iβ come radici del polinomio caratteristico.
Questo metodo funziona sempre (quando il secondo membro `e del tipo pre-
scritto) ed `e spesso meno laborioso dal punto di vista dei calcoli.
Esempio 2.4.7 Consideriamo nuovamente l’equazione u
ttt
(t) + u
t
(t) = e
it
,
gi` a analizzata nell’esempio 2.4.1, e cerchiamone una soluzione particolare.
Dato che i e −i sono radici del polinomio caratteristico (di molteplicit` a 1), e
f(t) = e
it
= cos t + i sin t, cerchiamo u
f
del tipo
u
f
(t) = t(Acos t + Bsin t).
Si ha allora
u
t
f
(t) = (A + Bt) cos t + (B −At) sin t,
u
tt
f
(t) = (2B −At) cos t −(2A + Bt) sin t,
u
ttt
f
(t) = −(3A + Bt) cos t −(3B −At) sin t;
imponendo che u
f
risolva l’equazione si ottiene
−(3A+Bt) cos t−(3B−At) sin t+(A+Bt) cos t+(B−At) sin t = cos t+i sin t,
148
ossia
−2Acos t −2Bsin t = cos t + i sin t,
da cui A = −1/2 e B = −i/2. In definitiva
u
f
(t) = −
t
2
(cos t + i sin t) = −
1
2
e
it
,
che `e la stessa funzione ottenuta con il metodo di variazione delle costanti.
Esercizi 2.4
1. Determinare l’integrale generale delle seguenti equazioni differenziali
lineari:
(i) u
ttt
(t) −3u
t
(t) + 2u(t) = 0,
(ii) u
ttt
(t) −u
tt
(t) = 0,
(iii) u
ttt
(t) −3u
tt
(t) + 3u
t
(t) −u(t) = (t + 1)e
t
,
(iv) u
tttt
(t) −16u(t) = 2 cos
2
t,
(v) u
tttt
(t) + u
tt
(t) = sin t,
(vi) u
ttt
(t) −u
tt
(t) −u
t
(t) + u(t) = e
t
,
(vii) u
ttt
(t) + u
t
(t) = (t −1) sin t,
(viii) u
ttttt
(t) + 2u
ttt
(t) + u(t) = 0.
2. Risolvere l’equazione differenziale
u
tt
(t) −
2t
t
2
+ 1
u
t
(t) +
2
t
2
+ 1
u(t) = (t
2
+ 1)
2
,
cercando soluzioni dell’equazione omogenea del tipo u(t) = at
2
+bt +c.
3. Risolvere i seguenti problemi di Cauchy:
(i)
_
u
ttt
(t) = t
−2
u(1) = 3, u
t
(1) = 2, u
tt
(1) = −1;
(ii)
_
u
tttt
(t) + u
tt
(t) = −sin t
u(0) = 0, u
t
(0) = −1, u
tt
(0) = 0, u
ttt
(0) = 1;
(iii)
_
u
tttt
(t) + 2u
tt
(t) + u(t) = 2
u(0) = 1, u
t
(0) = 0, u
tt
(0) = 0, u
ttt
(0) = 2;
(iv)
_
u
ttttt
(t) + u
ttt
(t) = t
u(1) = 1, u
t
(1) = 0, u
tt
(1) = 0, u
ttt
(1) = 0, u
tttt
(0) = 1.
149
4. (Riduzione dell’ordine) Si provi che se si conosce una soluzione u
1
(t)
dell’equazione differenziale u
tt
(t)+a
1
(t)u
t
(t)+a
0
(t)u(t) = 0, allora se ne
pu` o trovare un’altra, linearmente indipendente dalla prima, della forma
u
2
(t) = v(t)u
1
(t), riducendosi ad un’equazione lineare del primo ordine
nell’incognita v. Si applichi il metodo alla risoluzione dell’equazione
(1 −t
2
)u
tt
(t) −2tu
t
(t) + 2u(t) = 0.
[Traccia: si osservi che u
1
(t) = t `e soluzione dell’equazione.]
5. Si generalizzi il metodo di riduzione dell’ordine, illustrato nell’esercizio
precedente, al caso di equazioni lineari omogenee di ordine n qualunque.
6. (Equazioni di Eulero) Si provi che l’equazione
u
(n)
(t) +
n

k=1
a
k
t
k
u
(n−k)
(t) = 0, t > 0,
si trasforma in un’equazione a coefficienti costanti mediante il cam-
biamento di variabile x = ln t. Se ne deduca che tale equazione ha
soluzioni del tipo u(t) = t
α
, ove α `e una radice dell’equazione algebrica
α(α −1) . . . (α −n + 1) +
n−1

k=1
a
k
α . . . (α −n + k + 1) + a
n
= 0,
ed eventualmente altre soluzioni del tipo u(t) = t
α
(ln t)
h
, 1 ≤ h ≤ k−1,
quando la radice α ha molteplicit`a k > 1.
7. Risolvere le seguenti equazioni lineari di Eulero:
(i) u
ttt
(t) +
3
t
u
tt
(t) +
2
t
2
u
t
(t) = 0,
(ii) u
tttt
(t) +
6
t
u
ttt
(t) +
9
t
2
u
tt
(t) +
3
t
3
u
t
(t) +
1
t
4
u(t) = 0.
(iii) u
ttt
(t) +
6
t
u
tt
(t) +
7
t
2
u
t
(t) +
1
t
3
u(t) = t.
8. (Risoluzione per serie) Data l’equazione differenziale
u
tt
(t) + 2tu
t
(t) + u(t) = 0, t ∈ R,
se ne cerchino due soluzioni linearmente indipendenti sotto forma di
serie di potenze. Si verifichi che tali serie hanno raggio di convergenza
infinito, e se ne determinino i coefficienti in funzione dei primi due, a
0
e a
1
, che fungono da costanti arbitrarie.
150
9. Risolvere per serie i seguenti problemi di Cauchy:
_
u
tt
(t) + 2tu
t
(t) + 2u(t) = 0
u(0) = 1, u
t
(0) = 0,
_
u
tt
(t) + tu
t
(t) + u(t) = 0
u(0) = 1, u
t
(0) = 1.
10. Trovare una serie di potenze che risolva l’equazione di Bessel di ordine
0
tu
tt
(t) + u
t
(t) + tu(t) = 0, t ∈ R,
e trovarne poi una seconda col metodo di riduzione dell’ordine (esercizio
2.4.4).
11. Dato n ∈ N
+
, trovare una serie di potenze che risolva l’equazione di
Bessel di ordine n
t
2
u
tt
(t) + tu
t
(t) + (t
2
−n
2
)u(t) = 0, t ∈ R,
e trovarne poi una seconda col metodo di riduzione dell’ordine.
12. Dato ν / ∈ N, trovare l’integrale generale dell’equazione di Bessel di
ordine ν
t
2
u
tt
(t) + tu
t
(t) + (t
2
−ν
2
)u(t) = 0, t > 0.
[Traccia: posto v(t) = t
ν
u(t), si verifichi che v risolve
tv
tt
(t) + (2ν + 1)v
t
(t) + tv(t) = 0, t > 0;
si cerchi una soluzione di questa equazione sotto forma di serie di po-
tenze. Si mostri infine che l’analoga soluzione con ν sostituito da −ν `e
linearmente indipendente dalla precedente.]
13. Risolvere col metodo di eliminazione i seguenti sistemi:
(i)
_
u
t
(t) = u(t) + 3v(t)
v
t
(t) = 3u(t) −v(t),
(ii)
_
u
t
(t) = u(t) + v(t)
v
tt
(t) = 3u(t) + v(t),
(iii)
_
u
t
(t) = −2u(t) −4v(t)
u
t
(t) −2v
t
(t) = −2v(t),
(iv)
_
u
t
(t) −v
t
(t) = −u(t)
u
tt
(t) −v
tt
(t) = u(t) + v(t).
14. Risolvere, se possibile, i seguenti problemi ai limiti:
_
u
ttt
(t) −u(t) = te
−t
u(0) = 3, u(1) = 2, u
t
(2) = 6,
_
u
ttt
(t) + u(t) = t
u(0) = u(1) = 0, lim
t→∞
u(t) = 0.
151
2.5 Analisi qualitativa
Non sempre `e possibile scrivere esplicitamente le soluzioni di un’equazione
differenziale non lineare, e del resto non sempre un’espressione esplicita aiuta
a comprendere l’andamento qualitativo delle curve integrali, ossia dei grafici
di tali soluzioni. In molti casi, uno studio diretto dell’equazione differenziale
permette di studiare il comportamento delle curve integrali senza conoscerne
l’espressione analitica.
Esempio 2.5.1 Consideriamo l’equazione del primo ordine
u
t
(t) = t
_
1 +
1
u(t)
_
.
Il teorema di esistenza e unicit` a della soluzione `e applicabile in tutti i punti
(t, u) dei due semipiani u > 0 e u < 0: quindi per ogni punto (t
0
, u
0
),
con u
0
,= 0, passa una e una sola soluzione dell’equazione. Cominciamo col
determinare le curve isocline, cio`e le curve sulle quali la pendenza di tutte
le curve integrali che le attraversano `e la stessa. Nel nostro caso, le isocline
sono le iperboli di equazione u =
t
c−t
: infatti una soluzione u(t), che passi
per un punto della forma (t
0
,
t
0
c−t
0
), deve avere in tale punto pendenza pari a
u
t
(t
0
) = t
0
_
1 +
1
u(t
0
)
_
= t
0
_
1 +
1
t
0
c−t
0
_
= c,
dunque costante (al variare di tutte le soluzioni passanti per punti della
curva). In particolare, sui punti dell’isoclina u = −1 le curve integrali hanno
tangente orizzontale.
Dall’equazione differenziale ricaviamo, derivando rispetto a t,
u
tt
(t) = 1 +
1
u(t)
−t
u
t
(t)
u(t)
2
=
(u(t) + 1)(u(t) −t)(u(t) + t)
u
3
,
e quindi l’intero piano pu`o essere suddiviso in regioni di concavit` a e di con-
vessit` a sulla base del segno dei fattori che compongono u
tt
. In particolare le
rette u = ±t sono costituite da punti di flesso per le soluzioni. Si osservi che
per t < 0 e u / ∈ [−1, 0] le soluzioni sono decrescenti, mentre sono crescenti
per t < 0 e −1 < u < 0. Inoltre le soluzioni sono simmetriche rispetto alla
retta verticale t = 0, dato che il secondo membro dell’equazione differenziale
152
`e una funzione dispari rispetto a t; ne segue che se u(t) `e soluzione, anche
u(−t) lo `e.
La retta u = −1 `e una curva inte-
grale dell’equazione: quindi, per
il teorema di unicit` a, essa non
pu` o essere attraversata da altre
curve integrali. Infine osserviamo
che per u > 0 risulta [u
t
(t)[ >
[t[, e quindi [u
t
(t)[ → ∞ quan-
do t → ±∞; pertanto nessuna
curva integrale presenta asintoti
obliqui.
Si noti che l’equazione differenziale, essendo a variabili separabili, si risolve,
ma la soluzione `e espressa in forma implicita:
u −ln [1 + u[ =
t
2
2
+ c, c ∈ R.
Esempio 2.5.2 Consideriamo l’equazione
u
t
(t) = 4u(t)(1 −u(t)).
In questo caso le curve isocline sono le rette u = c; vi sono inoltre le soluzioni
costanti u = 0 e u = 1, che separano il piano in tre zone, in ciascuna delle
quali u
t
ha segno costante. Si ha anche
u
tt
(t) = 16u(t)(1 −u(t))(1 −2u(t)),
e quindi per u > 1 e per 0 < u < 1/2 le soluzioni sono convesse.
`
E facile analizzare il comportamento asintotico delle soluzioni. Consideria-
mo una curva integrale uscente da un punto di coordinate (0, a): se a ∈]0, 1[,
u(t) `e crescente ed `e contenuta nella striscia 0 < u < 1 (poich´e non pu`o
attraversare le due curve integrali u = 0 e u = 1); dal teorema di esisten-
za segue che u(t) esiste per ogni t ∈ R. Inoltre, posto u
0
= lim
t→∞
u(t)
e v
0
= lim
t→−∞
u(t) (i limiti esistono essendo u crescente), si deve avere
lim
t→±∞
u
t
(t) = 0, e dunque, passando al limite nell’equazione differenziale,
si trova 4u
0
(1 − u
0
) = 0 = 4v
0
(1 − v
0
), da cui u
0
= 1 e v
0
= 0. Dunque
le curve integrali costanti u = 0 e u = 1 sono asintoti orizzontali per tali
soluzioni.
Se invece a > 1, u(t) `e convessa e decrescente, quindi u
0
= lim
t→∞
u(t) esiste
153
finito e come sopra si ottiene u
0
= 1, mentre necessariamente la soluzione
diverge per t → −∞, dato che [u
t
[ ≥ 4[u[([u[ − 1) → +∞ per t → −∞:
dunque v
0
= −∞.
Quando a < 0, simili consi-
derazioni mostrano che v
0
=
0 e u
0
= −∞. Si noti il di-
verso comportamento delle
curve integrali attorno alla
soluzioni stazionarie: al cre-
scere di t, la soluzione u = 1
`e un “attrattore” di solu-
zioni, mentre u = 0 `e un
“repulsore” di soluzioni.
In questo caso le soluzioni si determinano esplicitamente:
u(t) =
ce
4t
1 + ce
4t
, c ∈ R.
Osservazione 2.5.3 L’esempio precedente rientra in una importante sotto-
classe di equazioni del primo ordine: le equazioni autonome, ossia quelle della
forma
u
t
(t) = F(u(t)),
ove F : J → R `e un’assegnata funzione continua definita su un intervallo
J ⊆ R. Dunque un’equazione differenziale `e autonoma se il suo secondo
membro non dipende esplitamente dalla variabile t.
`
E facile verificare che se u(t) `e una soluzione in ]t
1
, t
2
[ dell’equazione sopra
scritta, allora, qualunque sia T ∈ R, la funzione t → u(t + T) risolve l’equa-
zione in ]t
1
− T, t
2
− T[. Nel seguito supporremo per semplicit`a che F sia
definita su tutto R; si noti che questo non implica che ciascuna soluzione sia
definita su tutto R.
`
E vero per` o che per descrivere tutte le soluzioni sar` a
sufficiente, a meno di una traslazione temporale, considerare le soluzioni del
problema di Cauchy
_
u
t
(t) = F(u(t))
u(0) = x
0
al variare di x
0
in R.
Analizziamo alcuni casi significativi. Se F(x
0
) = 0, allora u(t) ≡ x
0
`e una
soluzione stazionaria, ossia costante. Se F(x
0
) < 0 ed esiste x < x
0
tale che
F(x) = 0, allora si vede facilmente che la soluzione u(t) `e definita per ogni
154
t > 0 e lim
t→+∞
u(t) = x
1
, ove x
1
`e il massimo fra gli zeri di F minori di
x
0
. Similmente, se F(x
0
) > 0 ed esiste x > x
0
tale che F(x) = 0, allora
la soluzione u(t) `e definita per ogni t > 0 e lim
t→+∞
u(t) = x
2
, ove x
2
`e il
minimo fra gli zeri di F maggiori di x
0
. Se ne deduce che se esiste un intorno
U di x
0
per cui
F(x)
_
_
_
> 0 per x < x
0
, x ∈ U
= 0 per x = x
0
< 0 per x > x
0
, x ∈ U,
allora la soluzione stazionaria u(t) = x
0
`e asintoto per t → +∞ di soluzioni
u(t), sia “dall’alto” che “dal basso”. Una condizione sufficiente affinch´e ci` o
accada `e, ovviamente,
F ∈ C
1
(R), F(x
0
) = 0, F
t
(x
0
) < 0.
Si dice in tal caso che la soluzione stazionaria u = x
0
`e asintoticamente
stabile. Se, invece, esiste un intorno U di x
0
per cui
F(x)
_
_
_
< 0 per x < x
0
, x ∈ U
= 0 per x = x
0
> 0 per x > x
0
, x ∈ U,
allora le soluzioni u(t) “si allontanano” dalla soluzione stazionaria u = x
0
per t → +∞; ci`o accade, ad esempio, quando F ∈ C
1
(R), F(x
0
) = 0 e
F
t
(x
0
) > 0. In tal caso la soluzione stazionaria u = x
0
si dice instabile.
Sistemi autonomi
Consideriamo il sistema autonomo
_
x
t
(t) = f(x(t), y(t))
y
t
(t) = g(x(t), y(t)),
ove x e y sono le funzioni incognite e f(x, y), g(x, y) sono funzioni assegnate,
non dipendenti esplicitamente da t, che supporremo almeno differenziabili in
un aperto A ⊆ R
2
. Una soluzione di questo sistema `e una coppia (x(), y())
di funzioni definite su un dato intervallo. Si osservi che l’intervallo `e in un
certo senso arbitrario, poich´e se (x(t), y(t)) `e una soluzione definita in ]a, b[,
anche (x(t + c), y(t + c)), definita nell’intervallo ]a − c, b − c[, lo `e. La cur-
va descritta dalla coppia (x(t), y(t)), al variare di t nell’intervallo massimale
155
di esistenza, si chiama orbita, o traiettoria, del sistema; un’orbita `e dun-
que l’immagine in R
2
di una soluzione massimale. Possiamo anche orientare
un’orbita pensando di percorrerla nel verso delle t crescenti. Si osservi che
diverse soluzioni possono avere come immagine la stessa orbita: ad esempio,
appunto, (x(), y()) e (x( +c), y( +c)). Notiamo che il vettore (x
t
(t), y
t
(t))
`e tangente all’orbita nel punto (x(t), y(t)).
Il sistema sopra scritto ha un’evidente interpretazione cinematica: se nell’a-
perto A `e definito un campo di vettori v(x, y) = (f(x, y), g(x, y)), e se la
variabile t denota il tempo, il nostro sistema descrive il moto piano di una
particella che nel punto (x, y) ha una velocit` a pari a v(x, y); il piano in cui si
muove la particella `e detto piano delle fasi e il sistema stesso prende il nome
di sistema dinamico. L’analogia meccanica sar`a sempre sotterraneamente
presente nel linguaggio che adopereremo.
Per i sistemi autonomi vale questa importante propriet`a:
Proposizione 2.5.4 Siano f, g ∈ C
1
(A). Allora per ogni (x
0
, y
0
) ∈ A passa
una ed una sola orbita del sistema.
Dimostrazione Per il teorema di esistenza relativo al problema di Cauchy,
vi `e certamente una soluzione (x, y) del sistema che verifica (x(t
0
), y(t
0
)) =
(x
0
, y
0
) in un certo (arbitrario) istante t
0
: esiste perci` o almeno un’orbita che
contiene il punto (x
0
, y
0
). Se poi vi fossero due orbite
C
1
= ¦(x
1
(t), y
1
(t)) : t ∈ I
1
¦, C
2
= ¦(x
2
(t), y
2
(t)) : t ∈ I
2
¦
con un punto (x
0
, y
0
) in comune, avremmo per certi istanti t
1
∈ I
1
e t
2
∈ I
2
(x
0
, y
0
) = (x
1
(t
1
), y
1
(t
1
)) = (x
2
(t
2
), y
2
(t
2
)).
Allora la coppia (x, y), data da
x(t) = x
1
(t + t
1
−t
2
), y(t) = y
1
(t + t
1
−t
2
), t ∈ I
1
−t
1
+ t
2
,
`e una soluzione del sistema che ha per immagine l’orbita C
1
; ma essendo
(x(t
2
), y(t
2
)) = (x
0
, y
0
) = (x
2
(t
2
), y
2
(t
2
)), per unicit`a deve essere x ≡ x
2
e
y ≡ y
2
, e dunque (x, y) ha per immagine l’orbita C
2
. Si conclude cos`ı che le
due orbite coincidono.
Per lo studio qualitativo dei sistemi `e di fondamentale importanza la nozione
156
di punto critico, o stazionario, del sistema: si tratta dei punti del piano per
i quali risulta
_
f(x, y) = 0
g(x, y) = 0.
Se (x
0
, y
0
) `e un punto critico, l’orbita passante per (x
0
, y
0
) coincide con il
punto stesso. Come vedremo, le orbite nell’intorno di un punto critico posso-
no essere delle forme pi` u diverse. Un punto critico del sistema si dice isolato
se in un suo opportuno intorno non ve ne sono altri. Di particolare rilevanza
`e la seguente classificazione dei punti critici isolati.
Definizione 2.5.5 Un punto critico isolato si dice stabile (per t →+∞) se
per ogni suo intorno U ne esiste un altro, U
t
, contenuto in U, tale che ogni
soluzione (x(), y()), che passi ad un dato istante t
0
per un punto di U
t
, resta
dentro U per ogni t > t
0
. In particolare, un punto critico stabile (x
0
, y
0
) si
dice asintoticamente stabile se vi `e un suo intorno V tale che ogni soluzione
(x(), y()), che passi ad un dato istante t
0
per un punto di V , converge, per
t →+∞, a (x
0
, y
0
). Un punto critico isolato si dice instabile se non `e stabile.
Definizioni del tutto analoghe di stabilit`a, stabilit`a asintotica e instabilit` a si
possono dare per t →−∞.
Sistemi lineari
Consideriamo sistemi della forma
_
u
t
(t) = au(t) + bv(t)
v
t
(t) = cu(t) + dv(t),
t ∈ R,
ove a, b, c, d sono costanti reali. Il punto (0, 0) `e ovviamente critico per questo
sistema; se ad − bc ,= 0, non ve ne sono altri. Il caso ad − bc = 0, che d` a
luogo a famiglie di punti stazionari non isolati, `e trattato nell’esercizio 2.5.2.
Cominciamo con l’osservare che, derivando una delle equazioni e utilizzando
l’altra, si arriva facilmente a provare che se (u, v) `e una soluzione del sistema
allora le funzioni u e v sono entrambe soluzioni dell’equazione del secondo
ordine
z
tt
(t) −(a + d)z
t
(t) + (ad −bc)z(t) = 0, t ∈ R.
La corrispondente equazione caratteristica `e
λ
2
−(a + d)λ + (ad −bc) = 0,
157
e coincide con il polinomio caratteristico p(λ) della matrice dei coefficienti,
cio`e
p(λ) = det
_
a −λ b
c d −λ
_
.
Dunque le radici dell’equazione caratteristica sopra scritta sono gli autovalori
(non nulli a causa dell’ipotesi ad −bc ,= 0)
λ
1
=
a + d +
_
(a −d)
2
+ 4bc
2
, λ
2
=
a + d −
_
(a −d)
2
+ 4bc
2
della matrice A =
_
a b
c d
_
. A questo punto `e molto facile scrivere esplici-
tamente le soluzioni del sistema (esercizio 2.2.4), ma a noi adesso interessa
uno studio qualitativo delle soluzioni. A questo scopo sar` a importante di-
stinguere i casi in cui si ha una coppia di autovalori reali, un solo autovalore
reale o due autovalori complessi coniugati, perch´e queste caratteristiche de-
terminano comportamenti molto diversi delle soluzioni.
Per comodit`a, conviene operare un cambiamento di incognite della forma
_
x = pu + qv
y = ru + sv,
con p, q, r, s ∈ R: esso lascia fisso il punto (0, 0), trasforma intorni di (0, 0) in
intorni di (0, 0), deforma le orbite ma non ne altera il comportamento quali-
tativo attorno all’origine. Sceglieremo i coefficienti di questa trasformazione
in modo che il sistema trasformato prenda la forma pi` u semplice possibile
(forma canonica): laddove possibile, ci`o corrisponder`a a diagonalizzare la
matrice dei coefficienti.
Caso I: gli autovalori λ
1
e λ
2
sono reali, distinti e non nulli, ovvero il di-
scriminante (a −d)
2
+ 4bc `e positivo; supporremo λ
1
> λ
2
.
La matrice dei coefficienti `e diagonalizzabile. In particolare, poich´e ad−bc ,=
0, almeno uno fra d e c `e non nullo: possiamo supporre che sia c ,= 0 (altri-
menti ci si riduce a questo caso scambiando fra loro x e y). Allora `e facile
verificare che con la trasformazione
_
x = cu + (λ
1
−a)v
y = cu + (λ
2
−a)v
si porta il sistema in forma diagonale, e dunque il nostro sistema canonico `e
_
x
t
(t) = λ
1
x(t)
y
t
(t) = λ
2
y(t),
t ∈ R.
158
Le soluzioni, evidentemente, sono
x(t) = c
1
e
λ
1
t
, y(t) = c
2
e
λ
2
t
, t ∈ R.
Distinguiamo due sottocasi.
IA - λ
1
e λ
2
hanno lo stesso segno.
In questo caso la forma della traiettoria `e determinata dal numero γ = λ
2

1
,
in quanto per ciascuna orbita vi `e una costante K ≥ 0 tale che [y(t)[
λ
1
=
K[x(t)[
λ
2
, mentre il verso di percorrenza `e determinato dal segno di λ
1
e λ
2
.
Il punto critico si dice nodo; se le orbite sono orientate in direzione dell’origine
(caso (a), λ
2
< λ
1
< 0) il nodo `e asintoticamente stabile; se le orbite hanno
l’orientazione opposta (caso (b), 0 < λ
2
< λ
1
), il nodo `e instabile. Vi sono
quattro orbite particolari, che corrispondono alle scelte c
1
= 0 e c
2
= 0, e
percorrono le semirette dei due assi cartesiani; per le altre orbite, pensate
come curve cartesiane y = y(x) (si veda l’osservazione 2.5.6 che segue), vale
la relazione
dy
dx
=
y
t
x
t
= γ
y
x
= γ
c
2
e
λ
2
t
x
= γ
c
2
c
γ
1
(c
1
e
λ
1
t
)
γ
x
= γ
c
2
c
γ
1
x
γ−1
,
e dunque per x →0 risulta
dy
dx
(0) =
_
0 se γ > 1
+∞ se γ < 1.
Naturalmente γ nel nostro caso `e positivo e diverso da 1.
Osservazione 2.5.6 Un sistema
_
x
t
= f(x, y)
y
t
= g(x, y)
159
con f e g di classe C
1
`e equivalente, nei punti ove f(x, y)
2
+ g(x, y)
2
,= 0,
all’equazione
dy
dx
=
g(x, y)
f(x, y)
, oppure
dx
dy
=
f(x, y)
g(x, y)
.
Infatti, se si ha f(x
0
, y
0
)
2
+ g(x
0
, y
0
)
2
,= 0, e se (x(t), y(t)) passa per (x
0
, y
0
)
all’istante t
0
, in un intorno di t
0
la funzione vettoriale (x(t), y(t)) verifica
le ipotesi del teorema del rango (teorema 1.9.12): quindi in un intorno di
(x
0
, y
0
) possiamo ricavare t in funzione di x (se f(x
0
, y
0
) ,= 0) oppure in
funzione di y (se g(x
0
, y
0
) ,= 0). Supponendo ad esempio di essere nel primo
caso, si ha t = h(x) e
dt
dx
= h
t
(x(t)) =
1
x

(t)
in un intorno di t
0
; ne segue che
in un intorno di x
0
si ha y = y(t) = y(h(x)) e la funzione u(x) = y(h(x))
risolve
du
dx
= y
t
(h(x))h
t
(x) =
y
t
(t)
x
t
(t)
=
g(x(t), y(t))
f(x(t), y(t))
=
g(x, u(x))
f(x, u(x))
.
Viceversa, se y = u(x) `e soluzione di questa equazione differenziale, allora,
fissato x
0
e posto y
0
= u(x
0
), si ha necessariamente f(x
0
, y
0
) ,= 0: perci` o se
consideriamo la soluzione (x(t), y(t)) del problema di Cauchy
_
x
t
= f(x, y), y
t
= g(x, y)
x(t
0
) = x
0
, y(t
0
) = y
0
,
per quanto provato prima possiamo ricavare t = h(x) ed otteniamo che
y(h(x)) `e soluzione della stessa equazione risolta da u(x), e per di pi` u ri-
sulta y(h(x
0
)) = y(t
0
) = y
0
= u(x
0
): dunque, per unicit` a, y ◦ h = u, ov-
vero u(x(t)) = y(t). In definitiva i punti (x, u(x)) coincidono con i punti
(x(t), y(t)): cambia solo il parametro di riferimento.
IB - λ
1
e λ
2
hanno segno opposto.
In questo caso, λ
2
< 0 < λ
1
, le orbite
si avvicinano all’origine per poi allonta-
narsene. Il punto critico si dice punto di
sella ed `e instabile. Ciascuno degli assi
coordinati contiene due orbite, orienta-
te verso l’origine o al contrario a secon-
da che l’autovalore della corrisponden-
te equazione sia quello negativo o quel-
lo positivo: esse si dicono separatrici.
Ogni altra orbita ha come asintoti per
t →±∞ due delle separatrici.
160
Esempi 2.5.7 (1) Consideriamo il sistema
_
u
t
= −2u +
1
2
v
v
t
= 2u −2v.
L’equazione caratteristica `e
det
_
−2 −λ
1
2
2 −2 −λ
_
= (2 + λ)
2
−1 = 0
e gli autovalori sono λ
1
= −1, λ
2
= −3. L’origine `e dunque un nodo asinto-
ticamente stabile. La trasformazione per portare il nostro sistema in forma
canonica `e data da
_
x = 2u + v
y = 2u −v;
essa manda la retta v = 2u nell’asse delle ascisse y = 0 e la retta v = −2u
nell’asse delle ordinate x = 0. Il sistema canonico `e
_
x
t
= −x
y
t
= −3y
ed ha per soluzioni
x(t) = c
1
e
−t
, y(t) = c
2
e
−3t
, t ∈ R,
cosicch´e le orbite giacciono sulle curve y = cx
3
. Dal comportamento delle
orbite del sistema canonico (a) si deduce l’andamento di quelle del sistema
originale (b).
(2) Il sistema
_
u
t
= 2u −
3
2
v
v
t
= u −
3
2
v
161
ha autovalori λ
1
=
3
2
e λ
2
= −1: l’origine `e dunque un punto di sella. La
trasformazione da applicare `e
_
x = u −
1
2
v
y = u −3v
e con essa si ottiene il sistema canonico
_
x
t
=
3
2
x
y
t
= −y.
Le separatrici x = 0, y = 0 di questo sistema (a) corrispondono alle rette
v = 2u, v =
1
3
u del sistema originale (b).
Caso II: vi `e un solo autovalore reale λ =
a+d
2
non nullo, ovvero il discrimi-
nante (a −d)
2
+ 4bc `e nullo.
Si ha in particolare bc ≤ 0. Se b = c = 0, la matrice dei coefficienti `e diago-
nale con a = d = λ ed il sistema `e gi`a in forma diagonale, dunque canonica:
dunque con x = u e y = v si ha
_
x
t
= λx
y
t
= λy.
Le orbite sono rettilinee e l’origine `e un punto a stella, asintoticamente stabile
se λ < 0 (a), instabile se λ > 0 (b).
162
Se uno solo fra c e b `e nullo, si ha ancora a = d = λ, ma la matrice non `e
diagonalizzabile: con la trasformazione
_
x =
1
b
u
y = v
se b ,= 0,
_
x = u
y =
1
c
v
se c ,= 0,
si arriva al sistema canonico
_
x
t
= ax + y
y
t
= ay,
se b ,= 0,
_
x
t
= ax
y
t
= x + ay
se c ,= 0.
I due sistemi, naturalmente, sono uguali a meno di scambiare x con y.
Infine, se b, c sono entrambi non nulli, la trasformazione da utilizzare `e, ad
esempio,
_
x =
1
b
u
y =
a−d
2b
u + v,
e il sistema canonico `e
_
x
t
= λx + y
y
t
= λy;
le soluzioni sono
x(t) = (c
1
+ c
2
t)e
λt
, y(t) = c
2
e
λt
, t ∈ R.
Due orbite sono contenute nell’asse x, per c
2
= 0; le altre orbite sono tutte
tangenti nell’origine all’asse x. L’origine `e un nodo improprio, asintotica-
mente stabile se λ < 0 (a), instabile se λ > 0 (b). Derivando x(t) si vede
che la retta lungo la quale x(t) cambia direzione, cio`e l’isoclina x
t
= 0, ha
equazione y = −λx.
163
Caso III: vi sono due autovalori complessi coniugati λ
1
= α+iβ, λ
2
= α−iβ,
con α, β ∈ R e β ,= 0, ovvero il discriminante (a −d)
2
+ 4bc `e negativo.
I coefficienti b e c sono necessariamente non nulli. La matrice `e diagonalizza-
bile, ma poich´e vogliamo un sistema canonico a coefficienti reali, utilizziamo
la trasformazione
_
x = cu + (α −a)v
y = βv
che porta il sistema, come si pu` o verificare, alla forma canonica seguente:
_
x
t
= αx −βy
y
t
= βx + αy.
Per lo studio di questo sistema `e utile passare a coordinate polari: posto
x(t) = r(t) cos ϑ(t), y(t) = r(t) sin ϑ(t),
cosicch´e
r(t)
2
= x(t)
2
+ y(t)
2
, tan ϑ(t) =
y(t)
x(t)
se x(t) ,= 0,
derivando queste relazioni rispetto a t si trova
2rr
t
= 2xx
t
+ 2yy
t
, (1 + tan
2
ϑ)ϑ
t
=
xy
t
−x
t
y
x
2
.
Sostituendo in queste equazioni le espressioni di x
t
e y
t
fornite dal sistema,
si arriva facilmente a
_
r
t
= αr
ϑ
t
= β,
164
da cui
r(t) = c
1
e
αt
, ϑ(t) = βt + c
2
, t ∈ R.
La forma delle traiettorie dipende dal segno di α: si hanno spirali che si
stringono per α < 0 (a) e che si allargano per α > 0 (c), circonferenze per
α = 0 (b). Invece il segno di β determina il verso di avvolgimento intorno al
punto critico. Nel caso (a) l’origine si dice fuoco ed `e asintoticamente stabile,
nel caso (c) l’origine `e un fuoco instabile, mentre nel caso (b) si dice che
l’origine `e un centro: le orbite hanno la forma
x(t) = c
1
cos(βt + c
2
), y(t) = c
1
sin(βt + c
2
), t ∈ R,
e sono periodiche di periodo

β
; il punto critico `e stabile ma non asintotica-
mente stabile. Si noti che questo `e il solo caso in cui un sistema lineare ha
traiettorie periodiche.
Esempi 2.5.8 (1) Il sistema
_
u
t
= u −v
v
t
= 5u −v
ha autovalori λ
1
= 2i, λ
2
= −2i. Con la trasformazione x = 5u − v, y = 2v
il sistema diventa
_
x
t
= −2y
y
t
= 2x
e le sue orbite (a) sono circonferenze x
2
+y
2
= C
2
, corrispondenti alle traiet-
torie ellittiche (b), di equazione (5x −y)
2
+4y
2
= C
2
, del sistema originario.
165
(2) Il sistema
_
u
t
= −v
v
t
= 5u −2v
ha autovalori λ
1
= −1 + 2i, λ
2
= −1 − 2i. Con la stessa trasformazione di
prima si ha il sistema canonico
_
x
t
= −x −2y
y
t
= 2x + y.
Le orbite di questo sistema (a), come quelle del sistema originario (b), sono
spirali che si avvolgono in verso antiorario. L’origine `e un fuoco asintotica-
mente stabile.
Possiamo riassumere tutti i risultati ottenuti nell’enunciato seguente:
Teorema 2.5.9 Sia A =
_
a b
c d
_
una matrice reale con determinante non
nullo. Il sistema
_
u
t
= au + bv
v
t
= cu + dv
ha l’origine come unico punto critico. Esso `e:
166
(i) stabile, se gli autovalori di A sono immaginari puri;
(ii) asintoticamente stabile, se gli autovalori di A sono reali ed entrambi
negativi, oppure complessi con parte reale negativa,
(iii) instabile negli altri casi.
Dalla discussione precedente segue che le caratteristiche qualitative e di sta-
bilit` a del punto critico dipendono unicamente dagli autovalori di A, i quali
sono funzioni dei coefficienti a, b, c, d della metrice.
`
E naturale allora chie-
dersi in che modo piccole perturbazioni dei coefficienti possano influire sulla
stabilit` a delle soluzioni.
Vi sono due casi critici da questo punto di vista. Il primo riguarda il caso
di autovalori immaginari puri: l’origine `e un centro e le orbite sono curve
chiuse, ma se una piccola perturbazione porta gli autovalori fuori dall’asse
immaginario, l’origine diventa un fuoco e le traiettorie diventano spirali, sta-
bili o instabili.
Nella figura sono disegnate le orbite dei sistemi
(a)
_
x
t
= x −2y
y
t
= x −y,
(b)
_
x
t
= 1.01x −2y
y
t
= x −y.
Il secondo caso critico si riferisce al caso di due autovalori (reali) uguali:
l’origine `e un nodo improprio. Anche in questo caso, una piccola perturba-
zione dei coefficienti pu`o renderli, ad esempio, complessi coniugati, alterando
radicalmente la forma delle orbite e rendendo l’origine un fuoco (ma non
modificandone, in questo caso, l’instabilit`a o la asintotica stabilit` a).
167
Sistemi non lineari
Abbiamo visto come il comportamento di un sistema lineare a coefficienti
costanti dipenda dagli autovalori della matrice dei coefficienti. Nel caso di
sistemi non lineari del tipo
_
x
t
= f(x, y)
y
t
= g(x, y),
la situazione naturalmente `e molto pi` u complicata e ci limiteremo allo studio
del comportamento locale delle orbite del sistema attorno ad un punto sta-
zionario isolato; l’aggettivo “locale” si riferisce al fatto che, a differenza che
nel caso lineare, per i sistemi non lineari la convergenza delle orbite verso un
punto critico stabile avviene solo per quelle che partono “abbastanza vicino”
ad esso: questo insieme di punti iniziali si chiama bacino di attrazione del
punto critico. A meno di traslazioni ci si pu`o ridurre al caso in cui il pun-
to critico sia (0, 0): dunque supporremo che f, g siano funzioni di classe C
1
definite su un aperto A ⊆ R
2
, tali che
f(0, 0) = g(0, 0) = 0, f(x, y)
2
+ g(x, y)
2
,= 0 per 0 < x
2
+ y
2
< r
2
,
per un opportuno r > 0.
La nomenclatura che occorre per descrivere il comportamento delle orbite `e
simile a quella utilizzata per i sistemi lineari. Sia C un’orbita del sistema so-
pra scritto, descritta dalle funzioni (x(t), y(t)): passando a coordinate polari,
si ha
x(t) = r(t) cos ϑ(t), y(t) = r(t) sin ϑ(t).
Supponiamo che esista un intorno U di (0, 0) tale che
• tutte le traiettorie passanti per punti di U siano definite per t ∈ R,
• si abbia lim
t→+∞
r(t) = 0, oppure lim
t→−∞
r(t) = 0;
168
se per ciascuna traiettoria si ha anche lim
t→+∞
[ϑ(t)[ = ∞ oppure lim
t→−∞
[ϑ(t)[ =
∞, diremo che (0, 0) `e un fuoco (a), asintoticamente stabile nel primo caso,
instabile nel secondo; se vi `e una costante c tale che, per ciascuna traiettoria
salvo due sole, si ha lim
t→+∞
ϑ(t) = c oppure lim
t→−∞
ϑ(t) = c, il punto (0, 0) si
dice nodo (b), asintoticamente stabile o instabile.
Se invece vi sono due traiettorie per le quali lim
t→+∞
r(t) = 0, due altre per cui
lim
t→−∞
r(t) = 0, mentre tutte le altre transitano in U solo durante un intervallo
limitato ]t
1
, t
2
[, allora diremo che (0, 0) `e punto di sella (c).
Un metodo molto naturale per studiare le orbite attorno al punto stazionario
(0, 0) `e quello di “linearizzare” il problema, utilizzando lo sviluppo di Taylor
delle funzioni f(x, y) e g(x, y) nell’origine. Posto a = f
x
(0, 0), b = f
y
(0, 0),
c = g
x
(0, 0), d = g
y
(0, 0), il sistema lineare
_
x
t
= ax + by
y
t
= cx + dy
si dice sistema linearizzato relativo al sistema originale, il quale potr`a essere
riscritto nella forma
_
x
t
= ax + by + ϕ(x, y)
y
t
= cx + dy + ψ(x, y),
con ϕ(x, y) e ψ(x, y) infinitesimi di ordine superiore a
_
x
2
+ y
2
per (x, y) →
(0, 0). Il comportamento locale delle orbite del sistema non lineare risulta,
in molti casi ma non in tutti, strettamente collegato a quello delle orbite del
sistema linearizzato. Vale infatti il seguente risultato:
Teorema 2.5.10 (di linearizzazione) Supponiamo che (0, 0) sia un punto
critico isolato per il sistema non lineare sopra scritto. Se il sistema linea-
rizzato ha in (0, 0) un fuoco, o un nodo, o un punto di sella, allora (0, 0) `e
un punto dello stesso tipo anche per il sistema non lineare; se inoltre (0, 0)
`e asintoticamente stabile, o instabile, per il sistema linearizzato, tale resta
anche per il sistema non lineare.
Si noti che il teorema non considera il caso in cui il sistema linearizzato ha
un centro o un nodo improprio, in accordo col fatto che in tali casi, come
sappiamo, una piccola perturbazione dei coefficienti modifica radicalmente la
natura del punto critico. In tutti gli altri casi, per` o, i termini non lineari ag-
giuntivi ϕ(x, y) e ψ(x, y) non alterano n´e la stabilit`a, n´e la natura del punto
169
critico, consentendo di determinare le caratteristiche qualitative delle orbite
attraverso l’esame del sistema linearizzato, il che `e assai pi` u semplice.
Dimostrazione Proviamo anzitutto la seconda parte dell’enunciato: sup-
poniamo che l’origine sia asintoticamente stabile per il sistema linearizzato.
Scriviamo i due sistemi in forma vettoriale:
u
t
= Au, u
t
= Au +ΦΦΦ(u), con lim
[u[
2
→0
[ΦΦΦ(u)[
2
[u[
2
= 0.
Il fatto che (0, 0) sia asintoticamente stabile per il sistema linearizzato signifi-
ca che gli autovalori della matrice A hanno parte reale strettamente negativa;
in particolare la matrice e
tA
decade esponenzialmente a 0 per t →+∞(eser-
cizio 2.5.8): dunque esistono M, ν > 0 tali che |e
tA
|
/
2
≤ M e
−νt
per ogni
t ≥ 0. Sia allora x(t) = (x(t), y(t)) un’orbita del sistema non lineare, che
per t = t
0
si trovi nel punto x
0
= (x
0
, y
0
). Possiamo scrivere, nell’intervallo
temporale I in cui x(t) `e definita,
x(t) = e
(t−t
0
)A
x
0
+
_
t
t
0
e
(t−s)A
ΦΦΦ(x(s)) ds,
da cui, posto r
0
= [x
0
[
2
,
[x(t)[
2
≤ r
0
e
−ν(t−t
0
)
+
_
t
t
0
e
−ν(t−s)
[ΦΦΦ(x(s))[
2
ds ∀t ∈ I.
Fissiamo adesso δ ∈]0, 1[ tale che si abbia
[ΦΦΦ(x)[
2

ν
2
r per [x[
2
= r ≤ 2δ.
Se prendiamo [x
0
[
2
= r
0
≤ δ, per continuit` a esiste T
0
∈ I, T
0
> t
0
tale che
[x(t)[
2
≤ 2δ per ogni t ∈ [t
0
, T
0
]. Ponendo allora
T = sup¦T
0
> t
0
: [x(t)[
2
≤ 2δ ∀t ∈ [t
0
, T
0
]¦,
si ottiene che vale la disuguaglianza
[x(t)[
2
≤ e
−ν(t−t
0
)
δ +
_
t
t
0
e
−ν(t−s)
ν
2
2δ ds ∀t ∈ [t
0
, T],
ossia, calcolando l’integrale,
[x(t)[
2
≤ δ ∀t ∈ [t
0
, T].
170
Per definizione, si deduce che T = sup I. Da questa maggiorazione a priori
segue che sup I = +∞, e quindi otteniamo
[x(t)[
2
≤ e
−ν(t−t
0
)
δ +
ν
2
_
t
t
0
e
−ν(t−s)
[x(s)[
2
ds ∀t ≥ t
0
,
ovvero, posto v(t) = e
ν(t−t
0
)
[x(t)[
2
e ricordando che δ < 1,
v(t) ≤ 1 +
ν
2
_
t
t
0
v(s) ds ∀t ≥ t
0
.
Dal lemma di Gronwall (lemma 2.2.6) segue allora
v(t) ≤ e
ν
2
(t−t
0
)
∀t ≥ t
0
,
ossia
[x(t)[
2
≤ e
−νt
v(t) ≤ e

ν
2
(t−t
0
)
∀t ≥ t
0
:
dunque [x(t)[
2
→ 0 per t → +∞. Ci` o prova che (0, 0) `e asintoticamente
stabile per il sistema non lineare.
Se avessimo supposto l’origine instabile per il sistema linearizzato, avremmo
ottenuto analogamente [x(t)[
2
→0 per t →−∞.
Proviamo adesso la prima parte dell’enunciato, limitandoci al caso in cui
(0, 0) `e un fuoco: il caso del nodo e del punto di sella sono molto pi` u laboriosi
e li tralasciamo.
Come sappiamo, il sistema linearizzato si porta in forma canonica con la so-
stituzione x = Bu, ove B `e un’opportuna matrice invertibile. Consideriamo
dunque i sistemi equivalenti
x
t
= BAB
−1
x, x
t
= BAB
−1
x +BΦΦΦ(B
−1
x),
ove, ponendo ΨΨΨ(x) = BΦΦΦ(B
−1
x), si ha
lim
[x[
2
→0
[ΨΨΨ(x)[
2
[x[
2
= 0.
Se (0, 0) `e un centro per il sistema linearizzato, la matrice dei coefficienti ha
due autovalori complessi coniugati α ±iβ e
BAB
−1
=
_
α −β
β α
_
,
171
Il sistema non lineare, in forma canonica, `e
_
x
t
= αx −βy + γ(x, y)
y
t
= βx + αy + η(x, y),
ove γ e η sono infinitesime per (x, y) →(0, 0) di ordine superiore a
_
x
2
+ y
2
.
Sia x(t) = (x(t), y(t)) un’orbita del sistema non lineare, che per t = t
0
si
trovi in x
0
= (x
0
, y
0
). Scriviamo x(t) = r(t) cos ϑ(t) e y(t) = r(t) sin ϑ(t):
derivando l’equazione tan ϑ(t) =
y(t)
x(t)
si ricava l’equazione differenziale
(1 + tan
2
ϑ)ϑ
t
=
xy
t
−x
t
y
x
2
, ovvero ϑ
t
=
xy
t
−x
t
y
x
2
+ y
2
,
da cui, facilmente,
ϑ
t
= β +
1
r
(η(x, y) cos ϑ −γ(x, y) sin ϑ) = β + ϕ(x, y),
ove
lim
r→0
ϕ(x, y) = 0.
Si ricava allora
ϑ(t) = ϑ
0
+ β(t −t
0
) +
_
t
t
0
ϕ(x(s), y(s)) ds,
ove ϑ
0
`e legato a (x
0
, y
0
) dalle relazioni x
0
= r
0
cos ϑ
0
e y
0
= r
0
sin ϑ
0
. Sup-
poniamo, per fissare le idee, che α < 0 (ossia che (0, 0) sia un fuoco asinto-
ticamente stabile per il sistema linearizzato). Fissiamo δ ∈]0, 1[ tale che si
abbia
[ϕ(x, y)[ ≤
[β[
2
per
_
x
2
+ y
2
= r ≤ 2δ.
Se prendiamo r
0
≤ δ, come nella dimostrazione del secondo enunciato dedu-
ciamo che r(t) ≤ 2δ per ogni t > t
0
; ne segue
[ϑ(t) −ϑ
0
[ ≥ [β(t −t
0
)[ −
_
t
t
0
[β[
2
ds
e in particolare
[ϑ(t)[ ≥
(t −t
0
)[β[
2
−[ϑ
0
[ ∀t > t
0
.
172
Dunque [ϑ(t)[ → ∞ per t → +∞. L’orbita tende verso l’origine lungo una
spirale che gira in verso antiorario se β > 0, orario se β < 0. Naturalmente,
se avessimo supposto α > 0, con calcoli analoghi avremmo ottenuto
lim
t→−∞
[ϑ(t)[ = +∞,
con spirali orarie o antiorarie a seconda del segno di β. Ci`o prova che (0, 0) `e
un fuoco (asintoticamente stabile oppure instabile) anche per il sistema non
lineare.
Esempi 2.5.11 (1) Sia α ∈ R. Consideriamo il sistema
_
x
t
= −x + e
αy
−1
y
t
= e
x−y
−1.
L’unico punto stazionario `e (0, 0). Il sistema linearizzato `e
_
x
t
= −x + αy
y
t
= x −y,
la corrispondente equazione caratteristica `e (−1 −λ)
2
−α = 0, gli autovalori
sono
λ = −1 ±

α se α ≥ 0, λ = −1 ±i

−α se α < 0.
In virt` u del teorema di linearizzazione, se α < 0 l’origine `e un fuoco asinto-
ticamente stabile, se 0 < α < 1 l’origine `e invece un nodo asintoticamente
stabile, e infine se α > 1 l’origine `e un punto di sella. Non possiamo conclu-
dere nulla quando α = 0 e α = 1. Nella figura sottostante sono disegnate le
orbite del sistema nei casi α = −1, α = 1/2, α = 2.
(2) Un pendolo semplice `e costituito da una massa m ancorata ad un pun-
to O per mezzo di un’asta di lunghezza e di peso trascurabile. Se questo
173
sistema si muove in un piano verticale, la sua posizione `e individuata dal-
l’angolo x che l’asta forma con la verticale, e lo stato del sistema al tempo t
`e completamente descritto dalle funzioni x(t) e x
t
(t), che denotano posizio-
ne e velocit`a angolare all’istante t. Supponendo che sul pendolo agisca una
forza viscosa proporzionale alla velocit`a, in base al secondo principio della
dinamica si ricavano le equazioni del pendolo smorzato:
_
x
t
= y
y
t
= −ky −
g

sin x.
I punti critici di questo sistema sono (nπ, 0), per ogni n ∈ Z. Nell’origine il
sistema linearizzato `e
_
x
t
= y
y
t
= −
g

x −ky,
ed i suoi autovalori sono
1
2
_
−k ±
_
k
2
−4g/
_
. Se supponiamo k
2
< 4g/
otteniamo che (0, 0) `e un fuoco asintoticamente stabile per il sistema linea-
rizzato e dunque anche per il sistema originario.
Utilizzando il cambiamento di variabile z = x − π si pu`o scrivere il sistema
linearizzato nel punto critico (π, 0):
_
z
t
= y
y
t
=
g

z −ky;
un’analisi simile alla precedente mostra che (0, 0) `e punto di sella per questo
sistema, cosicch´e (π, 0) `e punto di sella per il sistema del pendolo smorzato.
Il comportamento qualitativo delle orbite nell’intorno dei due punti critici
esaminati `e descritto nella figura sottostante.
174
Integrali primi
Il teorema di linearizzazione, se applicabile, fornisce un’accurata descrizione
locale delle orbite, ma non pu` o essere d’aiuto nella ricerca di una descrizione
qualitativa globale delle orbite. Per questi scopi `e utile la nozione di “integrale
primo” di un sistema differenziale.
Definizione 2.5.12 Sia A un aperto di R
2
. Una funzione U ∈ C
1
(A) si
dice integrale primo del sistema
_
x
t
= f(x, y)
y
t
= g(x, y)
se il gradiente di U non si annulla in A, salvo al pi` u nei punti critici del
sistema, e se per ogni orbita non costante (x(t), y(t)) contenuta in A si ha
d
dt
U(x(t), y(t)) = 0.
Vediamo alcune conseguenze di questa definizione. Se U `e un integrale primo,
consideriamo una curva di livello Γ:
Γ = ¦(x, y) ∈ A : U(x, y) = k¦.
Se (x
0
, y
0
) ∈ Γ, allora dalla definizione segue che l’intera orbita passante
per (x
0
, y
0
) `e contenuta in Γ. Quindi Γ `e unione (disgiunta, per unicit` a) di
orbite. Inoltre `e facile verificare che una funzione U ∈ C
1
(A), con gradiente
non nullo salvo al pi` u nei punti critici di A, `e un integrale primo se e solo se
risulta
f(x, y)U
x
(x, y) + g(x, y)U
y
(x, y) = 0
in ogni punto (x, y) ∈ A che non sia critico. Infatti, se U `e un integrale primo
allora, fissato un punto (x, y) ∈ A non critico e detta (x(t), y(t)) l’orbita che
per t = 0 passa per tale punto, si ha per ogni t
0 =
d
dt
U(x(t), y(t)) = U
x
x
t
+ U
y
y
t
= U
x
f + U
y
g,
e scelto t = 0 si trova f(x, y)U
x
(x, y) +g(x, y)U
y
(x, y) = 0. Viceversa, se vale
questa relazione in ogni punto non critico di A, allora lungo ogni orbita non
costante si ha
d
dt
U(x(t), y(t)) = U
x
x
t
+ U
y
y
t
= U
x
f + U
y
g = 0,
175
e dunque U `e un integrale primo.
La denominazione “integrale primo” nasce dal fatto che per determinarlo si
pu` o utilizzare una delle equazioni differenziali
dy
dx
=
g(x, y)
f(x, y)
se f(x, y) ,= 0,
dx
dy
=
f(x, y)
g(x, y)
se g(x, y) ,= 0.
Infatti, se U `e un integrale primo allora U
x
f + U
y
g = 0; quindi ogni funzio-
ne y(x) definita implicitamente dall’equazione U(x, y) = k soddisfa, per il
teorema del Dini,
y
t
(x) = −
U
x
U
y
=
g(x, y)
f(x, y)
.
Viceversa, una soluzione y(x) dell’equazione y
t
= g/f sar` a espressa, general-
mente in forma implicita, tramite un’espressione della forma U(x, y) = k; ne
segue
0 =
d
dx
U(x, y(x)) = U
x
+ U
y
y
t
= U
x
+ U
y
g
f
=
1
f
(fU
x
+ gU
y
),
cosicch´e U `e un integrale primo. Il discorso `e del tutto analogo se si considera
una soluzione x(y) di x
t
= f/g.
Esempio 2.5.13 Consideriamo il sistema
_
x
t
= y
y
t
= −x + x
3
,
i cui punti critici sono (0, 0), (1, 0) e (−1, 0). L’equazione differenziale
dy
dx
=
−x + x
3
y
, y ,= 0,
`e a variabili separabili e si integra con facilit` a. La soluzione, in forma
implicita, `e
x
2

x
4
2
+ y
2
= c.
Ne segue che U(x, y) = x
2

x
4
2
+ y
2
`e un integrale primo del sistema,
definito su tutto R
2
. Le curve di livello sono i grafici delle funzioni y =
±
_
c −x
2
(1 −x/2); su queste curve giacciono le orbite del sistema, l’orien-
tazione delle quali si determina sulla base della prima equazione x
t
= y (la x
176
cresce nei punti del semipiano superiore). In particolare, la curva di livello
c = 1/2 si pu` o scrivere nella forma
(x
2
−1 −

2y)(x
2
−1 +

2y) = 0,
e quindi `e costituita da due parabole,
di equazioni y = ±
x
2
−1

2
. Essa contiene
i punti critici (±1, 0) ed `e formata da 8
orbite disgiunte.
Il comportamento del sistema nelle vi-
cinanze di (0, 0) non pu` o essere dedotto
dal teorema di linearizzazione, perch´e
il sistema linearizzato ha in (0, 0) un
centro. Tuttavia un’analisi diretta mo-
stra che per c ∈]0, 1/2[ le curve di li-
vello c sono curve chiuse, ossia orbite
periodiche: vale a dire, ogni soluzio-
ne (x(t), y(t)) passante per un punto
di una di esse vi rimane per ogni t, ha
per immagine l’intera curva e ripassa in
quel punto dopo un tempo finito.
A proposito delle orbite periodiche vale in generale un importante risultato,
la cui dimostrazione, seppure geometricamente intuitiva, richiede qualche
attenzione.
Teorema 2.5.14 Se U `e un integrale primo del sistema
_
x
t
= f(x, y)
y
t
= g(x, y),
e Γ = ¦(x, y) ∈ A : U(x, y) = k¦ `e una curva chiusa sulla quale non vi sono
punti critici del sistema, allora Γ `e un’orbita periodica.
Precisiamo cosa significa “curva chiusa”: `e un sottoinsieme limitato, chiuso
e connesso di A, che in ogni punto `e localmente grafico di una funzione di
classe C
1
.
Dimostrazione Sia (x, y) un punto di Γ: per esso certamente passa un’or-
bita non costante del sistema (perch´e in Γ non vi sono punti critici). Da-
to che U `e un integrale primo, in ogni punto (x(t), y(t)) dell’orbita si ha
177
U(x(t), y(t)) = U(x, y) = k, e quindi l’intera orbita C contenente (x, y) `e
inclusa in Γ.
Proviamo che C = Γ. Anzitutto osserviamo che C `e un chiuso: infatti se
(˜ x, ˜ y) `e un punto di C ¸ C (e in particolare, per quanto gi` a provato, esso
appartiene al chiuso Γ), allora esiste una successione (x(t
n
), y(t
n
)) ⊂ C tale
che (x(t
n
), y(t
n
)) →(˜ x, ˜ y) per t →
˜
t oppure per t →+∞. Ma nel primo caso
avremmo (˜ x, ˜ y) = (x(
˜
t), y(
˜
t)) ∈ C, contro lipotesi, mentre nel secondo caso
dedurremmo che (˜ x, ˜ y) sarebbe un punto critico (esercizio 2.5.10), mentre Γ
non ne contiene.
Supponiamo adesso, per assurdo, che esista un punto (x
0
, y
0
) ∈ Γ ¸ C.
Poniamo
r
0
= inf¦r > 0 : B((x
0
, y
0
), r) ∩ C ,= ∅¦,
e notiamo che r
0
`e in effetti un minimo. Quindi vi `e un punto (x

, y

) ∈
∂B((x
0
, y
0
), r
0
) ∩C (nel caso in cui r
0
= 0 si ha (x

, y

) = (x
0
, y
0
)). Conside-
riamo l’orbita C

passante per (x

, y

): essa `e inclusa in Γ e interseca neces-
sariamente sia la palla aperta B((x
0
, y
0
), r
0
), sia C; di conseguenza C
t
⊆ C
e dunque C interseca B((x
0
, y
0
), r
0
). Ci` o `e assurdo per definizione di r
0
.
Adesso proviamo che C `e un’orbita periodica. Fissiamo (x(t
0
), y(t
0
)) ∈ C e
supponiamo che sia (x(t), y(t)) ,= (x(t
0
), y(t
0
)) per ogni t > t
0
: per compat-
tezza, possiamo estrarre una successione ¦(x(t
n
), y(t
n
))¦ ⊂ C, ove t
n
→+∞
per n →∞, tale che (x(t
n
), y(t
n
)) →(˜ x, ˜ y) ∈ Γ per n →∞. Ma ci`o `e impos-
sibile, perch´e (˜ x, ˜ y) sarebbe un punto critico (esercizio 2.5.10), mentre Γ non
ne contiene. Dunque deve esistere un T > 0 tale che (x(t
0
+T), y(t
0
+T)) =
(x(t
0
), y(t
0
)), e ci` o implica che C `e un’orbita periodica.
Esempi 2.5.15 (1) Il sistema
_
x
t
= 2y(y −2x)
y
t
= (1 −x)(y −2x)
ha come punti critici tutti i punti della retta y = 2x e il punto (1, 0).
L’equazione
dy
dx
=
(1 −x)(y −2x)
2y(y −2x)
=
1 −x
2y
se y ,= 2x, y ,= 0
ha come soluzione, in forma implicita, (1 − x)
2
+ 2y
2
= c; si tratta di ellissi
centrate in (1, 0), curve di livello dell’integrale primo U(x, y) = (1−x)
2
+2y
2
.
178
Per 0 < k <
8
9
tali ellissi non in-
contrano la retta y = 2x, quindi
non vi sono punti critici su di es-
se e pertanto sono orbite periodi-
che. Per k ≥
8
9
, invece, le ellissi
contengono punti critici e sono co-
stituite da pi` u di un’orbita (due
se k =
8
9
, quattro se k >
8
9
). Il
verso di percorrenza si determina
analizzando il segno di x
t
e y
t
.
(2) Consideriamo il modello preda-predatore di Lotka-Volterra: supponiamo
che in una stessa nicchia ecologica siano presenti una specie di prede che al
tempo t conta x(t) esemplari ed una specie di predatori cha al tempo t conta
y(t) esemplari, ed ipotizziamo che:
• il tasso (relativo) di crescita delle prede sia pari ad una costante positiva
in assenza di predatori, ma decresca linearmente come funzione di y;
• il tasso (relativo) di crescita dei predatori sia pari ad una costante
negativa in assenza di prede, ma cresca linearmente come funzione di
x.
Sotto queste condizioni il sistema che ne risulta `e del tipo seguente:
_
x

x
= a −by
y

y
= −c + dx,
ovvero
_
x
t
= ax −bxy
y
t
= −cy + dxy,
con a, b, c, d numeri positivi.
Supponiamo per semplicit` a che sia a = b = c = d = 1; il sistema diventa
_
x
t
= x(1 −y)
y
t
= −y(1 −x).
I punti critici sono (0, 0) e (pi` u significativamente) (1, 1). Dal teorema di
linearizzazione segue facilmente che (0, 0) `e un punto di sella, mentre tale
teorema `e inefficace per quanto riguarda il punto (1, 1), che `e un centro per
il sistema linearizzato. Per` o si pu` o facilmente trovare un integrale primo:
dall’equazione
dy
dx
=
(x −1)y
x(1 −y)
,
179
separando le variabili e integrando, si trova
ln y −y = x −ln x + c,
ovvero (x e
−x
)(y e
−y
) = k; possiamo equivalentemente scrivere l’integrale
primo nella forma
U(x, y) = (x e
−x+1
)(y e
−y+1
).
La funzione ϕ(x) = x e
−x+1
ha massimo nel punto 1, con ϕ(1) = 1: quindi
U(x, y) ha massimo in (1, 1) e ci` o suggerisce che le curve di livello c, con
c < 1 sufficientemente vicino a 1, siano curve chiuse.
In effetti, notiamo che tali curve sono tutte simmetriche rispetto alla biset-
trice del primo quadrante. Poi, fissato c ∈]0, 1[ e detta Γ
c
la curva di livello c,
siano x
1
e x
2
i due numeri tali che ϕ(x
1
) = ϕ(x
2
) = c, con 0 < x
1
< 1 < x
2
;
allora i quattro punti (x
1
, 1), (x
2
, 1), (1, x
1
) e (1, x
2
) appartengono a Γ
c
.
Inoltre, per ogni x ∈]x
1
, x
2
[ esistono esat-
tamente due numeri y
1
(x), y
2
(x), tali che
ϕ(x)ϕ(y
1
(x)) = ϕ(x)ϕ(y
2
(x)) = c, con 0 <
y
1
(x) < 1 < y
2
(x): ne segue che i quat-
tro punti (x, y
1
(x)), (x, y
2
(x)), (y
1
(x), x),
(y
2
(x), x) appartengono a Γ
c
. Si vede subi-
to che le quantit` a y
1
(x) e y
2
(x) dipendono
con continuit` a da x, e tendono a 1 quando
x → x
1
e x → x
2
. Con queste considera-
zioni `e facile concludere che Γ
c
`e una curva
chiusa e quindi un’orbita periodica per ogni
c ∈]0, 1[.
Un sistema che, come quello del modello di Lotka-Volterra, ha un integrale
primo su tutto il piano, si dice conservativo. Il nome viene dalla meccanica:
per una particella di posizione x e quantit` a di moto y le equazioni del moto
hanno la forma
x
t
=
∂H
∂y
(x, y), y
t
= −
∂H
∂x
(x, y),
ove H(x, y) `e l’Hamiltoniana del sistema. Tale funzione `e un integrale primo
delle equazioni, poich´e lungo una traiettoria si ha
d
dt
H(x(t), y(t)) = H
x
x
t
+ H
y
y
t
= −y
t
x
t
+ x
t
y
t
= 0.
180
Dunque H `e una costante del moto, ossia `e una quantit` a che si conser-
va. Ad esempio, la legge di Newton unidimensionale d` a luogo all’equazione
differenziale x
tt
= f(x), che equivale al sistema
_
x
t
= y
y
t
= f(x).
La somma dell’energia cinetica T(y) = y
2
/2 e dell’energia potenziale U(x) =

_
x
0
f(ξ) dξ fornisce l’energia meccanica E(x, y) = T(y) + U(x); essa `e un
integrale primo del sistema, dato che lungo una traiettoria (x(t), y(t)) si ha
d
dt
E(x(t), y(t)) =
d
dt
T(y(t)) +
d
dt
U(x(t)) = yy
t
−f(x)x
t
= 0.
Dunque l’energia meccanica si conserva durante il moto.
Cicli limite
Nello studio delle orbite di un sistema non lineare pu`o comparire un fenomeno
nuovo rispetto al caso lineare: la presenza di orbite periodiche “isolate”. Per
capire come ci` o sia possibile, analizziamo subito un esempio.
Esempio 2.5.16 Consideriamo il sistema
_
x
t
= −y + x(1 −
_
x
2
+ y
2
)
y
t
= x + y(1 −
_
x
2
+ y
2
) :
utilizzando le coordinate polari = r cos ϑ, y = r sin ϑ esso prende la semplice
forma
_
r
t
= r(1 −r)
ϑ
t
= 1.
Chiaramente, (r(t), ϑ(t)) = (1, t) `e una soluzione del sistema la cui orbita `e
la circonferenza x
2
+ y
2
= 1. Per 0 < r < 1 si ha r
t
> 0, quindi le orbite
interne a tale circonferenza, essendo ϑ
t
= 1, vi si avvicinano lungo spirali
antiorarie; al contrario, per r > 1 `e r
t
< 0, e pertanto anche le orbite esterne
si avvicinano alla circonferenza secondo spirali antiorarie. Si dice che l’orbita
x
2
+ y
2
= 1 `e un ciclo limite del sistema.
181
In generale, si chiama ciclo limite
di un sistema differenziale un’or-
bita chiusa tale che in un suo in-
torno “tubolare” non vi siano al-
tre orbite chiuse. Un ciclo li-
mite pu` o essere stabile, se, come
nell’esempio precedente, le orbite
vicine si avvicinano ad esso per
t → +∞, o instabile, se se ne al-
lontanano, oppure semistabile, se
le orbite interne e quelle esterne
hanno comportamenti diversi.
Esempio 2.5.17 Il sistema r
t
= r(r − 1)(r − 2), ϑ
t
= 1 ha due cicli limite:
r = 1 `e stabile, r = 3 `e instabile, in quanto r
t
> 0 per 0 < r < 1 e per
r > 2. Invece il sistema r
t
= r(r − 1)
2
, ϑ
t
= 1 ha il ciclo limite r = 1 che `e
semistabile, in quanto r
t
> 0 per 0 < r < 1 e per r > 1.
Naturalmente i cicli limite non sono sempre circolari, n´e `e sempre possibile
determinarli passando a coordinate polari.
Esempio 2.5.18 Consideriamo l’equazione di Van der Pol, che governa l’in-
tensit` a di corrente in certi circuiti elettrici:
x
tt
−µ(1 −x
2
)x
t
+ x = 0,
ove µ `e un parametro positivo. Il sistema corrispondente
_
x
t
= y
y
t
= −x + µy(1 −x
2
)
ha il punto critico (0, 0), dove la linearizzazione porta a
_
x
t
= y
y
t
= −x + µy.
In quest’ultimo sistema non ci sono orbite periodiche: gli autovalori o sono
positivi (se µ
2
≥ 4), o hanno parte reale positiva (se µ
2
< 4), cosicch´e le
soluzioni si allontanano dall’origine per t → ∞. Per` o nell’equazione non
lineare vi `e un termine di “resistenza” −µ(1 − x
2
)x
t
che ha coefficiente ne-
gativo per [x[ < 1 (la corrente viene amplificata) e positivo per [x[ > 1 (la
182
corrente viene indebolita). Questa azione alternata del termine resistivo fa
sperare che il sistema possa avere soluzioni periodiche, che sono di grande
importanza dal punto di vista ingegneristico; in effetti, un ciclo limite esiste,
ma non `e affatto banale dimostrarlo. Le figure sottostanti mostrano le orbite
del sistema quando µ = 0.1 (a), µ = 1 (b), µ = 5 (c).
Il problema della determinazione dei cicli limite `e in generale molto difficile.
Vale in proposito il teorema seguente, non dimostrabile coi nostri mezzi:
Teorema 2.5.19 (di Poincar´e-Bendixon) Sia A ⊆ R
2
un aperto, siano
f, g ∈ C
1
(A) e sia (x(), y()) una soluzione del sistema non lineare
_
x
t
= f(x, y)
y
t
= g(x, y).
Supponiamo che l’insieme ¦(x(), y()) : t ≥ t
0
¦ sia contenuto in una regione
D ⊂ A chiusa e limitata, non contenente punti critici del sistema. Allora
(x(), y()) o `e periodica, oppure tende ad un ciclo limite del sistema.
Esercizi 2.5
1. Si verifichi che il comportamento qualitativo delle soluzioni delle equa-
zioni
u
t
(t) = u(t)(1 −u(t))
_
u(t) −
1
2
_
, u
t
(t) =
1
2
(u(t)
2
−1)
`e quello descritto nelle figure sottostanti.
183
2. Si consideri il sistema
_
x
t
(t) = ax(t) + by(t)
y
t
(t) = cx(t) + dy(t),
ove a, b, c, d sono costanti reali tali che ad − bc = 0. Si provi che si
verifica una delle seguenti tre situazioni:
(a) quando almeno due fra a, b, c, d sono non nulli, o quando b = c = 0
e a = 0, d ,= 0 oppure a ,= 0, d = 0, vi `e un’intera retta di punti
critici, le orbite sono rettilinee e trasversali a tale retta e tendono
ad essa per t →+∞ oppure per t →−∞;
(b) quando a = d = 0 e b = 0, c ,= 0 oppure b ,= 0, c = 0, vi `e una
retta di punti critici e le orbite sono parallele ad essa;
(c) quando a = b = c = d = 0, ogni punto del piano `e critico.
3. Descrivere la natura del punto critico (0, 0) dei seguenti sistemi lineari,
tracciandone approssimativamente le orbite:
(a)
_
x
t
= 3x + y
y
t
= −x + y,
(b)
_
x
t
= −x −y
y
t
= −y/4,
(c)
_
x
t
= 3x −2y
y
t
= 2x −2y,
(b)
_
x
t
= 3x −2y
y
t
= 4x −y.
4. Si consideri l’equazione delle oscillazioni smorzate
mu
tt
(t) + µu
t
(t) + ku = 0 :
si scriva un sistema di due equazioni del primo ordine nelle incognite
x = u, y = u
t
e si studi la stabilit` a del punto critico (0, 0) in funzione
dei parametri m, µ, k.
184
5. Si effettui la stessa analisi dell’esercizio precedente per l’equazione del
circuito oscillante
LQ
tt
+ RQ
t
+
1
C
Q = 0.
6. Dato il sistema lineare
_
x
t
= ax + by
y
t
= cx + dy,
si ponga p = a +d, q = ad −bc e ∆ = p
2
−4q. Si verifichi che il punto
critico (0, 0) `e:
(i) un nodo, se q > 0 e ∆ ≥ 0;
(ii) un punto di sella, se q < 0;
(iii) un fuoco, se p ,= 0 e ∆ < 0;
(iv) un centro, se p = 0 e q > 0,
e che tale punto `e asintoticamente stabile se e solo se q > 0 e p < 0.
7. Determinare un sistema lineare che abbia come soluzioni
x(t) = e
t
(cos t + 2 sin t), y(t) = e
−t
cos t
e descriverne qualitativamente le orbite.
8. Trovare i punti critici dei sistemi sotto elencati, scriverne i corrispon-
denti sistemi linearizzati e, quando possibile, analizzare il comporta-
mento qualitativo delle orbite in un intorno dei punti critici:
(a)
_
x
t
= y −3
y
t
= 2x + 2,
(b)
_
x
t
= y
y
t
= −sin x −y,
(c)
_
x
t
= −x + y
2
y
t
= y
2
−2y,
(d)
_
x
t
= 2x −y
2
y
t
= −y + xy.
(e)
_
x
t
= 2x −x
2
y
t
= −y + xy,
(f)
_
x
t
= y −x
3
y
t
= −x
5
.
9. Sia (x(), y()) una soluzione non costante del sistema
_
x
t
= f(x, y)
y
t
= g(x, y),
185
con f, g ∈ C
1
(R
2
). Si dimostri che se in un istante t
0
si ha
lim
t→t
0
x(t) = x
0
∈ R, lim
t→t
0
y(t) = y
0
∈ R,
allora (x
0
, y
0
) non `e un punto critico del sistema; se ne deduca che per
raggiungere, o abbandonare, un punto critico occorre un tempo infinito.
10. Sia (x(), y()) una soluzione non costante del sistema
_
x
t
= f(x, y)
y
t
= g(x, y),
con f, g ∈ C
1
(R
2
). Si dimostri che se
lim
t→+∞
x(t) = x
0
∈ R, lim
t→+∞
y(t) = y
0
∈ R,
e se (x
0
, y
0
) ∈ A, allora (x
0
, y
0
) `e un punto critico del sistema.
[Traccia: si osservi che per ogni n ∈ N si ha
x(t)−x(n)
t
→0 e
y(t)−y(n)
t

0 per t → +∞; si provi che ci`o implica x
t
(t) → 0 e y
t
(t) → 0 per
t →+∞, e se ne deduca la tesi.]
11. Dato il sistema _
_
_
x
t
= −x −
y
ln

x
2
+y
2
y
t
= −y +
x
ln

x
2
+y
2
,
si verifichi che (0, 0) `e un punto critico isolato, e che tale punto `e un
fuoco per il sistema originale ma `e un punto a stella per il sistema
linearizzato.
12. Si consideri il sistema
_
_
_
x
t
= −y + x(x
2
+ y
2
) sin
π

x
2
+y
2
y
t
= x + y(x
2
+ y
2
) sin
π

x
2
+y
2
.
Si verifichi che l’origine `e il solo punto critico e che le circonferenze C
n
di
centro (0, 0) e raggio
1
n
sono orbite periodiche. Passando a coordinate
polari si provi che le orbite passanti fra C
n
e C
n+1
sono a spirale, mentre
quelle esterne a C
1
sono illimitate, cosicch´e non vi sono altre orbite
chiuse.
186
13. Determinare gli integrali primi dei sistemi seguenti, provando poi a
disegnarne le orbite:
(a)
_
x
t
= x(1 + y)
y
t
= −y(1 + x),
(b)
_
x
t
= x(x e
y
−cos y)
y
t
= sin y −2x e
y
,
(c)
_
x
t
= y −x
2
y −y
3
y
t
= x
2
+ y
2
−1,
(d)
_
x
t
= 2x
2
y
y
t
= (y
2
+ 1)x.
14. Determinare le orbite periodiche dei sistemi
(a)
_
x
t
= −y(x
2
+ y
2
−4)
y
t
= 4(x −1)(x
2
+ y
2
−4),
(b)
_
¸
¸
_
¸
¸
_
x
t
= y +
x
_
x
2
+ y
2
(x
2
+ y
2
−2)
y
t
= −x +
y
_
x
2
+ y
2
(x
2
+ y
2
−2).
15. Si provi che i seguenti sistemi non hanno soluzioni periodiche non
costanti:
(a)
_
x
t
= −2x −3y −xy
2
y
t
= y + x
3
−x
2
y,
(b)
_
x
t
= x + y + x
3
−y
2
y
t
= −x + 2y + x
2
y +
1
3
y
3
.
16. Si provi che il sistema
_
x
t
= y
y
t
= −x + y(1 −3x
2
−2y
2
)
ha un ciclo limite nella regione
D =
_
(x, y) ∈ R
2
:
1
2

_
x
2
+ y
2

1

2
_
.
17. Si consideri l’equazione del pendolo
z
tt
−kz
t

g

sin z = 0.
Nel caso k = 0 (pendolo senza smorzamento) si determini un integrale
primo del corrispondente sistema e si dimostri che esistono orbite pe-
riodiche, giustificando cos`ı il comportamento delle orbite (a) riportato
187
qui sotto. Si studi anche il caso k > 0 (oscillazioni smorzate) e si giu-
stifichi il comportamento delle orbite (b).
188
Capitolo 3
Integrazione secondo Lebesgue
3.1 Motivazioni
Questo capitolo `e dedicato alla teoria della misura e dell’integrazione secondo
Lebesgue in una o pi` u variabili. Si potrebbe, pi` u semplicemente, estendere la
nozione di integrale di Riemann, descritta nel corso di Analisi I, al caso di pi` u
variabili; tuttavia la teoria di Riemann, seppure concettualmente semplice e
soddisfacente per molti aspetti, non `e abbastanza flessibile da consentire certe
operazioni che pure appaiono naturali: ad esempio, si ha
lim
n→∞
_
A
f
n
(x) dx =
_
A
lim
n→∞
f
n
(x) dx
solo se A `e un insieme misurabile limitato (ad esempio un intervallo) e se vi
`e convergenza uniforme delle funzioni f
n
(teorema 1.2.6). Inoltre, se ¦A
n
¦
`e una successione di insiemi misurabili disgiunti, la loro unione non `e ne-
cessariamente misurabile (esercizio 3.1.2) n´e, tanto meno, vale in generale la
relazione
m
_
_
n∈N
A
n
_
=

n∈N
m(A
n
)
(qui la misura di A `e data dall’integrale della funzione caratteristica, cio`e
m(A) =
_
b
a
I
A
(x) dx, essendo [a, b] un arbitrario intervallo contenente A).
Infine, le quantit`a
_
A
[f(x)[dx,
__
A
[f(x)[
2
dx
_1
2
189
non sono norme sullo spazio 1(A) delle funzioni integrabili secondo Riemann
su A (esempio 1.4.2(7)), ma solo - quando A `e compatto - sullo spazio C(A)
delle funzioni continue su A; tuttavia, tale spazio, munito di una qualunque
di tali norme, non `e completo (esercizio 1.7.4).
Vi sono poi altre, e pi` u importanti, motivazioni “a posteriori”: la teoria del-
l’integrazione secondo Lebesgue ha dato l’avvio ad enormi sviluppi nell’analisi
funzionale, nella teoria della probabilit`a, ed in svariatissime applicazioni (ri-
soluzione di equazioni differenziali, calcolo delle variazioni, ricerca operativa,
fisica matematica, matematica finanziaria, biomatematica, ed altre ancora).
Esercizi 3.1
1. Esibire una successione di funzioni ¦f
n
¦ definite su [a, b], Riemann-
integrabili in [a, b], puntualmente convergenti in [a, b], e tali che
lim
n→∞
_
b
a
f
n
(x) dx ,=
_
b
a
lim
n→∞
f
n
(x) dx.
2. Esibire una successione ¦A
n
¦ di sottoinsiemi di R, misurabili secondo
Riemann e disgiunti, tali che la loro unione non sia misurabile secondo
Riemann.
3.2 Rettangoli e plurirettangoli
L’integrazione secondo Riemann di funzioni di una variabile si fa usualmente
sugli intervalli limitati, o anche sugli intervalli illimitati nel caso di integrali
impropri. Per gli integrali di funzioni di pi` u variabili, la scelta degli insiemi
sui quali fare l’integrale, che chiameremo insiemi “misurabili”, `e molto pi` u
varia: gi` a nel caso di due variabili `e del tutto naturale richiedere che fra essi
figurino, ad esempio, poligoni, circonferenze, ellissi, nonch´e intersezioni ed
unioni di questi. Prima di definire l’integrale, quindi, conviene individuare
una classe, il pi` u possibile vasta, di insiemi misurabili, ed attribuire ad essi
una “misura”: la misura secondo Lebesgue. Questa misura dovr` a essere
dotata di certe propriet`a basilari: l’insieme vuoto avr`a misura nulla, ci sar`a
monotonia rispetto all’inclusione, e additivit`a sugli insiemi disgiunti. Come
vedremo, non si potr` a attribuire una misura a tutti i sottoinsiemi di R
N
, ma
la classe dei sottoinsiemi misurabili secondo Lebesgue sar` a comunque molto
190
ricca: ad esempio, per N = 1 essa risulter`a molto pi` u ampia di quella degli
insiemi misurabili secondo Riemann.
I “mattoni” con i quali si costruisce la misura di Lebesgue sono i rettangoli
N-dimensionali (intervalli, quando N = 1) e le loro unioni finite, i cosiddetti
plurirettangoli.
Un rettangolo in R
N
(N ≥ 1) `e un insieme R della forma
R =
N

i=1
I
i
= I
1
I
2
I
N
,
ove I
1
, . . . , I
N
sono intervalli limitati di R. Ricordando che la lunghezza (I)
di un intervallo I ⊂ R `e la differenza fra i due estremi, ossia
(I) =
_
b −a se ]a, b[⊆ I ⊆ [a, b],
+∞ se I `e illimitato,
`e naturale porre la seguente
Definizione 3.2.1 La misura N-dimensionale di un rettangolo R =

N
i=1
I
i
`e
m
N
(R) =
N

i=1
(I
i
).
Ricordiamo che se E `e un sottoinsieme di R
N
, la parte interna

E di E, la
chiusura E di E e la frontiera ∂E di E sono stati introdotti nella definizione
1.5.10.
Osservazioni 3.2.2 (1) Dalla definizione 3.2.1 segue subito che per ogni
rettangolo R ⊂ R
N
si ha
m
N
(R) = m
N
(R) = m
N
(

R).
(2) La misura m
N
`e additiva sulla famiglia dei rettangoli di R
N
: ci` o significa
che se un rettangolo R viene decomposto nell’unione finita di sottorettangoli
R
1
, . . . , R
n
, privi di punti interni comuni, allora si ha
m
N
(R) =
n

i=1
m
N
(R
i
).
191
La verifica consiste in un noioso calcolo per il quale rimandiamo all’esercizio
3.2.2.
Poich´e la classe dei rettangoli di
R
N
`e chiusa rispetto all’interse-
zione, ma non rispetto all’unio-
ne n´e alla differenza, conviene in-
trodurre i plurirettangoli di R
N
,
cio`e gli insiemi P ⊂ R
N
che sono
unione finita di rettangoli.
`
E facile verificare che se P, Q sono plurirettangoli, allora P ∩Q, P ∪Q, P ¸Q
sono plurirettangoli. Si noti che, per definizione, ogni plurirettangolo `e un
insieme limitato.
Osserviamo che, dato un plurirettangolo P, non `e restrittivo supporre che es-
so sia unione finita di rettangoli disgiunti (naturalmente, tali rettangoli non
saranno in generale tutti chiusi). Comunque, anche in questo caso, la decom-
posizione di un plurirettangolo in sottorettangoli disgiunti non `e unica.
`
E naturale attribuire una misura ai plurirettangoli nel modo seguente:
Definizione 3.2.3 La misura N-dimensionale di un plurirettangolo P =

k
i=1
R
i
, ove gli R
i
sono rettangoli disgiunti, `e
m
N
(P) =
k

i=1
m
N
(R
i
).
192
Occorre per` o verificare che questa `e una buona definizione, nel senso che non
dipende dal modo in cui decomponiamo il plurirettangolo P in unione di
rettangoli disgiunti. In altre parole, se
P =
k
_
i=1
I
i
=
h
_
j=1
J
j
,
dove i J
j
sono rettangoli disgiunti diversi dagli I
i
, bisogna controllare che
risulti
k

i=1
m
N
(I
i
) =
h

j=1
m
N
(J
j
).
Questo si pu` o fare facilmente, “sovrapponendo” le due decomposizioni e con-
statando che, grazie all’additivit` a della misura per i rettangoli (osservazione
3.2.2(2)), entrambe le somme coincidono con
k

i=1
h

j=1
m
N
(I
i
∩ J
j
).
Si verifica poi che la misura `e ancora additiva sulla classe dei plurirettangoli,
cio`e che se P, Q sono plurirettangoli disgiunti, allora m
N
(P ∪Q) = m
N
(P)+
m
N
(Q). Pi` u in generale, se P e Q sono plurirettangoli qualunque, vale la
subadditivit`a, ovvero m
N
(P ∪ Q) ≤ m
N
(P) + m
N
(Q) (si veda l’esercizio
3.2.3). Inoltre m
N
`e monotona: se P e Q sono plurirettangoli con P ⊆ Q,
allora m
N
(P) ≤ m
N
(Q) (facile verifica). Infine, come ovvia conseguenza
della definizione, m
N
`e invariante per traslazioni: se P `e un plurirettangolo
e Q = P +x
0
= ¦x ∈ R
N
: x −x
0
∈ P¦, allora anche Q `e un plurirettangolo
e m
N
(Q) = m
N
(P).
193
Esercizi 3.2
1. Se E, F sono sottoinsiemi di uno spazio metrico, si provi che
∂(E ∪ F) ⊆ ∂E ∪ ∂F, ∂(E ∩ F) ⊆ ∂E ∪ ∂F, ∂(E ¸ F) ⊆ ∂E ∪ ∂F.
2. Si verifichi che se I =

N
i=1
[a
i
, b
i
] `e un rettangolo di R
N
e si ha I =

k
j=1
I
j
, ove gli I
j
=

N
i=1
[a
ij
, b
ij
] sono rettangoli privi di punti interni
comuni, allora risulta
m
N
(I) =
k

j=1
m
N
(I
j
).
[Traccia: si provi dapprima la tesi nel caso di una decomposizione coor-
dinata, cio`e nella situazione seguente: per i = 1, . . . , N esistono dei nu-
meri x
i,0
, . . . , x
i,p
i
, con a
i
= x
i,0
< x
i,1
< . . . < x
i,p
i
= b
i
, tali che, posto
H = ¦h ∈ N
N
: 0 ≤ h
i
< p
i
, i = 1, . . . , N¦ e I
h
=

N
i=1
[x
i,h
i
, x
i,h
i
+1
],
risulta I =

h∈H
I
h
e gli I
h
non hanno punti interni in comune. Si
passi poi al caso generale osservando che se I =

k
j=1

N
i=1
[a
ij
, b
ij
], per
i = 1, . . . , N possiamo mettere in ordine crescente i numeri a
i1
, . . . , a
iN
e ridenominarli come a
i
= x
i,0
< x
i,1
< . . . < x
i,p
i
= b
i
; in questo
modo si individua una decomposizione coordinata di intervalli I
h
=

N
i=1
[x
i,h
i
, x
i,h
i
+1
], con 0 ≤ h
i
≤ p
i
, tale che ciascun I
j
`e l’unione di un
numero finito di intervalli della decomposizione. Si deduca allora che

k
j=1
m
N
(I
j
) =

h∈H
m
N
(I
h
) = m
N
(I).]
3. Siano P,Q plurirettangoli di R
N
. Si provi che
m
N
(P ∪ Q) = m
N
(P) + m
N
(Q) −m
N
(P ∩ Q).
194
3.3 Misura interna e misura esterna
Come si `e gi`a osservato, vogliamo poter “misurare” insiemi molto pi` u gene-
rali dei plurirettangoli. L’idea `e di riuscire ad attribuire una misura a tutti
gli insiemi che siano, in un senso opportuno, approssimabili tramite fami-
glie numerabili di plurirettangoli. Cominceremo con l’attribuire una misura
agli aperti ed ai compatti di R
N
.
`
E chiaro che ogni aperto non vuoto di
R
N
contiene qualche plurirettangolo: ha quindi senso approssimare l’aperto
dall’interno con plurirettangoli. Similmente, poich´e ogni compatto `e incluso
in qualche rettangolo, ha senso approssimare un compatto dall’esterno con
plurirettangoli.
Successivamente estenderemo la misura ad una vasta classe di insiemi limi-
tati, vale a dire quelli che sono ben approssimabili dall’esterno con aperti e
dall’interno con compatti: queste propriet`a si esprimeranno con le nozioni di
“misura esterna” e di “misura interna”.
Secondo quanto detto sopra, detta T
N
la classe di tutti i plurirettangoli di
R
N
, definiamo la misura di un aperto:
Definizione 3.3.1 Se A `e un aperto di R
N
, la sua misura N-dimensionale
`e data da
m
N
(A) =
_
0 se A = ∅
sup¦m
N
(P) : P ∈ T
N
, P ⊂ A¦ se A ,= ∅.
Osservazioni 3.3.2 (1) Se A `e un plurirettangolo aperto, la definizione di
m
N
(A) ora fornita coincide con la precedente (definizione 3.2.3): si veda
l’esercizio 3.3.3.
(2) Pu` o benissimo darsi il caso che m
N
(A) = +∞, per esempio quando
A = R
N
, per`o risulta m
N
(A) < ∞per ogni aperto limitato A (facile verifica).
Si noti che il viceversa `e falso, ossia esistono aperti non limitati ma di misura
finita: basta considerare in R, ad esempio, l’aperto A =


n=1
]n, n + 2
−n
[.
(3) Se A e A
t
sono aperti con A ⊆ A
t
, allora, per definizione di estremo
superiore, si ha subito m
N
(A) ≤ m
N
(A
t
).
Definiamo ora la misura di un compatto:
Definizione 3.3.3 Sia K un sottoinsieme compatto di R
N
. La misura N-
dimensionale di K `e data da
m
N
(K) = inf¦m
N
(P) : P ∈ T
N
,

P ⊃ K¦.
195
Osservazioni 3.3.4 (1) Se K `e un plurirettangolo chiuso (dunque compat-
to), la definizione di m
N
(K) ora fornita coincide con la precedente (defini-
zione 3.2.3) in forza dell’esercizio 3.3.3.
(2) Se K e K
t
sono compatti con K ⊆ K
t
, per definizione di estremo inferiore
si ha m
N
(K) ≤ m
N
(K
t
).
Vediamo ora come ampliare la classe dei sottoinsiemi di R
N
ai quali `e possibile
attribuire una misura tramite approssimazioni dall’interno (mediante com-
patti) o dall’esterno (mediante aperti). Ci limitiamo per adesso a considerare
insiemi limitati.
Definizione 3.3.5 Sia E un sottoinsieme limitato di R
N
. La misura interna
N-dimensionale di E `e la quantit`a
m
N
(E) = sup¦m
N
(K) : K compatto, K ⊆ E¦;
la misura esterna N-dimensionale di E `e la quantit`a
m
N
(E) = inf¦m
N
(A) : A aperto, A ⊇ E¦.
Propriet`a di misura interna e misura esterna
`
E immediato verificare che le funzioni m
N
e m
N
sono crescenti rispetto al-
l’inclusione: in altre parole, se E, F sono insiemi limitati con E ⊆ F, allora
m
N
(E) ≤ m
N
(F) e m
N
(E) ≤ m
N
(F); inoltre `e chiaro che
m
N
(E) = m
N
(E) se E `e compatto,
m
N
(E) = m
N
(E) se E `e un aperto limitato.
Vale poi la seguente propriet` a, del tutto intuitiva ma niente affatto banale:
Proposizione 3.3.6 Sia E un sottoinsieme limitato di R
N
. Allora
m
N
(E) ≤ m
N
(E).
Dimostrazione Basta far vedere che per ogni compatto K ⊆ E e per
ogni aperto A ⊇ E risulta m
N
(K) ≤ m
N
(A). Questo fatto non `e per nulla
immediato, poich´e sulla base delle definizioni di misura interna ed esterna
occorre costruire un plurirettangolo P tale che K ⊂

P ⊂ P ⊂ A: questo `e un
196
compito fattibile ma non banale, come vedremo.
A questo scopo, cominciamo con l’in-
trodurre la funzione “distanza da un
insieme”:
Definizione 3.3.7 Sia F un sottoinsie-
me non vuoto di R
N
. La distanza da F
`e la funzione
d(x, F) = inf¦[x−y[
N
: y ∈ F¦, x ∈ R
N
.
Il lemma che segue illustra le caratteristiche della funzione d(, F).
Lemma 3.3.8 Sia F un sottoinsieme non vuoto di R
N
. Allora la funzione
d(, F) `e continua; pi` u precisamente si ha
[d(x, F) −d(x
t
, F)[ ≤ [x −x
t
[
N
∀x, x
t
∈ R
N
.
Dimostrazione Per ogni y ∈ F possiamo scrivere
d(x, F) ≤ [x −y[
N
≤ [x −x
t
[
N
+[x
t
−y[
N
,
da cui
d(x, F) ≤ [x −x
t
[
N
+ d(x
t
, F).
Invertendo i ruoli di x e x
t
si ha anche
d(x
t
, F) ≤ [x
t
−x[
N
+ d(x, F),
da cui la tesi.
Lemma 3.3.9 Sia K ⊂ R
N
un compatto e sia A ⊆ R
N
un aperto contenente
K. Allora esiste un plurirettangolo P tale che K ⊂

P ⊂ P ⊂ A.
Dimostrazione La funzione d(, A
c
) `e continua, per il lemma 3.3.8; provia-
mo che essa `e strettamente positiva su K. Se, per assurdo, esistesse x ∈ K
tale che d(x, A
c
) = 0, per definizione di estremo inferiore troveremmo una
successione ¦y
n
¦ ⊆ A
c
tale che [x − y
n
[
N
→ 0 per n → ∞; ma allora, dato
che A
c
`e chiuso, avremmo x = lim
n→∞
y
n
∈ K ∩A
c
, il che `e assurdo essendo
K e A
c
disgiunti.
197
Per il teorema di Weierstrass, la funzione d(, A
c
) ha minimo positivo δ su
K, ossia
d(x, A
c
) ≥ δ > 0 ∀x ∈ K.
Di conseguenza, per ogni x ∈ K la palla chiusa B(x, δ/2) `e contenuta in A,
e lo stesso vale, a maggior ragione, per il cubo chiuso Q
x
, ove
Q
x
=
_
y ∈ R
N
: [x
i
−y
i
[ <
δ
2

N
per i = 1, . . . , N
_
⊂ B(x, δ/2).
La famiglia di cubi aperti ¦Q
x
¦
x∈K
chiaramente forma un ricoprimento aper-
to del compatto K: dunque esistono n
1
, . . . , n
k
∈ N tali che K ⊂

k
h=1
Q
xn
h
.
Pertanto l’insieme
P =
k
_
h=1
Q
xn
h
`e un plurirettangolo aperto tale che K ⊂ P ⊂ P ⊂ A.
Il lemma 3.3.9 permette di provare agevolmente la proposizione 3.3.6: se K `e
un compatto contenuto in E ed A `e un aperto contenente E, sia P un pluri-
rettangolo aperto tale che K ⊂ P ⊂ P ⊂ A: allora per definizione di m
N
(K)
e di m
N
(A) (definizioni 3.3.3 e 3.3.1) si ha m
N
(K) ≤ m
N
(P) ≤ m
N
(A), e
ci` o, ricordando la definizione 3.3.5, prova la tesi.
Vediamo ora come si comportano la misura esterna e la misura interna
rispetto a famiglie numerabili di insiemi.
Proposizione 3.3.10 La misura esterna m
N
`e numerabilmente subadditi-
va: ci`o significa che se ¦E
n
¦
n∈N
`e una successione di insiemi limitati di R
N
tale che

n∈N
E
n
sia limitato, allora
m
N
_
_
n∈N
E
n
_

n∈N
m
N
(E
n
).
Dimostrazione Procederemo in vari passi.
1
o
passo: se A e B sono aperti (anche non limitati) di R
N
, allora si ha
m
N
(A ∪ B) ≤ m
N
(A) + m
N
(B).
La tesi `e ovvia se m
N
(A) = +∞ oppure m
N
(B) = +∞. In caso contrario,
sia P un plurirettangolo tale che P ⊂ A ∪ B; allora la funzione
f(x) = d(x, A
c
) + d(x, B
c
), x ∈ R
N
,
198
`e continua e strettamente positiva su P (facile verifica). Quindi f ha minimo
positivo δ sul compatto P. Ne segue che in ogni punto x ∈ P almeno uno dei
due addendi che compongono f(x) `e non inferiore a δ/2. Pertanto risulta
B(x, δ/2) ⊆ A, oppure B(x, δ/2) ⊆ B ∀x ∈ P
(potendo valere, eventualmente, entrambe le inclusioni). Osserviamo adesso
che non `e restrittivo supporre che sia P =

k
j=1
R
j
, ove gli R
j
sono rettangoli
chiusi aventi diametro minore di δ/2; in altre parole
diam(R
j
) = sup¦[x −x
t
[
N
: x, x
t
∈ R
j
¦ <
δ
2
, j = 1, . . . , k.
Dunque, indicando con P
t
il plurirettangolo unione di tutti gli R
j
inclusi in
A, e con P
tt
il plurirettangolo unione di tutti gli R
j
inclusi in B, avremo
P
t
∪ P
tt
= P, poich´e ciascuno degli R
j
`e contenuto in A oppure in B (od in
entrambi). Di conseguenza, per la subadditivit` a di m
N
sui plurirettangoli,
m
N
(P) ≤ m
N
(P
t
) + m
N
(P
tt
) ≤ m
N
(A) + m
N
(B).
Essendo P un arbitrario plurirettangolo tale che P ⊂ A∪B, si deduce la tesi
del 1
o
passo.
2
o
passo: se A
1
, . . . , A
m
sono aperti di R
N
, allora
m
N
_
m
_
i=1
A
i
_

m

i=1
m
N
(A
i
).
Si tratta di una semplice verifica per induzione.
3
o
passo: se ¦A
n
¦
n∈N
`e una successione di aperti di R
N
, allora
m
N
_
_
n∈N
A
n
_

n∈N
m
N
(A
n
).
Se la serie a secondo membro diverge, la tesi `e banale. Altrimenti, sia P un
plurirettangolo tale che P ⊂

n∈N
A
n
: poich´e P `e compatto, esiste m ∈ N
tale che P ⊂

m
n=0
A
n
; dunque, per il 2
o
passo,
m
N
(P) ≤ m
N
_
m
_
n=0
A
n
_

m

n=0
m
N
(A
n
) ≤

n=0
m
N
(A
n
).
199
Per l’arbitrariet` a di P, si ottiene la tesi.
Quarto passo: conclusione.
Sia ¦E
n
¦
n∈N
una successione di sottoinsiemi limitati di R
N
. Se la serie

n∈N
m
N
(E
n
) `e divergente, la tesi della proposizione 3.3.10 `e ovvia. Al-
trimenti, fissato ε > 0, per ogni n ∈ N esiste un aperto A
n
⊇ E
n
tale
che
m
N
(A
n
) < m
N
(E
n
) +
ε
2
n
.
Posto A =

n∈N
A
n
, A `e un aperto che contiene

n∈N
E
n
: dunque, per il 3
o
passo,
m
N
_
_
n∈N
E
n
_
≤ m
N
(A) ≤

n∈N
m
N
(A
n
) <
<

n∈N
_
m
N
(E
n
) +
ε
2
n
_

n∈N
m
N
(E
n
) + 2ε.
Per l’arbitrariet` a di ε, otteniamo
m
N
_
_
n∈N
E
n
_

n∈N
m
N
(E
n
).
Proposizione 3.3.11 La misura interna m
N
`e numerabilmente superaddi-
tiva sui disgiunti: in altre parole, se ¦E
n
¦
n∈N
`e una successione di sottoinsie-
mi limitati e disgiunti di R
N
, tale che l’unione

n∈N
E
n
sia limitata, allora
risulta
m
N
_
_
n∈N
E
n
_

n∈N
m
N
(E
n
).
Dimostrazione Anche in questo caso ci occorrono quattro passi.
1
o
passo: se K, H sono compatti disgiunti di R
N
, allora m
N
(K ∪ H) ≥
m
N
(K) + m
N
(H).
Notiamo anzitutto che K e H hanno mutua distanza positiva (si veda l’eser-
cizio 3.3.12), vale a dire
d(H, K) = inf¦[x −x
t
[
N
: x ∈ K, x
t
∈ H¦ = δ > 0;
infatti d(, H) `e una funzione continua e positiva su K, cosicch´e ha minimo
positivo su K: tale minimo coincide ovviamente con δ.
200
Sia allora P un plurirettangolo tale che

P ⊃ K ∪ H; possiamo supporre che
sia P =

k
j=1
R
j
, con gli R
j
rettangoli chiusi, privi di punti interni comuni e
con diametro minore di δ/2. Indichiamo con P
t
il plurirettangolo costituito
dall’unione di tutti gli R
j
che intersecano K, e con P
tt
il plurirettangolo
unione di tutti gli R
j
che intersecano H: allora si ha P ⊇ P
t
∪P
tt
e P
t
∩P
tt
= ∅,
in quanto ciascuno degli R
j
non pu`o intersecare simultaneamente H e K;
inoltre `e facile rendersi conto che P
t
⊃ K e P
tt
⊃ H. Pertanto
m
N
(K) + m
N
(H) ≤ m
N
(P
t
) + m
N
(P
tt
) = m
N
(P
t
∪ P
tt
) ≤ m
N
(P),
da cui la tesi per l’arbitrariet` a di P.
2
o
passo: se K
1
, . . . , K
m
sono compatti disgiunti di R
N
, allora
m
N
_
m
_
i=1
K
i
_

m

i=1
m
N
(K
i
).
`
E una facile verifica per induzione.
3
o
passo: se ¦K
n
¦
n∈N
`e una successione di compatti disgiunti in R
N
, tali
che la loro unione

n∈N
K
n
sia limitata, allora
m
N
_
_
n∈N
K
n
_

n∈N
m
N
(K
n
).
Per ogni m ∈ N, l’insieme

m
n=0
K
n
`e compatto e, per il 2
o
passo,
m
N
_
m
_
n=0
K
n
_

m

n=0
m
N
(K
n
).
Per la monotonia di m
N
, si deduce
m
N
_
_
n∈N
K
n
_
≥ m
N
_
m
_
n=0
K
n
_
= m
N
_
m
_
n=0
K
n
_

m

n=0
m
N
(K
n
) ∀m ∈ N,
e per m →∞ si ha la tesi.
4
o
passo: conclusione.
Sia ¦E
n
¦ una successione di insiemi limitati tali che

n∈N
E
n
sia un insieme
201
limitato. Fissato ε > 0, per ogni n ∈ N sia K
n
un compatto contenuto in
E
n
, tale che
m
N
(K
n
) > m
N
(E
n
) −
ε
2
n
.
Allora

n∈N
K
n

n∈N
E
n
, da cui, per il 3
o
passo,
m
N
_
_
n∈N
E
n
_
≥ m
N
_
_
n∈N
K
n
_

n∈N
m
N
(K
n
) >

n∈N
m
N
(E
n
) −2ε;
per l’arbitrariet`a di ε, si deduce la tesi della proposizione 3.3.11.
Esercizi 3.3
1. Si provi che ogni aperto ha misura strettamente positiva.
2. Si provi che ogni compatto ha misura finita.
3. Si verifichi che se A `e un plurirettangolo aperto, allora le due definizioni
3.3.1 e 3.2.3 di m
N
(A) coincidono. Similmente, si verifichi che se K
`e un plurirettangolo chiuso le due definizioni 3.3.3 e 3.2.3 di m
N
(A)
coincidono.
4. Si verifichi che se A `e un aperto limitato di R
N
e si ha A =

k
j=1
A
j
,
ove gli A
j
sono aperti disgiunti, allora risulta
m
N
(A) =
k

j=1
m
N
(A
j
).
5. Si mostri che ogni aperto di R `e unione al pi` u numerabile di intervalli
aperti disgiunti. Come si pu`o generalizzare questo enunciato al caso di
aperti di R
N
con N > 1?
6. Siano K,H compatti di R
N
ed A, B aperti di R
N
. Si provi che
m
N
(K ∪ H) ≤ m
N
(K) + m
N
(H) −m
N
(K ∩ H),
e che se m
N
(A ∩ B) < ∞, allora
m
N
(A ∪ B) ≥ m
N
(A) + m
N
(B) −m
N
(A ∩ B).
202
7. Sia P un plurirettangolo di R
N
. Si provi che m
N
(P) e m
N
(P) coinci-
dono con il valore m
N
(P) fornito dalla definizione 3.2.3.
8. Si provi che la misura interna e la misura esterna sono invarianti per
traslazioni.
9. Sia E = Q∩ [a, b]. Si provi che m
1
(E) = m
1
(E) = 0.
10. Se A `e un aperto di R
N
, si costruisca una successione di plurirettangoli
¦P
n
¦
n∈N
tali che P
n
⊆ P
n+1
e

n∈N
P
n
= A; se K `e un compatto di
R
N
, si costruisca una successione di plurirettangoli ¦Q
n
¦
n∈N
tali che
Q
n
⊇ Q
n+1
e

n∈N
Q
n
= K.
11. Si estenda il lemma 3.3.8 al caso in cui F `e un sottoinsieme di uno
spazio metrico (X, d).
12. (Distanza fra due insiemi) Siano A, B sottoinsiemi di uno spazio me-
trico (X, d). La distanza fra A e B `e definita nel modo seguente:
dist(A, B) = inf¦d(x, y) : x ∈ A, y ∈ B¦.
Si provi che:
(i) risulta dist(A, B) = inf
x∈A
d(x, B) = inf
y∈B
d(y, A);
(ii) se A ∩ B ,= ∅ allora dist(A, B) = 0, ma il viceversa `e falso;
(iii) se A e B sono chiusi disgiunti e uno dei due `e compatto, allora
dist(A, B) > 0;
(iv) la disuguaglianza triangolare
dist(A, C) ≤ dist(A, B) + dist(B, C)
`e falsa in generale.
3.4 Insiemi misurabili
Restando, per adesso, nell’ambito dei sottoinsiemi limitati di R
N
, possiamo
attribuire in modo naturale una misura a quegli insiemi per i quali la misura
interna e la misura esterna coincidono, cio`e per quegli insiemi che sono ben
approssimabili dall’interno con compatti e dall’esterno con aperti.
203
Definizione 3.4.1 Sia E un sottoinsieme limitato di R
N
. Diciamo che E
`e misurabile (secondo Lebesgue) se si ha m
N
(E) = m
N
(E); in tal caso la
misura (di Lebesgue) E `e il numero non negativo
m
N
(E) = m
N
(E) = m
N
(E).
Osservazione 3.4.2 Gli aperti limitati ed i compatti di R
N
sono misurabili,
e la loro misura di Lebesgue coincide con la misura introdotta nelle definizioni
3.3.1 e 3.3.3. Infatti, se A `e un aperto limitato
m
N
(A) = inf¦m
N
(B) : B aperto, B ⊇ A¦ = m
N
(A) =
= sup¦m
N
(P) : P ∈ T
N
, P ⊂ A¦ ≤
≤ sup¦m
N
(K) : K compatto, K ⊂ A¦ = m
N
(A).
Dalla proposizione 3.3.6 segue che m
N
(A) = m
N
(A) e tale numero coin-
cide con quello della definizione 3.3.1. Se invece K `e un compatto si ha,
analogamente,
m
N
(K) = sup¦m
N
(H) : H compatto, H ⊆ K¦ = m
N
(K) =
= inf¦m
N
(P) : P ∈ T
N
,

P ⊂ A¦ ≥
≥ inf¦m
N
(A) : A aperto, A ⊃ K¦ = m
N
(K),
cosicch´e, sempre per la proposizione 3.3.6, segue che K `e misurabile e la sua
misura di Lebesgue coincide con quella della definizione 3.3.3.
Il risultato che segue fornisce una caratterizzazione “geometrica” degli insiemi
limitati misurabili.
Proposizione 3.4.3 Sia E un sottoinsieme limitato di R
N
. Allora E `e
misurabile se e solo se per ogni ε > 0 esistono un compatto K ed un aperto
A tali che
K ⊆ E ⊆ A, m
N
(A ¸ K) < ε.
Si noti che A¸K, essendo aperto, `e misurabile, per cui la scrittura m
N
(A¸K)
ha senso.
Dimostrazione Supponiamo E misurabile. Dalla definizione 3.4.1 segue
che, fissato ε > 0, esistono un compatto K ed un aperto A tali che K ⊆ E ⊆
A e
m
N
(K) > m
N
(E) −
ε
2
, m
N
(A) < m
N
(E) +
ε
2
.
204
L’aperto A, che si pu` o prendere limitato, `e l’unione di K e A ¸ K, in-
siemi disgiunti e misurabili in virt` u dell’osservazione 3.4.2. Quindi, per le
proposizioni 3.3.10 e 3.3.11,
m
N
(A) ≤ m
N
(K) + m
N
(A ¸ K) = m
N
(K) + m
N
(A ¸ K) ≤ m
N
(A),
da cui
m
N
(A ¸ K) = m
N
(A) −m
N
(K) < ε.
Proviamo l’implicazione inversa; supponiamo dunque che per ogni ε > 0
esistano un compatto K ed un aperto A tali che
K ⊆ E ⊆ A, m
N
(A ¸ K) < ε.
Per ipotesi, E `e limitato: quindi si pu` o supporre cha anche A sia limitato.
Poi, per la misurabilit` a del compatto K e dell’aperto A¸K, si ha come sopra,
utilizzando anche la monotonia di m
N
e m
N
,
m
N
(E) ≤ m
N
(A) = m
N
(A) = m
N
(K) + m
N
(A ¸ K) =
= m
N
(K) + m
N
(A ¸ K) < m
N
(E) + ε;
per l’arbitrariet` a di ε otteniamo m
N
(E) ≤ m
N
(E). Quindi E `e misurabile.
Verificheremo ora che la classe degli insiemi limitati misurabili `e stabile
rispetto all’unione, all’intersezione ed alla differenza.
Proposizione 3.4.4 Se E, F sono sottoinsiemi limitati e misurabili di R
N
,
allora E ∪ F, E ∩ F, E ¸ F sono misurabili; in particolare
m
N
(E ¸ F) = m
N
(E) −m
N
(E ∩ F),
e se E ∩ F = ∅ allora
m
N
(E ∪ F) = m
N
(E) + m
N
(F).
Dimostrazione Proviamo che E ¸ F `e misurabile: faremo uso della propo-
sizione 3.4.3. Fissato ε > 0, per tale enunciato esistono due compatti K, H
e due aperti A, B tali che K ⊆ E ⊆ A, H ⊆ F ⊆ B e
m
N
(A ¸ K) <
ε
2
, m
N
(B ¸ H) <
ε
2
.
205
Poniamo U = A¸ H e L = K ¸ B. Allora U `e aperto, L `e compatto e risulta
L ⊆ E ¸ F ⊆ U; verifichiamo che si ha anche
U ¸ L ⊆ (A ¸ K) ∪ (B ¸ H).
Infatti
U ¸ L = (A ∩ H
c
) ¸ (K ∩ B
c
) = (A ∩ H
c
) ∩ (K
c
∪ B) =
= (A ∩ H
c
∩ K
c
) ∪ (A ∩ H
c
∩ B) ⊆ (A ∩ K
c
) ∪ (B ∩ H
c
) =
= (A ¸ K) ∪ (B ¸ H).
Dunque, essendo U ¸L, A¸K e B¸H misurabili, per la subadditivit`a di m
N
si ha
m
N
(U ¸ L) = m
N
(U ¸ L) ≤ m
N
(A ¸ K) + m
N
(B ¸ H) =
= m
N
(A ¸ K) + m
N
(B ¸ H) < ε.
La proposizione 3.4.3 mostra allora che E ¸ F `e misurabile.
La misurabilit`a di E ∩ F segue da quanto gi` a dimostrato e dalla relazione
E ∩ F = E ¸ (E ¸ F).
Proviamo la misurabilit`a di E ∪ F. Rimpiazzando eventualmente E con
E ¸ F, che sappiamo essere misurabile, possiamo supporre che E e F siano
disgiunti. Allora, utilizzando le proposizioni 3.3.10 e 3.3.11, si ha
m
N
(E ∪ F) ≤ m
N
(E) + m
N
(F) = m
N
(E) + m
N
(F) ≤ m
N
(E ∪ F),
da cui segue che E∪F `e misurabile e, in particolare, m
N
(E∪F) = m
N
(E) +
m
N
(F).
Finalmente, se E, F sono misurabili e limitati, allora E ∩ F ed E ¸ F sono
misurabili e disgiunti, con E = (E ∩ F) ∪ (E ¸ F): quindi
m
N
(E) = m
N
(E ∩ F) + m
N
(E ¸ F),
da cui l’uguaglianza m
N
(E ¸ F) = m
N
(E) −m
N
(E ∩ F).
206
Insiemi misurabili non limitati
Estenderemo ora agli insiemi non limitati di R
N
la nozione di misura di
Lebesgue e le propriet` a illustrate nei paragrafi precedenti. Nei discorsi che
seguono, per semplicit`a, denoteremo con B
r
la palla aperta B(0, r) di centro
l’origine e raggio r.
Definizione 3.4.5 Sia E ⊆ R
n
un insieme non limitato. Diciamo che E `e
misurabile se per ogni r > 0 l’insieme limitato E ∩ B
r
`e misurabile. In tal
caso, la misura (di Lebesgue) di E `e il numero non negativo, eventualmente
infinito,
m
N
(E) = sup
r>0
m
N
(E ∩ B
r
) = lim
r→∞
m
N
(E ∩ B
r
).
Osservazioni 3.4.6 (1) Se A `e un aperto non limitato, la definizione 3.4.5
coincide con la definizione 3.3.1: infatti, per ogni r > 0 l’aperto A ∩ B
r
`e
ovviamente contenuto in A, da cui
sup
r>0
m
N
(E ∩ B
r
) ≤ m
N
(A).
D’altra parte, se P `e un plurirettangolo tale che P ⊂ A, `e chiaro che per r
sufficientemente grande risulta P ⊂ A ∩ B
r
; quindi
m
N
(P) ≤ sup
r>0
m
N
(E ∩ B
r
) ∀P ∈ T
N
con P ⊂ A,
e dunque m
N
(A) ≤ sup
r>0
m
N
(E ∩ B
r
).
(2) Se E `e limitato e misurabile, allora per la proposizione 3.4.4 l’insieme
E∩B
r
`e misurabile per ogni r > 0, e se r `e abbastanza grande si ha E∩B
r
=
E; quindi
m
N
(E) = sup
r>0
m
N
(E ∩ B
r
),
ossia E verifica il requisito richiesto nella definizione 3.4.5. Viceversa, se E
verifica tale requisito ed `e limitato, allora E `e misurabile, dato che si pu` o
scrivere E = E ∩ B
r
per r abbastanza grande. In definitiva, possiamo far
uso della condizione espressa dalla definizione 3.4.5 tutte le volte che E `e un
insieme misurabile, che sia limitato oppure no.
Proposizione 3.4.7 Siano E, F sottoinsiemi misurabili di R
N
. Allora gli
insiemi E ∪ F, E ∩ F, E ¸ F sono misurabili; inoltre
m
N
(E ∪ F) ≤ m
N
(E) + m
N
(F),
e se E ∩ F = ∅ vale l’uguaglianza.
207
Dimostrazione Come si `e osservato, possiamo far uso della condizione
espressa nella definizione 3.4.5. L’insieme E ¸ F `e misurabile, in virt` u dell’u-
guaglianza
(E ¸ F) ∩ B
r
= (E ∩ B
r
) ¸ (F ∩ B
r
) ∀r > 0
e della proposizione 3.4.4. Di conseguenza, E∩F = E¸(E¸F) `e misurabile.
Similmente,
(E ∪ F) ∩ B
r
= (E ∩ B
r
) ∪ (F ∩ B
r
) ∀r > 0,
quindi anche E ∪ F `e misurabile. In particolare, per ogni r > 0 si ha
m
N
((E ∪ F) ∩ B
r
) ≤ m
N
(E ∩ B
r
) + m
n
(F ∩ B
r
) ≤ m
N
(E) + m
N
(F),
e per r → ∞ si ottiene m
N
(E ∪ F) ≤ m
n
(E) + m
N
(F). Se poi E ∩ F = ∅,
allora
m
N
(E ∪ F) = lim
r→∞
m
N
((E ∪ F) ∩ B
r
) =
= lim
r→∞
[m
N
(E ∩ B
r
) + m
N
(F ∩ B
r
)] = m
N
(E) + m
N
(F).
Osservazioni 3.4.8 (1) Se E `e misurabile, allora E
c
= R
N
¸E `e misurabile.
(2) Se E, F ⊆ R
n
sono insiemi misurabili con F ⊆ E, allora
m
N
(E) = m
N
(E ¸ F) + m
N
(F);
se inoltre m
N
(F) < ∞, allora
m
N
(E ¸ F) = m
N
(E) −m
N
(F);
si osservi che quando m
N
(F) = ∞ questa uguaglianza non ha senso.
Esercizi 3.4
1. Si generalizzi la proposizione 3.4.3 al caso di insiemi E ⊂ R
N
misurabili
di misura finita.
2. Si estenda l’esercizio 3.3.4 al caso di un qualunque aperto di R
N
.
208
3. (Insiemi normali) Sia E = ¦(x, y) ∈ R
2
: a ≤ x ≤ b, α(x) ≤ y ≤ β(x)¦,
ove α e β sono assegnate funzioni continue definite su [a, b], con α ≤ β.
Si provi che E `e misurabile in R
2
e che
m
2
(E) =
_
b
a
[β(x) −α(x)] dx.
4. Calcolare m
2
(C), ove C `e un cerchio di raggio r > 0 in R
2
.
5. Calcolare la misura m
2
(P
n
), ove P
n
`e la regione di R
2
delimitata da
un poligono regolare di n lati inscritto in una circonferenza di raggio
r > 0.
6. Calcolare l’area della regione piana delimitata dall’ellisse di equazione
x
2
a
2
+
y
2
b
2
= 1 (a > 0, b > 0).
7. Sia f : [a, b] → R una funzione continua. Si provi che il grafico di f `e
un sottoinsieme misurabile di R
2
di misura nulla.
8. (Insieme di Cantor) Dividiamo [0, 1] in tre parti uguali ed asportiamo
l’intervallo aperto centrale di ampiezza 1/3. Dividiamo ciascuno dei due
intervalli chiusi residui in tre parti uguali e rimuoviamo i due intervalli
aperti centrali di ampiezza 1/9. Per ciascuno dei quattro intervalli resi-
dui ripetiamo la stessa procedura: al passo n-simo, avremo 2
n
intervalli
chiusi I
k,n
(k = 1, . . . , 2
n
), di ampiezza 3
−n
, di cui elimineremo le parti
centrali aperte J
k,n
di ampiezza 3
−n−1
. L’insieme
C = [0, 1] ¸

_
n=0
2
n
_
k=1
J
k,n
si chiama insieme ternario di Cantor.
(i) Si dimostri che C `e chiuso e privo di punti interni.
(ii) Si provi che tutti i punti di C sono punti d’accumulazione per C.
(iii) Si calcoli la misura m
1
(C).
209
9. Si ripeta la procedura dell’esercizio precedente, asportando stavolta
parti centrali di ampiezza p
−n
, ove p `e un intero fissato maggiore di 3.
Si calcoli la misura dell’insieme risultante, e se ne deduca che esistono
aperti densi in [0, 1] la cui misura `e positiva ma arbitrariamente piccola.
10. Sia E ⊂ R
N
un insieme misurabile. Si provi che se

E ,= ∅ allora
m
N
(E) > 0.
`
E vero il viceversa?
11. Si provi che se E, F sono insiemi misurabili limitati di R
N
allora
m
N
(E ∪ F) = m
N
(E) + m
N
(F) −m
N
(E ∩ F).
Cosa si pu` o dire se E, F sono insiemi misurabili qualunque?
12. Si provi che i chiusi di R
N
sono misurabili secondo Lebesgue.
13. Si costruisca un aperto illimitato di R
N
cha abbia misura di Lebesgue
pari a λ, essendo λ un arbitrario numero positivo.
14. Sia E ⊆ R
N
un insieme qualunque. Si provi che l’insieme
E
t
= ¦(x, 0) ∈ R
N+1
: x ∈ E¦
`e misurabile in R
N+1
con m
N+1
(E
t
) = 0.
15. Si provi che l’insieme Q dei numeri razionali `e misurabile secondo
Lebesgue in R con m
1
(Q) = 0.
16. (Completezza della misura di Lebesgue) Sia E ⊂ R
N
un insieme mi-
surabile con m
N
(E) = 0. Si provi che ogni sottoinsieme di E `e a sua
volta misurabile con misura nulla.
17. Sia E il sottoinsieme di [0, 1] costituito da tutti i numeri che hanno
uno sviluppo decimale in cui non compare la cifra 1: ad esempio,
2
3
=
0, 6 ∈ E,
1
9
= 0.1 / ∈ E, mentre
1
10
= 0.1 = 0.09 ∈ E. Si provi che E `e
misurabile in R e se ne calcoli la misura.
18. Sia E un insieme illimitato di R
N
. Detto Q
r
il cubo N-dimensionale di
centro l’origine e spigoli paralleli agli assi di lunghezza 2r, si provi che
E `e misurabile se e solo se E ∩Q
r
`e misurabile per ogni r > 0, e che in
tal caso
m
N
(E) = sup
r>0
m
N
(E ∩ Q
r
) = lim
r→∞
m
N
(E ∩ Q
r
).
210
19. Si calcoli l’area della regione piana definita dalle disuguaglianze
x
2
≤ [y[ ≤ x
1/3
.
20. Si provi che la misura di Lebesgue `e invariante per traslazioni: in altre
parole, se E `e misurabile allora per ogni v ∈ R
N
l’insieme
E +v = ¦x +v : x ∈ E¦
`e misurabile, e si ha m
N
(E +v) = m
N
(E).
21. Fissato t ∈ R ¸ ¦0¦, poniamo
tE = ¦tx : x ∈ E¦ ∀E ⊆ R
N
.
Si provi che se E `e misurabile allora tE `e misurabile, e si ha m
N
(tE) =
[t[
N
m
N
(E).
3.5 Propriet`a della misura di Lebesgue
La misura di Lebesgue gode di interessanti e utili propriet` a rispetto alle
famiglie numerabili di insiemi misurabili.
Proposizione 3.5.1 La misura di Lebesgue `e numerabilmente additiva sui
disgiunti: cio`e, se ¦E
n
¦
n∈N
`e una successione di insiemi misurabili di R
N
fra
loro disgiunti, allora

n∈N
E
n
`e misurabile e
m
N
_
_
n∈N
E
n
_
=

n∈N
m
N
(E
n
).
Dimostrazione Per ogni r > 0 risulta
_
_
n∈N
E
n
_
∩ B
r
=
_
n∈N
(E
n
∩ B
r
);
d’altra parte, usando le proposizioni 3.3.10 e 3.3.11 si ha
m
N
__
_
n∈N
E
n
_
∩ B
r
_
= m
N
_
_
n∈N
(E
n
∩ B
r
)
_

n∈N
m
N
(E
n
∩ B
r
) =
=

n∈N
m
N
(E
n
∩ B
r
) ≤ m
N
_
_
n∈N
(E
n
∩ B
r
)
_
= m
N
__
_
n∈N
E
n
_
∩ B
r
_
.
211
Dunque
_
n∈N
E
n
_
∩ B
r
`e misurabile per ogni r > 0, ossia

n∈N
E
n
`e
misurabile. Inoltre
m
N
_
_
n∈N
E
n
_
= sup
r>0
m
N
_
_
n∈N
(E
n
∩ B
r
))
_
=
= sup
r>0

n∈N
m
N
(E
n
∩ B
r
) ≤

n∈N
m
N
(E
n
);
d’altronde. per ogni m ∈ N si ha
m
N
_
_
n∈N
E
n
_
= sup
r>0

n∈N
m
N
(E
n
∩ B
r
) ≥ sup
r>0
m

n=0
m
N
(E
n
∩ B
r
) ≥
≥ lim
r→∞
m

n=0
m
N
(E
n
∩ B
r
) =
m

n=0
m
N
(E
n
),
cosicch´e si ha anche
m
N
_
_
n∈N
E
n
_

n∈N
m
N
(E
n
).
Proposizione 3.5.2 La misura di Lebesgue `e numerabilmente subadditiva:
cio`e, se ¦E
n
¦
n∈N
`e una successione di insiemi misurabili di R
N
, allora gli
insiemi

n∈N
E
n
e

n∈N
E
n
sono misurabili e in particolare si ha
m
N
_
_
n∈N
E
n
_

n∈N
m
N
(E
n
).
Dimostrazione Posto
F
0
= E
0
, F
n+1
= E
n+1
¸
n
_
k=0
F
k
∀n ∈ N,
gli insiemi F
n
sono misurabili (proposizione 3.4.7) e disgiunti; inoltre
F
n
⊆ E
n
∀n ∈ N,
_
k∈N
F
k
=
_
k∈N
E
k
.
Dunque, per la proposizione precedente,

k∈N
E
k
`e misurabile e
m
N
_
_
k∈N
E
k
_
= m
N
_
_
k∈N
F
k
_
=

k∈N
m
N
(F
k
) ≤

k∈N
m
N
(E
k
).
212
Infine,

n∈N
E
n
=
_
n∈N
(E
n
)
c
¸
c
`e un insieme misurabile per quanto gi` a
provato e per l’osservazione 3.4.8 (1).
Il risultato che segue riguarda la “regolarit` a” della misura di Lebesgue, ossia
il suo comportamento rispetto a successioni di insiemi misurabili monotone
rispetto all’inclusione.
Proposizione 3.5.3 Sia ¦E
n
¦
n∈N
una successione di insiemi misurabili di
R
N
.
(i) Se E
n
⊆ E
n+1
per ogni n ∈ N, allora
m
N
_
_
n∈N
E
n
_
= lim
n→∞
m
N
(E
n
).
(ii) Se E
n
⊆ E
n+1
per ogni n ∈ N, e se esiste n
0
∈ N tale che m
N
(E
n
0
) < ∞,
allora
m
N
_

n∈N
E
n
_
= lim
n→∞
m
N
(E
n
).
Dimostrazione Proviamo (i). Poniamo
F
0
= E
0
, F
n+1
= E
n+1
¸ E
n
∀n ∈ N :
gli F
n
sono misurabili e disgiunti, con

m
k=0
F
k
= E
m
per ogni m ∈ N ed
anche

k∈N
F
k
=

k∈N
E
k
. Quindi, per la proposizione 3.5.1,
m
N
_
_
k∈N
E
k
_
=

k∈N
m
N
(F
k
) = lim
m→∞
m

k=0
m
N
(F
k
)
= lim
m→∞
m
N
_
m
_
k=0
F
k
_
= lim
m→∞
m
N
(E
m
).
Proviamo (ii). Poniamo F
n
= E
n
0
¸ E
n
per ogni n > n
0
. Allora gli F
n
sono
misurabili e F
n
⊆ F
n+1
; inoltre

_
n=n
0
F
n
= E
n
0
¸

n=n
0
E
n
.
213
Utilizzando il fatto che m
N
(E
n
0
) < ∞, nonch´e (i), abbiamo
m
N
(E
n
0
) −m
N
_

n=n
0
E
n
_
= m
N
_

_
n=n
0
F
n
_
=
= lim
n→∞
m
N
(F
n
) = lim
n→∞
[m
N
(E
n
0
) −m
N
(E
n
)] = m
N
(E
n
0
) − lim
n→∞
m
N
(E
n
).
Ne segue la tesi poich´e, ovviamente,

n=n
0
E
n
=

n∈N
E
n
.
Osservazione 3.5.4 Nella (ii) della proposizione precedente l’ipotesi che ri-
sulti m
N
(E
n
0
) < ∞per qualche n
0
∈ N`e essenziale: ad esempio, se scegliamo
N = 1 e E
n
= [n, ∞[ per ogni n ∈ N, si ha m
N
(E
n
) = ∞ per ogni n ∈ N e
m
N
_
k∈N
E
k
_
= m
N
(∅) = 0, cosicch´e la tesi di (ii) `e falsa.
Osservazione 3.5.5 Il fatto che la misurabilit` a secondo Lebesgue sia una
propriet` a stabile per il passaggio al complementare e per unioni ed interse-
zioni numerabili fa s`ı che risulti misurabile qualsiasi sottoinsieme di R
N
che
sia esplicitamente costruibile. Tuttavia, come vedremo nel breve paragrafo
che segue, esistono sottoinsiemi di R
N
non misurabili.
Concludiamo questa esposizione con un’ulteriore osservazione. La costruzio-
ne della misura di Lebesgue ha richiesto quattro tappe successive, delle quali
nessuna `e superflua. La prima tappa, che assegna la misura ai plurirettangoli,
`e preliminare a tutto il procedimento e garantisce che la misura di Lebesgue
sia coerente con il calcolo delle aree delle figure geometriche elementari. Il
passaggio intermedio relativo agli aperti ed ai compatti `e pure necessario: se
si definissero la misura esterna e la misura interna direttamente sulla base
dell’approssimazione tramite plurirettangoli, ben pochi insiemi risulterebbe-
ro misurabili: infatti per moltissimi insiemi limitati E ⊂ R
N
(anche chiusi o
aperti) risulta
sup¦m
N
(P) : P ∈ T
N
, P ⊆ E¦ < inf¦m
N
(P) : P ∈ T
N
,

P ⊇ E¦
(esercizio 3.5.1).
Anche la distinzione fra insiemi limitati e non limitati `e necessaria: se si
214
definissero la misura interna ed esterna indistintamente per gli insiemi limi-
tati e non, risulterebbe m
N
(E) = m
N
(E) = +∞ per tutti gli insiemi della
forma E = G ∪ H, con H insieme illimitato e ”regolarissimo” (ad esempio
un semispazio) e G insieme limitato e non misurabile; ed invece `e giusto che
insiemi di questo tipo risultino non misurabili!
Esercizi 3.5
1. Si consideri l’insieme ternario di Cantor costruito nell’esercizio 3.4.9.
Si provi che tale insieme, che denotiamo con C
p
, `e chiuso e che per esso
risulta
sup¦m
N
(P) : P ∈ T
N
, P ⊆ C
p
¦ = 0,
inf¦m
N
(P) : P ∈ T
N
,

P ⊇ C
p
¦ > 0.
2. Sia f : [a, +∞[→ R una funzione non negativa, integrabile secondo
Riemann in senso improprio. Si provi che l’insieme
E = ¦(x, y) : x ≥ a, 0 ≤ y ≤ f(x)¦
`e misurabile in R
2
, con
m
2
(E) =
_

a
f(x) dx.
3.6 Un insieme non misurabile
Sia N = 1. La classe /
1
dei sottoinsiemi misurabili secondo Lebesgue `e
molto vasta, ma non esaurisce la classe di tutti i sottoinsiemi di R. Tuttavia,
per esibire un insieme non misurabile non si pu` o fare a meno del seguente
Assioma della scelta Per ogni insieme non vuoto X esiste una funzione di
scelta f : T(X) ¸ ¦∅¦ →X tale che f(E) ∈ E per ogni E ∈ T(X) ¸ ¦∅¦.
In altre parole, l’assioma della scelta dice che `e possibile selezionare, per
mezzo di un’opportuna funzione f, esattamente un elemento da ciascun sot-
toinsieme non vuoto di X. La cosa sarebbe banale se X avesse cardinalit` a
finita, e facile se X fosse numerabile (esercizio 3.6.6), ma per insiemi di car-
dinalit` a pi` u alta questa propriet`a non `e dimostrabile se non si adotta questo
assioma.
215
L’insieme che andiamo a costruire fu introdotto da Vitali. Consideriamo in
[0, 1] la relazione di equivalenza
x · y ⇐⇒ x −y ∈ Q.
Vi `e un’infinit`a pi` u che numerabile di classi di equivalenza, ognuna delle
quali contiene un’infinit`a numerabile di elementi. Costruiamo un insieme
V prendendo, grazie all’assioma della scelta, esattamente un elemento da
ciascuna classe di equivalenza: V `e un sottoinsieme pi` u che numerabile di
[0, 1], detto insieme di Vitali.
Sia ora ¦q
n
¦
n∈N
una numerazione di Q∩[−1, 1], e sia V
n
= V +q
n
. Notiamo
che V
n
∩ V
m
= ∅ se n ,= m: infatti se x ∈ V
n
∩ V
m
allora x = a +q
n
= b +q
m
con a, b ∈ V ; di qui segue a − b = q
m
− q
n
∈ Q, da cui (per come `e stato
costruito V ) a = b. Ne deduciamo q
n
= q
m
, ed infine n = m. Notiamo anche
che valgono le inclusioni
[0, 1] ⊆

_
n=0
V
n
⊆ [−1, 2],
e quindi, per la monotonia della misura esterna,
1 ≤ m
1
_

_
n=0
V
n
_
≤ 3.
Se V fosse misurabile secondo Lebesgue, anche i suoi traslati V
n
sarebbero
misurabili ed avrebbero la stessa misura; per l’additivit` a numerabile di m
1
si ricaverebbe
m
1
_

_
n=0
V
n
_
=

n=0
m
1
(V
n
) =

n=0
m
1
(V ) =
_
0 se m
1
(V ) = 0
+∞ se m
1
(V ) > 0,
e ci` o contraddice il fatto che la misura di


n=0
V
n
`e compresa fra 1 e 3.
Pertanto l’insieme V non pu`o essere misurabile.
Esercizi 3.6
1. Dimostrare che per ogni λ ∈]0, +∞] esiste un sottoinsieme U ⊂ [0, ∞[,
non misurabile secondo Lebesgue, tale che m

(U) = λ.
216
2. Dato un insieme misurabile E ⊆ R di misura positiva, si provi che
esiste un sottoinsieme W ⊂ E che non `e misurabile secondo Lebesgue.
3. Sia V
n
= V +q
n
, come nella costruzione dell’insieme non misurabile di
Vitali. Posto E
n
=


m=n
V
m
, si provi che
m
1
(E
n
) < ∞, E
n
⊃ E
n+1
∀n ∈ N, lim
n→∞
m
1
(E
n
) > m
1
_

n=0
E
n
_
.
4. Siano V, W sottoinsiemi di R non misurabili, disgiunti e tali che V ∪W
sia misurabile. Si provi che se m(V ∪ W) < ∞ allora
m(V ∪ W) < m

(V ) + m

(W).
5. Si costruisca un sottoinsieme non misurabile secondo Lebesgue in R
N
,
N > 1.
6. Dato un insieme numerabile X, si costruisca una funzione di scelta per
X.
3.7 Funzioni misurabili
Ora che abbiamo costruito la misura di Lebesgue e conosciamo gli insiemi
misurabili, sui quali potremo effettuare gli integrali, dobbiamo determinare
la classe delle funzioni che potranno essere integrate, cio`e per le quali l’in-
tegrale avr` a senso. Considereremo funzioni f : D → R, ove D `e un insieme
misurabile di R
N
e R `e la retta reale estesa, ossia R = [−∞, +∞]; ammette-
remo dunque che le funzioni prendano i valori ±∞. In questo nuovo contesto
sar` a utile fissare la convenzione
0 (±∞) = 0,
grazie alla quale potremo definire l’integrale senza ambiguit`a.
Cominciamo con la seguente proposizione, che introduce la propriet` a ca-
ratteristica delle funzioni che ci interessano, e che riguarda gli insiemi di
sopralivello e di sottolivello.
Proposizione 3.7.1 Sia D un sottoinsieme misurabile di R
N
. Per una
qualunque funzione f : D →R i seguenti fatti sono equivalenti:
217
(i) ¦x ∈ D : f(x) > α¦ `e un insieme misurabile in R
N
per ogni α ∈ R;
(ii) ¦x ∈ D : f(x) ≥ α¦ `e un insieme misurabile in R
N
per ogni α ∈ R;
(iii) ¦x ∈ D : f(x) < α¦ `e un insieme misurabile in R
N
per ogni α ∈ R;
(iv) ¦x ∈ D : f(x) ≤ α¦ `e un insieme misurabile in R
N
per ogni α ∈ R.
Dimostrazione (i) =⇒ (ii) Si ha per ogni α ∈ R
¦x ∈ D : f(x) ≥ α¦ =

n=1
¦x ∈ D : f(x) > α −1/n¦,
e quindi la tesi.
(ii) =⇒ (iii) Si ha per ogni α ∈ R
¦x ∈ D : f(x) < α¦ = D ¸ ¦x ∈ D : f(x) ≥ α¦,
e quindi la tesi.
(iii) =⇒ (iv) Si ha per ogni α ∈ R
¦x ∈ D : f(x) ≤ α¦ =

n=1
¦x ∈ D : f(x) < α + 1/n¦,
e quindi la tesi.
(iv) =⇒ (i) Si ha per ogni α ∈ R
¦x ∈ D : f(x) > α¦ = D ¸ ¦x ∈ D : f(x) ≤ α¦,
e quindi la tesi.
Definizione 3.7.2 Sia D un sottoinsieme misurabile di R
N
. Diciamo che
una funzione f : D → R `e misurabile (secondo Lebesgue) se vale una delle
condizioni della proposizione precedente (e quindi valgono tutte).
218
Esempi 3.7.3 (1) Se E `e un sottoinsieme misurabile di R
N
, la funzione
caratteristica, o indicatrice, di E `e
I
E
(x) =
_
1 se x ∈ E,
0 se x / ∈ E.
Questa funzione `e misurabile perch´e per ogni α ∈ R si ha
¦x ∈ D : I
E
(x) > α¦ =
_
¸
_
¸
_
∅ se α ≥ 1,
E se 0 ≤ α < 1,
R
N
se α < 0.
(2) Una funzione semplice in R
N
`e una combinazione lineare finita di funzioni
caratteristiche di insiemi misurabili di R
N
, cio`e `e una funzione della forma
ϕ(x) =
k

i=1
α
i
I
E
i
(x),
dove α
1
, . . . , α
k
sono numeri reali ed E
1
. . . . , E
k
sono sottoinsiemi misurabili
di R
N
. Queste funzioni non si rappresentano in modo unico: ad esempio, se
N = 1,
I
[0,2]
(x) = I
[0,3]
(x) −I
]2,3]
(x).
219
Per` o esse hanno una rappresentazione canonica: dato che assumono un
numero finito di valori non nulli e distinti β
1
, . . . , β
r
, ponendo
A
j
= ¦x ∈ R
N
: ϕ(x) = β
j
¦, j = 1. . . . , r,
si pu`o scrivere
ϕ(x) =
r

j=1
β
j
I
A
j
(x),
ed in questo modo si ottiene la forma canonica della funzione semplice ϕ, che
viene espressa come combinazione lineare finita di funzioni caratteristiche di
insiemi disgiunti e “massimali”, nel senso che ciascun A
j
`e il pi` u grande
insieme dove la ϕ assume il corrispondente valore β
j
. Osserviamo che gli
insiemi A
j
sono misurabili, essendo ottenuti dagli E
i
con un numero finito di
unioni, intersezioni e differenze; quindi, supponendo (il che non `e restrittivo)
che sia β
1
< . . . < β
q−1
< 0 < β
q
< . . . < β
r
, e posto per comodit` a
B = ¦x ∈ D : ϕ(x) = 0¦ =
_
r
_
j=1
A
j
_
c
,
si ha
¦x ∈ D : ϕ(x) > α¦ =
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
¸
_
∅ se α ≥ β
r

r
j=i
A
j
se β
i−1
≤ α < β
i
, q < i ≤ r

r
j=q
A
j
se 0 ≤ α < β
q

r
j=q
A
j
∪ B se β
q−1
≤ α < 0

r
j=i
A
j
∪ B se β
i−1
≤ α < β
i
, 1 < i < q
R
N
se α < β
1
.
Ne segue che ϕ `e misurabile.
(3) Le funzioni continue sono misurabili. Infatti in tal caso per ogni α ∈ R
l’insieme ¦x ∈ D : f(x) > α¦ `e un aperto, e dunque `e misurabile.
(4) Se N = 1, le funzioni f : R → R monotone sono misurabili: infatti
per ogni α ∈ R l’insieme ¦x ∈ R : f(x) > α¦ `e una semiretta e quindi `e
misurabile.
220
Osservazione 3.7.4 Se D ⊂ R
N
`e misurabile e f : D → R `e una funzione
misurabile, possiamo sempre estendere f a tutto R
N
ponendo
f(x) =
_
f(x) se x ∈ D,
0 se x / ∈ D;
l’estensione f `e ancora misurabile, in quanto per ogni α ∈ R si ha
¦x ∈ D : f(x) > α¦ =
_
¦x ∈ D : f(x) > α¦ se α ≥ 0,
¦x ∈ D : f(x) > α¦ ∪ D
c
se α < 0.
Questo ci permette di lavorare esclusivamente con funzioni misurabili definite
su tutto R
N
, rimpiazzando f, quando occorre, con f.
Propriet`a delle funzioni misurabili
La classe delle funzioni misurabili `e estremamente ampia: in effetti esibire
una funzione non misurabile `e equivalente a fornire un esempio di un insieme
non misurabile, compito non banale, come abbiamo visto nel paragrafo pre-
cedente. Inoltre tale classe `e stabile rispetto alle operazioni algebriche ed a
quelle di passaggio al limite, come andremo a verificare. Utilizzeremo d’ora
in avanti, per semplicit` a, la notazione pi` u comoda ¦f > α¦ per denotare
l’insieme ¦x ∈ R
N
: f(x) > α¦.
Proposizione 3.7.5 Siano f, g : R
N
→ R funzioni misurabili. Se f e −g
non valgono mai simultaneamente n´e +∞ n´e −∞, allora la somma f + g `e
una funzione misurabile su R
N
.
Dimostrazione Fissato α ∈ R, si ha
¦f + g > α¦ = ¦f = +∞¦ ∪ ¦g = +∞¦ ∪ ¦α < f + g < +∞¦ :
i primi due insiemi sono misurabili in virt` u dell’esercizio 3.7.2; quindi basta
dimostrare che il terzo insieme `e misurabile. Ed infatti si pu` o scrivere
¦α < f + g < +∞¦ = ¦−∞< α −g < f < +∞¦ =
=
_
r∈Q
[¦α −r < g < +∞¦ ∩ ¦r < f < +∞¦] ,
221
e gli insiemi dell’ultimo membro sono misurabili, poich´e
¦α −r < g < +∞¦ =
_
n∈N
[¦g < n¦ ∩ ¦g > α −r¦] ,
ed analogamente
¦r < f < +∞¦ =
_
n∈N
[¦f < n¦ ∩ ¦f > r¦] .
Ne segue che f + g `e misurabile.
Il risultato che segue riguarda la misurabilit` a del prodotto f g. Ricordiamo
che esso `e sempre ben definito in virt` u della convenzione 0 (±∞) = 0.
Proposizione 3.7.6 Siano f, g : R
N
→ R funzioni misurabili. Allora il
prodotto f g `e una funzione misurabile su R
N
.
Dimostrazione Notiamo, per cominciare, che se f `e misurabile allora,
ovviamente, anche −f lo `e, essendo ¦−f > α¦ = ¦f < −α¦ per ogni α ∈ R.
Ci` o premesso, supponiamo dapprima f e g non negative. Allora si ha
¦fg > α¦ =
_
¸
_
¸
_
R
N
se α < 0,
¦f > 0¦ ∩ ¦g > 0¦ se α = 0,

r∈Q
+
[¦f > r¦ ∩ ¦g > α −r¦] se α > 0.
Ne segue che fg `e misurabile quando f e g sono non negative.
Nel caso generale, poniamo
f
+
= max¦f, 0¦, f

= −min¦f, 0¦,
ed osserviamo che tali funzioni sono non negative e misurabili, dato che
¦f
+
> α¦ =
_
R
N
se α < 0,
¦f > α¦ se α ≥ 0,
¦f

> α¦ =
_
R
N
se α < 0,
¦f < −α¦ se α ≥ 0;
inoltre si ha f = f
+
− f

. Analoga decomposizione si pu`o fare per g =
g
+
−g

. Ma allora fg si pu`o scrivere come
fg = (f
+
−f

)(g
+
−g

) = f
+
g
+
+ f

g

+ (−f
+
g

) + (−f

g
+
),
e quindi `e misurabile per quanto gi`a dimostrato e per la proposizione 3.7.5.
Considereremo adesso successioni di funzioni misurabili definite su R
N
.
222
Proposizione 3.7.7 Se ¦f
n
¦
n∈N
`e una successione di funzioni misurabili su
R
N
, allora le funzioni inf
n∈N
f
n
, sup
n∈N
f
n
, liminf
n→∞
f
n
e limsup
n→∞
f
n
sono misurabili.
Dimostrazione Infatti per ogni α ∈ R si ha
_
inf
n∈N
f
n
< α
_
=
_
n∈N
¦f
n
< α¦,
_
sup
n∈N
f
n
> α
_
=
_
n∈N
¦f
n
> α¦,
il che prova la misurabilit` a di inf
n∈N
f
n
e sup
n∈N
f
n
; per le altre due basta
osservare che
liminf
n→∞
f
n
= sup
n∈N
_
inf
m≥n
f
m
_
, limsup
n→∞
f
n
= inf
n∈N
_
sup
m≥n
f
m
_
,
ed applicare quanto gi` a dimostrato.
Corollario 3.7.8 Sia ¦f
n
¦
n∈N
una successione di funzioni misurabili che
converge puntualmente ad una funzione f in R
N
. Allora f `e misurabile.
Dimostrazione Basta osservare che f = limsup
n→∞
f
n
= liminf
n→∞
f
n
ed
applicare la proposizione 3.7.7.
Il corollario precedente individua una propriet`a che in effetti caratterizza la
misurabilit` a. Si ha infatti:
Proposizione 3.7.9 Sia f : R
N
→ R una funzione qualunque. Essa `e
misurabile su R
N
se e solo se esiste una successione ¦ϕ
n
¦
n∈N
di funzioni
semplici, che converge puntualmente a f in R
N
.
Dimostrazione (⇐=) Segue dal corollario 3.7.8.
(=⇒) Costruiamo le ϕ
n
nel modo seguente:
ϕ
n
(x) =
_
¸
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
¸
_
n se f(x) > n,
k−1
2
n
se
k−1
2
n
< f(x) ≤
k
2
n
, k = 1, 2, . . . , n2
n
,
0 se f(x) = 0,
k
2
n
se
k−1
2
n
≤ f(x) <
k
2
n
, k = 0, −1, . . . , −n2
n
+ 1,
−n se f(x) < −n.
223
Le ϕ
n
sono funzioni semplici, in quanto
ϕ
n
= nI
¡f>n¦
+
n2
n

k=1
k −1
2
n
I
¡
k−1
2
n
<f≤
k
2
n
¦
+
+
0

k=−n2
n
+1
k
2
n
I
¡
k−1
2
n
≤f<
k
2
n
¦
−nI
¡f<−n¦
,
e tutti gli insiemi coinvolti sono misurabili. Proviamo che ϕ
n
→ f pun-
tualmente in R
N
: se x `e tale che f(x) = ±∞, allora per ogni n ∈ N si ha
ϕ
n
(x) = ±n, quindi ϕ
n
(x) → f(x); se invece [f(x)[ < ∞, allora, per costru-
zione, per ogni n > [f(x)[ si ha [f(x) −ϕ
n
(x)[ <
1
2
n
e dunque, nuovamente,
ϕ
n
(x) →f(x). Ci`o prova la tesi.
Osservazione 3.7.10 Le funzioni ϕ
n
costruite nella dimostrazione prece-
dente sono, per costruzione, dominate da f, ossia verificano

n
(x)[ ≤ [ϕ
n+1
(x)[ ≤ [f(x)[ ∀n ∈ N, ∀x ∈ R
N
.
Questa propriet`a verr` a usata nel seguito. Si noti inoltre che se f `e limitata,
allora la convergenza delle ϕ
n
verso f `e uniforme: infatti risulta

n
(x) −f(x)[ <
1
2
n
∀x ∈ R
N
, ∀n > sup
R
N
[f[.
Infine notiamo che si pu` o supporre, rimpiazzando ϕ
n
con ϕ
n
I
Bn
, ove B
n
`e
la palla di R
N
di centro 0 e raggio n, che la successione ¦ϕ
n
¦ sia contenuta
in o
0
; naturalmente con questa scelta si perde in generale la propriet` a della
convergenza uniforme.
Esercizi 3.7
1. Si verifichi che una funzione indicatrice I
E
`e misurabile se e solo se E
`e un insieme misurabile.
2. Se f : R
N
→R `e una funzione misurabile, si provi che l’insieme
¦x ∈ R
N
: f(x) = ±∞¦
`e misurabile.
224
3. Se f, g sono funzioni misurabili su R
N
, si provi che l’insieme
¦x ∈ R
N
: f(x) = g(x)¦
`e misurabile.
4. Sia f una funzione misurabile su R
N
. Se g : R
N
→ R `e un’altra
funzione, tale che l’insieme ¦x ∈ R
N
: f(x) ,= g(x)¦ sia misurabile con
misura nulla, si provi che g `e misurabile.
5. Se f `e una funzione misurabile su R
N
, si provi che per ogni α ∈ R
l’insieme
¦x ∈ R
N
: f(x) = α¦
`e misurabile.
`
E vero il viceversa?
6. Sia b un intero maggiore di 1. Per ogni x ∈ R si consideri lo sviluppo
di x in base b:
x = [x] +

n=1
ε
n
(x)
b
n
ove ε
n
(x) ∈ ¦0, 1, . . . , b − 1¦ per ogni n ∈ N
+
. Si osservi che tale
sviluppo non `e unico per certi valori di x, ma si provi che, qualunque
sia lo sviluppo scelto nei casi di ambiguit`a, le funzioni ε
n
sono tutte
misurabili su R.
7. Se f : R
N
→ R `e una funzione misurabile (a valori reali) e g : R → R
`e una funzione continua, si provi che la composizione g ◦ f : R
N
→ R
`e una funzione misurabile.
Traccia: si osservi che ¦t ∈ R : g(t) > α¦ `e un aperto e si ricordi
l’esercizio 3.3.5.]
8. Si provi che se f `e una funzione misurabile su R
N
, allora anche [f[ `e
misurabile.
`
E vero il viceversa?
9. Si provi che una funzione f : R
N
→ R `e misurabile se e solo se f
2
`e
misurabile e se l’insieme ¦f > 0¦ `e misurabile.
10. Sia f : R → R una funzione derivabile. Si provi che f
t
`e una funzione
misurabile su R. Se ne deduca che, se f : R
N
→ R `e differenziabile, le
sue derivate parziali sono funzioni misurabili.
225
11. Sia ¦f
n
¦
n∈N
una successione di funzioni misurabili su R
N
. Si provi che
l’insieme
_
x ∈ R
N
: ∃ lim
n→∞
f
n
(x)
_
`e misurabile.
3.8 L’integrale di Lebesgue
Ora che abbiamo identificato la classe delle funzioni misurabili, vogliamo co-
struire l’integrale per queste funzioni. Il primo passo consiste nel definire
l’integrale per le funzioni semplici (esempio 3.7.3 (2)).
Cominciamo considerando l’importante sottofamiglia o
0
delle funzioni sem-
plici che sono nulle fuori da un insieme di misura finita.
Definizione 3.8.1 Sia ϕ ∈ o
0
, e supponiamo che la sua forma canonica sia
ϕ =
k

i=1
α
i
I
A
i
,
con gli α
i
numeri reali non nulli e A
i
= ¦ϕ = α
i
¦ insiemi misurabili di
misura finita. L’ integrale di ϕ su R
N
`e il numero reale
_
R
N
ϕdx =
k

i=1
α
i
m
N
(A
i
).
Si verifica facilmente che questa definizione `e indipendente dal modo con cui
si rappresenta la ϕ mediante insiemi misurabili disgiunti (esercizio 3.8.2).
Elenchiamo le principali propriet`a di cui gode l’integrale di funzioni di o
0
.
Proposizione 3.8.2 Siano ϕ, ψ ∈ o
0
. Valgono le seguenti propriet`a:
(i) (monotonia) se ϕ ≤ ψ, allora
_
R
N
ϕdx ≤
_
R
N
ψ dx;
(ii) (linearit` a) si ha
_
R
N
(αϕ + βψ) dx = α
_
R
N
ϕdx + β
_
R
N
ψ dx per ogni
α, β ∈ R.
Si noti che, come facile conseguenza di (i) e (ii), si ha la relazione
¸
¸
¸
¸
_
R
N
ϕdx
¸
¸
¸
¸

_
R
N
[ϕ[ dx ∀ϕ ∈ o
0
.
226
Dimostrazione (i) Consideriamo le rappresentazioni canoniche di ϕ e ψ:
ϕ =
k

i=1
α
i
I
A
i
, ψ =
h

j=1
β
j
I
B
j
.
Ponendo α
0
= β
0
= 0 e
A
0
=
_
k
_
i=1
A
i
_
c
, B
0
=
_
h
_
j=1
B
j
_
c
,
si pu`o scrivere ϕ =

k
i=0
α
i
I
A
i
e ψ =

h
j=0
β
j
I
B
j
. Essendo ϕ ≤ ψ, si riconosce
subito che, fissati i ∈ ¦0, 1, . . . , k¦ e j ∈ ¦0, 1, . . . , h¦, se A
i
∩B
j
non `e vuoto
allora α
i
≤ β
j
, in quanto per x ∈ A
i
∩ B
j
si ha α
i
= ϕ(x) ≤ ψ(x) = β
j
.
Quindi, scrivendo
ϕ =
k

i=0
h

j=0
α
i
I
A
i
∩B
j
, ψ =
h

j=0
k

i=0
β
j
I
A
i
∩B
j
,
otteniamo rappresentazioni di ϕ e ψ mediante insiemi disgiunti: pertanto, in
virt` u dell’esercizio 3.8.2, si ha
_
R
N
ϕdx =
k

i=0
h

j=0
α
i
m
N
(A
i
∩ B
j
) ≤
k

i=0
h

j=0
β
j
m
N
(A
i
∩ B
j
) =
_
R
N
ψ dx.
(ii) Rappresentando ϕ e ψ come in (i), si ha
αϕ + βψ =
k

i=0
h

j=0
(αα
i
+ ββ
j
)I
A
i
∩B
j
;
la tesi segue allora dalla definizione di integrale.
Integrale di funzioni misurabili
Estenderemo adesso l’integrale ad una vasta sottoclasse delle funzioni misu-
rabili; il risultato dell’operazione di integrazione potr` a anche fornire i valori
±∞.
Definizione 3.8.3 Sia f : R
N
→R una funzione misurabile.
227
(i) Se f ≥ 0, l’ integrale di f su R
N
`e la quantit`a (eventualmente infinita)
_
R
N
f dx = sup
__
R
N
ϕdx : ϕ ∈ o
0
, 0 ≤ ϕ ≤ f
_
.
(ii) Se f assume valori negativi, posto f
+
= max¦f, 0¦ e f

= −min¦f, 0¦,
diciamo che f `e integrabile su R
N
se almeno uno fra gli integrali
_
R
N
f
+
dx,
_
R
N
f

dx `e finito; in tal caso, l’integrale di f su R
N
`e
la quantit`a (eventualmente uguale a ±∞)
_
R
N
f dx =
_
R
N
f
+
dx −
_
R
N
f

dx.
(iii) Se l’integrale
_
R
N
f dx `e finito, diciamo che f `e sommabile su R
N
.
(iv) Sia D un sottoinsieme misurabile di R
N
. Diciamo che f `e integrabile
su D se la funzione fI
D
`e integrabile su R
N
; in tal caso si definisce
_
D
f dx =
_
R
N
fI
D
dx,
e diciamo che f `e sommabile su D se tale integrale `e finito.
Abbiamo cos`ı ottenuto un numero,
_
D
f dx, che dipende da D e da f. Ana-
lizziamo separatamente le due dipendenze.
Proposizione 3.8.4 Sia f una funzione integrabile definita su un insieme
misurabile D ⊆ R
N
. Se ¦D
n
¦
n∈N
`e una successione di insiemi misurabili e
disgiunti, tale che

n∈N
D
n
= D, allora si ha
_
D
f dx =

n∈N
_
Dn
f dx.
Dimostrazione Come gi` a osservato, possiamo supporre che f sia definita su
tutto R
N
. Se f = I
E
, con E insieme misurabile, la tesi segue dalla numerabile
additivit` a della misura di Lebesgue, in quanto
_
D
I
E
dx = m
N
(E ∩ D) = m
N
_
_
n∈N
(E ∩ D
n
)
_
=
=

n∈N
m
N
(E ∩ D
n
) =

n∈N
_
R
N
I
E
I
Dn
dx =

n∈N
_
Dn
I
E
dx.
228
Se f `e un elemento di o
0
, f =

k
i=1
α
i
I
A
i
, si ha per linearit` a
_
D
f dx =
k

i=1
α
i
m
N
(A
i
∩ D) =
k

i=1
α
i

n∈N
m
N
(A
i
∩ D
n
) =
=

n∈N
k

i=1
α
i
m
N
(A
i
∩ D
n
) =

n∈N
_
Dn
f dx.
Sia ora f misurabile e non negativa. Se f `e anche sommabile, fissato ε > 0,
dalla definizione 3.8.3 segue che esiste ϕ ∈ o
0
tale che
0 ≤ ϕ ≤ fI
D
,
_
D
ϕdx =
_
R
N
ϕdx >
_
D
f dx −ε.
Ne segue, essendo 0 ≤ ϕI
Dn
≤ fI
Dn
ed utilizzando quanto gi` a provato,

n∈N
_
Dn
f dx ≥

n∈N
_
Dn
ϕdx =
_
D
ϕdx >
_
D
f dx −ε.
Dunque, per l’arbitrariet` a di ε, vale la disuguaglianza ≤:
_
D
f dx ≤

n∈N
_
Dn
f dx.
Se invece f non `e sommabile, per ogni M > 0 esiste ϕ ∈ o
0
tale che
0 ≤ ϕ ≤ fI
D
,
_
D
ϕdx > M,
e per l’arbitrariet` a di M si ottiene analogamente la disuguaglianza ≤, che in
questo caso d` a direttamente l’uguaglianza

n∈N
_
Dn
f dx = +∞=
_
D
f dx.
Proviamo, sempre per f ≥ 0, la disuguaglianza ≥, in cui si pu` o chiaramente
supporre f sommabile. Fissato ε > 0, per ogni n ∈ N esiste ϕ
n
∈ o
0
tale che
0 ≤ ϕ
n
≤ fI
Dn
,
_
Dn
ϕ
n
dx =
_
R
N
ϕ
n
dx >
_
Dn
f dx −
ε
2
n+1
.
Posto ψ
m
=

m
n=0
ϕ
n
, si ha ancora ψ
m
∈ o
0
ed inoltre 0 ≤ ψ
m
≤ fI
D
;
quindi, utilizzando la linearit` a dell’integrale su o
0
(proposizione 3.8.2),
m

n=0
_
R
N
ϕ
n
dx =
_
R
N
ψ
m
dx ≤
_
D
f dx.
229
Ne segue, a maggior ragione,
m

n=0
__
Dn
f dx −
ε
2
n+1
_

_
d
f dx,
e per m →∞

n∈N
_
Dn
f dx −ε ≤
_
D
f dx.
L’arbitrariet` a di ε porta alla disuguaglianza ≥.
Infine, se f `e una funzione misurabile di segno variabile, basta fare la sottra-
zione fra le due uguaglianze
_
D
f
+
dx =

n∈N
_
Dn
f
+
dx,
_
D
f

dx =

n∈N
_
Dn
f

dx,
almeno una delle quali coinvolge certamente quantit` a finite.
Corollario 3.8.5 Sia f una funzione integrabile non negativa, definita su
un insieme misurabile D ⊆ R
N
. Se ¦D
n
¦
n∈N
`e una successione di insiemi
misurabili, tale che

n∈N
D
n
= D, allora si ha
_
D
f dx ≤

n∈N
_
Dn
f dx.
Dimostrazione Se i D
n
sono disgiunti, la tesi segue dalla proposizione 3.8.4.
Altrimenti, poniamo
E
0
= D
0
, E
n
= D
n
¸
n−1
_
k=0
D
k
∀n ∈ N
+
.
Chiaramente gli E
n
sono misurabili e disgiunti, e si ha ancora


n=0
E
n
= D.
Per la proposizione 3.8.4, essendo f ≥ 0, possiamo scrivere
_
D
f dx =

n=0
_
En
f dx ≤

n=0
_
Dn
f dx,
che `e la tesi.
Prima di esaminare come l’integrale dipende dall’integrando f, conviene fare
una considerazione di carattere generale.
230
Osservazione 3.8.6 Gli insiemi di misura nulla, altrimenti detti insiemi
trascurabili, giocano nella teoria di Lebesgue un ruolo particolarmente im-
portante. Anzitutto, sappiamo che se C `e misurabile con m
N
(C) = 0 allora
ogni sottoinsieme di C `e a sua volta misurabile con misura nulla (esercizio
3.4.16). Poi, se f `e integrabile su D e C ⊆ D ha misura nulla, allora si
ha
_
C
f dx = 0, come facile conseguenza della definizione di integrale (defi-
nizione 3.8.3). Pi` u in generale, se g `e un’altra funzione definita su D tale
che m
N
(¦f ,= g¦) = 0, allora anche g `e misurabile (esercizio 3.7.4) e si ha
_
E
f dx =
_
E
g dx per ogni sottoinsieme misurabile E ⊆ D: infatti, ¦f ,= g¦
risulta misurabile con misura nulla, da cui
_
E
g dx =
_
E\¡f,=g¦
g dx +
_
E∩¡f,=g¦
g dx =
_
E\¡f,=g¦
f dx + 0 =
_
E
f dx.
Pi` u importante ancora, come vedremo pi` u avanti, `e il ruolo degli insiemi di
misura nulla nell’ambito della teoria dell’integrazione secondo Lebesgue: si
vedano a questo proposito la definizione 3.10.1 e gli esempi 3.10.2.
Una basilare conseguenza dell’osservazione precedente `e il fatto che se una
funzione f `e sommabile su un insieme misurabile D, allora, modificandola
sull’insieme dove essa vale ±∞, che per l’esercizio 3.8.4 `e un insieme di misura
nulla, possiamo sempre supporre che f assuma solo valori finiti, senza alterare
il valore dell’integrale
_
D
f dx.
Proposizione 3.8.7 Siano f, g funzioni integrabili definite sull’insieme mi-
surabile D ⊆ R
N
. Valgono i seguenti fatti:
(i) (monotonia) se f ≤ g, allora
_
D
f dx ≤
_
D
g dx;
(ii) (omogeneit` a) se α ∈ R, allora
_
D
αf dx = α
_
D
f dx;
(iii) (additivit` a) se non risulta n´e
_
D
f dx = −
_
D
g dx = +∞, n´e
_
D
f dx =

_
D
g dx = −∞, allora si ha
_
D
(f + g) dx =
_
D
f dx +
_
D
g dx.
Notiamo che l’integrale
_
D
(f +g) dx ha sempre senso, anche se in effetti f +g
non `e definita nell’insieme
M = ¦x ∈ D : f(x) = −g(x) = ±∞¦.
231
Infatti l’insieme M, per le ipotesi fatte, ha misura nulla: dunque, per l’osser-
vazione 3.8.6, possiamo ridefinire f = g = 0 su M, senza alterare i due inte-
grali
_
D
f dx e
_
D
g dx, e pertanto, nelle nostre ipotesi, l’integrale
_
D
(f+g) dx
coincide con
_
D\M
(f + g) dx.
Dimostrazione (i) Se si ha 0 ≤ f ≤ g, la tesi `e facile conseguenza della
definizione 3.8.3.
Nel caso generale, si osservi che se f ≤ g allora f
+
≤ g
+
e f

≥ g

; quindi
_
D
f
+
dx ≤
_
D
g
+
dx,
_
D
f

dx ≥
_
D
g

dx,
e la tesi segue per sottrazione.
(ii) Sia α ≥ 0. Se f ≥ 0, la tesi segue dalla definizione 3.8.3; altrimenti,
essendo (αf)
+
= αf
+
e (αf)

= αf

, si deduce la tesi anche per le f non
sempre positive. Sia ora α = −1: da (−f)
+
= f

e (−f)

= f
+
segue che
_
D
(−f) dx =
_
D
f

dx −
_
D
f
+
dx = −
_
D
f dx.
Infine, se α < 0 basta combinare i due casi precedenti.
(iii) Distinguiamo quattro casi.
I: f, g ≥ 0.
In questo caso la funzione f + g `e sicuramente integrabile. Siano ϕ, ψ ∈ o
0
con 0 ≤ ϕ ≤ fI
D
e 0 ≤ ψ ≤ gI
D
; allora 0 ≤ ϕ + ψ ≤ (f + g)I
D
e dunque
_
D
ϕdx +
_
D
ψ dx =
_
D
(ϕ + ψ) dx ≤
_
D
(f + g) dx.
Per l’arbitrariet` a di ϕ e ψ si ottiene
_
D
f dx +
_
D
g dx ≤
_
D
(f + g) dx.
Per provare la disuguaglianza opposta, introduciamo gli insiemi misurabili
D
m
= ¦x ∈ D : m ≤ f(x) + g(x) < m+ 1¦, m ∈ N
+
,
D

= ¦x ∈ D : f(x) + g(x) = +∞¦,
232
D
m
=
_
x ∈ D :
1
m + 1
≤ f(x) + g(x) <
1
m
_
, m ∈ N
+
,
D

= ¦x ∈ D : f(x) + g(x) = 0¦.
Fissiamo β ∈]0, 1[ e scegliamo ϕ ∈ o
0
tale che 0 ≤ ϕ ≤ β(f +g)I
D
. Siano poi
¦ϕ
n
¦ e ¦ψ
n
¦ due successioni di funzioni semplici, costruite con la procedura
descritta nella dimostrazione della proposizione 3.7.9, convergenti puntual-
mente a fI
D
e gI
D
rispettivamente. La strategia `e quella di mostrare che si
ha ϕ ≤ ϕ
n

n
definitivamente in ciascuno degli insiemi D
m
e D
m
(m ,= ∞),
grazie al fatto che, per l’osservazione 3.7.10, la convergenza delle ¦ϕ
n
¦ e delle
¦ψ
n
¦ `e ivi uniforme: in effetti, poich´e
(f + g) −ϕ ≥ (1 −β)(f + g) ≥ (1 −β)m in D
m
,
(f + g) −ϕ ≥ (1 −β)(f + g) ≥
1 −β
m + 1
in D
m
,
ϕ < f + g = +∞ in D

,
ϕ = f + g = 0 in D

,
per ogni m ∈ N
+
∪¦∞¦ esiste ν
m
∈ N tale che per quanlunque n > ν
m
risulta
ϕ ≤ (f + g) −(1 −β)m ≤ ϕ
n
+ ψ
n
≤ f + g in D
m
,
ϕ ≤ (f + g) −
1 −β
m + 1
≤ ϕ
n
+ ψ
n
≤ f + g in D
m
,
ϕ ≤ ϕ
n
+ ψ
n
< +∞= f + g in D

,
ϕ = ϕ
n
+ ψ
n
= 0 = f + g in D

.
Modifichiamo lievemente le disuguaglianze precedenti: detto E = ¦ϕ > 0¦,
si ha m
N
(E) < ∞; inoltre risulta per ogni n ≥ ν
m
ϕ ≤ ϕ
n
I
E
+ ψ
n
I
E
≤ f + g in D
m
,
ϕ ≤ ϕ
n
I
E
+ ψ
n
I
E
≤ f + g in D
m
,
ϕ ≤ ϕ
n
I
E
+ ψ
n
I
E
< ∞= f + g in D

,
ϕ = ϕ
n
I
E
+ ψ
n
I
E
= 0 = f + g in D

,
233
con il vantaggio di avere ora ϕ
n
I
E
, ψ
n
I
E
∈ o
0
. Possiamo perci` o utilizzare la
proposizione 3.8.2, ricavando che per ogni m ∈ N
+
∪ ¦∞¦ e n ≥ ν
m
si ha,
essendo 0 ≤ ϕ
n
I
E
≤ fI
D
e 0 ≤ ψ
n
I
E
≤ gI
D
,
_
D
m
ϕdx ≤
_
D
m

n
+ ψ
n
)I
E
dx =
_
R
N

n
+ ψ
n
)I
D
m
∩E
dx =
=
_
R
N
ϕ
n
I
D
m
∩E
dx +
_
R
N
ψ
n
I
D
m
∩E
dx ≤
_
D
m
f dx +
_
D
m
g dx
e similmente
_
Dm
ϕdx ≤
_
Dm

n
+ ψ
n
)I
E
dx =
_
R
N

n
+ ψ
n
)I
Dm∩E
dx =
=
_
R
N
ϕ
n
I
Dm∩E
dx +
_
R
N
ψ
n
I
Dm∩E
dx ≤
_
Dm
f dx +
_
Dm
g dx.
Sommiamo rispetto a m ∈ N
+
∪ ¦∞¦: dato che
D =
_
_
m∈N
+
D
m
_
∪ D


_
_
m∈N
+
D
m
_
∪ D

,
per la proposizione 3.8.4 si deduce
_
R
N
ϕdx =
_
D
ϕdx ≤
_
D
f dx +
_
D
g dx,
e per l’arbitrariet` a di ϕ
β
_
D
(f + g) dx ≤
_
D
f dx +
_
D
g dx.
Per β →1
+
si ottiene infine la disuguaglianza opposta cercata.
II: f, g ≤ 0.
In questo caso basta applicare il risultato di I a −f e −g, e poi usare l’omo-
geneit` a.
III: f ≥ 0, g ≤ 0.
In questo caso non sappiamo a priori se f + g sia integrabile. Definiamo gli
insiemi misurabili seguenti:
S
+
= ¦(f + g)I
D
≥ 0¦, S

= ¦(f + g)I
D
< 0¦;
234
gli integrali di f + g su tali insiemi hanno certamente senso. Per quanto gi`a
dimostrato possiamo scrivere
_
S
+
f dx =
_
R
N
fI
S
+ dx =
_
R
N
[(f + g)I
S
+ + (−g)I
S
+] dx =
=
_
R
N
(f + g)I
S
+ dx +
_
R
N
(−g)I
S
+ dx =
=
_
S
+
(f + g) dx −
_
S
+
g dx,
e analogamente
_
S

g dx =
_
R
N
gI
S
− dx =
_
R
N
[(g + f)I
S
− + (−f)I
S
−] dx =
=
_
R
N
(g + f)I
S
− dx +
_
R
N
(−f)I
S
− dx =
=
_
S

(g + f) dx −
_
S

f dx.
Ora notiamo che, per ipotesi, non si ha
_
D
f dx = −
_
D
g dx = +∞, e dunque
uno almeno fra gli integrali
_
S
+
f dx e
_
S
+
g dx `e finito: se ne deduce
_
S
+
f dx +
_
S
+
g dx =
_
S
+
(f + g) dx =
_
D
(f + g)
+
dx,
e pr analogo motivo
_
S

f dx +
_
S

g dx =
_
S

(f + g) = −
_
D
(f + g)

dx;
per somma si ha allora la tesi.
IV: f e g di segno qualunque.
Poniamo
F
+
= ¦fI
D
≥ 0¦, F

= ¦fI
D
≤ 0¦, G
+
= ¦gI
D
≥ 0¦, G

= ¦gI
D
≤ 0¦ :
allora F
+
∩G
+
, F
+
∩G

, F

∩G
+
e F

∩G

sono insiemi misurabili disgiunti,
la cui unione `e D, e su ciascuno di essi la tesi `e vera in virt` u di uno dei tre
passi precedenti. Sommando le quattro uguaglianze (delle quali al pi` u due
sono tra quantit`a infinite, ma dello stesso segno) si ottiene la tesi per D.
235
Esercizi 3.8
1. Si verifichi che se A, B ⊆ R
N
allora
I
A∩B
= I
A
I
B
, I
A∪B
= I
A
+ I
B
−I
A
I
B
, I
A\B
= I
A
−I
A
I
B
.
2. Si verifichi che se ϕ ∈ o
0
e se risulta
ϕ(x) =
k

i=1
α
i
I
A
i
=
h

j=1
β
j
I
B
j
,
con A
i
e B
j
insiemi misurabili disgiunti di misura finita, allora si ha
k

i=1
α
i
m
N
(A
i
) =
h

j=1
β
j
m
N
(B
j
).
3. Siano α
1
, . . . , α
n
numeri reali distinti, e siano E
1
, . . . E
n
sottoinsiemi ar-
bitrari di R
N
, fra loro disgiunti. Si provi che la funzione g =

n
i=1
α
i
I
E
i
`e misurabile su R
N
se e solo se gli insiemi E
i
sono tutti misurabili.
4. Sia D un sottoinsieme di R
N
di misura nulla. Provare che per ogni
funzione misurabile f si ha
_
D
f dx = 0.
5. Si considerino le funzioni ¦ε
n
¦ dell’esercizio 3.7.6. Si calcoli, per ogni
n ∈ N, l’integrale
_
[0,1]
ε
n
dx.
6. Si calcoli l’integrale
_
[0,1]
f dx, ove f `e definita da
f(x) =
_
0 se x ∈ Q,
n se x / ∈ Q e la prima cifra decimale non nulla `e l’n-esima.
7. Sia f una funzione misurabile su R
N
. Si provi che f `e sommabile su
R
N
se e solo se [f[ `e sommabile su R
N
.
8. Sia f una funzione sommabile su R
N
. Si provi che m
N
(¦f = ±∞¦) = 0.
9. Sia f una funzione misurabile su R
N
. Posto F
n
= ¦[f[ ≥ n¦, si provi
che se f `e sommabile, allora lim
n→∞
nm
N
(F
n
) = 0.
`
E vero il viceversa?
10. Siano f, g funzioni integrabili o sommabili su R
N
. Si provi che f∨g, f∧g
sono a loro volta rispettivamente integrabili o sommabili su R
N
.
236
3.9 Confronto con l’integrale di Riemann
Consideriamo il caso N = 1: vogliamo confrontare l’integrale di Lebesgue
con quello di Riemann visto nel corso di Analisi 1.
Ricordiamo che una funzione f : [a, b] → R, limitata, `e integrabile secondo
Riemann su [a, b] se, posto per ogni suddivisione σ : a = x
0
< x
1
< . . . <
x
k
= b di [a, b]
s(f, σ) =
k

i=1
_
inf
[x
i−1
,x
i
]
f
_
(x
i
−x
i−1
), S(f, σ) =
k

i=1
_
sup
[x
i−1
,x
i
]
f
_
(x
i
−x
i−1
),
risulta
sup
σ
s(f, σ) = inf
σ
S(f, σ);
in tal caso l’integrale di Riemann
_
b
a
f dx `e definito uguale a tale numero.
Ci proponiamo di dimostrare che se f `e integrabile secondo Riemann in [a, b],
allora f `e sommabile in [a, b] e il suo integrale secondo Lebesgue coincide con
quello secondo Riemann.
Cominciamo col provare che se f ∈ 1(a, b) allora f `e misurabile. Osserviamo
che i numeri s(f, σ) e S(f, σ) sono gli integrali su [a, b] delle due funzioni
semplici
ϕ
σ
=
k

i=1
_
inf
[x
i−1
,x
i
]
f
_
I
[x
i−1
,x
i
]
, ψ
σ
=
k

i=1
_
sup
[x
i−1
,x
i
]
f
_
I
[x
i−1
,x
i
]
,
le quali, oltre che semplici, sono costanti a tratti: ci` o significa che le funzioni
caratteristiche coinvolte si riferiscono ad intervalli e non ad insiemi misurabili
qualunque. Dunque, il fatto che f ∈ 1(a, b) equivale a dire che per ogni
n ∈ N
+
esistono due funzioni ϕ
n
, ψ
n
costanti a tratti, tali che
ϕ
n
≤ f ≤ ψ
n
in [a, b],
_
b
a

n
−ϕ
n
) dx <
1
n
.
Si pu`o supporre, rimpiazzando ϕ
n
con max
1≤k≤n
ϕ
k
e ψ
n
con min
1≤k≤n
ψ
k
,
che si abbia ϕ
n
≤ ϕ
n+1
e ψ
n
≥ ψ
n+1
per ogni n ∈ N
+
. Dunque esistono i
limiti puntuali
ϕ(x) = lim
n→∞
ϕ
n
(x), ψ(x) = lim
n→∞
ψ
n
(x),
237
e si ha ϕ ≤ f ≤ ψ in [a, b]. Le funzioni ϕ e ψ sono misurabili (proposizione
3.7.9); quindi se dimostriamo che l’insieme N = ¦ϕ < ψ¦ ha misura nulla,
otteniamo che f `e misurabile: infatti per ogni α ∈ R vale la relazione
¦f > α¦ = ¦x ∈ N : f(x) > α¦ ∪ ¦x ∈ N
c
: ψ(x) > α¦
nella quale il secondo insieme `e misurabile perch´e tale `e N, mentre il primo
`e misurabile essendo incluso in N che ha misura nulla (esercizio 3.4.16).
Per provare che m
1
(N) = 0, osserviamo che la funzione ψ −ϕ `e misurabile e
0 ≤ ψ −ϕ ≤ ψ
n
−ϕ
n
in [a, b] ∀n ∈ N
+
,
da cui, per monotonia,
0 ≤
_
b
a
(ψ −ϕ) dx ≤
_
b
a

n
−ϕ
n
) dx ≤
1
n
∀n ∈ N
+
.
Ne segue
_
b
a
(ψ − ϕ) dx = 0. Ora, scrivendo [a, b] = N ∪ N
c
ed osservando
che ψ −ϕ = 0 su N
c
, si ha per ogni k ∈ N
+
0 =
_
N
(ψ −ϕ) dx ≥
_
¡ψ−ϕ≥1/k¦
(ψ −ϕ) dx ≥
1
k
m
1
(¦ψ −ϕ ≥ 1/k¦) :
ci` o implica m
1
(¦ψ − ϕ ≥ 1/k¦) = 0 per ogni k ∈ N
+
. Essendo poi N =

k∈N
+
¦ψ−ϕ ≥ 1/k¦, dalla proposizione 3.5.3 segue finalmente che m
1
(N) =
0 e pertanto ogni funzione f ∈ 1(a, b) `e misurabile.
Veniamo alla dimostrazione della sommabilit` a di f e della coincidenza dei due
integrali, che denoteremo con
_
b
a
f dx (Riemann) e con
_
[a,b]
f dx (Lebesgue).
Supponiamo dapprima f ≥ 0: allora
_
b
a
f dx = sup
__
b
a
ϕdx : ϕ ≤ f, ϕ costante a tratti
_

≤ sup
__
b
a
ϕdx : ϕ ≤ f, ϕ ∈ o
0
_
=
_
[a,b]
f dx;
d’altra parte, per ogni ψ costante a tratti tale che ψ ≥ f (ne esistono, essendo
f limitata) si ha, per monotonia,
_
[a,b]
f dx ≤
_
[a,b]
ψ dx, da cui
_
[a,b]
f dx ≤ inf
__
b
a
ψ dx : ψ ≥ f, ψ costante a tratti
_
=
_
b
a
f dx.
238
Dunque, gli integrali
_
[a,b]
f dx e
_
b
a
f dx coincidono. Se poi f cambia segno,
si applica quanto detto sopra a f
+
e f

.
Dato che l’integrale di Riemann, se esiste, `e uguale a quello di Lebesgue, d’ora
in avanti scriveremo
_
b
a
f dx anche per indicare l’integrale secondo Lebesgue.
In particolare, gli integrali di Riemann e di Lebesgue coincidono per ogni
funzione continua, e pertanto continuano a valere per l’integrale di Lebesgue
1-dimensionale i teoremi sull’integrazione visti in Analisi 1, ed in particolare
il teorema fondamentale del calcolo integrale: se f ∈ C[a, b] allora F(x) =
_
[a,x]
f dt =
_
x
a
f dt `e derivabile in [a, b] con F
t
= f. Ci`o implica la validit`a,
anche nell’ambito della teoria di Lebesgue, delle formule di integrazione per
parti e per sostituzione (sempre che gli integrandi verifichino le adeguate
ipotesi di regolarit` a).
Osservazione 3.9.1 Le funzioni sommabili sono pi` u di quelle integrabili
secondo Riemann: ad esempio, la funzione I
Q
non `e integrabile secondo
Riemann in alcun intervallo [a, b], mentre `e sommabile in ogni [a, b] con
_
b
a
I
Q
dx = 0.
Esercizi 3.9
1. Sia C
p
l’insieme di Cantor di parametro p > 3 (esercizio 3.4.9). La
funzione I
Cp
`e integrabile secondo Riemann su [0, 1]?
2. Si consideri la funzione f : R →R definita da
f(x) =
_
sin x
x
se x ,= 0,
0 se x = 0.
Si provi che f `e integrabile secondo Riemann in senso improprio su R,
ma non `e integrabile secondo Lebesgue su R.
[Traccia: Si utilizzi l’esercizio 3.8.7.]
3.10 Passaggio al limite sotto il segno di in-
tegrale
Una delle pi` u importanti propriet`a dell’integrale di Lebesgue `e il fatto di
poter scambiare fra loro, in ipotesi molto blande, le operazioni di limite e
239
di integrazione. Prima di dare i risultati principali, conviene introdurre una
comoda locuzione, strettamente legata alle propriet` a degli insiemi di misura
nulla citate nell’osservazione 3.8.6.
Definizione 3.10.1 Sia D un sottoinsieme misurabile di R
N
. Diciamo che
una propriet`a p(x) `e vera quasi ovunque in D (abbreviato: q.o. in D) se,
posto P = ¦x ∈ D : p(x)¦, l’insieme D¸ P `e misurabile con m
N
(D¸ P) = 0.
Esempi 3.10.2 (1) Se f `e misurabile su D e se g : D → R `e un’altra
funzione tale che g(x) = f(x) q.o., allora anche g `e misurabile (esercizio
3.7.4).
(2) Se f `e sommabile e non negativa su D, e se K ⊆ D `e un insieme
misurabile tale che
_
K
f dx = 0 allora f = 0 q.o. su K. Infatti, posto
K
n
= ¦fI
K

1
n
¦, n ∈ N
+
, si ha
1
n
m
N
(K
n
) ≤
_
Kn
f dx ≤
_
K
f dx = 0,
da cui m
N
(K
n
) = 0 per ogni n ∈ N
+
. Poich´e


n=1
K
n
= ¦fI
K
> 0¦, in virt` u
della subadditivit`a della misura anche questo insieme ha misura nulla.
Osservazione 3.10.3 La relazione f = g q.o. su D `e una relazione di equi-
valenza nell’insieme di tutte le funzioni misurabili su D, come `e immediato
verificare. Questo fatto `e estremamente importante, perch´e ci permetter` a di
costruire spazi di Banach di funzioni sommabili dotati di norme integrali, a
dispetto di quanto osservato nel paragrafo 3.1.
Veniamo ora ai teoremi di passaggio al limite sotto il segno di integrale. Il
principale di questi, da cui discendono tutti gli altri, riguarda successioni
crescenti di funzioni.
Teorema 3.10.4 (di Beppo Levi o della convergenza monotona) Sia
D un sottoinsieme misurabile di R
N
e sia ¦f
n
¦
n∈N
una successione di funzioni
misurabili definite su D, tali che 0 ≤ f
n
≤ f
n+1
q.o. in D per ogni n ∈ N.
Allora il limite puntuale f(x) = lim
n→∞
f
n
(x) esiste q.o. in D, e si ha
lim
n→∞
_
D
f
n
dx =
_
D
f dx.
240
Dimostrazione Posto P
n
= ¦f
n
< 0¦ e Q
n
= ¦f
n+1
< f
n
¦, gli insiemi
P
n
e Q
n
hanno misura nulla per ipotesi; quindi anche P =

n∈N
(P
n
∪ Q
n
)
ha misura nulla, ed il limite puntuale f `e ben definito e non negativo su
D ¸ P. Possiamo poi estendere f a tutto D ponendola uguale a 0, il che
come sappiamo preserva la misurabilit` a, e non altera ovviamente il valore
dell’integrale, nel senso che
_
D
f dx =
_
D\P
f dx.
Notiamo che il limite degli integrali su D di f
n
esiste certamente, poich´e
_
D
f
n
dx =
_
D\P
f
n
dx ≤
_
D\P
f
n+1
dx =
_
D
f
n+1
dx,
ed anzi si ha
lim
n→∞
_
D
f
n
dx ≤
_
D
f dx.
Dobbiamo provare la disuguaglianza opposta. Sia β ∈]0, 1[ e sia ψ ∈ o
0
tale
che 0 ≤ ψ ≤ f. Posto A
n
= ¦f
n
≥ βψ¦, gli A
n
sono misurabili, definiti-
vamente non vuoti (essendo β < 1), nonch´e crescenti rispetto all’inclusione;
inoltre, dato che f
n
(x) → f(x) per ogni x ∈ D, risulta D =

n∈N
A
n
.
Poniamo anche B
0
= A
0
e B
n
= A
n
¸ A
n−1
per n ≥ 1. Si ha allora
β
_
An
ψ dx ≤
_
An
f
n
dx ≤
_
D
f
n
dx ≤ lim
n→∞
_
D
f
n
dx,
ovvero, essendo A
n
l’unione disgiunta di B
0
, . . . , B
n
,
β
n

k=0
_
B
k
ψ dx ≤ lim
n→∞
_
D
f
n
dx ∀n ∈ N.
Poich´e D =

k∈N
B
k
, da qui ricaviamo, per la proposizione 3.8.4,
β
_
D
ψ dx = β

k=0
_
B
k
ψ dx ≤ lim
n→∞
_
D
f
n
dx.
Per l’arbitrariet` a di ψ, ci`o implica
β
_
D
f dx ≤ lim
n→∞
_
D
f
n
dx,
ed infine per β →1 si ha la tesi.
241
Osservazione 3.10.5 Il teorema precedente `e falso se si sopprime qualcuna
delle ipotesi: ad esempio, in R le funzioni f
n
= I
[n,+∞[
formano una succes-
sione crescente ma non positiva, che tende puntualmente a f = 0, e tuttavia
risulta, per ogni n ∈ N,
_
R
f
n
dx = −∞ < 0 =
_
R
f dx. Invece le funzioni
f
n
= I
[n,n+1]
sono non negative ma non formano una successione crescente: il
loro limite puntuale `e f = 0 ma, per ogni n ∈ N,
_
R
f
n
dx = 1 > 0 =
_
R
f dx.
Per successioni di funzioni non negative vale il seguente risultato molto
generale:
Lemma 3.10.6 (di Fatou) Sia D un sottoinsieme misurabile di R
N
, e sia
¦f
n
¦
n∈N
una successione di funzioni misurabili definite su D e q.o. non
negative. Posto
f(x) = liminf
n→∞
f
n
(x), x ∈ D,
si ha _
D
f dx ≤ liminf
n→∞
_
D
f
n
dx.
Dimostrazione La successione ¦g
n
¦
n∈N
, definita da
g
n
= inf
m≥n
f
m
,
`e crescente; inoltre le g
n
sono q.o. non negative. Essendo, per definizione di
minimo limite, f(x) = lim
n→∞
g
n
(x) per ogni x ∈ D, si ha dal teorema di
Beppo Levi
_
D
f dx = lim
n→∞
_
D
g
n
dx;
d’altra parte, poich´e g
n
≤ f
m
in D per ogni m ≥ n, integrando su D troviamo
_
D
g
n
dx ≤
_
D
f
m
dx ∀m ≥ n,
ovvero _
D
g
n
dx ≤ inf
m≥n
_
D
f
m
dx.
Pertanto, ancora per definizione di minimo limite,
_
D
f dx = lim
n→∞
_
D
g
n
dx ≤ liminf
n→∞
_
D
f
n
dx.
Il risultato che segue `e il pi` u utile fra i teoremi di passaggio al limite sotto il
segno di integrale.
242
Teorema 3.10.7 (di Lebesgue o della convergenza dominata) Sia D
un sottoinsieme misurabile di R
N
, e sia ¦f
n
¦
n∈N
una successione di funzioni
misurabili definite su D, tali che:
(i) f
n
(x) →f(x) q.o. in D,
(ii) [f
n
(x)[ ≤ g(x) q.o. in D, per ogni n ∈ N,
ove g `e una fissata funzione sommabile e non negativa su D. Allora
lim
n→∞
_
D
f
n
dx =
_
D
f dx,
ed anzi
lim
n→∞
_
D
[f
n
−f[ dx = 0.
Dimostrazione Consideriamo le successioni ¦g − f
n
¦
n∈N
e ¦g + f
n
¦
n∈N
,
entrambe costituite da funzioni q.o. non negative e convergenti puntualmente
q.o in D, rispettivamente a g − f e g + f. Applicando il lemma di Fatou a
tali successioni, troviamo
_
D
(g −f) dx ≤ liminf
n→∞
(g −f
n
) dx =
_
D
g dx −limsup
n→∞
_
D
f
n
dx,
_
D
(g + f) dx ≤ liminf
n→∞
(g + f
n
) dx =
_
D
g dx + liminf
n→∞
_
D
f
n
dx.
Essendo g sommabile su D, possiamo semplificare i termini contenenti l’in-
tegrale di g, ottenendo
limsup
n→∞
_
D
f
n
dx ≤
_
D
f dx ≤ liminf
n→∞
_
D
f
n
dx,
cio`e la prima parte della tesi.
La seconda parte della tesi segue applicando quanto gi`a dimostrato alla
successione ¦[f
n
−f[¦, il che `e lecito poich´e
[f
n
(x) −f(x)[ →0 q.o. in D, [f
n
(x) −f(x)[ ≤ 2 g(x) q.o. in D.
243
Assoluta continuit`a dell’integrale
L’integrale di Lebesgue ha un’altra importante propriet` a, vale a dire la co-
siddetta assoluta continuit`a. Con ci` o si intende il fatto che se f `e una fun-
zione sommabile allora l’integrale
_
E
[f[ dx, come funzione dell’insieme E, `e
“piccolo” al tendere a 0 della misura di E. Precisamente, vale il seguente
risultato:
Teorema 3.10.8 Sia D un sottonsieme misurabile di R
N
. Se f `e una fun-
zione sommabile su D, allora per ogni ε > 0 esiste δ > 0 per il quale risulta
_
E
[f[ dx < ε per ogni insieme misurabile E ⊆ D con m
N
(E) < δ.
Dimostrazione Ragioniamo per assurdo. Supponiamo che la tesi non sia
vera: dunque esiste ε
0
> 0 tale che, per ogni n ∈ N, scelto δ = 2
−n
, si pu` o
trovare un insieme misurabile E
n
⊆ D per cui risulta
m
N
(E
n
) < 2
−n
,
_
En
[f[ dx ≥ ε
0
.
Ponendo allora
F
n
=

_
k=n
E
n
, F =

_
n=0
F
n
,
abbiamo, per le proposizioni 3.5.2 e 3.5.3(ii),
m
N
(F
n
) ≤

k=n
2
−k
= 2
−n+1
, m
N
(F) = 0.
Dunque
_
F
[f[ dx = 0. D’altra parte, osservando che la successione di funzioni
sommabili ¦[f[I
Fn
¦ converge puntualmente, in modo decrescente, a [f[I
F
, il
teorema di Lebesgue ci permette di dedurre
0 =
_
F
[f[ dx = lim
n→∞
_
Fn
[f[ dx ≥ liminf
n→∞
_
En
[f[ dx ≥ ε
0
,
il che `e assurdo. Ci`o prova la tesi.
Esercizi 3.10
1. Sia D un sottoinsieme misurabile di R
N
e sia ¦f
n
¦
n∈N
una successione
di funzioni misurabili definite su D, tali che g ≤ f
n
≤ f
n+1
q.o. in D
per ogni n ∈ N, ove g `e una funzione sommabile su D. Si provi che
lim
n→∞
_
D
f
n
dx =
_
D
f dx.
244
2. Sia D un sottoinsieme misurabile di R
N
e sia ¦f
n
¦
n∈N
una successione
di funzioni misurabili definite su D, q.o. non negative. Si provi che

n∈N
_
D
f
n
dx =
_
D

n∈N
f
n
dx.
3. Sia D un sottoinsieme misurabile di R
N
e sia ¦f
n
¦
n∈N
una successione
di funzioni misurabili definite su D, tali che la funzione

n∈N
[f
n
[ sia
sommabile su D. Si provi che

n∈N
_
D
f
n
dx =
_
D

n∈N
f
n
dx.
4. Sia f una funzione sommabile sull’insieme misurabile D ⊆ R
N
. Si provi
che
lim
n→∞
_
D
[f[
1/n
dx = m
N
(¦f ,= 0¦).
5. Posto f
n
(x) =
_
n+x
n+2x
_
n
, x ≥ 0, si dimostri che f
n
≥ f
n+1
per ogni
n ∈ N, si determini lim
n→∞
f
n
e si dica se `e possibile passare al limite
sotto il segno di integrale nei due casi seguenti:
(i)
_

0
f
n
(x)e
x/2
dx, (ii)
_

0
f
n
(x)e
−x/2
dx.
6. Per ogni α ∈ R si esibisca una successione ¦f
n
¦ tale che
lim
n→∞
f
n
(x) = 0 ∀x ∈ [0, 1], lim
n→∞
_
1
0
f
n
dx = α.
7. Sia f una funzione sommabile su R
N
. Provare che per ogni ε > 0 esiste
un compatto K ⊂ R
N
tale che
_
K
c
[f[ dx < ε.
8. Esibire una funzione sommabile su R, illimitata sul complementare di
ogni compatto.
9. Dimostrare le seguenti uguaglianze:
(i)
_
1
0
x
p
1 −x
[ ln x[ dx =

n=1
1
(n + p)
2
∀p > −1,
245
(ii)
_
1
0
sin x ln x dx =

n=1
(−1)
n
2n(2n)!
,
(iii)
_

0
sin x
e
x
−t
dx =

n=0
t
n
1 + (n + 1)
2
∀t ∈ [−1, 1],
(iv)
_

0
cos x
e
x
+ 1
dx =

n=1
(−1)
n
n
n
2
+ 1
,
(v)
_

0
e
−x
cos

x dx =

n=0
(−1)
n
n!
(2n)!
,
(vi)
_

0
e
−x
2
sin x dx =

n=0
(−1)
n
2
n!
(2n + 1)!
,
(vii)
_
1
0
(x ln x)
2
1 + x
2
dx = 2

n=1
(−1)
n−1
(2n + 1)
3
.
10. Provare che
_
1
0
x
p−1
1 + x
q
dx =

n=0
(−1)
n
p + nq
∀p, q > 0,
e dedurne che

n=0
(−1)
n
n + 1
= ln 2,

n=0
(−1)
n
2n + 1
=
π
4
,

n=0
(−1)
n
3n + 1
=
ln 2
3
+
π
3

3
.
11. Provare che
_
1
0
1 −x
1 −ax
3
dx =

n=0
a
n
(3n + 1)(3n + 2)
∀a ∈ [−1, 1],
e dedurne che

n=0
1
(3n + 1)(3n + 2)
=
π
3

3
,

n=0
1
(6n + 1)(6n + 2)
=
π
6

3
+
ln 2
3

3
.
12. Calcolare, se esistono, i limiti seguenti:
lim
n→∞
_

0
nx + x
2
1 + nx
3/2
e


x
dx, lim
n→∞
_
n
0
1
x
−n
+ x
2
dx.
246
13. (Continuit`a degli integrali dipendenti da parametro) Sia D un sottoin-
sieme misurabile di R
N
, sia t
0
∈ R e sia f : D R → R una funzione
tale che:
(i) ∃ lim
t→t
0
f(x, t) = g(x) per q.o. x ∈ D;
(ii) la funzione x →f(x, t) `e misurabile su D per ogni t ∈ R, ed esiste
una funzione sommabile h : D → R tale che [f(x, t)[ ≤ h(x) per
q.o. x ∈ D e per ogni t ∈ R.
Si provi che allora
∃ lim
t→t
0
_
D
f(x, t) dx =
_
D
g(x) dx.
[Traccia: si applichi il teorema 3.10.7 ad una qualunque successione
¦t
n
¦
n∈N
⊂ R ¸ ¦t
0
¦ che converga a t
0
.]
14. Sia f una funzione sommabile in [0, ∞[, tale che x
α
f(x) e x
β
f(x) siano
sommabili per certi α, β ∈ R con α < β. Si provi che se γ ∈ [α, β]
anche x
γ
f(x) `e sommabile e che la funzione F(γ) =
_

0
x
γ
[f(x)[ dx `e
continua.
15. (Derivabilit`a degli integrali dipendenti da parametro) Sia D un sot-
toinsieme misurabile di R
N
e sia f : D R → R una funzione tale
che:
(i) ∃
∂f
∂t
(x, t) per q.o. x ∈ D e per ogni t ∈ R;
(ii) la funzione x →f(x, t) `e sommabile su D per ogni t ∈ R, ed esiste
una funzione sommabile h : D →R tale che
¸
¸
∂f
∂t
(x, t)
¸
¸
≤ h(x) per
q.o. x ∈ D e per ogni t ∈ R.
Si provi che allora

d
dt
_
D
f(x, t) dx =
_
D
∂f
∂t
(x, t) dx ∀t ∈ R.
[Traccia: si verifichi che
∂f
∂t
`e misurabile e si utilizzi il teorema 3.10.7.]
247
3.11 Calcolo degli integrali multipli
Conosciamo tutte le propriet` a della misura e dell’integrale di Lebesgue, ab-
biamo confrontato quello 1-dimensionale con l’integrale di Riemann, ma
quando N > 1 non sappiamo ancora come calcolare esplicitamente gli in-
tegrali multipli. Come vedremo, si pu` o ridurre il calcolo di un integrale
N-dimensionale a N integrazioni semplici successive, con possibilit` a di mo-
dificare a piacere l’ordine di integrazione. Cominciamo con il legare le misure
di Lebesgue m
k
e m
h
alla misura m
k+h
.
Lemma 3.11.1 Fissati k, h ∈ N
+
, siano E ⊆ R
k
e F ⊆ R
h
insiemi misura-
bili. Allora E F `e misurabile in R
k+h
e m
k+h
(E F) = m
k
(E) m
h
(F),
con l’usuale convenzione 0 (±∞) = 0.
Dimostrazione La tesi `e ovvia se E, F sono rettangoli, dato che in tal caso
anche E F `e un rettangolo.
Se E, F sono plurirettangoli, sar` a E =

p
j=1
R
j
e F =

q
i=1
S
i
, con gli R
j
rettangoli disgiunti e gli S
i
rettangoli disgiunti. Quindi
E F =
p
_
j=1
q
_
i=1
(R
j
S
i
)
e gli R
j
S
i
sono rettangoli disgiunti; quindi, per additivit`a,
m
k+h
(E F) =
p

j=1
q

i=1
m
k+h
(R
j
S
i
) =
=
p

j=1
q

i=1
m
k
(R
j
)m
h
(S
i
) = m
k
(E)m
h
(F).
Se E, F sono aperti, esistono due successioni di plurirettangoli ¦R
n
¦
n∈N
(di
R
k
) e ¦S
n
¦
n∈N
(di R
h
), tali che R
n
⊆ R
n+1
⊆ E, S
n
⊆ S
n+1
⊆ F e
lim
n→∞
m
k
(R
n
) = m
k
(E), lim
n→∞
m
h
(S
n
) = m
h
(F).
Possiamo anche supporre, grazie all’esercizio 3.3.10, che E =


n=0
R
n
e
F =


n=0
Q
n
, da cui
R
n
S
n
⊆ R
n+1
S
n+1
⊆ E F =

_
n=0
(R
n
S
n
).
248
Dunque, per la proposizione 3.5.3,
m
k+h
(E F) = lim
n→∞
m
k+h
(R
n
S
n
) = lim
n→∞
m
k
(R
n
)m
h
(S
n
) = m
k
(E)m
h
(F).
Se E, F sono compatti, esistono due successioni di plurirettangoli ¦R
n
¦
n∈N
(di
R
k
) e ¦S
n
¦
n∈N
(di R
h
), tali che (esercizio 3.3.10) R
n
⊇ R
n+1
⊇ E =


n=0
R
n
,
S
n
⊇ S
n+1
⊇ F =


n=0
S
n
e
lim
n→∞
m
k
(R
n
) = m
k
(E), lim
n→∞
m
h
(S
n
) = m
h
(F).
Quindi si ha
R
n
S
n
⊇ R
n+1
S
n+1
⊇ E F =

n=0
(R
n
S
n
),
e dunque, ancora per la proposizione 3.5.3,
m
k+h
(E F) = lim
n→∞
m
k+h
(R
n
S
n
) = lim
n→∞
m
k
(R
n
)m
h
(S
n
) = m
k
(E)m
h
(F).
Se E, F sono misurabili e limitati, esistono due successioni di aperti ¦A
n
¦
n∈N
(di R
k
) e ¦B
n
¦
n∈N
(di R
h
), e due successioni di compatti ¦K
n
¦
n∈N
(di R
k
) e
¦H
n
¦
n∈N
(di R
h
), tali che
A
n
⊇ E ⊇ K
n
, B
n
⊇ F ⊇ H
n
,
lim
n→∞
m
k
(A
n
) = lim
n→∞
m
k
(K
n
) = m
k
(E),
lim
n→∞
m
h
(B
n
) = lim
n→∞
m
h
(H
n
) = m
h
(F).
Utilizzando gli A
n
e i B
n
si trova
m
k+h
(E F) ≤ lim
n→∞
m
k
(A
n
)m
h
(B
n
) = m
k
(E)m
h
(F);
utilizzando i K
n
e gli H
n
si ottiene invece
m
k+h
(E F) ≥ lim
n→∞
m
k
(A
n
)m
h
(B
n
) = m
k
(E)m
h
(F).
Ne segue m
k+h
(E F) = m
k
(E)m
h
(F).
Infine se E, F sono insiemi misurabili non necessariamente limitati, indicando
con Q
m
r
il cubo di centro l’origine e lato 2r in R
m
si ha
m
k
(E) = lim
r→∞
m
k
(E ∩ Q
k
r
), m
h
(F) = lim
r→∞
m
h
(F ∩ Q
h
r
);
249
d’altra parte, essendo Q
k+h
r
= Q
k
r
Q
h
r
, si ottiene
(E F) ∩ Q
k+h
r
= (E ∩ Q
k
r
) (F ∩ Q
h
r
) ∀r > 0,
cosicch´e E F `e misurabile in R
k+h
e
m
k+h
(E F) = lim
r→∞
m
k
(E ∩ Q
k
r
) m
h
(F ∩ Q
h
r
) = m
k
(E)m
h
(F).
Ci` o conclude la dimostrazione.
Vediamo ora come il calcolo della misura di un insieme misurabile di R
N
,
N > 1, si possa ricondurre ad integrazioni iterate in dimensione pi` u bassa.
Ci` o corrisponde geometricamente ad una integrazione “per fette”.
Proposizione 3.11.2 Siano k, h ∈ N
+
e sia E un sottoinsieme misurabile
di R
k+h
. Per ogni x ∈ R
k
e per ogni y ∈ R
h
consideriamo le sezioni verticali
ed orizzontali di E cos`ı definite:
E
x
= ¦y ∈ R
h
: (x, y) ∈ E¦, E
y
= ¦x ∈ R
k
: (x, y) ∈ E¦.
Allora valgono i seguenti fatti:
(i) E
x
`e misurabile in R
h
per q.o. x ∈ R
k
ed E
y
`e misurabile in R
k
per q.o.
y ∈ R
h
;
(ii) la funzione x → m
h
(E
x
) `e misurabile in R
k
e la funzione y → m
k
(E
y
)
`e misurabile in R
h
;
(iii) risulta
m
k+h
(E) =
_
R
k
m
h
(E
x
) dx =
_
R
h
m
k
(E
y
) dy.
Dimostrazione Proveremo so-
lo la parte che riguarda l’insieme
E
x
: l’altra, relativa ad E
y
, `e ana-
loga.
Se E `e un rettangolo, sar`a E =
J
1
J
2
, con J
1
rettangolo in R
k
e
J
2
rettangolo in R
h
. Dunque
E
x
=
_
_
_
J
2
se x ∈ J
1
,
∅ se x / ∈ J
1
,
250
cosicch´e E
x
`e misurabile per ogni x ∈ R
k
e m
h
(E
x
) = m
h
(J
2
)I
J
1
(x); in
particolare x →m
h
(E
x
) `e una funzione semplice, dunque misurabile. Inoltre,
per il lemma 3.11.1,
m
k+h
(E) = m
k
(J
1
)m
h
(J
2
) =
_
R
k
m
h
(J
2
)I
J
1
dx =
_
R
k
m
h
(E
x
) dx.
Se E `e un plurirettangolo, possiamo scrivere E =

p
j=1
R
j
con gli R
j
rettan-
goli disgiunti; allora E
x
=

p
j=1
(R
j
)
x
`e misurabile e, per quanto gi`a provato,
m
h
(E
x
) =

p
j=1
m
h
((R
j
)
x
) `e una funzione semplice, quindi misurabile. Infine
m
k+h
(E) =
p

j=1
m
k+h
(R
j
) =
p

j=1
_
R
k
m
h
((R
j
)
x
) dx =
_
R
k
m
h
(E
x
) dx.
Se E `e un aperto, esiste una successione di plurirettangoli ¦P
n
¦
n∈N
tale che
P
n
⊆ P
n+1
⊆ E e


n=1
P
n
= E. Allora E
x
=


n=1
(P
n
)
x
`e misurabile e, per
quanto gi` a provato e per la proposizione 3.5.3, m
h
(E
x
) = lim
n→∞
m
h
((P
n
)
x
)
`e una funzione misurabile. Per il teorema di B. Levi si ha allora
m
k+h
(E) = lim
n→∞
m
k+h
(P
n
) = lim
n→∞
_
R
k
m
h
((P
n
)
x
) dx =
_
R
k
m
h
(E
x
) dx.
Se E `e compatto, analogamente, si sceglie una successione di plurirettangoli
¦P
n
¦
n∈N
tale che P
n
⊇ P
n+1
⊇ E e


n=1
P
n
= E. Allora E
x
=


n=1
(P
n
)
x
`e
misurabile e, sempre per la proposizione 3.5.3, m
h
(E
x
) = lim
n→∞
m
h
((P
n
)
x
)
`e una funzione misurabile. Per convergenza dominata si ha allora
m
k+h
(E) = lim
n→∞
m
k+h
(P
n
) = lim
n→∞
_
R
k
m
h
((P
n
)
x
) dx =
_
R
k
m
h
(E
x
) dx.
Se E `e un insieme misurabile e limitato, esistono una successione di aperti
¦A
n
¦
n∈N
ed una successione di compatti ¦K
n
¦
n∈N
tali che A
n
⊇ A
n+1
⊇ E ⊇
K
n+1
⊇ K
n
e m
k+h
(A
n
) → m
k+h
(E), m
k+h
(K
n
) → m
k+h
(E) per n → ∞.
Per quanto gi`a provato, si ha dunque
m
k+h
(E) = lim
n→∞
_
R
k
m
h
((A
n
)
x
) dx = lim
n→∞
_
R
k
m
h
((K
n
)
x
) dx,
da cui, in particolare,
lim
n→∞
_
R
k
[m
h
((A
n
)
x
) −m
h
((K
n
)
x
)] dx = lim
n→∞
_
R
k
[m
h
((A
n
)
x
¸ (K
n
)
x
)] dx = 0.
251
Poich´e per ogni x ∈ R
k
la successione ¦m
h
((A
n
)
x
¸(K
n
)
x

n∈N
`e decrescente,
essa ha limite puntuale: l’uguaglianza precedente e il lemma di Fatou ci
dicono che tale limite deve essere q.o. nullo. Pertanto
lim
n→∞
m
h
((A
n
)
x
¸ (K
n
)
x
) = 0 per q.o. x ∈ R
k
.
Dato che (A
n
)
x
⊇ E
x
⊇ (K
n
)
x
, la proposizione 3.4.3 implica che E
x
`e
misurabile per q.o. x ∈ R
k
, e che
m
h
(E
x
) = lim
n→∞
m
h
((A
n
)
x
) = lim
n→∞
m
h
((K
n
)
x
) per q.o. x ∈ R
k
;
in particolare tale funzione `e misurabile, e dal teorema di Lebesgue segue la
relazione
m
k+h
(E) = lim
n→∞
m
k+h
(A
n
) = lim
n→∞
_
R
k
m
h
((A
n
)
x
) dx =
_
R
k
m
h
(E
x
) dx.
Infine, se E `e un insieme misurabile illimitato, allora risulta
E
x
∩ Q
k
r
= (E ∩ Q
k+h
r
)
x
∀r > [x[
k
, ∀x ∈ R
k
;
quindi E
x
`e misurabile per q.o. x ∈ R
k
tale che [x[
k
< r, cio`e (per l’arbitra-
riet` a di r) per q.o. x ∈ R
k
. Inoltre, scelto r = n ∈ N, il corollario 3.7.8 ci
assicura che
m
h
(E
x
) = lim
r→∞
m
h
(E ∩ Q
k+h
r
)
x
) = lim
n→∞
m
h
((E ∩ Q
k+h
n
)
x
)
`e una funzione misurabile, ed infine, grazie al teorema di B. Levi,
m
k+h
(E) = lim
r→∞
m
k+h
(E ∩ Q
k+h
r
) =
= lim
r→∞
_
R
k
m
h
((E ∩ Q
k+h
r
)
x
) dx =
_
R
k
m
h
(E
x
) dx.
Ci` o conclude la dimostrazione.
Si noti che la tesi della proposizione 3.11.2 si pu` o scrivere nel modo seguente:
per ogni insieme misurabile E ⊆ R
k+h
si ha
_
R
k+h
I
E
(x, y) dxdy =
_
R
k
__
R
h
I
E
(x, y) dy
_
dx =
_
R
h
__
R
k
I
E
(x, y) dx
_
dy.
Nei teoremi che seguono generalizzeremo questa formula al caso di una qua-
lunque funzione integrabile su R
k+h
.
252
Teorema 3.11.3 (di Tonelli) Sia f : R
k+h
→ R una funzione misurabile
e non negativa. Allora si ha:
(i) la funzione f(, y) `e misurabile in R
k
per q.o. y ∈ R
h
e la funzione f(x, )
`e misurabile in R
h
per q.o. x ∈ R
k
;
(ii) la funzione
_
R
h
f(, y) dy `e misurabile in R
k
e la funzione
_
R
k
f(x, ) dx
`e misurabile in R
h
;
(iii) risulta
_
R
k+h
f(x, y) dxdy =
_
R
k
__
R
h
f(x, y) dy
_
dx =
_
R
h
__
R
k
f(x, y) dx
_
dy.
Dimostrazione Se f = I
E
, con E ⊆ R
k+h
misurabile, la tesi `e fornita dalla
proposizione 3.11.2. Se f `e una funzione semplice, la tesi segue per linearit` a.
Nel caso generale, grazie alla non negativit`a di f esiste una successione di
funzioni semplici ¦ϕ
n
¦
n∈N
che converge puntualmente a f in modo crescente
(ad esempio, quelle costruite nella dimostrazione della proposizione 3.7.9).
La propriet`a (i) `e vera perch´e f(, y) e f(x, ) sono limiti puntuali di funzioni
misurabili; le parti (ii) e (iii) si ottengono applicando il teorema di B. Levi.
Un risultato analogo vale per le funzioni di segno variabile, purch´e integrabili
(e non solo misurabili): basta scrivere il risultato per f
+
e f

e pi sottrarre,
il che `e sempre lecito perch´e almeno uno fra i due termini della sottrazione `e
finito.
Per le funzioni sommabili il risultato del teorema di Tonelli si pu`o precisare:
Teorema 3.11.4 (di Fubini) Sia f : R
k+h
→ R una funzione sommabile.
Allora si ha:
(i) la funzione f(, y) `e sommabile su R
k
per q.o. y ∈ R
h
e la funzione
f(x, ) `e sommabile su R
h
per q.o. x ∈ R
k
;
(ii) la funzione
_
R
h
f(, y) dy `e sommabile su R
k
e la funzione
_
R
k
f(x, ) dx
`e sommabile su R
h
;
(iii) risulta
_
R
k+h
f(x, y) dxdy =
_
R
k
__
R
h
f(x, y) dy
_
dx =
_
R
h
__
R
k
f(x, y) dx
_
dy.
253
Dimostrazione La tesi `e vera, grazie al teorema di Tonelli, per le funzioni
non negative f
+
e f

; gli integrali risultanti sono tutti finiti in quanto f
+

[f[, f

≤ [f[ e [f[ `e sommabile. Il risultato segue allora per differenza.
Osservazione 3.11.5 Spesso viene usata la notazione
_
R
k
dx
_
R
h
f(x, y) dy,
lievemente imprecisa, in luogo di
_
R
k
__
R
h
f(x, y) dy
¸
dx, ed analogamente si
usa
_
R
h
dy
_
R
k
f(x, y) dx in luogo di
_
R
h
__
R
k
f(x, y) dx
¸
dy.
Esempi 3.11.6 (1) (Insiemi normali piani) Poniamo
E = ¦(x, y) ∈ R
2
: a ≤ x ≤ b, α(x) ≤ y ≤ β(x)¦,
ove α, β ∈ C[a, b] con α ≤ β. Un insieme di questo genere si chiama insieme
normale rispetto all’asse x (essendo l’unione di segmenti verticali). L’insieme
E `e chiuso, quindi misurabile in R
2
; inoltre
E
x
=
_
[α(x), β(x)] se x ∈ [a, b]
∅ se x / ∈ [a, b],
m
1
(E
x
) =
_
β(x) −α(x) se x ∈ [a, b]
0 se x / ∈ [a, b].
Pertanto
m
2
(E) =
_
R
m
1
(E
x
) dx =
_
b
a
[β(x) −α(x)] dx.
Similmente, per l’insieme
F = ¦(x, y) ∈ R
2
: c ≤ y ≤ d, γ(y) ≤ x ≤ δ(x)¦,
con γ, δ ∈ C[c, d] e γ ≤ δ (insieme normale rispetto all’asse y), si ha
F
y
=
_
[γ(y), δ(y)] se y ∈ [c, d]
∅ se y / ∈ [c, d],
m
1
(F
y
) =
_
δ(y) −γ(y) se y ∈ [c, d]
0 se y / ∈ [c, d].
254
Pertanto
m
2
(F) =
_
R
m
1
(E
y
) dy =
_
d
c
[δ(y) −γ(y)] dy.
(2) (Integrali su insiemi normali piani) Sia F un insieme normale rispetto
all’asse y, dunque della forma
F = ¦(x, y) ∈ R
2
: c ≤ y ≤ d, γ(y) ≤ x ≤ δ(y)¦,
con γ, δ ∈ C[c, d] e γ ≤ δ. Se f `e una funzione sommabile, o integrabile, su
E, si ha
_
F
f dxdy =
_
R
2
fI
F
dxdy =
_
R
__
R
fI
F
dx
_
dy =
=
_
d
c
__
R
fI
F
dx
_
dy =
_
d
c
_
_
δ(y)
γ(y)
f(x, y) dx
_
dy.
Analogamente, se g `e una funzione sommabile od integrabile sull’insieme
(normale rispetto all’asse x)
E = ¦(x, y) ∈ R
2
: a ≤ x ≤ b, α(x) ≤ y ≤ β(x)¦,
ove α, β ∈ C[a, b] con α ≤ β, allora
_
E
g dxdy =
_
b
a
_
_
β(x)
α(x)
g(x, y) dx
_
dy.
Osservazione 3.11.7 Se il dominio su cui si deve integrare `e normale rispet-
to ad entrambi gli assi, si possono combinare i due casi esposti nell’esempio
precedente, ottenendo uno scambio dell’ordine di integrazione che spesso aiu-
ta a semplificare il calcolo. Se ad esempio E `e un rettangolo [a, b] [c, d], si
ha per ogni f integrabile su E
_
E
f dxdy =
_
b
a
__
d
c
f(x, y) dy
_
dx =
_
d
c
__
b
a
f(x, y) dx
_
dy,
e converr` a scegliere la formula pi` u semplice per i calcoli.
255
Esempi 3.11.8 (1) Siano a, b ∈ R con a < b, e sia T il triangolo di vertici
(a, a), (b, b) e (b, a): vogliamo calcolare l’integrale
_
T
e
(b−y)
2
dxdy.
L’insieme T `e normale rispetto all’asse
x, quindi si ha
_
T
e
(b−y)
2
dxdy =
_
b
a
__
x
a
e
(b−y)
2
dy
_
dx,
ma l’integrale a secondo membro non `e calcolabile esplicitamente. Per`o,
essendo T normale anche rispetto all’asse y, possiamo scrivere
_
T
e
(b−y)
2
dxdy =
_
b
a
__
b
y
e
(b−y)
2
dx
_
dy,
e poich´e l’integrando non dipende da x, otteniamo
_
T
e
(b−y)
2
dxdy =
_
b
a
e
(b−y)
2
__
b
y
1 dx
_
dy =
=
_
b
a
(b −y)e
(b−y)
2
dy =
1
2
_
e
(b−a)
2
−1
_
.
(2) Calcoliamo l’integrale
_
D
y
2
dxdy, ove D
`e la regione delimitata dalla parabola x = y
2
e dalla retta x = 1. Il dominio D `e norma-
le rispetto ad entrambi gli assi: tenuto conto
della forma dell’integrando, conviene veder-
lo come insieme normale rispetto all’asse y.
Scriviamo quindi
_
D
y
2
dxdy =
_
1
−1
__
1
y
2
y
2
dx
_
dy =
=
_
1
−1
y
2
(1 −y
2
) dy =
= 2
_
1
0
(y
2
−y
4
) dy =
4
15
.
256
(3) (Insiemi normali di R
3
) Un insieme della forma
E = ¦(x, y, z) ∈ R
3
: (x, y) ∈ D, α(x, y) ≤ z ≤ β(x, y)¦,
ove D `e un chiuso di R
2
e α, β ∈ C(D) con α ≤ β, si chiama insieme normale
rispetto al piano xy; analogamente si possono avere insiemi normali rispetto
ai piani xz o yz. Se f `e una funzione integrabile su E, vale la formula
_
E
f(x, y, z) dxdydz =
_
D
_
_
β(x,y)
α(x,y)
f(x, y, z) dz
_
dxdy.
Se, in particolare, D `e a sua volta normale rispetto (ad esempio) all’asse x,
cosicch´e
D = ¦(x, y) ∈ R
2
: a ≤ x ≤ b, p(x) ≤ y ≤ q(x)¦
257
con p, q ∈ C[a, b] e p ≤ q, allora l’integrale triplo si decompone in tre integrali
semplici:
_
E
f(x, y, z) dxdydz =
_
b
a
_
_
q(x)
p(x)
_
_
β(x,y)
α(x,y)
f(x, y, z) dz
_
dy
_
dx.
Se poi consideriamo, per ogni x ∈ [a, b], le sezioni di E lungo piani ortogonali
all’asse x, cio`e
C
x
= ¦(y, z) ∈ R
2
: p(x) ≤ y ≤ q(x), α(x, y) ≤ z ≤ β(x, y)¦,
si vede che ciascun C
x
`e misurabile, essendo un insieme normale rispetto
all’asse y, e inoltre
_
E
f(x, y, z) dxdydz =
_
b
a
__
Cx
f(x, y, z) dydz
_
dx.
Questa formula esprime una “integrazione per fette”, che `e utile in svariate
situazioni: particolarmente importante `e il caso dei solidi di rotazione. Se
f(z) `e una funzione continua e non negativa definita per z ∈ [a, b], e se
G = ¦(x, z) ∈ R
2
: a ≤ z ≤ b, 0 ≤ x ≤ f(z)¦,
l’insieme H, ottenuto ruotando G attorno all’asse z, `e un esempio di solido
di rotazione. Si ha
H = ¦(x, y, z) ∈ R
3
: a ≤ z ≤ b,
_
x
2
+ y
2
≤ f(z)¦;
H `e chiuso, quindi misurabile, e
si trova, integrando per fette,
m
3
(H) =
_
R
m
2
(H
z
) dz.
Le sezioni orizzontali H
z
, per z ∈
[a, b], sono cerchi di centro (0, 0)
e raggio f(z), mentre sono vuote
per z / ∈ [a, b]. Quindi
m
3
(H) =
_
b
a
πf(z)
2
dz.
258
(4) Calcoliamo il volume del paraboloide solido
H = ¦(x, y, z) ∈ R
2
: x
2
+ y
2
≤ z ≤ 1¦ :
si ha, affettando perpendicolarmente all’asse z,
H
z
= ¦(x, y) ∈ R
2
: x
2
+ y
2
≤ z¦,
cosicch´e la sezione H
z
`e un cerchio di centro (0, 0) e raggio

z. Perci` o
m
3
(H) =
_
H
1 dxdydz =
_
1
0
__
H
z
dxdy
_
dz =
_
1
0
m
2
(H
z
) dz =
=
_
1
0
πz dz =
π
2
.
Osserviamo infine che anche negli integrali tripli si possono avere scambi del-
l’ordine di integrazione quando, come spesso accade, si integra su un dominio
normale rispetto a due o addirittura a tutti e tre i piani coordinati.
(5) Calcoliamo l’integrale di Riemann improprio
_

0
sin x
x
dx. Fissato a > 0,
osserviamo che
_
a
0
sin x
x
dx =
_
a
0
__

0
e
−xy
sin x dy
_
dx.
La funzione (x, y) →e
−xy
sin x `e sommabile su [0, a] [0, ∞[ poich´e, in virt` u
del teorema di Tonelli,
_
[0,a][0,∞[
e
−xy
[ sin x[ dxdy =
_
a
0
__

0
e
−xy
[ sin x[ dy
_
dx =
=
_
a
0
[ sin x[
x
dx < ∞.
Quindi possiamo scambiare l’ordine di integrazione nell’integrale di e
−xy
sin x,
ottenendo
_
a
0
sin x
x
dx =
_
a
0
__

0
e
−xy
sin x dy
_
dx =
_

0
__
a
0
e
−xy
sin x dx
_
dy.
Quest’ultimo integrale si pu` o calcolare: integrando per parti due volte si
verifica facilmente che
_
a
0
e
−xy
sin x dx =
1
1 + y
2
_
1 −e
−ay
(y sin a + cos a)
_
,
259
da cui
_
a
0
sin x
x
dx =
_

0
1
1 + y
2
_
1 −e
−ay
(y sin a + cos a)
_
dy.
Dato che per a →∞ si ha e
−ay
(y sin a + cos a) →0 puntualmente, e che
e
−ay
[y sin a + cos a[
1 + y
2

(1 + y)e
−y
1 + y
2
∀a ≥ 1, ∀y > 0,
in virt` u del teorema di Lebesgue si ottiene
_

0
sin x
x
dx = lim
a→∞
_
a
0
sin x
x
dx =
_

0
1
1 + y
2
dy =
π
2
.
Esercizi 3.11
1. La funzione f(x, y) =
1
1−xy
`e integrabile, o sommabile, in [0, 1] [0, 1]?
2. La funzione f(x, y) =
_
1
x
− 1
__
1
y
− 1
_
`e integrabile, o sommabile, in
[0, 2] [0, 2]?
3. Determinare il volume dei seguenti sottoinsiemi di R
3
:
(i) E = ¦x, y, z) ∈ R
3
: x, y, z > 0, 0 < x + y + z < 1¦;
(ii) E = regione delimitata dai vincoli x = 0, x = 1, y = −1, y = 1,
z = 0, z = x
2
+ y
2
;
(iii) E = ¦(x, y, z) ∈ R
3
: a
2
≤ x
2
+ y
2
≤ a
2
+ z
2
¦;
(iv) E = insieme ottenuto ruotando attorno all’asse y l’insieme piano
F = ¦(x, y) ∈ R
2
: y ∈ [0, 3], 0 ≤ x ≤ g(y)¦, ove
g(y) =
_ _
y/2 se y ∈ [0, 2],
_
−y
2
+ (9/2)y −4 se y ∈ [2, 3].
4. Calcolare i seguenti integrali:
(i)
_
A
z(1 −[x[)

4 −z
2
dxdydz, ove
A = ¦(x, y, z) ∈ R
3
: [x[ ≤ 1, 0 ≤ y ≤ 4, 0 ≤ z ≤

3(1 −[x[)¦;
260
(ii)
_
B
y
x
2
+ y
2
dxdy, ove
B = ¦(x, y) ∈ R
2
: x ≥ 1/2, y ≥ 0, 1 ≤ x
2
+ y
2
≤ 4¦;
(iii)
_
C
y dxdy, ove C = ¦(x, y) ∈ R
2
: y
2
−x
3
(1 −x
3
) ≤ 0¦;
(iv)
_
D
cos y
x
2
dxdy, ove D =
_
(x, y) ∈ R
2
:
1
π
≤ x ≤
2
π
, 0 ≤ y ≤
1
x
_
;
(v)
_
E

x + y dxdy, ove E `e il triangolo di vertici (0, 0), (1, 1), (2, 1);
(vi)
_
F
max¦x, y¦ dxdy, ove
F = ¦(x, y) ∈ R
2
: xy > 0, a < max¦x, y¦ < b¦, con b > a > 0;
(vii)
_
G
ln(xy) dxdy, ove
G = ¦(x, y) ∈ R
2
: xy ≥ 1, x ≥ −1, 0 ≥ y ≥ 4x¦;
(viii)
_
H
dxdy
x + 1
, ove H = ¦(x, y) ∈ R
2
: x ≥ y
2
, x ≤ y + 2¦;
(ix)
_
I
1 + 2x
x + y
dxdy, ove I = ¦(x, y) ∈ R
2
: 0 ≤ y ≤ x
2
, 1 ≤ x ≤ 2¦;
(x)
_
J
(x−1) dxdy, ove J = ¦(x, y) ∈ R
2
: y ∈ [0, 1], [x[y ≤ 1, [x[ ≤ 2¦;
(xi)
_
K
y cos(x + z) dxdydz, ove
K = ¦(x, y, z) ∈ R
3
: x ≥ 0, y ≥ 0, z ≥ 0, x+z ≤ π/2, y ≤

x¦.
5. Sia Γ la circonferenza di equazione x
2
+ y
2
= 1 nel piano z = 0. Da
ogni punto di Γ si tracci la perpendicolare alla retta ¦x = 0, z = h¦;
la superficie risultante, insieme al piano z = 0, delimita un solido E,
detto cono a cuneo. Se ne determini il volume.
6. Calcolare la misura dell’insieme
E = ¦(x, y) ∈ R
2
: 0 ≤ y ≤ 2
5−x
+ x −6, 2
y
+ y
2
≤ x ≤ 4¦.
261
7. Poniamo F(a) =
_
π
0
ln(1 + a cos x) dx, [a[ < 1. Dimostrare che:
(i) F `e ben definita e continua anche per [a[ = 1;
(ii) F `e derivabile in ] −1, 1[, con
F
t
(a) =
_
_
_
π
a
_
1 −
1

1 −a
2
_
se [a[ < 1, a ,= 0,
0 se a = 0;
(iii) risulta F(a) = π ln
1 +

1 −a
2
2
per ogni a ∈ [−1, 1].
8. Fissati a, b > 0, si provi che:
(i) la funzione f(x) =
e
−ax
−e
−bx
x
`e sommabile su [0, ∞[;
(ii) risulta
_

0
f(x) dx =
_
b
a
_

0
e
−xy
dydx = ln
b
a
.
9. (Teorema di Schwarz) Sia A un aperto di R
2
e sia f ∈ C
2
(A); si provi
che

2
f
∂x∂y
=

2
f
∂y∂x
in A.
[Traccia: se in un punto (x
0
, y
0
) di A fosse, ad esempio,

2
f
∂x∂y
(x
0
, y
0
) >

2
f
∂y∂x
(x
0
, y
0
), si determini un rettangolo R sul quale

2
f
∂x∂y
>

2
f
∂y∂x
, e si
trovi l’assurdo calcolando
_
R
_

2
f
∂x∂y


2
f
∂y∂x
_
dxdy.]
10. Sia E un insieme misurabile di R
N
di misura positiva. Il baricentro di
E `e il punto x ∈ R
N
di coordinate x
i
=
1
m
N
(E)
_
E
x
i
dx, i = 1, . . . , N,
mentre il momento di inerzia di E rispetto ad una retta r `e il numero
I
r
=
_
E
d(x)
2
dx, ove d(x) `e la distanza del punto x dalla retta r. Si
calcolino il baricentro ed il momento di inerzia rispetto agli assi x e y
dei seguenti sottoinsiemi di R
2
:
(i) A = ¦(x, y) ∈ R
2
: x ∈ [0, π], 0 ≤ y ≤ sin x¦;
(ii) B = ¦(x, y) ∈ R
2
: x
2
+ y
2
≤ 1, (x −1)
2
+ y
2
≤ 1¦;
(iii) C = ¦(x, y) ∈ R
2
: x
2
+ y
2
≥ 1, (x −1)
2
+ y
2
≤ 1¦;
(iv) D = ¦(x, y) ∈ R
2
: x ≥ 0, 0 ≤ y ≤ 4 −x
2
¦.
262
11. Sia f una funzione integrabile sull’insieme misurabile D ⊆ R
N
. Si provi
la seguente formula di “integrazione per fette”:
_
D
[f[ dx =
_

0
m
N
(¦x ∈ D : [f(x)[ > t¦) dt.
[Traccia: si tratti dapprima il caso f ∈ o
0
, scrivendo f nella forma
f =

m
i=1
α
i
I
E
i
, con i numeri [α
i
[ ordinati in modo crescente e con
E
i
= f
−1

i
); poi si usi il teorema di B. Levi.]
3.12 Cambiamento di variabili
Anche per gli integrali multipli, come per quelli in una sola variabile, vi `e una
formula per il cambiamento di variabili. In questo paragrafo non daremo il
risultato pi` u generale possibile, ma ci limiteremo al caso di cambiamenti di
variabili descritti da diffeomorfismi fra due aperti A e B di R
N
, ossia dalle
applicazioni bigettive g : A →B tali che g e g
−1
siano di classe C
1
.
Osserviamo che se g : A →B `e un diffeomorfismo, allora si ha g
−1
(g(y)) = y
per ogni y ∈ A e g(g
−1
(x)) = x per ogni x ∈ B; pertanto, dalla formula di
derivazione delle funzioni composte si ha
Dg
−1
(g(y)) Dg(y) = I ∀y ∈ A, Dg(g
−1
(x)) Dg
−1
(x) = I ∀x ∈ B,
cio`e Dg
−1
(g(y)) `e la matrice inversa della matrice Jacobiana Dg(y) per ogni
y ∈ A. In particolare, posto J
g
(y) = det Dg(y), si ha
[J
g
(y)[ , = 0, [J
g
−1(g(y))[ =
1
[J
g
(y)[
∀y ∈ A.
Ci` o premesso, valgono i seguenti risultati.
Teorema 3.12.1 Siano A, B aperti di R
N
e sia g : A → B un diffeomorfi-
smo. Se E `e un sottoinsieme misurabile di A, allora g(E) `e misurabile, [J
g
[
`e integrabile su E e si ha
m
N
(g(E)) =
_
E
[J
g
(y)[ dy.
In particolare, g(E) ha misura finita se e solo se [J
g
[ `e sommabile su E.
263
Teorema 3.12.2 Siano A, B aperti di R
N
e sia g : A → B un diffeomorfi-
smo. Se F `e un sottoinsieme misurabile di B e f `e una funzione integrabile
su F, allora (f ◦ g)[J
g
[ `e integrabile su g
−1
(F) e vale la formula
_
F
f(x) dx =
_
g
−1
(F)
f(g(y))[J
g
(y)[ dy.
In particolare, f `e sommabile su F se e solo se (f ◦ g)[J
g
[ `e sommabile su
g
−1
(F).
Il teorema 3.12.2 `e facile conseguenza del teorema 3.12.1, ma la dimostrazione
di quest’ultimo `e molto laboriosa, per cui rimandiamo entrambe ai prossimi
paragrafi. Qui ci limitiamo ad un’osservazione e all’esame di qualche appli-
cazione. Per N = 1, se A = [a, b] e B = [c, d] la formula del teorema 3.12.2
(con F = B) ci d` a
_
d
c
f(x) dx =
_
b
a
f(g(y)[g
t
(y)[ dy,
che `e quella che conosciamo dall’Analisi I. Infatti g `e bigettiva e continua,
quindi `e strettamente monotona da [a, b] in [c, d]: dunque, se g `e crescente si
ha g(a) = c e g(b) = d, e in questo caso
_
d
c
f(x) dx =
_
g(b)
g(a)
f(g(y))g
t
(y) dy =
_
b
a
f(g(y)[g
t
(y)[ dy,
mentre se g `e decrescente risulta g(a) = d e g(b) = c, nel qual caso
_
d
c
f(x) dx =
_
g(a)
g(b)
f(g(y))g
t
(y) dy = −
_
g(b)
g(a)
f(g(y))g
t
(y) dy =
= −
_
b
a
f(g(y)g
t
(y) dy =
_
b
a
f(g(y)[g
t
(y)[ dy.
Notiamo comunque che in dimensione 1 la formula di cambiamento di va-
riabile vale anche se g non `e bigettiva. Osserviamo anche che in dimensione
N > 1 non ci deve sorprendere la presenza del modulo del determinante [J
g
[:
ricordiamo infatti che in R
2
l’area del parallelogramma generato dai vettori
P = (x
1
, y
1
) e Q = (x
2
, y
2
) `e data dal determinante
¸
¸
¸
¸
x
1
x
2
y
1
y
2
¸
¸
¸
¸
preso in mo-
dulo.
Vediamo alcuni esempi.
264
Esempi 3.12.3 (1) Vogliamo calcolare l’area dell’insieme
F = ¦(x, y) ∈ R
2
: x ≤ y ≤ 2x, 1 ≤ xy ≤ 3¦,
che, essendo chiuso, `e certamente misu-
rabile.
La definizione stessa di F ci suggerisce
di prendere in considerazione, al posto
di x e y, la quantit`a y/x e xy, che va-
riano in intervalli fissi (rispettivamente
[1, 2] e [1, 3]). Poniamo quindi u = y/x
e v = xy: l’applicazione
(u, v) = h(x, y) =
_
y
x
, xy
_
trasforma F nel rettangolo E = [1, 2] [1, 3]. Invertiamo h per trovare il
diffeomorfismo g = h
−1
, al quale applicheremo il teorema 3.12.1: si trova
_
u =
y
x
v = xy
⇐⇒
_
x =
_
v
u
y =

uv.
Dunque g(u, v) = (
_
v/u,

uv). La g `e un diffeomorfismo che manda
]0, ∞[]0, ∞[ in s´e, e si ha
J
g
(u, v) = det
_
_
_
_

v
1/2
2u
3/2
1
2(uv)
1/2
v
1/2
2u
1/2
u
1/2
2v
1/2
_
_
_
_
= −
1
2u
,
da cui per il teorema 3.12.1
m
2
(F) =
_
E
[J
g
(u, v)[ dudv =
_
2
1
__
3
1
dv
_
1
2u
du = ln 2.
(2) Vogliamo calcolare l’integrale
_
F
x
2
dxdy, ove
F = ¦(x, y) ∈ R
2
: 1 ≤ x + y ≤ 3, x ≤ y ≤ 2x¦.
265
L’insieme F `e misurabile. Poniamo
u = x + y e v = y/x: si ha allora
(u, v) ∈ E = [1, 3] [1, 2]; inoltre, come
si verifica facilmente,
(x, y) = g(u, v) =
_
u
1 + v
,
uv
1 + v
_
,
J
g
(u, v) =
u
(1 + v)
2
.
L’integrale diventa
_
F
x
2
dxdy =
_
E
u
2
(1 + v)
2
[J
g
(u, v)[ dudv =
_
3
1
_
2
1
u
3
(1 + v)
4
dudv =
=
_
3
1
u
3
du
_
2
1
dv
(1 + v)
4
=
95
162
.
Coordinate polari in R
2
Consideriamo la trasformazione G che rappresenta i punti di R
2
in coordinate
polari:
(x, y) = G(ρ, ϑ) = (ρ cos ϑ, ρ sin ϑ), ρ ≥ 0, ϑ ∈ [−π, π]
(esempio 1.9.8 (2)). Come si sa, G `e di classe C

ed `e surgettiva ma non
iniettiva. La restrizione g di G alla striscia ]0, ∞[ ] − π, π[ ha immagine
R
2
¸ Σ, ove Σ = ¦(x, y) ∈ R
2
: y = 0, x ≤ 0¦, ed `e bigettiva. L’inversa g
−1
`e
univocamente determinata dalle relazioni
ρ =
_
x
2
+ y
2
,
_
_
_
cos ϑ =
x

x
2
+y
2
sin ϑ =
y

x
2
+y
2
Si pu`o verificare che anche g
−1
`e di classe C
1
, con
J
g
(ρ, ϑ) = det
_
cos ϑ −ρ sin ϑ
sin ϑ ρ cos ϑ
_
= ρ,
e che, come `e giusto,
J
g
−1(x, y) = det
_
x

x
2
+y
2
y

x
2
+y
2

y
x
2
+y
2
x
x
2
+y
2
_
=
1
_
x
2
+ y
2
=
1
ρ
.
266
Dal teorema 3.12.2 segue che per ogni insieme misurabile E ⊆ R
2
¸ Σ e per
ogni funzione f integrabile su E si ha
_
E
f(x, y) dxdy =
_
g
−1
(E)
f(ρ cos ϑ, ρ sin ϑ) ρ dρdϑ.
Ma `e facile provare che questa formula si pu` o generalizzare, nel senso seguen-
te:
Proposizione 3.12.4 Per ogni insieme misurabile E ⊆ R
2
e per ogni fun-
zione f integrabile su E vale la formula
_
E
f(x, y) dxdy =
_
G
−1
(E)
f(ρ cos ϑ, ρ sin ϑ) ρ dρdϑ.
Dimostrazione Poich´e m
2
(Σ) = 0 e poich´e l’insieme
Λ = G
−1
(Σ) = (¦0¦ [0, 2π]) ∪ ([0, ∞[¦0, 2π¦)
ha misura di Lebesgue nulla rispetto alle variabili (ρ, ϑ), si deduce
_
E
f(x, y) dxdy =
_
E\Σ
f(x, y) dxdy =
_
g
−1
(E\Σ)
f(ρ cos ϑ, ρ sin ϑ) ρ dρdϑ =
=
_
G
−1
(E)
f(ρ cos ϑ, ρ sin ϑ) ρ dρdϑ.
L’uso delle coordinate polari `e consigliabile, in linea generale, quando l’in-
tegrale presenta, nel dominio o nell’integrando, qualche simmetria circolare.
Ma l’utilit` a e la versatilit` a di questo cambiamento di variabili si apprezza
solo con l’esperienza.
Esempi 3.12.5 (1) Calcoliamo l’integrale
_
C
x dxdy, ove
C =
_
(x, y) ∈ R
2
: 1 ≤ x
2
+ y
2
≤ 4,
x
2
≤ y ≤ 2x
_
.
267
Poniamo, come al solito,
g(ρ, ϑ) = (ρ cos ϑ, ρ sin ϑ).
Poich´e
g
−1
(C) = [1, 2]
_
arctan
1
2
, arctan 2
_
,
si ha
_
C
x dxdy =
_
2
1
__
arctan 2
arctan 1/2
ρ
2
cos ϑdϑ
_
dρ =
=
_
2
1
ρ
2

_
arctan 2
arctan 1/2
cos ϑdϑ =
7
3
_
sin arctan 2 −sin arctan
1
2
_
.
Ricordando che
sin ϑ =
tan ϑ

1 + tan
2
ϑ
∀ϑ ∈
_
0,
π
2
_
,
otteniamo
_
C
x dxdy =
7
3
_
2

5

1

5
_
=
7
3

5
.
(2) Mediante le coordinate polari riusciamo a calcolare l’integrale
_

0
e
−x
2
dx.
Fissiamo n ∈ N
+
e poniamo S
n
= ¦(x, y) ∈ R
2
: x ≥ 0, y ≥ 0, x
2
+y
2
≤ n
2
¦.
Allora g
−1
(S
n
) = [0, n] [0, π/2], cosicch´e
_
Sn
e
−x
2
−y
2
dxdy =
_
n
0
_
π/2
0
e
−ρ
2
ρ dϑdρ =
π
4
(1 −e
−n
2
).
Ora, per il teorema di B. Levi,
lim
n→∞
_
Sn
e
−x
2
−y
2
dxdy =
_
S
e
−x
2
−y
2
dxdy,
ove S = ¦(x, y) ∈ R
2
: x ≥ 0, y ≥ 0¦; d’altra parte questo integrale, per il
teorema di Fubini, pu`o scriversi come
_
S
e
−x
2
−y
2
dxdy =
_

0
e
−x
2
dx
_

0
e
−y
2
dy =
__

0
e
−x
2
dx
_
2
.
268
In conclusione
__

0
e
−x
2
dx
_
2
= lim
n→∞
_
Sn
e
−x
2
−y
2
dxdy = lim
n→∞
π
4
(1 −e
−n
2
) =
π
4
,
cio`e
_

0
e
−x
2
dx =

π
2
.
Coordinate cilindriche in R
3
Introduciamo le coordinate cilindriche in R
3
, ponendo per ogni ρ ≥ 0, ϑ ∈
[−π, π] e z ∈ R:
x = ρ cos ϑ, y = ρ sin ϑ, z = z.
Questa trasformazione di variabili, che
denotiamo con G, `e surgettiva su R
3
ma non iniettiva, poich´e nei punti del-
l’asse z si ha (0, 0, z) = G(0, ϑ, z) per
ogni ϑ ∈ [−π, π], mentre nei punti
del semipiano y = 0 e x < 0 si ha
(x, 0, z) = G(x, −π, z) = G(x, π, z) per
ogni x > 0 e z ∈ R. Tuttavia, ponendo
Σ = ¦(x, y, z) ∈ R
3
: y = 0, x ≤ 0¦,
la restrizione di G a ]0, ∞[] −π, π[R, che denotiamo con
g(ρ, ϑ, z) = (ρ cos ϑ, ρ sin ϑ, z), ρ > 0, −π < ϑ < π, z ∈ R,
`e bigettiva a valori in R
3
¸ Σ, di classe C
1
, con inversa g
−1
pure di classe C
1
,
data da
ρ =
_
x
2
+ y
2
,
_
_
_
cos ϑ =
x

x
2
+y
2
sin ϑ =
y

x
2
+y
2
z = z;
si ha
J
g
(ρ, ϑ, z) = det
_
_
cos ϑ −ρ sin ϑ 0
sin ϑ ρ cos ϑ 0
0 0 1
_
_
= ρ,
269
e naturalmente
J
g
−1(x, y, z) =
1
_
x
2
+ y
2
=
1
ρ
.
Dato che m
3
(Σ) = 0, le stesse considerazioni svolte per la proposizione 3.12.4
portano alla seguente
Proposizione 3.12.6 Per ogni insieme misurabile E ⊆ R
3
e per ogni fun-
zione f integrabile su E vale la formula
_
E
f(x, y, z) dxdydz =
_
G
−1
(E)
f(ρ cos ϑ, ρ sin ϑ, z) ρ dρdϑdz.
Esempi 3.12.7 (1) (Volume di un solido di rotazione) Sia D ⊂ R
2
un insie-
me misurabile, contenuto in un semispazio di R
2
: scegliamo gli assi cartesiani
in modo che D sia incluso nel semipiano x ≥ 0, y = 0 di R
3
, cosicch´e i punti
di SD hanno ora la forma (x, 0, z) con x ≥ 0. Sia E il solido ottenuto ruo-
tando D attorno all’asse z. Abbiamo ricavato una formula per il volume di
E nell’esempio 3.11.8 (3) nel caso speciale in cui D era un insieme normale
rispetto all’asse z; vogliamo ora ottenere una formula per il caso generale.
Verifichiamo anzitutto che
E = ¦(x, y, z) ∈ R
3
: (
_
x
2
+ y
2
, 0, z) ∈ D¦ :
se (x, y, z) ∈ E, la sua distanza dall’asse di
rotazione,
_
x
2
+ y
2
, e la sua quota z sono le
stesse del punto (
_
x
2
+ y
2
, 0, z) ∈ D, che
`e quello che ruotando va a coincidere con
(x, y, z). In definitiva
G
−1
(E) =
= ¦(ρ, ϑ, z) : ϑ ∈ [−π, π], (ρ, 0, z) ∈ D¦,
da cui, passando in coordinate cilindriche ed utilizzando il teorema di Fubini,
m
3
(E) =
_
G
−1
(E)
ρ dρdϑdz =
_
π
−π
__
D
ρ dρdz
_
dϑ =
= 2π
_
D
ρ dρdz = 2π
_
D
x dxdz.
270
Possiamo descrivere questa formula come una “integrazione per circonferen-
ze”. Il punto (x, 0, z) varia in D, e noi misuriamo la lunghezza della cir-
conferenza che esso percorre ruotando: il raggio di rotazione `e x, e dunque
tale circonferenza `e lunga 2πx. Questa quantit` a viene integrata su tutto D,
fornendo il volume di E. Naturalmente, se D `e normale rispetto all’asse z,
integrando rispetto a x si ritrova la formula dell’esempio 3.11.8 (3).
(2) Con la formula precedente si calcola facilmente il volume del toro
T = ¦(x, y, z) ∈ R
3
: (
_
x
2
+ y
2
−R)
2
+ z
2
≤ r
2
¦,
che si ottiene ruotando attorno all’asse z un disco D del semipiano x ≥ 0,
y = 0, di raggio r > 0, il cui centro si trovi a distanza R > r dall’asse z. Si
ha
m
3
(T) = 2π
_
D
x dxdz = 2π
_
r
−r
_
_
R+

r
2
−z
2
R−

r
2
−z
2
x dx
_
dz =
= π
_
r
−r
_
(R +

r
2
−z
2
)
2
−(R −

r
2
−z
2
)
2
_
dz =
= 4π
_
r
−r
R

r
2
−z
2
dz = 8πR
_
r
0

r
2
−z
2
dz =
[ponendo z = r sin t]
= 8πR
_
π/2
0
r
2
cos
2
t dt = 2π
2
Rr
2
= (2πR)(πr
2
).
Coordinate sferiche in R
3
Poniamo per ogni ρ ≥ 0, ϑ ∈ [0, π] e ϕ ∈ [−π, π]:
x = ρ sin ϑcos ϕ
y = ρ sin ϑsin ϕ
z = ρ cos ϑ,
ove ρ `e la distanza del punto P =
(x, y, z) dall’origine O = (0, 0, 0), ϑ `e la
co-latitudine, ossia l’angolo fra il seg-
mento OP e l’asse z, e ϕ `e la longitudi-
ne (angolo fra il piano y = 0 ed il pia-
no generato dall’asse z e dal segmento
OP).
271
Questa corrispondenza, che denotiamo con G, fornisce la rappresentazione
dei punti di R
3
in coordinate polari o sferiche. L’applicazione G `e surget-
tiva ma non iniettiva, poich´e nei punti del semipiano y = 0, x < 0 si ha
(x, 0, z) = G(ρ, ϑ, −π) = G(ρ, ϑ, π) (con ρ =

x
2
+ z
2
e cos ϑ =
z

x
2
+z
2
),
mentre nei punti dell’asse z risulta, per ϕ arbitrario, (0, 0, z) = G(z, 0, ϕ) se
z > 0 e (0, 0, z) = G(−z, π, ϕ, ) se z < 0, ed in particolare nell’origine vale
(0, 0, 0) = G(0, ϑ, ϕ) per ϑ e ϕ arbitrari. Ponendo allora
Σ = ¦(x, y, z) ∈ R
3
: y = 0, x ≤ 0¦,
la restrizione di G a ]0, ∞[]0, π[] −π, π[, cio`e l’applicazione
g(ρ, ϑ, ϕ) = (ρ sin ϑcos ϕ, ρ sin ϑsin ϕ, ρ cos ϑ), ρ > 0, ϑ ∈]0, π[, ϕ ∈]−π, π[,
`e una bigezione su R
3
¸ Σ; essa `e di classe C
1
, e la sua inversa, pure di classe
C
1
, `e g
−1
(x, y, z) = (ρ, ϑ, ϕ), ove
ρ =
_
x
2
+ y
2
+ z
2
, ϑ = arcsin
_
x
2
+ y
2
_
x
2
+ y
2
+ z
2
,
_
_
_
cos ϕ =
x

x
2
+y
2
sin ϕ =
y

x
2
+y
2
.
Inoltre
J
g
(ρ, ϑ, ϕ) = det
_
_
sin ϑcos ϕ ρ cos ϑcos ϕ −ρ sin ϑsin ϕ
sin ϑsin ϕ ρ cos ϑsin ϕ ρ sin ϑcos ϕ
cos ϑ −ρ sin ϑ 0
_
_
= ρ
2
sin ϑ
e naturalmente
J
g
−1(x, y, z) =
1
_
x
2
+ y
2
+ z
2
_
x
2
+ y
2
=
1
ρ
2
sin ϑ
.
Poich´e m
3
(Σ) = 0, con gli stessi argomenti usati per la proposizione 3.12.4
si prova la seguente
Proposizione 3.12.8 Per ogni insieme misurabile E ⊆ R
3
e per ogni fun-
zione f integrabile su E vale la formula
_
E
f(x, y, z) dxdydz =
=
_
G
−1
(E)
f(ρ sin ϑcos ϕ, ρ sin ϑsin ϕ, ρ cos ϑ) ρ
2
sin ϑdρdϑdϕ.
272
Esempio 3.12.9 Calcoliamo l’integrale
_
A
(x
2
+ y
2
+ z
2
)
2
dxdydz, ove
A = ¦(x, y, z) ∈ R
3
: x
2
+ y
2
+ z
2
≤ 1, 0 ≤ z ≤
_
x
2
+ y
2
¦.
L’insieme A `e una semisfera scavata dall’alto in forma conica. Si ha, usando
le coordinate sferiche,
G
−1
(A) =
_
(ρ, ϑ, ϕ) : ρ ∈ [0, 1], ϑ ∈
_
0,
π
4
_
, ϕ ∈ [−π, π]
_
,
cosicch´e
_
A
(x
2
+ y
2
+ z
2
)
2
dxdydz =
_
π
−π
_
_
1
0
_
_
π/2
π/4
ρ
6
sin ϑdϑ
_

_
dϕ =

2
7
π.
Dimostrazione dei teoremi 3.12.1 e 3.12.2
`
E giunto il momento di dedicarsi alla laboriosa dimostrazione dei teoremi
3.12.1 e 3.12.2 sul cambiamento di variabili. Poich´e il secondo segue facil-
mente dal primo, cominceremo dal secondo.
Dimostrazione del teorema 3.12.2 Supponiamo che il teorema 3.12.1
sia vero: allora la tesi del teorema 3.12.2 `e valida quando f = I
D
, con D
sottoinsieme misurabile di B: basta scegliere nel teorema 3.12.1 E = g
−1
(D).
Quindi, per additivit`a, il teorema 3.12.2 vale quando f `e una funzione sem-
plice. Se f `e integrabile e non negativa, si sceglie una successione di funzioni
semplici ¦ϕ
n
¦
n∈N
tale che 0 ≤ ϕ
n
≤ ϕ
n+1
e ϕ
n
→ f puntualmente, e la tesi
segue applicando il teorema di B. Levi. Infine se f `e integrabile si scrive il
risultato per f
+
e f

e poi si sottrae.
Dimostrazione del teorema 3.12.1 La prima cosa che ci occorre `e vedere
come agisce una trasformazione affine su un insieme misurabile.
Proposizione 3.12.10 Sia h : R
N
→ R
N
un’applicazione affine, dunque
della forma
h(x) = x
0
+Lx, x ∈ R
N
,
ove L ∈ /
N
. Allora per ogni insieme misurabile E ⊆ R
N
l’insieme h(E) `e
misurabile con
m
N
(h(E)) = [ det L[ m
N
(E).
273
Dimostrazione Se det L = 0, allora l’immagine di h `e uno spazio affine di
dimensione minore di N: quindi h(E) `e certamente misurabile con misura
nulla. Dunque la formula `e vera.
Supponiamo L non singolare ed osserviamo subito che, essendo la misura
invariante per traslazioni, non `e restrittivo supporre x
0
= 0, cio`e h(x) = Lx.
Cominciamo a supporre che E sia un rettangolo. In tal caso h(E) `e un
poliedro di R
N
che si ottiene intersecando un numero finito di semispazi, e
quindi `e un insieme misurabile. Trattiamo dapprima il caso in cui la matrice
L `e di uno dei seguenti tre tipi:
(A) L agisce su x scambiando fra loro le componenti x
k
e x
h
: quindi la
matrice L si ottiene dall’identit` a invertendo di posto le righe k e h. Ne
segue che h(E) `e il rettangolo simmetrico a E rispetto all’iperpiano
(N − 1)-dimensionale di equazione x
k
= x
h
: quindi il prodotto delle
lunghezze dei lati non cambia, e pertanto m
N
(h(E)) = m
N
(E). D’altra
parte [ det L[ = 1 e dunque la formula `e vera.
(B) L = diag(c
1
, . . . , c
N
), con c
1
, . . . , c
N
∈ R. Il rettangolo E sar` a del tipo
E =

N
i=1
I
i
, ove gli I
i
sono intervalli di R; allora h(E) `e un rettan-
golo con lati lunghi [c
i
[m
1
(I
i
), i = 1, . . . , N, e quindi m
N
(h(E)) =

N
i=1
[c
i
[m
1
(I
i
) =

N
i=1
[c
i
[m
N
(E). D’altra parte [ det L[ =

N
i=1
[c
i
[ e
dunque la formula `e vera.
(C) L agisce su x nel modo seguente: esistono c ∈ R e k, h ∈ ¦1, . . . , N¦,
distinti, per cui
[Lx]
k
= x
k
+ cx
h
, [Lx]
i
= x
i
per i ,= k.
Quindi L si ottiene dall’identit` a sommando alla riga k la riga h mol-
tiplicata per c. Se E =

N
i=1
I
i
, possiamo descrivere h(E) come un
insieme normale rispetto all’iperpiano perpendicolare all’asse x
k
: infat-
ti, supponendo ad esempio che I
k
= [a
k
, b
k
] (ma l’intervallo potrebbe
ugualmente essere aperto o semiaperto), si ha
h(E) =
_
x ∈ R
N
: x
t
= (x
1
, . . . , x
k−1
, x
k+1
, . . . , x
n
) ∈

i,=k
I
i
,
x
k
∈ [a
k
+ cx
h
, b
k
+ cx
h
]
_
.
274
Quindi, posto E
t
=

i,=k
I
i
, dal teorema di Fubini si ha
m
N
(h(E)) =
_
E

m
1
([a
k
+ cx
h
, b
k
+ cx
h
]) dx
t
=
= m
1
(I
k
) m
N−1
(E
t
) =
N

i=1
m
1
(I
i
) = m
N
(E).
D’altra parte si ha det L = 1, dato che L `e triangolare con tutti 1 sulla
diagonale; dunque anche in questo caso la formula `e vera.
In questi tre casi (A), (B), (C), la validit` a della formula si estende ad ogni
insieme misurabile. Infatti, se E `e un plurirettangolo la tesi segue per ad-
ditivit` a, ricordando che ogni plurirettangolo `e unione finita di rettangoli di-
sgiunti. Se E `e aperto o compatto la formula si estende approssimando
E rispettivamente con successioni crescenti o decrescenti di plurirettangoli
(esercizio 3.3.10), e utilizzando il teorema di B. Levi o quello di Lebesgue.
Se E `e misurabile e limitato, si scelgono, per definizione di misura interna
ed esterna, una successione di aperti ¦A
j
¦
j∈N
tali che A
j
⊇ A
j+1
⊇ E e una
successione di compatti ¦K
j
¦
j∈N
tali che K
j
⊆ K
j+1
⊆ E, in modo da avere
m
N
(A
j
¸ K
j
) →0 per j →∞. Dato che A
j
¸ K
j
`e aperto, si sa che
m
N
(h(A
j
) ¸ h(K
j
)) = m
N
(h(A
j
¸ K
j
)) = [ det L[ m
N
(A
j
¸ K
j
) ∀j ∈ N;
in particolare, m
N
(h(A
j
) ¸ h(K
j
)) → 0 per j → ∞, e pertanto h(E) `e
misurabile. Passando poi al limite nella relazione m
N
(h(K
j
)) = [ det L[
m
N
(K
j
), si ottiene la tesi per E. Infine, per avere il risultato quando E `e
misurabile e illimitato, basta scrivere la tesi per E ∩ B
r
e passare al limite
utilizzando il teorema di B. Levi.
In definitiva, abbiamo provato la tesi della proposizione 3.12.10 quando h `e
un’applicazione di tipo (A), (B) o (C).
Inoltre, se la tesi vale per due matrici, essa vale anche per il loro prodotto, a
causa della relazione det L
1
L
2
= det L
1
det L
2
. D’altra parte vale il seguente
Lemma 3.12.11 Ogni matrice L ∈ /
N
, non singolare, si pu`o decomporre
nel prodotto di un numero finito di matrici M
j
, 1 ≤ j ≤ q, dei tipi (A), (B)
e (C).
Dimostrazione Ragioniamo per induzione sulla dimensione N. Conside-
riamo il caso N = 2: essendo det L ,= 0, deve essere a
11
,= 0 oppure a
21
,= 0.
275
Supposto, per fissare le idee, a
11
,= 0, si verifica pazientemente che
_
a
11
a
12
a
21
a
22
_
=
_
_
1 0
a
21
a
11
1
_
_

_
_
1 0
0 a
22

a
12
a
21
a
11
_
_

_
1 a
12
0 1
_

_
a
11
0
0 1
_
.
Supponiamo ora la tesi vera per matrici non singolari di /
N−1
e consideriamo
una matrice L ∈ /
N
non singolare. Denotiamo con L
iN
la matrice ottenuta
da L eliminando la riga i e la colonna N: dato che det L ,= 0, esiste i ∈
¦1, . . . , N¦ tale che a
iN
det L
iN
,= 0; scambiando eventualmente fra loro due
variabili, possiamo supporre che sia a
NN
det L
NN
,= 0.
Per ipotesi induttiva, L
NN
`e il prodotto di un numero finito di matrici M
J

/
N−1
, 1 ≤ j ≤ q, di tipo (A), (B) e (C). Dunque si ha anche
_
L
NN
0
0
t
1
_
=
q

j=1
_
M
j
0
0
t
1
_
.
Se ora poniamo
N
i
=
_
I a
iN
e
i
0
t
1
_
, i = 1, . . . , N −1,
`e facile, anche se noioso, verificare che
_
I 0
0
t
b
_

N−1

i=1
N
i

_
L
NN
0
0
t
1
_
=
_
_
_
_
_
a
11
a
1,N−1
a
1N
.
.
.
.
.
.
.
.
.
a
N−1,1
a
N−1,N−1
a
N−1,N
0 0 b
_
_
_
_
_
,
ove b `e un numero da determinare in seguito. Abbiamo cos`ı sistemato le
prime N −1 righe. Adesso, se poniamo
C
i
=
_
I 0
(c
i
e
i
)
t
1
_
, i = 1, . . . , N −1,
con c
1
, . . . , c
N−1
costanti da determinare, si vede senza difficolt`a che
N−1

i=1
C
i

_
I 0
0
t
b
_

N−1

h=1
N
h

_
L
NN
0
0
t
1
_
276
`e la matrice le cui prime N −1 righe sono quelle di L, mentre l’ultima `e
_
N−1

i=1
c
i
a
i1
, . . . ,
N−1

i=1
c
i
a
i,N−1
,
N−1

i=1
c
i
a
iN
+ b
_
.
Noi vogliamo che tale riga coincida con l’ultima di L, ossia (a
N1
, . . . , a
NN
):
quindi dobbiamo imporre che
_
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
_
N−1

i=1
c
i
a
ij
= a
Nj
, j = 1, . . . , N −1,
N−1

i=1
c
i
a
iN
+ b = a
NN
.
Ora notiamo che, per ipotesi, L
NN
`e invertibile: detta M = ¦m
ij
¦ l’inversa,
si verifica agevolmente che il sistema sopra scritto `e risolto da
c
i
=
N−1

h=1
a
Nh
m
hi
, i = 1, . . . , N −1, b = a
NN

N−1

h=1
c
h
a
hN
.
In definitiva, ricordando il modo con cui `e stata decomposta L
NN
, so ottiene
L =
N−1

i=1
C
i

_
I 0
0
t
b
_

N−1

h=1
N
h

q

j=1
_
M
j
0
0
t
1
_
,
e ci`o prova il passo induttivo.
Dal lemma 3.12.11 segue che, se E `e misurabile, i suoi trasformati successivi,
tramite le applicazioni lineari associate alle matrici M
j
il cui prodotto `e L,
sono tutti misurabili e si ha iterativamente
m
N
(h(E)) = [ det M
1
[ . . . [ det M
q
[ m
N
(E) = [ det L[ m
N
(E).
Ci` o conclude la dimostrazione della proposizione 3.12.10.
Osservazioni 3.12.12 (1) Quando E = [0, 1]
N
ed h `e l’applicazione lineare
h(x) = Lx, l’insieme h(E) `e il poliedro generato dai vettori colonna di L,
cio`e da h(e
1
), . . . , h(e
N
). Per quanto visto si ha
m
N
_
h
_
[0, 1]
N
__
= [ det L[.
277
Questo `e il significato geometrico del (modulo del) determinante. In realt` a
il determinante rappresenta un’area orientata, come si vedr` a pi` u avanti nel
corso.
(2) Nel caso tridimensionale, il volume del parallelepipedo P generato da
tre vettori u, v, w ∈ R
3
`e uguale, come abbiamo appena visto, a [ det L[, ove
L `e la matrice che ha per colonne tali vettori. Vi `e per` o un altro modo di
esprimere tale volume, tramite il prodotto vettoriale fra due vettori di R
3
.
Se u, v ∈ R
3
, il loro prodotto vettoriale `e il vettore u v ∈ R
3
che ha:
• modulo pari a [u[
3
[v[
3
sin ϑ, ove ϑ ∈ [0, π] `e l’angolo fra u e v;
• direzione perpendicolare al piano generato da u e v;
• verso tale che la terna u, v, uv sia orientata come gli assi cartesiani
x, y, z (in altre parole, essa `e orientata come medio, indice e pollice
della mano sinistra disposti ortogonalmente: in termini piu` u precisi,
la matrice che ha per colonne i vettori u, v, u v ha determinante
positivo).
Dalla definizione segue subito u u = 0 e u v = −v u; in particolare,
e
1
e
2
= e
3
, e
2
e
3
= e
1
, e
3
e
1
= e
2
. La definizione non sembra dare
indicazioni su come calcolare le componenti di u v: al contrario, esse sono
univocamente determinate come conseguenza della
Proposizione 3.12.13 Per ogni u, v ∈ R
3
risulta
u v = (u
2
v
3
−u
3
v
2
, u
3
v
1
−u
1
v
3
, u
1
v
2
−u
2
v
1
).
Dimostrazione Poniamo z = (u
2
v
3
− u
3
v
2
, u
3
v
1
− u
1
v
3
, u
1
v
2
− u
2
v
1
) ed
osserviamo innanzitutto che la dipendenza di z da u e v `e evidentemente
bilineare, cio`e lineare in ciascuno dei due argomenti. Proveremo, utilizzando
la definizione di prodotto vettoriale, che z = uv. Il vettore z `e ortogonale
sia a u che a v poich´e
¸z, u¸
3
= (u
2
v
3
−u
3
v
2
)u
1
+ (u
3
v
1
−u
1
v
3
)u
2
+ (u
1
v
2
−u
2
v
1
)u
3
= 0,
e similmente ¸z, v¸
3
= 0. Verifichiamo che [z[
3
= [u[
3
[v[
3
sin ϑ: con calcolo
noioso ma facile si ha
[u[
2
3
[v[
2
3
sin
2
ϑ = [u[
2
3
[v[
2
3
(1 −cos
2
ϑ) = [u[
2
3
[v[
2
3
−[¸u, v¸
3
]
2
=
=
_
(u
1
)
2
+ (u
2
)
2
+ (u
3
)
2
¸ _
(v
1
)
2
+ (v
2
)
2
+ (v
3
)
2
¸
−(u
1
v
1
+ u
2
v
2
+ u
3
v
3
)
2
=
= (u
2
v
3
−u
3
v
2
)
2
+ (u
3
v
1
−u
1
v
3
)
2
+ (u
1
v
2
−u
2
v
1
)
2
= [z[
2
3
.
278
A questo punto, si ha u v = ±z e resta da determinare il segno davanti a
z: possiamo naturalmente supporre z ,= 0, altrimenti il segno `e ininfluente.
Ora `e chiaro che il determinante della matrice che ha per colonne i vettori u,
v e z `e
det
_
_
u
1
v
1
u
2
v
3
−u
3
v
2
u
2
v
2
u
3
v
1
−u
1
v
3
u
3
v
3
u
1
v
2
−u
2
v
1
_
_
= (u
2
v
3
−u
3
v
2
)
2
+(u
3
v
1
−u
1
v
3
)
2
+(u
1
v
2
−u
2
v
1
)
2
e quindi `e positivo: pertanto occorre scegliere il segno +. Ci` o prova la tesi.
Per quanto visto, il prodotto vettoriale `e bilineare e possiamo formalmente
scrivere
u v = det
_
_
e
1
u
1
v
1
e
2
u
2
v
2
e
3
u
3
v
3
_
_
.
Torniamo al volume del parallelepipedo P generato da u, v e w. Detto γ
l’angolo fra w e la perpendicolare al piano generato da u e v, ossia l’angolo
fra w e u v, ovvie considerazioni geometriche ci dicono che
m
3
(P) = [u[
3
[v[
3
sin ϑ [w[
3
[ cos γ[ = [uv[
3
[w[
3
[ cos γ[ = [¸uv, w¸
3
[,
e dunque avremo
m
3
(P) = [(u
2
v
3
−u
3
v
2
)w
1
+ (u
3
v
1
−u
1
v
3
)w
2
+ (u
1
v
2
−u
2
v
1
)w
3
[ =
=
¸
¸
¸
¸
¸
¸
det
_
_
u
1
v
1
w
1
u
2
v
2
w
2
u
3
v
3
w
3
_
_
¸
¸
¸
¸
¸
¸
.
Si ritrova cos`ı, per altra via, il risultato gi`a noto m
3
(P) = [ det L[.
(3) Consideriamo il simplesso S
c,N
generato da N vettori cv
1
, . . . , cv
N
∈ R
N
,
con c fissato numero positivo:
S
c,N
=
_
x =
N

i=1
t
i
v
i
: 0 ≤ t
i
≤ c,
N

i=1
t
i
= c
_
.
Se L `e la matrice che ha per colonne i vettori v
i
, e poniamo h(x) = Lx, si
ha S
c,N
= h(Σ
c,N
), ove Σ
c,N
`e il simplesso generato dai multipli della base
canonica ce
1
, . . . ,ce
N
. Proviamo che
m
N
(S
c,N
) = [ det L[
c
N
N!
∀c > 0.
279
A questo scopo basta mostrare che
m
N

c,N
) =
c
N
N!
∀c > 0.
Ragioniamo per induzione: se N = 1 si ha Σ
c,1
= [0, c], cosicch´e m
1

c,1
) = c.
Se la tesi `e vera per l’intero N−1, dimostriamola per il successore N: poich´e
Σ
c,N
= ¦x = (x
1
, . . . , x
N
) : 0 ≤ x
i
≤ c, (x
2
, . . . , x
N
) ∈ Σ
c−x
1
,N−1
¦,
integrando per fette perpendicolari all’asse x
1
si ha, grazie all’ipotesi indut-
tiva,
m
N

c,N
) =
_
c
0
m
N−1

c−x
1
,N−1
) dx
1
=
_
c
0
(c −x
1
)
N−1
(N −1)!
dx
1
=
c
N
N!
.
In particolare, il simplesso standard di R
N
, generato dai vettori e
1
, . . . , e
N
,
ha misura pari a
1
N!
.
Riprendiamo la dimostrazione del teorema 3.12.1. Il punto chiave di tutta
l’argomentazione sta nel lemma che segue, che descrive quanto il trasformato
di un cubo di R
N
mediante un diffeomorfismo g : A → B differisce dal
trasformato dello stesso cubo mediante un’opportuna approssimazione affine
di g. Prima di enunciare il lemma ci occorrono alcuni preliminari.
Sia Ω un aperto limitato tale che Ω ⊂ A. Poniamo
M = max
_
max
x∈Ω
|Dg(x)|
/
N
, max
y∈g(Ω)
|Dg
−1
(y)|
/
N
_
.
Poniamo anche (si veda l’esercizio 3.3.12)
µ = dist(g(Ω), ∂B),
e definiamo
(g(Ω)
r
= ¦y ∈ B : dist (y, g(Ω)) ≤ r¦, r ∈]0, µ[,
Fissiamo un numero p > 0, che determineremo in seguito. Siccome Ω `e
compatto e g `e differenziabile in ogni punto u ∈ Ω, per ogni ε > 0 esiste
σ > 0, dipendente da ε ma non da u, tale che
x ∈ Ω, [x −u[
N
< σ =⇒ [g(x) −g(u) −Dg(u)(x −u)[
N
<
ε
p
[x −u[
N
280
ed anche
v ∈ (g(Ω))
µ/2
, [v −g(u)[
N
< σ =⇒
=⇒ [g
−1
(v) −u −Dg
−1
(g(u))(v −g(u))[
N
<
ε
p
[v −g(u)[
N
.
Inoltre, se C `e un cubo contenuto in Ω di centro u ∈ Ω e spigolo d > 0,
indichiamo con C
t
ε
e con C
tt
ε
i cubi concentrici a C, di spigoli rispettivamente
d(1 −ε) e d(1 + ε). Ci`o premesso, si ha:
Lemma 3.12.14 Per ogni ε > 0 esiste δ > 0 tale che qualunque cubo C ⊆ Ω
di centro u ∈ Ω e spigolo d ∈]0,
δ

N
[ verifichi
h(C
t
ε
) ⊆ g(C) ⊆ h(C
tt
ε
),
ove h `e l’applicazione affine
h(x) = g(u) +Dg(u)(x −u), x ∈ R
N
.
Dimostrazione Fissiamo ε > 0 e cominciamo con la verifica della seconda
inclusione. Sia x ∈ g(C): sar` a x = g(y) con y ∈ C. Poniamo z = h
−1
(x),
cosicch´e x = g(y) = h(z); si tratta di provare che z ∈ C
tt
ε
. Fissato i ∈
¦1, . . . , N¦, si ha
[z
i
−u
i
[ ≤ [z
i
−y
i
[ +[y
i
−u
i
[ ≤ [z
i
−y
i
[ +
d
2
.
D’altronde
[z
i
−y
i
[ ≤ [z −y[
N
= [Dg
−1
(g(u)) Dg(u)(z −y)[
N

≤ M[Dg(u)(z −y)[
N
= M[h(y) −h(z)[
N
=
= M[h(y) −g(y)[
N
= M[g(u) −g(y) +Dg(u)(y −u)[
N
,
281
da cui, se risultasse [y −u[
N
< σ, dedurremmo
[z
i
−y
i
[ ≤ M[g(u) −g(y) +Dg(u)(y −u)[
N
<

p
[y −u[
N
.
Allora, se si sceglie δ < 2σ, otteniamo effettivamente
[y −u[
N

d

N
2
<
δ
2
< σ,
e pertanto otteniamo, per ogni i ∈ ¦1, . . . , N¦,
[z
i
−u
i
[ ≤

p
[y −u[
N
+
d
2
<
M

Ndε
2p
+
d
2
<
d(1 + ε)
2
pur di prendere p > M

N. Ci`o mostra che z ∈ C
tt
ε
, come si voleva.
Proviamo la prima inclusione. Sia x ∈ h(C
t
ε
): sar`a x = h(v) con v ∈ C
t
ε
.
Mostriamo anzitutto che x ∈ (g(Ω))
µ/2
: risulta infatti
[x −g(u)[
N
= [h(v) −g(u)[
N
= [Dg(u)(v −u)[
N

≤ M[v −u[
N

Md

N(1 −ε)
2

Md

N
2


2
,
e se si sceglie δ <
µ
M
si conclude che
[x −g(u)[
N


2
<
µ
2
.
Ne segue che `e ben definito y = g
−1
(x) ∈ A. Se proviamo che y ∈ C,
otteniamo x ∈ g(C), che `e la tesi. Poich´e per ogni i ∈ ¦1, . . . , N¦ si ha
[y
i
−u
i
[ ≤ [y
i
−v
i
[ +[v
i
−u
i
[ < [y
i
−v
i
[ +
d(1 −ε)
2
,
baster` a mostrare che [y
i
−v
i
[ <

2
per i = 1, . . . , N. Osserviamo che
[y
i
−v
i
[ ≤ [y −v[
N
= [g
−1
(x) −h
−1
(x)[
N
=
= [g
−1
(x) −u −Dg
−1
(g(u))(x −g(u))[
N
;
quindi se si sceglie δ <

M
il vettore x ∈ (g(Ω))
µ/2
verifica anche
[x −g(u)[
N
= [h(v) −g(u)[
N
= [Dg(u)(v −u)[
N

≤ M[v −u[
N

Md

N(1 −ε)
2


2
< σ,
282
da cui
[y
i
−v
i
[ ≤ [g
−1
(x) −u −Dg
−1
(g(u))(x −g(u))[
N
<
ε
p
[x −g(u)[
N
,
e dunque, finalmente,
[y
i
−v
i
[ <
ε
p
[x −g(u)[
N
<
εMd

N
2p
<
εd
2
pur di prendere p > M

N. Ci`o prova, come gi` a osservato, che x ∈ g(C).
In definitiva, bisogna fissare a priori p > M

N e, in corrispondenza di ε,
scegliere dapprima σ e poi δ < min
_
σ
2
,
µ
M
,

M
_
. Ci` o conclude la dimostrazione
del lemma 3.12.14.
Siamo ora in grado di trattare il caso generale di un diffeomorfismo g : A →
B e di un generico insieme misurabile E ⊆ A. Sia Ω un aperto limitato
tale che Ω ⊂ A, poniamo dist(Ω, ∂A) = µ > 0, e proviamo dapprima la
tesi per tutti i sottoinsiemi misurabili E ⊆ Ω. Cominciamo, al solito, con
il caso in cui E ⊆ Ω `e un rettangolo. Fissato ε > 0, decomponiamo E
nell’unione di una famiglia numerabile di sottocubi adiacenti C
i
, centrati in
punti u
i
∈ E e ciascuno di spigolo minore di δ/

N, ove δ `e il numero fornito
dal lemma 3.12.14 (dunque il diametro dei cubi C
i
`e minore di δ). Inoltre,
poich´e la funzione J
g
`e uniformemente continua in Ω, possiamo supporre,
rimpicciolendo eventualmente δ, che
y, y
t
∈ Ω, [y −y
t
[
N
< δ =⇒ [J
g
(y) −J
g
(y
t
)[ < ε.
Posto, per i ∈ N,
h
i
(x) = g(u
i
) +Dg(u
i
)(x −u
i
), x ∈ R
N
,
il lemma 3.12.14 ci dice che
h
i
((C
i
)
t
ε
) ⊆ g(C
i
) ⊆ h
i
((C
i
)
tt
ε
), i ∈ N.
Dalla prima di queste due inclusioni segue, ricordando la proposizione 3.3.11
283
ed il risultato gi` a noto per le applicazioni affini,
m
N
(g(E)) ≥

i=1
m
N
(g(C
i
)) ≥

i=1
m
N
(h
i
((C
i
)
t
ε
)) =
=

i=1
[J
g
(u
i
)[ m
N
((C
i
)
t
ε
) = (1 −ε)
N

i=1
[J
g
(u
i
)[ m
N
(C
i
) =
= (1 −ε)
N

i=1
_
C
i
[J
g
(u
i
)[ dy ≥
≥ (1 −ε)
N

i=1
__
C
i
[J
g
(y)[ dy −
_
C
i
[J
g
(u
i
) −J
g
(y)[ dy
_

≥ (1 −ε)
N
_
_
E
[J
g
(y)[ dy −ε

i=1
m
N
(C
i
)
_
=
= (1 −ε)
N
_
E
[J
g
(y)[ dy −ε(1 −ε)
N
m
N
(E).
Analogamente, dalla seconda delle due inclusioni precedenti, utilizzando la
proposizione 3.3.10 e quanto gi` a dimostrato ricaviamo
m
N
(g(E)) ≤

i=1
m
N
(g(C
i
)) ≤

i=1
m
N
(h
i
((C
i
)
tt
ε
)) =
=

i=1
[J
g
(u
i
)[ m
N
((C
i
)
tt
ε
) = (1 + ε)
N

i=1
[J
g
(u
i
)[ m
N
(C
i
) =
= (1 + ε)
N

i=1
_
C
i
[J
g
(u
i
)[ dy ≤
≤ (1 + ε)
N

i=1
__
C
i
[J
g
(u
i
) −J
g
(y)[ dy +
_
C
i
[J
g
(y)[ dy
_

≤ (1 + ε)
N
_
ε

i=1
m
N
(C
i
) +
_
E
[J
g
(y)[ dy
_
=
= (1 + ε)
N
_
ε m
N
(E) +
_
E
[J
g
(y)[ dy
_
.
284
Abbiamo cos`ı ottenuto la stima
(1 −ε)
N
_
E
[J
g
(y)[ dy −ε(1 −ε)
N
m
N
(E) ≤ m
N
(g(E)) ≤
≤ m
N
(g(E)) ≤ ε(1 + ε)
N
m
N
(E) + (1 +ε)
N
_
E
[J
g
(y)[ dy;
di qui, grazie all’arbitrariet` a di ε, otteniamo finalmente che g(E) `e misurabile
e che
m
N
(g(E)) =
_
E
[J
g
(y)[ dy,
il che prova la tesi del teorema 3.12.1 quando E `e un rettangolo contenuto
in Ω.
Adesso, ripetendo quanto si `e gi` a fatto nel caso delle applicazioni affini,
si ricava lo stesso risultato quando E `e un plurirettangolo contenuto in Ω
(per additivit` a), quando E ⊆ Ω `e aperto o compatto (per approssimazione
dall’interno o dall’esterno con plurirettangoli) e quando E ⊆ Ω `e misurabile
(per approssimazione dall’interno con compatti e dall’esterno con aperti).
Ora ci liberiamo dell’aperto Ω e consideriamo un qualunque sottoinsieme
limitato e misurabile E ⊆ A. Posto, per j ∈ N
+
,

j
= ¦x ∈ A : d(x, ∂A) > 1/j¦,
la tesi del teorema `e vera per E∩Ω
j
, qualunque sia j. Utilizzando il teorema
di B. Levi si deduce allora la tesi per E. Infine, se E ⊆ A non `e limitato,
si applica quanto gi` a provato a E ∩ B
r
e poi si passa al limite per r → ∞
utilizzando nuovamente il teorema di B. Levi. Ci` o conclude la dimostrazione
del teorema 3.12.1.
Esercizi 3.12
1. Si verifichi che la misura di Lebesgue m
N
`e invariante per traslazioni,
rotazioni e simmetrie.
2. Sia g : R
N
→R
N
un’ omotetia di centro 0 e rapporto a ∈ R, ossia
g(x) = ax ∀x ∈ R
N
.
Si provi che per ogni insieme misurabile E ⊆ R
N
l’insieme g(E) `e a
sua volta misurabile, e che
m
N
(g(E)) = [a[
N
m
N
(E).
285
3. Fissati v
1
, v
2
, . . . , v
N
in R
N
, e posto
E =
_
x ∈ R
N
: x =
N

i=1
λ
i
v
i
, λ
1
, . . . , λ
N
≥ 0,
N

i=1
λ
i
= 1
_
,
si provi che E `e misurabile e che
m
N
(E) =
1
N!
det
_
_
_
v
1
1
v
1
N
.
.
.
.
.
.
v
N
1
v
N
N
_
_
_
.
[Traccia: con una opportuna trasformazione di variabili ci si riporti al
caso v
i
= e
i
.]
4. Si verifichi che se R `e un rettangolo di R
N
della forma R =

N
j=1
I
j
,
con gli I
j
intervalli di R non tutti chiusi, allora R¸ R `e unione finita di
rettangoli chiusi degeneri (ossia di misura nulla).
5. Calcolare i seguenti integrali:
(i)
_
A
ln(1 + xy) dxdy, ove
A = ¦(x, y) ∈ R
2
: 0 ≤ xy ≤ 2, y ≤ 2x, 2y ≥ x¦;
(ii)
_
B

x + y dxdy, ove B `e l’insieme delimitato dalla retta y+x =

2
e dalla parabola passante per i punti (

2, 0), (0,

2) con vertice
in (0, 0);
(iii)
_
C
1
xy
dxdy, ove
C =
_
(x, y) ∈ R
2
:
x
2
≤ y ≤ 2x, 2 −2x ≤ y ≤ 4 −2x
_
;
(iv)
_
D
(x + y)
_
[x −y[ dxdy, ove
D = ¦(x, y) ∈ R
2
: x
2
+ y
2
≤ 1, x + y ≥ 0¦;
286
(v)
_
E
2y(x −y) sin(x
2
+ y
2
) dxdy, ove
E = ¦(x, y) ∈ R
2
: 4 ≤ x
2
+ y
2
≤ 16, y ≤ x ≤

3 y¦;
(vi)
_
F
x
y
dxdy, ove F = ¦(x, y) ∈ R
2
: x
2
≤ y ≤ 2x
2
, x ≤ y ≤ 2x¦;
(vii)
_
G
x
2
y
2
(y
2
−x
2
) dxdy, ove
G =
_
(x, y) ∈ R
2
: x, y ≥ 0, x + 1 ≤ y ≤ x + 2,
1
x
≤ y ≤
2
x
_
;
(viii)
_
H
sin
3
(x
2
+ y
2
) dxdy, ove H ⊂ R
2
`e l’insieme definito da
π
2
≤ x
2
+ y
2
≤ π, y ≤ [x[.
(ix)
_
I
y dxdy, ove I ⊂ R
2
`e l’insieme definito da
x ≥ 0, y ≥ 0, −2 ≤ y(x −2) ≤ −1, 1 ≤ xy ≤ 2.
(x)
_
J
_
x
2
+ y
2
dxdy, ove J `e la regione piana interna alle due circon-
ferenze (x −1)
2
+ y
2
= 1, x
2
+ (y −1)
2
= 1.
(xi)
_
K
x dxdy, ove K `e il dominio del primo quadrante interno alla cir-
conferenza di centro (0, 1) e raggio 1 ed esterno alla circonferenza
di centro (0, 1/2) e raggio 1/2.
6. Calcolare i seguenti integrali:
(i)
_
A
x
2
dxdy, ove A `e il semicerchio di centro (r, 0) e raggio r > 0,
contenuto nel semispazio y > 0;
(ii)
_
B
y e
x
dxdy, ove B = ¦(x, y) ∈ R
2
: ρ ≤ cos ϑ¦;
(iii)
_
C
[y[ dxdy, ove C ⊂ R
2
`e la regione definita da 1 ≤ x
2
+y
2
≤ x+
1
4
;
287
(iv)
_
D
1
x
2
+ y
2
dxdy, D = trapezio di vertici (1, 0), (3, 0), (1, 1), (3, 3);
(v)
_
E
x
x
2
+ y
2
dxdy, ove
E = ¦(x, y) ∈ R
2
: y ≤ x ≤ r, x
2
+ y
2
≥ r
2
¦ (r > 0);
(vi)
_
F
arctan
y
x
dxdy, ove F `e il dominio del primo quadrante delimi-
tato dalla circonferenza x
2
+ y
2
= 4.
(vii)
_
G
dxdy
1 + x
2
+ y
2
, ove G `e la regio-
ne delimitata dalla curva (lemni-
scata di Bernoulli) di equazione
(x
2
+ y
2
)
2
−(x
2
−y
2
) = 0.
7. Provare che la funzione f(x, y) =
xy
x
2
+y
2
`e integrabile nella palla di
centro (0, 0) e raggio 1, e calcolarne l’integrale.
8. Sia E il sottoinsieme di R
2
descritto, in coordinate polari, dalla dise-
guaglianza
ρ ≤ α(ϑ), ϑ ∈ [0, 2π],
ove α `e una funzione continua e non negativa su [0, 2π]. Si calcoli
m
2
(E). Che cosa succede quando α assume anche valori negativi?
9. Sia D = ¦(x, z) ∈ R
2
: x ∈ [a, b], 0 ≤ z ≤ f(x)¦, ove f ∈ C[a, b]
e 0 ≤ a < b. Si calcoli il volume dei due solidi ottenuti ruotando D
attorno all’asse z ed attorno all’asse x.
10. (Teorema di Pappo-Guldino) Si provi che in R
3
il volume di un solido
di rotazione `e uguale al prodotto dell’area della figura ruotante per
la lunghezza della circonferenza descritta dal suo baricentro (esercizio
3.11.10).
11. Calcolare i seguenti integrali:
(i)
_
A
x
_
1 −y
2
dxdydz, ove A `e il dominio compreso fra il cilindro
x
2
+ y
2
= 1, il piano x + y + z = 8 e il piano z = 0;
288
(ii) m
3
(B), ove B `e l’insieme delimitato dal paraboloide z = x
2
+ y
2
,
dal cilindro x
2
+ y
2
= 1, e dal piano z = 2;
(iii)
_
C
y
2
z dxdydz, ove C = ¦(x, y, z) ∈ R
3
: x
2
+ y
2
+ z
2
≤ 1 ∧ 2z¦;
(iv)
_
D
sin
2
_
π
2
(z −
_
x
2
+ y
2
)
_
dxdydz, ove
D = ¦(x, y, z) ∈ R
3
: y ≥ 0, z ≥ 0, 1 −z ≥
_
x
2
+ y
2
¦.
12. (Coordinate sferiche in R
N
) Fissato N ≥ 3, si consideri l’applicazione
G : [0, ∞[[0, π]
N−2
[−π, π] →R
N
data da G(ρ, ϑ
1
, . . . , ϑ
N−2
, ϕ) = x,
ove
_
¸
¸
¸
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
¸
¸
¸
_
x
1
= ρ cos ϑ
1
x
2
= ρ sin ϑ
1
cos ϑ
2
x
3
= ρ sin ϑ
1
sin ϑ
2
cos ϑ
3
...............................................................
x
N−2
= ρ sin ϑ
1
sin ϑ
2
. . . sin ϑ
N−3
cos ϑ
N−2
x
N−1
= ρ sin ϑ
1
sin ϑ
2
sin ϑ
N−2
cos ϕ
x
N
= ρ sin ϑ
1
sin ϑ
2
sin ϑ
N−2
sin ϕ.
(i) Posto n =
1
ρ
G(ρ, ϑ
1
, . . . , ϑ
N−2
, ϕ), si verifichi che [n[
N
= 1.
(ii) Si provi che
[J
G
(ρ, ϑ
1
, . . . , ϑ
N−2
, ϕ)[ =
= ρ
N−1
(sin ϑ
1
)
N−2
(sin ϑ
2
)
N−3
. . . (sin ϑ
N−3
)
2
(sin ϑ
N−2
).
(iii) Si determini una restrizione g di G che sia iniettiva, oltre che
surgettiva su R
N
¸ Σ, ove Σ `e un opportuno insieme di misura
nulla.
(iv) Si ricavi la formula
ω
N
def
= m
N
(¦x ∈ R
N
: [x[
N
= 1¦) =
(N −3)!!
N
_
π
2
_
[
N
2
]
2
[
N+3
2
]
,
ove [t] denota la parte intera del numero reale t e n!! `e il prodotto di
tutti i naturali fra 1 e n che hanno la stessa parit`a di n (convenendo
che 0!! = 1).
289
13. Sia f : [0, R] →R una funzione integrabile. Si provi che
_
B
R
f([x[
N
) dx = Nω
N
_
R
0
f(r)r
N−1
dr.
14. Si provi che per ogni x, z ∈ R
N
e per ogni t, τ > 0 vale la relazione
seguente:
(4πt)
−N/2
(4πτ)
−N/2
_
R
N
e

|x−y|
2
N
4t
e

|y−z|
2
N

dy = [4π(t + τ)]
−N/2
e

|x−z|
2
N
4(t+τ)
.
[Traccia: utilizzare la sostituzione w =
1

1
t
+
1
τ
_
x−y
t

y−z
τ
_
.]
3.13 Lo spazio L
1
Come sappiamo, la quantit`a
_
D
[f(x)[ dx non `e una norma sull’insieme delle
funzioni integrabili su un insieme misurabile D ⊆ R
N
, poich´e tale integrale
pu` o essere nullo senza che la funzione integranda sia identicamente nulla in
D. Per aggirare questa difficolt`a, utilizzeremo la relazione di equivalenza, gi`a
introdotta nell’osservazione 3.10.3,
f · g ⇐⇒ f(x) = g(x) q.o. in D,
definita nello spazio /
D
di tutte le funzioni misurabili su D, a valori in R.
A noi interesser`a l’insieme quoziente di /
D
rispetto a ·. Notiamo che tale
quoziente eredita da /
D
la struttura di spazio vettoriale e di algebra: la
somma e il prodotto sono definiti da [f] + [g] = [f + g] e [f] [g] = [fg].
`
E
immediato verificare che queste definizioni sono ben poste.
In particolare, diamo la seguente
Definizione 3.13.1 Sia D un sottoinsieme misurabile di R
N
e sia /
1
(D) lo
spazio vettoriale delle funzioni sommabili su D: l’insieme quoziente /
1
(D)/ ·
si indica con L
1
(D).
Osserviamo che L
1
(D) `e uno spazio vettoriale. I suoi elementi non sono
funzioni, ma classi di equivalenza di funzioni q.o. coincidenti; tuttavia, come
`e d’uso, continueremo a chiamarle funzioni, confondendo in effetti la classe
[f] con il suo rappresentante f. Si tenga presente per` o che tali “funzioni”
sono definite soltanto quasi ovunque e non punto per punto.
La motivazione per il passaggio da /
1
(D) a L
1
(D) `e fornita dal seguente
fondamentale risultato:
290
Teorema 3.13.2 Sia D un sottoinsieme misurabile di R
N
. La quantit`a
|f|
1
=
_
D
[f[ dx, f ∈ /
1
(D),
`e invariante rispetto alla relazione · e definisce una norma su L
1
(D); inoltre
(L
1
(D), | |
1
) `e uno spazio di Banach.
Dimostrazione La quantit`a |f|
1
dipende solo dalla classe [f] e non dal
rappresentante f, in virt` u dell’osservazione 3.8.6; le propriet`a che fanno di
essa una norma sono pressocch´e ovvie. Proviamo che L
1
(D) `e completo
rispetto a questa norma: faremo uso del criterio di completezza espresso dal
teorema 1.7.13.
Sia ¦[f
n

n∈N
una successione contenuta in L
1
(D), tale che


n=0
|[f
n
]|
1
<
∞: faremo vedere che la serie


n=0
[f
n
] converge in norma | |
1
ad un
elemento [f] ∈ L
1
(D).
Scegliamo, per ogni n ∈ N, un elemento g
n
∈ [f
n
]: allora si ha

n=0
_
D
[g
n
[ dx < ∞.
Poniamo g(x) =


n=0
[g
n
(x)[: la funzione g `e ben definita e misurabile su
D; potrebbe valere sempre +∞, ma si vede facilmente che essa `e in realt` a
una funzione sommabile e dunque q.o. finita in D. Infatti, per il teorema di
B. Levi risulta
_
D
g dx =
_
D

n=0
[g
n
[ dx =

n=0
_
D
[g
n
[ dx < ∞.
Quindi la serie


n=0
g
n
(x) `e assolutamente convergente per quasi ogni x ∈ D
e pertanto
∃f(x) =

n=0
g
n
(x) q.o. in D.
Completiamo la definizione di f ponendo f(x) = 0 nei punti x in cui la serie
sopra scritta non converge: la funzione f cos`ı definita risulta allora misurabile
su D. Essa `e inoltre sommabile, essendo, in virt` u del lemma di Fatou,
_
D
[f[ dx ≤ liminf
n→∞
_
D
n

k=0
g
k
dx ≤

k=0
_
D
[g
k
[ dx < ∞;
291
quindi f definisce un elemento [f] ∈ L
1
(D). Proviamo che [f] `e somma della
serie


n=0
[f
n
] in L
1
(D): si ha infatti, per n →∞,
_
_
_
_
_
[f] −
n

k=0
[f
k
]
_
_
_
_
_
1
=
_
D
¸
¸
¸
¸
¸
f −
n

k=0
g
k
¸
¸
¸
¸
¸
dx =
_
D
¸
¸
¸
¸
¸

k=n+1
g
k
¸
¸
¸
¸
¸
dx ≤

k=n+1
|f
k
|
1
→0,
il che prova la tesi.
Osservazioni 3.13.3 (1) Da ora in poi confonderemo volutamente il gene-
rico elemento di L
1
, cio`e la classe di equivalenza, con uno dei rappresentanti
di tale classe, che `e una funzione sommabile. Questo modo di fare semplifica
i discorsi e non provoca guai, quindi verr`a sistematicamente adottato nel se-
guito. L’unica differenza che ne risulta `e che le relazioni puntuali tra funzioni
di L
1
valgono solamente quasi ovunque, perch´e tali “funzioni” sono definite
a meno di insiemi di misura nulla.
(2) A conferma di quanto detto in (1), notiamo che se f `e una funzione
continua e sommabile definita in R
N
, allora essa `e l’unica funzione conti-
nua appartenente alla classe [f] ∈ L
1
(R
N
): infatti se g `e un’altra funzione
continua e sommabile, non coincidente con f, allora
m
N
(¦x ∈ R
N
: g(x) ,= f(x)¦) > 0,
e quindi g non pu`o essere equivalente a f.
Spazi L
p
La costruzione che ha permesso di definire lo spazio L
1
si pu`o lievemente
generalizzare per ottenere altri spazi di Banach: gli spazi L
p
, ove p ≥ 1.
Utilizzeremo nuovamente la relazione di equivalenza · introdotta all’inizio
del paragrafo.
Definizione 3.13.4 Fissiamo p ∈ [1, ∞[ e un sottoinsieme misurabile D ⊆
R
N
. Sia /
p
(D) lo spazio vettoriale delle funzioni misurabili tali che [f[
p
`e
sommabile su D. L’insieme quoziente /
P
(D)/ · si indica con L
p
(D).
La norma di L
p
(D) `e data da
|f|
p
=
__
D
[f[
p
dx
_
1/p
, f ∈ L
p
(D);
292
naturalmente essa `e ben definita, cio`e non dipende dalla scelta del particolare
rappresentante della classe f ∈ L
p
(D). Il fatto che si tratti effettivamente di
una norma segue dalle disuguaglianze di H¨older e di Minkowski, dimostrate
nell’esercizio 1.4.6. Con questa norma, L
p
(D) `e uno spazio di Banach: ci`o
si ottiene con dimostrazione analoga a quella del teorema 3.13.2 (si veda
l’esercizio 3.13.9).
Di particolare importanza `e il caso p = 2, perch`e la norma di tale spazio `e
indotta dal prodotto scalare
¸f, g¸
L
2
(D)
=
_
D
fg dx ∀f, g ∈ L
2
(D).
Dunque L
2
(D) `e uno spazio di Hilbert.
Infine esaminiamo il caso limite p = ∞, che ha notevole interesse. Introdu-
ciamo anzitutto lo spazio delle funzioni “essenzialmente limitate”.
Definizione 3.13.5 Sia D un sottoinsieme misurabile di R
N
e sia f una
funzione misurabile definita su D. Se A ⊆ D `e un insieme misurabile, i
numeri (finiti o no)
supess
A
f = inf¦α ∈ R : f(x) ≤ α q.o. in A¦,
infess
A
f = sup¦α ∈ R : f(x) ≥ α q.o. in A¦
si chiamano estremo superiore essenziale ed estremo inferiore essenziale di f
in A (convenendo che inf ∅ = +∞ e sup ∅ = −∞).
Definizione 3.13.6 Sia D un sottoinsieme misurabile di R
N
e sia f una
funzione misurabile definita su D. Se risulta
infess
D
f > −∞ e supess
D
f < +∞,
diremo che f `e essenzialmente limitata in D e scriveremo f ∈ /

(D).
Si vede subito che f ∈ /

(D) se e solo se f `e misurabile e supess
D
[f[ < +∞.
Esempi 3.13.7 (1) La funzione f(x) = 5I
Q
(x) + sin x verifica
supess
R
f = 1, infess
R
f = −1.
(2) Se f : R
N
→R `e continua, allora per ogni aperto A ⊆ R
N
si ha
supess
A
f = sup
A
f, infess
A
f = inf
A
f.
293
Osservazione 3.13.8 Per ogni funzione f misurabile su D si ha (esercizio
3.13.15)
f(x) ≥ infess
D
f, f(x) ≤ supess
D
f q.o. in D.
Si verifica anche facilmente (esercizio 3.13.16) che /

(D) `e uno spazio vet-
toriale e un’algebra.
Definizione 3.13.9 L’insieme quoziente /

(D)/ · si indica con L

(D).
Teorema 3.13.10 Sia D un sottoinsieme misurabile di R
N
. La quantit`a
|f|

= supess
D
[f[, f ∈ /

(D),
`e invariante rispetto alla relazione · e definisce una norma su L

(D); inoltre
L

(D) `e uno spazio di Banach.
Dimostrazione Sia f ∈ /

(D); se g · f `e facile verificare che
supess
D
[f[ = supess
D
[g[,
quindi la quantit` a |f|

dipende solo dalla classe [f] e non da f. Verifichiamo
che | |

`e una norma.
Anzitutto, ovviamente, |f|

≥ 0; se si ha |f|

= 0 allora per l’osservazione
3.13.8 si ha f(x) = 0 q.o. in D, cio`e f · 0, ossia [f] `e l’elemento neutro della
somma in L

(D).
Si ha poi |λf|

= [λ[ |f|

(facile verifica usando la definizione di estremo
superiore essenziale).
Infine, la subadditivit`a di | |

segue dall’esercizio 3.13.16.
Proviamo ora la completezza dello spazio normato (L

(D), | |

). Per
maggior chiarezza, utilizziamo la notazione [f] per indicare gli elementi di
L

(D).
Sia dunque ¦[f
n

n∈N
una successione di Cauchy in L

(D): ci` o significa che
per ogni ε > 0 esiste ν ∈ N tale che
|[f
n
] −[f
m
]|

< ε ∀n, m ≥ ν.
Per ogni n ∈ N sia g
n
∈ [f
n
]; allora
supess
D
[g
n
[ = |[f
n
]|

, supess
D
[g
n
−g
m
[ = |[f
n
] −[f
m
]|

∀n, m ∈ N.
294
Posto per n, m ∈ N
A
n
= ¦x ∈ D : [g
n
(x)[ > supess
D
[g
n
[¦,
A
nm
= ¦x ∈ D : [g
n
(x) −g
m
(x)[ > supess
D
[g
n
−g
m
[¦,
dall’osservazione 3.13.8 segue che m
N
(A
n
) = m
N
(A
nm
) = 0 per ogni n, m ∈
N; dunque anche l’insieme
B =
_
_
n∈N
A
n
_

_
_
n,m∈N
A
nm
_
ha misura nulla e si ha, per ogni ε > 0,
[g
n
(x) −g
m
(x)[ ≤ supess
D
[g
n
−g
m
[ < ε ∀n, m ≥ ν, ∀x ∈ D ¸ B.
Pertanto ¦g
n
¦ `e una successione di /

(D¸ B) che `e di Cauchy rispetto alla
convergenza uniforme in D ¸ B. Dunque esiste una funzione g : D ¸ B → R
tale che g
n
→g uniformemente in D¸ B per n →∞. Tale g `e misurabile su
D¸ B perch´e tali sono le g
n
; se prolunghiamo g a tutto D ponendola uguale
a 0 in B, otteniamo che g `e misurabile su D. Inoltre
supess
D
[g[ ≤ sup
D\B
[g[ = sup
D
[g[ < ∞,
cosicch´e la classe [g] individuata da g `e un elemento di L

(D). Proviamo
che [f
n
] →[g] in L

(D):
|[f
n
] −[g]|

= supess
D
[g
n
−g[ = sup
D\B
[g
n
−g[ →0 per n →∞.
Teoremi di densit`a
`
E utile sapere se e quando `e possibile approssimare gli elementi di L
p
(D),
1 ≤ p ≤ ∞, rispetto alla norma di questi spazi, mediante funzioni che siano
“migliori” in qualche senso. Come vedremo, vi sono svariati risultati di questo
tipo.
Il primo di questi riguarda le funzioni semplici e nulle fuori da un insieme di
misura finita.
Proposizione 3.13.11 Sia p ∈ [1, ∞[ e sia D un sottoinsieme misurabile
di R
N
. Allora l’insieme ¦f ∈ o
0
: f(x) = 0 ∀x ∈ D
c
¦ `e denso in L
p
(D).
295
Dimostrazione Sia f ∈ L
p
(D). Utilizzando la proposizione 3.7.9 possiamo
trovare una successione ¦ϕ
n
¦
n∈N
⊂ o
0
tale che
lim
n→∞
ϕ
n
(x) = f(x) q.o. in D, [ϕ
n
(x)[ ≤ [f(x)[ q.o. in D
(si ricordi l’osservazione 3.13.3). Dato che

n
(x) −f(x)[
p
≤ 2
p
[f(x)[
p
q.o. in D,
il teorema di Lebesgue fornisce la tesi.
Osservazione 3.13.12 Non possiamo aspettarci per il caso p = ∞un risul-
tato analogo a quello della proposizione precedente; tuttavia l’insieme o di
tutte le funzioni semplici su R
N
`e denso in L

(R
N
) in virt` u dell’osservazione
3.7.10.
Fissato un qualsiasi aperto Ω ⊆ R
N
, consideriamo adesso lo spazio L
p
(Ω),
con 1 ≤ p < ∞: pressocch´e tutte le classi di funzioni regolari risultano dense
in questo spazio.
Proposizione 3.13.13 Se p ∈ [1, ∞[, lo spazio C
0
(Ω) ∩ L
p
(Ω) `e denso in
L
p
(Ω).
Dimostrazione Supponiamo dapprima Ω = R
N
. Poich´e, grazie alla pro-
posizione precedente, o
0
`e denso in L
p
(R
N
), baster`a dimostrare che per ogni
f ∈ o
0
vi `e una funzione continua g, con [g[
p
sommabile, arbitrariamente
vicina ad essa; a questo scopo `e chiaramente sufficiente considerare il caso
f = I
E
, con E sottoinsieme misurabile di R
N
di misura finita.
Sia dunque ε > 0; per l’esercizio 3.4.1 esistono un aperto A ed un chiuso C tali
che C ⊆ E ⊆ A e m
N
(A¸ C) < ε; in particolare, m
N
(A) < m
N
(E) +ε < ∞.
Poniamo
g(x) =
d(x, A
c
)
d(x, A
c
) + d(x, C)
, x ∈ R
N
;
si ha 0 ≤ g ≤ 1, g = 1 su C, g = 0 su A
c
ed inoltre g `e continua. D’altra
parte g ∈ L
p
(R
N
) perch´e
_
R
N
g
p
dx =
_
A
g
p
dx ≤ m
N
(A) < ∞.
La tesi nel caso Ω = R
N
segue allora dal fatto che
_
R
N
[I
E
−g[
p
dx =
_
A\C
[I
E
−g[
p
dx ≤ m
N
(A ¸ C) < ε.
296
Sia ora Ω ⊂ R
N
e sia f ∈ L
p
(Ω). La funzione f, definita su R
N
ponendola
uguale a f in Ω ed uguale a 0 fuori di Ω, appartiene a L
p
(R
N
) e si ha
ovviamente _
R
N
[f[
p
dx =
_

[f[
p
dx.
Per quanto gi`a provato, fissato ε > 0 esiste g ∈ C
0
(R
N
) ∩ L
p
(R
N
) tale che
_
R
N
[f −g[
p
dx < ε.
Ne segue che, posto g = g[

, risulta g ∈ C
0
(Ω) ∩ L
p
(Ω) e
_

[f −g[
p
dx ≤
_
R
N
[f −g[
p
dx < ε.
Consideriamo ora lo spazio C
0
0
(Ω) delle funzioni continue il cui supporto, cio`e
la chiusura dell’insieme ¦x ∈ R
N
: g(x) ,= 0¦, `e un compatto contenuto in Ω.
Proposizione 3.13.14 Se p ∈ [1, ∞[, lo spazio C
0
0
(Ω) `e denso in L
p
(Ω).
Dimostrazione Basta provare, in virt` u della proposizione precedente, che le
funzioni di C
0
0
(Ω) approssimano nella norma di L
p
(Ω) quelle di C
0
(Ω)∩L
p
(Ω).
Sia ¦K
n
¦
n∈N
una successione crescente di compatti la cui unione sia Ω, e
fissiamo f ∈ C
0
(Ω) ∩ L
p
(Ω). Consideriamo le funzioni
ϕ
n
(x) =
d(x, K
c
n+1
)
d(x, K
c
n+1
) + d(x, K
n
)
, x ∈ Ω :
allora si ha fϕ
n
∈ C
0
0
(Ω), fϕ
n
→ f puntualmente in Ω, [fϕ
n
[
p
≤ [f[
p
in Ω;
ne segue, per il teorema di Lebesgue, fϕ
n
→f in L
p
(Ω).
Convoluzioni
Il “prodotto di convoluzione” fra due funzioni sommabili `e un utilissimo stru-
mento dell’analisi con il quale `e possibile fornire teoremi di approssimazione,
risolvere equazioni alle derivate parziali, e fare molte altre cose.
Definizione 3.13.15 Siano f, g ∈ L
1
(R
N
). Si chiama convoluzione fra f e
g la funzione f g definita da
f g(x) =
_
R
N
f(x −y)g(y) dy, x ∈ R
N
.
297
Non `e chiaro, a priori, che f g sia ben definita. Il risultato che segue,
comunque, chiarisce la questione.
Lemma 3.13.16 Siano f e g funzioni sommabili in R
N
. Allora l’integrale
_
R
N
f(x−y)g(y) dy ha senso ed `e finito per q.o. x ∈ R
N
; pertanto la funzione
f g `e ben definita e sommabile su R
N
, e si ha
|f g|
1
≤ |f|
1
|g|
1
.
Dimostrazione Osserviamo subito che y → f(x − y) `e una funzione
misurabile su R
N
: infatti, posto E
α
= ¦f > α¦, si ha
¦y ∈ R
N
: f(x −y) > α¦ = x −E
α
,
e quindi tale insieme `e misurabile per ogni α ∈ R. Di pi` u, dimostriamo che
la funzione (x, y) → f(x − y) `e misurabile in R
2N
. Anzitutto, ci`o `e vero
quando f = I
E
, con E ⊆ R
N
misurabile: infatti si ha I
E
(x −y) = I
G
(x, y),
ove
G = ¦(x, y) ∈ R
2N
: x −y ∈ E¦;
d’altronde possiamo scrivere G come l’immagine di R E mediante l’appli-
cazione lineare L, ove
L(x, y) = (x, x −y) ∀(x, y) ∈ R
2N
,
e siccome L `e (in particolare) un’applicazione affine, essa preserva la misu-
rabilit` a. Pertanto, essendo R E misurabile in R
2N
, tale `e anche G. Poi,
per linearit` a, (x, y) → f(x −y) `e misurabile quando f `e una funzione sem-
plice. Nel caso generale, esiste una successione di funzioni semplici ¦ϕ
n
¦
n∈N
che converge puntualmente a f: quindi f(x − y) `e il limite puntuale delle
funzioni misurabili ϕ
n
(x −y) e dunque `e misurabile.
A questo punto applichiamo il teorema di Tonelli alla funzione misurabi-
le e non negativa (x, y) → [f(x − y)[[g(y)[: si ottiene che la funzione
x →
_
R
N
[f(x −y)[[g(y)[ dy `e integrabile su R
N
e che
_
R
N
__
R
N
[f(x −y)[[g(y)[ dy
_
dx =
_
R
2N
[g(y)[[f(x −y)[ dxdy =
=
_
R
N
[g(y)[
__
R
N
[f(x −y)[ dx
_
dy =
_
R
N
[g(y)[
__
R
N
[f(z)[ dz
_
dy =
= |f|
1
|g|
1
.
298
Ne segue, intanto, che l’integrale
_
R
N
__
R
N
[f(x −y)[[g(y)[ dy
¸
dx `e finito per
q.o. x ∈ R
N
, e quindi f g `e ben definita e fornisce un numero reale per q.o.
x ∈ R
N
. Inoltre, la funzione (x, y) →f(x −y)g(y) `e sommabile su R
2N
; ci` o
significa, grazie alla stima precedente, che f g `e sommabile su R
N
e che
|f g|
1
=
_
R
N
¸
¸
¸
¸
_
R
N
f(x −y)g(y) dy
¸
¸
¸
¸
dx ≤ |f|
1
|g|
1
.
`
E facile verificare, per cambiamento di variabili e per linearit` a, che
f g = g f, ∀f, g ∈ L
1
(R
N
),
(f g) h = f (g h) ∀f, g, h ∈ L
1
(R
N
),
(λf
1
+ µf
2
) g = λf
1
g + µf
2
g ∀f
1
, f
2
, g ∈ L
1
(R
N
), ∀λ, µ ∈ R.
La convoluzione ha le seguenti propriet` a regolarizzanti:
Proposizione 3.13.17 Sia f ∈ L
1
(R
N
). Valgono i seguenti fatti:
(i) se g ∈ L
p
(R
N
), 1 ≤ p ≤ ∞, allora f g ∈ L
p
(R
N
) e
|f g|
p
≤ |f|
1
|g|
p
;
(ii) se g ∈ L

(R
N
), allora la funzione f g `e uniformemente continua su
R
N
;
(iii) se g appartiene a C
1
(R
N
) e g, Dg ∈ L

(R
N
), allora f g ∈ C
1
(R
N
) e
D
i
(f g)(x) = f (D
i
g)(x) ∀x ∈ R
N
, i = 1, . . . , n;
(iv) se g ∈ L
1
(R
N
), detti K
f
, K
g
e K
fg
i supporti di f, g e f g, vale
l’inclusione K
fg
⊆ K
f
+ K
g
.
Dimostrazione (i) Se p = 1 la tesi segue dal lemma 3.13.16. Se invece
1 < p < ∞, detto q l’esponente coniugato di p (ossia
1
p
+
1
q
= 1) si ha, in
virt` u della disuguaglianza di H¨older e del teorema di Tonelli,
_
R
N
[f g[
p
dx ≤
_
R
N
__
R
N
[f(x −y)[
1/q
[f(x −y)[
1/p
[g(y)[ dy
_
p
dx ≤

_
R
N
__
R
N
[f(x −y)[ dy
_
p/q
__
R
N
[f(x −y)[ [g(y)[
p
dy
_
dx =
≤ |f|
p/q
1

_
R
N
__
R
N
[f(x −y)[ dx
_
[g(y)[
p
dy = |f|
1+p/q
1
|g|
p
p
=
= |f|
p
1
|g|
p
p
,
299
e ci`o prova la tesi.
Infine, quando p = ∞ si ha banalmente
[f g(x)[ ≤
_
R
N
[f(x −y)[ dy |g|

= |f|
1
|g|

∀x ∈ R
N
,
da cui la maggiorazione delle norme.
(ii) Se x, x
t
∈ R
N
risulta
[f g(x) −f g(x
t
)[ ≤
_
R
N
[f(x −y) −f(x
t
−y)[ [g(y)[ dy ≤

_
R
N
[f(z) −f(x
t
−x +z)[ dz |g|

da cui, grazie alla continuit`a delle traslazioni in L
1
(esercizio 3.13.10), si
ottiene
[f g(x) −f g(x
t
)[ < ε per [x −x
t
[
N
< δ
ε
.
(iii) Supponiamo dapprima f ∈ C
0
0
(R
N
) e fissiamo x ∈ R
N
. Se 0 < [t[ ≤ 1,
dato che il prodotto di convoluzione `e commutativo, possiamo scrivere, detto
K il supporto di f,
¸
¸
¸
¸
f g(x + te
i
) −f g(x)
t
−f D
i
g(x)
¸
¸
¸
¸
=
=
¸
¸
¸
¸
_
K
_
g(x + te
i
−y) −g(x −y)
t
−D
i
g(x −y)
_
f(y) dy
¸
¸
¸
¸


_
K
¸
¸
¸
¸
1
t
_
t
0
d

g(x −y + σ e
i
) dσ −D
i
g(x −y)
¸
¸
¸
¸
[f(y)[ dy ≤

_
K
¸
¸
¸
¸
1
t
_
t
0
[D
i
g(x −y + σ e
i
) −D
i
g(x −y)[dσ
¸
¸
¸
¸
[f(y)[ dy.
Poich´e D
i
g `e una funzione uniformemente continua sul compatto
H = x −K + B(0, 1),
esiste δ ∈]0, 1[ per cui
[t[ ≤ δ =⇒ [D
i
g(x −y + σt e
i
) −D
i
g(x −y)[ < ε ∀y ∈ K, ∀σ ∈ [−1, 1],
da cui, se [t[ ≤ δ,
¸
¸
¸
¸
f g(x + te
i
) −f g(x)
t
−f D
i
g(x)
¸
¸
¸
¸
≤ ε
_
K
[f(y)[ dy ≤ ε|f|
1
.
300
Ci` o prova che
D
i
(f g)(x) = f D
i
g(x) ∀x ∈ R
N
, ∀f ∈ C
0
0
(R
N
).
Sia ora f sommabile su R
N
. Esiste una successione ¦f
n
¦ ⊂ C
0
0
(R
N
) tale
che f
n
→ f in L
1
(R
N
). Per ogni n ∈ N risulta, per quanto dimostrato,
D
i
(f
n
g) = f
n
D
i
g. Dalla limitatezza di g e D
i
g e dalle relazioni
|f
n
g−f g|

≤ |f
n
−f|
1
|g|

, |f
n
D
i
g−f D
i
g|

≤ |f
n
−f|
1
|D
i
g|

segue che
f
n
g →f g uniformemente in R
N
,
D
i
(f
n
g) →f D
i
g uniformemente in R
N
;
pertanto, grazie al teorema 1.2.4, f g ha la derivata parziale i-sima e si ha
D
i
(f g) = f D
i
g. Da (ii) segue infine che f g ∈ C
1
(R
N
).
(iv) Siano K
f
, K
g
e K
fg
i supporti di f, di g e di f g, definiamo H =
K
f
+ K
g
, ove
K
f
+ K
g
= ¦z ∈ R
N
: z = x +y, x ∈ K
f
, y ∈ K
g
¦,
e proviamo che K
fg
`e contenuto in H. Infatti, sia x / ∈ H: allora, essendo
H chiuso, esiste una palla B, di centro x e raggio positivo, disgiunta da H
e quindi da K
fg
, il che implica x
t
− y / ∈ K
f
per ogni y ∈ K
g
e per ogni
x
t
∈ B; dunquef(x
t
− y)g(y) = 0 per ogni y ∈ R
N
e per ogni x
t
∈ B.
Pertanto f g(x
t
) = 0 per ogni x
t
∈ B, ed in particolare x / ∈ K
fg
.
Osserviamo che, come conseguenza della proposizione precedente, la convo-
luzione `e di classe C

se almeno uno dei suoi “fattori” `e di classe C

.
Un importante complemento alla proposizione precedente `e dato dalla se-
guente disuguaglianza.
Proposizione 3.13.18 (disuguaglianza di Young) Siano f ∈ L
p
(R
N
) e
g ∈ L
q
(R
N
), con p, q ∈ [1, ∞] tali che
1
p
+
1
q
≥ 1. Se
1
r
=
1
p
+
1
q
− 1, allora
f g ∈ L
r
(R
N
) e
|f g|
r
≤ |f|
p
|g|
q
.
Si noti che risulta r =
pq
q+p−pq
, e da qui `e facile dedurre che r ≥ p e r ≥ q.
Osserviamo che la tesi include il caso in cui
1
p
+
1
q
= 1 e di conseguenza
r = ∞, nonch´e il caso in cui p = ∞, e dunque q = 1 e r = ∞, oppure q = ∞,
301
e dunque p = 1 e r = ∞.
Dimostrazione Supponiamo, per cominciare,
1
p
+
1
q
> 1 e quindi r ∈]1, ∞[.
Denotiamo con q
t
l’esponente coniugato di q e poniamo s = p
_
1−
1
q
_
: si vede
subito allora che s ∈]0, 1[, sq
t
= p e (1 − s)r = p. Possiamo perci` o scrivere
per q.o. x ∈ R
N
, utilizzando la disuguaglianza di H¨older,
[f g(x)[
q

__
R
N
[f(x −y)[
1−s+s
g(y)[ dy
_
q


_
R
N
[f(x −y)[
(1−s)q
[g(y)[
q
dy
__
R
N
[f(x −y)[
sq

dy
_
q
q

=
=
_
[f[
(1−s)q
[g[
q
(x)
¸
|f|
sq
p
.
Notiamo che l’integrale che definisce la convoluzione [f[
(1−s)q
[g[
q
`e q.o.
finito: infatti [g[
q
∈ L
1
(R
N
) mentre [f[
(1−s)q
∈ L
r
q
(R
N
), e dunque per la
proposizione 3.13.17 (i) si ha [f[
(1−s)q
[g[
q
∈ L
r
q
(R
N
).
Consideriamo allora [f g(x)[
q
alla potenza
r
q
, integriamo su R
N
ed eleviamo
all’esponente
q
r
. Si ottiene
|f g|
q
r
=
_
_
[f g[
q
_
_
r
q

_
_
[f[
(1−s)q
[g[
q
_
_
r
q
|f|
sq
p


_
_
[f[
(1−s)q
|
r
q

_
_
[g[
q
_
_
1
|f|
sq
p
= |f|
(1−s)q
p
|g|
q
q
|f|
sq
p
,
ed infine
|f g|
r
≤ |f|
p
|g|
q
.
Nel caso
1
p
+
1
q
= 1 e r = +∞, la tesi `e immediata conseguenza della
disuguaglianza di H¨ older:
[f g(x)[ ≤
__
R
N
[f(x −y)[
p
dy
_1
p
|g|
q
= |f|
p
|g|
q
per q.o. x ∈ R
N
.
Nel caso p = r = 1, q = +∞, oppure p = +∞ e q = r = 1, la tesi segue dalla
proposizione 3.13.17 (i).
Le convoluzioni permettono di “regolarizzare” in modo standard tutte le
funzioni sommabili: in altre parole, tramite le convoluzioni si fornisce un
metodo per costruire approssimazioni di classe C

di una funzione sommabile
qualunque. A questo scopo, consideriamo una funzione ϕ ∈ C

(R
N
) tale che
ϕ ≥ 0,
_
R
N
ϕdx = 1, ϕ(x) = 0 per [x[
N
≥ 1.
302
Una siffatta funzione `e ad esempio ϕ(x) = c
N
f([x[
2
N
−1), ove
f(t) =
_
e
1/t
se t < 0
0 se t ≥ 0,
e c
N
`e una costante scelta in modo che l’integrale di ϕ valga proprio 1. Ci`o
premesso, si ha:
Definizione 3.13.19 Sia Ω un aperto di R
N
, sia u ∈ L
1
(Ω) e pensiamo u
prolungata a tutto R
N
ponendola uguale a 0 su Ω
c
. Per ogni ε > 0 la funzione
regolarizzata di u di parametro ε `e
u
ε
(x) =
_
R
N
u(x −εy)ϕ(y) dy = ε
−N
_
R
N
u(z) ϕ
_
x −z
ε
_
dz, x ∈ R
N
.
Dalla proposizione 3.13.17 segue che u
ε
∈ C

(R
N
) per ogni ε > 0. Inol-
tre, se u ha supporto compatto in Ω allora per ε sufficientemente piccolo
lo stesso vale per u
ε
: infatti, basta osservare che il supporto della funzione
z → ϕ
_
x−z
ε
_
`e contenuto nella palla B(x, ε); quindi, detto K il supporto
di u, per ε < d(K, Ω
c
) il supporto di u
ε
`e a sua volta, per la proposizione
3.13.17, un compatto di Ω: in definitiva, posto C

0
(Ω) = C

(Ω) ∩ C
0
0
(Ω),
risulta u
ε
∈ C

0
(Ω).
La funzione regolarizzata ha buonissime propriet` a di convergenza, come mo-
stra la seguente
Proposizione 3.13.20 Sia Ω un aperto di R
N
e sia u : Ω →R una funzione
misurabile che pensiamo prolungata a 0 fuori di Ω. Valgono i fatti seguenti:
(i) se u ∈ L
p
(Ω), 1 ≤ p < ∞, allora |u
ε
|
p
≤ |u|
p
per ogni ε > 0 e u
ε
→ u
in L
p
(Ω) per ε →0;
(ii) se u ∈ C
0
0
(Ω), allora u
ε
∈ C

0
(Ω) per ogni ε sufficientemente piccolo e
u
ε
→u uniformemente in Ω.
Dimostrazione Proviamo dapprima (ii). Sappiamo che in questo caso si
ha u
ε
∈ C

0
(Ω) per ε abbastanza piccolo. Inoltre, poich´e
_
R
N
ϕdx = 1, si ha
[u
ε
(x) −u(x)[ =
¸
¸
¸
¸
_
R
N
[u(x −εy) −u(x)]ϕ(y) dy
¸
¸
¸
¸


_
R
N
[u(x −εy) −u(x)[ϕ(y) dy,
303
e dall’uniforme continuit` a di u si deduce, per ogni σ > 0,
[u
ε
(x) −u(x)[ < σ ∀x ∈ Ω
pur di prendere ε sufficientemente piccolo. Ci`o prova che u
ε
→ u uniforme-
mente in Ω.
Proviamo (i). Cominciamo col dimostrare la relazione
[u
ε
(x)[ ≤
__
R
N
[u(x −εy)[
p
ϕ(y) dy
_
1/p
∀x ∈ Ω.
Ci` o `e ovvio se p = 1; se invece p > 1 dalla disuguaglianza di H¨older si ha,
detto q l’esponente coniugato di p:
[u
ε
(x)[ ≤
_
R
N
[u(x −εy)[ϕ(y)
1/p
ϕ(y)
1/q
dy ≤

__
R
N
[u(x −εy)[
p
ϕ(y) dy
_
1/p
__
R
N
ϕ(y) dy
_
1/q
=
=
__
R
N
[u(x −εy)[
p
ϕ(y) dy
_
1/p
∀x ∈ Ω,
e la relazione sopra scritta `e provata. Da essa, elevando alla potenza p-sima
e integrando su Ω entrambi i membri, si ottiene
_
R
N
[u
ε
(x)[
p
dx ≤
_
R
N
_
R
N
[u(x −εy)[
p
ϕ(y) dydx =

_
R
N
_
R
N
[u(x −εy)[
p
dxϕ(y) dy =
_
R
N
[u(z)[
p
dz.
Ci` o premesso, sia u ∈ L
p
(Ω). Notiamo che, per la proposizione 3.13.14, dato
σ > 0 esiste una funzione v ∈ C
0
0
(Ω) tale che |v − u|
p
< σ. Denotiamo
con K il supporto di v, che `e un compatto di Ω. Per la (ii) gi`a provata, la
regolarizzata v
ε
di v verifica, per ε sufficientemente piccolo, |v
ε
− v|
p
< σ.
Usando la linearit` a della convoluzione e la parte (i) si deduce, per ε piccolo,
|u
ε
−u|
p
≤ |u
ε
−v
ε
|
p
+|v
ε
−v|
p
+|v −u|
p
=
= |(u −v)
ε
|
p
+|v
ε
−v|
p
+|v −u|
p

≤ 2|v −u|
p
+|v
ε
−v|
p
< 3σ
e ci`o prova che u
ε
→u in L
p
(Ω).
304
Corollario 3.13.21 Sia Ω ⊆ R
N
un aperto e sia p ∈ [1, ∞[. Allora lo spazio
C

0
(Ω) `e denso in L
p
(Ω).
Dimostrazione Sia u ∈ L
p
(Ω). Dato σ > 0, esiste v ∈ C
0
0
(Ω) tale che
|u − v|
p
< σ. Detto K il supporto di v, per ε < d(K, Ω
c
) la regolarizzata
v
ε
di v appartiene a C
0
0
(Ω) e converge a v uniformemente in Ω per ε →0; in
particolare i supporti delle v
ε
, per ε < ε
σ
, sono tutti contenuti in un fissato
compatto K
t
⊂ Ω. Dunque per ε sufficientemente piccolo si ha
|u −v
ε
|
p
≤ |u −v|
p
+|v −v
ε
|
p
< σ +|v −v
ε
|

m
N
(K
t
)
1/p
< 2σ.
Ci` o prova la tesi.
Partizione dell’unit`a
Uno strumento utilissimo in svariate situazioni `e la cosiddetta partizione
dell’unit`a, che consiste nel costruire una famiglia di funzioni di classe C

,
i supporti delle quali siano contenuti in opportuni aperti, e la cui somma
sia identicamente uguale a 1. Ci` o permette di semplificare lo studio di vari
fenomeni “localizzandoli” opportunamente.
Proposizione 3.13.22 Sia ¦B
h
¦
h∈N
una successione di palle aperte di R
N
,
le quali costituiscano un ricoprimento di R
N
, e siano tali che ogni compatto
K ⊂ R
N
ne intersechi solo un numero finito. Allora esiste una successione
di funzioni ¦ϕ
h
¦
h∈N
⊂ C

0
(R
N
), tali che:
(i) per ogni h ∈ N il supporto di ϕ
h
`e contenuto in B
h
,
(ii) risulta


h=0
ϕ
h
(x) = 1 per ogni x ∈ R
N
.
La successione ¦ϕ
h
¦
h∈N
`e detta partizione dell’unit` a associata al ricoprimento
¦B
h
¦
h∈N
.
Dimostrazione Poniamo anzitutto B
h
= B(x
h
, r
h
) ed osserviamo che, eli-
minando eventualmente qualche palla B
h
, possiamo supporre che nessuna
palla sia totalmente inclusa nell’unione di altre, ossia che
B
h
¸
_
k,=h
B
k
,= ∅ ∀h ∈ N.
305
Andiamo adesso a costruire un restringimento del ricoprimento ¦B
h
¦
h∈N
,
ossia un nuovo ricoprimento ¦B
t
h
¦
h∈N
di R
N
tale che
B
t
h
⊂ B
t
h
⊂ B
h
∀h ∈ N.
Questo si pu`o fare induttivamente: vi `e un insieme finito I
1
di indici h ,= 1
tale che le palle B
h
con h ∈ I
1
intersecano B
1
; quindi, indicando con A
1
l’unione di tali palle, i due compatti ∂(B
1
¸ A
1
) e ∂B
1
hanno distanza
δ
1
∈]0, r
1
[ . Ne segue che la palla B
t
1
= B(x
1
, r
1

δ
1
2
) `e non vuota e la
famiglia ¦B
t
1
, B
h
: h > 1¦ ricopre ancora R
N
. Poi, una volta costruite le B
t
h
per 1 ≤ h < k, vi `e un insieme finito I
k
di indici h ,= k tale che le palle del
ricoprimento ¦B
t
1
, ..., B
t
k−1
, B
h
: h > k¦ con h ∈ I
k
intersecano B
k
; quindi,
indicando con A
k
l’unione di tali palle, i due compatti ∂(B
k
¸ A
k
) e ∂B
k
hanno distanza positiva δ
k
∈]0, r
k
[ . Perci` o, la palla B
t
k
= B(x
k
, r
k

δ
k
2
) `e
non vuota e la famiglia ¦B
t
1
, ..., B
t
k
, B
h
: h > k¦ `e ancora un ricoprimento di
R
N
. Iterando questo procedimento, si ottiene che la famiglia ¦B
t
k
¦
k∈N
`e il
restringimento desiderato.
Fatto ci` o, consideriamo la funzione g :
R →R definita da
g(t) =
_
exp
_
t
2
t
2
−1
_
se [t[ < 1,
0 se [t[ ≥ 1.
ed osserviamo che g ∈ C

0
(R). Posto B
t
h
= B(x
h
, r
t
h
), definiamo
β
h
(x) = g
_
[x −x
h
[
2
N
(r
t
h
)
2
_
, x ∈ R
N
, h ∈ N.
Allora si ha β
h
∈ C

(R
N
), 0 ≤ β
h
≤ 1 e β
h
= 0 per [x −x
h
[
N
≥ r
t
h
, cosicch´e
il supporto di β
h
`e contenuto in B
h
. La serie


k=0
β
k
(x) converge in ogni
punto x ∈ R
N
con somma strettamente positiva, poich´e per ogni x ∈ R
N
vi
`e solo un numero finito di addendi non nulli dei quali almeno uno positivo
(dato che vi `e almeno un indice k tale che x ∈ B
t
k
). Quindi le funzioni
α
h
(x) =
β
h
(x)


k=0
β
k
(x)
, x ∈ R
N
,
verificano la tesi.
Pi` u generalmente si pu`o costruire una partizione dell’unit` a rispetto a un
ricoprimento di un fissato aperto Ω ⊆ R
N
. Si ha infatti:
306
Proposizione 3.13.23 Sia Ω un aperto di R
N
e sia ¦U
h
¦
h∈N
una succes-
sione di aperti contenuti in Ω, i quali costituiscano un ricoprimento di Ω,
e siano tali che ogni compatto K ⊂ Ω ne intersechi solo un numero finito.
Allora esiste una successione di funzioni ¦ϕ
h
¦
h∈N
⊂ C

0
(Ω), tali che:
(i) per ogni h ∈ N il supporto di ϕ
h
`e contenuto in U
h
,
(ii) risulta


h=0
ϕ
h
(x) = 1 per ogni x ∈ Ω.
Dimostrazione Iniziamo con l’osservare che se A `e aperto, C `e chiuso e
C ⊂ A ⊂ A ⊂ Ω, allora esiste una funzione g ∈ C

0
(Ω) tale che 0 ≤ g ≤ 1,
g = 1 su C e g = 0 su Ω ¸ A. Infatti, poich´e δ = d(C, ∂A) > 0, possiamo
scegliere due aperti B
1
e A
1
tali che C ⊂ B
1
⊂ B
1
⊂ A
1
⊂ A
1
⊂ A: basta
definire
B
1
= ¦x ∈ Ω : d(x, C) < δ/3¦, A
1
= ¦x ∈ Ω : d(x, C) < 2δ/3¦.
Sia
h(x) =
d(x, A
c
1
)
d(x, B
1
) + d(x, A
c
1
)
, x ∈ R
N
:
la funzione h `e continua, verifica 0 ≤ h ≤ 1 e il suo supporto coincide con A
1
.
Consideriamo ora la regolarizzata h
ε
di h (definizione 3.13.19): la funzione
h
ε
appartiene a C

0
(R
N
) e, per la proposizione 3.13.20, il supporto di h
ε
`e
contenuto in A se ε `e sufficientemente piccolo. Inoltre, `e immediato verifica-
re che per ε sufficientemente piccolo si ha anche h
ε
= 1 su C. Posto allora
g = h
ε
, si vede subito che la funzione g verifica quanto richiesto.
Ci` o premesso, si pu` o estrarre dal ricoprimento ¦U
h
¦ un restringimento ¦U
t
h
¦,
in modo simile a quanto fatto nella dimostrazione della proposizione prece-
dente: con notazioni analoghe, posto A
1
=

h∈I
1
U
h
, i due compatti ∂(B
1
¸
A
1
) e ∂B
1
hanno distanza δ
1
> 0; posto U
t
1
= ¦x ∈ U
1
: d(x, ∂U
1
) > δ
1
/2¦,
la famiglia ¦U
t
1
, U
h
: h > 1¦ ricopre ancora Ω. Poi, costruiti U
t
1
, . . . U
t
k−1
e
posto A
k
=

h∈I
k
U
h
, i due compatti ∂(B
k
¸ A
k
) e ∂B
k
hanno distanza po-
sitiva δ
k
e quindi, definendo U
t
k
= ¦x ∈ U
k
: d(x, ∂U
k
) > δ
k
/2¦, la famiglia
¦U
t
1
, . . . , U
t
k
, U
h
: h > k¦ ricopre ancora Ω. Iterando, la famiglia ¦U
t
k
¦
k∈N
`e il
restringimento desiderato.
Per ogni h ∈ N sia allora g
h
una funzione appartenente a C

0
(Ω), con sup-
porto contenuto in U
t
h
, tale che 0 ≤ g
h
≤ 1 e g
h
= 1 su U
t
h
¸

k,=h
U
k
. La serie


k=0
g
k
(x) converge in ω e la sua somma `e strettamente positiva. Pertanto,
le funzioni
ϕ
h
(x) =
g
h
(x)


k=0
g
k
(x)
, x ∈ Ω
307
verificano la tesi.
Esercizi 3.13
1. Si provi che ogni aperto di R
N
`e l’unione di una successione crescente
di compatti.
2. Sia D un sottoinsieme misurabile di R
N
e siano f
n
, f funzioni di L
1
(D)
tali che f
n
(x) → f(x) q.o. in D. Si provi che se, inoltre,
_
D
[f
n
[ dx →
_
D
[f[ dx, allora f
n
→f in L
1
(D), e che la tesi `e in generale falsa senza
quest’ultima ipotesi.
[Traccia: si applichi il lemma di Fatou alla successione ¦g
n
¦, ove
g
n
[f[ +[f
n
[ −[f −f
n
[.]
3. Sia D un sottoinsieme misurabile di R
N
e sia f ∈ L
1
(D). Si provi che
per ogni ε > 0 esiste un insieme misurabile A ⊆ D tale che m
N
(A) < ∞
e
_
D\A
[f[ dx < ε.
4. Provare che le funzioni f
n
definite da
f
n
(x) =
sin x
n(e
x/n
−1)

x
, x > 0,
appartengono a L
1
(0, ∞). Si dica se esiste finito il limite
lim
n→∞
_

0
f
n
dx.
5. Poniamo per ogni n ∈ N
+
f
n
(x) =
_
1
nx
_
, x > 0,
ove [y] indica la parte intera di y.
(i) Si verifichi che ¦f
n
¦ converge puntualmente a 0 in ]0, ∞[.
(ii) Si dica se ¦f
n
¦ converge a 0 in L
1
(0, ∞).
6. Se ¦f
n
¦ converge a f in L
1
(D), si provi che esiste una sottosuccessione
¦f
n
k
¦
k∈N
⊆ ¦f
n
¦
n∈N
che converge q.o. in D a f in modo dominato, cio`e
verifica, per un’opportuna g ∈ L
1
(D),
lim
k→∞
f
n
k
(x) = f(x), sup
k∈N
[f
n
k
(x)[ ≤ g(x) per q.o. x ∈ D.
308
7. Siano p, q > 1 con
1
p
+
1
q
= 1, e sia K(x, y) una funzione misurabile a
supporto compatto. Si provi che per ogni funzione ψ ∈ L
q
(R
N
) risulta
¸
¸
¸
¸
_
R
N
__
R
N
K(x, y) dy
_
ψ(x) dx
¸
¸
¸
¸

_
R
N
|K(, y)|
p
dy |ψ|
q
;
scegliendo (quando ha senso) ψ(x) =
¸
¸
_
R
N
K(x, y) dy
¸
¸
p−2

_
R
N
K(x, y) dy,
si deduca che
__
R
N
¸
¸
¸
¸
_
R
N
K(x, y) dy
¸
¸
¸
¸
p
dx
_1
p

_
R
N
__
R
N
[K(x, y)[
p
dx
_1
p
dy.
8. Esibire un esempio di successione ¦f
n
¦ che converga in L
1
(a, b), ma tale
che per ogni x ∈ [a, b] la successione ¦f
n
(x)¦ non abbia limite.
9. Sia p ∈]1, ∞[ e sia D un sottoinsieme misurabile di R
N
. Si dimostri
che L
p
(D) `e uno spazio di Banach.
[Traccia: scimmiottare la dimostrazione del teorema 3.13.2.]
10. (Continuit`a in L
p
delle traslazioni) Sia f ∈ L
p
(R
N
), 1 ≤ p < ∞. Posto,
per h ∈ R
N
, f
h
(x) = f(x +h), si provi che:
(i) f
h
∈ L
p
(R
N
) e |f
h
|
p
= |f|
p
per ogni h ∈ R
N
;
(ii) lim
h→0
|f
h
−f|
p
= 0.
[Traccia: utilizzare la densit`a di o
0
e di C
0
0
(R
N
) in L
p
(R
N
).]
11. (Continuit`a in L
p
delle omotetie) Sia f ∈ L
p
(R
N
), 1 ≤ p < ∞. Posto,
per λ ∈ R ¸ ¦0¦, F
λ
(x) = f(λx), si provi che:
(i) F
λ
∈ L
p
(R
N
) e |F
λ
|
p
=
1
[λ[
N
|f|
p
per ogni λ ∈ R ¸ ¦0¦;
(ii) lim
λ→1
|F
λ
−f|
p
= 0.
12. Determinare per quali valori di α ∈ R esiste finito il limite
lim
n→∞
_

0
x
α
n
2
_
1 −cos
x
n
_
dx,
e calcolarlo.
309
13. Sia g ∈ C
0
(R) con lim
[x[→∞
g(x) = 0. Provare che per ogni f ∈ L
1
(R) si
ha
lim
n→∞
1
n
_
R
g(x)f
_
x
n
_
dx = 0.
14. Si provi che se f ∈ /

(D) allora esiste un insieme misurabile A ⊆ D
tale che m
N
(D ¸ A) = 0 e supess
D
[f[ = sup
A
[f[.
15. Sia D ⊆ R
N
misurabile e sia f una funzione misurabile su D. Provare
che per ogni A ⊆ D misurabile si ha
f(x) ≥ infess
A
f e f(x) ≤ supess
A
f q.o. in A.
16. Si provi che se f, g ∈ /

(D) allora f + g, fg ∈ /

(D) e
supess
D
[f + g[ ≤ supess
D
[f[ + supess
D
[g[,
supess
D
[fg[ ≤ supess
D
[f[ supess
D
[g[.
17. Sia ¦f
n
¦ ⊂ /

(D) una successione convergente puntualmente in D ad
una funzione f.
`
E vero che f ∈ /

(D)?
18. (Lemma di Riemann-Lebesgue) Se f ∈ L
1
(R), si provi che
lim
t→∞
_
R
f(x) cos tx dx = lim
t→∞
_
R
f(x) sin tx dx = 0.
19. Si provi che l’insieme delle funzioni costanti a tratti `e denso in L
p
(R).
[Traccia: si osservi che basta approssimare le funzioni di C
0
0
(R), e che
una fissata f ∈ C
0
0
(R), nulla fuori di [−M, M], `e integrabile secondo
Riemann su [−M, M].]
20. Sia E un sottoinsieme misurabile di R con m
1
(E) < ∞. Provare che
_
E
1
2 −sin nx
dx =
m
1
(E)

3
.
[Traccia: se E `e un intervallo, l’integrale si calcola esplicitamente e,
usando la periodicit`a, si ottiene il risultato passando al limite; si ap-
prossimi poi I
E
, utilizzando l’esercizio precedente, con funzioni costanti
a tratti.]
310
21. Esibire un esempio di funzioni f, g ∈ L
1
(R
N
) con supporti K
f
e K
g
tali
che K
f
+ K
g
non sia chiuso.
22. Verificare che (f g) h = f (g h) per ogni f, g, h ∈ L
1
(R
N
).
23. Calcolare esplicitamente la funzione I
[a,b]
I
[c,d]
, ove [a, b] e [c, d] sono
generici intervalli chiusi di R.
24. Calcolare esplicitamente la funzione f ∗ g(x), quando f(x) = e
−a[x[
2
N
e
g(x) = e
−b[x[
2
N
, con a, b > 0.
3.14 Serie di Fourier
Studieremo il comportamento di serie trigonometriche della forma
a
0
2
+

n=1
(a
n
cos nt + b
n
sin nt), t ∈ R,
ove i coefficienti a
n
, b
n
sono numeri reali o complessi. Fra le tante motivazioni
che conducono a questo studio ne citiamo due: una prettamente matematica
ed una fisica.
La motivazione matematica `e semplice: ogni serie di potenze complesse

n=0
a
n
z
n
, z ∈ C,
si riduce ad una serie trigonometrica scrivendo la variabile z nella forma
esponenziale z = ρe

:

n=0
a
n
z
n
=

n=0
a
n
ρ
n
e
inϑ
=

n=0
(a
n
ρ
n
cos nϑ + a
n
ρ
n
sin nϑ),
e in effetti la somma di alcune serie trigonometriche pu`o essere calcolata
proprio riconducendola, mediante questo artificio, alla somma di serie di po-
tenze note (esercizio 3.14.3); inversamente, il comportamento di alcune serie
di potenze sul bordo del loro cerchio di convergenza pu`o essere determinato
per mezzo delle propriet` a di convergenza delle serie trigonometriche.
La motivazione fisica proviene dallo studio di fenomeni di tipo oscillatorio e
311
vibratorio. Ad esempio, in acustica i suoni “puri”, quali il suono del diapason,
sono il risultato di un’oscillazione armonica elementare della forma
a sin(ωt + ϕ),
dove a `e l’ ampiezza, ω `e la frequenza e ϕ `e la fase. I suoni emessi dagli stru-
menti musicali sono invece il risultato della sovrapposizione di diversi tipi di
onde sonore: per esempio, la corda di una chitarra, oscillando, produce suoni
a diverse frequenze, teoricamente infinite, tutte multiple di una stessa fre-
quenza fondamentale ω propria della corda, che dipende dalla sua lunghezza
e dalla tensione. Il suono della corda `e perci`o descritto da una somma di
funzioni periodiche dello stesso periodo T =
1
ω
, del tipo
a
n
cos
2πnt
T
oppure b
n
sin
2πnt
T
.
Siamo quindi ricondotti allo studio di serie trigonometriche della forma sopra
descritta.
Iniziamo la nostra analisi con alcune osservazioni preliminari.
• (Periodicit`a) La somma di una serie trigonometrica convergente `e una
funzione definita su R, a valori reali o complessi, periodica di un certo
periodo T; noi supporremo sempre T = 2π. D’altra parte, ogni funzione
definita su [−π, π[, oppure su [a, a + 2π[ con a fissato numero reale,
pu` o essere prolungata a R in modo 2π-periodico. Quindi avr`a senso
considerare possibili approssimazioni trigonometriche di una arbitraria
funzione definita solo su [−π, π[. Se il periodo T `e diverso da 2π, si
avranno serie trigonometriche della forma
a
0
2
+

n=1
_
a
n
cos
2πnx
T
+ b
n
sin
2πnx
T
_
, x ∈ R.
Il passaggio dall’uno all’altro caso si fa con l’omotetia x →
T

x, che
trasforma funzioni T-periodiche in funzioni 2π-periodiche.
• (Notazione complessa) Un modo equivalente di scrivere le serie trigono-
metriche si ottiene facendo uso della funzione esponenziale complessa:
poich´e
cos nt =
e
int
+ e
−int
2
, sin nt =
e
int
−e
−int
2i
,
312
si ha
a
0
2
+

n=1
(a
n
cos nt + b
n
sin nt) = c
0
+

n=1
_
c
n
e
int
+ c
−n
e
−int
_
,
ove
c
0
=
a
0
2
; c
n
=
a
n
−ib
n
2
, c
−n
=
a
n
+ ib
n
2
∀n ∈ N
+
,
e, viceversa,
a
0
= 2c
0
; a
n
= c
n
+ c
−n
, b
n
= i(c
n
−c
−n
) ∀n ∈ N
+
.
Scriveremo, pi` u concisamente,

k∈Z
c
k
e
ikt
in luogo di

n=1
_
c
n
e
int
+ c
−n
e
−int
_
.
L’uso delle esponenziali complesse coinvolge coefficienti c
k
complessi
anche se i coefficienti originali a
n
e b
n
sono reali; naturalmente in que-
st’ultimo caso la somma della serie `e reale. D’altra parte, la notazione
complessa rende del tutto naturale lo studio di serie trigonometriche a
coefficienti complessi. Per queste ragioni, nell’ambito della teoria delle
serie trigonometriche le funzioni che considereremo saranno di regola a
valori complessi.
• (Ortogonalit`a)
`
E facile constatare che risulta (esercizio 1.3.2)
_
π
−π
cos nt cos mt dt =
_
_
_
2π se n = m = 0
π se n = m > 0
0 se n ,= m,
_
π
−π
sin nt sin mt dt =
_
π se n = m > 0
0 se n ,= m oppure n = m = 0,
_
π
−π
cos nt sin mt dt = 0 ∀m, n ∈ N;
Similmente si ha (esercizio 1.3.3)
_
π
−π
e
ikt
e
−iht
dt =
_
2π se k = h
0 se k ,= h.
313
Ci` o significa che la famiglia ¦e
ikt
¦
k∈Z
`e costituita da funzioni mutua-
mente ortogonali rispetto al prodotto scalare complesso di L
2
(π, π; C)
¸f, g¸
2
=
_
π
−π
f(t)g(t) dt, f, g ∈ L
2
([−π, π], C),
mentre il sistema trigonometrico ¦cos nt, sin nt¦
n∈N
`e costituito da fun-
zioni mutuamente ortogonali sia rispetto al prodotto scalare precedente,
sia rispetto al prodotto scalare reale di L
2
(−π, π; R)
¸f, g¸
2
=
_
π
−π
f(t)g(t) dt, f, g ∈ L
2
([−π, π], R).
Convergenza delle serie trigonometriche
Sotto quali ipotesi una serie trigonometrica `e convergente? La risposta na-
turalmente dipende da quale tipo di convergenza si cerca. Una semplice
condizione sufficiente per la convergenza uniforme `e la seguente:
Proposizione 3.14.1 Siano ¦a
n
¦
n∈N
e ¦b
n
¦
n∈N
+ successioni reali o comples-
se. Se si ha


n=1
[a
n
[ < ∞ e


n=1
[b
n
[ < ∞, allora la serie trigonometrica
a
0
2
+


n=1
(a
n
cos nt +b
n
sin nt) converge totalmente ed uniformemente in R;
in particolare la sua somma `e una funzione continua 2π-periodica.
Dimostrazione La tesi segue immediatamente osservando che per ogni
t ∈ R si ha
[a
0
[
2
+

n=1
[a
n
cos nt + b
n
sin nt[ ≤
[a
0
[
2
+

n=1
([a
n
[ +[b
n
[) < ∞.
Vi `e anche una condizione pi` u debole che `e necessaria per la convergenza
uniforme e che mostra lo stretto legame che deve intercorrere fra la somma
della serie e i suoi coefficienti.
Proposizione 3.14.2 Supponiamo che la serie
a
0
2
+

n=1
(a
n
cos nt + b
n
sin nt)
sia uniformemente convergente in R, e sia f la sua somma. Allora risulta
a
n
=
1
π
_
π
−π
f(t) cos nt dt ∀n ∈ N, b
n
=
1
π
_
π
−π
f(t) sin nt dt ∀n ∈ N
+
,
314
o equivalentemente
c
k
=
1

_
π
−π
f(t) e
−ikt
dt ∀k ∈ Z.
Dimostrazione Fissato m ∈ N, possiamo scrivere
1
π
_
π
−π
f(t) cos mt dt =
=
1
π
_
π
−π
a
0
2
cos mt dt +
1
π
_
π
−π

n=1
(a
n
cos nt + b
n
sin nt) cos mt dt.
La serie che compare nel secondo integrale `e uniformemente convergente su
R alla funzione f(t) cos mt, in quanto, per ipotesi, se p →∞ si ha
sup
t∈R
¸
¸
¸
¸
¸

n=p
(a
n
cos nt + b
n
sin nt) cos mt
¸
¸
¸
¸
¸
≤ sup
t∈R
¸
¸
¸
¸
¸

n=p
(a
n
cos nt + b
n
sin nt)
¸
¸
¸
¸
¸
→0.
Dunque, per il teorema 1.2.6, possiamo scambiare la serie con l’integrale,
ottenendo
1
π
_
π
−π
f(t) cos mt dt =
a
0
2
1
π
_
π
−π
cos mt dt+
+

n=1
a
n
1
π
_
π
−π
cos nt cos mt dt +

n=1
b
n
1
π
_
π
−π
sin nt cos mt dt,
da cui finalmente, in virt` u delle relazioni di ortogonalit`a,
1
π
_
π
−π
f(t) cos mt dt = a
m
∀m ∈ N
(si noti che questa relazione vale anche per m = 0 in virt` u della scelta,
apparentemente strana, di aver preso nella serie come termine costante
a
0
2
anzich´e a
0
).
In modo del tutto analogo, moltiplicando per sin mt, si trova che
1
π
_
π
−π
f(t) sin mt dt = b
m
∀m ∈ N
+
.
La relazione per i c
k
segue allo stesso modo, oppure utilizzando le relazioni
c
±n
=
1
2
(a
n
∓ib
n
).
315
Osservazione 3.14.3 Si noti l’analogia con le serie di potenze: vi `e una
stretta relazione fra la somma di una serie trigonometrica ed i suoi coeffi-
cienti; tale relazione `e di tipo integrale, e non differenziale come accade per
le serie di potenze. Questo fatto ha due conseguenze. La prima `e che se vo-
gliamo determinare una serie trigonometrica che converga (uniformemente)
ad una funzione continua assegnata, sar` a obbligatorio prendere quella che
ha per coefficienti i numeri
1
π
_
π
−π
f(t) cos mt dt e
1
π
_
π
−π
f(t) sin mt dt, il che
peraltro non garantisce la convergenza della serie stessa. La seconda conse-
guenza `e che, dal momento che tali coefficienti hanno senso per ogni funzione
di L
1
(−π, π), sar`a naturale considerare le serie trigonometriche associate a
funzioni di L
1
(−π, π) e non solo di C[−π, π].
Le considerazioni dell’osservazione precedente portano alla seguente
Definizione 3.14.4 Se f ∈ L
1
(−π, π), i numeri
a
n
=
1
π
_
π
−π
f(t) cos nt dt, n ∈ N; b
n
=
1
π
_
π
−π
f(t) sin nt dt, n ∈ N
+
,
si dicono coefficienti di Fourier di f relativi alla famiglia ¦1, cos nt, sin nt¦
n∈N
+,
mentre i numeri
c
k
=
1

_
π
−π
f(t)e
−ikt
dt, k ∈ Z,
si dicono coefficienti di Fourier di f relativi alla famiglia ¦e
ikt
¦
k∈Z
. La serie
a
0
2
+

n=1
(a
n
cos nt + b
n
sin nt) =

k∈Z
c
k
e
ikt
si chiama serie di Fourier di f.
Vale la pena di ribadire che se f `e una funzione reale, allora i suoi coefficienti
di Fourier a
n
e b
n
sono tutti reali, mentre i c
k
sono complessi. Per scrivere la
serie di Fourier di una funzione f reale, nel calcolo dei coefficienti di Fourier
la scelta dell’una o dell’altra famiglia di funzioni ortogonali `e indifferente;
l’unico “vantaggio” che si ha con l’uso del sistema dei seni e coseni `e che i
calcoli non coinvolgono numeri complessi. Lo svantaggio sta nel fatto che,
fissato un intero m, per determinare a
m
e b
m
occorre calcolare due integrali,
in luogo dell’(essenzialmente) unico integrale richiesto per trovare c
±m
.
316
Osservazione 3.14.5 Se f `e una funzione pari, ossia f(−x) = f(x) per
ogni x ∈ [−π, π], si vede immediatamente che i coefficienti b
n
, relativi ai
seni, sono tutti nulli, mentre per gli a
n
, relativi ai coseni, si ha
a
n
=
2
π
_
π
0
f(t) cos nt dt.
Dunque la serie di Fourier di una funzione pari `e formata da soli coseni.
Similmente, se f `e dispari, cio`e f(−x) = −f(x) per ogni x ∈ [−π, π], gli a
n
sono tutti nulli mentre i b
n
diventano
b
n
=
2
π
_
π
0
f(t) sin nt dt.
Dunque la serie di Fourier di una funzione dispari `e formata da soli seni.
Questi sono casi in cui l’uso del sistema ¦cos nx, sin nx¦ pu` o risultare pi` u
vantaggioso rispetto all’uso delle esponenziali ¦e
ikt
¦.
Propriet`a di miglior approssimazione
Fissiamo una funzione f ∈ L
2
(−π, π) e siano ¦a
n
, b
n
¦ i suoi coefficienti di
Fourier rispetto al sistema trigonometrico. Come si `e osservato, e cos`ı come
avviene per le serie di Taylor, non `e detto che la serie di Fourier di f sia con-
vergente, ed anche in caso di convergenza non `e detto che la sua somma sia
f, nemmeno quasi ovunque. Tuttavia le serie di Fourier, in quanto tali, go-
dono di alcune importanti propriet` a metriche nello spazio L
2
(−π, π), munito
del suo prodotto scalare naturale ¸f, g¸
2
=
_
π
−π
f(t)g(t) dt (ma se g `e reale,
naturalmente, si ha g(t) = g(t)) e della norma indotta |f|
2
=
_
_
π
−π
[f[
2
dt.
Introduciamo anzitutto la famiglia dei “polinomi trigonometrici”.
Definizione 3.14.6 Un polinomio trigonometrico `e una funzione della for-
ma
P(x) =
α
0
2
+
N

n=1

n
cos nx + β
n
sin nx) =
N

k=−N
γ
k
e
ikx
,
ove N ∈ N
+
, α
0
, α
1
, . . . , α
N
, β
1
, . . . , β
N
sono numeri reali o complessi e γ
±k
=
1
2

k
∓ iβ
k
). Il grado di P `e il massimo intero N tale che [α
N
[ + [β
N
[ > 0
(ovvero, [γ
N
[ +[γ
−N
[ > 0). Indichiamo con T la famiglia di tutti i polinomi
trigonometrici e con T
N
la classe dei polinomi trigonometrici di grado non
superiore a N.
317
Osserviamo che T
N
`e un sottospazio vettoriale di L
2
(−π, π) di dimensione
2N + 1; una base ortogonale `e data dalla famiglia ¦1, cos nx, sin nx¦
1≤n≤N
ovvero da ¦e
ikx
¦
[k[≤N
. Ci` o premesso, vale il seguente risultato, noto come
“propriet` a di miglior approssimazione”:
Teorema 3.14.7 Sia f ∈ L
2
(−π, π) ed indichiamo con S
N
la somma par-
ziale N-sima della serie di Fourier di f, ossia
S
N
(t) =
a
0
2
+
N

n=1
(a
n
cos nt + b
n
sin nt) =
N

k=−N
c
k
e
ikt
.
Allora si ha
|f −S
N
|
2
2
= min
P∈T
N
|f −P|
2
2
=
= |f|
2
2
−π
_
[a
0
[
2
2
+
N

n=1
([a
n
[
2
+[b
n
[
2
)
_
= |f|
2
2
−2π
N

k=−N
[c
k
[
2
.
Dimostrazione Sia
P(x) =
α
0
2
+
N

n=1

n
cos nx + β
n
sin nx)
un elemento di T
N
: allora possiamo scrivere
|f −P|
2
2
= |f|
2
2
+|P|
2
2
−2¸f, P¸
2
.
D’altra parte, per l’ortogonalit` a delle funzioni trigonometriche, si trova
|P|
2
2
=
_
π
−π
P(x) P(x) dx =
=
_
π
−π
_

0
[
2
4
+
N

n=1
([α
n
[
2
cos
2
nx +[β
n
[
2
sin
2
nx)
_
dx =
= π
_

0
[
2
2
+
N

n=1
([α
n
[
2
+[β
n
[
2
)
_
;
inoltre, per definizione di coefficienti di Fourier,
¸f, P¸
2
=
_
π
−π
f(x)
_
α
0
2
+
N

n=1

n
cos nx + β
n
sin nx)
_
dx =
= π
_
a
0
α
0
2
+
N

n=1
(a
n
α
n
+ b
n
b
n
)
_
.
318
Ne deduciamo
|f −P|
2
2
= |f|
2
2
+|P|
2
2
−2¸f, P¸
2
=
=|f|
2
2
+ π
_

0
[
2
2
+
N

n=1
([α
n
[
2
+[β
n
[
2
) −2
a
0
α
0
2
+
N

n=1
(2a
n
α
n
+ 2b
n
b
n
)
_
=
=|f|
2
2
+ π
_

0
−a
0
[
2
2
+
N

n=1
([α
n
−a
n
[
2
+[β
n
−b
n
[
2
)
_

−π
_
[a
0
[
2
2
+
N

n=1
([a
n
[
2
+[b
n
[
2
)
_
.
Pertanto la quantit`a |f − P|
2
2
`e minima quando α
n
= a
n
e β
n
= b
n
per
n = 0, 1, . . . , N, cio`e quando P = S
N
; ne segue la formula cercata.
Il calcolo relativo ai coefficienti c
k
si fa in modo del tutto analogo; in alternati-
va, il risultato per i c
k
si pu`o facilmente dedurre dalle relazioni c
±n
= a
n
∓ib
n
.
Osservazione 3.14.8 Se f ∈ L
2
(−π, π), il polinomio trigonometrico S
N
`e
dunque la proiezione ortogonale di f sul sottospazio T
N
.
Corollario 3.14.9 (disuguaglianza di Bessel) Se f ∈ L
2
(−π, π), allora
per ogni n ∈ N si ha
[a
0
[
2
2
+
N

n=1
([a
n
[
2
+[b
n
[
2
) = 2
N

k=−N
[c
k
[
2

1
π
_
π
−π
[f(x)[
2
dx.
Dimostrazione Basta osservare che, per il teorema e l’osservazione prece-
dente, le due somme finite coincidono con la quantit` a
1
π
_
|f|
2
2
−|f −S
N
|
2
2
_
,
ovviamente non superiore a
1
π
|f|
2
2
.
Completezza del sistema trigonometrico
I risultati del paragrafo precedente mostrano che la serie di Fourier `e il can-
didato migliore per ottenere approssimazioni di una funzione f dal punto
319
di vista della norma | |
2
. Mostreremo adesso che tali approssimazioni si
riescono effettivamente ad ottenere: proveremo cio`e che il sistema trigono-
metrico `e completo, nel senso che le combinazioni lineari finite di elementi
di questo sistema approssimano qualunque funzione di L
2
(−π, π) nel senso
sopra detto. Questo `e senza dubbio il risultato basilare della teoria delle serie
di Fourier.
Teorema 3.14.10 Per ogni f ∈ L
2
(−π, π) sia S
N
la somma parziale N-
sima della serie di Fourier di f. Allora
lim
N→∞
_
π
−π
[f(x) −S
N
(x)[
2
dx = 0.
Dimostrazione In virt` u della propriet` a di miglior approssimazione, baster` a
far vedere che, fissato ε > 0, esiste ν ∈ N tale che per ciascun k ≥ ν risulti,
per un opportuno polinomio trigonometrico T
k
di grado non superiore a k,
_
π
−π
[f(x) −T
k
(x)[
2
dx < ε.
Il punto chiave della dimostrazione consiste nel costruire una successione
¦Q
k
¦ di polinomi trigonometrici dotati delle seguenti propriet`a:
(a) Q
k
(t) ≥ 0 per ogni t ∈ R;
(b)
1

_
π
−π
Q
k
(t) dt = 1;
(c) per ogni δ > 0 si ha lim
k→∞
sup
δ≤[t[≤π
Q
k
(t) = 0, ossia la successione ¦Q
k
¦
converge uniformemente a 0 in [−π, −δ] ∪ [δ, π].
Una famiglia di polinomi trigonometrici che soddisfa questi requisiti `e ad
esempio la seguente:
Q
k
(t) = λ
k
_
1 + cos t
2
_
k
, t ∈ R,
320
ove λ
k
`e una costante che
si sceglie in modo che val-
ga la condizione (b). Si noti
che il grado di Q
k
`e uguale
a k, come si vede subito uti-
lizzando la relazione cos t =
1
2
(e
it
+e
−it
). La validit` a del-
la condizione (a) `e evidente;
inoltre, essendo
1
λ
k
=
1

_
π
−π
_
1 + cos t
2
_
k
dt =
1
π
_
π
0
_
1 + cos t
2
_
k
dt >
>
1
π
_
π
0
_
1 + cos t
2
_
k
sin t dt =
2
π(k + 1)
,
risulta
Q
k
(t) ≤
π(k + 1)
2
_
1 + cos δ
2
_
k
se δ ≤ [t[ ≤ π,
e dunque vale anche la condizione (c).
Costruiamo ora una successione ¦T
k
¦ di polinomi trigonometrici che, co-
me vedremo, approssimano f nel modo richiesto; la definiamo mediante un
integrale di convoluzione:
T
k
(t) =
1

_
π
−π
f(t −y)Q
k
(y) dy, t ∈ R,
ove f si intende prolungata a tutto R per periodicit`a. Poich´e Q
k
`e un
polinomio trigonometrico di grado k, dunque della forma
Q
k
(t) =

[n[≤k
a
nk
e
int
, t ∈ R,
si ha, grazie alla periodicit` a e all’esercizio 3.14.1,
T
k
(t) =

[n[≤k
1

_
π
−π
f(u)a
nk
e
in(t−u)
du =

[n[≤k
_
a
nk

_
π
−π
f(u)e
−inu
du
_
e
int
,
e pertanto T
k
`e a sua volta un polinomio trigonometrico di grado non supe-
riore a k.
321
Valutiamo la differenza |f −T
k
|
2
2
. Si ha
|f −T
k
|
2
2
=
_
π
−π
¸
¸
¸
¸
f(t) −
1

_
π
−π
f(t −y)Q
k
(y) dy
¸
¸
¸
¸
2
dt ≤

1

2
_
π
−π
__
π
−π
[f(t) −f(t −y)[Q
k
(y) dy
_
2
dt.
Applichiamo la disuguaglianza di H¨ older nell’integrale pi` u interno, con espo-
nenti p = q = 2, alle funzioni [f(t) −f(t −y)[Q
k
(y)
1/2
e Q
k
(y)
1/2
: si ottiene,
essendo
_
π
−π
Q
k
(y) dy = 2π,
|f −T
k
|
2
2

1

_
π
−π
_
π
−π
[f(t) −f(t −y)[
2
Q
k
(y) dydt =
=
1

_
π
−π
_
[y[≤δ
[f(t) −f(t −y)[
2
Q
k
(y) dydt +
+
1

_
π
−π
_
δ<[y[≤π
[f(t) −f(t −y)[
2
Q
k
(y) dydt = I + II,
ove δ ∈]0, π[ `e un numero fissato che preciseremo fra poco. Adesso notiamo
che, in virt` u del teorema di Tonelli e dell’esercizio 3.14.1,
II =
1

_
π
−π
_
δ<[y[≤π
[f(t) −f(t −y)[
2
Q
k
(y) dydt ≤

1
π
_
δ<[y[≤π
Q
k
(y)
__
π
−π
[f(t)[
2
dt +
_
π
−π
[f(t −y)[
2
dt
_
dy ≤

2
π
|f|
2
2
_
δ<[y[≤π
Q
k
(y) dy.
Poich´e Q
k
→0 uniformemente nell’insieme ¦δ ≤ [y[ ≤ π¦, in corrispondenza
di ε esiste k
δ,ε
∈ N tale che
II ≤ ε ∀k ≥ k
δ,ε
.
Per quanto riguarda il termine I, si pu` o scrivere
I =
1

_
[y[≤δ
Q
k
(y)
_
π
−π
[f(t) −f(t −y)[
2
dtdy.
322
A questo punto invochiamo la continuit`a delle traslazioni rispetto alla norma
| |
2
(esercizio 3.13.10), e deduciamo che in corrispondenza di ε esiste δ
ε
> 0
tale che
_
π
−π
[f(t) −f(t −y)[
2
dt < ε ∀y ∈]0, δ
ε
].
Ne segue
I =
1

_
[y[≤δ
__
π
−π
[f(t) −f(t −y)[
2
dt
_
Q
k
(y) dy ≤

ε

_
[y[≤δ
Q
k
(y) dy ≤ ε ∀δ ∈]0, δ
ε
],
ed in definitiva, scelto δ = δ
ε
, otteniamo
|f −T
k
|
2
2
≤ I + II < 2ε ∀k ≥ k
δε,ε
= k
t
ε
.
Ci` o prova la tesi.
Corollario 3.14.11 (identit`a di Bessel) Per ogni f ∈ L
2
(−π, π) vale l’u-
guaglianza
[a
0
[
2
2
+

n=1
([a
n
[
2
+[b
n
[
2
) = 2

k∈Z
[c
k
[
2
=
1
π
_
π
−π
[f(t)[
2
dt.
Dimostrazione Per f, qualunque sia N ∈ N, vale il risultato dell’osserva-
zione 3.14.8: se N →∞, tenuto conto del teorema 3.14.10, otteniamo la tesi.
Corollario 3.14.12 (identit`a di Parseval) Per ogni f, g ∈ L
2
(−π, π), det-
ti a
n
, b
n
, c
k
e α
n
, β
n
, γ
k
i coefficienti di Fourier di f e g rispetto alle famiglie
¦cos nx, sin nx¦ e ¦e
ikx
¦, vale l’uguaglianza
a
o
α
0
2
+

n=1
(a
n
α
n
+ b
n
β
n
) = 2

k∈Z
c
k
γ
k
=
1
π
_
π
−π
f(t)g(t) dt.
Dimostrazione Anzitutto, le serie sono assolutamente convergenti in virt` u
della disuguaglianza di Cauchy-Schwarz nello spazio
2
e dell’identit` a di Bes-
sel. Applicando questa identit` a a f ± g e f ± ig, ed osservando che tali
323
funzioni hanno per coefficienti di Fourier i numeri a
n
±α
n
, b
n
±β
n
e a
n
±iα
n
,
b
n
±iβ
n
, si ha poi
1
π
_
π
−π
f(t)g(t) dt =
1

_
π
−π
_
[f(t) + g(t)[
2
−[f(t) −g(t)[
2
¸
dt +
+
i

_
π
−π
_
[f(t) + ig(t)[
2
−[f(t) −ig(t)[
2
¸
dt =
=
1
4
_
[a
0
+ α
0
[
2
2
+

n=1
_
[a
n
+ α
n
)[
2
+[b
n
+ β
n
[
2
¸


[a
0
−α
0
[
2
2
+

n=1
_
[a
n
−α
n
[
2
+[b
n
−β
n
[
2
¸
_
+
+
i
4
_
[a
0
+ iα
0
[
2
2
+

n=1
_
[a
n
+ iα
n
)[
2
+[b
n
+ iβ
n
[
2
¸


[a
0
−iα
0
[
2
2
+

n=1
_
[a
n
−iα
n
[
2
+[b
n
−iβ
n
[
2
¸
_
=
=
a
0
α
0
2
+

n=1
(a
n
α
n
+ b
n
β
n
).
Il risultato per i coefficienti c
k
, γ
k
si prova in modo del tutto analogo, oppure
si ricava dalle relazioni c
±n
= a
n
∓ib
n
, γ
±n
= α
n
∓iβ
n
.
Corollario 3.14.13 (lemma di Riemann-Lebesgue) Se f ∈ L
2
(−π, π),
allora
lim
n→∞
a
n
= lim
n→∞
b
n
= lim
[k[→∞
c
k
= 0.
Dimostrazione Banale conseguenza della convergenza delle serie

k∈Z
[c
k
[
2
e


n=1
([a
n
[
2
+[b
n
[
2
).
Si confronti questo risultato con quello dell’esercizio 3.13.18.
Esempio 3.14.14 Consideriamo la funzione
f(x) = sgn(x)
π −[x[
2
, x ∈ [−π, π]
(ove sgn(x) vale 1 per x > 0, −1 per x < 0 e 0 per x = 0). Dato che f `e
dispari, si ha
a
n
=
1
π
_
π
−π
f(x) cos nx dx = 0 ∀n ∈ N,
324
mentre, integrando per parti, si trova facilmente
b
n
=
1
π
_
π
−π
f(x) sin nx dx =
2
π
_
π
0
π −x
2
sin nx dx =
1
n
∀n ∈ N
+
.
Quindi la serie di Fourier di f, di soli seni, `e

n=1
sin nx
n
.
Dall’identit` a di Bessel ricaviamo

n=1
b
2
n
=
1
π
_
π
−π
f(t)
2
dt =
2
π
_
π
0
_
π −t
2
_
2
dt =
π
2
6
,
e dunque

n=1
1
n
2
=
π
2
6
.
Convergenza puntuale delle serie di Fourier
Uno dei pi` u celebri e importanti risultati sulla convergenza delle serie di
Fourier `e quello di Lennart Carleson, che nel 1966 dimostr` o che la serie di
Fourier di un’arbitraria funzione f ∈ L
2
(−π, π) converge quasi ovunque alla
325
funzione stessa. Il risultato di Carleson pose fine a pi` u di mezzo secolo di
congetture e tentativi, nel corso dei quali vennero esibiti svariati esempi di
funzioni continue la cui serie di Fourier, effettivamente, converge soltanto
quasi ovunque, e di funzioni sommabili (ma non di quadrato sommabile!) la
cui serie di Fourier addirittura non converge in alcun punto.
Sotto ipotesi ragionevolmente blande su f, comunque, la convergenza pun-
tuale in [−π, π] `e assicurata dal seguente classico risultato: esso naturalmen-
te non riguarda classi di funzioni appartenenti a L
2
, ma singole funzioni di
quadrato sommabile.
Teorema 3.14.15 (di Dirichlet) Sia f : R →R una funzione 2π-periodica
tale che [f[
2
sia sommabile in (−π, π). Se in un punto x ∈ [−π, π] esistono
finiti i limiti destro e sinistro di f:
f(x
+
) = lim
h→0
+
f(x + h), f(x

) = lim
h→0

f(x + h),
ed esistono finite anche la derivata destra e la derivata sinistra di f:
f
t
(x
+
) = lim
h→0
+
f(x + h) −f(x
+
)
h
, f
t
(x

) = lim
h→0

f(x + h) −f(x

)
h
,
allora la serie di Fourier di f `e convergente nel punto x e si ha
a
0
2
+

n=1
(a
n
cos nx + b
n
sin nx) =

k∈Z
c
k
e
ikx
=
f(x
+
) + f(x

)
2
.
Dimostrazione Prima di tutto scriviamo in maniera pi` u comoda la somma
parziale S
N
(x). Si ha con facili calcoli
S
N
(x) =
a
0
2
+
N

n=1
(a
n
cos nx + b
n
sin nx) =
=
1
π
_
π
−π
f(t)
_
1
2
+
N

n=1
(cos nt cos nx + sin nt sin nx)
_
dt =
=
1
π
_
π
−π
f(t)
_
1
2
+
N

n=1
cos n(t −x)
_
dt =
=
1

_
π
−π
f(t)D
N
(t −x) dt,
326
ove si `e introdotto il nucleo di Dirichlet D
N
(s) = 1+2

N
n=1
cos ns. Notiamo
che risulta
1

_
π
−π
D
N
(s) ds =
1
π
_
π
0
D
N
(s) ds = 1 ∀N ∈ N
+
;
inoltre si ha
D
N
(s) =
_
¸
¸
_
¸
¸
_
2N + 1 se s = 2kπ, k ∈ Z
sin(N +
1
2
)s
sin
s
2
se s ,= 2kπ, k ∈ Z,
come si vede sommando da 1 a N le relazioni
2 sin
s
2
cos ns =
_
sin
_
n +
1
2
_
s −sin
_
n −
1
2
_
s
¸
e dividendo poi per sin
s
2
.
Si ha dunque, utilizzando la 2π-periodicit`a
degli integrandi,
S
N
(x) =
1

_
π
−π
f(t)D
N
(t −x) dt =
=
1

_
π−x
−π−x
f(x + s)D
N
(s) ds =
1

_
π
−π
f(x + s)D
N
(s) ds,
da cui
S
N
(x) −
f(x
+
) + f(x

)
2
=
1

_
π
−π
f(x + s)D
N
(s) ds −
f(x
+
) + f(x

)
2
=
=
1
π
_
π
0
[f(x + s) −f(x
+
)]
sin(N +
1
2
)s
2 sin
s
2
ds +
+
1
π
_
0
−π
[f(x + s) −f(x

)]
sin(N +
1
2
)s
2 sin
s
2
ds.
Valutiamo il primo addendo all’ultimo membro (la stima del secondo `e com-
pletamente analoga e la ometteremo). Poich´e
lim
s→0
+
f(x + s) −f(x
+
)
2 sin
s
2
= lim
s→0
+
f(x + s) −f(x
+
)
s
= f
t
(x
+
),
327
fissato ε > 0 esiste δ ∈]0, π ∧ ε[ tale che
¸
¸
¸
¸
f(x + s) −f(x
+
)
2 sin
s
2
−f
t
(x
+
)
¸
¸
¸
¸
< ε ∀s ∈]0, δ[;
quindi
¸
¸
¸
¸
1
π
_
π
0
[f(x + s) −f(x
+
)]
sin(N +
1
2
)s
2 sin
s
2
ds
¸
¸
¸
¸


¸
¸
¸
¸
1
π
_
δ
0
_
f(x + s) −f(x
+
)
2 sin
s
2
−f
t
(x
+
)
_
sin
_
N +
1
2
_
s ds
¸
¸
¸
¸
+
+
[f
t
(x
+
)[
π
_
δ
0
¸
¸
¸
¸
sin
_
N +
1
2
_
s
¸
¸
¸
¸
ds +
+
¸
¸
¸
¸
1
π
_
π
δ
[f(x + s) −f(x
+
)]
sin Ns cos
s
2
+ cos Ns sin
s
2
2 sin
s
2
ds
¸
¸
¸
¸


ε +[f
t
(x
+
)[
π
ε +
¸
¸
¸
¸
1
π
_
π
δ
f(x + s) −f(x
+
)
2 tan
s
2
sin Ns ds
¸
¸
¸
¸
+
+
¸
¸
¸
¸
1
π
_
π
δ
f(x + s) −f(x
+
)
2
cos Ns ds
¸
¸
¸
¸
.
Il primo termine all’ultimo membro `e minore di C ε, con C costante oppor-
tuna. Il secondo e terzo termine sono gli N-simi coefficienti di Fourier (uno
relativo al seno, uno al coseno) delle due funzioni
g(s) =
_
_
_
f(x + s) −f(x
+
)
2 tan
s
2
se s ∈ [δ, π]
0 se s ∈ [−π, δ[,
h(s) =
_
_
_
f(x + s) −f(x
+
)
2
se s ∈ [δ, π]
0 se s ∈ [−π, δ[,
le quali appartengono a L
2
(−π, π); quindi sia il secondo che il terzo termine
sono infinitesimi per N → ∞ in virt` u del lemma di Riemann-Lebesgue. Se
ne conclude che esiste N
ε
∈ N
+
tale che
¸
¸
¸
¸
1
π
_
π
0
[f(x + s) −f(x
+
)]
sin(N +
1
2
)s
2 sin
s
2
ds
¸
¸
¸
¸
< 2C ε ∀N > N
ε
.
328
Stimando, in modo completamente analogo, l’altro integrale
¸
¸
¸
¸
1
π
_
0
−π
[f(x + s) −f(x

)]
sin(N +
1
2
)s
2 sin
s
2
ds
¸
¸
¸
¸
si ottiene ¸
¸
¸
¸
S
N
(x) −
f(x
+
) + f(x

)
2
¸
¸
¸
¸
< 4C ε ∀N > N
ε
,
cio`e la tesi.
Esempi 3.14.16 (1) Riprendiamo in esame la funzione dell’esempio 3.14.14:
f(x) = sgn(x)
π −[x[
2
, x ∈ [−π, π].
Questa funzione, prolungata a R per periodicit` a, verifica le ipotesi del teore-
ma di Dirichlet in tutti i punti di [−π, π], con
f(x
+
) + f(x

)
2
= f(x) ∀x ∈ [−π, π]
(anche nel punto di discontinuit`a 0). Quindi

n=1
sin nx
n
= sgn(x)
π −[x[
2
∀x ∈ [−π, π].
In particolare, scelto x = π/2, troviamo

k=1
(−1)
k
2k + 1
=
π
4
,
come gi` a sapevamo dallo sviluppo di Taylor dell’arcotangente, mentre sce-
gliendo x = π/3 si ricava
1 +
1
2

1
4

1
5
+
1
7
+
1
8

1
10

1
11
+ =

3

3
.
(2) Consideriamo la restrizione a [0, π] della funzione dell’esempio (1):
g(x) =
π −x
2
, x ∈ [0, π].
329
Di questa funzione possiamo ottenere tre sviluppi in serie trigonometrica
distinti, tutti e tre convergenti. Se prolunghiamo f in modo dispari all’in-
tervallo [−π, π], otteniamo la funzione dispari f dell’esempio 3.14.14, la cui
serie di Fourier `e di soli seni e converge in ogni punto a f(x):

n=1
sin nx
n
= sgn(x)
π −[x[
2
∀x ∈ [−π, π].
Se prolunghiamo g a [−π, π] in modo pari, otteniamo la funzione
h(x) =
π −[x[
2
, x ∈ [−π, π] :
per essa tutti i coefficienti b
n
sono nulli, cosicch´e la sua serie di Fourier `e di
soli coseni; per i suoi coefficienti a
n
si trova
a
0
=
2
π
_
π
0
h(t) dt =
π
2
,
ed anche, integrando per parti,
a
n
=
2
π
_
π
0
h(t) cos nt dt =
(−1)
n
−1
πn
2
=
_
0 se n `e pari

2
πn
2
se n `e dispari.
Il teorema di Dirichlet `e applicabile in tutti i punti e si ha
π
4

k=0
2 cos(2k + 1)x
π(2k + 1)
2
=
π −[x[
2
∀x ∈ [−π, π].
Infine, possiamo sviluppare la funzione f, pensata prolungata a R come fun-
zione periodica di periodo T = π, in serie di Fourier rispetto al sistema
330
¦cos 2nt, sin 2nt¦
n∈N
. In questo caso f non `e n´e pari n´e dispari: con facili
calcoli si vede che
b
n
=
2
π
_
π
0
π −u
2
sin 2nu du =
1
2n
∀n ∈ N
+
,
mentre
a
0
=
2
π
_
π
0
π −u
2
du =
π
2
, a
n
=
2
π
_
π
0
π −u
2
cos 2nu du = 0 ∀n ∈ N
+
.
Pertanto, dal teorema di Dirichlet, che
`e applicabile, troviamo
π
4
+

n=1
sin 2nu
2n
=
_
π−x
2
se x ∈]0, π[
π
4
se x = 0, π.
In definitiva, per x ∈]0, π[ abbiamo i tre
sviluppi convergenti
π −x
2
=

n=1
sin nx
n
=
π
4

2
π

k+0
cos(2k + 1)x
(2k + 1)
2
=
π
4
+
1
2

n=1
sin 2nx
n
.
Convergenza uniforme di polinomi trigonometrici
Se f : R → R `e una funzione continua 2π-periodica, come sappiamo il
teorema di Dirichlet non assicura che la sua serie di Fourier converga a f
puntualmente, e tanto meno uniformemente. Tuttavia `e possibile costruire
una successione di polinomi trigonometrici che converga a f uniformemente.
Definizione 3.14.17 Per ogni N ∈ N il polinomio trigonometrico
F
N
(s) =
1
N + 1
N

n=0
D
n
(s), s ∈ R,
che `e la media aritmetica dei nuclei di Dirichlet, si chiama nucleo di Fej´er.
331
`
E facile verificare che
F
N
(s) =
_
_
_
N + 1 se s = 0
1
N+1
sin
2 N+1
2
s
sin
2 s
2
se s ,= 0;
infatti per s = 0, essendo D
n
(0) = 2n + 1, `e
facile vedere che
F
N
(0) =
1
N + 1
N

n=0
(2n + 1) = N + 1,
mentre per s ,= 0 possiamo scrivere
D
n
(s) =
sin
s
2
sin
_
n +
1
2
_
s
sin
2 s
2
=
=
cos ns −cos(n + 1)s
2 sin
2 s
2
,
da cui
F
N
(s) =
1
N + 1
N

n=0
cos nt −cos(n + 1)t
2 sin
2 s
2
=
=
1
N + 1
1 −cos(N + 1)s
2 sin
2 s
2
=
1
N + 1
sin
2 N+1
2
s
sin
2 s
2
;
dunque F
N
≥ 0. Osserviamo anche che
1

_
π
−π
F
N
(s) ds =
1
N + 1
N

n=0
1

_
π
−π
D
n
(s) ds = 1 ∀N ∈ N.
Vale allora il seguente risultato di convergenza uniforme:
Teorema 3.14.18 (di Fej´er) Sia f : R → R una funzione continua 2π-
periodica. Allora la successione di polinomi trigonometrici, detti somme di
Fej´er
T
N
(t) =
1

_
π
−π
f(t −s)F
N
(s) ds, t ∈ R,
converge uniformemente in R a f per N →∞.
332
Dimostrazione Sia ε > 0. La funzione f `e uniformemente continua su R,
essendo continua e periodica. Quindi esiste δ > 0 tale che [f(t) − f(σ)[ < ε
non appena [t −σ[ < δ. Pertanto si ha per ogni t ∈ [−π, π]
[f(t) −T
N
(t)[ =
1

¸
¸
¸
¸
_
π
−π
[f(t) −f(t −s)]F
N
(s) ds
¸
¸
¸
¸


1

_
δ
−δ
[f(t) −f(t −s)[F
N
(s) ds +
+
1

_
δ<[s[≤π
[f(t) −f(t −s)[F
N
(s) ds ≤

1

_
δ
−δ
εF
N
(s) ds +
2|f|

N + 1
_
δ<[s[≤π
sin
2 N+1
2
s
sin
2 s
2
ds ≤
≤ ε +
4π|f|

(N + 1) sin
2 δ
2
.
Dunque per N sufficientemente grande risulta
[f(t) −T
N
(t)[ ≤ 2ε ∀t ∈ [−π, π],
il che implica la tesi per periodicit`a.
Il caso di coefficienti decrescenti e infinitesimi
Quando una serie trigonometrica ha coefficienti reali, decrescenti e infinitesi-
mi, le sue propriet` a di convergenza sono particolarmente interessanti. Inizia-
mo questa descrizione con uno strumento fondamentale: l’identit`a di Abel,
gi` a incontrata nel corso del primo anno.
Proposizione 3.14.19 Siano ¦a
n
¦ e ¦b
n
¦ due successioni di numeri reali o
complessi. Fissati p, q ∈ N con q ≤ p e posto B
N
=

N
n=q
b
n
, risulta
N

n=p
a
n
b
n
= a
N
B
N
−a
p
B
p−1
+
N−1

n=p
(a
n
−a
n+1
)B
n
∀N > p,
ove B
p−1
= 0 nel caso in cui q = p.
333
Dimostrazione Basta osservare che
N

n=p
a
n
b
n
=
N

n=p
a
n
(B
n
−B
n−1
) =
N

n=p
a
n
B
n

N−1

n=p−1
a
n+1
B
n
=
= a
N
B
N
−a
p
B
p−1
+
N−1

n=p
(a
n
−a
n+1
)B
n
.
Un’immediata conseguenza di questa identit` a `e il seguente
Lemma 3.14.20 (di Abel) Siano ¦a
n
¦ e ¦b
n
¦ due successioni di numeri
reali. Posto B
N
=

N
n=0
b
n
, supponiamo che
(i) [B
N
[ ≤ M ∀N ∈ N, (ii) a
n
≥ a
n+1
≥ 0 e lim
n→∞
a
n
= 0.
Allora la serie Σa
n
b
n
converge e risulta
¸
¸
¸
¸
¸

n=0
a
n
b
n
¸
¸
¸
¸
¸
≤ Ma
0
.
Dimostrazione Poniamo s
N
=

N
n=0
a
n
b
n
. Dall’identit` a di Abel otteniamo
s
N
−a
N
B
N
=
N−1

n=0
(a
n
−a
n+1
)B
n
∀N ∈ N;
poich´e

n=0
[(a
n
−a
n+1
)B
n
[ =

n=0
(a
n
−a
n+1
)[B
n
[ ≤ M

n=0
(a
n
−a
n+1
) = Ma
0
,
si conclude che
∃ lim
N→∞
(s
N
−a
N
B
N
) ∈ R e
¸
¸
¸ lim
N→∞
(s
N
−a
N
B
N
)
¸
¸
¸ ≤ Ma
0
.
D’altra parte [a
N
B
N
[ ≤ Ma
N
→0, e dunque si ha la tesi.
Osservazione 3.14.21 Alla stessa conclusione si arriva quando [B
N
[ ≤ M
per ogni N ∈ N, a
n
≥ 0 per ogni n ∈ N e, in luogo della decrescenza di ¦a
n
¦,
si fa l’ipotesi che la serie


n=1
[a
n
−a
n+1
[ sia convergente.
334
Pi` u in generale, vale questo risultato:
Proposizione 3.14.22 Siano ¦a
n
¦ e ¦b
n
¦ due successioni di numeri reali,
con ¦a
n
¦ decrescente e infinitesima e b
n
≥ 0 per ogni n ∈ N. Posto B
N
=

N
n=0
b
n
, si ha

n=1
a
n
b
n
< ∞ ⇐⇒

n=1
(a
n
−a
n+1
)B
n
< ∞.
Dimostrazione (=⇒) Dalla positivit` a di a
N
B
N
e dall’identit` a di Abel
N−1

n=0
(a
n
−a
n+1
)B
n

N−1

n=0
(a
n
−a
n+1
)B
n
+ a
N
B
N
=
N

n=1
a
n
b
n
∀N ∈ N,
da cui la tesi per confronto.
(⇐=) Dall’identit`a di Abel sopra scritta segue che a
N
B
N
, essendo differenza
di due somme di termini positivi una delle quali convergente, ha limite λ ∈
[0, ∞]; se proviamo che λ ∈ R seguir` a la tesi. A questo scopo basta osservare
che
a
N
B
N
= B
N

n=N
(a
n
−a
n+1
) ≤

n=N
(a
n
−a
n+1
)B
n
;
ma per ipotesi l’ultimo membro `e infinitesimo per N →∞, e dunque λ = 0.
Osservazione 3.14.23 Si noti che dalla dimostrazione precedente segue
addirittura l’uguaglianza

n=1
a
n
b
n
=

n=1
(a
n
−a
n+1
)B
n
, ove B
n
=
n

k=1
b
k
,
per ogni successione reale decrescente e infinitesima ¦a
n
¦ e per ogni succes-
sione non negativa ¦b
n
¦.
Applicheremo il lemma di Abel alle due serie trigonometriche

n=1
a
n
cos nx,

n=1
a
n
sin nx,
335
supponendo naturalmente che ¦a
n
¦ sia una successione reale, decrescente e
infinitesima. Prima di tutto per`o ricordiamo due propriet`a delle somme di
funzioni trigonometriche che ci serviranno nel seguito:
¸
¸
¸
¸
¸
N

n=1
cos nt
¸
¸
¸
¸
¸
=
1
2
[D
N
(t) −1[ =
=
1
2
¸
¸
¸
¸
¸
_
sin
_
N +
1
2
_
t
sin
t
2
−1

¸
¸
¸
¸

1
2
_
1
¸
¸
sin
t
2
¸
¸
+ 1
_
, 0 < [t[ ≤ π,
¸
¸
¸
¸
¸
N

n=1
sin nt
¸
¸
¸
¸
¸
=
¸
¸
¸
¸
¸
cos
t
2
−cos
_
N +
1
2
_
t
2 sin
t
2
¸
¸
¸
¸
¸

1
¸
¸
sin
t
2
¸
¸
, 0 < [t[ ≤ π.
Teorema 3.14.24 Sia ¦a
n
¦ una successione reale, decrescente e infinitesi-
ma. Allora le due serie Σa
n
cos nx e Σa
n
sin nx convergono puntualmente in
[−π, 0[ ∪]0, π] (la seconda anche in 0) ed uniformemente in [−π, −δ] ∪ [δ, π]
per ogni δ ∈]0, π[.
Dimostrazione Consideriamo la prima serie. Fissato δ ∈]0, π[, applichiamo
il lemma di Abel alle successioni ¦a
n
¦
n≥ν
e ¦cos nx¦
n≥ν
, con ν ∈ N fissato e
[x[ ∈ [δ, π]. Poich´e
¸
¸
¸
¸
¸
N

n=ν
cos nx
¸
¸
¸
¸
¸

1
2
_
1
¸
¸
sin
x
2
¸
¸
+ 1
_
+
¸
¸
¸
¸
¸
ν−1

n=1
cos nx
¸
¸
¸
¸
¸

1
¸
¸
sin
δ
2
¸
¸
+ 1, [x[ ∈ [δ, π],
e la successione ¦a
n
¦ `e decrescente e infinitesima, dal lemma di Abel otte-
niamo che
¸
¸
¸
¸
¸

n=ν
a
n
cos nx
¸
¸
¸
¸
¸

_
1
sin
δ
2
+ 1
_
a
0
, [x[ ∈ [δ, π],
cosicch´e la serie Σa
n
cos nx converge uniformemente in [−π, −δ] ∪[δ, π]. Dal-
l’arbitrariet` a di δ segue anche la convergenza puntuale in [−π, 0[ ∪]0, π]. Nel
punto 0 invece la somma della serie `e un ben determinato valore in [0, ∞].
Per la seconda serie si procede in modo del tutto analogo; c’`e soltanto da
osservare che, ovviamente, la serie converge puntualmente anche per x = 0,
con somma 0.
336
Esempio 3.14.25 Grazie al teorema precedente, le due serie

n=2
cos nx
ln n
,

n=2
sin nx
ln n
definiscono due funzioni f e g periodiche, continue in [−π, π] ¸ ¦0¦. Tali fun-
zioni non appartengono a L
2
(−π, π), poich´e la serie

(ln n)
−2
`e divergente.
Invece le due serie

n=2
cos nx
n
α
,

n=2
sin nx
n
α
definiscono due funzioni periodiche, continue in [−π, π] ¸ ¦0¦, le quali appar-
tengono a L
2
(π, π) se e solo se α >
1
2
.
Ci chiediamo a questo punto se, fissata una successione reale ¦a
n
¦ decrescente
e infinitesima, la funzione
f(x) =

n=1
a
n
sin nx, x ∈ R,
sia o no un elemento di L
1
(−π, π) e se, in tal caso, la serie a secondo membro
sia o no la serie di Fourier di f, intendendo con ci` o che
a
n
=
1
π
_
π
−π
f(t) sin nt dt, n ∈ N
+
.
Una domanda analoga, naturalmente, va posta per la funzione
g(x) =

n=1
a
n
cos nx, x ∈ R.
Teorema 3.14.26 Sia ¦a
n
¦ una successione reale, decrescente e infinitesima
e sia f(x) =


n=1
a
n
sin nx. Allora
f ∈ L
1
(−π, π) ⇐⇒

n=1
a
n
n
< ∞.
In tal caso, la serie


n=1
a
n
sin nx converge a f in L
1
(−π, π) ed `e la serie
di Fourier di f.
337
Dimostrazione Come abbiamo visto, la serie


n=1
a
n
sin nx ha per somma
f(x) in ogni x ∈ R. Per 0 < [x[ ≤ π possiamo scrivere, grazie all’identit`a di
Abel,
N

n=1
a
n
sin nx = a
N
S
N
(x) +
N−1

n=1
(a
n
−a
n+1
)S
n
(x), N ∈ N
+
,
ove S
N
(x) =

N
n=1
sin nx. Poich`e, come si sa, [S
N
(x)[ ≤ [ sin
x
2
[
−1
, per
N →∞ si ricava
f(x) =

n=1
(a
n
−a
n+1
)S
n
(x).
Introduciamo il polinomio trigonometrico
T
N
(x) = S
N
(x) −
1
2
sin Nx =
=
cos
x
2
−cos
_
N +
1
2
_
x −sin Nx sin
x
2
2 sin
x
2
=
1 −cos Nx
2 tan
x
2
,
il quale rispetto a S
N
ha il vantaggio di essere non negativo per x ∈]0, π].
Possiamo allora scrivere
f(x) =

n=1
(a
n
−a
n+1
)T
n
(x) +
1
2

n=1
(a
n
−a
n+1
) sin nx.
La seconda serie a destra `e totalmente convergente, e quindi convergente
anche in L
1
(−π, π), in quanto


n=1
[a
n
− a
n+1
[ =


n=1
(a
n
− a
n+1
) = a
1
.
Per la prima serie a destra, invece, che `e a termini positivi per x ∈]0, π], si
ha l’uguaglianza
¸
¸
¸
¸
¸

n=1
(a
n
−a
n+1
)T
n
(x)
¸
¸
¸
¸
¸
=

n=1
(a
n
−a
n+1
)[T
n
(x)[,
quindi si pu`o integrare termine a termine, ottenendo che tale serie converge
in L
1
(−π, π) se e solo se

n=1
(a
n
−a
n+1
)|T
n
|
L
1
(−π,π)
< ∞.
338
Ora si vede facilmente che
|T
n
|
L
1
(−π,π)
= 2
_
π
0
1 −cos nx
2 tan
x
2
dx ≤ 2
_
π
0
1 −cos nx
x
dx =
= 2
_

0
1 −cos t
t
dt ≤ c U
n
,
ove U
n
=

n
k=1
1
k
, ed anche, con facili calcoli,
|T
n
|
L
1
(−π,π)
= 2
_
π
0
1 −cos nx
2 tan
x
2
dx ≥ 2
_ π
2
0
1 −cos nx
2 tan
x
2
dx ≥

π
2
_ π
2
0
1 −cos nx
x
dx =
π
2
_ nπ
2
0
1 −cos t
t
dt ≥ c U
n
;
quindi

n=1
(a
n
−a
n+1
)T
n
∈ L
1
(−π, π) ⇐⇒

n=1
(a
n
−a
n+1
)U
n
< ∞.
Utilizzando infine la proposizione 3.14.22, concludiamo che

n=1
(a
n
−a
n+1
)U
n
< ∞ ⇐⇒

n=1
a
n
n
< ∞.
Proviamo ora che se f ∈ L
1
(−π, π) risulta a
n
=
1
π
_
π
−π
f(t) cos nt dt per ogni
n ∈ N. Partiamo dalla relazione
N

n=1
a
n
sin nx = a
N
S
N
(x) +
N−1

n=1
(a
n
−a
n+1
)
_
T
n
(x) +
1
2
sin nx
_
, N ∈ N
+
.
Essendo


n=1
an
n
< ∞, ripetendo la dimostrazione della proposizione 3.14.22
si verifica che la funzione a
N
S
N
(x), avendo norma limitata dalla quantit`a
a
N
ln N, ossia a
N
U
N
, converge a 0 in L
1
(−π, π). Dato che la somma a destra
converge in L
1
(−π, π), lo stesso vale per la somma a sinistra: in altre parole,
f(x) =


n=1
a
n
sin nx nel senso di L
1
(−π, π) . Pertanto per ogni m ∈ N
+
si ha
1
π
_
π
−π
f(t) sin mt dt = lim
N→∞
N

n=1
a
n
1
π
_
π
−π
sin nt sin mt dt = a
m
.
339
Teorema 3.14.27 Sia ¦a
n
¦ una successione reale tale che
(i) a
n
¸0, (ii) n(a
n
−a
n+1
) →0, (iii)

n=1
n[a
n
−2a
n+1
+ a
n+2
[ < ∞
e sia f(x) =


n=1
a
n
cos nx. Allora f ∈ L
1
(−π, π), la serie


n=1
a
n
cos nx
`e la serie di Fourier di f, ma in generale tale serie non converge a f in
L
1
(−π, π).
Dimostrazione Come sappiamo, la somma della serie


n=1
a
n
cos nx `e
f(x) in R ¸ ¦2kπ¦
k∈Z
e vale +∞ in ¦2kπ¦
k∈Z
. Per 0 < [x[ ≤ π si ha,
applicando due volte l’identit`a di Abel,
N

n=1
a
n
cos nx = a
N
C
N
(x) +
N−1

n=1
(a
n
−a
n+1
)C
n
(x) =
= a
N
C
N
(x) + (a
N−1
−a
N
)G
N−1
(x) + H
N
(x),
dove si `e posto C
N
(x) =

N
n=1
cos nx =
1
2
(D
N
(x) −1) e
G
N
(x) =
N

n=1
C
n
(x), H
N
(x) =
N−2

n=1
(a
n
−2a
n+1
+ a
n+2
)G
n
(x).
Notiamo che si ha, come osservato in precedenza,
[C
N
(x)[ ≤
1
2
_
1
¸
¸
sin
x
2
¸
¸
+ 1
_
, 0 < [x[ ≤ π,
e di conseguenza
[G
N
(x)[ ≤
N
2
_
1
¸
¸
sin
x
2
¸
¸
+ 1
_
, 0 < [x[ ≤ π.
Dunque, per N →∞ si ricava a
N
C
N
(x) →0 e (a
N−1
−a
N
)G
N−1
(x) →0, da
cui
f(x) = lim
N→∞
H
N
(x) =

n=1
(a
n
−2a
n+1
+ a
n+2
)G
n
(x), 0 < [x[ ≤ π.
340
Osserviamo che questa serie converge nella norma di L
1
(−π, π): infatti
G
N
(x) =
N

n=1
1
2
(D
n
(x) −1) =
1
2
N

n=0
(D
n
(x) −1) =
N + 1
2
(F
N
(x) −1),
da cui
|G
N
|
1

N + 1
2
(|F
N
|
1
+ 1) ≤
N + 1
2
(2π + 1) ≤ 8N
e quindi
_
_
_
_
_

n=N
(a
n
−2a
n+1
+ a
n+2
)G
n
_
_
_
_
_
1

n=N
[a
n
−2a
n+1
+ a
n+2
[|G
n
|
1

≤ 8

n=N
n[a
n
−2a
n+1
+ a
n+2
[ →0 per N →∞.
Si conclude allora che la somma della serie


n=1
(a
n
− 2a
n+1
+ a
n+2
)G
n
(x),
cio`e f, appartiene a L
1
(−π, π).
Proviamo ora che la serie


n=1
a
n
cos nx, malgrado non ne sia stata provata
la convergenza in L
1
(−π, π), `e la serie di Fourier di f. Consideriamo le due
funzioni ausiliarie
g
N
(x) =
N

n=1
a
n
n
sin nx, g(x) =
_
x
−π
f(t) dt, x ∈ [−π, π].
Osserviamo che g
N
`e continua e 2π-periodica, e che possiamo scrivere
g
N
(x) =
_
x
−π
N

n=1
a
n
cos nt dt =
_
x
−π
[a
N
C
N
(t)+(a
N−1
−a
N
)G
N−1
(t)+H
N
(t)] dt.
Passiamo al limite per N →∞ in questa relazione: si ha
_
x
−π
a
N
C
N
(t) dt = a
N
N

n=1
sin nx
n
e questa quantit`a `e infinitesima, essendo il prodotto di a
N
per una serie che
converge puntualmente in virt` u del teorema 3.14.24; inoltre
¸
¸
¸
¸
_
x
−π
(a
N−1
−a
N
)G
N−1
(t) dt
¸
¸
¸
¸
≤ (a
N−1
−a
N
)|G
N
|
L
1
(−π,π)

≤ 8N(a
N−1
−a
N
) →0,
341
ed infine
_
x
−π
H
N
(t) dt →
_
x
−π
f(t) dt,
dato che H
N
→f in L
1
(−π, π). Pertanto
g
N
(x) =
N

n=1
a
n
n
sin nx →
_
x
−π
f(t) dt per N →∞,
ossia
g(x) =
_
x
−π
f(t) dt =

n=1
a
n
n
sin nx, x ∈ [−π, π].
Osserviamo adesso che la serie


n=1
an
n
sin nx converge uniformemente, in
virt` u del lemma che segue:
Lemma 3.14.28 Sia ¦b
n
¦ una successione reale decrescente e infinitesima.
Allora la serie


n=1
b
n
sin nx converge uniformemente in R se e solo se la
successione ¦nb
n
¦ `e infinitesima.
Dimostrazione (=⇒) Fissato N ≥ 2 si ha, posto k =
_
N
2
¸
,
Nb
N
2

N

n=k+1
b
n

1
sin
π
4
N

n=k+1
b
n
sin

2N
=

1
sin
π
4
¸
¸
¸
¸
¸
N

n=k+1
b
n
sin nx
¸
¸
¸
¸
¸
x=
π
2N
≤ c sup
x∈R
¸
¸
¸
¸
¸
N

n=k+1
b
n
sin nx
¸
¸
¸
¸
¸
,
e l’ultimo membro tende a 0 per N →∞.
(⇐=) Posto B
k
= sup
n≥k
nb
n
, si ha chiaramente b
k
¸0. Per 0 < [x[ ≤ π sia
N =
_
N
[x[
_
, cosicch´e
π
N+1
< [x[ ≤
π
N
. Allora per m > N possiamo scrivere
¸
¸
¸
¸
¸

n=m
b
n
sin nx
¸
¸
¸
¸
¸

¸
¸
¸
¸
¸
m+N−1

n=m
b
n
sin nx
¸
¸
¸
¸
¸
+
¸
¸
¸
¸
¸

n=m+N
b
n
sin nx
¸
¸
¸
¸
¸
= I + II;
d’altra parte
I ≤
m+N−1

n=m
b
n
n[x[ ≤ N[x[b
m
≤ πB
m
,
342
mentre, utilizzando ancora una volta l’identit` a di Abel,
II =
¸
¸
¸
¸
¸

n=m+N
(b
n
−b
n+1
)S
n
(x) −b
m+N
S
m+N−1
(x)
¸
¸
¸
¸
¸


2
¸
¸
sin
x
2
¸
¸
b
m+N


[x[
b
m+N
≤ 2π(N + 1)b
m+N
≤ 2πB
m
.
Pertanto, qualunque sia x ∈ [−π, π] ¸ ¦0¦, si ha
¸
¸
¸
¸
¸

n=m
b
n
sin nx
¸
¸
¸
¸
¸
≤ cB
m
→0 per m →∞,
e dunque la serie


n=1
b
n
sin nx converge uniformemente.
Possiamo ora concludere la dimostrazione del teorema 3.14.27. Poich´e g
n
converge uniformemente a g, anzitutto anche g `e 2π-periodica e, in parti-
colare, g(π) = 0. Inoltre per ogni m ∈ N
+
si ha, in virt` u del teorema di
Fubini,
1
π
_
π
−π
f(t) cos mt dt =
m
π
_
π
−π
f(t)
__
t
π
sin mxdx + (−1)
m
_
dt =
=
m
π
_
π
−π
__
π
x
f(t)dt
_
sin mx dx +
m
π
(−1)
m
g(π) =
=
m
π
_
π
−π
g(x) sin mx dx =
m
π
lim
N→∞
_
π
−π
g
N
(x) sin mx dx =
= lim
N→∞
N

n=1
a
n
m
π
_
π
π
sin nx sin mx dx =
N

n=1
a
n
δ
nm
= a
m
,
il che prova la tesi.
Osservazione 3.14.29 I teoremi 3.14.27 e 3.14.26 valgono anche quando
la successione ¦a
n
¦ `e infinitesima, ma decrescente soltanto definitivamen-
te: si tratter`a di considerare, per un opportuno indice N
0
≥ 1, le serie


n=N
0
a
n
cos nx e


n=N
0
a
n
sin nx, che differiscono solo per un numero finito
di termini (continui) da quelle originarie.
Esempio 3.14.30 Consideriamo la successione a
n
=
1
ln n
, n ≥ 2, e comple-
tiamo per comodit`a la definizione ponendo a
0
= a
1
= 0. Questa successione
`e (definitivamente) decrescente e infinitesima; inoltre essa verifica
lim
n→∞
n(a
n
−a
n+1
) = 0,
343
in quanto
n(a
n
−a
n+1
) =
nln
_
1 +
1
n
_
ln nln(n + 1)

1
(ln n)
2
.
Proviamo che si ha anche

n=1
n
¸
¸
¸
¸
1
ln n

2
ln(n + 1)
+
1
ln(n + 2)
¸
¸
¸
¸
< ∞:
possiamo scrivere, dopo facili calcoli,
1
ln n

2
ln(n + 1)
+
1
ln(n + 2)
=
_
n+1
n
_
x+1
x
d
2
dt
2
1
ln t
dtdx =
=
_
n+1
n
_
x+1
x
_
1
t
2
(ln t)
2
+
2
t
2
(ln t)
3
_
dtdx,
da cui ¸
¸
¸
¸
1
ln n

2
ln(n + 1)
+
1
ln(n + 2)
¸
¸
¸
¸

3
n
2
(ln n)
2
.
Se ne deduce che

n=1
n
¸
¸
¸
¸
1
ln n

2
ln(n + 1)
+
1
ln(n + 2)
¸
¸
¸
¸
≤ 3

n=1
1
n(ln n)
2
< ∞,
che `e quanto si voleva. Pertanto per le funzioni dell’esempio 3.14.25
f(x) =

n=2
cos nx
ln n
, g(x) =

n=2
sin nx
ln n
si hanno i fatti seguenti: g appartiene a C([−π, π] ¸¦0¦) ma non a L
1
(−π, π)
(perch´e

1
nln n
= +∞), la serie che definisce g `e la sua serie di Fourier, e la
convergenza `e solo in senso puntuale; invece f appartiene a C([−π, π] ¸¦0¦)∩
L
1
(−π, π), la serie che definisce f `e la sua serie di Fourier ma la convergenza
`e soltanto in senso puntuale. In tutti e due i casi la convergenza della serie
`e anche uniforme in [−π, −δ] ∪ [δ, π] per ogni δ ∈]0, π[ .
Esercizi 3.14
1. Si verifichi che se f : R → C `e una funzione T-periodica e sommabile
in [0, T], allora
_
a+T
a
f(t) dt =
_
T
0
f(t) dt ∀a ∈ R.
344
2. Nello spazio L
2
(−π, π) poniamo
P = ¦g ∈ L
2
(−π, π) : g `e pari¦, D = ¦h ∈ L
2
(−π, π) : h `e dispari¦,
ove le propriet` a di essere “pari” e “dispari” si intendono verificate
soltanto quasi ovunque. Si provi che:
(i) P, D sono sottospazi di L
2
(−π, π) fra loro ortogonali;
(ii) per ogni f ∈ L
2
(−π, π) esiste un’unica coppia di funzioni g, h tali
che
g ∈ P, h ∈ D, f(x) = g(x) + h(x) q.o. in [−π, π].
3. Calcolare la somma delle seguenti serie per [a[ < 1 e x ∈ R:
(i)

n=1
na
n
cos nx,

n=1
na
n
sin nx, (ii)

n=1
a
n
n
cos nx,

n=1
a
n
n
sin nx.
4. Sia f : [−π, π] → C una funzione derivabile, con f
t
∈ L
2
(−π, π), tale
che f(−π) = f(π). Detti c
k
e γ
k
i coefficienti di Fourier di f e f
t
rispetto alla famiglia ¦e
ikt
¦, si provi che
γ
k
= ik c
k
∀k ∈ Z.
Che cosa cambia se si elimina la condizione f(−π) = f(π)?
5. Sia f : [−π, π] → C una funzione derivabile, con f
t
∈ L
2
(−π, π), tale
che f(−π) = f(π). Si provi che alla serie di Fourier di f `e applicabile
la proposizione 3.14.1, e che dunque essa converge uniformemente a f.
6. Calcolare la somma delle serie

n=1
1
(2n + 1)
2
,

n=1
(−1)
n
n
2
.
7. Posto C
#
[−π, π] = ¦f ∈ C[−π, π] : f(−π) = f(π)¦, si provi che lo
spazio T dei polinomi trigonometrici `e denso nello spazio di Banach
(C
#
[−π, π], | |

).
[Traccia: Si dimostri che se g ∈ C
1
[−π, π] ∩C
#
[−π, π] la serie di Fou-
rier di g converge uniformemente, e poi si estenda il risultato, per den-
sit` a, alle g ∈ C
#
[−π, π] utilizzando (ad esempio) i polinomi di Bernstein
introdotti nella dimostrazione del teorema 1.7.9.]
345
8. (Disuguaglianza di Bernstein) Sia P(x) =

[k[≤N
c
k
e
ikx
un polinomio
trigonometrico di grado al pi` u N.
(i) Si mostri che P ha al pi` u 2N zeri in [0, 2π[.
(ii) Posto M = |P|

e L =
1
N
|P
t
|

, si verifichi che non `e restrittivo
ammettere che P
t
(0) = NL; si supponga che M < L, si definisca
S(x) = Lsin Nx −P(x) e si provi quanto segue:
(a) (−1)
r
S
_
(2r+1)π
2N
_
> 0 per 0 ≤ r ≤ 2N −1;
(b) S e S
t
hanno 2N zeri distinti in [0, 2π[;
(c) S
t
(0) = 0 e S
tt
(0) = 0;
(d) S
tt
ha pi` u di 2N zeri distinti in [0, 2π[.
(iii) Si concluda che L ≤ M e che quindi
|P
t
|

≤ N|P|

per ogni polinomio trigonometrico di grado al pi` u N.
9. Sia f ∈ L
1
(−π, π) tale che
_
π
−π
f(x) x
n
dx = 0 per ogni n ∈ N. Si provi
che f = 0.
10. Scrivere la serie di Fourier delle seguenti funzioni definite su [−π, π[:
(i) f
1
(x) = x
2
, (ii) f
2
(x) = e
x
, (iii) f
3
(x) = e
−x
,
(iv) f
4
(x) = 1, (v) f
5
(x) = (π −[x[)
2
, (vi) f
6
(x) = sgn(x).
11. Si scriva l’identit` a di Bessel per ciascuna delle funzioni del precedente
esercizio.
12. Sia f ∈ L
2
(0, T/2), ove T > 0 `e un numero fissato, e siano F
p
, F
d
i
prolungamenti pari e dispari di f all’intervallo [−T/2, T/2]. Si scrivano
le serie di Fourier di F
p
e F
d
relative al sistema ¦cos
2πnt
T
, sin
2πnt
T
¦, e
quella di f rispetto al sistema ¦cos
4πnt
T
, sin
4πnt
T
¦. In quale senso le tre
serie verificano la propriet` a di miglior approssimazione?
13. Si provi che se f ∈ L
2
(−π, π) allora, detti a
n
e b
n
i coefficienti di Fourier
di f, per ogni [a, b] ⊆ [−π, π] si ha
_
b
a
f(t) dt =
a
0
2
(b −a) +

n=1
a
n
(sin nb −sin na) −b
n
(cos nb −cos na)
n
.
346
14. Sia k ∈ N
+
e sia f ∈ C
k
(R) una funzione 2π-periodica. Si provi che

n=1
n
2k
([a
n
[
2
+[b
n
[
2
) < ∞.
15. Sia f : R → R una funzione 2π-periodica, i cui coefficienti di Fourier
a
n
e b
n
verifichino

n=1
n
k
([a
n
[ +[b
n
[) < ∞.
Si provi che f ∈ C
k
(R).
16. Sia f : R → R una funzione 2π-periodica. Si provi che f ∈ C

(R) se
e solo se lim
n→∞
n
m
([a
n
[ +[b
n
[) = 0 per ogni m ∈ N.
17. Sia f : R →R una funzione 2π-periodica e α-h¨olderiana, con α ∈]0, 1[ :
ci` o significa che esiste una costante M ≥ 0 tale che
[f(t) −f(s)[ ≤ M[t −s[
α
∀t, s ∈ R.
Si provi che la serie di Fourier di f converge puntualmente a f.
[Traccia: si ripeta, con le dovute modifiche, la dimostrazione del
teorema di Dirichlet.]
18. Si provi che se f `e una funzione 2π-periodica e α-h¨ olderiana, allora,
detti c
k
i suoi coefficienti di Fourier, esiste M ≥ 0 tale che [k[
α
[c
k
[ ≤ M
per ogni k ∈ Z.
19. Si considerino le seguenti serie trigonometriche:
(i)

n=0
2
−n
cos 4
n
x, (ii)

n=0
A
−n
sin 3
n
x, A ∈]1, 3[ ,
(iii)

n=0
3
−n
sin 3
n
x, (iv)

n=0
2
−n
sin 2πn!x.
Si verifichi anzitutto che tutte queste serie convergono uniformemente
in R; indichiamo con f
1
, f
2
, f
3
e f
4
le rispettive somme.
(i) Si provi che f
1
`e
1
2
-h¨ olderiana ma non `e α-h¨ olderiana per alcun
α >
1
2
.
347
(ii) Si mostri che, posto α = log
3
A, f
2
`e α-h¨ olderiana ma non `e β-
h¨ olderiana per alcun β > α.
(iii) Si mostri che f
3
`e α-h¨ olderiana per ogni α ∈]0, 1[ , ma non `e
lipschitziana.
(iv) Si provi infine che f
4
non `e α-h¨ olderiana per alcun α ∈]0, 1[ .
20. Siano f, g ∈ L
2
(−π, π); dopo averle prolungate a tutto R in modo
2π-periodico, si consideri l’ integrale di convoluzione
F(x) =
_
π
−π
f(x −t)g(t) dt, x ∈ [−π, π].
Determinare il legame fra i coefficienti di Fourier di F e quelli di f e g;
dedurne che la serie di Fourier di F converge uniformemente in [−π, π].
21. Scrivere la serie di Fourier delle funzioni
f(x) = sin ax, g(x) = cos ax, x ∈ [−π, π],
ove a `e un fissato numero reale non intero.
22. Utilizzando le serie di Fourier di f(x) = x
2
e di g(x) = x
4
, calcolare

n=1
1
n
4
,

n=1
1
n
6
,

n=1
1
n
8
.
23. Calcolare per x ∈ [−π, π] la somma della serie

k=0
sin(2k + 1)x
2k + 1
.
24. Provare la relazione
lim
N→∞
1
π
_
π
0
_
D
N
(t) −
sin Nt
t
_
dt = 0,
e dedurne che
lim
x→∞
_
x
0
sin t
t
dt = lim
n→∞
_

0
sin t
t
dt =
π
2
.
348
25. Scrivere la serie di Fourier della funzione
f(x) =
_

1
4
+
_
x +
1
2
_
2
se x ∈ [−1, 0]
1
4

_
x −
1
2
_
2
se x ∈ [0, 1]
relativa al sistema ¦cos πnt, sin πnt¦, e dedurne la relazione

k+0
(−1)
n
(2n + 1)
3
=
π
3
32
.
26. Sia f una funzione 2π periodica tale che la sua restrizione a ]0, 2π[ sia
decrescente. Si provi che i suoi coefficienti di Fourier b
n
relativi ai seni
sono non negativi.
27. Sia f una funzione 2π periodica tale che la sua restrizione a ]0, 2π[ sia
convessa. Si provi che i suoi coefficienti di Fourier a
n
relativi ai coseni
sono non negativi.
[Traccia: si utilizzi il fatto che i rapporti incrementali di f sono
crescenti.]
28. (Fenomeno di Gibbs) Sia f(x) = sgn(x)
π−[x[
2
, x ∈ [−π, π].
(i) Si provi che
S
N
(x) −f(x) =
_
x
0
D
N
(t) dt −
π
2
∀x ∈]0, π].
(ii) Se ne deduca che
S
N
_

2N + 1
_
−f
_

2N + 1
_

_
π
0
sin t
t
dt −
π
2
∀N ∈ N
+
.
(iii) Si concluda che per ogni δ > 0 si ha
lim
N→∞
_
sup
0<x≤δ
S
N
(x)
_
−f(0
+
) > 0.
(iv) Sia g una funzione limitata definita su [−π, π] e derivabile in
[−π, π] ¸ ¦ξ¦, con g
t
∈ L
2
(−π, π) e g(−π) = g(π); supponiamo
inoltre che nel punto ξ esistano finiti g(ξ
+
), g(ξ

), g
t

+
) e g
t


).
Si dimostri che la serie di Fourier di g presenta il fenomeno di
Gibbs nel punto ξ, vale a dire si provi che:
349
(a) la funzione
∆(x) = g(x) −
g(ξ
+
) −g
t


)
π
sgn(x −ξ)
π −[x −ξ[
2
`e continua in [−π, π];
(b) la serie di Fourier di ∆ converge uniformemente in [−π, π];
(c) le somme parziali S
N
della serie di Fourier di g verificano, per
ogni δ > 0,
lim
N→∞
sup
ξ<x<ξ+δ
[S
N
(x) −g(ξ
+
)[ > 0,
lim
N→∞
sup
ξ−δ<x<ξ
[S
N
(x) −g(ξ

)[ > 0.
29. Sia f una funzione 2π-periodica tale che f ∈ L
p
(−π, π), 1 ≤ p < ∞.
Si provi che le somme di Fej´er di f convergono a f in L
p
(−π, π).
30. Sia f ∈ L
1
(−π, π) e sia Σa
n
sin nx la sua serie di Fourier. Si provi che le
somme parziali

N
n=1
a
n
sin nx sono limitate da un’opportuna costante
M per ogni x ∈ R e per ogni N ∈ N
+
se e solo se la successione ¦na
n
¦
`e limitata.
3.15 Il metodo di separazione delle variabili
L’uso delle serie di Fourier permette di risolvere svariati problemi ai limiti
per equazioni alle derivate parziali che provengono dalla fisica matematica.
Consideriamo, come primo esempio, l’equazione del calore
∂u
∂t
= α
2

2
u
∂x
2
, x ∈]0, [, t > 0,
che descrive matematicamente il processo di conduzione del calore ed altri
fenomeni diffusivi. Data una sottile asta metallica di lunghezza , isolata
termicamente, se indichiamo con u(x, t) la temperatura dell’asta nel punto x
all’istante t, la funzione u soddisfa l’equazione sopra scritta; la costante α
2
`e il coefficiente di diffusione termica e dipende solo dal materiale costitutivo
dell’asta. Per conoscere la temperatura lungo l’asta ad ogni istante, occorre
conoscere:
350
(a) la distribuzione iniziale di temperatura:
u(x, 0) = f(x), x ∈ [0, ];
(b) le condizioni alle estremit`a dell’asta: essendo termicamente isolata, essa
ricever` a o ceder`a calore soltanto attraverso le sue estremit` a. Potre-
mo richiedere, ad esempio, che tali estremit` a vengano mantenute a
temperatura costante, quindi nulla rispetto ad un’opportuna unit` a di
misura:
u(0, t) = u(, t) = 0 ∀t > 0,
oppure che esse siano isolate, in modo da non poter essere attraversate
da flussi di calore:
∂u
∂x
(0, t) =
∂u
∂x
(, t) = 0 ∀t > 0;
altre condizioni ancora sono possibili.
Consideriamo dunque il problema di Cauchy-Dirichlet
_
¸
¸
¸
_
¸
¸
¸
_
∂u
∂t
= α
2

2
u
∂x
2
in ]0, []0, ∞[
u(0, t) = u(, t) = 0, t ≥ 0,
u(x, 0) = f(x), x ∈ [0, ],
ove f : [0, ] → R `e una funzione continua assegnata. Poich´e u rappresenta
una temperatura, ci interessano soluzioni reali, che richiederemo continue in
[0, ] [0, ∞[ e tali che
∂u
∂t
e

2
u
∂x
2
siano continue in ]0, []0, ∞[. Il metodo di
separazione delle variabili consiste nel ricercare una soluzione u della forma
speciale
u(x, t) = X(x) T(t),
con X : [0, ] →R e T : [0, ∞[→R funzioni regolari non nulle da determinare.
Imponendo che X T risolva l’equazione differenziale si trova
X(x)T
t
(t) = α
2
X
tt
(x)T(t) ∀x ∈]0, [, ∀t > 0,
da cui
X
tt
(x)
X(x)
=
T
t
(t)
α
2
T(t)
∀x ∈]0, [, ∀t > 0.
351
Poich´e il primo membro `e indipendente da t e il secondo `e indipendente da
x, esiste λ ∈ R tale che
X
tt
(x)
X(x)
= λ =
T
t
(t)
α
2
T(t)
∀x ∈]0, [, ∀t > 0;
inoltre dalle condizioni u(0, t) = u(, t) = 0 si ricava X(0) = X() = 0. La
funzione X deve dunque risolvere il problema
_
X
tt
(x) = λX(x), x ∈]0, [,
X(0) = X() = 0.
Questo problema ha sempre la soluzione nulla, ma per certi valori di λ
(gli autovalori del problema) esso ha soluzioni non nulle (i corrispondenti
autovettori): pi` u precisamente si ha la situazione seguente.
• Se λ = 0, la soluzione generale dell’equazione X
tt
= 0 `e
X(x) = Ax + B, A, B ∈ R,
ma dalle condizioni X(0) = X() = 0 segue subito A = B = 0.
• Se λ > 0, la soluzione generale `e
X(x) = Ae

λx
+ Be


λx
, A, B ∈ R,
e nuovamente le condizioni agli estremi A+B = 0, Ae

λ
+Be


λ
= 0
ci dicono che A = B = 0.
• Se λ < 0, la soluzione generale `e
X(x) = A cos

−λx + B sin

−λx, A, B ∈ R,
con le condizioni A = 0, Bsin

−λ = 0: quindi `e A = B = 0, oppure

−λ = kπ per qualche k ∈ Z ¸ ¦0¦, cio`e λ = −
n
2
π
2

2
per qualche
n ∈ N
+
, nel qual caso A `e nullo ma B `e arbitrario. Si trova allora la
soluzione, che denotiamo con X
n
,
X
n
(x) = B
n
sin
nπx

, x ∈ [0, ],
ove B
n
`e una costante arbitraria.
352
Adesso andiamo a risolvere la seconda equazione per i valori di λ che sono
stati selezionati, cio`e per λ = −
n
2
π
2

2
, n ∈ N
+
. La soluzione generale, che
denotiamo con T
n
, dell’equazione
T
t
(t) = −
n
2
π
2
α
2

2
T(t), t > 0,
`e data da
T
n
(t) = D
n
e

n
2
π
2
α
2
t

2
, t > 0,
ove D
n
`e una costante arbitraria. In definitiva, per ogni n ∈ N
+
abbiamo
una candidata soluzione per il nostro problema di Cauchy-Dirichlet, che `e
u
n
(x, t) = X
n
(t)T
n
(t) = C
n
e

n
2
π
2
α
2
t

2
sin
nπx

, (x, t) ∈]0, []0, ∞[,
ove la costante C
n
= B
n
D
n
`e arbitraria.
L’equazione differenziale `e certamente verificata, come pure la condizione agli
estremi. Occorre ora verificare la condizione iniziale u(x, 0) = f(x). Dato
che u
n
(x, 0) = C
n
sin
nπx

, `e naturale a questo punto utilizzare il principio di
sovrapposizione ed anzi estenderlo al caso di infiniti addendi; consideriamo
dunque la serie

n=1
u
n
(x, 0) =

n=1
C
n
sin
nπx

,
ed imponiamo che essa coincida con la serie di Fourier, di soli seni, relativa
al prolungamento dispari di f all’intervallo [−, ] ( si veda l’esempio 3.14.16
(2) e l’esercizio 3.14.12). La serie di Fourier di questo prolungamento `e

n=1
b
n
sin
nπx

, ove b
n
=
2

_

0
f(t) sin
nπt

dt ∀n ∈ N
+
.
La convergenza di questa serie verso f si ha, a priori, solo in L
2
(−, ), e non
in senso puntuale. Tuttavia, se si sceglie C
n
= b
n
per ogni n ∈ N
+
, almeno
formalmente la funzione
u(x, t) =

n=1
u
n
(x, t) =

n=1
b
n
e

n
2
π
2
α
2
t

2
sin
nπx

, (x, t) ∈ [0, ] [0, ∞[
risolve il problema di Cauchy-Dirichlet. Ma lo risolve davvero?
Per ogni fissato t > 0 la serie che definisce u(x, t) `e uniformemente convergen-
te in [0, ], in virt` u della presenza dell’esponenziale negativa. Anzi, sempre
353
grazie all’esponenziale, u appartiene a C

([0, ]]0, ∞[), e le sue derivate si
ottengono derivando termine a termine la serie di u(x, t); ne segue facilmente
che u risolve l’equazione differenziale u
t
−α
2
u
xx
in [0, ]]0, ∞[, e che verifica
le condizioni u(0, t) = u(, t) = 0 per ogni t > 0.
Per quanto riguarda la condizione u(x, 0) = f(x), essa sar` a certamente ve-
rificata se la serie di Fourier di f converge uniformemente in [0, ]: quindi
supponendo, per esempio, che f ∈ C
1
[0, ] con f(0) = f() = 0, otteniamo
che u `e continua in [0, ] [0, ∞[ ed `e davvero soluzione del problema di
Cauchy-Dirichlet.
Si pu` o anche provare che u `e l’unica soluzione del problema: infatti se v `e
un’altra soluzione (con la stessa regolarit`a di u) del medesimo problema, la
funzione w = u −v risolver` a
_
¸
¸
¸
_
¸
¸
¸
_
∂w
∂t
= α
2

2
w
∂x
2
in ]0, []0, ∞[
w(0, t) = w(, t) = 0, t ≥ 0
w(x, 0) = 0, x ∈ [0, ].
Allora per ogni t > 0, moltiplicando l’equazione per w(x, t) ed integrando
rispetto a x su [0, ], si ha
_

0
w(x, t)
∂w
∂t
(x, t) dx = α
2
_

0
w(x, t)

2
w
∂x
2
(x, t) dx,
ossia, dato che w(0, t) = w(, t) = 0,
1
2
_

0

∂t
w(x, t)
2
dx = −α
2
_

0
_
∂w
∂x
(x, t)
_
2
dx;
portando la derivata fuori dall’integrale (esercizio 3.10.15) si ricava
1
2
d
dt
_

0
w(x, t)
2
dx = −α
2
_

0
_
∂w
∂x
(x, t)
_
2
dx ≤ 0 ∀t > 0.
Perci` o la funzione t →
1
2
_

0
w(x, t)
2
dx `e decrescente e non negativa in [0, ∞[.
Ma per t = 0 essa `e nulla, e dunque
_

0
w(x, t)
2
dx = 0 ∀t ≥ 0.
354
La continuit` a di x →w(x, t) implica allora
w(x, t) = 0 ∀(x, t) ∈ [0, ] [0, ∞[,
cio`e u ≡ v.
Osservazione 3.15.1 In modo analogo si studia il problema di Cauchy-
Neumann
_
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
_
∂u
∂t
= α
2

2
u
∂x
2
in ]0, []0, ∞[
∂u
∂x
(0, t) =
∂u
∂x
(, t) = 0, t ≥ 0
u(x, 0) = f(x), x ∈ [0, ]
(si veda l’esercizio 3.15.1).
Il metodo di separazione delle variabili si applica anche allo studio di un
altro problema delle fisica matematica, relativo all’equazione delle onde, o di
D’Alembert

2
u
∂t
2
= c
2

2
u
∂x
2
, (x, t) ∈]0, []0, ∞[,
e cio`e la propagazione vibratoria, che riguarda l’analisi delle vibrazioni di
una corda tesa di lunghezza . La funzione u(x, t) rappresenta lo spostamento
verticale all’istante t del punto della corda di ascissa x, rispetto alla posizione
di riposo u = 0; la costante c
2
`e legata all’elasticit` a della corda, quindi alla
sua tensione oltre che al materiale costitutivo della corda stessa.
Per determinare i movimenti della corda al tempo t, occorre assegnare:
(a) posizione e velocit` a iniziali della corda, u(x, 0) e
∂u
∂t
(x, 0);
(b) la legge con cui si muovono le estremit`a della corda. Noi supporremo
che gli estremi siano fissi, u(0, t) = u(, t) = 0, ma solo per semplicit` a.
Vogliamo quindi determinare la soluzione del problema di Cauchy-Dirichlet
per l’equazione delle onde:
_
¸
¸
¸
¸
_
¸
¸
¸
¸
_

2
u
∂t
2
= c
2

2
u
∂x
2
in ]0, []0, ∞[
u(0, t) = u(, t) = 0, t ≥ 0
u(x, 0) = f(x),
∂u
∂t
(x, 0) = g(x), x ∈ [0, ],
355
ove f, g : [0, ] →R sono funzioni continue assegnate. Ci interessano soluzioni
reali di classe C
2
(]0, []0, ∞[), con u e u
t
continue in [0, ][0, ∞[. Cercando
soluzioni non nulle a variabili separate,
u(x, t) = X(x) T(t),
si trova, come nel caso precedente,
T
tt
(t)X(x) = c
2
T(t)X
tt
(x),
da cui
X
tt
(x)
X(x)
=
T
tt
(t)
c
2
T(t)
= λ, λ ∈ R opportuno.
Risolvendo il problema
_
X
tt
(x) = λX(x), x ∈]0, [
X(0) = X() = 0
si trova una soluzione non nulla soltanto per λ = −
n
2
π
2

2
, n ∈ N
+
, data da
X
n
(x) = B
n
sin
nπx

, B
n
∈ R;
risolvendo l’equazione
T
tt
(t) = −
n
2
π
2
c
2

2
T(t), t ∈]0, ∞[,
si trovano le soluzioni
T
n
(t) = P
n
cos
nπct

+ Q
n
sin
nπct

, P
n
, Q
n
∈ R.
Dunque una candidata soluzione del problema di Cauchy-Dirichlet `e
u
n
(x, t) =
_
C
n
cos
nπct

+ D
n
sin
nπct

_
sin
nπx

, C
n
, D
n
∈ R.
Dovendo imporre le condizioni iniziali u(x, 0) = f(x) e u
t
(x, 0) = g(x), `e
naturale considerare le serie di Fourier di f e di g di soli seni (dopo aver
prolungato entrambe le funzioni a [−, ] per disparit` a); se
f(x) =

n=1
b
n
sin
nπx

, g(x) =

n=1
β
n
sin
nπx

356
(ove l’uguaglianza vale nel senso della norma | |
2
), allora ponendo u(x, t) =


n=1
u
n
(x, t) e scegliendo
C
n
= b
n
, D
n
=

nπc
β
n
∀n ∈ N
+
si ha, almeno formalmente,
u(x, 0) =

n=1
b
n
sin
nπx

= f(x),
∂u
∂t
(x, 0) =

n=1
β
n
sin
nπx

= g(x),
e dunque il problema di Cauchy-Dirichlet ha come soluzione formale la fun-
zione
u(x, t) =

n=1
_
b
n
cos
nπct

+

nπc
β
n
sin
nπx

_
sin
nπx

.
La u `e davvero soluzione? Se imponiamo che

n=1
n
2
[b
n
[
2
< ∞,

n=1
n[β
n
[ < ∞,
allora `e facile vedere che u ha derivate seconde continue in [0, ] [0, ∞[ e
che risolve l’equazione differenziale e le condizioni ai limiti, cosicch´e risolve
davvero il problema. L’ipotesi sulla convergenza delle due serie `e certamente
soddisfatta, in virt` u dell’esercizio 3.14.5, se si suppone
f ∈ C
1
[0, ], f(0) = f() = 0,
g ∈ C
2
[0, ], g(0) = g() = 0.
Si noti che possiamo scrivere u(x, t) nella forma
u(x, t) =
1
2

n=1
_
b
n
_
sin

(x −ct) + sin

(x + ct)
_
+
+

nπc
β
n
_
cos

(x −ct) −cos

(x + ct)
_
_
.
Anche per questo problema si ha l’unicit` a della soluzione: infatti tutte le
soluzioni del problema sono necessariamente della forma α(x−ct) +β(x+ct)
357
(esercizio 3.15.2), per cui se v `e un’altra soluzione (regolare), la differenza
w = u −v risolve
_
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
_

2
w
∂t
2
= c
2

2
w
∂x
2
in ]0, []0, ∞[
w(0, t) = w(, t) = 0, t ≥ 0
w(x, 0) = 0,
∂w
∂t
(x, 0) = 0, x ∈ [0, ].
D’altra parte deve essere w(x, t) = α(x − ct) + β(x + ct) con α ∈ C
2
(] −
∞, [) ∩ C
1
(] − ∞, ]) e β ∈ C
2
(]0, ∞[) ∩ C
1
([0, ∞[), e dalle condizioni ai
limiti si ha
α(−ct) + β(ct) = 0, α( −ct) + β( + ct) = 0 ∀t ≥ 0,
α(x) + β(x) = 0, −cα
t
(x) + β
t
(x) = 0 ∀x ∈ [0, ].
Le prime due condizioni ci dicono che α e β sono 2-periodiche: infatti, se
ξ − ≥ 0 si ha β(ξ −) = −α( −ξ) = β( +ξ), ovvero, posto η = ξ − ≥ 0,
β(η) = −α(−η) = β(η + 2) ∀η ≥ 0;
da qui segue poi
α(−ξ) = −β(ξ) = −β(ξ + 2) = α(−ξ −2) ∀ξ ≥ 0,
ed anche, posto ζ = −ξ ≤ ,
α(ζ) = α(−ξ) = −β(+ξ) = −β(3+ξ) = α(−3−ξ) = α(ζ −2) ∀ζ ≤ .
Inoltre, derivando, si ottiene α
t
(x) + β
t
(x) = 0 per ogni x ∈ [0, ], da cui
segue α
t
≡ β
t
≡ 0 in [0, ]. Perci`o α e β sono funzioni costanti, con α(x) =
A = −β(x), per ogni x ∈ [0, ]. D’altra parte se ξ ∈ [0, ] troviamo α(−ξ) =
−β(ξ) = A, ossia α(x) = A per x ∈ [−, ] e analogamente β( + ξ) =
−α( −ξ) = −A, ossia β(x) = −A per x ∈ [0, 2]. Questi due fatti, insieme
alla 2-periodicit`a, ci dicono fnalmente che
α(x) = A ∀x ∈] −∞, ], β(x) = −A ∀x ∈ [0, ∞[ ,
e pertanto w = α + β = 0, ossia u ≡ v.
358
Esercizi 3.15
1. Si provi che se f ∈ C
1
[0, ] e se
a
0
2
+


n=1
a
n
cos
nπx

`e la serie di
Fourier relativa al prolungamento pari di f a [−, ], allora il problema
di Cauchy-Neumann
_
¸
¸
¸
¸
¸
_
¸
¸
¸
¸
¸
_
∂u
∂t
= α
2

2
u
∂x
2
in ]0, []0, ∞[
∂u
∂x
(0, t) =
∂u
∂x
(, t) = 0, t ∈ [0, ∞[
u(x, 0) = f(x), x ∈ [0, ]
ha l’unica soluzione
u(x, t) =
a
0
2
+

n=1
a
n
e

n
2
π
2
α
2
t

2
cos
nπx

.
2. Si provi che ogni soluzione dell’equazione delle onde

2
u
∂t
2
= c
2

2
u
∂x
2
, x ∈]a, b[ , t > 0,
`e della forma u(x, t) = α(x − ct) + β(x + ct) con α ∈ C
2
(] − ∞, b[) ∩
C
1
(] −∞, b]), β ∈ C
2
(]a, ∞[) ∩ C
1
([a, ∞[).
[Traccia: posto ξ = x − ct, η = x + ct, si verifichi che nelle variabili
(ξ, η) l’equazione differenziale assume la forma

2
v
∂ξ∂η
= 0...]
3. Siano f, g funzioni continue definite su [0, ], nulle agli estremi, e siano
F, G i rispettivi prolungamenti per disparit`a a [−, ]. Si verifichi che la
soluzione u del problema di propagazione vibratoria tale che u(x, 0) =
f(x) e u
t
(x, 0) = g(x) si pu` o scrivere nella forma
u(x, t) =
1
2
[F(x −ct) + F(x + ct)] +
1
2c
_
x+ct
x−ct
G(s) ds
(in accordo con l’esercizio 3.15.2.)
4. Utilizzando il metodo di separazione delle variabili si determini una
soluzione formale del problema di Dirichlet per l’equazione di Laplace
359
in un rettangolo [0, a] [0, b]:
_
¸
¸
¸
_
¸
¸
¸
_
∆u =

2
u
∂x
2
+

2
u
∂y
2
= 0 in ]0, a[]0, b[
u(x, 0) = u(x, b) = 0, x ∈ [0, a]
u(0, y) = 0, u(a, y) = f(y), y ∈ [a, b].
Si formulino poi ipotesi appropriate sul dato f affinch´e la soluzione u
sia non solo formale ma effettiva.
5. Si provi che se Ω ⊂ R
N
`e un arbitrario aperto limitato, allora per ogni
f ∈ C(Ω) il problema di Dirichlet
_
¸
_
¸
_
∆u =
N

i=1

2
u
∂(x
i
)
2
= 0 in Ω
u = f su ∂Ω
ha al pi` u una soluzione u ∈ C
2
(Ω) ∩ C(Ω).
[Traccia: se u, v sono soluzioni, allora occorre provare che w = u − v
`e nulla in Ω. Fissato x
0
∈ ∂Ω, si considerino le funzioni ϕ(x) = w(x) +
ε[x −x
0
[
2
N
, ψ(x) = w(x) −ε[x −x
0
[
2
N
e si provi che max

w e min

w
sono assunti in punti di ∂Ω. Se ne deduca che
max

w ≤ max
∂Ω
ϕ + εd
2
, min

w ≥ min
∂Ω
ϕ −εd
2
,
ove d `e il diametro di Ω, ossia d = sup¦[x − y[
N
: x, y ∈ Ω¦; se ne
deduca la tesi.]
6. Si consideri l’operatore di Laplace ∆ in B
R
= ¦(x, y) ∈ R
2
: x
2
+ y
2
<
R
2
¦.
(i) Posto x = r cos ϑ, y = r sin ϑ, si verifichi che, definendo v(r, ϑ) =
u(r cos ϑ, r sin ϑ), risulta
∆u(x, y) =

2
v
∂r
2
(r, ϑ) +
1
r
2

2
v
∂ϑ
2
(r, ϑ) +
1
r
∂v
∂r
(r, ϑ).
360
(ii) Data f ∈ C[0, 2π] con f(0) = f(2π), si ricerchi una soluzione del
problema di Dirichlet
_
_
_

2
v
∂r
2
+
1
r
2

2
v
∂ϑ
2
+
1
r
∂v
∂r
= 0 in ]0, R[[0, 2π]
v(R, ϑ) = f(ϑ), ϑ ∈ [0, 2π]
nella forma
v(r, ϑ) =
a
0
(r)
2
+

n=1
(a
n
(r) cos nϑ + b
n
(r) sin nϑ) ,
e si provi che i coefficienti di Fourier a
n
(r) e b
n
(r) verificano
l’equazione differenziale x
tt
(r) +
x

(r)
r

n
2
x(r)
r
2
= 0 in ]0, R[.
(iii) Si verifichi che la soluzione generale dell’equazione differenziale
precedente `e
x(r) =
_
c + d ln r se n = 0
cr
n
+ dr
−n
se n ≥ 1;
sfruttando la continuit` a di a
n
(r) e b
n
(r) per r = 0, si deduca che
a
0
(r) = A
0
, a
n
(r) = A
n
r
n
e b
n
(r) = B
n
r
n
e si determinino le
costanti A
0
, A
n
, B
n
utilizzando la condizione v(R, ϑ) = f(ϑ).
(iv) Dedurre che la soluzione v del problema di Dirichlet `e formalmente
esprimibile sotto forma di integrale di Poisson:
v(r, ϑ) =
1
π
_

0
f(α)
_
1
2
+

n=1
_
r
R
_
n
cos n(ϑ −α)
_
dα =
=
1

_

0
f(α)
R
2
−r
2
R
2
−2Rr cos(ϑ −α) + r
2
dα.
361
Capitolo 4
Variet`a
4.1 Curve
Come abbiamo visto nel capitolo 1, uno dei modi possibili di definire una
variet` a `e il seguente, fondato sul teorema del Dini (teorema 1.9.6):
Definizione 4.1.1 Un insieme M ⊆ R
N
`e una variet`a r-dimensionale di
classe C
k
(ove k ∈ N oppure k = ∞) se, per ogni suo punto x
0
, `e possibile
determinare un intorno U di x
0
in R
N
ed un’applicazione F : U →R
N−r
, di
classe C
k
, con DF(x
0
) di rango N −r, tale che
M ∩ U = ¦x ∈ U : F(x) = 0¦.
Una definizione pi` u precisa sar`a data nel paragrafo 4.10. In effetti studieremo
oggetti, che impropriamente denoteremo ancora variet` a, un po’ pi` u generali:
si tratter`a spesso di insiemi chiusi, in generale dotati di “bordo” in un senso
opportuno (si pensi, ad esempio, ad un segmento di R
N
contenente i propri
estremi, oppure ad una superficie cilindrica delimitata da due piani ad essa
perpendicolari, contenente le proprie circonferenze “estreme”).
Le prime variet` a che andiamo a studiare sono le pi` u semplici: quelle di di-
mensione 1, vale a dire le curve. L’idea intuitiva di curva si ha immaginando
un punto materiale che si muova nello spazio con un grado di libert` a: la
traiettoria che esso descrive `e una curva. Dal punto di vista matematico, la
definizione `e la seguente:
Definizione 4.1.2 Una curva in R
N
`e un’applicazione continua ϕϕϕ : I →R
N
,
ove I `e un intervallo di R, limitato o no. Diciamo che la curva `e di classe
362
C
k
(ove k ∈ N oppure k = ∞) se si ha ϕϕϕ ∈ C
k
(I, R
N
). L’insieme immagine
di ϕϕϕ,
Γ = ϕϕϕ(I) = ¦x ∈ R
N
: x = ϕϕϕ(t), t ∈ I¦,
si dice sostegno della curva ϕϕϕ; su di esso viene indotta un’ orientazione per
mezzo dell’orientazione naturale di I. Se in particolare I = [a, b], i punti ϕϕϕ(a)
e ϕϕϕ(b) sono il primo e il secondo estremo della curva; quando i due estremi
coincidono, cio`e ϕϕϕ(a) = ϕϕϕ(b), la curva si dice chiusa. Le N equazioni
x
i
= ϕ
i
(t), t ∈ I, i = 1, . . . , N
si dicono equazioni parametriche della curva: si dice anche che il sistema
x = ϕϕϕ(t), t ∈ [a, b], costituisce una parametrizzazione della curva.
Diciamo poi che una curva `e semplice se si ha ϕϕϕ(t) ,= ϕϕϕ(s) per ogni t, s ∈ I,
con uno almeno fra t e s interno ad I (e dunque la curva `e iniettiva in

I).
La curva `e detta regolare se ϕϕϕ `e di classe C
1
ed inoltre ϕϕϕ
t
(t) ,= 0 per ogni
t ∈ I.
Diciamo poi che una curva ϕϕϕ `e di classe C
1
a tratti, o regolare a tratti, se
ϕϕϕ `e di classe C
0
ed inoltre `e possibile decomporre I in un numero finito di
intervalli adiacenti I
1
, I
2
, . . . , I
m
in modo che ϕϕϕ[
I
h
sia una curva di classe C
1
,
o regolare, per h = 1, . . . , m.
Come vedremo, le propriet` a delle curve regolari, o regolari a tratti, si traduco-
no in propriet` a geometriche del sostegno, il quale, in queste ipotesi, almeno lo-
calmente (esclusi gli estremi) sar` a, come vedremo, una variet` a 1-dimensionale
in R
N
.
Esempi 4.1.3 (1) Sia ϕϕϕ(t) = x
0
+tv, t ∈ R, ove x
0
e v sono fissati elementi
di R
N
con v ,= 0. Il sostegno di ϕϕϕ `e la retta per x
0
parallela a v, percorsa
secondo il verso di v. La curva `e semplice, di classe C

e regolare, in quanto
ϕϕϕ
t
(t) = v per ogni t ∈ R. Se invece v = 0, la curva `e costante e il suo
sostegno `e ¦x
0
¦.
(2) Sia ϕϕϕ(t) = (cos mt, sin mt),
t ∈ [0, 2π], ove m ∈ N
+
`e fissato.
La curva `e di classe C

e chiu-
sa, il suo sostegno `e la circonfe-
renza unitaria di R
2
, percorsa m
volte in verso antiorario; la curva
`e semplice se e solo se m = 1.
363
Dato che
[ϕϕϕ
t
(t)[
2
=
_
m
2
(−sin mt)
2
+ m
2
(cos mt)
2
= m ∀t ∈ [0, 2π],
la curva `e regolare.
(3) (Curve cartesiane) Fissata f ∈ C[a, b], il grafico di f `e sostegno della
curva in R
2
di classe C
0
di equazioni parametriche
ϕϕϕ : x = x, y = f(x), x ∈ [a, b];
se f ∈ C
1
[a, b] la curva `e regolare, poich´e
[ϕϕϕ
t
(x)[
2
=
_
1 + f
t
(x)
2
> 0 ∀x ∈ [a, b].
(4) (Curve in coordinate polari) L’equazione
ρ = g(ϑ), ϑ ∈ I,
con g ∈ C(I) e g ≥ 0, descrive la curva ϕϕϕ in
R
2
di equazioni parametriche
x = g(ϑ) cos ϑ, y = g(ϑ) sin ϑ, ϑ ∈ I;
se inoltre g ∈ C
1
(I) e g > 0, oppure g
t
,= 0, la curva `e regolare, poich´e si
verifica facilmente che
[ϕϕϕ(ϑ)[
2
=
_
g
t
(ϑ)
2
+ g(ϑ)
2
> 0 ∀ϑ ∈ I.
Ad esempio l’equazione polare ρ = ϑ, ϑ ≥ 0, descrive una spirale infinita,
percorsa in verso antiorario, uscente dall’origine.
364
(6) Sia ϕϕϕ(t) = (t, [t[), t ∈ R. Questa `e una curva cartesiana, con sostegno il
grafico di f(x) = [x[, ed `e regolare a tratti ma non regolare. Infatti, sebbene
ϕϕϕ
t
(0) non esista, le restrizioni di ϕϕϕ alle due semirette ] −∞, 0] e [0, ∞[ sono
curve regolari, dato che f[
]−∞,0]
e f[
[0,∞[
sono funzioni di classe C
1
. Osser-
viamo che la curva ψψψ(τ) = (τ
3
, [τ[
3
), τ ∈ R, ha lo stesso sostegno di ϕϕϕ, ed `e
di classe C
1
; tuttavia ψ non `e regolare perch´e ψψψ
t
(0) = 0. Dunque, il sostegno
di una curva di classe C
1
pu` o contenere punti angolosi. Ci` o invece non pu`o
accadere, come vedremo, per le curve regolari.
L’idea geometrica di curva appare pi` u legata al sostegno che alla parame-
trizzazione: in sintonia con questa intuizione, introduciamo un’importante
relazione di equivalenza fra curve.
Definizione 4.1.4 (i) Siano I, J intervalli di R e siano ϕϕϕ : I → R
N
e
ψψψ : J → R
N
due curve di classe C
r
, con r ≥ 0. Diciamo che ϕϕϕ e ψψψ sono
equivalenti se esiste una funzione bigettiva p : J → I tale che p e p
−1
siano
di classe C
r
(dunque, se r ≥ 1, p `e un diffeomorfismo di classe C
r
) e che
risulti
ψψψ(τ) = ϕϕϕ(p(τ)) ∀τ ∈ J.
(ii) Supponiamo, in pi` u, che le curve ϕϕϕ e ψψψ siano chiuse. Diciamo che ϕϕϕ
e ψψψ sono equivalenti a tratti se esiste un numero finito m di sottointervalli
I
1
, . . . , I
m
di I e di sottointervalli J
1
, . . . , J
m
di J, tali che:
(a) I
1
, . . . , I
m
sono intervalli adiacenti la cui unione `e I, mentre J
1
, . . . , J
m
sono intervalli adiacenti la cui unione `e J;
(b) per h = 1, . . . , m le restrizioni ϕϕϕ[
I
h
e ψψψ[
J
h
sono curve fra loro equivalenti.
Si verifica facilmente che l’equivalenza fra curve, cos`ı come l’equivalenza a
tratti fra curve chiuse, costituisce una relazione di equivalenza nella classe di
tutte le curve di classe C
r
in R
N
. Inoltre, due curve chiuse equivalenti sono
anche equivalenti a tratti, mentre il viceversa non `e vero (si veda l’esempio
4.1.5 (4) che segue).
Osserviamo che due curve equivalenti, o equivalenti a tratti, hanno neces-
sariamente lo stesso sostegno; inoltre, dovendo essere p
t
(τ) ,= 0 per ogni
τ ∈ J, se ϕϕϕ `e regolare anche ogni curva ψψψ ad essa equivalente lo `e, dato che
ψψψ
t
(τ) = ϕϕϕ
t
(p(τ)) p
t
(τ). L’orientazione di ψψψ coincide con quella di ϕϕϕ se p
t
> 0
in J, `e l’opposta se p
t
< 0 in J.
365
Esempi 4.1.5 (1) La funzione p : [a, b] → [a, b] data da p(τ) = a + b − τ
`e bigettiva, con p, p
−1
di classe C

. Dunque ogni curva ϕϕϕ : [a, b] → R
N
`e
equivalente alla curva ψψψ(τ) = ϕϕϕ(a +b −τ), che ha verso opposto a quello di
ϕϕϕ. Si dice che ψψψ `e l’ opposta di ϕϕϕ.
(2) Le due curve del piano
ϕϕϕ(t) = (cos t, sin t), t ∈ [0, 2π], e ψψψ(τ) = (cos 2τ, sin 2τ), τ ∈ [0, 2π],
pur avendo lo stesso sostegno non sono equivalenti, perch´e la prima `e sem-
plice mentre la seconda no.
(3) Sia ϕϕϕ : [0, π] → R
2
, ϕϕϕ(t) = (cos t, sin t); il sostegno di ϕϕϕ `e la semicir-
conferenza Γ = ¦(x, y) : y ≥ 0, x
2
+ y
2
= 1¦. La curva cartesiana (di
verso opposto) ψψψ(x) = (x,

1 −x
2
), x ∈ [−1, 1], `e equivalente a ϕϕϕ come
curva di classe C
0
, ma non lo `e come curva di classe C
1
, perch´e ϕϕϕ `e di classe
C
1
mentre ψψψ no (si ha [ψψψ
t
(±1)[
2
= +∞). Il cambiamento di parametro `e
t = p(x) = arccos x, x ∈ [−1, 1], che non `e derivabile negli estremi.
(4) Le due curve regolari
ϕϕϕ(t) = (cos t, sin t), t ∈ [0, 2π],
ψψψ(τ) = (cos(τ + π), sin(τ + π)), τ ∈ [0, 2π],
pur essendo semplici e avendo lo stesso sostegno non sono equivalenti: infatti
si ha evidentemente ψψψ(τ) = ϕϕϕ(τ +π), ma il diffeomorfismo p(τ) = τ +π non
manda [0, 2π] in s´e. Le due curve sono per` o equivalenti a tratti, perch´e sono
chiuse ed inoltre ϕϕϕ[
[0,π]
`e equivalente a ψψψ[
[π,2π]
e ϕϕϕ[
[π,2π]
`e equivalente a ψψψ[
[0,π]
.
In effetti, affinch´e due curve regolari, semplici e chiuse ϕϕϕ : [a, b] → R
N
e
ψψψ : [c, d] →R
N
siano equivalenti (e non solo equivalenti a tratti) `e necessario
che risulti ϕϕϕ(a) = ϕϕϕ(b) = ψψψ(c) = ψψψ(d). Come vedremo, questa condizione `e
anche sufficiente.
Retta tangente a una curva regolare
Abbiamo gi` a osservato che le curve regolari, o regolari a tratti, hanno par-
ticolare interesse dal punto di vista geometrico: per esse, infatti, il vettore
derivata in ciascun punto ha un significato geometrico legato alla esistenza
della retta tangente al sostegno.
Sia ϕϕϕ : I →R
N
una curva regolare. Consideriamo due punti distinti t
0
, t
1
∈ I:
366
la retta passante per ϕϕϕ(t
0
) e ϕϕϕ(t
1
) ha equazioni parametriche
x = ϕϕϕ(t
0
) + (t −t
0
)
ϕϕϕ(t
1
) −ϕϕϕ(t
0
)
t
1
−t
0
, t ∈ R.
Facendo tendere t
1
a t
0
si ottiene la retta
limite
x = ϕϕϕ(t
0
) +ϕϕϕ
t
(t
0
)(t −t
0
), t ∈ R,
che, per definizione, si chiama retta tangente
a Γ = ϕϕϕ(I) nel punto ϕϕϕ(t
0
).
Questa definizione `e giustificata dal fatto che tale retta `e l’unica, fra tutte
quelle passanti per ϕ(t
0
), dunque della forma
x = ϕϕϕ(t
0
) +v (t −t
0
), t ∈ R,
per la quale risulti
[ϕϕϕ(t) −ϕϕϕ(t
0
) −v (t −t
0
)[
N
= o(t −t
0
) per t →t
0
;
infatti ci`o accade, per definizione di derivata, se e solo se v = ϕϕϕ
t
(t
0
).
Si noti che questa argomentazione ha senso se e solo se ϕϕϕ
t
(t
0
) ,= 0, e questo
`e il motivo per cui `e necessario supporre ϕϕϕ regolare. Il ragionamento fun-
ziona anche se ϕϕϕ `e regolare a tratti, pur di prendere t
0
interno ad uno dei
sottointervalli di regolarit` a: invece ϕϕϕ(t
0
), quando t
0
`e uno degli estremi di
tali intervalli, sar` a, in generale, un punto angoloso o una cuspide.
Il versore
T(t
0
) =
ϕϕϕ
t
(t
0
)
[ϕϕϕ
t
(t
0
)[
N
`e il versore tangente al sostegno di ϕϕϕ nel punto ϕϕϕ(t
0
), ed il suo verso ci
d` a l’orientazione della curva. Se ψψψ `e una curva equivalente a ϕϕϕ (anch’essa
regolare, quindi), e se ψψψ(τ
0
) = ϕϕϕ(t
0
), allora si ha
ψψψ
t

0
)
[ψψψ
t

0
)[
N
= ±
ϕϕϕ
t
(t
0
)
[ϕϕϕ
t
(t
0
)[
N
,
a seconda che ψψψ e ϕϕϕ abbiano versi uguali od opposti. Quindi, com’`e geome-
tricamente prevedibile, il versore tangente T in un dato punto del sostegno
dipende solo dal sostegno e dall’orientazione ad esso attribuita, e non dalla
particolare curva regolare con cui esso viene parametrizzato.
367
Osservazione 4.1.6 Sia F ∈ C
1
(A), ove A `e un aperto di R
2
, e consideria-
mo il luogo di zeri delle funzione F:
Z = ¦(x, y) ∈ A : F(x, y) = 0¦.
Supponendo Z ,= ∅ e ∇∇∇F(x, y) ,= 0 per ogni (x, y) ∈ Z, sappiamo dal teorema
del Dini che Z `e localmente grafico di una curva cartesiana regolare (esempio
4.1.3 (3)). Il versore normale a Z in un punto (x
0
, y
0
) ∈ Z `e dato, come si
sa, da
N = ±
∇∇∇F(x
0
, y
0
)
[∇∇∇F(x
0
, y
0
)[
2
;
pertanto il versore tangente a Z nello stesso punto `e
T = ±
_
F
y
(x
0
, y
0
)
[∇∇∇F(x
0
, y
0
)[
2
, −
F
x
(x
0
, y
0
)
[∇∇∇F(x
0
, y
0
)[
2
_
,
dove il segno dipende da come decidiamo di orientare Z.
Lunghezza di una curva
`
E possibile associare ad ogni curva ϕϕϕ : I →R
N
, in modo del tutto naturale,
la nozione di “lunghezza”, andando a misurarne il sostegno per mezzo di un
procedimento geometricamente assai intuitivo.
Consideriamo una suddivisione finita σ
dell’intervallo I mediante certi punti
t
0
< t
1
< . . . < t
k
. Se I = [a, b],
sceglieremo in particolare t
0
= a e
t
k
= b, mentre se I `e non limitato
o non chiuso non faremo alcuna altra
ipotesi sulla scelta dei punti. Poniamo
x
i
= ϕϕϕ(t
i
), i = 0, 1, . . . , k, e consideria-
mo la spezzata, o poligonale S
σ
di verti-
ci x
0
, x
1
, . . . , x
k
: ad essa evidentemente
attribuiamo come lunghezza il numero
(S
σ
) =
k

i=1
[x
i
−x
i−1
[
N
=
k

i=1
[ϕϕϕ(t
i
) −ϕϕϕ(t
i−1
)[
N
.
`
E chiaro che, infittendo la suddivisione σ, aumenter` a la quantit` a (S
σ
); pi` u
precisamente, per ogni coppia di suddivisioni σ
1
e σ
2
di I ne esiste una terza,
368
σ, che `e pi` u fine di entrambe: ad esempio quella costituita dall’unione dei
punti di σ
1
e di quelli di σ
2
. Per la nuova suddivisione σ si avr`a chiaramente
(S
σ
) ≥ max¦(S
σ
1
), (S
σ
2
)¦.
Siamo cos`ı indotti a formulare la seguente
Definizione 4.1.7 Sia ϕϕϕ : I → R
N
una curva. La lunghezza di ϕϕϕ `e il
numero non negativo, eventualmente infinito,
(ϕϕϕ) = sup
σ
(S
σ
),
ove l’estremo superiore `e fatto al variare di tutte le possibili suddivisioni finite
σ di I. Diciamo che ϕϕϕ `e rettificabile se ϕϕϕ ha lunghezza finita.
Questa definizione, sebbene intuitiva, `e alquanto scomoda, poich´e coinvol-
ge un estremo superiore fatto su un’infinit` a di possibili spezzate.
`
E facile
comunque verificare, sulla base di essa, che esistono curve continue non ret-
tificabili: ci`o pu` o accadere non solo quando l’intervallo I `e illimitato o non
chiuso, il che rende la cosa evidente (si pensi al caso della retta dell’esempio
4.1.3 (1)), ma anche quando I = [a, b]: si veda l’esercizio 4.1.4.
Per le curve di classe C
1
il calcolo della lunghezza `e semplificato da una
formula molto importante:
Teorema 4.1.8 Sia ϕϕϕ : I →R
N
una curva di classe C
1
. Allora la lunghezza
di ϕϕϕ `e data da
(ϕϕϕ) =
_
I
[ϕϕϕ
t
(t)[
N
dt.
In particolare, ogni curva di classe C
1
definita su un intervallo chiuso e
limitato `e rettificabile.
Dimostrazione (≤) Non `e restrittivo supporre che l’integrale a secondo
membro sia convergente. Sia σ una suddivisione finita di I mediante i punti
t
0
< t
1
< . . . < t
k
: allora
(S
σ
) =
k

i=1
[ϕϕϕ(t
i
) −ϕϕϕ(t
i−1
)
N
=
k

i=1
¸
¸
¸
¸
_
t
i
t
i−1
ϕϕϕ
t
(τ) dτ
¸
¸
¸
¸
N


k

i=1
_
t
i
t
i−1
[ϕϕϕ
t
(τ)[
N
dτ ≤
_
I
[ϕϕϕ
t
(τ)[
N
dτ;
369
quindi, per l’arbitrariet` a di σ, (ϕϕϕ) = sup
σ
(S
σ
) ≤
_
I
[ϕϕϕ
t
(τ)[
N
dτ.
(≥) Siccome l’intervallo I non `e in generale chiuso e limitato, cominciamo col
fissare un arbitrario sottointervallo [a, b] ⊆ I. Poich´e ϕϕϕ ∈ C
1
([a, b], R
N
), la
funzione ϕϕϕ
t
`e uniformemente continua su [a, b]. Quindi, fissato ε > 0, esiste
δ > 0 tale che
t, τ ∈ [a, b], [t −τ[ < δ =⇒ [ϕϕϕ
t
(t) −ϕϕϕ
t
(τ)[
N
<
ε
b −a
.
Sia σ una suddivisione di [a, b] mediante i punti a = t
0
< t
1
< . . . < t
k
= b
tale che t
i
−t
i−1
< δ per i = 1, . . . , k. Allora per i = 1, . . . , k si ha
_
t
i
t
i−1
[ϕϕϕ
t
(τ)[
N
dτ =
_
t
i
t
i−1
[ϕϕϕ
t
(τ) −ϕϕϕ(t
i
) +ϕϕϕ(t
i
)[
N
dτ ≤

_
t
i
t
i−1
[ϕϕϕ
t
(τ) −ϕϕϕ(t
i
)[
N
dτ +[ϕϕϕ(t
i
)[
N
(t
i
−t
i−1
) =
=
_
t
i
t
i−1
[ϕϕϕ
t
(τ) −ϕϕϕ(t
i
)[
N
dτ +
¸
¸
¸
¸
_
t
i
t
i−1
[ϕϕϕ
t
(t
i
) −ϕϕϕ
t
(τ) +ϕϕϕ
t
(τ)] dτ
¸
¸
¸
¸
N

≤ 2
_
t
i
t
i−1
[ϕϕϕ
t
(τ) −ϕϕϕ(t
i
)[
N
dτ +
¸
¸
¸
¸
_
t
i
t
i−1
ϕϕϕ
t
(τ) dτ
¸
¸
¸
¸
N
=
< 2ε
t
i
−t
i−1
b −a
+[ϕϕϕ(t
i
) −ϕϕϕ(t
i−1
)[
N
.
Sommando rispetto a i, si ricava
_
b
a
[ϕϕϕ
t
(τ)[
N
dτ ≤ 2ε + (S
σ
) ≤ 2ε + (ϕϕϕ);
dall’arbitrariet` a di ε segue
_
b
a
[ϕϕϕ
t
(τ)[
N
dτ ≤ (ϕϕϕ) ∀[a, b] ⊂ I,
e passando al limite per a →inf I e per b →sup I, si ottiene infine
_
I
[ϕϕϕ
t
(τ)[
N
dτ ≤ (ϕϕϕ).
Osservazione 4.1.9 Dal teorema precedente segue che due curve di classe
C
1
, fra loro equivalenti, hanno la stessa lunghezza. Infatti, siano ϕϕϕ : I →R
N
370
e ψψψ : J → R
N
due curve di classe C
1
con ψψψ(τ) = ϕϕϕ(p(τ)) per ogni τ ∈ J,
ove p : J → I `e un diffeomorfismo; allora dalla formula di cambiamento di
variabile si ha
(ϕϕϕ) =
_
I
[ϕϕϕ
t
(t)[
N
dt =
_
J
[ϕϕϕ
t
(p(τ))[
N
[p
t
(τ)[ dτ =
=
_
J
¸
¸
¸
¸
d
dt
ϕϕϕ(p(τ))
¸
¸
¸
¸
N
dτ =
_
J
[ψψψ
t
(τ)[
N
dτ = (ψψψ).
Se, in particolare, le curve equivalenti sono anche regolari e semplici, la loro
lunghezza `e qualcosa di intrinsecamente legato al sostegno. Proveremo nel
paragrafo successivo che due curve regolari e semplici aventi lo stesso sostegno
sono necessariamente equivalenti o, se chiuse, almeno equivalenti a tratti:
quindi, se Γ ⊂ R
N
`e un insieme che `e sostegno di una curva regolare e
semplice, potremo utilizzare il simbolo (Γ) per denotare la lunghezza di una
qualunque curva regolare e semplice che abbia Γ come sostegno.
Esempi 4.1.10 (1) Sia ϕϕϕ(t) = (1 −t)x
0
+ tx
1
, t ∈ [0, 1]: il sostegno di ϕϕϕ `e
il segmento di R
N
che unisce x
0
e x
1
. Poich´e
[ϕϕϕ
t
(t)[
N
= [x
1
−x
0
[
N
∀t ∈ [0, 1],
si ha, come era prevedibile, (ϕϕϕ) =
_
1
0
[x
1
−x
0
[
N
dt = [x
1
−x
0
[
N
.
(2) Poniamo ϕϕϕ(t) = (cos mt, sin mt), t ∈ [0, 2π], ove m ∈ N
+
. Poich´e
[ϕϕϕ
t
(t)[
2
= m, si ha (ϕϕϕ) = 2πm (il che non sorprende, visto che la curva
percorre la circonferenza unitaria m volte).
(3) Sia ϕϕϕ la curva definita, in coordinate polari, dall’equazione ρ = e
−ϑ
,
ϑ ≥ 0. Poich´e ϕϕϕ(ϑ) = (e
−ϑ
cos ϑ, e
−ϑ
sin ϑ), si ha
ϕϕϕ
t
(ϑ) = (e
−ϑ
(−cos ϑ −sin ϑ), e
−ϑ
(−sin ϑ + cos ϑ)),
cosicch´e otteniamo [ϕϕϕ
t
(ϑ)[
2
=

2 e
−ϑ
. Ne segue
(ϕϕϕ) =
_

0

2 e
−ϑ
dϑ =

2.
La spirale quindi ha lunghezza finita,
pur avvolgendosi infinite volte intorno
all’origine.
371
Esercizi 4.1
1. Si verifichi che le seguenti curve piane sono semplici ed hanno lo stesso
sostegno, ma non sono regolari n´e equivalenti:
_
x = t ∧ 1
y = 0 ∨ (t −1),
t ∈ [0, 2];
_
¸
¸
_
¸
¸
_
x =
_
τ
2
(2 −τ)
2
se τ ∈ [0, 1]
1 se τ ∈ [1, 2]
y =
_
0 se τ ∈ [0, 1]
(τ −1)
2
(3 −τ)
2
se τ ∈ [1, 2].
2. Si provi che le seguenti curve piane sono equivalenti:
_
x = cos t
y = sin t
, t ∈
_

π
2
,
π
2
_
,
_
x =
1−τ
2
1+τ
2
y =

1+τ
2
, t ∈ [−1, 1].
3. Sia f : [a, b] → R una funzione continua e crescente. Si provi che
ϕϕϕ(t) = (t, f(t)) `e una curva rettificabile e che
_
(b −a)
2
+ (f(b) −f(a))
2
≤ (ϕϕϕ) ≤ b −a + f(b) −f(a).
4. Sia ϕϕϕ(t) = (t, f(t)), ove
f(t) =
_
0 set = 0
t sin
1
t
se 0 < t <
1
π
,
Si provi che ϕϕϕ non `e rettificabile.
[Traccia: per ogni n ∈ N
+
sia σ
n
la suddivisione di [0, 1/π] de-
terminata dai punti 0 <
1
(2n−1)π/2
< . . . <
1
3π/2
<
1
π
; si provi che
(S
σn
) ≥
2
π

n−1
i=0
1
2i+1
.]
5. Se ϕϕϕ `e una curva piana definita, in coordinate polari, dall’equazione
ρ = f(ϑ), con f ∈ C
1
(I) e f ≥ 0, si verifichi che
(ϕϕϕ) =
_
I
_
f(ϑ)
2
+ f
t
(ϑ)
2
dϑ.
6. Calcolare la lunghezza delle curve seguenti:
372
(i) (arco di parabola) x = x, y = x
2
, x ∈ [−a, a];
(ii) (parabola semicubica) x = t
2
, y = t
3
, [t[ ≤ 2;
(iii (astroide o ipocicloide) x = cos
3
t, y = sin
3
t,
t ∈ [0, 2π];
(iv) (cicloide) x = t −sin t, y = 1 −cos t, t ∈ [0, 2π];
(v) (catenaria) x = x, y = cosh x, x ∈ [−a, a];
(vi) (nefroide) x = 3 cos t −cos 3t, y = 3 sin t −sin 3t, t ∈ [0, 2π];
(vii) (deltoide) x = 2 cos t + cos 2t, y = 2 sin t −sin 2t, t ∈ [0, 2π];
(viii) (cardioide) ρ = 2(1 + cos ϑ), ϑ ∈ [−π, π];
(ix) (spirale di Archimede) ρ = ϑ, ϑ ∈ [0, 2nπ];
(x) (spirale logaritmica) ρ = e
ϑ
, ϑ ∈ [−2nπ, 2π];
(xi) (spirale iperbolica) ρ = 1/ϑ, ϑ ∈ [2π, 2nπ];
(xii) (elica cilindrica) x = cos t, y = sin t, z = t,
t ∈ [0, 2nπ].
373
4.2 Ascissa curvilinea
Sia ϕϕϕ : [a, b] → R
N
una curva regolare, con sostegno Γ. Fra tutti i cambia-
menti di parametro che danno luogo a curve equivalenti, ce n’`e uno privi-
legiato, perch´e intrinsecamente legato alla geometria di Γ. Per descriverlo,
introduciamo la variabile
s = λ(t) =
_
t
a
[ϕϕϕ
t
(τ)[
N
dτ, t ∈ [a, b].
Il parametro s, detto ascissa curvilinea o parametro lunghezza d’arco, misura
la lunghezza della curva regolare ϕϕϕ[
[a,t]
; quando t descrive [a, b], s descrive
[0, (ϕϕϕ)]. Si noti che λ `e un diffeomorfismo fra [a, b] e [0, (ϕϕϕ)], perch´e
λ
t
(t) = [ϕϕϕ
t
(t)[
N
> 0 ∀t ∈ [a, b].
Dunque ϕϕϕ `e equivalente alla curva ααα : [0, (ϕϕϕ)] →R
N
data da
ααα(s) = ϕϕϕ(λ
−1
(s)), s ∈ [0, (ϕϕϕ)],
che `e definita in termini del parametro lunghezza d’arco. Il punto ααα(s), per
costruzione, `e quel punto di Γ che si trova a distanza s (misurata lungo la
curva) dal primo estremo ααα(0) = ϕϕϕ(a). Osserviamo che
ααα
t
(s) = ϕϕϕ
t

−1
(s)) (λ
−1
)
t
(s) =
ϕϕϕ
t

−1
(s))
[ϕϕϕ
t

−1
(s))[
N
,
e quindi [ααα
t
(s)[
N
= 1 per ogni s ∈ [0, (ϕϕϕ)]. Perci` o ααα
t
(s) `e in ogni punto di Γ il
versore tangente a Γ, orientato secondo il verso di percorrenza. Interpretando
s come lo spazio percorso da un punto materiale vincolato a muoversi lungo
Γ, ααα(s) `e la posizione del punto e ααα
t
(s) `e la sua velocit` a, che per quanto visto
`e un vettore unitario.
L’ascissa curvilinea pu`o essere definita anche nel caso di curve definite su
intervalli illimitati: se I = [a, ∞[ si ripete il discorso precedente, se I =
] − ∞, b] sar` a naturale parlare di lunghezza negativa, definendo s nel modo
formalmente analogo
s = λ(t) =
_
t
b
[ϕϕϕ
t
(τ)[
N
dτ, t ∈ I;
374
infine se I `e una semiretta aperta, o anche tutto R, si parler` a di lunghezza a
partire da un fissato punto x = ϕϕϕ(a) ∈ Γ, misurata dal parametro
s = λ(t) =
_
t
a
[ϕϕϕ
t
(τ)[
N
dτ, t ∈ I :
essa sar` a positiva per i punti che seguono ϕϕϕ(a) e negativa per quelli che lo
precedono secondo l’orientazione fissata.
Da quanto detto segue che il simbolo ds rappresenta l’ elemento di lunghezza
lungo il sostegno Γ. Esso si esprime in termini del differenziale dt re;lativo
alla parametrizzazione x = ϕϕϕ(t) = (x
1
(t), . . . , x
N
(t)) tramite la relazione
ds = [ϕϕϕ(t)[
3
dt =
_
(x
1
)
t
(t)
2
+ . . . + (x
N
)
t
(t)
2
dt; d’altronde, poich´e ds `e indi-
pendente dalla parametrizzazione scelta, si pu` o formalmente scrivere l’iden-
tit` a (ds)
2
= (dx
1
)
2
+ . . . (dx
N
)
2
.
Utilizzando l’ascissa curvilinea `e facile provare questo risultato gi` a annunciato
e geometricamente plausibile.
Proposizione 4.2.1 Due curve regolari e semplici, non chiuse, sono equi-
valenti se e solo se hanno lo stesso sostegno; due curve chiuse, regolari e
semplici sono equivalenti a tratti se e solo se hanno lo stesso sostegno.
Dimostrazione Se due curve regolari e semplici sono equivalenti, oppure
sono chiuse ed equivalenti a tratti, esse hanno lo stesso sostegno, come `e stato
osservato subito dopo la definizione 4.1.4.
Proviamo i due enunciati opposti, limitandoci al caso pi` u semplice in cui
le curve sono definite su intervalli chiusi e limitati; per il caso generale si
rimanda all’esercizio 4.2.9. Siano dunque ϕϕϕ : [a, b] → R
N
e ψψψ : [c, d] → R
N
due curve regolari e semplici, non chiuse, tali che ϕϕϕ[a, b] = ψψψ[c, d] = Γ. Inoltre
ammettiamo dapprima che ϕϕϕ e ψψψ abbiano lo stesso verso, ossia che si abbia
ϕϕϕ(a) = ψψψ(c) e ϕϕϕ(b) = ψψψ(d). Poniamo
λ(t) =
_
t
a
[ϕϕϕ
t
(v)[
N
dv, t ∈ [a, b], (τ) =
_
τ
c
[ψψψ
t
(u)[
N
du, τ ∈ [c, d],
e definiamo
ϕϕϕ
0
(s) = ϕϕϕ(λ
−1
(s)), s ∈ [0, (ϕϕϕ)], ψψψ
0
(s) = ψψψ(
−1
(σ)), σ ∈ [0, (ψψψ)].
Come sappiamo, ϕϕϕ
0
`e equivalente a ϕϕϕ e ψψψ
0
`e equivalente a ψψψ; ci proponiamo
di verificare che ϕϕϕ
0
≡ ψψψ
0
e che, in particolare, (ϕϕϕ) = (ψψψ). A questo scopo
notiamo che, detto T(x) il versore tangente a Γ nel punto x ∈ Γ, si ha
ϕϕϕ
t
0
(s) = T(ϕϕϕ
0
(s)) ∀s ∈ [0, (ϕϕϕ)],
375
e similmente
ψψψ
t
0
(s) = T(ψψψ
0
(σ)) ∀σ ∈ [0, (ψψψ)].
Osserviamo adesso che per ogni s ∈ [0, (ϕϕϕ)] esiste un unico punto x
s
∈ Γ
tale che x
s
= ϕϕϕ
0
(s), ed esiste un unico punto σ
s
∈ [0, (ψψψ)] tale che ψψψ
0

s
) =
x
s
= ϕϕϕ
0
(s). Denotiamo con p la corrispondenza s →σ
s
, cosicch´e la funzione
p : [0, (ϕϕϕ)] → [0, (ψψψ)] verifica ψψψ
0
(p(s)) = ϕϕϕ
0
(s) per ogni s ∈ [0, (ϕϕϕ)].
Proviamo che p `e continua: siccome
lim
h→0
ψψψ
0
(p(s + h)) = lim
h→0
ϕϕϕ
0
(s + h) = ϕϕϕ
0
(s) = ψψψ
0
(p(s)),
deve risultare p(s+h) →p(s) per h →0 poich´e altrimenti, per compattezza,
esisterebbe una successione ¦h
n
¦ infinitesima tale che p(s + h
n
) → σ
0

[0, (ψψψ)], ove necessariamente σ
0
,= p(s): ma allora ψψψ
0
(p(s + h
n
)) → ψψψ
0

0
)
e, per unicit` a del limite, ψψψ
0

0
) = ψψψ
0
(p(s)): dato che ψψψ
0
`e iniettiva, se ne
dedurrebbe σ
0
= p(s), assurdo. Pertanto p `e una funzione continua. Per h
sufficientemente piccolo possiamo allora scrivere
ϕϕϕ
0
(s + h) −ϕϕϕ
0
(s)
h
=
ψψψ
0

s+h
) −ψψψ
0

s
)
h
=
ψψψ
0

s+h
) −ψψψ
0

s
)
σ
s+h
−σ
s

σ
s+h
−σ
s
h
,
da cui, moltiplicando scalarmente per il vettore
ϕϕϕ
0
(s+h)−ϕϕϕ
0
(s)
h
,
¸
¸
¸
¸
ϕϕϕ
0
(s + h) −ϕϕϕ
0
(s)
h
¸
¸
¸
¸
2
N
=
=
_
ψψψ
0

s+h
) −ψψψ
0

s
)
σ
s+h
−σ
s
,
ϕϕϕ
0
(s + h) −ϕϕϕ
0
(s)
h
_
N

σ
s+h
−σ
s
h
;
ne segue
σ
s+h
−σ
s
h
=
¸
¸
¸
ϕϕϕ
0
(s+h)−ϕϕϕ
0
(s)
h
¸
¸
¸
2
N
_
ψψψ
0

s+h
)−ψψψ
0
(σs)
σ
s+h
−σs
,
ϕϕϕ
0
(s+h)−ϕϕϕ
0
(s)
h
_
N
e pertanto, essendo σ
s+h
→σ
s
per h →0,
∃p
t
(s) = lim
h→0
σ
s+h
−σ
s
h
=
[T(ϕϕϕ
0
(s))[
2
N
¸T(ψψψ
0

s
)), T(ϕϕϕ
0
(s))¸
N
= 1 ∀s ∈ [0, (ϕϕϕ)].
Dunque, p
t
(s) = s e p(0) = σ
0
= 0: se ne deduce che p(s) = s ed in particolare
ϕϕϕ
0
(s) ≡ ψψψ
0
(s) e (ψψψ) = p((ϕϕϕ)) = (ϕϕϕ). Dal fatto che ϕϕϕ
0
`e equivalente a ϕϕϕ e
376
ψψψ
0
`e equivalente a ψψψ segue ovviamente che ϕϕϕ e ψψψ sono curve equivalenti.
Se invece ϕϕϕ e ψψψ hanno verso opposto, l’argomentazione precedente mostra
che ψψψ `e equivalente all’opposta ϕϕϕ(a + b − t) di ϕϕϕ. Ne segue che ψψψ `e anche
equivalente a ϕϕϕ.
Siano ora ϕϕϕ e ψψψ due curve regolari, semplici e chiuse, aventi lo stesso sostegno
e tali che
ϕϕϕ(a) = ϕϕϕ(b) = x, ψψψ(c) = ψψψ(d) = y,
con x, y punti distinti del sostegno Γ: dobbiamo provare che ϕϕϕ e ψψψ sono
equivalenti a tratti. Per iniettivit` a, esistono unici h ∈]a, b[ e k ∈]c, d[ tali che
ϕϕϕ(h) = y e ψψψ(k) = x. Poniamo
I
1
= [a, h], I
2
= [h, b]; J
1
= [c, k], J
2
= [k, d].
Se ϕϕϕ e ψψψ hanno la stessa orientazione, si verifica subito, per la parte gi`a
dimostrata, che ϕϕϕ[
I
1
`e equivalente a ψψψ[
J
2
e ϕϕϕ[
I
2
`e equivalente a ψψψ[
J
1
; se invece
ϕϕϕ e ψψψ hanno orientazioni opposte, si vede che ϕϕϕ[
I
1
`e equivalente a ψψψ[
J
1
e ϕϕϕ[
I
2
`e
equivalente a ψψψ[
J
2
. Si noti che se risulta, in particolare, ϕϕϕ(a) = ϕϕϕ(b) = ψψψ(c) =
ψψψ(d) (condizione che, come sappiamo dall’esempio 4.1.5 (4), `e necessaria per
avere l’equivalenza fra curve chiuse), allora si pu` o ripetere l’argomento della
prima parte, e si prova che le due curve sono equivalenti. La tesi `e provata.
Come gi` a osservato, questo risultato ci permette di parlare di lunghezza del
sostegno Γ, intendendo con ci` o la lunghezza di qualunque curva regolare e
semplice ϕϕϕ avente Γ come sostegno.
Osservazione 4.2.2 Se ϕϕϕ : I →R
N
`e una curva di classe C
1
a tratti, la sua
lunghezza pu`o essere definita per additivit`a: se I
1
, . . . , I
m
sono sottointervalli
adiacenti di I la cui unione `e I, e se ϕϕϕ
j
= ϕϕϕ[
I
j
sono curve di classe C
1
per
j = 1, . . . , m, si definisce
(ϕϕϕ) =
m

j=1
(ϕϕϕ
j
);
`e facile verificare che questa definizione non dipende dagli infiniti modi in cui
ϕϕϕ pu` o essere decomposta in “sottocurve” di classe C
1
. Nel caso in cui ϕϕϕ `e
anche semplice e regolare a tratti, la sua lunghezza dipende solo dal sostegno
Γ, cosicch`e potremo analogamente parlare di lunghezza di Γ.
377
Esempio 4.2.3 Calcoliamo la lunghezza della lemniscata di Bernoulli, data
da
Γ = ¦(x, y) ∈ R
2
: (x
2
+ y
2
)
2
−2(x
2
−y
2
) = 0¦.
Utilizzando le coordinate polari, si trova facilmente che l’insieme Γ `e descritto
da
ρ =

2 cos 2ϑ, ϑ ∈
_

π
4
,
π
4
_

_

4
,

4
_
(ricordiamo che deve essere cos 2ϑ ≥ 0). L’insieme Γ `e dunque sostegno di
due curve, l’una definita per ϑ ∈
_

π
4
,
π
4
¸
, l’altra per ϑ ∈
_

4
,

4
¸
, nessuna
delle quali `e regolare, in quanto entrambe sono di classe C
1
solo nei punti
interni. Le lunghezze delle due curve sono uguali fra loro, per evidenti ragioni
di simmetria; la lunghezza della prima `e
I =
_ π
4

π
4
[ϕϕϕ
t
(ϑ)[
2
dϑ =
_ π
4

π
4
_
2
cos 2ϑ
dϑ,
e dunque la lunghezza cercata `e data da
(Γ) = 2I = 2
_ π
4

π
4
_
2
cos 2ϑ
dϑ = 4

2
_ π
4
0


cos 2ϑ
.
Questo integrale `e certamente finito, essendo
cos 2ϑ = −2
_
ϑ −
π
4
_
+ o
_
_
ϑ −
π
4
_
2
_
per ϑ →
π
4

.
Sebbene esso non sia calcolabile esplicitamente, se ne pu` o trovare uno svi-
luppo in serie. Ponendo

2 sin ϑ = sin t, ossia ϑ = arcsin
_
sin t

2
_
,
si ha t ∈ [0, π/2] e, come si verifica facilmente,
(Γ) = 4

2
_
π/4
0

_
1 −2 sin
2
ϑ
= 4
_
π/2
0
dt
_
1 −
sin
2
t
2
;
378
ricordando la serie binomiale
(1 + x)
−1/2
=

n=0
_
−1/2
n
_
(−1)
n
x
n
= 1 +

n=1
(2n −1)!!
(2n)!!
x
n
, x ∈] −1, 1[,
troviamo, in virt` u del teorema di B. Levi,
(Γ) = 4
_
π/2
0
_
1 +

n=1
(2n −1)!!
(2n)!!
2
−n
sin
2n
t
_
dt =
= 2π + 4

n=1
(2n −1)!!
(2n)!!
2
−n
_
π/2
0
sin
2n
t dt.
Infine, per l’esercizio 4.2.7(iii) si conclude che
(Γ) = 2π
_
1 +

n=1
_
(2n −1)!!
(2n)!!
_
2
2
−n
_
.
Integrali curvilinei
Sia f una funzione continua definita su un insieme Γ che `e sostegno di una
curva ϕϕϕ di classe C
1
. Andiamo a definire l’integrale di f lungo ϕϕϕ nel modo
seguente:
Definizione 4.2.4 Sia ϕϕϕ : I → R
N
una curva di classe C
1
, con sostegno
Γ. Se f : A → R `e una funzione misurabile definita su un aperto A ⊃ Γ,
l’ integrale curvilineo di f lungo ϕϕϕ `e il numero, finito o infinito,
_
ϕϕϕ
f ds =
_
I
f(ϕϕϕ(t)) [ϕϕϕ(t)[
N
dt,
sempre che la quantit`a a secondo membro sia ben definita.
Nel seguito ci interesseranno soprattutto i casi in cui f `e continua e ϕϕϕ `e
definita su un intervallo I = [a, b], casi nei quali l’integrale curvilineo ha
sempre senso.
Si verifica facilmente, con un cambiamento di variabile, che se ψψψ : J →R
N
`e
una curva di classe C
1
equivalente a ϕϕϕ, allora si ha
_
ϕϕϕ
f ds =
_
ψψψ
f ds.
379
Se, in particolare, ϕϕϕ `e regolare e semplice, otteniamo che l’integrale curvilineo
_
ϕϕϕ
f ds dipende soltanto, oltre che da f, dal sostegno Γ, e non dalla particolare
curva regolare e semplice di cui tale insieme `e sostegno: possiamo quindi
scrivere _
Γ
f ds
per indicare l’integrale di f lungo una qualunque curva regolare e semplice
che abbia Γ come sostegno.
Un discorso analogo vale per le curve di classe C
1
a tratti: se ϕϕϕ : I → R
N
`e una curva di classe C
1
a tratti e ϕϕϕ
j
= ϕϕϕ
I
j
, j = 1, . . . , m, sono le curve di
classe C
1
che compongono ϕϕϕ, si definisce
_
ϕϕϕ
f ds =
m

j=1
_
ϕϕϕ
j
f ds;
considerazioni analoghe alle precedenti portano a definire l’integrale
_
Γ
f ds
quando Γ `e sostegno di una curva semplice e regolare a tratti.
Osservazione 4.2.5
`
E immediato verificare che
_
Γ
1 ds = (Γ); inoltre,
si vede facilmente che se Γ `e un segmento T dell’asse x, allora l’integrale
curvilineo di f si riduce all’ordinario integrale
_
T
f(x) dx.
Esempi 4.2.6 (1) Sia f(x, y) = x. L’integrale di f lungo la curva
ϕϕϕ(t) = (sin t, 0), t ∈ [0, π],
il cui sostegno `e il segmento T dell’asse x di estremi 0 e 1, vale
_
ϕϕϕ
f ds =
_
π
0
sin t[ cos t[ dt = 2
_
π/2
0
cos t sin t dt = 1.
La curva ϕϕϕ non `e semplice (e nemmeno regolare). Una curva regolare e
semplice che ha per sostegno il segmento T `e, ovviamente,
ψψψ(x) = (x, 0), x ∈ [0, 1],
e per essa si ha
_
ψψψ
f ds =
_
1
0
x dx =
1
2
.
380
Possiamo perci`o concludere che
_
T
f ds =
1
2
.
Il valore 1 ottenuto per l’integrale lungo ϕϕϕ `e giustificato dal fatto che tale
curva percorre il sostegno due volte: la prima, crescendo, per t ∈ [0, π/2], e
la seconda, decrescendo, per t ∈ [π/2, π].
(2) Calcoliamo l’integrale
_
Γ
e
x−y
ds,
ove Γ = ¦(x, y) ∈ R
2
: [x[ +[y[ = 1¦.
L’insieme Γ `e costituito da quattro segmenti:
Γ
1
: x = x, y = −1 −x, x ∈ [−1, 0],
Γ
2
: x = x, y = x −1, x ∈ [0, 1],
Γ
3
: x = x, y = 1 −x, x ∈ [0, 1],
Γ
4
: x = x, y = x + 1, x ∈ [−1, 0].
Si ha allora
_
Γ
e
x−y
ds =
_
0
−1
e
2x+1

2 dx +
_
1
0
e

2 dx +
+
_
1
0
e
2x−1

2 dx +
_
0
−1
e
−1

2 dx = 2

2 e.
Gli integrali curvilinei godono delle usuali propriet`a degli integrali: linearit` a,
monotonia, additivit` a, eccetera. Gli esercizi 4.2.2, 4.2.3, 4.2.4 e 4.2.5 sono
dedicati alla dimostrazione di queste propriet`a.
Esercizi 4.2
1. Scrivere le seguenti curve in funzione del parametro lunghezza d’arco:
(i) x = r cos mt, y = r sin mt, t ∈ [0, 2π] (r > 0, m ∈ N
+
);
(ii) x = r cos
3
t, y = r sin
3
t, t ∈ [0, 2π] (r > 0);
(iii) x = e
t
cos t, y = e
t
sin t, z = e
t
, t ∈ R;
381
(iv) x = 2 cos t −cos 2t, y = 2 sin t −sin 2t, t ∈ [0, 2π].
2. Sia Γ sostegno di una curva semplice e regolare (o regolare a tratti). Si
provi che se f, g sono funzioni continue definite su Γ e λ, µ ∈ R si ha
_
Γ
(λf + µg) ds = λ
_
Γ
f ds + µ
_
Γ
f ds.
3. Sia Γ sostegno di una curva semplice e regolare (o regolare a tratti). Si
provi che se f, g sono funzioni continue definite su Γ con f ≤ g, allora
si ha _
Γ
f ds ≤
_
Γ
g ds;
se ne deduca che ¸
¸
¸
¸
_
Γ
f ds
¸
¸
¸
¸

_
Γ
[f[ ds.
4. Sia Γ sostegno di una curva semplice e regolare (o regolare a tratti)
ϕϕϕ : [a, b] →R
N
, e sia f una funzione continua definita su Γ. Se c ∈]a, b[
e Γ
1
= ϕϕϕ[a, c], Γ
2
= ϕϕϕ[c, b], si provi che
_
Γ
f ds =
_
Γ
1
f ds +
_
Γ
2
f ds.
5. (Teorema della media) Sia Γ sostegno di una curva semplice e regolare
(o regolare a tratti), e sia f una funzione continua definita su Γ. Si
provi che
min
Γ
f ≤
1
(Γ)
_
Γ
f ds ≤ max
Γ
f,
e che esiste x
0
∈ Γ tale che
f(x
0
) =
1
(Γ)
_
Γ
f ds.
6. Calcolare i seguenti integrali curvilinei:
(i)
_
Γ
_
x + 2y ds, ove Γ `e il segmento di estremi (0, 0) e (2, 4);
(ii)
_
Γ
_
x
2
+ y
2
ds, ove Γ: x = e
t
cos t, e
t
sin t, t ∈ [0, 2π];
382
(iii)
_
Γ
(x
3
+ y) ds, ove Γ: x = 2t, y = t
3
, t ∈ [0, 1];
(iv)
_
Γ
x
y
2
ds, ove Γ: ρ = e
−ϑ
, ϑ ∈
_
π
4
,

4
¸
;
(v)
_
Γ
(x
3
+ y
2
) ds, ove Γ: y
2
= x
3
, x ∈ [0, 2];
(vi)
_
Γ
xy ds, ove Γ = semiellisse di centro (2, 0), semiassi 2 e 1, y ≥ 0;
(vii)
_
Γ
arctan
y
x
ds, ove Γ: ρ = 2ϑ, ϑ ∈ [0, π/2];
(viii)
_
Γ
y ds, ove Γ: x
2
+ y
2
= 9z
2
, x = 3z
2
, y ≥ 0, z ∈ [0, 1].
7. (i) Si verifichi che l’ellisse
x
2
a
2
+
y
2
b
2
(a ≥ b) `e sostegno della curva regolare
x = a cos t, y = b sin t, t ∈ [0, 2π],
ed ha lunghezza pari a
= 4a
_
π/2
0
_
1 −k
2
sin
2
x dx,
ove k =
_
1 −b
2
/a
2
`e l’ eccentricit`a dell’ellisse.
(ii) Procedendo come nell’esempio 4.2.3, si deduca che
= 4a
_
π
2

n=1
1
2n −1
(2n −1)!!
(2n)!!
k
2n
_
π/2
0
sin
2n
x dx
_
.
(iii) Si verifichi per induzione che
_
π/2
0
sin
2n
x dx =
(2n −1)!!
(2n)!!
π
2
∀n ∈ N
+
.
(iv) Si concluda che
= 2πa
_
1 −

n=1
1
2n −1
_
(2n −1)!!
(2n)!!
_
2
k
2n
_
.
383
8. Posto ϕϕϕ(t) = (cos t, cos t sin t), t ∈ [0, 2π], se ne disegni il sostegno Γ,
si verifichi che la curva `e chiusa e regolare, ma che Γ non `e una variet` a
1-dimensionale; si calcoli infine l’integrale
_
Γ
y ds.
9. Dimostrare la proposizione 4.2.1 nel caso di curve definite su intervalli
qualsiasi.
[Traccia: fissare un punto x
0
= ϕϕϕ(a
0
) = ψψψ(c
0
) ∈ Γ che funga da
“origine” per l’ascissa curvilinea; poi, posto λ(t) =
_
t
a
0
[ϕϕϕ
t
(v)[
N
dv, t ∈
I, e (τ) =
_
τ
c
0
[ψψψ
t
(u)[
N
du, τ ∈ J, si proceda come nel caso di intervalli
compatti.]
4.3 Geometria delle curve piane
Consideriamo una curva piana ϕϕϕ : I → R
2
, che supporremo regolare e di
classe C
2
; scriviamo ϕϕϕ(t) = (x(t), y(t)), t ∈ I. Come sappiamo, il suo versore
tangente `e
T(t) =
ϕϕϕ
t
(t)
[ϕϕϕ
t
(t)[
N
=
_
x
t
(t)
_
x
t
(t)
2
+ y
t
(t)
2
,
y
t
(t)
_
x
t
(t)
2
+ y
t
(t)
2
_
.
Sia N(t) il versore normale a T(t), ottenuto ruotando T(t) di un angolo retto
in verso antiorario, cio`e di +π/2: si ha
N(t) =
_
−y
t
(t)
_
x
t
(t)
2
+ y
t
(t)
2
,
x
t
(t)
_
x
t
(t)
2
+ y
t
(t)
2
_
.
L’equazione cartesiana della retta tangente alla
curva nel punto ϕϕϕ(t) `e dunque
(x −x(t))y
t
(t) −(y −y(t))x
t
(t) = 0,
mentre l’equazione cartesiana della retta normale alla curva nel punto ϕϕϕ(t) `e
(x −x(t))x
t
(t) + (y −y(t))y
t
(t) = 0.
384
Supponiamo adesso che ϕϕϕ sia riferita al parametro lunghezza d’arco: sar` a
allora ϕϕϕ(s) = (x(s), y(s)), e quindi, per ogni s,
_
¸
_
¸
_
x
t
(s)
2
+ y
t
(s)
2
= 1,
T(s) = (x
t
(s), y
t
(s)),
N(s) = (−y
t
(s), x
t
(s)).
Questo ci aiuter` a a semplificare i calcoli: per il caso generale in cui ϕϕϕ dipende
da un parametro generico t, si veda l’esercizio 4.3.3.
Poich´e ϕϕϕ ∈ C
2
, il vettore N(s) `e derivabile; essendo ¸T(s), T(s)¸
2
= 1, si ha
0 =
d
ds
¸T(s), T(s)¸
2
= 2(x
t
(s)x
tt
(s) + y
t
(s)y
tt
(s)) = 2¸T(s), T
t
(s)¸
2
,
ossia T
t
(s) `e ortogonale a T(s). Similmente, essendo ¸N(s), N(s)¸
2
= 1,
anche N
t
(s) `e ortogonale a N(s).
Dato che T
t
(s) e N(s) sono paralleli, esiste un numero k(s) ∈ R tale che
T
t
(s) = k(s)N(s);
il numero k(s) si dice curvatura di ϕϕϕ nel punto ϕϕϕ(s). Si noti che
k(s) = k(s)¸N(s), N(s)¸
2
= ¸T
t
(s), N(s)¸
2
= x
t
(s)y
tt
(s) −x
tt
(s)y
t
(s),
e quindi k `e una funzione continua; inoltre si ha [k(s)[ = [T
t
(s)[
2
, quindi
k(s) misura il tasso di variazione di T(s) il quale, essendo un versore, pu`o
solo ruotare. Si ha k(s) > 0 se, al crescere di s, T(s) ruota in direzione di
N(s), mentre k(s) < 0 se T(s) ruota in direzione di −N(s); nei punti in
cui la curvatura cambia segno, pertanto, la curva attraversa la propria retta
tangente.
Dato che anche N
t
(s) e T(s) sono paralleli, esiste un numero h(s) ∈ R tale
che
N
t
(s) = h(s)T(s),
385
ma la relazione
0 =
d
ds
0 =
d
ds
¸T(s), N(s)¸
2
= ¸T
t
(s), N(s)¸
2
+¸T(s), N
t
(s)¸
2
=
= k(s) [N(s)[
2
2
+ h(s) [T(s)[
2
2
= k(s) + h(s)
implica h(s) = −k(s). Ne seguono le due formule di Fr´enet-Serret per le
curve piane:
_
T
t
(s) = k(s)N(s)
N
t
(s) = −k(s)T(s).
Anomalia
Continuiamo a considerare una curva
piana ϕϕϕ(s) regolare e di classe C
2
, rife-
rita al parametro lunghezza d’arco. In-
troduciamo l’ anomalia ϑ(s) come l’an-
golo fra T(s) ed il verso positivo del-
l’asse x. Essa `e univocamente definita
se si fissa ϑ(0) ∈ [0, 2π[, e risulta
cos ϑ(s) = x
t
(s), sin ϑ(s) = y
t
(s).
L’anomalia `e una funzione di classe C
1
, poich´e localmente essa si esprime
nella forma
ϑ(s) = arctan
y
t
(s)
x
t
(s)
+ 2kπ, oppure ϑ(s) = arccot
x
t
(s)
y
t
(s)
+ 2kπ.
Derivando, si trova
x
tt
(s) = −sin ϑ(s) ϑ
t
(s), y
tt
(s) = cos ϑ(s) ϑ
t
(s),
da cui
k(s) = x
t
(s)y
tt
(s) −x
tt
(s)y
t
(s) = ϑ
t
(s).
la curvatura k(s) `e dunque il tasso di variazione dell’anomalia ϑ(s), a con-
ferma delle osservazioni fatte sul legame fra k(s) e la variazione di T(s).
`
E interessante notare che la curvatura individua univocamente una curva
piana, naturalmente a meno di spostamenti rigidi del piano. Si ha infatti:
386
Teorema 4.3.1 Sia > 0. Per ogni k ∈ C[0, ] e per ogni x
0
, y
0
, ϑ
0
∈ R
esiste una ed una sola curva ϕϕϕ, di classe C
2
, s ∈ [0, ], tale che
ϕϕϕ(0) = (x
0
, y
0
), ϕϕϕ
t
(0) = (cos ϑ
0
, sin ϑ
0
),
e che abbia k(s) come funzione curvatura in [0, ].
Dimostrazione Definiamo
ϑ(s) = ϑ
0
+
_
s
0
k(τ) dτ, s ∈ [0, ].
La curva ϕϕϕ(s) = (x(s), y(s)), data da
x(s) = x
0
+
_
s
0
cos ϑ(τ) dτ, y(s) = y
0
+
_
s
0
sin ϑ(τ) dτ, s ∈ [0, ],
risponde ai requisiti richiesti.
Se poi ϕϕϕ
1
(s), s ∈ [0, ], `e un’altra curva con le stesse propriet`a, la sua
anomalia ϑ
1
(s) verificher` a
ϑ
t
1
(s) = k(s) = ϑ
t
(s), ϑ
1
(0) = ϑ
0
= ϑ(0),
e quindi, per l’unicit` a della soluzione del problema di Cauchy, ϑ
1
≡ ϑ in [0, ].
Ne segue che le componenti x
1
(s), y
1
(s) di ϕϕϕ
1
(s) soddisferanno
_
x
t
1
(s) = cos ϑ(s) = x
t
(s),
x
1
(0) = x
0
= x(0),
_
y
t
1
(s) = sin ϑ(s) = y
t
(s),
y
1
(0) = y
0
= y(0),
da cui finalmente x
1
≡ x e y
1
≡ y, ossia ϕϕϕ
1
≡ ϕϕϕ.
Analizziamo adesso l’ ordine di contatto fra una curva regolare ϕϕϕ (di classe
C

), sempre riferita al parametro lunghezza d’arco s, ed una qualunque retta
di equazione ax + by + c = 0. Se la retta incontra la curva nel punto ϕϕϕ(s
0
),
diremo che la retta ha un contatto di ordine ≥ 1 con la curva in tale punto;
in tal caso, dette x(s), y(s) le componenti di ϕϕϕ(s), la funzione
g(s) = ax(s) + by(s) + c
deve annullarsi per s = s
0
, cio`e c = −ax(s
0
) − by(s
0
). Il contatto avr`a
ordine ≥ 2 se la nostra retta, oltre ad intersecare la curva, le `e tangente nel
387
punto ϕϕϕ(s
0
): in questo caso, a meno di costanti moltiplicative dovr` a aversi
a = −y
t
(s
0
) e b = x
t
(s
0
), cosicch´e la funzione g diventa
g(s) = −y
t
(s
0
)[x(s) −x(s
0
)] + x
t
(s
0
)[y(s) −y(s
0
)]
e soddisfa g(s
0
) = 0 e g
t
(s
0
) = 0. Le espressioni di g
tt
e g
ttt
sono
g
tt
(s) = −y
t
(s
0
)x
tt
(s) + x
t
(s
0
)y
tt
(s)
g
ttt
(s) = −y
t
(s
0
)x
ttt
(s) + x
t
(s
0
)y
ttt
(s);
si verifica allora che
g
tt
(s
0
) = k(s
0
), g
ttt
(s
0
) = k
t
(s
0
),
da cui si deduce che se k(s
0
) ,= 0 l’ordine di contatto con la retta tangente `e
esattamente 2; se k(s
0
) = 0 e k
t
(s
0
) ,= 0, l’ordine `e 3, ed in tal caso, poich´e
k(s) cambia segno in s
0
, come gi` a osservato la curva attraversa la propria
tangente in ϕϕϕ(s
0
); se infine k(s
0
) = k
t
(s
0
) = 0 l’ordine di contatto `e almeno
4 e in quel punto la curvatura ha un massimo o un minimo locale, oppure un
flesso di ordine superiore.
Analizziamo lo stesso problema nel caso di una generica circonferenza, la cui
equazione `e del tipo
[x −u[
2
2
= R
2
.
La circonferenza tocca la curva in un punto ϕϕϕ(s) se e solo se la funzione
G(s) = [ϕϕϕ(s) −u[
2
2
−R
2
si annulla; ci`o naturalmente implica R = [ϕϕϕ(s) −u[
2
ed in questo caso si ha
un ordine di contatto ≥ 1. Il contatto avr`a ordine ≥ 2 se e solo se
G
t
(s) = ¸2ϕϕϕ
t
(s), (ϕϕϕ(s) −u)¸
2
= 0,
ossia se e solo se ϕϕϕ(s) − u `e ortogonale al versore tangente T(s). Il centro
della circonferenza `e dunque sulla retta per ϕϕϕ(s) perpendicolare a T(s), e la
388
circonferenza `e tangente alla curva in ϕϕϕ(s): in particolare potremo scrivere
ϕϕϕ(s)−u = µ(s)N(s) per un opportuno numero µ(s) (il cui modulo `e il raggio
della circonferenza).
Il contatto `e di ordine almeno 3 se e solo se
G
tt
(s) = ¸2ϕϕϕ
tt
(s), (ϕϕϕ(s) −u)¸
2
+ 2[ϕϕϕ
t
(s)[
2
2
= 0,
ossia, utilizzando le formule di Fr´enet-Serret, se e solo se
1
2
G
tt
(s) = ¸k(s)N(s), µ(s)N(s)¸
2
+ 1 = k(s)µ(s) + 1 = 0.
In definitiva si ha contatto di ordine ≥ 3 se e solo se µ(s) =
1
k(s)
, cio`e
u = ϕϕϕ(s) +
1
k(s)
N(s), R =
1
[k(s)[
.
Si noti che quando k(s) = 0 il raggio diventa infinito e la circonferenza
degenera nella retta tangente.
Dunque, vi `e un unico cerchio il cui bordo ha ordine di contatto ≥ 3 con la
curva nel punto ϕϕϕ(s): `e quello di raggio
1
[k(s)[
, il cui centro sta sulla retta per
ϕϕϕ(s) normale alla curva; esso sta dalla parte del versore N(s) se k(s) > 0,
dalla parte opposta se k(s) < 0, e quindi sempre, per cos`ı dire, dalla parte
dove la curva gira. Tale cerchio si chiama cerchio osculatore alla curva ϕϕϕ
nel punto ϕϕϕ(s), mentre il centro del cerchio osculatore si chiama centro di
curvatura di ϕϕϕ in tale punto. Si noti che se k
t
(s) ,= 0, cosicch´e k `e strettamente
monotona in un intorno di s, allora la curva, rispetto al punto ϕϕϕ(s), ha
curvatura minore di k(s) da una parte e maggiore di k(s) dall’altra: quindi
il cerchio osculatore, la cui curvatura (costante) `e k(s) (esercizio 4.3.2), deve
attraversare la curva nel punto ϕϕϕ(s).
389
Il contatto del cerchio osculatore con la curva `e di ordine ≥ 4 quando
1
2
G
ttt
(s) = k
t
(s) ¸N(s), (ϕϕϕ(s) −u)¸
2
+
+k(s) ¸N
t
(s), (ϕϕϕ(s) −u)¸
2
+ k(s) ¸N(s), T(s)¸
2
= 0,
ossia, ricordando che N
t
⊥ N e N ⊥ T, quando
0 = k
t
(s) ¸N(s), (ϕϕϕ(s) −u) = −
k
t
(s)
k(s)
;
ci` o naturalmente, accade se e solo se k
t
(s) = 0. I punti nei quali la curvatura
ha derivata nulla si dicono vertici della curva: quelli ordinari, dove il contatto
`e di ordine esattamente 4, corrispondono a punti di massimo o di minimo
relativo per la curvatura. Ad esempio, nel caso dell’ellisse i vertici si trovano
all’intersezione con i due semiassi principali. Si pu` o dimostrare che ogni curva
regolare chiusa (di classe C
3
) possiede almeno quattro vertici.
Esercizi 4.3
1. Verificare che una circonferenza di raggio R > 0 ha curvatura costante
k(s) =
1
R
.
2. Sia ααα una curva piana regolare di classe C
2
, riferita al parametro lun-
ghezza d’arco. Si provi che se la curvatura k(s) verifica k(s) ≡ A, con
A costante non nulla, allora il sostegno di ααα `e un arco di circonferenza
di raggio
1
[A[
. Che cosa succede quando A = 0?
[Traccia: si consideri la curva βββ(s) = ααα(s) +
1
A
N(s)...]
3. Sia ϕϕϕ : I →R
2
una curva regolare di classe C
2
di componenti x(t), y(t).
Si provi che il versore tangente, il versore normale e la curvatura sono
dati dalle formule
T(t) =
_
x
t
(t)
[x
t
(t)
2
+ y
t
(t)
2
]
1/2
,
y
t
(t)
[x
t
(t)
2
+ y
t
(t)
2
]
1/2
_
,
390
N(t) =
_
−y
t
(t)
[x
t
(t)
2
+ y
t
(t)
2
]
1/2
,
x
t
(t)
[x
t
(t)
2
+ y
t
(t)
2
]
1/2
_
,
k(t) =
x
t
(t)y
tt
(t) −x
tt
(t)y
t
(t)
[x
t
(t)
2
+ y
t
(t)
2
]
3/2
,
mentre il centro del cerchio osculatore ha coordinate
_
x(t) −
y
t
(t)
k(t)[x
t
(t)
2
+ y
t
(t)
2
]
1/2
, y(t) +
x
t
(t)
k(t)[x
t
(t)
2
+ y
t
(t)
2
]
1/2
_
.
Si verifichi inoltre che le formule di Fr´enet-Serret diventano
_
T
t
(t) = k(t)[ϕϕϕ
t
(t)[
2
N(t)
N
t
(t) = −k(t)[ϕϕϕ
t
(t)[
2
T(t).
4. Si provi che se una curva ϕϕϕ `e il grafico di una funzione f ∈ C
2
[a, b],
allora la curvatura di ϕϕϕ `e data da
k(x) =
f
tt
(x)
[1 + f
t
(x)
2
]
3/2
,
e che di conseguenza k > 0 dove f `e convessa e k < 0 dove f `e concava.
5. Determinare la curvatura e il cerchio osculatore nei punti dell’astroide
x
2/3
+ y
2/3
= a
2/3
(a > 0).
6. Determinare la curvatura e il cerchio osculatore nei punti della parabola
y = x
2
, x ∈ R.
7. Dimostrare che se f ∈ C
2
[a, b] e ϕϕϕ `e la curva espressa in coordinate
polari dall’equazione ρ = f(ϑ), ϑ ∈ [a, b], allora la curvatura di ϕϕϕ `e
data dalla formula
k(ϑ) =
f(ϑ)
2
+ 2f
t
(ϑ)
2
−f
tt
(ϑ)f(ϑ)
[f
t
(ϑ)
2
+ f(ϑ)
2
]
3/2
.
391
8. Sia ϕϕϕ(t) = (t
α
, t
β
), t > 0, ove β > α > 0. Si provi che ϕϕϕ `e regolare e di
classe C

, se ne calcoli la curvatura k(t), si verifichi che
lim
t→0
+
k(t) =
_
0 se β > 2α
+∞ se α < β < 2α,
e infine si disegni la curva.
9. Calcolare la curvatura delle seguenti curve:
(i) (concoide di Nicomede) ρ =
a
cos ϑ
+b, ϑ ∈ [−π, π] ¸ ¦±
π
2
¦ (a, b > 0);
(ii) (strofoide) y
2
= x
2 a+x
a−x
, [x[ < a (a > 0);
(iii) (cissoide di Diocle) y
2
=
x
3
a−x
, x ∈ [0, a[ (a > 0);
(iv) (rosa a 3 petali) ρ = a sin 3ϑ (a > 0);
(v) (rosa a 2 petali) ρ = a sin 2ϑ (a > 0);
(vi) (spirale iperbolica) ρ =
a
ϑ
(a > 0).
392
10. Per una curva piana ϕϕϕ di classe C
3
, riferita al parametro lunghezza
d’arco, tale che ϕϕϕ(0) = 0 e ϕϕϕ
t
(0) = (1, 0), provare che
ϕϕϕ
tt
(0) = (0, k(0)), ϕϕϕ
ttt
(0) = (−k(0)
2
, k
t
(0)),
ed interpretare geometricamente questi fatti.
11. Dato b > 0 e fissata una curva regolare ϕϕϕ, di classe C
2
, riferita al
parametro lunghezza d’arco, la curva
δδδ(s) = ϕϕϕ(s) + b N(s)
`e detta parallela a ϕϕϕ. Si provi che δδδ `e
una curva regolare tranne che nei punti ove
k(s) = 1/b; si verifichi che in tali punti δδδ(s) `e
il centro del cerchio osculatore di ϕϕϕ nel punto
ϕϕϕ(s). Nella figura a fianco sono riportate le
parallele della parabola.
4.4 Inviluppi
Consideriamo una funzione F di classe C
1
, definita in A I, ove A `e un
aperto di R
2
e I `e un intervallo di R, tale che
_
∂F
∂x
(x, y, a)
_
2
+
_
∂F
∂y
(x, y, a)
_
2
> 0 ∀(x, y) ∈ A, ∀a ∈ I.
In queste ipotesi, per ogni fissato a ∈ I, l’equazione
F(x, y, a) = 0
definisce implicitamente, in virt` u del teorema del Dini (teorema 1.9.2), una
curva piana regolare Γ
a
.
Provando a disegnare tutte le curve della famiglia ¦Γ
a
¦
a∈I
, in molti casi si
nota che le curve “si addensano” in certe zone del piano, spesso delineando
il profilo di una nuova curva non appartenente alla famiglia.
Esempio 4.4.1 Posto F(x, y, a) = (x − a)
2
+ y
2
− 1, le curve Γ
a
sono cir-
conferenze di raggio 1, centrate in (a, 0); l’insieme in cui queste curve “si
addensano” `e costituito dalle due rette y = ±1.
393
Andiamo ad interpretare matematicamente questo fenomeno. Consideriamo
due curve “vicine” Γ
a
e Γ
a+h
, con [h[ piccolo. Se queste due curve hanno
punti in comune, essi risolveranno il sistema
_
F(x, y, a) = 0
F(x, y, a + h) = 0,
che si scrive anche nella forma equivalente
_
¸
_
¸
_
F(x, y, a) = 0
F(x, y, a + h) −F(x, y, a)
h
= 0,
Al variare di h, questi punti (se esistono), che indichiamo con (x
h
, y
h
), variano
in Γ
a
; se per h → 0 essi convergono verso determinati punti di Γ
a
, questi
altri punti (x, y) si dicono punti caratteristici di Γ
a
.
`
E facile verificare che i
punti caratteristici, se esistono, sono soluzioni del sistema
_
_
_
F(x, y, a) = 0
∂F
∂a
(x, y, a) = 0,
Infatti, per ogni h si ha, dal teorema del valor medio,
_
_
_
F(x
h
, y
h
, a) = 0
F(x
h
, y
h
, a + h) −F(x
h
, y
h
, a)
h
=
∂F
∂a
(x
h
, y
h
, a + δ
h
) = 0,
ove δ
h
`e un opportuno numero tale che 0 < [δ
h
[ < [h[. Quindi, per la
continuit`a di F e
∂F
∂a
, se (x
h
, y
h
) → (x, y), passando al limite per h → 0 si
ottiene
_
_
_
F(x, y, a) = 0
∂F
∂a
(x, y, a) = 0.
394
Abbiamo fatto una lista di ipotesi alquanto arbitrarie: che i punti (x
h
, y
h
)
esistano per ogni [h[ sufficientemente piccolo, e che tali punti convergano
per h → 0. Tuttavia si tratta di ipotesi spesso verificate in svariati esempi
significativi.
Esempio 4.4.2 Posto F(x, y, a) = (x − a)
2
+ y
2
− a
2
/4 , l’insieme Γ
a
`e la
circonferenza di centro (a, 0) e raggio [a[/2. Risolvendo il sistema fra Γ
a
e
Γ
a+h
si trovano i punti
x
h
=
h
2
+
3a
4
, y
h
= ±
¸
a
2
4

_
3h
8

a
4
_
2
,
e per h → 0 si ottiene il punto
caratteristico
x =
3a
4
, y =

3 a
4
.
Il luogo dei punti caratteristici, al
variare di a, d` a la coppia di rette
y = ±x/

3, sulle quali i punti delle
circonferenze “si addensano”.
Osservazione 4.4.3 Le soluzioni del sistema F =
∂F
∂a
= 0 non sono neces-
sariamente punti caratteristici della famiglia ¦Γ
a
¦: ad esempio se Γ
a
`e la
circonferenza di centro (a
3
, 0) e raggio 1, i punti caratteristici sono soltanto
quelli delle rette y = ±1, mentre le soluzioni di F =
∂F
∂a
= 0 sono anche i
punti della circonferenza x
2
+y
2
= 1, oltre a quelli di tali rette. Le verifiche
di tutto ci` o sono facili.
Sotto opportune e ragionevoli ipotesi, comunque, le soluzioni del sistema
F =
∂F
∂a
= 0 formano una curva con propriet`a geometriche assai interessanti.
Teorema 4.4.4 Sia F : AI →R una funzione di classe C
1
. Supponiamo
che
(i) det
_
_
_
_
∂F
∂x
∂F
∂y

2
F
∂x∂a

2
F
∂y∂a
_
_
_
_
,= 0 in A I; (ii)

2
F
∂a
2
,= 0 in A I.
395
Allora le soluzioni del sistema
_
_
_
F(x, y, a) = 0
∂F
∂a
(x, y, a) = 0
formano una curva regolare Γ, parametrizzata da a ∈ I, la quale `e tangen-
te in ogni suo punto alla corrispondente curva Γ
a
(definita implicitamente
dall’equazione F(x, y, a) = 0). La curva Γ si dice inviluppo della famiglia
¦Γ
a
¦
a∈I
.
Dimostrazione La condizione (i), intanto, assicura che F
2
x
+ F
2
y
> 0 in
A I, e che quindi Γ
a
`e una curva regolare; tale condizione inoltre, in virt` u
del teorema del Dini (esercizio 1.9.4), assicura che il sistema dato definisce
implicitamente una curva Γ, parametrizzata nella forma x = p(a), y = q(a),
a ∈ I, con p, q di classe C
1
e
_
p
t
(a)
q
t
(a)
_
= −
_
_
_
_
∂F
∂x
∂F
∂y

2
F
∂x∂a

2
F
∂y∂a
_
_
_
_
−1
_
_
_
0

2
F

2
a
_
_
_
,
ove le derivate di F sono tutte calcolate in (p(a), q(a), a) e si `e usato il fatto
che F
a
(p(a), q(a), a) = 0. In particolare, Γ `e una curva regolare, poich´e da
(ii) segue che p
t
(a)
2
+ q
t
(a)
2
> 0.
Derivando rispetto ad a l’identit` a F(p(a), q(a), a) = 0 e tenendo conto ancora
una volta della condizione F
a
(p(a), q(a), a) = 0, si ricava
F
x
(p(a), q(a), a) p
t
(a) + F
y
(p(a), q(a), a) q
t
(a) = 0,
il che ci dice che il vettore tangente (p
t
(a), q
t
(a)) `e ortogonale al vettore
(F
x
(p(a), q(a), a), F
y
(p(a), q(a), a)), il quale `e normale alla curva Γ
a
: dunque
Γ risulta tangente a Γ
a
nel punto (p(a), q(a)).
Evoluta di una curva piana
Data una curva piana ϕϕϕ, regolare e di classe C
2
, con curvatura k(s) mai nulla,
il luogo dei suoi centri di curvatura (cio`e dei centri dei suoi cerchi osculatori)
396
`e una nuova curva che si chiama evoluta della curva ϕϕϕ. Se ϕϕϕ `e riferita al
parametro lunghezza d’arco, le equazioni parametriche dell’evoluta sono
(s) = ϕϕϕ(s) +
1
k(s)
N(s)
(si noti che s non `e il parametro lunghezza d’arco su ). L’evoluta `e una
curva regolare, ad eccezione dei punti in cui k
t
(s) = 0, che corrispondono ai
vertici della curva ϕϕϕ: infatti, per le formule di Fr´enet-Serret si ha

t
(s) = −
k
t
(s)
k(s)
2
N(s).
In particolare, la normale alla curva ϕϕϕ `e tangente alla sua evoluta; il punto
di tangenza `e (s), ossia il centro di curvatura relativo al punto ϕϕϕ(s).
Vediamo due propriet` a interessanti dell’evoluta.
Proposizione 4.4.5 L’evoluta di una curva regolare, di classe C
2
, con cur-
vatura mai nulla, `e l’inviluppo delle rette normali ad essa.
Dimostrazione Sia ϕϕϕ una curva piana, regolare e di classe C
2
, con curvatura
k(s) mai nulla, riferita al parametro lunghezza d’arco, e sia la sua evoluta.
La retta normale a ϕϕϕ(s) = (x(s), y(s)) ha equazione
F(x, y, s) = (x −x(s))x
t
(s) + (y −y(s))y
t
(s) = 0;
derivando questa relazione rispetto a s troviamo, ponendo (N
1
(s), N
2
(s)) =
N(s),
0 =
∂F
∂s
(x, y, s) = (x −x(s))x
tt
(s) + (y −y(s))y
tt
(s) −x
t
(s)
2
−y
t
(s)
2
=
= (x −x(s))k(s)N
1
(s) + (y −y(s))k(s)N
2
(s) −1.
Ricordando che = ϕϕϕ(s) +
1
k(s)
N(s), si deduce che (s) risolve il sistema
_
_
_
F(x, y, s) = 0
∂F
∂s
(x, y, s) = 0.
D’altra parte si vede facilmente che quando ϕϕϕ(s) non `e un vertice di ϕϕϕ si ha
397
det
_
_
_
_
∂F
∂x
∂F
∂y

2
F
∂x∂s

2
F
∂y∂s
_
_
_
_
= k(s) ,= 0,

2
F
∂s
2
=
k
t
(s)
k(s)
2
,= 0;
pertanto il teorema 4.4.4 ci fornisce la tesi.
Proposizione 4.4.6 Data una curva regolare ϕϕϕ, di classe C
2
, con curvatura
mai nulla, sia la sua evoluta. Fissato un intervallo [s
0
, s
1
] tale che ϕϕϕ[s
0
, s
1
]
non contenga vertici, la lunghezza dell’arco di evoluta relativo a tale inter-
vallo `e uguale alla differenza fra i raggi di curvatura (cio`e i raggi dei cerchi
osculatori) relativi ai due estremi ϕϕϕ(s
0
) e ϕϕϕ(s
1
).
Dimostrazione Sia σ il parametro lunghezza d’arco dell’evoluta a partire
da s
0
:
σ(s) =
_
s
s
0
[
t
(τ)[
2
dτ;
poich´e per ipotesi, k e k
t
non si annullano in [s
0
, s
1
], si ha
σ
t
(s) = [
t
(s)[
2
=
[k
t
(s)[
k(s)
2
=
¸
¸
¸
¸
d
ds
1
k(s)
¸
¸
¸
¸
=
¸
¸
¸
¸
d
ds
1
[k(s)[
¸
¸
¸
¸
.
Dunque, integrando fra s
0
e s
1
otteniamo
([
[s
0
,s
1
]
) = [σ(s
1
) −σ(s
0
)[
2
=
¸
¸
¸
¸
1
[k(s
1
)[

1
[k(s
0
)[
¸
¸
¸
¸
.
la tesi segue ricordando che
1
[k(s)[
`e il raggio di
curvatura relativo al punto ϕϕϕ(s).
Dalla proposizione 4.4.6 ricaviamo che, immaginando di tendere un pezzo di
filo inestensibile lungo l’evoluta fra (s
1
) e (s
0
), con la parte residua tesa
fra (s
0
) e ϕϕϕ(s
0
), accade la cosa seguente: “tirando” il filo teso in modo che
si stacchi via via dall’evoluta fino a tendersi in linea retta da (s
1
), il suo
secondo estremo, che prima era in ϕϕϕ(s
0
), descriver` a la curva ϕϕϕ (l’ evolvente
di ) fino a trovarsi teso fra (s
1
) e ϕϕϕ(s
1
).
398
Esempi 4.4.7 (1) Per la parabola y = x
2
, il luogo dei centri di curvatura
(esercizio 4.3.6) `e la curva
x(t) = −4t
3
, y(t) = 3t
2
+
1
2
;
eliminando la t, si ottiene come evoluta la parabola semicubica di equazione
16
_
y −
1
2
_
3
= 27x
2
.
(2) La cicloide (curva descritta da un punto su una circonferenza di raggio
1, centrata in un punto di quota 1, che rotola senza strisciare lungo l’asse x)
`e data dalle equazioni parametriche
x = π + t + sin t, y = −1 −cos t, t ∈ [−π, π].
Ricordando l’esercizio 4.3.3, l’evoluta di una curva ϕϕϕ(t) = (x(t), y(t)) di
parametro generico t `e data da
(t) = ϕϕϕ(t) +
1
k(t)
N(t) =
=
_
x(t) −y
t
(t)
x
t
(t)
2
+ y
t
(t)
2
x
t
(t)y
tt
(t) −x
tt
(t)y
t
(t)
, y(t) + x
t
(t)
x
t
(t)
2
+ y
t
(t)
2
x
t
(t)y
tt
(t) −x
tt
(t)y
t
(t)
_
.
Dato che
x
t
(t) = 1 + cos t, y
t
(t) = sin t, x
tt
(t) = −sin t, y
tt
(t) = cos t,
si deduce facilmente che
(t) = (π + t −sin t, 1 + cos t), t ∈ [−π, π],
399
ovvero, ponendo τ = t + π,
(τ −π) + (π, −2) = (π + τ + sin τ, −1 −cos τ), τ ∈ [0, 2π].
Queste sono le equazioni di una cicloide, ottenuta traslando del vettore
(π, −2) la cicloide originaria ϕϕϕ. Dunque, l’evoluta di una cicloide `e la stessa
cicloide.
Esercizi 4.4
1. Calcolare la curvatura dell’evoluta di una curva regolare ϕ, di classe
C
2
, con curvatura mai nulla, riferita al parametro lunghezza d’arco.
2. Determinare l’inviluppo della famiglia di segmenti di lunghezza , aventi
gli estremi sui due assi coordinati di R
2
, nonch´e l’evoluta di tale invi-
luppo.
3. Provare che l’inviluppo delle circonferenze passanti per l’origine e con
centro sull’iperbole y
2
− x
2
= 1 `e la lemniscata di Bernoulli (esempio
4.2.3).
4. Una sorgente posta sul bordo di un cerchio emette raggi luminosi che
vengono riflessi dal bordo del cerchio. Si trovi l’equazione dell’invilup-
po dei raggi riflessi (caustica di riflessione).
[Traccia: si supponga che il cerchio abbia
equazione x
2
+ y
2
≤ 1 e che la sorgente si
trovi in P = (1, 0). Il raggio che colpisce
(cos t, sin t) viene riflesso in (cos 2t, sin 2t); si
mostri che l’equazione del raggio riflesso ha la
forma F(x, y, t) = x(sin t −sin 2t) +y(cos t −
cos 2t) −sin t = 0.
Si provi poi che le soluzioni di F(x, y, t) = F
t
(x, y, t) = 0 sono date da
400
x =
2
3
cos t(1+cos t)−
1
3
, y =
2
3
sin t(1+cos t), ed usando coordinate po-
lari di centro (−
1
3
, 0) si provi che si arriva all’equazione ρ =
2
3
(1+cos ϑ),
che `e quella della cardioide (esercizio 4.1.6(xii)).]
5. Provare che l’evoluta della trattrice
_
x = ln
_
1+sin t
cos t
_
−sin t
y = cos t,
[t[ ≤
π
2
,
`e la catenaria y = cosh x, x ∈ R.
6. Trovare l’inviluppo delle circonferenze passanti per l’origine e con centro
sulla parabola y
2
= x (cissoide di Diocle, esercizio 4.3.9(iii)).
4.5 Curve sghembe
Analizziamo alcuni aspetti della geometria delle curve in R
3
, dette anche
“curve sghembe”. Sia ϕϕϕ : I →R
3
una curva regolare, di classe C
3
, riferita al
parametro lunghezza d’arco. Il versore tangente `e, come sappiamo,
T(s) = ϕϕϕ
t
(s);
diversamente dal caso delle curve piane, definiamo la curvatura di ϕϕϕ nel modo
seguente:
k(s) = [T
t
(s)[
3
.
Dunque per le curve sghembe la curvatura `e sempre non negativa (ricordiamo
che nel caso piano vale comunque [k(s)[ = [T
t
(s)[
2
). Se poi k(s) non `e nulla,
ricordando che la derivata di un versore `e un vettore ad esso ortogonale,
definiamo il versore normale principale come
N(s) =
T
t
(s)
k(s)
401
(quando k(s) = 0 il versore normale principale non viene definito). Vale di
conseguenza la relazione
T
t
(s) = k(s)N(s)
come nel caso piano.
Supporremo d’ora in avanti k(s) strettamente positiva. Il piano individuato
da T(s) e N(s) si chiama piano osculatore alla curva ϕϕϕ nel punto ϕϕϕ(s); il
punto c(s) di tale piano, a distanza
1
k(s)
da ϕϕϕ(s) nella direzione di N(s),
si chiama centro di curvatura, mentre il cerchio di centro c(s) e raggio
1
k(s)
,
contenuto nel piano osculatore, si dice cerchio osculatore. La retta ortogonale
al piano osculatore si chiama retta binormale, e il versore binormale B(s) `e
definito, come `e naturale, dal prodotto vettoriale
B(s) = T(s) N(s),
cosicch´e la terna (T(s), N(s), B(s)) , detta triedro principale della curva ϕϕϕ nel
punto ϕϕϕ(s), `e sinistrorsa al pari dei tre assi cartesiani x, y, z (e in particolare
il determinante della matrice che ha tali vettori come vettori colonna vale
+1).
Il piano individuato da N(s) e B(s) si dice (ovviamente) piano normale,
mentre quello individuato da B(s) e T(s) si chiama piano rettificante.
Osservazioni 4.5.1 (1) Il significato geometrico del piano osculatore `e il
seguente: fra tutti i piani che passano per il punto ϕϕϕ(s) e contengono il
vettore T(s) (che pensiamo uscente da ϕϕϕ(s)), esso `e l’unico che abbia un
contatto con la curva di ordine ≥ 3. Infatti i piani della forma
¸x −ϕϕϕ(s), a¸
3
= 0
hanno contatto in ϕϕϕ(s) di ordine ≥ 1. La derivata rispetto a s del primo
membro `e −¸ϕϕϕ
t
(s), a¸
3
, quindi il contatto `e di ordine ≥ 2 se e solo se
¸a, T(s)¸
3
= 0;
la derivata seconda `e ¸a, T
t
(s)¸
3
= k(s) ¸a, N(s)¸
3
, per cui il contatto `e di
ordine ≥ 3 se e solo se
¸a, T(s)¸
3
= 0, ¸a, N(s)¸
3
= 0.
L’unica retta ortogonale sia a T(s) che a N(s) `e ovviamente la retta binor-
male; ne segue a = λB(s) e dunque il nostro piano ha equazione
¸x −ϕϕϕ(s), B(s)¸
3
= 0,
402
ed `e perci`o il piano osculatore.
(2) L’equazione del piano normale `e
¸x−ϕϕϕ(s), T(s)¸
3
= ¸x−ϕϕϕ(s), ϕϕϕ
t
(s)¸
3
= 0,
e quella del piano rettificante `e
¸x−ϕϕϕ(s), N(s)¸
3
= ¸x−ϕϕϕ(s), ϕϕϕ
tt
(s)¸
3
= 0;
dette x(s), y(s), z(s) le componenti di ϕϕϕ(s), e ricordando l’espressione delle
componenti di un prodotto vettoriale, l’equazione del piano osculatore pu` o
scriversi nella forma
¸x −ϕϕϕ(s), T(s) N(s)¸
3
=
1
k(s)
det
_
_
x −x(s) y −y(s) z −z(s)
x
t
(s) y
t
(s) z
t
(s)
x
tt
(s) y
tt
(s) z
tt
(s)
_
_
.
Vediamo adesso come si ricavano le formule di Fr´enet-Serret nello spazio.
Sappiamo gi` a che T
t
(s) = k(s)N(s). Ricordando che N
t
(s) `e ortogonale a
N(s), sar`a
N
t
(s) = λ(s)T(s) + τ(s)B(s)
per certi λ(s), τ(s) ∈ R. Ma, essendo ¸N(s), T(s)¸
3
= 0, si ha anche
0 =
d
ds
¸T(s), N(s)¸
3
= ¸T
t
(s), N(s)¸
3
+¸T(s), N
t
(s)¸
3
=
= k(s)[N(s)[
2
3
+ λ(s)[T(s)[
2
3
+ τ(s) ¸T(s), B(s)¸
3
= k(s) + λ(s),
da cui λ(s) = −k(s). Quindi
N
t
(s) = −k(s)T(s) + τ(s)B(s);
il numero τ(s) si chiama torsione della curva ϕϕϕ nel punto ϕϕϕ(s).
Analogamente, sar` a
B
t
(s) = µ(s)T(s) + ν(s)N(s)
per certi µ(s), ν(s) ∈ R; ma
0 =
d
ds
¸B(s), T(s)¸
3
= ¸B
t
(s), T(s)¸
3
+¸B(s), T
t
(s)¸
3
=
= µ(s)[T(s)[
2
3
+ ν(s) ¸N(s), T(s)¸
3
+ k(s)¸B(s), N(s)¸
3
= µ(s),
403
0 =
d
ds
¸B(s), N(s)¸
3
= ¸B
t
(s), N(s)¸
3
+¸B(s), N
t
(s)¸
3
=
= µ(s) ¸T(s), N(s)¸
3
+ ν(s)[N(s)[
2
3
−k(s) ¸B(s), T(s)¸
3
+ τ(s)[B(s)[
2
3
=
= ν(s) + τ(s),
e partanto µ(s) = 0 e ν(s) = −τ(s), ossia
B
t
(s) = −τ(s)N(s).
In definitiva si hanno le relazioni
_
_
_
T
t
(s) = k(s)N(s)
N
t
(s) = −k(s)T(s) + τ(s)B(s)
B
t
(s) = −τ(s)N(s)
che costituiscono le formule di Fr´enet-Serret per le curve sghembe.
Qual `e il significato geometrico della curvatura e della torsione? Indicando
con ω(h) l’angolo fra T(s + h) e T(s), si ha ω(h) →0 per h →0 e
[T
t
(s)[
2
3
= lim
h→0
[T(s + h) −T(s)[
2
3
h
2
=
= lim
h→0
1
h
2
¸T(s + h) −T(s), T(s + h) −T(s)¸
3
+
= lim
h→0
2 −2 cos ω(h)
h
2
= lim
h→0
2 −2 cos ω(h)
ω(h)
2
lim
h→0
_
ω(h)
h
_
2
=
= lim
h→0
_
ω(h)
h
_
2
.
D’altra parte, il primo membro di questa catena di uguaglianze `e il quadrato
della curvatura, per cui
k(s) = lim
h→0
[ω(h)[
[h[
.
Dunque la curvatura misura quanto rapidamente la curva si stacca dalla sua
retta tangente in ϕϕϕ(s).
Similmente, se indichiamo con Ω(h) l’angolo fra B(s+h) e B(s), procedendo
allo stesso modo si trova
[τ(s)[ = lim
h→0
[Ω(h)[
[h[
.
404
Dato che Ω(h) `e anche l’angolo fra il piano osculatore in ϕϕϕ(s +h) e quello in
ϕϕϕ(s), otteniamo che il modulo della torsione misura quanto rapidamente la
curva si stacca dal piano osculatore.
Anche il segno di τ(s) ha un’interpretazione geometrica: se conveniamo di
scegliere come faccia positiva del piano osculatore quella che guarda verso
B(s) e come faccia negativa quella che guarda verso −B(s), allora la torsione
`e positiva se ϕϕϕ(s + h), per h > 0, si stacca dal piano osculatore sulla sua
faccia positiva (ossia ¸
ϕϕϕ(s+h)−ϕϕϕ(s)
h
, B(s)¸
3
> 0), mentre la torsione `e negativa
se ϕϕϕ(s + h), sempre per h > 0, si stacca dal piano osculatore sulla sua
faccia negativa (ossia ¸
ϕϕϕ(s+h)−ϕϕϕ(s)
h
, B(s)¸
3
< 0). Per provare questo fatto,
consideriamo il rapporto incrementale di ϕϕϕ nel punto s: dalla formula di
Taylor si ha
ϕϕϕ(s + h) −ϕϕϕ(s)
h
= ϕϕϕ
t
(s) +ϕϕϕ
tt
(s)
h
2
+ϕϕϕ
ttt
(s)
h
2
6
+ o(h
2
) per h →0,
ed usando le formule di Fr´enet-Serret
ϕϕϕ(s + h) −ϕϕϕ(s)
h
= T(s) +N(s)k(s)
h
2
+ [k(s)N(s)]
t
h
2
6
+ o(h
2
) =
= T(s)
_
1 −k(s)
2
h
2
6
_
+N(s)
_
k(s)
h
2
+ k
t
(s)
h
2
6
_
+
+ B(s)k(s)τ(s)
h
2
6
+ o(h
2
) per h →0.
Dunque, per h →0,
_
ϕϕϕ(s + h) −ϕϕϕ(s)
h
, B(s)
_
3
=
= k(s)τ(s)
h
2
6
+ o(h
2
),
cosicch´e per [h[ sufficientemente piccolo tale prodotto scalare ha esattamente
il segno di τ(s).
Le curve sghembe sono caratterizzate, a meno di moti rigidi dello spazio,
dalla curvatura e dalla torsione. Vale infatti il
Teorema 4.5.2 Sia I un intervallo di R contenente 0, e siano k ∈ C
1
(I) e
τ ∈ C(I) funzioni assegnate, con k > 0. Per ogni x
0
∈ R
3
e per ogni coppia
405
di versori ortogonali u e v esiste un’unica curva regolare ϕϕϕ : I →R
3
di classe
C
3
, riferita al parametro lunghezza d’arco, tale che
ϕϕϕ(0) = x
0
, ϕϕϕ
t
(0) = u, ϕϕϕ
tt
(0) = v,
e che abbia k(s) come curvatura e τ(s) come torsione.
Dimostrazione Le formule di Fr´enet-Serret costituiscono un sistema di
nove equazioni differenziali lineari, a coefficienti continui definiti in I, nelle
incognite T(s), N(s), B(s) (tre per ciascun vettore). Le condizioni iniziali
sono
T(0) = u, N(0) = v, B(0) = u v.
Dalla teoria dei sistemi differenziali lineari otteniamo l’esistenza e l’unicit` a
di tre funzioni vettoriali T(s), N(s), B(s) definite sull’intero intervallo I, che
risolvono le equazioni di Fr´enet-Serret. La curva cercata sar`a
ϕϕϕ(s) = x
0
+
_
s
0
T(r) dr, s ∈ I :
`e immediato infatti controllare che tale curva ha k(s) come curvatura e τ(s)
come torsione.
Occorre per` o mostrare che la terna T(s), N(s), B(s) `e, per ogni s ∈ I, una
terna di versori ortogonali or