You are on page 1of 9

Matriz Hessiana e Aplicaes

Sadao Massago
Dezembro de 2010

Sumrio
1 Introduo

2 Matriz Jacobiana

3 Matriz hessiana

4 Taylor de primeira e segunda ordem

5 Classicao dos pontos crticos

A Procedimeno da demonstrao do Teorema 5.5

B Taylor de ordem qualquer

1 Introduo
Sabemos que uma funo real de uma varivel poder ser aproximado por Taylor de segunda ordem na
qual costuma apresentar uma preciso melhor do que o uso somente das primeiras derivadas. O Taylor
de segunda ordem tambm permite obter critrios de classicao dos pontos crticos no degenerados
atravs da segunda derivada. No caso das funes reais de vrias variveis tambm apresenta os
resultados similares, mas a segunda derivada uma matriz, o que aumentar a complexidade.

2 Matriz Jacobiana
Dado uma funo vetorial de vrias variveis F : Rm Rn com F (X) = (f1 (X), . . . , fn (X)), a
representao matricial da derivada, quando existe, denominada de matriz Jacobiana denido

f1

0
f1
x
f1
x1
m
.
.
..
..
como sendo JF(x1 , . . . , xn ) = .. = ..
.
. . Quando m = n, a matriz jacobiana

fn

fn
x1

fn
xm

uma matriz quadrada e o seu determinante

(f1 ,...,fn )
(x1 ,...,xm )

f1
x1

= det ...

fn
x1

..
.

f1
xm

..
.

denominado de

fn
x
m
funo jacobiana. Os livros de clculo costumam designar a funo jacobiana simplesmente como
jacobiana.

Exemplo 2.1.

Obter a matriz jacobiana de F (x, y) = x y,

Soluo: JF (x, y) =

x2 y
x
y

xy

2xy

x2

1
y

x
y2

x
,x
y

y .

Exemplo 2.2.



Obter a funo jacobiana de F (x, y) = xy, xy .
"
#0 "
#
xy
y x
(xy, x
y)
= det JF (x, y) =
Soluo: JF (x, y) =
.
Assim,
a
funo
jacobiana

=
x
x
1
(x,y)
2
y
y
y
"
#
y x
det 1 x = x
xy = 2x
.
y
y
y

y2

3 Matriz hessiana
Dada uma funo real de vrias variveis, f : Rn R, a matriz jacobinana (derivada) do gradiente (que funo vetorial) denominado de matriz hessiana de f . Assim, Hessf (x1 , . . . , xn ) =
f 2 f

2f

x1 x1
xn x1
x1

..
..
..
J ... =
.
.
.
.
f
x1 xn

f
xn x
n
A matriz hessiana sempre uma matriz quadrada. O determinante da matriz hessiana denominado de funo hessiana que no pode ser confundido com a matriz hessiana. Nos livros de clculo,
a funo hessiana costuma ser referenciado simplesmente de hessiana.
f
xn

Exemplo 3.1.

2 3
Obter a matriz e a funo
" hessiana
# da funo f (x, y) = x y .
"
#
3
3
2xy
2xy
Soluo: f (x, y) = (2xy 3 , 3x2 y 2 ) =
e a matriz hessiana Hessf (x, y) = J
=
3x2 y 2
3x2 y 2
"
#
"
#
2y 3 6xy 2
2y 3 6xy 2
. A funo hessiana det Hess(f )(x, y) = det
= 12x2 y 4 36x2 y 4 =
6xy 2 6x2 y
6xy 2 6x2 y
24x2 y 4 .

3.2. Como conseqncia do Teorema de Schwartz, quando a matriz hessiana for contnua,
ele ser uma matriz simtrica.

Observao

4 Taylor de primeira e segunda ordem


Seja f : Rn R, uma funo real de vrias variveis. O Taylor de ordem 2 (que pode ser obtido
pelo uso de Taylor do caso de uma varivel sobre a reta P + t(X P )) dado por
R2
f (P + H) = f (P ) + hf (P ), Hi + 21 hhessf (P )H, Hi + R2 onde lim
= 0 e H = X =
n ||H||2
X P = (x1 , . . . , xn ) um vetor. O resto do Taylor de segunda ordem envolve derivadas parciais
de ordem 3, o que no entraremos em detalhes.
No caso de uma varivel, o reso de Taylor de ordem n o (n + 1)-simo termo do Taylor, com a
derivada calculado no ponto desconhecido entre P e P + H . Isto vale tambm para o caso de vrias
variveis, mas os termos de Taylor de ordem maior ou igual a 3 requer o uso da forma combinatorial,
enquanto que at a segunda ordem, poder ser escrito atravs da expresso vetorial e matricial.
No caso da funo de uma varivel, o Taylor de primeira ordem
2

f (P + H) = f (P ) + hf (P ), H > +R1 com R1 = 12 hHessf (ZH )H, Hi para algum ponto ZH no


segmento que liga P a P + H . No entanto, obter um bom limitante superior para R1 requer o uso
da norma matricial.

Exemplo 4.1.

Obter o Taylor de segunda ordem de f (x, y) = exy sen(y x) em torno de (0, 0).
Soluo: Como a funo tem as derivadas de qualquer ordem, a segunda derivada contnua e a
matriz hessiana ser simtrica.

f (0, 0) = 0

f (x, y) = exy sen(y x) exy cos(y x), exy sen(y x) + exy cos(y x)

= exy (sen(y x) cos(y x)) , exy (sen(y x) + cos(y x))
de modo que f (0, 0) = (0 1, 0" + 1) = (1, 1).

Hessf (x, y) = (F (x, y))0 =

exy (sen(y x) cos(y x))


exy (cos(y x) sen(y x))

#0
.

Temos,

(exy (sen(yx)cos(yx)))
=
= exy (sen(y x) + cos(y x))+exy ( cos(y x) + sen(y x)) =
x
2e
sen(y x).
(exy (sen(yx)cos(yx)))
2f
=
= exy (sen(y x) cos(y x))+exy (cos(y x) + sen(y x)) =
yx
y
2exy cos(y x).
2f
2f
= yx
= 2exy cos(y x) por hessiana ser simtrica.
xy
Neste exemplo, temos que f
= f
(no vale no caso geral) e
y
x



2f
f
2f

= y
= y
x
= yx
= 2exy sen(y x).
yy
y
"
#
2exy sen(y x) 2eyx cos(y x)
Assim, Hessf (x, y) =
.
2exy cos(y x) 2exy sen(y x)
"
#
0 2
Logo, Hessf (0, 0) =
.
2 0
Assim, o Taylor de ordem 2 em (0, 0) dado por
" #
h
1
, (h, k)i + R2 ento o polinmio
f (0 + h, 0 + k) = f (0, 0) + hf (0, 0), (h, k)i + 2 hhessf (0, 0)
k
"
#" #
0
2
h
de Taylor de ordem 2 ser p2 (h, k) = 0 + h(1, 1), (h, k)i + 12 h
, (h, k)i = 0 h + k +
2 0
k
"
#
2k
1
h
, (h, k)i = h + k + 21 h(2k, 2h), (h, k)i = h + k + 4hk
e temos
2
2
2h
p2 (h, k) = h + k + 2hk . Como x = 0 + h e y = 0 + k , temos que h = x e k = y . Substituindo
no polinmio, temos p2 (x, y) = x + y + 2xy . Observe que importante deixar escrito em x e y em
vez de h = x e k = y , pois a varivel da funo f x e y .
Por exemplo, f (0.2, 0.3)
= 0.2 + (0.3) + 2 0.2 (0.3) = 0.5 + 0.04 0.12 = 0.58.
2f
xx
xy

5 Classicao dos pontos crticos


Como a funo cresce na direo do gradiente e decresce na direo oposta do gradiente, nos pontos
de mximos e mnimos locais o gradiente ser nulo, caso exista.
3

Denio 5.1.

O ponto P tal que f (P ) = @ ou f (P ) = ~0 denominado de ponto crtico de f .


A imagem do ponto crtico denominado de valor crtico.
Um ponto dito ponto regular se no for ponto crtico. O valor no crtico denominado de valor
1
regular. O valor regular requer cuidado. Um valor C regular se f
(C) = {X : f (X) = C} no
contm pontos crticos (no existe ponto crtico P tal que f (P ) = C ). Portanto, para ser um valor
regular, no basta que seja imagem do ponto regular.

Exemplo 5.2.

Encontre os pontos crticos de f (x, y) = x 3 y + 1 x.

x
Soluo: Temos que f (x, y) = ( 3 y + 1 1,
3
3

(y+1)2

Pontos crticos
1o.) f (P ) = @ Quando y = 1, independente de x ento (x, 1).
2o.) f (P ) = ~0 Quando x = 0 e y = 0 (exerccio).
Assim, os pontos crticos so (x, 1) e (0, 0).

Denio 5.3.

Seja P , um ponto do domnio de f : D Rn R.

O ponto P dito ponto de mnimo local se para todo ponto X 6= P sucientemente prximo de
P , tem-se que f (X) f (P ). Se a desigualdade for estrita (f (X) > f (P )) ento dizemos que
ponto de mnimo local estrito. No ponto de mnimo local estrito, a funo cresce em todas as
direes.
O ponto P dito ponto de mximo local se para todo ponto X 6= P sucientemente prximo
de P , tem-se que f (X) f (P ). Se a desigualdade for estrita (f (X) < f (P )) ento dizemos
que ponto de mximo local estrito. No ponto de mximo local estrito, a funo decresce em
todas as direes.
O ponto P dito ponto de sela quando tiver uma direo que cresce e outra direo que
decresce. No deve confundir com o ponto planar na qual a funo mantm constante perto
do ponto.
Note que os valores calculados nos pontos de mximos e mnimos so denominados de valor de
mximo e valor de mnimo, respectivamente.
Seja P , um ponto crtico do tipo f (P ) = ~0. Quando a matriz hessiana for matriz singular
(det Hessf (P ) = 0), dizemos que o ponto crtico degenerado. Reciprocamente, um ponto crtico na
qual det Hessf (P ) = 0 denominado de ponto crtico no degenerado.
Para enunciar o teorema de classicao dos pontos crticos, precisamos de determinante dos
menores principais que denido como a seguir.

a1,1 a1,n
.
..
..
Denio 5.4. O determinante do menor principal de A =
.
..
. de ordem i denido

an,1

an,n

a1,1 a1,i
..
..
..
.
.
. que o determinante do bloco de tamanho ii localizado
ai,1 ai,i
na posio superior esquerdo de A.

como i = i (A) = det

No caso de Hessf (X) ser contnua em P , a matriz hessiana e simtrica e podemos mostrar que
4

Teorema 5.5.

Seja

det Hessf (P ) 6= 0)

um ponto critico no degenerado da funo

f : Rn R (f (P ) = ~0

com todas as derivadas parciais de segunda ordem so contnuas, ento

1.

i (Hessf (P )) > 0 para todo i = 1, . . . , n (todos i 's so estritamente positivos)


se P ponto de mnimo local estrito (funo cresce em todas as direes).

2.

(1)i i (Hessf (P )) > 0 para todo i = 1, . . . , n (sinal de i alternado, comeando de negativo)


se, e somente se, P o ponto de mximo local estrito (funo decresce em todas as direes).

se, e somente

3. Se for nenhuma das anteriores, ento o ponto de sela (tem direo em que a funo cresce e
outra direo em que a funo decresce).

Observe que o critrio deve coincidir com o caso de uma varivel quando n = 1. Logo, 1 < 0
para mximo local.
A demonstrao de 1 pode ser feita pela anlise do Taylor de segunda ordem atravs do Teorema
Espectral que costuma ser estudado no segundo curso de lgebra Linear. Para completar a demonstrao, tambm vai precisar do Teorema sobre determinantes dos menores principais da matriz
simtrica.
Para parte de 2, observe que P um ponto de mximo local estrito se, e somente se f (x) < f (P )
para todos os pontos X 6= P , sucientemente prximos de P . Isto quer dizer que f (X) < f (P )
para tais pontos. Assim, P ponto de mximo local restrito de f se, e somente se, P o ponto
de mnimo local restrito de f . Como Hess(f )(P ) = Hessf (P ), temos que i (Hess(f )(P )) =
(1)i (Hessf (P )). Logo, i (Hess(f )(P )) = (1)i (Hessf (P )) > 0 se, e somente se, P um
ponto de mnimo local restrito de f , isto , um ponto de mximo local restrito de f .
O caso do ponto de sela pela excluso, observando que no caso de det Hessf (P ) 6= 0, o ponto deve
ser de mximo local restrito, mnimo local restrito ou de sela, como consequncia do Teorema A.2.
5.6. No caso do ponto crtico degenerado (det Hessf (P ) = 0), no podemos determinar
o comportamento atravs do Teorema 5.5. Uma alternativa obter os auto valores da matriz hessiana e usar o Teorema A.2 na qual permite tirar concluses mesmo para alguns casos degenerados
(det Hessf (P ) = 0).

Observao

5.7. No caso do domnio no ser aberto, o ponto regular ou o ponto de sela na fronteira
pode tornar mximo ou mnimo local, o que aumenta a complexidade de estudos, mesmo considerando
os gradientes e hessianas, estendidos para a fronteira. O mtodo de multiplicadores de Lagrange
permite detectar possveis "pontos regulares" que tornaram pontos crticos na curva ou superfcies,
mas anlise de mximos e mnimos locais sobre a curva e superfcies costumam ser omitidos nos
cursos de clculo.

Observao

Exemplo 5.8.

Obter e classicar o ponto crtico de f (x, y) = x2 + y 2 + z 2

2 0 0

Soluo: O ponto crtico exatamente (0, 0, 0) (exerccio) e Hessf (0, 0, 0) = 0 2 0 (exer0 0 2


ccio). Obtendo o determinante dos menores principais de

2 0 0

0 2 0
0 0 2
5

temos que 1 = 2 > 0, 2 > 0 e 3 = det Hessf (0, 0, 0) = 8 > 0. Logo, (0, 0, 0) um ponto de
mnimo local.
No exemplo acima, como f (0, 0, 0) = 0 e f (x, y, z) 0 para todo (x, y, z), (0, 0, 0) um ponto de
mnimo global.
5.9. No caso da funo de vrias variveis, ter um nico ponto crtico e ele ser ponto
de mnimo local no implica que um ponto de mnimo global. A funo f (x, y) = x2 + y 2 (1 + x)3
tem um nico ponto crtico que a origem e um ponto de mnimo local, o que pode ser vericado
facilmente pela matriz hessiana. No entanto, lim f (x, y) = (exerccio). Logo, (0, 0) no um
Observao

y=1
x

ponto de mnimo global.


Problemas similares ocorrem quando tenta generalizar os resultados da funo de uma varivel
para caso das funes de vrias variveis. Alguns resultados continuam vlidos, outros precisam de
condies adicionais ou ter resultados apenas parciais, enquanto que alguns no valem.

Exemplo 5.10.

Obter e classicar o ponto crtico de f (x, y) = xy

"
Soluo: O ponto crtico exatamente (0, 0) (exerccio) e Hessf (0, 0) =

0 1
1 0

#
(exerccio).

Calculando
os
"
# i 's de
0 1
1 0
temos que 1 = 0 e 2 = det Hessf (0, 0) = 1. Como det Hessf (0, 0) 6= 0, um
ponto de mximo local, mnimo local ou sela. Mas 1 = 0 e consequentemente, (0, 0) um ponto de
sela.

Exemplo 5.11. Considere um ponto crtico P R3 na qual a funo tem segunda derivada contnua.
Em cada caso, efetue classicao, justicando devidamente. Note que 3 = det Hessf (P ) por ser
de 3 variveis.
1. 1 = 1, 2 = 2 e 3 = 4. Soluo: como todos i so (estritamente) positivos, um ponto
de mnimo local (estrito).
2. 1 = 1, 2 = 4 e 3 = 2. Soluo: como i 's tem sinais alternados e 1 < 0, um ponto
de mximo local (estrito).
3. 1 = 2, 2 = 1 e 3 = 3. Soluo: Como 3 = det Hessf (P ) = 2 6= 0 , ponto de
minimo

local, mximo local ou de sela. Os i 's tem sinais alternados, mas o primeiro (1 )
no negativo. Logo no ponto de mximo local. Como 2 = 1 < 0, no mnimo local.
Logo, um ponto de sela.
4. 1 = 2, 2 = 1 e 3 = 2. Soluo: Temos que nem todas i 's so positivos, nem tem
sinais alternados. Como 3 = det Hessf (P ) = 2 6= 0, um ponto de sela.
5. 1 = 1, 2 = 0 e 3 = 2. Soluo: como 2 = 0, no pode ser mnimo local (no estritamente
positiva), nem mximo local (sinal alternado). Como 3 = det Hessf (P ) = 2 6= 0, s pode
ser ponto de sela.
6. 1 = 2, 2 = 1 e 3 = 0. Soluo: como 3 = det Hessf (P ) = 0, nada pode ser concludo.
6

No caso da classicao dos pontos crticos no degenerados da funo real de duas variveis,
a expresso de i relativamente simples. Por exemplo,
 2  O critrio para mnimo local restrito
2f 2f
f
f
> 0, Analogamente, o ponto de mximo
caria1 = xx > 0 e 2 = det Hessf = xx yy xy
 2 
f
2f 2f
f
local restrito ((1)i i > 0) torna xx
> 0. Como a parte de
< 0 e det Hessf = xx

yy
xy
2 mesmo, podemos juntar e enunciar como sendo

Teorema 5.12.

Se

f : R2 R

tem segundas derivadas parciais contnuas e

um ponto crtico,

ento

f
f
Se det Hessf (P ) > 0 ento xx
> 0 implica que um ponto de mnimo local estrito, xx
<0
f
implica que um ponto de mximo local estrito e xx = 0 implica que ponto de sela.

Se det Hessf (P ) < 0, ento um ponto de sela.

 2 
f
2f 2f

= 0), nada pode ser


No caso do ponto crtico ser degenerado (det Hessf (P ) = xx
yy
xy
armado.
Esta uma das verses que mais aparece nos livros de clculo, mas no h anloga para o caso
de Rn , pois i torna mais complexa e no consegue explicitar condies em poucas palavras.
5.13. A tcnica mais rpida e simples para determinar se i so todos positivos no caso
da matriz simtrica de dimenso maior que 3 aplicar o mtodo de decomposio de Cholesky.
Observao

A Procedimeno da demonstrao do Teorema 5.5


Este apndice destina aos estudantes que j tenham algum conhecimento de lgebra linear, tais como
base e auto valores.
No estudo terico da funo real de vrias variveis com segundas derivadas parciais contnuas
(logo, matriz hessiana simtrica), o Teorema Espectral (veja [4]) desempenha um papel importante.
O Teorema Espectral garante que toda matriz simtrica tem uma base ortonormal de auto vetores.
Usando uma base de auto vetores ortonormais da matriz hessiana, temos que

Teorema A.1.

f : Rn R

P , ento existe
uma base na qual a sries de Taylor de segunda ordem tem a forma f (P +H) = f (P )+hf (P ), Hi+
1
(1 h21 + + n h2n ) + R2 onde H = (h1 , . . . , hn ) e 1 , . . . , n so os auto valores de Hessf (P ).
2
Se

tem segundas derivadas parciais contnuas no ponto

A expanso do Taylor de segunda ordem em torno do ponto crtico f (P ) = ~0 torna f (P + H) =


f (P ) + 21 (1 h21 + + n h2n ) + R2 que no depende da base, exceto nas coordenadas hi de H (pois os
auto valores no dependem da base). Por ser uma soma dos mltiplos de quadrados das coordenadas,
podemos usar a condio sobre o erro do Taylor e provar que

Teorema A.2.

Se

f : Rn R

tem segundas derivadas contnuas e

um ponto crtico. Ento

P um ponto de mximo local estrito se todos os autovalores da matriz hessiana forem estritamente negativos.
P um ponto de mnimo local estrito se todos os auto valores da matriz hessiana forem
estritamente positivos
Se tiver algum auto valor estritamente positivo e algum auto valor estritamente negativo, ento
P ser um ponto de sela.
7

O Teorema 5.5 uma consequncia do Teorema A.2 para o caso no degenerado. No caso da matriz
simtrica, todos os auto valores so estritamente positivos se, e somente se, todos os determinantes
dos menores principais so estritamente positivos (veja [4]).
O Teorema 5.5 apropriado para analisar uma funo com expresso dada explicitamente e com
poucas variveis, enquanto que o Teorema A.2 apropriado para os estudos tericos ou dos pontos
crticos degenerados.

B Taylor de ordem qualquer


Este apndice destinado para quem precisar do Taylor de ordem maior que 2 que pode ser usado
tanto no estudo terico como na implementao computacional.
Dado f : Rn R, a expanso de Taylor de ordem N
! dado por
N
n
n
k
X X
X f (P )
RN
hi1 hik + RN com lim
= 0.
f (P + H) =

||H|| ||H||N
x

x
i
i
1
k
i1 =1
ik =0
k=0
Para facilitar no uso terico, assim como reduzir os nmeros de termos necessrios na implementao computacional, costuma usar a notao de multi ndices.
Um multi ndice de dimenso n uma n-upla = (1 , . . . , n ) onde i so inteiros no negativos.
O valor absoluto e o fatorial so denidos como sendo || = 1 + + n e a! = a1 ! n !,
respectivamente. Dado uma n-upla x = (x1 , . . . , xn ), denimos a potenciao x = x1 1 xnn .
A derivada parcial repetida tambm pode ser escrita em termos de multi ndices como sendo

n
= x11 xn onde xi a i-sima varivel da funo em n-variveis.
Com estas notaes, a expanso de Taylor de
ordem N pode ser
escrito simplesmente como sendo
N

X f (P )H
X X f (P )H
RN

+ RN com lim
+ RN =
= 0, onde
F (P + H) =
||H|| ||H||N
!
!
k=0
||N
||=k
X f (ZH )H
RN =
com ZH pertencente ao segmento que liga P a P + H .
!
||=N +1

A expresso em termos de multi ndices permite usar resultados da teoria combinatorial no estudo
dos problemas que envolvem o Taylor de ordem maior que 2.
Tambm note que na notao de multi ndices, os termos repetidos j esto agrupados, tendo
reduzido signicativamente os nmeros de termos da expresso original. A implementao computacional tpica percorre os possveis multi ndices de ordem k atravs do algoritmo combinatorial para
obter termos de ordem k da expanso de Taylor.

Referncias
[1] Lima, Elon L., "Curso de Anlise vol. 2" (projeto euclides), IMPA, 1985.
[2] Lang, Serge, "Clculo vol. 2", Ao Livro tcnico S/A, 1971.
[3] Guidorizzi, Hamilton L., "Clculo vol. 1", LTC editora, 2001.
[4] Homan, Kenneth e Kunze, Ray (traduo de Bergamasco, Adalberto P.), "lgebra
Linear", Editora da USP, 1971.

[5] Wikipdia, http://en.wikipedia.org/wiki/Multi-index_notation, consultado em


2010.

You might also like