Diferencia Bili Dad

Diferenciabilidad en R
n
Ramon Sellanes
Matematica
I.P.A. 2010
Parte I
Diferenciabilidad de funciones de
R
n
en R
1. Derivadas Parciales
Recordemos que para funciones de una variable f : I R R denida en el
intervalo abierto I de R, se dene la derivada de f en x
0
I, denotada por f
(x
0
),
como el valor del lmite
f
(x
0
) = lm
h0
f(x
0
+ h) f(x
0
)
h
cuando este existe (en cuyo caso decimos que f es derivable en dicho punto). Ademas
sabemos que si f
(x
0
) existe, su valor nos da la pendiente de la recta tangente a la
graca de la funcion f de expresion y = f(x) en el punto (x
0
, f(x
0
)).
Resulta deseable, disponer de un concepto similar para funciones de varias va-
riables, comencemos por considerar la siguiente denicion.
Denicion 1.1. Dada una funcion de dos variables f : U R
2
R denida en
un conjunto U de R
2
. Sea a = (x
0
, y
0
) un punto de

U. Se dene la derivada parcial
de f con respecto a x (la primer variable de f) en el punto a denotada por
f
x
(a) (o
f
x
(a) o simplemente f
x
(a) o f
1
(a) o D
1
f(a)), como el lmite
f
x
(a) = lm
h0
f(x
0
+ h, y
0
) f(x
0
, y
0
)
h
cuando este lmite existe. Del mismo modo la derivada parcial de f con respecto a
y (la segunda variable de f) en a denotada por
f
y
(a) (o f
y
(a) o f
2
(a) o D
2
f(a)), es
el lmite
f
y
(a) = lm
h0
f(x
0
, y
0
+ h) f(x
0
, y
0
)
h
siempre que exista.
Analogamente, se denen las funciones derivadas parciales de f respecto a x e y
como
f
x
(x, y) = lm
h0
f(x + h, y) f(x, y)
h
f
y
(x, y) = lm
h0
f(x, y + h) f(x, y)
h
1
cuyos dominios de denicion estan formados por todos los puntos a = (x, y) interiores
de U donde estos lmites esten bien denidos.
Observaci on 1.1. Observando con detenimiento estas deniciones vemos que tiene
los mismos ingredientes de la denicion de derivada de una funcion de una sola va-
riable. Mas concretamente si consideramos la funcion (x) = f(x, y
0
) que se obtiene
de jar en la funcion f(x, y) la variable y como y
0
, sabemos que la derivada de en
x = x
0
es
(x
0
) = lm
h0
(x
0
+ h) (x
0
)
h
= lm
h0
f(x
0
+ h, y
0
) f(x
0
, y
0
)
h
=
f
x
(a)
Analogamente si denimos (y) = f(x
0
, y) se tiene
(y
0
) =
f
y
(a)
Se puede observar ademas que desde el punto de vista geometrico, la funcion (x) =
f(x, y
0
) representa la curva que se obtiene al intersecar la supercie z = f(x, y) con el
plano y = y
0
. Esta es una curva que en el punto x = x
0
tiene una recta tangente cuya
pendiente es precisamente
(x
0
) =
f
x
(a). Analogamente la funcion (y) = f(x
0
, y)
representa la curva obtenida de la intersecci on de la supercie z = f(x, y) con el
plano x = x
0
con recta tangente en el punto y = y
0
de pendiente
(y
0
) =
f
y
(a).
Ejemplo 1.1. Sea f : U R
2
R dada por la expresion f(x, y) = x
2
y
3
, entonces
f
x
(x, y) = lm
h0
f(x + h, y) f(x, y)
h
= lm
h0
(x + h)
2
y
3
x
2
y
3
h
= lm
h0
h(2x + h)y
3
h
= lm
h0
2xy
3
+ hy
3
= 2xy
3
que coincide con la derivada de la expresion x
2
y
3
respecto de x como si la y se tratase
de una constante. Analogamente se tiene
f
y
(x, y) = lm
h0
f(x, y + h) f(x, y)
h
= lm
h0
(x)
2
(y + h)
3
x
2
y
3
h
= lm
h0
3x
2
y
2
h + 3x
2
yh
2
+ x
2
h
3
h
= lm
h0
3x
2
y
2
+ 3x
2
yh = 3x
2
y
2
que coincide con la derivada de la expresion x
2
y
3
respecto de y como si la x se tratase
de una constante.
De aqu en mas para hallar las derivadas parciales en los puntos interiores al
conjunto donde esta denida la funcion (dominio de f), podemos proceder de esa
manera.
2
R dada por la expresion f(x, y) = sen(
2x
3
+ y
2
)
f
x
(x, y) =
_
cos
2x
3
+ y
2
_
1
2
2x
3
+ y
2
(6x
2
) =
3x
2
cos
2x
3
+ y
2
2x
3
+ y
2
analogamente
f
y
(x, y) =
_
cos
2x
3
+ y
2
_
1
2
2x
3
+ y
2
(2y) =
y cos
2x
3
+ y
2
2x
3
+ y
2
2
Ejemplo 1.3. Sea la funcion f(x, y) = x
2
+ y
2
las derivadas parciales en el punto
(1, 0), son
f
x
(1, 0) = 2x|
(1,0)
= 2(1) = 2
f
y
(1, 0) = 2y|
(1,0)
= 2(0) = 0
Ejemplo 1.4. Sea la funcion f(x, y) = xe
x
2
y
sus derivadas parciales en el punto
(1, L2), son
f
x
(x, y) = e
x
2
y
+ xe
x
2
y
2xy = (1 + 2x
2
y)e
x
2
y
luego
f
x
(1, L2) = (1 + 2x
2
y)e
x
2
y
|
(1,L2)
= (1 + 2L2)e
L2
= 2 + 4L2
analogamente
f
y
(1, L2) = xe
x
2
y
x
2
|
(1,L2)
= x
3
e
x
2
y
|
(1,L2)
= e
L2
= 2
Antes de introducir la denicion mas general de derivada parcial, conviene rees-
cribir las derivadas parciales para funciones de dos variables de la siguiente manera,
sea un punto a = (x, y) y los vectores unitarios e
1
= (1, 0) y e
2
= (0, 1) entonces
f
x
(a) = lm
h0
f(x + h, y) f(x, y)
h
= lm
h0
f ((x, y) + h(1, 0)) f(x, y)
h
= lm
h0
f(a + he
1
) f(a)
h
Y escribimos
f
x
(a) = lm
h0
f(a + he
1
) f(a)
h
analogamente para la derivada parcial respecto a y se tiene
f
y
(a) = lm
h0
f(a + he
2
) f(a)
h
Ahora si generalizamos las deniciones dadas hasta ahora de derivadas parciales
para funciones escalares de dominio R
n
.
Denicion 1.2. Sea f : U R
n
R una funcion escalar, dependiente de n
variables reales, denida en U R
n
y sea a = (x
1
, . . . , x
n
)

U un punto interior
de su dominio. Llamamos derivada parcial de f en el punto a con respecto a la
variable x
i
a
f
x
i
(a) = lm
h0
f(a + he
i
) f(a)
h
= lm
h0
f(x
1
, . . . , x
i
+ h, . . . , x
n
) f(x
1
, . . . , x
n
)
h
siempre que este lmite exista y siendo e
i
= (0, . . . , 1, . . . , 0) que todas sus compo-
nentes son nulas salvo la que ocupa el lugar i que vale 1.
3
Ejemplo 1.5. Para una funcion f(x, y, z) tenemos que en a R
3
generico:
f
z
(a) = lm
h0
f(x, y, z + h) f(x, y, z)
h
y para la funcion f(x
1
, x
2
, x
3
, x
4
) se tiene donde a R
4
generico
f
x
4
(a) = lm
f(x
1
, x
2
, x
3
, x
4
+ h) f(x
1
, x
2
, x
3
, x
4
)
h
3
R dada por la expresion f(x, y, z) = e
x
3
y
4
z
5
.
Entonces
f
x
= e
x
3
y
4
z
5
(3x
2
y
4
z
5
),
f
y
= e
x
2
y
4
z
5
(x
3
4y
3
z
5
),
f
z
= e
x
3
y
4
z
5
(x
3
y
4
5z
4
)
Estamos interesados en introducir una denicion de diferenciabilidad que sea de
alguna forma equivalente a la dada para funciones de una sola variable, es deseable
que se conserve la propiedad que asegura la continuidad en un punto a partir que la
diferenciabilidad en ese punto. Nos podemos preguntar si a partir de las existencia
de las derivadas parciales de una funcion f : U R
n
R en un punto a

U nos
puede asegurar la continuidad en ese punto, pero vasta ver un ejemplo para ver que
no es as.
Ejemplo 1.7. Consideremos la funcion
f(x, y) =
_
xy
x
2
+y
2
si (x, y) = 0
0 si (x, y) = 0
Calculemos las derivadas parciales en (0, 0), por medio de la denicion de las mismas
f
x
(0, 0) = lm
h0
f(h, 0) f(0, 0)
h
= lm
h0
h(0)
h
2
+0
2
0
h
= lm
h0
0
h
= 0
y
f
y
(0, 0) = lm
h0
f(0, h) f(0, 0)
h
= lm
h0
(0)h
0
2
+h
2
h
= lm
h0
0
h
= 0
De modo que la funcion tiene ambas derivadas parciales iguales a cero en el origen.
Sin embargo
lm
(x,y)(0,0)
f(x, y) = lm
x0
f(x, 0) = lm
x0
x(0)
x
2
+ 0
2
= 0
lm
(x,y)(0,0)
f(x, y) = lm
x0
f(x, x) = lm
x0
x
2
x
2
+ x
2
=
1
2
por lo que no existe el lmite en el origen, y en consecuencia no es continua en ese
punto.
Ahora estudiaremos un concepto mas fuerte que el de derivada parcial, como
para poder introducir luego el concepto de diferenciabilidad como lo deseamos, que
conserve la propiedad que mencionamos mas arriba (diferenciabilidad implica con-
tinuidad).
4
2. Derivadas direccionales
En primer lugar vamos a denir derivadas direccionales para funciones escalares
en R
2
es decir para f : U R
2
R, queremos estudiar la variaci on de la funcion
en una determinada direccion u R
2
.
2
R una funcion escalar de dos variables denidas
en U R
2
y a = (x
0
, y
0
)

U un punto interior de U. Se dene la derivada direccional
de f en el punto a y con respecto al vector unitario u como
f
u
(x
0
, y
0
) = lm
h0
f(a + hu) f(a)
h
= lm
h0
f(x
0
, y
0
) + hu) f(x
0
, y
0
)
h
siempre que exista.
Se denomina funcion derivada direccional seg un el vector unitario u a la aplica-
cion que a cada punto interior (x, y)

U, le asocia el valor vectorial
f
u
(x, y).
Seg un esta denicion la derivadas parciales son casos particulares de las derivadas
direccionales, a saber
f
x
=
f
e
1
f
y
=
f
e
2
es decir que la derivada parcial respecto a x es la derivada direccional respecto al
vector e
1
= (1, 0) y la derivada parcial respecto de y es la derivada direccional
respecto a la direccion del vector e
2
= (0, 1).
Ejemplo 2.1. Estudiemos la derivadas parciales y direccionales de la funcion f(x, y) =
e
xy
en un punto interior de su dominio de denicion. Tenemos que las derivadas par-
ciales son
f
x
(x, y) = ye
xy
f
y
(x, y) = xe
xy
Ahora utilizando la denicion de derivada direccional seg un el vector u = (cos t, sen t),
resulta
f
u
(x, y) = lm
h0
e
(x+hcos t)(y+hsen t)
e
xy
h
y eliminando la indeterminacion mediante la regla de LHopital obtenemos
f
u
(x, y) = lm
h0
(cos t(y + hsen t) + (x + hcos t) sen t) e
(x+hcos t)(y+hsen t)
= (y cos t + x sen t)e
xy
lo que tambien podemos expresar utilizando el producto escalar (y cos t +x sen t) =
(y, x) u y entonces escribir
f
u
(x, y) = e
xy
((y, x) u)
Observese que se pueden recuperar las derivadas parciales utilizando la expresion
anterior
f
x
(x, y) = e
xy
((y, x) e
1
) = e
xy
y
y
f
y
(x, y) = e
xy
((y, x) e
2
) = e
xy
x
5
El concepto de derivada direccional se generaliza para espacios de dimension n.
n
R una funcion escalar denida en U R
n
,
a

U un punto interior de su dominio, y u un vector unitario cualquiera. Se dene
entonces la derivada direccional de f en el punto a y seg un el vector u como el lmite
f
u
(a) = lm
h0
f(a + hu) f(a)
h
si este existe.
Ejemplo 2.2. Sea la funcion denida de la siguiente forma
f(x, y) =
_
x +
xy
x
2
+y
2
si (x, y) = (0, 0)
0 si (x, y) = (0, 0)
Para (x, y) = (0, 0) podemos calcular las derivadas parciales por la regla de deriva-
cion estandar, considerando una de las variable constante y derivando respecto a al
otra como sigue
f
x
(x, y) = 1
y(x
2
+ y
2
) xy(2x)
(x
2
+ y
2
)
2
= 1
(x
2
y
2
)y
(x
2
+ y
2
)
2
y analogamente
f
y
(x, y) =
x(x
2
+ y
2
) xy(2y)
(x
2
+ y
2
)
2
=
(x
2
y
2
)x
(x
2
+ y
2
)
2
Estas expresiones no estan denidas en el origen de coordenadas, pero como veremos
la funcion posee derivadas parciales en dicho punto, ya que en (x, y) = (0, 0) se tiene
denida la funcion como igual a cero y por lo tanto si aplicamos la denicion de
derivada parcial se tiene
f
x
(0, 0) = lm
h0
f(h, 0) f(0, 0)
h
= lm
h0
h 0
h
= 1
y
f
y
(0, 0) = lm
h0
f(0, h) f(0, 0)
h
= lm
h0
0 0
h
= 0
por lo que existen las derivadas parciales y valen 1 y 0 respecto a x e y respectiva-
mente.
Ejemplo 2.3. Sea la funcion denida por
f(x, y) =
_
x
3
y
si y = 0
0 si y = 0
Calculemos las derivadas direccionales en (0, 0), respecto a un vector u = (cos t, sen t),
de forma que no sea paralelo al eje OX, porque la funcion en dicho eje esta denida
como 0, es decir que t = 0 y t = , entonces aplicando la denicion de derivada
direccional se tiene
f
u
(0, 0) = lm
h0
f(hcos t, hsen t) f(0, 0)
h
= lm
h0
h
3
cos
3
t
h
2
sen t
= lm
h0
h
cos
3
t
sen t
= 0
6
Consideremos ahora que t = 0 o t = , es decir que el vector sea u = (1, 0) = e
1
o
u = (1, 0) = e
1
, tambien aplicando la denicion se tiene
f
e
1
(0, 0) = lm
h0
f(h, 0) f(0, 0)
h
= lm
h0
0
h
= 0
lo mismo da si derivamos respecto a e
1
. De esta forma f posee todas sus derivadas
direccionales y son nulas.
Estudiemos ahora la continuidad en (0, 0), aproxim andonos al origen de coorde-
nadas por caminos diversos.
lm
(x,y)(0,0)
f(x, y) = lm
x0
f(x, x) = lm
x0
x
3
x
= lm
x0
x
2
= 0
y si reemplazamos y = mx, nos queda
lm
x0
x
3
mx
= lm
x0
x
2
m
= 0
Sin embargo, si elegimos un cambio un poco mas rebuscado como la c ubica y = x
3
,
resulta
lm
(x,y)(0,0)
f(x, y)
y=x
3
= lm
x0
f(x, x
3
) = lm
x0
x
3
x
3
= 1
luego no existe el lmite en (0, 0) porque de existir tendran que ser iguales los lmites
por cualquier restriccion, y por lo tanto la funcion no es continua en (0, 0).
Concluimos que la existencia de las derivadas direccionales en todas las direccio-
nes (y por lo tanto tambien las derivadas parciales) no garantiza a un la continuidad
de la funcion.
La denicion de lmite de una funcion en un punto requiere que la funcion tienda
a un valor jo cualquiera sea el camino de aproximaci on a dicho punto, mientras que
la denicion de las derivadas direccionales la aproximaci on es por rectas (denida
por la direccion del vector), luego la existencia de las mismas no es suciente para
garantizar el lmite de la funcion.
Para motivar la denicion de diferenciabili-
dad trataremos de imitar la denicion de dife-
renciabilidad para funciones de una variable.
Recordemos que si f : U R R se dice que
es diferenciable en x
0
I si existe el lmite
lm
h0
f(x
0
+ h) f(x
0
)
h
y en caso armativo se le llama derivada de f
en x
0
y denotamos por f
(x
0
). Veamos ahora que si la funcion es diferenciable en
x
0
I, la ecuacion de la recta
y = f
(x
0
)(x x
0
) + f(x
0
)
es la recta tangente al graco de la funcion f de expresion de la forma y = f(x) en
el punto a = (x
0
, f(x
0
). Consideremos un punto R de abscisa x
0
+ h sobre la recta
tangente, es decir con ordenada y = f(x
0
) + f
(x
0
)h, por lo que la diferencia (BC
en la gura)
|f(x
0
+ h) f(x
0
) f
(x
0
)h|
7
es una funcion que depende de h ya que x
0
es un valor jo, y que denotamos por
r(h), y que llamamos residuo (llamado as, pensando en que es lo que falta a la
recta tangente para describir a la curva y = f(x) en los alrededores de x
0
) cuando
h 0 esa funcion tiende a cero pero lo hace de forma que tiende mas rapido que
la tendencia del h, (sin importar si es por derecha o por izquierda) lo que se expresa
diciendo que
lm
h0
r(h)
|h|
= 0
luego entonces una denicion alternativa de diferenciabilidad de una funcion de
una variable puede ser la siguiente: la funcion f : I R R es diferenciable en
x
0
I si existe una constante A y una funcion r denida en un entorno reducido y
arbitrariamente peque no de cero, tal que:
f(x
0
+ h) = f(x
0
) + Ah + r(h)
donde
lm
h0
r(h)
|h|
= 0
Denamos una funcion T : R R por la expresion T(x) = Ax; esta aplicacion
cumple:
T(x + y) = A(x + y) = Ax + Ay = T(x) + T(y) x, y R (1)
as como
T(x) = T(x) , x R (2)
si recordamos que una funcion (aplicacion, transformacion o operador ) entre dos
espacios vectoriales (en el caso que nos ocupa es R) que cumplan con (1) y (2) se le
llama funcion o transformacion lineal.
Entonces podemos decir que una funcion f : I R R es diferenciable en
x
0
R si existen una transformacion lineal T : R R ( que depende de x
0
) y una
funcion r : E
(0, ) R R tales que:

f(x
0
+ h) = f(x
0
) + T(h) + r(h) con lm
h0
r(h)
|h|
= 0
Pensando en lo anterior trataremos de generalizar para funciones escalares de-
nidas en el plano es decir dada f : U R
2
R, donde la graca de la misma es una
supercie en R
3
, debera admitir un plano tangente en todos sus puntos, intentaremos
deducir como sera la ecuacion del plano tangente en el punto (x
0
, y
0
, f(x
0
, y
0
)).
La ecuacion de un plano generico en R
3
viene dada por
z = ax + by + c
Se cumple que
z
x
= a y
z
y
= b, por lo que las pendientes del plano a lo largo de los
ejes X e Y son a y b respectivamente. Si este plano debe ser tangente a la graca
de la funcion en el punto propuesto se debera cumplir que
f
x
(x
0
, y
0
) = a, f
y
(x
0
, y
0
) = b.
De esta forma la ecuacion
z = f
x
(x
0
, y
0
)x + f
y
(x
0
, y
0
)y + c
8
dene una familia de planos paralelos entre s y que tienen la inclinacion adecuada
para ser tangente a la graca de la funcion en (x
0
, y
0
, f(x
0
, y
0
). para determinar la
constante c exigimos que el plano contenga el punto anterior, con lo cual obtenemos
z = f
x
(x
0
, y
0
)(x x
0
) + f
y
(x
0
, y
0
)(y y
0
) + f(x
0
, y
0
),
que debera ser la ecuacion del plano tangente a la graca de f(x, y) en el punto
(x
0
, y
0
, f(x
0
, y
0
).
Ya estamos en condiciones de dar una denicion plausible de diferenciabilidad
para funciones de dos variables. Dada la funcion lineal
t(x, y) = f
x
(x
0
, y
0
)(x x
0
) + f
y
(x
0
, y
0
)(y y
0
)
decimos que f es diferenciable en (x
0
, y
0
) si
lm
(x,y)(x
0
,y
0
)
f(x, y) f(x
0
, y
0
) t(x, y)
(x, y) (x
0
, y
0
)
= 0
Para una denicion un poco mas formal introducimos la notacion
h = (x x
0
, y y
0
) = (h
1
, h
2
)
_
x = x
0
+ h
1
y = y
0
+ h
2
Y al punto a = (x
0
, y
0
).
Denicion 2.3. Dada la funcion f : U R
2
R, denida en un abierto U de
R
2
, sea a U. Diremos que f es diferenciable en el punto a cuando existen una
transformacion lineal T : R
2
R y una funcion r : B
(0, ) R tales que, para

todo vector h = (h
1
, h
2
) R
2
, con a + h U, se verica
f(a + h) = f(a) + T(h
1
, h
2
) + r(h) donde lm
h0
r(h)
h
= 0
cuando f es diferenciable en todos los puntos de U, se dice simplemente que f es
diferenciable.
Observaci on 2.1. Si f es diferenciable en un punto a = (x
0
, y
0
), tomando h =
(, 0) = e
1
h = ||, se tiene para sucientemente peque no que
f(x
0
+ , y
0
) = f(x
0
, y
0
) + T(, 0) + r(h)
entonces como T(, 0) = T(1, 0)
f(x
0
+ , y
0
) f(x
0
, y
0
)
= T(1, 0) +
h
acot.
r(h)
h
luego tomando lmite cuando h 0 0, nos queda
f
x
(x
0
, y
0
) = T(1, 0)
por comodidad usaremos la notacion f
x
(x
0
, y
0
) = T(1, 0). Analogamente si tomamos
h = (0, t), con t sucientemente peque no como para garantizar que a + h U, se
llega a que f
y
(x
0
, y
0
) = T(0, 1).
Luego la transformacion lineal T : R
2
R esta denida por
T(x, y) = xT(1, 0) + yT(0, 1) = f
x
(x
0
, y
0
)x + f
y
(x
0
, y
0
)y
Por lo tanto hemos probado una condicion necesaria de diferenciabilidad. Y po-
demos enunciar la siguiente propiedad.
9
Propiedad 2.1. Una funcion f : U R
2
R denida en un abierto U de R
2
, es
diferenciable en un punto a = (x
0
, y
0
) U, cuando existen las derivadas parciales
f
x
(x
0
, y
0
), f
y
(x
0
, y
0
) y ademas de esto
f(x
0
+ h
1
, y
0
+ h
2
) = f(x
0
, y
0
) + f
x
(x
0
, y
0
)h
1
+ f
y
(x
0
, y
0
)h
2
+ r(h
1
, h
2
)
donde lm
(h
1
,h
2
)(0,0)
r(h
1
, h
2
)
(h
1
, h
2
)
= 0
De la igualdad anterior se tiene que la funcion residuo o resto r(h), se puede
expresar usando la notacion de producto escalar o producto punto, como
r(h) = f(a + h) f(a) (f
x
(a), f
y
(a)) h.
La existencia de las derivadas parciales es una condicion necesaria para la diferencia-
bilidad pero no suciente, hace falta que lm
h0
r(h)
h
= 0, esta es la condicion crucial,
que debe vericarse (directa o indirectamente) siempre que quisieramos probar que
una funcion es diferenciable, y es la que nos garantiza la existencia de un plano
tangente como vimos en lo previo.
De lm
h0
r(h)
h
= 0, concluimos que lm
h0
r(h) = 0, ya que
lm
h0
r(h) = lm
h0
_
r(h)
h
_
h = 0
Denicion 2.4. Sea r : V R
2
R una funcion escalar denida en el origen, es
decir que (0, 0) V , decimos que r(h) es un innitesimo de orden superior a h si
lm
h0
r(h)
h
= 0
en cuyo caso se suele escribir r(h) = o(h)
Los dos siguientes teoremas se reeren a la condiciones de diferenciabilidad. En
primer lugar veremos una condicion que es necesaria, y en segundo lugar otra condi-
cion ahora suciente. Ambos teoremas se cumplen en R
n
, solo que para simplicar
en una primera instancia se enuncian y demuestran en R
2
.
Veremos ahora que la denicion de diferenciabilidad en un punto a s garantiza
la continuidad de la funcion en ese punto.
Teorema 2.1 (Condicion necesaria de diferenciabilidad). Sea la funcion f : U
R
2
R,denida en un abierto U de R
2
, si es diferenciable en a = (x
0
, y
0
) U,
entonces es continua en ese punto.
Demostracion. Por ser diferenciable en a = (x
0
, y
0
) se tiene, como ya lo analizamos
mas arriba, que de
lm
h0
r(h)
h
= 0 lm
h0
r(h) = 0
entonces
lm
h0
f(a + h) = lm
(h
1
,h
2
)(0,0)
f(x
0
+ h
1
, y
0
+ h
2
)
= lm
(h
1
,h
2
)(0,0)
f(x
0
, y
0
) + f
x
(x
0
, y
0
)h
1
+ f
y
(x
0
, y
0
)h
2
+ r(h)
= f(x
0
, y
0
) = f(a)
10
Ejemplo 2.4. Sea la funcion denida por
f(x, y) =
_
xy
x
2
+y
2
si (x, y) = (0, 0)
0 si (x, y) = (0, 0)
Como vimos en el ejemplo 1.7 esta funcion no es continua, entonces por el teorema
anterior tampoco puede ser diferenciable.
Veamos ahora una demostracion directa, calculando lm
h0
r(h)
h
.
En el mismo ejemplo citado mas arriba (ejemplo 1.7) probamos que la derivadas
parciales son nulas, luego sustituyendo nos queda
f(0 + h
1
, 0 + h
2
) = f(0, 0) + 0h
1
+ 0h
2
+ r(h
1
, h
2
)
de donde
r(h
1
, h
2
) =
h
1
h
2
h
2
1
+ h
2
2
y como h =
h
2
1
+ h
2
2
nos queda
r(h
1
, h
2
)
(h
1
, h
2
)
=
h
1
h
2
(h
2
1
+ h
2
2
)
3
y tomando lmite cuando (h
1
, h
2
) (0, 0) obtenemos
lm
(h
1
,h
2
)(0,0)
h
1
h
2
(h
2
1
+ h
2
2
)
3
h=h
1
=h
2
= lm
h0
h
2
2
3
h
3
= lm
h0
1
8h
lmite que no existe, por lo que no es diferenciable.
Teorema 2.2 (Condicion suciente de diferenciabilidad). Dada la funcion f : U
R
2
R, denida en un abierto U de R
2
si las derivadas parciales f
x
, f
y
existen y
son continuas en una bola de centro a = (x
0
, y
0
) U, entonces f es diferenciable en
(x
0
, y
0
).
Demostracion. Por hipotesis como las f
x
y f
y
estan denidas y son continuas en una
bola de centro (x
0
, y
0
) U, entonces por se U abierto tenemos que existe > 0 tal
que f
x
y f
y
, estan denidas y son continuas en B
(x
0
, y
0
) U.
Tomando (h
1
, h
2
) tal que (h
1
, h
2
) < , la expresion del residuo es:
r(h
1
, h
2
) = f(x
0
+ h
1
, y
0
+ h
2
) f(x
0
, y
0
) f
x
(x
0
, y
0
)h
1
f
y
(x
0
, y
0
)h
2
Queremos ver que
lm
(h
1
,h
2
)(0,0)
r(h
1
, h
2
)
(h
1
, h
2
)
= 0
Escribamos la expresion del residuo como
r(h
1
, h
2
) = f(x
0
+ h
1
, y
0
+ h
2
) f(x
0
, y
0
+ h
2
)+
+ f(x
0
, y
0
+ h
2
) f(x
0
, y
0
) f
x
(x
0
, y
0
)h
1
f
y
(x
0
, y
0
)h
2
(3)
Si consideramos la funcion (x) = f(x, y
0
+ h
2
), que por ser la derivada parcial
respecto a x continua en B
(x
0
, y
0
), y (h
1
, h
2
) < , es entonces (x) derivable
(diferenciable) en (x
0
, x
0
+h
1
) y por lo tanto podemos aplicar el Teorema del Valor
11
Medio (Lagrange) en el intervalo [x
0
, x
0
+ h
1
] obtenemos que existe un n umero
1
[0, 1] tal que
(x
0
+ h
1
) (x
0
) =
(x
0
+
1
h
1
)h
1
o sea
f(x
0
+ h
1
, y
0
+ h
2
) f(x
0
, y
0
+ h
2
) = f
x
(x
0
+
1
h
1
, y
0
+ h
2
)h
1
Del mismo modo aplicando el Teorema del Valor Medio en la funcion (y) = f(x
0
, y)
en el intervalo [y
0
, y
0
+ h
2
] se obtiene un n umero
2
[0, 1] tal que
f(x
0
, y
0
+ h
2
) f(x
0
, y
0
) = f
y
(x
0
, y
0
+
2
h
2
)h
2
entonces sustituyendo en (3), nos queda
r(h
1
, h
2
) = f
x
(x
0
+
1
h
1
, y
0
+ h
2
)h
1
+ f
y
(x
0
, y
0
+
2
h
2
)h
2
f
x
(x
0
, y
0
)h
1
f
y
(x
0
, y
0
)h
2
= [f
x
(x
0
+
1
h
1
, y
0
+ h
2
) f
x
(x
0
, y
0
)] h
1
+ [f
y
(x
0
, y
0
+
2
h
2
) f
y
(x
0
, y
0
)] h
2
Al dividir por la norma del vector (h
1
, h
2
) obtenemos
r(h
1
, h
2
)
(h
1
, h
2
)
= [f
x
(x
0
+
1
h
1
, y
0
+ h
2
) f
x
(x
0
, y
0
)]
h
1
(h
1
, h
2
)
+ [f
y
(x
0
, y
0
+
2
h
2
) f
y
(x
0
, y
0
)]
h
2
(h
1
+ h
2
)
Observemos que
|h
i
|
(h
1
, h
2
)
1 (h
1
, h
2
) = (0, 0) , i = 1, 2
y que debido a la continuidad de las derivadas parciales en (x
0
, y
0
), cuando (h
1
, h
2
) (0, 0)
los dos corchetes de la expresion anterior tienden a cero, obteniendo nalmente que
lm
(h
1
,h
2
)(0,0)
r(h
1
, h
2
)
(h
1
, h
2
)
= 0
por lo que f es diferenciable en (x
0
, y
0
).
Es importante se nalar que para demostrar el Teorema anterior, es posible con-
siderar hipotesis mas debiles, as para armar que (x) es derivable en (x
0
, x
0
+h),
alcanza con la continuidad de f
x
en el punto (x
0
, y
0
) y con la funcion (y), si le
pedimos a f
y
que exista en (x
0
, y
0
), tenemos que existe el siguiente lmite
lm
h
2
0
f(x
0
, y
0
+ h
2
) f(x
0
, y
0
)
h
2
= f
y
(x
0
, y
0
)
luego para h
2
peque no se tiene
f(x
0
, y
0
+ h
2
) f(x
0
, y
0
) = (f
y
(x
0
, y
0
) + (h
2
)) h
2
con lm
h
2
0
(h
2
) = 0
y por lo tanto nos queda
r(h
1
, h
2
)
(h
1
, h
2
)
= [f
x
(x
0
+
1
h
1
, y
0
+ h
2
) f
x
(x
0
, y
0
)]
h
1
(h
1
, h
2
)
+ [f
y
(x
0
, y
0
) f
y
(x
0
, y
0
) + (h
2
)]
h
2
(h
1
+ h
2
)
Por lo que los parentesis rectos siguen tendiendo a cero como antes, y por lo tanto
se cumple la diferenciabilidad de la funcion en (x
0
, y
0
).
En resumen alcanza con pedir que f
x
sea continua en (x
0
, y
0
) y que exista
f
y
(x
0
, y
0
).
12
Ejemplo 2.5. La funcion f : R
2
R denida por la expresion f(x, y) = e
(x
2
+y
2
)
tiene por derivadas parciales
f
x
(x, y) = 2xe
(x
2
+y
2
)
f
y
(x, y) = 2ye
(x
2
+y
2
)
son continuas y por lo tanto es f diferenciable.
La condicion anterior es una condicion suciente para la diferenciabilidad pero
no es necesaria como muestra el siguiente ejemplo.
Ejemplo 2.6. Consideremos la funcion denida por
f(x, y) =
_
(x
2
+ y
2
) cos
1
x
2
+y
2
si (x, y) = (0, 0)
0 si (x, y) = (0, 0)
Primero hallemos las derivadas parciales en (0, 0)
f
x
(0, 0) = lm
h
1
0
f(h
1
, 0) f(0, 0)
h
1
= lm
h
1
0
h
2
1
cos
1
|h
1
|
= 0
por estar el coseno acotado cuando h
1
tiende a cero.
Analogamente f
y
(0, 0) = 0. Por otro lado
r(h
1
, h
2
)
(h
1
, h
2
)
=
f(h
1
, h
2
) f(0, 0) f
x
(0, 0)h
1
f
y
(0, 0)h
2
(h
1
, h
2
)
=
(h
2
1
+ h
2
2
) cos
1
h
2
1
+h
2
2
h
2
1
+ h
2
2
=
h
2
1
+ h
2
2
cos
1
h
2
1
+ h
2
2
por lo que lm
(h
1
,h
2
)(0,0)
r(h
1
,h
2
)
(h
1
,h
2
)
= 0 (acotado por algo que tiende a cero), luego la
funcion es diferenciable en (0, 0).
Sin embargo sus derivadas parciales no son continuas como vamos a probar a
continuaci on.
Teniendo en cuanta que f
x
(0, 0) = 0, se tiene
f
x
(x, y) =
_
2x cos
1
x
2
+y
2
+
x
x
2
+y
2
sen
1
x
2
+y
2
si (x, y) = (0, 0)
0 si (x, y) = (0, 0)
Para que f
x
(x, y) sea continua en (0, 0) debe ser
lm
(x,y)(0,0)
f
x
(x, y) = f
x
(0, 0)
Sin embargo
lm
(x,y)(0,0)
f
x
(x, y) =
_
x = cos t
y = sen t
_
= lm
0
_
2 cos t cos
1
+ cos t sen
1
_
= lm
0
cos t sen
1
que no existe, por lo que no es continua, analogamente con f

y
.
13
A continuaci on daremos la generalizacion natural de las deniciones de diferen-
ciabilidad en R
n
y es un ejercicio vericar que los teoremas 2.1 y 2.2 se cumplen,
con un poco mas de trabajo por la notacion un tanto mas cargada.
Denicion 2.5. Dada f : U R
n
R, U abierto de R
n
. Diremos que la funcion
f es diferenciable en el punto a U, cuando existen una transformacion lineal
T : R
n
R (que depende de a) y una funcion r : B
(0, ) R tales que, para todo

vector h = (h
1
, . . . , h
n
) R
n
con a + h B
(a, ) U se verica
f(a + h) = f(a) + T(h) + r(h) con lm
h0
r(h)
h
= 0
Cuando f es diferenciable en todos sus punto de U diremos simplemente que f es
diferenciable.
Observaci on 2.2. As como lo hicimos para una funcion escalar de dos variables,
observemos que si f es diferenciable en el punto a entonces tomando h = e
i
, es
decir h
j
= 0 j = i y h
i
= , podemos escribir
f(a + h) = f(a) + T(e
i
) + r(h)
como T(e
i
) = T(e
i
) se tiene
f(a + e
i
) f(a)
= T(e
i
) +
h
acot.
r(h)
h
y haciendo h 0 es decir 0 vemos que existe cada derivada parcial en el punto
a, siendo
f
x
i
(a) = T(e
i
) para todo i = 1, . . . , n. Y por lo tanto al igual que antes la
transformacion lineal nos queda:
T(x
1
, x
2
, . . . , x
n
) = x
1
T(e
1
) +x
2
T(e
2
) + +x
n
T(e
n
) =
f
x
1
(a)x
1
+ +
f
x
n
(a)x
n
tenemos la siguiente propiedad.
Propiedad 2.2. Una funcion f : U R
n
R, denida en un abierto U de
R
n
, es diferenciable en un punto a U cuando existen las derivadas parciales
f
x
1
(a), . . . ,
f
x
n
(a), y ademas para todo vector h = (h
1
, h
2
, . . . , h
n
) tal que a+h U,
se tiene
f(a + h) = f(a) +
f
x
1
(a)h
1
+ +
f
x
n
(a)h
n
+ r(h)
donde lm
h0
r(h)
h
= 0
Si la funcion f : U R
n
R, denida en el conjunto abierto U R
n
, es
diferenciable en a U, entonces es continua en ese punto. La demostracion es
analoga a la del teorema 2.1.
Cuando decimos que la derivada parcial
f
x
i
de la funcion f respecto a su iesima
variable es continua en el punto a, nos estamos reriendo a que la funcion
f
x
:

U
R
n
R, denida en

U U
1
que a cada punto a

U le asocia la derivada parcial
f
x
i
(a), es continua en a, es decir que
lm
h0
f
x
i
(a + h) =
f
x
i
(a)
El teorema 2.2 se puede generalizar entonces como sigue.
1
Estas funciones podran no estar denidas en todo el conjunto abierto U, pero deben estarlo
al menos en un abierto

U, tal que a

U U.
14
Teorema 2.3. Sea f : U R
n
R una funcion denida en un conjunto abierto
U de R
n
. Si las funciones derivadas parciales
f
x
i
:

U R
n
R, i = 1, . . . , n, son
continuas en el punto a

U U, entonces f es diferenciable en a.
La demostracion es similar a la dada para dos variables.
Ejemplo 2.7. Sea la funcion f : R
3
R dada por la expresion f(x, y, z) = cos(x+
y
2
+ z
3
), tiene por derivadas parciales a
f
x
= sen(x + y
2
+ z
3
)
f
y
2y sen(x + y
2
+ z
3
)
f
z
= 3z
2
sen(x + y
2
+ z
3
)
que son funciones continuas. Entonces f es diferenciable.
Denicion 2.6. Una funcion f : U R
n
n
,
se dice de clase C
1
cuando existen en cada punto x U las derivadas parciales
f
x
1
, . . . ,
f
x
n
y las funciones
f
x
i
: U R i = 1, . . . , n son continuas.
Diremos que una funcion f : U R
n
R es de clase C
k
cuando tienen derivadas
parciales en todos los puntos de U y las funciones
f
x
i
: U R i = 1, . . . , n son
de clase C
k1
. Aqu k es un entero mayor que cero. Para completar la denicion
inductiva diremos que una funcion f : U R
n
R es de clase C
0
cuando ella es
continua. Para indicar que una funcion es de clase C
k
, escribimos f C
k
. Tambien
escribimos que f C
y decimos que f es de clase C
, cuando f C
k
para todo
k 0. De estas denicion se tiene por lo ya demostrado el siguiente corolario
Corolario 2.4. Toda funcion de clase C
1
es diferenciable.
Como era de esperarse la diferenciabilidad cumple las mismas propiedades res-
pecto a las operaciones, que para funciones de una sola variable, es decir que la
suma, el producto y el cociente de funciones diferenciables es tambien una funcion
diferenciable, como se demuestra en el siguiente teorema.
Teorema 2.5. Sean f, g : U R
n
R dos funciones denidas en el conjunto
abierto U de R
n
, diferenciables en a U. Entonces
1. La suma f + g : U R
n
R denida por (f + g)(x) = f(x) + g(x) x U,
es una funcion diferenciable en a.
2. El producto fg : U R
n
R denida por fg(x) = f(x)g(x) x U, es
diferenciable en a.
3. Si g(a) = 0, el cociente
f
g
: U R
n
R denido por
f
g
(x) =
f(x)
g(x)
x U con
g(x) = 0, es diferenciable en a.
Demostracion. La demostracion de los tres incisos es similar. Presentaremos a modo
de ejemplo el segundo, para el caso n = 2. Pongamos a = (x
0
, y
0
). Debemos probar
que el residuo denido por la siguiente expresion
fg(x
0
+ h
1
, y
0
+ h
2
) = fg(x
0
, y
0
) +

x
fg(x
0
, y
0
)h
1
+

y
fg(x
0
, y
0
)h
2
+ r(h
1
, h
2
)
15
tiene la propiedad
lm
(h
1
,h
2
)(0,0)
r(h
1
, h
2
)
(h
1
, h
2
)
= 0
ahora como
x
fg = f
g
x
+ g
f
x
,

y
fg = f
g
y
+ g
f
y
para no cargar la notacion escribimos (x
0
, y
0
) = a y (h
1
, h
2
) = h, sustituyendo
entonces nos queda
fg(a + h) = fg(a) +
_
f(a)
g
x
(a) + g(a)
f
x
(a)
_
h
1
+
_
f(a
g
y
(a) + g(a)
f
y
(a)
_
h
2
+ r(h
1
, h
2
)
expresion que podemos reescribir como
r(h
1
, h
2
) = g(a + h)
_
f(a + h) f(a)
f
x
(a)h
1
f
y
(a)h
2
_
f(a)
_
g(a + h) g(a)
g
x
(a)h
1
g
y
(a)h
2
_
+
f
x
(a)
_
g(a + h) g(a)
_
h
1
+
f
y
(a)
_
g(a + h) g(a)
_
h
2
de donde
r(h
1
, h
2
)
(h
1
, h
2
)
= g(a + h)
f(a + h) f(a)
f
x
(a)h
1
f
y
(a)h
2
(h
1
, h
2
)
+ f(a)
g(a + h) g(a)
g
x
(a)h
1
g
y
(a)h
2
(h
1
, h
2
)
+
f
x
(a)
_
g(a + h) g(a)
_
h
1
(h
1
, h
2
)
+
f
y
(a)
_
g(a + h) g(a)
_
h
2
(h
1
, h
2
)
Al tomar el lmite cuando (h
1
, h
2
) (0, 0) vemos que los dos primeros sumandos tienden
a cero ya que las funciones f y g son por hipotesis diferenciables en a (los segundos factores
de cada uno de estos sumandos denen los residuos divididos por h de las funcionas f
y g respectivamente).
Por otra parte, como
|h
1
|
(h
1
, h
2
)
1
|h
2
|
(h
1
, h
2
)
1
para todo (h
1
, h
2
) R
2
no nulo (es decir esta expresion se mantiene acotada cerca del
origen de R
2
), y como g es diferenciable en a, es continua en a (teorema 2.1), entonces
lm
h0
_
g(a + h) g(a)
_
= 0
por lo cual los dos ultimos sumandos tienden a cero cuando h 0. Con lo que queda
demostrado el teorema.
n
R diferenciable, denida en el conjunto abierto
U de R
n
, y sean a U y v = (v
1
, . . . , v
n
) R
n
vector (unitario), entonces existe la
derivada direccional de f respecto a v, y se obtiene por medio de la expresion
f
v
(a) =
n
i=1
f
x
i
(a)v
i
16
Demostracion. Siendo f diferenciable en a se tiene que el residuo esta denido por
la expresion
f(a + h) f(a) =
n
i=1
f
x
i
(a)h
i
+ r(h)
con la propiedad de que
lm
h0
r(h)
h
= 0
Escribamos el vector h = (h
1
, . . . , h
n
) R
n
como h = v, con R y tal que sea
lo sucientemente peque no como para que a+v U, entonces como v = (v
1
, . . . , v
n
)
se tiene h
i
= v
i
i = 1, . . . , n, luego nos queda
f(a + v) f(a) =
n
i=1
f
x
i
(a)v
i
+ r(v)
de donde
f(a + v) f(a)
=
n
i=1
f
x
i
(a)v
i
+
r(v)
Si hacemos h 0 esto equivale a 0. Ademas h = v = || v = ||. Si

se toma lmite cuando h 0 nos queda
lm
0
f(a + v) f(a)
=
n
i=1
f
x
i
(a)v
i
lm
h0
r(h)
h
y como el lmite que aparece en el segundo miembro es cero, pues la funcion f es
diferenciable. En el primer miembro aparece la denicion de la derivada direccional
de la funcion f en el punto a respecto al vector v. Por lo que tenemos
f
v
(a) =
n
i=1
f
x
i
(a)v
i
(4)
El teorema anterior justica en cierto sentido la siguiente denicion
3. Diferencial y gradiente
n
n
, diferenciable
en un punto a U, llamamos diferencial de f en el punto a a la funcional lineal
df|
a
: R
n
R, cuyo valor en un vector v = (v
1
, . . . , v
n
) es dado por
df|
a
(v) =
f
v
(a) =
n
i=1
f
x
i
(a)v
i
Observaci on 3.1. Como toda transformacion lineal de R
n
en R (o funcional lineal)
df|
a
tiene asociada una matriz 1n en relacion a la base canonica de R
n
. En nuestro
caso
df|
a
=
_
f
x
1
(a) . . .
f
x
n
(a)
_
17
Y as podemos escribir
df|
a
(v) =
_
f
x
1
(a), . . . ,
f
x
n
(a)
_
v (5)
Cuando f : U R
n
R es diferenciable en todo punto de U, obtenemos una
aplicacion df : U (R
n
)
= L(R
n
; R), que asocia a cada punto x U, su diferencial
df|
x
, cuya matriz es
_
f
x
1
(x) . . .
f
x
n
(x)
_
La aplicacion df es continua si y solo si cada una de sus funciones coordenadas
f
x
i
: U R son continuas, y esto es as si y solo si f es de clase C
1
.
Es com un indicarse a la base canonica de (R
n
)
como (dx
1
, . . . , dx
n
). El motivo
de esta notacion es el siguiente: si a la iesima proyecci on la llamamos
i
: R
n
R
que en cada punto x = (x
1
, . . . , x
n
) R
n
el valor
i
(x) = x
i
, y escribimos x
i
en vez
de
i
. Calculando la diferencial de la iesima proyecci on x
i
: R
n
R, obtenemos
dx
i
|
a
(v) = v
i
en todo punto a R
n
, podemos entonces sustituir v
i
por dx
i
(v) en la
denicion de diferencial se tiene
df|
a
(v) =
n
i=1
f
x
i
(a)dx
i
(v)
Como esta igualdad vale para todo v R
n
, tenemos
df|
a
=
n
i=1
f
x
i
(a)dx
i
Esto signica que la funcional lineal df|
a
se escribe como combinaci on lineal de las
funcionales dx
i
, siendo
f
x
i
(a) los coecientes de la combinacion. Y como la igualdad
anterior vale para todo a U, podemos escribir
df =
n
i=1
f
x
i
dx
i
Teorema 3.1. Supongamos que las funciones f, g : U R
n
R son diferenciables
ya vimos en el teorema 2.5 que la suma el producto y el cociente son diferenciables,
y ademas
1. d(f + g) = df + dg
2. dfg = fdg + gdf
3. d
_
f
g
_
=
gdf fdg
g
2
si g(x) = 0 x U
Demostracion. Haremos la demostracion para el caso f, g : U R
2
R, pero para
el caso general es igual. A modo de ejemplo realizamos la demostracion para el inciso
2.
d(fg) =
(fg)
x
dx +
(fg)
y
dy
=
_
f
g
x
+ g
f
x
_
dx +
_
f
g
y
+ g
f
y
_
dy
= f
_
g
x
dx +
g
y
dy
_
+ g
_
f
x
dx +
f
y
dy
_
= fdg + gdf
18
de manera analoga se demuestran los incisos restantes.
Se ve que la diferencial de una funcion de varias variables tiene propiedades
analogas a las propiedades de derivacion de una funcion de una solo variable.
n
R una funcion diferenciable en el conjunto
abierto U de R
n
. Se dene el vector gradientede la funcion f en el punto a U, que
denotamos por f(a), como el vector de R
n
dado por
f(a) =
_
f
x
1
(a),
f
x
2
(a), . . . ,
f
x
n
(a)
_
Observaci on 3.2. Con este nuevo concepto se puede escribir la formula (4) que
nos da la derivada direccional de una funcion diferenciable f : U R
n
R en el
punto a U, en la direccion del vector unitario v R
n
, como
f
v
(a) = f(a) v
donde el producto se entiende como el producto escalar (o producto punto o
producto interno usual)
La funcional lineal llamada diferencial dada por la expresion (5) se puede rees-
cribir como
df|
a
(v) = f(a) v
aunque una matriz y un vector son objetos matematicos distintos se puede decir
haciendo abuso del lenguaje, que la matriz de la misma es f(a) (considerando al
vector sin la comas, es decir como matriz).
Por ser el gradiente un vector representa aspectos geometricos muy convenientes
para dar informacion con respecto al comportamiento de las funciones, como veremos
enseguida. Sabido es que el producto escalar puede expresarse en funcion del angulo
formado por los vectores, como
u v = |u||v| cos
en nuestro caso para el vector gradiente y un vector unitario v se tiene
df|
a
(v) = f(a) v = |f(a)| cos
entonces si el vector v tiene la direccion perpendicular al gradiente dicho producto
nos da cero, y si es en la direccion del gradiente nos da un valor maximo, y como
este producto es la derivada direccional que nos da la taza de variacion de la funcion,
concluimos que la variacion de la funcion es maxima en la direccion del gradiente, y es
mnima cuando la direccion es ortogonal al gradiente. En R
3
, como intuitivamente el
plano tangente es el plano que mas se pega (o mejor se pega) a la supercie, podemos
concluir al menos intuitivamente que el gradiente de la funcion F(x, y, z) = z
f(x, y) es normal al plano tangente a la supercie en uno de sus puntos, considerando
a la supercie z = f(x, y) como el nivel cero de F.
Denicion 3.3. Recordemos que una funcion f es diferenciable en un punto a,
entonces cuando h tiene magnitudes peque na
f(a + h) f(a) +f(a) h
19
si hacemos x = a + h, tenemos que la funcion T denida como
T(x) = f(a) +f(a) (x a)
es una buena aproximacion de f(x) si x esta cerca de a. As la ecuacion z = T(x)
dene un plano que aproxima f cerca de a. Y a este plano llamamos plano tangente.
Ejemplo 3.1. Demuestre que f(x, y) = xe
y
+ x
2
y es diferenciable en todas partes
y calcule su gradiente. Luego determine la ecuacion del plano tangente en (2, 0).
Primero tenemos que las derivadas parciales son
f
x
= e
y
+ 2xy
f
y
= xe
y
+ x
2
Ambas funciones son continuas en todas partes y as f es diferenciable en todas
partes. El gradiente es
f(x, y) = (e
y
+ 2xy, xe
y
+ x
2
)
y entonces
f(2, 0) = (1, 6)
y la ecuacion del plano tangente es
z = f(2, 0) +f(2, 0) (x 2, y)
= 2 + (1, 6) (x 2, y)
= 2 + x 2 + 6y = x + 6y
4. Funciones Compuestas
Analicemos solo para aclarar ideas el caso en que tenemos z = g(u, v), y que a su
vez u = u(x, y) y v = v(x, y) entonces sustituyendo se obtiene z = g(u(x, y), v(x, y)).
Una mejor manera de contemplar el proceso de composicion de funciones es
pensando en funciones de R
m
en R
n
: la pareja de funciones u = u(x, y), v = v(x, y)
las podemos ver como una funcion f que va de R
2
en R
2
, de la siguiente manera: A
cada punto (x, y) R
2
la funcion f le asocia el punto f(x, y) R
2
cuyas coordenadas
seran (u, v) = (u(x, y), v(x, y)), a las funciones u y v se le llaman por razones obvias
funciones coordenadas de la funcion f. Escribimos entonces
f : R
2
R
2
(x, y) (u, v)
donde u = u(x, y) y v = v(x, y), luego f(x, y) = (u(x, y), v(x, y) y si g : R
2
R esta
dada por g(u, v) = z podemos escribir a la funcion compuesta como (g f)(x, y) =
g(f(x, y)) = g(u(x, y), v(x, y)) = z. Para generalizar con mas comodidad volvemos
a escribir lo anterior con otra notacion mas apropiada, tenemos
f : R
2
R
2
(x
1
, x
2
) (y
1
, y
2
)
donde y
1
= f
1
(x
1
, x
2
), e y
2
= f
2
(x
1
, x
2
), si ademas tenemos otra funcion
g : R
2
R
(y
1
, y
2
) g(y
1
, y
2
)
20
entonces (g f)(x
1
, x
2
) = g(f
1
(x
1
, x
2
), f
2
(x
1
, x
2
)), llamando v = (x
1
, x
2
) podemos
escribir (g f)(v) = g(f(v)).
En general si tenemos una funcion
f : U R
n
R
m
(x
1
, . . . , x
n
) (y
1
, . . . , y
m
)
donde cada y
i
= f
i
(x
1
, . . . , x
n
), para i = 1, . . . , m y otra funcion
g : V R
m
R
(y
1
, . . . , y
m
) g(y
1
, . . . , y
m
)
donde V f(U), entonces (g f)(x
1
, . . . , x
n
) = g (f
1
(x
1
, . . . , x
n
), . . . , f
m
(x
1
, . . . x
n
))
es la funcion compuesta que va de R
n
en R.
Teorema 4.1 (Regla de la Cadena). Consideremos las funciones f = (f
1
, . . . , f
m
) :
U R
m
donde U R
n
, g : V R, donde f(U) V R
m
, con V, U abiertos.
Supongamos que cada funcion coordenada f
j
(j = 1, . . . , m) es diferenciable en un
punto a U, y que g es diferenciable en b = f(a) = (f
1
(a), . . . , f
m
(a)). Entonces,
la funcion compuesta g f : U R, es diferenciable en el punto a, y sus derivadas
parciales verican
(g f)
x
i
(a) =
g
y
1
(b)
f
1
x
i
(a) + +
g
y
m
(b)
f
m
x
i
(a) (6)
Demostracion. Si m = n = 1 en (6) tenemos un unico sumando, obteniendo la regla
de la cadena para funciones de una sola variable.
Demostraremos que g f verica la denicion 2.5; al calcular el vector A de la
denicion obtenemos (6).
Como f
j
es diferenciable en a, existe r
j
: B
(0,
j
) R tal que si a+h B(a,
j
),
tenemos
f
j
(a + h) f
j
(a) =
n
i=1
f
x
j
(a)h
i
+ r
j
(h), con lm
h0
r
j
(h)
h
= 0 (7)
Designemos
1
= f
1
(a + h) f
1
(a), . . . ,
m
= f
m
(a + h) f
m
(a) y sea
= (
1
, . . . ,
m
) = f(a + h) f(a)
como +b = +f(a) = f(a +h) V , aplicando la denicion de diferenciabilidad,
ahora a la funcion g, existe s : B
(0, ) R tal que

g(b + ) g(b) =
m
j=1
g
y
j
(b)
j
+ s() con lm
0
s()
= 0 (8)
Sustituyendo en (8) el factor
j
= f
j
(a +h) f
j
(a) para j = 1, . . . , m calculado en
(7), tenemos
(g f)(a + h) = g(f(a + h)) = g( + b)
= g(b) +
m
j=1
g
y
j
(b)
_
n
i=1
f
j
x
i
(a)h
i
+ r
j
(h)
_
+ s()
21
Como g(b) = g(f(a)) = (g f)(a), cambiando el orden en la suma doble e introdu-
ciendo la funcion auxiliar q(h), podemos escribir
(g f)(a + h) = (g f)(a) +
n
i=1
_
m
j=1
g
y
j
(b)
f
j
x
i
(a)
_
h
i
+ q(h) (9)
donde q(h) esta denida por
q(h) =
m
j=1
g
y
j
(b)r
j
(h) + s() (10)
Las constantes en (9) cumplen con la formula (6). Para obtener la diferencial resta
vericar que
lm
h0
q(h)
h
= lm
h0
h
s()
= 0
Veamos primero que

h
esta acotado. Tenemos
h
=
_
_
_
_
_
n
i=1
f
j
x
i
(a)
h
i
h
+
r
j
(h)
h
_
_
_
_
_
i=1
_
_
_
_
f
j
x
i
(a)
_
_
_
_
h
i
h
+
_
_
_
_
r
j
(h)
h
_
_
_
_
. Como
|h
i
|
h
1 y lm
h0
r
j
(h)
h
= 0, resulta que

h
esta acotado. Finalmente, si
h 0 y 0, de la denicion (10) obtenemos que
lm
h0
q(h)
h
= 0
con lo que concluye la demostracion.
En la practica, es frecuente la situacion en la cual las funciones f
1
, . . . , f
m
, g tie-
nen derivadas parciales continuas (es decir son de clase C
1
) en U. Sabemos entonces
que son diferenciables, y se aplica la regla de la cadena en todos los puntos de U,
obteniendo para v = (x
1
, . . . , x
n
)
(g f)
x
i
(v) =
g
y
1
(f(v))
f
1
x
i
(v) + +
g
y
m
(f(v))
f
m
x
i
(v)
para cada i = 1, . . . , n lo que muestra que lass derivadas parciales de g f son
tambien funciones continuas, por ser composicion, producto y sumas de funciones
continuas. En otras palabras, la composicion de funciones de clase C
1
es una funcion
de clase C
1
.
Observaci on 4.1. Cuando n = 1 la primer funcion es una curva.
Si denotamos la misma como : I R
n
donde I es un intervalo abierto de la
recta real R, dada por la expresion = (t) = (x
1
(t), x
2
(t), . . . , x
n
(t)), si ademas
adoptamos la notacion para la derivada respecto al parametro t en un punto a, como
(a) =

t
(a), se sabe que el vector tangente a la curva (y tambien velocidad de la
curva) es:
(a) = ( x
1
(a), . . . , x
n
(a))
donde x
i
(a) son las derivadas respecto de t de las funciones reales x
1
, . . . , x
n
.
22
Sea f : U R
n
R una funcion escalar denida en el abierto U de R
n
,
entonces si (I) U, podemos denir la funcion compuesta g = f en I mediante
la ecuacion
g(t) = f ((t)) si t I
Sea t un punto de I donde cada una de las coordenadas de es diferenciable en
ese punto t y supongamos que f es diferenciable en (t). Entonces por el Teorema
anterior existe g
(t) y es igual al producto escalar

g
(t) = f((t)) (t)

2
R la funcion dada por la expresion f(x, y) = x
2
+
3y
2
, y sea : V R
2
R dada por (t) = (e
t
, cos t), podemos aplicando la formula
vista en la observacion anterior obtener la derivada de la funcion f : V R R,
as
t
(f )(t) = f((t)) (t)
calculemos primero el gradiente de f
f(x, y) = (2x, 6y) f((t)) = (2e
t
, 6 cos t)
y como (t) = (e
t
, sen t), se tiene
t
(f )(t) = f((t)) (t) = (2e
t
, 6 cos t) (e
t
, sen t)
= 2e
2t
6 sen t cos t
Se puede llegar al mismo resultado haciendo primero la composicion f((t)) =
f(e
t
, cos t) = e
2t
+ 3cos
2
t y derivamos directamente en ella como se comprueba
facilmente.
Denicion 4.1. Dado un conjunto M R
n
y un punto a M denimos el espacio
tangente a M en a, que denotamos como T
a
M, como el conjunto de los vectores
tangentes en a a las curvas contenidas en M que pasan por a, es decir
T
a
M = {v R
n
: : (, ) M, (0) = a, (0) = v}
Denicion 4.2. Consideremos una funcion f : U R, donde U es abierto de R
n
,
y un real c. Llamamos conjunto de nivel c de f al conjunto M de los puntos x U
tales que f(x) = c, es decir que M = f
1
(c). Si n = 2, 3 llamamos respectivamente
curva de nivel, supercie de nivel a los conjuntos de nivel recien denidos.
Proposicion 4.2. Sea f : U R de clase C
1
en U, abierto de R
n
. Dado c R
consideremos M = f
1
(c), el conjunto de nivel c de f, y un punto a M, tal que
f(a) = 0. Entonces todo vector v T
a
M es v f(a).
Demostracion. La prueba es muy sensilla, para c R, sea M = f
1
(c) y considere-
mos v T
a
M, entonces existe : (, ) M tal que (0) = a y (0) = v. Como
(f )(t) = f((t)) = c, seg un la regla de la cadena, si derivamos, se tiene
0 =

t
(f )(0) = f((0)) (0) = f(a) v
de donde v f(a).
Luego el gradiente f(a) es perpendicular a la velocidad (0) (vector tangente a
la curva) en el punto a = (0) de cualquier camino diferenciable (curva) contenido
en el conjunto de nivel de f que contiene a a. Dichos de otra forma el gradiente es
ortogonal al conjunto de nivel.
23
Ejemplo 4.2. Sea f : R
2
R denida por f(x, y) = ax + by donde a
2
+ b
2
= 0.
Las curvas de nivel de f son las rectas denidas por la ecuacion ax + by = c, para
cualquier c real. El vector gradiente de f es constante: f(x, y) = (a, b) en cualquier
punto (x, y) R
2
. As las curvas de nivel de f son todas las rectas perpendiculares
al vector (a, b); tales rectas son, evidentemente paralelas unas a otras.
2
R denida por f(x, y) = x
2
+ y
2
, las curvas de nivel c
de la funcion f son las soluciones de la ecuacion x
2
+y
2
= c, estas son vacas si c < 0,
la curva de nivel cero se reduce a un punto (0, 0), y para c > 0 la curva de nivel c
es un crculo de centro el origen y radio

c. El vector gradiente de f en un punto
generico es f(x, y) = (2x, 2y), es paralelo al radio, como era de esperar, pues el
radio es perpendicular a todo vector tangente al crculo en uno de sus puntos.
2
R, dada por la expresion f(x, y) = x
2
y
2
, las curva
de nivel c son hiperbolas cuando c = 0. En el caso c > 0, la hiperbola x
2
y
2
=
c tienen como eje el eje de las abscisas, cuando c < 0 el eje de la hiperbola es
el de las ordenadas. Para c = 0, la curva de nivel x
2
y
2
= 0 consiste en dos
rectas perpendiculares que se cortan en el origen. El gradiente f(x, y) = (2x, 2y).
Sustituyendo por valores particulares de x e Y se puede observar que ese vector
es perpendicular a la curva de nivel que pasa por (x, y), e indica la direccion de
crecimiento de f.
5. Derivadas de orden superior
Consideremos f : U R diferenciable en cada punto del abierto U R
n
. Para
cada natural i = 1, . . . , n tenemos denida la funcion
f
x
i
: U R
Nos planteamos estudiar las derivadas parciales de estas funciones.
Denicion 5.1. Es as que denimos, cuando existe el lmite, la jesima derivada
parcial de
f
x
i
en un punto a U, como
x
j
_
f
x
i
_
(a) =

2
f
x
i
x
j
(a)
que llamamos derivada segundade f con respecto a x
i
y x
j
en el punto a. Cuando
derivamos por segunda vez con respecto de la misma variable, escribimos indistin-
tamente
2
f
x
2
i
=

2
f
x
i
x
i
Si n = 2 tambien escribimos
2
f
x
2
= f
xx
;

2
xy
= f
xy
;

2
f
y
2
= f
yy
En forma analoga se denen las derivadas tercera, cuarta, etc. que llamaremos de-
rivadas de orden superior.
24
El teorema de Schwarz asegura que mediante algunas hipotesis naturales, el orden
en que se toman las derivadas parciales no inuye en el resultado nal. Es decir que
las derivadas que llamamos cruzadas cumplen:
2
f
x
i
x
j
=

2
f
x
j
x
i
Hay diferentes enunciados para este teorema, nosotros veremos dos.
Teorema 5.1. Teorema de Schwarz I Sean U abierto de R
n
, f : U R. Su-
pongamos que las derivadas cruzadas

2
f
x
i
x
j
,

2
f
x
j
x
i
estan denidas en una bola
B(a, ) U, y que son continuas en el punto a. Entonces ambas derivadas coin-
ciden en a.
Demostracion. Por simplicidad en la notacion, y sin perdida de generalidad, su-
pondremos que n = 2 y a = (x
0
, y
0
). Para h sucientemente peque no, tal que
(x
0
+ h.y
0
+ h) B(a, ), denimos
(x) = f(x, y
0
+ h) f(x, y
0
) (11)
de forma que
(h) = f(x
0
+ h, y
0
+ h) f(x
0
+ h, y
0
) f(x
0
, y
0
+ h) + f(x
0
, y
0
)
= (x
0
+ h) (x
0
).
Llamamos a (h) el incremento doble de la funcion f en el rectangulo [x
0
, x
0
+h]
[y
0
, y
0
+ h]. La funcion es derivable en el intervalo [x
0
, x
0
+ h], y por el teorema
del valor medio, existe
1
(0, 1) tal que
(x
0
+ h) (x
0
) =
(x
0
+
1
h)h,
por lo que, derivando en (11), obtenemos
(x) =
f
x
(x, y
0
+ h)
f
x
(x, y
0
)
luego
(x
0
+
1
h)h =
_
f
x
(x
0
+
1
h, y
0
+ h)
f
x
(x
0
+
1
h, y
0
)
_
h = (h)
para este ultimo incremento de la funcion f
x
, aplicamos nuevamente el teorema del
valor medio (la existencia de f
xy
asegura la derivabilidad de f
x
con respecto a y),
para obtener la existencia de
2
(0, 1), tal que
(h) =

2
f
xy
(x
0
+
1
h, y
0
+
2
h)h
2
.
De la continuidad de f
xy
en (x
0
, y
0
) obtenemos que
lm
h0
(h)
h
=

2
f
xy
(x
0
, y
0
).
El resto de la demostracion consiste en ver que cambiando el rol de x por el de y,
este mismo lmite es igual a la otra derivada cruzada. Denimos entonces
(y) = f(x
0
+ h, y) f(x
0
, y),
25
de forma que el mismo incremento doble verica
(h) = (y
0
+ h) (y
0
).
Los mismos argumentos nos permiten obtener
lm
h0
(h)
h
=

2
f
yx
(x
0
, y
0
)
lo que concluye la demostracion.
El siguiente teorema permite derivar bajo el signo de integracion. Si bien se
utiliza para dar otra demostracion del Teorema de Schwarz, tiene relevancia por
s mismo.
Teorema 5.2. Sea f : U [a, b] R, donde U es un abierto de R
n
, y se verica:
1. Para cada x U jo, la funcion de una variable f(x, t) es integrable en el
intervalo [a, b].
2.
f
x
i
existe y es una funcion continua en U [a, b].
Entonces la funcion : U R denida mediante
(x) =
b
a
f(x, t)dt
tiene derivada parcial iesima en U, que verica
x
i
(x) =
b
a
f
x
i
(x, t)dt.
Demostracion. Tenemos que ver que, para un x arbitrario en U, se verica
lm
h0
(x + he
i
) (x)
h
=
b
a
f
x
i
(x, t)dt.
Sea > 0. Tomemos h sucientemente peque no tal que x + he
i
U. En primer
lugar,
(x + he
i
) (x)
h

b
a
f
x
i
(x, t)dt =
b
a
_
f(x + he
i
, t) f(x, t)
h

f
x
i
(x, t)
_
dt.
Por el teorema del valor medio, existe (0, 1) tal que
f(x + he
i
, t) f(x, t) = h
f
x
i
(x + he
i
, t)
Por otra parte, al ser
f
x
i
una funcion continua en el conjunto [x, x + he
i
] [a, b]
compacto, obtenemos la continuidad uniforme, donde existe > 0 tal que si |h| <
tenemos
f
x
i
(y, t)
f
x
i
(x, t)
<

b a
, (y, t) [x, x + he
i
] [a, b].
Sustituyendo, obtenemos
b
a
_
f(x + he
i
, t) f(x, t)
h

f
x
i
(x, t)
_
dt
b
a
f
x
i
(x + he
i
, t)
f
x
i
(x, t)
dt
< ,
completando la demostracion.
26
Teorema 5.3. Teorema de Schwarz II Sea f : U R, con U abierto de R
n
.
Supongamos que existe la derivada
f
x
j
y que existen y son continuas las derivadas
f
x
i
y

2
f
x
i
x
j
en todo U. Entonces, existe

2
f
x
j
x
i
y verica
2
f
x
i
x
j
=

2
f
x
j
x
i
en todos los puntos de U.
Demostracion. Por simplicidad en la notacion, y sin perdida de generalidad, supon-
gamos que n = 2, a = (x
0
, y
0
). Como U es abierto, existen intervalos I, J centrados
en x
0
e y
0
respectivamente, y tales que I J U. Si x I e y J, podemos escribir
f(x, y) = f(x
0
, y) +
x
x
0
f
x
(t, y)dt.
La continuidad de f
xy
nos permite aplicar el teorema anterior, obteniendo
f
y
(x, y) =
f
y
(x
0
, y)
. .
no depende de x
+
x
x
0
2
f
xy
(t, y)dt
Derivando respecto a x y mediante el teorema fundamental del calculo, se tiene la
tesis.
Observaci on 5.1. El teorema de Schwarz se aplica tambien para derivadas de orden
superior, obteniendo, por ejemplo para las derivadas terceras de f(x, y), que
3
f
xxy
=

3
f
yx
=

3
f
yxx
cuando U es abierto en R
2
, y f : U R verica las hipotesis correspondientes.
Ejemplo 5.1. Veamos que la funcion f : R
2
R denida por
f(x, y) =
_
xy(x
2
y
2
)
x
2
+y
2
si (x, y) = 0
0 si (x, y) = 0
tiene derivadas cruzadas distintas en el origen. En efecto, si y = 0 tenemos
f
x
(0, 0) = lm
x0
f(x, 0) f(0, 0)
x
= 0
Si y = 0, tenemos
f
x
(0, y) = lm
x0
f(x, y) f(0, y)
x
= lm
x0
y(x
2
y
2
)
x
2
+ y
2
= y
Por eso,
y
_
f
x
_
(0, 0) = lm
x0
f
x
(0, y) f
x
(0, 0)
y
= 1
Calculos similares muestran que
x
_
f
y
_
(0, 0) = 1.
27
6. Formula de Taylor
Lo que hasta ahora denotamos con df|
a
lo denotamos, por comodidad como df
a
.
n
R. Si existen todas las derivadas de segundo
orden de f en un punto a del abierto U de R
n
, llamamos diferencial segundo de f
en a, y lo designamos d
2
f
a
, a la funcion
d
2
f
a
: R
n
R
v
n
i,j
2
f
x
i
x
j
(a)v
i
v
j
para todo v = (v
1
, . . . , v
n
) R
n
.
Es decir que d
2
f
a
(v) =
n
i,j
2
f
x
i
x
j
(a)v
i
v
j
Observaci on 6.1. Observemos que la diferencial segunda es un polinomio ho-
mogeneo de segundo grado en las variables v
1
, . . . , v
n
. Podemos escribir
d
2
f
a
(v) = (v
1
, . . . , v
n
)
_
_
_
2
f
x
1
x
1
(a)

2
f
x
1
x
n
.
.
.
.
.
.
.
.
.
2
f
x
n
x
1
(a)

2
f
x
n
x
n
_
_
_
_
_
_
v
1
.
.
.
v
n
_
_
_
= vHv
t
donde v
t
es el vector traspuesto de v, y la matriz correspondiente H la llamamos
matriz Hessiana o hessiano.
Cuando estamos en las hipotesis del teorema de Schwarz, las derivadas cruzadas
coinciden, es decir

2
f
x
i
x
j
(a) =

2
f
x
j
x
i
(a). En este caso el Hessiano es una matriz
simetrica, y por lo tanto, la diferencial segunda es una forma cuadratica, que llama-
mos la Hessiana de f en a
Ejemplo 6.1. Por ejemplo si n = 2 y v = (h, k), y las derivadas cruzadas coinciden
en un punto a U, tenemos
d
2
f
a
(h, k) =

2
f
x
2
(a)h
2
+ 2

2
f
xy
(a)hk +

2
f
y
2
(a)k
2
.
Denicion 6.2. Si existen todas las derivadas parciales de orden 3 de f : U R
en a U, denimos la diferencial tercero de f en el punto a, que designamos d
3
f
a
,
a la funcion
d
3
f
a
: R
n
R
v
i,j,k
3
f
x
i
x
j
x
k
(a)v
i
v
j
v
k
,
para todo v = (v
1
, . . . , v
n
) R
n
. Analogamente denimos la diferenciales de orden
superior p = 4, 5, . . . que resultan ser polinomios homogeneos de grado p, por lo que
verica
d
p
f
a
(tv) = t
p
d
p
f
a
(v).
Teorema 6.1 (Teorema de Taylor). Sean f : U R, y a U, donde U es un
abierto de R
n
.
28
(a) Supongamos que f es de clase C
p
en B(a, ) U y que las derivadas parciales
de orden p son funciones diferenciables en la misma bola. Entonces, para cada
v R
n
con a + v B(a, ), existe (0, 1) tal que
f(a + v) = f(a) +
p
i=1
1
i!
d
i
f
a
(v) +
1
(p + 1)!
d
p+1
f
a+v
(v). (12)
(b) Si ademas se verica que las derivadas parciales de orden p +1 son funciones
continuas en a, entonces vale
f(a + v) = f(a) +
p+1
i=1
1
i!
d
i
f
a
(v) + r(v), con lm
v0
r(v)
v
p+1
= 0.
Demostracion. Sea v = (v
1
, . . . , v
n
) tal que a + v B(a, ) y : [0, 1] R
n
dada
por (t) = a +tv. Si denimos : [0, 1] R mediante (t) = (f )(t) = f(a +tv),
tenemos (0) = f(a), (1) = f(a +v). Como f es de clase C
p
, nos asegura que es
de clase C
p
. Como las derivadas de f de orden p son diferenciables,
(p)
es derivable
en [0, 1] y por lo tanto continua. Aplicando la formula de Taylor para funciones de
una variable a la funcion en el intervalo [0, 1], obtenemos que existe (0, 1) tal
que
(1) = (0) +
p
i=1
1
i!
(i)
(0) +
1
(p + 1)!
(p+1)
(). (13)
La formula (12) a obtener, es esta misma ecuacion escrita en terminos de f. Para
ver esto aplicamos la regla de la cadena a la funcion compuesta (t) = (f )(t) =
f(a + tv) para obtener
(t) =
n
i=1
f
x
i
(a + tv)v
i
= df
a+tv
(v),
(0) = df
a
(v).
Derivando nuevamente
(t) =
n
i,j=1
2
f
x
i
x
j
(a + tv)v
i
v
j
= d
2
f
a+tv
(v),
(0) = d
2
f
a
(v)
Analogamente obtenemos
(k)
(0) = d
k
f
a
(v) para k = 3, . . . , p y tambien
(p+1)
() =
d
p+1
f
a+v
(v), lo que sustituyendo en (13) da la formula (12).
Veamos ahora la parte (b).
(p + 1)!
r(v)
v
p+1
d
p+1
f
a+v
(v) d
p+1
f
a
(v)
v
p+1
i
1
,...,i
p+1
=1
p+1
f
x
i
1
. . . x
i
p+1
(a + v)

p+1
f
x
i
1
. . . x
i
p+1
(a)
|v
1
1
. . . v
i
p+1
|
v
p+1
i
1
,...,i
p+1
=1
p+1
f
x
i
1
. . . x
i
p+1
(a + v)

p+1
f
x
i
1
. . . x
i
p+1
(a)
0
si v 0 por la continuidad de las derivadas de orden p + 1 en a, completando la
demostracion.
29
Ejemplo 6.2. Dada f(x, y) con derivadas primeras continuas y diferenciales en
alguna bola centrada en a = (x, y) y derivadas segundas continuas en a, del teorema
de Taylor con p = 1, obtenemos que
f(x + h, y + k)f(x, y) = f
x
(x, y)h + f
y
(x, y)k
+
1
2
f
xx
(x, y)h
2
+ f
xy
(x, y)hk +
1
2
f
yy
(x, y)k
2
+ r(h, k)
donde
r(h, k)
h
2
+ k
2
0 cuando (h, k) (0, 0).
7. Extremos de funciones de varias variables
Denicion 7.1. Sean f : U R y a U, abierto de R
n
.
1. Decimos que f(a) es un maximo relativo o local de f, o que f presenta un
maximo relativo (o local) en a, si existe una bola B(a, ) U tal que
f(a) f(x) para todo x B(a, ).
La denicion de mnimo relativo o local es analoga, es decir si existe una bola
B(a, ) tal que
f(a) f(x) para todo x B(a, ).
Si f presenta maximo o mnimo relativo, decimos que f presenta extremo
relativo (o local) en a.
2. Si en a U se verica
f(a) f(x) para todo x U,
decimos que f(a) es el maximo absoluto de f en U, o que f presenta su maximo
absoluto en a, con el valor f(a). (Analogamente se dene el mnimo absoluto
en U.)
Teorema 7.1 (Condicion necesaria de extremo). Si f : U R presenta extremo
relativo en un punto a del abierto U R
n
, en el que existe la iesima derivada
parcial, entonces esta derivada es nula.
Demostracion. Supongamos, por ejemplo, que f presenta maximo relativo en a =
(a
1
, . . . , a
n
), y que existe su derivada parcial iesima. Entonces, como existe una
bola B(a, ) U tal que
f(a) f(x) para todo x B(a, ),
en particular se verica
f(a
1
, . . . , a
i
, . . . , a
n
) f(a
1
, . . . , x
i
, . . . , a
n
) x
i
(a
i
, a
i
+ ). (14)
El lmite del cociente incremental
lm
x
i
a
f(a
i
, . . . , x
i
, . . . , a
n
) f(a
1
, . . . , a
i
, . . . , a
n
)
x
i
a
= L (15)
porque existe la derivada iesima. Si L > 0 el cociente es positivo en alg un intervalo
a
i
< x
i
< a
i
+ (por el teorema de conservaci on del signo para el lmite), y el
numerador en (15) es positivo, lo que contradice (14). Si L < 0 el mismo argumento
para a
i
< x
i
< a
i
produce tambien una contradiccion, por lo que L =
f
x
i
(a) = 0.
El caso de mnimo relativo es analogo.
30
Observaci on 7.1. Una demostracion alternativa se obtiene observando que la fun-
cion de una variable (x) = f(a
1
, . . . , x, . . . , a
n
) presenta un maximo en x = a
i
y
aplicando la condicion necesaria de extremo para funciones de una variable, dado
que
(a
i
) =
f
x
i
(a).
El teorema anterior nos da una herramienta para la b usqueda de extremos de
una funcion. Si sabemos que existe alguna derivada parcial, y que no se anula en un
punto a, sabemos que en a no hay extremo relativo. De otra forma, si existen todas
las derivadas parciales en un dominio U, los extremos se presentan unicamente en
los puntos donde se anulan todas las derivadas parciales. Estos puntos se denominan
puntos crticos, y son los candidatos a ser extremos relativos, y absolutos, mas
precisamente denimos
Denicion 7.2. Dada un a funcion f : U R
n
R, de clase C
2
en el abierto U,
se dice que a es un punto crtico si para cada i = 1, . . . , n
f
x
i
(a) = 0 o no existen.
Denicion 7.3. Llamamos punto de ensilladura o mas brevemente punto silla a un
punto crtico que no es ni maximo ni mnimo.
El problema que estudiaremos a continuaci on es como reconocer si un punto
crtico es maximo relativo, mnimo relativo, o punto silla.
Teorema 7.2 (Criterio de clasicacion de puntos crticos). Sean f : U R y a U
un punto crtico de f. Supongamos que f es de clase C
2
en alguna bola B(a, ) U.
Entonces
(a) Si todos los valores propios de la matriz Hessiana son positivos (es decir, si la
forma cuadratica d
2
f
a
es denida positiva), f presenta mnimo relativo en a.
(b) Si todos los valores propios de la matriz Hessiana son negativos (es decir, si
d
2
f
a
es una forma cuadratica denida negativa), f presenta maximo relativo
en a
(c) Si existen valores propios de la matriz Hessiana positivos y negativos (es decir
d
2
f
a
es una forma cuadratica indenida), f presenta punto silla en a.
Observaci on 7.2. El teorema no analiza los casos en que existe alg un valor propio
nulo del Hessiano, y todos los demas tienen signo constante, (correspondiente a los
casos en que d
2
f
a
es una forma cuadratica semidenida positiva o negativa). En
estos casos decimos que el criterio no clasica al punto crtico.
Ejemplo 7.1. Consideremos f : R
2
R dada por f(x, y) = x
2
+ y
3
. Es facil ver
que f presenta un punto silla en (0, 0). Su matriz Hessiana en el punto (0, 0) tiene
la forma
_
2 0
0 0
_
con valores propios 2 y 0. Por su parte, la funcion g : R
2
R dada por g(x, y) =
x
2
+ y
4
presenta mnimo relativo (y absoluto) en (0, 0), y tiene la misma matriz
Hessiana en el punto (0, 0). Esto muestra que con el analisis de la matriz hessiana
no es suciente para clasicar todos lo puntos crticos.
31
Demostracion. Veamos (a). Estamos en las hipotesis de la parte (b) del teorema de
Taylor con p = 1. Existe > 0 tal que si a + v B(a, ) U tenemos
f(a + v) f(a) = df
a
(v) +
1
2
d
2
f
a
(v) + r(v),
donde lim
v0
r(v)
v
2
= 0. Como a es punto crtico df
a
(v) = 0, y si v = 0, podemos
escribir
f(a + v) f(a) = v
2
_
1
2
d
2
f
a
(
v
v
) +
r(v)
v
2
_
(16)
Estudiemos el signo del diferencial segundo. Como H es una matriz real y simetrica,
existe una base ortonormal de vectores propios de H, que designamos {
1
, . . . ,
n
}
con valores propios
1
, . . . ,
n
. Dado x = 0 R
n
, podemos escribir x = a
1
1
+ +
a
n
n
, y tenemos
d
2
f
a
(x) = xHx
t
=
_
n
i=1
a
i
i
_
H
_
n
j=1
a
j
t
j
_
=
n
i,j=1
a
i
a
j
i
H
t
j
=
n
i,j=1
a
i
a
j
t
j
=
n
i,j=1
i
a
2
i
(17)
y d
2
f
a
(x) > 0, porque todos lo valores propios son positivos y alg un a
i
es no nulo.
Consideremos el conjunto compacto S = {x R
n
: x = 1}. Tenemos d
2
f
a
(x) >
0 para todo x S y, por ser S compacto y d
2
f
a
(x) una funcion continua en x, f
alcanza su mnimo absoluto, que es entonces un n umero m positivo. En conclusion
d
2
f
a
(x) m > 0 para todo x S. Si v = 0 R
n
, se tiene x =
v
v
S, y
1
2
d
2
f
a
_
v
v
_
m
2
Por otra parte, como lm
v0
r(v)
v
2
= 0 y
m
2
> 0, existe > 0 (que podemos elegir de
forma que sea menor que el de la hipotesis) tal que si v < , se cumple
m
2
<
r(v)
v
2
<
m
2
Entonces de las dos ultimas desigualdades aplicadas en (16) se tiene que en una bola
B(a, ) U, tal que si v B
(a, ) se verica f(a + v) > f(a), demostrando que f

presenta un mnimo relativo en a.
La demostracion de (b) es analoga. Para demostrar (c) observemos que la forma
cuadratica d
2
f
a
(x) que es una funcion continua, restringida a S (que es compacto)
alcanza su mnimo m y su maximo M en versores x e y, y se cumple m < 0 < M,
como resulta de (17), dado que d
2
f
a
(
i
) =
i
, y que existen valores propios positivos
y negativos.
En todos los vectores de la forma v = tx (con t = 0) el primer sumando de la
derecha en (16) verica
1
2
d
2
f
a
_
v
v
_
=
m
2
< 0
y como el segundo sumando tiende a cero, en todo entorno de a existen puntos
tales que f(a + v) < f(a) (tomando t sucientemente peque no). Analogamente en
cualquier entorno de a existen puntos de la forma v = ty en donde f(a +v) > f(a),
por lo que f no presenta ni mnimo ni maximo en a, es decir, presenta un punto de
ensilladura.
32
Observaci on 7.3. Un punto clave es la matriz Hessiana H pues en ella esta conte-
nida la informacion para concluir si el punto crtico es un mnimo, maximo o punto
silla. Seg un el signo de los valores propios, y por lo tanto seg un el signo de la forma
cuadratica d
2
f
a
, ahora hay otro criterio para determinar cuando la forma cuadrati-
ca d
2
f
a
es denida positiva o denida negativa en terminos de los elementos de la
matriz Hessiana (sin calcular valores propios).
Dada una matriz cuadrada A = (a
ij
) con i, j = 1, . . . , n, se consideran las sub-
matrices angulares A
k
, con k = 1, 2, . . . , n denidas como
A
1
=
_
a
11
_
, A
2
=
_
a
11
a
12
a
21
a
22
_
, A
3
=
_
_
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
_
_
, . . . , A
n
= A
Es decir, la matriz A
k
esta formada por los elementos de la matriz A que estan en
su angulo superior izquierdo, incluyendo k las y k columnas de ella. Se dene
k
= det A
k
. Se tiene entonces que la forma cuadratica vHv
t
es denida positiva
(denida negativa) si y solo si todos los determinantes
1
, . . . ,
n
son n umeros
positivos (los determinantes tienen signos alternados empezando con
1
< 0,
2
>
0, . . . , respectivamente). De esta forma tenemos el siguiente criterio
1. Si todas las submatrices angulares de la matriz Hessiana H tienen determi-
nantes positivos, entonces la funcion f tiene un mnimo local en a
2. Si las submatrices angulares de la matriz Hessiana H tienen determinantes
de signo alternado (comenzando con un valor negativo), entonces la funcion f
tiene un maximo local en a.
La demostracion de la propiedad anterior se puede ver en Algebra Lineal de
Claudio Pita Ruiz.
Veamos ahora que ocurre cuando n = 2
Corolario 7.3 (Clasicacion de puntos crticos en R
2
). Sean f : U R, a
U R
2
un punto crtico de f. Supongamos que f es de clase C
2
en alguna bola
B(a, ) U. Sea
H =
_
f
xx
(a) f
xy
(a)
f
yx
(a) f
yy
(a)
_
Entonces
(a) Si det(H) > 0 y f
xx
(a) > 0 f presenta mnimo relativo en a
(b) Si det(H) > 0 y f
xx
(a) < 0, f presenta maximo relativo en a.
(c) Si det(H) < 0, f presenta punto silla en a.
Demostracion. Como H es una matriz simetrica y real, tiene valores propios reales
1
y
2
, como se puede vericar directamente, calculando las races de det(HId) = 0.
Sabemos que
det(H) = f
xx
(a)f
yy
(a) f
2
xy
(a) =
1
2
, (18)
tr(H) = f
xx
(a) + f
yy
(a) =
1
+
2
. (19)
Si det(H) > 0 de (18) obtenemos que los valores propios tienen el mismo signo.
Ademas f
xx
(a)f
yy
(a) > f
2
xy
(a) 0, y las derivadas segundas f
xx
(a), f
yy
(a) tienen
igual signo. Entonces si f
xx
(a) > 0, en vista de (19) la traza tr(H) resulta positiva,
33
y ambos valores propios son positivos. Se aplica entonces (a) en el teorema 7.2, para
obtener (a) en el corolario. El caso (b) es analogo. Si det(H) < 0 los valores propios
son de signo opuesto, y se aplica (c) del teorema 7.2 para completar la demostracion
del corolario.
Veamos ahora algunos ejemplos.
2
R la funcion dada por
f(x, y) = 2(x 1)
2
+ 3(y 2)
2
los puntos crticos de f son soluciones del sistema
_
f
x
= 4(x 1) = 0
f
y
= 6(y 2) = 0
que tiene por solucion x = 1 e y = 2. Entonces el unico punto crtico de la funcion
es el punto (1, 2). La matriz Hessiana de f es
H =
_
f
xx
f
xy
f
yx
f
yy
_
=
_
4 0
0 6
_
que en (1, 2) es ella misma. Se ve que los valores propios de esta matriz son 4 y 6
(ambos positivos) o bien, que los determinantes de la submatrices angulares son 4
y 24 (tambien ambos positivos) por lo que concluimos que la funcion f tiene en el
punto (1, 2) un mnimo relativo.
3
f(x, y, z) = e
x
2
+ e
y
2
+ z
2
entonces la solucion del sistema
_
_
_
f
x
= 2xe
x
2
= 0
f
y
= 2ye
y
2
= 0
f
z
= 2z = 0
tiene como unica solucion el punto (0, 0, 0). La matriz Hessiana es
H =
_
_
f
xx
f
xy
f
xz
f
yx
f
yy
f
yz
f
zx
f
zy
f
zz
_
_
=
_
_
(4x
2
2)e
x
2
0 0
0 (4y
2
2)e
y
2
0
0 0 2
_
_
que en el origen es
H =
_
_
2 0 0
0 2 0
0 0 2
_
_
Los valores propios de la matriz son 2 y 2, por lo que la funcion f tiene un punto
silla en el origen.
Ejemplo 7.4. Consideremos la funcion f : R
3
R dada por
f(x, y, z) = sen x + sen y + sen z sen(x + y + z)
34
Esta funcion es diferenciable y tiene sus derivadas parciales de todos los ordenes
continuas en todo R
3
.
El punto (
2
,

2
,

2
) es solucion del sistema
_
_
_
f
x
= cos x cos(x + y + z) = 0
f
y
= cos y cos(x + y + z) = 0
f
z
= cos z cos(x + y + z) = 0
por lo que es un punto crtico de f .En ese punto la matriz Hessiana de f es
_
_
2 1 1
1 2 1
1 1 2
_
_
Los determinantes de las submatrices angulares son
1
= 2,
2
= det
_
2 1
1 2
_
= 3,
3
= det H = 4
Puesto que son de signos alternados (con
1
< 0) concluimos que la funcion f
tiene en (
2
,

2
,

2
) un maximo local. Dicha conclusion se puede obtener tambien con
el estudio de los valores propios, ya que det(H Id) =
3
6
2
9 4 =
( + 1)
2
( + 4) y por lo tanto tiene como valores propios 1 y 4 que son ambos
negativos. Se tiene un maximo relativo en (
2
,

2
,

2
) y este vale f(
2
,

2
,

2
) = 4.
Ahora veremos un ejemplo donde un valor propio de la matriz Hessiana en un
punto crtico sea nulo.
2
f(x, y) = ax
2
+ by
4
Tenemos que
_
f
x
= 2ax = 0
f
y
= 4by = 0
de donde se ve que el origen (0, 0) es el unico punto crtico de la funcion. La matriz
Hessiana es
H =
_
f
xx
f
xy
f
yx
f
yy
_
=
_
2a 0
0 12by
2
_
que en el origen es
H =
_
2a 0
0 0
_
Se tiene entonces que 0 es un valor propio de la matriz Hessiana. Como dijimos
nada se puede concluir en este caso de la naturaleza del punto crtico (0, 0) para la
funcion f. De hecho, puede ocurrir cualquier cosa en es punto: si a = b = 1, la funcion
f(x, y) = x
2
+y
4
tiene un mnimo local en (0, 0), pues es claro que para una bola B
cualquiera de R
2
de centro (0, 0) se tiene f(x, y) = x
2
+y
4
0 = f(0, 0), (x, y) B;
si a = b = 1, la funcion f(x, y) = x
2
y
4
tiene un maximo local en el origen,
pues f(x, y) = x
2
y
4
0 = f(0, 0), (x, y) B. Si a = 1 y b = 1 la funcion
f(x, y) = x
2
+ y
4
tiene un punto de ensilladura en el origen, pues en cualquier
bola B de R
2
con centro en el origen, digamos B = {(x, y) R
2
: x
2
+ y
2
<
2
} se
tiene puntos (r, 0) y (0, s) de modo que f(r, 0) = r
2
< 0 = f(0, 0) (con r
2
<
2
) y
f(0, s) = s
4
> 0 = f(0, 0) (con s
2
<
2
).
35
8. Funciones implcitas y aplicaciones
Para funciones reales de una variable real f : I R R, tenemos una repre-
sentacion geometrica de ellas, a saber su graco.
Denicion 8.1. En el caso de una funcion de n variables f : U R
n
R, denimos
(analogamente al caso de una variable) el graco de funcion f, que denotamos por
G
f
, como el conjunto
G
f
= {(x
1
, . . . , x
n
, x
n+1
) R
n+1
: (x
1
, . . . , x
n
) U, e x
n+1
= f(x
1
, . . . , x
n
)}
Observese que este es un conjunto del espacio R
n+1
. As para n = 1, tenemos el
graco de la funcion f : U R R denido como el conjunto del espacio R
2
G
f
= {(x, y) R : x U, y = f(x)}
Si n = 2, el graco de f : U R
2
R es el conjunto de R
3
G
f
= {(x, y, z) R
3
: (x, y) U, z = f(x, y)}
Consideremos un abierto U en R
2
, una funcion F : U R, y un punto (x
0
, y
0
)
tal que F(x
0
, y
0
) = 0. Queremos averiguar bajo que condiciones esta raz de F se
extiende al graco de un a curva en el conjunto U, es decir, la ecuacion F(x, y) = 0
tiene soluciones de la forma (x, f(x) para x I = (x
0
, x
0
+), para alg un > 0.
En este caso pensamos que despejamos la variable y como funcion de la variable
x (y = f(x)) de la condicion F(x, y) = 0, y decimos que f es la funcion implcita
denida en I por la ecuacion F(x, y) = 0.
De otra forma, si sabemos que F(x
0
, y
0
) = 0 nos preguntamos si el conjunto
F
1
(0) es el graco de alguna funcion f en un entorno de x
0
.
Teorema 8.1 (Teorema de la funcion implcita). Sean (x
0
, y
0
) U R
2
abierto,
y F : U R de clase C
1
, tales que F(x
0
, y
0
) = 0. Supongamos que F
y
(x
0
, y
0
) = 0.
Entonces:
(a) Existen intervalos I = (x
0
, x
0
+), J = (y
0
, y
0
+) tales que I J U,
y una funcion f : I J de clase C
1
tal que
F(x, y) = 0 y = f(x) (x, y) I J.
(b) Si x I tenemos
f
(x) =
F
x
(x, f(x))
F
y
(x, f(x))
. (20)
Demostracion. Supongamos, para jar ideas, que F
y
(x
0
, y
0
) > 0. Como F
y
es conti-
nua existen intervalos = (x
0
, x
0
+ ), y J = (y
0
, y
0
+ ) tales que I J U
y F
y
(x, y) > 0 si (x, y) [x
0
, x
0
+ ] [y
0
, y
0
+ ].
Entonces para x
0
I la funcion de una variable F(x
0
, y) es estrictamente cre-
ciente en el intervalo [y
0
, y
0
+ ]. Como F(x
0
, y
0
) = 0, tenemos F(x
0
, y
0
) <
0 < F(x
0
, y
0
+ ).
La conservacion del signo de la funcion f en un entorno de los puntos (x
0
, y
0
)
y (x
0
, y
0
+ ) nos asegura (tomando otro menor que el anterior, si es necesario)
que, para cada x [x
0
, x
0
+ ], tenemos
F(x, y
0
) < 0 < F(x, y
0
+ ).
36
Como ademas cada funcion
x
(y) = F(x, y) es continua en J, por la propiedad de
Bolzano-Darboux, existe (para cada x) una raz y J tal que
x
(y) = F(x, y) = 0.
Denimos f : I J mediante f(x) = y donde y, es la raz hallada para el x
correspondiente. Esto demuestra (a) (falta ver si f es de clase C
1
).
Veamos (b). Si h = 0 verica x + h I tenemos F(x + h, f(x + h)) = 0.
Designamos k = f(x + h) f(x)y, por el teorema del valor medio aplicado a F en
el intervalo de extremos (x, f(x)) y (x + h, f(x) + k), sabemos que existe (0, 1)
tal que
0 = F(x + h, f(x) + k) F(x, f(x))
=
F
x
(x + h, f(x) + k)h +
F
y
(x + h, f(x) + k)k.
Entonces
f(x + h) f(x)
h
=
k
h
=
F
x
(x + h, f(x) + k)
F
y
(x + h, f(x) + k)
. (21)
La continuidad de las derivadas parciales F
x
y F
y
nos permite asegurar que existen
constantes M y H > 0 tales que
|F
x
(x, y)| M, |F
y
(x, y)| M,
para todo (x, y) [x
0
, x
0
+ ] [y
0
, y
0
+ ]. Esto nos permite obtener que
|f(x + h) f(x)|
M
H
h,
de donde resulta la continuidad de la funcion f en el punto x I. Es decir, si h 0
tenemos k 0. Tomando ahora lmite en (21) si h 0, obtenemos
f
(x) = lm
h0
f(x + h) f(x)
h
= lm
h0
F
x
(x + h, f(x) + k)
F
y
(x + h, f(x) + k)
= lm
(h,k)(0,0)
F
x
(x + h, f(x) + k)
F
y
(x + h, f(x) + k)
=
F
x
(x, f(x))
F
y
(x, f(x)
,
por la continuidad de las derivadas parciales, obtenemos (27). Para ver si f es de clase
C
1
, observamos que la derivada de f es una funcion continua por ser composicion
de funciones continuas.
Observaci on 8.1. Observemos que la funcion del teorema anterior es unica, en el
siguiente sentido. Supongamos que existe f
0
: I
0
J
0
, con I
0
, J
0
intervalos centrados
en x
0
, y
0
respectivamente, tales que
F(x, y) = 0 y = f
0
(x) (x, y) I
0
J
0
.
Sean x I I
0
, y0f(x), y
0
= f
0
(x). Si y = y
0
, por ejemplo y < y
0
, como F(x, y) =
F(x, y
0
) = 0 resulta, por el teorema de Rolle aplicado a
x
(y) = F(x, y) en el
intervalo [y, y
0
], que existe y tal que F
y
(x, y) = 0 contradiciendo F
y
> 0 en I J.
Esto demuestra la unicidad.
Observaci on 8.2. La formula (27) permite obtener que si F es de clase C
k
, entonces
f es de clase C
k
, por la regla de la cadena. Veamos como obtener las derivadas
37
segundas de f, suponiendo que F es de clase C
2
. Podemos derivar (27), pero es mas
sencillo derivar dos veces la igualdad
F(x, f(x)) = 0 para x I.
Derivando una vez, obtenemos
F
x
(x, f(x)) + F
y
(x, f(x))f
(x) = 0
que equivale a (27). Derivando nuevamente, obtenemos
F
xx
(x, f(x)) + F
xy
(x, f(x))f
(x) + F
yy
(x.f(x))f
(x)
2
+ F
y
(x, f(x))f
(x) = 0
de donde, como F
y
(x, f(x)) = 0, se obtiene el valor de f
(x).
Con una demostracion analoga se obtiene el siguiente teorema.
Teorema 8.2 (Teorema de la funcion implcita en R
n
). Sean (x
1
, x
2
, . . . , x
n
, y) U
abierto de R
n+1
, F : U R de clase C
1
. Supongamos que F(x
1
, x
2
, . . . , x
n
, y) = 0
y que
F
y
(x
1
, x
2
, . . . , x
n
, y) = 0. Entonces:
(a) Existe una bola B = B(a, ), donde a = (x
1
, x
2
, . . . , x
n
), un intervalo J =
(y , y +), tal que B J U, y una funcion f : B J de clase C
1
, tales
que
F(x
1
, x
2
, . . . , x
n
, y) = 0 y = f(x
1
, . . . , x
n
) (x
1
, . . . , x
n
, y) B J.
(b) Si (x
1
, . . . , x
n
) B tenemos
f
x
i
(x
1
, . . . , x
n
) =
F
x
i
(x
1
, . . . , x
n
)
F
y
(x
1
, . . . , x
n
)
.
Es importante observar que el teorema de la funcion implcita se aplica indistin-
tamente a cualquier variable. Elegimos la ultima para simplicar los enunciados de
los teoremas. Por ejemplo, si F(x
0
, y
0
, z
0
) = 0 para una funcion de tres variable de
clase C
1
, y F
x
(x
0
, y
0
, z
0
) = 0, obtenemos que existen una funcion f de dos variables
tales que F(x, y, z) = 0 x = f(y, z). En lo que respecta a las derivadas parciales,
obtenemos
f
y
(y, z) =
F
y
(f(y, z), y, z)
F
x
(f(y, z), y, z)
,
f
z
(y, z) =
F
x
(f(y, z), y, z)
F
x
(f(y, z), y, z)
.
Denicion 8.2. Dado un conjunto S R
n
, no vaco, denimos como el ortogonal
a S, que denotamos por S
, como
S
= {v R
n
: v s s S}
Una propiedad importante es que S
es un subespacio vectorial cerrado de R

n
, y
que llamamos entonces el subespacio ortogonal a S.
Veamos ahora una aplicacion geometrica del teorema de la funcion implcita.
38
Teorema 8.3. Sea F : U R, donde U es un abierto de R
n
. Dado c R con-
sideremos M = F
1
(c), el conjunto de nivel c de F, y un punto p M, tal que
F(p) = 0. Entonces, el espacio tangente a M en p es el subespacio ortogonal a
F(p), es decir T
p
M = F(p)
. En particular, T
p
M es un subespacio vectorial de
R
n
de dimension n 1.
Demostracion. Tenemos que por el teorema 4.2 se tiene T
p
M F(p)
.
Consideremos ahora v = (v
1
, . . . , v
n
) F(p)
, es decir
v
1
F
x
1
(p) + + v
n
F
x
n
(p) = 0 (22)
Como F(p) = 0, alguna derivada parcial de F no es nula, supongamos entonces
que
F
x
n
(p) = 0. Designemos p = (p
1
, . . . , p
n
). Del teorema de la funcion implcita
obtenemos una bola B = B(a, ), con a = (p
1
, . . . , p
n1
), un intervalo J = (p
n

, p
n
+ ), y una funcion f : B J tales que
x
n
= f(x
1
, . . . , x
n1
) F(x
1
, . . . , x
n
) = 0, (x
1
, . . . , x
n
) B J.
Como ademas se verica
f
x
i
(a) =
F
x
i
(p)
F
x
n
(p)
, para i = 1, . . . , n 1,
en vista de (22), resulta que
v
n
= v
1
f
x
1
(a) + + v
n1
f
x
n1
(a).
Por eso la curva
(t) = (p
1
+ tv
1
, . . . , p
n1
+ tv
n1
, f(p
1
+ tv
1
, . . . , p
n1
+ tv
n1
))
verica (0) = p, y (t) = v, obteniendo que v T
p
M. Por lo que hemos probado
que F(p)
T
p
M, concluyendo la demostracion.
Dada la funcion f : U R de clase C
1
en U, abierto de R
n
, el graco G
f
R
n+1
(ver denicion 8.1) es un conjunto que esta en correspondencia biyectiva con el do-
minio U de f: cada punto a = (x
1
, . . . , x
n
) U se corresponde con un punto
p = (x
1
, . . . , x
n
, f(x
1
, . . . , x
n
)) G
f
. En vista que la nocion de espacio tangente
esta denida para subconjuntos arbitrarios de R
n+1
, tiene sentido considerar el es-
pacio tangente al graco G
f
de la funcion f en un punto p, que designamos como
T
p
G. El teorema anterior nos permite obtener una caracterizacion de este espacio
tangente.
Corolario 8.4. Sea f : U R de clase C
1
en U, abierto de R
n
. Entonces,
dado a = (x
1
, . . . , x
n
) U, el espacio tangente al graco G
f
de f en el punto
p = (x
1
, . . . , x
n
, f(x
1
, . . . , x
n
)) es el subespacio vectorial de R
n+1
ortogonal al vector
(
f
x
1
(a), . . . ,
f
x
n
(a), 1). En otros terminos
T
p
G = (
f
x
1
(a), . . . ,
f
x
n
(a), 1)
39
Demostracion. Consideremos la funcion auxiliar F : U R R denida mediante
F(x
1
, . . . , x
n
, x
n+1
) = f(x
1
, . . . , x
n
) x
n+1
,
que es de clase C
1
. Seg un la denicion del graco G
f
de f, se tiene que es el conjunto
de nivel 0 de F. Dado a = (x
1
, . . . , x
n
) U tenemos p = (x
1
, . . . , x
n
, f(x
1
, . . . , x
n
)),
y
F(p) = (
f
x
1
(a), . . . ,
f
x
n
(a), 1) = 0.
Aplicando entonces el teorema anterior, obtenemos
T
p
G = F(p)
= (
f
x
1
(a), . . . ,
f
x
n
(a), 1)
, concluyendo la demostracion.
Ejemplo 8.1. Como ejemplo estudiemos el caso n = 2, considerando f : U R de
clase C
1
en U, abierto de R
2
. Sean a = (x
0
, y
0
) U, y p = (x
0
, y
0
, f(x
0
, y
0
)) G
f
.
De acuerdo al corolario el espacio tangente al graco de f en p es el subespacio
vectorial T
p
G = (f
x
(a), f
y
(a), 1)
, en R
3
y por lo tanto
f
x
(a)(x x
0
) + f
y
(a)(y y
0
) 1(z f(x
0
, y
0
)) = 0
es decir
z = f(x
0
, y
0
) +
f
x
(x
0
, y
0
)(x x
0
) +
f
y
(x
0
, y
0
)(y y
0
)
que es la ecuacion del plano tangente el el punto a. De otra forma podemos decir
que el plano tangente esta formado por los puntos de espacio afn que se obtienen
sumando al punto p a los vectores de T
p
G. Esto explica la denominacion de tangente
para ambos objetos matematicos.
9. Extremos condicionados
Supongamos que queremos los extremos de la suma de las tres coordenadas de
los puntos de R
3
que pertenecen a la esfera de centro el origen y radio unidad. En
otros terminos, queremos determinar los extremos de f(x, y, z) = x + y + z en el
dominio M = {(x, y, z) R
3
: x
2
+ y
2
+ z
2
= 1}.
Mas en general, si consideramos U abierto de R
3
, y dos funciones f : U R
y G : U R, el problema que estudiamos en esta seccion es el de determinar
los extremos de la funcion f en M = g
1
(0), el conjunto de puntos que verica
g(x, y, z) = 0. Tenemos dos funciones en juego, una que es la funcion f que queremos
minimizar, y la otra que liga a las variables intervinientes, que llamamos ecuacion
de ligadura, a continuaci on damos una denicion precisa de extremos ligados.
Denicion 9.1. Consideremos U abierto de R
n
, f : U R, g : U R, el conjunto
de nivel M = g
1
(0), y el punto p M. Decimos que f presenta un maximo relativo
condicionado a g en el punto p, si existe una bola B(a, ), con > 0, tal que
f(p) f(x) x B(a, ) M. (23)
La denicion de mnimo relativo condicionado es analoga, con un signo en lugar
de en (23).
Si f presenta maximo o mnimo relativo condicionado, decimos que f presenta
extremo relativo condicionado a g en p.
40
Teorema 9.1 (Multiplicadores de Lagrange). Consideremos U abierto de R
n
, f :
U R, g : U R, ambas de clase C
1
, p M = g
1
(0). Si f presenta un extremo
relativo condicionado a g en p, y se verica g(p) = 0, entonces existe un n umero
real tal que
f(p) = g(p).
Al n umero real llamamos multiplicador de Lagrange.
Demostracion. Como g(p) = 0, sabemos que el espacio tangente T
p
M = g(p)
.
Para ver entonces que los gradientes de f y g son colineales (que es lo que arma la
tesis), es suciente ver que f(p) T
p
M.
Sea entonces v T
p
M, por denicion, existe : (, ) M una curva diferen-
ciable en t = 0 con (0) = p y (0) = v. Como f presenta extremo en p restringido
a M, la funcion f presenta extremo en t = 0, de donde
0 = (f )
(0) = f(p) (0) = f(p) v,

por lo que f(p) v. Como v T
p
M es arbitrario, resulta que f(p) T
p
M, es
decir los gradientes de f y g son colineales, completando la demostracion.
Al igual que la b usqueda de extremos de f : U R, que llamamos extremos
libres, en contraposicion a los extremos condicionados, el teorema del multiplicador
de Lagrange da una condicion necesaria de extremos condicionados. Una vez des-
cartados los puntos en los que f, g no son de clase C
1
, y aquellos en los que g = 0,
los extremos condicionados se presentan unicamente en aquellos puntos en los que
existe real tal que f(p) = g(p). Para buscar estos puntos condicionados
consideramos la funcion auxiliar
L(x, ) = f(x) g(x) con x U R
n
y R,
y observando que como
L(x, ) = f(x) g(x) = 0
los extremos condicionados de f a g son los puntos crticos de L.
Parte II
Diferenciabilidad de funciones de
R
n
en R
m
Analizaremos la nocion de diferenciabilidad para funciones vectoriales de varia-
ble vectorial, que tambien llamamos aplicaciones. Una aplicacion es entonces una
funcion f : X R
m
donde X es un subconjunto de R
n
.
Un primer ejemplo lo constituyen las aplicaciones o transformaciones lineales, es
decir la aplicaciones T : R
n
R
m
que verican T(x +y) = T(x) +T(y) para
, R e x, y R
n
, todos arbitrarios. Recordemos que dada una transformacion
lineal T como antes existe una unica matriz A = (a
ij
) de tama no mn, que llamamos
matriz asociada, tal que se verica
T(x) = Ax
t
,
41
asumiendo que x = (x
1
, . . . , x
n
) es un vector la. Si las funciones coordenadas de T
son T
1
, . . . , T
m
tenemos T
i
(x) = A
i
, x, para i = 1, . . . , m donde A
i
= (a
i1
, . . . , a
in
designa la iesima la de A.
Casos particulares de aplicaciones son los cambios de coordenadas cartesianas a
polares, viene dado por la aplicacion
x = cos , y = sen ,
que denimos de dominio X = [0, +) [0, 2) en R
2
.
Si en el ejemplo anterior agregamos la altura z de un punto (x, y, z) de R
3
,
obtenemos la aplicacion
x = cos , y = sen , z = z
aplicacion denida en X = [0, +) [0, 2) R en R
3
, que llamamos cambio de
coordenadas cilndricas.
Otra aplicacion es el llamado cambio de coordenadas esfericas, que consiste en
describir un punto (x, y, z) de R
3
mediante sus coordenadas esfericas, designadas
(, , ) de forma que
x = cos sen , y = sen sen , z = cos
aplicacion denida en X = [0, +) [0, 2) [0, ) en R
3
.
10. Aplicaciones diferenciables
Denicion 10.1. Sean f : U R
m
, U abierto en R
n
. La aplicacion f es diferen-
ciable en un punto a U, cuando existen una transformacion lineal T : R
n
R
m
y una aplicacion p : B
(0, ) R
m
, con > 0 sucientemente peque no, tales que
para todo v R
n
con a + v B
(a, ) U, se verica
f(a + v) f(a) = T(v) +vp(v), lm
v0
p(v) = 0 (24)
La transformacion lineal anterior se llama diferencial de la aplicacion f en el punto a,
y se designa df
a
.Decimos ademas que f es diferenciable en U cuando es diferenciable
en todo a U.
Introduciendo la aplicacion r(v) = vp(v), que llamamos resto, la formula en
(24) puede escribirse como
f(a + v) f(a) = T(v) + r(v), lm
v0
r(v)
v
= 0
Estamos entonces deniendo que una aplicacion es diferenciable en un punto a cuan-
do su incremento se puede aproximar por una transformacion lineal.
Si ponemos v = 0 en (24) vemos que p se puede denir en v = 0 poniendo
p(0) = 0. Consideremos entonces, de aqu en mas p : B(0, ) R
m
.
Como las transformaciones lineales son continuas, es inmediato obtener que si
f es diferenciable en un punto a entonces es continua; tenemos f(a + v) f(a) si
v 0, como se ve tomando lmite a la derecha en (24).
42
Observaci on 10.1. Veremos que una transformacion lineal T : R
n
R
m
es dife-
renciable. Tenemos
T(a + v) (Ta) = T(v)
por lo que se verica la denicion (24), con df
a
= T y p(v) = 0 para todo v R
n
.
Como una aplicacion f : U R
m
equivale a sus m funciones coordenadas
f
1
, f
2
, . . . , f
m
, es natural relacionar la diferenciabilidad de una aplicacion con la de
sus funciones coordenadas. las coordenadas son funciones reales de variable vectorial,
cuya diferenciabilidad ya fue estudiada.
Teorema 10.1. Consideremos f = f
1
, . . . , f
m
: U R
m
, a U, abierto de R
n
.
Entonces la aplicacion f es diferenciable en a si y solo si sus coordenadas f
1
, . . . , f
m
son diferenciables en a.
Demostracion. Supongamos primero que la aplicacion f es diferenciable en a y
escribamos la identidad vectorial (24) como m identidades escalares. Designando
T = (T
1
, . . . , T
m
), p = (p1, . . . , p
m
), tenemos
f
i
(a + v) f
i
(a) = T
i
(v) +vp
i
(v), lm
v0
p
i
(v) = 0
para i = 1, . . . , m, que es la denicion de diferenciabilidad de la funcion f
i
en a,
dado que T
i
(v) = A
i
, v, donde A
i
es la iesima la de la matriz asociada a T.
Recprocamente, si f
1
, . . . , f
m
son diferenciables en a, existen funciones p
1
, . . . , p
m
tales que
f
i
(a + v) f
i
(a) = df
ia
(v) +vp
i
(v), lm
v0
p
i
(v) = 0
para i = 1, . . . , m. Luego con
T(v) = (df
1a
(v), . . . , df
ma
(v)), (25)
y p = (p
1
, . . . , p
m
), la aplicacion f verica la denicion (24) en el punto a.
Observaci on 10.2. Una curva = (
1
, . . . ,
m
: I R
n
es diferenciable en un
punto a del intervalo real I si son diferenciables sus coordenadas. Obtenemos enton-
ces la misma denicion de curva diferenciable ya dada. Ademas si es diferenciable
en a I, tenemos
(a + v) (a) = d
a
(1) +
|h|
h
p(h),
con p(h) 0 si h 0, de donde resulta
(a) = d
a
(1),
es decir, la velocidad de la curva en el instante a se obtiene como el valor del
diferencial de la curva en a, evaluado en el vector v = 1.
Denicion 10.2. La matriz asociada al diferencial df
a
de una aplicacion f en un
punto a se llama matriz jacobiana, o mas brevemente jacobiano, y se designa me-
diante J
f
(a). De la formula (25), obtenemos si f = (f
1
, . . . , f
m
) es diferenciable en
a, que verica
df
a
(v) = (df
1a
(v), . . . , df
ma
(v)) (26)
43
y como df
ia
(v) = f
i
(a) v, resulta que la la iesima de J
f
(a) es el gradiente
f
i
(a). En otros terminos, hemos demostrado que
J
f
(a) =
_
_
_
f
1
x
1
(a)
f
1
x
m
(a)
.
.
.
.
.
.
.
.
.
f
m
x
1
(a)
f
m
x
m
(a)
_
_
_
De aqu resulta ademas que el diferencial en un punto de una aplicacion diferenciable
en ese punto es unico.
Denicion 10.3. Denimos la derivada direccional de una aplicacion f en un punto
a con respecto a un vector v R
n
, que designamos (
f
v
(a)), como el valor del lmite
en R
m
dado por
f
v
(a) = lm
t0
f(a + tv) f(a)
t
cuando existe. A partir de la denicion resulta que la derivada direccional de una
aplicacion existe si y solo si existen las derivadas direccionales de sus funciones
coordenadas. Ademas, en ese caso se verica
f
v
(a) =
_
f
1
v
(a), . . . ,
f
m
v
(a)
_
(27)
Pero (
f
i
v
(a) = df
ia
(v)) por lo que el vector obtenido en (27), en vista de (26), es la
imagen de v por el diferencial de f, es decir
f
v
(a) = df
a
(v)
La formula anterior es una generalizacion a aplicaciones de la que obtuvimos para
funciones reales de varias variables.
n
R
m
y g : U R
n
R
m
dos funciones denidas
en el abierto U, diferenciables en a

U, entonces (f +g) es diferenciable en a y
ademas J
(f+g)
(a) = J
f
(a) + J
g
(a) para todo , R.
Demostracion. por hipotesis f y g son diferenciables en a entonces existen matrices
J
f
(a) y J
g
(a) y aplicaciones p : B
(0, ) R
m
y q : B
(0, ) R
m
tales que si
a + v B
(0, ) se tiene
f(a + v) = f(a) + J
f
(a)v +vp(v), con lm
v0
p(v) = 0 (28)
y
g(a + v) = g(a) + J
g
(a)v +vq(v) con lm
v0
q(v) = 0 (29)
Multiplicando (28) por y sumando la (29) previamente multiplicada por , resulta
(f + g)(a + v) = (f + g)(a) + (J
f
(a) + J
g
(a))v +v(p(v) + q(v))
con lm
v0
p(v) + q(v) = 0. As (f + g) es diferenciable en a y J
(f+g)
(a) =
J
f
(a) + J
g
(a), para todo , R.
En particular mirando las transformaciones lineales se tine que
d(f + g)
a
= df
a
+ dg
a
44
Analogamente que la proposicion anterior y en las mismas hipotesis se puede
probar que f g es diferenciable en a y ademas
J
fg
(a) = g(a)J
f
(a) + f(a)J
g
(a)
y mirando la transformaciones lineales se tiene
d(f g)
a
= g(a)df
a
+ f(a)dg
a
Proposicion 10.3. Sean f : U R
n
R
m
, denida en el abierto U y diferenciable
en a

U y g : U R
n
R
m
tal que g(x) = uf(x) siendo u R
m
. Entonces g es
diferenciable en a y J
g
(a) = uJ
f
(a).
Demostracion. Como por hipotesis f es diferenciable en a entonces existe una matriz
J
f
(a) y una aplicacion p : B
(0, ) R
m
con a + v B
(0, ), entonces
f(a + v) = f(a) + J
f
(a)v +vp(v) con lm
v0
p(v) = 0
si multiplicamos por u la ecuacion anterior, resulta
g(a + v) = uf(a + v) = uf(a) + uJ
f
(a)v + uvp(v)
= g(a) + uJ
f
(a)v +vu p(v) con lm
v0
u p(v) = 0
luego g es diferenciable en a y ademas J
g
(a) = uJ
f
(a).
Lema 10.4. Si A es una matriz nm, entonces existe c 0 tal que Ax cx.
Demostracion. Para la demostracion podemos escribir el vector Ax como
Ax =
_
_
_
_
A
1.
x
A
2.
x
. . .
A
n.
x
_
_
_
_
donde A
i.
indica la iesima la de la matriz A, y ahora utilizando la desigualdad
de Cauchy-Schwarz (A
i.
x)
2
A
i.
2
x
2
), se llega a
Ax =
_
i=n
i=1
(A
i.
x)
2
_
i=n
i=1
A
i.
2
x
2
= x
_
i=n
i=1
A
i.
2
luego existe c =
i=n
i=1
A
i.
2
0 tal que Ax cx.
Lema 10.5. Sea f : U R
n
R
m
denida en el abierto U y diferenciable en
a

U, entonces existe k > 0 y una bola B(a, ) tal que
f(x) f(a) kx a x B(a, )
Demostracion. Por hipotesis f es diferenciable en a, luego existe J
f
(a) y la aplicacion
p(x a) tal que
f(x) = f(a) + J
f
(a)(x a) +x ap(x a) con lm
xa
p(x a) = 0
45
luego
f(x) f(a) = J
f
(a)(x a) +x ap(x a)
J
f
(a)(x a) +x ap(x a)
ahora por el lema anterior sabemos que existe c 0 tal que J
f
(a)(xa) cxa
entonces
f(x) f(a) cx a +x ap(x a) = x a (c + p(x a))
como c 0 y lm
xa
(c + p(x a)) = c utilizando la denicion de lmite se demues-
tra que existe k 0 y > 0 tal que x B(a, ) se cumple
f(x) f(a) kx a
Teorema 10.6. Sean g : U R
n
R
s
, con U abierto de R
n
, g diferenciable en
a

U y f : V R
s
R
m
, con V abierto de R
s
y f diferenciable en g(a)

V .
Entonces f g : U R
n
R
m
, es diferenciable en a, y ademas
J
(fg)
(a) = J
f
(g(a)) J
g
(a)
que es lo que habitualmente se llama regla de la cadena.
Demostracion. Recordemos que f diferenciable en b implica
f(v + b) f(b) = J
f
(b)v +vp(v) con lm
v0
p(v) = 0
Como por hipotesis f es diferenciable en g(a), si tomamos b = g(a) y v = g(a+h)
g(a) tenemos
f(g(a+h))f(g(a)) = J
f
(g(a)) (g(a + h) g(a))+g(a+h)g(a)p (g(a + h) g(a))
con lm
h0
p (g(a + h) g(a)) = 0 por otra parte como g es diferenciable en a se
tiene que:
g(a + h) g(a) = J
g
(a)h +hq(h) con lm
h0
q(h) = 0
llamemos g = g(a+h)g(a) para simplicar la notacion y sustituyendo nos queda
f(g(a + h)) f(g(a)) = J
f
(g(a)) (J
g
(a)h +hq(h)) +gp(g)
= J
f
(g(a))J
g
(a)h + J
f
(g(a))hq(h) +gp(g)
= J
f
(g(a))J
g
(a)h +hr(h)
siendo r(h) = J
f
(g(a))q(h) +
g
h
p(g) y como lm
h0
q(h) = 0, entonces
lm
h0
J
f
(g(a))q(h) = 0.
Por otro lado, por el lema anterior
g
h
es acotado y como lm
h0
p(g) = 0, resulta
que lm
h0
g
h
p(g) = 0 y as lm
h0
r(h) = 0. Luego
(f g)(a + h) (f g)(a) = J
f
(g(a))J
g
(a)h +hr(h) con lm
h0
r(h) = 0
es decir f g es diferenciable en a y
J
fg
(a) = J
f
(g(a))J
g
(a)
46
Observaci on 10.3. Como en el Teorema anterior la transformacion lineal corres-
pondiente es la diferencial de f g en a (d(f g)
a
), se tiene d(f g) : R
n
R
m
de
forma que
d(f g)
a
(v) = J
f
(g(a))J
g
(a)v =
y como dg
a
(v) = J
g
(a)v y df
g(a)
(w) = J
f
(g(a))w y el producto de las matrices se
corresponde con la composicion de las transformaciones lineales se tiene que
d(f g)
a
= df
g(a)
dg
a
47

Diferencia Bili Dad

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Diferencia Bili Dad

Uploaded by

Copyright:

Available Formats

Diferenciabilidad en R

(0, ) R R tales que:

(0, ) R tales que, para

que no existe, por lo que no es continua, analogamente con f

(0, ) R tales que, para todo

y decimos que f es de clase C

Si hacemos h 0 esto equivale a 0. Ademas h = v = || v = ||. Si

(0, ) R tal que

(t) y es igual al producto escalar

(t) = f((t)) (t)

(a, ) se verica f(a + v) > f(a), demostrando que f

es un subespacio vectorial cerrado de R

(0) = f(p) (0) = f(p) v,

You might also like