Professional Documents
Culture Documents
Indice
Introduccion v
Captulo 1. TOPOLOG
IA DE R
N
1
1.1. Producto escalar, norma y distancia eucldeas 1
1.2. Bolas, entornos, abiertos y cerrados de R
N
2
1.3. Convergencia de sucesiones en R
N
5
Captulo 2. L
ON DE FUNCIONES DE VARIAS
VARIABLES 15
3.1. Derivadas parciales y derivadas direccionales 15
3.2. Diferencial y gradiente de una funcion real de varias
variables. Relacion e interpretacion geometrica 17
3.3. Diferencial y matriz jacobiana de una funcion vectorial de
varias variables. Regla de la cadena 21
3.4. Funciones denidas de forma implcita. El teorema de la
funcion implcita 24
3.5. Derivadas parciales y diferencial de orden superior. Matriz
hessiana de una funcion real de varias variables 26
3.6. El teorema de Taylor en varias variables 28
3.7. Extremos relativos de una funcion real de varias variables 30
3.8. Extremos condicionados de una funcion real de varias
variables. El teorema de los multiplicadores de Lagrange 32
3.9. Extremos absolutos de una funcion real de varias variables 34
iii
Introduccion
El estudio de las aplicaciones o funciones de varias variables es uno
de los objetivos fundamentales de las matematicas, ya que la mayora
de los fenomenos de cualquier tipo (fsicos, qumicos, economicos, etc.)
se pueden modelizar mediante una funcion de este tipo.
Cuando la aplicacion es lineal, conocemos tecnicas algebraicas que
me permiten manejarla y estudiarla facilmente, pues tales aplicaciones
se pueden caracterizar mediante una matriz de coecientes y as tra-
bajar con aplicaciones lineales se reduce a trabajar con matrices:
f(x, y, z) = (8x + y z, x + 2y + 3z) =
_
8 1 1
1 2 3
_
_
_
x
y
z
_
_
f(x, y, z) = (x z, 4y + 6z, x y z) =
_
_
1 0 1
0 4 6
1 1 1
_
_
_
_
x
y
z
_
_
Obviamente la cantidad de aplicaciones con las que podemos tra-
bajar as es bastante limitada, pues cuando la aplicacion no es lineal ya
no podemos estudiar su comportamiento global a traves de una matriz,
pero a menudo si vamos a poder estudiar su comportamiento local a
traves de ciertas matrices.
De hecho, en esencia, el objetivo del calculo diferencial que vamos
a presentar en esta memoria es ese: Estudiar una clase de funciones
(las funciones diferenciables) que se parecen mucho a una aplicacion
afn (esto es, su incremento se parece mucho a una aplicacion lineal)
en un entorno de cada punto. De este modo las tecnicas algebraicas
que ya conocemos nos permitiran obtener consecuencias locales sobre
tales funciones a partir de las propiedades (globales) de las aplicaciones
lineales a las que se parecen en cada punto.
Se trata por tanto de explotar tanto como podamos las tecnicas
algebraicas para estudiar funciones que no tienen por que ser lineales.
De este modo estamos ampliando enormemente la cantidad de fun-
ciones con las que podemos trabajar, pues disponemos de herramientas
matematicas para extraer informacion util sobre ellas.
v
CAPTULO 1
TOPOLOG
IA DE R
N
En el estudio de las funciones reales de variable real los intervalos de-
sempe nan un papel crucial pues algunas propiedades de tales funciones
solo se dan en un determinado tipo de intervalos. La importancia de
los intervalos se debe a que nos permiten manejar (de un modo sencillo
y riguroso) los n umeros reales que se encuentran entorno a un n umero
real dado a, en concreto, los n umeros reales que estan a una distancia
menor (o menor o igual) que de a, pues
]a , a + [= x R : [x a[ <
[a , a + ] = x R : [x a[
Si ahora pretendemos estudiar funciones de varias variables nece-
sitaremos una nocion que generalice la idea del valor absoluto como
herramienta para medir distancias entre puntos y unos conjuntos que
hagan el papel de los intervalos como conjuntos de puntos entorno a
un punto dado a.
1.1. Producto escalar, norma y distancia eucldeas
Vamos a comenzar presentando de forma abstracta las nociones
basicas con las que vamos a trabajar. Si X es un espacio vectorial
sobre R se llama distancia a toda aplicacion d : X X R que
x, y, z X verica las siguientes propiedades:
d(x, y) 0 y d(x, y) = 0 x = y
d(x, y) = d(y, x)
d(x, y) d(x, z) + d(z, y)
Se llama norma a toda aplicacion | | : X R que x, y, z X
y R cumple lo siguiente:
|x| 0 y |x| = 0 x = 0
|x| = [[|x|
|x + y| |x| +|y|
Por ultimo, se llama producto escalar a toda forma bilineal simetrica
denida positiva de X, esto es a toda aplicacion < , >: XX R
tal que x, x
, y X y , R verica que:
1
2 1. TOPOLOG
IA DE R
N
< x + x
y >
< x, y >=< y, x >
< x, x > 0 y < x, x >= 0 x = 0
Intuitivamente una distancia es una funcion que mide el grado de
proximidad entre los puntos, una norma es una funcion que mide las
longitudes de los vectores y un producto escalar es una funcion que me
permite medir angulos y hablar de ortogonalidad entre vectores.
Ademas estas nociones no son independientes entre si, pues todo
producto escalar induce una norma, denida mediante la expresion
|x| :=
< x, x >, x X
y toda norma induce una distancia del siguiente modo:
d(x, y) := |x y|, x, y X
es decir, que si tengo un producto escalar en un espacio vectorial puedo
medir longitudes de vectores sin mas que hacer la raz cuadrada del
producto escalar de cada vector consigo mismo, y si tengo una nor-
ma puedo medir distancias entre dos puntos cualesquiera midiendo la
longitud de su diferencia como vectores.
Como R
N
es un espacio vectorial con un producto escalar canonica-
mente asociado, el producto escalar eucldeo, dado por
x y = < x, y > := x
1
y
1
+ + x
N
y
N
para todo x = (x
1
, . . . , x
N
) e y = (y
1
, . . . , y
N
) de R
N
, en particular
tenemos una norma y una distancia inducidas, que reciben el nombre
de norma y distancia eucldeas y vienen dadas por
|x| =
_
x
2
1
+ + x
2
N
d(x, y) =
_
(x
1
y
1
)
2
+ + (x
N
y
N
)
2
on 1.2.1. Sea a R
N
y > 0. Se dene la bola (abierta)
de centro a y radio como el siguiente conjunto:
B
(a) := x R
N
: |x a| <
Analogamente, se dene la bola cerrada de centro a y radio como
B
(a) := x R
N
: |x a|
1.2. BOLAS, ENTORNOS, ABIERTOS Y CERRADOS DE R
N
3
Observese que para N = 1 las bolas vuelven a ser intervalos, pues
B
(a) V .
Ya tenemos unos conjuntos, las bolas, que extienden la denicion
de los intervalos a R
N
. Sin embargo, dada la riqueza de conjuntos que
hay en R
N
, las bolas son unos conjuntos demasiados restrictivos para
nuestros nes: En R es suciente con limitarnos a estudiar las funciones
denidas en un intervalo ya que la mayora de las funciones suelen estar
denidas de un modo natural sobre uno (o varios) intervalos, pero en
R
N
los conjuntos en los que estan denidas las funciones pueden tener
una geometra muy diversa y no sera muy interesante limitarnos solo
a estudiar las funciones denidas en una (o varias) bolas.
Por este motivo vamos a usar las bolas para introducir un par de
familias de conjuntos de R
N
muchos mas amplia que las propias bolas,
que seran la familia de los conjuntos abiertos y la de los conjuntos
cerrados de R
N
.
Definici
on 1.2.3. Sea A R
N
y x R
N
. Se dice que
x es un punto interior de A si > 0 tal que B
(x) A
x es un punto adherente de A si > 0, B
(x) A ,=
Al conjunto A
A A. Pongamos
nombre a los conjuntos que de hecho coinciden con su interior o con su
adherencia:
Definici on 1.2.4. Sea A un conjunto cualquiera de R
N
.
Se dice que A es abierto si A = A
IA DE R
N
Ejemplo 1.2.5. Las bolas abiertas son conjuntos abiertos y las
bolas cerradas son conjuntos cerrados de R
N
.
Intuitivamente, los conjuntos abiertos son aquellos que no tienen
frontera o borde alguno y los conjuntos cerrados son lo que contienen a
toda su frontera o borde. Esto se puede expresar de un modo riguroso
deniendo la frontera de un conjunto del siguiente modo:
Definici on 1.2.6. Se dice que x es un punto frontera de A si
> 0, B
(x) A ,= y B
(x) (R
N
A) ,=
Denotaremos por Fr(A) al conjunto de todos los puntos frontera de A.
Como Fr(A) = AA
(x) A = x
x es un punto de acumulacion de Asi > 0 B
(x)Ax ,=
El conjunto de todos los puntos de acumulacion de A se llama conjunto
derivado de A y se denota por A
.
1.3. Convergencia de sucesiones en R
N
Definici
on 1.3.4. Dados A R
N
y x R
N
, se cumple que:
(i) x A x
n
A, x
n
x.
(ii) x A
x
n
A, x
n
,= x, n N, x
n
x.
En particular, A es cerrado si y solo si contiene el lmite de cualquier
sucesion convergente de elementos de A.
CAPTULO 2
L
R
M
es el conjunto A donde esta denida la funcion. Siempre podremos
restringirnos a un dominio B mas peque no (en el sentido de contenido
en A) sin mas que considerar que la funcion f act ua tan solo sobre
los puntos de B (en tal caso, se suele decir que trabajamos con la
restriccion de f a B o que f esta restringida al conjunto B y se denota
por f[
B
).
Ahora bien, si no se expresa un dominio A de manera explcita, se
entiende que este es el mas grande posible, esto es, el conjunto A de
R
N
donde la expresion f(x) tiene sentido
Ejemplo 2.0.6. Calcular el dominio de f(x, y) =
ln(xy)
_
1 x
2
y
2
Observaci
, l R, L = (l
1
, . . . , l
M
),
f : A R
N
R y F : A R
N
R
M
con F = (f
1
, . . . , f
M
).
Se dice que f tiene lmite l en el punto a, y se nota lm
xa
f(x) = l, si
> 0, > 0 : 0 < |x a| < [f(x) l[ < .
Se dice que F tiene lmite L en el punto a, y notaremos igualmente
lm
xa
F(x) = L, si f
i
tiene lmite l
i
en el punto a, o sea, que el lmite de
una funcion vectorial se calcula componente a componente:
lm
xa
F(x) =
_
lm
xa
f
1
(x), . . . , lm
xa
f
M
(x)
_
.
Observaci
entonces l = l
.
Proposici
on 2.1.5 (
algebra de l
.
(i) lm
xa
(f +g)(x) = lm
xa
f(x)+lm
xa
g(x), si lm
xa
f(x) y lm
x
a
g(x)
(ii) lm
xa
(fg)(x) = lm
xa
f(x) lm
xa
g(x), si lm
xa
f(x) y lm
x
a
g(x)
(iii) lm
xa
f
g
(x)
lm
xa
f(x)
lm
xa
g(x)
, si lm
xa
f(x) y lm
x
a
g(x) ,= 0
2.2. ALGUNAS T
ECNICAS Y M
ETODOS PARA EL C
ALCULO DE L
IMITES 9
2.2. Algunas tecnicas y metodos para el calculo de lmites
2.2.1. Lmites por caminos y lmites direccionales: En R,
para acercarnos a un punto a podemos hacerlo de tres maneras: Pode-
mos movernos solo por puntos situados a la izquierda de a, hacerlo solo
por puntos situados a la derecha de a o hacerlo por ambos lados del
punto a. Cuando calculamos el lmite de una funcion real de variable
real, estas distintas formas de acercarse a un punto conducen a los con-
ceptos de lmite por la izquierda, por la derecha y lmite (global) de la
funcion en a y sabemos que la existencia del lmite de la funcion en un
punto a es equivalente a que ambos lmites laterales existan y tomen
el mismo valor real.
En R
N
podemos acercarnos a un punto a de muchas mas formas.
En general, si f : A R
N
R
M
y a A, podemos acercarnos al
punto a a traves de cualquier subconjunto B A tal que a B
. En
estas condiciones vamos a denotar por
lm
xa
xB
f(x) := lm
xa
f[
B
(x)
esto es, al lmite de f cuando x tiende a a pero moviendonos solo a
traves de los puntos de B. Con esta notacion es claro que
lm
xa
f(x) = l lm
xa
xB
f(x) = l
o sea, que si existe el lmite de f cuando x tiende a a existe entonces
existe el lmite de f cuando x tiende a a a traves de cualquier subcon-
junto suyo y ademas coincide con el.
Esta ingenua armacion es una herramienta muy util para compro-
bar que ciertas funciones no tienen lmite en un punto o para obtener
el unico candidato a lmite posible.
Los lmites a traves de subconjuntos se usan sobre todo tomando
como conjunto B ciertos caminos en R
N
que conducen hacia el punto a,
como por ejemplo las rectas que pasan por a. Estos ultimos reciben el
nombre de lmites direccionales de f en a y para funciones de dos vari-
ables son especialmente faciles de calcular ya que se reducen a lmites
de funciones reales de variable real. Su doble uso se resume brevemente
de la siguiente manera:
(1
o
) Si existen los lmites direccionales de f en a y no son todos
iguales, entonces f no tiene lmite en a
(2
o
) Si todos los lmites direccionales de f en a son iguales a l,
entonces l es el unico candidato admisible a lmite (o sea, el
lmite de f en a, si existe, es a la fuerza l)
10 2. L
ON DE VARIAS VARIABLES 11
Ejemplo 2.2.7. La funcion f(x, y) := x sen(
1
y
) + y cos(
1
x
) tiene
lmite 0 cuando (x, y) (0, 0) y sin embargo no existen ninguno de los
dos lmites reiterados en (0, 0).
2.2.3. Lmites en polares: Podemos calcular el lmite de una
funcion f(x, y) de dos variables en el punto (0, 0) haciendo el cambio a
coordenadas a polares
_
x = r cos
y = r sen
Teniendo en cuenta que (x, y) (0, 0) equivale a r 0, ]0, 2[,
lm
(x,y)(0,0)
f(x, y) = lm
r0
f(r cos , r sen ), ]0, 2[
luego para que ese lmite exista no puede depender de .
Ejemplo 2.2.8. Calcular mediante el cambio a coordenadas polares
lm
(x,y)(0,0)
xy
x
2
+ y
2
y lm
(x,y)(0,0)
x
2
y
x
2
+ y
2
2.3. Lmites en el innito y funciones divergentes
Si f : R
N
R, a R
N
y l R tambien se pueden denir los
lmites en el innito y las funciones divergentes en un punto a o el
innito del siguiente modo:
lm
x
f(x) = l > 0, M > 0 : |x| > M [f(x) l[ < .
lm
xa
f(x) = K > 0, > 0 : |x a| < [f(x)[ > K.
lm
x
f(x) = K > 0, M > 0 : |x| > M [f(x)[ > K.
Observaci on 2.3.1. Notese que para x R
N
, la expresion x
signica realmente que [[x[[ (o sea que cubrimos todas las
direcciones posibles de R
N
).
2.4. Continuidad de una funcion de varias variables
Definici
on 2.4.1. Sean A R
N
, a A, f : A R
N
R y
F : A R
N
R
M
con F = (f
1
, . . . , f
M
).
Se dice que f es continua en el punto a si verica lo siguiente:
> 0, > 0 : |x a| < [f(x) f(a)[ <
Se dice que F es continua en el punto a si f
i
es continua en el punto
a, i = 1, . . . , M (equivalentemente: > 0, > 0 : |x a| <
|f(x) f(a)| < ).
Ademas, diremos que f (o F) es continua en A si y solo si lo es
para todo punto a A.
12 2. L
, f es continua en a si y solo si lm
xa
f(x) = f(a).
Puesto que ya sabemos que los lmites (cuando existen) se compor-
tan bien con las operaciones algebraicas tenemos, en particular que las
sumas, productos y cocientes (por funciones no nulas) de funciones
continuas son funciones continuas. Ademas la composicion de fun-
ciones continuas es tambien una funcion continua. Por tanto, todas las
sumas, productos, exponenciales y logaritmos de funciones polinomi-
cas en varias variables (por ejemplo, x, xy, x
3
y + 2x
2
, cos x, sin(x +
y), exp(2x + y), ln(x
2
+ y
2
), . . .) son funciones continuas.
El unico problema que se nos puede presentar es cuando una funcion
f esta denida de distinta forma en distintas regiones del dominio.
En esta situacion f puede coincidir con una continua en una de tales
regiones, pero eso solo nos dice que f, restringida a ese subconjunto
del dominio, es continua. El siguiente resultado puede sernos muy util
para garantizar la continuidad de f en esa situacion, pues arma que
la continuidad de una funcion en un punto es una propiedad local: la
continuidad en un punto a solo depende de los puntos que hay en un
entorno de a.
Proposici
on 2.4.5 (car
y f : A R
N
R
M
.
(i) Si f[
B
a
()
es continua en a, entonces f es continua en a.
(ii) Si B A, B abierto, f[
B
es continua en B, entonces f es
continua en B.
Ejemplo 2.4.6. f(x, y) :=
_
x
2
y
x
2
+y
2
(x, y) ,= (0, 0)
0 (x, y) = (0, 0)
es continua
2.4. CONTINUIDAD DE UNA FUNCI
ON DE VARIAS VARIABLES 13
Recordemos que para funciones f reales de variable real sabemos
que la imagen mediante una funcion continua de un intervalo com-
pacto es un intervalo compacto. Para funciones de varias variables la
propiedad que se verica, en general, es que la imagen mediante una
funcion continua de una conjunto compacto es un compacto, esto es,
Teorema 2.4.7 (propiedad de compacidad). Sea A R
N
. Si
f : A R
M
es una funcion continua y A es compacto, entonces f(A)
es compacto.
Este resultado nos dice, en particular, que las funciones reales de
varias variables sobre compactos siguen teniendo maximo y mnimo
absoluto.
Corolario 2.4.8 (teorema de Weierstrass). Sea A R
N
.
Si f : A R es continua y A es compacto, entonces f alcanza su
maximo y su mnimo en A.
Acabamos de asegurar que las funciones continuas transforman
compactos en compactos. No ocurre lo mismo con los abiertos ni con los
cerrados: Una funcion continua puede trasformar abiertos en conjun-
tos que no sean abiertos y cerrados en conjuntos que no sean cerrados
(incluso una funcion real de variable real).
Lo que ocurre en realidad es que es la imagen inversa de una funcion
continua la que se comporta bien con los abiertos y con los cerrados.
De hecho podemos caracterizar las funciones continuas mediante esa
propiedad del siguiente modo:
Teorema 2.4.9. Sea f : A R
N
R
M
.
(i) f es continua si y solo si f
1
(E) es un abierto de R
N
cortado
con A para todo E abierto de R
M
.
(ii) f es continua si y solo si f
1
(F) es un cerrado de R
N
cortado
con A para todo F cerrado de R
M
.
Sin embargo esta caracterizacion de la continuidad se suele usar mas
en el sentido contrario que para estudiar la continuidad de una funcion
dada: Se suele emplear para probar que ciertos conjuntos (denidos
mediante una funcion continua de sus coordenadas) son abiertos o cer-
rados. Por ejemplo, se puede ver de este modo que las bolas abiertas
son conjuntos abiertos, pues se pueden expresar como
B
a
() = x R
M
: |x a| < = f
1
( ] , [ ),
siendo f la funcion f : R
N
R dada por f(x) := |x a| que es
claramente continua.
CAPTULO 3
DIFERENCIACI
ON DE FUNCIONES DE
VARIAS VARIABLES
3.1. Derivadas parciales y derivadas direccionales
Pretendemos extender la nocion de derivabilidad de una funcion f :
R R a funciones de varias variables. Recordemos que f es derivable
en un punto a si existe el siguiente lmite (expresado de cualquiera de
estas dos formas equivalentes):
f
(a) = lm
h0
f(a + h) f(a)
h
= lm
xa
f(x) f(a)
x a
.
Si tenemos ahora una funcion f : A R
N
R, el modo mas
sencillo de proceder es intentar reducirnos al caso unidimensional, con-
siderando la funcion f como si fuese una funcion de una unica variable,
es decir, manteniendo jas todas las variables menos una. Esto nos con-
duce al concepto de derivada parcial de una funcion de varias variables
Definici on 3.1.1. Sea f : A R
N
R, a A
, a = (a
1
, . . . , a
N
).
Se dice que f es derivable (parcialmente) en a con respecto a la
variable x
i
, para i = 1, . . . , N, si existe el siguiente lmite
f
x
i
(a) := lm
h0
f(a
1
, . . . , a
i
+ h, . . . , a
N
) f(a
1
, . . . , a
2
)
h
que llamaremos derivada parcial de f en a respecto a x
i
.
Si no se expresa un punto a concreto se entiende que
f
x
i
es la
funcion de varias variables
f
x
i
(x) denida en todos los puntos x R
en los cuales f es derivable con respecto a x
i
.
Para N = 2, las derivadas parciales de f en a = (a
1
, a
2
) quedan as:
f
x
(a
1
, a
2
) = lm
h0
f(a
1
+ h, a
2
) f(a
1
, a
2
)
h
f
y
(a
1
, a
2
) = lm
h0
f(a
1
, a
2
+ h) f(a
1
, a
2
)
h
Observaci
(a
1
)
f
x
(a
1
, a
2
) = lm
h0
v(a
2
+ h) v(a
2
)
h
= v
(a
2
)
Por lo tanto, podemos calcular las derivadas parciales de f derivan-
do las funciones reales de variable real u y v. Pero u y v no son otra
cosa que f cuando se ja una de sus variables, luego lo que estamos
diciendo es que podemos calcular las parciales de f derivando f como
si solo dependiese de una variable y la otra fuese constante. Lo bueno
de este procedimiento es que nos permite usar todos las tecnicas que
ya conocemos para derivar funciones reales de variable real a la hora
de calcular derivadas parciales, lo que facilita enormemente su calculo.
Ejemplo 3.1.3. Para f(x, y) = x
2
y + 2xy
3
+ 4x, se tiene que
f
x
(x, y) = 2xy + 2y
3
+ 4 y
f
y
(x, y) = x
2
+ 6xy
2
, (x, y) R
2
El problema que presenta el concepto de derivada parcial es que
la existencia de todas las derivadas parciales de una funcion f en un
punto no garantiza la continuidad de f en tal punto, luego el concepto
de derivada parcial no generaliza adecuadamente al de derivabilidad
de funciones reales de variable real ya que no conserva una de sus
principales propiedades.
Ejemplo 3.1.4. f(x, y) :=
_
1 si x = 0 o y = 0
0 si x ,= 0 e y ,= 0
en (0, 0).
Este mal comportamiento de las derivadas parciales de una fun-
cion f se debe a que las derivadas parciales nos dan solo una vision
parcial de la funcion. En concreto, las derivadas parciales de f en a
nos proporcionan la pendiente de la recta tangente a la graca de f en
las direcciones de las variables y eso, en general, no nos dice nada del
comportamiento global de la funcion en un entorno del punto a.
Esta idea de derivar en la direccion de las variables se puede gen-
eralizar a cualquier vector de R
N
del siguiente modo:
Definici
on 3.1.5. f : A R
N
R, a A
, v R
N
(|v| = 1).
Se dice que f es derivable en a seg un el vector v si existe el siguiente
lmite
D
v
f(a) =
f
v
(a) := lm
h0
f(a + hv) f(a)
h
que llamaremos derivada (direccional) de f en a seg un (la direccion del
vector) v.
3.2. DIFERENCIAL Y GRADIENTE 17
3.2. Diferencial y gradiente de una funcion real de varias
variables. Relacion e interpretacion geometrica
Como la existencia de todas las derivadas direccionales de una fun-
cion en un punto no implica la continuidad de la funcion en dicho pun-
to, el concepto de derivada direccional no extiende satisfactoriamente
el caso real.
Por ello vamos a introducir un nuevo concepto, el de diferencial de
una funcion de varias variables, que si extiende el concepto de derivada
adecuadamente, esto es, conservando sus principales propiedades.
La nocion de diferenciabilidad surge de manera natural a partir de
la siguiente reformulaci on de la derivabilidad de funciones de reales
de variable real f : A R R: f es derivable en a f
(a) =
lm
h0
f(a + h) f(a)
h
lm
h0
f(a + h) f(a) f
(a)h
h
= 0 existe
una aplicacion lineal D : R R, dada por D(h) = f
on 3.2.1. Sea A R
N
abierto, f : A R
N
R, a A.
Se dice que f es diferenciable en el punto a si existe una aplicacion
lineal (necesariamente unica por ser A abierto) que denotaremos por
df(a) o Df(a) y llamaremos diferencial de f en a , tal que
lm
h0
f(a + h) f(a) df(a)(h)
|h|
= 0.
Observaci
on 3.2.6. Sea A R
N
abierto, a A
y f : A R
N
R
parcialmente derivable en a con respecto a x
i
, i = 1, . . . , N.
Se llama vector gradiente de f en a al siguiente vector de R
N
f(a) :=
_
f
x
1
(a), . . . ,
f
x
N
(a)
_
Corolario 3.2.7. El vector gradiente de una funcion f diferen-
ciable en un punto a es la matriz asociada a la diferencial de f en a
respecto de las bases canonicas de R
N
y R. Por tanto, la diferencial de
f en a act ua as
df(a)(x
1
, . . . , x
N
) =
_
f
x
1
(a), . . . ,
f
x
N
(a)
_
_
_
x
1
.
.
.
x
N
_
_
lo cual tambien se puede interpretar como el producto escalar del vector
gradiente f(a) por el vector (x
1
, . . . , x
N
), esto es
df(a)(x) = f(a) x, x R
N
.
3.2. DIFERENCIAL Y GRADIENTE 19
Por tanto, las derivadas parciales de una funcion f me dan toda
la informacion que necesito para poder estudiar la diferenciabilidad de
tal funcion, ya que
(1
o
) Si no existe alguna derivada parcial de f en un punto a en-
tonces f no es diferenciable en ese punto.
(2
o
) Si existen todas las derivadas parciales de f en a entonces
tenemos la unica aplicacion lineal D candidata a ser la df(a):
la dada por D(x
1
, . . . , x
N
) =
f
x
1
(a) x
1
+ +
f
x
N
(a) x
N
.
Ademas, las derivadas direccionales permiten dar una interesante
interpretaci on geometrica del vector gradiente: Como
D
v
f(a) = df(a)(v) = f(a) v, v R
N
,
tenemos que
D
v
f(a) = |f(a)||v| cos ,
siendo el angulo entre f(a) y v, de lo que se deducen las siguientes
consecuencias:
Corolario 3.2.8. Sea A R
N
abierto, f : A R
N
R, a A.
v R
N
con |v| = 1 se tiene que |f(a)| D
v
f(a) |f(a)|
(las derivadas direccionales de la funcion estan acotadas por la norma
del gradiente). Ademas,
(i) D
v
f(a) = |f(a)| v =
f(a)
|f(a)|
(La derivada direccional
maxima se alcanza solo en la direccion del gradiente).
(ii) D
v
f(a) = |f(a)| v
f(a)
|f(a)|
(La derivada direc-
cional mnima se alcanza solo en la direccion opuesta).
(iii) D
v
f(a) = 0 v f(a) (La derivada direccional se anula
unicamente en la direccion perpendicular a la del gradiente).
Por lo tanto,
(1
o
) El vector gradiente los proporciona la direccion de maximo
crecimiento del la funcion.
(2
o
) La direccion opuesta a la del gradiente es la direccion de maxi-
mo decrecimiento de la funcion.
(3
o
) La direccion perpendicular a la del gradiente es la de mnima
variacion de la funcion. (De hecho, el gradiente es un vector
perpendicular a las curvas de nivel de la funcion).
Ejemplo 3.2.9. Sea T(x, y) = 100 x
2
y
2
la temperatura de
una placa con un foco de calor en el punto (0, 0) y supongamos que
una partcula se encuentra en le punto (1, 1). En que direccion debe
20 3. DIFERENCIACI
on geom
etrica de la dif.).
Sea A R
N
abierto, f : A R y a A con a = (a
1
, . . . , a
N
).
La graca de la aplicacion g del teorema anterior, esto es el conjunto
(x
1
, . . . , x
N
, x
N+1
) : x
N+1
= g(x
1
, . . . , x
N
), es el hiperplano de R
N+1
dado por la ecuacion
x
N+1
= f(a) +
f
x
1
(a) (x
1
a
1
) + +
f
x
N
(a) (x
N
a
N
)
que, evidentemente, pasa por el punto (a
1
, . . . , a
n
, f(a)) de R
N+1
.
Si f es diferenciable en a este hiperplano recibe el nombre de hiper-
plano tangente a la graca de f en a, ya que es el que mejor aproxima
a la graca de f en un entorno de a.
Para N = 1, se trata de la (ya conocida) recta tangente a la graca
y = f(x) en a:
y = f(a) + f
(a)(x a)
3.3. DIFERENCIAL Y MATRIZ JACOBIANA 21
Para N = 2, lo que nos queda es la ecuacion del plano tangente a
la graca z = f(x, y) en (a
1
, a
2
):
z = f(a) +
f
x
(a) (x a
1
) +
f
y
(a) (y a
2
)
Ejemplo 3.2.13. Determinar el plano tangente a la graca de
f(x, y) = x
2
+ y
2
en el punto (1, 1).
Hasta ahora hemos estado viendo condiciones necesarias para la
diferenciabilidad de una funcion que se pueden usar para probar que
una funcion no es diferenciable en un punto pero no para comprobar
que sea diferenciable.
A continuaci on vamos a presentar una sencilla condicion suciente
para la diferenciabilidad que evita tener que recurrir a la denicion de
diferenciabilidad en muchos casos.
Definici on 3.2.14. Sea A R
N
abierto y f : A R. Se dice
que f es de clase C
1
en A, y se nota f C
1
(A), si existen todas las
derivadas parciales de f en A y son continuas.
Teorema 3.2.15 (cond. suficiente de diferenciabilidad).
Si f es de clase C
1
en A entonces f es diferenciable en A.
Sin embargo el recproco del teorema anterior no es cierto en gen-
eral, es decir que no todas las funciones diferenciables son de clase C
1
,
como pone de maniesto el siguiente ejemplo.
Ejemplo 3.2.16. La funcion f denida por
f(x, y) =
_
(x
2
+ y
2
) sin
1
x
2
+y
2
(x, y) ,= (0, 0)
0 (x, y) = (0, 0)
es diferenciable en todo R
2
y sin embargo sus derivadas parciales no
son continuas en el punto (0, 0).
3.3. Diferencial y matriz jacobiana de una funcion vectorial
de varias variables. Regla de la cadena
Definici
on 3.3.1. Sea A R
N
abierto, a A y F : A R
M
,
F = (f
1
, . . . , f
M
). Se dice que F es diferenciable en a si todas sus
funciones coordenadas f
i
lo son y, en tal caso, la diferencial de F en a
es la aplicacion lineal dF(a) : (df
1
, . . . , df
M
).
22 3. DIFERENCIACI
on 3.3.2. Sea A R
N
abierto, a A y F : A R
M
,
F = (f
1
, . . . , f
M
). Se llama matriz jacobiana de f en a a la matriz
JF(a) :=
_
_
_
F
1
x
1
(a)
F
1
x
N
(a)
.
.
.
.
.
.
F
M
x
1
(a)
F
M
x
N
(a)
_
_
_
y su determinante se denomina determinante jacobiano de f en a.
Observaci
(a) para la
matriz jacobiana de F en a, ya que si f es una funcion real de variable
real (esto es M = N = 1) la matriz jacobiana f
(a)).
Teorema 3.3.4. La matriz Jacobiana de F en a es la matriz aso-
ciada a la diferencial de F en a respecto de las bases canonicas de R
N
y R
M
. Por tanto, dF(a)(x) = F
k=1
g
i
y
k
(f(a))
f
k
x
j
(a)
3.3. DIFERENCIAL Y MATRIZ JACOBIANA 23
Cuando la regla de la cadena se aplica en todo el dominio de las fun-
ciones involucradas se puede interpretar del siguiente modo: Estamos
realizando un cambio de variables y = f(x), esto es
_
_
_
y
1
= f
1
(x
1
, . . . , x
N
)
.
.
.
.
.
.
y
M
= f
M
(x
1
, . . . , x
N
)
en la funcion g(y
1
, . . . y
M
), de manera que al sustituir se obtiene una
nueva funcion g(f
1
(x), . . . , f
M
(x)) que ya solo depende de las variables
x = (x
1
, . . . , x
N
), y queremos calcular las derivadas parciales de esta
ultima funcion a partir de las parciales de la funcion original g y las
parciales de la funcion del cambio de variable f.
Por este motivo se suelen hacer las siguientes simplicaciones que
facilitan mucho su expresion y comprension:
(1
o
) Se omiten los puntos a y f(a) donde se aplican las parciales.
(2
o
) Las funciones coordenadas f
k
del cambio de variable f se de-
notan igual que las variables de g, esto es se entiende que f es
el cambio de variables
_
_
_
y
1
= y
1
(x
1
, . . . , x
N
)
.
.
.
.
.
.
y
M
= y
M
(x
1
, . . . , x
N
)
(3
o
) La composicion h se sigue denotando como la funcion g pero
ahora directamente como funcion de las variables (x
1
, . . . , x
N
)
despues de haber realizado el cambio de variables. Es decir
que la funcion g(y) de las variables y = (y
1
, . . . , y
M
) (antes
del cambio de variables) se puede ver tambien como funcion
g(x) de las variables x = (x
1
, . . . , x
N
) directamente (despues
de cambio de variables) entendiendo que
g(x) := g (y
1
(x
1
, . . . , x
N
), . . . , y
M
(x
1
, . . . , x
N
))
Con esta nueva notacion la regla de la cadena queda as:
g
i
x
j
= x
j
+ +
g
i
y
M
y
M
x
j
y se puede interpretar de la siguiente manera: cuando en una funcion
g(y
1
. . . , y
M
) se realiza un cambio de variables, y
k
= y
k
(x
1
, . . . , x
N
),
k = 1, . . . M, podemos calcular la derivada de la componente g
i
de
la funcion resultante con respecto de una de las variables x
j
sumando
todas las derivadas de g
i
con respecto a todas sus variables y
k
pero,
como a su vez estas variables son funciones de x
j
, hay que multiplicar
cada una de ellas por su derivada con respecto a x
j
.
24 3. DIFERENCIACI
1 x
2
o y =
1 x
2
No obstante, si planteamos el problema de despejar ciertas variables
de la ecuacion F(x, y) = 0 desde un punto de vista local (es decir, en
un entorno de cada punto que verica esa ecuacion) la situacion mejora
notablemente. El Teorema de la Funci on Implcita (T.F.I.) proporciona
unas condiciones que garantizan que, localmente, se pueden despejar
las variables y de una ecuacion F(x, y) = 0 en funcion de las x.
Comencemos analizando los casos mas sencillos en los que se puede
plantear este problema, que es cuando x e y representan unicamente un
par de variables reales o cuando queremos despejar una variable real z
en funcion de otras dos (x, y). En ambos casos la regla de la cadena nos
proporciona una sencilla formula para calcular las derivadas parciales
de la funcion explcita f a partir de las derivadas parciales de la funcion
implcita F de la que partimos, F : D : R
N
R.
3.4. FUNCIONES DEFINIDAS DE FORMA IMPL
ICITA 25
Teorema 3.4.4 (N=2). Sea F : D : R
2
R, F C
1
(D), D
abierto, a = (a
1
, a
2
) D con F(a
1
, a
2
) = 0 y
F
y
(a
1
, a
2
) ,= 0.
Entonces F dene a y implcitamente como funcion de x en un
entorno de (a
1
, a
2
), esto es, existen A
1
, A
2
R, abiertos con a
1
A
1
y a
2
A
2
y existe una unica funcion f : A
1
A
2
tal que F(x, y) =
0 y = f(x), (x, y) A
1
A
2
.
Ademas f C
1
(A
1
) y
f
x
=
F
x
F
y
en todo A
1
.
Teorema 3.4.5 (N=3). Sea F : D : R
3
R, F C
1
(D), D
abierto, a = (a
1
, a
2
, a
3
) D con F(a
1
, a
2
, a
3
) = 0 y
F
z
(a
1
, a
2
, a
3
) ,= 0.
Entonces F dene a y implcitamente como funcion de (x, y) en
un entorno de a, esto es, existen A
1
R
2
, A
2
R abiertos con
(a
1
, a
2
) A
1
y a
3
A
2
y existe una unica funcion f : A
1
A
2
tal que F(x, y, z) = 0 z = f(x, y), (x, y, z) A
1
A
2
.
Ademas f C
1
(A
1
) y
f
x
=
F
x
F
z
y
f
y
=
F
y
F
z
en A
1
.
Por tanto la ecuacion del plano tangente a la supercie dada por la
ecuacion F(x, y, z) = 0 en el punto a es
F
x
(a)(x a
1
) +
F
y
(a)(y a
2
) +
F
z
(a)(z a
3
) = 0
esto es, F(a) es el vector normal tal supercie.
En su forma mas general, esto es cuando tenemos una funcion F con
N + M variables igualada a cero y queremos despejar de esa ecuacion
M de tales variables, el teorema quedara de la siguiente manera:
Teorema 3.4.6 (el teorema de la funci
on impl
cita). Sea
F : D : R
N+M
R
M
, F C
1
(D), D abierto, (a, b) R
N+M
(a R
N
, b R
M
) con F(a, b) = 0 y det J(F, y
1
, . . . , y
M
) ,= 0, siendo
J(F, y
1
, . . . , y
M
) :=
_
_
_
F
1
y
1
(a, b)
F
1
y
M
(a, b)
.
.
.
.
.
.
F
M
y
1
(a, b)
F
M
y
M
(a, b)
_
_
_
Entonces F dene a y = (y
1
, . . . , y
M
) implcitamente como funcion
de x = (x
1
, . . . , x
N
) en un entorno de (a, b), esto es, existen A R
N
,
B R
M
abiertos con a A y b B y existe una unica funcion
f : A B tal que F(x, y) = 0 y = f(x), (x, y) A B.
Ademas f C
1
(A) y sus derivadas parciales se pueden calcular
resolviendo el sistema lineal
J(F, y
1
, . . . , y
M
) Jf(a, b) = J(F, x
1
, . . . , y
N
)
26 3. DIFERENCIACI
2
f
x
i
x
j
(a) :
_
f
x
i
_
x
j
(a) ( o bien, f
x
i
x
j
= (f
x
i
)
x
j
)
En particular, una funcion f de dos variables tiene 4 funciones
derivadas parciales segundas,
2
f
x
2
,
2
f
xy
,
2
f
yx
,
2
f
y
2
A las parciales de en medio se les llama derivadas parciales cruzadas
de f.
Ejemplo 3.5.2. Si f(x, y) = 3xy
2
2y + 5x
2
y
2
se tiene que
f
x
(x, y) = 3y
2
+ 10xy
2
f
y
(x, y) = 6xy 2 + 10x
2
y
f
xx
(x, y) = 20y
2
f
xy
(x, y) = 6y + 20xy
f
yx
(x, y) = 6y + 20xy f
yy
(x, y) = 6 + 20x
2
Se observa en el ejemplo anterior que las parciales cruzadas de f
coinciden. Aunque esto se verica frecuentemente no ocurre en general
como pone de manifesto el siguiente ejemplo
Ejemplo 3.5.3. La funcion f dada por
f(x, y) =
_
xy
x
2
y
2
x
2
+y
2
(x, y) ,= (0, 0)
0 (x, y) = (0, 0)
verica que f
xy
(0, 0) = 1 y f
yx
(0, 0) = 1.
El siguiente teorema proporciona una condicion suciente para que
las derivadas parciales cruzadas coincidan.
3.5. DERIVADAS PARCIALES Y DIFERENCIAL DE ORDEN SUPERIOR 27
Teorema 3.5.4 (de schwartz). Si f
x
, f
y
, f
xy
, f
yx
son continuas
en un abierto R de R
2
entonces f
xy
= f
yx
en todo R.
Las deniciones anteriores se pueden extender por recurrencia a un
orden cualquiera n + 1. As pues, supuestas ya denidas las derivadas
parciales de orden n de f, se dene la derivada parcial de orden n + 1
de f en a respecto de las variables x
i
1
, . . . , x
i
n+1
(con i
1
,. . . , i
n+1
1, . . . , N) del siguiente modo:
(n+1)
f
x
i
1
x
i
n+1
(a) :=
_
n
f
x
i
1
x
i
n
_
x
i
n+1
(a)
Definici
j=1
f
x
j
(x)h
j
,
_
x = (x
1
, . . . , x
N
) R
N
h = (h
1
, . . . , h
N
) R
N
Si variamos solo el vector h, h df(x)(h) es una aplicacion lineal
de R
N
en R, pero si variamos solo el punto x tenemos una aplicacion
x df(x)(h) (continua, si f es de clase C
1
en A) de R
N
en R a la que
podemos calcular de nuevo su diferencial, y que denotaremos por df(h)
(la diferencial de f pero como funcion de x)
Definici on 3.5.7. Se dene el diferencial de orden 2 como la apli-
cacion d
2
f que a cada punto a (tal que df(h) exista en un entorno
suyo para todo h) le hace corresponder la aplicacion d
2
f(a) dada por
d
2
f(a)(h) = d(df(h))(a) (abreviadamente d
2
f = d(df)).
Definici on 3.5.8. Se llama matriz hessiana de f en a a la matriz
Hf(a) =
_
_
_
_
2
f
x
2
1
(a)
2
f
x
1
x
N
(a)
.
.
.
.
.
.
2
f
x
N
x
1
(a)
2
f
x
2
N
(a)
_
_
_
_
28 3. DIFERENCIACI
i=1
N
j=1
N
k=1
3
f
x
i
x
j
x
k
(a)h
1
h
2
h
3
3.6. El teorema de Taylor en varias variables
Hasta ahora sabemos que las funciones diferenciables se pueden
aproximar por medio funciones anes (cuyas ecuaciones no son otra
cosa que polinomios de grado 1). El teorema de Taylor trata de mejorar
esta aproximacion utilizando para ello polinomios en varias variables de
grado superior, para lo cual necesitaremos que la funcion posea diferen-
ciales de orden superior. Ademas el teorema de Taylor nos dara tambien
una expresion para el error que se comete al aproximar un valor de una
funcion por el valor correspondiente de los polinomios de Taylor.
Recordemos que para una funcion f : I R R, f C
n
(I)
siendo I un intervalo de R y para todo x, a I el teorema de Taylor
para funciones reales de variable real nos garantiza la existencia de un
c en el intervalo de extremos a y x tal que f(x) = P
n
(x)+R
n
(x), siendo
P
n
(x) := f(a) +f
(a)(xa) +
1
2!
f
(a)(xa)
2
+ +
1
n!
f
(n)
(a)(xa)
n
R
n
(x) :=
1
(n + 1)!
f
(n+1)
(c)(x a)
n+1
3.6. EL TEOREMA DE TAYLOR EN VARIAS VARIABLES 29
En el caso general, para una funcion de N variables, esas funciones
se denen de la siguiente manera:
Definici on 3.6.1. Sea f : A R
N
R. Se llama polinomio de
Taylor de orden n de f en a al polinomio T
n
(f, a) = P
n
dado por
P
n
(x) := f(a) +df(a)(x a) +
1
2!
df
2
(a)(x a) + +
1
n!
df
n
(a)(x a)
y se llama resto de Taylor de orden n de f en a a la funcion
R(x) := f(x) P
n
(x)
Ademas, para funciones de varias variables, el papel que despe na el
intervalo de extremos a y x va a ser llevado a cabo por el segmento de
extremos a y x. Dados un par de puntos a y b de R
N
, el segmento de
extremos a y b se puede denir, de un modo riguroso, como el conjunto
[a, b] := ta + (1 t)b : 0 t 1
donde los puntos a y b se obtienen para los valores t = 1 y t = 0
respectivamente, por lo que tambien es coherente denotar por
]a, b[:= ta + (1 t)b : 0 < t < 1
al segmento [a, b] sin sus correspondientes extremos a y b.
Ya estamos en condiciones de enunciar el Teorema de Taylor en
varias variables, el cual me dice que puedo usar T
n
(f, a) para aproximar
el valor exacto de f(x) para puntos proximos al punto a y me da una
expresion del resto de Taylor que me permite acotar el error cometido
al realizar tal aproximacion.
Teorema 3.6.2 (de taylor en varias variables). Si tenemos
una funcion f : A R
N
R, f C
n+1
(A), A abierto, entonces
para todo x, a A con [a, x] A existe un c ]a, x[ tal que
f(x) = T
n
(f, a)(x) +
1
(n + 1)!
df
n+1
(c)(x a)
Merece la pena observar que, en particular, el teorema de Taylor
con resto de orden 1 (esto es, para n = 0 con la notacion anterior) no
es mas que la siguiente generalizacion del Teorema del Valor Medio a
varias variables (pues para N = 1 se vuelve a obtener dicho teorema):
Teorema 3.6.3 (del valor medio en varias variables). Si
f : A R
N
R, f C
n
(A), A abierto, entonces para todo a, b A
con [a, b] A existe un c ]a, b[ tal que f(b) f(a) = df(c)(b a)
Ademas, la formula del resto que nos proporciona el Teorema de
Taylor, nos permite deducir el siguiente resultado de manera inmedia-
ta, el cual nos dice que a medida que aumente el orden n del polinomio
30 3. DIFERENCIACI
2
f
x
2
(a)(x a
1
)
2
+ 2
2
f
xy
(a)(x a
1
)(y a
2
) +
2
f
y
2
(a)(y a
2
)
_
Ejemplo 3.6.5. Calcular el polinomio de Taylor de orden 2 de la
funcion f(x, y) = exp xy en el punto (0, 0).
3.7. Extremos relativos de una funcion real de varias
variables
Definici
on 3.7.1. Sea f : A R
N
R, A abierto, a A.
f alcanza un maximo relativo (o local) en a si > 0 tal que
B
(3
o
) f es diferenciable en x
0
y x
0
Fr(K)
En el segundo caso f alcanza un extremo relativo en x
0
y en el
tercer caso f alcanza un extremo condicionado a g en x
0
. Por tanto,
para determinar los extremos absolutos de f sobre K tenemos que
(1
o
) Localizar los puntos en los que f no es diferenciable
(2
o
) Calcular los puntos crticos de f que pertenecen a K
(3
o
) Hallar los puntos crticos de f condicionados a g
y entre todos esos puntos se encuentran forzosamente aquellos en los
que f alcanza sus extremos, con lo cual solamente tenemos que estudiar
en cual de ellos toma f toma el mayor y el menor valor.