You are on page 1of 55

La Universidad del Zulia

Facultad de Ingeniería
División de Estudios para Graduados
Programa: Computación Aplicada
Asignatura:
Optimización para Ingenieros
Prof. Luis Zerpa, M.Sc.
Email: lzerpa@ica.luz.ve
2. Programación No Lineal
• Repaso de funciones continuas
Programación Nolineal
(Non Linear Programming NLP)
• NLP: Conjunto de técnicas para optimizar funciones no-lineales
sujetas a restricciones de igualdad o desigualdad. Tanto las
funciones como las restricciones pueden ser de una o más variables
Formulación general de un problema de optimización
• Encontrar x tal que

se minimice una función objetivo f(x)
sujeto a restricciones: g
i
(x) = b
i
(i=1,…, m)
g
j
(x) s b
j
(j=m,…, k)


Donde
x es un vector de n variables independientes
Características de los problemas que
trataremos mayormente en el curso
• Funciones objetivo y restricciones continuas con sus primeras
derivadas parciales también continuas (suaves)
– Esto garantiza que pequeños cambios en x conlleve a pequeños cambios en
valores asociados

• Inecuaciones estrictas no son permitidas (< ó >) solo se permiten
restricciones de > , s e =

• El problema debe ser determinístico

• Todas las variables deben ser reales, ninguna puede tomar
únicamente valores enteros. (Continuous Programming)

• S dominio de f y g
i
sea una región conectada

Tipos de Problemas No-lineales
• Sin restricciones • Con restricciones
Tamaño de los Problemas
• Una forma de medir la complejidad de los problemas es en función del
número de variables o del número de restricciones

• Pequeña Escala: hasta 5 variables y restricciones  puede ser resuelto a
mano

• Escala intermedia: de 5 a 100 variables y restricciones  Computador
Personal o Servidor de Propósito General

• Gran Escala: más de 100 y quizás 1000 variables y restricciones 
Mainframe para cálculo científico (cray), explotando la estructura del
problema con algoritmos paralelos
Tipos de Problemas No-lineales
• En el curso se estudiarán la teoría y los métodos que permiten
efectivamente la solución de la más amplia variedad de problemas
(pequeña y mediana escala principalmente)
• A pesar de que un gran número de algoritmos han sido propuestos
para la solución del problema general de optimización no lineal, sólo
unos pocos han demostrado ser efectivos cuando se aplican a
problemas de “gran – escala”
• No existe un método general de optimización no lineal en el sentido
como es SIMPLEX para problemas lineales
• Ninguno es tan superior para ser clasificado como la “panacea”
universal de la NLP
Criterios de Comparación de Algoritmos
1. Número de evaluaciones de la función objetivo
2. Confiabilidad (Éxito en alcanzar la solución)
3. Rapidez
4. Tiempo de Preparación del usuario (sobre parametrización)
5. Precisión de la solución
6. Grado de satisfacción de las restricciones
7. Dificultad

Algoritmos Iterativos y Convergencia
• La mayoría de los algoritmos de NLP son iterativos


• En programación lineal existe una secuencia de longitud finita para
alcanzar la solución
• En NLP la secuencia generalmente no alcanza la solución óptima
sino que converge hacia ella
• En problemas no lineales se determina una solución lo
suficientemente cercana a la óptima
÷
÷ ÷ ÷
÷ ÷ ÷ ÷
x
n
x x x x 
2 1
Solución
Óptima
Algoritmos Iterativos y Convergencia
• La teoría de algoritmos iterativos se divide en:

1. Diseño del Algoritmo
2. Convergencia Global: Análisis de convergencia global (si
eventualmente converge)
3. Convergencia Local: Análisis de convergencia local (la razón a la
cual el algoritmo converge en la Solución óptima)
“Una buena teoría es mejor que miles de corridas”
• Esto da una idea de la manejabilidad de los problemas mediante un
análisis simple lo cual es muy importante
Funciones de una variable
Continuidad de una función en un número
• Se dice que f es continua en el número a si y solo si las siguientes
3 condiciones se satisfacen:

1. existe
2. existe
3.

( ) a f
( ) x f
a x ÷
lim
( ) ( ) a f x f
a x
=
÷
lim
( )
( )( )
( )
¦
)
¦
`
¹
¦
¹
¦
´
¦
=
=
÷
÷ +
=
x si
x si
x
x x
x f
1 ; 2
1 ;
1
; 1 3 2
Discontinuidad removible
( )
2
1
÷
=
x
x f
Discontinuidad Esencial
( )
)
`
¹
¹
´
¦
=
= ÷
=
3 2
3 3
si x
si x x
x f
Teoremas sobre Continuidad
Teorema: Si f y g son continuas en a entonces:

• f + g es continua en a
• f – g es continua en a
• f x g es continua en a
• f ÷ g es continua en a suponiendo que g(a) ≠ 0

Teorema: Una función polominal es continua en cualquier
valor de las variables independientes

Continuidad en un Intervalo
Definición: Continuidad por la
derecha
• Se dice que f es continua por la
derecha del número a si y solo si
satisface las siguientes
condiciones:

Continuidad por la izquierda
• Se dice que f es continua por la
izquierda del número a si y solo si,
( ) existe a f i )
( )
+
÷a x
existe x f
ii
lim
)
( ) ( )
+
÷
=
a x
a f x f
iii
lim
)
( ) existe a f i )
( )
÷
÷a x
existe x f
ii
lim
)
( ) ( )
÷
÷
=
a x
a f x f
iii
lim
)
Continuidad en un Intervalo
Definición: Una función cuyo dominio incluye el intervalo cerrado [a,b]
se dice que es continua en [a,b] si y solo si es continua en el
intervalo abierto (a,b), así como es continua por la derecha de a y
continua por la izquierda de b
a b
• Definición: f es continua en [a,b) si y solo si es
continua en (a,b) y continua por la derecha de a

• Definición: f es continua en (a,b] si y solo si
es continua en (a,b) y continua por la izquierda
de b
Diferenciabilidad y Continuidad
• La continuidad de una función no implica la diferenciabilidad de
dicha función en ese número







• Sin embargo, la diferenciabilidad si implica la continuidad

Teorema: Si una función es diferenciable en x
1
, entonces f es continua
en x
1
( ) x x f =
Derivada de una Función
• La pendiente de la recta tangente a f(x) en el punto (x, f(x))
( )
( ) ( )
x
x f x x f
x
x f
A
A
A
÷ +
÷
=
0
lim
'
x
f(x)
Valores Máximos y Mínimos de una Función de
una Variable
• La derivada puede utilizarse para determinar los puntos donde la
tangente es horizontal (derivada = 0)

Extremos Relativos
Definición: La función f se dice que
tiene un valor máximo relativo en “c”,
si existe un intervalo abierto que
contenga a “c” sobre el cual está
definida la función f tal que
f(c) ≥ f(x) para toda x en este intervalo
C = C =
Valores Máximos y Mínimos de una Función de
una Variable
Extremos Relativos
Definición: La función f se dice que
tiene un valor mínimo relativo en “c”, si
existe un intervalo abierto que
contenga a “c” sobre el cual f está
definido tal que f(c) ≤ f(x) para toda x en
este intervalo
cc
¿Dónde Localizar los Posibles Valores
Extremos?
Teorema: Si f(x) existe para todos los valores de x en el intervalo
abierto (a,b) y si f tiene un extremo relativo en “c”, donde a < c < b,
entonces f ´(c) existe y f ´(c) = 0
C = C =
Si f es una función diferenciable,
los únicos lugares posibles para
puntos extremos es donde f ´(x) = 0
¿Dónde Localizar los Posibles Valores
Extremos?
• Sin embargo, f ´(x) puede ser cero
y no obstante en ese valor f no
tiene un valor extremo (Punto de
Silla)
• Más aún f puede tener un
extremo relativo en un número y f’
puede no existir allí
( ) ( )
3
1 ÷ = x x f
( ) ( )
2
1 3 ' ÷ = x x f
( ) 0 1 ' = f
( ) 1 ÷ = x x f
¿Dónde Localizar los Posibles Valores
Extremos?
En Resumen
• Si una función está definida en un número “c” es una condición
necesaria, pero no suficiente, para que f tenga un extremo relativo
en “c” que f ´(c) = 0 ó que f ´(c) no exista
Definición: Si c es un número en el
dominio de la función f y si f ´(c) = 0 ó
f ´(c) no existe, entonces “c” se llama
punto crítico de f
Extremos Absolutos
• Frecuentemente estamos en una función definida en un intervalo
dado, y deseamos encontrar el valor mayor o menor de la función
en el intervalo
• Estos intervalos pueden ser cerrados, abiertos o cerrados a un
extremo y abierto en otro.
• El valor máximo absoluto es el mayor valor dentro del intervalo, y el
valor mínimo absoluto es el mínimo valor de la función dentro del
intervalo
Extremos Absolutos en un Intervalo
• Definición: La función f se dice que tiene un valor máximo absoluto en un
intervalo, si existe algún número “c” en el intervalo tal que f(c) ≥ f(x) para
toda x en el intervalo. En tal caso f(c) es el valor máximo absoluto de f en el
intervalo
• Definición: La función f se dice que tiene un valor mínimo absoluto en un
intervalo si existe algún número “c” en el intervalo tal que f(c) ≤ f(x) para
toda x en el intervalo. En tal caso f(c) es el valor mínimo absoluto de f en el
intervalo
• Valor extremo absoluto es un mínimo o máximo absoluto de la función en el
intervalo
• También se puede hablar de extremo absoluto de una función cuando no
se especifica ningún intervalo, en este caso se dice que es un extremo
global de la función
Teorema del Valor Extremo
• Si una función f es continua en el intervalo cerrado [a,b], entonces f
tiene un valor máximo absoluto y un valor mínimo absoluto en [a,b]

• Un extremo absoluto de una función en un intervalo cerrado debe
ser un extremo relativo o ser un valor de la función en un extremo
del intervalo
C = C =
Procedimientos para la determinación de extremos
absolutos en intervalo cerrado

1. Identificar valores de la función en los números críticos de f en [a,b]
2. Encontrar f(a) y f(b)
3. El mayor de estos es el máximo absoluto y el menor es el mínimo
absoluto
Teorema de Rolle (Michel Rolle 1652-1719)
• Sea f una función continua en un intervalo cerrado, diferenciable en
el intervalo abierto (a,b) y sean f(a) = 0 y f(b) = 0, existe al menos un
número “c” entre a y b donde f ´(c) = 0
c a b c a b
•Debe notarse que puede haber más
de un número en el intervalo abierto
para el cual la derivada es cero
a
b
c
1
c
2
a
b
c
1
c
2
Teorema del Valor Medio
• Sea f una función continua tal que:
i. es continua en el intervalo cerrado [a,b]
ii. es diferenciable en el intervalo abierto (a,b)

• entonces existe un número “c” en el intervalo abierto (a,b) tal que:
( )
( ) ( )
a b
a f b f
c f
÷
÷
= '
f(c)
a b c
R
T
R
S
f(c)
a b c
R
T
R
S
La tangente R
T
es
paralela a la secante R
S
Funciones Crecientes y Decrecientes y Criterio
de la Primera Derivada
• Definición: Una función definida en un intervalo se dice que es
creciente en ese intervalo si y solo si:
– f(x
1
) < f(x
2
) siempre que x
1
< x
2
donde x
1
y x
2
son números del
intervalo

• Definición: Una función definida en un intervalo se dice que es
decreciente en ese intervalo si y solo si:
– f(x
1
) > f(x
2
) siempre que x
1
< x
2
donde x
1
y x
2
son números del
intervalo

• Si una función es creciente o decreciente en un intervalo, entonces
se dice que f es monótona
Funciones Crecientes y Decrecientes y Criterio
de la Primera Derivada
• Teorema: Si una función continua en el intervalo cerrado [a,b] y
diferenciable en el intervalo abierto (a,b)

i. Si f ´(x) > 0 para toda x  es creciente en el intervalo

ii. Si f ´(x) < 0 para toda x  es decreciente en el intervalo
Criterio de la Primera derivada para
Extremos Relativos
• Si una función continua en el intervalo abierto (a,b) que contiene un
número crítico “c” y f es diferenciable, excepto, posiblemente en “c” .

Si c es un extremo entonces:
– f ´(x
1
) > 0 donde x
1
< c
– f ´(x
2
) > 0 donde c < x
2


• en este caso c es un máximo relativo
f’ = 0
f’ < 0
f’ > 0
f’ = 0
f’ < 0
f’ > 0
Máximo Relativo
f’ = 0
f’ < 0
f’ > 0
f’ = 0
f’ < 0
f’ > 0
Lo contrario aplica para Mínimo Relativo 
Criterio de la Segunda Derivada
• Sea “c” un número crítico de una función en la cual f ´(c) = 0 y f
existe para todos los valores de x en algún intervalo abierto que
contenga a “c”. Entonces si f ´´(c) existe y,
– Si f ´´(c) < 0, f tiene un valor máximo relativo en “c”
– Si f ´´(c) > 0, f tiene un valor mínimo relativo en “c”
• Nótese que si f ´´(c) = 0 nada puede concluirse

• Teorema: Sea f una función continua en el intervalo I que
contiene al número crítico c. Si f(c) es un extremo relativo de f en I
y es el único, entonces f(c) es un extremo absoluto de f en I.
Además,
– Si f(c) es un máximo relativo  es un máximo absoluto
– Si f(c) es un mínimo relativo  es un mínimo absoluto
Formula de Taylor (Brook Taylor 1685 – 1731)
• Ciertas funciones pueden ser aproximadas por polinomios y el
polinomio puede ser usado cuando la diferencia es pequeña
• Teorema: Sea f una función tal que f y sus n primeras derivadas
son continuas en el intervalo cerrado [a,b]. Además, f
n+1
(x) existe
para toda x en el intervalo abierto (a,b). Entonces hay un número c
en el intervalo abierto (a,b) tal que,




Si n = 0  f(b) = f(a) + f ´(c)(b – a)  Teorema del valor medio
( ) ( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
1
1
2
! 1 ! ! 2 ! 1
'
+
+
÷
+
+ ÷ + + ÷
' '
+ ÷ + =
n
n
n
n
a b
n
f
a b
n
a f
a b
a f
a b
a f
a f b f
c

Polinomio de Taylor


( ) ( )
( )
( )
( )
( )
( )
( )
n
n
a x
n
a f
a x
a f
a x
a f
a f x n ÷ + + ÷
' '
+ ÷
'
+ =
! ! 2 ! 1
2
 P
Residuo ( )
( )
( )
( )
( ) a x entre está donde a x
n
f
x Rn
n
n
y
! 1
1
1
c
c
+
+
÷
+
=
Funciones de Varias Variables
(Campos Escalares)
Continuidad de Campos Escalares
• Sea f una función de varias variables y a un vector de variables, se
dice que f es continua en a si
( ) definida está y existe a f i)
( ) existe x f ii
a x÷
lim )
( ) ( ) a f x f iii
a x
=
÷
lim )
si esta falla entonces existe una discontinuidad
esencial
si esta falla entonces existe una discontinuidad
evitable
Funciones de Varias Variables
(Campos Escalares)
Operaciones sobre funciones continuas

• Si f y g son continuas en a entonces:

– f + g
– f – g
– f x g

– f ÷ g es continua, si g(a) ≠ 0
Son continuas
Derivada direccional
• La derivada direccional permite tener información del
comportamiento de la función si sus variables se modifican
siguiendo el sentido indicado por el vector gradiente

• La Derivada direccional de f en p según el vector unitario µ
[ D
µ
f(p) ] es el producto escalar del gradiente en p, por µ :
D
µ
f(p) = Vf(p)
T
µ

¿En qué sentido deberían desplazarse las variables de f, partiendo del
punto p, para que los valores de f crezcan más rápidamente?
Derivada direccional
• Como la rapidez está dada por : Vf(p)
T
µ

• En esta expresión se suponen ya conocidos f y p; faltando conocer
“µ” que haga máximo el producto escalar

• Siendo Vf(p)
T
µ = |Vf(p)|. |µ| Cos u = |Vf(p)|.(1). Cos u

• Donde : u , es el ángulo formado por los vectores Vf(p) y µ

• Vf(p)
T
µ, será máximo si y sólo si Cos u es máximo, ósea cuando
u = 0 y Vf(p) con µ son colineales. Lo cual significa que el vector
unitario µ debe tener el mismo sentido que el vector gradiente de f
en p
( )
( ) p f
p f
V
V
= µ
significa que el vector gradiente de una función f en
un punto p, Vf(p), de su dominio se orienta en el
sentido en el cual f crece mas rápidamente
Derivada direccional
f(x,y) = -20 + 3x
2
+y
2

Vf = [6x
2y]

x
y
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
-18
-16
-14
-12
-10
-8
-6
-2
-1
0
1
2
-2
-1
0
1
2
-20
-15
-10
-5
0
Gradiente
• Derivadas Parciales: Son derivadas direccionales especiales, las
direcciones son las de los ejes coordenados



• Definición: Si f:u  R, u _ R
n
, la derivada de f en un punto x
0
e u es
el vector cuyos componentes son las derivadas parciales de f en x
0
.
A esto se le llama Gradiente
 , ,
y
f
x
f
c
c
c
c
( )
( ) ( ) ( )
|
|
.
|

\
|
c
c
c
c
c
c
= V
n
x
x f
x
x f
x
x f
x f
0
2
0
1
0
0
, , , 
Diferenciabilidad de funciones de varias
variables
• Teorema: Si f : u  R, u c R
n
, es diferenciable en x entonces es
continua en x
– El reciproco es falso: Una función puede ser continua sin ser
diferenciable
• Teorema: (Condición de suficiencia de diferenciabilidad)
Si f : u  R, u c R
n
, posee derivadas parciales continuas en x
0
e u
entonces f es diferenciable en x
0

– Sin embargo, una función puede ser diferenciable en un punto sin que
sus derivadas parciales sean continuas, en dicho punto
• Definición: Decimos que una función es de clase C
k
en u _ R
n
, y
escribimos f e C
k
(u), si todas sus derivadas parciales de orden k
existen y son continuas en u
Formula de Taylor en Varias Variables


• En una notación mas convencional y compacta



donde,
( ) ( )
( )
( ) ( )
( )
( ) 
 
+ ÷
c c
c
÷ + ÷
c
c
+ =
= = =
j j
j i
i i
n
j
n
i
oj j
j
n
j
x x
x x
x f
x x x x
x
x f
x f x f
0
0
2
0
1 1
0
1
0
! 2
1
E E E
( ) ( ) ( ) ( ) ( ) ( ) 
      
+ ÷ ÷ + ÷ · V + =
0 0 0 0 0
! 2
1
x x x x x x x f x f x f
T
T
H
|
|
.
|

\
|
c
c
c
c
= V
n
x
f
x
f
f , ,
1

2
2
2
2
1
2
2
2
2
2
2
1 2
2
1
2
2 1
2
2
1
2
n n n
n
n
x
f
x x
f
x x
f
x x
f
x
f
x x
f
x x
f
x x
f
x
f
c
c
c c
c
c c
c
c c
c
c
c
c c
c
c c
c
c c
c
c
c
÷



H
Gradiente
Hessiano
Extensión de los Criterios de Existencia
de Máximo y Mínimos
• Los puntos críticos son aquellos donde Vf = 0 o no existe
• Alguna medida de “positividad” del Hessiano nos dirá si es un
máximo o un mínimo

• Teorema de Weierstrass (Extensión del teorema de Valor
Extremo):

Una función continua f, definida en un conjunto compacto S cerrado
y acotado (definido y no se va a infinito) tiene al menos un mínimo y
un máximo en S
Formas cuadráticas
• Definición: Una forma cuadrática es cualquier campo escalar (R
n

R), definido para todo x en R
n
que sigue la siguiente forma:



donde a
ij
e R puede ser cero
• Una forma cuadrática no incluye ningún término lineal


• Cualquier forma cuadrática puede ser expresada en notación
matricial como


donde a
ij
son elementos de la matriz A
( )
j i ij
h
j
h
i
x x a x q
1 1 = =
¿ ¿ =

( )
2
2 2 1
2
1 2 1
8 4 7 , x x x x x x q + + =
( ) Ax x x q
t
=
Formas cuadráticas
• Es claro que

para todo i = j

• Por lo tanto una forma cuadrática puede ser representada
equivalentemente por muchas matrices A o conjuntos de
coeficientes a
ij

• Sin embargo, para una forma cuadrática q(x) dada existe sólo una
matriz simétrica (cuadrada tal que D = D
T
) que satisface q(x) = x
T
Dx
cuyos elementos están definidos por:


para todo i = j

( )
j i ji ij i j ji j i ij
x x a a x x a x x a + = +
( )
2
ji ij
ji ij
a a
d d
+
= =
( )
2
2 2 1
2
1 2 1
, cx x bx ax x x q + + =
( ) | |
2
1
2 1 2 1
2 /
2 /
,
x
x
c
b
b
a
x x Dx x x x q
t
= =
Formas cuadráticas
• Ejemplo
( )
2
2 2 1
2
1 2 1
, cx x bx ax x x q + + =
( ) | |
2
1
2 1 2 1
2 /
2 /
,
x
x
c
b
b
a
x x Dx x x x q
t
= =
1
2
8
2
÷
÷
= A
( )
( ) | |
2
1
2 1 2 1
2
2 2 1
2
1
2
2 1 2 2 1
2
1 2 1
1 3
3 2
,
6 2 8 2 2 ,
x
x
x x x x q
x x x x x x x x x x x x q
÷
=
÷ + = ÷ + ÷ =
Propiedades de las formas cuadráticas
• Definición: la forma cuadrática q(x) = x
T
Dx es definida positiva si
q(x) > 0 para todo x ≠ 0 en E
n
• Definición: la forma cuadrática q(x) = x
T
Dx es semidefinida positiva
si q(x) ≥ 0 para todo x e E
n
, pero q(x) no es definida positiva

• Definición: la forma cuadrática q(x) = x
T
Dx es definida negativa si
q(x) < 0 para todo x ≠ 0 en E
n
• Definición: la forma cuadrática q(x) = x
T
Dx es semidefinida negativa
si q(x) s 0 para todo x e E
n
, pero q(x) no es definida negativa

La matriz D (única y simétrica) de una forma cuadrática definida
positiva es definida positiva

Propiedades de las formas cuadráticas
• Si no satisface ninguna de las cuatro definiciones anteriores se dice
que la forma cuadrática es indefinida. Esto es si q(x
1
) > 0 y q(x
2
) <
0 es indefinida, donde x
1
y x
2
e R
n
( )
2
2
2
1 2 1
10 , x x x x q + =
Es definida positiva
( ) ( )
2
2
2
1 2 1
10 , x x x x q ÷ + ÷ =
Es definida negativa
Propiedades de las formas cuadráticas
• Sea D una matriz simétrica de n x n definida positiva, entonces:
a) D
-1
existe
b) D
-1
es definida positiva
c) ADA
T
es semidefinida positiva para cualquier matriz A mxn


Clasificación de formas cuadráticas
Método de los autovalores
• Sea q(x) = x
T
Dx una forma cuadrática, con D matriz simétrica.
Sean ì
1
, ì
2
,… ì
n
los n autovalores de la matriz D. Entonces:
a) q(x) es definida positiva si y sólo si ì
i
> 0 ¬ i
b) q(x) es definida negativa si y sólo si ì
i
< 0 ¬ i
c) q(x) es semidefinida positiva si y sólo ì
i
> 0 ¬ i, siendo al menos un
ì
j
= 0
d) q(x) es semidefinida negativa si y sólo ì
i
s 0 ¬ i, siendo al menos un
ìj = 0
e) q(x) es indefinida si y sólo si algún ì
i
> 0 y algún ì
j
< 0

Funciones Convexas
• Estamos particularmente interesados en la optimización de este tipo
de funciones sobre los llamados conjuntos convexos
• Definición: Un conjunto X en E
n
(R
n
) es convexo si y sólo si para dos
puntos cualquiera x
1
y x
2
en X y cualquier valor escalar 0 s ì s 1, el
punto x = ì x
1
+ (1 - ì) x
2
también está dentro de X
x
1
x
2
x
2
x
1
Convexo No Convexo
x
1
x
2
x
1
x
2
x
2
x
1
x
2
x
1
Convexo No Convexo
Una esfera, un triángulo, el espacio R
n
, una línea recta y un punto son conjuntos
convexos. Un hiperplano también es un conjunto convexo
Funciones Convexas
• Definición: Una función escalar f(x) es una función convexa
definida sobre un conjunto convexo X en E
n
si para dos puntos
cualquiera x
1
y x
2
en X


donde 0 s ì s 1

( ) ( ) ( ) ( ) ( )
2 1 2 1
1 1 x f x f x x f
   
ì ì ì ì ÷ + s ÷ +
a c b
A
B
a c b
A
B
( ) ( ) ( )
( ) ( ) b a f BC
b f a f AC
ì ì
ì ì
÷ + =
÷ + =
1
1
Funciones Convexas
• Las funciones convexas tienen una caracterización geométrica
simple e informativa
• Teorema: Cualquier función lineal f(x) = c
T
x es tanto cóncava como
convexa
• Teorema: Si f(x) es convexa  -f(x) es cóncava (y viceversa)
• Teorema: La suma de 2 o más funciones convexas es convexa
• Teorema: Cualquier forma cuadrática semidefinida positiva
q(x) = x
T
Dx donde D es simétrica, es una función convexa en todo
E
n
, y si D es definida positiva es estrictamente convexa
• Teorema: Cualquier forma cuadrática semidefinida negativa
q(x) = x
T
Dx donde D es simétrica, es una función cóncava en todo
E
n
, y si D es definida negativa es estrictamente cóncava
Funciones Convexas
• Dada una función cuadrática representada como



es convexa o cóncava si q(x) es convexa o cóncava

• Podemos notar la similitud con el polinomio de Taylor
( ) ( )
0
c x c x q x f
t
+ + ÷

( ) ( ) ( ) ( ) ( ) ( )( )
0 0 0 0 0 0
2
1
x x x x x x x x f x f x f
t
t
÷ ÷ + ÷ · V + ~ H
      
Funciones Convexas
• Teorema: Si la función f(x) está definida y es convexa sobre un
conjunto convexo X en E
n
, luego cualquier mínimo local (con
restricción) de f(x) en X es un mínimo global en X
• Teorema: Si la función f(x) está definida y es cóncava sobre un
conjunto convexo X en E
n
, luego cualquier máximo local (con
restricción) de f(x) en X es un máximo global en X
• Teorema: Si una función f(x) es convexa sobre un conjunto X
compacto y convexo (cerrado y limitado) en E
n
entonces al menos
un máximo global se encuentra sobre el borde de X
Criterios de la primera y segunda
derivada
• Teorema: Supongamos que f(x) tiene primeras derivadas parciales
continuas. Luego f(x) es cóncava sobre alguna región R en E
n
si y
sólo si



similarmente, f(x) es convexa sobre alguna región R en E
n
si y sólo
si


( ) ( ) ( ) ( )
- - -
÷ · V + s x x x f x f x f
t
    
( ) ( ) ( ) ( )
- - -
÷ V + > x x x f x f x f
t     
Convexa
x
*
x
Cóncava
x
*
x
P
l
a
n
o

t
a
n
g
e
n
t
e
P
l
a
n
o

t
a
n
g
e
n
t
e
Convexa
x
*
x
Cóncava
x
*
x
P
l
a
n
o

t
a
n
g
e
n
t
e
Cóncava
x
*
x
P
l
a
n
o

t
a
n
g
e
n
t
e
P
l
a
n
o

t
a
n
g
e
n
t
e
Criterios de la primera y segunda
derivada
• Teorema: Sea f(x) una función e C
2
(segundas derivadas parciales
existen y son continuas). Entonces f(x) es convexa sobre una región
R en E
n
si y sólo si su Hessiano es definido o semidefinido positivo
para toda x de la región R
Criterios de la primera y segunda
derivada
• Teorema de Schwartz: Si f(x,y) es tal que

son continuas en un entorno de un punto (x
0
,y
0
), entonces

existe y se cumple que


• Como la matriz Hessiano es simétrica la definición definida y
semidefinida positiva para formas cuadráticas es aplicable
directamente

• Una función puede ser convexa o concava y su Hessiano puede
“desaparecer” en algunos puntos (matriz de ceros)
y x
f
y
y
f
x
f
c c
c
c
c
c
c
2
,
( )
0 0
2
y x
x y
f
c c
c
( ) ( )
0 0
2
0 0
2
, , y x
y x
f
y x
x y
f
c c
c
=
c c
c