You are on page 1of 45

Introduccin a la Programacin Lineal

Claudia Liliana Daza Garzn cldaza@universia.net.co

Trabajo de Grado para Optar por el Ttulo de Matemtico

Director: Pervys Rengifo Rengifo Ingeniero Universidad Nacional de Colombia

Fundacin Universitaria Konrad Lorenz Facultad de Matemticas

2 de junio de 2005

Tabla de contenido

Introduccin__________________________________________________________ 3 Programacin no lineal_________________________________________________ 4 Optimizacin clsica variable unidimensional_______________________________ 4


Utilizacin de mtodos numricos en la determinacin de puntos crticos___________ 10

Optimizacin clsica variable multidimensional ____________________________ 11


Condiciones necesarias y suficientes para la existencia de puntos ptimos __________ 16 Utilizacin de mtodos numricos en la determinacin de puntos estacionarios______ 19
Mtodo de Newton para sistemas de ecuaciones _____________________________________20

Extremos restringidos. Multiplicadores de Lagrange ___________________________ 23


Mtodo de los multiplicadores de Lagrange ________________________________________24

Optimizacin no clsica variable multidimensional _________________________ 26


Mtodo del gradiente ______________________________________________________ 26 Programacin separable ___________________________________________________ 29 Algoritmos Genticos: un cambio de paradigma _______________________________ 35
Caractersticas de los algoritmos genticos _________________________________________43

Conclusiones ________________________________________________________ 44 Bibliografa _________________________________________________________ 45

Introduccin
Las matemticas prestan su servicio a la sociedad mediante la elaboracin de modelos matemticos de la realidad. Esta modelacin consiste en crear un objeto conceptual que refleje las caractersticas relevantes de un fenmeno para, a partir de tal simplificacin, llegar a extraer conclusiones que enriquezcan, en algn sentido, el conocimiento que hasta el momento se tiene del fenmeno. Una modelacin de gran importancia y utilidad el la modelacin lineal, la cual acude al empleo de funciones lineales para conseguir sus objetivos. Sin embargo, a medida que crece la complejidad de los fenmenos que nos rodean, comienza a hacerse necesario modelar fenmenos con los cuales las aproximaciones lineales son notoriamente ineficaces. Por esta razn es necesario emplear modelos no lineales que se ajustan de una manera ms precisa a las realidades de alto grado de complejidad. Uno de los propsitos fundamentales con los cuales se construyen modelos matemticos es el de obtener respuestas a problemas de ptimizacin, esto es, a la toma de decisiones inmejorables. La modelacin lineal tiene en los mtodos smplex y del punto interior (de Karmarkar) unas herramientas de gran poder que le permiten resolver problemas con grandes cantidades de variables y restricciones. Este no es el caso de los modelos no lineales, en los cuales, como se ver, los caminos de fcil recorrido constituyen ms la excepcin que la norma. Sin embargo, el trabajo realizado en este campo ha estado guiado por unas grandes dosis de ingenio, que han llevado a la creacin de algoritmos de base puramente matemtica, a otros que mezclan resultados matemticos con procesos heursticos y, finalmente, como es el caso de los algoritmos genticos, a emular los procesos de evolucin biolgica, que han llevado a muchas formas de vida a elevados niveles de complejidad y sosfisticacin, como estrategia para la resolucin de problemas. El trabajo, de carcter exploratorio, ha pretendido ser algo ms que una recopilacin muda de resultados ya plenamente establecidos. No se ha dejado escapar la oportunidad de hacer, lo que se han considerado, pequeos aportes, en su mayora de tipo pedaggico. Como su taln de Aquiles puede mencionarse la escasez de los mtodos tratados, muchos de los cuales ni siquiera estn dentro de los considerados como de alto rendimiento, sin embargo, la razn ha sido que, como lo indica el nombre, se trata de una introduccin, que busca llamar la atencin tanto sobre resultados tericos de bajo nivel que muchas veces se pasan por alto, as como tambin sobre el empleo de las herramientas informticas, tanto como ayuda para las tcnicas clsicas, as como cuando son la base de metodologas que estn completamente inspiradas en ellas. El campo es extenso y fascinante. El trabajo realizado es de dimensiones modestas, pero aspira a reflejar, al menos en algn momento, algo de la belleza que se encontr en la etapa exploratoria.

Programacin no lineal
Se puede dar una definicin de programacin no lineal (PNL) por contraposicin con la programacin lineal (PL). Recurdese que esta ltima trata el problema de optimizar una funcin lineal f : R n R sujeta a una serie de restricciones tambin lineales. Si el problema se modifica, cambiando la funcin objetivo y/o, al menos, una de las restricciones, por no lineales, se cae en el campo de la PNL. La teora clsica de la optimizacin acude al empleo del clculo diferencial para determinar los puntos en los cuales la funcin f : R n R asume valores ptimos (mximos o mnimos). Luego de unas definiciones esenciales se expondrn algunos resultados tericos as como ejemplos de solucin de problemas mediante la aplicacin de esta teora. Se inicia con la teora propia de las variables unidimensionales, pues este campo permite la comprensin intuitiva de los conceptos y procedimientos empleados, y tambin, porque algunos de sus resultados tiene aplicacin directa en la extensin de la teora a las variables multidimensionales.

Definicin 1: se dice que una funcin f : S R, S R n tiene un mximo absoluto


(o global) en un punto

S si

f ( [ ) f (D )

para todo x de S. El nmero f (D) se llama mximo absoluto de f en S. D

Definicin 2: se dice que una funcin f : S R, S R n tiene un mximo relativo (o


f ( [ ) f (D ) para todo x B (D, r ) . El nmero f (D ) se llama mximo relativo de f en S.
De las definiciones 1 y 2 se concluye que todo mximo absoluto es, a su vez, mximo relativo. Las definiciones de mnimo absoluto (o global) y mnimo relativo (o local) se hacen de manera equivalente.

local) en un punto

S si existe r > 0 tal que

Optimizacin clsica variable unidimensional


Definicin 3: Un punto crtico de una funcin f : R R es un nmero c para el cual
f (c) = 0 o f (c) no existe.

Teorema 1: Si una funcin f : R R tiene un mximo o mnimo relativo en un punto


c, entonces c es un punto crtico.

Demostracin: si f (c) no existe, entonces c es un punto crtico. Supngase ahora que


f (c) existe. Defnase la funcin

g ( x) =

f ( x ) f (c ) para x c xc f ' (c ) para x = c

(1)

entonces lim g ( x) = g (c) y, en consecuencia , g es continua en c. Se debe demostrar


x c

que g(c) = 0, para ello se procede por contradiccin: si g(c) > 0, por la propiedad de la conservacin del signo para funciones continuas, existe un intervalo que contiene a c en el cual g(x) es positiva. Por lo tanto en (1), para x en el intervalo mencionado, x c, el numerador tiene el mismo signo que el denominador, lo cual implica que si x > c entonces f(x) > f(c), y si x < c entonces f(x) < f(c). Esto contradice la hiptesis de que f tiene un extremo en c. De manera similar se demuestra que suponer que g(c) < 0 conduce a la misma contradiccin, por lo tanto g(c) = 0 y como g(c) = f ' (c) ha concluido la demostracin. El resultado anterior garantiza que si f tiene un ptimo en c, entonces c es un punto crtico. El recproco no es cierto, como lo demuestra el conocido contraejemplo f ( x) = x 3 , pues f ' ( x) = 3 x 2 y entonces f ' (0) = 0 , con lo cual 0 es un punto crtico de f y, sin embargo, f no tiene un ptimo en 0 como se ve en la figura 1.

Figura 1
Entonces, para determinar el conjunto de puntos ptimos de una funcin debe hacerse un trabajo adicional, luego de haber determinado el conjunto de puntos crticos, pues solo algunos de ellos sern puntos ptimos. El siguiente teorema aporta las herramientas para realizar este trabajo.

Teorema 2 (criterio de la primera derivada para extremos en un punto crtico): Supngase que f : R R es continua en un intervalo [a, b] y que existe f '
en todo punto de (a, b), excepto posiblemente en c (a, b), entonces: 1. Si f es positiva para toda x, con a < x < c, y negativa para toda x, con c < x < b, entonces f tiene un mximo relativo en c.
5

2. Si f es negativa para toda x, con a < x < c, y positiva para toda x, con c < x < b, entonces f tiene un mnimo relativo en c. 3. Si f es positiva (negativa) para toda x, con a < x < b, x un ptimo relativo en c. c, entonces f no tiene

Demostracin: en el caso 1. f es estrictamente creciente en [a, c] y estrictamente decreciente en [c, b]. Entonces f(x) < f(c) para todo x c en [a, b] y por lo tanto f tiene un mximo relativo en c. El caso 2 se demuestra de manera anloga. La hiptesis del caso 3 implica que f es estrictamente creciente (decreciente) en [a, b] y, en consecuencia, no puede tener ptimos relativos en el punto interior c. Ejemplo 1: encuentre los puntos en los cuales f ( x) = x 3 3 x 2 24 x + 2 tiene
valores ptimos y determine de que clase son. crticos, en consecuencia, el primer paso es determinarlos:

Solucin: segn el teorema 1 los candidatos a ser puntos ptimos son los puntos
f ' ( x) = 3 x 2 6 x 24 = 3( x + 2)( x 4) (2)

la derivada est definida en todo , en consecuencia, se buscan aquellos puntos crticos para los cuales f (x) = 0. 3( x + 2)( x 4) = 0 (3) tiene como soluciones x = 4 y x = -2. El producto en (2) es positivo cuando los dos trminos variables son ambos negativos, o ambos positivos, por lo tanto, f (x) > 0 en (- , -2) y en (4, ), y f (x) < 0 en (-2, 4). Entonces, es posible construir un intervalo alrededor de -2 tal que f (x) > 0 para x < -2 y, f (x) < 0 para x > -2 en consecuencia, segn el teorema 2, f tiene un mximo en x = -2, con un valor f(-2) = 30. Un razonamiento anlogo lleva a concluir que f tiene un mnimo en x = 4, con f(4) = -78. La figura 2 muestra una comprobacin grfica de este hecho.

Figura 2
6

Ejemplo 2: encuentre los puntos en los cuales f ( x) = 3x 2 / 3 + 5 tiene valores


ptimos y determine de que clase son. 2 esta funcin nunca es cero y no est definida en x x = 0. En consecuencia x = 0 es el nico punto crtico. Es evidente que para x < 0, f (x) < 0, y para x > 0, f (x) > 0. Aplicando el teorema 2 se concluye que f tiene un mnimo en x = 0. La figura 3 ilustra la situacin.

Solucin: f ' ( x) = 2 x 1 / 3 =

Figura 3

Ejemplo 3: encuentre los puntos crticos de f ( x) = x 3 y establezca si en ellos f tiene


ptimos relativos.

Solucin: f ' ( x) = 3x 2 entonces f est definida en todo . El nico punto crtico de f


es entonces x = 0. Sin embargo, f (x) es positiva para todo x , x 0. Y por el caso 3 del teorema 2 se concluye que f no tiene ptimos relativos en 0, pues es estrictamente creciente en toda vecindad de 0. Vase la figura 1. El siguiente teorema, en algunos casos, facilita los clculos que permiten concluir que tipo de ptimo se presenta en un punto crtico c. Es aplicable nicamente cuando c es tal que f (c) = 0 y f (c) 0. Es til para funciones como la del ejemplo 1; no puede ser usado en funciones como la del ejemplo 2. Para funciones como la del ejemplo 3, para la cual f (c) = 0, se expondr un teorema especial ms adelante.

existe, entonces:

Teorema 3 (criterio de la segunda derivada para extremos en un punto crtico): Supngase que c (a, b) y que f (c) = 0. Supngase, adems, que f (c)
1. Si f (c) < 0, f tiene un mximo relativo en c. 2. Si f (c) > 0, f tiene un mnimo relativo en c.

Demostracin: En el caso 1, al ser f negativa en c, f es estrictamente decreciente


en una vecindad alrededor de c y como f (c) = 0 entonces f pasa de positivo a negativo en c, aplicando el caso 1 del teorema 2 se concluye que f tiene un mximo relativo en c. El caso 2 se demuestra de manera anloga.

Ejemplo 4: En el ejemplo 1 se estableci que x = 4 y x = -2 son los puntos crticos de


f ( x) = x 3 3 x 2 24 x + 2 , tales que f (-2) = 0 y f (4) = 0. Empleando el teorema 3, determine que clase de valores ptimos son. f ' ( x) = 3 x 2 6 x 24 f ' ' ( x) = 6 x 6

Solucin:
y

f (4) = 18 > 0, entonces f tiene un mnimo relativo en 4. f (-2) = -18 < 0, entonces f tiene un mximo relativo en -2. El teorema 3 no dice que ocurre en el caso de que f (c) = 0. Este es el caso de f ( x) = x 3 y f ( x) = x 4 . El siguiente teorema resuelve este problema.

Teorema 4: Sea f que posee n-sima derivada continua en el intervalo (a, b).
Supngase que para un cierto punto c (a, b) se tiene: f ' (c) = f ' ' (c) = ... = f
( n 1)

(c) = 0 , pero f ( n ) (c) 0 .


(n)

entonces para n par, f posee un mnimo local en c si f c si f


(n)

(c) > 0 , y un mximo local en

(c) < 0 . Si n es impar, no existe ptimo en c.

Demostracin: Como f ( n ) (c) 0 existe un intervalo (a, b) que contiene a c, tal que
para cada x (a, b) la derivada f ( n ) ( x) tiene el mismo signo que f ( n ) (c) . Por la frmula de Taylor con resto (con el resto en la forma de Lagrange) se tiene f ( x ) f (c ) = f
(n)

( x1 ) ( x c) n , donde x1 (a, b) n!
(n)

Si n es par, esta ecuacin implica que f(x) f(c) cuando f


(n) (n)

(c) > 0, y f(x) f(c)

cuando f (c) < 0. Si n es impar y f (c) > 0, entonces f(x) > f(c) cuando x > c, y f(x) < f(c) cuando x < c, en consecuencia no existe ptimo en c. Se llega a una conclusin anloga cuando n es impar y f ( n ) (c) < 0. Ntese que el teorema 3 es un caso particular del teorema 4. Este hecho puede ser empleado como nemotecnia para recordar el resultado.

Ejemplo 5: En el ejemplo 3 se estableci que 0 es el nico punto crtico de f ( x) = x 3 ,


emplee el teorema 4 para determinar que clase de punto crtico es.

Solucin:

f ' ( x) = 3x 2

entonces

f (0) = 0

f ' ' ( x) = 6 x

entonces

f (0) = 0

f ( 3) ( x ) = 6 0 como 3 es impar y la funcin constante 6 es continua se concluye que en x = 0 no se presentan ptimos relativos.

Ejemplo 6: Determine los puntos crticos de f ( x) = x 4 y establezca de que clase son. Solucin:
f ' ( x) = 4 x 3 f ' ' ( x) = 12 x f ( 3) ( x) = 24 x f
( 4) 2

entonces entonces entonces ( x) = 24 0

f (0) = 0 f (0) = 0 f
( 3)

( 0) = 0

como 4 es par y como, adems f ( 4) (0) > 0 , entonces en x = 0 la funcin tiene un mnimo relativo. Hasta el momento no se ha tratado el caso en el cual la funcin a optimizar se encuentra restringida en su dominio. En tales casos los extremos del intervalo, o los intervalos, son candidatos a ser puntos ptimos. Este caso es tratado en el ejemplo siguiente.

Ejemplo 7: Determine los puntos ptimos de


restringe segn los casos: a) [-1, 2] b) [2,3].

f ( x) = x 2 cuando su dominio se

Solucin: La figura ilustra el efecto, sobre los puntos ptimos, de restringir el dominio

de una funcin. En el caso a) el mnimo absoluto es el mismo que cuando no hay restriccin, y aparece un mximo absoluto que no existe en el caso irrestricto. Para b) tanto el mximo como el mnimo absolutos no existen en el caso irrestricto y, en este caso, coinciden con los extremos del intervalo.

Figura 4

Utilizacin de mtodos numricos en la determinacin de puntos crticos


En algunos casos la solucin de la ecuacin f (x) = 0 no puede calcularse por medios algebraicos y es necesario recurrir a algn mtodo numrico para llevar a cabo esta labor. En el siguiente ejemplo se ilustra esta situacin.

Ejemplo 8: Determine los puntos en los cuales la funcin g ( x) = x 3 sen( x) presenta


ptimos relativos.

Solucin: En primer lugar se grafca la funcin para tener una idea de donde pueden
localizarse los ptimos relativos.

Figura 5
La figura 5 permite concluir que, efectivamente, existen ptimos y que estos se encuentran, el primero en [-1, 0] y el segundo en [0, 1]. El procedimiento a seguir es similar al de los ejemplos anteriores. g ' ( x) = 3 x 2 - cos(x) Esta funcin est definida en todo , entonces, los puntos crticos son las soluciones de 3x - cos(x) = 0 para resolver esta ecuacin es necesario acudir a los mtodos numricos. En este caso se emplear el mtodo de Newton. Este mtodo consiste en la aplicacin de la ecuacin recursiva f ( xn ) x n +1 = x n f ' ( xn )

10

en donde x0 es un nmero prximo a la raz buscada. Para este caso se tiene f ( x) = 3 x 2 - cos(x) f ' ( x) = 6 x + sen(x) tomando x1 = -0.8 los clculos son los siguientes: Iteracin 0 1 2 3 4 5 xi f ( xi ) -0.8 1.22329329 -0.5782827 0.16583011 -0.53699325 0.00583458 -0.53543049 8.3762E-06 -0.53542824 1.7364E-11 -0.53542824 0 Tabla 1 f ' ( xi ) -5.517356091 -4.016282878 -3.733514265 -3.722794298 -3.722778863 -3.722778863

Se tiene entonces, que x = -0.53542824 es el punto crtico que se encuentra en [-1, 0]. En virtud de la simetra de f se concluye que el punto crtico en [0, 1] es x = 0.53542824. Para determinar que clase de ptimo es x = -0.53542824 evaluamos g en puntos cercanos a x uno a la izquierda y el otro a la derecha: g (-0.54) = 1.7*10 2 > 0 y g (-0.52) = -5.6*10 2 < 0 haciendo analoga con el caso 2 del teorema 2 se concluye que en x = -0.53542824 g tiene un mximo local. Un procedimiento anlogo permite concluir que en x = 0.53542824 g tiene un mnimo local. Estos resultados confirman lo observado en la figura 5. (En este ejemplo hemos incurrido en una imprecisin terica al afirmar que x es igual al nmero encontrado con el mtodo numrico, sin embargo, para efectos prcticos, este hecho es irrelevante pues la solucin puede ser calculada con la precisin requerida por el problema que se este resolviendo en el momento. Como ejemplo se muestra el resultado que se obtiene al emplear Matemtica con una precisin de 40 decimales: x = -0.5354282441646569523641119303647428750992).

Optimizacin clsica variable multidimensional


Definicin 4 (Derivadas direccional y parcial): Sea f : S R, S R n . Si y es
un vector unitario y a es un punto interior a S, la derivada

f ' (D \ ) = lim


h 0

f ( D + h\ ) f ( D ) , h>0 h

se llama derivada direccional de f en a en la direccin de y. Si y = H k (el k-simo f ' (a; H k ) se denomina derivada parcial respecto a x k y se representa mediante el smbolo vector de la base cannica de R n ) la derivada direccional

11

f (a1 ,..., a n ) . x k En el caso de la variable bidimensional el significado geomtrico de esta derivada es una generalizacin del caso unidimensional. La figura 6 ilustra la situacin

Figura 6
las alturas de f (a) y f (a + hy) son perpendiculares a la hoja y pasan por los puntos a y a + hy respectivamente. Como y es unitario la longitud del segmento que une a con a + hy tiene una longitud igual a h. Los cuatro puntos: a, a + hy, f (a) y f (a + hy) estn todos contenidos en un plano perpendicular al plano xy que sigue la direccin del segmento que une a con a + hy. Con esto en mente se puede concluir que la derivada direccional representa la pendiente de la recta tangente a la curva que se forma al intersecar la superficie con el plano que es perpendicular al plano xy, que pasa por a y es paralelo a y.

Definicin 5: El vector
f ( D ) =

f (D) f (D ) f (D ) , , ... , x1 x 2 x n

se conoce como el gradiente de f en a.

Teorema 5: Sea f : S R, S R n . Una condicin necesaria para que f tenga un


ptimo en a es que f (D ) =  .

Demostracin : Si f tiene un ptimo en a, al dejar constantes n-1 variables y analizar


proyeccin de la funcin tiene un ptimo en a k y, como se estara en el caso unidimensional, segn el teorema 1 la derivada de la funcin proyeccin debe ser igual a cero. Como este resultado se tiene para todas y cada una de las variables, necesariamente f (D ) =  .

la situacin en la variable restante, digamos x k , debe tenerse que, para esta, la

El teorema 5 motiva un mtodo, anlogo al empleado en el caso de variable unidimensional, para encontrar puntos ptimos. Este mtodo consiste en determinar los puntos en los cuales el gradiente se hace cero. Sin embargo, como en el caso

12

unidimensional, la anulacin del gradiente es una condicin necesaria, pero no suficiente, para la existencia de ptimos. La definicin 6 introduce la terminologa que se emplea para clasificar los diferentes casos. Mas adelante se establece un criterio, tambin anlogo al del caso unidimensional, basado en las segundas derivadas para establecer que clase de ptimo (si lo es) es un punto en el cual se anula el gradiente.

Definicin 6: Un punto a para el cual f (D) =  se conoce como punto estacionario de f. Un punto estacionario se llama de silla (o de ensilladura) si toda n-bola B(a)
contiene puntos x tales que f(x) < f(a) y otros para los cuales f(x) > f(a).

Ejemplo 9 (mtodo de los mnimos cuadrados): Cada planeta, con una nica

excepcin, se halla entre 1,3 y 2,0 veces tan alejado del Sol en relacin al siguiente planeta ms cercano. La nica excepcin es Jpiter, el quinto planeta, que se halla 3,4 veces ms alejado de lo que est Marte. Este hecho intrig notablemente a los astrnomos Podra existir un planeta en el hueco entre Marte y Jpiter? Heinrich Wilhelm Mathias Olbers, astrnomo alemn, reclut un grupo que planeaba emprender la bsqueda sistemtica del planeta faltante. Sin embargo, en la noche del 31 de diciembre de 1800 Giuseppe Piazzi, astrnomo italiano, quien desconoca la existencia y los propsitos del grupo de Olbers, localiz, en el mencionado hueco, un objeto celeste que variaba de posicin de un da al siguiente. Lo denomin Ceres y fue el primer asteroide de que se tuvo noticia. Un mes despus Ceres desapareci detrs del Sol. En los meses posteriores fue buscado infructuosamente en los cielos. Tres meses despus apareci exactamente en el lugar en el cual Carl Friedrich Gauss, matemtico alemn, empleando un mtodo de su invencin para analizar las observaciones hechas, haba predicho que lo hara. El mtodo inventado por Gauss se denomina de los mnimos cuadrados, y consiste en una tcnica que se utiliza para encontrar la curva que se ajusta mejor a un conjunto de resultados experimentales, de manera que sea mnima la suma de los cuadrados de las diferencias entre las ordenadas de dichos puntos y las de la curva que tienen la misma abscisa. El ejemplo que sigue desarrolla la idea del mtodo.

Dadas n parejas ordenadas distintas ( x1 , y1 ), ( x 2 , y 2 ), ... , ( x n , y n ) no siempre es posible encontrar una recta f ( x) = mx + b que pase por todos los puntos ( xi , y i ) . Sin embargo, pueden calcularse las constantes m y b de tal manera que la recta f ( x) = mx + b se ajuste de la mejor manera a la coleccin de puntos. Antes de resolver el problema se considerar el mejor criterio segn el cual se puede afirmar que la recta se ajusta de la mejor manera. En cada punto el error cometido ser igual a la diferencia entre el valor generado por la frmula f ( x) = mx + b y el valor tabulado, esto es, ei = f ( xi ) y i = mxi + b y i . Vase la figura 7.

Figura 7

13

Cualquier mtodo debe, de alguna manera, minimizar el total de los errores cometidos. En un primer momento podra pensarse en minimizar la suma de todos los errores, esto es, minimizar
n i =1

f ( xi ) y i

La figura 8 muestra que no es una buena idea, pues lo mnimo que se espera de la recta de ajuste es que, cuando se tienen exactamente dos puntos, pase por ambos. Este no es el caso, pues cualquier recta que pase por el punto medio, con la nica excepcin de una vertical, cumple la condicin de minimizar la suma de los errores, hacindola igual a cero (ntese que los errores son iguales en magnitud pero de signo contrario).

Figura 8
Una solucin alternativa sera intentar minimizar la suma de los valores absolutos de los errores, o sea, minimizar
n i =1

f ( xi ) y i

la dificultad de este enfoque radica en que es necesario calcular derivadas parciales pero el valor absoluto es una funcin que se define por partes y que, adems, no es derivable en 0. Todas estas dificultades son superadas con el enfoque de los mnimos cuadrados, el cual consiste en minimizar la suma de los errores al cuadrado, esto es, minimizar
n i =1

( f ( x i ) y i )2 =

n i =1

(mxi + b yi )2

El problema se concreta entonces a determinar las constantes m y b de tal manera que se minimice S(m, b) =
n i =1

(mxi + b yi )2
n S = 2 (mxi + b yi )xi m i =1 n S = 2 (mxi + b y i ) b i =1

Solucin:

igualando estas derivadas parciales a cero se obtiene 14

n i =1

xi2 + b
n i =1

n i =1

xi =

n i =1 n

xi y i

xi + nb =

i =1

yi

Este es un sistema lineal de dos ecuaciones con dos incgnitas, resolviendo por el mtodo de sustitucin, de la segunda ecuacin se obtiene
n

b= reemplazando en la primera
n

i =1

yi m n
n i =1

n i =1

xi

n i =1

x +
2 i

i =1

yi m n

xi

n i =1

xi =

n i =1

xi y i

despejando m
n n

m=

i =1

xi y i

i =1

xi

n i =1

yi n
2

n i =1

n
n i =1

xi y i
n

n i =1 n

xi

n i =1

yi
2

n i =1

xi n

x
2 i

x
2 i

i =1

i =1

xi

resumiendo

n m=

n i =1

xi yi
n

n i =1 n

xi

n i =1

yi
2

b=

i =1

yi m n

n i =1

xi

x
2 i

i =1

i =1

xi

es la solucin pedida. Cualquier hoja de clculo o calculadora cientfica genera ests cantidades a partir de los datos introducidos. En consecuencia, la recta de regresin es
f ( xi ) = Yi = mxi + b

Ejemplo 10: Demuestre que para la recta de regresin encontrada en el ejemplo


anterior se tiene
n i =1

f ( xi ) y i = 0
n i =1 n i =1

Solucin:

n i =1

f ( xi ) y i =
n i =1

Yi y i =

mxi + b y i =

xi + nb

n i =1

yi =

15

n i =1

xi +

n i =1

yi m

n i =1

xi

n i =1

yi = 0

Aunque se ha trabajado nicamente la regresin de tipo lineal en dos variables, el enfoque de los mnimos cuadrados puede extenderse directamente a polinomios de grado n (en el caso de que se tengan n + 1 puntos el polinomio de regresin ser precisamente el polinomio de colocacin), el grado del polinomio puede establecerse por algn resultado terico, alguna expectativa o por la aplicacin que se le pretenda dar. Mediante transformaciones, problemas no lineales pueden adaptarse para hacer regresin lineal a datos que, por ejemplo, se ajusten aproximadamente a una exponencial del tipo y = ab cx , ya que, evaluando en ambos lados logaritmos de base b se obtiene log b y = log b a + cx y haciendo las sustituciones Y = log b y y A = log b a se llega a una ecuacin de tipo lineal. Tambin es posible trabajar en ms de dos dimensiones encontrando, ya no la recta, sino el hiperplano que mejor se ajusta a una nube de puntos en R n .

Condiciones necesarias y suficientes para la existencia de puntos ptimos


El mtodo empleado en el ejemplo 9 se limit a determinar un punto estacionario de f. Las derivadas parciales estn definidas en todo el plano y, en consecuencia, este punto estacionario es nico. Consideraciones tericas propias del caso particular que se estaba tratando permitan concluir que la solucin exista. Por lo tanto se asumi que en este punto se presenta el mnimo buscado. Este procedimiento es lcito. Sin embargo, este no es siempre el caso: la existencia de varios puntos estacionarios puede hacer necesario que se clasifiquen en mximos, mnimos o puntos de silla. Tambin puede ocurrir que el modelo matemtico no garantice la existencia de la solucin y, en consecuencia, en los puntos estacionarios hallados pueden presentarse puntos de silla u ptimos de naturaleza contraria a los buscados. Estas consideraciones hacen que sea necesario contar con un criterio de clasificacin de los puntos estacionarios. Las definiciones y el teorema, sin demostracin, que se presentan en seguida suplen esta necesidad.

Definicin 7: La matriz n x n de las segundas derivadas parciales de f es llamada


matriz hessiana y se designa por H(x). As, se tiene
2 f ([ ) x12 2 f ([ ) H ( [ ) = x x 2 1 2 f ([ ) x n x1 2 f ([ ) x1x 2 2 f ([ ) 2 x 2 2 f ([ ) x n x 2 2 f ([) x1x n 2 f ([) x 2 x n 2 f ([) 2 x n

16

Definicin 8: Dada la matriz A n x n se define el k-simo menor principal de A como


a11 a 21 a k1 a12 a 22 ak 2 a1k a2k a kk

k = 1,2, . . . , n

Definicin 9: Dada la matriz simtrica A n x n se dice que A es:


1. definida positiva si los valores de los menores principales de A son positivos (no negativos). 2. definida negativa si el valor del k-simo menor principal tiene signo (1) k

Teorema 6: sea a un punto estacionario de f entonces


1. Si H(a) es definida positiva f tiene un mnimo en a. 2. Si H(a) es definida negativa f tiene un mximo en a.

Ejemplo 11: encuentre los puntos ptimos de la funcin


2 2 f ( x1 , x 2 , x3 ) = x1 + 2 x3 + x 2 x3 x12 x 2 x3

Solucin: el sistema

f = 1 2 x1 = 0 x1 f = x3 2 x 2 = 0 x 2 f = 2 + x 2 2 x3 = 0 x3

tiene como solucin el vector a = (1/2, 2/3, 4/3), entonces

2 H (D) = D 0 0

2 1 1 2

los menores principales de H tienen valores -2, 4, -6. Segn la definicin 9, H es definida negativa. Aplicando el teorema 6 se concluye que f tiene un mximo en a.

Ejemplo 12: Determine el punto del plano x + 2y + z = 1 ms cercano al origen. Solucin: El problema puede representarse como
minimizar f (x, y, z) = x 2 + y 2 + z 2

17

sujeto a

x + 2y + z = 1

despejando z en la restriccin se tiene z = 1- x - 2y , reemplazndola en la funcin objetivo queda f = x 2 + y 2 + (1 x 2 y ) 2 calculando las derivadas parciales e igualando a cero f = 2 x 2(1 x 2 y ) = 0 x f = 2 y 4(1 x 2 y ) = 0 y o f = 4x + 4 y 2 = 0 x f = 4 x + 10 y 4 = 0 y

que tiene como solucin y = 1/3, x = 1/6. En consecuencia z = 1/6. As, el punto estacionario a es igual a (1/6, 1/3). Como ya se mencion, caractersticas propias del problema en particular (en este caso el hecho de que la distancia mnima de un punto a un plano siempre existe) garantizan que el punto encontrado corresponde a la solucin. Sin embargo, se harn los clculos que verifican este hecho. H (D) = 4 4

4 10

Los menores principales de H son 4 y 24. Por consiguiente H es definida positiva y f tiene un mnimo en a. Hecha esta confirmacin se puede afirmar que el punto solucin es (1/6, 1/3, 1/6).

Ejemplo 13: encuentre los puntos estacionarios de


f (x, y, z) = 2xyz - 4xz - 2yz + x + y + z - 2x - 4y + 4z.

Solucin: calculando las derivadas parciales e igualando a cero


f = 2yz - 4z +2x - 2 = 0 x f = 2xz - 2z + 2y - 4 = 0 y

Nota: este problema pude resolverse acudiendo exclusivamente a argumentos geomtricos. La distancia mnima de un punto a un plano es la perpendicular del punto al plano. La solucin se halla, entonces, intersecando la recta (x, y, z) = t (1, 2 ,1) =(t, 2t, t), t que es perpendicular al plano con el plano. Para ello se resuelve para t la ecuacin t + 2(2t) + t = 1. La solucin es t = 1/6 y el punto es 1/6*(1, 2, 1) = (1/6, 1/3, 1/6).

18

f = 2xy 4x - 2y + 2z + 4 = 0 z Para resolver este sistema no lineal de 3 ecuaciones con 3 incgnitas se emplea el mtodo de sustitucin. Despejando x en la primer ecuacin reemplazando en la segunda x = 1 yz + 2z 2(1 yz + 2z)z - 2z + 2y - 4 = 0 haciendo el producto, simplificando y factorizando factorizando de nuevo z(4 - 2y) + 2y 4 = 0 (4 2y)(z - 1) = (4 2y)(z - 1)(z + 1) = 0 de esta ltima igualdad se concluye que y = 2 o z = 1 o z = -1. Reemplazando x en la segunda ecuacin 2(1 yz + 2z)y 4(1 yz + 2z) - 2y + 2z + 4 = 0 simplificando y factorizando en consecuencia z(y - 4y + 3) = z(y 3)(y - 1) = 0 z = 0 o y = 3 o y = 1.

Se escogen las parejas (y, z) de tal manera que se cumplan las 2 condiciones, por ejemplo, si se escoge y = 3 en la segunda condicin entonces, por la primera condicin, z = 1 o z = -1. Se tienen, por lo tanto, las parejas (3, 1) y (3, -1). Consideraciones anlogas dan como resultado las parejas (1, 1), (1, -1) y (2, 0). Tomando, por ejemplo, la pareja (3, 1) se obtiene x = 1 3*1 + 2*1 = 0, con lo cual se tiene la tripla (0, 3, 1). El mismo procedimiento conduce a la obtencin de los puntos (1, 2, 0), (2, 3, -1), (2, 1, 1) y (0, 1, -1) como puntos estacionarios de f.

Utilizacin de mtodos numricos en la determinacin de puntos estacionarios


El ejemplo 13, de fcil solucin, ilustra las bondades de un problema artificial, esto es, un problema que ha sido creado para que tenga una solucin relativamente fcil. En este caso la solucin del sistema de ecuaciones, originado al igualar el gradiente a cero, se pudo realizar acudiendo nicamente al lgebra elemental. Sin embargo, este tipo de

19

problemas constituyen la excepcin y no la regla cuando se presentan como parte de la solucin de un problema real de aplicacin. En estos casos, de manera similar a lo visto en el trabajo con variable unidimensional, hay que recurrir a algn mtodo numrico para resolver el sistema. El mtodo que se tratar aqu es el de Newton para sistemas de ecuaciones no lineales.

Mtodo de Newton para sistemas de ecuaciones


Dado el sistema de n ecuaciones F(x) = 0, donde

)( [ ) =

f1 ( [ ) f 2 ([ ) f n ([ )

El mtodo de Newton para sistemas consiste en la aplicacin de la ecuacin recursiva

[ k = [ k 1 [J ( [ k 1 )] )( [ k 1 )
1

en donde [ 0 es un punto prximo a la raz buscada y

f 1 ( [ ) x1 f 2 ( [ ) J ( [ ) = x1 f n ( [ ) x1

f1 ( [ ) x 2 f 2 ( [ ) x 2 f n ( [ ) x 2

f 1 ( [ ) x n f 2 ( [ ) x n f n ( [ ) x n

Ejemplo 14: Encuentre los puntos estacionarios de


f (x, y, z) = 2x + y + z + 6(x + y + z) + 2xyz

Solucin: Calculando las derivadas parciales e igualando a cero


f = 4x + 2yz + 6 = 0 x f = 2y + 2xz + 6 = 0 y f = 2z + 2x y + 6 = 0 z Para aplicar el mtodo de Newton se construye la matriz J

20

2z 2 y

J ([ ) = 2 z 2 2 x 2 y 2x 2
Comenzando con [ 0 =(0, 0, 0) se tiene

4 0 0 J (0,0,0) = 0 2 0 0 0 2
adems y

[J (0,0,0)]
6

1/ 4 = 0 0

1/ 2 0 0 1/ 2

F(0, 0, 0) = 6

6
se tiene entonces

1/ 4

6 6 = (-3/2, -3, -3) 6


Zi 0 -3 -1.10526316 6.76180141 2.69855772 0.11834204 -0.92876013 2.17392051 1.01241321 2.46146365 1.79535061 1.6406222 1.63437 1.63436529 1.63436529

[ 1 = (0, 0, 0) -

0 0

1/ 2 0 0 1/ 2

Iteracin (i) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Xi 0 -1.5 -0.31578947 6.5843733 3.11386779 1.82175404 -1.38308621 0.95034839 -1.33794065 -3.47952806 -2.88978861 -2.83385015 -2.83556311 -2.83557496 -2.83557496

Tabla 2

Yi 0 -3 -1.10526316 6.76180141 2.69855772 0.11834204 -0.92876013 2.17392051 1.01241321 2.46146365 1.79535061 1.6406222 1.63437 1.63436529 1.63436529

La tabla 2 resume los clculos. Ntese que los valores en la iteracin 14 coinciden con los de la 13 esto se debe a que F(x) = 0. As, partiendo del punto (0, 0, 0) se ha encontrado una solucin al sistema consistente en x = -2.83557496, y = 1.63436529 y z = 1.63436529. Sin embargo, en el ejemplo 13 se encontraron 5 puntos estacionarios (5 soluciones al sistema no lineal de ecuaciones) por lo tanto es probable que tambin en este caso existan varias soluciones. Un procedimiento intuitivo consiste en ejecutar las iteraciones a partir de diferentes puntos en busca de las otras races del sistema, por ejemplo, a partir del punto (15, -15, 5) se obtiene la solucin x = 1, y = - 4.1925824 y z = 1.1925824. Como los papeles de y y z en el sistema son simtricos, a partir de esta ltima solucin se deduce que x = 1, y = 1.1925824 y z = - 4.1925824 tambin es solucin. Obviamente esta tcnica de ensayo y error no constituye un mtodo de

21

aplicacin general y adems las simetras son extraas. Para evadir estas dificultades, se puede, en el caso particular del sistema que se est resolviendo, disminuir la dimensin del problema despejando x en la primera ecuacin y reemplazndola en las otras 2 con lo cual se obtiene: x = -(yz + 3)/2 y el sistema se reduce a y(2 - z ) - 3z + 6 = 0 - yz - 3y + 2z + 6 = 0 como para una solucin cualquiera deben satisfacerse simultneamente las dos ecuaciones, las soluciones se localizan en los puntos de interseccin de las 2 grficas. Esta situacin se ilustra en la figura 9

Figura 9
As, es posible verificar de forma grfica que las races encontradas son todas las existentes. Es importante insistir que la tcnica empleada para la resolucin de este ejemplo no siempre es aplicable. En general es difcil determinar el nmero exacto de races, como tambin el lugar aproximado en donde se encuentran. Lo que se desea indicar es que, en la resolucin de cada problema en particular, es aconsejable acudir a todas las herramientas que sea lcito emplear en el momento. De manera anloga al caso unidimensional los ptimos de una funcin f de variable multidimensional, f : S R, S R n , tambin pueden presentarse en aquellos puntos para los cuales no existen las derivadas parciales o que corresponden a la frontera. El propsito del ejemplo 15 es ilustrar esta situacin.

Ejemplo 15: Dada f ( x, y ) = x 2 + y 2 definida en {(x, y) / x + y 4} que aparece


graficada en la figura 10

22

Figura 10
es evidente que presenta un mnimo en (0, 0), punto en el cual las derivadas parciales

f = x

x x +y
2 2

f = y

y x + y2
2

no existen. Adems f toma un valor mximo de 2 en todos y cada uno de los puntos de la frontera.

Extremos restringidos. Multiplicadores de Lagrange


De la misma manera que la derivada unidimensional f (a) representa la pendiente de la recta tangente a la curva f(x) en el punto (a, f(a)), el vector gradiente tiene una interpretacin geomtrica que es til en el momento de dar una motivacin del mtodo conocido como de los multiplicadores de Lagrange. El vector gradiente f (D ) es un vector normal (perpendicular) al plano tangente a la superficie f(x) en el punto (a, f(a)). Este hecho se ilustra en la figura 11.

Figura 11
Se introducen las ideas del mtodo mediante la solucin de un problema de aplicacin.

23

Ejemplo 15: Encuentre los puntos de la superficie z - xy = 1 ms prximos al origen. Solucin: Al plantear el problema de la forma
1

Minimizar (x + y + z) 2 Sujeto a z - xy = 1 Se hace evidente que se trata de un problema de optimizacin con restricciones. Un punto (x, y, z) se encuentra a una distancia r del origen si, y solo si, est en la esfera

x + y + z = r
Esta esfera es una superficie de nivel de la funcin f(x, y, z) = x + y + z que hay que minimizar. Como la superficie z - xy = 1 no pasa por el origen, la idea de la solucin consiste en comenzar con r = 0 e ir aumentando hasta que la esfera sea tangente a la superficie. Cada punto de contacto ser una solucin del problema. En el punto de tangencia las dos superficies tienen el mismo plano tangente y, en consecuencia, gradientes paralelos. El paralelismo de los gradientes se traduce en que uno es mltiplo del otro. Definiendo g ( x, y, z ) = z 2 xy 1 se tiene que la superficie queda definida por g(x, y, z) = 0 y que

f = g
en consecuencia ( 2 x, 2 y , 2 z ) = ( y , x, 2 z ) 2x = -y 2y = -x 2z = 2z

que equivale a las 3 ecuaciones

la cuarta ecuacin est dada por g(x, y, z) = 0 o sea z 2 xy 1 = 0 . Este sistema tiene como solucin: = 1, x = y = 0, z = 1 o z = -1. Se tienen, en consecuencia, las dos soluciones (0, 0, 1) y (0, 0, -1). El mtodo empleado en la solucin del ejemplo 15 se generaliza de la siguiente manera.

Mtodo de los multiplicadores de Lagrange


Si f : S R, S R n tiene un ptimo relativo cuando est sometida a m condiciones

g1 ( x1 ,..., x n ) = 0,..., g m ( x1 ,..., x n ) = 0

24

con m < n, existen entonces m escalares 1 ,..., m tales que

f = 1g 1 +

+ n g n

Los escalares 1 ,..., m que se introdujeron para resolver este tipo de problemas se denominan multiplicadores de Lagrange.

Ejemplo 16: Encuentre las dimensiones de la cubeta que aparece en la figura 12 de tal
manera que se minimice el material empleado y se cumplan las dos restricciones: 1. cada uno de los espacios debe tener una seccin horizontal cuadrada. 2. el volumen total (sin tener en cuenta las particiones) debe ser igual a 12 pulgadas cbicas.

Figura 12

Solucin:
El problema se plantea de la siguiente manera: Minimizar 3xz + xy + 6yz Sujeto a x/5-y/2=0 xyz-12 = 0 en donde f (x, y, z) = 3xz + xy + 6yz, g1 ( x, y, z ) = x / 5 y / 2 y g 2 ( x, y, z ) = xyz 12 . Entonces

f = (3 z + y, x + 6 z ,3 x + 6 y ) , g1 = (1 / 5,1 / 2,0) y g 2 = ( yz , xz , xy )
El sistema

f = 1g1 + 2 g 2 g 1 ( x, y , z ) = 0 g 2 ( x, y , z ) = 0

es un sistema de 5 ecuaciones con 5 incgnitas de solucin dispendiosa. Sin embargo, empleando un paquete matemtico (en este caso Derive) se obtiene la solucin:

25

3 * 60 3 3 * 60 3 2 * 60 3 x= , y= y z= 2 5 9
Al no contarse con un paquete matemtico este problema puede simplificarse despejando x en la primera restriccin y reemplazndola en la funcin objetivo y en la segunda restriccin, con lo cual se obtiene un problema en dos variables con una restriccin. An ms, este nuevo problema puede a su vez simplificarse despejando z y se tiene un problema en una sola variable sin restricciones. Sin embargo, el mtodo de los multiplicadores de Lagrange est concebido para resolver problemas en los cuales es imposible hacer tales simplificaciones.

Optimizacin no clsica variable multidimensional


Hasta el momento los mtodos empleados han sido fruto de la aplicacin de resultados tericos como, por ejemplo, igualar el gradiente a cero o emplear el mtodo de los multiplicadores de Lagrange, las dificultades han aparecido al momento de atacar el problema de resolver los sistemas de ecuaciones no lineales que aparecen al aplicar los resultados tericos. Para ello se ha acudido al mtodo de Newton, el cual es un mtodo iterativo de aproximaciones sucesivas a partir de un punto inicial. Lo que se har ahora es emplear una idea similar para encontrar directamente el ptimo: comenzando con un punto inicial, adecuado segn algn criterio, iterar hasta estar lo suficientemente cerca del ptimo.

Mtodo del gradiente


Existe una relacin fundamental entre la derivada direccional y el gradiente la cual es expresada en la siguiente frmula

f ' (D; \ ) = f (D ) \ = f (D ) \ cos = f (D ) cos


donde es el ngulo formado por f (a) e y. La figura 13 proporciona una ilustracin grfica del hecho

Figura 13

26

Al tener la derivada direccional la forma f (D ) cos es claro que esta asume un valor mximo cuando = 0 y un valor mnimo cuando = . O sea que, el valor mximo de la derivada direccional es f (D ) y ocurre cuando y tiene la misma direccin del gradiente y el valor mnimo es - f (D ) que ocurre cuando y tiene direccin opuesta al gradiente. En otras palabras, el gradiente de f en a apunta en la direccin de mximo crecimiento de f a partir de a, en tanto que f (D ) apunta en la direccin del mximo decrecimiento de f. Este importante hecho constituye la base del mtodo del gradiente el cual consiste en comenzar a partir de un punto inicial, y avanzar en la direccin del gradiente, en el caso de maximizacin, o en la direccin contraria, en el caso de minimizacin. Una vez determinada la direccin de avance es necesario escoger la longitud de dicho avance (o tamao del paso) lo cual constituye, a su vez, un problema de optimizacin de variable unidimensional. El siguiente ejemplo ilustra el procedimiento.

Ejemplo 17: Maximice la funcin


f(x, y) = 4x + 6y 2x -2xy 2y

Solucin: comenzando en el punto inicial (0, 0) y considerando que


f (x, y) = (4 4x 2y, 6 2x 4y)
entonces el vector f (0,0) = (4, 6) determina la direccin que debe tomarse a partir de (0, 0). Si p controla la longitud del paso, el punto de llegada ser (0, 0) + p(4, 6) = (4p, 6p) para determinar el mejor p se optimiza f (4p, 6p), se tiene entonces

f (4p, 6p) = 16p + 36p 32p - 48p - 72p = 52p 152p


derivando e igualando a cero 52 304p = 0 entonces p = 52/304 = 13/76 con lo que el nuevo punto es (13/19, 39/38). Evaluando f (13/19, 39/38) = 169/38 = 4.447368421que representa una mejora frente a f (0,0) = 0. Se hacen los clculos para dar el siguiente paso. f (13/19, 39/38) = (-15/19, 10/19) con lo que el nuevo punto es (13/19, 39/38) + p(-15/19, 10/19) = (13/19 - 15p/19, 39/38 + 10p/19) entonces

f (13/19 - 15p/19, 39/38 + 10p/19) = -( 700p - 650p 3211) / 722


derivando, igualando a cero y despejando se obtiene p = 13/28 con lo que el nuevo punto es (169/532, 169/133) con f (169/532, 169/133) = 169/38 = 4.656361297. 27

Este proceso es engorroso, sin embargo, como en este caso en el proceso de optimizacin la p se obtiene de manera explcita, pueden hacerse los clculos para cualquier punto genrico (a, b), con lo cual se obtiene

f (a, b) = (4 4a 2b, 6 2a 4b)


entonces el nuevo punto es (a, b) + p(4 4a 2b, 6 2a 4b) = (4 p +(1 4 p)a 2pb, 6p 2pa + (1 4 p)b) evaluando f (4 p +(1 4 p)a 2pb, 6p 2pa + (1 4 p)b), derivando, igualando a cero y despejando p se obtiene

p=

5a 2 + 2a (4b 7) + 5b 2 16b + 13 4(7 a 2 + a (13b 22) + 7b 2 23b + 19)

con lo cual el procedimiento se puede automatizar mediante una hoja de clculo para obtener la tabla Iteracin
0 1 2 3 4 5 6 7 8 9 10 11 12 32 33 0 0.68421053 0.54916898 0.47572532 0.42700188 0.39495765 0.37387564 0.3600059 0.35088108 0.3448779 0.34092844 0.33833012 0.33662069

X 0 1.02631579 1.11634349 1.19097172 1.23966398 1.27170903 1.29279102 1.30666076 1.31578559 1.32178876 1.32573822 1.32833655 1.33004598

f(X)
0 4.44736842 4.57299572 4.62612436 4.64911892 4.65907156 4.66337931 4.66524381 4.66605082 4.66640011 4.6665513 4.66661673 4.66664505

f(X)
4 -0.78947368 -0.42936288 -0.28484473 -0.1873355 -0.12324868 -0.08108462 -0.05334514 -0.03509549 -0.02308914 -0.01519022 -0.00999357 -0.00657472 -1.52E-06 -9.98E-07 6 0.52631579 0.43628809 0.28466249 0.1873403 0.12324856 0.08108462 0.05334514 0.03509549 0.02308914 0.01519022 0.00999357 0.00657472 1.52E-06 9.98E-07

0.1710526 0.4642857 0.499936 0.4999999 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5

0.33333409 1.33333257 4.66666667 0.33333383 1.33333283 4.66666667

Tabla 3

En la tabla 3 se ve que el algoritmo converge efectivamente hacia la solucin (1/3, 4/3) la cual puede encontrarse de forma analtica- mientras que el gradiente tiende a cero como es de esperarse que ocurra en un punto ptimo.

28

Programacin separable
La idea de la programacin separable para resolver un problema de P.N.L. es construir una aproximacin lineal del problema, esto es, un problema de programacin lineal, y resolver este para encontrar una aproximacin a la solucin de aquel.

Definicin 10: Una funcin f (x) donde [ = ( x1 , x 2 ,..., x n ) se dice separable si cumple
la condicin:

f ([ ) =

n i =1

f i ( xi )

(4)

Ejemplo 18:
escribirse donde

La funcin

f ( x1 , x 2 ) = 2 x12 + 3 x1 + 4 x 2 es separable pues puede

f ( x1 , x 2 ) = f 1 ( x1 ) + f 2 ( x 2 )
f 1 ( x1 ) = 2 x12 + 3 x1 y f 2 ( x 2 ) = 4 x 2

Supongamos que en el problema de optimizacin Maximizar z = f (x) Sujeto a < g j ( [ ) b j j = 1,..., m > xi 0 i = 1,2,..., n

(5)

la funcin objetivo y las restricciones son separables. El problema adquiere entonces la forma Maximizar z = Sujeto a
n i =1 n i =1

f i ( xi )

< g ji ( xi ) b j j = 1,..., m > xi 0 i = 1,2,..., n


n i =1

(6)

Al hacer la descomposicin f ( [ ) =

f i ( xi ) cada f i puede ser lineal o no. En caso de

no serlo se le hace una aproximacin lineal de la siguiente manera: sea f (x), definida en [a, b], como aparece en la figura 14

29

Figura 14
Se toma la particin a = x0 < x1 < x 2 <

< x k < x k +1 <

< x r 1 < x r = b . La funcin


, f ( x r 1 ), f ( x r ) es una
__________ ______

f ( x) definida por la poligonal f ( x0 ), f ( x1 ), f ( x1 ), f ( x 2 ), aproximacin lineal de la funcin f (x).

__________ ______

________________

Para estudiar f ( x) se selecciona el intervalo arbitrario [ x k , x k +1 ] para el cual se tiene

f ( x) = f ( x k ) +

f ( x k +1 ) f ( x k ) ( x x k ) (7) x k +1 x k

Por otra parte si x [ x k , x k +1 ] entonces x puede ser representado como combinacin convexa de los extremos del intervalo. Se tiene entonces

x = x k +1 + (1 ) x k 0 1 (8)
Sustituyendo (8) en (7) queda

f ( x) = f ( x k ) +
o

f ( x k +1 ) f ( x k ) (x k +1 + (1 ) x k x k ) 0 1 x k +1 x k f ( x k +1 ) f ( x k ) ( x k +1 x k ) 0 1 x k +1 x k

f ( x) = f ( x k ) +
Simplificando y factorizando

f ( x) = f ( x k +1 ) + (1 ) f ( x k ) 0 1 (9)
Como se est analizando el intervalo [ x k , x k +1 ] se definen k +1 = y k = 1 con lo cual (8) y (9) toman la forma

30

x = k x k + k +1 x k +1 f ( x) = k f ( x k ) + k +1 f ( x k +1 )
donde k + k +1 = 1, k , k +1 0 . En general para cualquier x [a, b] se puede escribir
r k =0

x=

k xk y

f ( x) =

r k =0

k f ( xk )
(10)

donde

r k =0

i = 1 y k 0 k = 0,1,

,r

con la condicin de que mximo dos k sean positivos, en cuyo caso deben ser adyacentes. Empleando (10) en el problema (6) se obtiene un problema aproximado de naturaleza lineal el cual tiene la siguiente representacin: Maximizar z = Sujeto a
n i =1 r k =0 r k =0 n r

i =1 k = 0

ik f i ( xik )

ik g ji ( xik ) b j j = 1,..., m
,n , r , i = 1, ,n

< >

(11)

ik = 1 i = 1,

ik 0, k = 0,

con la condicin de que para cada i mximo dos ik sean positivos, en cuyo caso deben ser adyacentes. Este problema es casi lineal, no lo es por la propiedad de adyacencia que se acaba de mencionar, en consecuencia, se resuelve (11) por el mtodo smplex (o algn mtodo equivalente) y se verifica que la solucin satisfaga dicha propiedad.

Ejemplo 18: Dado el problema separable


Maximizar z = 2 x1 x12 + x 2 Sujeto a 2 2 x12 + 3 x 2 6 x1 , x 2 0 constryase y resulvase el problema lineal aproximado.

Solucin: en primer lugar se separan la funcin objetivo y la restriccin as:

31

f 1 ( x1 ) = 2 x1 x12 f 2 ( x2 ) = x2 g1 ( x1 ) = 2 x12
2 g 2 ( x2 ) = 3x2

es necesario tambin encontrar los intervalos de definicin de x1 y x 2 . De la restriccin


2 2 x12 + 3 x 2 6 2 6 3x 2 2

se tiene, por una parte

x1
2 de donde 6 3 x 2 0 o x 2 2 1.4142 .

De manera anloga

x2

6 2 x12 3

de donde 6 2 x12 0 o x1 3 1.7320 . Por comodidad se toman los rangos 0 xi 2 i = 1, 2. Para r = 8 se tiene la tabla 4
k 0 1 2 3 4 5 6 7 8 Xk 0 0.25 0.5 0.75 1 1.25 1.5 1.75 2 f1(x1) 0 0.4375 0.75 0.9375 1 0.9375 0.75 0.4375 0 f2(x2) 0 0.25 0.5 0.75 1 1.25 1.5 1.75 2 g1(x1) 0 0.125 0.5 1.125 2 3.125 4.5 6.125 8 g2(x2) 0 0.1875 0.75 1.6875 3 4.6875 6.75 9.1875 12

Tabla 4

con lo cual (11) para este caso particular asume la forma: Maximizar z = 010 + 0.437511 + 0.7512 + 0.937513 + 14 + 0.937515 + 0.7516 + 0.437517 + 018 + 0 20 + 0.25 21 + 0.5 22 + 0.75 23 + 24 + 1.25 25 + 1.5 26 + 1.75 27 + 2 28 Sujeto a 010 + 0.12511 + 0.512 + 1.12513 + 214 + 3.12515 + 4.516 + 6.12517 + 818 + 020 + 0.187521 + 0.7522 + 1.687523 + 324 + 4.687525 + 6.7526 + 9.187527 + 1228 6

32

10 + 11 + 12 + 13 + 14 + 15 + 16 + 17 + 18 = 1 20 + 21 + 22 + 23 + 24 + 25 + 26 + 27 + 28 = 1
Para resolver este problema se han renombrado las variables de la siguiente manera

x0 = 10 ,

, x8 = 18 , x9 = 20 ,

, x17 = 28

La salida de MPL con la solucin de este problema es:

se tiene entonces que

13 = 1, 2 5 = 0.9091 y 2 6 = 0.0909

se ve que la solucin satisface la propiedad de adyacencia. De acuerdo con (10) se tiene entonces que la solucin aproximada es:

x1 = 1 0.75 = 0.75 y x 2 = 0.9091 1.25 + 0.0909 1.5 = 1.272725


con

z = 2.2102 .

El problema tambin puede ser resuelto por un mtodo grfico anlogo al empleado en Programacin Lineal. En primer lugar se grafica la regin factible (conjunto de puntos que satisfacen simultneamente todas las restricciones), luego se grafican las diversas curvas que se obtienen al asignar algunos valores a la funcin objetivo y, finalmente, observando el comportamiento de estas ltimas se determina la solucin. La figura 15 ilustra el procedimiento. 33

Figura 15
Se observa que a medida que z va tomando valores cada vez ms grandes la grfica de la funcin objetivo se desplaza hacia arriba, por lo tanto el punto ptimo es el ltimo punto de contacto que tiene la regin factible con la funcin objetivo en su camino de ascenso, este punto cumple la condicin de que en l las dos grficas la de la funcin objetivo que asciende y la que delimita la regin factible son tangentes. Aplicando lo aprendido en la seccin dedicada a los Multiplicadores de Lagrange se tiene que en el punto de tangencia las dos funciones deben tener la misma derivada. Despejando x 2 en la funcin objetivo y en la restriccin se tiene

x 2 = z 2 x1 + x
entonces

2 1

x2 =

6 2 x12 3

dx 2 = 2 + 2 x1 dx1

dx 2 2 x1 = dx1 3 6 2 x12

igualando las derivadas se obtiene la ecuacin

2 + 2 x1 +

2 x1 3 6 2 x12

=0

aplicando el mtodo de Newton con un valor inicial de 1 se obtiene

de donde

x1 = 0.7905721355 x 2 = 1.258304599
y z = 2.214444568

La tabla 4 contiene una comparacin entre la solucin del problema lineal aproximado y la solucin del problema original 34

Tabla 4
La precisin del mtodo puede mejorarse resolviendo dos problemas consecutivos, el primero con menos divisiones en los intervalos de definicin de las variables (una aproximacin no tan refinada) con el objetivo de determinar una aproximacin al ptimo. El segundo, con divisiones ms finas, en un entorno del punto encontrado en el primer problema, incluyendo las restricciones necesarias.

Algoritmos Genticos: un cambio de paradigma


A finales de los 50 y comienzos de los 60 del siglo pasado, bilogos evolutivos, en un intento de simular los mecanismos de la evolucin biolgica, programaron los primeros algoritmos que hoy se conocen como genticos. Sin embargo, en un primer momento no pensaron que estas tcnicas podran emplearse en la solucin de problemas de bsqueda u optimizacin. En 1965 surgi un desarrollo ms exitoso, cuando Ingo Rechenberg, entonces de la Universidad Tcnica de Berln, introdujo una tcnica que llam estrategia evolutiva. En esta tcnica no haba poblacin ni cruzamiento; un padre mutaba para producir un descendiente, y se conservaba el mejor de los dos, convirtindose en el padre de la siguiente ronda de mutacin. En 1962 John Holland sent las bases para estudios posteriores sobre sistemas adaptativos, tambin fue el primero en proponer explcitamente el cruzamiento y otros operadores de recombinacin. Sin embargo, el trabajo fundamental en el campo de los algoritmos genticos apareci en 1975, con la publicacin del libro Adaptacin en Sistemas Naturales y Artificiales. Basado en investigaciones y publicaciones anteriores del propio Holland y de colegas de la Universidad de Michigan, este libro fue el primero en presentar sistemtica y rigurosamente el concepto de sistemas digitales adaptativos utilizando la mutacin, la seleccin y el cruzamiento. Un algoritmo gentico (AG) es una tcnica de programacin que imita a la evolucin biolgica como estrategia para resolver problemas. Dado un problema especfico a resolver, la entrada del AG es un conjunto de soluciones potenciales a ese problema, codificadas de alguna manera, y una funcin de aptitud que permite evaluar cuantitativamente a cada candidata. Estas candidatas pueden ser soluciones que ya se sabe que funcionan, con el objetivo de que el AG las mejore, pero tambin pueden haber sido generadas de manera aleatoria. Luego el AG evala cada candidata de acuerdo con la funcin de aptitud. En un conjunto de candidatas generadas de manera aleatoria, muchas tendrn desempeos poco satisfactorios y sern eliminadas. Sin embargo, por puro azar, unas pocas pueden ser prometedoras.

35

Estas candidatas prometedoras se conservan y se les permite reproducirse. Tambin se realizan copias de ellas, pero las copias no son perfectas; se introducen cambios aleatorios durante el proceso de copia (mutaciones). Esta descendencia constituye un nuevo conjunto de soluciones candidatas que se convierte en una nueva entrada al AG. Tras sucesivas generaciones (generalmente una gran cantidad) este proceso evolutivo debe converger hacia una solucin ptima (hasta el momento esta ltima afirmacin es heurstica). Los conceptos de codificacin, cruzamiento y mutacin, as como algunas de las ventajas de los AG sern discutidos de manera simultnea con la solucin de un ejemplo.

Ejemplo 19 Maximizar
f ( x1 , x 2 ) = 21.5 + x1 sen(4x1 ) + x 2 sen(20x 2 )
Sujeto a

3 x1 12.1 4.1 x 2 5.8

Solucin: en primer lugar se hace una grfica de la funcin objetivo

Figura 15
En la figura 15 puede apreciarse la gran cantidad de mximos y mnimos relativos que presenta la funcin en su dominio. El procedimiento clsico nos lleva a igualar las derivadas parciales a cero, con lo cual se tiene el sistema no lineal 4 x cos(4 x) + sen(4 x) = 0 20 x cos(20 x) + sen(20 x) = 0

36

La tabla 5 contiene los resultados obtenidos al emplear el mtodo de Newton as como los diferentes puntos iniciales usados en cada conjunto de iteraciones
Punto inicial (x, y) Solucin encontrada Clase de P. Est -3 4.1 -0.390978477 1.025247045 Fuera del dominio -2.5 4.5 -0.634922044 1.125225098 Fuera del dominio -2.5 4.7 -0.634922044 1.175215524 Fuera del dominio 0 5 0 0.625404935 Fuera del dominio 5 5 0.634922044 0.625404935 Fuera del dominio 12.1 5.8 12.12552224 0.725349159 Fuera del dominio

Tabla 5

A pesar de que la grfica indica la existencia de una gran cantidad de ptimos en el dominio, para todos los puntos iniciales dados el mtodo de Newton converge en puntos que estn por fuera del dominio. Ahora se mostrar la manera de emplear un algoritmo gentico para resolver el problema.

Codificacin: la codificacin se hace mediante numeracin binaria (cadenas de bits). Para el intervalo [a, b] con una precisin de cinco cifras decimales, se tiene un total de
(b a ) 10 5 puntos a codificar. Para ello se determina m tal que 2 m 1 < (b a ) 10 5 2 m 1 Lo cual puede hacerse fcilmente empleando logaritmos en base 2. Si x [ a, b] entonces x puede escribirse como x = a + (b - a) donde 0 1 (combinacin convexa). El mayor valor decimal que puede tener una cadena de n bits es 2n 1, por lo tanto 0 valor decimal(cadena n bits) / (2n 1) 1, entonces, para cualquier cadena de n bits, se tiene que el nmero

x= a+

valor _ decimal (cadena n bits ) (b a ) 2n 1

est en [a, b]. De esta manera se establece una relacin entre las cadenas de n bits y el intervalo [a, b]. En el ejemplo, para el intervalo de x1 se tiene (12.1 (3)) 10 5 = 151.000

log 2 (151.000) = 17.204189


entonces 217 < 151.000 218 1 con lo cual se necesitarn 18 bits para codificar el intervalo [-3, 12.1]. De manera anloga, para el intervalo [4.1, 5.8] sern necesarios 15 bits. Se emplearn cadenas de 33 bits, los 18 primeros para x1 y los 15 restantes para x2.

37

Figura 16

Poblacin inicial: se emplear una poblacin inicial de 10 individuos generada de manera aleatoria
1. 1 1 1 0 0 0 1 1 1 0 0 0 0 1 1 1 1 1 1 1 0 1 0 1 1 1 0 0 1 1 0 1 1 2. 0 1 0 1 0 1 1 0 1 0 1 0 0 1 1 0 1 0 0 0 1 1 0 0 1 0 0 0 0 1 1 0 0 3. 0 0 0 1 1 1 1 0 0 1 0 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1 4. 1 1 1 0 0 1 1 1 1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1 5. 0 1 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 0 6. 0 0 1 1 0 1 0 0 1 0 0 0 0 1 1 0 0 0 1 0 1 1 0 0 0 0 0 1 0 0 0 1 0 7. 0 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 1 0 0 1 0 8. 1 0 0 1 0 0 1 1 0 0 1 1 1 0 1 1 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 0 1 9. 1 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1 10. 1 0 0 0 0 1 0 0 1 1 0 1 1 1 1 1 1 0 0 0 1 0 1 0 1 1 0 1 0 1 1 1 1 Cada cadena de 33 bits es descompuesta en dos, una de 18 y otra de 15 bits respectivamente y para cada una de ellas se calcula su valor decimal. 1. 232991 2. 88730 3. 31095 4. 237217 5. 66030 6. 53784 7. 6895 8. 150766 9. 134710 10. 136062 Mediante la frmula 27547 6412 17829 5027 14262 22562 402 16493 14787 5551

x= a+

valor _ decimal (cadena n bits ) (b a ) 2n 1

cada nmero de la lista anterior es llevado al correspondiente intervalo de definicin. Se obtiene: 1. 10.4208 5.52918 2. 2.11104 4.43266 3. -1.20886 5.02499 4. 10.6642 4.36081

38

5. 0.80347 6. 0.098074 7. -2.60283 8. 5.68445 9. 4.75959 10. 4.83746

4.83993 5.27055 4.12086 4.95568 4.86717 4.38799

Evaluacin: la funcin objetivo es evaluada en cada pareja para medir su desempeo.


1. f(10.4208 , 5.52918 ) = 18.0964 2. f(2.11104 , 4.43266 ) = 27.5072 3. f(-1.20886 , 5.02499 ) = 27.1225 4. f(10.6642 , 4.36081 ) = 28.1568 5. f(0.80347 , 4.83993 ) = 23.8611 6. f(0.098074 , 5.27055 ) = 16.5267 7. f(-2.60283 , 4.12086 ) = 27.9845 8. f(5.68445 , 4.95568 ) = 23.9393 9. f(4.75959 , 4.86717 ) = 16.638 10. f(4.83746 , 4.38799 ) = 14.1858

Seleccin: la aptitud de un individuo se determina de acuerdo a su comportamiento en la funcin objetivo. Si se representa el desempeo de acuerdo a la longitud de un segmento de recta se tiene, para el caso de 3 individuos

Figura 17

luego se escalan las cantidades para que la suma sea 1.

Figura 18

Se colocan los segmentos, uno a continuacin del otro, de manera que llenen el intervalo [0, 1]. Acto seguido, se generan 10 nmeros aleatorios en [0, 1], el individuo al que pertenece el intervalo en el cual cay el nmero generado de manera aleatoria pasa a la siguiente generacin.

39

Figura 19
Para el caso de la figura 19 el individuo elegido para pasar a la siguiente generacin es b. Volviendo al ejemplo se tiene que la suma total de las imgenes es 224.018 y para cada individuo su desempeo escalado (dividido por 224.018) es 1. 0.0807811 2. 0.12279 3. 0.121073 4. 0.12569 5. 0.106514 6. 0.0737738 7. 0.124921 8. 0.106863 9. 0.0742706 10. 0.0633242 Ahora se coloca un intervalo a continuacin del otro sumando sus longitudes 1. 0.0807811 2. 0.203571 3. 0.324644 4. 0.450334 5. 0.556848 6. 0.630622 7. 0.755542 8. 0.862405 9. 0.936676 10. 1 Se generan 10 nmeros aleatorios y de acuerdo a su valor se indica que individuo pasa a la siguiente generacin. 1. 2. 3. 4. 5. 6. 7. 0.353679 0.562273 0.911527 0.865902 0.714621 0.378155 0.222755 4 6 9 9 7 4 3

40

8. 0.290262 3 9. 0.462966 5 10. 0.781793 8 Se tiene la nueva poblacin 1. 1 1 1 0 0 1 1 1 1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1 2. 0 0 1 1 0 1 0 0 1 0 0 0 0 1 1 0 0 0 1 0 1 1 0 0 0 0 0 1 0 0 0 1 0 3. 1 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1 4. 1 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1 5. 0 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 1 0 0 1 0 6. 1 1 1 0 0 1 1 1 1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1 7. 0 0 0 1 1 1 1 0 0 1 0 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1 8. 0 0 0 1 1 1 1 0 0 1 0 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1 9. 0 1 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 0 10. 1 0 0 1 0 0 1 1 0 0 1 1 1 0 1 1 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 0 1

Cruce: por cada individuo se genera un nmero aleatorio en [0, 1], si el resultado es menor que 0.25 (probabilidad de cruce) el individuo es elegido para ser cruzado. Si se obtiene un nmero impar de padres se repite la eleccin. Por este mtodo fueron elegidas para ser cruzadas las parejas 3 y 7, 8 y 10. El mecanismo de cruce se ilustra en la figura 20.

Figura 20

Se determina de manera aleatoria un punto de corte y a partir de l las cadenas padres intercambian sus bits para obtener las cadenas hijos. Los hijos reemplazan a los padres en la poblacin. En este caso se seleccionaron los puntos de corte 5 y 11. Poblacin luego del cruce de 3 con 7 (punto de corte 5) y 8 con 10 (punto de corte 11). 1. 2. 3. 4. 5. 6. 7. 111001111010100001001001110100011 001101001000011000101100000100010 100000100101110111100010110100101 100000111000110110011100111000011 000001101011101111000000110010010 111001111010100001001001110100011 000111111000110110011100111000011 41

8. 0 0 0 1 1 1 1 0 0 1 0 1 1 0 1 1 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 0 1 9. 0 1 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 0 10. 1 0 0 1 0 0 1 1 0 0 1 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1

Mutacin: por cada gen (bit) se genera un nmero aleatorio, si resulta inferior a 0.01 (probabilidad de mutacin) el gen muta. El mecanismo de mutacin se ilustra en la figura 21

Figura 19
y consiste simplemente en trocar el bit elegido de 0 a 1 o viceversa (puede hacerse simplemente aplicando la frmula gen_nuevo = 1-gen_original). En este caso fue elegido para mutar el gen 6 del cromosoma (individuo) 2. Poblacin luego de la mutacin 1. 1 1 1 0 0 1 1 1 1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1 2. 0 0 1 1 0 0 0 0 1 0 0 0 0 1 1 0 0 0 1 0 1 1 0 0 0 0 0 1 0 0 0 1 0 3. 1 0 0 0 0 0 1 0 0 1 0 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1 4. 1 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1 5. 0 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 1 0 0 1 0 6. 1 1 1 0 0 1 1 1 1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1 7. 0 0 0 1 1 1 1 1 1 0 0 0 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1 8. 0 0 0 1 1 1 1 0 0 1 0 1 1 0 1 1 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 0 1 9. 0 1 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 0 10. 1 0 0 1 0 0 1 1 0 0 1 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1 Con la obtencin de esta nueva generacin termina una iteracin del algoritmo. Los nuevos valores (convertidos al intervalo de definicin) y sus respectivas imgenes por la funcin objetivo son: 1. f(10.6648 , 4.36109 )= 28.0581 2. f(-0.137743 , 5.27078 )= 16.5494 3. f(4.68953 , 5.02526 )= 29.755 4. f(4.7602 , 4.8674 )= 16.569 5. f(-2.60279 , 4.12111 )= 28.0005 6. f(10.6642 , 4.36108 )= 28.0984 7. f(-1.13902 , 4.86738 )= 18.3006 8. f(-1.20905 , 4.95594 )= 20.2886 9. f(0.803744 , 4.84019 )= 23.7965 10. f(5.68524 , 5.02522 )= 30.6572 Se ha ejecutado el algoritmo 3 veces y en cada una de ellas se han realizado 1000 generaciones (iteraciones), el resultado se muestra en la tabla 5

42

x 11.6302 11.629 11.6273

y 5.7246 5.52438 5.72797

Obtenido en f(x, y) la iteracin 38.8278 381 38.6348 426 38.7508 490

se ve que el punto ptimo se localiza alrededor de (11.6, 5.7) empleando este punto para iniciar el mtodo de Newton se obtiene que el algoritmo converge al punto (11.62554470, 1.425177726) el cual est fuera del dominio. Sin embargo, empleando el punto inicial (11.6, 5.72) el algoritmo converge a (11.62554470, 5.725044244) y se tiene que f (11.62554470, 5.725044244) = 38.85029448. Este hecho parece explicar cual es la razn por la cual, a pesar de que la grfica revela la existencia de una gran cantidad de ptimos, el mtodo de Newton converge a puntos por fuera del dominio, y esta es que el valor inicial debe estar muy cerca del ptimo. Hemos encontrado as el mximo global combinando el algoritmo gentico con la teora clsica. Las probabilidades de cruce y mutacin no son restrictivas, al resolver un problema en particular puede ejecutarse varias veces el algoritmo, variando estos parmetros y observando los resultados.

Caractersticas de los algoritmos genticos


1. 2. 3. 4. Son independientes del problema particular que se est resolviendo. El proceso de mutacin evita que caigan en mnimos locales. Son de fcil programacin. Solo pueden emplearse cuando la optimizacin se restringe a un rea concreta.

43

Conclusiones
Durante el desarrollo del trabajo fue surgiendo, de manera natural, la necesidad de emplear hojas de clculo, paquetes matemticos y lenguajes de programacin, para lograr aplicar la teora desarrollada. Este hecho permite concluir que la PNL est compuesta, fundamentalmente, de dos elementos complementarios: el anlisis matemtico y la implementacin de algoritmos en herramientas informticas. La carencia de uno de estos elementos, as este acompaada de una abundante dosis del otro, tendr como consecuencia el fracaso de todo intento de lograr resultados fructferos. Otro elemento a tener en cuenta es el hecho de que los textos de clculo, y los cursos que con base en ellos se dictan, en un afn pedaggico, emplean problemas artificiales, esto es, problemas que no presentan dificultad alguna en el momento de aplicar la teora para resolverlos. En el desarrollo del trabajo se ha hecho evidente que tales problemas artificiales son la excepcin, y no la regla, en las aplicaciones reales. Este punto es fundamental, pues el enfoque pedaggico encierra un peligro soterrado: que quien aprende con l adquiere la certeza de estar dotado con las herramientas suficientes para enfrentar cualquier tipo de problema. Esta certidumbre lo aleja de ver la necesidad de, en el momento dado, completar por si mismo la teora para adaptarla a una situacin en particular o en otras palabras, lo aleja de considerar la posibilidad de convertirse en investigador. Karl Popper en alguna ocasin afirm que: Los grandes progresos solo tienen lugar cuando confluyen las disciplinas esta afirmacin motiva llamar la atencin sobre otra gran carencia de la literatura sobre PNL: a diferencia de la forma como es tratada la PL en la cual se muestran situaciones que al ser modeladas conducen a problemas lineales, los textos de PNL se limitan, en la mayora de los casos, a proponer la optimizacin de una funcin objetivo en presencia de algunas restricciones sin previamente mostrar la realidad cuya modelacin condujo a ese planteamiento. Algunos mtodos, como el del gradiente y el de Newton, necesitan comenzar a partir de un punto inicial. Un conocimiento mas general sobre la realidad modelada permitira poder inferir la regin en la cual debe ubicarse dicho punto inicial as como sacar conclusiones una vez obtenida la solucin matemtica. Resumiendo: la PNL es un rea fascinante, en la cual hay mucho por hacer. Los requisitos para trabajar de manera exitosa en ella incluyen: conocimientos no superficiales de anlisis matemtico y de algoritmia; dominio de herramientas informticas; adems del conocimiento del rea en la cual surgen los problemas de optimizacin.

44

Bibliografa

1. [All88] Allen W, Anlisis Numrico, Naucalpan de Jurez, Edo. de Mjico: Prentice Hall (1988). 2. [Apo77] Apostol Tom, Anlisis matemtico, Barcelona Espaa: Revert (1977).

3. [Apo86] Apostol Tom, Calculus, Barcelona Espaa: Revert (1986). 4. [Arm85]Armitano Orlando, Programacin no lineal, Mjico, D.F.: Limusa (1985). 5. [Bur98] Burden Richard, Anlisis Numrico, Mjico, D.F.: Thomsom (1998). 6. [Pra00] Prawda Juan, Mtodos y modelos de Investigacin de Operaciones, Mjico, D.F.: Limusa (2000). 7. [Tah95] Taha Hamdy, Investigacin de Operaciones, Mjico, D.F.: Alfaomega (1995).

45

You might also like