CAPÍTULO 12 Aplicaciones en la ingeniería: ecuaciones algebraicas lineales
El propósito de este capítulo es usar los procedimientos numéricos analizados en los capítulos 9,10 y 11 para resolver sistemas de ecuaciones algebraicas lineales, en algunas aplicaciones de la ingeniería. Estas técnicas numéricas sistemáticas tienen significado práctico, ya que los ingenieros se enfrentan con mucha frecuencia a problemas que involucran sistemas de ecuaciones que son demasiado grandes para resolverse a mano. Los algoritmos numéricos en estas aplicaciones son de particular conveniencia para implementarse en computadoras personales. En la sección 12.1 se muestra cómo un balance de masa se puede emplear para modelar un sistema de reactores. En la sección 12.2 se le da especial énfasis al uso de la matriz inversa para determinar las interacciones complejas causa-efecto entre las fuerzas en los miembros de una estructura. La sección 12.3 es un ejemplo del uso de las leyes de Kirchhoff para calcular las corrientes y voltajes en un circuito con resistores. Por último, la sección 12.4 es una ilustración de cómo se puede emplear las ecuaciones lineales para determinar la configuración del estado uniforme de un sistema masa-resorte.

12.1

A N Á L I S I S E N E S T A D O ESTABLE DE U N S I S T E M A DE REACTORES (INGENIERÍA QUÍMICA/PETROLERA) Antecedentes. Uno de los más importantes principios de organización en la ingeniería química es la conservación de la masa (recuerde la tabla 1.1). En términos cuantitativos, el principio se expresa como un balance de masa que toma en cuenta todas las fuentes y depósitos de un fluido que entra y sale de un volumen (véase figura 12.1). Sobre un periodo finito, esto se puede expresar como Acumulación = entradas — salidas (12.1)

El balance de masa representa un ejercicio contable para la sustancia particular que habrá de modelarse. Para el tiempo en que se realiza el cálculo, si las entradas son mayores que las salidas, la masa de la sustancia dentro del volumen aumenta. Si las salidas son mayores que las entradas, la masa disminuye. Si las entradas son iguales a las salidas, la acumulación es cero y la masa permanece constante. Para esta condición estable, o en estado uniforme, la ecuación (12.1) se puede expresar como
ünlriidiiN « SIILIDIM (12.2)

330

APLICACIONES EN LA INGENIERÍA: ECUACIONES,ALGEBRAICAS LINEALES

Entrada

Salida

FIGURA

12.1

Una representación esquemática del balance de masa.

Empleo de la conservación de la masa para determinar concentraciones en estado estable de un sistema de reactores acoplados. Solución. Se puede usar el balance de masa para resolver problemas de la ingeniería al expresar las entradas y salidas en términos de variables y parámetros medibles. Por ejemplo, si se realiza un balance de masa para una sustancia conservativa (es decir, una que no aumenta o disminuye debido a las transformaciones químicas) en un reactor (véase figura 12.2), podríamos cuantificar la razón con la cual el flujo másico entra al reactor a través de dos tuberías de entrada, saliendo de éste a través de una tubería de salida. Se puede hacer esto al tomar el producto del caudal Q (en metros cúbicos por minuto) y la concentración c (en miligramos por metro cúbico) para cada tubería. Por ejemplo, para la tubería 1 en la figura 12.2, Q = 2 m /min y c — 25 mg/m ; por tanto, la razón con la cual fluye la masa hacia el reactor a través de la tubería 1 es Q c = (2 m /min)(25 mg/ m ) = 50 mg/min. Así, 50 mg de sustancias químicas fluyen cada minuto hacia el reactor a través de esta tubería. De forma similar, para la tubería 2 la razón de masa que entra se calcula como Q c = (1.5 m /min)(10 mg/m ) = 15 mg/min. Observe que la concentración a la salida del reactor a través de la tubería 3 no se especifica en la figura 12.2. Esto es porque ya se tiene suficiente información para calcularla con base en la conservación de la masa. Como el reactor se halla en estado uniforme, se aplica la ecuación (12.2) y las entradas se encuentran en balance con las salidas, como en
3 3 x x 3 l l 3 3 3 2 2

Sustituyendo los valores dados en esta ecuación se obtiene 5 0 + 15 = 3.5c
3

Q\c\ + Q2C2 = Q3C3
3 3

la cual se resuelve para c = 18.6 mg/m . De esta forma, hemos determinado la concentración en la tercera tubería. Sin embargo, el cálculo obtiene algo adicional. Como el reactor está bien mezclado (como lo representa el agitador en la figura 12.2), la concón Ilación será uniforme, u homogénea, en todo el tanque. Asimismo, la concentración 011 ln

tupiarla 3 Haría aer iiiénlitm 1 1 la (««nnentruci An en. tntin el reactor. Rn r.nnaaeuanala al

12.1

ANÁLISIS EN ESTADO ESTABLE DE U N SISTEMA DE REACTORES

991

FIGURA 12.2
I lu UKIC I DI en oslado i '.'.lulilo, completamente MUi/i Jado, con dos tuberías do unliada y una de salida. Ii >;, llujos volumétricos están i ni metros cúbicos por minuto, y las I I mconlraciones están en

«2m m /n l c , =2 5m g m / y
3 3

Q -1 5 . m m /n i c=1 0m g m /
3 2 3 2

0 =3 5 . m m /n i c=?
3 3 3

iu b i c o .

tuilijjiamos por metro

Oi5 =

3

0 «=2 Q ¿ , =2 Q = 1
4 2


c

01

=5 =1 0

°1

Q=3
2 1 2

c

2

c

4

0 4 4 = 1 1

Q ,=1
FIGURA 12.3
' Un o reactores conectados i ii ii luberías.

3 1=1 Q=8 Q CQ = 2 0
3 0
3

balance de masa nos ha permitido calcular ambas: la concentración en el reactor y el caudal en el tubo de salida. Tal información es de gran utilidad para los ingenieros químicos y petroleros, quienes deben diseñar reactores que tengan mezclas de una concentración específica. Debido a que se usa álgebra simple para determinar la concentración para un solo reactor en la figura 12.2, esto podría no ser fácil de representar en una computadora para el cálculo de un balance de masa. En la figura 12.3 se muestra la disposición de un problema donde las computadoras no sólo son útiles, sino también prácticas. Debido a que hay cinco reactores interconectados o acoplados, se necesitan cinco ecuaciones de balance de masa para caracterizar el sistema. Para el reactor 1, la razón de flujo de masa que entra es
Sí 10) 4-

Q\\c\

APLICACIONES ENJLA INGENIERÍA: E C U A C I O N E S ALGEBRAICAS LINEALES

y la razón de flujo de masa de salida es

Ya que el sistema se halla en estado uniforme, los flujos de entrada y salida deben ser iguales: 5(10) + Q3lC3 = Gl2Cl + Gl5Cl o, sustituyendo valores para el flujo, de la figura 12.3 6ci — c = 50
3

Ecuaciones similares se definen para los otros reactores: - 3 c i + 3c = 0
2

-c

2

+ 9 c = 160
3

-c

2

- 8c + l l c - 2c = 0
3 4 5 2 5

-3ci - c + 4c = 0 Se puede usar un método numérico para resolver estas cinco ecuaciones para las cinco incógnitas que son las concentraciones: { C } = L11.51
r

11.51

19.06

17.00

11.51J

Además, se puede calcular la matriz inversa como 0.16981 0.16981 0.01887 0.06003 0.16981 0.00629 0.33962* 0.03774 0.07461 0.08962 0.01887 0.01887 0.11321 0.08748 0.01887 0 0 0 0.09091 0 0 0 0 0.04545 0.25000

Cada uno de los elementos a y significa el cambio en la concentración del reactor i debido a un cambio unitario en la carga del reactor j . De esta forma, los ceros en la columna 4 indican que una carga en el reactor 4 no tendrá impacto sobre los reactores 1, 2, 3 y 5. Esto es consistente con la configuración del sistema (véase figura 12.3), la cual indica que el flujo de salida del reactor 4 no alimenta ningún otro reactor. En contraste, la.s cargas de cualquier otro de los tres reactores afectarán al sistema completo como es indicado por la ausencia de ceros en las primeras tres columnas. Tal información es de gran utilidad para los ingenieros que diseñan y manejan sistemas como ése.

12.2

A N Á L I S I S DE U N A E S T R U C T U R A ESTÁTICAMENTE DETERMINADA (INGENIERÍA CIVIL/AMBIENTAL)
Antecedentes.

Un problema importante en la ingeniería estructural es determinar IIIN fuerzas y reacciones asociadas con una estructura estáticamente determinada, lin la l'i gura 12.4 se muestra un ejemplo de tal estructura.

12.2

ANÁLISIS DE U N A ESTRUCTURA ESTÁTICAMENTE

DETERMINADA

333

PIOURA 1 2 . 5 I iii ii |M iiiius de fuerza de i utíipii libio para los nodos
fin I un I (1,'ili'uctura

~2,v

30° 3

F

3,h

«Mr'illi nmnnte determinada.

Las fuerzas (F) representan, ya sea la tensión o la compresión de los elementos de la estructura. Las reacciones externas (H , V y V ) son fuerzas que caracterizan cómo interactúa la estructura con la superficie de soporte. El apoyo en el nodo 2 puede transmitir ambas fuerzas, horizontal y vertical a la superficie, mientras que el rodillo en el nodo 3 transmite sólo fuerzas verticales. Se observa que el efecto de la carga externa de 1 000 Ib se distribuye a lo largo de varios elementos de la estructura.
2 2 3

Solución. El tipo de estructura se puede describir como un sistema de dos ecuaciones algebraicas lineales. Los diagramas de cuerpo libre se muestran para cada nodo en la figura 12.5. La suma de las fuerzas en ambas direcciones, vertical y horizontal, deben ser cero en cada nodo, ya que el sistema está en reposo. Por tanto, para el nodo 1, EF„ = 0 = - f , eos 30° + F eos 60° + F ,
3 h

(12.3)

ZF

y = 0 sen 30° -

F\

sen 60° +

F

(12.4)

x

334

APLICACIONES E N LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

para el nodo 2, JF =
H

0 = F +F eos 30° + F
2 { 2>

2h

+ r H
2

2

(12.5) (12.6)

IF

K

= 0 = F , sen 30° + F „ + V

para el nodo 3, ZF =0=
H

-F
3

2

-F

3

eos 60° + F
3

3h

(12.7) (12.8)

IF

V

= 0 = F sen 60° + F „ + V
ih

3

d o n d e F es la fuerza horizontal externa que se aplica sobre el nodo i (donde la fuerza es positiva de izquierda a derecha) y F es la fuerza vertical externa que se aplica sobre el nodo / (donde la fuerza es positiva hacia arriba). Así, en este problema, la fuerza de 1 000 Ib hacia abajo en el nodo 1 corresponde a F¡ = — 1 000 libras. Para este caso, todas las otras F¡ y F¡ son cero. Observe que las direcciones de las fuerzas internas y las reacciones son desconocidas. La aplicación apropiada de las leyes de Newton requiere sólo de suposiciones consistentes con respecto a la dirección. Las soluciones son negativas si las direcciones se asumen de manera incorrecta. También observe que en este problema, las fuerzas en todos los elementos supuestamente están en tensión y actúan jalando los nodos adyacentes. Una solución negativa, por tanto, corresponde a compresión. Este problema se puede escribir como el siguiente sistema de seis ecuaciones con seis incógnitas:
iv v h

2 3 se requiere de pivoteo parcial Advierta que, como se formuló en la ecuación (12.9), para evitar la división entre cero de los elementos de la diagonal. Con el uso de una estrategia para el pivote, el sistema se puede resolver mediante cualquiera de las técnicas de eliminación que se analizaron en los capítulos 9 y 10. Sin embargo, como este problema es un caso ideal de estudio, para demostrar la utilidad de la matriz inversa se puede usar la descomposición LUpara calcular

0.866 0.5 -0.866 -0.5 0 0

-0.5 0.866 0 0 0.5 -0.866

0 0 -1 0 0 0

0 0 0 -1 0 0

í F}
Fi
2

F H

3

2

iv v

J

0 -1000 0 0 0 0

(12.9)

F\ = - 5 0 0 H =0
2

F = 433
2

F V

3

-866 750

V = 250
2

3

y la matriz inversa es 0.866 0.25 -0.5 -1 -0.433 0.433 0.5 -0.433 0.866 0 -0.25 -0.75 0 0 0 -1 0 0 0 0 0 0 -1 0 J O 1 0 -1 0 0

[A]"

1

=

0 0 0 0 -1

Ahora, observe que los vectores del lado derecho representan las fuerzas externas horizontal y vertical que se aplican sobre cada nodo, como en {F}
r

=

(/i,*

F,,„

F,

2 h

F,

2 v

F ,„
3

F ,J
3 t

(12.10)

Debido a que las fuerzas externas no tienen efecto sobre la descomposición L U, no se necesita implementar el método una y otra vez para estudiar el efecto de diferentes fuerzas externas sobre la estructura. Más que esto, todo lo que se ha hecho es ejecutar los pasos de sustitución hacia adelante y hacia atrás para cada vector del lado derecho con el fin de obtener de manera eficiente soluciones alternas. Por ejemplo, podríamos querer estudiar el efecto de fuerzas horizontales que se inducen por un viento que sopla de izquierda a derecha. Si la fuerza del viento se puede idealizar como dos fuerzas puntuales de 1 000 libras sobre los nodos 1 y 2 (véase figura 12.6a), el vector del lado derecho es {F}
T

= L-1000

0

1000

0

0

0J

el cual se puede usar para calcular Fi = - 8 6 6 H = -2000
2

F = 250
2

F = -500
3

V = -433
2

V = 433
3 lh 3 h

Para un viento de la derecha (véase figura 12.66), F = — 1 000, F todas las demás fuerzas externas son cero, con esto, resulta que Fj = - 8 6 6 H = 2000
2

= — 1 000, y

F = -1250
2

F = 500
3

V = 433
2

V = -433
3

Los resultados indican que los vientos tienen efectos muy notorios sobre la estructura. Ambos casos se muestran en la figura 12.6.

FIGURA 12.6 I >I>N rusos de prueba mostrando o) vientos desde la izquierda y

b) vientos desde la derecha.

336

APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

Los elementos individuales de la matriz inversa tienen también utilidad directa en aclarar las interacciones estímulo-respuesta para la estructura. Cada elemento representa el cambio de una de las variables desconocidas a un cambio unitario de uno de los estímulos externos. Por ejemplo, el elemento a \ indica que la tercera incógnita (F ) cambiará a 0.866 debido a un cambio unitario del segundo estímulo externo (F, „). De esta forma, si la carga vertical en el primer nodo fuera aumentada en 1, F se podría aumentar en 0.866. El hecho de que los elementos sean 0 indica que ciertas incógnitas no son afectadas por algunos estímulos externos. Por ejemplo a\\ = 0 significa que F , no es afectado por los cambios en F . Esta habilidad de aislar interacciones tiene un número de aplicaciones en la ingeniería; éstas incluyen la identificación de aquellos componentes que son muy sensibles a estímulos externos y, como una consecuencia, la mayoría tiende a fallar. Además, se puede usar para determinar los componentes que son innecesarios (véase el problema 12.16). El procedimiento anterior resulta particularmente útil cuando se aplica a grandes estructuras complejas. En la práctica de la ingeniería, puede ser necesario resolver estructuras con cientos y aun miles de elementos estructurales. Las ecuaciones lineales proveen un enfoque poderoso para ganar cierta comprensión del comportamiento de estas estructuras.
3 3 3 2h

12.3

C O R R I E N T E S Y V O L T A J E S E N C I R C U I T O S DE R E S I S T O R E S ( I N G E N I E R Í A ELÉCTRICA) Antecedentes. Un problema común dentro de la ingeniería eléctrica involucra la determinación de corrientes y voltajes en varios puntos en circuitos de resistores. Estos problemas se resuelven usando las leyes para corrientes y voltajes de Kirchhoff. La regla para la corriente (o nodo) establece que la suma algebraica de todas las corrientes que entran a un nodo debe ser cero (véase figura 12.7a), o E/ = 0 (12.11)

FIGURA 12.7 Representaciones esquemáticas de o) regla de las corrientes de Kirchhoff y b) ley de Ohm.
'3

donde todas las corrientes que entran al nodo se consideran de signo positivo. La regla de la corriente es una aplicación del principio de la conservación de la carga (recuerde la tabla 1.1). La regla para el voltaje (o malla) especifica que la suma algebraica de las diferencias de potencial (es decir, cambios en el voltaje) en cualquier ciclo debe ser igual a cero. Para un circuito de resistores, esto se expresa como E § - Ei7? = 0 (12.12)

donde ¿j es la fem (fuerza electromotriz) de las fuentes de voltaje, y i? es la resistencia de cualquier resistor en la malla. Observe que el segundo término se deriva de la ley de Ohm (véase figura 12.76), la cual establece que la caída de voltaje a través de un resistor ideal es igual al producto de la corriente y la resistencia. La ley de Kirchhoff para el voltaje es una expresión de la conservación de la energía. Solución. La aplicación de estas reglas resulta en un sistema de ecuaciones algebraicas lineales, ya que son varios los ciclos o mallas que forman un circuito. Por ejemplo,

f ? »1 0 1 1
FIGURA 12.8 1 ln circuito de resistores que liuhiá de ser resuelto usando ecuaciones akjubraicas lineales simultáneas.

~OV-\= 2 0 0V

1

ñ = 5 a : — v W — ñ = 1 5 Q

• ñ =i o n
ñ = 20í2

OV é s=0V

considere el circuito mostrado en la figura 12.8. Las corrientes asociadas con este circuito son desconocidas tanto en magnitud como en dirección. Esto no presenta gran dificultad, ya que simplemente se supone una dirección para cada corriente. Si la solución resultante a partir de las leyes de Kirchhoff es negativa, entonces la dirección supuesta fue incorrecta. Por ejemplo, en la figura 12.9 se muestran las direcciones supuestas de las corrientes. Dadas estas suposiciones, la regla de la corriente de Kirchhoff se aplica a cada nodo para obtener
í 12 + ' 5 2 + ( 3 2 — '65
-

'52 — '54 = '32 =

¡43 -

i

54 — ' 4 3 —

0 0

0 0

La aplicación de la regla del voltaje en cada una de las mallas da
—'54-^54

'43*43

'32*32 + '52*52 =

-«65*65 "

'52*52 +

¿ 1 2 * 1 2 "2 0 0=0
+

0

o, si se sustituyen las resistencias de la figura 12.8 y se pasan las constantes al lado derecho,

1 5 / 5 4 5 Í 4 36 5

= 0 2 0 /-I O 5 /2 + 5 1 /2 = 2 0 0
1 0 ¿ 3 2 1 0 / 5 2

Portante, el problema se reduce a la resolución del siguiente conjunto de seis ecuaciones con seis corrientes como incógnitas:

FIGURA 12.9 (Corrientes supuestas.

338

APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES I I I

0 0 0 0 5

•-1 0 ü 10 -10

0 -1 0 -10 0

0 1 0 0 0 20

0 -1 0 1 -15 0

0 0 1 -1 -5 0

'52 '32
'65

'54 '43

0 0 0 0 0 200

Aunque no es práctico resolverlo a mano, este sistema se maneja de manera fácil mediante un método de eliminación. Si se procede de esta forma, la solución es ¿12 = 6.1538 /
65

¿52 = -4.6154 i
5 4

z ¡

32

= - 1 . 5 3 85 =-1.5385

=-6.1538

= -1.5385

4 3

Así, con una adecuada interpretación de signos en el resultado, las corrientes y voltajes en el circuito se muestran en la figura 12.10. Deberían ser evidentes las ventajas de usar algoritmos numéricos y computadoras para problemas de este tipo. 12.4 SISTEMAS MASA-RESORTE (INGENIERÍA MECÁNICA/AEROESPACIAL) Antecedentes. Los sistemas idealizados resorte-masa desempeñan un papel importante en la mecánica y otros problemas de la ingeniería. En la figura 12.11 se muestra un sistema de ese tipo. Después de liberar las masas, éstas son jaladas hacia abajo debido a la fuerza de la gravedad. Observe que el desplazamiento resultante en cada resorte de la figura 12.1 Ib, se mide a lo largo de las coordenadas con referencia a su posición inicial dada en la figura 12.1 la. Como se introdujo en el capítulo 1, la segunda ley de Newton se puede emplear en conjunto con un equilibrio de fuerzas para desarrollar un modelo matemático del sistema. Para cada masa, la segunda ley se puede expresar como
m—r

dx
2

dt

2

=

r

D

(12.13)

Para simplificar el análisis se supondrá que todos los resortes son idénticos y que se comportan de acuerdo con la ley de Hooke. En la figura 12.12a se muestra un diagrama de cuerpo libre para la primera masa. La fuerza hacia arriba es únicamente una expresión directa de la ley de Hooke:
Fn

=

kx\

(12.14)

FIGURA 12.10 la solución obtenida para h s con ionios y voltajes iiftundo un método de
(LILLTLILKK'IÚLL.

V= 153.85
- M A -

ÍZ = 169.23
M A A -

- O V=200

<|

( / = 1.5385

/= 6.1538

V - 1 4 6 . 1 5

V- 123.08

^

O

IZ= 0

"11

1

m

2

1 1
b)

x

2

O
*3

a)

FIGURA 12.11 Un sistema compuesto de tres masas suspendidas verticalmente por una serie de resortes. a) Ei sistema antes de liberarse; es decir, antes de la extensión o compresión de los resortes. b) El sistema después de liberarse. Advierta que las posiciones de las masas están referenciadas a las coordenadas locales con orígenes en su posición antes de soltarse.

k{x -x )
2 :

L m
a)

«1

M*2-*l)

K*Z-Xl)

I
z y

L _L
z

M*3~*2)

m^g k{x -x )

mg
z

k[x -x )
z

mg
3

b)

c)

FIGURA 12.12 Diagramas de cuerpo libre para las tres masas de la figura 1 2 . 1

Las componentes hacia abajo consisten en dos fuerzas sobre el resorte junto con la acción de la gravedad sobre la masa,

Fi,~k(X2-xi)+k(x -xi) + mig
2
(MiNcrve cómo la componente fuerza en los dos resortes es proporcional al desplazamicnlo do In N E G U N D N musa, .v , apropiado para el desplazamiento de la primera masa, x,.
3

340

APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

Las ecuaciones (12.14) y (12.15) se pueden sustituir en la ecuación (12.13) para dar d x\ m —^-=2k(x -xi)-{-m g-kx dt
2 ] ¿ 2 l

l

(12.10)

De esta forma, se ha obtenido una ecuación diferencial de segundo orden para describir el desplazamiento de la primera masa con respecto al tiempo. Sin embargo, advierta que la solución no se puede obtener, ya que el modelo incluye una segunda variable dependiente, x . En consecuencia, se debe desarrollar diagramas de cuerpo libre para la segunda y tercera masas (véase figuras Yl.Ylb y c) que se pueden emplear para obtener
2

m2

dx
2

2

dt

2

= k(x

3

- x ) + m g - 2k(x
2 2

2

- x)
x

(-)
12 1?

y
W3

^7?

= m g - k(x, - x )
3 2

(

1

2

1

8

)

Las ecuaciones (12.16), (12.17) y (12.18) forman un sistema de tres ecuaciones diferenciales con tres incógnitas. Con las condiciones iniciales apropiadas, éstas se pueden usar para calcular los desplazamientos de las masas como una función del tiempo (es decir, sus oscilaciones). Analizaremos en la parte siete los métodos numéricos para obtener esas soluciones. Por ahora, podemos obtener los desplazamientos que ocurren cuando el sistema eventualmente llega al reposo; es decir, en estado estable. Esto se realiza mediante la igualación a cero de las derivadas en las ecuaciones (12.16), (12.17) y (12.18), para dar 3kxi —2kx\ — + — 2kx kx
2

= — + kx3 kxi = —

ni\g mg
2

3kx
2

2

mjg

o, en forma matricial, [K]{X} = [W}

donde [K], es llamada matriz de rigidez, y es 3k -2k -2k 3k -k
s

[K]

-k k

Y {^0 y {^} respectiva.

s o n

l ° vectores columna de las incógnitas X y de los pesos mg, en forma

Solución. En este punto se puede emplear métodos numéricos para obtener una solución. Si nt\ = 2 kg, m — 3 kg, m — 2.5 kg, y las k — lü kg /s ; use lu descomposición . i „ j . . « i „ „ , u n t a i v uenerar la inven» de [K],
2 2 i B

' • 'TWWBSBITWB

Sustituyendo los parámetros del m o d e l o se obtiene

\K\
3

30 -20

-20 30 -10

-10 10

{W} =
19.6 29.4 24.5
x 2

La descomposición LU se puede emplear con el fin de resolver para x = 7.35, x = 10.045 y x = 12.495. Estos desplazamientos se usaron para construir la figura 12.1 Ib. La inversa de la matriz de rigidez se calcula como 0.1 0.1 0.1 0.1 0.15 0.15 0.1 0.15 0.25

[K] =

Cada elemento de la matriz kj¡ nos indica el desplazamiento de la masa i debido a una fuerza unitaria impuesta sobre la masa j . Así, los valores de 0.1 en la columna 1 nos indica que una carga unitaria hacia abajo en la primera masa desplazará todas las masas 0.1 m hacia abajo. Los otros elementos se pueden interpretar en una forma similar. Por tanto, la inversa de la matriz de rigidez provee un resumen fundamental de cómo los componentes del sistema responden a fuerzas que se aplican de forma externa. PROBLEMAS
INUIMILERIA QUÍMICA/PETROLERA

12.1 Realice los mismos cálculos que en la sección 12.1, pero mnihic c,|| a 20 y c a 6. 11.2 Si Iti entrada al reactor 1 en la sección 12.1 se disminuye en un 2.1%, ¿cuál es el porcentaje de cambio en la concentración de lim roiielorcs 2 y 3? 12. 1 Debido a que el sistema mostrado en la figura 12.3 se halla en M L I I D O estable, ¿qué se puede inferir con respecto a los cuatro
03

<2OI=5

g

3

I = 2

225 254 224

= =

3 2

2 2 3 2 3 4

:

Gis = 3 2L2 = 4

2 5 5

2 0 3 =

=4 10

=0

HHI«»:YOI.GO3.fi«YFIJS?

12 .4 Vuelva a calcular las concentraciones para los cinco reactol M (|iie se muestran en la figura 12.2, si los flujos se han cambiado n:

12.5 Resuelva el mismo sistema como lo especifica el problema 12.4, pero tome Q y Q¡ igual a cero. Use la conservación del flujo para recalcular los valores para los otros flujos. ¿Qué le indica la respuesta con respecto al sistema físico? 12.6 En la figura P12.6 se muestra tres reactores unidos por tuberías. Como se indica, la razón de transferencia de químicos a través de cada tubería es igual al flujo volumétrico (Q, con unil2 4

R I O U R A

P12.6

LLON incK LOIOS C O N E C T A D O S

400 mg/s

0, C,
3

jiul

INLIOILÍJS. L A R A Z Ó N D E A

IFWMLBINNR.LA D E M A S A LLÚVÉ» D T I C A D A

TUBERÍA E S Q

I QIHI I TIL P R O D U C T O D E L FLUJO y Iti T»(TU ( M I R A C I Ó N c D E L

Q ¡^
2

tr [jj200mg/s
Q =120 0 , 3 = 40 Q ,2 = 80 0 = 60 Q , = 20
33 2 3 2

T W I R L M (JOL i UUL SO O R I G I N A EL LLU|u

t

342

APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

iludes ilc metros cúbicos por segundo) multiplicado por la concentración del reactor donde se origina el flujo (c, con unidades do miligramos por metro cúbico). Si el sistema se halla en un eslaclo estable, la transferencia hacia cada reactor equilibrará la transferencia de salida. Desarrolle ecuaciones de balance de masa pura los reactores y resuelva las tres ecuaciones algebraicas lineales simultáneas para sus concentraciones. 1 2 . 7 Emplee el mismo planteamiento básico que en la sección 1 2 . 1 , para determinar la concentración de cloro en cada uno de los Grandes Lagos mediante la información mostrada en la figura P12.7.

tiene una fracción en peso X del mismo químico entra desde la derecha a una razón de flujo de F . Así, para la etapa i, se puede representar un balance de masa como
m 2

F,y,_i +

F Xi+i = FiY¡ + F X¡
2 2
(P12.86)

En cada etapa, se supone que se establece un equilibrio entre Y¡ y X , como en
t

K = ~

1 2 . 8 Una etapa en un proceso de extracción se ilustra en la figura P 1 2 . 8 . En estos sistemas, una corriente que contiene una fracción en peso F de un químico entra desde la izquierda a razón do un flujo de masa de F En forma simultánea, un solvente que
en v

donde K es llamada el coeficiente de distribución. La ecuación (P12.86) se puede resolver para X¡ y sustituirla en la ecuación (P12.8a) para obtener

FIGURA P l 2.7 Un balance del cloro para los Grandes Lagos. Las flechas con número son entradas directas.

180

0

S

H

= 67 36 = 161 = 182

Q H

E

QEO 740

Qoo = 2 1 2

QHE°H

3

850

Hurón
7 1 0 QEO°E 4 720

Erie

Qoo°o
Michigan
QMHCM

Ontario

FIGURA P12.8 Un estado del proceso de extracción.

X

M

|

(

x

2

x

3

x

n - 1

PROBLEMAS

1 2 1 .1 Realice el mismo cálculo que en la sección 12.2, pero ahora para la estructura mostrada en la figura P12.11. 1 2 1 .2 Efectúe el mismo cálculo que en la sección 12.2, pero ahora para la estructura mostrada en la figura P12.12. 1 2 1 .3 Calcule las fuerzas y reacciones para la estructura de la figura 1 2 . 4 si se aplica en el nodo 1 una fuerza por debajo de 2 200 kg y una fuerza horizontal hacia la derecha de 1 800 kg. 1 2 1 .4 En el ejemplo para la figura 12.4, donde una fuerza por FIGURA P 1 2 . l l debajo de 1 000 libras se aplica en el nodo 1, las reacciones externas V y V fueron calculadas. Si las longitudes de los miembros de la estructura han sido dadas, se puede calcular V y V utilizando el hecho que V + V debe ser igual a 1 000 y sumando los momentos alrededor del nodo 2. Sin embargo, como no se conoce V y V , se puede trabajar hacia atrás y resolver para las - (l + Y¡ + = 0 longitudes de(P12.8c) los elementos de la estructura. Observe que como i+Í existen tres longitudes desconocidas y sólo dos ecuaciones, se Sí /•', = 400 kg/h, Y = 0.1, F = 800 kg/h, X = 0 y K = 5, determine los valores de 7 y X , si se usa un reactor de 5 puede resolver para únicamente la relación entre las longitudes. etapas. Observe que la ecuación (P12.8c) debe modificarse para Resuelva para esta relación. tomar en cuenta las fracciones peso de entrada cuando se aplica 1 2 1 .5 Emplee los mismos métodos que se usaron en el análisis II las etapas primera y última. de la figura 12.4, determine las fuerzas y reacciones para la estructura que se muestra en la figura P12.15.
600
2 } 2 3 2 3

1 4 8

i

j-K^j
m

(y-K^J Y
en

2

}

2

fuera

fijera

1 2 < . > Un ingeniero civil involucrado en la construcción, requiere •I 800, 5 810 y 5 690 m de arena, de grano fino y grueso, résped ivuinente, para un proyecto de construcción. La composición de estas canteras es
3

I n g e n i e r í ac i v i l / a m b i e n t a l

FIGURA P 12.15

Arena %

Grano fino %
30 50 20

Grano grueso %
18 30 55

vw:
l'n I l'n i

52 20 25

/,('nimios metros cúbicos se debe transportar desde cada cantera ptiiu cumplir con las necesidades del ingeniero? 1 1 . Kl Realice el mismo cálculo que en la sección 12.2, peroahoin cambie el ángulo en el nodo 2 a 40° y en el nodo 3 a 50°, y la llici/ii en el nodo 1 es de 750 libras.

FIGURA P 1 2 . 1 2

4

°0

1

200

i

344

APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

o sustituyendo los parámetros 225c, - 25c = 1400
3

X60° 6 0 ° X

/\

4

5

°

Se puede escribir balances en forma similar para los otros cuartos. a) Resuelva para la concentración, en estado estable, de monóxido de carbono en cada cuarto. b) Determine qué porcentaje de monóxido de carbono en la sección de niños es a causa de i) los fumadores, ii) la parrilla y iii) el aire que entra por ventilación. Ingeniería eléctrica 12.18 Realice el mismo cálculo que en la sección 12.3, pero ahora cambie la resistencia entre los nodos 3 y 4 a 25 Í2 y cambie V a60V 12.19 Lleve a cabo el mismo cálculo que en la sección 12.3, pero ahora para el circuito que se presenta en la figura P12.19. 12.20 Realice el mismo cálculo que en la sección 12.3, pero ahora para el circuito expuesto en la figura P 12.20. 12.21 Resuelva el circuito resistor de la figura 12.8, usando la eliminación de Gauss, si V = 180 V y R = 50 ohms. 12.22 Resuelva el circuito de la figura Pl 2.22 para las corrientes en cada alambre. Use el método de eliminación de Gauss con pivoteo. 12.23 Un ingeniero eléctrico supervisa la producción de tres tipos de componentes eléctricos. Tres clases de materiales (metal, plástico y hule) se requieren para la producción. Las cantidades necesarias para producir cada componente son
H { 56

3500

FIGURA P 12.16

12.16 Resuelva para las fuerzas y reacciones de la estructura de lu figura P12.16. Determine la matriz inversa para el sistema. ¿Parece razonable la fuerza en elemento vertical a la mitad del elemento? ¿Por qué? 12.1 7 Como su nombre implica, la polución de aire entrante tiene que ver con la contaminación encerrada en espacios tales como casas, oficinas, áreas de trabajo, etcétera. Suponga que se diseña un sistema de ventilación para un restaurante como se muestra en la figura P12.17. El área de servicio del restaurante consiste en dos cuartos cuadrados y uno alargado. El cuarto 1 y el 3 tienen fuentes de monóxido de carbono, de los fumadores y una parrilla. Se puede escribir balances de masa en estado estable para cada cuarto. Por ejemplo, para la sección de fumadores (cuarto I), el balance se escribe como 0 = W'fu.nador + (carga) QC
a

fl

-

Q C,
a

+E (C -C¡)
Í3 (mezcla) 3
c

+ (entrada) — (salida) +

FIGURA

P12.17

Vista aérea de los cuartos en un restaurante. Las flechas en un sentido representan los flujos de aire volumétricos, mientras que las flechas en ambos sentidos representan la mezcla difusa. Las cargas debido al humo y la parrilla agregan masa de monóxido de carbono al sistema pero con entrada de aire Insignificante.

Q = 150m3/hri

Q =100m /hrA
d 3

Q = 50 m /hr
b 3

c = 2 mg/m
b

3

(Sección de niños)

^

25 m /hr
3

O, = 200 m /hr
3

- H 1 (Sección de fumar) ~ 25 m /hr
3

c = 2 mg/m
a

3

Carga por fumadores (T 000 mg/h'r)

R-20U

2

v W
ñ=51i 1 " ' 5

fl-10U

1

O V, = 150 volts

ñ = 5 í 2
PIOURA P 1 2 . 1 9

— ^ oe=
v
0.25 0.33 0.42

ñ=25Q

0 volts

M e t a l , P l á s t i c o , H u e l, C o m p o - c / o m p o n e n e t g c / o m p o n e n e t g c / o m p o n e n e t n e n t e g
15 17 19

12.24 Efectúe el mismo cálculo que en la sección 12.4, pero uhoru triplique el valor de las constantes del resorte. 12.25 Realice el mismo cálculo que en la sección 12.4, pero ahora agregue un tercer resorte entre las masas 1 y 2 y duplique k. 12.26 Efectúe el mismo cálculo que en la sección 12.4, pero ahora cambie las masas de 2, 3 y 2.5 kg a 15, 3 y 2 kg. 12.27 Los sistemas idealizados masa-resorte tienen numerosas aplicaciones en toda la ingeniería. La figura P12.27 muestra un arreglo de cuatro resortes en serie cuando se comprimen con una fuerza de 2 000 kg. En el equilibrio, se pueden desarrollar las ecuaciones de equilibrio de fuerzas, definiendo las interrelacioncs entre los resortes;

I n g e n i e r í am e c á n l e n / a e r o e s p i c l a l

k (x (x -x - x¡) = kyxi k ) = k (x -JCI) k (x'4 - x ) — k (x - x )
2 3 2 3 2 2 2
A

Si IIIS cantidades totales son 2.12, 0.0434 y 0.164 kgpara el metal, plástico y hule, respectivamente, y están disponibles cada illa, ¿cuántos componentes se puede producir por día?

F = k4{X4 - x )
3 2

3

3

3
4

2

donde las k son las constantes del resorte. Si de k a ¿ son de 150, 50, 75 y 225 kg/s , respectivamente, calcule las x.
{

PIOURA P 1 2 . 2 0

MOURA P 1 2 . 2 2

20 Q

1 5£ 2 5 Í 2
V, - 1 1 0
V = 40
2

346

APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

x

2

FIGURA P12.27

11.IH Tres bloques cslnn conectados por unit cnerda sin peso y ih'sciinsiiii sobre un plimo inclinado (véase figura IM2.28 <7). Si !<u usa un procodiniicnlo similar al usado en el análisis del paracaidista en caída libre del ejemplo 9.11, se obtiene el siguiente ninjiinlo de ecuaciones simultáneas (los diagramas de cuerpo libre se muestran en la figura P12.28£>): IIKW I 7' 519.72 MW
.'..•i,/

T I A * - 216.55
-

Encuentre la aceleración a y las tensiones 7'y l< en las dos cuerdas. 12.29 Realice un cálculo similar al que se pidió en el problema 12.28, pero ahora para el sistema que se muestra en la figura P 12.29. 12.30 Realice el mismo cálculo que en el problema 12.28, pero ahora para el sistema expuesto en la figura P12.30 (los ángulos son de 45°).

R = 108.27 FIGURA P 1 2 . 3 0

FIGURA P 12.29

E P Í L O G O : PARTE TRES
PT3.4 E L E M E N T O S DE JUICIO La tabla PT3.2 proporciona un resumen de los elementos de juicio involucrados en la resolución de ecuaciones algebraicas lineales simultáneas. Dos métodos (el gráfico y la regla de Cramer) están limitados a pocas ecuaciones (< 3), de modo que tienen poca utilidad para resolver problemas prácticos. Sin embargo, esas técnicas son herramientas didácticas útiles para entender el comportamiento en general de sistemas lineales. Los mismos métodos numéricos están divididos en dos categorías generales: métodos exactos y aproximados. El primero, como su nombre lo implica, intenta dar resulta dos exactos. Sin embargo, como están afectados por errores de redondeo, algunas veces dan resultados imprecisos. La magnitud del error de redondeo varía en cada sistema y depende de varios factores que incluyen las dimensiones del sistema, su condición y si la matriz de coeficientes es dispersa o llena. Además, la precisión de la computadora afectará el error de redondeo. Se recomienda una estrategia de pivoteo para emplearse en cualquier programa de computadora con el fin de implementar métodos de eliminación exactos. La inclusión de esa estrategia minimiza el error de redondeo y evita problemas como el de la división entre cero. Todas las otras cosas permanecen igual, la descomposición LU basada en algoritmos son los métodos más apropiados debido a su eficiencia y flexibilidad.

TABLA PT3.2

Comparación de las características de métodos alternativos para encontrar soluciones a ecuaciones algebraicas lineales simultáneas.
R a n g o de aplicación Limitada Limitada E s f u e r z o de programación

Método Gráfica Regla de Cramer

Estabilidad

Precisión Pobre Afectada por errores de redondeo

Comentarios Puede tomar más tiempí > que el método numério > Excesivo esfuerzo computacional requerid > para más de tres ecuaciones

Eliminación de Gauss (con pivoteo parcial) Descomposición LU

Afectada por errores de redondeo Afectada por errores de redondeo

General General

Moderado Moderado Método de eliminación preferido; permile til cálculo de la matriz

Gauss-Seidel

Puede no converger si no es diagonalmente

Excelente

Apropiada sólo para sistemas diagonalmente

Fácil

dominante

dominante»

m.é

M É T O D O S AVANZADOS Y REFERENCIAS ADICIONALES

34»

Aunque los métodos de eliminación tienen gran utilidad, el uso de toda la matriz do coeficientes puede ser algo limitante cuando se trate con sistemas dispersos muy grandes. Esto se debe a que grandes porciones de la memoria de la computadora podrían ser dedicadas a guardar ceros, lo cual no tiene sentido. Para sistemas bandados, se dispone de técnicas para implementar métodos de eliminación sin tener que guardar todos los coeficientes de la matriz. La técnica aproximada descrita en este libro se conoce como método de GaussSeidel. Difiere de las técnicas exactas en que emplea un esquema iterativo para obtener progresivamente estimaciones más cercanas a la solución. Así, el efecto del error de redondeo es un punto de discusión con el método de Gauss- Seidel, ya que se pueden continuar las iteraciones hasta que se obtenga la precisión deseada. Además, se pueden desarrollar versiones del método de Gauss-Seidel para utilizar de manera eficiente los requerimientos de almacenaje en computadora para sistemas dispersos. En consecuencia, la técnica de Gauss-Seidel es útil para grandes sistemas de ecuaciones, donde los requerimientos de almacenaje podrían llevar a problemas significativos para las técnicas exactas. La desventaja del método de Gauss-Seidel es que no siempre converge, o algunas veces lo hace de manera lenta sobre la solución verdadera. Es muy confiable sólo para aquellos sistemas que son diagonalmente dominantes. Sin embargo, los métodos de relajación de que se dispone algunas veces corrigen estas desventajas. Además, como muchos conjuntos de ecuaciones algebraicas lineales se originan a partir de sistemas físicos y exhiben dominio de la diagonal, el método de Gauss-Seidel tiene gran utilidad para resolver problemas de ingeniería. En resumen, diferentes factores soportarán su elección de una técnica para un problema en particular que involucra ecuaciones algebraicas lineales. Sin embargo, como se mencionó antes, el tamaño y la densidad del sistema son factores particularmente importantes en la determinación de su elección.

PT3.5

RELACIONES IMPORTANTES Y FORMULAS Cada parte de este libro incluye una sección que resume fórmulas importantes. Aunque la parte tres no trata en realidad sólo con fórmulas, usamos la tabla PT3.3 para resumir los algoritmos expuestos. La tabla proporciona una revisión que será de gran ayuda para repasar y aclarar las principales diferencias entre los métodos.

PT3.6

MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES Se puede encontrar referencias generales acerca de la solución de ecuaciones lineales simultáneas enFaddeev y Faddeeva(1963), Stewart (1973), Varga (1962) y Young (1971). Ralston y Rabinowitz (1978) proporcionan un resumen general. Muchas técnicas avanzadas están disponibles para aumentar el ahorro en tiempo y/o espacio de ecuaciones algebraicas lineales. La mayoría de éstas se concentra en propiedades de exploración de ecuaciones como las simétricas y bandadas. En particular, se dispone de algoritmos para operar sobre matrices dispersas al convertirlas a un mínimo formato bandado. Tewerson (1973) y Jacobs (1977) incluyen información sobre esta

350

EPÍLOGO: PARTE TRES

área. Una vez que se encuentran en un formato mínimo bandado, existe una variedad de estrategias de solución eficientes que pueden emplearse, como el procedimiento de guardar en la columna activa de Bathe y Wilson (1976). Además de los conjuntos de ecuaciones n X «, hay otro tipo de sistema donde el número de ecuaciones, m, y el número de incógnitas, n, no son iguales. A los sistemas donde m < n se les conoce como bajodeterminados. En tales casos puede ser que no tenga solución o que tenga más de una. Los sistemas donde m > n son llamados sobredeterminados. Para tales situaciones no hay solución exacta. Sin embargo, a menudo es posible desarrollar una solución convenida que intente determinar soluciones que estén "lo más cerca" de satisfacer todas las ecuaciones de manera simultánea. Un procedimiento común es resolver la ecuación en un sentido de "mínimos cuadrados" (Lawson y Hanson, 1974; Wilkinson y Reinsch, 1971). Alternativamente, se puede usar métodos de programación lineal donde las ecuaciones son resueltas en un sentido "óptimo" al minimizar algunas funciones objetivo (Rabinowitz, 1968; Dantzig, 1963; y Luenberger, 1973). En el capítulo 15 se describe con mayor detalle este procedimiento.

TABLA PT3.3

Resumen de información importante presentada en la parte tres.
Problemas potenciales

Método

Procedimiento

y soluciones

Eliminación de Gauss

a,, a a, I c{ a i a 2 c-23 I 2 °31 °32 °33 ' 3.
12 3 c 2 2 c

Olí

0

1 2

0

1 3

I
1 c
1
c

C]

«22 °23
033

2
3

*3 = 3/°33 => x = |c - a x ) / a
c 2 2 23 3

22
3 3

x, = (c, - a , x ,
2

-oi x )/a,

Problemas: Mal condicionamiento Redondeo División entre cero Soluciones: Alta precisión Pivoteo parcial Problemas: Mal condicionamiento Redondeo División entre cero Soluciones: Alta precisión Pivoteo parcial Problemas: Divergente o converge lentamente Soluciones: Relajación por diagonal dominante

Sustitución Descomposición T Descomposición hacia atrás

"ai 1
.031

°12

LU

°21 °22

13~ °23
a

"

1

0
1
1

0 "
0

=>

u
0

u

u
u
0

]2

u u u

1 3

'21

2 2

2 3

°32

°33.

. '31 '32

.

.0

3 3

Sustitución hacia adelante Método de Gauss-Seidel x', = ( q
7

-o X2
t 2 2 2 1

y! = ( c - a

' -oi^'l/ai,! - G^xf ) / a
1 22

Continúa iterativamente hasta
-1

X3 = ( C 3 - ° 3 1 * 1

-a

3 2

x

2

)/a J
3 3

1

100%<e y. paró todas las x,

s

OPTIMIZACIÓN
PT4.1 MOTIVACIÓN La localización de raíces (parte dos) y la optimización están relacionadas, en el sentido de que ambas involucran valores iniciales y búsqueda de un punto sobre una función. La diferencia fundamental entre los dos tipos de problemas se expone en la figura PT4.1. La localización de raíces involucra la búsqueda de raíces de una función o funciones. En contraste, la optimización involucra la búsqueda del mínimo o el máximo. Lo óptimo es el punto donde la curva es plana. En términos matemáticos, esto corresponde al valor de x donde la derivada f'(x) es igual a cero. Además, la segunda derivada,/"^), indica si el óptimo es un mínimo o un máximo: si f"(x) < 0, el punto es un máximo; si f"(x) > 0, el punto es un mínimo. Si comprendemos ahora la relación entre raíces y óptimo podríamos sugerir una posible estrategia para determinar el último. Esto es, se puede diferenciar la función y localizar la raíz (es decir, el cero) de la nueva función. De hecho, algunos métodos de optimización buscan encontrar un óptimo al resolver la raíz del problema: f'{x) — 0. Debería observarse que tales búsquedas con frecuencia son complicadas porque f'(x) no está disponible analíticamente. Por tanto, a veces se debe usar aproximaciones por diferencia finita para estimar la derivada. Más allá de ver la optimización como un problema de raíces, debería observarse que la tarea de localizar el óptimo está reforzada por alguna estructura matemática extra que no es parte del hallazgo de una simple raíz. Esta tiende a hacer de la optimización una tarea más fácil de seguir en particular para casos multidimensionales. PT4.1.1 M é t o d o s s i n computadora e h i s t o r i a

Como se mencionó antes, los métodos de cálculo diferencial aún están en uso para determinar soluciones óptimas. Todos los estudiantes de ciencia e ingeniería recuerdan el trabajo con problemas de máximos y mínimos cuando determinan las primeras deriva-

FIGURA PT4.1
Una función de una sola variable ilustra la diferencia entre raices y el óptimo.

Máximo

0

x

354

OPTIMI I Z A C I Ó N

das de l a s funciones en sus cursos de cálculo. Bemoulli, Euler, Lagrange y otros, introd u j e r o m l ° fundamentos del cálculo de variaciones, el cual trata con la minimización de funcionales. El método de los multiplicadores de Lagrange se desarrolló para optimizar p r o b l e r r n a s restringidos; es decir, problemas de optimización donde las variables son conf i n a d a ^ en alguna forma. El primer avance de importancia en los procedimientos numéricos ocurrió con el d e s a r r c o l l o de las computadoras digitales después de la Segunda Guerra Mundial. Koopmans en el R - e i n o Unido y Kantorovich en la ex Unión Soviética, trabajaron en forma independiente ¡ ^ o b r e el problema general de distribución a bajo costo de artículos y productos. En 1947, e s ¡ l estudiante de Koopman, Dantzig, inventó el método simplex para resolver problemas - <3 programación lineal. Este método abrió el camino a muchos investigadores hacia otros rrrT-étodos de optimización restringida; entre los más notables se encuentran Chames y sus cc^>laboradores. El planteamiento de la optimización restringida también se desarrolló en f ^ o r m a rápida siguiendo la disponibilidad tan amplia de las computadoras.
s e

PT4.1

-2
- 0 1

Optimización y práctica de la ingeniería

La m a ^ ' ™ de los modelos matemáticos con que hemos tratado hasta ahora han sido descriptivosEs decir, se han derivado de simular el comportamiento de un dispositivo o s i s t e m a de la ingeniería. En contraste, la optimización tiene que ver típicamente con la deterrrínínación del "mejor resultado", u óptima solución, de un problema. Así, en el contexto d ^ l modelado, los modelos matemáticos son con frecuencia llamados modelos prescri^ptivos, puesto que se usan para prescribir un curso de acción o el mejor diseño. L c r > s ingenieros deben diseñar en forma continua dispositivos y productos que realicen t a r - ^ forma efectiva. Al hacer esto, ellos están restringidos por las limitaciones del m u n d o físico. Además, deben mantener costos bajos. Así, los ingenieros siempre se hallará J i confrontado problemas de optimización que equilibren el comportamiento y las l i m i t a c = - i ° - Algunos ejemplos comunes se listan en la tabla PT4.1. El siguiente ejeme a s e n nes

TABUBt PT4 .1
• • • • • • • • • • • • • • • •

Algunos ejemplos comunes de optimización en la ingeniería.

G\s~&ño de un avión para un mínimo peso y máxima resistencia. Tro yectorias óptimas de vehículos espaciales, D ¡ » ñ o de estructuras en la ingeniería civil con un mínimo costo. D i s v - ñ o de proyectos de abastecimiento de agua, como en presas, para mitigar el daño por inundación m i e n t r a s se obtiene máxima potencia de generación. Pre^decír el comportamiento estructural al minimizar la energía potencial. E s t * " 9 ¡ de corte de materiales para un costo mínimo. D¡sv©ño de bombas y equipos de transferencia de calor para máxima eficiencia. Mca ¡ ' 1° potencia de salida de redes eléctricas y maquinaria mientras se minimiza el caloi generado. Rut o á s corta de un vendedor que visita varias ciudades durante un viaje de venias. Pie* neación óptima y calendarizada. A n * c i l ¡ ¡ s estadístico y modelado con un mínimo error. R e e J de tubería óptimas. Q ^ n t r p l de inventario. P í o neación del mantenimiento para minimizar costos. Mi n imízar tiempos de espera y ociosos.
e e a , e a ; < m 2 a r m s e s

D i s - e ñ o r sistemas de tratamiento de aguas para cumplii con «sláiiclmos do uilklud ilnl nijiici ci bu|ii costo-

PT4.1

MOTIVACIÓN

3 5 5

pío ha sido desarrollado para ayudarlo a obtener una visión de la forma on la que tule» problemas se podrían formular.
EJEMPLO PT4.1 Optimización del costo de un paracaídas

] ! ] i

í i

Enunciado del problema. A través de este libro, hemos usado la caída de un paracaidista para ilustrar las áreas básicas de un problema de métodos numéricos. Usted puede haber notado que ninguno de estos ejemplos se concentró en lo que pasa después de que se abre el paracaídas. En este ejemplo examinaremos un caso donde el paracaídas se abre, y en el cual nos interesaremos en predecir la velocidad de impacto en el suelo. Usted es un ingeniero que trabaja para una compañía aérea que lleva abastecimientos a los refugiados en una zona de guerra. Los abastecimientos se dejarán caer a baja altitud (500 m), de tal forma que la caída no sea detectada y que los abastecimientos caigan tan cerca como sea posible del campo de refugiados. Los paracaídas abren en forma inmediata casi al salir del aeroplano. Para reducir el daño, la velocidad vertical de impacto debe ser menor que un valor crítico de v = 20 m/s. El paracaídas que se usa para la caída se ilustra en la figura PT4.2. El área transversal del paracaídas es el de una semiesfera,
c

!

A = 2nr

2

(PT4.1)

La longitud de cada una de las 16 cuerdas que sostienen al paracaídas con la masa está relacionada con el radio del paracaídas por í = V2r (PT4.2)

Usted sabe que la fuerza de arrastre en el paracaídas, es una función lineal de su área de sección transversal descrita por la siguiente fórmula ! c = kA
c c

(PT4.3)

donde c = coeficiente de arrastre (kg/s) y k = constante de proporcionalidad parametrizando el efecto del área sobre el arrastre [kg/(s • m )].
2

F I G U R A PT4.2
Un paracaídas abierto.

356

OPTIMIZACIÓN

También, es posible dividir la carga total en tantos paquetes como quiera. Es decir, la masa de cada paquete individual se puede calcular como m = M, — n
t

donde m = masa de cada paquete individual (kg), M — carga total que habrá de arrojarse (kg) y n = número total de paquetes. Por último, el costo de cada paracaídas está relacionado con el tamaño en una forma no lineal, Costo por paracaídas = c + c l + c A
0 x 2 0 x 2 2

(PT4.4)
0

donde c , c y c = coeficientes de costo. El término constante, c , es el valor base para los paracaídas. La relación no lineal se debe a que la manufactura de los paracaídas de ¡ gran tamaño es más complicada que la de los paracaídas pequeños, j Determine el tamaño (r) y el número de paracaídas («) que puedan obtenerse a un | mínimo costo, y que cumplan al mismo tiempo el requerimiento de tener una velocidad | de impacto suficientemente pequeña.
!

I | | | | |

Solución. El objetivo aquí es determinar la cantidad y tamaño de paracaídas que minimicen el costo del planeador. El problema está restringido, ya que los paquetes deben tener una velocidad de impacto menor al valor crítico. El costo se puede calcular al multiplicar el valor de un paracaídas individual [ecuación (PT4.4)] por el número de paracaídas («). Así, la función que usted quiere minimizar, la cual es llamada formalmente función objetivo, se escribe como Minimizar C = n(c + c i + c A )
2 Q x 2

(PT4.5)

¡ donde C = costo ($) y A y (, se calculan con las ecuaciones (PT4.1) y (PT4.2), respectij vamente. j Después, usted debe especificar las restricciones. Para este problema existen dos | restricciones. i Primera, la velocidad de impacto debe ser igual o menor que la velocidad crítica.
\

\

v <v

c

(PT4.6)

Segunda, el número de paquetes debe ser un entero y mayor o igual a 1, ¡ n>\ (PT4.7)

IAA
| I | | | donde n es un entero. En este punto, el problema de optimización se ha formulado. Como puede verse, es un problema restringido no lineal. Aunque el problema se ha formulado en forma amplia, algo más se debe tener en cuenta: ¿cómo se determina la velocidad de impacto vi Recuerde del capítulo 1 que la velocidad de un objeto en caída se puede calcular con _,.--«•/«>/) (1-10)
L ) =

PT4.1

MOTIVACIÓN
2

donde v = velocidad (m/s), g = aceleración de la gravedad (m/s ), m = masa (kg) y t = tiempo (s). Aunque la ecuación (1.10) provee una relación entre v y r, se necesita conocer en cuánto tiempo cae la masa. Por tanto, es necesaria una relación entre la distancia de calda z y el tiempo de caída t. La distancia de caída se puede calcular de la velocidad en la ecuación (1.10) por integración

Jo c
Esta integral se puede evaluar para obtener gm
t

(PT4.8)

-{c/m)t

donde z = altura inicial (m). Esta función, como muestra la gráfica de la figura PT4.3, 0 provee una forma c de predecir z conociendo t. Sin embargo, no se necesita z como una función de t para resolver este problema. En lugar de esto, se debe calcular el tiempo requerido por el paquete para recorrer en caída la distancia z . Así, se reconoce que se ha formulado la ecuación (PT4.9) como un problema de determinación de raíces. Esto es, se debe resolver para el tiempo al cual z se acerca a cero.
0 0

z 1

(PT4.9)

0 = z - — t c
0

gm-

(1

-(c/m)t

(PT4.10)

Una vez que se calcula el tiempo de impacto, se puede sustituir en la ecuación (1.10) con el fin de resolver para la velocidad de impacto.

358

OPTIMIZACIÓN

La especificación final del problema podría ser Minimizar C = n(c + c,€ +
0

cA)
2 2

(PT4.1 I)

sujeta a v < v n > 1 donde A = 2nr
2 c

(PT4.12) (PT4.13)

(PT4.14) (PT4.15) (PT4.16) (PT4.17) (PT4.18) (PT4.19)

l = 4lr
c = kA
c

Mi

m = — n t = raíz

c

Resolveremos este problema en el ejemplo 15.4 al final del capítulo 15. Por ahora, reconozca que se tiene uno de los elementos fundamentales de los otros problemas de optimización, que usted enfrentará en la práctica de la ingeniería. Estos son • • • El problema involucrará una función objetivo que contiene su meta. Tendrá también un número de variables de diseño. Estas pueden ser números reales o enteros. En nuestro ejemplo, estas variables son r (real) y n (entero). El problema incluirá restricciones que reflejan las limitaciones bajo las cuales se trabaja.

Plantearíamos un punto más antes de proceder. Aunque la función objetivo y restricciones pueden, en forma superficial, parecer simples ecuaciones [por ejemplo, la ecuación (PT4.12)], de hecho son la "punta del iceberg". Es decir, pueden estar basadas en modelos y dependencias complejas. Por ejemplo, en nuestro caso, pueden involucrar otros métodos numéricos [ecuación (PT4.18)]. Esto significa que las relaciones funcionales que usted estará usando podrían de hecho representar cálculos grandes y complicados. Así, pueden ser en extremo valiosas las técnicas que pueden encontrar lu solución óptima, mientras se minimizan las funciones de evaluación.

PT4.2

BASES MATEMÁTICAS

PT4.2

BASES MATEMÁTICAS Existen infinidad de conceptos matemáticos y operaciones que son la base de lu optimización. Como creemos que para usted éstos serán más relevantes en contexto, se dejará el análisis de los prerrequisitos matemáticos hasta que se ocupen. Por ejemplo, se analizarán los importantes conceptos del gradiente de Hessians al inicio del capítulo 14 sobre la optimización de multivariables no restringidas. Mientras tanto, nos limitaremos a un tópico más general de cómo se clasifican los problemas de optimización. Un problema de programación matemática u optimización, se puede establecer en forma general como Determine x, el cual minimiza o maximiza/(x) sujeto a

d¡{x)<a¡
e¡(x) = bi

/ = l,2,...,m ¿= 1 , 2 , ( P T 4 . 2

(PT4.20) 1 )

donde x es un vector de diseño con n dimensiones, f(x) es la función objetivo; d¡(x) son las restricciones de desigualdad; e¡(x) son las restricciones de igualdad, y a¡ y b¡ son constantes. Los problemas de optimización se pueden clasificar con base en la forma de f(x): • • • Si f(x) y las restricciones son lineales, tenemos programación lineal.

Si f(x) es cuadrática y las restricciones son lineales, tenemos programación cuadrática. Si f(x) es no lineal o cuadrática y/o las restricciones son no lineales, tenemos programación no lineal.

Además, cuando las ecuaciones (PT4.20) y (PT4.21) se incluyen, tenemos un problema de optimización restringida; de otra forma, es un problema de optimización no restringido. ' Observe que para problemas restringidos, los grados de libertad están dados por n-p. Generalmente, para obtener una solución,/? debe ser <n.Sip>n, se dice que el problema es sobrerrestringido. Otra forma en la cual se clasifican los problemas de optimización es mediante dimensionalidad. Esto es muy común al dividir los problemas en unidimensionales y multidimensionales. Como su nombre implica, los primeros involucran funciones que dependen de una sola variable. Como en la figura PT4.4a, la búsqueda entonces consiste en ascender o descender los picos y valles unidimensionales. Los problemas multidimensionales involucran funciones que dependen de dos o más variables dependientes. En el mismo sentido, la optimización bidimensional se puede de nuevo visualizar como una búsqueda de picos y valles (véase PT4.46). Sin embargo, justo como en una caminata, no estamos restringidos a caminar en una sola dirección; en lugar de esto se examina ln topografía para alcanzar la meta en forma eficiente. Finalmente, el proceso de encontrar un máximo versus encontrar un mínimo es en esencia idéntico, ya que el mismo valor, m i n i m i z a / ^ ) y maximiza Esta equivalencia se ilustra en forma gráfica por una función unidimensional en la figura PT.4«.

x*,

—f(x).

360

OPTIMIZACIÓN

a)

b)

FIGURA PT4.4 a) Optimización unidimensional. Esta figura también ilustra cómo la minimización de f(x¡ es equivalente a la maximización de -f[x). b) Optimización bidimensional. Observe que esta figura puede tomarse para representar, ya sea una maximización (los contornos aumentan con la elevación hasta un máximo como en una montaña) o una minimización (los contornos disminuyen a un mínimo como un valle).

PT4.3

ORIENTACIÓN Alguna orientación es útil antes de proceder con los métodos numéricos de optimización. Lo siguiente, tiene la intención de proveer una revisión del material visto en la parte cuatro. Además, se han incluido algunos objetivos para ayudar a enfocar los esfuerzos cuando se estudie el material.

PT4.3.1

Alcance y anticipación

La figura PT4.5 es una representación esquemática de la organización de la parte cuatro. Examine esta figura con cuidado, comenzando arriba y después en sentido de las manecillas del reloj. Después de la introducción, el capítulo 13 se dedica a la optimización unidimensional no restringida. Se presentan métodos para determinar el mínimo o máximo de una función de una sola variable. Se cubren tres métodos: búsqueda sección-dorada, interpolación cuadrática y el método de Newton. Estos métodos tienen también relevancia en la optimización multidimensional. El capítulo 14 cubre dos tipos generales para resolver problemas de optimización
' - • ' - — ' - > - i — — A i v a t i t n * t a l a * p n m o húsauadcii
J

(¡lucítotliw,

PT4.3

ORIENTACIÓN

361

búsquedas invariables y búsquedas de patrones, no requieren la evaluación de las derivadas de la función. Por otro lado, los métodos gradiente usan algunas veces la primera y otras la segunda derivada para encontrar el óptimo. El capítulo introduce el gradiente y el Hessian, los cuales son representaciones multidimensionales de la primera y segunda derivadas. El método de paso ascendente/descendente es entonces cubierto con algún detalle. A esto le siguen descripciones de algunos métodos avanzados: gradiente conjugado, el método de Newton, el método de Marquardt y los métodos cuasi-Newton. El capítulo 15 se dedica a la optimización restringida. La programación lineal se describe con detalle usando ambos: la representación gráfica y el método simplex. El análisis detallado de optimización restringida no lineal está fuera del alcance de este libro, pero se dará un repaso a los principales enfoques. Además, se ilustra cómo tales problemas, junto con los estudiados en los capítulos 13 y 14, se pueden obtener con las librerías y paquetes de software como Excel, Mathcad e IMSL. El capítulo 16 extiende los conceptos anteriores a problemas actuales de la ingeniería. Se utilizan aplicaciones de la ingeniería para ilustrar cómo se formulan los problemas de optimización y en qué forma se provee una visualización en la aplicación de las técnicas de solución en la práctica profesional. Se incluye un epílogo al final de la parte cuatro. Este contiene un repaso de los métodos analizados en los capítulos 13,14 y 15. Este repaso incluye una descripción de los elementos de juicio relacionados con el uso apropiado de cada técnica. Esta sección también provee referencias de algunos métodos numéricos que van más allá del alcance de este texto. PT4.3.2 M e t a s y objetivos

Objetivos de estudio. Después de haber analizado la parte cuatro, usted tendrá suficiente información para plantear con éxito una amplia variedad de problemas de la ingeniería relacionados con la optimización. En general, usted debería dominar las técnicas, haber aprendido a evaluar su confiabilidad y detectar métodos alternativos de análisis para un problema particular. Además, de estas metas generales, deberían ser asimilados los conceptos específicos dados en la tabla PT4.2 para un aprendizaje comprensivo del material de la parte cuatro. Objetivos computacionales. Usted debería ser capaz de escribir un subprograma que implemente una búsqueda simple unidimensional (como la búsqueda dorada o la interpolación cuadrática) y multidimensional (como el método de búsqueda aleatorio). Además, programas de librerías como el IMSL y los paquetes de software tales como Excel o Mathcad tienen una variedad de capacidades para la optimización. Usted puede usar esta parte del libro para familiarizarse con todas estas capacidades.

3Ó2

OPTIMIZACIÓN

15,2 Restricciones no lineales

FIGURA PT4.5 Esquema de la organización del material en la parte cuatro: Optimización.

PT4.3

ORIENTACIÓN Objetivos de estudio específicos para la parte cuatro.

lis

TABLA PT4.2

1. Comprender por qué y dónde ocurre la optimización al resolver problemas de ingeniería. 2. Comprender los elementos principales del problema de optimización en general: función ob|elivo, variables de decisión y restricciones. 3. Ser capaz de distinguir entre la optimización lineal y no lineal, y entre problemas restringidos y no restringidos. 4. Poder definir la relación dorada y comprender cómo realiza una eficiente optimización unidimensional. 5. Localizar el óptimo de una función con una sola variable con la búsqueda de la sección dorada, interpolación cuadrática y el método de Newton. También, reconozca los elementos de juicio entre estos enfoques, con particular atención en los valores iniciales y en la convergencia. ó. Ser capaz de escribir un programa y resolverlo para el óptimo y la función multivariable usando búsqueda aleatoria. 7. Comprender las ideas detrás de los patrones de búsqueda, direcciones conjugadas y el método de Powell. 8. Poder definir y evaluar el gradiente y Hessian de una función multivariable, ambas en forma analítica y numérica. 9. Calcular a mano el óptimo de una función con dos variables, usando el método de paso ascendente/ descendente. 10. Comprender las ideas básicas detrás de los métodos del gradiente conjugado, de Newton, de Marquardt y de cuasi-Newton. En particular, comprender los elementos de juicio de los enfoques y reconocer cómo cada uno mejora sobre el paso ascendente/descendente. 11. Ser capaz de reconocer y acondicionar un problema de programación lineal para representar aplicaciones de los problemas en ingeniería. 1 2. Poder resolver un problema de programación lineal bidimensional con ambos métodos: el gráfico y el simplex. 1 3. Comprender los cuatro posibles resultados de un problema de programación lineal. 14. Ser capaz de acondicionar y resolver problemas de optimización restringidos no lineales mediante un paquete de software.

CAPÍTULO 13 Optimización unidimensional no restringida
Esta sección describirá las técnicas para encontrar el mínimo o máximo de una función de una sola variable,/(x). Una imagen útil en este sentido es la unidimensional "montaña rusa", como la función ilustrada en la figura 13.1. Recuerde de la parte dos, que la localización de una raíz fue complicada por el hecho de que varias raíces ocurren para una sola función. De manera similar, ambos, el óptimo local y el óptimo global, pueden ocurrir en optimización. Tales casos son llamados multimodal. En casi todos los ejemplos, estaremos interesados en encontrar el valor absoluto máximo o mínimo de una función. Así, debemos cuidar de no equivocarnos con un óptimo local en vez de un óptimo global. Distinguir un extremo global de un extremo local puede ser un problema difícil para el caso general. Existen tres formas usuales de enfocar este problema. Primero, la visualización en el comportamiento de funciones de bajas dimensiones puede algunas veces obtenerse en forma gráfica. Segundo, determinar la óptima con base en los valores iniciales, que varían muy ampliamente y quizá sean generados en forma aleatoria, y después seleccionar el más grande de éstos como global. Por último, cambiar el punto de inicio asociado con un óptimo local y ver si la rutina regresa a un mejor punto, o siempre regresa al mismo punto. Aunque todos estos planteamientos tienen su utilidad, el hecho es que en algunos problemas (usualmente los más grandes), quizá no hay una forma práctica de asegurar que se ha localizado un óptimo global. Sin embargo, aunque se

V

FIGURA 13.1 Una función que asintóticamente se aproxima a cero en más y menos °° y tiene dos puntos máximos y dos puntos mínimos en la vecindad del origen. Los dos puntos a la derecha son los óptimos locales, mientras que los dos de la izquierda son globales.

A

Máximo ^R ^l global / \

Máximo O*^" local
X

Mínimo \ global —

i

Mínimo

13.1

B U W S U E P A D E LA S E C C I Ó N DORAL7A

ilcberhi ser siempre sensible ul lema, se liene la fortuna de que hay numerosos problemas en la ingeniería donde se puede localizar el global óptimo en una forma no ambigua. Como en la localización de raíces, la optimización en una dimensión se puede dividir en métodos que usan intervalos y métodos abiertos. Como se describirá en la próxima sección, la búsqueda de sección dorada, es un ejemplo de un método de intervalo que depende de los valores iniciales y que contiene un solo óptimo. Este es seguido por un procedimiento de intervalo algo más sofisticado (la interpolación cuadrática). El método final descrito en este capítulo es un método abierto que se basa en la idea del cálculo de que se puede encontrar el mínimo o máximo al resolver f(x) = 0. Esto reduce el problema de optimización para encontrar la raíz d e / \ x ) mediante las técnicas de esa clase descritas en la parte dos. En seguida se mostrará una versión de este planteamiento (el método de Newton).

13.1

B Ú S Q U E D A DE LA SECCIÓN D O R A D A Al resolver para la raíz de sólo una ecuación no lineal, la meta fue la de encontrar la variable x que diera cero en la función f(x). La optimización de una sola variable tiene como meta encontrar el valor de x que generará un extremo, ya sea un máximo o un mínimo de f(x). La búsqueda de la sección dorada es una técnica simple, de búsqueda de una sola variable de propósito general. Es similar en esencia al enfoque de la bisección para localizar raíces (capítulo 5). Recuerde que la bisección depende del intervalo definido, especificado por un valor inicial inferior (x,) y un valor inicial superior (xj, que ajusta a una sola raíz. La presencia de una raíz entre estas fronteras se verifica al determinar que f(x¡) Y /(*«) tienen signos diferentes. La raíz se estima entonces como el punto medio de este intervalo,
xi + x
u

El paso final en una iteración por bisección involucró determinar el intervalo más pequeño. Esto se hizo al reemplazar cualquiera de las fronteras x¡ o x , que tuvieran un valor de la función con el mismo signo que f(x ). Un efecto útil de este procedimiento fue que el nuevo valor x , reemplazará a una de las fronteras anteriores. Ahora se puede desarrollar un procedimiento similar para localizar el óptimo de una función unidimensional. Por simplicidad, nos concentraremos sobre el problema de encontrar un máximo. Cuando se analice el algoritmo de cómputo, se describirán las pequeñas modificaciones necesarias para simular un mínimo. Como con el método de la bisección, se puede comenzar por definir un intervalo que contenga una sola respuesta. Es decir, el intervalo debería contener un solo máximo, y por esto es llamado unimodal. Podemos adoptar la misma nomenclatura que para la bisección, donde x¡ y x , definen los límites inferior y superior de ese intervalo. Sin embargo, en contraste con bisección, se necesita una nueva estrategia para encontrar un máximo dentro del intervalo. En vez de usar solamente dos valores función (los cuales son suficientes para detectar un cambio de signo, y por tanto un cero), se necesitarían tres valores función para detectar si ocurre un máximo. Así, se ha escogido un punto adicional dentro del intervalo. Después, se toma un cuarto punto. Entonces, lu pruebn
u r r u

OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA

f[x)k
Primera iteración

FIGURA 13.2 El paso inicial del algoritmo de búsqueda de la sección dorada involucra escoger dos puntos interiores de acuerdo con la razón dorada.

para el máximo podría aplicarse para discernir si el máximo ocurre dentro de los prime ros tres o en los últimos tres puntos. La clave para hacer eficiente este procedimiento es la mejor elección de los punlim intermedios. Como en la bisección, la meta es minimizar las funciones evaluación ni remplazar los valores anteriores con los nuevos. Esta meta se puede alcanzar al especificar que las siguientes dos condiciones se cumplan (véase figura 13.2):

lo = li +h
x 2

(13.1)

(I3.;>

La primera condición especifica que la suma de las dos sublongitudes € y £ debe m igual a la longitud original del intervalo. La segunda indica que el cociente o razón de I IIN longitudes debe ser igual. La ecuación (13.1) se puede sustituir en la (13.2),

Si se toma el recíproco y R = € /€,, se llega a
2

ÍI+Í2
2

(I-VI)

(114)

o R + R1 =0
(I.U)

la cual se puede resolver para la raíz positiva

13.1

BÚSQUEDA DE LA SECCIÓN DORADA

367

Cuadro 13.1 L a razón dorada y los números de Fibonacci
lili muchas culturas, a ciertos números se les otorga cualidades. I 'or ejemplo, en Occidente se suele decir "el 7 de la suerte" y "viernes 13". L o s antiguos griegos llamaron al siguiente número ln "razón dorada":

> A
I'.NIII

I

: 0.61803.

razón fue empleada para un gran número de propósitos, proporciones fueron consideradas por los griegos como

Incluyendo el desarrollo del rectángulo como en la figura 13.3.
I'NUIN

Místicamente agradables. Entre otras cosas, muchos de los templiiN siguieron esta forma. I ,a razón dorada se relaciona con importantes series maternal icns conocidas como los números de Fibonacci, los cuales •on 0. I , 1 , 2 , 3 , 5 , 8 , 1 3 , 2 1 , 3 4 , . . . Así, cada número después de los dos primeros representa la mima de l o s dos precedentes. Esta secuencia detonó en muchas rtii'iiN diversas de la ciencia y la ingeniería. E n el contexto del p í n t e n l e análisis, una interesante propiedad de la secuencia de
I'IIMIIIIICCÍ

FIGURA 13.3 El Partenón de Atenas, Grecia, fue construido en el siglo v antes de Cristo. Sus dimensiones frontales pueden casi ajusfar en forma exacta dentro de un rectángulo dorado.

relaciona la razón de números consecutivos en la se-

Himieia; os decir, 0/1 = 0, 1/1 = 1, 1/2 = 0.5,2/3 = 0.667, 3/5 — ( l o , 1/H = 0.625, 8/13 = 0.615, y asi sucesivamente. ¡Como mi|iunenios, la razón de números consecutivos se aproxima a la l»*on dorada!

Este valor, el cual se conoce desde la antigüedad, es llamado la razón dorada (vea el cuadro 13.1). Ya que permite encontrar en forma eficiente el óptimo, es el elemento clave del método de la sección dorada que hemos desarrollado conceptualmente. Ahora derivemos un algoritmo para implementar este procedimiento en la computadora. Como se mencionó antes y se ilustra en la figura 13.4, el método comienza con dos valores iniciales, x¡ y x , que contienen un extremo local de f(x).
u

Después, dos puntos

interiores x

{

yx

2

se escogen de acuerdo con la razón dorada,

d =—-—(x
x\ = xi + d x
2

u

- x¡)

= x„

-

d

La función HO evalúa en esto» dos puntos interiores. Dos resultados pueden ocurrir:

368

OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA

f(x)

Eliminar

Extremo (máximo)

f'f ,!• \
x¿< d a)

> v

'

i

•i - l i 1 iw
• • . t- -

x

u

W /4

Xf
2

Xg

X] X

Antiguo x Antiguo x¡ b) FIGURA 13.4 o) El paso inicial del algoritmo de búsqueda de la sección dorada involucra escoger dos puntos interiores de acuerdo con la razón dorada, b) El segundo paso involucra definir un nuevo intervalo que incluya el óptimo.

1 .

2.

Si, como es el caso en la figura 13 .4, /(x ) > f(x ), entonces el dominio de x a I» izquierda de x J de x¡ a x , se puede eliminar, ya que no contiene el máximo. Para este caso, x pasa a ser el nuevo x¡ para la siguiente vuelta. Si ha ocurrido q u e / ( x ) > f{x ), entonces el dominio de x a la derecha de x de x, a x podría ser eliminado. En este caso x pasa a ser el nuevo x para la siguiente iteración.
f 2 2 2 2 2 x l5 u t u ;

Ahora, éste es el beneficio real del uso de la razón dorada. Debido a que los x, y .v originales se han escogido mediante la razón dorada, no se tiene que recalcular todos los valores de la función para la siguiente iteración. Por ejemplo, para el caso expuesto en la figura 13.4, el anterior X j pasa a ser el nuevo x . Esto significa que ya se tiene el valor para el nuevo/(x ), puesto que es el mismo valor de la función en el anterior x Para completar el algoritmo, ahora sólo se necesita determinar el nuevo x . listo NC realiza con la misma proporcionalidad que antes,
2 2 v t

5 -1 . v i= V ( . v „ -.v/)
xi -I

13.1

BÚSQUEDA DG LA SECCIÓN DORADA

36*

Un procedimiento similar podría usarse para el caso alterno donde el óptimo está en la izquierda del subintervalo. Como las iteraciones se repiten, el intervalo que contiene el extremo se reduce rápidamente. De hecho, en cada vuelta el intervalo se reduce por un factor de la razón dorada (aproximadamente el 61.8%). Esto significa que después de 10 vueltas, el intervalo se acorta a cerca de 0.618 o 0.008 o 0.8% de su longitud inicial. Después de 20 vueltas, se acerca al 0.0066%. Esta reducción no es tan buena como la que se alcanza con bisección, pero éste es un problema más difícil.
10

EJEMPLO 13.1

Búsqueda de la sección dorada

Enunciado del problema . x f(x) — 2 sen* — 10
1

Use la búsqueda de la sección para encontrar el máximo de

dentro del intervalo x¡ = 0 y x — 4.
u

Solución.

V5-

Primero, se usa la razón dorada para crear los dos puntos anteriores 1 ( 4 - 0) = 2.472

xx = 0 + 2.472 = 2.472 x = 4 - 2.472 = 1.528
2

La función se puede evaluar en los puntos interiores f(x )
2

=/(1.528) =

^

- 2 sen (1.528) = 1.765

/ ( * , ) = /(2.472) = 0.63 Debido a que f(x ) >/(*i), el máximo en el intervalo está definido por x¡, x y x . Así, para el nuevo intervalo, la frontera inferior permanece x = 0, y x, pasa a ser la frontera superior; esto es, x = 2.472. Además, el primer valor x pasa a ser el nuevo x¡; esto es, x, = 1.528. Además, no se tiene que recalcular/(x,) ya que se determinó en la ; iteración previa como/(l.528) = 1.765. Todo lo que falta es calcular la nueva razón dorada y x ,
2 2 x t u 2 2

d =
2

1

(2.472 - 0) = 1.528

x = 4 - 1.528 = 0.944 La evaluación de la función en x es/(0.994) =1.531. Como este valor es menor que el valor de la función en x , el máximo está en el intervalo prescrito por x , x y x . i ül proceso se puede repetir, con los resultados tabulados en seguida:
2 ( 2 { u

370

OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA /
1 2 3 4 5 6 7 8 0 0 0.9443 0.9443 1.3050 1.3050 1.3050 1.3901

'(*/)
0 0 1.5310 1.5310 1.7595 1.7595 1.7595 1.7742

x

2

í(x )
2

d
2.4721 1.52790.6300 1.7647 4.0000 2.4721 2.4721' 1.8885 1.8885 1.6656 1.5279 1.5279 -3.1136 0.6300 0.6300 1.5432 1.5432 1.7136 1.7647 1.7647 2.4/71 1.52/9 0.9443 0.5836 0.360/ 0.2229 0.1378 0.0851

'1.5279 0.9443 1.5279 1.3050 1.5279 1.4427 1.3901 1.4427

1.7647 1.5310 1.7647 1.7595 1,7647 1.7755 1.7742 1.7755

1.8885 - 1.5432 1.5279 1.6656 1.5279 1.4427 1.4752 1.7647 1.7136 1.7647 1.7755 1.7732

Observe que el máximo actual está resaltado para cada iteración. Después de ocho iteraciones, el máximo ocurre en x = 1.4427 con un valor función de 1.7755. Así, el resultado es convergente sobre el valor verdadero de 1.7757 e n x = 1.4276.

Recuerde que por bisección (véase sección 5.2.1), se puede calcular un límite superior exacto en cada iteración. Usando un razonamiento similar, un límite superior para la búsqueda de la sección dorada se puede derivar como sigue. Una vez que se completa una iteración, el óptimo estará en uno de los dos intervalos. Si x es el valor de la función óptima, estará en el intervalo inferior (x¡, x , x,). Si x, es el valor de la función en el punto óptimo, estará en el intervalo superior (x , x x ). Debido a que los puntos interiores son simétricos, cualquier caso se puede usar para definir el error. Observando en el intervalo superior, si el valor verdadero estuviera en el extremo izquierdo, la máxima distancia de la estimada podría ser
2 2 2 v u

A.v = xi - x
0

2

= x\ + R{x = {IR u

u

- x¡) - x„ + R(x
u

u

- x¡)

= (x, - x „ ) +2R(x

-xi)

!)(*„-*,)

o 0.236 (x — x¡) Si el valor verdadero estuviera en el extremo derecho, la máxima distancia de la estimada podría ser Axft = x¡, - x\ = x„ - x¡ - R(x
u

- x¡)

= (1-/?)(*«-*/) o 0.382 (x — x¡). Por tanto, este caso podría representar el error máximo. Tal resultado puede entonces ser normalizado al valor óptimo para esa iteración, x para dar
u o p t

Sa = 0 - / 0

Xu ~ XI

100%

Esta estimación proporciona una base para terminar las iteraciones.

13.1

BÚSQUEDA DE LA SECCIÓN DORADA

PIOURA 13.5

FUNCTION Gold

(xíow.xhigh.maxit.es.fx)

xt — xlow; xu = xhigh ¡ter = 1 d = R*(xuxt) xí = xt + d; x2 = xu — d fí = f(x1) f2 = f(x2) IF fí > fZ THEN xopt xí fx=fí ELSE xopt = x2 fx= f2 END ¡F DO d = K*d IFfí>f2 THEN xt = x2 x2= x1 x1 xt+d f2= fí fí = f(x1) EL5E xu — xí
1

IF fí < f2 THEN

IFfí<f2

THEN

xí = x2
x2 = xu—d fí = f2 f2 = f(x2) END IF ¡ter = iter+1 IFfí > f2 THEN xopt = xí fx=fí EL5E xopt - x2 fx=f2 END IF IFxopt*0. THEN ea = (1.-R)*A8S((xu - xt)/xopt) END IF IF ea < es OK ¡ter > maxit EXlT END DO Gold — xopt END Gold
«) Maximización

IFfí < f2 THEN

* 100.

b) Minlmlzaolón

372

OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA

En la figura 13.5a, se presenta el pseudocódigo del algoritmo de búsqueda de la sección dorada. En la figura 13.5b se listan las pequeñas modificaciones para convertir el algoritmo a minimización. En ambas versiones el valor x para el óptimo se regresa como el valor función (dorado). Además, el valor def(x) en el óptimo se regresa como la variable f(x). Usted se preguntará por qué hemos hecho énfasis en la reducción de las funciones evaluación de la búsqueda de la sección dorada. Por supuesto, para resolver una sola optimización, la velocidad ahorrada podría ser insignificante. Sin embargo, hay dos importantes contextos donde minimizar el número de evaluaciones de la función puede ser importante. Éstos son 1. Muchas evaluaciones. Existe casos donde el algoritmo de búsqueda de la sección dorada puede ser una parte de muchos más cálculos. En tales casos, ésta podría llamarse muchas veces. Por tanto, manteniendo las evaluaciones de la función a un mínimo podría dar grandes dividendos para esos casos. Tiempo consumido en la evaluación. Por razones pedagógicas, se usan funciones sim pies en la mayoría de nuestros ejemplos. Usted debería entender que una función puedeser muy compleja y consumir mucho tiempo en su evaluación. Por ejemplo, en una parte posterior de este libro, se describirá cómo se puede usar la optimización para estimar los parámetros de un modelo que consiste de un sistema de ecuaciones difercí íciales. Para tales casos, la "función" involucró tiempo consumido en la integración del modelo. Cualquier método que minimiza tales evaluaciones podría ser ventaj oso.

2.

13.2

INTERPOLACIÓN CUADRÁTICA La interpolación cuadrática tiene la ventaja del hecho que un polinomio de segundo orden con frecuencia proporciona una buena aproximación a la forma de f(x) cercana a un óptimo (véase figura 13.6).

F I G U R A 13.6 Ilustración gráfica de la interpolación cuadrática.

13.2

INTERPOLACIÓN CUADRÁTICA

Así como existe sólo una línea recta para conectar dos puntos, hay únicamente una cuadrática o parábola para conectar tres puntos. De esta forma, si se tiene tres puntos que juntos contienen un óptimo, se puede ajustar una parábola a los puntos. Después se puede diferenciar e igualar el resultado a cero, y resolver para una estimación de la óptima x. Se puede demostrar que después de un manejo algebraico el resultado es /(¿o) ( x - xj) + f{x\) (x¡ - x ) + f(x )
2 2 2

3 7 3

(x - x )
2 2 2

2 / ( x ) (xi - x ) + 2f(x¡) (x - x ) + 2f(x )
0 2 2 0 Q x 2 3

(x - x{)
0

donde x , x y x son los valores que fijan el extremo, y x es el valor de x que corresponde al máximo valor del ajuste cuadrático a los valores iniciales.

.2

Interpolación cuadrática

] i

Enunciado del problema. de f(x) = 2 sen x x —
2

Use la interpolación cuadrática para aproximar el máximo

j i i j
| ; ¡ j | | ! | | I * i j | \ I

con valores iniciales de x = 0, x = 1 y x — 4.
0 x 2

Solución.

El valor de la función en los tres valores se puede evaluar,

x = 0
0 x

/(x ) = 0
0

x = 1 / ( x i ) = 1.5829 .v = 4 f{x ) = - 3 . 1 1 3 6 y sustituyendo en la ecuación (13.7) se obtiene,
2 2

_
X i

0 ( l - 4 ) + 1.5829 (4 - O ) + (-3.1136) (O - l )
2 2 2 2 2 2

=

}

5 Q 5 5

~ 2(0) (1 - 4 ) +2(1.5829) ( 4 - 0 ) + 2(-3.1136) (0 - 1) ~

la cual tiene un valor de la función d e / ( 1 .5055) = 1 .769 1. Después, se puede emplear una estrategia similar a la de la búsqueda de la sección dorada para determinar cuál punto se descartará. Ya que el valor de la función para el nuevo punto es mayor que para el punto intermedio (x,) y el nuevo valor de x está a la derecha del punto intermedio, el valor de inicio inferior (x ) se descarta. Por tanto, para la próxima iteración,
0

jc = 1
0

/ ( x ) = 1.5829
0

x, = 1.5055 x = 4
2

/ ( * , ) = 1.7691 /U ) =-3.1136
2

la cual so sustituye en la ecuación (13.7) para obtener

374

OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA

_

1.5829 (1.5055' -4') = 1.4903

+ 1.7691 ( 4

¿

(-3.1136) ( I ' l) + 2 ( - 3 . H 3 6 ) ( l

I.505.V') - 1.5055)

2(1.5829)(1.5055 - 4 ) + 2(1.7691)(4 •

la cual tiene un valor de la función de/(1.4903) = 1.7714. El proceso se puede repetir, con los resultados tabulados abajo: /
1 -«o 0.0000 1.0000 1.0000 1.0000 1.4256 0.0000 1.5829 1.5829 1.5829 *i 1.0000 1.5055 1.4903 1.4256 1.4266 1.5829 1.7691 1.7714 1.7757 1.7757

x

2

flx )
2

* 3

4* )
3

2
3

4
5

1 .7757

4.0000 4.0000 1.5055 1.4903 1.4903

-3.1136 -3.1136 1.7691 1.7714 1.7714

1.5055 1.4903 1.4256 1.4266 1.4275

1.7691 1.7/M 1.775/ 1.7/.'./ 1.77'./

Así, dentro de las cinco iteraciones, el resultado es rápidamente convergente sobre i-l valor verdadero de 1.7757 e n x = 1.4276.

Deberíamos mencionar que así como en el método de la falsa posición, la interpcln ción cuadrática puede quedarse con sólo un extremo de intervalo convergiendo. Así, ln convergencia puede ser lenta. Como prueba de lo anterior, observe que en nuestro pío, 1.0000 fue un punto final para la mayoría de la iteraciones. Este método, así como otros que usan polinomiales de tercer orden, se puede formu lar en algoritmos que contienen pruebas de convergencia, cuidadosas estrategias de s e lección para los puntos que habrán de retenerse en cada iteración e intentos de minimi/.m la acumulación del error de redondeo. En particular, vea el método de Brent's en y cois. (1992).

e j e i n

P r e s s

13.3

M É T O D O DE N E W T O N Recuerde que el método de Newton-Raphson del capítulo 6, es un método abierto que encuentra la raíz de x como una función tal que f(x) = 0. El método se resume como x¡+\ = X¡ f(x¡) fU,)

Se puede usar un planteamiento similar abierto para encontrar un óptimo de / ( \ ) ul definir una nueva función, g(x) — f\x). Así, como el mismo valor óptimo x* satisface ambos
/ ' ( x * ) = g(x*) = 0

se puede usar lo siguiente

x,¡ + 1

X:

-

( M H .)

T*.#-TW!B1WB«rüB NEWTON

"

17B

como una técnica pura encontrar el mínimo o máximo de f(x). Se deberiu observar c¡uo esta ecuación puede también derivarse al escribir una serie de Taylor de segundo orden para /'(x) e igualar la derivada de la serie a cero. El método de Newton es abierto y similar al de Newton-Raphson porque no requiere de valores iniciales que contengan el óptimo. Además, también comparte la desventaja de poder ser divergente. Por último, es una buena idea verificar que la segunda derivada tenga usualmente el signo correcto para confirmar que la técnica converge sobre el resultado deseado.
EJEMPLO 1 3 . 3 Método de Newton

I

Enunciado del problema. f(x) = 2 senx

Use el método de Newton para encontrar el máximo de

10
0

con un valor inicial de x = 2.5. ) Solución. f(x) La primera y segunda derivadas de la función se puede evaluar como = 2 eos x — -2 senx las cuales se sustituyen en la ecuación (13.8) para obtener _ 2 eos x¡ — x / 5 —2 senx,- — 1/5 Al sustituir el valor inicial se obtiene x 5 2 eos 2 . 5 - 2 . 5 / 5 - 2 sen 2.5 - 1/5 la cual tiene un valor de la función de 1.57859. La segunda iteración da x, = 0.995 2 eos 0.995 - 0.995/5 - 2 sen 0.995 - 1/5 = 1.46901
= a 9 9 5 Q 8

la cual tiene un valor de la función de 1.77385. El proceso se repite, con los resultados abajo tabulados:
f(x)
2.5 0.99508 1.46901 1.42764 1,427.5.5 0.57194 1.57859 1.77385 1.77573 1.77573 -2.10229 0.88985 -0.09058 -0.00020 0.00000 -1.39694 -1.87761 -2.18965 -2.17954 -2.17952

376
Asi, dentro de las cuatro iteraciones, el resultado converge en forma rápida sobre el vulor verdadero.

Aunque el método de Newton trabaja bien en algunos casos, no es práctico en otros donde las derivadas no se pueden evaluar en forma conveniente. Para estos casos, se dispone de otros procedimientos que no involucran la evaluación de la derivada. Por ejemplo, un método de Newton, en versión como la secante, se puede desarrollar al usar aproximaciones por diferencia finita para las evaluaciones de la derivada. Una restricción mayor con respecto al procedimiento es que puede divergir con base en la naturaleza de la función y la calidad del valor inicial. Así, usualmente se emplea sólo cuando se está cerca del óptimo. Las técnicas híbridas que usan procedimientos con intervalos lejos del óptimo y los métodos abiertos cercanos al óptimo intentan explotar los puntos fuertes de ambos procedimientos. Esto concluye nuestro tratamiento de los métodos para encontrar el óptimo de funciones de una sola variable. Algunos ejemplos de ingeniería se presentan en el capítulo 16. Por otra parte, las técnicas descritas aquí son un importante elemento de algunos procedimientos para optimizar funciones multivariables, que se analizarán en el próximo capítulo.

PROBLEMAS 13.1 Dada la fórmula
f(x) = x - 8x + 12
2

a) Determine en forma analítica el máximo y el valor correspondiente de x para esta función (use por ejemplo, diferenciación). b) Verifique que con la ecuación (13.7) se obtienen los mismos resultados con base en los valores iniciales x = 0,x = 2 y x = 6. 13.2 Dada la función
0 l 2

13.5 Repita el problema 13.3, pero ahora use el método de Newton. Emplee un valor inicial de x = 2 y realice tres iteraciones. 13.6 Analice las ventajas y desventajas de la búsqueda de la sección dorada, interpolación cuadrática y el método de Newton para localizar un óptimo valor en una dimensión. 13.7 Emplee los siguientes métodos para determinar el máximo de
0

f(x) = 2..Y - 1 J5x

2

+ \Ax

3

- 0.25.V

4

/(,v) = -l.5x

6

- 2 x + 12*
4

a) Grafique la función. /;) Use métodos analíticos para probar que la función es cóncava para todos los valores de x. <;) Diferencie la función y después use un método de localizaf(x) = 6x + 1.5x + 3x + x ción de raíces para determinar el máximo de f(x) y el valor correspondiente de x. 13.3 Encuentre el valor de x que maximiza f(x) en el problema Use métodos analíticos y gráficos para mostrar que la función 13.2, usando la búsqueda de la sección dorada. Emplee los valo- tiene un mínimo para algún valor de x en el rango — 2 < x < 1. 13.9 Emplee los siguientes métodos para encontrar el máximo res iniciales de x¡ = 0 y x = 2 y realice 3 iteraciones. 13.4 Repita el problema 13.3, pero ahora use interpolación de la función del problema 13.8: cuadrática. Emplee valores iniciales de x = 0,x, = 1 ,x = 2 y a) Búsqueda de la sección dorada (x¡ = — 2, x„ = 1, £ — i'oulioc 3 iteraciones. 1%).
0 s
2
3

a) Búsqueda de la sección dorada (x¡ = —2, x = 4, e = 1%). b) Interpolación cuadrática (x = 1.75, x, = 2, x = 2.25, iteraciones = 5). c) Método de Newton (x = 2.5, e = 1 %). 13.8 Considere la siguiente función:
u s 0 2 4

u

0

2

8

PROBLEMAS

/>) Interpolación cuadrática (.v„ ~ 2, .v, = — 1, x = 1, iteraciones — 5). i) Método do Newton (x — — 1, e = 1 %). I l, 1 0 ('onsiilere la siguiente función:
2 0 t

Itere hasta que el error relativo esto por debajo de un criterio de paro o exceda un máximo número de ileíacionos. Regrese ambos al óptimo de x y f(x). Minimice el número evaluaciones de función.

I /( t ) I \

.v

Non Mee 10 iteraciones con interpolación cuadrática para ubicar i'l IIIIIIIIIU). Comente sobre la convergencia de sus resultados (x
0

-

().l,.v, -= 0.5, x =
2

5.0).
2 3 A

I I. 1 1 ('onsidere la siguiente función:
/'(\) ^ 2 + 5x + 6x + 2x + 2x

focalice el mínimo al encontrar la raíz de la derivada de esta liiiK'ión. Use bisección con valores iniciales de x¡ = —2 y x

1 3 1 .2 Determine el mínimo de la función del problema 13.11 K oii los siguientes métodos: u) Método de Newton (x = — 1, e = 1%). Ii) Método de Newton, pero ahora usando aproximación por diferencias finitas para estimar las derivadas.
0 s

-I

u

Pruebe su programa con el mismo problema dado en el ejemplo 13.1. 13.14 Desarrolle un subprograma como el descrito en el problema 13.13, pero ahora haga un reconocimiento para determinar si el problema involucra minimización o maximización, y después con base en este reconocimiento implemente en forma adecuadu la búsqueda de la sección dorada. 13.15 Desarrolle un subprograma usando un programa o lenguaje macro para implementar el algoritmo de interpolación cuadrática. Diseñe el subprograma de tal forma que esté expresamente diseñado para localizar un máximo. La subrutina deberá tener las siguientes características: • Utilice como base en dos valores iniciales y haga que el programa genere el tercer valor inicial a la mitad del intervalo. Verifique si los valores iniciales ajustan a un máximo. Si no es así, la subrutina no debe implementar el algoritmo, pero debe regresar un mensaje de error. Itere hasta que el error relativo esté por debajo de un criterio de paro o exceda un número máximo de iteraciones. Encuentre ambos, el óptimo x y f(x). Minimice el número evaluaciones de función.

^ ftxi + 8x¡) - f(x¡ - Sx¡)
2¿x,

M . , )_ = f{x¡

+ Sx¡) - 2 / ( x , ) + f(x¡ - 8XJ )

^

N u t iu i 'i H ¡ t M |O H u i u e n c t

ilmuli' S i — una fracción de perturbación ( = 0.01). Use un valor Pruebe su programa con el mismo problema como en el ejemplo liitrhil de .»•„ = — 1 e itere para £, = 1%. 13.2. M I ' I )es!irrolle un subprograma usando un programa o lengua- 13.16 Desarrolle un subprograma mediante un programa o! len|n iniiiio para implementar el algoritmo de la búsqueda de la guaje macro para implementar el método de Newton. La subrutina dorada. Diseñe el subprograma de tal forma que esté deberá tener las siguientes características: diseñado para localizar un máximo. La subrutina I M H H I 'I tener las siguientes características: • Itere hasta que el error relativo esté por debajo de un criterio de paro o exceda un número máximo de iteraciones. • Veri fique si los valores iniciales ajustan a un máximo. Si no • Encuentre ambos, el óptimo x y/(x). i\s así, la subrutina deberá implementar el algoritmo, pero deberá regresar mostrando un mensaje de error. Pruebe su programa con el mismo problema del ejemplo 13.3.

CAPITULO 14 Optimización multidimensional sin restricciones
I
Este capítulo describe las técnicas para encontrar el mínimo o máximo de una función do varias variables. Recuerde del capítulo 13 que nuestra imagen visual de una búsqueda unidimensional fue como una montaña rusa. Para el caso en dos dimensiones, la imagen es ahora como la de montañas y valles (véase figura 14.1). Para problemas de gratulen dimensiones, no son posibles imágenes adecuadas. Se ha optado por limitar este capítulo a los casos en dos dimensiones. Se adoptar A este planteamiento debido a que las formas características esenciales de las búsqueda* multidimensionales son a menudo más comunicativas visualmente. Las técnicas para la optimización multidimensional sin restricciones se pueden olí» sificar de varias formas. Para propósitos del presente análisis, se dividirán dependiendo de si se requiere la evaluación de la derivada. Los procedimientos que no requieren dicha evaluación se llaman métodos no gradientes o directos. Aquellos que requieren las dei i vadas son llamados métodos gradientes o métodos de descenso (o ascenso). 14.1 M É T O D O S DIRECTOS Estos métodos varían de procedimientos de fuerza bruta simple a técnicas más eleganlox que intentan explotar la naturaleza de la función. Se empezará el análisis con el procedí miento de fuerza bruta.
FIGURA 14.1 La forma más tangible de visualizar búsquedas en dos dimensiones es en el contexto de ascender una montaña (maximización) o descender a un valle (minimización). a) Mapa topográfico bidimensional (2-D) de la montaña que corresponde a la gráfica tridimensional (3-D| de la montaña en el inciso b).

Líneas de f constante

14.1.1

Búsqueda aleatoria

Un simple ejemplo del procedimiento de fuerza bruta es llamado el método de la búsqueda aleatoria. Como su nombre lo indica, este método evalúa en forma repelida In función mediante la selección aleatoria de valores de la variable independiente. Si un número suficiente de muestras se lleva a cabo, el óptimo será eventualmente localizado.
EJEMPLO 14.1 Método de la búsqueda aleatoria

Enunciado del problema. máximo de
2

Use un generador de números aleatorio para localizar el

f(x, y) = y - x - 2x - 2xy - y

2

(E14.1.1)

en el dominio acotado porx = —2 a 2, y y = 1 a 3. El dominio se describe en la figura 14.2. Observe que un solo máximo de 1.5 ocurre e n x = — 1 y y = 1.5. Solución. Los generadores de números aleatorios en forma típica generan valores entre 0 y 1. Si se designa a tal número como r, la siguiente fórmula puede ser usada para generar valores de x aleatorios en un rango de x¡ a x :
u

x = x, + (x

u

-

x¡)r
u

Para la presente aplicación, x¡= — 2 y x = 2, y la fórmula es x = -2+(2( - 2 ) ) r = - 2 + 4r

Esta se puede probar al sustituir 0 y 1 para obtener —2 y 2, respectivamente. De forma similar para y, una fórmula para el presente ejemplo se puede desarrollar como
y = yi + (y u

y¡)r = 1 + (3 - l)r = 1 + 2r

FIGURA 1 4 . 2
Ecuación (El 4 .1.1) que muestra el máximo en x = - 1 y y = 1 .5.

Máximo

OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

'[ j ¡ • ¡

El siguiente código en Fortran 90 usa la subrutina RANDOM de un número aléalo rio hecha en un Fortran 90 visual y digital (Digital Visual Fortran 90) para generar pares (x, y). Éstos se sustituyen en la ecuación (E14.1.1). El máximo valor de entre estas pruebas aleatorias se guarda en la variable maxf, y los valores correspondientes de x y y en maxx y maxy, respectivamente. Se toma un total de 300 muestras y los resultados se despliegan cada 30 iteraciones.
Program Jump IMPLICIT N0NE INTEGER : : i , j , i t e r REAL : : x,y,f,fn,maxf,maxx,maxy,rnd f ( x , y) - y - x - 2.*x**2 - 2.*x*y - y**2 maxf = -999.e9 00 i - 1 , 10 D O J - 1 . 30 iter - iter + 1 CALL Random(rnd) x - - 2 . + 4. * rnd y - 1 . + 2. * rnd f n - f ( x , y) I F (fn.GT.maxf) THEN maxf = fn maxx - x maxy = y END I F END D O PRINT * , i t e r , maxx, maxy, maxf END D O OUTPUT: 30 60 90 120 150 180 210 240 270 300

-9 -9 -9 -9 -9 -9 -9 -9

483753E-01 483753E-01 799424E-01 799424E-01 799424E-01 799424E-01 799424E-01 .938087E-01 -1.003075 -1.003075

1 1 1 1 1 1 1 1 1 1

525812 525812 510029 510029 510029 510029 510029 503096 498462 498462

1 1 1 1 1 1 1 1 1 1

241338 241338 248693 248693 248693 248693 248693 249875 249969 249969

Los resultados indican que la técnica rápidamente arriba al máximo verdadero.

Este simple procedimiento de fuerza bruta trabaja aun en discontinuidades y luncio nes no diferenciables. Además, siempre encuentra el óptimo global más que el local, 1

j

14; 1

MÉTODOS DIRECTOS

principal deficiencia es que como crece el número de variables independientes, ol esfuerzo de implementación requerido puede ser gravoso. Además, no es eficiente, ya que no toma en cuenta el comportamiento de la función realzada. Los procedimientos restantes descritos en este capítulo toman en cuenta el comportamiento de la función, asi como los resultados de las iteraciones previas para mejorar la velocidad de convergencia. En consecuencia, aunque la búsqueda aleatoria puede probar ser útil en un contexto de problemas específicos, los siguientes métodos tienen una utilidad más general y casi siempre tienen la ventaja de tener una convergencia más eficiente. Se debe observar que se dispone de técnicas de búsqueda más sofisticadas. Éstas son procedimientos heurísticos que fueron desarrollados para manejar problemas no lineales y/o discontinuos que la optimización clásica usualmente no maneja bien, si no es que todos. Simulación de recocido, búsqueda tabú, redes neuronales artificiales y algoritmos genéticos son unos pocos ejemplos. El más ampliamente utilizado es el algoritmo genético, con un número disponible de paquetes comerciales. Holland (1975), iniciador del procedimiento del algoritmo genético, y Goldberg (1989) y Davis (1991) proporcionan buena revisión de la teoría y aplicación del método. 14.1.2 Univariabilidad y búsquedas patrón

Es muy agradable tener un procedimiento eficiente de optimización que no requiera evaluar las derivadas. El método de búsqueda aleatoria, antes descrito, no requiere la evaluación de la derivada, pero no es muy eficiente. En esta sección se describe un procedimiento, el método de búsqueda univariable, que es más eficiente y además no requiere la evaluación de la derivada. La estrategia básica a resaltar del método de búsqueda univariable es que cambia una variable a la vez para mejorar la aproximación, mientras las otras variables se mantienen constantes. Dado que únicamente se cambia una variable, el problema se reduce a una secuencia de búsquedas en una dimensión, que se puede resolver mediante una variedad de métodos (entre ellos los descritos en el capítulo 13).

i i
I

riOURA 14.3 ion gráfica de I'HIII (.unduce una

y

382

OPTIMIZACIÓN MULTIDIMENSIÓNAL SIN RESTRICCIONES

Realicemos una búsqueda univariable por medio de una gráfica, como se muestra en la figura 14.3. Se comienza en el punto 1, y se mueve a lo largo del eje x con la y constante hacia el máximo en el punto 2. Se puede ver que el punto 2 es un máximo al observar que la trayectoria a lo largo del eje x justo toca una línea del contorno en el punto. Luego, muévase a lo largo del eje y con la x constante hacia el punto 3. Continúeeste proceso generando los puntos 4, 5, 6, etcétera. Aunque se está moviendo en forma gradual hacia el máximo, la búsqueda comienza a ser menos eficiente al moverse a lo largo de una angosta cresta hacia el máximo. Sin embargo, también observe que las líneas unen puntos alternos tales como 1-3, 3-5 o 2-4; el punto 4-6 va en la dirección general del máximo. Esas trayectorias presentan una oportunidad para llegar directamente a lo largo de la cresta hacia el máximo. Tales trayectorias son llamadas direcciones patrón. Se dispone de algoritmos formales que capitalizan la idea de las direcciones patrón para encontrar los valores óptimos en forma eficiente. El más conocido de dichos algoritmos es el llamado método de Powell. Este se basa en la observación (véase l;i figura 14.4) de que si los puntos 1 y 2 se obtienen por búsquedas en una dimensión en l¡i misma dirección, pero con diferentes puntos de partida, entonces la línea formada por I y 2 podría dirigirse hacia el máximo. Tales líneas son llamadas direcciones conjugadas. En efecto, se puede demostrar que sif(x, y) es una función cuadrática, las búsquedas secuenciales a lo largo de las direcciones conjugadas convergerán exactamente en un número finito de pasos, sin importar el punto de partida. Puesto que una función general no lineal a menudo puede estar razonablemente aproximada a una función cuadrática, los métodos basados en direcciones conjugadas son por lo común bastante eficientes y son en realidad convergentes en forma cuadrática cuando se aproximan al óptimo. Se implementará en forma gráfica una versión simplificada del método de Powell para encontrar el máximo de

FIGURA 14.4 Direcciones conjugadas.

FIGURA 14.5 Método de Powell.

f(x,y)=c-(x-a) ~(y~b)
2

2

donde a,byc son constantes positivas. Esta ecuación resulta en contornos circulares en el plano x,y, como se muestra en la figura 14.5. Se inicia la búsqueda en el punto 0 con las direcciones iniciales A, y h . Observe que h y h no son necesariamente direcciones conjugadas. Desde cero, se mueve a lo largo de h hasta un máximo que es localizado en el punto 1. Después se busca del punto 1 a lo largo de la dirección h para encontrar el punto 2. Luego, para una nueva búsqueda en la dirección h-¡ a través de los puntos 0 y 2. Se busca a lo largo de esta dirección hasta que se localice el máximo en el punto 3. Luego la búsqueda va del punto 3 en la dirección h hasta que se localice el máximo en el punto 4. Del punto 4 se llega al punto 5, pero de nuevo buscando a lo largo de hy Ahora, obsérvese que ambos puntos, 5 y 3, se han localizado por búsqueda en la dirección ¿ , desde dos puntos diferentes. Powell ha demostrado que A (formado por los puntos 3 y 5) y h son direcciones conjugadas. Así, buscando desde el punto 5 a lo largo de h , nos llevará directamente al máximo. El método de Powell se puede refinar para hacerlo más eficiente, pero los algoritmos formales van más allá del alcance de este texto. Sin embargo, es un método eficiente que converge en forma cuadrática sin requerir evaluación de la derivada.
2 x 2 x 2 2 3 4 3 4

14.2

MÉTODOS GRADIENTE Como su nombre lo indica, los métodos gradiente usan en forma explícita información de la derivada para generar algoritmos eficientes que localicen el óptimo. Antes de describir los procedimientos específicos, primero se revisarán algunos conceptos y operaciones matemáticas clave.

384

OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

14.2.1

Gradientes y H e s s i a n s

Recuerde del cálculo que la primera derivada de una función unidimensional proporciona una pendiente o tangente de la función que es diferenciada. Desde el punto de vista de la optimización, ésta es una información útil. Por ejemplo, si la pendiente es positiva, nos indica que al aumentar la variable independiente nos conducirá a un valor más alto de la función que se está explorando. Del cálculo, también recuerde que la primera derivada puede indicarnos cuándo se ha encontrado un valor óptimo, puesto que éste es el punto donde la derivada tiende a cero. Además, el signo de la segunda derivada puede indicarnos si se ha alcanzado un mínimo (positivo en la segunda derivada) o un máximo (negativo en la segunda derivada). Esas ideas fueron útiles para los algoritmos de búsqueda en una dimensión que se exploró en el capítulo anterior. Sin embargo, para entender por completo las búsquedas multidimensionales, se debe primero entender cómo la primera y la segunda derivada se expresan en un contexto multidimensional. El gradiente. Suponga que se tiene una función en dos dimensiones f(x, y). Un ejemplo podría ser su altura sobre una montaña como una función de su posición. Suponga que usted está en un lugar específico sobre la montaña (a, b) y quiere saber la pendiente en una dirección arbitraria. Una forma para definir la dirección es a lo largo de un nuevo eje h que forma un ángulo 9 con el eje x (véase figura 14.6). La elevación a lo largo de este nuevo eje puede pensarse como una nueva función g (h). Si usted define su posición como si estuviera en el origen de este eje (es decir, h — 0), la pendiente en esta dirección podría designarse como g'(0). Esta pendiente, que es llamada derivada direccional, se puede calcular a partir de las derivadas parciales a lo largo de los ejes x y y por
(14.1)

donde las derivadas parciales son evaluadas c o n * — a y y = b.

FIGURA 1 4 . 6
El gradiente direccional se define a lo largo de un eje h que forma un ángulo 6 con el eje x. x

h

WffTODOS GRADIENTE

tu

Suponiendo que su meta es obtener la mayor clevacitSn con el siguiente paso, ahora la pregunta lógica podría ser: ¿En qué dirección está el paso de ascenso'/ La respuosto es clara, porque matemáticamente se hace referencia a él como el gradiente, el cual so define como

v

f = ir + -fi
1
^~
( x )

(14.2)

dx oy Este vector también es referido como "del/". El cual representa la derivada direccional de f(x, y) en el punto x = a y y = b. La notación vectorial proporciona un medio conciso para generalizar el gradiente a n dimensiones, como

V/(x) =

OX\
dx

(x)

2

dx„

(x)

¿Cómo se usa el gradiente? Para el problema de subir la montaña, si lo que interesa es ganar elevación tan rápidamente como sea posible, el gradiente nos indica en qué dirección movernos y cuánto ganaremos por tomarla. ¡Observe, sin embargo, que dicha estrategia no necesariamente nos lleva en una trayectoria directa a la cima! Más tarde, en este capítulo, se analizará estas ideas con mayor profundidad.
EJEMPLO 1 4 . 2 Utilización del gradiente para evaluar la trayectoria de paso ascendente

]

Enunciado del problema. cendente para la función
/(-v, y) = xy
2

Emplee el gradiente para evaluar la dirección del paso as-

<

¡

en el punto (2,2). Se considera que la x positiva está dirigida hacia el este y la y positiva apunta al norte. Solución. Primero, la elevación se puede determinar como
2

i
j

j i
| i ;

/ ( 4 . 2) = 2 ( 2 ) - 8 Ahora, las derivadas parciales pueden ser evaluadas, ^ dx
d
=

y = 2 =4
2 2

i -L=2xy

= 2(2)(2) = 8

386
I |

OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

las cuales se pueden usar para determinar el gradiente como Y / = 4i + 8j

| Este vector puede ser bosquejado en un mapa topográfico de la función, como en la I figura 14.7. Esto inmediatamente nos indica que la dirección que debe tomarse es 6 = tan' (^j
1

= 1 . 1 0 7 radianes ( = 63.4°)

j

respecto al eje x. La pendiente en esta dirección, la cual es la magnitud de V/, puede ser calculada como V 4 + 8 = 8.944
2 2

'

Así, durante el primer paso, inicialmente se ha ganado 8.944 unidades de aumento de elevación de pendiente por unidad de distancia recorrida a lo largo de la trayectoria empinada. Observe que la ecuación (14.1) da el mismo resultado, g'(0) = 4 eos (1.107) + 8 sen (1.107) = 8.944 Note que para cualquier otra dirección, digamos 9 = 1.107/2 = 0.5235, g'(0) = 4 eos (0.5235) + 8 sen (0.5235) = 7.608, la cual es más pequeña. Al moverse hacia adelante, tanto la dirección como la magnitud del paso de la trayectoria cambiarán. Estos cambios se pueden cuantificar en cada paso mediante el gradiente, y la dirección del ascenso se modificará de acuerdo con esto.

; ! i

FIGURA 14.7 La flecha sigue la dirección de pasos ascendente calculado con el gradiente.

1 _

i

1

1

1

0

1

2

3

1 4

• x

14.2

MÉTODOS GRADIENTE

387

I |

Se puede obtener una cierta perspectiva al inspeccionar la figura 14.7. Como se indica, la dirección del paso ascendente es perpendicular, u ortogonal, al contorno en la elevación en la coordenada (2, 2). Esta es una característica general del gradiente.

Además de definir la trayectoria de paso, se puede también usar la primera derivada para discernir si se ha alcanzado un óptimo. Como en el caso para una función de una dimensión, si las derivadas parciales con respecto ax y y son cero, se ha alcanzado el óptimo en dos dimensiones. El Hessian. Para problemas de una dimensión, ambas derivadas, la primera y la segunda, proporcionan información valiosa para la búsqueda del óptimo. La primera derivada a) proporciona una trayectoria más grande de la función y b) indica que se ha alcanzado el óptimo. Una vez en el óptimo, la segunda derivada indicará si es un máximo [negativo f"(x)] o un mínimo [positivo f"(x)]. En los párrafos anteriores, se ilustró cómo el gradiente proporciona la mejor trayectoria local para problemas multidimensionales. Ahora, se examinará cómo se usa la segunda derivada en tales contextos. Puede esperarse que si las segundas derivadas parciales con respecto a x y y son ambas negativas, entonces se ha alcanzado un máximo. La figura 14.8 muestra una función en la que esto no es cierto. El punto (a, b) de esta gráfica parece ser un mínimo cuando se observa a lo largo, ya sea de la dimensión x o de la>>. En ambos casos, las segundas deri-

FIGURA 14.8 Un punto de silla (x = o y y = b) . Observe que al ser vista la curva a lo largo de las direcciones x y y, la función parece ir hacia un mínimo (la segunda derivada es positiva), mientras que al verse a lo largo del eje x = y, es cóncava hacia abajo (la segunda derivada es negativa).

,

f(x< y) t

388

OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

vadas parciales son positivas. Sin embargo, si la función se observa a L O largo de lu Unen y = x, puede verse que ocurre un máximo en el mismo punto. Esta fo R M U es llamada do y, claramente, no ocurren ni un máximo ni un mínimo en el p u n t o . Ya sea que ocurra un máximo o un mínimo, esto involucra no s«ólo a las PARCIULCN con respecto ax y y, sino también a la segunda parcial con respecto a JC y y. Suponiendo que las derivadas parciales sean continuas en y cerca del punto que hah>rá de evaluarse, se puede calcular la siguiente cantidad:

silla
\H\ =

A /
2

8x

2

dy

2 K

dxdy

(14.3)

Pueden ocurrir tres casos: • • Si | H | > 0 y Si | H | > 0 y

a^fdx > (Pfdx <
2 2
2

0, entonces

0, entonces

f(x, y) f(x, y)

tiene un mínimo local.

tiene un máximo local.

Si | H | < 0, entonces f(x, y) tiene un punto de silla.
2

df "1 " 9 / La cantidad | H | es igual al determinante de una matriz f o r m a d a con las scguiulim dxdy dx derivadas. H = (14.4)
1
2

df
2

9 /
2

_ dydx

dy

2

_

donde esta matriz se encuentra formalmente referida como el Hessia j% d e / Además proporciona un medio para discernir si una función mxiltidimensional ha alcanzado el óptimo; el Hessian tiene otros usos en optimización ( p o r ejemplo, para lu forma multidimensional del método de Newton). En particular, p e r n o t e búsquedas qiip incluyen curvatura de segundo orden para obtener resultados superio» res. Aproximaciones por diferencias finitas. Se debe mencionar que, j p a r a los casos don de son difíciles o inconvenientes de calcular en forma analítica, a m b o s , el gradiente y el determinante de Hessian, se pueden evaluar numéricamente. En la m_.ayoría de los castiN se emplea el procedimiento que se introdujo en la sección 6.3.3 p a j a el método de la secante modificado. Esto es, las variables independientes se pueder^ modificar ligera mente para generar las derivadas parciales requeridas. Por ejemplo, si se adopta el proco dimiento de diferencias centrales, éstas se pueden calcular como
9/ dx d¿ dy df
2 = 2 = =

f(

x

+ 2Sx

Sx,y)-f(x-Sx,y)

(I4..1)

f(x,y+Sy)-f(x,y-Sy) 2Sy f(x + Sx, y) - 2f(x, Sx
2

(14,n) (14.7)

y) - f(x - Sx, y)

dx

' Observe que

d J!(dx dy) = d fl(dy dx).
2 2

rmvt
í)y
2
2

m c i w w w v w i m r

_ / ( ^ y + ¿y) - 2 / ( . v , y) - / ( . v , y • ~
&y
2

M

(14.8)

a/ _
3x3_y
/ ( x + 5x, y + Sy) - /(* + Sx, y - Sy) - f(x - Sx, y + Sy) + f(x - Sx, y 4SxSy Sy)

(14.9) donde S es un valor fraccional algo pequeño. Observe que los métodos empleados en paquetes de software comerciales también usan diferencias hacia adelante. Además, ellos son usualmente más complicados que las aproximaciones enlistadas en las ecuaciones (14.5) a la (14.9). Por ejemplo, la librería IMSL basa la perturbación en el épsilon de la máquina. Dennis y Schnabel (1996) proporcionan más detalles sobre el procedimiento. Sin importar cómo se implemente la aproximación, el punto importante es que se pueda tener la opción de evaluar el gradiente y/o el Hessian en forma analítica. Esto puede algunas veces ser una tarea ardua, pero el comportamiento del algoritmo puede ser lo bastante benéfico como para que el esfuerzo valga la pena. Las derivadas de forma cerrada serán exactas, pero lo más importante es que reduce las evaluaciones de la función. Este último punto tiene un impacto crítico en el tiempo de ejecución. Por otro lado, usted practicará con frecuencia la opción de calcular estas cantidades internamente mediante procedimientos numéricos. En muchos casos, el comportamiento será el adecuado y se evita la dificultad de numerosas diferenciaciones parciales. Tal podría ser el caso de los optimizadores usados en ciertas hojas de cálculo y paquetes de software matemático (por ejemplo, Excel). En tales casos, se podría no tener la opción de introducir un gradiente y un Hessian derivado en forma analítica. Sin embargo, para problemas de tamaño pequeño o moderado esto no es una gran desventaja. 14.2.2 M é t o d o de pasos ascendente

Una estrategia obvia para subir una colina podría ser determinar la pendiente máxima en la posición inicial y después comenzar a caminar en esa dirección. Pero claramente surge otro problema casi de inmediato. A menos que usted realmente tenga suerte y empiece sobre una cresta que apunta directamente a la cima, tan pronto como se mueva, su camino podría divergir en la dirección de pasos ascendente. Al darse cuenta de este hecho, usted podría adoptar la siguiente estrategia. Podría caminar una distancia corta a lo largo de la dirección gradiente. Luego podría detenerse, reevaluar el gradiente y caminar otra distancia corta. Mediante la repetición de este proceso podría llegar eventualmente al pico de la colina. Aunque tal estrategia parece ser superficialmente buena, no es muy práctica. En particular, la reevaluación continua del gradiente puede ser demandante en términos computacionales. Se prefiere un planteamiento que involucra moverse en un camino fijo a lo largo del gradiente inicial hasta que f(x, y) detenga los incrementos; es decir, pase a ser el nivel a lo largo de su dirección de viaje. Este punto de paro pasa a ser el punto inicial donde V/es reevaluada y se sigue una nueva dirección. El proceso se repite hasta que se alcance la cima. Este procedimiento es conocido como método de pasos aseen-

FIGURA 14.9 Representación gráfica del método de pasos ascendente.

dente} Es la más directa de las técnicas de búsqueda del gradiente. La idea básica detrito del procedimiento se describe en la figura 14.9. Comenzaremos en un punto inicial (x ,y ) etiquetado como " 0 " en la figura. En este punto, se determina la dirección de pasos ascendente; esto es, el gradiente. Entonces se busca a lo largo de la dirección del gradiente, h , hasta que se encuentra un máximo, el cual es etiquetado como " 1 " en la figura. El proceso entonces se repite. Así, el problema se puede dividir en dos partes: 1) determinar la "mejor" dirección para la búsqueda y 2) establecer "el mejor valor" a lo largo de esa dirección de búsqueda. Como se verá, la efectividad de varios algoritmos descritos en las siguientes páginas depende de qué tan hábil seamos en ambas partes. Por ahora, el método de pasos ascendente usa el método del gradiente como su el ce ción para la "mejor" dirección. Se ha mostrado ya cómo se evalúa el gradiente en el ejemplo 14.1. Ahora, antes de examinar cómo se lleva el algoritmo para localizar el máximo a lo largo de la dirección de pasos, se debe hacer una pausa para explorar el modo de trans formar una función de x y y en una función de h a lo largo de la dirección gradiente. Comenzando e n x y y , las coordenadas de cualquier punto en la dirección gradiente pueden expresarse como
0 0 0 0 0

x =x

0

+

—h dx
d

(14.10)

f

,

y = yo + dy

(14.11)

2

Debido ii nuestro ónlasis sobre la maximización, se usurrt lii terniinolonla do /w.vuv u,<¡fanlfnh*. \'\
UNIIIÍI

mismo en loque se puede usar también pum lu mlmmi/.ueión en esto easo no

lu terminología do

pimt»

usctndtnte.

14.2

MÉTODOS GRADIENTE

391

V f = 3 i + 4j

FIGURA

14.10

La relación entre una dirección arbitraria hy las coordenadas x y y.

donde h es la distancia a lo largo del eje h. Por ejemplo, supóngase que x — 1 y y = 2 y V / = 3i + 4j, como se muestra en la figura 14.10. Las coordenadas de cualquier punto a lo largo del eje h están dadas por
0

0

x = 1 + 3h y = 2 + Ah

(14.12) (14.13)

El siguiente ejemplo ilustra la forma en que se pueden usar estas transformaciones para convertir una función de dos dimensiones de x y y en una función h de una dimensión.
EJEMPLO 1 4 . 3 Desarrollando una función 1 -D a lo largo de la dirección gradiente

i

Enunciado del problema. nes:
f(x,

Suponga que se tiene la siguiente función de dos dimensio-

y) — 2xy + 2x — x"

Desarrolle una versión unidimensional de esta ecuación a lo largo de la dirección gradiente en el punto x = — 1 y y = 1. Solución.
9/ dx 9/ dy

Las derivadas parciales se pueden evaluar en ( — 1, 1).

= 2y + 2 - 2x = 2(1) +"2 - 2 ( - l ) = 6 2x -Ay = 2(—1) — 4(1) = - 6

Por tanto, el vector gradiente es V/' = 6i - 6j

392 ¡ | i
s

OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

Para encontrar el máximo, se podría buscar a lo largo de la dirección gradiente; esto es, a lo largo de un eje h que corre a lo largo de la dirección de este vector. La función se puede expresar a lo largo de este eje como f(xo + ?fh, dx y + -fh) = / ( - l + 6h, 1 - 6/0 dy
d 0

\

= 2 ( - l + 6A)(1 - 6/0 + 2 ( - l + 6/0 - ( - 1 + 6hf

- 2(1 -

6h)

2

¡ donde las derivadas parciales se evalúan en x = — lyy= 1. « Al combinar términos, se desarrolla una función de una sola dimensión g(h) que mapea f(x, y) a lo largo del eje h. g(h) = - 1 8 0 / z + 72A - 7
2

Ahora que se ha desarrollado una función a lo largo del camino de pasos ascenden te, se puede explorar cómo resolver la segunda pregunta. Esto es, ¿qué tan lejos a lo largo de este camino se puede viajar? Un procedimiento podría ser moverse a lo largo de este camino hasta encontrar el máximo de esta función. Identificaremos la localización de este máximo como h*. El cual es el valor del paso que maximiza g (y por tanto,/) en lu dirección gradiente. Tal problema es equivalente a encontrar el máximo de una función de una sola variable h. Lo cual se puede hacer mediante diferentes técnicas de busque da de una dimensión como las analizadas en el capítulo 13. Así, se pasa de encontrar el óptimo de una función de dos dimensiones a realizar una búsqueda de una dimensión a lo largo de la dirección gradiente. Este método es llamado de pasos ascendente cuando se usa un paso arbitrario de tamaño h. Si se encuentra que un valor de un solo paso h* nos lleva directamente al máximo a lo largo de la dirección gradiente, el método es llamado óptimo de pasos ascendente.
EJEMPLO 14.4 Óptimo de pasos ascendente

Enunciado del problema. ; f(x,y) = 2xy+ 2x -

Maximice la siguiente función: x -2y
2 2

usando los valores iniciales, x = — lyy=

1.

Solución. Debido a que esta función es muy simple, se podría generar primero una solución analítica. Para hacer esto, las derivadas parciales se evalúan como '
I

— = 2y+ dx
— =

2-2x^=0

;

dy

2x - 4y = 0

Este par de ecuaciones se pueden resolver para el óptimo, x — 2 y y = I. Las segunda* derivadas parciales también se pueden determinar y evaluar en el óptimo

¡)\r
;i.v-

m
2

=
2

-4

9y
2

3 / 9x9y

a/
9y9x

y el determinante de Hessian se calcula [véase ecuación (14.3)],
\H\ = - 2 ( - 4 ) - 2
Z

=4
2 2

Por lo tanto, debido a que | H | > 0 y 9 /73 JC < 0, el valor de la función/(2, 1) es un máximo. Ahora se implementará el método de pasos ascendente. Recuerde que al final del ejemplo 14.3 ya se había implementado los pasos iniciales del problema al generar g(h) = — 180/r + 726 - 7
2

Ahora, ya que ésta es una simple parábola, se puede localizar directamente el máximo (es decir, h = h*) resolviendo el problema, g'(h*) = 0
- 3 6 0 F + 72 = 0

h* = 0.2 Esto significa que si se viaja a lo largo del eje h, g (h) alcanza un valor mínimo cuando h = h* — 0.2. Este resultado se puede sustituir en las ecuaciones (14.10) y (14.11) y resolver .para las coordenadas (x, y) correspondientes a este punto,
x = - 1 + 6 ( 0 . 2 ) = 0.2 y = 1 - 6(0.2) = - 0 . 2

\ FIGURA 14.11 ; El método del paso ascendente para alcanzar el óptimo.

394 | '•

OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

Este paso se describe en la figura 14.11 cuando se mueve del punto 0 al 1. El segundo paso es simplemente implementado al repetir el procedimiento. Primero, las derivadas parciales se pueden evaluar en el nuevo punto de inicio (0.2, — 0 .2) pnrn obtener — = 2 ( - 0 . 2 ) + 2 - 2 ( 0 . 2 ) = 1.2
ít.V

Í

\

— = 2 ( 0 . 2 ) - 4 ( - 0 . 2 ) = 1.2 Por tanto, el vector gradiente es

|

V / = 1.2Í + 1.2j

l Esto significa que la dirección de pasos es ahora dirigida hacia arriba y a la derecha a un > ángulo de 45° con respecto al ejex (véase la figura 14.11). Las coordenadas a lo largo DE ; este nuevo eje h se puede ahora expresar como [
*

x = 0 . 2 + 1.2/z
y = - 0 . 2 + 1.2/!

I \

Al sustituir estos valores en la función se obtiene /(0.2 + 1.2/i, - 0 . 2 + 1.2/z) = g{h) = - 1 . 4 4 / ¡ + 2.88/z + 0.2
2

|
i

El paso h* nos lleva al máximo a lo largo de la dirección buscada y puede ENTONCEN calcularse directamente como
g'(h*) = - 2 . 8 8 / 1 * + 2.88 = 0

\

h* = 1 Este resultado se puede sustituir en las ecuaciones (14.10) y (14.11) y resolver para las coordenadas (x, y) correspondientes a este nuevo punto, x = 0 . 2 + 1.2(1) = 1.4

,

y = - 0 . 2 + 1.2(1) = 1 Como se describe en la figura 14.11, nos movemos a las nuevas coordenadas, etiquetailn como punto 2 en la gráfica, y al hacer esto se mueve más cerca del máximo. El PROCEDÍ miento se puede repetir con el resultado final que converge a la solución analítica, v J y y = 1. ,

j
J |

Puede demostrarse que el método de pasos descendente es linealmente convergente. Además, tiende a moverse muy lentamente a lo largo de crestas largas y angostan, listo es porque el nuevo gradiente en cada punto máximo será perpendicular a la dirección original. Así, la técnica toma muchos pasos pequeños de cruce en la dirección de la nilit hacia la cima. Por tanto, aunque es confiable, hay otros procedimientos que convergen mucho más rápido, particularmente en la vecindad de un óptimo, lil resto de lu sección es dedicada a esos métodos,

14.2.3

Procedimientos de g r a d i e n t e a v a n z a d o
En la sección 14.1.2, se ha visto

Método del gradiente conjugado (Fletcher-Reeves).

cómo en el método de Powell las direcciones conjugadas mejoran mucho la eficiencia de la búsqueda univariable. De manera similar, se puede también mejorar la convergencia lineal de pasos ascendentes por medio de gradientes conjugados. En efecto, un método de optimización que usa gradientes conjugados para definir la dirección de búsqueda, se puede demostrar que es cuadráticamenté convergente. Esto también asegura que el método optimizará una función cuadrática exactamente en un número finito de pasos sin importar el punto de inicio. Dado que muchas funciones con buen comportamiento pueden aproximarse razonablemente bien por una cuadrática en la vecindad de un óptimo, los procedimientos de convergencia cuadrática son a menudo muy eficientes cerca de un óptimo. Se ha visto cómo empezando con dos direcciones de búsqueda arbitrarias, el método de Powell produce nuevas direcciones de búsqueda conjugadas. Este método es cuadráticamente convergente y no requiere la información del gradiente. Por otro lado, si la evaluación de las derivadas es práctica, se puede utilizar algoritmos que combinen las ideas de pasos descendente y conjugar las direcciones para lograr un comportamiento inicial más sólido y de convergencia rápida como la técnica que gravita hacia el óptimo. El algoritmo de gradiente conjugado Fletcher-Reeves modifica el método de pasos ascendente al imponer la condición de que las direcciones de búsqueda del gradiente sucesivas sean mutuamente conjugadas. La prueba y el algoritmo van más allá del alcance del texto, pero se describen en Rao (1996). Método de Newton. El método de Newton para una sola variable (recuerde la sección 13.3) se puede extender a los casos de multivariable. Escriba una serie de Taylor de segundo orden para f(x) cerca de x = x,-, /(x) = / ( ) + V / ( x , ) ( x - X,-) + I ( x - XifHiix
r

X /

- x,)

donde H es la matriz Hessian. En el mínimo,
l

= O Así,

para 7 = 1, 2 , n

V/ = V/(x ) +
/

//,(x-x )=0
/

Si H es no singular,

la cual se puede demostrar que converge en forma cuadrática cerca del óptimo. Este método de nuevo se comporta mejor que el método de pasos ascendentes (véase la figura 14.12). Sin embargo, observe que este método requiere ambos, el cálculo de las segundas derivadas y la inversión de la matriz, en cada iteración. Así, el método no es muy útil en la práctica para funciones con grandes números de variables. Además, el método de Newton puede no converger si el punto inicial no está cerca del óptimo.

FIGURA 1 4 . 1 2
Cuando el punto inicial es cercano al punto óptimo, siguiendo el gradiente puede ser ineficiente. Los métodos de Newton intentan la búsqueda a lo largo de una trayectoria directa hacia el óptimo (línea sólida).

Método de Marquardt. Se sabe que el método de pasos ascendente aumenta el valor de la función aun si el punto inicial está lejos del óptimo. Por otro lado, ya se ha descrito el método de Newton, el cual converge con rapidez cerca del máximo. El método de Marquardt usa el método de pasos descendente cuando x está lejos de x*, y el método de Newton cuando x se acerca a un óptimo. Esto se puede llevar a cabo al modificar la diagonal del Hessian en la ecuación ( 1 4 . 1 4 ) , H, = H,+ai¡

donde oc, es una constante positiva e / es la matriz de identidad. Al inicio del procedimiento, oc, se supone que es grande y a¡ la cual reduce la ecuación ( 1 4 . 1 4 ) al método de pasos ascendente. En tanto continúan I HN iteraciones, a¡ se aproxima a cero y el método pasa a ser el de Newton. Así, el método de Marquardt ofrece lo mejor de ambos mundos: comienza en forma lenta y confiable desde valores de inicio pobres y luego acelera en forma rápida cuando se aproxima al óptimo. Por desgracia, el método todavía requiere la evaluación del Hessiun y la inversión de las matrices a cada paso. Debería observarse que el método de Marquardt es ante todo usado para problema* de mínimos cuadrados. Por ejemplo, la librería del IMSL contiene una subrutinn para este propósito.

PROBLEMAS

397

Métodos de Quasi-Newton. Los métodos de Quasi-Newton, o métodos de variable métrica buscan estimar el camino directo hacia el óptimo en forma similar al método de Newton. Sin embargo, observe que la matriz Hessian en la ecuación (14.14) se compone de las segundas derivadas d e / q u e varían de paso a paso. Los métodos de Quasi-Newton intentan evitar estas dificultades al aproximar Tí con otra m a t r i z s ó l o por medio de las primeras derivadas parciales d e / El procedimiento involucra comenzar con una aproximación inicial de H~ y actualizar y mejorarla con cada iteración. Estos métodos son llamados de Quasi-Newton porque no usan el Hessian verdadero, sino más bien una aproximación. Así, se tienen dos aproximaciones al trabajar en forma simultánea: 1) la aproximación original de la serie de Taylor y 2) la aproximación Hessian. Hay dos métodos principales de este tipo: los algoritmos de Davidon-Fletcher-Powell (DFP) y el de Broyden-Fletcher-Goldfarb-Shanno (BFGS). Ellos son similares excepto en detalles concernientes a cómo manejan los errores de redondeo y su convergencia. BFGS es por lo general reconocido como superior en la mayoría de los casos. Rao (1996) proporciona detalles y declaraciones formales de ambos algoritmos, el DFP y el BFGS.
x

PROBLEMAS H I encuentre la derivada direccional de
/(>. v) ,= 2.v + j
2 2

P i n - 2 y y = 2 en la dirección de h = 3/ + 2j. H J l'nitientre el vector gradiente y la matriz Hessian para cada tilín do las siguientes funciones ,i) íi\,y) = 2xy + 3 ^
2

/.) I\\.y,z) l ' M Dada
/(\,

= x +y
2 2

2

+ 2z

i

.•) /U.y) = m(x + 2xy + 3y )
2

Construya y resuelva un sistema de ecuaciones algebraicas lineales que maximice/(*). Observe que esto se realiza al igualar a cero las derivadas parciales de/con respecto a x y y. 14.4 a) Empiece con un valor inicial de x — 1 y y = 1 y emplee dos aplicaciones del método de pasos ascendente a f(x, y) para el problema 14.3. b) Construya una gráfica con los resultados del inciso a) anterior mostrando la trayectoria de la búsqueda. Encuentre el valor mínimo de
/(A,

y) = (x-

2)

2

+

(Y -

3)

2

Y) ^ 2xy

+

\.5y

-

1.25 A- 2

2y

2

empezando en x — 1 y y = 1, usando el método de pasos descendente con un criterio de paro de £ = 1 %.
5

FIOURA P 1 4 . 9 lu
LII'IM]II (¡cla

de la malla.
-5 -10 -15-20-25

-2

-1 \

0

2

X

<

Menta»,

39B

OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES Diseñe el subprograma do tal forma que esté expresamente di señado para localizar un máximo. Pruebe el programa con f(x,y) del problema 14.6. Use un rango de —2 a 2 para ambos xyy14.9 La búsqueda por malla es otro procedimiento de fuer/a bruta para optimización. La versión en dos dimensiones se des cribe en la figura P14.9. Las dimensiones de x y y se dividen en pequeños incrementos para crear una malla. La función se eva lúa entonces en cada nodo de la malla. Cuanto más densa sea la malla, es más probable localizar el óptimo. Desarrolle un subprograma por medio de un programa o lenguaje macro para implementar el método de búsqueda por malla. Diseñe el subprograma de tal forma que esté expresanien te diseñado para localizar un máximo. Pruebe su programa con el problema del ejemplo 14.1.

1 4 . 6 Realice nuil iteración del método de pasos ascendente para locali/ur el máximo de

,/lv, v) =

3.5.V + 2y + .x - x
2

4

-

2xy

-

y

2

mediante los valores iniciales x = 0, y = 0. Emplee el método de bisección para encontrar el tamaño de paso óptimo en la dirección de la búsqueda del gradiente. 1 4 . 7 Efectúe una iteración del método de pasos descendente del gradiente óptimo para localizar el mínimo de /(.v, y) = -Ix + \ .2x + 1 ly + 2 y - 2xy
2 2

con valores iniciales x = 0 y y = 0. 1 4 . 8 Desarrolle un subprograma usando un programa o lenguaje macro para implementar el método de búsqueda aleatoria.

CAPITULO 15 Optimización restringida
Este capítulo aborda problemas de optimización donde entran enjuego las restricciones. Primero, se analizarán problemas donde ambas, la función objetivo y las restricciones, son lineales. Para tales casos, se dispone de métodos especiales que aprovechan la linearidad de las funciones realzadas. Los llamados métodos de programación lineal y sus algoritmos resultantes, resuelven con gran eficiencia problemas muy grandes con miles de variables y restricciones. Dichos métodos se usan en un amplio rango de problemas en la ingeniería y la administración. Después, se retomará en forma breve un problema más general de optimización restringida no lineal. Finalmente, se proporcionará una revisión de cómo se puede emplear los paquetes de software y librerías para la optimización.

15.1

PROGRAMACIÓN

LINEAL

La programación lineal (o PL por simplicidad) es un procedimiento de optimización que trata de cumplir con un objetivo como el de maximizar las utilidades o minimizar el costo, en presencia de restricciones como lo son las fuentes limitadas. El término lineal denota que las funciones matemáticas que representan ambos, el objetivo y las restricciones, son lineales. El término programación no significa "programación en computadora", más bien denota "programar" o "fijar una agenda" (Revelle y cois. 1997). 15.1.1 Forma estándar

El problema básico de programación lineal consiste en dos partes principales: la función objetivo y un conjunto de restricciones. Para un problema de maximización, la función objetivo es por lo general expresada como Maximizar Z =
y

cx
i

l

+ c¿x

2

+ • • • + c pc
t

n

(15.1)

donde c = pago por cada unidad de la y-ésima actividad que se lleva a cabo y Xj = magnitud de laj'-ésima actividad. Así, el valor de la función objetivo, Z, es el pago total debido al número total de actividades, n. Las restricciones se pueden representar en forma general como a; 1 * 1 +
a/2*2

-\

1 " ax
m

n

< b¡

(15.2)

donde a¡¡ = cantidad de z'-ésima fuente que se consume por cada unidad de /-ésima actividad y h¡ = cantidad de la /-ésima fuente que está disponible. Esto es, las fuentes Hon limitadas.

OPTIMIZACIÓN RESTRINGIDA El segundo tipo general de restricción especifica que todas las actividades deben tener un valor positivo. ,v, > 0
(I.VM

En el contexto actual, esto expresa la noción realística de que, para algunos problemas, la actividad negativa es físicamente imposible (por ejemplo, no se puede producir bienes negativos). Juntas, la función objetivo y las restricciones, especifican el problema de programo ción lineal. Estas indican que se trata de maximizar la amortización para un número do actividades bajo la restricción de que éstas utilizan cantidades finitas de fuentes. Anlos de mostrar cómo se puede obtener este resultado, se desarrollará un ejemplo. Inicializando el problema PL Enunciado del problema. Se desarrolla el siguiente problema del área de la ingeniet in química. Sin embargo, éste es relevante para todas las áreas de la ingeniería que (icnoii que ver con la producción de productos con fuentes limitadas. Suponga que una planta procesadora de gasolina recibe cada semana una canlidiul fija de materia prima para gasolina. Esta última se procesa en dos tipos de gasolina, do calidad regular y prémium. Estas clases de gasolina son de alta demanda; es decir, so tiene garantizada su venta y se obtiene diferentes utilidades para la compañía. Sin om bargo, su producción involucra ambas restricciones, tiempo y almacenaje en sitio. I'oi ejemplo, sólo una de las clases se puede producir a la vez, y las instalaciones csliin abiertas solamente 80 horas por semana. Además, existe un límite de almacenamiento para cada uno de los productos. Todos estos factores se enlistan abajo (observe que umi tonelada métrica, o ton, es igual a 1 000 kg):

Producto Recurso Materia prima para la gasolina Tiempo de producción Almacenamiento Aprovechamiento Regular Prémium D i s p o n i b i l i d a d del r a c u r t s

7 m /tone!ada 10 hr/tonelada 9 toneladas
3

11 m /tonelada 8 hr/tonelada 6 toneladas
3

7 7 m /seman<i 80 hr/semanu
3

150/tonelada

175/tonelada

Desarrolle una formulación de programación lineal para maximizar las utilidades iltf esta operación. Solución. El ingeniero que opera esta planta debe decidir la cantidad a piodueii de cada gasolina para maximizar las utilidades. Si las cantidades producidas cada semiili» de gasolinas regular y prémium son designadas x y .v , respectivamente, la uiiiiniiel» total se puede calcular como
] 2

S~2nnnnn¡n

>nfal

I < A v

J.

17C.V-

13.1

PROGRAMACIÓN L1NIAI

o escribirlo como una función objetivo en programación lineal, Maximizar Z = 150*1 175x
2

¡

1
|
i

Las restricciones se pueden desarrollar en una forma similar. Por ejemplo, el total de gasolina cruda utilizada se puede calcular como Total de gasolina utilizada = 7x^ + 1 \x
2

Este total no puede exceder el abastecimiento disponible de 77 m /semana, así que la restricción se puede representar como
3

7x, + 1 lx < 77
2

Las restricciones restantes se pueden desarrollar en una forma similar, la formulación total resultante para la PL está dada por Maximizar Z = 150*! + 175x Sujeta a 7x, + 1lx < 77 10x, + 8x < 80 X! < 9 x <6 X j , x >0
2 2 2 2 2

(maximizar la ganancia)

(restricciones de materiales) (restricción de tiempo) (restricción de almacenaje "regular") (restricción de almacenaje "prémium") (restricciones positivas)

Observe que el conjunto de ecuaciones anterior constituye la formulación completa de PL. Las explicaciones en los paréntesis de la derecha se han incluido para clarificar el significado de cada ecuación.

15.1.2

Solución gráfica

Debido a que las soluciones gráficas están limitadas a dos y tres dimensiones, tienen utilidad práctica limitada. Sin embargo, son muy útiles para demostrar algunos conceptos básicos que resaltan las técnicas algebraicas generales usadas para resolver problemas con grandes dimensiones en la computadora. Para un problema en dos dimensiones, como el del ej emplo 15.1, la solución espacial se define como un plano conX] medida a lo largo de la abscisa y x , a lo largo de la ordenada. Como las restricciones son lineales, se pueden trazar sobre este plano como líneas rectas. Si el problema de PL se formula adecuadamente (es decir, si tiene una solución), estas líneas restrictivas delinearán una región, llamada el espacio de solución factible, englobando todas las posibles combinaciones dex, y x que obedecen las restricciones y, por tanto, representan soluciones factibles. La función objetivo para un valor particular de Z se puede trazar como otra línea recta y sobrepuesta en este espacio. El valor de Z puede entonces ser ajustado hasta que esté en el máximo valor, mientras todavía toca el espacio factible. Este valor de Zrepresenta la solución óptima. Los valores correspondientes de x y x , donde Z toca el espacio de solución factible, representan los valores óptimos pura las actividades. El siguiente ejemplo deberá ayudar a clarificar el procedimiento,
2 2 { 2

402
EJEMPLO 15.2

OPTIMIZACIÓN RESTRINGIDA Solución gráfica

Enunciado del problema. Desarrolle una solución gráfica para el problema de procesamiento de gasolina que se derivó antes en el ejemplo 15.1: Maximizar Z Sujeta a
7 JCI

150x, + 175x

2

+ l l x < 77
2 2

(1) (2) (3) (4) (5) (6)

10x, + 8x < 80
x\
2

< 9

x < 6
xi xi
>

0

>0

Se ha numerado las restricciones para identificarlas en la siguiente solución gráfica. Solución. Primero, se pueden trazar las restricciones sobre el espacio de solución. Por ejemplo, se puede formular la primera restricción como una línea al reemplazar la desigualdad por un signo de igual y resolver para x :
2

Xl

Así, como en la figura 15.1a, los valores posibles dex, y x que obedecen dicha restricción se hallan por debajo de esta línea (la dirección es designada en la gráfica por la pequeña flecha). Las otras restricciones se pueden evaluar en forma similar, como sobrepuestas sobre la figura 15.1a. Observe cómo éstas encierran una región donde todas se encuentran. Este es el espacio de solución factible (el área ABCDE en la gráfica). Además de definir el espacio factible, la figura 15.1a también proporciona un conocimiento adicional. En particular, se puede ver que la restricción 3 (almacenamiento de gasolina regular) es "redundante". Esto es, el espacio de solución factible no resulla afectado si fuese suprimida. Después, se puede agregar la función objetivo a la gráfica. Para hacer esto, se debe escoger un valor de Z. Por ejemplo, para Z = 0 la función objetivo es ahora
2

0 = 150xi + 175x o, resolviendo para x x 150
2 2

2

175

X l

Como se muestra en la figura 15.16, ésta representa una línea punteada interceptando el origen. Ahora, puesto que estamos interesados en maximizar Z, se puede aumentar osla » digamos 600, y la función objetivo es

DOO

150

175

175

x\

FIGURA 15.1 ' » n ' m gráfica de un problema de programación lineal, a) Las restricciones definen un espacio de solución factible. M li i liilición objetivo se puede incrementar hasta que alcance el valor más alto que cumpla con todas las restricciones. < iiólii uniente, se mueve hacia arriba y a la derecha hasta que toca el espacio factible en un solo punto óptimo.

Así, incrementando el valor de la función objetivo, la línea se mueve lejos del origen. Como la línea todavía está dentro del espacio de solución, nuestro resultado es aún factible. Sin embargo, por la misma razón, todavía hay espacio para mejorarlo. Por tanto, Z se puede seguir aumentando hasta que un incremento adicional lleve la función objetivo más allá de la región factible. Como se muestra en la figura 15.1¿>, el valor máximo de Z corresponde a 1 400 aproximadamente. En este punto, x y x son casi igual a 4.9 y 3.9, en forma respectiva. Así, la solución gráfica indica que si se producen estas cantidades de gasolinas regular y prémium, se alcanzará una máxima utilidad de casi 1 400.
{ 2

Además de determinar los valores óptimos, el procedimiento gráfico proporciona conocimientos adicionales en el problema. Esto se puede apreciar al sustituir de nuevo las soluciones en las ecuaciones restrictivas. 7(4.9) + 11(3.9) = 77 10(4.9) + 8(3.9) = 80 4.9 < 9 3.9 < 6 En consecuencia, como queda también claro en la gráfica, producir la cantidad óptima de cada producto nos lleva directamente al punto donde se encuentran las restricciones de las fuentes (1) y del tiempo (2). Tales restricciones se dice que están enlazadas. Además, la gráfica también hace evidente que ninguna de las restricciones de almacena-

404

OPTIMIZACIÓN RESTRINGIDA

miento [(3) y (4)] actúan como una limitante. Tales restricciones se conocen como iu> enlazadas. Esto nos lleva a la conclusión práctica de que, para este caso, se puedo ¡ni mentar las utilidades, ya sea con un incremento en el abastecimiento de fuentes (la gasolina cruda) o en el tiempo de producción. Además, esto indica que el aumento <M almacenamiento podría no tener impacto sobre las utilidades. El resultado obtenido en el ejemplo anterior es uno de los cuatro posibles resultados que por lo general se puede obtener en un problema de programación lineal. Éstos son: 1. 2. Solución única. Como en el ejemplo, la función objetivo máxima intercepta un solo punto. Soluciones alternas. Suponga que la función objetivo del ejemplo tuviera coeficicn tes, de tal forma que fueran paralelos precisamente a una de las restricciones, lín nuestro problema ejemplo, una forma en la cual esto podría ocurrir, sería que las utilidades fueran cambiadas a $140/ton y $220/ton. Entonces, más que un solo pun to, el problema podría tener un número infinito de óptimos correspondientes a un segmento de línea (véase figura 15.2a). Solución no factible. Como en la figura 15.26, es posible que el problema esté lói mulado de tal manera que no exista solución factible. Esto puede deberse a que se trata con un problema sin solución o a errores en la formulación del problema. I o último puede resultar si el problema está tan sobrerrestringido que ninguna solución puede satisfacer todas las restricciones. Problemas sin límite. Como en la figura 15.2c, esto usualmente significa que el problema está bajorrestringido y, por tanto, con finales abiertos. Como para el caso de la solución no factible, puede a menudo surgir de errores cometidos durante la especificación del problema.

3.

4.

Ahora supongamos que nuestro problema involucra una solución única. El procedí miento gráfico podría sugerir una estrategia numerativa para dar con el máximo. De la

FIGURA 15.2 Adornas de una sola ecuación óptima (por ejemplo, figura 15.1b), existen otros tres resultados posibles de un problema di piogramación lineal: a) alternativa óptima, b) solución no factible y c) en resultado sin límites.

1371

PROGRAMACIÓN

LINEAL

figura 15.1, debería quedar claro que siempre ocurre el óptimo en uno de los puntos esquina donde se encuentran dos restricciones. Tal punto se conoce de manera formal como un punto extremo. Así, fuera del número infinito de posibilidades en el espacio de decisión y enfocándonos sobre los puntos extremo, claramente se reducen las opciones posibles. Además, se puede reconocer que no todo punto extremo es factible; esto es, salislucer todas las restricciones. Por ejemplo, observe que el punto F en la figura 15. \a es un punto extremo, pero no es factible. Si nos limitamos a puntos extremos factibles, ,sc reduce el campo factible todavía más. Por último, una vez que se ha identificado todos los puntos extremo factibles, el que ofrezca el mejor valor de la función objetivo representará la solución óptima. Se podría encontrar esta solución óptima mediante la exhaustiva (e ineficiente) evaluación del valor de la función objetivo en cada punto extremo factible. En la siguiente sección se analiza el método simplex, que ofrece una estrategia preferible que representa en forma gráfica un rumbo selectivo a través de la secuencia de puntos extremos factibles para arribar al óptimo de una manera extremadamente eficiente. 15.1.3 El método s i m p l e x

El método simplex se basa en la suposición de que la solución óptima estará en un punto extremo. Así, el procedimiento debe ser capaz de discernir si durante la solución a un problema ocurre un punto extremo. Para realizar esto, las ecuaciones con restricciones se reformulan como igualdades por medio de la introducción de las llamadas variables de holgura. Variables de holgura. Como lo indica su nombre, una variable de holgura mide cuánto de una fuente restringida está disponible; es decir, cuánta "holgura" de la fuente está disponible. Por ejemplo, recuerde la fuente restringida que se usó en los ejemplos 15.1 y 15.2: 7x, + l l x
2

< 77

Se puede definir una variable de holgura S¡ como la cantidad de gasolina cruda que no se usa para un nivel de producción particular (x,, x ). Si esta cantidad se agrega al lado izquierdo de la restricción, forma la relación exacta
2

7xi +

11 *2 + Si =

11

Ahora se reconoce lo que la variable de holgura nos indicaba. Si ésta es positiva, significa que se tiene algo de "holgura" para esta restricción. Esto es, se cuenta con algo más de recursos que no han sido utilizados por completo. Si es negativa, nos indica que nos hemos excedido en la restricción. Finalmente, si es cero, denota que se cumplió exactamente con la restricción. Es decir, se dispuso de todo el recurso. Puesto que ésta es exactamente la condición donde las líneas de restricción se intersectan, la variable de holgura proporciona un medio para detectar puntos extremos. Una variable de holgura diferente se desarrolla para cada ecuación restringida, resultando en lo que se llama versión completamente aumentada, Maximizar Z = I50*| + I75x
2

406

OPTIMIZACIÓN RESTRINGIDA

Sujeta a 7*i + 1 1JC + 5i
2

=77
+ S
2

(15.4«)
(15.4A)

10xi+8x2

=80

xi x
2 2

+ S

3

=9 + S =6
4

(15.4c-) (15 Ad)

xi, x , Si, S , S , S
2 3

4

> 0

Advierta cómo se han formulado de igual modo las cuatro ecuaciones, de tal manera que las incógnitas están alineadas en las columnas. Se hizo así para resaltar que ahora se trata de un sistema de ecuaciones algebraicas lineales (recuerde la parte tres). En la siguiente sección se mostrará cómo se pueden usar estas ecuaciones para determinar los puntos extremo en forma algebraica. Solución algebraica. En contraste con la parte tres, donde se tenía ra ecuaciones con // incógnitas, nuestro sistema ejemplo [ecuaciones (15.4)] está subespecificado; esto es, tiene más incógnitas que ecuaciones. En términos generales, hay n variables estructuradas (es decir, las incógnitas originales), m excedentes o variables de holgura (una por restricción), y n + m variables totales (estructuradas más excedentes). Para el problema de la producción de gasolina se tienen 2 variables estructuradas, 4 variables de holgura y 6 variables totales. Así, el problema involucra resolver 4 ecuaciones con 6 incógnitas. La diferencia entre el número de incógnitas y el de ecuaciones (igual a 2 en nuestro problema) está directamente relacionada con la forma en que se puede distinguir un punto extremo factible. En forma específica, cada punto factible tiene 2 variables de las 6 que se igualaron a cero. Por ejemplo, los cinco puntos esquina del área ABCDE tienen los siguientes valores cero:
Punto extremo Variables cero
x,, x
2

Esta observación nos lleva a concluir que los puntos extremo se pueden determinni en la forma estándar al igualar las dos variables a cero. En nuestro ejemplo, esto reduce el problema a una forma soluble de 4 ecuaciones con 4 incógnitas. Por ejemplo, para el punto E, haciendo x, = S = 0 se reduce la forma estándar a
4

A B C D E

S|, s Sj,
s

2

4

X], S

4

llx +Si
2

=77 + S
2

8x
X2

2

=80 + S = 9
3

=6
2 2 3 4

la cual se puede resolver para x = 6, S, = 11, S = 32 y S = 9. Junto con *| -- S 0, estos valores definen el punto E,

15.1

PROGRAMACIÓN LINEAL

Para generalizar, una solución básica para m ecuaciones lineales con n incógnitas so desarrolla al igualar n — m variables a cero, y resolviendo las tn ecuaciones para las m incógnitas restantes. Las variables cero son formalmente referidas como variables no básicas, mientras las m variables restantes son llamadas variables básicas. Si todas I UN variables básicas son no negativas, el resultado es llamado solución factible básica. VA óptimo será una de éstas. Ahora un procedimiento directo para determinar la solución óptima podría ser calcular todas las soluciones básicas, para determinar cuáles son factibles, y entre ellas, cuál tiene el valor de Z más grande. Pero éste no es un buen procedimiento por dos razones. Primero, para problemas de tamaños moderados, el procedimiento puede involucrar resolver una gran cantidad de ecuaciones. Para m ecuaciones con n incógnitas, se deben resolver

m

m\(n-m)\

ecuaciones simultáneas. ¡Por ejemplo, si hay 10 ecuaciones (m — 10) con 16 incógnitas (« = 16), se podría tener 8 008 [ = 16!/(10! 6!)] sistemas 10 X 10 de ecuaciones a resolver! Segundo, una porción significativa de éstas puede ser no factible. Por ejemplo, en el problema actual de los C\ — 15 puntos extremos, sólo 5 son factibles. Claramente, si se pudiese evitar resolver todos estos sistemas innecesarios, se podría desarrollar un algoritmo más eficiente. Un procedimiento como tal se describe a continuación. Implementación del método simplex. El método simplex evita las ineficiencias descritas en la sección anterior. Esto lo realiza al comenzar con una solución factible básica. Luego se mueve a través de una secuencia con las otras soluciones factibles básicas que sucesivamente mejoran el valor de la función objetivo. En forma eventual, se alcanza el valor óptimo y termina el método. Se ilustrará el procedimiento mediante el problema de procesamiento de la gasolina de los ejemplos 15.1 y 15.2. El primer paso es empezar en una solución factible básicu (es decir, en una esquina del punto extremo del espacio factible). Para casos como los nuestros, un punto de inicio obvio podría ser el A; esto es, x = x = 0. Las 6 ecuaciones originales con 4 incógnitas serían
l 2

Si S
2

= 77 = 80
S
2

=9 5 = 6
4

Así, los valores iniciales de las variables básicas son dados automáticamente como iguales a los lados derecho de las restricciones. Antes de proceder al siguiente paso, la información inicial se puede ahora resumir en un formato tabular conveniente llamado representación. Como se muestra en la tabla de la siguiente página, la representación proporciona un resumen conciso de la información clave que constituye el problema de programación lineal.

408

OPTIMIZACIÓN RESTRINGIDA
Básica Z x

* 1

2

Si

s

2

s

3

s

4

Solución

Intercepción

Z 5, S s 5
2 3 4

1 0 0 0 0

-150 7 10 1 0

-175 11 8 0
1

0 1 0 0 0

0 0 1 0 0

0 0 0 1 0

0 0 0 0 1

0 77 80 9
ó

1 1 íi 9

Observe que para propósitos de la representación, la función objetivo se expresa como Z - 150*i - 175 *2 - OS, - 0S - 0 S - 0S = 0
2 3 4

(15.5)

El siguiente paso implica moverse a una nueva solución factible básica que nos lleva a una mejora de la función objetivo. Esto se lleva a cabo al aumentar una variable actual no básica (en este punto, x, o x ) por arriba de cero para que Z aumente. Recuerde que, para el ejemplo actual, los puntos extremos deben tener 2 valores cero. Por tanto, una de las variables básicas actuales (S S , S o S ) deben también igualarse a cero. Para resumir este paso importante: una de las variables no básicas actuales debe hacerse básica (no cero). Esta variable se llama variable de entrada. En el proceso, una de las variables básicas actuales se hace no básica (cero). Esta variable se llama variable de salida. Ahora, desarrollaremos un procedimiento matemático para seleccionar las variables de entrada y salida. Debido a la convención de cómo se escribe la función objetivo [véase ecuación (15.5)], la variable de entrada puede ser cualquier variable en la función objetivo que tenga un coeficiente negativo (ya que esto hará a Z más grande). La variable con el valor negativo más grande se escoge de manera convencional porque nos lleva usualmente al incremento más grande en Z. Para nuestro caso, x podría ser la variable de entrada puesto que su coeficiente, —175, es más negativo que el coeficiente d e x , — 150. En este punto se puede consultar la solución gráfica por visualización. Se comienza en el punto A, como se muestra en la figura 15.3. Con base en su coeficiente, se debería escoger x para introducirlo. Sin embargo, para continuar con este breve ejemplo, seleccionamos x¡ puesto que se observa en la gráfica que nos llevará más rápido al máximo. Después, se debe escoger la variable de salida de entre las variables básicas actuales S2, S o S ). Se puede ver gráficamente que hay dos posibilidades. Moviéndonos al punto B se tendrá S igual a cero, mientras que al movernos al punto F tendremos .V, igual a cero. Sin embargo, por la gráfica también queda claro que F no es posible, ya que queda fuera del espacio de solución factible. Así, se decide mover de A a B. ¿Cómo se detecta el mismo resultado en forma matemática? Una forma es calcular los valores para los cuales las líneas de restricción interceptan el eje o línea que corresponde a la variable de salida (en nuestro caso, el eje x,). Se puede calcular este valor como la razón del lado derecho de la restricción (la columna "Solución" de la representación) al coeficiente correspondiente de x¡. Por ejemplo, para la primera variable de holgura restrictiva S , el resultado es
2 1( 2 3 4 2 ( 2 3 4 2 x

Intercepción =

77 7

=11

Las intersecciones restantes se pueden calcular y enlistar como la úllima columna de la tabla. Como 8 es el entero positivo más pequeño, esto significa que la segunda linea

13,1

PROGRAMACIÓN L I N E A L

m

restringida se alcanzará primero en tanto x aumente. Por tanto, S debería ser la variable de entrada. En este punto, se ha movido al punto B (x = S = 0), y la nueva solución básica es ahora
x 2
2 2

7 x i + Si

= 7 7

lOx, x, + S
3

= 80
= 9
S
4

=

6

La solución de este sistema de ecuaciones define en forma efectiva los valores de las variables básicas en el punto B: x, = 8, 5*, = 21, S = 1, S = 6. La tabla se puede usar para realizar los mismos cálculos al emplear el método de Gauss-Jordan. Recuerde que la estrategia básica detrás de Gauss-Jordan implica conver tir el elemento pivote a 1 Y después eliminar los coeficientes en la misma columna arriba Y abajo del elemento pivote (recuerde la sección 9.7) Para este ejemplo, el renglón pivote es S (la variable de entrada) Y el elemento pivote es 10 (el coeficiente de la variable de salida, X J ) . Al dividir el renglón ende 10 Y reemplazar S por x, se tiene
3 4 2 2

Básica Z s,

s

1 0 0 0 0

z

* 1

x

2

Si 0 1 0 0 0

S

2

S

3

S

4

Solución 0 77 8 9

-150 7 1

-175

11
0.8 0 1

0 0 0.1 0 0

0 0 0

1
0

1
0

0 0 0 0 1

3

ñ

OPTIMIZACIÓN RESTRINGIDA

Después, los coeficientes x, en los otros renglones se pueden eliminar. Por ejemplo, |(M« el renglón de la función objetivo, el renglón pivote se multiplica por 150 y se IO M M »»l resultado del primer renglón para dar

Z

* 1

x

1 -0 1

-150 -(-150) 0

-175 -1-120) -55

2

« I

S

2

S

3

S

4

Solución
11

0 -0 0

0 -15) 15

0 0 0

0 0 0

( 1 '.'< ii I|

1

:nn

Operaciones similares se pueden ejecutar en los renglones restantes para obtener la mirva tabla

Básica Z
S,

Z 1 0 0 0 0

x

i 0 0 1 0 0

x

2

Si 0 1 0 0 0 15 -0.7 0.1 -0.1 0

S

3

S

4

Solución 1 200 21 8 1 ó

Intercepción

S

4

-55 5.4 0.8 -0.8 1

0 0 0 1. 0

0 0 0 0 1

:i .HH7 10 6 -1

y>

Así, la nueva tabla resume toda la información para el punto B. Esto incluye el hecho iln que el movimiento ha aumentado la función objetivo a Z = 1 200. Esta tabla se puede usar entonces para representar el próximo, y en este caso, el pum > final. Sólo una más de las variables, x , tiene un valor negativo en la función objetivo, y se escoge, por tanto, como la variable de salida. De acuerdo con los valores de la intei cepción (ahora calculados como la columna de solución sobre los coeficientes de la columna x ), la primera restricción tiene el valor positivo más pequeño y, por tanto, se selecciona a S, como la variable de entrada. Así, el método simplex mueve los puntos dr B a C e n la figura 15.3. Por último, la eliminación Gauss-Jordan se puede implemcnluí para resolver las ecuaciones simultáneas. El resultado es la tabla final,
2 2

Básica Z
X

Z 1 0 0 0 0

* 1

x

2

S ,

S

2

S

3

S

4

Solución i 4 I : Í HHV

2

*1

5
S

3

4

0 0 1 0 0

0 1 0 0 0

10.1852 0.1852 -0.1481 0.1481 -0.1852

7.8704 -0.1296 0.2037 -0.2037 0.1296

0 0 0

1
0

0 0 0 0 1

4 111 A HIIV '¿111

Se sabe que éste es el resultado final porque no quedan coeficientes negativos en el renglón de la función objetivo. La solución final se tabula como x¡ — 3.889 y x v Si
OITÁN
}

4.889, los cuales dan una función objetivo máxima de Z = I 413.889. Además, como .V,

todavía en la base, sabemos que la solución está limitudu por ln primer» y

15.2

OPTIMIZACIÓN RESTRINGIDA N O LINEAL Existe un número de procedimientos para el manejo de problemas de optimización no lineal en la presencia de restricciones. Dichos procedimientos se pueden dividir en forma general en directos e indirectos (Rao, 1996). Un procedimiento típico indirecto usa las muy conocidas funciones de penalización. Estas involucran colocar expresiones adicionales para hacer la función objetivo menos óptima en tanto la solución se aproxima n la restricción. Así, la solución será no aceptada por violar las restricciones. Aunque talos métodos pueden ser útiles en algunos problemas, pueden ser difíciles cuando el problema involucra muchas restricciones. El método de búsqueda del gradiente reducido generalizado, o GRG (por sus siglas en inglés), es uno de los más populares métodos directos (para detalles, véase Lasdon y cois., 1978; Lasdon y Smith, 1992). Este es, de hecho, el método no lineal usado en el Solver de Excel. Primero "reduce" el problema a uno de optimización no restringida. Esto lo hace al resolver un conjunto de ecuaciones no lineales para las variables básicas en términos do variables no básicas. Después, se resuelve el problema no restringido usando procedimientos similares a los descritos en el capítulo 14. Se escoge primero una dirección do búsqueda. La selección por default es un procedimiento cuasi-Newton (BFGS) que, como se describió en el capítulo 14, requiere el almacenamiento de una aproximación de la matriz Hessian. Este procedimiento se ejecuta muy bien en la mayoría de los casos. El procedimiento del gradiente conjugado está también disponible en Excel como una alternativa para problemas grandes. El Solver de Excel tiene la excelente característica que en forma automática cambia al método del gradiente conjugado dependiendo de la disponibilidad de almacenamiento. Una vez que se ha establecido la dirección de búsqueda, se lleva a cabo la búsqueda en una dimensión a lo largo de esa dirección mediante un procedimiento de tamaño de paso variable.

15.3

O P T I M I Z A C I Ó N C O N P A Q U E T E S DE S O F T W A R E Los paquetes de software y librerías tienen grandes capacidades para la optimización. En esta sección, se dará una introducción a algunos de los más útiles. 15.3.1 Momead

Mathcad contiene una función en modo numérico llamada Find, que se puede usar parn resolver hasta 50 ecuaciones algebraicas no lineales simultáneas con restricciones de desigualdad. El uso de esta función para aplicaciones no restringidas se describió en In parte dos. Si Find falla en la localización de una solución que satisface las ecuaciones y restricciones, regresa con un mensaje de error "no se encontró solución". Sin embargo, Mathcad contiene también una función similar llamada Minerr . Esta función da resultados de solución que minimizan los errores en las restricciones aun cuando no puedan encontrarse soluciones exactas. Esta función resuelve ecuaciones y acomoda varias restricciones mediante el método Lenenberg-Marquardt tomando de los algoritmos do dominio público M1NPACK, desarrollados y publicados por el Laboratorio Nacional Argonne.

OPTIMIZACIÓN RESTRINGIDA

Hagamos un ejemplo donde se utiliza Find para resolver un sistema de ecuaciones no lineales con restricciones que introducen los valores iniciales de x = I yy I mediante los símbolos definidos como se muestra en la figura 15.4. La instrucción (¡Ivon entonces le indica a Mathcad que se debe introducir un sistema de ecuaciones. Observe que para esta aplicación Mathcad requiere el uso de un signo de igual simbólico, teclea do como [Ctrl] = y > para separar los lados izquierdo y derecho de una ecuación. Ahora se calcula el vector que consiste de xval y yval usando Find(x, y) y los valores son mostrados con un signo igual. Una gráfica que muestra las ecuaciones y restricciones, así como la solución, se puede insertar en cualquier lugar sobre la hoja de cálculo al hacer clic en la ubicación deseada. Esto coloca una retícula roja en esa localización. Entonces se usa la secuencia Insert/Graph/X-Y Plot en el menú para colocar un gráfico vacío sobre la hoja de cálculo con símbolos matemáticos para las expresiones que habrán de granearse y para los rau gos de los ejes x y y. Cuatro variables se trazan sobre el eje y como se muestra (las mitades inferior y superior de la ecuación para el círculo, la función lineal y un pailón cruzado que representa la restricción x > 2). Los rangos para estos casos son x para las mitades del círculo superior e inferior, ¿j para la línea y r¡ para la restricción. Mathcad realiza el resto para producir la gráfica. Una vez que se ha creado la gráfica, se puede usar del menú la secuencia Format/Graph/X-Y Plot para variar el tipo de grá l'i ca, cambiar color, tipo y grueso de la línea de la función, y agregar títulos, etiquetas y otras características. La gráfica y los valores numéricos para xval y yval ilustran excelentemente la solución, así como la intersección del círculo y la línea en la región x>2. 15.3.2 Programación lineal en Excel

Existe una variedad de paquetes de software especialmente diseñados para implemcntai programación lineal. Sin embargo, como su disponibilidad es amplia, este análisis se

FIGURA 15.4 Pantalla de Mathcad de un problema de optimización restringida no lineal.

FILE

G a e » a u : i : = lv y = :lé I* G v e r n x t y 6 i t y 2 a > 2 D e m t r n e i m ó n i t n : y [v a ] l ()') x v a lo 4 2 1 .4 2 1 3 6 y « l0 4 . 1 4 2 1 3 6 C m a n r t e d emey > ( i 2 )
EDIT VIEW INSERT FORMAT MATH SYMBOLICS WINDOW HELP CONSTKAINED NONUNEAR OPTIMIZATION

1 2

:=F n d i 1

15.3

OPTIMIZACIÓN C O N PAQUETES DE SOPTWARE

4tt

concentrará en la hoju tic cálculo lixcel. íisln involucra usar la opción Solver que nntoH NO empleó en el capítulo 7 para localizar raíces. La manera en la cual se usa Solver para programación lineal es similar a nuestras aplicaciones previas en el sentido de que los datos se introducen en las celdas de la hoja de cálculo. La estrategia básica es llegar a una celda que esté optimizada como una función de las variaciones de las otras celdas sobre la hoja de cálculo. El siguiente ejemplo ilustra cómo se puede realizar esto para el problema de procesamiento de lu gasolina.

EJEMPLO 1 5 . 3

Usando el Solver de Excel para un problema de programación lineal

Enunciado del problema. Utilice una hoja de cálculo en Excel para calcular los valores adecuados en el problema del procesamiento de la gasolina examinado en este capítulo. Solución. Una hoja de cálculo de Excel para calcular los valores pertinentes en el problema de procesamiento de gasolina es mostrado en la figura 15.5. Las celdas no ! sombreadas son las que contienen los datos numéricos y leyendas. Las celdas sombreadas involucran las cantidades que se calculan con base en las otras celdas. Reconozca que la { celda a ser maximizada es la D I 2 , la cual contiene la utilidad total. Las celdas que cambian son B4: C4, en las cuales se tiene las cantidades de la gasolina producida regular y prémium. ¡ Una vez que se crea la hoja de cálculo, se selecciona Solver del menú Tools (Herra| mientas). En esta etapa un recuadro de diálogo se mostrará, requiriendo de usted la infor-

FIGURA 15.5 Acondicionamiento de una hoja de cálculo en Excel para usar el Solver para la programación lineal.
A | B | C | P r o b l e m a p a r a el proe es. de g a s o l i n a Regular Producido Materia prima Tiempo Almacén, de regular Almacén, de prémium Aprov. por unidad Aprovechamiento 0 7 10 Prémium 0 1 1 8 , D E

1 2 3 4 5 6 7
00

Total

Disponib. = B6*B4+C6*C4 B7*B4+C7'C4

9 10 11 12

0 0 0 0

"
* -

77
80

=

"*
^

9
6

= B4 = C4

150

175

0

0

-

B4*B11

-

C4*C11

o

-

B12+C12

414

OPTIMIZACIÓN RESTRINGIDA

marión pertinente. Estas celdas pertinentes del recuadro de dialogo de Solver se llenaran como
Ubique la celda dentro: Igual a 9 máx

D12
O igual a 0

O mín

Al cambiar celdas

B4-.G1
Sujeto a:

D6<=-£6 D7<=E7 D8<=E8 D9<=E9

Se debe incluir las restricciones una por una al seleccionar el botón "Add". Esto abrirá un recuadro de diálogo como el siguiente
Celda de referencia: D6 Restricción Eó

Como se muestra, la restricción donde el total de materia prima para la gasolina (celda D6) debe ser menor o igual que el abastecimiento disponible (E6) se puede agre gar como se ejemplificó. Después de agregar cada una de las restricciones, el botón "Add" puede ser seleccionado. Cuando se haya introducido las cuatro restricciones, se leccionamos el botón OK para regresar al recuadro de diálogo del Solver. Ahora, antes de la ejecución, se debería seleccionar el botón options del Solver y revisar el recuadro rotulado como "Assume linear model"(Suponer modelo linear). hará que Excel emplee una versión del algoritmo simplex (en lugar del Solver no lineal más general que normalmente usa) que acelera su aplicación.

E s t o

FIGURA 15.6 Hoja de cálculo de Excel con la solución al problema de programación lineal. ' A | B j C | Problema para el preces, de gasolina
1 :

D

E
Disponib.

1 2 3 4 5 6 '7, ,*

Regular Producido

Prémium

Total

4.888889 3.888889
7 10

Materia prima Tiempo Almacén, de regular Almacén, de prémium Aprov. por unidad

11
8

77 80 4.888889 3.888889

77 80 9 6

n

o

150

175

13,3

OPTIMIZACIÓN C O N PAQUETES DE SOFTWARE

411

Después de seleccionar esta opción, regrese el menú Solver. Cuando seleccione H botón OK, se abrirá un recuadro de diálogo con un reporte sobre el éxito de In operación. Para el caso actual, el Solver obtiene la solución correcta (véase figura 15.6).

Además de obtener la solución, el Solver también proporciona algunos reportes resumen útiles. Estos serán explorados en las aplicaciones de la ingeniería que se describen en la sección 16.2. 15.3.3 Excel p a r a optimización no lineal

La manera de usar Solver para optimización no lineal es similar a nuestras aplicaciones anteriores en cuanto a que los datos son introducidos en las celdas de la hoja de cálculo. Una vez más, la estrategia básica es tener una sola celda a optimizar como una función de las variaciones de las otras celdas sobre la hoja de cálculo. El siguiente ejemplo ilustra cómo hacer esto para el problema del paracaidista que se acondicionó en la introducción de esta parte del libro (recuerde el ejemplo PT4.1).

EJEMPLO 15.4

Uso del Solver de Excel para la optimización restringida no lineal Enunciado del problema. Recuerde que en el ejemplo PT4.1 se desarrolló una optimización restringida no lineal para minimizar el costo de la caída de un paracaídas en un campo de refugiados. Los parámetros para este problema son
Parámetro Masa total Aceleración de la gravedad Coeficiente de costo |constante) Coeficiente de costo (por longitud) Coeficiente de costo (por área) Velocidad critica de impacto Efecto del área sobre el arrastre Altura inicial de caída Símbolo M, Valor 2 000 9.8 200 56 0.1 20 3 500 Unidades

c

co i
v

9
c

m/s

2

$
$/m $/m m/s kg/(sm ) m
2 2

=2

k

z

Sustituyendo estos valores en las ecuaciones (PT4.11) a (PT4.19) se obtiene Minimizar C = «(200 + 56( + 0.L4 )
2

0

c

sujeto a v <
20

n > 1 donde n es un entero y todas las otras variables son reales. Además, las siguientes cantidades se definen como

OPTIMIZACIÓN RESTRINGIDA

A =

2nr

2

í = V2r c = 3,4

m -

¥í n 9.8m
c
e

(15.6) -(I-e
-(c/m)t

t = raíz 500
V=
9

1

(15.7)

' %

-(c/

m ) f

j |

Use Excel para resolver este problema para las variables diseño r y n que minimicen el costo C.

í Solución. Antes de implementar este problema en Excel, se debe primero enfrentar el j problema de establecer la raíz en la formulación anterior [ecuación (15.7)]. Un método \ podría ser desarrollar un macro para implementar un método de localización de raíces, | tal como el de la bisección o de la secante. (Advierta que se ilustrará cómo realizar esto ] en el próximo capítulo, en la sección 16.3.) Mientras tanto, un procedimiento más fácil es posible mediante el desarrollo de la í siguiente solución por iteración por punto fijo en la ecuación (15.7), 5009.8m
¿

'¡+1 —

(1

-(c/m)f,-

9.8w

(15.8)

Así, t se puede ajustar hasta que se satisfaga la ecuación (15.8). Se puede demostrar que para el rango de parámetros usados en este problema, la fórmula siempre converge. Ahora, ¿cómo se puede resolver esta ecuación en una hoja de cálculo? Como se muestra abajo, se puede fijar dos celdas de manera que tengan un valor para t y para el lado derecho de la ecuación (15.8) [es decir,/(r)]. Se puede teclear la ecuación (15.8) en la celda B21 de tal forma que toma su valor tiempo de la celda B20 y los otros valores de los parámetros de celdas de cualquier otro lugar de la hoja (véase a continuación cómo se construye toda la hoja). Después coloqúese en la celda B20 y apunte su valor a la celda B21.
A
20 21

B

r itl

0 0.480856 500 + 9.8m2 ( 1 _ e^clm)i)

9.8m

Una vez que se introducen estas fórmulas, se desplegará en forma inmediata el mensaje de error: "no se puede resolver referencias circulares", ya que B20 dependo do IÍ21 y viceversa. Ahora, vaya a las selecciones Tools/Options del menú y seleccione calculatlon

(cálculo). Del recuadro de diálogo calculation, verifique que apurezca "iterución" y presione "OK". En forma inmediata la hoja de cálculo iterará estas celdas y el resultudo aparecerá como
A B

20 i 2 1 Ht)

1 255} 10.25595

Así, las celdas convergerán sobre la raíz. Si se quiere tener más precisión, sólo presione la tecla F9 para que se realicen más iteraciones (el default es 100 iteraciones, que se pueden cambiar si se desea). En la figura 15.7 se muestra cómo establecer una hoja de cálculo en Excel para calcular los valores pertinentes. Las celdas no sombreadas son las que contienen los datos numéricos y las leyendas. Las celdas sombreadas involucran cantidades que se calculan con base en las otras celdas. Por ejemplo, la masa en B17 se calculó con la ecuación (15.6) con base en los valores de M (B4) y n (E5). Observe también que algunas celdas son redundantes. Por ejemplo, la celda El 1 se direcciona a la celda E5. Esta repetición en la celda El 1 muestra que la estructura de las restricciones es evidente en la hoja. Finalmente, note que la celda que habrá de minimizarse es E l 5 , que contiene el costo total. Las celdas a cambiar son E4:E5, en las cuales se tiene el radio y el número de paracaídas.
t

FIGURA 15.7 Acondicionamiento de una hoja de cálculo en Excel para el problema de optimización no lineal referente al paracaídas. '
A | B | C | D P r o b l e m a de o p t i m i z a c i ó n del paracaídas Parámetros: E F G

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

1

1 2000 9.8 200 56 0.1 20 3 500

V a r i a b l e s de d i s e ñ o :
r

Mt

a
A 1 c m

n
Restricciones: variables
V

costl cost2 cost3 ve kc zO

1 1

tipo

límite

n
Función o b j e t i v o :

< = i > =

1

V a l o r e s calculados:

6.283185 1.414214 2000

Costo

9

283.1438

R a i z : localización:

t fifi

418

OPTIMIZACIÓN RESTRINGIDA

Una vez que se ha creado la hoja de cálculo, se elige la selección Solver del menú Tools. En esta etapa se desplegará un recuadro de diálogo, requiriendo la información pertinente. Las celdas pertinentes en el recuadro de diálogo Solver se podrían llenar como
Ubique la celda dentro. Igual a O máx Al cambiar celdas
E 1 5

• mín

O igual a

0

U
E'

E i 5

E"?> - 3 1 0
K - V

I

' E 5 = entero

Se debe agregar las restricciones una por una al seleccionar el botón "Add". Esto abrirá un recuadro de diálogo como el siguiente
Celda de referencia: E.C Restricción

FIGURA 15.8 Hoja de cálculo en Excel con la solución del problema de optimización no lineal referente ni caídas. 1 2 3 4 5 6 7 8 9
A | B 1 C | D P r o b l e m a de o p t i m i z a c i ó n del p a r a c a i d a s Parámetros: E F

1

1
2000 9.8 200 56 0.1 20 3 500

V a r i a b l e s de d i s e ñ o :

Mt

costl cost2 cost3 ve No kc 11 zO 12 13 V a l o r e s calculados: 54.44432 14 A 4.162952 15 1 163.333 16 c m 333.3333 17 18

a

r n
Restricciones: variables
V

6

tipo

limite

n
Función o b j e t i v o :

<= 6 > =

20 1

Costo

4377.262

, 19 fin
1

R a i z : localización:

27,Q4v76

27.04076

1 5,3

OPTIMIZACIÓN C O N PAQUETES DE

SOFTVM»

41*

Como se muestra, la restricción en la que la velocidad real del impacto (celda E10) debe ser menor o igual a la velocidad requerida (G10), puede ser agregada como se hizo en el ejemplo. Después de agregar cada restricción se puede seleccionar el botón "Add". | Observe que la flecha hacia abajo le permite escoger entre varios tipos de restricciones ( < = , > = , = y entero). Así, se puede forzar el número de paracaídas (E5) para que sea un entero. Cuando se hayan introducido las tres restricciones, se selecciona el botón OK para \ regresar al recuadro de diálogo Solver. Cuando seleccione el botón OK se abrirá un | recuadro de diálogo con un reporte sobre el éxito de la operación. Para el caso presente, \ el Solver obtiene la solución correcta como la que se muestra en la figura 15.8. jj De esta forma, se determina que el costo mínimo de 4 377.26 ocurrirá si se reparte I en seis paquetes con un radio del paracaídas de 2.944 m. Además de obtener la solución, ] el Solver también proporciona algunos reportes resumen útiles. Estos serán explorados ¡ en las aplicaciones de la ingeniería que se describirán en la sección 16.2.

15.3.4

IMSL

IMSL tiene varias subrutinas en Fortran para optimización (véase tabla 15.1). El presente análisis se concentrará en la rutina UVMÍD. Esta rutina localiza el punto mínimo de una función suave para una sola variable mediante evaluaciones de la función y primeras derivadas. UVMID es implementado por el siguiente enunciado CALL:
C A L L U V M I D ( F , G , X G U E S S , E R R E L , G T O L , MAX F N , A , B , X , F X , G X )

donde F = FUNCIÓN suministrada por el usuario para calcular el valor de la función a ser minimizada. La forma es F(X), donde X = punto en el cual se evalúa la función. (Entrada). X no debería ser cambiada por F,. y F = valor de la función calculado en el punto X. (Salida) G = FUNCIÓN suministrada por el usuario para calcular la derivada de la función, donde G = valor de la función calculada en el punto X. (Salida) F y G se deben declarar como EXTERNAL en el programa de llamado XGUESS = Un valor inicial del punto mínimo de F. (Entrada) ERREL = Exactitud relativa requerida del valor final de X. (Entrada) GTOL = Tolerancia derivativa usada para decidir si el punto actual es un mínimo. (Entrada) MAXFN = Número máximo de ecuaciones permitido de la función. (Entrada) A = Punto extremo inferior del intervalo en el cual se localiza el máximo. (Entrada) B = Punto extremo superior del intervalo en el cual se localiza el máximo. (Entrada) FX = Valor de la función en X. (Salida) GX = Valor de la derivada en X. (Salida)

420 T A I L A 15.1
Categoría Minimización no restringida Función univariable

OPTIMIZACIÓN RESTRINGIDA Rutinas IMSL para optimización.
Rutina Capacidad

UVMIF UVMID UVMGS Función multivariable UMINF UMING UMIDH UMIAH UMCGF UMCGG UMPOL Mínimos cuadrados no lineales UNLSF UNLSJ Minimización con límites simples BCONF BCONG BCODH BCOAH BCPOL BCLSF BCLSJ Minimización restringida lineal DLPRS QPROG LCONF LCONG Minimización restringida no lineal NCONF NCONG Rutinas de servicio CDGRD FDGRD FDHES GDHES FDJAC CHGRD CHHES

Usando sólo valores de la función Utilizando valores de la función y de la primera derivada Función no suave

Usando gradiente por diferencias finitas Utilizando gradiente analítico Empleando Hessian por diferencias finitas Usando Hessian analítico Utilizando gradiente conjugado con gradiente por diferencias finitas Empleando gradiente conjugado con gradiente analítico Función no suave

Utilizando Jacobiano por diferencias finitas Usando Jacobiano analítico

Usando gradiente por diferencias finitas Utilizando gradiente analítico Empleando Hessian por diferencias finitas Usando Hessian analítico Función no suave Mínimos cuadrados no lineales mediante Jacobiano por diferencias finilun Mínimos cuadrados no lineales mediante Jacobiano analítico

Programación lineal densa Programación cuadrática Función objetivo general con gradiente por diferencias finitas Función objetivo general con gradiente analítico

Usando gradiente por diferencias finitas Utilizando gradiente analítico

CHJAC GGUES

Gradiente por diferencias centrales Gradiente por diferencias hacia adelante Hessian por diferencias hacia adelante Hessian por diferencias hacia adelante mediante gradiente analítico Jacobiano por diferencias hacia adelante Verificación del gradiente proporcionado por el usuario Revisión del Hessian dado por el usuario

Verificación del Jacobiano proporcionado por «I usuario ..Puntal d t Iniciojwntradoi

PROBLEMAS

"

- " • ^

Ttn

EJEMPLO 1 5 . 5

U J O de IMSL p a r a localizar un 1 0 I 0 óptimo

j Enunciado del problema. Use la rutina UVMID para determinar el máximo de lii función unidimensional resuelta en el capítulo 13 (recuerde los ejemplos del 15.1 AL 15.3).
!

¡

f(x) = 2 sen x

J

10

!

Solución. Un ejemplo del programa principal en Fortran 90 y de la función usadn UVMIF para resolver este problema se puede escribir como PROGRAM Oned

! I

USE mimsl IMPLICIT N O N E INTEGER::max fn - 50 REAL: :xguess-0. . e r r e l - l . E - 6 . g t o l - l . E - 6 . a — 2 . , b - 2 . REAL::x,f,g,fx,gx EXTERNAL f.g CALL UVMIDCf,g,xguess,errrel,gtol,maxfn,a,b,x,fx,gx) PRINT * . x . f x . g x END P R O G R A M FUNCTION f(x) IMPLICIT NONE REAL::X,f f—(2.*SIN(X) - x**2/10.) END FUNCTION FUNCTION g(x) IMPLICIT N O N E REAL::x,g g—(2.*C0S(x) - 2 . * x / 1 0 . ) END FUNCTION Observe que como la rutina está acondicionada para minimización, se introduce el negativo de la función. Un ejemplo de la corrida es

\

i
1.427334 -1.775726 -4.739729E-04

PROBLEMAS I 1 1 Inii compañía produce dos tipos de productos, A y B. Esos productos se producen en una semana de trabajo de 40 horas y al I nuil de la semana son embarcados. Los productos requieren 20 y í kg de materia prima por kg de producto, respectivamente, y IN compañía tiene acceso a 10 000 kg de materia prima por seiminii, Sólo un producto so puede fabricar a la voz, con tiempos de producción de 0.05 y 0.15 horas, respectivamente. La plnnlii puede almacenar sólo 550 kg del producto total por semana. Pin último, la compañía obtiene utilidades de $45 y $30 por e«<ln unidad, respectivamente. a) Establezca el problema de programación linoal pare maxl mizar la utilidad.

422

OPTIMIZACIÓN RESTRINGIDA sujeto a

/;) Resuelva el problema do programación lineal en forma gráfica. c) Solucione el problema do programación lineal con el método simplex. d) Resuelva el problema con un paquete de software. e) Evalúe con cuál de las siguientes opciones se obtendrá la máxima utilidad: aumentar la materia prima, el almacenamiento o el tiempo de producción. 15.2 Suponga que para el ejemplo 15.1, la planta procesadora de gasolina decide producir una tercera clase de producto con las siguientes características:
Suprema Materia prima para gasolina Tiempo de producción Almacenamiento Aprovechamiento 15 m /tonelada 1 2 hr/tonelada 5 toneladas $250/tonelada
3

5x + 4 . y - 1700

x +y

< 7

4.5JC + 3 . 5 } ' < 1600 .v + 2y < 500

x >0
}>0 Obtenga la solución a) Gráficamente. b) Mediante el método simplex. c) Con un paquete de software o librería apropiado (por ejeui pío, Excel, Mathcad o IMSL). 15.5 Use un paquete o librería de software (por ejemplo, líxiW, Mathcad o IMSL) para resolver el siguiente problema de opiitin zación no lineal restringido. Maximizar f(x, y)

l.\x+\.9y

- y

3

Además, suponga que una nueva fuente de materia prima para la gasolina se ha descubierto, de tal forma que el total disponible se duplica a 154 m /por semana. a) Establezca el problema de programación lineal para maximizar la utilidad. b) Resuelva el problema de programación lineal con el método simplex. c) Solucione el problema con un paquete de software. d) Evalúe con cuál de las siguientes opciones se obtendrá la máxima utilidad: aumentar la materia prima, el almacenamiento o el tiempo de producción. 15.3 Considere el problema de programación lineal
3

sujeto a

x + y < 0.9 x >0
y > 0 15 .Í Use un paquete o librería de software (por ejemplo, IÍXITI, Mathcad o IMSL) para resolver el siguiente problema de opluul zación no lineal restringido. Minimizar/(x:,}>) = I9x+ sujeto a \ly

Minimizar f(x, y) = —x + y

3

sujeto a

x + y > 0.95 x + 2y < 2 x > 0
2
2

x + 2.5}' < 15 x+y < 7 2x + y < 9 x>0
y > 0 Obtenga la solución a) Gráficamente. b) Por medio del método simplex. c) Mediante un paquete de software o librería apropiado (por ejemplo, Excel, Mathcad o IMSL). 15.4 Considere el problema de programación lineal: Maximizar/X*, .y) = 12* + lOy

y > 0 15.7 Considere el siguiente problema de optimización no IIIICBI restringido: Minimizar/(x, y) = (x - 2.5) + (y - 2 . 5 )
2 2

sujeto a

x + 2y = 4
a) b) Use un procedimiento gráfico para estimar la solución. Utilice un paquete o librería de software (por ejemplo, l 'v ecl, Mathcad o IMSL) pura obtener una ONlinmuion mát

exacta.

,.

.,

Ift.ll

UNO

un pnquelc o librorln de solUvarc puní determinar el
de

./'(.v.r) ~ - 7 . r I I.2.V'' -1 1 ly I 2/

2\y

IUI'IHIIIIO

,/'(.v..)•)

2.»>> + \.5y -

\.25x 2

2y

1

lít.° Uliliee un paquete o librería de software para determinar el máximo de /(.,•,y) = 3.5x + 2y + x - x - 2xy - y
2 4 2

15.10 Dada la siguiente función,

use un paquete o librería de software puru determinar al mínimo a) Gráficamente. b) Numéricamente. c) Sustituya el resultado de b) en la función para determinar el mínimo f(x, y). d) Determine el Hessian y su determinante, y sustituya el resultado del inciso b) en la última para verificar que se lia detectado un mínimo.

CAPITULO 16 Aplicaciones en la ingeniería: optimización
El propósito de este capítulo es usar los procedimientos numéricos analizados en los capítulos 13 al 15 para resolver problemas reales de la ingeniería que involucran optimización. Estos problemas son importantes, ya que a los ingenieros se les pide con frecuencia que den la "mejor" solución a un problema. Como muchos de estos casos involucran sistemas complejos e interacciones, los métodos numéricos y las computado ras son con frecuencia una necesidad para desarrollar soluciones óptimas. Las siguientes aplicaciones son típicas de aquellas que se encuentran en forma ruli nana durante los estudios superiores y de graduados. Además, ellas son representativas de problemas con los que se enfrentará el ingeniero profesionalmente. Los problemas son tomados de las áreas principales de la ingeniería: química/petrolera, eléctrica y me cánica/aeroespacial. La primera aplicación, tomada de la ingeniería química/petrolera, tiene que ver con el uso de la optimización restringida no lineal para el diseño óptimo de un tanque cilindrico. El Solver de Excel se usa para desarrollar la solución. Después, se utiliza la programación lineal para apreciar un problema de la ingenie ría civil/ambiental: minimizar el costo del tratamiento de aguas para cumplir con los objetivos de calidad del agua en un río. En este ejemplo, se introduce la noción de precios indefinidos y su uso para mostrar la sensibilidad de una solución por programación lineal. La tercera aplicación, tomada de la ingeniería eléctrica, involucra maximizar la potencia a través de un potenciómetro en un circuito eléctrico. La solución involucra optimización unidimensional no restringida. Además de resolver el problema, se ilustra cómo los lenguajes macro de Visual Basic dan acceso al algoritmo de búsqueda de la sección dorada dentro del contexto del ambiente Excel. Por último, la cuarta aplicación, tomada de la ingeniería mecánica/aeroespacial, involucra determinar los desplazamientos de la pierna al pedalear en una bicicleta do montaña al minimizar la ecuación bidimensional de energía potencial.

16.1

D I S E Ñ O DE U N T A N Q U E C O N EL M E N O R C O S T O (INGENIERÍA QUÍMICA/PETROLERA) Antecedentes. Los ingenieros químicos y petroleros (así como otros especialistas tales como los ingenieros mecánicos y civiles) con frecuencia se enfrentan al problema general del diseño de recipientes que transportan líquidos y gases. .Suponga que so lo pide determinar las dimensiones de un pequeño tanque cilindrico para ol transporto de

16.1

DISEÑO DE U N T A N Q U E C O N EL M E N O R C O S T O

FIGURA 16.1 Parámetros para determinar las dimensiones óptimas de un tanque cilindrico.

desechos tóxicos que se van a trasladar en un camión. Su objetivo general será minimizar el costo del tanque. Sin embargo, además del costo, usted debe asegurar que mantenga la cantidad requerida de líquido y que no exceda las dimensiones de la caja del camión. Debido a que el tanque transportará desechos tóxicos, se requiere de un espesor especificado por ciertos reglamentos. Un esquema del tanque y de la caja se muestra en la figura 16.1. Como puede verso, el tanque consiste en un cilindro con dos placas soldadas en cada extremo. El costo del tanque involucra dos componentes: 1) gastos del material, el cual está basado en el peso, y 2) gastos de soldadura que se basan en la longitud necesaria para soldar. Observe que lo último involucra soldar ambas: la costura interior y la exterior en donde se conectan las placas con el cilindro. Los datos necesarios para el problema so resumen en la tabla 16.1. Solución. El objetivo aquí es construir un tanque a un mínimo costo. El costo está relacionado con las variables de diseño (longitud y diámetro), ya que ellas tienen efecto sobre la masa del tanque y las longitudes a soldar. Además, el problema es restringido yu que el tanque debe 1) ajustar a la caja del camión y 2) contener el volumen requerido de material.
TABLA 16.1
Parámetro

Parámetros para determinar las dimensiones óptimas de un tanque cilindrico para transporte de desechos tóxicos.
Símbolo Valor Unida das

Volumen requerido Espesor Densidad Longitud de la caja Ancho de la caja

i

^ m ó x

p

Costo d e l material Costo por soldadura

0.8 3 8 000 2 1 4.5 20

rrr' cm kg/rrv m m

1

$Afj $/m

APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN El costo implica los valores del material del tanque y de soldarlo. Por lanío, la fluición objetivo se puede formular como una minimización (16.1)

donde C = costo ($), m = masa (kg), í = longitud a soldar (m), c y c = factores de costo para la masa ($/kg) y longitud de la soldadura ($/m), respectivamente. Después, se reformulará cómo la masa y longitud de la soldadura se relacionan con las dimensiones del tambor. Primero, la masa se puede calcular como el volumen del material por su densidad. El volumen del material usado para crear las paredes laterales (por ejemplo, el cilindro) se puede calcular como
w m w

D
^cilindro

^

n

Para cada placa circular en los extremos, esto es

aplaca = * ( —

(d
\2

+t

Así, la masa se calcula con

donde p = densidad (kg/m ). La longitud de soldadura para unir cada placa es igual a la circunferencia interior y exterior del cilindro. Para las dos placas, la longitud total de soldadura sería

m = p\Ljí
2
+

D

D
H

-

2?r| y + f | t

(16.2)

**w — ^

2*|§+í)+2*f

= 4n(D

+1)

(16.3)

Dados los valores de D y L (recuerde que el espesor t está fijo por códigos), las ecuaeio nes (16.1), (16.2) y (16.3) proporcionan un medio para calcular el costo. También observe que cuando las ecuaciones (16.2) y (16.3) se sustituyen en la ecuación (16.1), ol resultado de la función objetivo es no lineal en las incógnitas. Después, se puede formular las restricciones. Primero, se debe calcular qué volu men puede ser introducido en el tanque terminado,

TTD
2

2

Este valor debe ser igual al volumen deseado. Así, una restricción es

JTD= L V„
ü

donde V e» el volumen deseado (m ).
3

16.1

D I S E Ñ O DE U N T A N Q U E C O N EL M E N O R COSTO

49?

Las restricciones restantes tienen que ver con que el tanque ajusto a las dimensiones de la caja del camión, L<L
D<D
r

M Á X

El problema está ahora especificado. Con la sustitución de los valores de la tabla 16.1, se puede resumir como Maximizar C = 4.5m + 2Q€ Sujeto a
TTD L
2

W

4
L D < <

= o.:

2 1

donde m = 8000 \ Ln
D

+ 0.03

-

-

+

2JT[ ®

+

0.03

0.03

El problema ahora se puede resolver en diferentes formas. Sin embargo, el planteamiento más simple para un problema de esta magnitud es usar una herramienta como el Solver de Excel. La hoja de cálculo para realizar esto se muestra en la figura 16.2.
FIGURA 16.2 Hoja de cálculo de Excel lista para evaluar el costo de un tanque sujeto a restricciones de volumen requerido y tamaño.

ln
:

4K(D

+

0.03)

A 1 2 3 4 5 6 7
Parámetros:

D i s e ñ o de t a n q u e ó p t i m o

B

c

0

E

F

G

1

V a r i a b l e s de d i s e ñ o

. )

rho Lmáx 9 Dmáx n 10 11 cw

0.8 0.03 8000 2 1 4.5 20

D
L

1 2

Restricciones D
L

*

Vol

1 2 1.570796

< = = _

1 2 0.8

V a l o r e s calculados:

W3
IF1 m
Iw Vcoraza

Función objetivo:

It ,,! ,
W F »(

\ )V
i
» > *

C

•14,433

Ylaeai

11$

1

428

APLICACIONES E N LA INGENIERÍA: OPTIMIZACIÓN

Para el caso mostrado, se introducen los límites D y L. Para este caso, el volumen cu mayor que el requerido (1.57 > 0.8). Una vez creada la hoja de cálculo, la selección Solver se escoge del menú T O O I N (Herramientas). En este punto aparecerá un recuadro de diálogo que le solicitará la información pertinente. Las celdas pertinentes del recuadro de diálogo Solver se pueden llenar como

Ubique la celda destino: Igual a O máx 0 mír

E16 O igual a 0

Por cambio de celdas E5:E6 Sujeto a las restricciones: E10<G10 E l l <G11 E l 2 = G12

Al seleccionar el botón OK, un recuadro de diálogo se abrirá mostrado un reporte sobre el éxito de la operación. Para el caso presente, el Solver obtiene la solución correcta, la cual se muestra en la figura 16.3. Observe que el diámetro óptimo es casi el valor de la restricción de 1 m. Así, si la capacidad del tanque se aumentara, podría encararse esta restricción y el problema se reduciría a una búsqueda unidimensional para la longitud.

FIGURA 1 6 . 3
RESULTADOS DE MINLMIZACIÓN. EL PRECIO SE REDUCE DE 9 1 54 A 5 7 2 3 , YA QUE EL VOLUMEN MÁS PEQUEÑO TIENE LAS DIMENSIONES DE D = 0 . 9 8 M Y L = 1 .05 M. A B C D i s e ñ o de t a n q u e ó p t i m o 1 Parámetros: VO t rho Lmáx Dmáx cm cw 0.8 0.03 8000 2 1 4.5 20 D E F O

1 2 3 4 5

Variables de diseño: D L Restricciones D L Vol < = 0.982949 < = 0.799998 1 2
o.a

6

0.982949 1.054235


15

7 8 9 10 11 12 •13 V a l o r e s calculados: m Iw

Función o b j e t i v o :

_

1

1215.236 12.72909

1
C

Vcora¿u

••••

16.2

MÍNIMO COSTO ! N TRATAMIENTO DE AGUAS DE DESECHO

429

16.2

M Í N I M O C O S T O E N T R A T A M I E N T O DE A G U A S DE D E S E C H O (INGENIERÍA CIVIL/AMBIENTAL) Antecedentes. Las descargas de aguas de desecho de las grandes ciudades son, con frecuencia, la causa principal de la contaminación en un río. La figura 16.4 ilustra el tipo de sistema que un ingeniero ambiental podría enfrentar. Varias ciudades están localizadas sobre un río y sus afluentes. Cada uno genera contaminación a una razón de carga P que tiene unidades de miligramos por día (mg/d). La carga contaminante está sujeta al tratamiento de desechos que resulten de una remoción fraccional x. Así, la cantidad descargada al río es el exceso no removido por el tratamiento, W, = (1 -x,)P¡
i

(16.4)

donde W — descarga de desechos desde la ciudad /-ésima. Cuando las descargas de desechos entran en la corriente, se mezclan con la contaminación de las fuentes corriente arriba. Si se supone un mezclado completo en el punto de descarga, la concentración resultante en el punto de descarga se puede calcular con un simple balance de masa,
W¡ + Qi
u u

Qc
u

u

(16.5)

donde Q = flujo (L/d), c = concentración (mg/L) en el río inmediatamente corriente arriba de la descarga, y Q¡ = flujo corriente abajo del punto de descarga (L/d). Después que se establece la concentración en el punto de mezclado, los procesos de descomposición químicos y biológicos pueden remover algo de la contaminación cuando fluye corriente abajo. Para el presente caso, se supone que esta remoción se puede representar por una simple reducción fraccional R. Suponiendo que los cabezales de agua (por ejemplo, las ciudades 1 y 2 en el río mostrado antes) están libres de contaminantes, las concentraciones en los cuatro nodos se pueden calcular como

FIGURA 16.4 Cuatro plantas de tratamiento de aguas de desecho que descargan contaminantes a un sistema de ríos. Los segmentos del río entre las ciudades están indicados con números dentro de un círculo.

A P L I C A C I O N E S

E N

L A

I N G E N I E R Í A :

O P T I M I Z A C I Ó N

(1

Gl3 Ql3
fll3<2l3Cl +

£•3

=

R23Q21C2 + (1 Q34

(!(>.())
J C
3

) f 3

c

4

=

R34Q34C3 Q45
d P2X2

+ O

-x )P
4

4

Después, se observa que el tratamiento de aguas tiene un costo diferente, d¡($ 1 0 0 0 / mg removido), en cada una de las localidades. Así, el costo total de tratamiento (sobre una base diaria) se puede calcular como
(16.7)

Z = d¡ P\X\ + + d-iP-¡xi + Í Í 4 P 4 X 4 2 diario del tratamiento donde Z es el costo total ( $ 1 000/d). La pieza final en la "decisión rompecabezas" involucra regulaciones ambientales Para proteger los usos benéficos del río (por ejemplo, paseos en bote, pesca, tomar 1111 baño), las regulaciones indican que la concentración del río no debe exceder un estáiuliii de calidad de c . En la tabla 1 6 . 2 se resumen los parámetros para el sistema del río de la figura 16/1 Advierta que hay una diferencia en los costos de tratamiento entre las ciudades corrienlp arriba ( 1 y 2 ) y corriente abajo (3 y 4 ) por la naturaleza impredecible de las planilla corriente abajo. La concentración se puede calcular con la ecuación ( 1 6 . 6 ) y el resultado se c i i I í h I i i en la columna sombreada para el caso donde no se implemento tratamiento de aguas (e* decir, donde todas las x = 0 ) . Observe que el estándar de 2 0 mg/L se viola en todos I o n puntos de mezclado. Use la programación lineal para determinar los niveles de tratamiento que salislii cen los estándares de calidad del agua a un mínimo costo. También, evalúe el impacto « I hacer el estándar más restringido debajo de la ciudad 3. Esto es, el mismo ejercicio, poní ahora con los estándares para los segmentos 3-4 y 4-5 disminuidos a 1 0 mg/L.
s

TABLA 16.2

Parámetros para las cuatro plantas de tratamiento de aguas de desecho que descargan contaminante» a un sistema de ríos, junto con los resultados de concentración (c¡) para tratamiento cero. También se enlista el flujo, el factor de remoción y los estándares para los segmentos del río.

16.2 MlNIMO COSTO EN TRATAMIENTO DE AGUAS DE DESECHO

Solución. Todos los factores antes mencionados se pueden combinar en el siguionto problema de programación lineal: Minimizar Z = d P x
l l l

m

+ d^P^

+ dPx
3 3

3

+ dPx
4 4

4

(16.8)

sujeto a las siguientes restricciones
(1

(1 "

X )P
2

2

223

<

c

s2

~
Q4 + R Q 3C ~x )P
3 2i 2

(16.9)
+ < Cs4

R\3<2\3C\
R34Q34C3 + Q45

2

(1 - * ) P
3

3

(1

4

4

<

Cs3

0 <

Xi,X ,X3,X4
2

<

1

(16.10)

De esta forma, la función objetivo es minimizar el costo de tratamiento [véase ecuación (16.8)] sujeto a la restricción de los estándares de calidad del agua que se deben satisfacer para todas las partes del sistema (16.9). Además, el tratamiento no debe ser negativo o mayor que el 100% de remoción [véase ecuación (16.10)]. El problema se puede resolver por medio de una variedad de paquetes. Para esta aplicación se usa la hoja de cálculo Excel. Como en la figura 16.5, los datos junto con los

PIOURA 1 6 . 5
I LI de cálculo de Excel lista para evaluar el costo de tratamiento de aguas sobre un sistema de ríos regulado. La columna I 11 MLLENE el cálculo de la concentración de acuerdo con la ecuación (16.6). Las celdas F4 y H 4 están sombreadas para UN II.LINI las fórmulas usadas para calcular C, y el costo del tratamiento para la Ciudad 1. Además, está sombreada la celda IIV I|II(¡ muestra la fórmula para el costo total que es el que hay que minimizar [véase ecuación (16.8)]. A B I C | D | E Costo m í n m o del t r a t a m i e n t o de a g u a s de desecho N O TRATADA TRATAMIENTO DESCARQA COSTO UNIT. CIUDAD P X W D 1 1 .OOE + 09 0 1E + 0 9 2.00E-06 '""•ip'lÍ 2 2.00E + 09 2E + 0 9 0 2.00E-06 jl||ni|iiiliiiii 3 4.00E + 09 4E + 09 0 4.00E-O6 s u . 4 2.50E + 09 0 2.5E + 0 9 4.00E-06 FLUJO EN REMOCIÓN SEQMENTO EL RÍO EN EL RÍO 1-3 1.00E + 0 7 0.5 « f f 2-3 5.OOE + 0 7 0.35 Í B i " 3-4 1.10E + 08 0.6 2.50E + 08 J i 4-5
" 1

F

G

H

CONCENT. ESTÁNDAR COSTO DE DECA EN EL RÍO TRATAMIENTO 20 100 0 / 40.00 20 0 / 47.27 20 0 / 22.48 20 0 TOTAL 0

/

/

$D$4/$B$10 - SUM($H$4t/$H$7)

- $B$4*$C$4*$I$4

432

APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

cálculos de la concentración se pueden introducir de manera fácil en lus celdas de la hoja de cálculo. Una vez que se crea la hoja de cálculo, se elige la selección Solver del menú Tools. En este punto, un recuadro de diálogo se desplegará, requiriéndole la información pertinente. Las celdas pertinentes del recuadro de diálogo se podrían llenar como
Ubique la celda desiir Igual a O máx • rnín O igual a

Por cambio de celdas C4:C7 Sujeto a las restricciones: C7< 1 C7>0 F4>G4 F5 >G5 F6>G6 F7>G7

Observe que no todas las restricciones son mostradas, ya que el recuadro de diálogo despliega sólo seis restricciones a la vez. Cuando se selecciona el botón OK, se abre un recuadro de diálogo con un reporte sobre el éxito de la operación. Para el presente caso, el Solver obtiene la solución correcta, la cual se muestra en la figura 16.6. Antes de aceptar la solución (al seleccionar el botón OK en el recuadro reporte del Solver), observe que se ha generado 3 reportes: Respuesta, Sensibilidad y Límites. Seleccione el reporte Sensibilidad y después presione el botón OK para aceptar la solución. El Solver generará automáticamente un reporte de sensibilidad, como el de la figura 16.7.

FIGURA 16.6 RESULTADOS DE MINIMIZACIÓN. LOS ESTÁNDARES DE CALIDAD DEL AGUA SE CUMPLEN A UN COSTO DE 12 600/DIARIOS. OBSERVE quo AUN CON EL HECHO DE QUE NO SE REQUIERE TRATAMIENTO PARA LA CIUDAD 4 , LA CONCENTRACIÓN EN SU PUNTO DE MEZCLADO ACTUALMENTE EXCEDE EL ESTÁNDAR. A :B -. D i 6 t Costo m í n i m o del t r a t a m i e n t o de a g u a s de desecho Costo unit. Concent. No tratada Tratamiento Descarga Estándar Ciudad P X W d en el río deCA ! 1 .OOE + 09 0.8 2E + 0 8 2.00E-06 20 2 2.OOE + 09 0.5 1E + 09 2.00E-06 20.00 0 4.00E + 09 0.5625 1.75E + 09 20.00 4.00E-06 4 2.50E + 09 0 2.5E + 09 15.28 4.00E-06 Flujo en Remoción Seqmento Total el río en el río 1-3 1.00E + 07 0.5 2-3 5.00E + 07 0.35 3-4 1.10E + Q8 0.6 H Costo de tratamiento •16QQ. 2000 9000 0

1 2 3 4

6
10 HfH •Pl

20 20 20 20

4-5

2,$°§tG§

m
M i c r o s o f t Excel 5 . 0 S e n s i t l v i t y R e p o r t W o r k s h e e t : [CASE 1 5 0 2 . X L S ] W a s t o T r e a t R e p o r t Craated: 3 / 9 / 9 7 8 : 2 9

Cambiando celdas
Celda $C Nombre $ 4 " 7 Valor final " " ' " Costo reducido . . " ° Coeficiente objetivo " 2 0 0 ° Aumento permisible " Í " É " Disminución permisible + 3 0 Ó

$C $5_ x $C$6 x $C $7_ x Restricciones
Celda Nombre

0.5 0.5625 0

_0 0 10000

4000 16000 10000

!.E+..30'____ 0 ! I + . 30

1200 16000 10000

Valor final

Precios anticip.

Restric. LD

Aumento permisible

Disminución permisible

FIGURA 16.7
k'nporte de sensibilidad en uno hoja de cálculo lista |Kiia evaluar el costo de liiitumiento de aguas sobre un sistemo de ríns renulndo.

$F $5 __conc $F$6 $F$7 conc_ conc

20.00 _ 20.00 15.28

-30.00 -440.00 6 .00

20 20

20 _ 1E+30

_

20 4.72

20 17.87878788

15.90909091

Ahora examinemos la solución (véase figura 16.6). Observe que el estándar ajustara en todos los puntos de mezclado. De hecho, la concentración en la ciudad 4 será en realidad menor que el estándar (16.28 mg/L), aunque no se requiere tratamiento para lo ciudad 4. Como un ejercicio final, se puede disminuir los estándares 3-4 y 4-5 para ahora tener 10 mg/L. Antes de hacer esto, se puede examinar el reporte de Sensibilidad. Para el caso actual, la columna clave de la figura 16.7 es el precio anticipado. El precio anticipado es un valor que expresa la sensibilidad de la función objetivo (en nuestro caso, el costo) con una unidad que cambia una de las restricciones (estándares calidad-agua). Por tanto, representa el costo adicional en que se incurrirá al hacer los estándares más restrictivos. Para nuestro ejemplo, revela que el precio anticipado más grande, — $440/Ac , ocurre para uno de los cambios de estándar (es decir, corriente abajo de la ciudad 3) que se están contemplando. Esto indica que nuestra modificación será costosa.
í3

Esto se confirma cuando se vuelve a ejecutar el Solver con los nuevos estándares (es decir, se disminuye el valor en las celdas G6 y G7 a G10). Como se muestra en la tabla
T A B L A 1 6 . 3 Comparación de los dos escenarios involucrando el impacto de diferentes regulaciones sobre los costos de tratamiento.
E s c e n a r i o 1 : T o d a s l a s c, = 2 0 Ciudad
X

Escenario 2 : C o r r i e n t e a b a j o c. Ciudad
X

10 c

c

1 2 3 4

0.8 0.5 0.5625 0 Costo - $12,600

20 20 20 15.28

1 2 3 4

0.8 0.5 0.8375 0.264 Costo - $19,640

20 20 10 10

434

APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

16.3, el resultado es que el costo del tratamiento aumentó de $ 12 600/diarios u $ I 9 640/ diarios. Además, al reducir el estándar de concentraciones para las llegadas inferiores significará que la ciudad 4 debe comenzar a tratar sus desechos, y que la ciudad 3 debe actualizar su tratamiento. Observe también que no se afecta el tratamiento en las duda des corriente arriba. 16.3 M Á X I M A T R A N S F E R E N C I A DE POTENCIA P A R A U N CIRCUITO ( I N G E N I E R Í A ELÉCTRICA) Antecedentes. El circuito simple con resistencias mostrado en la figura 16.8 contieno tres resistores fijos y uno ajustable. Los resistores ajustables son llamados potenciómetros Los valores para los parámetros son V = 80 V, R = 8 Q, R = 12 Q. y R = 10 Ll. a) Encuentre el valor de la resistencia ajustable R que maximiza la transferencia de potencia a través de las terminales 1 y 2. b) Realice un análisis de sensibilidad paiu determinar cómo varía la máxima potencia y el valor correspondiente del potenciómetro sobre un rango de 45 a 105 V
l 2 3 a

Solución. A partir de las leyes de Kirchhoff se puede obtener una expresión para la potencia del circuito, como

P(R )
a

=

VRiR, Ri(R + Ri + Ri) + RiRa + R3R2
( 1 6 . 1 1 )

a

Sustituyendo los valores de los parámetros dados se obtiene la gráfica mostrada en ln figura 16.9. Observe que la máxima transferencia de potencia ocurre en una resistencia de aproximadamente 16 Q.

FIGURA 16.8
Un circuito resistor con un resistor ajustable, o potenciómetro. +

«1 A

R

2

M

F

I

'3

FIGURA 1 6 . 9
Una gráfica de transferencia de potencia a través de las terminales 1-2 de la figura 1 6 .8 como una función de la resistencia del P(R )
a

40
20

Potencia

potonciómetro R .
0

0

1 ¿.3

MÁXIMA TRANSFERENCIA DE POTENCIA PARA U N CIRCUITO

435

A

B

'•'i
2

M á x i m a t r a n s f e r e n c i a de potencia V Rl R2 R3 Ra P|Ra) 80 8 12 10 16.44445

t

D

3
4 5 6

FIGURA 16.10 l>ciluminación en Excel de ln polc-ncia máxima a través i lo un potenciómetro niiKJiíinle prueba y error.

7
8

9

30.03003
=(B3*B6*B8/(B4'(B8+B5+B6)+B6*B8+B6*B5)) 2/B8
A

Resolveremos este problema en tres formas con la hoja de cálculo Excel. Primero, se emplea la prueba y error y la opción Solver. Después, se desarrollará un programa macro en Visual BASIC para realizar un análisis de sensibilidad. d) En la figura (16.10) se muestra una hoja de cálculo Excel para implementar la ecuación (16.11). Como se indica, la ecuación (16.11) se puede introducir en la celda B9. Entonces el valor de R (celda B8) puede ser variada en forma de prueba y error hasta que se tenga un residuo mínimo. Para este ejemplo, el resultado es una potencia de 30.03 W con un valor en el potenciómetro de R = 16.44 Q. Un planteamiento superior involucra usar la opción Solver del menú Tools de la hoja de cálculo. En este punto se desplegará un recuadro de diálogo requiriendo de usted la información pertinente. Las celdas pertinentes del recuadro de diálogo Solver se llenarán como
a a

Ubique la celda destino: Igual a 9 máx O mín

B9 O igual a B8 0

Por cambio de celdas

Cuando el botón OK es seleccionado, se despliega un recuadro de diálogo con un reporte sobre el éxito de la operación. Para el caso actual, Solver obtiene la misma solución correcta mostrada en la figura 16.10. b) Ahora, aunque el procedimiento anterior es excelente para una sola evaluación, no es conveniente para los casos donde se deben emplear múltiples optimizaciones. Tal podría ser el caso para la segunda parte de esta aplicación, donde estamos interesados en determinar en qué modo la potencia máxima varía para diferentes valores de voltaje. Está claro que el Solver podría llamar muchas veces los diferentes valores de los parámetros, pero esto será ineficiente. Una forma preferible sería involucrar el desarrollo de una función macro que llegue al óptimo. Tal función es enlistada en la figura 16.11. Observe la similitud tan cercana con el pseudocódigo de la búsqueda de la sección dorada que se presentó en la figura 13.5. Además, observe que una función se debe definir también para calcular la potencia de Acuerdo con In ecuación (16.11).

436

APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN Functlon GoldenCxlow, x h l g h , R l , R2, R3, V) maxlt - 50 : es - 0.01 : r - (5 0.5 - 1) / 2 x l - xlow : xu - x h l g h : 1 t e r - 1 d - r * (xu - x l ) x l - x l + d : x2 - xu - d f l - PowerCxl, R l . R2, R3, V) f 2 - Power(x2. R l , R2, R3, V) I f f l > f 2 Then xopt - x l : f x - f 1 Else xopt - x2 : f x - f 2 End I f Do d - r * d I f f l > f 2 Then x l - x2 : x2 - x l x l - xl + d : f2 - f l f l - PowerCxl. R l . R2, R3, V) Else xu - x l : x l - x2 x2 - xu - d : f l - f 2 f 2 - Power(x2, R l . R2, R3, V) End I f 1ter - i t e r + 1 I f f l > f 2 Then xopt - x l : f x - f l Else xopt - x2 : f x - f 2 End I f I f xopt O 0 then ea - ( 1 - r ) * AbsCCxu - x l ) / x o p t ) * 100 I f ea <- es Or i t e r > maxlt Then E x i t 0o Loop Gol den - xopt End Functlon
A

Function PowerCRa, R l . R2, R3, V) Num - (V * R3 * Ra / CR1 * (Ra + R2 + R3) + R3 * Ra + R3 * R2)) Power - Num/Ra End Function

A

2

FIGURA 16.11 Macro para Excel escrito en Visual BASIC para determinar un mínimo con la búsqueda do la sección dorada.

En la figura 16.12 se muestra una hoja de cálculo Excel que utiliza este macro para evaluar la sensibilidad de la solución para el voltaje. Se tiene una columna de valores que cubre un rango de los voltajes (esto es, de 45 a 105 V). En la celda B9 se tiene una función de llamado del macro que referencia el valor adyacente de V (los 45 volts en A9).

LIE.
*JF>'
1

M á x i m a t r a n s f • r a n c i a de potencia Rl 8 R2 12 R3 10 Rmín 0.1 Rmáx 100 V Ra ^ PiRal 45 1 6 . 4 4 4 4 4 9 . 5 0 1 6 8 9 6 0 16.44444 16.89189 75 16.44444 26.39358 90 16.44444 38.00676 105 1 6 . 4 4 4 4 4 5 1 . 7 3 1 4 2

Llama a la macrofunclón hecha en V i s u a l B A S I C Oro ($B$6,$B$7,$B$3,$B$4,$B$5,A9)

' I f ' '
1 1 1 1 1 1 1

/

llliilíliiim

w

\

TI'.

\

\

\

Cálculo de la potencia]

=(A9*$B$5*B9/($B$3*{B9+$B$4+$B$5)+$B$5*B9+$B$3*$B$4))*2/B9

FIGURA 16.12 I li > | u de cálculo de Excel para implementar un análisis de sensibilidad de la potencia máxima con variaciones de voltaje. I ski iijlina accesa el programa macro para la búsqueda de la sección dorada de la figura 16.1 1.

Además, se incluye también parámetros en la función argumento. Advierta que, mientras la referencia con Ves relativa, las referencias a los valores iniciales superior e inferior y las resistencias son absolutos (esto es, incluyendo el signo $). Esto se hizo de tal forma que cuando la fórmula se copie, las referencias absolutas queden fijas, mientras que la referencia relativa corresponde al voltaje en el mismo renglón. Una estrategia similar se usa para introducir la ecuación (16.11) en la celda C9. Cuando se copian las fórmulas hacia abajo, el resultado es como el mostrado en la figura 16.12. La potencia máxima se puede trazar para visualizar el impacto de las variaciones de voltaje. En la figura 16.13 se observa que la potencia aumenta con el voltaje. Los resultados para los valores correspondientes en el potenciómetro (R ) son más interesantes. La hoja de cálculo indica que para un mismo valor, 16.44 £2, se tiene una
a

FIGURA 16.13 Resultados del análisis de sensibilidad para el efecto de las variaciones de voltaje sobre la máxima potencia.

438

APLICACIONES EN LA INGENIERÍA: O P T I M I Z A C I Ó N

potencia máxima. Tal resultado podría ser difícil de intuir basado en una inspección casual en la ecuación (16.11).

16.4

D I S E Ñ O DE U N A BICICLETA DE M O N T A Ñ A (INGENIERÍA MECÁNICA/AEROESPACIAl) Antecedentes. Por su trabajo en la industria de la construcción, los ingenieros civiles son más comúnmente asociados con el diseño estructural. Sin embargo, otras especial i dades de la ingeniería deben tratar también con el impacto de fuerzas sobre los dispositivos que ellos diseñan. En particular, los ingenieros mecánicos y aeroespaciales deben cumplir tanto con la respuesta estática como con la dinámica en una amplia clase de vehículos que van desde automóviles hasta vehículos espaciales. El interés reciente en bicicletas de competencia y recreativas ha significado que los ingenieros tengan que dirigir sus habilidades hacia el diseño y pruebas de bicicletas do montaña (véase figura 16.14a). Suponga que se le asigna la tarea de predecirlos desplazamientos horizontal y vertical de un sistema de frenos de una bicicleta como respucstn a una fuerza. Suponga que las fuerzas que usted debe analizar se pueden simplificar, como se ilustra en la figura 16.14&. A usted le interesa probar la respuesta de la mano cuando se ejerce una fuerza en cualquier número de direcciones designadas por el ángti loft Los parámetros para el problema son E = módulo de Young = 2 X 1 0 Pa, A área de sección transversal = 0.0001 m , w — ancho = 0.44 m, l = longitud = 0.56 m, y h = altura = 0.5 m. Se puede resolver los desplazamientos e n * y y al determinar ION valores que den una energía potencial mínima. Determine los desplazamientos para uun fuerza de 10 000 N y un rango de los 8 desde 0°(horizontal) hasta 90° (vertical).
11 2

Solución. Este problema se puede plantear al desarrollar la siguiente ecuación para ln energía potencial del sistema de frenado.

V{x,y)

=

1— J x + - ^ i - \ — )y
2

2

- Fx eos 6-Fy

sen 0

(16.1 ,'|

FIGURA 1 6 . 1 4
a) Una bicicleta de montaña junto con b) un diagrama de cuerpo libre para una patio <lnl marco.

16.4

D I S E Ñ O D E U N A BICICLETA D E

MONTAÑA

Resolviendo para un ángulo en particular es tarea simple. Para 6 ~ 30°, se pueden sustituir en la ecuación (16.12) los valores de los parámetros dados y obtener V(x,y) = 5 512 026x
2

+ 28 471 2 1 0 / - 5000JC - 8660v

El mínimo de esta función se puede determinar de diferentes formas. Por ejemplo, mediante el Solver de Excel, la energía potencial mínima es — 3.62 con deflexiones de x = 0.000786 y y = 0.0000878 m. Por supuesto que se puede implementar el Solver de Excel en forma repetida para diferentes valores de 6 con el fin de verificar cómo se modifica la solución con el cambio de ángulo. En forma alterna, se puede escribir un macro en la misma forma que se hizo en la sección 16.3, de tal forma que se puedan implementar optimizaciones múltiples en forma simultánea. Queda claro que, para este caso, un algoritmo de búsqueda multidimensional debería implementarse. Una tercera forma de plantear el problema podría ser mediante el uso de un lenguaje de programación como Fortran 90, junto con un software de librerías para métodos numéricos tal como el IMSL. En cualquiera de los casos, los resultados se muestran en la figura 16.15. Como se esperaba (véase figura 16.15a), la deflexión x es mucho más pronunciada cuando la carga está dirigida en la dirección x (6 — 0 ) y la deflexión y tiene un máximo cuando la carga está dirigida en la dirección y (0 — 90°). Sin embargo, observe que la deflexión x es mucho más pronunciada que en la dirección y. Esto se manifiesta también en la figura 16.156, donde la energía potencial es mayor a bajos ángulos. Ambos resultados se deben a la geometría del marco de la bicicleta. Si w fuera mayor, las deflexiones podrían ser más uniformes.
o

FIGURA 1 6 . 1 5
o) El impacto de diferentes ángulos sobre las deflexiones (observe que Z e s la resultante de las componentes x y y| y b| energía potencial de una parte del marco de la bicicleta de montaña sujeta a una fuerza constante.

a) 0 . 0 0 1 0

r-

m 0.0005 -

0.0000

o o

30

60

90 0

I I I I I I I I I

440

APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

PROBLEMAS 16.1 Diseñe el contenedor cilindrico óptimo (véase figura P16.1) de tal forma que abra por un extremo y tenga paredes de espesor insignificante. El contenedor va a almacenar 0.2 m . Realice el diseño de tal forma que sean mínimos el área del fondo y sus lados. 16.2 Diseñe el contenedor cónico óptimo (véase figura P16.2) de tal forma que tenga una tapa y paredes de espesor insignificante. El contenedor va a almacenar 0.2 m . Realice el diseño de modo que tanto su tapa como sus lados sean minimizados. 16.3 Diseñe el tanque cilindrico óptimo con tapas semiesféricas (véase figura P16.3). El contenedor va a almacenar 0.2 m y tiene paredes de espesor insignificante. Observe que el volumen de cada una de las tapas semiesféricas se puede calcular con
3 3 3

Ingeniería química/petrolera

Tapa

FIGURA P 16.2 Un contenedor cónico con tapa.

A=n(h

2

+ r)
2

V =

a) Diseñe el tanque de tal forma que el área sea minimizada. Interprete el resultado. b) Repita el inciso a), pero ahora agregue la restricción L > 2/i. 16.4 La razón de crecimiento específico de una fermentación que produce un antibiótico es una función de la concentración de comida c, 2c ~ ~ 4 + 0.8c + c + 0.2c
8 2 3

FIGURA P l 6.3 Un contenedor cilindrico con tapas semiesféricas.

FIGURA P 16.1 Un contenedor cilindrico sin tapa.
Abierto

h

Como se ilustra en la figura Pl 6.4, el crecimiento parte de cero u muy bajas concentraciones debido a la limitación de la coinidn También parte de cero en altas concentraciones debido a los clbc tos de toxicidad. Encuentre el valor de c para el cual el cree i miento es un máximo. 16.5 Una planta química produce tres productos principales on una semana. Cada uno de estos productos requiere una cieiln cantidad de materia prima química de diferentes tiempos do producción, y se obtiene diferentes ganancias. La información pertinente se resume en la tabla siguiente:

Producto 1

Producto 2

Producto 3

Disponibilidad do f u e n t e *

Materia prima química Tiempo de producción Nueva utilidad

5 kg/kg 0.05 hr/kg $30/kg

4 kg/kg 0.1 hr/kg $30kg

lOkg/kg 0.2 hi/kg $35/kcj"

3 000 k<]
,'),'>
II/MHIKIIUI

PROBLEMAS

441

c (mg/L)

FIGURA P16.4 ! ( i razón de crecimiento específico de una fermentación que nioduce un antibiótico contra la concentración de comida.

de producción. Determine qué cantidad de productos y desechos se deben crear para maximizar las utilidades.
Ingeniería civil/ambiental

16.7 Un módulo de elemento finito de una viga en voladizo sujeta a carga y momentos (véase figura P16.7) se da para optimizarla. ()bserve que hay suficiente espacio en bodega de la planta para almacenar un total de 450 kg/ a la semana. a) Establezca un problema de programación lineal para maximizar las utilidades. />) Resuelva el problema de programación lineal con el método simplex. c) Resuelva el problema con un paquete de software. </) Evalúe cuál de las siguientes opciones aumentará más las utilidades: incrementar la materia prima química, el tiempo de producción o el almacenaje. H > . < > Recientemente los ingenieros químicos se han involucrado on el área conocida como minimización de desechos. Esto comprende la operación de una planta química de un modo tal que los impactos sobre el ambiente sean minimizados. Suponga que IIIIII refinería desarrolla un producto, Zl, hecho de dos materias primas Xy Y. La producción de 1 tonelada métrica del producto involucra 1 tonelada de Xy 2.5 toneladas de Xy produce 1 toneliula de un líquido de desecho, W. Los ingenieros tienen que enl'rcntar esto con tres formas alternas para el manejo de los desechos: • Producir una tonelada de un producto secundario, Z2, al agregar una tonelada adicional de X por cada tonelada de W. Producir una tonelada de otro producto secundario, Z3, al agregar 1 tonelada de Y por cada tonelada de W. Tratar los desechos de tal forma que su descarga sea permisible.
f(x,y) = 5x -5xy
2

+2.5y

2

l.5y

donde x = desplazamiento en el extremo y y = momento en el extremo. Determine los valores de x y y que minimicen f(x, y). 16.8 Suponga que se le pide diseñar una columna para soportar una carga de compresión P, como se muestra en la figura P16.8a. La columna tiene una forma de sección transversal como la de un tubo de pared delgada, como la mostrada en la figura P16.86. Las variables de diseño son el diámetro medio del tubo, d, y el espesor de la pared, t. El costo del tubo se calcula con Costo = / ( / , d) = c W + c d
x 2

FIGURA P l 6.8 a) Una columna que soporta una carga de compresión P. b) la columna tiene la forma de una sección transversal como la de un tubo de pared delgada.

• •

I os productos dan utilidades de $2 500, -$50 y $200/toneladas pin II Zl, Z2, y Z3, respectivamente. Observe que al producir Z2 NO obtiene de hecho una pérdida. El costo del proceso de tratamiento es do $3(>0/tonclada. Además, la compañía tiene acceso a un limite do 7 500 y 10 000 toneladusdo Xy Y durante el poriodo

a)

442

APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN donde o = concentración de oxígeno disimilo |nig/L, <> con centración saturada de oxigeno [mg/L], / = tiempo do I n i v i N 'h i = concentración BOD en el punto de mezclado 0 k = razón de descomposición de la demanda de oxigeno bioquímico (BOD, por sus iniciales en inglés) [d 1, k iii/ón de asentamiento de (BOD) [ d ] , k = razón de reatiaeión |il 1 y S = demanda de oxígeno sedimentado [mg/L/dj. Como se indica en la figura P16.9, la ecuación (l>Id.") pin duce un oxigeno "disuelto" que alcanza un nivel mínimo cillli n, o , en algún tiempo de travesía, t , debajo del punto de desairan Este punto es llamado "crítico", ya que representa la uhiciuií'in para flora y fauna que dependen del oxígeno, como el pe/., i|iits sería la más esforzada. Determine el tiempo de travesía crilii-u y la concentración dados los siguientes valores:

donde c, -= 4 y c = 2 son factores de costo y W — peso del tubo,
2

donde p = densidad del material del tubo = 0.0025 kg/cm . La columna debe soportar la carga bajo esfuerzo de compresión y no pandearse. Por lo tanto,
3

W ndlllp

[d], L
d b c

x

| n i u / l

|,

1

x

_1

1

a

Esfuerzo real (o) < esfuerzo máximo de compresión = 03, = 550 kg/cm Esfuerzo real < esfuerzo de pandeo El esfuerzo real está dado por
2

c

_

P

A jrdt
_
P

Se puede demostrar que el esfuerzo de pandeo es

donde E = módulo de elasticidad e / = segundo momento de área de la sección transversal. Se puede usar el cálculo para demostrar que

JiEI H dt
2

o= L k
s
10 m g / L k = 0 . 0 5 d~'
s 2

d= 0=

0.1 d"

1

k
h 2

a

= O.d (I

1

50 m g / L S = 1 mp/l./.l

1 6 1 .0 La distribución bidimensional de la concentración de mn taminantes en un canal se puede describir con c(x, y) = 7.9 + 0.13.t + 0.21y - 0.05x - 0 . 0 1 6 y - 0.007x>'

l = \dt[d> + ?) áedyt d = dmodelo t = det — Q=n -A R ' S ' Streeter-Phelps
3 i 2 2 2 k d L

Determine la localización exacta de la concentración pico dinln la función y con el conocimiento de que el pico cae dentro do lun fronteras - 1 0 < x < 10 y 0 <y < 20. Finalmente, los diámetros disponibles para los tubos están entre 1 6 1 .1 El flujo Q [m /s] en un canal abierto se puede predecir con d y d y el espesor entre í, y t . Desarrolle y resuelva este prolacosto. ecuación de Manning (recuerde la sección 8.2) blema al determinar los valores que minimizan el Observe que H = 275 cm, P = 2 000 kg, E = 900 000 kg/cm , 2 3 1 2 1 cm, 0.1 cm y 1 cm. { 2 = 10 cm, l 2 C 16.9 Se puede usar el para calcular la concentración de oxígeno disuelto en un río por debajo de un donde n = coeficiente de rugosidad de Manning (un n ú m e r o N I I I punto de descarga de desechos (véase figura P16.9), dimensiones usado para parametrizar la fricción del c a n a l ) ; = área de sección transversal del canal (m ); S = pcndienlo ilol ° (,,-*«' _ _ (i canal (sin dimensiones, metros de caída por metro de longitud), (P16.9) y R = radio hidráulico (m), el cual se relaciona para m á s purA < s d metros fundamentales por s a
2

A,,

FIGURA P 1 6 . 9

• ok + k

k

Oxígeno dísuelto "a la deriva" por debajo del punto de descarga de desechos en un río.

A R = — P
c

donde perímetro mojado (m). Como su nombre lo i n d i c n , perímetro mojado es la longitud de los lados del canal y l'ondo que están por debajo del agua. Por ejemplo, para un c a n a l i w tangular, esto se define como P = B +2H donde = profundidad (m). Suponga que u s t e d se cnaipnlrtt usando esta fórmula para d i s e ñ a r un c a n a l lineal ( o b s e r v e l o s granjeros a l i n e a n los canales p i n a minimizar l a s pérdidiiN por goteo).

P= H

c|

PROBLEMAS u) Dados los parámetros // - 0.0.15, .V = 0.003 y Q = I nvVs, determine los valores de H y II que minimizan el perímetro mojado. Advierta que un cálculo como éste podría minimizar el costo si los costos de alineación fueran mucho mayores que los de excavación. b) Repita el inciso anterior, pero esta vez incluya el costo de excavación. Para realizar esto minimice la siguiente función de costos,

443

40 V

C = A + cP
Cl 2

FIGURA P l 6.13 Un circuito eléctrico en paralelo para cargar tres baterías.
2

donde c es un factor de costo por excavación = 100 $/m y c es un factor de costo por alineación $50/m. c) Analice las implicaciones de sus resultados.
x 2

Ingeniería eléctrica
1 6 . 1 2 Un modelo para un solenoide se puede expresar como

L =

S + 6(a/b) + W(c/b)

donde L = inductancia, N = número de vueltas ya,byc describen la geometría como la mostrada en la figura P16.12. Se quiere maximizar L para una longitud dada del alambre ( con un área de sección transversal ^ . S i € = 2 m y ^ = 1 0 ~ m , entonces se requiere que
6 2

7a N/b
2
bc_

25 V Encuentre las corrientes que maximizan la potencia transferida a las baterías. Este problema se puede formular como el siguiente problema de programación lineal: Maximizar P = 15/ + 6 / + 2 5 /
2 4 5

sujeto a:

h = h + h
¡\ < 5

2nNA = 2 y
77
Por tanto, Encuentre a y b que maximice L. 16.13 Un circuito eléctrico se diseña para usar una fuente de 40 volts para cargar baterías conectadas en paralelo de 15 V, 6 V y

¡ < 4 h < 3 U 2
2

S

N

1

\Q' N
6

I\,h,

h, h, Is > 0

16.14 El circuito mostrado en la figura P16.14 consiste de cinco resistores y sus respectivas corrientes. Encuentre las resistencias de modo que la potencia total disipada por el circuito sea un mínimo. Suponga que cada corriente puede variar entre los límites superior e inferior,
;,min

FIGURA P16.12 Las dimensiones de un solenoide.

i — i.max

FIGURA P 1 6 . 1 4 Un circuito eléctrico.

444

APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

y que la caída de voltaje a través de cada resistor sea constante; es decir, V¡ = RJi = constante, Formule este caso como un problema de optimización restringida. 16.15 Un sistema consiste en dos plantas de potencia que deben entregar cargas sobre una red de transmisión. El costo de generación de potencia en las plantas 1 y 2 están dadas por Fi = 2p + 2
x

La figura P16.16 muestra esta función. Use un método numérico para determinar la desviación a la cual ocurre el máximo par. Ingeniería mecánica/aeroespacial 16.17 El arrastre total sobre un alerón se puede estimar por

fricción

empuje

F = 10p
2 x 2

2

donde p y p = potencia producida por cada planta. Las pérdidas de potencia debido a la transmisión, L, están dadas por Li =0.2pi + 0 . 1 p L =0.2p, +0.5p
2 2

2

La demanda total de potencia es 30. Determine la generación de potencia requerida para cumplir con las demandas, mientras se minimizan las costos usando una rutina de optimización como las que se encuentran en Excel, Mathcad, IMSL, etcétera. 16.16 El par transmitido a un motor de inducción es una función de la desviación entre la rotación del campo del estator y la velocidad del rotor, donde la desviación se define como
s =

n-riR n

donde D = arrastre, a = razón de la densidad del aire entre la altitud de vuelo y el nivel del mar, W = peso y V = velocidad. Como se observa en la figura P16.17, los dos factores que contribuyen al arrastre son afectados en forma diferente cuando la velocidad aumenta. Mientras que el arrastre por fricción aumenta con la velocidad, el arrastre por empuje disminuye. La combinación de estos dos factores llevan a un arrastre mínimo, a) Si o = 0.5 y W = 15 000, determine el arrastre mínimo y la velocidad a la cual esto ocurre, b) Además, desarrolle un análisis de sensibilidad para determinar cómo varía este óptimo en respuesta a un rango que va de W = 12 000 a 18 000 con a = 0.5. 16.18 Cuatro resortes helicoidales se pueden usar para soportar un vagón de tren que transporta bicicletas de montaña a Denver. Se desea encontrar el diámetro de alambre (d), el diámetro de la espiral (D) y el número de vueltas (Af) que minimice el peso del resorte y limite la deflexión a 0.15 pulgadas, el esfuerzo constante para 9 000 psi, y se requiere que el esfuerzo cortante sea mayor de 120. Este problema se puede formular como el siguiente problema de optimización: M i n i m i z a r ^ , D, N) = sujeto a Deflexión = 8FD /V
3

donde n = revoluciones por segundo de la velocidad de rotación del estándar y n — velocidad del rotor. Se puede usar las leyes de Kirchhoff para demostrar que el par (expresado en forma adimensional) y la desviación están relacionadas por
R
r

4

-^-{nDNp)

_

15J(1-J) (1 - Í ) ( 4 Í - 3 Í + 4 )
2

< 0.15

FIGURA P16.16 Par transmitido a un inductor como una función de deslizamiento.

FIGURA P 1 6 . 1 7 Gráfico de arrastre contra velocidad para un alerón.

T
4 3

D
20 000

443
Esfuerzo cortante = K<—».- < 9000 nd' •JGg d, D, N > 0 Si los valores dados para la carga y los parámetros del material se sustituyen, obtenemos Minimizar F(d, D, N) = QJd DN
2

K/'7>

d
2

Frecuencia natural = -—;==— _... Ijljin D N_ > 120

sujeto a d 110—r— > 1
4 3

d D
3

FIGURA P 1 6 . 1 9 Rodamientos de rodillo.

>

1

135> 1 DN d, D,N > 0
2

Resuelva para d,DyN. 16.19Los rodamientos de rodillo están sujetos a fallas por fatiga causadas por grandes cargas por contacto F (véase figura P16.19). El problema para encontrar la localización del máximo esfuerzo a lo largo del eje x se puede demostrar que es equivalente a maximizar la función
f(x) =

0.4

0.4 1 +x

2

+ x

Encuentre la x que maximiza/(se).

16.20 Una compañía aeroespacial está desarrollando un nuevo aditivo de combustible para aerolíneas comerciales. El aditivo se compone de tres ingredientes: X, Yy Z. Para un comportamiento máximo, la cantidad total de aditivo debe ser de al menos 6 mL/ L de combustible. Por razones de seguridad, el total de los altamente flamables ingredientes Xy Y no debe exceder de 3 mL/L. Además, la cantidad del ingrediente .Ydebe ser siempre igual o mayor que el Y, y el Z debe ser mayor que la mitad del Y. Si el costo por mililitro de los ingredientes X, Y y Z es 0.15, 0.025 y 0.05, respectivamente, determine el costo mínimo de la mezcla por cada litro de combustible.

E P Í L O G O : PARTE C U A T R O
Los epílogos de las otras partes de este libro contienen un análisis y un resumen tabular de los elementos de juicio entre los métodos, así como fórmulas importantes y relaciones. La mayoría de los métodos de esta parte son muy complicados y, en consecuencia, no se pueden resumir con simples fórmulas y resúmenes tabulares. Por tanto, aquí nos desviaremos un poco para proporcionar el siguiente análisis narrativo de los elementos de juicio y referencias adicionales.

PT4.4

E L E M E N T O S DE JUICIO El capítulo 13 trató acerca de la búsqueda del óptimo para una función no restringida de una sola variable. El método de búsqueda de la sección dorada es un método cerrado que requiere de un intervalo que contenga un solo óptimo conocido. Tiene la ventaja de minimizar las evaluaciones de la función, y siempre converge. La interpolación cuadrática también trabaja mejor cuando se implementa como un método de intervalo, aunque se puede también programar como un método abierto. Sin embargo, en tales casos, puede divergir. Tanto el método de búsqueda de la sección dorada como el de interpolación cuadrática no requieren evaluaciones de la derivada. Así, ambos son apropiados cuando el intervalo puede definirse fácilmente y las evaluaciones de la función son costosas. El método de Newton es un método abierto que no requiere que un óptimo sea acotado. Se puede implementar en una representación de forma cerrada cuando la primera y segunda derivadas pueden ser determinadas en forma analítica. Es posible implementar también en una forma similar al método de la secante con representaciones por diferencias finitas de las derivadas. Aunque el método de Newton converge fácilmente cerca del óptimo, con frecuencia diverge para valores iniciales pobres. La convergencia depende también de la naturaleza de la función. En el capítulo 14 se trató dos tipos generales de métodos para resolver problemas do optimización no restringidos de muchas dimensiones. Los métodos directos como el do búsqueda aleatoria y el univariable no requieren las evaluaciones de las derivadas de la función y con frecuencia son ineficientes. Sin embargo, proveen también una herramienta para encontrar el óptimo global más que el local. Métodos de búsqueda patrón como el de Powell pueden ser muy eficientes y tampoco requieren la evaluación de la derivada. Los métodos gradiente usan la primera y algunas veces la segunda derivada puní encontrar el óptimo. El método de pasos ascendente/descendente proporciona un procedimiento confiable pero en ocasiones lento. En contraste, el método de Newton a moñudo converge con rapidez cuando se está en la vecindad de una raíz, pero algunas vecen sufre divergencia. El método de Marquardt usa el método de pasos descendente en In ubicación de inicio, muy lejos del óptimo, y después cambia al método de Newton coren del óptimo, en un intento por tomar las fortalezas de cada método. El método de Newton puede ser costoso en el contexto computacional, ya que re quiere cálculos tanto del vector gradiente como de la matriz Hessian. El procedimiento de cuaii-Newton Intenta evitar eitos problemai al mar anroxim »cinn«« u n

rmA,mU

PT4.5

REFERENCIAS ADICIONALES

447

número de evaluaciones de la matriz (en forma particular la evaluación, almacenamiento e inversión del Hessian). En la actualidad, las investigaciones continúan para explorar las características y ventajas correspondientes de varios híbridos y métodos en serie. Algunos ejemplos son el método del gradiente conjugado de Fletcher-Reeves y los métodos cuasi-Newton de Davidon-Fletcher-Powell. El capítulo 15 se dedicó a la optimización restringida. Para problemas lineales, la programación lineal basada en el método simplex proporciona un medio eficiente para obtener soluciones. Procedimientos tales como el método GRG están disponibles para resolver problemas restringidos no lineales. Los paquetes de software y librerías incluyen una amplia variedad de capacidades de optimización. El más genérico es la librería IMSL, la cual contiene muchas subrutinas para implementar la mayoría de los algoritmos de optimización estándar. No hace mucho Excel tenía las capacidades de optimización más útiles en la forma de herramienta Solver. Debido a que esta herramienta está diseñada para implementar la forma más general de optimización (la optimización restringida no lineal), esto puede ser usado para resolver problemas en todas las áreas que se cubrieron en esta parte del libro.

PT4.5

REFERENCIAS ADICIONALES Para problemas en una dimensión, el método de Brent es un híbrido que intenta tomar en cuenta la naturaleza de la función para asegurar una convergencia lenta y uniforme para valores iniciales pobres y una rápida convergencia cerca del óptimo. Véase Press y cois. (1992) para detalles. Para problemas en varias dimensiones, se puede encontrar información adicional en Fletcher (1980,1981), Gilí y cois. (1981), Dermis y Schnabel (1996) y en Luenberger (1984).

A J U S T E DE C U R V A S
PT5.1 MOTIVACIÓN Los datos a menudo son dados para valores discretos a lo largo de un continuo. Sin embargo, usted puede requerir una estimación en puntos entre los valores discretos. Esta parte del libro describe técnicas para el ajuste de curvas de tales datos para obtener estimaciones intermedias. Además, usted puede requerir una versión simplificada de una función en un número de valores discretos a lo largo del rango de interés. Después, se puede derivar una función más simple para ajustar esos valores. Estas dos aplicaciones se conocen como ajuste de curvas. Existen dos procedimientos generales para el ajuste de curvas que se distinguen uno del otro con base en el grado de error asociado con los datos. Primero, donde los datos exhiban un grado significativo de error o "ruido", la estrategia será derivar una sola curva que represente la tendencia general de los datos. Debido a que cualquier dato individual puede ser incorrecto, no se necesita interceptar cada punto. En lugar de esto, se designa la curva para seguir un patrón de los puntos tomados como un grupo. Un procedimiento de esta naturaleza es llamado regresión por mínimos cuadrados (véase figura PT5.la). Segundo, donde se conoce que los datos son muy precisos, el procedimiento básico será ajustar a una curva o a una serie de curvas que pasen directamente a través de cada uno de los puntos. Usualmente tales datos se originan de tablas. Como ejemplos se tienen los valores de la densidad del agua o la capacidad calorífica de los gases en función de la temperatura. La estimación de valores entre puntos discretos bien conocidos es llamada interpolación (véase figura PT5.1& y PT5.1 c). PT5.1.1 M é t o d o s s i n computadora p a r a el ajuste de curvas

El método más simple para ajustar a una curva los datos es ubicar los puntos y después dibujar una línea que visualmente conforma a los datos. Aunque ésta es una operación válida cuando se requiere una estimación rápida, los resultados son dependientes del punto de vista subjetivo de la persona que dibuja la curva. Por ejemplo, en la figura PT5.1 son mostrados trazos desarrollados a partir del mismo conjunto de datos por tres ingenieros. El primero no intentó conectar los puntos; en vez de ello, caracterizó la tendencia general hacia arriba de los datos con una línea recta (véase figura PT5.1 a). El segundo ingeniero usó segmentos de línea recta o interpolación lineal para conectar los puntos (véase figura PT5.16). Ésta es una práctica común en la ingeniería. Si los valores están verdaderamente cercanos a ser lineales o cercanamente espaciados, tal aproximación provee estimaciones que son adecuadas en muchos cálculos de la ingeniería. Sin embargo, donde la relación resaltada es altamente curvilínea o los datos están espaciados en forma muy amplia, se puede introducir errores por esa interpolación lineal. El tercer ingeniero usa curvas para tratar de capturar el serpenteado sugerido por los datos (véase figura PT5.1c). Un cuarto o quinto ingeniero podría, de

450

AJUSTE DE CURVAS

FIGURA PT5.1 Tres intentos para ajustar a la "mejor" curva con cinco puntos, a) Regresión por mínimos cuadrados, b) interpolación lineal, y c) interpolación curvilínea.

igual forma, desarrollar ajustes alternativos. Es obvio que nuestra meta aquí es desarrollar métodos sistemáticos y objetivos con el propósito de obtener tales curvas.

PT5.1.2

A j u s t e de curvas y práctica de la ingeniería

Su primera situación en el ajuste de curvas podría haber sido determinar valores intermedios a partir de datos tabulados (por ejemplo, de tablas de interés para ingeniería económica, o a partir de tablas de vapor para termodinámica). En lo que resta de su carrera, usted tendrá frecuentes oportunidades para estimar valores intermedios de dichas tablas. Aunque muchas de las amplias propiedades usadas en la ingeniería han sido tabuludas, hay muchas más que no están disponibles en esta forma conveniente. Casos especiales y contextos de problemas nuevos a menudo requieren que usted recolecte sui propioi

PT5.Z

A N T E C E D E N T E S MATEAAATIC05

491

datos y desarrolle sus propias relaciones predictivas. Se han encontrado dos tipos generales de aplicaciones cuando se ajustan datos experimentales: análisis de tendencia y pruebas de hipótesis. Los análisis de tendencia representan el proceso de usar el patrón de los datos para realizar predicciones. Para casos donde se miden los datos con alta precisión, usted podría utilizar interpolación de polinomios. Con frecuencia, datos imprecisos son analizados con regresión por mínimos cuadrados. Los análisis de tendencia se pueden usar para predecir o pronosticar valores de la variable dependiente. Esto puede involucrar una extrapolación más allá de los límites de los datos observados o una interpolación dentro del rango de los datos. Todos los campos de la ingeniería comúnmente involucran problemas de este tipo. Una segunda aplicación de la ingeniería en el ajuste de curvas de experimentos es la prueba de hipótesis. Aquí, un modelo matemático existente se compara con los datos medidos. Si se desconocen los coeficientes del modelo, podría ser necesario determinar los valores que mejor ajusten a los datos observados. Por otro lado, si ya se dispone de la estimación de los coeficientes del modelo convendría comparar los valores predichos del modelo con los observados para probar qué tan adecuado es el modelo. Con frecuencia, los modelos alternativos son comparados y "el mejor" es seleccionado con base en observaciones empíricas. Además de las mencionadas aplicaciones en la ingeniería, el ajuste de curvas es importante en otros métodos numéricos, tales como en integración y la solución aproximada de ecuaciones diferenciales. Por último, las técnicas de ajuste de curvas se pueden usar para derivar funciones simples con el fin de aproximar funciones complicadas.

PT5.2

ANTECEDENTES MATEMÁTICOS Los antecedentes matemáticos como prerrequisito para interpolación se encuentran en el material sobre las expansiones de la serie de Taylor y las finitas divididas que se introdujeron en el capítulo 4. La regresión por mínimos cuadrados requiere de información adicional del campo de la estadística. Si usted conoce los conceptos de la media, desviación estándar, suma residual de los cuadrados, distribución normal e intervalos de confianza, puede omitir el estudio de las siguientes páginas y pasar directamente a la sección PT5.3. Si no recuerda muy bien estos conceptos o necesita de un repaso, el estudio del siguiente material le servirá como una breve introducción a estos temas.

PT5.2.1

Estadística simple

Suponga que en el curso de un estudio de ingeniería se realizaron varias mediciones de una cantidad en particular. Por ejemplo, la tabla PT5.1 contiene 24 lecturas del coeficiente de expansión térmica de un acero estructural. Tomados como genuinos, los datos proporcionan una cantidad limitada de información (es decir, que los valores van de un rango mínimo de 6.395 a un máximo de 6.775). Se puede obtener un conocimiento adicional al resumir los datos en una o más funciones estadísticas bien seleccionadas que tengan tanta información como sea posible acerca de características específicas del conjunto de datos. Esas estadísticas descriptivas son seleccionadas con más frecuencia para

452

AJUSTE DE CURVAS TABLA PT5.1 6.495 6.665 6.755 6.565 Mediciones del coeficiente de expansión térmico para acero estructural 6.595 6.505 6.625 6.515 6.615 6.435 6.715 6.555 6.635 6.625 6.575 6.395 6.485 6.715 6.655 6.775 6.555 6.655 6.605 6.685

representar 1) la posición del centro de la distribución de los datos y 2) el grado de aproximación de los datos fijos. La localización estadística más común es la media aritmética. La media aritmética (y) de una muestra se define como la suma de los datos individuales (y¡) dividida entre el número de puntos («), o

y = A -

(PT5.1)

donde la sumatoria (y todas las sumatorias que siguen en esta introducción) va de i = 1 a n. La medida más común de espaciamiento para una muestra alrededor de la media es la desviación estándar (s ),

h

-g¿

(PT,2)

donde S, es la suma total de los cuadrados de los residuos entre los datos y la media, o S, = S {y,- - y? (PT5.3)
t

Así, si las mediciones individuales están muy espaciadas alrededor de la media, S (y, en consecuencia, Sy) será grande. Si están agrupadas cerca de ella, la desviación estándar será pequeña. El espaciamiento también se puede representar por el cuadrado de la desviación estándar, al cual se le llama la varianza:

(PT5.4)

Observe que el denominador en ambas ecuaciones (PT5.2) y (PT5.4) es n — 1. La cantidad n — 1 está referida como los grados de libertad. Por tanto, S, y s se dice que se hallan basadas en n — 1 grados de libertad. Esta nomenclatura se deriva del hecho de que la suma de las cantidades sobre las cuales S se basa (es decir, y — y , y — y ,..., y — y ) es cero. En consecuencia, si y es conocida y se especifican los valores de n — 1, el valor restante es fijo. Así, sólo n — 1 de los valores se dice que están libremente determinados. Otra justificación para dividir entre n — 1 es el hecho de que no existe como In dispersión de un solo punto. Para el caso donde n = 1, las ecuaciones (PT5.2) y (PT5.4)
y t { 2 n

d a nu n multado lin sentido al infinito.

I-IJJ.Ü

ArNrctCDCNTC5 M A T E M Á T I C O S

4 1 »

Se debería observar que hay una fórmula alterna más conveniente para calcular ln desviación estándar. _ £j¿ - (X^) /«
2

2

Esta versión no requiere el cálculo previo de y y se obtiene un resultado idéntico al de la ecuación (PT5.4). Una estadística final que tiene utilidad en cuantificar la dispersión de datos es el coeficiente de variación (av.). Tal estadística es la razón de la desviación estándar a la media. Como tal, proporciona una medición normalizada de la dispersión. Con frecuencia se multiplica por 100 para que se pueda expresar en la forma de porcentaje:

c.v. = ^ 100%
y

(PT5.5)

Observe que el coeficiente de variación es similar, en esencia, al error relativo porcentual (e ) analizado en la sección 3.3. Es decir, es la razón del error de medición ( Í ) a un estimado del valor real (y).
(

EJEMPLO PT5.1

Estadística simple para una muestra

Enunciado del problema. Calcule la media, varianza, desviación estándar y coeficiente de variación para los datos de la tabla PT5.1. Solución. Los datos son sumados (tabla PT5.2) y los resultados se usan para calcular [ecuación (PT5.1)]

6.6 24 Como se observa en la tabla PT5.2, la suma de los cuadrados de los residuos es 0.217000, los cuales se pueden usar para calcular la desviación estándar [ecuación (PT5.2)]:
y =

-

1 5 8 4

0.217000 24- 1

„ „„ =0.097133

la varianza [ecuación (PT5.4)]: = 0.009435 y el coeficiente de variación [ecuación (PT5.5)]: c.v. = 0.097133 — 1 0 0 % = 1.47% 6.6

AJUSTE DE CURVAS TABLA PT5.2 Cálculos estadísticos de las lecturas del coeficiente de expansión térmico. Las frecuencias y límites son desarrolladas para construir el histograma que se muestra en la figura PT5 .2.

i

i
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
I

Yi 6.395 6.435 6.485 6.495 6.505 6.515 6.555 6.555 6.565 6.575 6.595 6.605 6.615 6.625 6.625 6.635 6.655 6.655 6.665 6.685 6.715 6.715 6.755 6.775 158.4

(y,-yf
0.042025 0.027225 0.013225 ' 0.01 1025 0.009025 0.007225 . 0.002025 " 0.002025 0.001225 ' 0.000625 • 0.000025 0.000025 " 0.000225 0.000625 0.000625 . 0.001225' 0.003025 0.003025 0.004225. 0.007225 0.013225 > 0.013225 1 0.024025 ' 0.030625
1

Frecuencia

inferior Límite

~ .

Intervalo

superior Limite

1 1

6.36 6.40

6.40 6.44

4 2

6.48 6.52

6.52 6.56

3

6.56

6.60

5

6.60

6.64

3

6.64

6.68

3 1 1

6.68 6.72 6.76

6.72 6.76 6.80

0.217000

PT5.2.2

La distribución n o r m a l

Otra característica que soporta el presente análisis es la distribución de datos (es decir, la forma con la cual se distribuyen los datos alrededor de la media). Un histograma proporciona una representación visual simple de la distribución. Como se observa en la tabla PT5.2, se construye el histograma al ordenar las mediciones en intervalos. Las unidades de medición se grafican en la abscisa y la frecuencia de ocurrencia de cada intervalo en la ordenada. Así, cinco de las mediciones se encuentran entre 6.60 y 6.64. Como se ve en la figura PT5.2, el histograma indica que la mayoría de los datos se agrupan cerca del valor de la media de 6.6. Si se tiene un conjunto de datos muy grande, el histograma a menudo se puede aproximar a una curva suave. La curva simétrica, en forma de campana que se sobrepone como en la figura PT5.2, es una característica de forma (la distribución normal). Dadas suficientes mediciones adicionales, el histograma para este caso en purticulur se aproximará eventualmente a la distribución normal.

PT5 .Z

ANTECEDENTES MATEMÁTICOS

481

FIGURA PT5.2 Se usa un histograma para ¡lustrar la distribución de datos. En tanto el número de puntos aumente, el histograma se podría aproximar a una curva suave en forma de campana, llamada distribución normal.

Los conceptos de la media, desviación estándar, suma de cuadrados de los residuos y distribución normal tienen una alta relevancia en la práctica de la ingeniería. Un ejemplo muy simple es su uso para cuantificar la confianza que se puede adscribir a una medición en particular. Si una cantidad está normalmente distribuida, el rango definido por y — s a y + s abarcará en forma aproximada el 68% de las mediciones totales. En forma similar, el rango definido por y — 2s a y + 2s abarcará alrededor del 9 5 % . Por ejemplo, para los datos de la tabla PT5.1 (y — 6.6 y s = 0.097133), se puede afirmar que aproximadamente el 9 5 % de las lecturas deberían estar entre 6.405734 y 6.794266. Si alguien nos dijera que tomó un valor de lectura de 7.35, entonces se podría sospechar que las mediciones fueron erróneas. En la siguiente sección se trabaja sobre tales evaluaciones.
y y y y v

PT5.2.3

Estimación de los i n t e r v a l o s de confianza

Como quedó claro de la sección anterior, una de las principales metas de la estadística es estimar las propiedades de una población basada en una muestra limitada tomada de esa población. Es evidente que es imposible medir el coeficiente de expansión térmica para cada pieza de acero estructural que no se haya producido. En consecuencia, como se muestra en las tablas PT5.1 y PT5.2, se puede realizar un número de mediciones en forma aleatoria y, con base en la muestra, intentar caracterizar las propiedades de lodu población.

AJUSTE DE CURVAS

Ya que se "infieren" propiedades de la población desconocida de una muestra limitada, el intento es llamado inferencia estadística. Ya que los resultados son a menudo reportados como estimaciones de los parámetros de población, el proceso es también referido como estimación. Se ha demostrado cómo estimar la tendencia central (media de la muestra, y) y la dispersión (desviación estándar de la muestra y varianza) de una muestra limitada. Ahora, se describirá en forma breve cómo se pueden conjuntar los enunciados probabilísticos con la calidad de esas estimaciones. En particular, se analizará cómo se puede definir un intervalo de confianza alrededor de un estimado de la media. Se ha escogido este tópico en particular debido a su relevancia directa en los modelos de regresión que se describirán en el capítulo 17. Observe en el siguiente análisis que la nomenclatura y y s se refieren a la media de la muestra y su desviación estándar. La nomenclatura ¡j. y a se refieren a la media y desviación estándar de la población. Las primeras son algunas veces referidas como la media y desviación estándar "estimada", mientras que las últimas son llamadas algunas veces la media y desviación estándar "real". Un estimador de intervalo proporciona el rango de valores dentro de los cuales el parámetro se espera que esté con una probabilidad dada. Tales intervalos se describen como si fueran de un lado o de dos lados. Como su nombre lo implica, un intervalo de un lado expresa nuestra confianza en que el parámetro estimado sea menor que o mayor que el valor real. En contraste, el intervalo de dos lados tiene que ver con una proposición más general en la que la estimación concuerda con la verdad, sin considerar el signo de la discrepancia. Como éste es más general, nos concentraremos en el intervalo de dos lados. Un intervalo de dos lados puede ser descrito por la relación
y

P{L<ii<U}

=

\ - a

que puede leerse como, "la probabilidad que la media real de y, ¡u esté dentro del límite de L a U es 1 — a". La cantidad a es conocida como el nivel de significancia. De esta forma, el problema para definir un intervalo de confianza se reduce a estimar L y U. Aunque no es absolutamente necesario, es costumbre observar el intervalo de dos lados con la probabilidad a distribuida de manera uniforme como a/2 en cada cola de la distribución, como se muestra en la figura PT5.3. Si la varianza real de la distribución de y, a es conocida (lo cual no es el caso usual), la teoría de la estadística establece que la media de la muestra y se obtiene de una 2 distribución normal con una media y varianza (véase cuadro PT5.1). En el caso ilustrado en la figura PT5.3, no se conoce realmente fl. Por tanto, no se sabe dónde se ubica con exactitud la curva normal con respecto a y. Para evitar este dilema, se calcula una nueva cantidad, la estimación de la normal estándar.
2

n

o ln

z =

y

-^L

(PT5.6)

la cual representa la distancia normalizada entreyy /x. De acuerdo con la teoría estadística, esta cantidad debería estar distribuida normalmente con una media de 0 y unu variuii/,» do a /n. Además, la probabilidad de que z esté dentro de la región no sombread* de la fiauraPT5 .3dBb «ria ««ri — n D n - - i — — •-•
2 J J J

PT5.2

ANTECEDENTES MATEMÁTICOS

F I G U R A PT5.3 Un intervalo de confianza de dos lados. La escala en la abscisa en a) se escribe en las unidades naturales de la variable aleatoria /. b] es una versión normalizada de la abscisa que toma el origen en la ubicación de la media y escala el eje de manera que la desviación estándar corresponda a un valor unitario.

<

—Z /2
a

O

,

>

Z /2
a

con una probabilidad de a. La cantidad z^ es una variable aleatoria normal estándar. Ésta es la distancia medida a lo largo del eje normalizado arriba y debajo de la media que cubre la probabilidad 1 — a (véase la figura PT5.36). Los valores de z^ están tabulados en libros de estadística (por ejemplo, Milton y Arnold, 1995). Ellos también pueden ser calculados mediante funciones en paquetes de software y librerías como Excel e IMSL. Como un ejemplo, para a = 0.05 (en otras palabras, definiendo un intervalo que cubre el 95%), z es igual a casi 1.96. Esto significa que un intervalo alrededor de la media con ancho + 1.96 veces la desviación estándar abarcará en forma aproximada el 9 5 % de la distribución. Esos resultados se pueden reordenar para obtener
a/2

L < ix < U con una probabilidad de 1 — a, donde
L = y - -^z
a/2

U = y + -^z

o / 2

(PT5.7)

Ahora, aunque lo anterior proporciona un estimado de L y U, está basado en un conocimiento de la varianza real o. Para nuestro caso, conocemos solamente la varianza

458

AJUSTE DE CURVAS

Cuadro PT5.1

Un poco de estadística Existe un importante teorema conocido como el Teorema de Limite Central que responde en forma directa a esta pregunta. Se puede enunciar como Sea y\,y ,- • •, Y una muestra aleatoria de tamaño na partir de una distribución con una media \1 y varianza O . Entonces, para n grandes, y es aproximadamente normal con la media \iy la varianza C ln. Ademéis, para n grandes, la variable aleatoria (y — /i)/(o7 \/~ñ) es de manera aproximada la normal estándar.
2 n 2 2

La mayoría de los ingenieros han tomado varios cursos para ser competentes en estadística. Como usted tal vez aún no ha tomado ninguno se mencionará algunas ideas con las cuales esta sección se haría más coherente. Como se ha mencionado, el "juego" de estadística inferencial supone que la variable aleatoria que usted muestrea, y, tiene una media real (n) y varianza (a ). Además, en este análisis se supondrá que tiene una distribución particular: la distribución normal. La varianza de esta distribución normal tiene un valor infinito que especifica la "dispersión" de la distribución normal. Si la varianza es grande, la distribución es ancha. En forma opuesta, si la varianza es pequeña, la distribución es angosta. Así, la varianza real cuantifica la incertidumbre intrínseca de la variable aleatoria. En el juego de la estadística, se toma un número limitado de mediciones de esta cantidad llamada muestra. De esta muestra, se puede calcular una media estimada (y) y la varianza (s ). Cuantas más mediciones se tomen, mejor serán las estimaciones para que se aproximen a los valores reales. Esto es, como n -> °°,y^>fiys ->o . Suponga que se toman n muestras y se calcula una media estimaday¡. Después se toman otras n muestras y se calcula otra, y . Se puede repetir este proceso hasta que se haya generado una muestra de medias: y , y , y-¡,. •., y , donde m es grande. Se puede entonces desarrollar un histograma de estas medias y determinar una "distribución de las medias", así como una "desviación estándar de las medias". Ahora surge la pregunta: ¿Esta nueva distribución de medias y su estadística se comportan en una forma predecible?
2 2 2 2 2 x 2 m

Así, el teorema establece el resultado notable de que la distribución de las medias siempre será normalmente distribuida, ¡sin importar la distribución en uso de las variables aleatorias! Esto también da el resultado esperado, que dada una muestra lo suficientemente grande, la media de las medias debería converger sobre la media real de la población \i. Además, el teorema dice que en tanto se tenga tamaños de muestra más grandes, la varianza de las medias deberá aproximarse a cero. Esto tiene sentido, ya que si n es pequeña, las estimaciones individuales de la media deberían ser pobres, y la varianza de las medias, grandes. En tanto n aumente, la estimación de la media mejorará y, por tanto, se acortará su dispersión. El Teorema de Límite Central claramente define en forma exacta cómo este estrechamiento relaciona tanto a la varianza real como al tamaño de la muestra; por ejemplo, como a ln. Por último, el teorema establece el importante resultado que se ha dado en la ecuación (PT5.6). Como se muestra en esta sección, el resultado es la base para construir con seguridad intervalos para la media.
2

estimada s . Una alternativa más directa podrá ser una versión de la ecuación (PT5.6) basada en s ,
y

t =

^ ~ jí_
Sy/Vn

(PT5.8)

Aun cuando la muestra se tomó de una distribución normal, esta fracción no será normalmente distribuida, en particular cuando n sea pequeña. W. S. Gossett encontró que la variable aleatoria definida por la ecuación (PT5.8) maneja la tan conocida distribución estudiante — t o, en forma simple, la distribución t. Para este caso,
L = y ~zt 2.„-\
al

U =

y +

~ta/2, ,
t

i

(PT5.9)

PT5.2 ANTECEDENTES MATEMÁTICOS

459

Normal

f(n-6)

F I G U R A PT5 .4
Comparación de la distribución normal con la distribución f para n = 3 y n = ó. Observe cómo la distribución fes normalmente más plana.

donde -\ ^ variable aleatoria estándar de la distribución t para una probabilidad de a/2. Como fue el caso para z ^ , los valores están tabulados en libros de estadística, y también pueden calcularse mediante paquetes de software y librerías. Por ejemplo, si a = 0.05 y n = 20, _ = 2.086. La distribución t puede pensarse como una modificación de la distribución normal que toma en cuenta el hecho de que se tiene una estimación imperfecta de la desviación estándar. Cuando n es pequeña, tiende a ser más plana que la normal (véase la figura PT5.4). Por tanto, para pequeños números de mediciones, se obtienen intervalos de confianza más amplios y, por tanto, más conservativos. Conforme n se haga más grande, la distribución t converge sobre la normal.
e s a n n x

EJEMPLO PT5.2

Intervalo de confianza sobre la media

\ Enunciado del problema. Determine la media y el intervalo de confianza correspon• diente al 9 5 % para los datos de la tabla PT5.1. Ejecute 3 estimaciones basándose en a) las primeras 8 mediciones b) las primeras 16 y c) las 24 mediciones. ; Solución,
y

a) La media y la desviación estándar para los primeros 8 puntos es = 6.59 347.4814 - (52.72) /8
2

52.72

- 1

= 0.089921

La estadística / correcta se puede calcular como
^0.05/2,8-1 = ¿0.025,7

= 2.364623

la cual se puede usar para calcular el intervalo /. = 6.59 0.089921 -2.364623 = 6.5148

460

AJUSTE DE CURVAS

y

-M
6.50 6.55 6.60 Coeficiente de expansión térmica [x 1 0
- 6

n = 16

n = 24

6.65 pulg/(pulg • °F)]

6.70

FIGURA PT5.5 Estimación de la media e intervalos de confianza al 9 5 % para diferentes números de tamaño muestra.

0 089921 U = 6.59 + — — — 2 . 3 6 4 6 2 3 = 6.6652

78

o
6.5148 < ii < 6.6652

Así, con base en las primeras ocho mediciones, concluimos que existe un 9 5 % de probabilidad de que la media real esté dentro del rango de 6.5148 a 6.6652. Los otros dos casos para b) con 16 puntos y c) con 24 puntos, se pueden calcular en una forma similar y los resultados se tabulan junto con el inciso á) como

«
8 16 24

6.5900 6.5794 6.6000

9_ * y

t

0.089921 0.095845 0.097133

2.364623 2.131451 2.068655

a/2,n-\

6.5148 6.5283 6.5590

6.6652 6.6304 6.6410

* • U_

Estos resultados, los cuales también se resumen en la figura P T 5 . 5 , indican la respuesta esperada de que el intervalo de confianza se hace más estrecho a medida que n aumenta. Así, cuantas más mediciones se tomen, nuestra estimación del valor real se hace mhn refinado.

Lo anterior es sólo un simple ejemplo de cómo se puede usar la estadística puní tomar decisiones con respecto a datos inciertos. Esos conceptos tendrán también rele vancia en nuestro análisis de modelos de regresión. Usted puede consultar cualquier libro básico de estadística (por ejemplo, Milton y Arnold, 1995) para obtener inlbrniii ción adicional sobre este tema.

IT5.3

ORIENTACIÓN

PT5.3

ORIENTACIÓN Antes de proceder a los métodos numéricos para el ajuste de curvas, alguna orientación podría ser de utilidad. Lo siguiente se intenta como una revisión del material analizado en la parte cinco. Además, se formularon algunos objetivos para ayudar a enfocar sus esfuerzos cuando estudie el material.

PT5.3.1

Alcance y presentación

La figura PT5.5 proporciona una revisión del material que se estudiará en la parte cinco. El capítulo 17 se dedica a la regresión por mínimos cuadrados. Se aprenderá primero cómo ajustar la "mejor" línea recta a través de un conjunto de datos inciertos. Esta técnica es llamada regresión lineal. Además de analizar cómo calcular la pendiente y la intercepción de esta línea recta, se presentarán también métodos visuales y cuantitativos para evaluar la validez de los resultados. Además de ajustar a una línea recta, se presentará también una técnica general para ajustar al "mejor" polinomio. Así, usted aprenderá a derivar una parabólica, cúbica o un polinomio de orden superior que ajuste en forma óptima datos inciertos. La regresión lineal es un subconjunto de este procedimiento más general, el cual es llamado regresión polinomio!. El siguiente tema que se analiza en el capítulo 17 es la regresión lineal múltiple. Está diseñada para el caso donde la variable dependiente^ es una función lineal de dos o más variables independientes x x ,..., x . Este procedimiento tiene especial utilidad para evaluar datos experimentales donde la variable de interés es dependiente de un número de diferentes factores. Después de la regresión múltiple, ilustramos cómo las regresiones polinomial y múltiple son ambas subconjuntos de un modelo general lineal de mínimos cuadrados. Entre otras cosas, esto nos permitirá introducir una representación de regresión de matriz concisa y analizar sus propiedades estadísticas generales. Por último, las últimas secciones del capítulo 17 se dedican a la regresión no lineal. Este procedimiento se designa para calcular un ajuste por mínimos cuadrados de una ecuación no lineal a datos. En el capítulo 18 se describe la técnica alterna para el ajuste de curvas llamada interpolación. Como se analizó antes, la interpolación se usa para estimar valores intermedios entre datos precisos. En el capítulo 18 se derivan los polinomios para este propósito. Se introduce el concepto básico de interpolación polinomial al usar líneas rectas y parábolas para conectar puntos. Luego, se desarrolla un procedimiento generalizado para el ajuste de un polinomio de orden n-ésimo. Se presentan dos formatos para expresar estos polinomios en forma de ecuación. El primero, llamado interpolación polinomial de Newton, es preferible cuando se desconoce el orden apropiado de los polinomios. El segundo, llamado interpolación polinomial de Lagrange, tiene ventajas cuando el orden apropiado se conoce de antemano.
u 2 m

La última sección del capítulo 18 presenta una técnica alterna para un ajuste más preciso de datos. Ésta, llamada interpolación segmentaria, ajusta polinomios a datos pero en forma de trozos. Como tal, es particularmente muy adecuada para ajustar datos que son por lo general suaves pero que exhiben cambios locales abruptos.

462

AJUSTE DE CURVAS

PARTE 5 Ajuste de curvas

17.1 Regresión lineal

17.2 Regresión polinomial 17.3 Regresión múltiple

• f.it¡\

CAPITULO 17 Regresión por mínimos cuadrados

17.4 jMfnimos cuadrados) .Jineal generaL 17.8 Regresión no lineal

18.1 Polinomial de Newton 20.3 Ingeniería •eléctrica iiír 20.2 Ingeniería civil 20.1 Ingeniería química

18.2 Polinomial ^de Lagrange_,
CAPITULO 20 Aplicaciones en la ingeniería CAPITULO 18 Interpolación

"Ta3~ Coeficientes ^polinomiales 18.4 Interpolación inversa

j

19.8 Librerías y paquetes 19.7 Espectro de potencia
:

CAPITULO 19 Aproximación de Fourier

19.1 Sinusoidales 19.2 Serie de Fourier continua ~íai~ Frec. y dominio del tiempo 19.4 Transformada de Fourier 18 Segmentarias

18.5 Comentarios adicionales

St-i :

19.6; Transformada jápida de Fourier/ 19.5 Transformada discreta de Fourier _

FIGURA PT5.6 Organización esquemática del material de la parte cinco: Ajuste de curvas.

El capítulo 19 tiene que ver con el procedimiento de la transformada de l'ourier puní el ajuste de curvas, donde funciones periódicas se ajustan a dalos. Nucslro énfasis on esta sección seré sobre la transformada rápida de Fourier. Al final de este capitulo se

4tt
incluye también una revisión de algunos paquetes de software y librerías que se pueden usar para el ajuste de curvas; entre ellos se encuentran Mathcad, Excel, MATLAB e IMSL. El capítulo 20 se dedica a las aplicaciones de la ingeniería que ilustran la utilidad de los métodos numéricos en el contexto de problemas de ingeniería. Los ejemplos se toman de las cuatro áreas principales de la ingeniería: química, civil, eléctrica y mecánica. Además, algunas de las aplicaciones ilustran cómo se pueden aplicar los paquetes de software para resolver problemas de ingeniería. Por último, se incluye un epílogo al final de la parte cinco. Éste contiene un resumen de las fórmulas y conceptos importantes relacionados con el ajuste de curvas, así como un análisis de los elementos de juicio entre las técnicas y sugerencias para estudios en el futuro. PT5.3.2 M e t a s y objetivos

Objetivos de estudio. Después de completar la parte cinco, usted habrá depurado en gran forma su capacidad para ajustar curvas con los datos. En general, usted manejará las técnicas, habrá aprendido a asegurar la confiabilidad de sus resultados y será capaz de seleccionar el método (o métodos) para cualquier problema particular. Además, para esas metas generales, los conceptos específicos dados en la tabla PT5.3 deberán ser asimilados y manejados.

TABLA P T 5 . 3

Objetivos específicos de estudio para la parte cinco.

1. Comprender la diferencia fundamental entre regresión e interpolación, y que confundirlos puede provocar serios problemas. 2. Entender la deducción de la regresión lineal por mínimos cuadrados y ser capaz de asegurar la confiabilidad del ajuste mediante validaciones en forma gráfica y cuantitativa. 3. Saber cómo linearizar datos por transformación. 4. Entender situaciones donde son apropiadas las regresiones polinomiales, múltiples y no lineales. 5. Ser capaz de reconocer modelos lineales generales, entender la formulación de una matriz general para mínimos cuadrados lineales y saber cómo calcular los intervalos de confianza de los parámetros. 6. Entender que hay uno y sólo un polinomial de grado n o menor que pasa exactamente a través de n + 1 puntos. 7. Saber cómo derivar la interpolación polinomial de Newton en primer orden. 8. Entender la analogía entre el polinomial de Newton y la expansión de la serie de Taylor y cómo se relaciona el error de truncamiento. 9. Reconocer que las ecuaciones de Newton y Lagrange son simplemente formulaciones diferentes de la misma interpolación polinomial, y entender sus respectivas ventajas y desventajas. 10. Percatarse que por lo general se obtienen resultados más exactos si los datos usados para interpolación son más o menos centrados y cercanos del punto desconocido. 1 1. Darse cuenta que los datos de los puntos no tienen que estar igualmente espaciados en cualquier orden particular, ya sea para los polinomiales de Newton o de lagrange. 12. Saber por qué las fórmulas de interpolación con igual espaciamiento tienen utilidad. 13. Reconocer las capacidades y riesgos asociados con la extrapolación. 14. Entender por qué las funciones segmentadas tienen utilidad para datos con áreas locales de cambio abrupto. 15. Reconocer cómo se usan las series de Fourier para ajustar datos con funciones periódicas. 16. Entender la diferencia entre frecuencia y dominios del tiempo.

464

AJUSTE DE CURVAS

Objetivos de cómputo. Se le ha proporcionado el software y algoritmos de cómputo simples para implementar las técnicas analizadas en la parte cinco. Usted puede también tener acceso a los paquetes de software y librerías. Todo esto tiene utilidad como herramientas de aprendizaje. El software de Métodos Numéricos TOOLKIT incluye regresión polinomial. Los gráficos asociados con este software permiten visualizar fácilmente el problema y las operaciones matemáticas asociadas. Las gráficas son una parte esencial del aseguramiento de la validez de un ajuste por regresión. Éstas también proporcionan guías con respecto al uso correcto de la regresión polinomial y de los peligros potenciales de la extrapolación. El software es muy fácil de aplicar para resolver problemas prácticos y se puede usar para verificar los resultados de cualquier programa en computadora que usted mismo haya desarrollado. Además, se proporcionan los algoritmos en pseudocódigo para la mayoría de los otros métodos en la parte cinco. Esta información le permitirá expandir su software de librerías para incluir técnicas más allá de la regresión polinomial. Por ejemplo, usted puede encontrar útil, desde un punto de vista profesional, tener software para implementar la regresión lineal múltiple, la interpolación polinomial de Newton, la interpolación segmentaria cúbica y la transformada rápida de Fourier. Finalmente, una de las metas más importantes deberá ser manejar varios de los paquetes de software de utilidad general que están disponibles ampliamente. En particular, usted debería acostumbrar usar esas herramientas para implementar métodos numéricos para la solución de problemas en la ingeniería.

CAPITULO 17 Regresión por mínimos cuadrados
Donde se asocian errores sustanciales con los datos, la interpolación polinomial es inapropiada y puede dar resultados insatisfactorios cuando se usa para predecir valores intermedios. Por ejemplo, en la figura 17.1a se muestran siete datos derivados experimentalmente que exhiben variabilidad significativa. Una inspección visual de dichos datos sugiere una posible relación entre y y x. Es decir, la tendencia general indica que los valores más altos de y son asociados con los valores más altos de x. Ahora, si una interpolación de sexto orden se ajusta a estos datos (figura 17.1¿»), pasará justo a través de todos los puntos. Sin embargo, a causa de la variabilidad en los datos, la curva oscila en forma amplia en el intervalo entre los puntos. En particular, los valores interpolados en x = 1.5 y JC = 6.5 parecen estar muy adelante del rango sugerido por los datos. Una estrategia más apropiada para tales casos es derivar una función aproximada que ajuste la forma de la tendencia general de los datos sin ajustar necesariamente con los puntos individuales. La figura 17.1c ilustra cómo se puede usar por lo general una línea recta para caracterizar la tendencia de los datos sin pasar a través de un punto en particular. Una manera para determinar la línea en la figura 17.1c es inspeccionar en forma visual los datos graneados y después trazar una "mejor" línea a través de los puntos. Aunque tales procedimientos por "vistazo" apelan al sentido común y son válidos para cálculos superficiales, resultan deficientes por ser arbitrarios. Es decir, a menos que los puntos definan una línea recta perfecta (en tal caso la interpolación podría ser apropiada), diferentes analistas podrían dibujar distintas líneas. Para hacer a un lado la subjetividad se debe concebir algunos criterisj^n el fin de establecer una base para el ajuste. Una forma de hacerlo es derivar una curva que minimice la discrepancia entre los puntos y la curva. Una técnica para cumplir con tal objetivo se conoce como regresión por mínimos cuadrados, que se analizará en este capítulo.

17.1

REGRESIÓN LINEAL El ejemplo más simple de una aproximación por mínimos cuadrados es mediante el ajuste de un conjunto de pares de observaciones: (x ,y ), (x ,y ), • • •. (x„ ,y„) a una línea recta. La expresión matemática para esta última es
l l 2 2

V =

c/<) +

+

('

(17.1)

466

R E G R E S I Ó NP O RM Í N I M O SC U A D R A D O S

a)

b)

FIGURA 17.1 a) Datos que exhiben un error significativo, b) Ajuste polinomial oscilando más allá del rango de datos, c) Resultados más satisfactorios mediante el ajuste por mínimos cuadrados.

c)

donde a y a¡ son coeficientes que representan el intercepto y la pendiente, respectivamente, y e es el error, o residuo, entre el modelo y las observaciones, las cuales se pueden representar al reordenar la ecuación (17.1) como
0

v-e r o - a\x Así, el envr o residuo es la discrepancia entre el valor real <icy y el valor aproximado, o„
e =

+

predicho por la ecuación lineal.

17,1

REGRESIÓN LINEAL

4*9

17.1.1

Criterios p a r a un " m e j o r " ajuste

Una estrategia para ajustar a la ¿"mejor"? línea a través de los datos podría ser minimizar la suma de los errores residuales para todos los datos disponibles, como en

J2 '<
e

=

í

= l

(-' " °° " >) 1
y
aix
=1

( 1 7 . 2 )

donde n — número total de puntos. Sin embargo, éste es un criterio inadecuado, como lo ilustra la figura 17.2a, la cual muestra el ajuste de una línea recta de dos puntos. Obvia-

FIGURA 17.2
Ejemplos de algunos criterios para "el mejor ajuste" inadecuados para regresión: a) minimiza la suma de los residuos, b) minimiza la suma de los valores absolutos de los residuos y c) minimiza el error máximo de cualquier punto individual

c)

x

468

REGRESIÓN POR MÍNIMOS CUADRADOS

mente, el mejor ajuste es la línea que conecta los puntos. Sin embargo, cualquier línea recta que pasa a través del punto medio que conecta la línea (excepto una línea perfecta vertical) resulta en un valor mínimo de la ecuación (17.2) igual a cero debido a los errores que se cancelan. Por tanto, otro criterio lógico podría ser minimizar la suma de los valores absolutos de las discrepancias, como en
n n

^ k l

1 = 1

= Yl^ >
y

- o- i í\
a a x

í = i

La figura 17.2b demuestra por qué este criterio es también inadecuado. Para los cuatro puntos expuestos, cualquier línea recta que esté dentro de las líneas punteadas minimizará el valor absoluto de la suma. Así, este criterio tampoco da un único mejor ajuste. Una tercera estrategia para ajustar a la mejor línea es el criterio técnica, la línea se elige de manera que minimice la máxima distancia que tenga un punto individual desde la línea. Como se ilustra en la figura 17.2c, tal estrategia no es adecuada para regresión, ya que tiene una excesiva influencia en puntos fuera del conjunto; es decir, un solo punto con un gran error. Debería observarse que el principio minimax es algunas ocasiones muy adecuado para ajustar una simple función a una complicada función (Carnahan, Luther y Wilkes, 1969). Una estrategia que supera los defectos de los procedimientos mencionados es minimizar la suma de los cuadrados de los residuos entre la y medida y la y calculada con el modelo lineal

mirúmax.

En

n n
^ = 2^=2(y ,
;
k

n
a->' ,modelo)
1 2

m e d i d

=

2<>,-ao-«l^)
¡=1

2

(

1 7

- )
3

;=1

i=l

Este criterio tiene varias ventajas, entre ellas el hecho de que se obtiene una línea única para un cierto conjunto de datos. Antes de analizar esas propiedades, presentaremos una técnica para determinar los valores de a y a que minimizan la ecuación (17.3). 1 7 . 1 . 2 Ajuste p o r m í n i m o s cuadrados de u n a línea recta
0 {

Para determinar los valores de a y a la ecuación (17.3) es diferenciada con respecto a cada coeficiente:
0 v

3S da dS ^2[{y
r Yl( 0 r2
2 y¡


a

~ )
aiXi

¡
« o « i )•*•;]

9<2l

Observe que hemos simplificado los símbolos de la sumatoria; a menos que se indique otra cosa, todas las sumatorias son de i = 1 hasta n. Al fijar esas derivadas igual a cero, resultará en un mínimo S . Si se hace esto, las ecuaciones se pueden expresar como
r

17.1

REGRESIÓN LINEAL

4 1 9

Ahora, si hacemos que £ a = na , podemos expresar las ecuaciones como un conjunto de dos ecuaciones lineales con dos incógnitas ( a y a,):
0 0

na + (X! ) ' ~X ^ '
x ai 1 0
a
0

0

O ' )
7 4
(17.5) (17.6)

+

Q T X ? )

a i

=£>

y

¡

.

Estas son llamadas ecuaciones normales, y pueden ser resueltas en forma simultánea

nlx* -

(Zx,.)*

Este resultado, entonces, se puede usar en conjunto con la ecuación (17.4) y resolver para a = y - ax
0 x

(17.7)

donde y y x son las medias de y y x, respectivamente.
EJEMPLO 17.1 Regresión lineal

i

Enunciado del problema. Ajuste a una línea recta los valores de x y y en las dos primeras columnas de la tabla 17.1. Solución. n = i
^JC,-=:28

Se calculan las siguientes cantidades:
x

>-y¡ =
i =

1

1

9

5

J2 <
x

2 =

1

4

0

y = 4

^

y¡ = 24

24 x = — = 3 .428571

Mediante las ecuaciones (17.6) y (17.7) 7(119.5)-28(24) „„„„„„„ ai = — -V- = 0.8392857 7(140) - (28)
2

a = 3 .428571 - 0.8392857 (4) = 0.07142857
0

TABLA 17.1

Cálculos para un análisis de error del ajuste lineal.

_*f
1 j í I 1 2 3 4 5 6 7 S

y >
0.5 2.5 2.0 4.0 3.5 6.0 ¿5. 24.0

(y;-y)
8.5765 0.8622 2.0408 0.3265 0.0051 6.6122 54,29Qg 22.7143

2

(yz-op-*»!*;)
0.1687 0.5625 0.3473 0.3265 0.5896 0.7972 01993 2 .9911

2

470

REGRESIÓN POR MÍNIMOS CUADRADOS

Por tanto, el ajuste por mínimos cuadrados es J y = 0.07142857 + 0.8392857*

S La línea, junto con los datos, son mostrados en la figura 17.1c.

17.1.3

Cuantificación del e r r o r de u n a r e g r e s i ó n lineal

Cualquier otra línea que la calculada en el ejemplo 17.1 resulta en una gran suma de cuadrados de los residuos. Así, la línea es única y en términos de nuestro criterio elegido es una línea "mejor" a través de los puntos. Un número adicional de propiedades de este ajuste se puede elucidar al examinar más de cerca la forma en que se calcularon los residuos. Recuerde que la suma de los cuadrados se define como [véase ecuación (17.3)] (17.8)
í=i

Observe la similitud entre las ecuaciones (PT5.3) y (17.8). En el primer caso, el cuadrado del residuo representa el cuadrado de la discrepancia entre los datos y una sola estimación de la medida de tendencia central (la media). En la ecuación (17.8), el cuadrado de los residuos representa el cuadrado de la distancia vertical entre los datos y otra medida de tendencia central: la línea recta (véase figura 17.3). La analogía se puede extender más para casos donde 1) la dispersión de los puntos alrededor de la línea es de magnitud similar junto con todo el rango de datos, y 2) la distribución de esos puntos cerca de la línea es normal. Se puede demostrar que si estos criterios se cumplen, la regresión por mínimos cuadrados proporcionará la mejor (es decir, una de las mejores) estimación de a y a (Draper y Smith, 1981). Esto es conocido en estadística como el principio de probabilidad máxima. Además, si estos criterios se
0 {

FIGURA 17.3 El residuo en la regresión lineal representa la distancia vertical entre un dato y la línea recta.

Medición

a + a,*,
0

x

17.1

REGRESIÓN LINEAL

cumplen, una "desviación estándar" para la línea de regresión se puede determinar como [compare con la ecuación (PT5.2)] (17.9) donde s es llamado el error estándar del estimado. La notación del subíndice "y/x" designa que el error es para un valor predicho de y correspondiente a un valor particular de x. También, observe que ahora dividimos entre n — 2 debido a los dos datos estimados (a y Í Z J ), que se usaron para calcular S ; así, se tiene dos grados de libertad. Como lo hicimos en nuestro análisis para la desviación estándar en PT5.2.1, otra justificación para dividir entre n — 2 es que no existe algo como "datos dispersos" alrededor de una línea recta que conecte dos puntos. De esta manera, para el caso donde n — 2, la ecuación (17.9) da un resultado sin sentido al infinito.
y/x Q r

Justo como fue el caso con la desviación estándar, el error estándar de la estimación cuantifica la dispersión de los datos. Sin embargo, s cuantifica la dispersión alrededor de la línea de regresión, como se muestra en la figura 17.4¿, en contraste con la desviación estándar original s que cuantifica la dispersión alrededor de la media (figura 17.4a). Los conceptos anteriores se pueden usar para cuantificar la "bondad" de nuestro ajuste. Esto es en particular útil para comparar diferentes regresiones (véase figura 17.5). Para hacer esto, regresamos a los datos originales y determinamos la suma total de los cuadrados alrededor de la media para la variable dependiente (en nuestro caso, y). Como fue el caso para la ecuación (PT5.3), esta cantidad se designa por S¡. Ésta es la magnitud del error residual asociado con la variable dependiente antes de la regresión. Después de realizar la regresión, calculamos 5 , la suma de los cuadrados de los residuos alrededor de la línea de regresión. Esto caracteriza el error residual que queda después de la regresión. Esto es, por tanto, algunas veces llamado la suma inexplicable de los cuadrados. La
y/x y r

FIGURA 17.4 Datos de regresión que muestran o) la dispersión de los datos alrededor de la media de la variable dependiente y b) la dispersión de los datos alrededor de la mejor línea de ajuste. La reducción en la dispersión va de a) a b), como lo indican las curvas en forma de campana a la derecha, representan la mejora debida a la regresión lineal.

472

REGRESIÓN POR MÍNIMOS CUADRADOS

FIGURA 17.5 Ejemplos de regresión lineal con errores residuales a) pequeños y b) grandes.

diferencia entre estas dos cantidades, S — S , cuantifica la mejora o reducción de error debido a que describe los datos en términos de una línea recta en vez de como un valor promedio. Como la magnitud de esta cantidad es dependiente de la escala, la diferencia es normalizada a S para obtener
t r t

r =
2

S

t ~

S,
S

r

(17.10)

donde r es conocido como el coeficiente de determinación y r es el coeficiente de conflación (— Vr ). Para un ajuste perfecto, S — 0yr = r = 1, significa que la línea explica el 100% de la variabilidad de los datos. Para r = r = 0, S = S, y el ajuste no representa ninguna mejora. Una formulación alternativa para r que es mas conveniente para implementarse en una computadora es
2 5 2 r 2 r

17.1 EJEMPLO 1 7 . 2

REGRESIÓN LINEAL

Estimación de errores para el ajuste lineal por mínimos cuadrados

Enunciado del problema. Calcule la desviación estándar total, el error estándar del estimado y el coeficiente de correlación para los datos en el ejemplo 17.1. Solución. Las sumatorias se realizan y se presentan en la tabla 17.1. La desviación estándar es [véase ecuación (PT5.2)]

7 - 1 y el error estándar del estimado es [véase ecuación (17.9)] s /2.9911 = ^ - =
T J n

ͱ1}ZÍ=
22 7143

1.9457

y

/

x

„„, 0.7735

Así, ya que s < Sy, el modelo de regresión lineal tiene mérito. La mejora adicional se puede cuantificar por [véase ecuación (17.10)]
y/x

r" =
2

22.7143 - 2.9911 — =0.868 22.7143

r = V0 .868 = 0 .932 Los resultados indican que el 86.8% de la incertidumbre original ha sido explicada por el modelo lineal.

Antes de proceder con el programa de cómputo para regresión lineal, debemos tomar en cuenta algunas consideraciones. Aunque los coeficientes de correlación proporcionan una manera fácil para medir la bondad del ajuste, se deberá tener cuidado de no darle más significado que el que ya tiene. Así como r es "cercana" a 1 no significa que el ajuste es necesariamente "bueno". Por ejemplo, es posible obtener un valor relativamente alto de r cuando la relación en turno entre y y x no es lineal. Draper y Smith (1981) proporcionan guías y material adicional con respecto al aseguramiento de los resultados para regresión lineal. Además, como mínimo, usted debería siempre inspeccionar una gráfica de los datos junto con su curva de regresión. Como se describe en la siguiente sección, el software de métodos numéricos TOOLKIT incluye esas capacidades. 17.1.4 P r o g r a m a de cómputo p a r a r e g r e s i ó n lineal

Esto es una cuestión relativamente trivial para desarrollar un pseudocódigo para regresión lineal (véase figura 17.6). Como se mencionó antes, una opción de gráfica es crítica para el uso efectivo e interpretación de regresión y se incluye en el software suplementario de métodos numéricos TOOLKIT. Además, paquetes de software populares como Excel y Mathcad pueden implementar regresión y tienen capacidades de graficación. Si su lenguaje de computadora tiene capacidades de graficación, recomendamos que expanda su programa para incluir una gráfica de y contra x mostrando ambos: los datos y la línea de regresión. La inclusión de la capacidad resaltará mucho la utilidad del programu en los contextos de solución de problemas.

474

REGRESIÓN POR MÍNIMOS CUADRADOS 5U3 Regres(x, y, n, al, aO, syx, r2)

sumx = 0: sumxy = 0: st ~ 0 sumy = 0: sumx2 = 0: sr = 0 DO ¡ = 1, n sumx = sumx + x¡ sumy = sumy + y¡ sumxy = sumxy + x¡y¡ sumx2 = sumx2 + x^x, EHDDO xm = sumx/n ym = sumy/n a1 — (n*sumxy ~ sumx*sumy)/(n*sumx2 aO — ym — aUxm DO i= 1,n st = st + (y¡ - ymf sr=sr+ (y¡ — a1*x¡ — aO) END DO syx = (sr/(n 2)) r2 = (st - s r j / s t
2 03

— sumx*sumx)

END Regres
FIGURA 17.6

Algoritmo para regresión lineal.

EJEMPLO 17.3

Regresión lineal usando la computadora

s : ! i !

Enunciado del problema. El paquete de software de Métodos Numéricos TOOLKIT adjunto a este texto, contiene un programa de cómputo para implementar regresión lineal. Podemos usar este software para resolver un problema de prueba hipotético asociado con la caída del paracaidista que se analizó en el capítulo 1. Un modelo matemático teórico para la velocidad del paracaidista fue dado como el siguiente [véase ecuación (1.10)]:
v{t)

S " (\ {-clm)t^ = — (1 - _ e0
1

C

donde v = velocidad (m/s), g = constante gravitacional (9.8 m/s ), m = masa del para caidista igual a 68.1 kg y c = coeficiente de arrastre de 12.5 kg/s. El modelo predice la velocidad del paracaidista como una función del tiempo, como se describe en el ejemplo 1.1. En el ejemplo 2.1 se desarrolló una gráfica de la variación de la velocidad. Un modelo empírico alternativo para la velocidad del paracaidista está dado por
2

i ; » ;/

l

\

17.1

REGRESIÓN LINEAL Velocidades medidas y calculadas para la caída del paracaidista,
v calculada con el m o d e l o , v calculada con el m o d e l o ,

TABLA 17.2

v medida. m/s Tiempo, s 1 2 3 4 5 ó 7 8 9 10 11 12 o) 10.00 16.30 23.00 27.50 31.00 35.60 39.00 41.50 42.90 45.00 46.00 45.50 46.00 49.00 50.00

m / s [ec. (1.10)]
b) 8.953 16.405 22.607 27.769 32.065 35.641 38.617 41.095 43.156 44.872 46.301 47.490 48.479 49.303 49.988

m / s [ec. ( E l 7 . 3 . 1 ) ]
c) 1 1.240 18.570 23.729 27.5.56 30.509 32.855 34.766 36.351 37.687 38.829 39.816 40.678 41.437 42.1 10 42.712

13
14 15

Suponga que a usted le gustaría probar y comparar lo adecuado de esos dos modelos matemáticos. Esto se podría cumplir al medir la velocidad real del paracaidista con valores conocidos de tiempo y comparar estos resultados con las velocidades predichas de acuerdo con cada modelo. Tal programa de colección de datos experimentales se implemento, y los resultados se enlistan en la columna a) de la tabla 17.2. Las velocidades calculadas para cada modelo se enlistan en las columnas b) y c). Solución. La adecuidad de los modelos se puede probar al graficar la velocidad del modelo calculado contra la velocidad medida. Se puede usar regresión lineal para calcular la pendiente y el intercepto de la gráfica. Esta línea tendrá una pendiente de I , un intercepto de 0 y una r = 1 si el modelo concuerda perfectamente con los datos. Una desviación significativa de esos valores se puede usar como un indicador de la inadecuidad del modelo. La figura 17.7a y 17.76 son gráficas de la línea y datos para las regresiones de las columnas b) y c), respectivamente, contra la columna a). Para el primer modelo [ecuación (1.10) como se ilustra en la figura 17.7a]
1

«Wwo = - 0 - 5 9 + 1.032u
8

medlda

y para el segundo modelo [ecuación (E17.3.1) como se ilustra en la figura 17.7/>]
"modelo =
5

-

7

7

6

+

°-

7 5 2 u

medida

Esas gráficas indican que la regresión lineal entre los datos y cada uno de los modelos ON altamente significativa. Ambos modelos ajustan los datos con un coeficiente de concia ción mayor que 0.99. I os modelos de prueba y selección son comunes y extremadiimenle imporliinlcN para la realización de actividades en todos los campos de lu ingeniciiu, lil iniitcrinl pro

476

REGRESIÓN POR MÍNIMOS CUADRADOS

!

5

30 X

55

30 X

55

FIGURA 17.7 a) Resultados que usan regresión lineal para comparar las predicciones calculadas con el modelo teórico [véase ecuación (1.10)] contra valores medidos, b) Resultados usando regresión lineal para comparar predicciones calculadas con el modelo empírico [véase ecuación ( E l 7 . 3 . 1 ] contra valores medidos.

porcionado en este capítulo como antecedente, junto con su software, le proporcionará una guía muy práctica para problemas de este tipo. Sin embargo, el modelo descrito por la ecuación (1.10) conforma para nuestra hipótesis criterios de prueba mucho mejores que los descritos por la ecuación (E17.3.1) ya que la pendiente y el intercepto son más cercanos o casi igual a 1 y 0. Así, aunque cada gráfica está bien descrita poruña línea recta, la ecuación (1.10) parece ser mejor modelo quela(E17.3.1). Hay un defecto eon el análisis en el ejemplo 17.3. El ejemplo no fue ambiguo, yn que el modelo empírico [véase ecuación (El 7.3.1)] fue claramente inferior al de la ecuación (1.10). Así, la pendiente y el intercepto para el modelo empírico fueron mucho más cercano! que el resultado deseado de 1 y 0, fue obvio cuál modelo fue superior.

17.1

REGRESIÓN LINEAL

477

Sin embargo, suponga que la pendiente fuera de 0.85 y que el intercepto lliorn de 2, Obviamente esto haría de la conclusión de que la pendiente y el intercepto fueran I y 0, un debate abierto. De manera clara, más que recaer en un juicio subjetivo, sería preferible basar tal conclusión sobre un criterio cuantitativo. Esto se puede hacer al calcular los intervalos de confianza para los parámetros del modelo en la misma forma que desarrollamos los intervalos de confianza para la media en la sección PT5.2.3. Regresaremos a este punto al final del presente capítulo. 17.1.5 Linearización de relaciones no lineales

La regresión lineal proporciona una técnica poderosa que ajusta a la "mejor" línea los datos. Sin embargo, está predicha sobre el hecho de que la relación entre las variables dependientes e independientes es lineal. Este no es siempre el caso, y el primer paso en cualquier análisis de regresión debería ser graficar e inspeccionar en forma visual para asegurarnos si se puede usar un modelo lineal. Por ejemplo, la figura 17.8 muestra algunos datos que son obviamente curvilíneos. En algunos casos, técnicas tales como regresión por polinomios, las cuales se describen en la sección 17.2, son apropiadas. Para otros, se puede usar transformaciones para expresar los datos en una forma que sea compatible con la regresión lineal.

FIGURA 17.8 o) Datos no adecuados para la regresión lineal por mínimos cuadrados, b) Indicación de que es preferible una parábola.

x b)

478

REGRESIÓN POR MÍNIMOS CUADRADOS

Un ejemplo es el modelo exponencial
y=
a i

e

h

l

X

( 1 7 1 .2 )
{

donde a y b son constantes. Este modelo se usa en muchos campos de la ingeniería para caracterizar cantidades que aumentan (b positivo) o disminuyen (b¡ negativo) u una velocidad que es directamente proporcional a sus propias magnitudes. Por ejemplo, el crecimiento poblacional o el decaimiento radiactivo pueden exhibir tal comportamiento. Como se ilustra en la figura 17.9a, la ecuación representa una relación no lineal (para /), 0) entre y y x. Otro ejemplo de modelo no lineal es la simple ecuación de potencias
x x

y = ax
2

hl

(17.13)

FIGURA 17.9 o) La ecuación exponencial, b) la ecuación por potencias y c) la ecuación de razón de crecimiento saturado. Los incisos < e] y f] son versiones linearizadas de estas ecuaciones producto de transformaciones simples.

y f

c)

1/y A

Pendiente •

/y*j

17.1

REGRESIÓN LINEAL
2 2

47?

donde a y b son coeficientes constantes. Este modelo tiene amplia uplicnbiliclud 011 todos los campos de la ingeniería. Como se ilustra en la figura 17.9/), la ecuación (pura b ^0o 1) es no lineal. Un tercer ejemplo de un modelo no lineal es la ecuación de razón de crecimiento saturado [recuerde la ecuación (El7.3.1)]
2 y = a

'l7^3

<->
17 14

donde a y b son coeficientes constantes. Este modelo, el cual es de manera particular muy adecuado para caracterizar la razón de crecimiento poblacional bajo condiciones limitadas, también representa una relación no lineal entre y y x (véase figura 17.9c) que iguala o "satura", en tanto x aumenta. Las técnicas de regresión no lineal están disponibles para ajustar esas ecuaciones a datos experimentales de manera directa. (Observe que analizaremos la regresión no lineal en la sección 17.5.) Sin embargo, una alternativa simple es usar manipulaciones matemáticas para transformar las ecuaciones en una forma lineal. Después, se puede emplear la regresión lineal simple para ajustar las ecuaciones a datos. Por ejemplo, la ecuación (17.12) se puede linearizar al tomar su logaritmo natural para dar
3

ln

y

= ln a\ +

b\X

ln e

Pero como ln e = 1, ln y = ln a + b\X
x

(17.15)

Así, una gráfica de ln y contra x dará una línea recta con una pendiente de ¿>, y un intercepto de ln a (véase la figura 17.9c/). La ecuación (17.14) es linearizada al tomar su base logaritmo 10 para dar
l

log y = b log x + log a
2

2

(17.16)

De este modo, una gráfica de log y contra log x dará una línea recta con una pendiente de b y un intercepto de log a (figura 17.9e). La ecuación (17.14) es linearizada al invertirla para dar
2 2

1 b - =
y

3

1
X

1 + —
a
3

(17.17)
3

«3

De esta forma, una gráfica de 1/y contra l/x será lineal, con una pendiente de b-¡/a y un intercepto de l / a (véase la figura 17.9/). En sus contornos transformados, estos modelos se ajustan mediante regresión lineal para evaluar los coeficientes constantes. Podrían ser de nuevo convertidos en su estado original y usados para propósitos predictivos. El ejemplo 17.4 ilustra este procedimiento para la ecuación (17.13). Además, la sección 20.1 proporciona un ejemplo de ingeniería de la misma clase de cálculo.
3

EJEMPLO 17.4

Linearización de una ecuación de potencias

Enunciado del problema. Ajustar la ecuación (17.13) con los datos en la tabla 17.3 mediante transformaciones logarítmicas de los datos.

480

REGRESIÓN POR MÍNIMOS CUADRADOS Solución. La figura 17. IOÍÜ es una gráfica de los datos originales en su estado no trans-

formado. La figura 17.10¿> muestra la gráfica de los datos transformados. Una regresión lineal de éstos mediante log dan el resultado l o g v = 1.75 log x - 0.300 TABLA 17.3 Datos que serán ajustados con la ecuación de potencias.

x

y
0.5 1.7 3.4 5.7 8.4

log x

log

y

1 2 3 4 5

0 0.301 0.477 0.602 0.699

-0.301 0.226 0.534 0.753 0.922

l FIGURA 1 7 . 1 0 | a) Gráfica de datos no transformados con la ecuación de potencias que ajusta los datos. ¡; b] Gráfica de datos transformados que se usan para determinar los coeficientes de la ecuación de potencias.

17.2

REGRESIÓN DE POLINOMIOS

411

i \

Así, el intercepto, log a , igual —0.300, y por tanto, al tomar el antilogaritmo, u¡ — 10 = 0.5. La pendiente es b = 1.75. En consecuencia, la ecuación de potencias es
2 _ 0 3 2

y • 0.5.v

l7S

Esta curva, como se gráfica en la figura 17.10a, indica un buen ajuste.

17.1.6

Comentarios generales s o b r e r e g r e s i ó n lineal

Antes de proceder con regresión curvilínea y lineal múltiple, debemos enfatizar la naturaleza introductoria del material anterior sobre regresión lineal. Nos hemos concentrado en la derivación simple y uso práctico de ecuaciones para ajustar datos. Debería estar consciente del hecho de que hay aspectos teóricos de regresión que son de importancia práctica, pero que van más allá del alcance de este libro. Por ejemplo, algunas suposiciones estadísticas que son inherentes en los procedimientos por mínimos cuadrados lineales son 1. 2. 3. Cada x tiene un valor fijo; no es aleatorio y es conocido sin error. Los valores y son variables aleatorias independientes y todas tienen la misma varianza. Los valores de y para una x dada deben ser normalmente distribuidos.

Tales suposiciones son relevantes para la derivación adecuada y uso de regresión. Por ejemplo, la primera suposición significa que 1) los valores x deben estar libres de errores y 2) la regresión de y contra x no es la misma que la de x contra y (pruebe el problema 17.4 al final del capítulo). Usted debe consultar otras referencias tales como Draper y Smith (1981) para apreciar aspectos y matices de regresión que están más allá del alcance de este libro.

17.2

R E G R E S I Ó N DE P O L I N O M I O S En la sección 17.1 se desarrolló un procedimiento para obtener la ecuación de una línea recta por medio del criterio de mínimos cuadrados. Algunos datos de ingeniería, aunque exhiben un patrón marcado como el que se vio en la figura 17.8, está pobremente representado por una línea recta. Para esos casos, una curva podría ser más adecuada para el ajuste de los datos. Como se analizó en la sección anterior, un método para cumplir con este objetivo es usar transformaciones. Otras alternativas son ajustar polinomios con los datos mediante regresión de polinomios. El procedimiento de mínimos cuadrados se puede fácilmente extender al ajuste de datos con un polinomio de orden superior. Por ejemplo, suponga que ajustamos un polinomio de segundo orden o cuadrático:
y = a
0

+ a\X

+ atx

1

+

e

Para este caso la suma de los cuadrados de los residuos es [compare con la ecuación (17.3)] S = ]T] (yi ~ «o - a\x¡ r

a xf)
2

(17.18)

482

REGRESIÓN POR MÍNIMOS CUADRADOS

Siguiendo el procedimiento de la sección anterior, tomamos la derivada de la ecuación (17.18) con respecto de cada uno de los coeficientes desconocidos del polinomio, como en

Estas ecuaciones se pueden igualar a cero y reordenar para desarrollar el siguiente conjunto de ecuaciones normal:

(17.19)

donde todas las sumatorias son de i = 1 hasta n. Observe que las tres ecuaciones anteriores son lineales y tienen tres incógnitas: a , a y a . Los coeficientes de las incógnitas se pueden evaluar de manera directa a partir de los datos observados. Para este caso, vemos que el problema de determinar un polinomio por mínimos cuadrados de segundo orden es equivalente a resolver un sistema de tres ecuaciones lineales simultáneas. Las técnicas para resolver tales ecuaciones fueron analizadas en la parte tres. El caso en dos dimensiones puede extenderse con facilidad a un polinomio de mésimo orden como
Q i 2

y = a + a\x + a x
0 2

2

H

hax
m

m

+ e

El análisis anterior se puede fácilmente extender a este caso más general. Así, podemos reconocer que la determinación de los coeficientes de un polinomio de /n-ésimo orden es equivalente a resolver un sistema de m + 1 ecuaciones lineales simultáneas. Para este caso, el error estándar se formula como

(17.20)

Esta cantidad es dividida entre n — (m + 1), ya que (m + 1) coeficientes obtenidos de los datos (a , a , , . . . , a ) se usaron para calcular S,.; así, hemos perdido m + 1 grados de libertad. Además del error estándar, un coeficiente de determinación puede ser calculado para una regresión de polinomios con la ecuación (17.10).
0 m

EJEMPLO 1 7 . 5

Regresión d e polinomios

Enunciado del problema. Ajustar a un polinomio de segundo orden los datos en I UN dos primeras columnas de la tabla 17 .4.

1 7.2

REGRE5IOIN DE P O L I N O M I O S

TABLA 17.4

Cálculos para un análisis de error del ajuste cuadrático por mínimos cuadrados.
(y -y)
; 2

x

¡

y, 2.1 7.7 13.6 27.2 40.9 61.1 152.6

(y/-OO-OIX -o x?)
f 2

0 1 2 3 4 5 2

544.44 314.47 140.03 3.12 239.22 1 272.1 1 2513.39

0.14332 1.00286 1.08158 0.80491 0.61951 0.09439 3.74657

FIGURA 17.11 Ajuste de un polinomio de segundo orden.

Solución. m = 2
n = 6

A partir de los datos dados,

X = 2.5 y = 25.433

X >= X >= í>2 > ? 15

4

979

152.6 55

= 585.6 = 2488.

225

Por tanto, las ecuaciones lineales simultáneas son " 6 15 55 15 55 225 55 " 225 979
«0

0\ «2

=

152.6 585.6 2488.8

484

REGRESIÓN POR MÍNIMOS CUADRADOS

Resolviendo estas ecuaciones con una técnica tal como la eliminación de Gauss se tiene a = 2.47857, a, = 2.35929 y a = 1.86071. Por tanto, la ecuación cuadrática por mínimos cuadrados para este caso es
0 2

y = 2.47857 + 2.35929* + 1.86071*

2

El error estándar del estimado con base en la regresión de polinomios es [véase ecuación (17.20)] = 1.12 6-3 El coeficiente de determinación es
Sy/,

3.74657

, 2 5 1 3 . 3 9 - 3.74657 r = = 0.99851 2513.39 y el coeficiente de correlación es r — 0.99925. Estos resultados indican que el 99.851% de la incertidumbre original la resolvió el modelo. Este resultado soporta la conclusión de que la ecuación cuadrática representa un excelente ajuste, como es también evidente de la figura 17.11.
2

17.2.1

A l g o r i t m o p a r a r e g r e s i ó n de p o l i n o m i o s

Un algoritmo para regresión de polinomios es expuesto en la figura 17.12. Observe que la principal tarea es la generación de los coeficientes de las ecuaciones normal [véase ecuación (17.19)]. (El pseudocódigo para el cumplimiento de esto se halla presente en la figura 17.13.) Entonces, las técnicas de la parte tres se pueden aplicar para resolver estas ecuaciones simultáneas para los coeficientes. Un problema potencial asociado con la implementación de regresión de polinomios en la computadora es que las ecuaciones normales algunas veces están mal condicionadas. Esto es en particular cierto para versiones de orden superior. Para esos casos, los coeficientes calculados podrían ser altamente susceptibles al error de redondeo y, en consecuencia, los resultados pueden ser inexactos. Entre otras cosas, este problema se relaciona con la estructura de las ecuaciones normal y por el hecho de que para los polinomios de orden superior las ecuaciones normales pueden tener coeficientes muy grandes y muy pequeños. Esto se debe a los coeficientes y sumatorias de los datos elevados a potencias.

FIGURA 17.12 Algoritmo para la implementación de polinomios y regresión lineal múltiple.
P a s o 1 : Introduzca el orden del polinomio sujeto a ajuste, m. P a s o 2 : Integre el número de datos, n. P a s o 3 : Si n < m + 1, imprima un mensaje de error que indique que la regresión no es posible y termine el proceso. Si n S m + 1, continúe. P a s o 4 : Calcule los elementos de la ecuación normal en la forma de una matriz aumentada. P a s o 5 : Resuelva la matriz aumentada para los coeficientes a , d i , a , . . ., a , por medio de un método de eliminación. P a s o d i Imprima los coeficientes.
0 2 m

17.2

REGRESIÓN DE POLINOMIOS DO i = 1, o r d í r + 1 PO j = 1, i

4 1 9

eum — 0 DOi = 1, n eum — eum + ¿£ END DO a¡j = eum ap — eum END DO eum = 0 D0£ = 1,n eum — eum + y • x£~ END DO
(
a

1

END DO

i, arder + 2

=

5

U

M

FIGURA 17.13 Pseudocódigo para ensamblar los elementos de las ecuaciones normal para regresión de polinomios.

Aunque las estrategias para disminuir el error de redondeo analizado en la parte tres, tal como el pivoteo, pueden ayudar a remediar en forma parcial este problema, una alternativa más simple es usar una computadora cotí más aira precisión. Por fortuna, la mayoría de los problemas prácticos están limitados a polinomios de orden inferior para los cuales el error de redondeo es insignificante. En situaciones donde se requieren versiones de orden superior, se dispone de otras alternativas para ciertos tipos de datos. Sin embargo, esas técnicas (tal como polinomios ortogonales) están más allá del alcance de este libro. El lector debería consultar textos sobre regresión, como el de Draper y Smith (1981), para información adicional con respecto al problema y posibles alternativas.
EJEMPLO 17.6 Regresión de polinomios por medio de la computadora

Enunciado del problema. En el software de Métodos Numéricos TOOLKIT adjunto a este libro se tiene un programa de computadora de uso amigable para implementar la regresión de polinomios. Se puede usar este software para el ajuste de polinomios con los siguientes datos:
X

2 6

4 2

5 3

6 7

6 8

7 8

9 1

1 5

0.5 7.5 3 7

y

Solución. Presione el ajuste de datos con el botón Curve sobre el menú principal del TOOLKIT para obtener una pantalla en blanco similar a la de la figura 17.14. Esta panI talla contiene espacios para la entrada y salida de información necesaria para ajustar los I datos con un polinomio de regresión por mínimos cuadrados de nj-ésimo orden, J El primer paso es presionar los valores de entrada X contra Y en la tabla e introducir I hasta 100 pares de valores para X y Y. Después usted podría decidir graficar los datos

484

REGRESIÓN POR MÍNIMOS CUADRADOS

Resolviendo estas ecuaciones con una técnica tal como la eliminación de Gauss se tiene a = 2.47857, a = 2.35929 y a — 1.86071. Por tanto, la ecuación cuadrática por mínimos cuadrados para este caso es
0 x 2

y = 2.47857 + 2.35929x + 1.86071*

2

El error estándar del estimado con base en la regresión de polinomios es [véase ecuación (17.20)] = 1.12 6-3 El coeficiente de determinación es , 2513.39 - 3.74657 r = = 0.99851 2513.39 y el coeficiente de correlación es r = 0.99925. Estos resultados indican que el 99.851% de la incertidumbre original la resolvió el modelo. Este resultado soporta la conclusión de que la ecuación cuadrática representa un excelente ajuste, como es también evidente de la figura 17.11.
2

3.74657

17.2.1

A l g o r i t m o para r e g r e s i ó n de p o l i n o m i o s

Un algoritmo para regresión de polinomios es expuesto en la figura 17.12. Observe que la principal tarea es la generación de los coeficientes de las ecuaciones normal [véase ecuación (17.19)]. (El pseudocódigo para el cumplimiento de esto se halla presente en la figura 17.13.) Entonces, las técnicas de la parte tres se pueden aplicar para resolver estas ecuaciones simultáneas para los coeficientes. Un problema potencial asociado con la implementación de regresión de polinomios en la computadora es que las ecuaciones normales algunas veces están mal condicionadas. Esto es en particular cierto para versiones de orden superior. Para esos casos, los coeficientes calculados podrían ser altamente susceptibles al error de redondeo y, en consecuencia, los resultados pueden ser inexactos. Entre otras cosas, este problema se relaciona con la estructura de las ecuaciones normal y por el hecho de que para los polinomios de orden superior las ecuaciones normales pueden tener coeficientes muy grandes y muy pequeños. Esto se debe a los coeficientes y sumatorias de los datos elevados a potencias.

FIGURA 17.12 Algoritmo para la implementación de polinomios y regresión lineal múltiple.
P a s o 1 : Introduzca el orden del polinomio sujeto a ajuste, m. P a s o 2 : Integre el número de datos, n. P a s o 3 : Si n < m + 1, imprima un mensaje de error que indique que la regresión no es posible y termine el proceso. Si n 5: m + 1, continúe. P a s o 4 : Calcule los elementos de la ecuación normal en la forma de una matriz aumenlada. P a s o 5 : Resuelva la matriz aumentada para los coeficientes o , ai, a , . . ., a,„, por medio do un método de eliminación.
0 7

PASO 6L

Imprjma los coeficientes.

17.2

REGRESIÓN DE POLINOMIOS

483

DO i = 1, order + 1 DOj = 1, i k=i + j - 2 eum = 0 DOt =\n eum = eum + >¿€ END DO a, • = eum ap = eum END DO eum = 0 D0€ = 1,n eum — eum + y • x ¿ ' END DO
(

a

END DO FIGURA 17.13 Pseudocódigo para ensamblar los elementos de las ecuaciones normal para regresión de polinomios.

i. arder + 2= ™
5U

Aunque las estrategias para disminuir el error de redondeo analizado en la parte tres, tal como el pivoteo, pueden ayudar a remediar en forma parcial este problema, una alternativa más simple es usar una computadora cor/ más alta precisión. Por fortuna, la mayoría de los problemas prácticos están limitados a polinprriios de orden inferior para los cuales el error de redondeo es insignificante. En situaciones donde se requieren versiones de orden superior, se dispone de otras alternativas para ciertos tipos de datos. Sin embargo, esas técnicas (tal como polinomios ortogonales) están más allá del alcance de este libro. El lector debería consultar textos sobre regresión, como el de Draper y Smith (1981), para información adicional con respecto al problema y posibles alternativas.
EJEMPLO 17.6 Regresión de polinomios por medio de la computadora

Enunciado del problema. En el software de Métodos Numéricos TOOLKIT adjunto a este libro se tiene un programa de computadora de uso amigable para implementar la regresión de polinomios. Se puede usar este software para el ajuste de polinomios con los siguientes datos: 2 4 5 6 6 7 9 1 0.5 7.5

Solución. Presione el ajuste de datos con el botón Curve sobre el menú principal del TOOLKIT para obtener una pantalla en blanco similar a la de la figura 17.14. Esta pantalla contiene espacios para la entrada y salida de información necesaria para ajustar los datos con un polinomio de regresión por mínimos cuadrados de m-ésimo orden. El primer paso es presionar los valores de entrada X contra Y en la tabla e introducir hasta 100 pares de valores para X y Y. Después usted podría decidir granear los datos

486

RKMMIÓN POR

MÍNIMOS CUADRADOS

solos antas de realizar decisiones con respecto al orden del polinomio. Esto se hace mediante un procedimiento similar al descrito en el ejemplo 2.1. La inspección de los datos muestra dos picos y sugiere que un polinomio de al menos cuarto orden sería el adecuado. Para nuestro ejemplo, primero intentaremos un polinomio de quinto orden. Simplemente introduzca un valor de 5 para el orden del polinomio y grafique los parámetros en el cuadro Entrada de parámetros y haga clic en los botones de red Cale y Plot (en el proceso cambian los botones a un color negro) para producir la figura 17.14. La forma para determinar el mejor orden se puede explorar al examinar cómo el error estándar varía como una función del orden de regresión. Los resultados para varios órdenes de regresión en el ajuste se tabula en la siguiente página:

FIGURA 17.14 Pantalla del TOOLKIT de métodos numéricos para una regresión polinomial de quinto orden.

~ P^iwaete* :| OÍdet of Paíy í Plot Xmtn Delta X Plot Ymin Delta Y

Valué
h

0 1 0 1

'i
3

' 21 , 3 4 5 6 , 7 8 9 V . 10

2 4 5 6 6 7 9 1 .5 7.5

+ liillli 6 2 3 7 8 8 1 5 3

I
X- 3 Y « 2.304472

;.>,;.«8SftÉ!£
* >, fiettift ,.. Standard Erior Coef of Deter Coir Coef Oth oider coef

;

¿J.:.

. . Wm...:,
1 000334 .3332087 .3660273 -6.573234

JBÉBJ

'CS3

Q 5 E 3 *'CHC3- i

i

XMjml

FIGURA 17.15 Gráfica de una regresión polinomial de octavo orden.

Ordet of Poly Plot Xmro Delta X Plot Ymin Delta Y

Vafc» 8 0 1 0 1

1 i

lwputXv*¥Vafoe* 1 2 4 5 6 6 7 9 1 .5 75

x

í 3 1 4
í

i

2

Ü

1 6
8 9 10
7

5

6 2 3 7 8 . 8 1 5 3 7

v

CafcYÍOT InputX ftewft Standatd Enot Coef of Detei Con Coef Oth order coef Vafe» ' 1 154277 .9777941 .9888347 -1 057965

17.3

REGRESIÓN LINEAL MÚLTIPLE
Orden Error estándar 2.71 2 2.69 3 2.34

487
1.38

A

6
1.00

/
1.17

1.12

Observe que el error estándar cae de manera dramática del orden 3 al 4 y alcanza un mínimo para el polinomio de orden 5. Esto sugiere que no se ha ganado mucho al gastar en esfuerzo de cómputo para ejecutar la regresión más alta que la de quinto orden. La figura 17.15 muestra las gráficas para el caso de un octavo orden. Para este caso, los puntos extremo empiezan a ser un problema en una manera similar a la de la interpolación de orden superior (analizaremos este fenómeno con más detalle en el próximo capítulo). La figura 17.15 muestra que el polinomio de octavo orden produce valores de Y negativos para valores de X entre 8 y 9. Observe también en las figuras 17.14 y 17.15 que mientras las curvas de regresión siguen la tendencia de los datos, es altamente inapropiado extrapolar los valores Y más allá del rango de los datos para X. La interpolación se puede ejecutar al introducir un valor en la tabla para X en el Cale Y para una X introducida. Por ejemplo, en X = 3, Y = 2.304472 como calculada con el polinomio de quinto orden (véase la figura 17.14). Por último, demos un vistazo a la tabla de resultados en la parte derecha inferior. Los primeros tres resultados son resúmenes estadísticos de la regresión: error estándar, coeficiente de determinación y coeficiente de correlación. Observe cómo esos valores cambian para diferentes órdenes de regresión. La barra de despliegue sobre la tabla de resultados se usa para observar los coeficientes reales de la regresión de polinomios. De nuevo, esos valores cambian con diferentes órdenes.

REGRESIÓN LINEAL MÚLTIPLE Una extensión útil de la regresión lineal es el caso donde y es una función lineal de dos o más variables independientes. Por ejemplo, y podría ser una función lineal de x y x , como en
l 2

y = c?o + «i 'i + 2X2 + e
A a

Tal ecuación es en particular útil cuando se ajustan datos experimentales donde la variable sujeta a estudio es a menudo una función de otras dos variables. Para este caso en dos dimensiones, ta "línea" de regresión pasa a ser un "plano" (véase la figura 17.16). Como en los casos anteriores, los "mejores" valores de los coeficientes son determinados al realizar la suma de los cuadrados de los residuos, (17.21) y diferenciando con respecto a cada uno de los coeficientes desconocidos,

488

REGRESIÓN POR MÍNIMOS CUADRADOS

FIGURA 17.16 Ilustración gráfica de regresión lineal múltiple donde yes una función lineal de x, y x .
2

dS

r

= -2 ^ x

2

/

(y, - í/ - i a ~
a x

0

«2*2/)

3 (3?

Los coeficientes dan la suma mínima de los cuadrados de los residuos y se obtienen al igual las derivadas parciales a cero y expresando el resultado en forma de matriz como
n

Ex
Ex ,.
2

2/

Ex,/ Ex
2 í

T,xi¡x ¡
2

a ai
0

=

Exi,-x

2l

Ex

2

a

2

Ey,Exi,y,Sx y,'

(17.22)

¡EJEMPLO 1 7 . 7

Regresión lineal múltiple

Enunciado del problema. 4x, — 3x :
2

Los siguientes datos se calcularon con la ecuación y = 5 +

x

l

X

0 2 2.5 1 4 7

0 1 2 3 6 2

2

y 5 10 9 0 3 27

Use regresión lineal múltiple para ajustar estos datos.

17.3

REGRESIÓN LINEAL MÚLTIPLE

Solución. Las sumatorias requeridas para desarrollar la ecuación (17.22) se calculan en la tabla 17.5. El resultado es 6 16.5 14 16.5 76.25 48 14 48 54
a
0

a\ a
2

• =

54 243.5 100

la cual se puede resolver mediante un método como el de eliminación de Gauss para ao = 5 ai = 4
a
2

= —3

que es consistente con la ecuación original a partir de la cual los datos se derivaron.
TABLA 17.5 Cálculos requeridos para desarrollar las ecuaciones normal para el ejemplo 17.7.
*i

y

X

5 10 9 0 3 27

0 2 2.5 1 4 7
16.5

0 1 2 3 6 2
14

2

X

2

A
0 i 4 9 36 4
54

x,x

2

*iy

x y
2

0 4 6.25 1 16 49
76.25

0 2 5 3 24 14
48

0 20 22.5 0 12 189
243.5

0 10 18 0 18 54
100

1

54

El caso anterior en dos dimensiones se puede fácilmente extender a m dimensiones, como en y = an + a\X\ + a x
2 2

-|

Ya x
m

m

+ e

donde el error estándar se formula como

S y , X

~\¡n-(m

+ l)

y el coeficiente de determinación se calcula como en la ecuación (17.10). En la figura 17.17 se enlista un algoritmo para preparar las ecuaciones normal. Aunque hay ciertos casos donde una variable está linealmente relacionada con otras dos o más variables, la regresión múltiple tiene utilidad adicional en la derivación de ecuaciones de potencias de la forma general y=a x x ---x "
1 2 0 1 2 m

Tales ecuaciones son extremadamente útiles cuando se ajustan datos experimentales. Para usar regresión lineal múltiple, la ecuación se transforma al tomar su logaritmo para obtener
log y = log üo + a\ log x\ + a log xj-i
2

Ya

m

log x

m

REGRESIÓN POR MÍNIMOS CUADRADOS

DOI = 1, order + 1 DOj = 1, i eum — 0 DOÍ= 1,n eum = eum + x¡-^( • END DO a = eum a- — eum END DO eum — 0 DOl = \,n eum = eum + y • x¡_ END DO
u s
e 1(
A

XJ-K

END DO

¡,CRDER+2

=

5

U

M

FIGURA 17.17 Pseudocódigo para ensamblar los elementos de las ecuaciones normal para regresión múltiple. Observe que además de guardar las variables independientes en X ] , x ¡, etcétera, los 1 se deben guardar en XQ • , para trabajar este algoritmo.
2

Esta transformación, es similar en esencia a la que se usó en la sección 17.1.5 y en el ejemplo 17.4 para ajustar a una ecuación por potencias cuandoy fue una función de una sola variable x. La sección 20.4 proporciona un ejemplo de tal aplicación para dos variables independientes. 17.4 FORMA GENERAL LINEAL POR M Í N I M O S CUADRADOS Hasta este punto nos hemos concentrado en la mecánica de obtención de ajustes por mínimos cuadrados para algunas funciones simples con datos. Antes de cambiar a regresión no lineal, hay varios puntos que nos gustaría analizar para enriquecer nuestra comprensión del material precedente. 17.4.1 Formulación general de u n a m a t r i z p a r a m í n i m o s cuadrados lineales

En páginas anteriores hemos introducido tres tipos de regresión: lineal simple, polinomial y lineal múltiple. De hecho, estas tres pertenecen al siguiente modelo general de mínimos cuadrados lineales:
y

arjzo

+

a

\

z

\

+

a

2 2 ^
z

1 "

a

mm
z

+ e

(17.23)

donde z , z , , . . . , z son las m + 1 funciones diferentes. Se puede ver con facilidad cómo la regresión lineal simple y múltiple encajan dentro de este modelo; es decir z — 1, z, jC|, z = x , • •., z„, = x . Además, la regresión de polinomios se incluye también si Iris ;
0 m () 2 2 m

son monomios simples como en z = x
0

ü

— I, z, = x, Z = x ,...,
2 2

Z

M

— x" .
1

Observe que la terminología "lineal" se refiere sólo a la dependencia del modelo sobre sus parámetros (es decir, las a). Como en el caso de regresión de polinomios, las mismas funciones pueden ser altamente no lineales. Por ejemplo, las z pueden ser sinusoidales, como en y =

a

0 + a, eos

(coi) + a (coi)
2 sen

Tal formato es la base del análisis de Fourier descrito en el capítulo 19. Por otro lado, un modelo de apariencia simple como f(x) = a (1 0

e-"'*)

es ciertamente no lineal porque no puede ser manejado en el formato de la ecuación (17.23). Regresaremos a tales modelos al final de este capítulo. Mientras tanto, la ecuación (17.23) se puede expresar en notación matricial como {Y} = [Z]{A] + {E} (17.24)

donde [2] es una matriz de los valores calculados de las funciones z en los valores medidos de las variables independientes,
z

m 1 m2

Z02

Zl2

z

[Z] =
Zrj« l«

z

donde m es número de variables en el modelo y n es el número de datos. Como n>m + 1, usted debería reconocer que la mayoría de las veces [Z] no es una matriz cuadrada. El vector columna {Y} contiene los valores observados de la variable dependiente {Y}
T

= [yi

yi

••• y „ J
••• a \
m

El vector columna {A} contiene los coeficientes desconocidos
{A}
T

— [a

0

y el vector columna {E} contiene los residuos [E}
T

= \_e\

e

2

•••

e„ \

Como se realizó a través de este capítulo, la suma de los cuadrados de los residuos para este modelo se pueden definir como

Sr = Y,\x-Y, ¡ A i = \ \ j=0 I
n / m \
2

a

z

Esta cantidad se puede minimizar al tomar su derivada parcial con respecto a cada uno de los coeficientes y fijar los resultados de la ecuación igual a cero. La salida de este proceso son las ecuaciones normal que se pueden expresar brevemente en forma de matriz como

492

REGRESIÓN POR MÍNIMOS CUADRADOS

[lZ] [Z]]{A} = {[Z] {Y}}
r T
Se puede demostrar que la ecuación (17.25) es, de hecho, equivalente a las ecuaciones normal desarrolladas antes para regresión lineal simple, polinomial y múltiple. Nuestra principal motivación para las anteriores ha sido ilustrar la unión entre los tres procedimientos y mostrar cómo se pueden expresar de manera simple en la misma notación matricial. También acondiciona la etapa para la siguiente sección donde asimilaremos algo de conocimiento en las estrategias preferidas para resolver la ecuación (17.25). La notación matricial tendrá también relevancia cuando veamos regresión no lineal en la última sección de este capítulo. 17.4.2 Técnicas de solución

(

En los análisis anteriores en este capítulo hemos encubierto el tema de las técnicas numéricas específicas para resolver las ecuaciones normales. Ahora que hemos establecido la unión entre los diversos modelos, podemos explorar esta cuestión con mayor detalle. Primero, debería quedar claro que Gauss-Seidel no puede usarse aquí debido a que las ecuaciones normal no son diagonalmente dominantes. De esta manera dejamos a un lado los métodos de eliminación. Para los actuales propósitos, podemos dividir esas técnicas en tres categorías: 1) métodos de descomposición LU, incluyendo eliminación de Gauss, 2) método de Cholesky y 3) procedimiento de inversión de matrices. Obviamente hay traslapes en esta clasificación. Por ejemplo, el método de Cholesky es, de hecho, una descomposición L U, y todos los procedimientos se pueden formular de tal forma que pueden generar la matriz inversa. Sin embargo, esta clasificación tiene su mérito en cada categoría y ofrece beneficios con respecto a la solución de las ecuaciones normales. Descomposición LU. Si usted está interesado sólo en aplicar un ajuste por mínimos cuadrados para el caso donde se conoce de antemano el modelo adecuado, cualquiera de los procedimientos de descomposición LU descritos en el capítulo 9 son perfectamente aceptables. De hecho, se puede también emplear la formulación de una descomposición no L t / d e eliminación de Gauss. Ésta es una tarea de programación relativamente directa para incorporar cualquiera de estos procedimientos en un algoritmo de mínimos cuadrados lineales. De hecho, si se ha seguido un enfoque modular, esto es casi trivial. Método d e Cholesky. El algoritmo de descomposición de Cholesky tiene varias ventajas con respecto a la solución del problema general de regresión lineal. Primero, está expresamente diseñado para resolver matrices simétricas como las ecuaciones normal. De este modo, es rápido y requiere menos espacio de almacenamiento para resolver tales sistemas. Segundo, es idealmente adecuado para casos donde el orden del modelo [es decir, el valor de m en la ecuación (17.23)] no es conocido de antemano (véase Ralston y Rabinowitz, 1978). Un caso sujeto a tratamiento sería la regresión de polinomios. Para este caso, podríamos saber a priori si un polinomio lineal cuadrático, cúbico o de orden superior es el "mejor" modelo para describir nuestros datos. Debido tanto a la forma en la cual las ecuaciones normales se construyen como a la manera en la que procede el algoritmo de Cholesky (véase figura 11.3), podemos desarrollar en forma sucesiva modelos de orden superior de un modo en extremo eficiente. En cada paso podríamos examinar la suma residual del error de los cuadrados (¡y una gráfica!) para examinar si la inclusión de términos de orden superior mejoran de manera significativa el ajuste.

493
La situación análoga para regresión lineal múltiple ocurre cuando se agregan variubles independientes, una a la vez, al modelo. Suponga que la variable dependiente de interés es una función de un número de variables independientes: por ejemplo, temperatura, contenido de humedad, presión, etcétera. Podríamos primero realizar una regresión lineal con la temperatura y calcular un error residual. En seguida se podría incluir el contenido de humedad para realizar una regresión múltiple de dos variables y ver si la variable adicional resulta en una mejora al ajuste. El método de Cholesky hace eficiente el proceso, ya que la descomposición del modelo lineal podría solamente ser añadido al incorporar una nueva variable. Procedimiento d e la matriz inversa. De la ecuación (PT3.6), recuerde que la matriz inversa se puede emplear para resolver la ecuación (17.25), como en
i fA F O R M A GENERAL LINEAL POR MÍNIMOS CUADRADOS

{A} = [[Z] [Z]Y {[Z] {Y}}
T L

T

(17.2

Cada uno de los métodos de eliminación se puede usar para determinar la inversa y, así, pueden ser usados para implementar la ecuación (17.26). Sin embargo, como aprendimos en la parte tres, éste es un enfoque ineficiente para resolver un conjunto de ecuaciones simultáneas. Así, si estuviéramos justamente interesados en resolver los coefientes de regresión, es preferible utilizar la aproximación de descomposición LU sin inversión. No obstante desde una perspectiva estadística, hay un número de razones por las cuales podríamos estar interesados en obtener la inversa y examinar sus coeficientes. Esas razones se analizarán después.

1 7.4.3

Aspectos estadísticos de la teoría de m í n i m o s cuadrados

En la sección PT5.2.1, revisamos un número de estadística descriptiva que puede usarse para describir una muestra. Aquéllas incluyen la media aritmética, la desviación estándar y la varianza. Además de obtener una solución para los coeficientes de regresión, la formulación de la matriz de la ecuación (17.26) proporciona estimaciones de su estadística. Se puede demostrar (Draper y Smith, 1981) que la diagonal y los términos fuera de la diagonal de la matriz [[Z] [ Z ] ] dan, respectivamente, las varianzas y las covarianzas de las a. Si los elementos de la diagonal de [[Z] [Z]]~ son designados como z j , entonces
T _ 1 1 r 1 l

var (a - )
i i

=

zj¡ 5
l
ij /x

2 y/x

(17-27)

y cov (a -i,a )=zr} s*
i j ( 1 7 2 g )

Estas estadísticas poseen un número de aplicaciones importantes. Para nuestros actuales propósitos, ilustraremos cómo se pueden usar para desarrollar intervalos de confianza para el intercepto y la pendiente.

'Lacovarianza es una estadística que mide la dependencia de una variable con otra. A s i , cov (x,y) la dependencia Por ejemplo, cov

ácxy y.

(x,y)

0 podría

indicar queje y

y

indica

son totalmente indcpcnd

494

REGRESIÓN POR MÍNIMOS CUADRADOS

Mediante un enfoque similar al visto en la sección l'T'5.2.3, se puede demostrar que los límites inferior y superior del intercepto se pueden formular como (véase Milton y Arnold 1995 para más detalles)
<•><) — t /2.,¡-2
a

í(«o)

U

=

fln

+

í /2.H-2-V(«
a

( )

)

(17.29)

donde s(a¡) — error estándar del coeficiente a- = K vai(ap. De manera similar, los límites inferior y superior de la pendiente se pueden formular como
L — a\ - t /2.„-is(a\)
a

U =

a\+t i2. - s(ci\)
a n 2

(17.30)

El siguiente ejemplo ilustra cómo esos intervalos se pueden usar para hacer inferencias cuantitativas relacionadas con la regresión lineal.
EJEMPLO 1 7 . 8 Intervalos de confianza para regresión lineal

\ Enunciado del problema. En el ejemplo 17.3 usamos regresión para desarrollar la i siguiente relación entre mediciones y predicciones del modelo:

j

y = - 0 . 8 5 9 + 1.032x

i S i i j i

donde y = predicciones del modelo y x = mediciones. Concluimos que había una buena concordancia entre los dos debido a que el intercepto fue aproximadamente igual a 0 y la pendiente, a 1. Recalcule la regresión pero ahora use la aproximación matricial para estimar los errores estándar de los parámetros. Después emplee esos errores para desarrollar los intervalos de confianza y úselos para hacer declaraciones probabilísticas con respecto a la bondad del ajuste. Solución. Los datos se pueden escribir en un formato matricial para regresión lineal simple como: 8.953 "1 10 "
1 1 [Z] = 16.3 23 \Y) = 16.405 22.607

¡
] j

1

50

49.988

Se puede entonces usar la transposición y multiplicación de la matriz para generar las ecuaciones normal como
[ÍZ] [Z]]
T

{A}

=

{ÍZ] {Y}}
T

15 548.3

548.3 22191.21 _

f 552.741 [ 22421.43

La inversión de la matriz puede ser usada para obtener la pendiente e intercepto como
[A}= 0.688414 -0.01701 [íZflZ]] -0.01701 0.000465 {[Z] {Y)
r

552.741 22421.43

-0.85872 1.031592

I
i i

17.4 FORMA GENERAL LINEAL /vuNimt» De esta manera, el intercepto y la pendiente se determinan como a = — 0.85872 y < 7 | » respectivamente. Estos valores a su vez se pueden usar para calculnr el error estándar del estimado como s Este valor puede utilizarse junto con los elementos diagonal de la matriz inversa para calcular los errores estándar de los coeficientes,

1 0 .3 1 5 9 2 ,

r u K

wmmwww»
Q

/x

=0 8 .6 3 4 0 3 .

I i,

La estadística, í^n-i necesaria para un 9 5 % de intervalo de confianza con n — 2 = 1 5 —2 = 1 3 grados de libertad puede ser determinada de una tabla estadística o mediante software. Usamos una función de Excel, TINV, para obtener el valor adecuado, como en

=T I N V ( 0 0 .5 ,1 3 ) i la cual da un valor de 2 1 .6 0 3 6 8 . Las ecuaciones ( 1 7 2 .9 )y( 1 7 3 .0 ) se pueden entonces
usar para calcular los intervalos de confianza como

a =0 . 8 5 8 7 2±2 1 .6 0 3 6 8 ( 0 7 .1 6 3 7 2 ) =0 . 8 5 8 7 2± 1 5 .4 7 6 2 7=[ 2 . 4 0 6 3 4 ,0 6 .8 8 9 1 2 ] a, = 1 0 .3 1 5 9 2± 2 1 .6 0 3 6 8 ( 0 0 .1 8 6 2 5 ) =1 0 .3 1 5 9 2±0 0 .4 0 2 3 7=[ 0 9 .9 1 3 5 5 ,1 0 .7 1 8 2 8 ]
0

Observe que los valores deseados ( 0 para el intercepto y pendiente, y 1 para el intercepto) están dentro de los intervalos. Sobre la base de este análisis podríamos hacer las siguientes declaraciones con respecto a la pendiente: tenemos fuertes fundamentos para pensar que la pendiente de la línea de regresión real está dentro del intervalo de a Debido a que está dentro de este intervalo, tenemos también bases fuertes para creer que el resultado soporta la concordancia entre las mediciones y el modelo. Como cero está dentro del intervalo del intercepto, una declaración similar se puede hacer con respecto del intercepto.

0 9 .9 1 3 5 5 1 0 .7 1 8 2 8 .

1

Lo anterior es una introducción limitada al enriquecedor tema de la inferencia estadística y su relación con la regresión. Hay muchas más que están lejos del alcance de este libro. Nuestra principal intención ha sido mostrar el poder del enfoque matricial al ajuste general lineal por mínimos cuadrados. Usted debería consultar algunos de los excelentes libros sobre el tema (por ejemplo, Draper y Smith 1 9 8 1 ) para información adicional. Además, debería observar qué paquetes de software y librerías pueden generar ajustes de regresión por mínimos cuadrados junto con información relevante para la estadística inferencial. Exploraremos algunas de esas capacidades cuando se describan esos paquetes al final del capítulo 1 9 .

496
17.5

REGRESIÓN POR MÍNIMOS CUADRADOS

REGRESIÓN N O LINEAL Hay muchos casos en ingeniería donde modelos no lineales deben ser ajustados con datos. En el contexto actual, esos modelos se definen como aquellos que tienen dependencia no lineal de sus parámetros. Por ejemplo, (17.31) Esta ecuación no puede ser manejada de acuerdo con el formato general de la ecuación (17.23). Como se hizo con los mínimos cuadrados lineales, la regresión no lineal se basa en la determinación de los valores de los parámetros que minimizan la suma de los cuadrados de los residuos. Sin embargo, para el caso no lineal, la solución debe proceder en una forma iterativa. El método de Gauss-Newton es un algoritmo para minimizar la suma de los cuadrados de los residuos entre datos y ecuaciones no lineales. El concepto clave que resalta la técnica es que una expansión por serie de Taylor se usa para expresar la ecuación no lineal original en una forma lineal aproximada. Entonces, la teoría de mínimos cuadrados se puede usar para obtener nuevas estimaciones de los parámetros que se mueven en la dirección de minimizar el residuo. Para ilustrar cómo se hace esto, primero se puede expresar de manera general la relación entre la ecuación no lineal y los datos como
y¡ f {x¡; ao, a
u

..., a)
m

+ e¡

donde y¡ = valor medido de la variable dependiente,/"^,; a , a ,..., a ) = ecuación que es una función de la variable independiente x¡ y una función no lineal de los parámetros a , a ,..., a , y e, = error aleatorio. Por conveniencia, este modelo se puede expresar de forma abreviada al omitir los parámetros,
0 x m 0 t m

(17.32) El modelo no lineal puede ser expandido dentro de una serie de Taylor alrededor de valores de parámetro y reducido después de las primeras derivadas. Por ejemplo, para un caso de dos parámetros
/(*;),-+, f(x¡)j + df(x¡\ da
0

donde j = son los valores iniciales, j + 1 = predicción, Aa = « j+i ~~ oj> y = ij+i ~ ij- ^ esta forma, hemos linearizado el modelo original con respecto a los parámetros. La ecuación (17.33) se puede sustituir en la (17.32) para obtener
a 0 0 a a e

j

Aa

0

+

a/ta).

(17.33)

o en forma matricial [compárela con la ecuación (17.24)],
\i>\ = [ / , J | A / \ ¡ , ( / : ¡

(17.34)

donde [Z¡\ es la matriz de las derivadas parciales de la función evaluada en el valor inicial y,

dfi/dao dfi/dcn df /dai
3/ /3ao
2

2

[Z,] =

0 = derivada parcial de la función con respecto al kdonde n = número de datos y df¡/da ésimo parámetro evaluado en el /-ésimo punto. El vector {£>} contiene las diferencias entre las mediciones y los valores de la función,
k

df„/da
f(x\) f(x )
2

dfn/dax

y\ >'2 -

¡D} = y„ f(x„)

y el vector {AA} contiene los cambios en los valores de los parámetros,

Si se aplica la teoría de mínimos cuadrados lineales a la ecuación (17.34) resulta en las siguientes ecuaciones normal [recuerde la ecuación (17.25)]:

Aa\ {AA} = Aa„
Arto

J J en resolver la ecuación (17.35) para / Así, el procedimiento consiste {A/4}, la cual se puede emplear para calcular valores mejorados para los parámetros, como en

[[Z ] [Z }]{AA} = {[Z ] {D}}
T T 0 Q

(17.35)

y

a j+i = OQJ + Aa \S„h =
a

Este procedimiento se repite hasta que la solución converge (es decir, hasta) 100% (17.36)

k,j+\

está por debajo de un criterio de paro aceptable.

498
EJEMPLO 1 7 . 9

REGRESIÓN POR MÍNIMOS CUADRADOS Método de Gauss-Newton

I

Enunciado del problema.
X

Ajuste la función f(x;a , «,) = a ( 1
0 0

) con los dalos:

y

0,25 0.28

0.75 0.57

1.25 0.68

1.75 0.74

2.25 0.79

Use los valores iniciales de a = 1.0 y a = 1.0 para los parámetros. Observe que para estos valores la suma inicial de los cuadrados de los residuos es 0.0248.
0 x

Solución.

Las derivadas parciales de la función con respecto a los parámetros son

da o

=1
= a je
Q

(E17.9.1)

(E17.9.2)

Las ecuaciones (E17.9.1) y (E17.9.2) se pueden usar para evaluar la matriz

0 2 .2 1 2 0 5 .2 7 6 0 7 . 1 3 5 [Z] = 0 8 .2 6 2 0 8 .9 4 6
0 r

0 1 .9 4 7 0 3 .5 4 3 0 3 .5 8 1 0 3 .0 4 1 0 2 .3 7 1

Esta matriz multiplicada por su traspuesta resulta en

2 '. 3 1 9 3 0 9 .4 8 9 " [ Z ] [ Z ] 0 9 .4 8 9 0 4 .4 0 4
0 0 r 0

la cual mi de de nuevo nueve se puede invertir para dar

3 6 .3 9 7 7 . 8 4 2 1 [ [ Z ] [ Z o ] p=7 . 8 4 2 1 1 9 1 .6 7 8 0 2 .8 02 2 1 2' 0 5 .7 -05 2 7 6 0 6 .8 07 1 3 5 0 7 .4 -08 2 6 2 0 7 .9 08 9 4 6
.
T

El vector {D} consiste en las diferencias entre las mediciones y las predicciones del modelo,

{D} =

,

0 0 .5 8 8 0 0 .4 2 4 0 . 0 3 3 5 0 . 0 8 6 2 0 . 1 0 4 6

Ésta es multiplicada por [Z ] para obtener
¡Z ] {D}
() T

0 . 1 5 3 3 0 . 0 3 6 5


0

17.5

REGRESIÓN NO LINEAL

El vector {AA} es entonces calculado al resolver la ecuación (17.35) para
AA = -0.2714 0.5019

m

la cual puede ser agregada al parámetro inicial supuesto para dar

I I

«o

1.0 1.0

+I

-0.2714 0.5019

i

0.7286 1.5019

1
0 x x

Así, las estimaciones mejoradas de los parámetros son a = 0.7286 y a = 1.5019. Los nuevos parámetros resultan en una suma de los cuadrados de los residuos igual a 0.0242. La ecuación (17.36) se puede usar para calcular £Q y e igual a 37 y 3 3 % , respectivamente. El cálculo podría repetirse hasta que esos valores estén abajo del criterio de paro preescrito. El resultado final es a = 0.79186 y a, = 1.6751. Estos coeficientes dan una suma de los cuadrados de los residuos de 0.000662.
0

Un problema potencial con el método de Gauss-Newton como se ha desarrollado hasta ahora es que las derivadas parciales de la función pueden ser difíciles de evaluar. En consecuencia, muchos programas de computadora usan diferentes ecuaciones para aproximar las derivadas parciales. Un método es
dfi da
k

^ f(x¡;

a ,...,a +
0 k

Sa , . . . , a ) - f{x¡\a ,
k m 0

...,

a ,...,
k

a)
m

5a

k

donde 8 = perturbación fraccional pequeña. El método de Gauss-Newton tiene una variedad de otros posibles defectos: 1. 2. 3. Puede converger con lentitud. Puede oscilar ampliamente; es decir, cambia en forma continua de dirección. Puede no converger.

Se han desarrollado modificaciones del método (Booth y Peterson, 1958; Hartley, 1961) para remediar los defectos. Además, aunque hay varios procedimientos expresamente diseñados para regresión, uno más general es usar rutinas de optimización no lineal como las descritas en la parte cuatro. Para hacer esto, se hace una suposición de los parámetros, y se calcula la suma de los cuadrados de los residuos. Por ejemplo, para la ecuación (17.31) esto se podría calcular como (17.38) Entonces, los parámetros se podrían ajustar de manera sistemática para minimizar S mediante técnicas de búsqueda descritas previamente en el capítulo 14. Ilustraremos el modo para hacer esto cuando describamos las aplicaciones del software al final del capítulo 19.
r

REGRESIÓN POR MÍNIMOS CUADRADOS

PROBLEMAS 17.1 Dados los datos 0.90 1.32 1.96 1.85 2.29 1.42 1.35 1.47 1.74 1.82 1.30 1.47 1.92 1.65 2.06 1.55 1.95 1.35 1.78 2.14 1.63 1.66 1.05 1.71 1.27 miento visual y en el error estándar, que la medición fue válida o fallida? Justifique su conclusión. 17.6 Use regresión por mínimos cuadrados para ajustar una línea recta a
x y I 2 9 3 6 4 5 7 K) 8 9 9 ñ 5 2 5 3

determine a) la media, b) la desviación estándar, c) la varianza, d) el coeficiente de variación y e) el intervalo de confianza al 95% para la media. 17.2 Construya un histograma para los datos del problema 17.1. Use un rango de 0.6 a 2.4 con intervalos de 0.2. 17.3 Con los datos 15 39 2 45 6 22 12 36 18 28 17 41 21 24 34 37 26 27 29 43 28 27 31 38 32 33 38 26

a) Junto con la pendiente y el intercepto, calcule el error estándar de la estimación y el coeficiente de correlación. Grafique los datos y la línea recta. Valide el ajuste. b) Recalcule a), pero ahora use regresión polinomial para ajustar los datos a una parábola. Compare los resultados con aquellos de a). 17.7 Ajuste un modelo de razón de crecimiento saturado con
X

0.75 0.8

2 1.3

2.5 1.2

4 1.6

6 1.7

8
l . í3

8.5 1.7

y

determine a) la media, b) la desviación estándar, c) la varianza, d) el coeficiente de variación y é) el intervalo de confianza al 90% para la media./) Construya un histograma. Use un rango de 0 a 55 con incrementos de 5. g) Suponga que la distribución es normal y que su estimación de la desviación estándar es válida, calcule el rango (esto es, los valores inferior y superior) que abarquen el 68% de las lecturas. Determine si esto es una estimación válida para los datos en este problema. 17.4 Use la regresión por mínimos cuadrados para ajustar a una línea recta a
X l

Grafique los datos y la ecuación. Encuentre el error estándar. 17.8 Ajuste los datos del problema 17.7 a una ecuación de potencias. Grafique los datos y la ecuación y encuentre el error estándar. 17.9 Adecúe los datos del problema 17.7 a una parábola. Grafique los datos y la ecuación y encuentre el error estándar. 17.10 Ajuste los siguientes datos a una ecuación de potencias
X
/

2.5 7

3.5 5.5

5 3.9

6 3.6

7.5 3.1

10 2.8

12.5 2.6

15 2.4

17.5 2.3

20 2.3

3 5 6

7 5

10 8

12 7

13 6

16 9

18 12

20 11

Grafique y contra x junto con la ecuación de potencias. 17.11 Adecué los siguientes datos a un modelo exponencial
X

y

4

0.4 750

0.8 1 000

1.2 1 400

1.6 2 000

2.0 2 700

2.3 3 750

Junto con la pendiente y el intercepto, calcule el error estándar del estimado y el coeficiente de correlación. Grafique los datos y la línea de regresión. Después repita el problema, pero ahora haga la regresión de x contra y (es decir, cambie las variables). Interprete sus resultados. 17.5 Use regresión por mínimos cuadrados para ajustar una línea recta a
X

y

Grafique los datos y la ecuación en papel estándar así como en gráfico logarítmico. Analice sus resultados. 17.12 Ajuste los datos del problema 17.11 a una parábola. Grafique los datos y la ecuación. 17.13 Con los datos
X

5 30

6 22

10 28

14 14

16 22

20 16

22 8

28 8

28 14

36 0

38 4

5 16

10 25

15 32

20 33

25 38

30 36

35 39

40 40

45 42

50 42

y

Junto con la pendiente y el intercepto, calcule el error estándar del estimado y el coeficiente de correlación. Grafique los datos y la línea de regresión. Si alguien hizo una medición adicional de x = 5, y = 5, ¿podría usted esperar, con base en un asegura-

use regresión por mínimos cuadrados para ajustar a) a una línea recta, b) a una ecuación de potencias, c) a una ecuación de razón de crecimiento saturado y d) a una parábola. Grafique los datos junto con todas las curvas. ¿Es superior alguna de las curvas? Si es así, justifique.

PROBLEMAS

501

17.14 Use regresión lineal múltiple para ajustar
x, 0
0
y

17.16 Use regresión no lineal para ajustar los siguientes datos a una parábola
3 4 4 y 0.075 600 0.5 800 1 200 1.2 1 400 1.7 2 050 2.0 2 650 2.3

1

1

2

2

3

15

18

12.8 25.7 20.6 35.0 29.8 45.5

40.3

3 750

Calcule los coeficientes, el error estándar del estimado y el coeficiente de correlación. 17.15 Use regresión lineal múltiple para ajustar
0 x
2

0 2 19

1 2 12

2 4 11

0 4 24

1 6 22

2 ó 15

2 2 5

1 1 19

0 15

y

Calcule los coeficientes, el error estándar del estimado y el coeficiente de correlación.

17.17 Use regresión no lineal para ajustar los datos del problema 17.13 a una ecuación de razón de crecimiento saturado. 17.18 Recalcule el ajuste por regresión de los problemas a) 17.4 y b) 17.13 mediante el procedimiento de la matriz. Estime los errores estándar y desarrolle intervalos de confianza al 90% para la pendiente y el intercepto. 17.19 Desarrolle, depure y pruebe un subprograma en ya sea un lenguaje de alto nivel o en lenguaje macro de su elección para implementar regresión lineal. Entre otras cosas: a) Agregue comentarios para documentar el código y b) determine el error estándar y el coeficiente de determinación. 17.20 Use el software de Métodos Numéricos TOOLKIT para resolver los problemas a) 17.4, b) 17.5,c) 17.6, d) 17.9 ye) 17.12.

CAPÍTULO 18 Interpolación

Usted a menudo habrá tenido la oportunidad de estimar valores intermedios entre datos precisos. El método más común que se usa para este propósito es la interpolación del polinomio. Recuerde que la fórmula general para un polinomio de n-ésimo orden es
f(x) = a + aix + a x
0 2 2

+ •••+

a x"
n

(18.1)

Para n + 1 puntos, hay uno y sólo ún polinomio de orden n que pasa a través de todos los puntos. Por ejemplo, hay sólo una línea recta (es decir, un polinomio de primer orden) que conecta dos puntos (vea la figura 18.1a). De manera similar, únicamente una parábola conecta un conjunto de tres puntos (ver figura 18.1Z>). Interpolación polinomial consiste en determinar el único polinomio de n-ésimo orden que ajuste n + 1 puntos. Este polinomio entonces proporciona una fórmula para calcular valores intermedios. Aunque hay uno y sólo un polinomio de n-ésimo orden que ajusta n + 1 puntos, existe una variedad de formatos matemáticos en los cuales este polinomio puede expresarse. En este capítulo describiremos dos alternativas que son muy adecuadas para la implementación en computadora: los polinomios de Newton y de Lagrange.

FIGURA 18.1 Ejemplos de interpolación polinomial: a] de primer orden [lineal) conectando dos puntos, b) de segundo orden (cuadrática o parabólica) enlazando tres puntos y c) de tercer orden (cúbica) conectando cuatro puntos.

a)

b)

c)

18.1

DIFERENCIA DIVIDIDA DE N E W T O N PARA LA INTERPOLACIÓN

503

18.1

DIFERENCIA DIVIDIDA DE N E W T O N P A R A LA I N T E R P O L A C I Ó N DE P O L I N O M I O S Como se mencionó antes,'existe una variedad de formas alternativas para expresar una interpolación de un polinomio. La diferencia dividida de Newton para la interpolación de polinomios está entre los modelos más populares y útiles. Antes de presentar la ecuación general, introduciremos la primera y segunda versión debido a su interpretación visual simple. 18.1.1 Interpolación lineal

El modo más simple de interpolación es conectar dos puntos con una línea recta. Esta técnica, llamada interpolación lineal, se ilustra en forma gráfica en la figura 18.2. Mediante triángulos semejantes,
/l(-r) ~ /(So)
X — XQ
=

/(*!)-/(*»)
X\ —

la cual se puede reordenar para dar

Xo

s

/,(*) = /(%> +

/ ( j C l )

~

/ ( X o )

(* - %>

(18-2)

que es una fórmula de interpolación lineal. La notación f(x) designa que es una interpolación de polinomios de primer orden. Observe que además de representar la FIGURA 18.2
Ilustración gráfica de interpolación lineal. Las áreas sombreadas indican los triángulos semejantes usados para obtener la fórmula de interpolación lineal [véase la ecuación! 1 8.2)]

AQ

X

X-\

X

rrvrcKruLACTurN pendiente de la línea que conecta los puntos, el término \f(x ) — f(x )]/(x — x ) es una aproximación por diferencia dividida finita de la primera derivada [recuerde la ecuación (4.17)]. En general, cuanto más pequeño sea el intervalo de datos, mejor será la aproximación. Esto se debe al hecho de que, en tanto el intervalo disminuya, una función continua se aproximará mejor por una línea recta. Esta característica se demuestra en el siguiente ejemplo.
x 0 x 0

EJEMPLO 18.1

Interpolación lineal

Enunciado del problema. Estime el logaritmo natural de 2 mediante interpolación lineal. Primero, realice el cálculo por interpolación entre ln 1 = 0 y ln 6 = 1.791759. Después, repita el procedimiento, pero use un intervalo más pequeño de ln 1 a ln 4 (1.386294). Observe que el valor real de ln 2 es 0.6931472. Solución . Usaremos la ecuación (18.2) y una interpolación lineal para ln(2) de x = 1 a X] = 6 para dar
0

/,(2) = 0 +

1 791759 - 0
— 6—1

(2 - 1) = 0.3583519
0 x

que representa un error de e = 48.3%. Con el intervalo más pequeño de, x = 1 a x 4 se obtiene
t

=

/ , ( 2 ) = 0

L +

3

8 4

6

^ - ° (2 - 1 ) = 0.4620981
t

Así, con el intervalo más corto se reduce el error relativo porcentual a e — 33.3%. Ambas interpolaciones se muestran en la figura 18.3, junto con la función real.

FIGURA 18.3 Dos interpolaciones lineales para estimar ln 2. Observe cómo el intervalo más pequeño proporciona una mejor estimación.

f(x) = ln j f .

Estimaciones lineales l i l i l í

18.1

DIFERENCIA DIVIDIDA DE N E W T O N PARA LA INTERPOLACIÓN

505

18.1.2

Interpolación cuadrática

El error en el ejemplo 18.1 resulta de nuestra aproximación a una curva con una línea recta. Por consiguiente, una estrategia para mejorar la estimación es introducir alguna curvatura en la línea que conecta los puntos. Si ties^uiüo^dejas datos están disponibles, esto puede realizarse con un polinomio de segundo orden (también conocido como polinomio cuadrático o parábola). Una forma en particular conveniente para este propósito es fi(x) = bo +bi(xx ) + b (x - x ){x
0 2 0

- x{)

(18.3)

Observe que aunque la ecuación (18.3) parecería diferir del polinomio general [véase ecuación (18.1)], las dos ecuaciones son equivalentes. Esto puede demostrarse al multiplicar los términos de la ecuación (18.3) para dar f (x)
2

= b + b\x - b]X + b x
0 0 2

2

+ b x x\
2 Q

- b xx
2

0

-

b xx\
2

o, agrupando términos, f (x)
2

= ao + a\x +

ax
2

2

donde
ao

=

bo - b xo +
t 2

h X{)X\
2

a\ = b\ — b xu — b x\
2

a = b
2

2

Así, las ecuaciones (18.1) y (18.3) son formulaciones alternativas equivalentes del único polinomio de segundo orden que une los tres puntos. Un procedimiento simple puede usarse para determinar los valores de los coeficientes. Para Z> , la ecuación (18.3) conx — XQ puede ser usada para calcular
0

b = /(*o)
0

(18.4)
x

La ecuación (18.4) puede sustituirse en la (18.3), la cual puede evaluarse e n x = x para
=

f^)-f(xo)
X\

-

XQ

Por último, las ecuaciones (18.4) y (18.5) se pueden sustituir en la (18.3), la cual puede evaluarse en x = x y resolver (después de algunas manipulaciones algebraicas) para
2

/(* )-/(*i)
2

/ ( * i ) - / ( * o )

f>2 =

,

xo -x\
=

xi - x

0

(18.6)

x

2

-

Xo
x 0 x 0 2 0

Note que, como fue el caso con la interpolación lineal, b todavía representa la pendiente de la línea que une los puntos x y x . Así, los primeros dos términos de la ecuación (18.3) son equivalentes a la interpolación lineal d e x a x , , como se especificó antes en la ecuación (18.2). El último término, b (x — x )(x — X j ) , introduce la curvatura de segundo orden en la fórmula.

506

INTERPOLACIÓN

Antes de ilustrar cómo usar la ecuación (18.3), debemos examinar la forma del coeficiente b . Es muy similar a la aproximación por diferencias divididas finitas de la segunda derivada que se introdujo antes en la ecuación (4.24). Así, la ecuación (18.3) comienza a manifestar una estructura que es muy similar a la serie de expansión de Taylor. Esta observación será objeto de más exploración cuando relacionemos los polinomios de interpolación de Newton con la serie de Taylor en la sección 18.1.4. Pero primero, desarrollaremos un ejemplo que muestra cómo se usa la ecuación (18.3) para interpolar entre tres puntos.
2

EJEMPLO 1 8 . 2

Interpolación cuadrática

Enunciado del problema. Ajuste los tres puntos usados en el ejemplo 18.1 a un polinomio de segundo orden:

i j

xo = 1 =4
Xl

f(xo) - 0 /(xj) = 1.386294
/(JC )
2

x = 6
2

= 1.791759

Use el polinomio para evaluar ln 2. Solución.
b = 0
0

Aplicando la ecuación (18.4) se obtiene

La ecuación (18.5) da

|

¡ í

FIGURA 18.4 Uso de interpolación cuadrática para estimar ln 2. Para comparación se incluye también la interpolación lineal de x = 1 a 4.

2

1

0

0

5

x

18.1

DIFERENCIA DIVIDIDA DE N E W T O N PARA LA INTERPOLACIÓN

507

y con la ecuación (18.6) se obtiene 1.791759 - 1.386294 b =
2 6 4

0.4620981 ^ = -0.0518731 6—1 Sustituyendo estos valores en la ecuación (18.3) se obtiene la fórmula cuadrática f (x)
2

= 0 + 0.462098l (x - 1) - 0.0518731 (x - ])(x - 4)

que puede evaluarse en x — 2 para / (2) = 0.5658444
2

la cual representa un error relativo de e = 18.4%. Así, la curvatura introducida por la fórmula cuadrática (véase la figura 18.4) mejora la interpolación comparada con el resultado que se obtiene mediante líneas rectas en el ejemplo 18.1 y figura 18.3.
t

18.1.3

F o r m a general de la interpolación de p o l i n o m i o s de N e w t o n

El análisis anterior puede ser generalizado para ajustar un polinomio de «-ésimo orden a n + 1 datos. El polinomio de «-ésimo orden es f„(x) = b + bi(x - x ) + • • • + b„(x - x )(x -*,)•••(*0 0 0

x„-i)

(18.7)

Como se hizo antes con las interpolaciones lineales y cuadráticas, los puntos de los datos evaluaban los coeficientes b , b¡,..., b . Para un polinomio de «-ésimo orden se requiere n + 1 puntos: [ x , / ( x ) ] , [x^fix^],. .., [x ,f(x )]. Usamos estos datos y las siguientes ecuaciones para evaluar los coeficientes:
0 n 0 0 n n

b = f(x )
Q 0

(18.8) (18.9)

b\=f[x x ]
u 0

bi = f[x ,xi,
z

x„)

(18.10)

b

n

= f[x„,x„-i,

...,Il,A' ]
0

(18.11)

donde las evaluaciones de la función puestas entre paréntesis son diferencias divididas finitas. Por ejemplo, la primera diferencia dividida finita se representa por lo general como
rr
T / ( • * / ' ) ~ f( j)
X

/ 1 0 n \

f[xj,Xj]

=
X¡ Xj

(18.12)

La segunda diferencia dividida finita, la cual representa la diferencia de las dos primeras diferencias divididas, se expresa por lo general como

508

INTERPOLACIÓN

; 0
i

*/
x

Primara
f(x )0

Segundo
|. x„]

Tareero
|X|,
X,, X,„

o
2

:f[x,, x ]0

x

2 3

\

f(x,)f(x |2

:f[x , x,]
2

x

: [x . x ]"
f 3 2

*3

f[x h
3

FIGURA 18.5 Ilustración gráfica de la naturaleza recursiva de las diferencias divididas finitas.

,

r

,

f[Xi,Xj]

-

f[.Xj,X ]
K

f \x¡ ,x,,x¡Á
J 1

=

- -

x¡-x

k

(18.13)
fí ni
x x

En forma similar, la n-ésima diferencia dividida finita es
j. f[x„,X„-u...,X Xo]
r U

,

=

-

n —\
-

>•••i
-

x

-

\ \ — /[x„_i,
-

X „ _ 2 , . . . , XQ]

(.18.14)

(Wl\A\

X„

— XQ

Estas diferencias pueden usarse para evaluar los coeficientes en las ecuaciones (18.8) hasta la (18.11), las cuales entonces se sustituirán en la ecuación (18.7) para obtener el polinomio de interpolación
/«(*) = ñ o)
x

+ -+

+ (x-

(x - Xo)(x - x,) ... (x - x _ Y[x ,x _ ,...,x ]
n 1 n n l 0

* y i * i » *o] + ( ~
0

x

x )(x - x^x^
0

x

u

x]
0

(18.15)

que es conocido como polinomio de interpolación por diferencias divididas de Newton. Debe observarse que no es necesario que los datos utilizados en la ecuación (18.15) sean igualmente espaciados o que los valores de la abscisa deban estar en orden ascendente, como se ilustra en el siguiente ejemplo. También, observe cómo las ecuaciones (18.12) a (18.14) son recursivas (es decir, las diferencias de órdenes mayores se calculan al tomar diferencias de orden menor, véase la figura 18.5). Esta propiedad será aprovechada cuando desarrollemos un programa eficiente en la computadora dentro de la sección 18.1.5 para implementar el método.
EJEMPLO 18.3 Interpolando polinomios mediante la diferencia dividida de Newton

Enunciado del problema. En el ejemplo 18.2, los datos e n x = \,x = 4 yx — 6 se utilizaron para estimar ln 2 con una parábola. Ahora, agregando un cuarto punto (x = 5; f(x ) = 1.609438], calcule el ln 2 con una interpolación del polinomio de Newton de tercer orden.
0 x 2 3

3

Solución.

El polinomio de tercer orden utilizando la ecuación (18.7) con n — 3, es
T )

/ l ( . v ) = b{) + l>l(X - X ) + l> (.\ - .«o) (.V - .V|) | /0,(.\
2

.loK.v • -.»| )(\

.v>)

1 5 .1

UirCKCrNUA U l V I V I U r t u c

P I S Y T

I W I ^

FIGURA 18.6 Uso de la interpolación cúbica para estimar ln 2.

Las primeras diferencias divididas para el problema son [véase la ecuación (18.12)] 1.386294-0
f[X],X ]
0

=

4-0 6-4

= 0.4620981 0.2027326 0.1823216

1.791759 - 1.386294
f[x ,Xi]
2

=

f[X3,X ]
2

=

1.609438 - 1.386294 5-6

Las segundas diferencias divididas son [véase la ecuación (18.13)] 0.2027326-0.4620981
f[X2,Xi,X ]
0

=

6- 1 0.1823216-0.2027326 5-4

= -0.05187311 = -0.02041100

f[XT,,X ,Xi
2

La tercera diferencia dividida es [véase la ecuación (18.14) con n = 3] - 0 . 0 2 0 4 1 1 0 0 - (-0.05187311) 5 - 1
0 2 3 2 x 0

= 0.007865529

Los resultados para/[*,, x ],f[x , X^XQ] y f[x , x , x , x ] representan los coeficientes 6,, b y ¿> de la ecuación (18.7). Junto con b =f(x ) = 0.0, la ecuación (18.7) es
2 3 0 0

310

INTERPOLACIÓN

fr(x) = 0 + 0.4620981 (JI - 1) - 0.05187311 (x + 0.007865529 (x - l ) ( x - 4 )(x - 6)

I )(.v - 4)

que puede usarse para e v a l u a r / ^ ) = 0.6287686, el cual representa un error relativo de e¡ = 9.3%. El polinomio cúbico completo se muestra en la figura 18.6.

18.1.4

E r r o r e s al i n t e r p o l a r p o l i n o m i o s de N e w t o n

Observe que la estructura de la ecuación (18.15) es similar a la serie de expansión de Taylor en el sentido de que se agrega términos en forma secuencial para capturar el comportamiento de alto orden de la función en turno. Estos términos son diferencias divididas finitas y, así, representan aproximaciones de las derivadas de orden mayor. Por consiguiente, como ocurrió con la serie de Taylor, si la verdadera función subyacente es un polinomio de w-ésimo orden, el polinomio sujeto a interpolación de n-ésimo con base en n + 1 puntos dará resultados exactos. También, como fue el caso con la serie de Taylor, puede obtenerse una formulación para el error de truncamiento. Recuerde de la ecuación (4.6) que el error de truncamiento para la serie de Taylor podría expresarse por lo general como
f (n+l)(t\

(n+

1)1

(4.6)

donde ¿j está en alguna parte en el intervalo x¡ a x , . Para una interpolación de n-ésimo orden, una relación análoga para el error es
+1

R„

r" (£)(x - x
+ 1 )

0

) ( x - x ) • • • (x
t

-x„)

(18.16)

(n + 1)!

donde £ está en alguna parte en el intervalo que contiene la incógnita y los datos. Para esta fórmula que habrá de usarse, la función en turno debe ser conocida y < iferenciable. Por lo común éste no es el caso. Por fortuna, una formulación alternativa ei tá disponible y no requiere conocimiento previo de la función. Más bien, usa una diferí ncia dividida finita para aproximar la derivada (n + l)-ésima, R„ =
n nA

fíx,x„,x„^i
0

, X ](X
Q

-

X )(X
0

-

X\)

• • • (X -

X„)

(18.17)

donde f[x, x ,x ,..., x )] es la (n + 1 )-ésima diferencia dividida finita. D :bido a que la ecuación (18.17) contiene la incógnita/ (x), no puede resolverse para el err >r. Sin embargo, si se dispone de un dato adicional f(x ), la ecuación (18.17) pue<e usarse para estimar el error, como en
n+1

R„ = f[x„

+u

x„,

. . . , x ](x
0

- x )(x
0

- x , ) • • • (x - x„)

(18.18)

EJEMPLO 18.4

Estimación del error para el polinomio de Newton

¡ !

Enunciado del problema. Use la ecuación (18.18) para estimar el error para la interpolación del polinomio de segundo orden del ejemplo 18.2. Use los datos adicional e s / ( x ) = / ( 5 ) = 1.609438 para obtener sus resultados.
3

• •».*

n u i n r w i v i v n

ve rwHmwmius'nimiwnOff

¥17

FIGURA 18.10 Una ilustración visual del racional detrás del polinomio de Lagrange. Esta figura muestra un caso de segundo orden. Cada uno de los tres términos en la ecuación (18.23) pasa a través de uno de los puntos y es cero en los otros dos. La sumatoria de los tres términos, por tanto, es un polinomio único de segundo orden f |x) que pasa exactamente a través de los puntos.
2

Observe que, como en el caso del método de Newton, la versión de Lagrange tiene un error estimado de [véase ecuación (18.17)]
n

R = f[x,x„,x„-i,...
n

,x ] Y\(x
0

-x¡)
n+l

De este modo, si se tiene un punto adicional en x — x , se puede obtener un error estimado. Sin embargo, como no se emplean las diferencias divididas finitas como parte del algoritmo de Lagrange, esto se hace muy ocasionalmente. Las ecuaciones (18.20) y (18.21) se programan de manera muy simple para implementarse en una computadora. La figura 18.11 muestra el pseudocódigo que se puede emplear para este propósito. En resumen, para casos donde el orden del polinomio es desconocido, el método de Newton tiene ventajas en el conocimiento que proporciona respecto al comportamiento de las fórmulas de diferente orden. Además, el error estimado expuesto por la ecuación (18,18) se integra de manera usual en el cálculo del polinomio de Newton debido a que

518

INTERPOLACIÓN

FUNCTION Lagrng(x, y, n, x) sum = 0 DO i = 0,n product - yi DO j = 0,n IF i # j THEN product = product*(x ENDIF EWDO sum = sum + product EWDO Lagmg = sum END Laqrftq

- Xj )/(x - Xj)
;

FIGURA 18.11 Pseudocódigo para ¡mplementar la interpolación de Lagrange. Este algoritmo se acondiciona para calcular una sola predicción de n-ésimo orden, donde n + 1 es el número de datos.

la estimación emplea una diferencia finita (véase el ejemplo 18.5). De esta manera, para cálculos exploratorios, a menudo se prefiere el método de Newton. Cuando se ejecuta sólo una interpolación, las formulaciones de Lagrange y Newton requieren un notable esfuerzo computacional. Sin embargo, la versión de Lagrange es un poco más fácil de programar. Debido a que no requiere de cálculos y almacenaje de diferencias divididas, la forma de Lagrange se usa a menudo cuando el orden del polinomio se conoce a priorí.
EJEMPLO 1 8 . 7 Interpolación de Lagrange usando la computadora

Enunciado del problema. Podemos usar el algoritmo de la figura 18.11 para estudiar un análisis de tendencia para un problema que se relaciona con nuestio conocido caso del paracaidista en caída. Suponga que desarrollamos cierta instrumentación para medula velocidad del paracaidista. Los datos de medición obtenidos para un caso de prueba en particular son
Tiempo, s Velocidad m e d i d a v,em/s

1 3 5 7 13

2 3 3 4

800 310 090 940 755

í

Nuestro problema es estimar la velocidad del paracaidista en t — 10 s para tener las mediciones faltantes entre t — lyt= 13 s. Estamos conscientes que el comportamiento de la interpolación de polinomios puede ser inesperado. Por tanto, construiremos polinomios de 4, 3, 2 y 1 órdenes para comparar los resultados.

18.3

COEFICIENTES DE U N POLINOMIO DE INTERPOLACIÓN

| ] ¡

FIGURA 18.12 Gráficas que exponen a) cuarto orden, b) tercer orden, c) segundo orden y d) interpolaciones de primer orden.

Solución. El algoritmo de Lagrange se usa para construir polinomios de interpolación de cuarto, tercer, segundo y primer orden. El polinomio de cuarto orden y los datos de entrada se pueden graficar como se muestra en la figura 18.12a. Es evidente a partir de esta gráfica que el valor estimado de y en x = 10 es mayor que la tendencia global de los datos. Desde la figura 18.12b hasta la 18.12d se muestran las gráficas de los resultados de los cálculos para las interpolaciones de los polinomios de tercer, segundo y primer orden. Se observa que mientras más bajo sea el orden, menor será el valor estimado de la velocidad en t = 10 s. Las gráficas de la interpolación de polinomios indican que los polinomios de alto orden tienden a sobrepasar la tendencia de los datos. Esto sugiere que las versiones de primer o segundo orden son las más adecuadas para este análisis de tendencia en particular. Debe recordarse, que debido a que tratamos con datos inciertos, la regresión de hecho podría ser la más adecuada.

El ejemplo anterior ilustró que los polinomios de alto orden tienden a ser mal condicionados; esto es, tienden a ser altamente sensibles a los errores de redondeo. El mismo problema se aplica a la regresión con polinomios de orden superior. La aritmética de doble precisión ayuda algunas veces a disminuir el problema. Sin embargo, en tanto el orden aumente, habrá un punto para el cual el error de redondeo interferirá con la habilidad para interpolar mediante el procedimiento simple que se abordó en este punto. 18.3 COEFICIENTES DE U N P O L I N O M I O P E I N T E R P O L A C I Ó N Aunque el polinomio de Newton y el de Lagrange son adecuados para determinar valores intermedios entre puntos, no proporcionan un polinomio conveniente de la forma convencional

520

INTERPOLACIÓN

f(x) =a

0

+ ax + ax
x 2

2

+ •••+ a x
n

n

(18.24)

Un método directo para calcular los coeficientes de este polinomio se basa en el hecho de que n + 1 puntos se requieren para determinar los n + 1 coeficientes. Así, se puede usar ecuaciones algebraicas lineales simultáneas para calcular las a. Por ejemplo, suponga que usted desea calcular los coeficientes de la parábola f(x) = a + a\x + a x
0 2 0 2

(18.25)
0

Se requiere tres puntos: [x ,f(x )], la ecuación (18.25) para dar f(x )
0

[X],/(xj)]

y [x ,f(x )].Cada
2 2

uno se puede sustituir en

— a + aix
0 0

0

+

a x\
2 2

f(x\) f(x )
2

= a + a\x\ + a x\ = a + a\x
0 2

(18.26)

+

a x\
2

De esta manera, las x son los puntos conocidos y las a las incógnitas. Como hay el mismo número de ecuaciones que incógnitas, la ecuación (18.26) se podría resolver con un método de eliminación de la parte tres. Debe observarse que el procedimiento anterior no es el método disponible más eficiente para determinar los coeficientes de una interpolación de polinomios. Press y cois. (1986) proporcionan un análisis y códigos de cómputo para procedimientos más eficaces. Cualquiera que sea la técnica empleada, se debe tener precaución con el orden. Los sistemas como el de la ecuación (18.26) están notoriamente mal condicionados. Ya sean resueltos con un método de eliminación o con un algoritmo eficiente, los coeficientes resultantes pueden ser altamente inexactos, en particular para n grandes. Cuando se usan para una interpolación subsecuente a menudo se obtiene resultados erróneos. En resumen, si usted se interesa en determinar un punto intermedio, emplee la interpolación de Newton o Lagrange. Si lo que desea es determinar una ecuación con la forma de la (18.24), limítese a polinomios de orden inferior y verifique sus resultados cuidadosamente.

18.4

INTERPOLACIÓN

INVERSA

Como su nomenclatura lo implica, los valores de f(x) y x en la mayoría de los contextos de interpolación son las variables dependientes e independientes, en forma respectiva. En consecuencia, los valores de las x están típicamente espaciados en forma uniforme. Un ejemplo simple es una tabla de valores tabulados para la función f(x) = l/x,

X

1 1

2 0.5

3 0.3333

4 0.25

5 0.2

6 0.1667

7 0.1429

Ahora suponga que usted debe usar los mismos datos, pero que se le ha dado un valor para f(x) y debe determinar el valor correspondiente de x. Por ejemplo, para los datos anteriores, suponga que se le pide determinar el valor de x que corresponda a f(x) — 0.3. Para este caso, como la función está disponible y se puede manejar en forma fácil, la respuesta correcta se determina directamente como A; = 1/0.3 = 3.3333.

puntos en una secuencia diferente. La figura 18.9 muestra los resultados para el caso de invertir el orden de los datos originales; esto es, x = 3.5, x = 2.5, x = 1.5, y asi sucesivamente. Como los puntos iniciales para este caso se hallan cercanos y espaciados en cualquier lado de ln 2, el error disminuye mucho más rápido que para la situación original. En el segundo término, el error se redujo a menos de e, = 2 % . Se podría emplear otras combinaciones para obtener diferentes velocidades de convergencia.
0 { 3

El ejemplo anterior ilustra la importancia de la selección de los puntos base. Como se podría intuir en forma obvia, los puntos deberían estar centrados alrededor y tan cerca como sea posible de las incógnitas. Esta observación es también soportada por un análisis directo de la ecuación para estimar el error [vea ecuación (18.17)]. Si suponemos que la diferencia dividida finita no varía mucho a lo largo del rango de datos, el error es proporcional al producto: (x — x ) (x — x¡).. .(x — x ). Por lógica, los puntos base más cercanos son a x, la magnitud más pequeña de este producto.
0 n

18.2

I N T E R P O L A C I Ó N DE P O L I N O M I O S P E L A G R A N G E La interpolación de polinomios de Lagrange es simplemente una reformulación del polinomio de Newton que evita el cálculo por diferencias divididas. Se puede expresar de manera concisa como

/ » ( * )=2
i=0
donde

£,(*)ft*i>

(18.20)
(18.2D

iW=
fi(x)

n^/
y=o

X Í - X J

donde II designa el "producto de". Por ejemplo, la versión lineal (n = 1) es
= ?—^f(xo) x - xi
0

+ í—^-f(xx) x, - x
0

(18.22)
0

y la versión de segundo orden es
f (x)
2

=

' (i-xi)(x-x ) - (x - x ) ( x — r/(x ) + - — ( x - xO(xo - x ) {x\ - x )(xi
2 0 0 2 0

- X )
2

-

r/(*i) x)
2

, (x-xo)(x- )
(x
2 0

Xl mfiX2)

( 1 8

.

2 3 )

-x )(x

2

-Xi)"

La ecuación (18.20) se puede derivar de manera directa a partir del polinomio de Newton (véase cuadro 18.1). Sin embargo, el racional resaltado de la formulación de Lagrange se puede captar de manera directa al darse cuenta que cada término L¡(x) será

516

INTERPOLACIÓN

1 en x = x, y 0 en todos los otros puntos de la muestra (véase la figura 18.10). De esta manera, cada producto L¡(x)f(x¡) toma el valor de f(x¡) en el punto de muestra x¡. En consecuencia, la sumatoria de todos los productos designados para la ecuación (18.20) es el único polinomio de n-ésimo orden que pasa de manera exacta a través de todos los n + 1 puntos.
EJEMPLO 1 8 . 6 Interpolación de polinomios de Lagrange

Enunciado del problema. Use una interpolación del polinomio de Lagrange de primer y segundo orden para evaluar ln 2 con base en los datos dados en el ejemplo 18.2: xo = 1 x,=4 x =6
2

f(xo) = 0 / ( x 0 = 1.386294 f(x )
2

= 1.791760

Solución. El polinomio de primer orden [véase ecuación (18.22)] se puede usar para obtener la estimación en x = 2, i / , ( 2 ) = Y~^°+ y -386294 = 0.4620981
1

1

De manera similar, el polinomio de segundo orden se desarrolla como [véase ecuación (18.23)] / (2) =
2

(2-4)(2-6) (l-4)(l-6)

-0+

(2-l)(2-6) -1.386294 (4-l)(4-6)

( 2 - l)(2-4) + -1.791760 = 0.5658444 (6-l)(6-4) Como se esperaba, ambos resultados concuerdan con los que se obtuvieron antes al usar la interpolación para el polinomio de Newton.

Cuadro 18.1 Obtención de la forma de Lagrange a partir directamente de la interpolación del polinomio de Newton
El polinomio de interpolación de Lagrange se puede obtener de manera directa a partir de la formulación del polinomio de Newton. Haremos esto únicamente para el caso del polinomio de primer orden [véase ecuación (18.2)]. Para obtener la forma de Lagrange, reformulamos las diferencias divididas. Por ejemplo, la primera diferencia dividida, la cual es referida comoforma simétrica. Al sustituir la ecuación (B18.1.2) en (18.2) se obtiene

/i(x) = /(x ) +x\—- — xf t x i )
0 0

+

——/(x ) x
0
Xi

0

- /(x ) /[x,,xo] = /(xi) xi - x o
0

fl i

Por último, al agrupar términos similares y simplificar se tiene la forma del polinomio de Lagrange,
— x— f (x) = x o -/(x ) + V(xi)
X

(B18.1.1)

Xl

se puede reformular como
(B18.1.2)

x

-

X l

0

X\ Xo

XQ

18.5

COMENTARIOS ADICIONALES

521

Tal problema se conoce como interpolación inversa. Para un caso más complicado, usted debe intentar cambiar los valores f(x) y x [es decir, sólo grafique x contra f(x)\ y use un procedimiento como la interpolación de Lagrange para determinar el resultado. Por desgracia, cuando usted invierte las variables no hay garantía de que los valores junto con la nueva abscisa [los/(x)] sean espaciados uniformemente. De hecho, en muchos casos, los valores serán "agrandados". Es decir, tendrán la apariencia de una escala logarítmica con algunos puntos adyacentes muy agrupados y otros muy dispersos. Por ejemplo, para f(x) = 1/x el resultado es
0.1429
X

0.1667

0.2

0.25

0.3333

0.5

1 1

7

6

5

4

3

2

Tal espaciamiento no uniforme sobre la abscisa a menudo lleva a oscilaciones en el resultado de la interpolación de polinomios. Esto puede ocurrir aun para polinomios de orden inferior. Una estrategia alterna es ajustar un polinomio de n-ésimo orden, f {x), a los datos originales [es decir, con f(x) contra x]. En la mayoría de los casos, como las x están espaciadas de manera uniforme, este polinomio no estará mal condicionado. La respuesta a su problema entonces toma en cuenta la determinación del valor de x que haga que este polinomio sea igual al dado por f(x). Así, ¡el problema de interpolación se reduce a un problema de raíces! Por ejemplo, para el problema antes descrito, un simple procedimiento podría ser ajustar los tres puntos a un polinomio cuadrático: (2, 0.5), (3, 0.3333) y (4, 0.25). El resultado sería
n

f (x)
2

= 1.08333 - 0.375.* + 0.041667*

2

La respuesta al problema de interpolación inversa para determinar lax correspondiente a f(x) = 0.3 sería equivalente a la determinación raices de 0.3 = 1.08333 - 0.375A- + 0.041667 A:
2

Para este caso simple, la fórmula cuadrática se puede usar para calcular _ 0.375 ± v/C-0.375) - 4(0.041667)0.78333 _ 5.704158
2 X

~

2(0.041667)

~ 3.295842

Así, la segunda raíz, 3.296, es una buena aproximación del valor real de 3.333. Si se desea una exactitud adicional, se podría emplear un polinomio de tercer o cuarto orden junto con uno de los métodos para la localización de raíces de la parte dos.

18.5

COMENTARIOS

ADICIONALES

Antes de proceder con la siguiente sección, se debe mencionar dos temas adicionales: interpolación con datos igualmente espaciados y extrapolación. Como, ambos polinomios, el de Newton y Lagrange, son compatibles con datos espaciados en forma arbitraria, usted se preguntaría por qué hemos puesto el caso especial de datos igualmente espaciados (véase cuadro 18.2). Antes de la llegada de las computadoras digitales, esas técnicas tenían gran utilidad para interpolación a partir de

522

INTERPOLACIÓN

Cuadro 18.2

INTERPOLACIÓN

CON

D A T O S

I G U A L M E N T E

E S P A C I A D O S

Si los datos están igualmente espaciados y en orden ascendente, entonces la variable independiente tiene los valores de

X

x\ = x + h
0

donde lo que resta es lo mismo que en la ecuación (18.16). Esta ecuación es conocida como fórmula de Newton o fórmula hacia adelante de Newton-Gregory. Se puede simplificar más al definir una nueva cantidad, a:

2

= A O ' + 2h

x„ = xo + nh

Esta definición se puede usar para desarrollar las siguientes expresiones simplificadas páralos términos en la ecuación (B18.2.3):
x — x —
AO = AQ —

donde h es el intervalo, o tamaño de paso, entre los datos. Con esta base, las diferencias divididas finitas se pueden expresar en forma concisa. Por ejemplo, la segunda diferencia dividida hacia adelante es

ah h = ah • •h = h(a-\)

f(Xl) f(Xj) _
A2

— Xl

X| — X Q

/(Al) ~ /(X ) x — Ao — (n — l)h = ah — (n — \)h = h(a — n + 1)
0

/[A'O, A|, X ] =
2

X2

la cual se puede expresar como
/ [ X , Al, A ]
0 2 2 2

-X
0

las cuales se sustituyen en la ecuación (Bl 8.2.3) para dar
A fn(x) = /(x ) + A/(x )a +
0 0 2

0
(B 18.2.1)

fíx ) i) 2! "a(a
0

- 1)

/ ( x ) - 2 / 2h ( x , ) + /(x )
2 { 2 0

H

, A"/(x ) -i ¡—a (a - 1) • • (a - n + 1) + R„
0

ya que x — x = x — x = (x — x )/2 = h. Ahora recuerde que la segunda diferencia hacia adelante es igual al numerador donde de la ecuación (4.24)
x 0

(B 18.2.4)

A /(xo) = /(A'2)-2/(x ) + /(x )
2 l 0

Por tanto, la ecuación (B 18.2.1) se puede representar como
/[X ,X|,X ] =
0 2

Rn = , , , \ , V + W - D(« - 2) • • • (a - «) [n + 1)! Esta notación concisa tendrá utilidad en nuestra derivación y en el análisis de error de las fórmulas de integración en el capítulo 21. Además de la fórmula hacia adelante, están disponibles las fórmulas hacia atrás y central de Newton-Gregory. Para información adicional con respecto a interpolación para datos igualmente espaciados se puede consultar a Carnahan, Luther y Wilkes (1969).

A /(x )
2 0

2\h

2

o, en general
/[Xo ,X|, . . . , x „ ]
=

A"/(x )
0

n\h"

(B18.2.2)

Mediante la ecuación (Bl 8.2.2), podemos expresar el polinomio de interpolación de Newton [véase ecuación (18.15)] para el caso de datos igualmente espaciados como
r / x s, / , ( X ) =/(XQ) , + A/(X ) ; (X 0

h

X )
0

+
+

A

2

/ ( A

0

)

2\h

2

(x - x ) ( x - xo - h)
0

nlh"
0

---+^¡^(x-x )(x-x -h)
Q 0

•••\x-x -(n-1)h)

+ R„

(B18.2.3)

I

i o. i j j \ "

uircRCNClA DIVIDIDA DE N E W T O N "PARA LA INTERPOLACIÓN

Solución. Recuerde que en el ejemplo 18.2 la interpolación del polinomio de segundo orden proporcionó una estimación de f (2) = 0.5658444, que representa un error de 0.6931472 - 0.5658444 = 0.1273028. Si se hubiera conocido el valor real, como es común que suceda, la ecuación (18.18), junto con el valor adicional en x , pudo usarse para estimar el error, como en
2 3

M I

!

Ri

=

/fe,

x ,
2

X\,XQ\(X

-

x )(x
0

-

x\)(x

-

x)
2

i
o ! í R = 0.007865529(JC - l)(x - 4)(x - 6) donde el valor para la diferencia dividida finita de tercer orden es como la que se calculó antes en el ejemplo 18.3. Esta relación puede evaluarse e n * = 2 para R = 0.007865529(2 - 1)(2 - 4)(2 - 6) = 0.0629242
2 2

la cual es del mismo orden de magnitud que el error real.

Del ejemplo anterior y de la ecuación (18.18), debe estar claro que el error estimado para el polinomio de n-ésimo orden es equivalente a la diferencia entre el (n + l)-ésimo orden y la predicción de n-ésimo orden. Es decir, Rn = fn + l(x) ~ fn(x) (18.19)

En otras palabras, el incremento que se agrega al caso del n-ésimo orden para crear el caso de (n + l)-ésimo orden [es decir, la ecuación (18.18)] se interpreta como una estimación del n-ésimo orden de error. Esto puede verse con claridad al reordenar la ecuación (18.19) para dar f„+l{x) = f„(x) + Rn La validez de este procedimiento es afirmada por el hecho de que la serie es fuertemente convergente. Para tal situación, la predicción del (n + l)-ésimo orden debería ser mucho más cercana al valor real que la predicción del n-ésimo orden. En consecuencia, la ecuación (18.19) conforma nuestra definición estándar de error al representar la diferencia entre la verdadera y una aproximación. Sin embargo, observe que mientras todos los otros errores estimados para procedimientos iterativos introducidos hasta ahora se determinaron como una predicción actual menos una previa, la ecuación (18.19) representa una predicción futura menos una presente. Esto significa que para una serie en convergencia rápida, el error estimado de la ecuación (18.19) podría ser menor que el verdadero. Esto representaría una calidad muy poco atractiva si el error estimado fuera a emplearse como un criterio de paro. Sin embargo, como será expuesto en la siguiente sección, la interpolación de polinomios de alto orden son muy sensibles a errores en los datos (es decir, están mal condicionados). Cuando se emplean para interpolación, a menudo se obtienen predicciones que divergen en forma significativa del valor verdadero. Si se prevén tales errores, la ecuación (18.19) es más sensible para dicha divergencia. Como tal, es más valioso para la clase de análisis de datos exploratorios para lo cual el polinomio de Newton es el más adecuado.

512

INTERPOLACIÓN

18.1.5

A l g o r i t m o de cómputo p a r o la interpolación del p o l i n o m i o de N e w t o n

Tres propiedades hacen que la interpolación del polinomio de Newton sea muy atractiva para las aplicaciones en la computadora: 1. Como en la ecuación (18.7), se puede desarrollar de manera secuencial versiones de orden mayor con la adición de un solo término a la siguiente ecuación de orden inferior. Esto facilita la evaluación de algunas de las versiones de diferente orden en el mismo programa. Tal capacidad es en especial valiosa cuando el orden del polinomio no es conocido a priori. Al agregar nuevos términos en forma secuencial, podemos determinar cuándo se alcanza un punto de disminución de regreso (es decir, cuando la adición de términos de orden superior ya no mejora de manera significativa la estimación, o en ciertas situaciones de hecho la aleja). Las ecuaciones para estimar el error que se analizan en el punto 3 son útiles para visualizar un criterio objetivo para identificar este punto de términos disminuidos. Las diferencias divididas finitas que constituyen los coeficientes del polinomio [ecuaciones (18.8) hasta (18.11)] se pueden calcular de manera eficaz. Es decir, como en la ecuación (18.14) y la figura 18.5, se usa diferencias del orden inferior para calcular las de alto orden. Por medio de la información determinada antes, los coeficientes se pueden calcular de manera eficiente. El algoritmo en la figura 18.7 contiene un esquema semejante. El error estimado [véase la ecuación (18.18)] puede ser muy simple de incorporar en un algoritmo de cómputo debido a la manera secuencial en la cual se construye la predicción.

2.

3.

FIGURA 18.7 Un algoritmo para el polinomio de interpolación de Newton escrito en pseudocódigo.

5U3R0UTINE Newtlnt (x, y, n, xi, ymt, ea) LOCAL fdd„ DOi = 0,n'
¡n

u>=y¡ END DO DO j = 1,n DO i = 0,n- j fdd = (fdd i ENDDO END DO xterm = 1 yint = fdd DO order = 1, n xterm = xterm * (x¡ - x yintZ = yint . + fdd
fdd ¡¿ M¡t 0 0¡0 older 1

fdd^x^-xj

oreter

_,)

0iOrder

* xterm

END order END Newtlnt

18.1

DIFERENCIA DIVIDIDA DE N E W T O N PARA LA INTERPOLACIÓN

913

Todas las características anteriores pueden aprovecharse y ser incorporadas en un algoritmo general para implementar el polinomio de Newton (véase la figura 18.7). Observe que el algoritmo consiste en dos partes: el primero determina los coeficientes o partir de la ecuación (18.7); el segundo establece las predicciones y su error asociado. La utilidad de este algoritmo se demuestra en el ejemplo siguiente.
EJEMPLO 18.5 Estimación del error para determinar el orden adecuado de interpolación

¡ ; j

Enunciadodel problema. Después de incorporar el error [véase la ecuación (18.18)], utilice el algoritmo de cómputo que se muestra en la figura 18.7 y la siguiente información para evaluar/(x) = Inxenx = 2:
x

i

f

(x) = ln x

0 4 ó 5 3 1.5 2.5 3.5

1 1.3862944 1.7917595 1.6094379 1.0986123 0.4054641 0.9162907 1.2527630

Solución. Los resultados al emplear el algoritmo de la figura 18.7 para obtener una solución se muestran en la figura 18.8. El error estimado, junto con el error real (con

|

L o sr e s u l t a d o sd eu np r o g r a m a ,c o nb a s ee ne la g lo r m t i od el af i g u r a1 8 . 7 , p a r ae v a l u a rn l 2.
NUMBER OF P01NTS? 8 X( 0 ) , X( 1 ). X( 2 ) , X( 3 ) . X( 4 ) , X( 5 ) . X( 6 ) , X( 7 ) , y( y( y( y( y( y( y( y( 0 1 ) ) ? ? ? ? ? ? 1,0 6 , 1.7917595 5 , 1.6094379 3 , 1 .0986123 1.5 , 0 . 4 0 5 4 6 4 1 1 3.5 ,1.2527630 2 ERROR 0.462098 0.103746 0.062924 0.046953 0.021792 -0.003616 -0.000459 ? 4 , 1. 3 8 6 2 9 4 4 2 ) 3 ) 4 ) 5 ) 6 ) 7 ) -

FIGURA

18.8

? 2.5 .0.91629073

INTERPOLATION AT X ORDER 0 1 2 3 4 5 6 7 F(X) 0.000000 0.462098 0.565844 0.628769 0.675722 0.697514 0.693898 0.693439

514

INTERPOLACIÓN

I ¡ \ ! \ \ \ ¡ i j j

base en el hecho de que ln 2 = 0.6931472), se ilustran en la figura 18.9. Observe que el error estimado y el real son similares y que su concordancia mejora en tanto se aumente el orden. A partir de estos resultados se puede concluir que la versión de quinto orden da una buena estimación y que los términos de orden superior no resaltan en forma significativa la predicción. Este ejercicio también ilustra la importancia de colocar el orden de los puntos. Por ejemplo, hasta la estimación del tercer orden, la razón de mejora es lenta debido a que los puntos que se agregaron (en x = 4, 6 y 5) están distantes y a un lado del punto de análisis en x = 2. La estimación de cuarto orden muestra algo de mejora ya que el nuevo punto en x — 3 está cercano a la incógnita. Sin embargo, la disminución más dramática en el error está asociada con la inclusión del término de quinto orden mediante los datos en x = 1.5. No sólo está este punto cercano a la incógnita, sino que también se halla en el lado opuesto de la mayoría de los otros puntos. En consecuencia, el error se reduce a casi un orden de magnitud. El significado de la posición y secuencia de los datos se puede también ilustrar al usar los mismos datos para obtener una estimación para el ln 2, pero considerando los

i j !

FIGURA 18.9 Porcentaje de errores relativos para la predicción de ln 2 como una función del orden de la interpolación polinomial.

Error i

FIGURA 18.13 Ilustración de la divergencia posible de una predicción extrapolada. La extrapolación se basa en el ajuste de una parábola a través de los primeros tres puntos conocidos.

tablas con argumentos igualmente espaciados. De hecho, una estructura computacional conocida como tabla de diferencias divididas fue desarrollada para facilitar la implementación de esas técnicas. (La figura 18.5 es un ejemplo de esa tabla.) Sin embargo, como las fórmulas son subconjuntos de esquemas de Newton y Lagrange compatibles con computadora y debido a las muchas funciones tabulares disponibles, como subrutinas de librerías, la necesidad para las versiones igualmente espaciadas ha disminuido. A pesar de esto, por su relevancia las hemos incluido en este tema en las últimas partes de este libro. En particular, son necesarias para obtener fórmulas de integración numérica que emplean de manera típica datos igualmente espaciados (véase el capítulo 21). Como las fórmulas de integración numérica tienen relevancia en la solución de ecuaciones diferenciales ordinarias, el material del cuadro 18.2 tiene también significado en la parte siete. Extrapolación es el proceso de estimar un valor de f(x) que se tiene fuera del rango de los puntos base conocidos, x , JC,, . . ., x (véase la figura 18.13). En una sección anterior, mencionamos que la interpolación más exacta es usualmente obtenida cuando las incógnitas están cerca del centro de los puntos base. Obviamente, esto no se cumple cuando las incógnitas se encuentran fuera del rango y, en consecuencia, el error en extrapolación puede ser muy grande. Como se ilustra en la figura 18.13, la naturaleza de extremos abiertos de la extrapolación representa un paso en la incógnita, ya que el proceso extiende la curva más allá de la región conocida. Como tal, la curva real podría con facilidad divergir de la predicción. Por tanto, se debe tener extremo cuidado al realizar ejercicios donde surja un caso que se deba extrapolar.
0 n

N I T E R P O L A C Ó I N
INTERPOLACIÓN SEGMENTARIA -^n la sección anterior, se usó polinomios de w-ésimo orden para interpolar entre n + 1 ¿Jatos. Por ejemplo, para ocho puntos se puede derivar un perfecto polinomio de séptimo ¿>rden. Esta curva podría capturar todas las curvaturas (al menos hasta e incluso la séptic a derivada) sugeridas por los puntos. Sin embargo, hay casos en los que estas funciones pueden llevar a resultados erróneos debido a errores de redondeo y puntos lejanos. Un

G I fU R A1 8 1 .4

s

(Jna representación visual de una situación donde las segmentarias son interpolaciones polinomialesde orden superior. La función que habrá de ajustarse pasa por un incremento jubito en x = 0. Los incisos a) a c) indican que el cambio abrupto induce oscilaciones al ¡nterpolar polinomiales. En contraste, como las curvas se limitan a tercer orden con transiciones suaves, la segmentaria cúbica d) proporciona una aproximación mucho más ¿iceptable.

a) f(x),

b)

X

f(x)

i 999 J —, » J>

J
0 d)


x

18.6

INTERPOLACIÓN SEGMENTARIA

525

¡í

procedimiento alternativo es aplicar polinomios de orden inferior a subconjuntos de datos. Tales polinomios conectores son llamados funciones segmentarias. Por ejemplo, curvas de tercer orden empleadas para conectar cada par de datos son llamadas segmentarias cúbicas. Esas funciones se pueden construir de tal forma que las conexiones entre las ecuaciones cúbicas adyacentes resultan visualmente suaves. Sobre la superficie, podría parecer que la aproximación de tercer orden de las segmentarias sería inferior a la expresión de séptimo orden. UstecJ se preguntaría por qué una segmentaria podría ser siempre preferible. La figura 18.14 ilustra una situación donde una segmentaria se comporta mejor que una polinomial de orden superior. Este es el caso donde una función es por lo general suave pero conlleva un cambio abrupto en algún lugar a lo largo de la región de interés. El incremento de paso expuesto en la figura 18.14 es un ejemplo extremo de tal cambio y sirve para ilustrar este punto. De la figura 18.14a hasta la 18.14c se ilustra cómo un polinomio de orden superior tiende a formar una curva a través de oscilaciones bruscas en la vecindad con un cambio súbito. En contraste, la segmentaria también conecta los puntos, pero debido a sus cambios limitados de tercer orden, las oscilaciones se mantienen a un mínimo. Como tal, la segmentaria usualmente proporciona una aproximación superior del comportamiento de las funciones que tienen cambios locales y abruptos. El concepto de la segmentaria se origina de la técnica de dibujo con una cinta delgada y flexible (llamada curvígrafo) para dibujar curvas suaves a través de un conjunto de puntos. El proceso se expone en la figura 18.15 para una serie de cinco pasadores (datos). En esta técnica, el dibujante coloca un papel sobre una mesa de madera y golpea los clavos o pasadores en el papel (y la mesa) en la ubicación de los datos. Una curva suave resulta al entrelazar la cinta entre los pasadores. De aquí que se haya adoptado el nombre de "segmentaria cúbica" para los polinomios de este tipo. En esta sección, se usarán primero funciones lineales simples para introducir algunos conceptos básicos y problemas asociados con la interpolación segmentaria. Entonces obtendremos un algoritmo para el ajuste de datos con segmentarias cuadráticas. Por último, presentamos material sobre la segmentaria cúbica, la cual es la versión más común y útil en la práctica de la ingeniería.

\i

.

', J 1

FIGURA 18.15 La técnica de dibujo.al usar una segmentaria para dibujar curvas suaves a través de una serie de puntos. Observe cómo en los puntos extremo, la segmentaria trata de enderezarse. Esto es conocido como uña segmentaria "natural".

526

INTERPOLACIÓN

18.6.1

S e g m e n t a r i a s lineales

La conexión más simple entre dos puntos es por medio de una línea recta. Las segmentarias de primer orden para un grupo de datos ordenados pueden definirse como un conjunto de funciones lineales,
f(x) = f(xo) +m (x
0

-

x )
0

xo < x '< xi
Xi £ x <
Xi

/ ( x ) = / ( x i ) +nn(x

- xi)

f(x) = / ( x „ - j ) + m„-\(x

- x„_i)

x „_i < x < x„

donde m¡ es la pendiente de la línea recta que conecta los puntos:
/(*/ + !) f(x¡)

x¡+i — x¡

(18.27)

Estas ecuaciones se pueden usar para evaluar la función en cualquier punto entre x y x para localizar primero el intervalo dentro del cual está el punto. Después se usa la ecuación adecuada para determinar el valor de la función dentro del intervalo. El método es obviamente idéntico al de la interpolación lineal.
0 n

EJEMPLO 1 8 . 8

Segmentarias de primer orden

Enunciado del problema. Ajuste los datos de la tabla 18.1 con segmentarias de primer orden. Evalúe la función e n x = 5. Solución. Se puede usar los datos para determinar las pendientes entre puntos. Por ejemplo, para el intervalo x = 4.5 a x = 7 la pendiente se puede calcular mediante la ecuación (18.27): 2.5 - 1 7-4.5 = 0.60

Las pendientes para los otros intervalos se pueden calcular y las segmentarias resultantes de primer orden se grafican en la figura 18.16a. El valor e n x = 5 es 1.3.
TABLA 18.1 Datos para ser ajustados con funciones segmentarias. f(x)

3.0 4.5 7.0 9.0

2.5 1.0 2.5 0.5

Una inspección visual a la figura 18.16a indica que la principal desventaja de las segmentarias de primer orden es que no son suaves. En esencia, en los puntos donde dos segmentarias se encuentran (llamado nodo), la pendiente cambia de forma abrupta. En términos formales, la primera derivada de la función es discontinua en esos puntos. Esta deficiencia se resuelve al usar segmentarias polinomiales de orden superior que aseguren suavidad en los nodos al igualar derivadas en esos puntos, como se analiza en la siguiente sección. 18.6.2 S e g m e n t a r i a s cuadráticas

Para asegurar que las derivadas m-ésimas son continuas en los nodos, se debe usar una segmentaria de al menos m + 1 orden. A menudo se usan con más frecuencia en la práctica los polinomios de tercer orden o segmentarias cúbicas para asegurar derivadas

FIGURA 18.16 Ajuste segmentario de un conjunto de cuatro puntos, a) Segmentaria lineal, b) segmentaria cuadrática y c] segmentaria cúbica, se gráfica también con una interpolación polinomial cúbica.

Segmentaria de primer orden

10

x

Segmentaria de segundo orden

0

I

1

1

|

L
b)

J

L

Segmentaría cúbica

\

Interpolación cúbica

'

o

f

528

INTERPOLACIÓN

continuas de primer y segundo orden. Aunque las derivadas de tercer orden y mayor© podrían ser discontinuas cuando se usa segmentarias cúbicas, usualmente no puede detectarse en forma visual y en consecuencia son ignoradas. Debido a que la obtención de segmentarias cúbicas está algo involucrada, la hem* escogido en una sección subsecuente. Hemos decidido primero ilustrar el cor.cípto e j interpolación segmentaria mediante polinomios de segundo orden. Esas "segmentáis j cuadráticas" tienen primeras derivadas continuas en los nodos. Aunque las segmentaras cuadráticas no aseguran segundas derivadas iguales en los nodos, «'"•en muy b¡en pía | demostrar el procedimiento general en el desarrollo de segmentarias de o. jen ¡superior. El objetivo de las segmentarias cuadráticas es derivar un polinomio de segundo orden para cada intervalo entre datos. El polinomio para cada intervalo se puede representar de manera general como

f,(x) = cnx + bix + ci
2

(18.28)

La figura 18.17 ha sido incluida para ayudar a clarificar la notación. Para n + 1 datos (i = 0, 1, 2 n) existen n intervalos y, en consecuencia, 3n constantes desconocidas (las a,byc) por evaluar. Por tanto, se requieren 3« ecuaciones o condiciones para evaluar las incógnitas. Éstas son: 1. Los valores de la función de polinomios adyacentes deben ser iguales a los nodos interiores. Esta condición se puede representar como a¡- x}_
x l x

+

+ c,-i = /(*,_!)

(18-29) (18.30)

a¡xf_ + b¡x¡-[ + c¡ = /(*,•_ i)

para / = 2 a n. Como sólo se usa nodos interiores, las ecuaciones (18.29) y (18.30) proporcionan cada una n — 1 condiciones del total de 2n — 2.

FIGURA 18.17 Notación usada para derivar segmentarias cuadráticas. Observe que hay n intervalos y n + 1 datos. El ejemplo mostrado es para n = 3.

a,)?

+ bfX+

c-

•«

Intervalo 1

*

Intervalo 2

Intervalo 3

_j
*0

1
*1

,

1
*2

1
*3

*

;= 0

/=1

1-2

/=3

18.6*

INTERPOLACIÓN SEGMENTARIA

1 9 9

2.

Las primera y última funciones deben pasar a través de los puntos extremo. Es
agrega dos ecuaciones adicionales: a\xl + bix
a„x
2 n n

0

+ c\ = f(x )
0

(18.31)
(18.32)

+ b x„ +c„-

f(x )
n

para un total de 2n — 2 + 2 = 2n condiciones. 3. vada de la ecuación 18.28 es
f\x) = 2ax + b

Las primeras derivadas en los nodos interiores deben ser iguales. La primera deri-

Por tanto, la condición se puede representar de manera general como
2a¡-\x,-\ + b¡-[ =

2a¡Xi-\

+ b¡

(18.33)

4.

para i = 2 a n. Esto proporciona otras n — 1 condiciones para un total de 2n + n — 1 = 3« — 1. Como se tiene 3n incógnitas, se tiene una condición corta. A menos que tengamos alguna información adicional con respecto a las funciones o sus derivadas, debemos tomar una selección arbitraria para calcular de manera exitosa las constantes. Aunque hay un número de elecciones diferentes que se pueden tomar, seleccionamos la siguiente: Suponga que en el primer punto la segunda derivada es cero. Como la segunda derivada de la ecuación 18.28 es 2a¡, esta condición se puede expresar matemáticamente como «i = 0 (18.34)

La interpretación visual de esta condición es que los dos primeros puntos se conectarán con una línea recta.
EJEMPLO 1 8 . 9 Segmentarias cuadráticas

j ! \

Enunciado del problema. Ajustar por medio de segmentarias cuadráticas los mismos datos que se usaron en el ejemplo 18.8 (véase tabla 18.1). Use los resultados para calcular el valor enx = 5.

| Solución. Para este problema, se tienen 4 datos con n — 3 intervalos. Por tanto, 3(3) = \ 9 incógnitas por ser determinadas. Las ecuaciones (18.29) y (18.30) dan 2(3) — 2 = 4 i condiciones: 1
I

2 0 . 2 5 a i + 4 . 5 & 1 + c i = 1.0
20.25 (32 + 4.5Í7 + c = 1.0
2 2

j J

49a +
2

7 /7 + c = 2.5
2 2

49a +
3

7fo + c = 2.5
3 3

Evaluando a las funciones primera y última en los valores inicial y final se agregan 2 ecuaciones mes [véase ecuación (18.31)]:

530

INTERPOLACIÓN

9a! +3b> + c i = 2.5 y [véase ecuación (18.32)] 81a + 9 ¿ > + c = 0.5
3 3 3

La continuidad de las derivadas crea un adicional de 3 — 1 = 2 [véase ecuación (18.33)]:
9Ú[
2

+ b\ = 9a 4- b
2

2

14a +

¿>2

= 14a +
3

¿>3

Por último, la ecuación (18.34) especifica que a — 0. Como esta ecuación especifica a¡ de manera exacta, el problema se reduce a la resolución de ocho ecuaciones simultáneas. Estas condiciones se pueden expresar en forma matricial como
x

4.5 0 0 0 3 0 1 0

1 0 0 0 1 0 0 0

0 0 20.25 4.5 7 49 0 0 0 0 0 0 -9 -1 14 1

0 0 1 0 1 0 49 0 0 0 0 81 0 0 0 -14

0 0 0 7 0 9 0 -1

0" 0 0 1 0 1 0 0

C\

a b
C

2

2

2

a
C

3

'3

1 1 2.5 2.5 2.5 0.5 0 0

Esas ecuaciones se pueden resolver mediante las técnicas de la parte tres, con los resultados: «i=0 a = 0.64
2

b\ = — 1 b =-6.76
2

c\ = 5.5 c = 18.46
2

a =-1.6
3

¿3=24.6

£- = - 9 1 . 3
3

las cuales pueden sustituirse en las ecuaciones cuadráticas originales para desarrollar la siguiente relación para cada intervalo: /,(.v) = —jr + 5.5
f (x)
2

3.0<x<4.5
4.5 < x < 7.0

= 0.64 A - - 6.76 JT + 18.46
2

/ (.v) = - 1 . 6 x + 24.6x - 91.3
2 3

7.0 < x < 9.0

Cuando se u s a ^ , la predicción para x = 5 es, por tanto, / ( 5 ) = 0.64(5) - 6.76(5) + 18.46 = 0.66
2 2

El ajuste total por segmentarias se ilustra en la figura 18.166. Observe que hay dos desventajas que se alejan del ajuste: 1) la línea recta que conecta los primeros dos puntos y 2) la segmentaria para el último intervalo parece oscilar demasiado. Las segmentarias cúbicas de la siguiente sección no exhiben estas desventajas y, en consecuencia, son i«<*molación seamentaria.

18.6.3

Segmentaria» cúbicas

El objetivo en las segmentarias cúbicas es obtener un polinomio de tercer orden partí cada intervalo entre los nodos, como en f¡ (JC) = a/.v + b¡x + c¡x + d-,
3 2

(18.35)

Así, para n + 1 datos (i — 0, 1, 2 , . . . , n), existen n intervalos y, por consiguiente, 4« incógnitas constantes para evaluar. Como con las segmentarias cuadráticas, se requieren 4 H condiciones para evaluar las incógnitas. Éstas son: 1. 2. 3. 4. 5. Los valores de la función deben ser iguales en los nodos interiores (2« — 2 condiciones). La primera y última funciones deben pasar a través de los puntos extremo (2 condiciones). Las primeras derivadas en los nodos interiores deben ser iguales (« — 1 condiciones). Las segundas derivadas en los nodos interiores deben ser iguales (« — 1 condiciones). Las segundas derivadas en los nodos extremo son cero (2 condiciones).

La interpretación visual de la condición 5 es que la función se vuelve una línea recta en los nodos extremo. La especificación de tal condición extremo nos lleva a lo que se denomina como segmentaria "natural". Se le da este nombre debido a que el dibujo segmentario se comporta en esta forma (véase figura 18.15). Si el valor de la segunda derivada en los nodos extremo no es cero (es decir, existe alguna curvatura), esta información se puede usar de manera alterna para suministrar las dos condiciones finales. Los cinco tipos de condiciones anteriores proporcionan un total de 4n ecuaciones requeridas para resolver los An coeficientes. Mientras sea ciertamente posible desarrollar segmentarias cúbicas en esta forma, presentamos una técnica alterna que requiere la solución de sólo n — 1 ecuaciones. Aunque la obtención de este método (véase cuadro 18.3) es algo menos directo que para las segmentarias cuadráticas, la ganancia en eficiencia bien vale el esfuerzo. La derivación del cuadro 18.3 resulta en la siguiente ecuación cúbica para cada intervalo:
r / \ f¡"( i~l)
X

,

x

3

,

fi ( i)
X

,

N3

fi(x)

= 7

1

Ax¡ - xY + — f(*i-Ó
/"(*/-! )(*/ -

-(x
X¡-Ó'

-

Xi-xY

x¡ —

Xi-\ f"(Xi)(Xj

6
-Xj.Q

(x¡ - x) (18.36)

+

/(*/) Xi

6

( A - X , - , )

Esta ecuación contiene sólo dos incógnitas (las segundas derivadas al final de cada intervalo). Esas incógnitas se pueden evaluar mediante la siguiente ecuación: (x¡
* ¡ _ I ) / V Í - Í ) +

2(x,

+1

- x , _ , ) / U ) + (JCi+i _ —
6

x,)f"(x )
¡+l

6

-/(*,•)]+

\f(x¡-ú
Xj-\

- f{x¡)]

( 1 8

.

3 7 )

X¡ + \ — X¡

532

INTERPOLACIÓN

Cuadro 1 8 . 3

D E R I V A C I Ó N

D E S E G M E N T A R I A S

C Ú B I C A S

]a derivación (Cheney y Kincaid, 1985) se 1.1 primer paso er>^ biisii en la observa derivada dentro de cada intervalo es por una cúbica, la ¡ > diferenciar dos una linea recta. L*» . unda voces para verifica p t r con una interpolación polinomial derivada se puede í Qrden [véase e c u a d ó n (,g 22)]. de Lagrange de prv
jon d e c o m o c a d a p a r d e n o d o s s e c o t l e c t a e g u n d a e c u a c i ó n ( 1 8 3 5 ) s e p u e d e C o e s t a o b s e r v a c i ó n a n e s t a b a s 6 ; ) a seg r e s e n

f¡\x) = f!Xx¡^>X - ~Xi
i l

x — x¡+ fi(M)- X¡-1 Xi - x¡.
nter

contiene solo dos "coeficientes" desconocidos, las segundas derivadas al inicio y al final del intervalo —fXx¡_,) y/"(*,)—. De esta forma, si podemos determinar la segunda derivada adecuada en cada nodo, la ecuación (B 18.3.2) es un polinomial de tercer orden que se puede usar para interpolar dentro del intervalo. Las segundas derivadas se evalúan al llamar las condiciones de que las primeras derivadas en los nodos deben ser continuas: (B18.3.3)

(B18.3.1)

jot de la segunda derivada en cualquier punLa ecuación (B18.3.2) puede diferenciarse con el fin de dar una i v a l o . Así, esta ecuación es una línea rivada en el primer nodo/"(*,_i) expresión para la primera derivada. Si esto se hace tanto para el (/' — l)-ésimo, como para /-ésimo intervalo y los dos resultados recta que conecta 1 * ^ , , _ se igualan de acuerdo con la ecuación (B18.3.3), resulta la sicon la segunda d e f í ^ j) integrar dos veces guiente relación: Después, la e¿ ^ . para obtener una desconocidas de integración. Esas (x¡ - A - - I ) / " ( . Y ; - I ) + 2 ( J : / I - x¡-i)f"(x¡) Hión contendrá dos ió condicioconstantes se pued* ¡ ^ + (Xi + \ -Xi)f"(x¡ + \) nos de igualdad / i¡ evaluaciones, resulta la 6 ser igual &f(xt) en % [f(xl+l) - f(X¡)] Xi + \ — x¡ siguiente ecuación

úonde f¡"(x) es el V lo x dentro de i-ésV

g e g u n d a £ n e

de

s e g u n d o 1 8 3 r

n o d o

f

( x ¡ )

c i ó n (

B

s e p u e d e

e s ¡ o n

p

a

a

§ i n e m D a r g 0 ;

e s t a

e x p r e

n s t a n t e s

e v a l u a r a l l l a m a r a l a f u n c ) d e b e A s e r g u a l a f ( x ¡ t )

n d e

;

+

e n

y f ( x )

d e b e

1 r e a

z a r e s t a s

b i c a :

6

f!Xx¡
fi(X) =

f'M) (x¡ - xY + :(-v-.v,_]r 6(x¡ — Xi(x¡ - x) f'XxMxi-Xi-i)'
(X - A V - l )

+

IftXi-l) - f(Xi)] Xi X¡ — \

(B18.3.4)

(B 18.3.2) j esta relación es una expresión mucho más Ahora, es claro qu^ ^ ^ ^ ^ cúbica para el ¡-ésimo intervacompheada para ufl g , observe que lo que, digamos, la
u a c i o n ( 1 8 3 5 ) s i n e m b a r 0 0

Si la ecuación (B18.3.4) se escribe para todos los nodos interiores, n — 1 ecuaciones simultáneas resultan con n + 1 segundas derivadas desconocidas. Sin embargo, ya que ésta es una segmentaria cúbica natural, las segundas derivadas en los nodos extremo son cero y el problema se reduce a n — 1 ecuaciones con n — 1 incógnitas. Además, observe que el sistema de ecuaciones será tridiagonal. Así, no sólo redujimos el número de ecuaciones, sino que las forjamos en una forma que es en extremo fácil de resolver (recuerde la sección 11.1.1).

, ,

,

Si esta ecuación es descrita para todos los nodos interiores, resulta n — 1 ecuaciones simultáneas con n — 1 incógnitas. (Recuerde que las segundas derivadas en los nodos extremo son cero.) La aplicación de esas ecuaciones se ilustra en el siguiente ejemplo.
EJEMPl¿? 1 8 . 1 0 Segmentarias cúbicas

Enunciado del problema. Ajuste por segmentarias cúbicas los mismos datos que se usaron en los ejemplos 18.8 y 18.9 (véase tabla 18.1). Utilice los resultados para estimar el valor en x = 5.

Solución, lil primer paso es emplear la ecuación (18.37) para generar un conjunto de ecuaciones simultáneas que serán utilizadas para determinar las segundas deriviiduN en los nodos. Por ejemplo, para el primer nodo interior se usan los siguientes datos: = 3
X\ X2
f(x )
0

=

2.5 1 2.5

= 4.5 = 7
f(X2)
=

Estos valores pueden sustituirse en la ecuación (18.37) para dar (4.5 - 3)/"(3) + 2(7 - 3)/"(4.5) + (7 - 4.5)/"(7)

1 j
| | | i j

6 :(2.5- D + — -(2.5-1) 7-4.5 4.5-3

6

Debido a la condición de la segmentaria natural,/"(3) = 0, y la ecuación se reduce a 8/"(4.5) + 2.5/"(7) = 9.6 En una forma similar, la ecuación (18.37) se aplica al segundo punto interior para obtener 2.5/"(4.5) + 9/"(7) = - 9 . 6 Estas dos ecuaciones pueden resolverse simultáneamente para dar /"(4.5) = 1.67909 f " { l ) =-1.53308 Estos valores se sustituyen entonces en la ecuación (18.36), junto con los valores de las x y las/(x), para obtener 1.67909 , 2.5 Mx) = (x - 3 ) + (4.5 - x ) 6(4.5-3) 4.5 -3 ' 1 1.67909(4.5 - 3)
3 J

í
| j | | ¡ I |

_4.5-3 o / i ( x ) = 0.186566 (x - 3 )
3

6

(x - 3)

+ 1.666667(4.5 - x ) + 0.246894 (x - 3)

Esta ecuación es la segmentaria cúbica para el primer intervalo. Sustituciones similares se pueden hacer para desarrollar las ecuaciones para el segundo y tercer intervalo: / ( x ) = 0.111939(7 -xf
2

- 0 . 1 0 2 2 0 5 ( x - 4.5) - 0.299621(7 - x )
3

+ 1.638783 (x - 4 . 5 ) y /•,(*) = - 0 . 1 2 7 7 5 7 ( 9 - x )
3

+ 1.761027(9 - x) +().25(x - 7)

534

INTERPOLACIÓN

Se puede emplear las tres ecuaciones para calcular los valores dentro de cada intervalo. Por ejemplo, el valor enx = 5, el cual está dentro del segundo intervalo, se calcula como / ( 5 ) = 0.111939(7 - 5 ) - 0 . 1 0 2 2 0 5 ( 5 - 4.5) - 0.299621(7 - 5)
3 3 2

+ 1.638783(5 - 4.5) = 1.102886 Se calculan otros valores y los resultados se grafican en la figura 18.16c.

Los resultados délos ejemplos 18.8 a 18.10 se resumen en la figura 18.16. Observe la mejora progresiva del ajuste conforme nos movemos de lineales a cuadráticas y a segmentarias cúbicas. También hemos sobrepuesto un polinomio de interpolación cúbica sobre la figura 18.16c. Aunque la segmentaria cúbica consiste en una serie de curvas de tercer orden, la resultante difiere de la obtenida al usar el polinomio de tercer orden. Esto se debe al hecho de que la segmentaria natural no requiere de segundas derivadas en los nodos extremo, mientras que el polinomio cúbico no tiene tal restricción. 18.6.4 A l g o r i t m o de cómputo p a r a s e g m e n t a r i a s cúbicas

El método para calcular segmentarias cúbicas, descrito en la sección anterior, es ideal para la implementación en computadora. Recuerde que, con algunas manipulaciones inteligentes, el método se reduce a la resolución de n — 1 ecuaciones simultáneas. Un beneficio extra de la derivación implica, como lo especifica la ecuación (18.37), que el sistema de ecuaciones es tridiagonal. Como se describió en la sección 11.1, los algoritmos están disponibles para resolver tales sistemas en una manera en extremo eficiente. La figura 18.18 muestra una estructura computacional que incorpora esas características. Observe que la rutina en la figura 18.18 regresa sólo un valor interpolado, yu, para un valor dado de la variable dependiente, xu. Ésta es sólo una forma con la cual se puede implementar la interpolación segmentaria. Por ejemplo, a usted le gustaría determinar ahora los coeficientes y después realizar muchas interpolaciones. Además, la rutina da tanto la primera derivada (dy) como la segunda (dy ) en xu. Aunque no es necesario calcular esas cantidades, son útiles en muchas aplicaciones de la interpolación segmentaria.
2

PROBLEMAS 18.1 Estime el logaritmo de 5 de base 10 (log 5) mediante 18.4 Dados los datos Interpolación lineal. X 1 2 2.5 4 3 5 a) Interpole entre log 4 = 0.60206 y log 6 = 0.7781513. b) Interpole entre log4.5 = 0.6532125 y log 5.5 = 0.7403627. f|x) 1 5 7 8 2 1 Para cada una de las interpolaciones, calcule el porcentaje de error relativo con base en el error real. a) Calcule/(3.4) mediante polinomios de interpolación de IH.2 Ajuste con'un polinomio de interpolación de Newton de Newton de orden 1 a 3. Escoja la secuencia de puntos para su segundo orden para estimar log 5 por medio de los datos del estimación con el fin de obtener la mejor exactitud posible. problema 18.1. Calcule el error relativo porcentual real. b) Utilice la ecuación (18.18) para estimar el error para cada I N..1 Ajuste con un polinomio de interpolación de Newton de terpredicción. oor orden para estimar log 5 usando los datos del problema 18.1. I K.5 Dados los datos

PROBLEMA5
SUtíKOUTINH bpllne (x,y.n,xu,yu,dy,d2y) LOCAL e f q r d2x CALL Tridiag(x,y,n,e,f,g,r) CALL Decomp(e,f,g,n-1) CALL 5ubst(e,f,g,r,n-1,d2x) CALL lnterpo\(x,y,n,d2x,xu,yu,dy,d2y) END Spline
n¡ n¡ fíi n¡ n

0 9 9

SU&ROUTINE Tridiag (x, y, n, e, f, g, r) f = 2*(x -x )
1 z 0

5UPR0UTINE Interpol (x,y,n.d?,x.xu,yu,dy.dZy) fíag = O 1= 1 DO IFxu>x¡_^ANDxu<xJHEN el = d2x-, _ /&/(x¡ - x¡ _,) c2 = d2x/6/(x -x¡_ ) c5 = (y _ /(x, - X; _,) - d2x¡ _, * (x, - x¡ _ ,)/6 c4 = (y/(x¡ - x¡ _, ) - d2x¡ * (x¡ - x¡ _ ,)/6 t1 = d * (x,-xuf
i 1

t2 = c 2 * ( x u - X J _ , J
01 = F
X

2-

X

I)

r, = 6 / (x -x<¡) * (y -y ) r, = r,+6/(x-x ) * (y -y,; DO 1-2, n -2 e¡ = (x¡-x ) f = 2*(x -x ) 0¡ = ( ¡ i-x¡)
2 z : 0
0

H

i

M

H

x

+

n = (*i+i-xi)*(yM-y¡)
6/

yu=t1 + t2 + t3 + t4 t í = -3*c1 *(x¡-xuf t2 = 3*c2*(xu-x¡_ f 13 =-c3 t4 = c4 dy = t1 + t2 + t3 + t4 t í = 6* el* (x¡ - xu) t2 = 6*c2*(xu-x _ )
1 i 1

1A = c4*(xu-x¡_i)
t 3 = c3 * (x¡ - xu)

3

END DO

f -^2.*(x„-x^2)
n

r„_, = 6/(x„ - x _,) * (y -y _,)
n
n n

V , = r^+6l{x END Tridiag

nA

- x _ j * (y„_
n 2

2

-y _,)
n

d2y = t í + t 2 fíag = í EL5E i = i+ 1 END IF IFi = n + WK flag = 1 EXIT END DO IF flag = O THEN PRINT "outside range" pause END \F END Interpol

FIGURA 18.18 Algoritmo para interpolación segmentaria cúbica.

536

INTERPOLACIÓN 1 4.75 2 4 3 5.25 5 19.75 6 36 implementar interpolación de polinomios de Newton con base en la figura 18.7. 18.15 Pruebe el programa que desarrolló en el problema 18.14 para los mismos cálculos del ejemplo 18.5. 18.16 Use el programa que desarrolló en el problema 18.14 para resolver los problemas 18.1 hasta 18.3. 18.17 Use el programa que desarrolló en el problema 18.14 para resolver los problemas 18.4 y 18.5. En el problema 18.4, utilice todos los datos para desarrollar polinomios de primer orden al quinto. Para ambos problemas, grafique el error estimado contra el orden. 18.18 Desarrolle, depure y pruebe un subprograma en lenguajes de alto nivel o en un lenguaje macro de su elección para implementar interpolación de Lagrange. Con base en el pseudocódigo de la figura 18.11. Pruébelo con los mismos datos del ejemplo 18.7. 18.19 Una aplicación útil de la interpolación de Lagrange es llamada tabla de consulta. Como su nombre lo implica, ésta involucra "consultar" un valor intermedio de la tabla. Para desarrollar un algoritmo como tal, la tabla de x y los valores de f(x) se guardan primero en un par de arreglos unidimensionales. Esos valores se pasan entonces a una función junto con el valor de x que usted quiera evaluar. La función entonces ejecuta dos tareas. Primero, va por la tabla hasta que encuentra el intervalo dentro del cual está la incógnita. Después se aplica una técnica como la interpolación de Lagrange para determinar el valor adecuado def(x). Desarrolle tal función usando un polinomio de Lagrange cúbico para realizar la interpolación. Para valores intermedios es una excelente selección, ya que la incógnita estará ubicada en el intervalo medio de los cuatro puntos necesarios para generar la cúbica. Sea cuidadoso con los intervalos primero y último donde éste no es el caso. También tenga su código para detectar cuándo requiere el usuario un valor fuera del rango de las x. Para tales casos, la función debería mostrar un error de mensaje. Pruebe su programa para f(x) = ln x mediante datos desde x = 0, 1, 2 , . . . , 10. 18.20 Desarrolle, depure y pruebe un subprograma en un lenguaje de alto nivel o un lenguaje macro de su elección para implementar interpolación segmentaria cúbica con base en la figura 18.18. Pruebe el programa con los mismos datos del ejemplo 18.10. 18.21 Use el software que desarrolló en el problema 18.20 para ajustar segmentarias cúbicas a través de los datos en los problemas 18.4 y 18.5. Para ambos casos, prediga/(2.25).

X

/|x)

Calcule f(A) usando polinomios de interpolación de Newton de orden 1 a 4. Escoja sus puntos base para obtener una buena exactitud. ¿Qué le indican los resultados con respecto al orden que se usó de los polinomios para generar los datos en la tabla? 18.6 Repita los problemas 18.1 hasta 18.3 mediante polinomios de Lagrange. 18.7 Repita el problema 18.5 usando el polinomio de Lagrange de orden 1 a 3. 18.8 Emplee interpolación inversa usando interpolación de polinomios cúbica y bisección para determinar el valor de x que corresponda a f(x) = 0.3 para los siguientes datos tabulados,
X

1 . 2 1 0.5

3 0.3333

4 0.25

5 0.2

6 0.1667

7 0.1429

f(x)

18 .9 Emplee interpolación inversa para determinar el valor de x que corresponda a f(x) = 0.93 para los siguientes datos tabulados,
X

0 0

1 0.5

2 0.8

3 0.9

4 0.94117 6

5 0.961538

f(x)

Observe que los valores en la tabla fueron generados con la función/(x) = x l(\ + x ). a) Determine en forma analítica el valor correcto. b) Use interpolación cuadrática y la fórmula cuadrática para determinar numéricamente el valor. c) Use interpolación cúbica y bisección para determinar el valor de manera numérica. 18.10 Desarrolle segmentarias cuadráticas para los primeros 5 datos en el problema 18.4 y prediga/(3.4) y f(2.2). 18.11 Desarrolle segmentarias cúbicas para los datos en el problema 18.5, y a) prediga f(4) y7(2.5) y b) verifique que7^(3) y / ( 3 ) = 5.25. 18 .12 Determine los coeficientes de la parábola que pasa a través de los tres últimos puntos del problema 18.4. 18.13 Determine los coeficientes de la ecuación cúbica que pasa a través de los primeros cuatro puntos del problema 18.5. 18 .14 Desarrolle, depure y pruebe un programa de prueba en un lenguaje de alto nivel o un lenguaje macro de su elección para
2 2 3

CAPÍTULO 19 Aproximación de Fourier

Hasta aquí, nuestra representación de interpolación ha enfatizado los polinomios estándar (es decir, combinaciones de los monomios 1, x, x ,..., x™ (véase figura 19.1a). Ahora veremos otra clase de funciones que son de mucha importancia en la ingeniería. Éstas son las funciones trigonométricas 1, cosx, eos 2x,..., eos nx, sen x, sen 2x,..., sen nx (figura 19.16). Los ingenieros con frecuencia tratan con sistemas que oscilan o vibran. Como podría esperarse, las funciones trigonométricas juegan un papel importante en el modelado de tales problemas en contexto. La aproximación de Fourier representa un esquema sistemático al usar series trigonométricas para este propósito.
2

FIGURA 19.1 Los primeros cinco a) monomios y b) funciones trigonométricas. Observe que para los intervalos mostrados, ambos tipos de función tienen un valor de rango entre - 1 y 1. Sin embargo, note que los valores pico para los monomios ocurren todos en los extremos, mientras que para las funciones trigonométricas los picos están más uniformemente distribuidos a través del intervalo.

eos 2/

538

APROXIMACIÓN DE FOURIER

Una de las características de un análisis de Fourier es que trata con ambos dominios: el tiempo y la frecuencia. Como algunos ingenieros no se sienten muy cómodos con el último, se ha desarrollado una larga fracción del material subsecuente para una revisión general de la aproximación de Fourier. Un aspecto importante de esta revisión será familiarizarse con el dominio de la frecuencia. Esta orientación es después seguida por una introducción a los métodos numéricos para calcular transformadas de Fourier discretas.

19.1

AJUSTE PE CURVAS CON FUNCIONES SINUSOIDALES Una función periódica f(i) es una para la cual /(r) = f(t + T) (19.1)

FIGURA 19.2 Además de las funciones trigonométricas tales como senos y cosenos, las funciones periódicas incluyen formas de onda como lo son a] la onda cuadrada y b) la onda de dientes de sierra. Más allá de estas formas idealizadas, las señales periódicas en naturaleza pueden ser c) no ideales y d] contaminadas por ruido. Las funciones trigonométricas se pueden usar para representar y analizar todos estos casos.

a)

«

T

H

*
b)

*

7"

H

c)

i

19.1

AJUSTE D E CURVAS C O N F U N C I O N E S SINUSOIDALES

Stf

donde Tes una constante llamada periodo, que es el valor más pequeño para el cunl ON válida la ecuación (19.1). Ejemplos comunes incluyen formas en onda tales como cuadradas y dientes de sierra (véase figura 19.2). Las más fundamentales son las funciones sinusoidales. En el presente análisis se usará el término sinusoide para representar cualquier forma de onda que se pueda describir como un seno o coseno. No existe una convención muy clara para escoger alguna función, y en cualquier caso, los resultados serán idénticos. Para este capítulo se usará el coseno, el cual se puede expresar de manera general como
f(t) = A
0

+ Ci eos (&>oí + 0)

(19.2)

Así, cuatro parámetros sirven para caracterizar el sinusoide (véase figura 19.3). El valor medio A , ajusta la altura promedio por arriba de la abscisa. La amplitud Cj especifica la
0

FIGURA

19.3

o) Una gráfica de la función sinusoidal y(f) = AQ + Cj eos [COQÍ + 6). Para este caso, AQ = 1.7, C, = 1, OQ = 2K/T= 2JI/|1 .5 s), y 0 = jt /3 radianes = 1 .0472 (= 0.25 s). Otros parámetros usados para describir la curva son la frecuencia f = «13/(271), la cual para este caso es 1 ciclo/(l .5 s), y el periodo T= 1.5 s. b| Una expresión alterna para la misma curva es y[f¡ = AQ + A-¡ eos («r/) + 8] sen (ca^f). Los tres componentes de esta función son ¡lustrados en b), donde A, = 0.5 y 8] = - 0 . 8 6 6 . La sumatoria de las tres curvas en b) da la curva simple en a).

2TC

2

-

6, sen (ffibO
0

A, eos (cobí)

- 1

840

APROXIMACIÓN DE FOURIER

FIGURA 19.4

Ilustraciones gráficas de o) un ángulo de fase en retraso y b) un ángulo de fase adelantado. Observe que la curva en atraso en o) puede describirse de manera alterna como eos [COQÍ 3 TI /2|. En otras palabras, si una curva se atrasa por un ángulo de a, también se puede representar como adelanto por 2n - a.

+

altura de la oscilación. La 0 caracteriza los ciclos. Finalmente, el ángulo de fase, o corrimiento de fase 9, parametriza la extensión a la cual el sinusoide es corrido horizontalmente. Puede ser medido como la distancia en radianes de t = 0 al punto en el cual la función coseno comienza un nuevo ciclo. Como se ilustra en la figura 19.4a, un valor negativo es referido como un ángulo de fase de atraso, ya que la curva eos ( o y — 9) comienza un nuevo ciclo en 9 radianes después de eos Así, eos (fifoí — se dice que tiene un retraso eos (ot%r). En forma opu como se muestra en la figura 19.46, un valor positivo es referido como un ángulo de fase adelantado. Observe que la frecuencia angular (en radianes/tiempo) está relacionada con la frecuencia / (en ciclos/tiempo) por

frecuencia angular co 9)

(Cüfjt).
0

cü = 2xf

(19.3) (19.4)

y la frecuencia en turno está relacionada con el periodo T (en unidades de tiempo) por

Aunque la ecuación (19.2) es una caracterización matemática adecuada de un sinusoide, es difícil trabajar desde el punto de vista de la curva que habrá de ajustarse, ya

i

T i

I

A J U B I B PB

U tK V A BC O NU rN C O IN M f1 N U 8 0 D IA J 8
(19.5)

que el adelanto de la fase está incluido en el argumento de la función coseno. Esta deficiencia se puede resolver al involucrar la identidad trigonométrica Cj eos (cu f + 9) = Cj [eos (CÜ¡,Í) eos (9) - sen (ciy) sen (9)]
0

Sustituyendo la ecuación (19.5) en la (19.2) y mediante la agrupación de términos se obtiene (véase la figura 19.36) f(t) = A + A eos (ct^í) + B sen ( a y )
0 x x

(19.6)

donde A = Cj eos (9)
x

B = - C , sen (9)
x

(19.7)

Dividiendo las dos partes de la ecuación (19.7) se obtiene 9 =arctan^--^ (19.8)

donde, si A < 0, agregue 7ra 9. Si se eleva al cuadrado y se suma la ecuación (19.7) se tiene
x

= JÁ\ + B representa una formulación alterna de la ecuación (19.2) (19.9) Así, la ecuación (19.6) que todavía requiere cuatro parámetros, pero que se encuentra en el formato de un modelo lineal general [recuerde la ecuación (17.23)]. Como se analizará en la^próxima sección, se puede simplemente aplicar como la base para un ajuste por mínimos cuadrados. Sin embargo, antes de proceder con la próxima sección, se debería resaltar que se podría haber empleado un seno más que un coseno como nuestro modelo fundamental de la ecuación (19.2). Por ejemplo,
2 C [

= A + C, sen (ü) ? + 5)
0 0

podría haberse usado. Se puede aplicar relaciones simples para convertir entre las dos formas sen (co f + 8) = eos I co^t + 8 ——
0

/

n

eos (co í + 9) = sen \^co t + 9 + -j- j
0 0

(19.10)

En otras palabras, 9=8— n/2. La única consideración importante es que uno u otros formatos deberían usarse en forma consistente. Así, usaremos la versión coseno en todo nuestro análisis. 1 9 . 1 . 1 A j u s t e p o r m í n i m o s cuadrados de u n s i n u s o i d e La ecuación (19.6) puede ser pensada como un modelo lineal de mínimos cuadrados

542

APROXIMACIÓN DE FOURIER

y=A

0

+ A eos (co t) 4- B sen (co t) + e
x 0 x Q

(19.11)

la cual es justamente otro ejemplo del modelo general [recuerde la ecuación (17.23)]
y —az
Q 0

+ a,Z| + az
2

2

H

ra„,z

m

+ e

(17.23)

donde z = 1, z = eos (co f), z = sen ( G ) Í ) y todas las otras z = 0. Así, nuestra meta es determinar los valores del coeficiente que minimicen
0 l 0 2
0

N
Las ecuaciones normales para cumplir esta minimización se pueden expresar en forma S = 2 {yi -[Aq + Aí eos (co í,.) + B sen (c<y,)]} de matriz como [recuerde la ecuación (17.25)]
2 r 0 x

N eos (co t) X sen ( G ^ Í )
X
0

X eos (co f) eos (a> t) X eos (o) f) sen (cu r)
0
2

X

0

X

0

0

X sen (ci^r) eos ( É O Í ) sen (<w r) X sen (co t)
0

0

A

x

2

0

A )
(19.12)

X

Y

X

Y

eos (a^t) sen (c^r)

Estas ecuaciones se pueden emplear para resolver los coeficientes desconocidos. Sin embargo, en lugar de hacer esto, se examina el caso especial donde hay N observaciones espaciadas de manera uniforme en intervalos de Ai y con una longitud registrada total de T = (N — 1) Ai. Para esta situación, los siguientes valores promedio pueden determinarse (véase el problema 19.3): X sen (tt^í)

X sen (ofof)
2

N N
0

= 0

X EOS N (CÚqÍ)
0
X E O S

_

J

_

~ 2

N
2

(FTFOF)

(19.13)

X eos (úfyí) sen (co^f)

N

0

Así, para los puntos igualmente espaciados, las ecuaciones normales son

NN/2
0 0 0
\A )
Q

0 0

¿0
A

ly X Y eos (co^t)

La inversa de una matriz diagonal es sólo otra matriz diagonal, cuyos elementos son los dos recíprocos del original. Así, los coeficientes se pueden determinar como
[l/NO
I 0 2/N

N/2

O
0

l
I

í
]

{A^**

SJ/COÍCFIV)

ly ]

\

19,1

AJUSTE DE CURVAS C O N FUNCIONES

SINUSOIDALES

543

4> = -^7N ¿, =—Xycos(flW) N B = — ly sen (co t) N
x 0

(19.14) (19.15) (19.16)

EJEMPLO 19.1 [

Ajuste por mínimos cuadrados d e un sinusoide Enunciado del problema. La curva en la figura 19.3 se describe por y — 1.7 + eos (4.189í + 1.0472). Genere 10 valores discretos para esta curva en intervalos de Ai = 0.15 para el rango de t = 0 a 1.35. Use esta información para evaluar los coeficientes de la ecuación (19.11) por ajuste de mínimos cuadrados. Los datos requeridos para evaluar los coeficientes con (ü = 4.189 son

j

1 Solución.

0 0.15 0.30 0.45 0.60 0.75 0.90 1.05 1.20 1.35

t

2.200 1.595 1.031 0.722 0.786 1.200 1.805 2.369 2.678 2.614

y

y eos (io f)
0

y sen (io f)
0

2.200 1.291 0.319 -0.223 -0.636 -1.200 -1.460 -0.732 0.829 2.114 2.502

0.000 0.938 0.980 0.687 0.462 0.000 -1.061 -2.253 -2.547 -1.536 -4.330

Estos resultados se pueden usar para determinar [véase ecuaciones (19.14) a (19.16)] A 17.000 = — ^ — = 1.7 2 A, = ^ 2 . 5 0 2 = 0.500 2 B = —(-4.330) = -0.866
x

1=

17.000

0

De esta manera, el ajuste por mínimos cuadrados es y= 1.7 + 0.500 eos (co t) - 0.866 sen (c%t)
0

El modelo se puede expresar también en el formato de la ecuación (19.2) al calcular [véase ecuación (19.8)] 9 = arctan / V -0.866\ — — — - = 1.0472 0.500 /

y [véase ecuación (19.9)] Cj = para dar

s/(0.5) +
2

( - 0 . 8 6 6 ) = 1.00
2

544

APROXIMACIÓN DE FOURIER

y = 1.7 + eos (coot + 1.0472) o alternativamente como un seno usando la [ecuación (19.10)] y = 1.7 + sen (ü) r + 2.618)
0

El análisis anterior se puede extender al modelo general

f(t) — A + A eos (fi) f) + B sen (a> t) + A eos (2co í) + B sen (2(O f) H h A eos (mcüQt) + B sen (mco t)
0 x 0 x

Q

2

0

2

0

m

m

0

donde, para datos igualmente espaciados, los coeficientes pueden ser evaluados por A = ly N

0

A¡ =
N 2

ly eos (Jo) t)
0

j = 1,2, ...,/n
0

Bj = — ly sen (Jco t)
Aunque estas relaciones se pueden usar para ajustar datos en el sentido de regresión (esto es, N > 2m + 1), una explicación alternativa es emplearlos para interpolación o colocación (es decir, usarlos para el caso donde el número de incógnitas, 2m + 1, sea igual al número de datos, N. Éste es el procedimiento usado en la serie de Fourier continua, como se describirá a continuación. 19.2 SERIE DE F O U R I E R C O N T I N U A En el curso del estudio de problemas de flujo de calor, Fourier demostró que una función periódica arbitraria, se puede representar por medio de una serie infinita de sinusoides de frecuencias relacionadas de manera armónica. Para una función con un periodo T, una serie de Fourier continua se puede escribir
1

f(t) — a + a eos (fty) + b sen (to í) + a eos ( 2 a y ) + b sen (2tt^í) + ...
0 x x 0 2 2

o de manera más concisa,

f(t)=

a +
0

2

[a eos (katf) + b sen (ko^t)]
k k

(19.17)

donde COQ = 2rt/res llamada la frecuencia fundamental y sus múltiplos constantes 2(0$, 3cüb, etcétera, son llamados armónicos. De esta forma, la ecuación (19.17) expresaf(t) como una combinación lineal de las funciones base: 1, cos(a\,f), sen (u^í), (2&V)' sen (2fi) r),...
c o s 0

La existencia d e las series d e Fourier eslá releridn en Ins condiciono» d e Dirichlol, Ins cunlos ospeci llcim que la función periódica licnc un número finito d e máximos y mínimos y quo liuy un número finito d o «nilón dlicontlnuoi. En general, lodií lai funeionei perlódloii derlvidw fliioamtntc utUtiotn ntii oondlolonei.

19.2

SERIE DE FOURIER CONTINUA

0 4 1

Como se describe en el cuadro 19.1, los coeficientes de la ecuación (19.17) se pueden calcular por medio de 2_ <f f(t) eos (kco t) dt T Jo
T 0

(19.18)

y b = — í f(t) sen (kco t) dt T Jo
k 0

(19.19)

para k = 1, 2 , . . . y a =
0

— f f(t)dt
T

T Jo

(19.20)

Cuadro 19.1

D e t e r m i n a c i ó n de los coeficientes de la serie d e F o u r i e r continua la cual se puede resolver para ,.j ,
JO
f ^
d t

('orno se hizo para los datos discretos de la sección 19.1. 1 , se puede establecer las siguientes relaciones:

< 3 F J =

j
e s s i m p l e m e n t e e l v a l o r p r o m e

/

sen (kco t) dt = £
0

eos (km t) dt = 0
0

(B19.1.1)

M

U

^

d i o de la función en ol

rr / eos (ko) t) sen (gco t) dt = 0
0 0

periodo. Para evaluar uno de los coeficientes coseno, por ejemplo (B19.1.2) ^ \ ecuación (19.17) se puede multiplicar por eos (mco t) e
a a 0

integrar para obtener f sen (kco t) sen (g(O t) dt = 0 J ' ^ '
v 0 0 Q 0 tt

(B19.1.3)

C, . f f(t) eos (mft) í) dt = / a eos (mco t) dt Jo Jo
T T X J 0 0 0

J

eos ( * a y ) eos ( g o y ) A = 0

(B19.1.4)

+ /

X

Ú

* °
C

S

^

C

°

S (

W

Í

Ü

B

0

*

r

r
2 0

f
T 0

T
T
2 ü

*

= 1

/ sen (kü) t) dt = / eos (kco t) dt = (B19.I.5) l'ni'ii •AI evaluar sus coeficientes, cada lado de la ecuación (19.17) 2 se puede integrar para dar ^ f /(/) di = f a dt + f V [ a eos (/fcay) Jo Jo Jo ¿—i k= I + b sen {kwfjt)) dt
t k

D

lo + Y k= ^ I ¿> sen (k(o t) eos ( m a y ) ¿ft (B19. 1.6) ecuaciones (B19.1.1), (B19.1.2) y (B19.1.4), se observa que cada término del lado derecho es cero, con excepción del caso donde k = m. Este último caso se puede evaluar con la ecuación (B19.1.5) y, por tanto, la ecuación (B19. 1.6) se puede resolver para a , o de manera más general [véase ecuación
t 0 e l a s m

( - )]>
19 18

( orno cuela término en la sumatoria es de la forma de la ecuaI'II'M (BI9.1.1), las ecuaciones son /

2 r a* = — / /(?) eos (keüot) dt
T 0

para k = 1 , 2, 3 , . . . En forma similar, la ecuación (19.17) se puede multiplicar por sen (rna^t), integrarla y reordenarla para obtener la ecuación
(19.19).

/

/ (/) di

«„ T

546
EJEMPLO 19.2

APROXIMACIÓN DE FOURIER Aproximación de la serie de Fourier continua

! | 1 !
|

Enunciado del problema. Use la serie de Fourier continua para aproximar la función de onda cuadrada o rectangular (véase la figura 19.5) F-1 / ( 0 = L 1 L -1 -T/2<t<-T/4 -T/4<t< T/4 T/4 < t < T/2

\ Solución. Como la altura promedio de la onda es cero, se puede obtener en forma directa un valor de a — 0. Los coeficientes restantes se pueden evaluar como [véase | ecuación (19.18)]
0

I a
k

Las integrales se evalúan para dar De manera similar, se puede determinar que todas las b = 0. Por tanto, la aproximación de la serie de Fourier es
4 4

C' r-T/4 rT/4 fT/2 i J-T/2 = — — / EOS (k(OQt) dt + I EOS T J-T/2 J-T/A JT/4
1 2
2
= — / ( O EOS ( f c í D n í ) dt

2

["

4/(kK) -4/()br) 0 L

para A: = 1, 5, 9,... para A: = 3 , 7, 11,... para k = pares enteros

/(/) =

— EOS (A>O0

EOS

(3a) t) + —
0
5TX

4

4

EOS ( 5 « O O — —

EOS

(la> t) +
0

n
FIGURA 19.5

ÍJÍ

IJÍ

Los resultados de los primeros tres términos se muestran en la figura 19.6.

Uno forma de onda cuadrada o rectangular con una altura de 2 y un periodo T =

271/(0^.

1
-R

i
-772 0

I
R/2

i
R

fc

-1

•41
1 9 . 2 SERIE DE FOURIER CONTINUA'

\

\ 1
1

— COS(íflbí)

n

nación

\ 0 y ¿Y nn Ün
k
1
b)

x A V y
y
1

^-COS(OJbf)

U U
c)

/i

\

/ V

/ Y

/

\

A

A

/

FIGURA 19.6 La aproximación de la serie de Fourier de la onda cuadrada a partir de la figura 19.5. La serie de trazos muestra la sumatoria hasta e incluyendo los términos a) primero, b) segundo y c¡ tercero. Se muestran también los términos individuales que se fueron agregando en cada etapa.

Debe mencionarse que a la onda cuadrada en la figura 19.5 se le llama función par, ya quef(t) = /(—r). Otro ejemplo de una función par es eos (í). Se puede demostra i (Van Valkenburg, 1974) que las b en la serie de Fourier siempre son igual a cero par» funciones pares. Observe también que lasfunciones impares son aquellas para las C U U I C H f(t) = —f(—t). La función sen (í) es una función impar. Para este caso las a serán igual a cero.

I

APROXIMACIÓN DE FOURIER

Además del formato trigonométrico de la ecuación (19.17), la serie de Fourier se puede expresar en términos de funciones exponenciales como (véase el cuadro 19.2 y el apéndice A)
oo

f(t) =

ce
k

ikml

(19.21)

donde i = H—1 y
1 i h = 7f /

r r'

TT/2 2

í

J -7 -T/2 72

f(t)e-

kuW

dt

(19.22)

Esta formulación alterna tendrá utilidad a través del resto del capítulo.

19.3

FRECUENCIA Y D O M I N I O S DE T I E M P O Hasta este punto, nuestro análisis de la aproximación de Fourier se ha limitado al dominio del tiempo. Esto se debe a que la mayoría de nosotros nos sentimos cómodos al conceptualizar el comportamiento de una función en esta dimensión. Aunque no sea tan conocido, el dominio de la frecuencia proporciona una perspectiva alterna para caracterizar el comportamiento de funciones oscilatorias. Así, justo como la amplitud contra tiempo se puede graficar, de igual manera también se puede hacer contra la frecuencia. Ambos tipos de expresión se ilustran en la figura 19.7a, donde se ha dibujado una gráfica en tres dimensiones de una función sinusoidal,
f(t) = Cj eos (/ +

| )

En esta gráfica, la magnitud de la amplitud de la curva,/(r), es la variable dependiente, y las variables independientes son el tiempo t y la frecuencia/ = WQIITÍ. Así, los ejes de la amplitud y el tiempo forman un plano tiempo, y los ejes amplitud y frecuencia forman un plano frecuencia. Por lo tanto, el sinusoide se puede concebir como si existiera a una distancia 1/7hacia afuera y a lo largo del eje de la frecuencia y corriendo paralelo a los ejes del tiempo. En consecuencia, cuando se habla acerca del comportamiento del sinusoide en el dominio del tiempo, queremos decir la proyección de la curva dentro del plano tiempo (véase la figura 19.1b). De manera similar, el comportamiento en el dominio de la frecuencia es meramente su proyección dentro del plano frecuencia. Como se observa en la figura 19.7c, esta proyección es una medida de la amplitud positiva máxima del sinusoide Cj. La vuelta completa de pico a pico es innecesaria a causa de la simetría. Junto con la ubicación \IT a lo largo del eje frecuencia, la figura 19.7c define ahora la amplitud y frecuencia del sinusoide. Ésta es una información suficiente para reproducir la forma y tamaño de la curva en el dominio del tiempo. Sin embargo, un parámetro más, llamado ángulo de fase, es requerido para ubicar la curva relativa a t = 0. En consecuencia, se debe incluir un diagrama de fase, como el mostrado en la figura 19.7í/. El ángulo de fase se determina como la distancia (en radianes) de cero al punió en el cuul ocurre el pico positivo. Si el pico ocurre después de cero, se dice que

19,3

FRECUENCIA Y DOMINIOS D I TIEMPO

Cuadro 19.2

F o r m a compleja de las series de F o u r i e r

I ,a forma trigonométrica de la serie de Fourier continua es
oo

o
oo oo

f(t) = a + V [a cos(kco t) + b sen(kú) t)]
0 k 0 k 0

(B19.2.1)

/(O =

J^cte'^

+ ]T

c-^"'*"*'

A partir de a i a . J a de a Euler, tj i el i seno y coseno se pueden J A la identidad o ., expresar en torma exponencial como senx =
e

*= 1

Para simplificar aún más, \en lugar de sumar la segunda serie de , , , 1 a » , haga la suma de — 1 a — °°, /(?)
= ^c^''^ ' +
0

"

6

2'

"

(B19.2.2)

]T

c-¡te''*

4=0

k=-\

^ (B19.2.3) 2 = se aopueden + ^ (sustituir >°> 4 . -ika>n¡ (B19.2.1) para dar las cuales en la ecuación ¡t=j V 2 2 / (B 19.2.4)
ika ak
ak

cosx=

a

,

-a

/(,) = £ ¿V**'
1

(B19

..
2

6)

e

c

donde la sumatoria incluye un término para k = 0. Para evaluar lascólas ecuaciones (19.18) y (19.19) son sustituidasenla ecuación (B19.2.5) para obtener 1 \ = — /
/

y a que 1 li = - /'. Podemos definir un número de constantes c —
0

f

m

^-772

1 /(O eos (to í) dt — i— I T
0

J-m

f f(t) sen (¿oy) cíf
m

a o

•.

Mediante las ecuaciones (B 19.2.2) y (B 19.2.3) y simplificando se obtiene

- aj-it-t
<'-•* =

<-'k —

a -ib
k

k

a

k

+

l

b

k

^ = ffZ ~' °'
me ka
=

dt

(B19 2 ?)

--

^

2

(B19.2.5)

1

donde, debido a las propiedades de pandad del coseno y del seno, «A = a-t yh= -b-t reexpresarsecomo k=\ La ecuación .IV) = co + J2^e "" + Y(B19.2.4) ~c- e-puede, ° por tanto,
ika ika l j k

a p é n d i c e

Por tanto, las ecuaciones (B19.2.6) y (B19.2.7) son las versiones complejas de las ecuaciones (19.17) a (19.20). Observe que el .
A i n d u y e u n r e s u m e n d e l a g i n t e r r e l a c i o n e s e n t r e t 0 ] o s f o r m a t o s d e l a s e r i e d e F o u r i e r q u e s e intr

d o s

odujeron en

este capítulo.

está retrasado (recuerde nuestro análisis de atrasos y adelantos en la sección 19.1), y por convención, el ángulo de fase tiene un signo negativo. En forma opuesta, un pico antes de cero se dice que está adelantado y el ángulo de fase es positivo. Así, de la figura 19.7, el pico está en cero y el ángulo de fase se traza como +7t/2. En la figura 19.8 se ilustra algunas otras posibilidades. Se puede observar ahora que las figuras 19.7c y 19.7a* proporcionan una forma alterna de presentar o resumir las características pertinentes del sinusoide de la figura 19.7a. Se hace referencia a ellas como línea espectral. Se acepta que para una sola sinusoide estas líneas no son muy interesantes. Sin embargo, cuando se aplican a una situación más complicada, digamos, una serie de Fourier, se hace présenle su poder y

550

APROXIMACIÓN DE FOURIER

FIGURA

19.7

o) Una ilustración de cómo se puede dibujar un sinusoide en los dominios del tiempo y la frecuencia. Se reproduce la proyección del tiempo en b¡, mientras que la proyección de la amplitud-frecuencia se reproduce en c). La proyección fase-frecuencia se muestra en a ).
1

valor verdadero. Por ejemplo, la figura 19.9 muestra la línea de fase espectral y amplitud para una función de onda cuadrada como la del ejemplo 19.2. Tal espectro proporciona información que no podría ser aparente desde el dominio del tiempo. Esto se puede ver al contrastar las figuras 19.6 y 19.9. La figura 19.6 representa dos perspectivas alternas tiempo-dominio. La primera, la onda cuadrada original, no nos indica nada acerca de las sinusoides comprendidas. La alternativa es mostrar esas sinusoides [es decir, (4/rc) eos (6%f), — (4 /3n) eos (3íu r), (4/57t) eos (5G) r)], etcétera. Esta alternativa no proporciona una visualización adecuada de la estructura de esas armónicas. En contraste, las figuras 19.9a y 19.96 proporcionan una visualización gráfica de esta estructura. Como tal, la línea espectral representa "huellas dactilares" que nos pueden ayudar a caracterizar y entender la forma complicada de una ondú. Lillas son en particular valiosas para casos no idealizados donde algunas veoes nos permiten discernir
0 0

1 9 . 3

FRECUENCIA Y DOMINIOS DE TIEMPO

«r
n

->;|

— i

7 C

tr ~
FIGURA 19.8 Varias fases de un sinusoide mostrando la fase asociada a la línea espectral.

FIGURA

19.9

a) Amplitud y b) línea de fase espectral para la onda cuadrada de la figura 19.5.

4/it
2/JI

3<,

54 a)

J _
7f
0

n/2

í,

3f

0

5/

0

7/

0

J t / 2

6)

552

APROXIMACIÓN DE FOURIER

la estructura en otra forma como señales oscuras. En la siguiente sección se describirá la transformada de Fourier que nos permitirá extender tal análisis para ondas de forma no periódica.

19.4

I N T E G R A L Y T R A N S F O R M A D A DE F O U R I E R Aunque la serie de Fourier es una herramienta útil para investigar el espectro de una función periódica, existen muchas formas de onda que no se autorrepiten de manera regular. Por ejemplo, un relámpago ocurre sólo una vez (o al menos pasará mucho tiempo para que ocurra de nuevo), pero causará interferencia con los receptores en operación en un amplio rango de frecuencias (por ejemplo en televisores, radios, receptores de onda corta, etcétera). Tal evidencia sugiere que una señal no recurrente tal como la producida por el relámpago exhibe un espectro de frecuencia continuo. Ya que fenómenos como éstos son de gran interés para los ingenieros, una alternativa para la serie de Fourier sería valiosa al analizar dichas formas de onda no periódicas. La integral de Fourier es la principal herramienta disponible para este propósito. Se puede obtener de la forma exponencial de la serie de Fourier
oo

f(t) = donde 1

J2
¿= — 00

C

V

T

O

0

'

(19.23)

f

T/2

Ck = ~ / f(t)e- °< dt (19.24) donde % = 2rc/Ty k = 0 , 1 , 2 , . . . La transición de una función de periódica a no periódica se puede efectuar al permitir que el periodo 1 J-T/2tienda al infinito. En otras palabras, como T se vuelve infinito, la función misma nunca se repite y de esta forma se vuelve no periódica. Si se permite que ocurra esto, se puede demostrar (por ejemplo, Van Valkenburg, 1974; Hayt y Kemmerly, 1986) que la serie de Fourier se reduce a
kü>

/(0 = —
¿X

1

J-oo

/

f°°

F(ia>o)e' < d(ü
ao

0

(19.25)

y los coeficientes se vuelven una función continua de la variable frecuencia co, como en
oo

/
-co

f(t)e- °'
iüJ

dt

(19.26)

La función F(ico^, definida por la ecuación (19.26), es llamada la integral de Fourier de f(i). Además las ecuaciones (19.25) y (19.26) son conocidas por lo general como transformada de Fourier. Entonces, sólo con ser llamada la integral de Fourier, F(ico ) es también llamada la transformada de Fourier de f(t). En el mismo sentido,/(/), como se definió con la ecuación (19 .25), es referida como la inversa de la transformada de Fourier
0

19,4

INTEGRAL Y TRANSFORMADA D E F O U R I E R '

FIGURA

19.10

Ilustración de cómo la frecuencia discreta espectral de una serie de Fourier para un tren de pulsos o) se aproxima a un espectro de frecuencia continua de una integral de Fourier c) cómo se permite al período aproximarse al infinito.

de F(ico ). Así, el par nos permite transformar de una a otra entre los dominios del tiempo y la frecuencia para una señal no periódica. La distinción entre serie y transformada de Fourier debería ser ahora muy clara. La principal diferencia es que cada una se aplica a un tipo diferente de funciones (las series a formas de onda periódicas y la transformada a las no periódicas). Además de esta principal diferencia, los dos procedimientos discrepan en cómo se mueven en el dominio del tiempo y de la frecuencia. La serie de Fourier convierte una función continua, de periódica en el dominio del tiempo a magnitudes en el dominio de la frecuencia con frecuencias discretas. En contraste, la transformada de Fourier convierte una función continua en el dominio del tiempo en una función continua en el dominio de la frecuencia. De esta manera, el espectro de frecuencia discreto generado por la serie de Fourier es análoga a un espectro de frecuencia continua generado por la transformada de Fourier.
0

El cambio de un espectro continuo en uno discreto se puede ilustrar gráficamente. En la figura 19.10a, se puede ver un tren de pulsos de ondas rectangulares con anchos de pulsos igual a la mitad del periodo de su espectro asociado discreto. Esta función es igual a la que se investigó antes en el ejemplo 19.2, sólo que en este caso está verticalmentc corrida.

554

APROXIMACIÓN DE FOURIER

En la figura 19.106, una duplicación del periodo de pulso del tren tiene dos efectos sobre el espectro. Primero, dos líneas de frecuencia adicional se agregan sobre un lado de las componentes originales. Segunda, las amplitudes de las componentes se reducen. En tanto se permita al periodo aproximarse al infinito, estos efectos continúan en forma de cada vez más líneas espectrales comprimidas hasta que el espacio entre las líneas tienda a cero. En el límite, las series convergen sobre la integral de Fourier continua, como se ilustra en la figura 19.10c. Ahora que se ha introducido una forma para analizar una señal periódica, se hará el paso final en nuestro desarrollo. En la siguiente sección reconoceremos el hecho de que una señal es raramente caracterizada como una función continua de la clase necesaria para implementar la ecuación (19.26). En lugar de esto, los datos están invariablemente en una forma discreta. Así, ahora se mostrará cómo calcular la transformada de Fourier para tales mediciones discretas.

19.5

T R A N S F O R M A D A DISCRETA DE F O U R I E R (TDF) En ingeniería, las funciones a menudo son representadas por conjuntos de valores discretos finitos. En forma adicional, los datos con frecuencia se colectan o convierten en un formato discreto. Como se ilustra en la figura 19.11, se puede dividir un intervalo de 0 a t en N subintervalos igualmente espaciados con anchos de Ar = TIN. El subíndice n se emplea para designar los tiempos discretos para los cuales se toma las muestras. Así, f designa un valor de la función continua f(t) tomada en t . Observe que los datos se especifican en n = 0, 1, 2, . . ., N — 1. Un valor no se incluye en n = N. (Véase Ramírez, 1985, para el racional de exclusión f .)
n n N

FIGURA

19.11

Los puntos de muestreo de la serie discreta de Fourier.

] 9.5

TRANSFORMADA DISCRETA DE FOURIER (TDF)

MI

Para el sistema en la figura 19.11, se puede escribir una transformada discreta de Fourier como
AT-I

F

k = 2

Para k = 0 a N - 1

(19.27)

y la transformada inversa de Fourier como
/ „ = — 2 *=O I V R ' ° V

N
0

para « = 0 a T V- 1

(19.28)

donde co = 2n/N Las ecuaciones (19.27) y (19.28) representan las análogas discretas de las ecuaciones (19.26) y (19.25), respectivamente. Como tales, se pueden emplear para calcular tanto la transformada directa de Fourier como la inversa para datos discretos. Aunque tales cálculos se pueden realizar a mano, es una tarea muy laboriosa. Como lo expresa la ecuación (19.27), el TDF requiere N operaciones complejas. Así, desarrollaremos un algoritmo de cómputo para implementar la TDF.
2

Algoritmo d e cómputo p a r a la TDF. Observe que el factor l/7Ven la ecuación (19.28) es sólo un factor de escala que se puede incluir, ya sea en la ecuación (19.27) o en la (19.28), pero no en ambas. Para nuestro algoritmo de cómputo, lo incluiremos en la ecuación (19.27) para que el primer coeficiente F (el cual es análogo del coeficiente continuo a ) sea igual a la media aritmética de las muestras. También, podemos usar la identidad de Euler para desarrollar un algoritmo que se pueda implementar en lenguajes que no contengan datos de variables complejas,
0 0

e

±m

= eos a ± i sen a

para expresar las ecuaciones (19.27) y (19.28) como
1
k
N

F = — 2 L T „ eos (küJ n) - if sen (ko^t)] N n =O
0 n

(19.29)

y
N-l

f„ = 2
I=0

[Fk

c

o

s

( o)
k(0 n

+ k
iF

s

e

n

<M)")1

(19.30)

El pseudocódigo para implementar la ecuación (19.29) se enlista en la figura 19.12. Este algoritmo se puede desarrollar en un programa de cómputo para calcular la TDF. El listado de resultados de tal programa se muestra en la figura 19.13 para el análisis de una función coseno.

FIGURA 19.12

DOk =

0,N-1

l'.'iuudocódigo para el

t úlculo de la TDF.

DO n = O, N -1 angle = ko) n realf, = rea\ + f cos(angle)/N ¡maginary = ¡mag¡nary - f s¡r¡(angle)/N END DO END DO
0 k n k k
n

556

APROXIMACIÓN DE FOURIER INDEX 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
FIGURA 19.13

f(t) 1 . 000 0 . 707 -0 000 -0 707 -1 000 -0 707 -0 000 0 707 1 000 0 707 -0 000 -0 707 -1 000 -0 707 0 000 0 707 1 000 0 707 -0 000 -0 707 -1 000 -0 707 0 000 0 707 1 000 0 707 -0 .000 -0 707 -1 000 -0 .707 0 .000 0 .707

REAL 0 0000 0 0000 0 0000 0 0000 0 5000 0 0000 0 0000 0 0000 -0 0000 0 0000 -0 0000 0 0000 -0 0000 0 0000 0 0000 0 0000 -0 0000 0 0000 -0 0000 -0 0000 -0 0000 0 0000 0 0000 -0 0000 -0 0000 -0 0000 -0 0000 -0 0000 0 5000 0 0000 0 0000 0 .0000

IMAGINARY 0 0000 0 0000 -0 0000 -0 0000 0 0000 -0 0000 0 0000 0 0000 0 0000 0 0000 -0 0000 0 0000 0 0000 -0 0000 0 0000 -0 0000 0 0000 0 0000 0 0000 -0 0000 0 0000 0 0000 0 0000 -0 0000 0 0000 0 0000 0 0000 -0 0000 -0 0000 -0 0000 0 0000 0 0000

Resultados de salida de un programa basado en el algoritmo de la figura 19.12 para la TDF de los datos generados por una función coseno f(f) = eos [2 K (1 2.5)f] en 32 puntos con Al = 0.01 s.

19.6

T R A N S F O R M A D A R Á P I D A DE F O U R I E R Aunque el algoritmo descrito en la sección anterior calcula de manera adecuada la TDF, es laborioso su trabajo de cómputo debido a que se requiere N operaciones. En consecuencia, para los datos de las muestras de un tamaño moderado, la determinación directa de la TDF puede ser en extremo consumidora de tiempo. La transformada rápida de Fourier, o TRF, es un algoritmo que ha sido desarrollado para calcular la TDF en una forma extremadamente económica. Su velocidad surge por el hecho de utilizar los resultados de los cálculos previos para reducir el número de operaciones. En particular, explota la periodicidad y simetría de funciones trigonométricas
2

19,6

TRANSFORMADA RÁPIDA DE POURIER

i

2 000

Muestras

FIGURA

19.14

Gráfica del número de operaciones contra tamaño de la muestra de TDF estándar y la TRF.

para calcular la transformada en aproximadamente 7Y log N operaciones (véase figura 19.14). Así, para N = 50 muestras, la TRF es alrededor de 10 veces más rápida que la TDF estándar. Para N = 1 000, es alrededor de 100 veces más rápida. El primer algoritmo TRF fue desarrollado por Gauss en los inicios del siglo XIX (Heideman y cois., 1984). Otras contribuciones principales fueron hechas por Runge, Danielson, Lanczos y otros en los comienzos del siglo XX. Sin embargo, como a menudo las transformadas discretas toman días o semanas para ser calculadas a mano, no atraían mucho el interés antes del desarrollo de la moderna computadora digital. En 1965, J. W. Cooley y J. W. Tukey, publicaron un artículo clave, en el cual delineaban un algoritmo para el cálculo de la TRF. Este esquema, similar a aquel de Gauss y de otros investigadores anteriores, es llamado algoritmo de Cooley-Tukey. En la actualidad, existen otros procedimientos que son adaptaciones de este método. La idea básica detrás de cada uno de estos algoritmos es que una TDF de longitud N se descompone, o "particiona" sucesivamente en TDF más pequeñas. Hay una variedad de formas diferentes de implementar este principio. Por ejemplo, el algoritmo de CooleyTukey es un elemento de las llamadas técnicas de decimación en el tiempo. En esta sección se describirá un procedimiento alterno llamado algoritmo Sande-Tukey. Este método es un elemento de otra clase de algoritmos llamado técnicas de decimación en la frecuencia. La distinción entre las dos clases se analizará después de haber elaborado el método.
2

558

APROXIMACIÓN DE FOURIER

19.6.1

A l g o r i t m o Sande-Tukey

En el caso actual, se supondrá que N es una potencia entera de 2, N=2
M

(19.31)

donde M es un entero. Esta restricción se introduce para simplificar el resultado del algoritmo. Ahora, recuerde que TDF se puede representar de manera general como
Ai- 1

F = 2 f e-* "
k

n

2m k

para * = 0 a N - 1

(19.32)

donde 2n/N = O) . La ecuación (19.32) se puede también representar como
0

N-l

donde Wes una función ponderada de valor complejo definida como
W = e

-H2n/N)

(1933)

Suponga ahora que se divide la muestra a la mitad y se expresa la ecuación (19.32) en términos del primer y último N/2 puntos:
(A//2J-1 N-l

F =
k

] T fi¡e
/,=()

-¡WN)kn
n=N/2 (N/2)-\

+

f e-iQ*/w>
n

donde k = 0 , 1 , 2 , . . . , N — 1. Una nueva variable, m = n — N/2, se puede crear para que el rango de la segunda sumatoria sea consistente con la primera,
(A72)-!

Fk

= £fa-WN*,, £ f^^-iWNMm+N,» n=0
+
m=0

= E

(AÍ/2J-1

«=0

(fn+e'^fn+w)'-' * """
2 1
Kk

(19.34)

Ahora, observe que el factor e~' = (—1)*. De esta forma, para puntos pares es igual a 1 y para los nones es igual a — 1. Por tanto, el próximo paso en el método es separar la ecuación (19.34) de acuerdo con valores pares e impares de k. Para los valores pares,
C (W/2)-l \ ^ ( f (¿V/2)-l A. f \ „-i2x(2k)n/N _ i f 4f , ,„1 ,,~i2nkn/{N/2)

y para loi valores impares,

II .0

'I

o

/,',

_

(/V/2) I V" t f n=0 (N/2)-¡

r

\ „

i'lnak \ \)n/N

=

£
n=0

( f n - U N ^ e - ' ^ e -

2

" ^ ^

p a r a k = O,1,2, ...,(N/2) - 1. Estas ecuaciones se pueden expresar en términos de la ecuación (19.33). Para los valores pares,
(JV/2)-l

F2k=

E
n=0

\fn

+

fn+N/2)W "
2k

y para los valores impares,
(N/2)-\ F
2 k +

l =

E «=0

{fn-

fn+N,2)W W
n

2kn

Ahora, se puede hacer un conocimiento clave. Esas expresiones pares e impares se pueden interpretar como si fueran igual a las transformadas secuenciales de longitud (N/2) gn = fn + fn+N/2 y K = (fn -fn+NnW Para« = 0, 1, 2,..., (N/2) - 1 (19.36) (19.35)

De esta manera, resulta en forma directa que J

2k

=G )
k
H

parafc = 0, 1, 2,

(N/2) - 1

^24+1 -

k J

En otras palabras, un cálculo de N puntos se ha reemplazado por dos cálculos de (N/2) puntos. Ya que cada uno de los últimos requiere aproximadamente (N/2) multiplicaciones y sumas complejas, el procedimiento produce un factor de 2 en ahorro (es decir N contra 2(7Y/2) = N /2. El esquema se ilustra en la figura 19.15 para /V = 8. La TDF se calcula primero al formar la secuencia g" y h" y después calculando las N/2 TDF para obtener las transformadas numeradas como pares e impares. Los pesos W° son algunas veces llamados factores de vuelta. Ahora es claro que este procedimiento de "divide y vencerás" se puede repetir en la segunda etapa. Así, podemos calcular los (N/4) puntos TDF de las cuatro N/4 secuencias compuestas de las primeras y últimas N/4 puntos de las ecuaciones (19.35) y (19.36). La estrategia es continuada a su inevitable conclusión cuando N/2 puntos dobles de las TDF se hayan calculado (véase figura 19.16). El número total de cálculos para toda la población es del orden de T V log N. El contraste entre este nivel de esfuerzo y el de la TDF estándar (véase figura 19.14) ilustra por qué la TRF es tan importante.
2 2 2 2 2

560

APROXIMACIÓN DE FOURIER

FIGURA 19.15 Diagrama de flujo de la primera etapa en una descomposición por decimación en la frecuencia de una TDF con Npuntos para las TDF con (N /2) puntos para N = 8.

FIGURA 19.16 Diagrama de flujo de la descomposición completa por decimación en la frecuencia de una TDF con ocho puntos.

f(0) '(1) \ f(2) \\ /1 \y /+ '(3)
+
•A /

A

+ ^ \

/ +

•A

+

A

i
+

+

A

A

F(0) F(4)
A

TA

A .

+

.A,

F(2) F(6)

X A\r

X

>A

*r +
.A^

w° 'i m) /\r X m// y/ Ur f(7)Y \m¡ mf
. X X+
>A A

A

A

A ,

F(5)
+

\

rA

TA

A.

F(3) F(7)

i

1

19.6

TRANSFORMADA RÁPIDA DE FOURIER

Algoritmo de cómputo. Es una proposición relativamente directa expresar la figura 19.16 como un algoritmo. Como fue el caso para el algoritmo de la TDF de la figura 19.12, se usará la identidad de Euler, e
± m

= eos a ± i sen a

para permitir implementar al algoritmo en lenguajes que no acomoden en forma explícita variables complejas. Una inspección cercana a la figura 19.16 indica que su diagrama computacional molecular fundamental es la conocida en forma extensa como red mariposa, ilustrada en la figura 19.17a. El pseudocódigo para implementar una de esas moléculas se muestra en la figura 19.176. El pseudocódigo para la TRF se enlista en la figura 19.18. La primera parte consiste, en esencia, en tres ciclos anidados para implementar el cuerpo computacional de la figura 19.16. Observe que los datos reales valuados se guardan originalmente en el arreglo x. También observe que el ciclo exterior pasa a través de las M etapas [recuerde la ecuación (19.31)] del diagrama de flujo. Después de que esta primera parte se ejecuta, la TDF habrá sido calculada pero en desorden (véase el lado derecho de la figura 19.16). Esos coeficientes de Fourier pueden ser ordenados por un procedimiento llamado de fragmento inverso. Si los subíndices del 0 al 7 se expresan en forma binaria, se puede obtener el orden correcto al invertir esos fragmentos (véase figura 19.19). La segunda parte del algoritmo implementa este procedimiento. 19.6.2 A l g o r i t m o de Cooley-Tukey

La figura 19.20 muestra una red de flujo para implementar el algoritmo de CooleyTukey. Para este caso, la muestra se divide inicialmente en puntos impares y pares numerados, y los resultados finales están en el orden correcto. Este procedimiento es llamado una ordenación en tiempo. Es la inversa del algoritmo de Sande-Tukey descrito en la sección anterior. Aunque las dos clases de métodos difieren en organización, ambos exhiben las AHog N operaciones que son la fortaleza del procedimiento de la TRF.
2

FIGURA 19.17 o| Una red mariposa que representa el cálculo fundamental de la figura 19.16. b) Pseudocódigo para implementar a).

#

ftP)

temporal = real (0) + real (1) real(1) - real (0)-real (1) real (0) = temporal temporal = imaginario (0) + imaginario (1) imaginario (1) = imaginarlo (0) - imaginario (1) Imaginario (0) - temporal

b)

562

APROXIMACIÓN DE FOURIER

m = LOÚ(N) / L0G(2) N2 = N D0k = 1,m N1 = N2 N2 = N2/2 angle = 0 arg = 2n IN1 DO} = 0,N2-1 c = coe(angle) e = sin(atigle) DO i =j,NN1 kk = i+ N2 xt = x(¡) - x(kk) x(i) = x(¡) + x(kk)

J=0 DO ¡ = 0, N-2 IF (i < j) THEN xt = Xj

Xj X¡=

x,.

= xt

yt=yj yj=y,

í,

E N D IF

y,=yt

y =yO)-y(kk)
t

x(kk) =xt *c-yt *s y(kk) =yt * c + xt * END DO angle = Q +1) * arg END DO END DO
FIGURA 19.18

5

k = N/2 DO IF(k>j + 1)EXIT j=j-k k = k/2 END DO J=J END DO D0i = 0,N-1 x(¡) = x(¡) / N y(¡)=y(¡)/N END DO
+ k

Pseudocódigo p a r ai m p l e m e n t a ru n a decimación e n la frecuencia p a r a la T R F .O b s e r v eq u e el pseudocódigo está c o m p u e s t op o r dos partes: a) la m i s m aT R Fyb )u n ar u t i n a de f r a g m e n t o si n v e r s ap a r an od e s o r d e n a r los coeficientes resultantes de F o u r i e r .

FIGURA 19.19

I l u s t r a c i ó n del proceso de f r a g m e n t o s inversa.
Desorden (Decimal) Ordenado (Binario) Orden de fragmentos invertida (Binario) Resultado final (Decimal)

F|0| F(4) F(2) F(6| F(l) F(5) F|3) F|7)

=>

F[000| F(100) F(010) F(UO) F(OOl) F|101) F(011) F|lll)

=>

F(000) F(001) F|010) F(011) F( 100) F|101) F(110| F|lll)

=>

F|0) F|l) F|2) F(3) F(4) F(5) F|6) F|7)

1 9 7 .

EL ESPECTRO DE P O T E N C I A

M I f ^ » > > O i t ) i |i ^ M | j l i •¡H i ) ,

^ ¡ * i § i | i ) i i t a ^ l j ^ i ) .

FIGURA 19.20 Diagrama de flujo de una TRF con decimación en el tiempo para una TDF de 8 puntos.

19.7

EL E S P E C T R O DE POTENCIA La TRF tiene muchas aplicaciones en ingeniería, que van desde análisis vibratorio do estructuras y mecanismos hasta el procesamiento de señales. Como se describió antes, la amplitud y el espectro de fase proporcionan un medio para discernir la estructura fundamental de señales aleatorias aparentes. De manera similar, un análisis útil llamado espectro de potencia se puede desarrollar a partir de la transformada de Fourier. Como su nombre lo implica, el espectro de potencia se deriva del análisis de la potencia de salida de sistemas eléctricos. En términos matemáticos, la potencia de una señal periódica en el dominio del tiempo se puede definir como
1

f

T/2

1

J-T/2

Ahora, otra forma de buscar en esta información es expresándola en el dominio de la frecuencia al calcular la potencia asociada con cada una de las componentes de la frecuencia. Esta información se puede entonces desplegar como un espectro de potencia, una gráfica de la potencia contra la frecuencia. Si la serie de Fourier para f(t) es
oo

f(t)

=

Fne '
ikü>0

(19.38)

se cumple la siguiente relación (véase Gabel y Roberts 1987 para más detalles):

( 1 9 3 .9 )

564

APROXIMACIÓN DE FOURIER

De esta forma, la potencia en f(t) se puede determinar al sumar los cuadrados de los coeficientes de Fourier; es decir, las potencias asociadas con las componentes de frecuencia individual. Ahora, recuerde que en esta representación, la armónica real simple consiste en ambos componentes de la frecuencia en 0 También sabemos que los coeficientes positivo y negativo son iguales. Por tanto, la potencia la ¿-ésima armónica real de /(Oes

±ka> .

enf^t),

p =2\F \
k k

2

(19.40)
k

El espectro de potencia es la gráfica de p como una función de la frecuencia ¿fi%. Dedicaremos la sección 20.3 a una aplicación de la ingeniería que involucra la TRF y el espectro de potencia generado por medio de paquetes de software. Información adicional. Lo anterior ha sido una breve introducción a la aproximación de Fourier y a la TRF. Información adicional sobre la primera se puede encontrar en Van Valkenburg (1974), Chirlian (1969), y Hayt y Kemmerly (1986). Referencias sobre la TRF son incluidas en Davis y Rabinowitz (1975); Cooley, Lewis y Welch (1977), y Brigham (1974). Buenas introducciones a ambos asuntos se pueden encontrar en Ramírez (1985), Oppenheim y Schafer (1975), Gabel y Roberts (1987).

19.8

AJUSTE DE CURVAS CON LIBRERÍAS Y

PAQUETES

Las librerías y paquetes de software tienen grandes capacidades para el ajuste de curvas. En esta sección daremos una muestra de las más usuales. 19.8.1 Excel

En el presente contexto, la aplicación más útil de Excel es para el análisis de regresión y, con menos extensión, para la interpolación polinomial. Además de algunas funciones predeterminadas (véase la tabla 19.1), existen dos formas principales en las cuales esta capacidad se puede implementar: el comando Trendline y el Paquete de Herramientas para el Análisis de Datos.

TABLA 19.1

Funciones prefabricadas de Excel que relacionan los ajustes por regresión de los datos.
Descripción

Función

FORECAST GROVVTH INTERCEPT UNEST LOGEST SLOPE TREND

Regresa un valor ¡unto con una tendencia lineal Regresa valores ¡unto con una tendencia exponencial Regresa el intercepto de la línea de regresión lineal Regresa los parámetros de una tendencia lineal Regresa los parámetros de una tendencia exponencial Regresa la pendiente de la línea de regresión lineal Regresa un valor ¡unto con una tendencia lineal

19.8

AJUSTE DE CURVAS CON LIBRERÍAS V P A Q U E T E S

565

El comando Trendline (menú insert). Este comando permite un número de diferentes modelos de tendencia que se pueden agregar a la gráfica. Esos modelos incluyen ajustes lineales, polinomiales, logarítmicos, exponenciales, de potencia y de promedio de movimiento. El siguiente ejemplo ilustra cómo se llama al comando Trendline.

EJEMPLO 1 9 . 3

Usando el comando Trendline de Excel

Enunciado del problema. Usted habrá notado que varios ajustes disponibles en Trendline fueron analizados anteriormente en el capítulo 17 (por ejemplo, lineal, polinomial, exponencial y potencia). Una capacidad adicional es la del modelo logarítmico y =a
0

+ ai logx

Ajuste los siguientes datos con este modelo usando el comando de Excel Trendline:
X

0.5 0.53

1 0.69

1.5 1.5

2 1.5

2.5 2

3 2.06

3.5 2.28

4 2.23

4.5 2.73

5 2.42

5.5 2.79

y

Solución. Para ejecutar el comando Trendline, se debe crear una gráfica que relaciona una serie de variables dependientes e independientes. Para el caso actual, se usa la guía de gráficas de Excel Wizard (Asistente) para crear una gráfica XY con los datos. Después, se selecciona la gráfica (haciendo doble clic en ésta) y la serie (al posicionar el cursor sobre uno de los valores y con un solo clic). Los comandos Insert y Trendline son entonces ejecutados con la ayuda del ratón o por la siguiente secuencia de teclas / Insert Trendline En este punto, se abre un cuadro de diálogo con dos tabuladores: el Options (Opciones) y el Type (Tipo). El tabulador Options proporciona formas para configurar el ajuste. Lo más importante en este contexto es desplegar tanto la ecuación como el valor del coeficiente de determinación (r ) sobre la gráfica. La primera elección en el tabulador Type es para especificar el tipo de línea. Para el caso actual, se selecciona Logarithmic. El ajuste resultante junto con r se despliega en la figura 19.21.
2 2

FIGURA 19.21 Ajuste de un modelo logarítmico con los datos del ejemplo 19.3.

y3
2

r

0

0

2

4

566
I I I I

APROXIMACIÓN DE FOURIER

El comando Trendline proporciona una manera fácil para ajustar un número de modelos para datos que se usan de manera común. Además, su inclusión en la opción Polinomial significa que también se puede usar para interpolación polinomial. Sin embargo, debido a su contenido estadístico, está limitado a r , y esto significa que no permite dibujar inferencias estadísticas con respecto al modelo a ajustar. El paquete de herramientas para el análisis de datos que se describirá a continuación proporciona una excelente alternativa para los casos donde las inferencias son necesarias.
2

El paquete de herramientas para el análisis de datos.

Este paquete de Excel, tam-

bién incluido, contiene una amplia capacidad para el ajuste de curvas mediante lineal general por mínimos cuadrados. Como se describió antes, en la sección 17.4, tales modelos son de la forma general y = az
0

0

+ a\Z\ + a z
2

2

H

\-a z
m

m

+e

(17.23)

donde z , z ,..., z son m + 1 funciones diferentes. El siguiente ejemplo ilustra cómo tales modelos se pueden ajustar con Excel.
0 x m

EJEMPLO 19.4

Usando el paquete de herramientas para el análisis de datos de Excel

Enunciado del problema. Los siguientes datos se colectaron para la pendiente, radio hidráulico y velocidad del agua que fluye en un canal:

S, R, U,
m

0.0002 0.2 0.25 m/s

0.0002 0.5 0.5

0.0005 0.2 0.4

0.0005 0.5 0.75

0.001 0.2 0.5

0.001 0.5 1

m/m

Se tiene razones teóricas (recuerde la sección 8.2) para creer que estos datos se pueden ajustar a un modelo de potencias de la forma

donde son los coeficientes obtenidos de manera empírica. Existe razones teóricas (véase de nuevo la sección 8.2) para creer que o"y p deberían tener valores aproximados de 0.5 y 0.667, respectivamente. Ajuste estos datos con Excel y evalúe si su regresión estimada contradice los valores esperados de los coeficientes del modelo. Solución. El logaritmo de este modelo de potencias se usa primero para convertirlo al formato lineal de la ecuación (17.23),

U =aS R a,ayp
a

p

U = a+a S+p R
log log log Se puede desarrollar una hoja de cálculo en Excel con los datos originales junto con sus respectivos logaritmos, como en la siguiente tabla:

566

APROXIMACIÓN DE FOURIER

El comando Trendline proporciona una manera fácil para ajustar un número de modelos para datos que se usan de manera común. Además, su inclusión en la opción Polinomial significa que también se puede usar para interpolación polinomial. Sin emI bargo, debido a su contenido estadístico, está limitado a r , y esto significa que no per• ' mite dibujar inferencias estadísticas con respecto al modelo a ajustar. El paquete de herramientas para el análisis de datos que se describirá a continuación proporciona una excelente alternativa para los casos donde las inferencias son necesarias.
2

El paquete de herramientas para el análisis de datos.

Este paquete de Excel, tam-

bién incluido, contiene una amplia capacidad para el ajuste de curvas mediante lineal general por mínimos cuadrados. Como se describió antes, en la sección 17.4, tales modelos son de la forma general y — ao^o + a\Z\ + a z
2 0 x m

2

H

\-a z,„+e
m

'

(17.23)

donde z , z ,..., z son m + 1 funciones diferentes. El siguiente ejemplo ilustra cómo tales modelos se pueden ajustar con Excel.

EJEMPLO 19.4

Usando el paquete de herramientas para el análisis de datos de Excel

,

Enunciado del problema. Los siguientes datos se colectaron para la pendiente, radio hidráulico y velocidad del agua que fluye en un canal:

S, R, U,
U

0.0002 0.2 0.25

0.0002 0.5 0.5

0.0005 0.2 0.4

0.0005 0.5 0.75

0.001 0.2 0.5

0.001 0.5 1

m/m m

Se tiene razones teóricas (recuerde la sección 8.2) para creer que estos datos se pueden ajustar a un modelo de potencias de la forma

m/s

donde son los coeficientes obtenidos de manera empírica. Existe razones teóricas (véase de nuevo la sección 8.2) para creer que o"y p deberían tener valores aproximados de 0.5 y 0.667, respectivamente. Ajuste estos datos con Excel y evalúe si su regresión estimada contradice los valores esperados de los coeficientes del modelo. Solución. El logaritmo de este modelo de potencias se usa primero para convertirlo al formato lineal de la ecuación (17.23),
U = log a + tr log S + p log R

a,oyp

=aS"R

p

Se puede desarrollar una hoja de cálculo en Excel con los dalos originales junio con sus respectivos logaritmos, como en la siguiente tabla:

r,a

mjvoi
A
S

c wc W K W O

B

W T N UBKBRIAS T W 5 J U E T E 5

'

1

B

1

Rh 0.0002 0.0002 0.0005 0.0005 0.001 0.001 0.2 0.5 0.2 0.5 0.2 0.5

U 0.25 0.5 0.4 0.75 0.5 1

lofl(S|

¿
3 4 5 6 7

loq(U| lofl(Rh) -0.69897 -0.60206 - 3 . 6 9 & V 1 -0.30103 -0.30103 -3.3010§ -0.69897 -0.39794 -3.30103' , -3.30103 -0.12494 -3 \-0.69897 -0.30103 -3 ^.30103 = log(A2) 0

P

Como se muestra, una forma eficiente para generar los logaritmos es tecleando la fórmula para calcular el primer log(S). Después se puede copiar esta fórmula a la derecha y hacia abajo para generar los otros logaritmos. Debido a su estado como una "incluida", en la versión de Excel disponible en el tiempo de la edición en inglés de este libro, el paquete de herramientas para el análisis de datos debe algunas veces cargarse en Excel. Para hacer esto, simplemente use el ratón o la secuencia de teclas /Tools Add-Ins Después seleccione Analysis Toolpack y OK. Si el add-in ha sido satisfactorio, la selección Data Analysis se incluirá en el menú Tools. Después de seleccionar Data Analysis en el menú Tools, un menú de Data Analysis aparecerá en pantalla conteniendo un gran número de rutinas orientadas estadísticamente. Seleccione Regression y aparecerá un cuadro de diálogo que esperará se le proporcione información sobre la regresión. Después de estar seguros que se ha seleccionado la instrucción por default New Worksheet Ply, llene en F2:F7 para el rango y y D2:E7 para el rango x y seleccione OK. Así se creará la siguiente hoja de cálculo:

1

B A RESUMEN DE RESULTADOS

C

D

E

F

G

2 3
4 5 6

& 0

10 11 13 •t)

7

Múltiple R R cuadrada A¡. de R cuadrada Error estándar Observaciones ANOVA Regresión Residual Total

Estadística de regresión
0.998353 0.996708 0.994513 0.015559 6

•LI RH 10 !l il

dt ss
2 3 5 0.219867 0.000726 0.220593

MS 0.109933 0.000242

454.1106

F Siqniticanáa
0.0001889 1.2808009 1.7641028

IflIdU'Bplo X Variable 1

0.433137

Coehs. Error estdr. Valor Inf. PSup. al al
0.075932 0.022189 Sfadf 20.0501 19.5203 0.0002712 0.0002937

95% 0.362521 1 0.5037521 Ó.83456W

95%

APROXIMACIÓN DE FOURIER

De esta manera, el ajuste resultante es log U = 1.522 + 0.433 log S + 0.733 log R o al tomar el antilog,
U = 333S R
0A33 0133

Observe que se han generado intervalos de confianza al 9 5 % para los coeficientes. Así, hay un 9 5 % de probabilidad de que la pendiente real del exponente esté entre 0.363 y 0.504, y el coeficiente real del radio hidráulico esté entre 0.631 y 0.835. De esta forma, el ajuste no contradice los exponentes teóricos.

Finalmente, se debe observar que se puede usar la herramienta Solver de Excel para ejecutar una regresión no lineal al minimizar de manera directa la suma de los cuadrados de los residuos entre la predicción modelo no lineal y los datos. Dedicaremos un ejemplo en la sección 20.1 para ver cómo se puede hacer esto. 19.8.2 Mathcad

Mathcad puede ejecutar una amplia variedad de tareas estadísticas, ajuste de curvas y corrección de datos. Dichas tareas incluyen trabajos relativamente simples, como trazo de histogramas y cálculo de resúmenes estadísticos de población tales como la media, mediana, varianza, desviaciones estándar y coeficientes de correlación. Además, Mathcad puede predecir valores intermedios al conectar los puntos de datos conocidos ya sea con líneas rectas (interpolación lineal) mediante I i n t e r p o con secciones de polinomiales cúbicos (interpolación segmentaria cúbica) por medio de cspline, pspline, o lspline. Estas funciones segmentarias le permiten intentar diferentes maneras que tienen que ver con interpolación en los puntos extremos de los datos. La función lspline genera una curva segmentada que es una línea recta al final de los puntos. La función pspline genera una curva segmentada que es una parábola en los puntos extremos. La función cspline genera una curva segmentada que es cúbica en los puntos extremo. La función i n t e r p usa el resultado del ajuste de curvas y regresa un valor y interpolado, dado un x valor. Además, usted puede ejecutar interpolación segmentaria cúbica en dos dimensiones al pasar una superficie a través de una malla de puntos. Mathcad contiene un número de funciones para ejecutar regresiones. Las funciones slope e intercept regresan la pendiente e intercepto del ajuste lineal por regresión de mínimos cuadrados. La función regress se usa para una regresión polinomial de n-ésimo orden de un conjunto completo de datos. La función loess ejecuta una regresión polinomial localizada de «-ésimo orden sobre un espacio de datos que usted puede especificar. La función i n t e r p también se puede usar para regresar valores intermedios de y a partir de un ajuste por regresión para un punto dado x. Las funciones regress y loess pueden también ejecutar regresión polinomial multivariable. Mathcad también proporciona la función l i n f i t que se usa para modelar datos con una combinación de funciones arbitrarias. Finalmente, la función genfit está disponible para casos donde los coeficientes del modelo aparecen en forma arbitraria. En este caso, las ecuaciones no lineales más difíciles se deben resolver por iteración.

19.8

AJUSTE D E CURVAS C O N LIBRERÍAS V

ROQUETES

Pongamos un ejemplo que muestre cómo se puede usar Muthcnd para ejecutar unu interpolación segmentaria en dos dimensiones (véase la figura 19.22). Los datos a ajustar son

z 0 1 2 3 4 5

0 0.17500 0.93500 0.64900 -0.55300 -0.97900 -0.70700

1 0.14100 0.16700 -0.00302 -O.22500 0.17500 0.12600

2 -0.13900 -0.76400 -0.33400 0.46700 0.36800 0.76100

x

3 -0.51400 -0.98600 -0.65900 0.73600 0.81400 0.30200

4 -0.29000 -0.30800 -0.00678 0.10600 0.39000 0.30300

5 0.32700 0.82600 0.23900 -0.09200 -0.78200 -0.16400

y

Observe que los números a lo largo de la parte superior y en el lado izquierdo son las coordenadas x y y de los valores z que se encuentran en el interior de la matriz. El primer paso es pasar los datos a Mathcad. Para hacer esto se pueden crear dos archivos de datos llamados MATSPLIN.PRN y MATXY.PRN. Los primeros dos activan las líneas en la figura 19.22 mediante el comando R E A D - P R N para leer los datos de esos archivos. El archivo MATSPLIN.PRN es un archivo simple de texto que contiene los valores de la función (z) a ser interpolada en varios puntos x y y sobre una rejilla rectangular. LAS dimensiones de la rejilla están definidas por los datos en el archivo de texto MATXY.PRN. Los elementos de este archivo son pares de valores x y y que caracterizan los elementos de la diagonal de la región. El símbolo definición se usa para asignar los datos de los archivos de datos a las variables Mz y Mxy. Después, el símbolo definición y la función ESPLIN se usan para definir la matriz S. Ésta es una matriz que contiene valores de la segunda derivada y otros resultados numéricos en varias localizaciones de la rejilla. Esta

FIGURA 19.22 Segmentaria 2D con Mathcad. File Edlt Vlew Insert Format SJath Symbolics yjlndow S«IP
2D SPLTNE

Enter theroatrixspecifying a surface: Mz :=READPRN("matsplin.prn") Mxy :=READPRN("matxy.pm") Compute spline coefficients: S :=* cspüne(Mxy,Mz)

fit(x,y) :=

inteipjs,Mxy,Mz,jx|j

Sample interpolated valúes: fltí2.5,3.9) = 0,046

370

APROXIMACIÓN DE FOURIER

matriz, junto con Mz y Mxy, son usadas por la función interp para regresar los valores de z como la variable de ajuste (x, y) con base en la interpolación segmentaria cúbica con los valores de entrada de x y y. Mathcad designa esta secuencia de operaciones, de tal manera que la interpolación de polinomiales no tengan que ser recalculados cada vez que se requiera la interpolación con diferentes valores de x y y. Considerando estas operaciones, usted puede interpolar en cualquier ubicación mediante el ajuste (x, y), como el mostrado con x = 2.5 y y = 3.9. Usted puede también construir una gráfica de la superficie interpolada como la mostrada en la figura 19.22. Como otro ejemplo para demostrar algunas capacidades para el ajuste de curvas mediante Mathcad, usamos la función fft para el análisis de Fourier como el mostrado en la figura 19.23. La primera línea usa el símbolo definición para crear i como un rango variable. Después x¡ es formulado mediante la función Mathcad r n d para impartir una componente aleatoria a la señal sinusoidal. La gráfica de la señal se puede colocar sobre la hoja de cálculo al hacer clic en la ubicación deseada. Esto coloca una línea roja cruzada en esa ubicación. Después use del menú la secuencia Insert/Graph/X-Y Plot para reservar una gráfica en blanco sobre la hoja de cálculo con lugares para las expresiones a graficarse y para los rangos de los ejes x y y. Simplemente teclee x¡ en el lugar reservado sobre el eje y y 0 y 80 para el rango en el eje x. Mathcad realiza todo el resto para producir la gráfica mostrada en la figura 19.23. Una vez que se ha creado la gráfica, usted puede usar del menú la secuencia Format/Graph/X-Y Plot para variar el tipo de gráfica, cambiar el color, tipo, ancho de línea del trazo de la función y agregar títulos, leyendas y otras características. Después c es definida como fft(x). Esta función regresa la transformada de Fourier de x. El resultado es un vector, c, de coeficientes complejos que representan los valores en el dominio de la frecuencia. Se construye una gráfica de la magnitud de c¡ como antes.

FIGURA 1 9 . 2 3 TRF con Mathcad.
Mathcad file Edil ylew ¡nsert Formal Malh gymbollcs Wlndow tjelp FAST FOURIER TRANSFORM Define a real signal in time: Signal

1 9 .8

A J U S T E DE C U R V A S CON L I B R E R Í A S Y R O Q U E T E S

19.8.3

MATLAB

Como se resume en la tabla 19.2, MATLAB tiene una variedad de funciones preconstruidus que abarcan las capacidades totales descritas en esta parte del libro. El siguiente ejemplo ilustra cómo usar algunas de ellas.

TABLA 19.2

Algunas funciones de MATLAB para implementar interpolación, regresión, segmentarias y TRF.
Descripción

Función

polyfit interp 1 interp 2 spline fft EJEMPLO 1 9 . 5

Ajuste polinomial a datos Interpolación 1-D (tabla 1-D) Interpolación 2-D (tabla 2-D| Interpolación segmentaria cúbica de datos Transformada de Fourier discreta

Uso de MATLAB para el ajuste de curvas

¡ | ¡ !

Enunciado del problema. Explore cómo se puede emplear MATLAB para ajustar curvas con los datos. Para hacer esto, use la función seno para generar valores igualmente espaciados f(x) de 0 a 10. Emplee un tamaño de paso de 1 de tal forma que la caracterización resultante de la onda seno sea dispersa (véase la figura 19.24). Después, ajústela con a) interpolación lineal, b) polinomial de quinto orden y c) una segmentaria cúbica.
Solución.

a) Los valores de las variables independientes y dependientes se pueden introducir en los vectores por
>> >> x=0:10; y=sin(x);

FIGURA 19.24 Once puntos muestreados de una sinusoidal.

572

APROXIMACIÓN DE FOURIER

Un nuevo vector más finamente espaciado con valores de la variable independiente se puede generar y guardar en el vector xi,
>> xi=0:.25:10;

La función MATLAB i n t e r p l puede entonces ser usada para generar valores de la variable dependiente yi para todos los valores xi mediante interpolación lineal. Tanto los valores originales (x, y) como los valores interpolados linealmente se pueden graficar juntos, como se muestra en la gráfica siguiente:
>> >> y i = i n t e r p 1 ( x , y , x i ) ; plotCx,y,'o
1

, x i , y i )

0

2

4

6

8

10

b)

Ahora, la función polyfit de MATLAB se puede usar para generar los coeficientes de un ajuste polinomial de quinto orden de los datos originales dispersos,
>> P= 0.0008 -0.0290 0.3542 -1.6854 2.5860 -0.0915 p=poLyfit(x,y,5)

donde el vector p cumple con los coeficientes polinomiales. Estos se pueden a su vez usar para generar un nuevo conjunto de valores yi, los cuales pueden de nuevo ser graneados junto con las muestras originales dispersas,
>> >> yi = potyvaL(p,xi);
1

p l o t ( x , y ,

o ' , x i , y i )

Asi, el polinomial eiiplura la tendencia general de los dalos, pero deja lucia la mayoría de los puntos. c) Finalmente, la función spline de MATLAB puede ser usada para «justar umi segmentaria cúbica de los datos dispersos originales en la forma de un nuevo conjunto de valores yi, los cuales se pueden nuevamente graficar junto con la muestra original dispersa,

r ,9 fm\jo i c ve

O tN L B I R E R A ÍS Y R A Q U T I S I

> > y i = s p l i n e ( x , y , x i ) ; > >p L o t ( x , y , ' o ,xi,yi)
1

0

2

4

6

8

10

Debería observarse que MATLAB también tiene excelentes capacidades para realizar el análisis de Fourier. Se dedica la sección 20.3 a un ejemplo de cómo se puede hacer esto. 19.8.4 IMSL

IMSL tiene numerosas rutinas para el ajuste de curvas que abarca todas las capacidades a cubrir en este libro, y, por tanto, se mostrará algunas. Una muestra se presenta en la tabla 19.3. En el actual análisis, nos concentraremos en la rutina RCURV Esta rutina ajusta los datos a un polinomial por mínimos cuadrados. RCURV se implementa con la siguiente declaración C ALL:

C A L L R C U R V ( N O B S , X D A T A , Y D A T A , N D E G , B ,S S P O L Y , S T A
donde NOBS = Número de observaciones. (Input) XDATA = Vector de longitud NOBS que contiene los valores x. (Entrada) YDATA = Vector de longitud NOBS que contiene los valores y. (Entrada) NDEG = Grado del polinomial. (Entrada) B = Vector de longitud NDEG + 1 que contiene los coeficientes. SSPOLY = Vector de longitud NDEG + 1 que contiene las sumas secuenciales de los cuadrados. (Salida) SSPOLY (1) contiene la suma de los cuadrados debidos a la media. Para i = 1,2,..., NDEG, SSPOLY(i + 1) contiene la suma de los cuadrados debido a las x' ajustadas a la media, x, x y x' '.
2

574

APROXIMACIÓN DE FOURIER TABLA 19.3
Categoría

Rutinas IMSL para ajuste de curvas.
Rutinas segmentaria cúbica CSIEZ CSINT CSDEC Descripción Fácil de usar rutina segmentaria cúbica No-un-nudo Deriva condiciones finales

• Interpolación

• Evaluación segmentaria cúbica
e integración CSVAL CSDER Evaluación Evaluación de la derivada Evaluación sobre una rejilla Integración

CS1GD
CSITG

• Interpolación segmentaria • Polinomio en fragmentos

B

• Rutinas de interpolación cuadrática
polinominal para datos cuadriculados

• Interpolación de datos dispersados • Aproximación de mínimos cuadrados
RUÑE RCURV FNLSQ
« Segmentaria cúbica suavizada

Polinomio lineal Polinomio general Funciones generales

• Aproximación
de Chebyshev

racional ponderada Ponderada racional Chebyshev aproximación

• TRF

real trigonométrica

FFTRF FFTRB FFTRI

Transformar hacia adelante Transformar hacia atrás o inversa Inicialización de la rutina para FFTR Transformar hacia adelante Transformar hacia atrás o inversa Inicialización de la rutina para FFTC

• TRF exponencial compleja

FFTCF FFTCB FFTCI

• Seno real y coseno para las TRF • Cuarto real del seno y coseno
paro las TRF.

• TRF en dos y tres dimensiones
complejas • Convoluciones y correlaciones Transformada de Laplace

• T.Q

AJUSTE DE CURVAS C O N LIBRERÍAS Y P A Q U E T E S

STAT = Vector de longitud 10 que contiene la estadística descrita en la tabla 19.4. (Salida) donde 1 = Media de x 2 = Media de y 3 — Varianza muestra de x 4 = Varianza muestra de y 5 = R-cuadrada (en porcentaje) 6 = Grados de libertad para la regresión 7 = Suma de cuadrados de la regresión 8 = Grados de libertad para el error 9 = Suma de cuadrados del error 10 = Número de datos (x, y) conteniendo NaN (no un número) como un valor x o y.
EJEMPLO 19.ó Uso de IMSL para regresión polinomial

m

I

Enunciado del problema. Use RCURV para determinar la polinomial cúbica que proporciona un ajuste por mínimos cuadrados de los siguientes datos
X

0.05 0.957

0.12 0.851

0.15 0.832

0.30 0.720

0.45 0.583

0.70 0.378

0.84 0.295

1.05 0.156

y

Solución. Un ejemplo de un programa principal en Fortran 90 y de la función RCURV para resolver este problema se puede escribir como
Fitpoly use msimsl
PROGRAM I M P L I C I T NONE

INTEGER::ndeg.nobs,i,j PARAMETER (ndeg -3, n o b s - 8 ) R E A L : : b ( n d e g + l ) , s s p o l y ( n d e g + l ) , s t a t ( 1 0 ) , x ( n o b s ) , y ( n o b s ) , ycalc(nobs)
DATA DATA CALL x / 0 . 0 5 . 0 . 1 2 , 0 . 1 5 . 0 . 3 0 . 0 . 4 5 , 0 . 7 0 , 0 . 8 4 , 1 . 0 5 / y / 0 . 9 5 7 , 0 . 8 5 1 , 0 . 8 3 2 , 0 . 7 2 0 , 0 . 5 8 3 , 0 . 3 7 8 . 0 . 2 9 5 , 0 . 1 5 6 /

RCURV(nobs,x,y.ndeg,B,sspo1y,stat) * , ' F i t t e d polynomlal i s ' DO i - l . n d e g + 1 PRINT ' ( 1 X . " X " . I I , " TERM: ".FS^)'.
PRINT
A

1-1,

b(1)

END

DO * ' ( I X , * * , ' N O . X Y YCALC' " R
A

PRINT PRINT PRINT PRINT

2 :

" , F 5 . 2 , " % " ) ' , s t a t ( 5 )

D O i = l.nobs ycalc=0. D O j = l,ndeg+l ycalc(i)-ycalc(1)+b(j)*x(i)**(j-l)
END DO PRINT END END DO

'(1X,I8,3(5X,F8.4))\

i , x ( 1 ) . y ( 1 ) , ycalcd)

576 |

APROXIMACIÓN DE FOURIER

i
\
] '
?

Un ejemplo de correr es F i t t e d polynomial i s
X 0 TERM:
A

.9909 -1.0312 .2785 -.0513 X .0500 .1200 .1500 .3000 .4500 .7000 .8400 1.0500 Y .9570 .8510 .8320 .7200 .5830 .3780 .2950 .1560 YCALC .9401 .8711 .8423 .7053 .5786 .3880 .2908 .1558

X 1 TERM:
A

X 2 TERM:
A

X 3 TERM:
A

R 2:
A

9 9 NO. .81% 1 2 3 4 5 6 7 8

PROBLEMAS 19.1 El pH en un reactor varía en forma sinusoidal durante el transcurso de un día. Use la regresión por mínimos cuadrados para ajustar con la ecuación (19.11) los siguientes datos. Use su ajuste para determinar la media, amplitud y tiempo del pH máximo.
Tiempo, hr 0 7.3 2 4 5 7 8.5 12 15 20 22 24 7

PH

7 7.1 6.4 7.4 7.2 8.9 8.8 8.9 7.9

19.2 La radiación solar en Georgetown, Carolina del Sur, ha sido tabulada como
Tiempo, mo Radiación, W / m
2

J 122

F

M 188

A 230

M 267

J 270

J 252

A —

S 196

O 160

N 138

D 120

Suponiendo que cada mes es de 30 días, ajuste a un sinusoide estos datos. Use la ecuación resultante para predecir la radiación que habrá durante la mitad de agosto. 19.3 Los valores promedio de una función se pueden determinar por

FIGURA P l 9.4 Una onda diente de sierra.

_ ¡¿mdx fix) =
Use esta relación para verificar los resultados de la ecuación (19.13). 19.4 Use una serie de Fourier continua para aproximar la onda de dentado de sierra mostrada en la figura P19.4. Grafique los primeros tres términos junto con la sumatoria.

1

1 9 . 1 4

U S E

EL C O M A N D O T R E N D L I N E D E E X C E L A

PARA «JUSTAR UNU

ECUU-

Sff
2 0 2 . 3

\

CIÓN EXPONENCIAL

1
2 . 5 3 . 5 6 7 . 5 1 0 1 2 . 5 1 5 1 7 . 5

7

5 . 5

3 . 9

3 . 6

3 . 1

2 . 8

2 . 6

2 . 4

2 . 3

-1

1

f

FIGURA P 19.5

I

JTIO

onda triangular.

Grafique y contra x junto con la ecuación exponencial y r . 19.15 Use el paquete de herramientas para el análisis de datos de Excel para desarrollar una regresión polinomial de cuarto orden, con los siguientes datos que contienen la concentración de oxigeno disuelto en agua fresca contra temperatura a nivel del mar.
2

0

1 6

2 4

3 2

4 0

O,

M G / L

1 4 . 6 2 1

1 1 . 8 4 3

9 . 8 7 0

8 . 4 1 8

7 . 3 0 5

6 . 4 1 3

I <).S Use la serie de Fourier continua para aproximar la forma de la onda en la figura P19.5. Grafique los primeros tres términos liinto con la sumatoria. I ').6 Construya la amplitud y línea de fase espectral del problema 19.4. 19.7 Construya la amplitud y línea de fase espectral del problema 19.5. 19.8 Un rectificador de media onda se puede caracterizar por

19.16 Use el paquete de herramientas para el análisis de datos de Excel para ajustar una línea recta con los siguientes datos. Determine el 90% de intervalo de confianza para el intercepto. Si pasa por cero, repita la regresión, pero ahora con el intercepto forzado a cero (ésta es una opción del cuadro de diálogo
Regression)
X
2 4 Ó 8 1 0 1 2 1 4

y(t) =

C ,

1 1 1
K

2

sen /

2 3n

„ eos 2t

2
15TT

eos 4í

19.17 Use Mathcad para ajustar una segmentaria cúbica (con una línea recta en los puntos extremos) los siguientes datos:
X
0 2 4 7 1 0 1 2

Y

5 . 7

6 . 4

1 2 . 3

1 7 . 7

1 8 . 9

2 5 . 7

2 6 . 8

-eos 6 í - •
357T

donde Q es la amplitud de la onda. Grafique los primeros cuatro (orminos junto con la sumatoria. I <>.9 Construya la amplitud y línea de fase espectral del problema 19.8. I « ) . 1 0 Desarrolle un subprograma de uso amigable para la TDF con base en el algoritmo de la figura 19.12. Pruébelo mediante la duplicación de la figura 19.13. I <>. 1 1 Use el programa del problema 19.10 para calcular una TDF pura la onda triangular del problema 19.8. Muestre la onda de t - 0 a 47. Use 32, 64 y 128 puntos de muestreo. Tome tiempo a cada corrida y grafique la ejecución contra N para verificar la ligura 19.14. 19.12 Desarrolle un subprograma de uso amigable para la TRF con base en el algoritmo de la figura 19.18. Pruébelo duplicando la figura 19.13. I').13 Repita el problema 19.11 mediante el software que usted desarrolló en el problema 19.12.

Determine el valor de y en x = 3. 19.18 Use Mathcad para generar 64 puntos a partir de la función /(í) = eos (3t) + sen (1 Oí) desde t = 0 a 2rc. Como se vio en la sección 19.8.2, agregue una componente aleatoria a la señal. Tome una TRF de esos valores y grafique los resultados. 19.19 En una forma similar a la sección 19.8.3, use MATLAB para ajustar los datos del problema 19.17 mediante a) interpolación lineal, b) un polinomial de quinto orden y c) una segmentaria. 19.20 Repita el problema 19.18, pero ahora use MATLAB para realizar el análisis. 19.21 Repita el problema 19.15, pero ahora use la rutina RCURV de IMSL.

Y

2 0

2 0

1 2

7

Ó

5 . 6

CAPÍTULO 2 0 Aplicaciones en ingeniería: ajuste de curvas
El propósito de este capítulo es usar los métodos numéricos para el ajuste de curvas en la solución de algunos problemas de ingeniería. La primera aplicación, la cual es tomada de la ingeniería química, muestra cómo se puede linealizar y ajustar los datos en un modelo no lineal mediante regresión lineal. La segunda aplicación emplea segmentarias para estudiar un problema que tiene relevancia en el área ambiental de la ingeniería civil: transporte de calor y masa en un lago estratificado. La tercera aplicación ilustra cómo se puede emplear una transformada rápida de Fourier (TRF) en la ingeniería eléctrica para analizar una señal determinando sus principales armónicas. La aplicación final muestra la forma en que se usa la regresión lineal múltiple para analizar datos experimentales en un problema de fluidos tomado de la ingeniería mecánica y aeroespacial.

20.1

R E G R E S I Ó N LINEAL Y M O D E L O S DE P O B L A C I Ó N (INGENIERÍA QUÍMICA/PETROLERA) Antecedentes. Modelos de crecimiento poblacional son importantes en muchos campos de la ingeniería. En muchos de los modelos, es fundamental la hipótesis de que la razón de cambio de la población (dp/df) es proporcional a la población real (p) en cualquier tiempo (t), o en forma de ecuación, %=k (20.1)

P

donde k — factor de proporcionalidad conocido como el crecimiento específico y tiene las unidades de tiempo" . Si k es una constante, entonces la solución de la ecuación (20.1) se puede obtener de la teoría de las ecuaciones diferenciales:
1

p(t) = p e
0 0

kl

(20.2)

d o n d e p = población cuando t = 0. En la ecuación (20.2) se observa que p(t) se aproxima al infinito en tanto t sea grande. Este comportamiento es claramente imposible para sistemas reales. Por tanto, el modelo debe ser modificado para hacerlo más realista. Solución. Primero, se debe reconocer que la razón de crecimiento específico k no puede ser una constante en tanto la población se vuelva grande. Este es el caso, y debido a q u e p se aproxima al infinito, el organismo a modelar oslará limitado por luctorcs tales como carencia de comida y producción de deiechoi tóxicos, Una forma de expresar esto

20.1

REGRESIÓN LINEAL Y MODELOS DE POBLACIÓN

en forma matemática es mediante el uso de un modelo de razón de crecimiento saturudo tal que k=k ~J—
mix

Í79

+J
mk mix

(20.3)

donde k = la razón de crecimiento obtenible máxima para grandes valores de comidu (j) y K = la constante de saturación media. En la figura 20. 1 se tiene la gráfica de la ecuación (20.3) y muestra que cuando f = K,k = k J2. Por tanto, K es la cantidad de comida disponible que respalda a una razón de crecimiento poblacional igual a la mitad de la razón máxima. Las constantes K y k son valores empíricos basados en mediciones experimentales de k para varios valores d e / Como un ejemplo, suponga que la población p representa la levadura empleada en la producción comercial de cerveza, y / e s la concentración de la fuente carbono que será fermentada. Las mediciones de k contra/para la levadura se muestran en la tabla 20.1. Se requiere calcular & y Ka partir de estos datos empíricos. Esto se lleva a cabo al invertir la ecuación (20.3) de manera similar a la ecuación (17.17) para obtener
mÍK máx

J- *±/ _!LJ_ _L.
= = +

(2

o.4)

k kf k f k "rnáxJ J
a

máx

"máx

Por este reordenamiento, se ha transformado la ecuación (20.3) en una forma lineal; esto es, l/k es una función lineal de \lf, con pendiente K/k e intercepto l/k^. Estos valores F I Gse U Rgrafican A 2 0 . 1 en la figura 20.2.
mix

Gráfica de la razón de crecimiento específico contra comida disponible para el modelo de razón de crecimiento saturado que se utiliza para caracterizar la cinética microblal. El valor de K se conoce como constante de saturación media, ya que conforma la concentración donde la razón de crecimiento específico es la mitad de su valor máximo.

580

APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS TABLA 20.1 Datos usados para evaluar las constantes de un modelo de razón de crecimiento saturado para caracterizar la cinética microbial.

f,

mg/L 7 9 15 25 40 75 100 150

k,
0.29 0.37 0.48 0.65 0.80 0.97 0.99 1.07

día"

1

\/f,
0.14286 0.11111 0.06666 0.04000 0.02500 0.01333 0.01000 0.00666

día L/mg 3.448 2.703 2.083 1.538 1.250 1.031 1.010 0.935

Debido a esta transformación, se puede usar los procedimientos por mínimos cuadrados lineales descritos en el capítulo 17 para determinar k = 1.23 días" y K = 22.18 mg/L. Estos resultados combinados con la ecuación (20.3) se comparan con los datos transformados en la figura 20.3, y después se sustituyen en el modelo de la ecuación (20.1), dando
1 milí

dp — = 1.23

f

p

(705)
V

dt 22.18+ r ' Observe que el ajuste da una suma de cuadrados de los residuos (como los calculados para los datos no transformados) de 0.001305. La ecuación (20.5) se puede resolver usando la teoría de las ecuaciones diferenciales o los métodos numéricos analizados en el capítulo 25 cuando f(t) se conoce. S i / s e aproxima a cero en tanto p sea grande, entonces dpldt se aproxima a cero y la población se estabiliza.
FIGURA 20.2 Versión linearizada del modelo de la razón de crecimiento saturado. La línea es un ajuste por mínimos cuadrados que se usa para evaluar los coeficientes del modelo fe = 1.23 d í a s " y K = 22.1 8 mg/L para una levadura que se usa para producir cerveza.
máx 1

1/í L/mg

20.1

MORESIÓN LINEAL Y MODELOS DE POBLACIÓN

III

máx

f, mg/L

FIGURA 20.3 Ajuste del modelo de razón de crecimiento saturado para una levadura empleada en la producción comercial de cerveza.

La linearización de la ecuación (20.3) es una forma para evaluar las constantes y K. Un procedimiento alternativo, que es capaz de relacionarse en esta forma original, es la regresión no lineal descrita en la sección 17.5. La figura 20.4 muestra cómo se puede usar la herramienta Solver de Excel para estimar los parámetros supuestos con regresión no lineal. Como puede verse, una columna de valores predichos es desarrollada, basada en el modelo y los parámetros iniciales. Éstos se usan para generar una columna de residuos al cuadrado que se suman, y el resultado se coloca en la celda D I 4 .

FIGURA 20.4 Regresión no lineal para ajustar el modelo de la razón de crecimiento saturado de una levadura empleada en la producción comercial de cerveza.
A 1 2 3 4 5 6 7 8 9 10 11 B D $B$1*A5/($B$2 + A5) = (B5 - C 5 ) 2
A

kmáx

K
f 7 9 15 25 40 75 100 150
1

1.2301 22.1386 k 0.29 0.37 0.48 0.65 0.80 0.97 0.99 1.07 SSR k-predicción ^
0.295508

Res 2
A

0.000030

0.355536 0.496828 0.652384 0.791842 0.949751 1.007134 1.071897

J*

0.000209 0.000283 0.000006 0.000067 0.000410 0.000294 0.000004

>SUM(D5..D12)

0,00130J]

582

APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

Después se utiliza el Solver de Excel para minimizar la celda D14 al ajustar las celdas B1:B2. El resultado, como el mostrado en la figura 20.4, da un estimado de k ^ = 1.23 y K = 22.14, con una S = 0.001302. De esta forma, aunque, como se esperaba, la regresión no lineal da un ajuste ligeramente mejor, los resultados son casi idénticos. En otras aplicaciones, esto puede no ser cierto (o la función puede no ser compatible con linearización) y la regresión no lineal podría representar la única opción factible para obtener un ajuste por mínimos cuadrados.
m x r

20.2

U S O DE S E G M E N T A R I A S P A R A E S T I M A R LA T R A N S F E R E N C I A DE CALOR (INGENIERÍA CIVIL/AMBIENTAL) Antecedentes. Los lagos en la zona templada pueden dividirse en estratos térmicos durante el verano. Como se ilustra en la figura 20.5, cerca de la superficie, el agua es tibia y liviana, y en el fondo es más fría y densa. Tal estratificación divide efectivamente el lago de manera vertical en dos capas: el epilimnion y el hipolimnion separados por un plano conocido como el thermocline. La estratificación térmica tiene gran importancia para los ingenieros ambientales que estudian la contaminación de tales sistemas. En particular, la thermocline disminuye en gran medida el mezclado entre las dos capas. Como resultado, la descomposición de materia orgánica puede acarrear reducción de oxígeno en el fondo aislado de las aguas. La ubicación de la thermocline se puede definir como el punto de inflexión de la curva temperatura-profundidad; es decir, el punto en el cual (PT/dx = 0. Es también el punto en el cual el valor absoluto de la primera derivada o gradiente es un máximo. Use segmentarias cúbicas para determinar la profundidad de la thermocline para el lago Piarte (véase la tabla 20.2). También use las segmentarias para determinar el valor del gradiente en la thermocline.
2

FIGURA 20.5 Temperatura contra profundidad durante el verano para el Lago Platte en Michigan.

7TC)
0

oI I

10

20

30

I I I II I I I i

II I
Epilimnion

10

Thermocline

S
N

20

Hypolimnion

30

20.3

ANÁLISIS DE FOURIER

983

TABLA 20.2

Temperatura contra profundidad durante el verano para el Lago Piarte en Michigan.
22.8
2.3

T,°C z,
22.8

22.8
4.9

20.6
9.1

13.9 13.7

11.7 18.3

11.1 22.9

11.1 27.2

0

m

Solución. Los datos se analizan con un programa que fue desarrollado con base en el pseudocódigo de la figura 18.8. Los resultados se despliegan en la tabla 20.3 y se enlistan las predicciones de la segmentaria junto con la primera y segunda derivada en intervalos de 1 m hacia abajo a través de la columna de agua. Los resultados se grafican en la figura 20.6. Observe cómo la thermocline está claramente localizada a la profundidad donde el gradiente es el más grande (es decir, el valor absoluto de la derivada es la más grande) y la segunda derivada es cero. La profundidad es 11.35 m y el gradiente en este punto es — 1.61°C/m.

20.3

A N Á L I S I S DE F O U R I E R ( I N G E N I E R Í A ELÉCTRICA) Antecedentes. El análisis de Fourier se usa en muchas áreas de la ingeniería. Sin embargo, se emplea de manera extensa en aplicaciones de la ingeniería eléctrica tales como en el procesamiento de señales. En 1848, Rudolph Wolf diseñó un método para cuantificar la actividad solar al contar el número de puntos individuales y grupos de puntos sobre la superficie del Sol. Calculó una cantidad que ahora se conoce como el número de puntos solares de Wolf, al sumar 10 veces el número de grupos más el conteo total de puntos individuales. En la figura 20.7 se tiene registros de este número desde 1770. Con base en los primeros datos históricos, Wolf determinó que la longitud del ciclo es de 11.1 años.

TABLA 2 0 . 3

Resultados del programa segmentario basado en el pseudocódigo de la figura 1 8.1 8. T(C) 22.8000 22.7907 22.7944 22.8203 22.8374 22.7909 22.6229 22.2665 21.6531 20.7144 19.4118 17.8691 16.2646 14.7766 13.5825 dT/dz - 0115 - 0050 0146 0305 - 0055 - 0966 - 2508 - 4735 - 7646 -1 1242 -1 4524 -1 6034 1 5759 1 3702 - 9981 d2T/dz2 .0000 .0130 .0261 -.0085 -.0635 -.1199 -.1884 -.2569 -.3254 -.3939 -.2402 -.0618 .1166 .2950 .3923 profundidad (m) 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. T(C) 12 7652 12 2483 11 9400 11 7484 11 5876 11 4316 11 2905 11 1745 11 0938 11 0543 11 0480 11 0646 11 0936 11 1000 dT/dz -.6518 -.3973 -.2346 -.1638 -.1599 -.1502 -.1303 -.1001 -.0596 -.0212 .0069 .0245 .0318 .0000 d2T/dz2 .3004 .2086 .1167 .0248 .0045 .0148 .0251 .0354 .0436 .0332 .0229 .0125 .0021 .0000

dldad (m) 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.

584

APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

T, °C 0 4 8 FIGURA 2 0 . 6 Gráficas de a) temperatura, b) gradiente y c) segunda derivada contra profundidad (m) generadas con el programa segmentarlo cúbico. La thermocllne se localiza en el punto de inflexión de la curva temperatura-profundidad. 12 16 20 24 28 a) 0

dT/dz

d*T/dz* 0.5 II

10 20_ - 2 . 0 -1.0 0.0 - 0 . 5 0.0 I I I I I I I I I IYI U IIII IMIIM I I I I I 1 I II

Thermocline

b)

c)

Use un análisis de Fourier para confirmar este resultado mediante la aplicación de una TRF a los datos de la figura 20 .3. Determine con toda precisión el periodo al desarrollar una gráfica de potencia contra periodo. Solución. Los datos para los años y el número de puntos solares se bajaron de la web y se guardaron en un archivo de tabulador delimitado: sunspotdat. El archivo se puede cargar en MATLAB y a la información del año y número se le asignaron vectores con el mismo nombre,
1

» »

load s u n s p o t . d a t year-sunspot(:,1);number-sunspot(:,2);

FIGURA 2 0 . 7 Gráfica del número de puntos solares de Wolf contra año.

1700

1800

1900

2000

En el TIEMPO en que se IMPRIMÓ la EDICIÓN en INGLII DE EITE LIBRO EL HTLM ERA HNP',//WWW,NGDC,NOU,GOV/ /ITP/SOLAR/SSN/NN,HTML. ...... .....1

20.4

ANÁLISIS DE DATOS EXPERIMENTALES

Después, se aplica una TRF a los números de puntos solares
» y-fft(number):

Después de obtener la primera armónica, se determina la longitud de la TRF («) y luego se calcula la potencia y frecuencia,
» » » >> » y(l)-[ ] ; n=length(y); power=abs(y(l:n/2)). 2; nyquist=l/2; freq=(l:n/2)/(n/2)*nyquist:
A

En este punto, el espectro de potencia es una gráfica de potencia contra frecuencia. Sin embargo, ya que el periodo es más significativo en el contexto actual, se puede determinar el periodo y una gráfica potencia-periodo,
>> p e r i o d = l . / f r e q >> plot(period,power):

El resultado, como el mostrado en la figura 20.8, indica un pico a los casi 11 años. El valor exacto se puede calcular con
>> index=-f ind(power==max(power)); >> period(index) ansI O . 9259

20.4

ANÁLISIS DE DATOS EXPERIMENTALES (INGENIERÍA MECÁNICA/AEROESPACIAL) Antecedentes. Las variables de diseño en la ingeniería son a menudo dependientes de varias variables independientes. Con frecuencia esta dependencia funcional es mejor

FIGURA 20.8 I .'.poctro de potencia para li I.'I números de puntos i i i h i e s de Wolf.

O C

<D
10

a.

h^i

1

1

U ^ L

1

1

Periodo (años)

20

30

586

APLICACIONES E N INGENIERÍA: AJUSTE DE CURVAS

caracterizada por ecuaciones de potencia multivariable. Como se analizó en la sección 17.3, una regresión lineal múltiple de datos transformados a logarítmicos proporciona un medio para evaluar tales ecuaciones. Por ejemplo, un estudio en ingeniería mecánica indica que el flujo de un fluido a través de una tubería esta relacionado con el diámetro de la tubería y la pendiente (véase la tabla 20.4). Use regresión lineal múltiple para analizar estos datos. Después use el modelo resultante para predecir el flujo en una tubería con un diámetro de 2.5 pies y una pendiente de 0.025 pies/pies. Solución.
0

La ecuación de potencias a evaluarse es
at

Q = aD

S

ai

(20.6)
3 0

donde Q = flujo (pies /s), S = pendiente (pies/pies), D = diámetro tubería (pies), y a , \ Y 2 — coeficientes. Tomando el logaritmo a esta ecuación resulta
a a

log Q = log a + ai log D + a log S
0

2

En esta forma, la ecuación es adecuada para una regresión lineal múltiple, ya que log Q es una función lineal de log S y log D. Usando el logaritmo (base 10) de los datos en la tabla 20.4, se puede generar las siguientes ecuaciones expresadas en forma matricial [recuerde la ecuación (17.22)]: 9 2.334 -18.903 2.334 0.954 -4.903 -18.903 -4.903 44.079
log a

0

11.691 3.945 -22.207

ai ai

Este sistema se puede resolver usando la eliminación de Gauss para log a = 1.7475
0

a\ = 2.62 a = 0.54
2

Si log a = 1.7475, a = 10
0

1

7 4 7 5

0

= 55.9, la ecuación (20.6) es ahora (20.7)

Q =
TABLA 2 0 . 4
Experimento 1 2 3 4 5 ó

55.9D S
262

0M

Datos experimentales para diámetro, pendiente y flujo en tubos circulares de concreto.
D i á m e t r o , pies 1 2 3 1 2 3 1 Pendiente, pies/pies 0.001 0.001 0.001 0.01 0.01 0.01 0.05 0.05 Flujo, pies /s
3

1.4 8.3 24.2

4.7
28.9 84.0 1 1.1 <W.()

7 8
9

2 3

0.05

200.0

PROBLEMAS

587

La ecuación (20.7) se puede usar para predecir el flujo para el caso de D — 2.5 pies y S = 0.025 pies/pies, como en Q = 55.9(2.5) (0.025) S '
Z62 0 54

= 84.1 pie /s
3

Debe observarse que la ecuación (20.7) se puede usar para otros propósitos además del cálculo de flujo. Por ejemplo, la pendiente se relaciona con la pérdida de carga h, y longitud de tubería L por S = hJL. Si esta relación se sustituye en la ecuación (20.7) y la fórmula resultante se resuelve para h , se obtiene la siguiente ecuación:
L

k.

-

.Q 1721
L

1.85£)4.85

Esta relación es conocida como ecuación de PROBLEMAS

Hazen-Williams.

Ingeniería química/petrolera función de la temperatura para el caso en que la concentración U\. I Realice el mismo cálculo de la sección 20.1, pero ahora use es igual a 20 000 mg/L. Use la ecuación para estimar la de cloro regresión lineal y transformaciones para ajustar los datos con concentración de oxígeno disuelto para T — 8°C. muí ecuación por potencias. Ignore el primer punto cuando ajus- 20.5 Use regresión lineal múltiple para obtener una ecuación 1 1 1 l;i ecuación. predictiva para la concentración de oxígeno disuelto como una 2 0 2 . Usted realiza experimentos y determina los siguientes valo- función de la temperatura y del cloro con base en los datos de la res ile capacidad calorífica c para varias temperaturas Tde un gas: tabla P20.3. Use la ecuación para estimar la concentración de oxígeno disuelto para una concentración de cloro de 15 000 mg/ -40 10 100 -20 70 120 L e n f = 12°C. 20.6 Al comparar los modelos de los problemas 20.4 y 20.5, un 1 250 1 280 1 350 1 480 1 580 1 700 modelo algo más sofisticado que toma en cuenta el efecto tanto I Isc regresión y determine un modelo para predecir c como una de la temperatura y del cloro en el oxígeno disuelto saturado puede ser propuesto de la forma nineión áeT. 1 0 J La concentración saturada de oxígeno disuelto en agua como una función de la temperatura y de la concentración de cloro se enlista en la tabla P20.3. Use interpolación para estimar el nivel Esto es, se supone, un polinomial de tercer orden para la tempetic oxígeno disuelto para T = 18°C con cloro = 10 000 mg/L. ¿ 0 4 . En el caso de los datos de la tabla P20.3 use la interpolación ratura y una relación lineal para el cloro, con el fin de obtener polinomial para obtener-una ecuación predictiva de segundo or- resultados superiores. Use el procedimiento general lineal por den que exprese la concentración de oxígeno disuelto como una mínimos cuadrados para ajustar este modelo con los datos de la

os = HT) + f\(c)

TABLA P 2 0 . 3

Dependencia de la concentración de oxígeno disuelto sobre la temperatura y concentración de cloro.
O x í g e n o d i s u e l t o ( m g / L ) p a r a la concentración establecida de cloro y t e m p e r a t u r a

T e m p e r a t u r a , °C 5 10 16 20 25 30

Cloro = O m g / L 12.8 11.3 10.0 9.0 8.2 7.4

Cloro = 1 0 0 0 0 m g / L 11.6 10.3 9.1 8.2 7.4 6.8

Cloro = 2 0 0 0 0 m g / L 10.5 9.2 8.2 7.4 6,7 6,1

588

APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS
Tiempo Resis. a la tensión 10 4 15 20 20 18 25 50 40 50 48

tabla P20.3. Use la ecuación resultante para estimar la concentración de oxígeno disuelto para una concentración de cloro de 20 000 mg/L en T= 30°C. 20.7 Se sabe que la resistencia a la tensión de un plástico aumenta como una función del tiempo cuando se calienta. Se dispone de los siguientes datos:

55
80

60 60

75 78

33

Ajuste a una línea recta estos datos y use la ecuación para determinar la resistencia a la tensión en un tiempo de 30 min.

20.8 Se reunieron los siguientes datos para determinar la relación entre presión y temperatura de un volumen fijo de 1 kg de nitrógeno. El volumen es de 10 m .
3

°C T,

-20
3

0 8 104

20 8 700

40 9 300

50 9 620

70 10 2 0 0

100 11 2 0 0

120 11 7 0 0

P.N / m

7 500

Emplee la ley de los gases ideales pV = nRT para determinar R con base en estos datos. Observe que para la ley Tse debe expresar en Kelvin. 20.9 El volumen específico de un vapor sobrecalentado es enlistado en tablas de vapor para diferentes temperaturas. Por ejemplo, a una presión de 2 950 lb/pulg absolutas:
2

T, °F
v

700 0.1058

720 0.1280

740 0.1462

760 0.1603

780 0.1703

20.12 Se realizó un estudio de ingeniería del transporte para determinar el diseño adecuado para carriles de bicicletas. Los datos se colectaron para anchos de carriles de bicicletas y distancias promedio entre bicicletas y carros en circulación. Los datos de 11 calles son:
Distancia x, pies A. del carri y, pies

3
5

8 10

5 7

8

6

6 6

10 10 8 9

4

5

7 8

Determine vpara T = 750 °F. 20.10 Un reactor está térmicamente estratificado con los valores de la siguiente tabla:
Profundidad, m Temperatura, °C 0 70 0.5 68 1.0 55 1.5 22 2.0 13 2.5 11 3.0 10

7.5 7

5 5.5

Como se ilustra en la figura P20.10, se puede idealizar al tanque como dos zonas separadas por un fuerte gradiente de temperatura o thermocline. La profundidad de este gradiente se puede definir como el punto de inflexión de la curva temperatura-profundidad; es decir, el punto para el cual d T/dz = 0. A esta profundidad, el flujo de calor de la superficie al fondo de la capa se puede calcular con la ley de Fourier,
2 2

FIGURA P20.10 Use una segmentaria cúbica para el ajuste de estos datos con el fin de determinar la profundidad de la thermocline. Si k = 0.01 cal/(s • cm • °C) calcule el flujo a través de esta ¡nterface.

Temperatura T, °C 20 40 60

,dT
C

¿ 7

20.11 El esfuerzo cortante, en kips por pie cuadrado (kpc) de nueve muestras tomadas a distintas profundidades en un estrato de arcilla son
Profundidad, m Esfuerzo, kpc 1.9 0.3 3.1 0.6 4.2 5.1 5.8 0.7 6.9 1.1 8.1 1.5 9.3 10.0 1.3 1.6

Ingeniería civil/ambiental

Thermocline

0.4 0.9

Eütime el E S F U E R Z O

CORTANTE A U N A P R O F U N D I D A D D E

4.5 T N .

táÍÉM

«) />)

u n i f i q u e Ion dutos. Ajusto u una linca recta los datos mediante regresión lineal. Agrcguo estu linca a la gráfica.

c) Si lu distanciu promedio mínima segura entro las bicicloüu y los carros circulando se considera de 7 pies, determine el ancho de carril mínimo correspondiente.

20.13 En la ingeniería de abastecimiento de aguas, el tamaño del reservorio depende de la estimación exacta del flujo de agua en el río del cual se toma. Para algunos ríos es difícil obtener registros históricos de muchos años atrás de tales datos de flujo. Por el contrario, datos meteorológicos sobre precipitación de muchos años atrás están a menudo disponibles. Por tanto, con frecuencia es útil determinar una relación entre flujo y precipitación. Esta relación se puede entonces usar para estimar flujos por años pero sólo cuando se hicieron dichas mediciones de precipitación. Para un río que se va a encauzar a un dique, se tienen los siguientes datos
Precipitación, cm Flujo, m / s
3

88.9 114.7

101.6 172.0

104.1 152.9

139.7 269.0

132.1 206.4

94.0 161.4

116.8 175.8

121.9 239.0

99.1 130.0

a) Grafique los datos. b) Ajuste a una línea recta los datos mediante regresión lineal. Sobreponga la línea de su gráfica. c) Use la mejor línea de ajuste para predecir el flujo de agua anual si la precipitación es de 120 cm. 2(1.14 La concentración de fósforo total (p en mg/m ) y clorofila ¡i (c en mg/m ) para cada uno de los Grandes Lagos es
3 3

o, = + sen

2mn 1 m + n + 1
2 2

m +n + 2
2 2 2

m + n + 1 + mn
2 2 2 2 2

m +n +1
2 2

2mn Km + n + 1 m + n + 1 + mn
2 2 2 2

li i<|0 Superior t e L I J O Michigan 111; J O Hurón I < i; jo Erie: C luenca oeste Cuenca central ("uenca este lurjo Ontario

4.5 8.0 5.5 39.0 19.5 17.5 21.0

0.8 2.0 1.2 11.6 4.4 3.8 5.5

Ya que es inconveniente resolver esta ecuación de forma manual, se ha reformulado como
o =
z

qf (m,n)
:

FIGURA P 2 0 . 1 5

I ,u clorofila a es un parámetro que indica cuánta vida de plantas CH\Í\ suspendida en el agua. Como tal, indica qué tan turbia y o|)iicu parece el agua. Use los datos anteriores para determinar una relación c. como una función de p. Use esta ecuación para predecir el nivel de clorofila que puede esperarse si el tratamiento ilo desechos os usado para disminuir la concentración de fósforo en la cuenca oeste del Lago Erie a 15 mg/m . 20.15 El esfuerzo vertical o debajo de la esquina de un área rectiingulur sujoln u una carga uniforme de intensidad q está dada por In solución do la ecuación do Doussinesq:
3 2

590
z

APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

donde f {m, n) se conoce como el valor influencia y m y n son relaciones adimensionales, con m = alz, n = blz y a y b como se definen en la figura P20.36. El valor influencia es entonces enlistado en una tabla, una porción de la cual se da aquí:

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8

m

n = 1.2 0.02926 0.05733 0.08323 0.10631 0.12626 0.14309 0.15703 0.16843

n=
0.03007 0.05894 0.08561 0.10941 0.13003 0.14749 0.16199 0.17389

1.4

0.03058 0.05994 0.08709 0.1 1 135 0.13241 0.15027 0.16515 0.17739

n=

debajo de la esquina de un estribo rectangular que está sujeto a una carga total de 200 1 (toneladas métricas). Exprese su respuesta en toneladas por metro cuadrado. Observe que q es igual a la carga por área. b) Resuelva el inciso d) pero ahora use la función espline de Mathcad que se describió en la sección 19.8.2. 20.16 Tres organismos portadores de enfermedades decaen de 1.6 manera exponencial en las aguas de un lago de acuerdo con el siguiente modelo.
p(t) = Ae~ '
L5

+Be~ '
03

+Ce' '
0XK

Calcule la población inicial de cada organismo (A, B y Q dadas las siguientes mediciones: i,
hr 0.5 7 1 5.2 2 3.8 3 3.2 4 2.5 .. 5 2.1 6 1.8 7 1.5 8 1.2 9 1.1

a) Si a = 4.8 y b — 16, use una interpolación polinomial de tercer orden para calcular o a una profundidad de 10 m
z 2

Pin

20.17 El mástil de un velero tiene un área de sección transversal de 10.65 cm y se construye de una aleación experimental de aluminio. Se efectuaron pruebas para definir la relación entre esfuerzo y deformación unitaria. Los resultados de las pruebas
Deformación unitaria, cm/cm Esfuerzo, N/cm
2

0.002 4965

0.0045 5 172

0.0060 5517
c

0.0013 3 586

0.0085 6 896

0.0005 1241

El esfuerzo causado por el viento se puede calcular como F/A : donde F = fuerza en el mástil y A = área de sección transversal del mástil. Este valor se puede sustituir en la ley de Hooke para determinar la deflexión del mástil: AL = deformación X L; donde L = longitud del mástil. Si la fuerza del viento es de 25 069 N, use los datos para estimar la deflexión de un mástil de 9.14 m.
c

Ingeniería eléctrica 20.18 Realice los mismos cálculos que en la sección 20.3, pero ahora analice los datos generados con f(t) = 5 eos (7í) — 2 sen (40 + 6. 20.19 Usted mide la caída de voltaje Va través de una resistencia para un número de diferentes valores de corriente i. Los resultados son
/

t i

0 0

0.1250 6.2402

0.2500 7.7880

0.3750 4.8599

0.5000 0.0000

0.25 -0.45

0.75 -0.6

1.25 0.70

1.5 1.88

2.0 6.0

Determine i en t = 0.22. 20.22 Los siguientes datos se tomaron de un experimento que mide la corriente en un alambre para diferentes voltajes suministrados:
2 3 7.8 4 10.7 5 13 7 19.3 10 27.5

V

Use interpolación polinomial para estimar la caída de voltaje para i — 1.1. Interprete sus resultados. 20.20 Realice nuevamente el cálculo del problema 20.19, pero ahora use regresión polinomial para obtener una ecuación cúbica para ajustar los datos. Grafique y evalúe los resultados. 20.21 La corriente en un alambre se mide con gran precisión como función del tiempo:

i,

A

5.2

Con base en una regresión lineal de estos datos, determine la corriente para un voltaje de 6 V Grafique la línea y los datos y evalúe el ajuste. Determine si es una buena suposición quo el intercepto sea cero. Si es así, comience la regresión y fuerce ol intercepto a cero.

PROBLEMAS

0 *1
TABLA P20.24 Datos experimentales para la caída de voltaje a través de un resistor sujeto a varios niveles de corriente
-0.25 -13.5625 0.25 13.5625 0.50 41 1.00 193

20.23 Se sabe que la caída de voltaje a través de un inductor cumple la ley de Faraday

-1.00

-.50 -41

donde V es la caída de voltaje (en volts), L es la inductancia (en henrys; 1 H = IV- s/A) e i es la corriente (en amperes). Emplee los siguientes datos para estimar L:
L

V

-193

di/dt, A/s v v
h

1 5

2 12

4 18

6 31

8 39

10 50

más que una línea recta representada por la ley de Ohm. Para cuantificar esta relación, se debe ajustar una curva a los datos. ¿Cuál es el significado, si lo hay, del intercepto de la ecuación Debido al error de medición, el método preferido para el ajuste de la curva podría ser el de regresión para el análisis de tales obtenida por regresión a partir de estos datos? datos experimentales. Sin embargo, la suavidad de esta relación, 20.24 La ley de Ohm establece que la caída de voltaje Va. través de un resistor ideal es linealmente proporcional a la corriente i asi como la precisión de los métodos experimentales, sugieren que fluye a través del resistor como en V = iR, donde R es la que la interpolación podría ser la apropiada. Use una interpolación resistencia. Sin embargo, resistencias reales podrían no siempre polinomial de quinto orden para ajustar los datos y calcule V cumplir la ley de Ohm. Suponga que usted realiza varios experi- para i = 0.10. mentos muy precisos para medir la caída de voltaje y la corrien- 20.25 Repita el problema 20.24, pero ahora determine los coefite correspondiente para cada resistencia. Los resultados, como cientes de la ecuación de quinto orden (véase la sección 18.4) se enlistan en la tabla P20.24, sugieren una relación curvilínea que ajusten los datos de la tabla P20.24. 20.26 Se realiza un experimento para determinar el porcentaje de alargamiento de un material conductor eléctrico como una función de la temperatura. Los datos resultantes son
Temperatura, °C Porcentaje de alargamiento 200 11 250 13 300 13 375 15 425 17 475 19 525 20 600 23

Prediga el porcentaje de alargamiento para una temperatura de 400°F. 20.27 Las funciones Bessel surgen con frecuencia en análisis avanzados de ingeniería, como en el estudio de los campos eléctricos p o r ejemplo. Esas funciones son usualmente no sujetas a una evaluación directa y, por tanto, a menudo se compilan en tablas matemáticas estándar. Por ejemplo,
1.8 0.3400 2.0 0.2239 2.2 0.1104 2.4 0.0025 2.6 0.0968 f p 0 100 5 212 10 448 15 949 20 2 009

Como ingeniero que trabaja en una compañía de servicio usted debe pronosticar la población que habrá dentro de 5 años, para poder anticipar la demanda de energía. Emplee un modelo exponencial y regresión lineal para hacer esta predicción.
Ingeniería mecánica/aeroespacial

listime J (2.\), d) = mediante una interpolación polinomial y b) usando segmentarias cúbicas. Observe que el valor real es 0.1666. 20.28 La población (p) de una pequeña comunidad en los suburbios de unu ciudad crece con rapidez en un periodo de 20 unos:
0

20.29 Con base en la tabla 20.4, use interpolación lineal y cuadrática para calcular Q para D = 1.23 pies y S = 0.01 pies/ pies. Compare sus resultados con los mismos valores calculados con la fórmula obtenida en la sección 20.4. 20.30 Reproduzca la sección 20.4, pero ahora desarrolle una ecuación para predecir el diámetro como una función do lu pendiente

592

APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

y flujo. Compare sus resultados con la fórmula de la sección 20.4 y analice sus resultados. 20.31 La viscosidad cinemática del agua, v, está relacionada con la temperatura en la siguiente forma:
T,°C v, 1 0 " cm /s
2 2

0 1.7923

4 1.5676

8 1.3874

12 1.2396

16 1.1168

20 1.0105

24 0.9186

Grafique estos datos a) Use interpolación para predecir va T = 7.5°C. b) Use regresión polinomial para ajustar una parábola a los datos para realizar la misma predicción. 20.32 La ley de Hooke, la cual se cumple cuando un resorte no se deforma demasiado, significa que el alargamiento del resorte y la fuerza aplicada están linealmente relacionados. La proporcionalidad es parametrizada por la constante del resorte k. Se puede establecer un valor para este parámetro de manera experimental al colocar pesos conocidos sobre el resorte y midiendo la compresión resultante. Tales datos están contenidos en la tabla P20.32 y graficados en la figura P20.32. Observe que para un peso por arriba de 40 X 10 N, la relación entre la fuerza y el desplazamiento ya no se cumple. Esta clase de comportamiento es típica de lo que se denomina un "resorte endurecido". Emplee regresión lineal para determinar un valor de k para la porción lineal de este sistema. Además, ajuste a una relación no lineal la porción no lineal. 20.33 Repita el problema 20.32 pero ahora ajuste a una curva de potencias todos los datos en la tabla P20.32. Comente sus resultados. 20.34 La distancia requerida para detener un automóvil es una función de su velocidad. Los siguientes datos experimentales fueron colectados para cuantificar esta relación:
4

FIGURA P20.32 Gráfica de fuerza (en 1 0 newtons) contra desplazamiento (en metros) para el resorte de un sistema de suspensión de un automóvil.
4

Velocidad, mi/h Distancia de frenado, pies

15 16

20 20

25 34

30 40

40 60

50 90

60 120

Estime la distancia de frenado para un carro que circula a 45 mi/h.
Desplazamiento, m

TABLA P 2 0 . 3 2

Valores experimentales para alargamiento x y fuerza F para el resorte en un sistema de suspensión de un automóvil.
0.10 10 0.17 20 0.27 30 0.35 40 0.39 60 0.42 60 0.43 70 0.44

Desplazamiento, m Fuerza, 10" N

80

PROBLEMAS Í0.35 So reulizu un experimento para definir la relación entre el P N t ú c r z o aplicado y el tiempo para fracturar un acero inoxidable. Se aplican ocho diferentes valores de esfuerzo, y los datos l'ONultantes son
il (iplic, x, kg/mm
2

593
c) Use la ecuación de mejor ajuste para predecir el tiempo do fractura para un esfuerzo aplicado de 17 kg/mm . 20.36 La aceleración debida a la gravedad a una altitud y por arriba de la superficie de la tierra está dada por
2

5 40

10 30

15 25

20 40

25 18

30 20

35 22

40 15

y, m g, m/s
2

0 9.8100

20 000 9.7487

40 000 9.6879

60000 9.6278

80

000

llwnpo de fractura, y, h

9.5682

u) Grafique los datos />) Ajuste a una línea recta los datos usando regresión lineal. Sobreponga esta línea en su gráfica.

Calcule g para y = 55 000 m.

E P Í L O G O : PARTE C I N C O
PT5.4 E L E M E N T O S DE JUICIO La tabla PT5 .4 proporciona un resumen de los elementos de juicio involucrados en el ajuste de curvas. Las técnicas se dividieron en dos grandes categorías, según sea la incertidumbre de los datos. Para mediciones imprecisas se usa regresión para desarrollar una "mejor" curva que ajuste la tendencia global de los datos sin que necesariamente pase a través de cualquier punto individual. Para mediciones precisas se usa interpolación para desarrollar una curva que pasa justo a través de cada uno de los puntos. Todos los métodos de regresión se designan para ajustar funciones que minimicen la suma de los cuadrados de los residuos entre los datos y la función. Tales métodos son denominados regresión por mínimos cuadrados. La regresión lineal por mínimos cuadrados se usa para casos en los que una variable dependiente y otra independiente se relacionan una con la otra en forma lineal. Para situaciones donde una variable dependiente y una independiente exhiben una relación curvilínea, hay varias opciones disponibles. En algunos casos, se usan transformaciones para linearizar la relación. En estos ejemplos, puede aplicarse la regresión lineal a las variables transformadas con el fin de determinar la mejor línea recta. De manera alterna, la regresión polinomial puede emplearse para ajustar una curva directamente con los datos. La regresión lineal múltiple se utiliza cuando una variable dependiente es una función lineal de dos o más variables independientes. Se puede aplicar también transformaciones logarítmicas a este tipo de regresión para algunos casos en los que la dependencia múltiple es curvilínea.

TABLA PT5.4

Comparación de las características de métodos alternos para el ajuste de curvas.
Errar asociado con d a l o s A j u s t e con los datos individuales N ú m . de p u n t o s que a j u s t a n en f o r m a exacta E s f u e r z o de programación

Método Regresión Regresión lineal Regresión polinomial

Comentarios

Grande Grande

Aproximada Aproximada

Fácil Moderado

El error de redondeo se vuelve pronunciado para versiones de orden superior

Regresión lineal múltiple Regresión no lineal Interpolación Polinomios por diferencia dividida de Newlon Polinomios de Lagrange

Grande Grande Pequeña

Aproximada Aproximada Exacta

0 0
n+ 1

Moderado Difícil Fácil Usualmente elegido para análisis exploratorios Usualmente preferido cuando se conoce ol orden

Pequeña

Exacta

n+ 1

Fácil

Segmentarlas cúblcat

Pequeña

Exacta

Ajuste por secciones

Moderado

Primera y segunda derivada laual en nodoi

PT5.5

RELACIONES IMPORTANTES Y FÓRMULAS

La regresión polinomial y lineal múltiple (observe que la regresión lineal simple es un elemento de ambas) pertenece a una clase más general de modelos de mínimos cuadrados lineales. Son clasificadas así porque son lineales con respecto a sus coeficientes. Estos modelos son típicamente implementados mediante sistemas algebraicos lineales que algunas veces están mal condicionados. Sin embargo, en muchas aplicaciones de ingeniería (esto es, para ajustes de orden inferior), esto no es así. Para casos donde sea un problema se cuenta con procedimientos alternos. Por ejemplo, se dispone de una técnica llamada polinomiales ortogonales para realizar regresión de polinomios (véase la sección PT5.6). Las ecuaciones que no son lineales con respecto a sus coeficientes son llamadas no lineales. Se dispone de técnicas de regresión especiales para ajustar tales ecuaciones. Estos son métodos aproximados que empiezan con un parámetro inicial estimado y después iterativamente regresan al punto inicial con valores que minimizan la suma de los cuadrados. La interpolación polinomial está diseñada para ajustar al único polinomio de nésimo orden que pasa justo a través de n + 1 puntos precisos. Este polinomio se presenta en dos formatos alternos. La interpolación polinomial por diferencias divididas de Newton es ideal para aquellos casos donde el orden adecuado del polinomio se desconoce. El polinomio de Newton es apropiado para tales situaciones, ya que se programa en forma fácil en un formato que sirve para comparar resultados de diferentes órdenes. Además, un error estimado se puede simplemente incorporar en la técnica. Así, usted puede comparar y escoger de los resultados al usar varios polinomios de diferente orden. La interpolación de polinomios de Lagrange es una formulación alternativa que es conveniente cuando el orden se conoce de antemano. Para esas situaciones, la versión de Lagrange es algo más simple de programar y no requiere el cálculo y almacenamiento de diferencias divididas finitas. Otro procedimiento para ajustar curvas es la interpolación segmentaria. Esta técnica ajusta un polinomio de bajo orden para cada intervalo entre los datos. El ajuste se hace de manera suave al igualar las derivadas de los polinomios adyacentes con el mismo valor en sus puntos de conexión. La segmentaria cúbica es la versión más común. Las segmentarias son de gran utilidad cuando se ajustan datos que por lo general son suaves, pero que exhiben áreas locales de cambio abrupto. Tales datos tienden a inducir oscilaciones desordenadas cuando se interpolan polinomios de orden superior. Las segmentarias cúbicas son menos propensas a esas oscilaciones debido a que están limitadas a variaciones de tercer orden. El último método que se estudia en esta parte del libro es la aproximación de Fourier. Esta área trata del uso de funciones trigonométricas para aproximar formas de onda. En contraste con las otras técnicas, el mayor énfasis de este procedimiento es no ajustar los datos a una curva. En lugar de esto, el ajuste de la curva se emplea para analizar la frecuencia característica de la señal. En particular, se dispone de una transformada rápida de Fourier para modificar en forma eficiente una función a partir del dominio del tiempo y de la frecuencia para poner en claro su estructura armónica en cuestión. PT5.5 RELACIONES IMPORTANTES Y FÓRMULAS

La tabla PT5.5 resume información importante que se presentó en la parte cinco. Esta tabla se puede consultar para tener un rápido acceso a relaciones y fórmulas.

596 TABLA PT5.5 Método Regresión lineal

EPÍLOGO: PARTE CINCO Resumen de información importante presentada en la parte cuatro. Formulación y=a
0

Interpretación gráfica

Errores

+ a,x

Regresión polinomial

n S xy, - £ x, X y, n £ x - px ] °o = Y - ° i x y=o + o x+.+ a x (Evaluación de las a equivalentes para la solución de m + 1 ecuaciones algebraicas lineales) donde a, =
l a 2 ( 2 0 ] m m

i,

y*

Regresión lineal múltiple

y = a + a,x, + • • • + a„xm Evaluación de las a equivalentes para la solución de m + 1 ecuaciones algebraicas lineales
0

i • ••
x
2

V »-Vn- 2 ~ S , - 5, S , S , ' V n - (m + s ,-s s , s ,
r/ r

s.

n -

Interpolación polinomial por diferencias divididas de Newton Interpolación polinomial de Lagrange

donde b = f(xg)
0

f \x) = b + b,
2
0

(x - x ) +
0

b( x2

*o)(*

_

x

i)

R

2

s ,- s s ,] = \x - x ( x -x ( , |x - x )6
f 0 2 2 0 2 3 2 0

[m +

b = f[x , x,, x ]
2
2 0

/ ?=( x-x ) ( x-x ( , |x - x ) f [ x ,x ,X ,x ]
x

Segmentarias cúbicas

+C x j + c¡2 *N o a t :P 'o rs m ip c i l d ia d ,s em u e a r s t nl a sv e r s o in e sd es e g u n d oo r d e n .
a
2 x 3

Una cúbica: 2 oye + + c¡x + d, se ajusta a cada intervalo entre nodos. Primera y segunda derivadas son ¡guales en cada nodo
3

x-x , \/ x - X f ( x )= f ( x ) 0 2 . * 0 < i -x A i x— /x— x +f ( x ) | < X / \ X
2 0 x x 0
XQ
\

R =
2

6 ( x-x ) ( x-x ) , ( x-x )
0 2

^ 2=I *-x ) ( x-x ) , ( x-x ) f [ x ,x , X,, x ]
0 2 3 2 0

2 2

0

2

b X j

y

t

a

v

b
3 +

i x + c x+cr
2
1

1

• nodo

+

¿2

X

2

PT5.6

M É T O D O S AVANZADOS Y REFERENCIAS ADICIONALES

597

PT5.6

MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES Aunque la regresión polinomial con ecuaciones normales es adecuada para muchas aplicaciones de la ingeniería, hay problemas en contexto donde su sensibilidad a los errores de redondeo pueden representar una seria limitación. Un procedimiento alternativo basado en polinomios ortogonales puede disminuir esos efectos. Debería observarse que de este procedimiento no se obtiene una ecuación de mejor ajuste; en vez de ello, da predicciones individuales para ciertos valores de la variable independiente. Se puede consultar a Shampine y Alien (1973) y Guest (1961) sobre información acerca de polinomios ortogonales. Mientras que la técnica de polinomios ortogonales es útil para desarrollar una regresión polinomial, no representa una solución al problema de inestabilidad para el modelo de regresión lineal general [véase ecuación (17.23)]. Un procedimiento alternativo con base en la descomposición de un solo valor, llamado método SVD, está disponible para dicho propósito. También se puede encontrar información sobre este procedimiento en Forsythe y cois. (1977), Lawson y Hanson (1974), y Press y cois. (1992). Además del algoritmo de Gauss-Newton, existe una variedad de métodos de optimización que se pueden usar de manera directa con el fin de desarrollar un ajuste por mínimos cuadrados para una ecuación no lineal. Esas técnicas de regresión no lineal incluyen los métodos de paso descendente y de Marquardt (recuerde la parte cuatro). Se puede encontrar información general sobre regresión en Draper y Smith (1981). Todos los métodos de la parte cinco se expresaron en términos de ajuste de curvas con los datos. Además, usted quizá desee ajustar una curva con otra. El objetivo principal de tal aproximación funcional es la representación de una función complicada por una versión simple que sea más fácil de manejar. Una manera de hacer esto es usar la función complicada para generar una tabla de valores. Después, las técnicas analizadas en esta parte del libro pueden usarse para ajustar polinomios a estos valores discretos. Un procedimiento alternativo se basa en el principio minimax (véase la figura 17.2c). Este principio especifica que los coeficientes de la aproximación polinomial deben ser elegidos de tal forma que la máxima discrepancia sea lo más pequeña posible. Así, aunque la aproximación pueda no ser tan buena como la dada por la serie de Taylor en el punto base, es por lo general mejor a través de todo el rango del ajuste. La economización Chebyshev es un ejemplo de un procedimiento para una aproximación funcional con base en tal estrategia (Ralston y Rabinowitz, 1978; Gerald y Wheatley, 1984; y Carnahan, Luther y Wilkes, 1969). Un área importante en el ajuste de curvas es la combinación de regresiones segmentarias con mínimos cuadrados. Así, una segmentaria cúbica se genera de tal forma que no intercepte cada punto, sino que minimice la suma de los cuadrados de los residuos entre los datos y las curvas segmentarias. El procedimiento involucra el uso de las tan conocidas segmentarias B como funciones base; son nombradas así debido a su uso como función base, y también por su característica forma de campana. Tales curvas son consistentes con un procedimiento segmentario en que su valor y su primera y segunda derivadas podrían tener continuidad en sus extremos. De esta forma se asegura la continuidad de f(x) y sus derivadas inferiores en los nodos. Wold (1974), Prenter (1974), y Cheney y Kincaid (1994) presentan un análisis de este procedimiento.

598

EPÍLOGO: PARTE CINCO

En resumen, con lo anterior se intenta proporcionarle caminos para la exploración más profunda sobre el tema, todas la referencias anteriores proporcionan descripciones de las técnicas básicas tratadas en la parte cinco. Le recomendamos consultar esas fuentes alternas para ampliar su comprensión de los métodos numéricos para el ajuste de curvas.

ii

DIFERENCIACIÓN E INTEGRACIÓN
PT6.1 MOTIVACIÓN

NUMÉRICA

El cálculo es la matemática del cambio. Como los ingenieros deben tratar en forma continua con sistemas y procesos que cambian, el cálculo es una herramienta esencial en nuestra profesión. El corazón del cálculo está relacionado con los conceptos matemáticos de diferenciación e integración. De acuerdo con la definición del diccionario, diferenciar significa "marcar por diferencias; distinguir; [ . . . ] percibir la diferencia en o entre". En el contexto de las matemáticas, la derivada, que sirve como vehículo fundamental para la diferenciación, representa la razón de cambio de una variable dependiente con respecto a una independiente. Como se ilustra en la figura PT6.1, la definición matemática de la derivada empieza con una aproximación por diferencias: A> Ax
=

f{x, + Ax) - /(*,-) Ax

(PT6.1)

donde y y f(x) son representaciones alternativas de la variable dependiente y x es la variable independiente. Si se permite que Ax se aproxime a cero, como ocurre al moverse de la figura PTó.lo a la PTó.lc, la diferencia es ahora una derivada

FIGURA

PT6.1

La definición gráfica de una derivada: debido a que Axse aproxima a cero en ir de a) a c), la aproximación por diferencias se convierte en una derivada.

602

DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

dy_
dx

=

H

M

/(*,-

+

Ax) Ax

f(x¡)

A.V-»O

donde dyldx [que se puede designar también como y'of\x¡)] es la primera derivada de y con respecto a x evaluada en x¡. Como se observa en la ilustración visual de la figura PTó.lc, la derivada es la pendiente de la tangente a la curva enx,. En cálculo, el proceso inverso de la diferenciación es la integración. De acuerdo con la definición del diccionario, integrar significa "llevar junto, como partes, en un todo; unir; indicar la cantidad t o t a l . . . " . Matemáticamente, la integración se representa por (PT6.2) que se tiene para la integral de la funciónf(x) con respecto a la variable independiente x, evaluada entre los límites x = a a x = b. La función f(x) en la ecuación (PT6.2) es llamada integrando. Como lo sugiere la definición del diccionario, el "significado" de la ecuación (PT6.2) es el valor total, o sumatoria de f(x)dx sobre el rango x = a a b. De hecho, el símbolo / es ahora una letra S estilizada que intenta representar la conexión cercana entre integración y sumatoria. La figura PT6.2 representa una manifestación gráfica del concepto. Para funciones que están por arriba del eje x, la integral se expresa por la ecuación (PT6.2) que corresponde al área bajo la curva de f(x) entre x — a y b.
1

1

Debería observarse que el proceso representado por la ecuación ( P T 6 . 2 ) y la figura P T 6 . 2 es llamado

integración definida. Hay otro tipo que se denomina integración indefinida en la cual los límites a y b no están especificados. Como se analizará en la parte siete, la integración indefinida trata con la determinación de una
función de la cual se da su derivada.

F I G U R A PT6.2 Representación gráfica de la integral de í(x] entre los límites x = o a b. La integral es equivalente al área bajo la curva.

'W4

Pro.l

MOTIVACIÓN

é o s

Como se dijo antes, la "selección o discriminación" de la diferenciación y el "llevar junto" de la integración se vinculan en forma estrecha con procesos que, de hecho, están inversamente relacionados (véase la figura PT6.3). Por ejemplo, si se tiene una función dada y (í) que especifica la posición de un obj eto como función del tiempo, la diferenciación proporciona un medio para determinar su velocidad, como en (véase figura PT6.3a). v(t) = d —y(t) at

De manera inversa, si se tiene la velocidad como función del tiempo, la integración se usará para determinar su posición (véase figura PT6.36), y(t) =

Jo

f

v(t) dt

De esta manera, podemos generalizar que la evaluación de la integral

" /cb
1 f(x) dx es equivalente a resolver la ecuación diferencial dx y (b) dada la condición inicial y (a) = 0. para una

Ja = I

— = /(*)

604

DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

Debido a esta relación cercana, optamos por dedicar esta parte del libro a ambos procesos. Entre otras cosas, esto proporcionará la oportunidad de resaltar sus similitudes y diferencias desde una perspectiva numérica. Además, nuestro análisis tendrá relevancia en las siguientes partes del libro, donde se tratarán ecuaciones diferenciales. Métodos s i n computadora p a r a diferenciación e integración

\/Í.PT6.1.1

La función que será diferenciada o integrada estará usualmente en una de las siguientes tres formas: 1. 2. 3. Una función simple continua tal como una polinomio, una exponencial o una función trigonométrica. Una función continua complicada que es difícil o imposible de diferenciar o integrar de manera directa. Una función tabulada donde los valores de x y f(x) están dados en un número de puntos discretos, como es frecuente el caso en datos experimentales o de campo.

En el primer caso, la derivada o integral de una simple función se puede evaluar en forma analítica mediante cálculo. Para el segundo caso, las soluciones analíticas son a menudo imprácticas y algunas veces imposibles de obtener. En estos ejemplos, así como en el tercer caso de datos discretos, se debe emplear métodos aproximados. Un método sin computadora para determinar las derivadas a partir de datos es conocido como diferenciación gráfica por áreas iguales. En este método los datos (x, y) se tabulan y, para cada intervalo, se emplea una diferencia dividida simple Ay/Ax para estimar la pendiente. Después, esos valores se grafican como una curva de pasos contra x (véase figura PT6 .4). Luego se dibuja una curva suave que intenta aproximar el área bajo

FIGURA

PT6 .4

Diferenciación por áreas iguales, o) Se usan las diferencias divididas centradas para estimar la derivada para cada X intervalo entre los datos, b) Las 0 estimaciones de la derivada se 3 representan en forma de gráfica de barras. Se superpone 6 una curva suave sobre esta 9 gráfica para aproximar el área bajo la gráfica de barras. Esto 15 se lleva a cabo al dibujar la 18 curva de tal forma que áreas ¡guales positivas y negativas estén equilibradas, c) Se pue(lo entonces leer los valores de de la curva suave,

y
0 200 350 470 650 720

Ay/Ax 66.7 50 40 30 23.3 15 18

dy/dx
76.50 57.50 45.00 36.25 25.00 21.50

dy/dx.

0

3

6

9

12

15

18

x

C)

PT8.1

MUIITAUUIN

la curva de pasos. Es decir, se dibuja así para equilibrar las áreas negativas y positivas. Las razones para valores dados de x pueden entonces leerse en la curva. En el mismo contexto, se emplearon procedimientos visualmente orientados para integrar los datos tabulados y las funciones complicadas antes de la llegada de la computadora. Un procedimiento simple intuitivo es graficar la función sobre una cuadrícula (véase figura PT6.5) y contar el número de cuadros que aproximen el área. Este número multiplicado por el área de cada cuadro proporciona una burda estimación del área total bajo la curva. Dicha estimación se puede refinar, a expensas de un esfuerzo adicional, al usar una cuadrícula más fina. Otro procedimiento de sentido común es dividir el área en segmentos verticales, o barras, con una altura igual al valor de la función en el punto medio de cada barra (véase figura PT6.6). El área de los rectángulos puede entonces calcularse al sumar el área total estimada. En este procedimiento se supone que el valor en el punto medio proporcionu una aproximación válida de la altura promedio de la función para cada barra. Como para el método de cuadrícula, es posible hacer estimaciones más refinadas al usar más (y más delgadas) barras para aproximar la integral. Aunque un procedimiento así de simple tiene utilidad para estimaciones rápidas, so dispone de técnicas numéricas alternativas para el mismo propósito. No es de sorprender que el más simple de estos métodos sea similar, en esencia, a las técnicas sin computadora. Para diferenciación, las técnicas numéricas fundamentales usan diferencias divididas finitas para estimar derivadas. Para datos con error, un procedimiento alterno es ajustar los datos a una curva suave con una técnica como la de regresión por mínimos cuadrados y después diferenciar esta curva para obtener estimaciones de la derivada. En el mismo sentido, se dispone de integración numérica o métodos de cuadratura para obtener integrales. Esos métodos, que de hecho son más fáciles de implementar que

606

DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

con el procedimiento de cuadrícula, son similares en esencia al método por barras. Es decir, las alturas de la función se multiplican por el ancho de las barras y se suman para estimar la integral. Sin embargo, con elecciones inteligentes de factores ponderados, la estimación resultante se puede hacer más exacta que para el "método de barras" simple. Como en el método de barras simple, las técnicas numéricas de integración y diferenciación utilizan datos en puntos discretos. Como la información ya está tabulada en tal forma, es naturalmente compatible con muchos de los procedimientos numéricos. Aunque las funciones continuas no están originalmente en forma discreta, es a menudo una proposición simple usar las ecuaciones dadas para generar una tabla de valores. Como se ilustra en la figura PT6.7, esta tabla se puede entonces evaluar con un método numérico. PT6.1.2 Diferenciación numérica e integración en ingeniería

La diferenciación e integración de una función tiene tantas aplicaciones en la ingeniería que usted requeriría estudiar cálculo diferencial e integral en su primer año en la universidad. Muchos ejemplos específicos de tales aplicaciones se podrían dar en todos los campos de la ingeniería. La diferenciación es algo común en ingeniería debido a que mucho de nuestro trabajo involucra caracterizar los cambios de las variables tanto en tiempo como en espacio. De hecho, muchas de las leyes y otras generalizaciones que figuran de manera prominente en nuestro trabajo se basan en predecibles en las cuales el cambio mismo se manifiesta en el mundo físico. El ejemplo principal es la segunda ley de Newton, que no está dirigida en términos de la posición de un objeto, sino en su cambio de posición con respecto al tiempo. Además de tales ejemplos temporales, numerosas leyes que gobiernan el comportamiento espacial de las variables se expresan en términos de derivadas. Entro las más comunes figuran las leyes que involucran potenciales o gradientes. Por ejemplo, la ley de

PT6.1

MOTIVACIÓN

607

/ * 2 + c o s ( 1 +> / V1 + 0.5 ser •'O
2

X

0.25 0.75 1.25 1.75

2.599 1.945 1.993

2.414

M

FIGURA

PT6.7

Aplicación de un método de integración numérico: a| Una función continua complicada, b) Tabla de valores discretos de f[x) generados a partir de la función, c) Uso de un método numérico (el método do barras) para estimar la Integral con base en los puntos discretos. Para una función tabulada, los datos están ya en forma tabular b); por tanto, el paso a) es innecesario.

Fourier para la conducción de calor cuantifica la observación de que el calor fluye de regiones de alta a baja temperatura. Para el caso de una dimensión, ésta se puede expresar matemáticamente como Flujo de calor = —k' dT dx

Así, la derivada proporciona una medida de la intensidad del cambio de la temperatura, o gradiente, que promueve la transferencia de calor. Leyes similares proporcionan modelos de trabajo en muchas áreas de la ingeniería, entre ellos el modelado de dinámica de fluidos, transferencia de masa, cinética de reacción química y flujo electromagnético. La habilidad para estimar de manera exacta las derivadas es una faceta importante de nuestra capacidad para trabajar de manera efectiva en estas áreas. Así como las estimaciones exactas de las derivadas son importantes en ingeniería, también el cálculo do integrales es valioso. Varios ejemplos se relacionan direclnmonle

608

DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

FIGURA

PT6.8

Ejemplos de cómo se usa la integración para evaluar aplicaciones en áreas de la ingeniería, a) Un topógrafo podría necesitar saber el área de un campo limitado por una corriente en forma de curvas y dos caminos, b) Un ingeniero abastecedor de aguas quizá requiera saber el área de sección transversal de un río. c) Un ingeniero en estructuras tal vez necesite determinar la fuerza neta ejercida por un viento no uniforme soplando contra un lado de un rascacielos.

con la idea de la integral como el área bajo la curva. La figura PT6.8 ilustra algunos casos donde la integración se usa para este propósito. Otras aplicaciones comunes relacionan la analogía entre integración y sumatoria. Por ejemplo, una aplicación común es determinar la media de funciones continuas. En la parte cinco se abordaron los conceptos de la media de n datos discretos [recuerde la ecuación PT6 .1]:

£

Media = — —
n

(PT6.3)

donde y¡ son las mediciones individuales. La determinación de la media de puntos discretos se ilustra en la figura PT6.9a. En contraste, suponga que y es una función continua de una variable independiente x, como se ilustra en la figura PT6.9a. Para este caso existe un número infinito de valores entre ay b. Así como con la ecuación (PT6.3) que se aplica para determinar la media, usted podría interesarse en calcular la media o promedio de la función continua y = f(x) para el intervalo de a a b. La integración se usa para este propósito, como lo especifica la fórmula

Media = ^ -

í

f(x) b - a

dx (PT6 .4)

PTÓ.1

MOTIVACIÓN

609

2

3

4 a)

Media

J I n nm i H lu In d e a ls m e d a i miu u l il h 11o i) d s lc r e o t y
HOURA P T 6 . 9
|t) (-MIIIIIUII ) *

Esta fórmula tiene cientos de aplicaciones en ingeniería. Por ejemplo, se usa para calcular el centro de gravedad de objetos irregulares en la ingeniería mecánica y civil y para determinar la raíz media cuadrática en ingeniería eléctrica. Las integrales son empleadas también por ingenieros para evaluar la suma o cantidad total de una variable física dada. La integral se evalúa sobre una línea, un área o un volumen. Por ejemplo, la masa total química contenida en un reactor está dada como el producto de la concentración de químicos en el volumen del reactor, o Masa = concentración X volumen donde la concentración tiene unidades de masa por unidad de volumen. Sin embargo, suponga que la concentración varía de un lugar a otro dentro del reactor. En este caso, es necesario sumar los productos de concentraciones locales c y los volúmenes del elemento correspondiente AV¡:
i

n

Masa =

c¡ AV¡

;=i
donde n es el número de volúmenes discretos. Para el caso continuo, donde c(x, y, z) es una función conocida yx,yyz son las variables independientes que designan la posición en las coordenadas cartesianas, la integración se usará para el mismo propósito: Masa == / / / c(x, y , z) dx dy dz

610

DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

Masa =

-///

c(V)dV

la cual es conocida como una integral de volumen. Observe la fuerte analogía entre sumatoria e integración. Ejemplos similares podrán darse en otros campos de la ingeniería. Por ejemplo, la razón total de transferencia de energía a través de un plano donde el flujo (en calorías por centímetro cuadrado por segundo) es una función de la posición, está dada por Transferencia de calor = / / flujo dA

la cual es referida como una integral de área, donde A = área. De manera similar, para el caso en una dimensión, la masa total de una barra con densidad variable y que tiene un área de sección transversal constante, está dada por m = A

Jo

I

p(x) dx

donde m = masa total (kg), L = longitud de la barra (m), p(x) = densidad conocida (kg/ m ) como una función de la longitud x (m) y A = área de sección transversal de la barra (m ). Por último, las integrales se usan para evaluar diferenciales o razón de ecuaciones. Suponga que la velocidad de una partícula es una función continua conocida del tiempo v(t),
3 2

— = v(t) dx La distancia total y recorrida por esta partícula en un tiempo t está dada por (véase figura PT6.36) y = í v(t)dt Jo (PT6.5)

Éstas son sólo algunas aplicaciones de diferenciación e integración que usted podría enfrentar en forma regular en el desarrollo de su profesión. Cuando las funciones sujetas a análisis son simples, usted normalmente escogerá evaluarlas desde un contexto analítico. Por ejemplo, en el problema del paracaidista en caída, determinamos la solución para la velocidad como una función del tiempo [véase ecuación (1.10)]. Esta relación podría sustituirse en la ecuación (PT6.5), la cual se integraría con facilidad para determinar la distancia a la que caerá el paracaidista en un tiempo t. Para este caso, la integral es simple de evaluar. Sin embargo, es difícil, o imposible, cuando la función es complicada, como típicamente sucede en el caso de ejemplos más realistas. Además, la función en turno es a menudo desconocida y definida sólo por mediciones en puntos discretos. Para ambos cesoí, usted debe tener la habilidad pera obtener valores aproximados para las

PT8.Z ArNTBCBODNTíBTVWMTnvwnwa

W I

I

derivadas e integrales mediante técnicas numéricas. Algunas de estas técnicas se analizarán en esta parte del libro.

PT6.2

ANTECEDENTES MATEMÁTICOS En el nivel medio superior o durante su primer año en el nivel superior, se le dará una introducción de cálculo diferencial e integral. Ahí usted aprenderá las técnicas para obtener derivadas exactas o analíticas e integrales. Cuando diferenciamos una función en forma analítica, generamos una segunda función que se usa para calcular la derivada para diferentes valores de la variable independiente. Se dispone de reglas generales para este propósito. Por ejemplo, en el caso del monomio y = x" se aplica la siguiente regla simple (n dy dx = nx ~
n l

0)

que es la expresión de la regla más general para y = u donde u = una función de x. Para esta ecuación, la derivada se calcula realizando dy — = nu dx du — dx

Otras dos fórmulas se aplican a los productos o cocientes de funciones. Por ejemplo, si el producto de dos funciones de x(u y v) se representa comoy = uv, entonces la derivada puede calcularse como dy dx dv dx du dx

Para la división, y = w/u, la derivada se calcularía como du dy dx dx v
2

dv dx

Otras fórmulas útiles se resumen en la tabla PT6.1. Se dispone de fórmulas similares para integración definida, en las cuales se busca determinar una integral entre límites específicos, como en / = f

De acuerdo con el teorema fundamental evalúa como

Ja

f(x) dx

(PT6.6) del cálculo integral, la ecuación (PT6.6) se

612

DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN TABLA PT6.1 Algunas derivadas de uso común.
d — sen x = eos x dx d — eos x = -sen x dx
D

d — cot x = -esc dx

2

x

d — sec x = sec x tan x dx

, tan x = sec 2 x

d —
dx

esc x = -esc x cot x

dx d . 1 — In x = — dx x dx e* = é

d , 1 — log x = dx x In a
0

— a* = a* In a dx

í

" f(x) dx = F(x)\"

a

donde F(x) = integral de f(x); es decir, cualquier función tal que F'(x) = f(x). La nomenclatura del lado derecho es para F(x)\
b a

= F(b)-F(a)

(PT6.7)

Un ejemplo de una integral definida es
/•0.8

/ = / Jo

(0.2 + 25* - 200x + 675x - 900x + 400x ) dx
2 3 4 5

(PT6.8)

Para este caso, la función es un polinomio simple que se puede integrar de manera analítica al evaluar cada término de acuerdo con la regla

donde n no puede ser igual a — 1. Si se aplica esta regla a cada término en la ecuación (PT6.8) se obtiene , / = 0.2x + 12.5x
2

í

b

x

n+\

x" dx

n + 1

(PT6.9)

200 , , , 400 x + 168.75x - 180x + — x
3 4 5

0.8

(PT6.10)

la cual se evalúa de acuerdo con la ecuación (PT6.7) como / = 1.6405333. Este valor es igual al área bajo el polinomio original [véase ecuación (PT6.8)] entre x = 0 y 0.8. La integración anterior depende del conocimiento de la regla expresada con la ecuación (PT6.9). Otras funciones siguen diferentes reglas. Estas "reglas" son sólo ejemplos de antidiferenciación; es decir, encontrar F(x) de tal forma que F'(x) = f(x). En consecuencia, la integración analítica depende del conocimiento anterior a la respuesta. Tal conocimiento se adquiere con entrenamiento y experiencia. Muchas de las reglas se resumen en manuales y tablas de integrales. Enlistamos algunas de las más comunes en la tabla PT6.2. Sin embargo, muchas funciones de importancia práctica ion demasiado

PT6.3

ORIENTACIÓN

613

TABLA PT6.2

Algunas integrales simples que se usan en la parte seis. En esta tabla las letras a y b son constantes y deberían no confundirse con los limites de integración analizados en el texto.

J u dv = uv- jv du
\u"du = ——+C
x a f

n*-l

1

f a dx = — — + C a > 0, a * 1 bino
/ — = Inixl+ C x*0

1

í sen [ax + b) dx = a - - eos [ax + 6) + C
J

í eos [ax + b) dx = - sen ( a x + b) + C a jI n i x la x=xI n i x l -x+ C

complicadas para ser contenidas en tales tablas. Una razón por la que las técnicas en esta parte del libro son tan valiosas, es porque proporcionan un medio para evaluar relaciones como la ecuación (PT6.8) sin conocimiento de las reglas.

j

PT6.3

ORIENTACIÓN Antes de proceder con los métodos numéricos para integración, podría ser de utilidad alguna orientación adicional. Lo siguiente pretende ser una revisión del material analizado en la parte seis. Además, formulamos algunos objetivos que ayudarán a enfocar su esfuerzo cuando estudie el material. PT6.3.1 Alcance y antecedentes

La figura PT6.10 proporciona una revisión de la parte seis. El capítulo 21 se dedica al más común de los procedimientos para integración numérica (las fórmulas de NewtonCotes). Esas relaciones se basan en el reemplazo de una función complicada o datos tabulados con un simple polinomio que es fácil de integrar. Tres de las fórmulas de Newlon-C 'otcH con un U N O más extendido se analizan con detalle: lu regla trapezoidal, la

614

DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

FIGURA P T 6 . 1 0 Organización esquemática del material en la parte seis: Diferenciación numérica e integración.

regla 1/3 de Simpson, y la regla 3/8 de Simpson. Todas ellas están diseñadas para casos en los que los datos a integrarse están espaciados de manera uniforme. Además, incluimos un análisis de integración numérica de datos espaciados de manera no uniforme. Este tema es muy importante, ya que las aplicaciones en el mundo real tienen que ver con datos espaciados de esta forma.

FT6.3

ORIENTACIÓN

611

Todo el material anterior se relaciona con la integración cerrada; es decir, cuando los valores de la función en los extremos de los límites de integración son conocidos. Al final del capítulo 21 presentamos fórmulas de integración abierta; es decir, donde los límites de integración se extienden más allá del rango de los datos conocidos. Aunque dichas fórmulas no se usan de manera común para la integración definida, las fórmulas de integración abierta, se presentan aquí debido a que se utilizan mucho en la parte siete para la solución de ecuaciones diferenciales ordinarias. Las formulaciones vistas en el capítulo 21 pueden emplearse para analizar tanto los datos tabulados como las ecuaciones. El capítulo 22 trata con dos técnicas que están expresamente diseñadas para integrar ecuaciones y funciones: integración de Romberg y cuadratura de Gauss. Se proporciona algoritmos de cómputo para ambos métodos. Además, se analizan los métodos para evaluar integrales impropias. En el capítulo 23 se presenta información adicional sobre diferenciación numérica como suplemento del material introductorio del capítulo 4. Los temas incluyen fórmulas por diferencias finitas de alta exactitud, extrapolación de Richardson y la diferenciación de datos espaciados de manera no uniforme. Se analiza el efecto de los errores de redondeo para la diferenciación numérica así como para integración. Por último, se concluye el capítulo con una descripción de la aplicación de diferentes paquetes de software y librerías para integración y diferenciación. El capítulo 24 demuestra cómo se puede aplicar los métodos para la resolución de problemas. Como en las otras partes del libro, las aplicaciones se toman de todos los campos de la ingeniería. Una sección de repaso, o epílogo, se incluye al final de la parte seis. Esta revisión incluye un análisis de los elementos de juicio que son relevantes para la implementación en la práctica de la ingeniería. Además, se resumen fórmulas importantes. Por último, se presenta una breve revisión de los métodos avanzados y referencias alternativas que facilitarán sus estudios adicionales de la diferenciación e integración numérica.

FT6.3.2 Metas y objetivos
Objetivos d e estudio. Después de terminar la parte seis, usted será capaz de resolver muchos problemas de integración y diferenciación numérica y apreciará su aplicación para solución de problemas en ingeniería. También deberá esforzarse para manejar las diferentes técnicas y asegurar su confiabilidad. Usted deberá entender que los elementos de juicio involucrados en la selección del "mejor" método (o métodos) para cualquier problema en particular. Además de estos objetivos generales, debería asimilarse y manejarse los conceptos específicos que se enlistan en la tabla PT6.3. Objetivos computacionales. Se le proporcionó ya el software y algoritmos de cómputo simple para ímplementar las técnicas analizadas en la parte seis. Todo esto tiene utilidad como herramientas de aprendizaje. Se le proporcionó para su PC el software TOOLKIT de métodos numéricos que es de uso amigable. Emplea la regla trapezoidal para evaluar la integral de funciones continuas o datos tabulados. Las gráficas obtenidas con este software le permitirán visualizar con facilidad su problema y las operaciones matemáticas asociadas, como el área entre la curva y el eje x. El software es fácil de usar para resolver muchos problemas prácticos

616

DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN TABLA P T 6 . 3 Objetivos de estudio específicos para la parte seis.

1. Entender la derivación de las fórmulas de Newton-Cotes; saber cómo derivar la regla trapezoidal y cómo acondicionar la derivación de ambas reglas de Simpson; reconocer que las reglas trapezoidal y de Simpson 1/3 y 3 / 8 representan las áreas de los polinomios de primer, segundo y tercer orden, respectivamente. 2. Conocer las fórmulas y ecuaciones de error para a) la regla trapezoidal, b) la regla trapezoidal de aplicación múltiple, c) regla de Simpson 1/3, d) regla de Simpson 3 / 8 , y e). regla de Simpson de aplicación múltiple. Ser capaz de escoger la "mejor" de estas fórmulas para cualquier problema de contexto particular. 3. Reconocer que la regla de Simpson 1 / 3 es exacta de cuarto orden, aun cuando está basada en sólo tres puntos; darse cuenta de que todas las fórmulas de Newton-Cotes de segmentos pares y puntos nones tienen exactitud resaltada similar. 4. Saber cómo evaluar la integral y derivada de datos desigualmente espaciados. 5. Reconocer la diferencia entre las fórmulas de integración abierta y cerrada. 6. Entender la base teórica de extrapolación Richardson y cómo se aplica en el algoritmo de integración Romberg para diferenciación numérica. 7. Entender la diferencia fundamental entre las fórmulas de Newton-Cotes y cuadratura de Gauss. 8. Reconocer por qué la integración de Romberg y la cuadratura de Gauss tienen utilidad cuando se integran ecuaciones (como opuestas a datos tabulares o discretos). 9. Saber cómo se emplean la fórmulas de integración abierta para evaluar integrales impropias. 10. Entender la aplicación de fórmulas por diferenciación numérica de alta exactitud. 1 1. Saber cómo diferenciar datos desigualmente espaciados. 1 2. Reconocer los diferentes efectos del error de datos en el proceso de integración y diferenciación numérica.

y se puede también usar para verificar los resultados de cualquiera de los programas de computadora que usted haya desarrollado. Además, se proporcionan los algoritmos para la mayoría de los otros métodos de la parte cinco. Esta información le permitirá aumentar su librería de software al incluir técnicas más allá de la regla trapezoidal. Por ejemplo, usted podría encontrarlo útil, desde un punto de vista profesional, al tener el software para implementar integración y diferenciación numérica para datos espaciados de manera no uniforme. También podría desarrollar su propio software para las reglas de Simpson, integración de Romberg y cuadratura de Gauss, los cuales son más eficientes y exactos que la regla trapezoidal. Por último, una de las metas más importantes debería ser manejar varios paquetes de software de uso general que están ampliamente disponibles. En particular, usted debería habituarse a usar estas herramientas para implementar métodos numéricos en la solución de problemas de ingeniería.

CAPÍTULO 2 1 K\ Fórmulas de integración de Newton-Cotes
i £ Lasfórmulas de integración de Newton-Cotes son los esquemas de integración numérica más comunes. Se basan en la estrategia de reemplazar una función complicada o datos tabulados con una función aproximada que sea fácil de integrar:
pb pb

1=

donde fn(x) — polinomio de la forma
f„(x) -

Ja Ja
a
0

f(x)dx

=

f (x)dx
n

(21.1)

+a\X

H

ha„_iA'"

_ i

+

a„x"

donde n es el orden del polinomio. Por ejemplo, en la figura 21.1a, se usa un polinomio de primer orden (una línea recta) como una aproximación. En la figura 21.1 b, se emplea una parábola para el mismo propósito. La integral se puede también aproximar mediante una serie de polinomios aplicada por pedazos a la función o datos sobre segmentos de longitud constante. Por ejemplo, en la figura 21.2, se usan tres segmentos de línea recta para aproximar la integral. Pueden utilizarse polinomios de orden superior para los mismos propósitos. Con este anteceden-

FIGURA

21.1

|ci aproximación de una InMjiol como el área bajo o) una sola línea recta y /i) una sola parábola.

618

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

te, reconocemos que el "método de barras" en la figura P T 6 . 6 emplea una serie de polinomios de orden cero (es decir, constantes) para aproximar la integral. Se dispone de formas cerradas y abiertas de fórmulas de Newton-Cotes. Las formas cerradas son aquellas donde los datos al inicio y final de los límites de integración son conocidos (véase figura 21.3a). Las formas abiertas tienen límites de integración que se extienden más allá del rango de los datos (véase figura 21.3¿>). En este sentido, son similares a las de extrapolación, como se analizó en la sección 18.5. Las formas abiertas de Newton-Cotes no se usan por lo general para integración definida. Sin embargo, se utilizan para evaluar integrales impropias y la solución de ecuaciones diferenciales ordi-

FIGURA 21.2 La aproximación de una integral como el área bajo tres segmentos de línea

f(x)n

FIGURA 21.3 La diferencia entre fórmulas de integración a) cerrada y b) abierta.

21.1 IA
ntirins. Esto capítulo tnfktliM las formas cerradas. Sin embargo, se introduce de manera breve el material sobre fórmulas abiertas de Newton-Cotes al final del capítulo.

21.1

LA REGLA TRAPEZOIDAL La regla trapezoidal es la primera de las fórmulas de integración cerrada de NewtonCotes. Corresponde al caso donde el polinomio en la ecuación (21.1) es de primer orden:

pb rb
I = fi(x) = f(a) + — - ( x - a) Recuerde del capítulo 18b que una línea recta se representa como [véase ecuación (18.2)] - a (21.2) El área bajo esta línea recta es un estimado de la integral de f(x) entre los límites a y b\
r b r

Ja Ja
i
a

f(x)dx

=

h(x)dx

-I.

+ m

/(*) - /(«) -(x — a) dx b-a

El resultado de la integración (véase el cuadro 21.1 para detalles) es
1 = { b )

m ± m _

(21.3)

la cual se denomina regla trapezoidal.

Cuadro 21.1

O b t e n c i ó n de la regla t r a p e z o i d a l

AlllM de ln Integración, ia ecuación (21.2) se puede expresar
T'LLLLLLL

Este resultado se evalúa para dar f(b) - f(a) (b - a ) bf(a) af(b) I = — + (b-a) b—a 2 b—a
2 2 i /u

, , ,
A|RUPTNÜ()

/'(/') /(«) h a

, „ ,

af(b)-af(a) o—a

los últimos dos términos se obtiene W-fta) •b-a ~x + bf(a)-af(a)-af{b)+af(a) b-a

Ahora, como b — a = (b — a)(b + a),
2 2

, , f\tt)-"
f

/ = íñb) - f{a)]

b

-^-

+ bf(a) - af(b)

Si se multiplica y agrupa términos se tiene , , , ni') - ña) /lid, x + b-a bf(a)-af(b) b-a
/ = ( 6

_

A

)

M ± M

2 que OH la fórmula para la regla trapezoidal.

IM tiiiil puedo Inlegrarso entre x = a y x = b pura obtener IV»
m

- f{a) x

2

bf(a) 2

-«/(/» '*

" h • "u~

b-a

620

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

Geométricamente, la regla trapezoidal es equivalente a aproximar el área del trapezoide bajo la línea recta que conecta f(á) y f(b) en la figura 21.4. Recuerde de geometría que la fórmula para calcular el área de un trapezoide es la altura por el promedio de las bases (véase figura 21.5a). En nuestro caso, el concepto es el mismo, pero el trapezoide está sobre su lado (véase figura 21.5¿). Por tanto, la integral se representa como / = ancho x altura promedio (21.4)

FIGURA

21.4

Ilustración gráfica de la regla trapezoidal.

FIGURA

21.5

a) La fórmula para calcular el área de un trapezoide: altura por el promedio de las bases. b) Para la regla trapezoidal, el concepto es el mismo pero ahora el trapezoide está sobre su lado.

o I as (b — a) x altura promedio (21.5)

donde, para la regla trapezoidal, la altura promedio es el promedio de los valores de la función en los puntos extremo, o \f(a) + f(b)]/2. Todas las fórmulas cerradas de Newton-Cotes pueden expresarse en el formato general de la ecuación (21.5). De hecho, sólo difieren con respecto a la formulación de la altura promedio. 21.1.1

E R R O R

D E

LA

R E G I A

T R A P E Z O I D A L

Cuando empleamos la integral bajo un segmento de línea recta para aproximar la integral bajo una curva, obviamente podemos incurrir en un error que puede ser sustancial (véase figura 21.6). Una estimación para el error de truncamiento local de una sola aplicación de la regla trapezoidal es (véase cuadro 21.2) £ = - ^ / " ( © ( 6 - « )
(

3

(21.6)

donde ¿¡ está en algún lugar en el intervalo de a a b. La ecuación (21.6) indica que si la función sujeta a integración es lineal, la regla trapezoidal será exacta. De otra manera, para funciones con derivadas de segundo orden y superior (es decir, con curvatura), puede ocurrir algún error.

FIGURA

21.6
2 3 4 5

Ilustración gráfica del uso de una sola aplicación de la regla trapezoidal para aproximar la integral de f[x) = 0.2 + 2 5 x - 200x + Ó75* - W O x + AOOx de x = 0 a 0.8.

622

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES Cuadro 2 1 . 2 O b t e n c i ó n y e r r o r estimado de la regla t r a p e z o i d a l

Una manera alternativa para la obtención de la regla trapezoida es integrando la interpolación polinomial hacia adelante de Newton-Gregory. Recuerde que para la versión de primer orden con término de error, la integral podría ser (véase cuadro 18.2)

Si se asume que para una h pequeña, el término/"^) es aproxi madamente constante, esta ecuación se puede integrar: I = h «/( ) + y A / ( ) +
fl f l

a

2

(o?

-

Ja

~4~

fia) + Afia)a

+ —^-aia

- l)h

2

dx (B21.2.1)

y

e v a

i

u a r

C

omo
f(a) + Afia)

rm

2

Para simplificar el análisis, considere que como a = (x — a)lh, dx = hda Debido a que h — b — a (para un segmento de la regla trapezoidal), los límites de integración a y b corresponden a 0 y 1, respectivamente. Por tanto, la ecuación (B21.2.1) se expresaría como
/ =h ) + Afia)a + ^-^aia - \)h
2

/ =h

Como Af(a) = /(6) — fia), el resultado podría escribirse como

I = h f^+W-J-fxW
2 12 Regla trapezoidal Error de truncamiento Así, el primer término es la regla trapezoidal y el segundo es un;i aproximación para el error.

da

E J E M P L O 21.1

Aplicación simple de la regla trapezoidal
Enunciado del problema. fix) Use la ecuación (21.3) para integrar numéricamente
2 3

= 0.2 + 25x - 2Q0x if 675x

- 900.v + 400x
4

5

desde a — 0 a b = 0.8. Recuerde de PT6.2 que el valor exacto de la integral se puedo determinar en forma analítica y es 1.640533. Solución. Los valores de la función

/(O) = 0.2 /(0.8) = 0.232 pueden sustituirse en la ecuación (21.3) para dar 0.2 + 0.232 = 0.1728

la cual representa un error de £, = 1.640533 - 0 . 1 7 2 8 = 1.467733 que corresponde a un error relativo porcentual de e, = 89.5%. La razón para C N I C gratule error os evidente de lu gráfica e n la figura 21 .6. Observe quo el áreu bajo 1» Uncu rccln no
t o m a e n cuenta u n a p o r c i ó n jtjgtffllcativa de le integral que e i t á p o r arriba de la linea.

lin se requiere una gunda derivada de le la función original paru dur f'ix)

s U ti B c o in e » a c t ú a a l! , a p r o x m i a c ó i n ( u n c ó in

podríamos no conocer previumcnle el vulor reul. Por lunlo, del error estimado. Para obtener dicha estimación, lti «esobre el intervalo podría calcularse al diferenciar dos veces

= - 4 0 0 + 4 050* - 10 800x + 8 OOOx
2

3

El valor promedio de la segunda derivada se puede calcular mediante la ecuación (PT6.4):
0.8

( - 4 0 0 + 4 050JC - 10 800x + 8 000x ) dx
2 3

I I \ | ) j

que podría sustituirse en la ecuación (21.6) para obtener =-^(-60)(0.8)
3

= 2.56

la cual es del mismo orden de magnitud y signo que el error real. Sin embargo, existe una discrepancia, ya que, de hecho, para un intervalo de este tamaño el promedio de la segunda derivada no es necesariamente una aproximación exacta Así, indicamos que el error es aproximado mediante la notación E , más exacto que usar E .

de/"(<jj).

a

t

21.1.2

Aplicación múltiple de la regla t r a p e z o i d a l

Una forma de mejorar la exactitud de la regla trapezoidal es dividir el intervalo de integración desde a a b en un número de segmentos y aplicar el método a cada uno de ellos (véase figura 21.7). Las áreas de segmentos individuales se pueden entonces agregar para dar la integral para todo el intervalo. Las ecuaciones resultantes son llamadas fórmulas de integración, de múltiple aplicación o compuestas. La figura 21.8 muestra el formato general y nomenclatura que usaremos para caracterizar integrales de múltiple aplicación. Hay n + 1 puntos base igualmente espaciados (x , x , x ,..., x„). En consecuencia, hay « segmentos de igual anchura:
0 x 2

h =

(21.7)

Si a y b son designados como x y x , respectivamente, la integral total se representará como
0 n

/ = í ' f(x)dx+

í

/\\)<ix

-

/

f(x)dx

Al sustituir ln regla trapezoidal puní etulu integral se obtiene
/lUl) 1 /U|)
-MI

J \(i / „. /,' 2 '

+

/, /'\!' 2

1

, ... ., 2 ,/ < * «» '
V„

J

1

( 2 1 . 8 )

FÓRMULAS DE INTEGRACIÓN DE NEWTON COTÉS_
:

Xrj

X-f X¿
c)

X3

X4

^

X

2

*3

-"4

*5

FIGURA 2 1 . 7 Ilustración de la regla trapezoidal du aplicación múlllple. a) Dos segmentos, fa|
MGITUNTOI, C) C U A T R O S S G M E N L O I Y

d| ^ ' n t f J f B T * " ' *
0

o, mediante agrupación de términos,

h ' = 2

M - l

/ ( * o ) + 2 £ / ( * ¡ ) + /(*»)

(2i.y)

o, usando la ecuación (21.7) para expresar la ecuación (21.9) en el formato general do lu ecuación (21.5),

7=(6-c)
v '

/w+/&)
i—W—^
i u".»i unm»»—Enmy—*•—•» i'

(21.10)

Ancho

AltUItffom«llo

Como In sumtiloriii de I ON coeficientes d c / ( . \ ) en el numerador dividido entre 2n os ¡giinl a I , hi ahina promedio lepicneula un promedio ponderado de los valores de la función, De «cuenlo con ln'ccuitelrtn

(21,10),

los puntos interiores dnn dos veces el poso do los

(I ON puntos ex (remo/'(.*„) y /(#,,).

626

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

Un error para la regla trapezoidal de múltiple aplicación se puede obtener al sumar los errores individuales de cada segmento para dar (b
E

- a)

3

^


(21-11)

' =

Í 2 ¿ 3 - ¿ ^ & > i=\

donde f"(^¡) es la segunda derivada en un punto %¡ localizado en el segmento i. Este resultado se puede simplificar al estimar la media o valor promedio de la segunda derivada para todo el intervalo como [véase ecuación (PT6.3)]

¿/"fe)
f

„ ^ U
n
n

(21.12)

Por tanto 2/"(§,-) — f"y la ecuación (21.11) se puede reescribir como E = { b

•'

a

' f f" 12n

(21.13)

Así, si el número de segmentos se duplica, el error de truncamiento disminuirá a un cuarto. Observe que la ecuación (21.13) es un error aproximado debido a la naturaleza aproximada de la ecuación (21.12).
EJEMPLO 2 1 . 2 Regla trapezoidal de múltiple aplicación

l

Enunciado del problema. integral de
f(x)

Use dos segmentos de la regla trapezoidal para estimar la

= 0.2 + 25x - 200x

2

+ 615x

3

- 900 JC + 4 0 0 x
4

5

desde a = 0 hasta b = 0.8. Emplee la ecuación (21.13) para estimar el error. Recuerde que el valor correcto para la integral es 1.640533.
Solución. n — 2(h = 0.4):

/(O) = 0.2 / = 0.8

/(0.4) = 2.456

/(0.8) = 0.232

0.2 + 2(2.456) + 0.232 —• — = 1.0688 4 s, = 34.9%

E, = 1.640533 - 1.0688 = 0.57173
E
a

= — ^ r ( -2 6 0 ) = 0.64

12(2) '

¡ I

donde — 60 es el promedio de la segunda derivada, determinada antes en el ejemplo 21.1. Los resultados del ejemplo anterior, junto con de tres a dio/, segmentos do uplicuoión de U regla trapezoidal, u rapjifjjMafldfcti&li 21.1. Observe cómo el error diiminu-

ye en lauto gl númotHi d« Negmenlos uumentu. Sin embargo, observe tninbicn que in razón de dlnmlnuoi6n M uradunl. listo OH debido a que el error está invcrsumcnlc relacionado con el cuadrado de n | véiisc ecuación (21.13)]. Por lanío, ul duplicar el número de segmentos diNtninuye en un cuarto el error. En las siguientes secciones desarrollaremos fórmulas de orden superior que son más exactas y que convergen más rápido sobre In integral real en tanto los segmentos aumentan. Sin embargo, antes de investigur esas fórmulas, analizaremos los algoritmos de cómputo para implementar la regla trapezoidal. 21.1.3 A l g o r i t m o s de cómputo p a r a la regla t r a p e z o i d a l

En la figura 21.9 se enlistan dos algoritmos simples para la regla trapezoidal. El primero (véase figura 21.9a) es para la versión de un solo segmento. La segunda (véase figura 21 .9b) es para la versión de múltiples segmentos con una anchura de segmento constante. Observe que ambos están diseñados para datos que se hallan en forma tabular. Un programa general debería tener la capacidad de evaluar funciones conocidas, así como ecuaciones. En el siguiente capítulo ilustraremos cómo se puede manejar esas funciones.
TABLA 21.1 Resultados de la regla trapezoidal de aplicación múltiple para estimar la integral de f[x) = 0.2 3+ 25x-

200X +
2

de x = 0 a 0.8. El valor exacto es

675X
1 1.0688 1.3695 1.4848 1.5399 1.5703 1.5887 1.6008 1.6091 1.6150

- 900X + ÁOOx
4

5

1 .640533.
n 2 3 4 5 6 7 8 9 10

0.4 0.2667 0.2 0.16 0.1333 0.1 143 0.1 0.0889 0.08

h

e (%)
t

34.9 16.5 9.5 6.1 4.3 3.2 2.4 1.9 1.6

FIGURA 21.9

Algoritmos para la regla trapezoidal a) de

solo segmento y b) de segmentos múltiples,

a) Un solo segmento
FUNCTION Trap (h, fO, fí) Trap = h*(f0 + fí)/2 END Trap

b) Segmentos múltiples
FUNCTION Trapm (h, n, f) eum = f D0¡=1,n-1 eum = sum + 2 *f¡ END DO sum = eum + f„
0

Trupm m h • eum / 2 END Trtpm

628

FÓRMULAS DE INTEGRACIÓN D i NEWTON -COTES

Un ejemplo de un programa de uso amigable para la regla Irapezoidal de múltiples segmentos se incluye en el software suplementario de métodos numéricos TOOLKIT contenido en este libro. Dicho software puede evaluar las integrales, bien de datos tabulados o de funciones definidas por el usuario. El siguiente ejemplo demuestra su utilidad para evaluar integrales. También proporciona una buena referencia para asegurar y probar su propio software.
EJEMPLO 2 1 . 3 Evaluación de integrales con la computadora

j I | |

Enunciado del problema. Use el software de métodos numéricos TOOLKIT para resolver un problema relacionado con nuestro amigo el paracaidista en caída. Como usted recordará del ejemplo 1.1, la velocidad del paracaidista está dada como la siguiente expresión en función del tiempo:

e donde v = velocidad (m/s), g — constante gravitacional de 9.8 m/s , m — masa del paracaidista igual a 68.1 kg y c = coeficiente de arrastre de 12.5 kg/s. El modelo predice la velocidad del paracaidista como una función del tiempo, como se describió en el ejemplo 1.1. Suponga que desea saber qué tan lejos ha caído el paracaidista después de cierto tiempo t. Esta distancia está dada por [véase ecuación (PT6.5)]
2

i > ( 0=

gm c

(1 _ -(clm),}

(E21.3.1)

Jo

(t)dt

donde d es la distancia en metros. Sustituyendo en la ecuación (E21.3.1), = f (i _ - ' ') c Jo
(c m) e

d

dt

Use el software de métodos numéricos TOOLKIT, y su propio software, para determinar esta integral con la regla trapezoidal de aplicación múltiple mediante diferentes números de segmentos. Observe que al desarrollar la integración en forma analítica y sustituir los valores de parámetros conocidos se obtiene un valor exacto de d — 289.43515 m. Solución. Presione el botón de la función Intégrate en el menú principal del TOOLKIT para obtener una pantalla en blanco similar a la de la figura 21.10. Esta pantalla contiene la información de entrada y salida necesaria para integrar una función analítica o datos tabulares. Primero, puede hacer clic en la tabla de función de entrada e introducir la función, v(t) = 9.8(68.1) 12.5 (1
H

v

—i

,-(12.5/68.1)1)

Después haga clic en el bloque de entrada de parámetros e introduzca los valores para los límites de integración inferior y superior de 0 a 10. Luego, introduzca el valor 10 para el número de segmentos junto con las dimensiones de la gráfica, como en la figura 21.10.

Rnnilr* Integial < Seg Width

Ww*

2887491 1

m*:":

'

Help

I :>«-.•-)

:

.J3ü»..j

.!£«!!=._• I •''<" , ,1

FIGURA

21.10

Pantalla de la computadora que muestra la integral de una función mediante el programa de la regla trapezoidal de segmentos múltiples del TOOLKIT de Métodos Numéricos.

Después de hacer clic en los botones Cale y Plot, se despliega una integral calculada de 288.7491. Así, hemos obtenido la integral con tres cifras significativas de exactitud, La integral es equivalente al área bajo la curva v(t) contra t, como se muestra en la figura 21.10. Una inspección visual confirma que la integral es e i ancho del intervalo (10 s) por la altura promedio (cerca de 29 m/s). Una gráfica de la función que expone los segmentos se muestra en la figura 21.10. Podemos tratar con otros números de segmento de unu manera conveniente. Con n — 500, el resultado es exacto hasta seis cifras significativas. En este punto, es importante reconocer que el TOOLKIT de métodos numéricos usa doble precisión para obtener su estimación de la integral. Podemos, por tanto, repetir este problema con un programa basado en el pseudocódigo de la figura 21 .9b y emplear números de simple precisión (por ejemplo, cerca de siete cifras significativas de precisión). Los resultados son
tgmentos T a m a ñ o del s e g m e n t o

*,(%)
d e288.7491 stimada, m

10 20 50 100 200 500 1 000 2 000 5 000 10 000

1.0 0.5 0.2 0.1 0.05 0.02 0.01 0.005 0.002 0.001

289.2636 289.4076 289.4282 289.4336 289.4348 289.4360 289.4369 289.4337 289.4317

0.237 0.0593 9.5 x 10 2.4 x 10 5.4 x 10" 1.2 x 10" -3.0 x 10" -5.9 x 10" 5.2 x 10" 1.2 x 10
:l ;l

Asi, hasta cerca de 500 segmentos, la regla trapezoidal de aplicación múltiple obtieiw «célente exactitud. Sin embargo, observe cómo el error cambia do signo y empieza a

630

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

aumentar en valor absoluto adelante del caso de 500 segmentos. El caso de 10 000 segmentos de hecho parece divergir del valor real. Esto se debe a la inclusión del error de redondeo por el gran número de cálculos para todos esos segmentos. De esta manera, el nivel de precisión está limitado y nunca podría alcanzar el valor exacto de 289.4351 que se obtiene en forma analítica. Esta limitación se analizará con más detalle en el capítulo 22.

Del ejemplo 21.3 puede tomarse en cuenta tres conclusiones principales: • Para aplicaciones individuales con buen comportamiento de las funciones, la regla trapezoidal de múltiples segmentos es casi fina para obtener el tipo de exactitud requerida en muchas aplicaciones de la ingeniería. Si se requiere de alta exactitud, la regla trapezoidal de múltiples segmentos demanda un gran esfuerzo computacional. Aunque este esfuerzo puede ser insignificante para una sola aplicación, podría ser muy importante cuando: a) se evaluarán numerosas integrales, o b) donde la misma función es consumidora de tiempo en su evaluación. Para tales casos, podrían requerirse procedimientos más eficientes (como aquellos planteados en lo que falta de este capítulo y en el próximo). Por último, los errores de redondeo representan una limitación en nuestra habilidad para determinar integrales. Esto se debe tanto a la precisión de la máquina como a los diversos cálculos involucrados en técnicas simples como la regla trapezoidal de múltiples segmentos.

Ahora veremos una forma en la cual se puede mejorar la eficiencia. Es decir, mediante polinomios de orden superior para aproximar la integral.

21.2

R E G L A S DE S I M P S O N Además de aplicar la regla trapezoidal con segmentación más fina, otra forma de obtener una estimación más exacta de una integral es con el uso de polinomios de orden superior para conectar los puntos. Por ejemplo, si hay un punto extra a la mitad del camino entre f(a) yf(b), los tres puntos se pueden conectar con una parábola (véase figura 21.11a). Si hay dos puntos igualmente espaciados entre f(a) y f(b), los cuatro puntos se pueden conectar con un polinomio de tercer orden (véase la figura 21.116). Las fórmulas que resultan al tomar las integrales bajo esos polinomios son conocidas como reglas de Simpson.

21.2.1

Regla de S i m p s o n 1/3

La regla de Simpson 1/3 resulta cuando una interpolación polinomial de segundo orden es sustituida en la ecuación (21.1):
nb rb

I = /

1

f{x)dx £ /

Mx)d.\

A

»

*

f.(x )A

'W4

FIGURA

21.11

(i) Ilustración gráfica de la i M i j l i i de Simpson 1/3: 11H iiiiste en tomar el área I K i | o una parábola que 11 muela tres puntos. | i ) Ilustración gráfica de la i t i i |lii de Simpson 3 / 8 : 11 ui.'.iste en tomar el área I H i|( > una ecuación cúbica ( | i i ( ! conecta cuatro puntos.

b)

Si a y b se designan como x y x , yf { ) representada por un polinomio de Lagrange de segundo orden [véase ecuación (18.23)], la integral se transforma en
x e s 0 2 2

I

f*2 Ixo
0 0 2 0

(x-x\)(x-x )
2 0

(x - L xi)(x

(x-x )(x-x ) ftxo) + - x) (x¡ - x )(xi - x ) -f{xi)
0 2 2 0 2 2

(x -x )(x
2

- X\)

[x -x )(x

-f(x ) - X\)'

dx

Después de la integración y manejo algebraico, resulta la siguiente fórmula:
/ = |[/(Jfo) + 4/(A,)
+

f(x )]
2

(21.14)

donde, para este caso, h = (b — á)l2. Esta ecuación es conocida como regla de Simpson 1/3. Es la segunda fórmula de integración cerrada de Newton-Cotes. La especificación "1/3" surge del hecho de que h está dividida entre 3 en la ecuación (21.14). Una obtención alternativa se muestra en el cuadro 21.3 donde el polinomio de Newton-Gregory se integra para obtener la misma fórmula. La regla de Simpson 1/3 se expresa también con el uso del formato de la ecuación (21.5):

Iss(

p-a)
Ancho
0 2

/(*o)+ * / ( * , ) + M )
Altura promedio

(

2

U

5

)

donde a — x , b — x y x = punto a la mitad del camino entre a y b, que está dado por (b + a)/2. Observe que, de acuerdo con la ecuación (21.15), el punto medio está ponderado por dos tercios y los dos puntos extremos por un sexto. Se puede mostrar que una aplicación de un solo segmento de la regla de Simpson 1/5 tiwie un error de truncamiento de (véase cuadro 21.3)
x

632

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

Cuadro 2 1 . 3

Obtención y estimación del error de la regla de Simpson 1 / 3
/ = h «/(*<,) + y A / ( x ) + l — - A /(*o)
2

Como se hizo en el cuadro 21.2 para la regla trapezoidal, la regla de Simpson 1/3 se puede obtener al integrar hacia adelante el polinomio de interpolación de Newton-Gregory (véase cuadro 18.2):
I

en J.xa a(a a(a —
f(x )
0

+ &f(x )a
0

+

A /Uo)
2

+
+

A /(*o)
3

— 1)

+ V120

y evaluando en los limites se obtiene

aa a (1
24
_

0

A /(x )
3 0

~6~
a

+

~6

4

Ucr*

16

+

~T2

l)(a — 2)
4

J

2 4

« ( " - 1)(<* - 2) (a - 3)/!

dx

Observe que hemos escrito el polinomio hasta el término de cuarto orden en lugar de hasta el de tercer orden como se podría haber esperado. La razón para esto se verá un poco después. Observe también que los límites de integración van de x a x . Por tanto, cuando se hagan las sustituciones simplificadoras (recuerde el
0 2

i
2 0

2/(.v ) + 2A/U- ) •
0 0

A /(x )
2 0

1

(B21.3.1)

cuadro 21.2), la integral es de a = 0 a 2:
I=h I
f l r

Observe que el resultado significativo de que el coeficiente de la tercera diferencia dividida es cero. Debido a que A/"(x ) = /(x,) -/(* )yA /-(x ) = / ( x ) - 2f{x ) +/(* ),laecuación(B21.3.1) se puede reescribir como
0 0 2 x 0

I f(x ) + Af{x )a
Q 0

+ A /(x )
2 0

A /(*o)
3

+

J

2 4

— l ) ( a — 2) « ( « - D ( « - 2) (a - 3 ) / ¡ da
4

-a(ot

a(a —

1)

/ = JLr/ ,
(

o )

+ 4/^)

+ ñ x 2 ) ]

_

- L /

4

) ( ^

REGK DE SIMPSON 173

ERROR DE TRUNCAMIENTO

que se puede integrar para obtener

Así, el primer término es la regla de Simpson y el segundo es el error de truncamiento. Ya que se suprime la tercera diferencia dividida, obtenemos el resultado significativo de que la fórmula tiene una precisión de tercer orden.

E, =

-¿¿ / (§)
5 M)

o, como h = (b — a)ll, (21.16)

2 880

donde ^ está en algún lugar en el intervalo desde aab. Así, la regla de Simpson 1/3 es más exacta que la regla trapezoidal. Sin embargo, en comparación con la ecuación (21.6) indica que es más exacta de lo esperado. En lugar de ser proporcional a la tercera derivada, el error es proporcional a la cuarta derivada. Esto es porque, como se muestra en el cuadro 21.3, el término del coeficiente de tercer orden va a cero durante la integración de la interpoUoión polinomial. En O O A I I G M A O I L , la regla de Simpion 1/3 tiene una preci-

sión de tereef ofdstt aun uiiaiidu He bnsc en sólo tres puntos, ¡lin otras palabras, dn resultados exuclos puní polinomios cúbicos «un cuando se derive de una parábola!
Aplicación simple de la regla do Simpson 1/3

Enunciado del problema. f(x)

Use la ecuación (21.15) para integrar
2 3 4 5

= 0.2 + 25* - 200x + 675x - 900x + 400x

desde a = 0 a b
Solución.

0.8. Recuerde que la integral exacta es 1.640533.

/(O) = 0.2

/(0.4) = 2.456

/(0.8) = 0.232

Por tanto, la ecuación (21.15) se puede usar para calcular / =0.8 0.2 + 4(2.456) + 0.232 6 = 1.367467

que representa un error exacto de E, = 1.640533 - 1.367467 = 0.2730667 e, = 16.6%

la cual es aproximadamente 5 veces más precisa que una aplicación simple de la regla trapezoidal (véase ejemplo 21.1). El error estimado es [véase ecuación (21.16)] E =
a

(0.8) — ' - ( - 2 400) = 0.2730667 2 880
5

donde —2 400 es el promedio de la cuarta derivada para el intervalo, como se obtuvo por medio de la ecuación (PT6.4). Como ocurrió en el caso del ejemplo 21.1, el error es aproximado (E ) y es debido a que el promedio de la cuarta derivada no es una estimación exacta de/* (£). Sin embargo, como en este caso tiene que ver con polinomios de quinto orden, el resultado concuerda.
a 4)

21.2.2

La regla de S i m p s o n 1/3 de aplicación múltiple

Así como con la regla trapezoidal, la regla de Simpson se puede mejorar al dividir el intervalo de integración en un número de segmentos de igual anchura (véase figura 21.12): h =
b —a

n

(21.17)

La integral total se puede representar como

634

FÓRMULAS DE INTEGRACIÓN DE NEWTON -COTES^

Al sustituir la regla de Simpson 1/3 para la integral individual so obtiene
/(A- )+4/'(.Y ) +
0 L

/ = 2/7

/(.V2)

2h

í\x )
2

+ 4 / ( x , ) + /(.v )
4

+ 2h

/U „ )+4/(x„_ ) + /U„)
¡ 2 1

o, combinando términos y usando la ecuación (21.17), /(*o) + 4 S f{x¡) + 2 " ¿
J . ~ {b - a)
Ancho

f(x,)+f(x„) (21.18)

3n
Altura promedio

Observe que, como se ilustra en la figura 21.12, se debe utilizar u n número par de segmentos para implementar el método. Además, los coeficientes " 4 " y " 2 " en la ecuación (21.18) podrían parecer peculiares a primera vista. Sin embargo, siguen en forma natural la regla de Simpson 1/3. Los puntos nones representan el término medio para cada aplicación y, por tanto, el peso de 4 en la ecuación (21.15). Los puntos pares son comunes en las aplicaciones adyacentes y, por tanto, se cuentan dos veces. Un error estimado para la aplicación de la regla de Simpson se obtiene en la misma forma que para la regla trapezoidal, sumando los errores individuales de los segmentos y sacando el promedio de la derivada para dar

F
"~
( 4 )

-

(¿> - a) 180«
4 J

7(4)

(21.19)

donde/

es el promedio de la cuarta derivada para el intervalo.

FIGURA

21.12

Representación gráfica de la regla de Simpson 1 / 3 de aplicación múltiple. Observe que el método se puede emplear sólo si el número de segmentos es par.

Veriión d« la rugía cim ülmpiun I /J do aplicación múltiplo Enunciado dol problema. gral de U n o lu ecuación (21.18) con n — 4 para estimur la inte2 1 4 5

/'(.v) = 0.2 + 25,v - 2()().v -1- 675A- - 9 0 0 A + 4 0 0 *

desde a = 0 hasta b = 0.8. Recuerde que la integral exacta es 1.640533. Solución, n = 4 (h = 0.2): /(0.2) = 1.288 /(0.6) = 3.464

/(0) = 0.2 /(0.4) = 2.456 /(0.8) = 0.232

A partir de la ecuación (21.18),

/ = (J.O

0.2 + 4(1.288 + 3.464) + 2(2.456) + 0.232 12

= 1.oZj4o/

E, = 1.640533 - 1.623467 = 0.017067 El error estimado [véase ecuación (21.19)] es E = — ^ - r ( - 2 400) = 0.017067 180(4) '
a 4

s, = 1.04%

El ejemplo anterior ilustra que la versión de la regla de Simpson 1/3 de aplicación múltiple da resultados precisos. Por esta razón, se considera superior a la regla trapezoidal para la mayoría de las aplicaciones. Sin embargo, como se mencionó antes, está limitada a casos en los que los valores son igualmente espaciados. Además, está limitada a situaciones donde hay un número par de segmentos y un número non de puntos. En consecuencia, como se analizará en la siguiente sección, la fórmula de segmentos nones y puntos pares conocida como regla de Simpson 3/8 se usa en conjunto con la regla 1/3 para permitir la evaluación de ambos números de segmentos pares y nones. 21.2.3 Regla de S i m p s o n 3 / 8

En una manera similar a la derivación de la regla trapezoidal y de Simpson 1/3, un polinomio de Lagrange de tercer orden se puede ajustar a cuatro puntos e integrarse:

para obtener

/ f(x)dx = / h(x)dx I Ja Ja 3/(.V|) + 3/(a) + / ( * . = )]
H

nb

rb

|./'(*,.) +

2

636

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

donde h — (b — «)/3. Esta ecuación se llama regla de Simpson 3/8 debido a que h se multiplica por 3/8. Esta es la tercera fórmula de integración cerrada de Newton-Cotes. La regla 3/8 se puede expresar también en la forma de la ecuación (21.5): Issjb-a)
Ancho
+ 3 / ( X l ) + 3 / f e ) +

m

m

(21.20)

Altura promedio

Así, los dos puntos interiores tienen pesos de tres octavos, mientras los puntos extremos pesan un octavo. La regla de Simpson 3/8 tiene un error de

'

80

J

o, ya que h — (b — a)/3,
E

Jtz^tji^
6 480

(21.21)

Como el denominador de la ecuación (21.21) es mayor que el de la ecuación (21.16), la regla 3/8 es algo más exacta que la de 1/3.

FIGURA

21.13

Ilustración de cómo se puede usar en conjunto las reglas de Simpson de 1/3 y 3 / 8 para manejar aplicaciones múltiples con números nones de intervalos.

/|x) A

La regla do Nlmpaun 1/1 en o moñudo ol método de preferencia, ya que alcanza exactitud de tercer orden con I T C N puntos más que los cuatro puntos requeridos pora la versión de 3/8. .Sin embargo, lu rogln de 3/8 tiene utilidad cuando el número de segmentos es impar. Como ilustración, en el ejemplo 21.5 usamos la regla de Simpson para integrar la función para cuatro segmentos. Suponga que usted desea una estimación para cinco segmentos. Una opción podría ser usar una versión de aplicación múltiple de la regla trapezoidal como se hizo en los ejemplos 21.2 y 21.3. Esto puede no ser recomendable, sin embargo, debido al gran error de truncamiento asociado con este método. Una alternativa podría ser aplicar la regla de Simpson 1/3 a los dos primeros segmentos y la regla de Simpson 3/8 a los últimos tres (véase figura 21.13). De esta forma, podríamos obtener un estimado con una precisión de tercer orden a través de todo el intervalo.
EJEMPLO 2 1 . 6 Regla de Simpson 3 / 8 Enunciado del problema.

a) Use la regla de Simpson 3/8 para integrar \ ! I | f(x) = 0.2 + 25x - 200x + 675x - 900x + 400x
2 3 4 5

desde a = 0 hasta b — 0.8. b) Úsela en conjunto con la regla de Simpson 1/3 a fin de integrar la misma función para cinco segmentos.
Solución.

|

a) Una sola aplicación de la regla de Simpson 3/8 requiere de cuatro puntos igualmente espaciados: /(O) = 0.2 /(0.5333) = 3.487177 Usando la ecuación (21.20) / - 0 S °' ^+ - 8 ? 1 7 7 ) + 0.232 ' 8 E, = 1.640533 - 1.519170 = 0.1213630 e, = 7.4%
2 + 3 4 3 2 7 2 4 3 4 =

/(0.2667) = 1.432724 /(0.8) = 0.232

'

? E

(0.8) " = -Tlérí6 4 8) 0
2400

5

= 0-1213630

| |

b) Los datos necesarios para la aplicación de cinco segmentos (h — 0.16) es /(0) = 0.2 ./(0.32) = 1.743393 ,/t0.64) - 3.181929 /(0.16) = 1.296919 ./Í0.48) = 3.186015 ./{().«()) 0.232

La Integral para los dos prlmeroi segmentos se obtiene usando la regla de Slmpion

1/3!

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

/ y. 0.32

0.2 + 4 ( 1 . 2 % 9 1 9 ) + 1.743393 — = 0.3803237 6

Para los últimos tres segmentos, la regla 3/8 se puede usar para obtener / = 0.48 1.743393 + 3(3.186015 + 3.181929) + 0.232 = 1.264754 8

La integral total se calcula al sumar los dos resultados: / = 0.3803237 + 1.264753 = 1.645077 E, = 1.640533 - 1.645077 = -0.00454383 e, = - 0 . 2 8 %

21.2.4

A l g o r i t m o s de cómputo p a r a las reglas de S i m p s o n

En la figura 21.14 se bosqueja el pseudocódigo para diferentes formas de reglas de Simpson. Observe que todas se hallan diseñadas para datos que están en forma tabulada. Un programa general debería tener la capacidad de evaluar funciones conocidas así como ecuaciones. En el siguiente capítulo ilustraremos cómo se puede manejar esas ecuaciones. Observe que el programa de la figura 21.14¿¡f está acondicionado para usar números de segmentos pares o nones. Para el caso de pares, la regla de Simpson 1/3 se aplica a cada par de segmentos y los resultados se suman para calcular la integral total. En los nones, se aplica la regla de Simpson 3/8 a los tres últimos segmentos y la regla 1/3 a los segmentos previos.

21.2.5

F ó r m u l a s cerradas de Newton-Cotes de o r d e n s u p e r i o r

Como se observó antes, la regla trapezoidal y ambas reglas de Simpson son miembros de una familia de ecuaciones de integración conocidas como fórmulas de integración cerrada de Newton-Cotes. Algunas de las fórmulas se resumen en la tabla 21.2, junto con su estimación del error de truncamiento. Observe que, como en el caso de las reglas de Simpson 1/3 y 3/8, las fórmulas de cinco y seis puntos tienen el mismo orden de error. Esta característica general se cumple para fórmulas de puntos mayores y nos lleva al resultado de que las fórmulas de segmentos pares y puntos nones (por ejemplo, la regla 1/3 y la regla de Boole) usualmente son los métodos de preferencia. Sin embargo, se debe resaltar que, en la práctica de la ingeniería, las fórmulas de orden superior (que son mayores de cuatro puntos) son usadas muy rara vez. Las reglas de Simpson bastan para la mayoría de las aplicaciones. La precisión se puede mejorar al usar la versión de aplicación múltiple. Además, cuando la función es conocida y se requiere de alta precisión, los métodos como la integración de Rombcrg o la cuadratura de O K U I I , descritos en el capitulo 22, OfitMB ajternativas viables y atractivas.

21.2

rüNCTION
5lmp13 = 2'h* (f0+4*fí+f2) END Slmp13

5lmp13 /6

(h. fO,

fí,fZ)

b) FUNCTION
5¡mp3& = 3*h* (f0+3*(fí+f2)+f3) FND 5imp33 t VNCTION 5imp13m (h, n, f) eum = f(0) P0l = 1,n-2,2 eum = eum + 4 * f¡ + 2 * f END DO fium = eum + 4 * f„_, + f iMmp13m = h * eum 13 FNI>Slmp13m
n

Simp33 / 3

(h, fO,

FUNCTION 5lmplnt(a, b. n, f) h = (b-a)/n IFn = 1 THEN eum = Trap(h, f„_,, f j EL5E fí,f2, f3) m = n odd = n/2-INT(n/2) IF oda > O AND n > 1 THEN m =n- 3 END IF IFm>1 THEN

1 * 1 • » di

eum = sum+Slmp33(h,f _ ,f _2,f _ ,f )
ri 3
r

n

1

tl

M

eum = eum + 5¡mp13m(h, m, f) END IF END IF 5lmplnt = eum END Simplnt

M i \ lu K Íc ó d g io H lf io

FIGURA 21.T4

i inio js

para las reglas de Simpson. a) Regla de Simpson 1 / 3 de aplicación simple, b) regla de Simpson 3 / 8 do ación simple, c) regla de Simpson 1/3 de aplicación múltiple, y d) regla de Simpson de aplicación múltiple para números de segmentos nones y pares. Observe que para todos los casos n debe ser > 1 .

TABLA 21.2

Fórmulas de integración cerrada de Newton-Cotes. Las fórmulas se presentan en el formato de la ecuación (21.5) de manera que el peso de los datos para estimar la altura promedio es aparente. El tamaño de paso está dado por h = (b - a)/n.
Error de t r u n c a m i e n t o -(1/12)^)

Segmentos

(")
1 2

Puntos 2 3 4

Nombre Regla trapezoidal (b-

Fórmula

Regla de Simpson 1/3 Regla de Simpson 3 / 8

ú

A .'i

5
Regla de 6

o) f ( X o | + f ( x , | a) [bn\ n\ B o u h I \b i i H)i{x ) i
(bf|x )
n +

2 4f(x )
1

+ f(x )
7

6 flxol + A F L X . l + S f N + flx,! 8

-\]/90)h fW
5
-|3/80)/i-VI' l(í)
1 4

0)

(b-

7f(x ) + 32f(x,| + 12í(x | + 3 2 r > ) + 7f(x )
0 2 3

0)

90

19f(x )
ü

ASflxJ

2

.')0/(x

:f
I V

288

' W

(2/5/1

VW())h

640 21.3

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

INTEGRACIÓN CON SEGMENTOS DESIGUALES Hasta este punto, todas las fórmulas para integración numérica se han basado en datos igualmente espaciados. En la práctica, existen muchas situaciones donde esta suposición no se cumple y debemos tratar con segmentos de tamaño desigual. Por ejemplo, los datos derivados experimentalmente son a menudo de este tipo. Para esos casos, un método es aplicar la regla trapezoidal a cada segmento y sumar los resultados:
.
U

/ ( * 0 )

+

,

u

/ ( S I )

+

/fe)

,

,
H

u

/ ( * „ - L )

+ / ( * „ )

l=hi

~ + " 2

2

'

"

2

(21.22)

donde h¡ = ancho del segmento /. Observe que éste fue el mismo procedimiento que se usó en la regla trapezoidal de aplicación múltiple. La única diferencia entre las ecuaciones (21.8) y (21.22) es que las h en la primera son constantes. En consecuencia, la ecuación (21.8) podría simplificarse al agrupar términos para obtener la ecuación (21.9). Aunque esta simplificación no puede aplicarse a la ecuación (21.22), es posible desarrollar de manera fácil un programa en computadora para acomodar los segmentos de tamaño desigual. Antes de describir ese algoritmo, ilustraremos en el siguiente ejemplo cómo se puede aplicar la ecuación (21.22) para evaluar una integral.
EJEMPLO 21.7 Regla trapezoidal con segmentos desiguales

| Enunciado del problema. La información en la tabla 21.3 fue generada mediante el | mismo polinomio empleado en el ejemplo 21.1. Use la ecuación (21.22) para determinar i la integral para estos datos. Recuerde que la respuesta correcta es 1 .640533.

i
?

í \ |

Solución.

Si se aplica la ecuación (21.22) a los datos de la tabla 21.3 se obtiene 1.309729 + 0.2 + 0.10 1.305241 + 1.309729 0.232 + . . . + 0.10
n

7=0.12

+ 2.363

1

= 0.090584 + 0.130749 + • • • + 0.12975 = 1.594801

1

TABLA 21.3

Datos para f(x) = 0 . 2 + 25x - 2 0 Ü X + la cual representa un error relativo absoluto de £, = 2 .8% 675X - 900X + 4 0porcentual 0 X , con valores
2

3

4

5

de x desigualmente espaciados.
X """""""'"ÍLX)'"*" X

0.0 0 . 1 2 0.22 0.32 0.36 0 . 4 0

0 . 2 0 0 0 0 0 1.309729 1.305241 1.743393 2 . 0 7 4 9 0 3 2 . 4 5 6 0 0 0

0.44 0.54 0.64 0.70 0.80

2 . 8 4 2 9 8 5 3 . 5 0 7 2 9 7 3 . 1 8 1 9 2 9 2 . 3 6 3 0 0 0 0 . 2 3 2 0 0 0

FIGURA

21.15

Uso de la regla trapezoidal para determinar la integral de datos desigualmente espaciado», Observe cómo los segmentos achurados podrían evaluarse con la regla de'Simpson para obtener mayor precisión.

Los datos del ejemplo 21.7 se ilustran en la figura 21.15. Observe que alguno* segmentos adyacentes son de igual anchura y, en consecuencia, pudieron haberse evaluado mediante las reglas de Simpson. Esto usualmente nos lleva a resultados más precisos, como lo ilustra el siguiente ejemplo.

Inclusión de las reglas de Simpson en la evaluación de datos no uniformes
Enunciado del problema. Vuelva a calcular la integral con los datos de la tabla 21.3, pero ahora use las reglas de Simpson para aquellos segmentos donde son apropiados. Solución. El primer segmento se evalúa con la regla trapezoidal:

„ 1.309729 + 0.2 / = 0.12 •— = 0.09058376 Debido a que los dos siguientes segmentos que van de x = 0.12 a 0.32 son de igual longitud, su integral se puede calcular con la regla de Simpson 1/3: , 1.743393 + 4(1.305241) + 1.309729 / = 0.2—: — = 0.2758029 Los siguientes tres segmentos también son iguales y, por tanto, pueden evaluarse con la regla de 3/ft para dar / = 0.2726863. De manera similar, la regla 1/3 se puede aplicar a

642

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

los dos segmentos desde x = 0.44 hasta 0.64 para obtener I = 0.6684701. Finalmente, los dos últimos segmentos, los cuales son de longitud desigual, se pueden evaluar con la regla trapezoidal para dar valores de 0.1663479 y 0.1297500, respectivamente. El área de esos segmentos individuales se suma para dar una integral total de 1.603641. Esto representa un error e = 2.2%, el cual es superior al resultado que se obtuvo mediante la regla trapezoidal del ejemplo 21.7.
t

Programa de cómputo para datos espaciados de manera desigual.

Programar la

ecuación (21.22) es una proposición bastante simple. El algoritmo se lista en la figura 21.16a.

FIGURA

21.16

Pseudocódigo para integrar datos desigualmente espaciados, a) Regla trapezoidal y b) Combinación de reglas de Simpson y trapezoidal. o) FUNCTION Trapun (x, y, n) LOCAL I, eum eum = O DO i=1,n eum = eum + (x¡ - x )*(y END DO Trapun = eum END Trapun
H

b)

H

+ y¡)/2

FUNCTION Uneven (n, x, f) h=x -x k=1 eum = O. DO J = 1,n
1 0

IF A35 (h - hf) < .OOOOOI THEN IFk = 3 THEN eum = eum + 5imp13 (h, fj_ fj_ f^) k = k-1 EL5E k = k+1 END IF EL5E IFk = 1 THEN eum = eum + Trap (7% FJ_, FP EL5E IFk = 2 THEN eum = eum + 6\mp13 (h, fj_ f-) EL5E eum = eum + Simp33 (h, fj_ ENDIF k=1 END IF END IF h = hf END DO
3 2 2 2

hf = x -Xj
j+1

fj)

UFE:

LMm*»n. ....

Univon - eum

21,4

I E R T A

TABLA 2 1 . 4

Fórmulas de integración abierta da Newton Cotos. Las fórmulas se presentan en «I formato de la ecuación (21.5) de manera quo el peso de los datos para estimar la altura promedio sea aparente. El tamaño de paso está dado por h - (b - a)/n.
Error de t r u n c a m i e n t o

tegmentos
(n) Puntos Nombre Método del punto medie Fórmula

[b-a]

f(x,| 2 2f|x,)-í|x |
? +

(l/3]/> f"(íl
3

|b-o)
fa

[3/4}h fU)
3

_

2f(x,|

3 24 llf| )-14f|x )
X l 2 +

|95/144)f) fl >|§)
5 4

26f|x3)-14f|x )
4

(41/140)//f (£)
|6,

20

Sin embargo, como se demostró en el ejemplo 21.8, el procedimiento es resaltado ai se implementan las reglas de Simpson cuando sea posible. Por esta razón desarrollamoa un segundo algoritmo que incorpora esta capacidad. Como se ilustra en la figura 21.1 6b, el algoritmo verifica la longitud de los segmentos adyacentes. Si dos segmentos consecutivos son de igual longitud, se aplica la regla de Simpson 1/3. Si tres son iguales, se una la regla 3/8. Cuando los segmentos adyacentes son de longitud desigual, se implementn la regla trapezoidal. Así, no sólo permite la evaluación de segmentos de datos desiguales, sino que al usar la información igualmente espaciada, se reduce a las reglas de Simpson. Como tal, representa un algoritmo básico para todo propósito en la determinación de la integral de datos tabulados.

21.4

F Ó R M U L A S DE I N T E G R A C I Ó N A B I E R T A Recuerde de la figura 21 3b que las fórmulas de integración abierta tienen límites que se extienden más allá del rango de los datos. La tabla 21.4 resume las fórmulas de integración abierta de Newton-Cotes. Las fórmulas se expresan en la forma de la ecuación (21.5) para que los factores ponderados sean evidentes. Como con las versiones cerradas, pares sucesivos de las fórmulas tienen el mismo orden de error. Las fórmulas de segmentos pares y puntos nones son por lo común los métodos de preferencia, ya que requieren menos puntos para alcanzar la misma precisión que con las fórmulas de segmentos nones y puntos pares. 1 ,UN fórmulas abiertas no se usan a menudo para integración definida. Sin embargo, como NO analiza en el capítulo 22, tienen utilidad para analizar integrales impropios. Adetnáa, tienen In relevancia de nuestro análisis de métodos multipnsos para la solución de eotiflolonen diferenciales ordinarias en el capitulo 26.

644 PROBLEMAS

FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES

21.1 Use medios analíticos para evaluar a) j* b)

J

(1 -

e- )dx
x 5

4

de la regla trapezoidal, b) la regla de Simpson 1/3, c) regla de Simpson 3/8, d) regla de Boole, e) método de punto medio,/) fórmula de integración abierta con 3 segmentos/2 puntos y g) fórmula de integración abierta con 4 segmentos/3 puntos.

(1 - x - A¿ + x ) dx (8 + 4senx)<¿x

c) J

Jo
15
2t

dx

21.2 Emplee una sola aplicación de la regla trapezoidal para evaluar las integrales del problema 21.1. 21.3 Evalúe las integrales del problema 21.1 con una regla trapezoidal de aplicación múltiple, con n = 2,4 y 6. 21.4 Evalúe las integrales del problema 21.1 con una sola aplicación de la regla de Simpson 1/3. 21.5 Evalúe las integrales del problema 21.1 con una aplicación múltiple de la regla de Simpson 1/3, con n = 4 y 6. 21.6Evalúe las integrales del problema 21.1 con una sola aplicación de la regla de Simpson 3/8. 21.7 Evalúe las integrales del problema 21.1, pero ahora use una aplicación múltiple de la regla de Simpson, con n = 5. 21.8 Integre la siguiente función mediante la regla trapezoidal, conn = 1, 2, 3 y 4: (x + l/x)" dx Calcule los errores relativos porcentuales con respecto al valor real de 4.8333 para evaluar la exactitud de las aproximaciones trapezoidales. 21.9 Integre la siguiente función en forma analítica y con las reglas de Simpson, con n = 4 y 5: j (4x.+ 5) dx
3

Calcule los errores relativos porcentuales de los resultados numéricos. 21.12 Integre la siguiente función en forma analítica y numérica. Para las evaluaciones numéricas use d) una sola aplicación de la regla trapezoidal, b) regla de Simpson 1/3, c) regla de Simpson 3/8, d) aplicación múltiple de las reglas de Simpson (« = 5), e) regla de Boole, j) el método de punto medio, g) la fórmula de integración abierta con 3 segmentos/2 puntos, y h) fórmula de integración abierta con 4 segmentos/3 puntos. (8 + 3 sen x) dx Calcule los errores relativos porcentuales de los resultados numéricos. 21.13 Integre la siguiente función,

Jo
0A

x {l.2-x)(\-e

20 (.v -l) )

dx

Observe que el valor real es 0.602297. Evalúe esta integral con la regla trapezoidal de segmento múltiple. Use una n lo suficientemente grande para que tenga usted 4 cifras significativas de exactitud. Analice sus resultados. 21.14 Evalúe la integral de los siguientes datos tabulados con la regla trapezoidal:
X

0 1

0.1

0.2

0.3

0.4

0.5

Analice los resultados. 21.10 Integre la siguiente función de manera analítica y numérica. Use las reglas trapezoidal y lá de Simpson 1/3 para integrar numéricamente la función. Para los dos casos, use la versión de aplicación múltiple con n = 4.

f|x)

7

4

3

5

2

Calcule los errores relativos porcentuales para los resultados numéricos. 21.11 Integre la siguiente función on forma analítica y nuniériM. P i n l u •valuaciones numéricas use a) una sola aplicación

f Jo

21.15 Realice la misma evaluación que en el problema 21.14, pero ahora use las reglas de Simpson. 21.16 Evalúe la integral de los siguientes datos tabulados mediante la regla trapezoidal:
-3 -1

dx
flx)

1 1
3

21.17 Realice la misma evaluación que on el problema 21.16, paro ai^¡aj||Jij»jegla» de Simpson.

I I , I N Determino el valor medio de la (unción
/( o • •ULTRA

SlmpHon 1/3. Para b) y e ) calcule el error relativo porcentual ((',). 2 1 . 2 1 Evalúe la integral triple
4

4d + 45.4.V - 13.8JC + 1.71* - 0,Ü72^'
2 3

2 y 10 a) graficando la función y estimando en forma VlHlIH1 el valor medio, b) usando la ecuación (PT6.4) y la evaluaR O N ttiinlilica de la integral, y c) mediante la ecuación (PT6.4) y I I H M versión de la regla de Simpson con cinco segmentos para •lllinm In integral. Calcule el error relativo porcentual.

\

J-4J0 J-l
2yz)

dx dy dz

d) analíticamente y b) usando sólo aplicaciones de la regla de Simpson 1/3. Para b) calcule el error relativo porcentual (e,). 2 1 . 2 2 Desarrolle un programa en computadora de uso amigablo II,IV función para la regla trapezoidal de aplicación múltiple con base en la figura 21.9. Entre otras cosas, a) agregue comentarios de docullil < • mentación al código, b) haga que la entrada y salida estén orientadas al usuario y c) modifique el programa para que sea capaz H» pupilo usar para generar la siguiente tabla de datos desigualde evaluar funciones dadas además de datos tabulados. Pruebe HltlilD espaciados: su programa con los mismos datos de cálculo del problema 21 .2. 2 1 . 2 3 Desarrolle un programa de cómputo de uso amigable para 0.7 o 0.1 0.3 0.5 0.95 1.2 la versión de aplicación múltiple de la regla de Simpson con base I 0.9048 0.7408 0.6065 0.4966 0.3867 0.3012 en la figura 21.14c. Pruébelo con los mismos datos de cálculo del ejemplo 21.5. t'viilíic la integral desde a = 0 hasta b = 1.2 con a) medios 2 1 . 2 4 Desarrolle un programa de cómputo de uso amigable para H I I H I I I K O S , b) la regla trapezoidal y c) una combinación de las integrar datos desigualmente espaciados con base en la figura I P U I I I N trapezoidal y de Simpson; emplee las reglas de Simpson 21.166. Pruébelo con los mismos datos de cálculo del ejemplo I I I I I H I O sea posible para obtener la mayor exactitud. Para b) y c), 21.8. imkulc el error relativo porcentual (£,). 2 1 . 2 5 Use el programa Intégrate Function del disco T O O L K I T 1 1 . 2 0 I i valúe la siguiente integral doble: de métodos numéricos (o su propio programa a partir del problema 21.22) para repetir a) el problema 21.2, b) el problema 2 1,3, c) el problema 21.8, d) el problema 21.10 y e) el problema 21.12, • 3y +xy ) dx dy Use la opción gráfica para que le ayude a visualizar el concepto il) timilllieumente, b) con una aplicación múltiple de la regla que I = ¡ f(x) dx es el área entre la curva f(x) y el eje. Intento liupivimliil (/i = 2), c) sólo con aplicaciones de la regla de diferentes tamaños de paso para cada problema.
1 2 2

b

a

CAPITULO 2 2 Integración de ecuaciones
En la introducción de la parte seis mencionamos que las funciones que habrán de integrarse de manera numérica son típicamente de dos formas: una tabla de funciones o una función. La forma de los datos tiene una importante influencia en los procedimientos que se puede usar para evaluar la integral. Para información tabulada, nos limitaremos al número de puntos que se tengan. En contraste, si la función está disponible, se puede generar tantos valores de f(x) como se requiera para alcanzar una exactitud aceptable (recuerde la figura PT6.7). Este capítulo dirige su atención a dos técnicas que están expresamente diseñadas para analizar casos donde se da la función. Ambas capitalizan la habilidad para generar valores de la función con el fin de desarrollar esquemas eficientes para integración numérica. La primera técnica se basa en la extrapolación de Richardson, el cual es un método que combina dos estimaciones numéricas de la integral para obtener una tercera, que tiene un valor más exacto. El algoritmo computacional para implementar en forma muy eficiente la extrapolación de Richardson se llama integración de Romberg. Esta técnica es recursiva y puede usarse para generar una estimación de la integral dentro de una tolerancia de error preespecificada. El segundo método es llamado cuadratura de Gauss. Recuerde que en el último capítulo los valores de f(x) para las fórmulas de Newton-Cotes fueron determinadas para valores específicos de x. Por ejemplo, si se usa la regla trapezoidal para determinar una integral, estamos restringidos a tomar el promedio ponderado def(x) en los extremos del intervalo. Las fórmulas de cuadratura de Gauss emplean valores dex que están posicionados entre a y b de tal forma que resulta una estimación de la integral mucho más exacta. Además de esas dos técnicas estándar, dedicamos una sección final a la evaluación de integrales impropias. En este análisis nos concentraremos en integrales con límites finitos y en mostrar cómo un cambio de variable y fórmulas de integración abierta prueban ser útiles para tales casos. 22.1 A L G O R I T M O S DE N E W T O N - C O T E S PARA ECUACIONES En el capítulo 21 presentamos algoritmos para versiones de aplicación múltiple de la regla trapezoidal y de las reglas de Simpson. Aunque estos pseudocódigos pueden ciertamente usarse para analizar ecuaciones, en nuestro esfuerzo por hacerlas compatibles con los datos o las funciones, podrían no explotar la conveniencia de estas últimas. La figura 22.1 muestra los pseudocódigos que están expresamente diseñados para casos donde la función es analítica, lin particular, observe que ni los valores de la variable independiente ni de la dependiente HC piiNiin u la función por medio de su argumento,
como fue el caso para los códigos ea ti Capitulo 2 1 . Para la variable independiente x, el

22.2 I N I F L J J T F F T N D E R Ó M B G R O

147

o)
FUNCTION TrapEq (n. a, b) h = (t>-a)/n x =a eum - f(x) D0l = l,n-1 x =x + h eum = eum + 2 * f(x) END DO eum = eum + f(b) TrapEq = (b-a) * eum / (2 * n) END TrapEq

b)
FUNCTION SimpEq (n, a, b) h = (b-a)/n

x =~a
eum = f(x) D0l = 1,n-2,2 x =x+ h eum = eum + 4 * f(x) x=x+ h eum = eum + 2* f(x) END DO x=x+ h eum = eum + 4 * f(x) eum = eum + f(b>) SimpEq = (b-a) * eum / (3 * n) END SlmpEq

FIGURA 22.1 Mi|IHilmos para M|ilii liciones múltiples de las I M I | | I I S a) trapezoidal y b) de 'iinipson 1 / 3 , donde la liini n'in está disponible.

intervalo de integración (a, b) y el número de segmentos pasados. Esta información se emplea entonces para generar valores igualmente espaciados de x dentro de la función. Para la variable dependiente, los valores de la función en la figura 22.1 se calculan mediante llamados de la función sujeta a análisis,/(X). Desarrollamos programas con simple precisión, basados en esos pseudocódigos, para analizar el esfuerzo involucrado y los errores en que se incurre cuando se usa progresivamente más segmentos para estimar la integral de una simple función. Para una función analítica, las ecuaciones para el error [ecuaciones (21.13) y (21.19)] indican que el aumento en el número de segmentos n resultará en una estimación más exacta de la integral. Esta observación es soportada por la figura 22.2, la cual es una gráfica del error verdadero contra n para la integral def(x) = 0.2 + 25x — 200X + 675JC — 900 JC + 400x . Observe cómo el error disminuye en tanto n aumenta. Sin embargo, note también que para grandes valores de n, el error empieza a aumentar cuando los errores de redondeo comienzan a dominar. Observe además que se requiere un número muy grande de evaluaciones de la función (y, por tanto, esfuerzo computacional) para alcanzar niveles altos de exactitud. Como una consecuencia de estos defectos, la regla trapezoidal de aplicación múltiple y las reglas de Simpson son algunas veces inadecuadas para resolver problemas en contextos donde se necesita alta eficiencia y errores mínimos.
2
3 4

5

22.2

I N T E G R A C I Ó N DE R O M B E R G La integración de Romberg es una técnica diseñada para alcanzar eficiencia en las integrales numéricas de funciones. Es muy similar a las técnicas analizadas en el capítulo 21 , en el sentido de que etttá basada en aplicaciones sucesivas de la regla trapezoidal. Sin embargo, aunque se lengu que hacer manipulaciones matemáticas, se alcanzan mejores resultados con menos esfuerzo.

648

INTEGRACIÓN DE ECUACIONES

100

10

O " 1 0 a • C B 1 0 0 . 2 c 2 0 0 X + 6 7 5 X 900/ +4 0 Ü X , e o a .1 0 FIGURA 22.2 Valor absoluto del error relativo porcentual verdadero contra el número de segmentos para la determinación de la integral de f(x| = + 25x

Regla trapezoidal

2

2

evaluada desde a = 0 hasta b = 0.8 mediante la regla trapezoidal de aplicación múltiple y la regla de aplicación múltiple de Simpson 1/3. Observe que ambos resultados indican que para un gran número de segmentos, los errores de redondeo limitan la precisión.

5

3

10 -3

a>

i

4

< D
.

10 -5

Límite de precisión Regla de Simpson 1/3 Límite de precisión

L U
22.2.1

2

. -

10 -6

I

I , I . I ,1
16 32

I , ,,l
64

I

I, I

I

I

I

I

256 1 024 4 096 16 384 128 512 2 048 8 192 Segmentos

Extrapolación de Richardson

Recuerde que en la sección 10.3.3 usamos un refinamiento iterativo para mejorar la solución de un conjunto de ecuaciones lineales simultáneas. Las técnicas de corrección de errores se hallan también disponibles para mejorar los resultados de integración numérica sobre la base de las mismas estimaciones de la integral. Esos métodos usan dos estimaciones de una integral para calcular una tercera más exacta, y se les conoce por lo general como extrapolación de Richardson. El error estimado y asociado con una aplicación múltiple de la regla trapezoidal puede representarse de manera general como / = /(/;) + E(h) donde / = valor exacto de la integral, I{h) — aproximación de una aplicación de n segmentos de la regla trapezoidal con un tamaño de paso h = (b — a)ln, y E(h) — error de truncamiento. Si hacemos dos estimaciones por separado mediante tamaños de paso de h\ Y 2 Y tienen valores exactos del error,
n

(22.1)

22.2

N IT O IU fC O lN D E ROMBERO

Ahora recuerde que el error de la aplicación múltiple de la regla trapezoidal puede representarse de manera aproximada por la ecuación (21.13) [con n = (b — d)lh\. E = -^V/" (22.2)

Si en ésta se supone q u e / " es constante sin importar el tamaño de paso, la ecuación 22.2 se puede usar para determinar que la razón de los dos errores será —— = 4 (22.3)

Este cálculo tiene un importante efecto en la remoción del t é r m i n o / " de la operación. Al hacer esto, hemos hecho posible utilizar la información contenida en la ecuación (22.2) sin un conocimiento previo de la segunda derivada de la función. Para realizarlo, arreglemos de nuevo la ecuación (22.3) para tener

\h

2

la cual se puede sustituir en la ecuación (22.1):

I(hi) + E(h )(j±j = ¡(h ) + E(h )
2 2 2

que puede resolverse para E(h ) =
2

l(.hú-I(h ) \-(h /h )
2 2 { 2

Así, desarrollamos un estimado del error de truncamiento en términos de las estimaciones de la integral y de sus tamaños de paso. Dicha estimación puede entonces ser sustituida en / = I(h ) +
2

E(h )
2

para dar una estimación mejorada de la integral:

^^'pQR^-^

1

.

( 2 2 A )

Sp puede demostrar (Ralston y Rabinowitz, 1978) que el error de dicha estimación es 0(h 4). Así, cambiamos las estimaciones de la regla trapezoidal de 0(h 2) para obtener una nueva estimación de 0(h A). Para el caso especial donde el intervalo es la mitad (h = A,/2), esta ecuación es ahora
2

/

S é I(h )
2

+ ^-¡[Wi)

-

/ ( A i ) ] 7.;,']/, y j / ,; i
; 1

T |

) /'
1

' ' ( 2 2 . 5 )

o, agrupando términos,
/

4

/ ( / / í )

1 / ( A | )
3

650
EJEMPLO 2 2 . 1

INTEGRACIÓN DE ECUACIONES Correcciones de error de la regla trapezoidal

| Enunciado del problema. En el capítulo anterior (ejemplo 21.1 y tabla 21.1) usamos ¡ una variedad de métodos de integración numérica para evaluar la integral de f(x) = 0.2 | + 25x - 200x + 675x - 900x + 400x desde a = 0 hasta b = 0.8. Por ejemplo, i aplicaciones simples y múltiples de la regla trapezoidal dan los siguientes resultados:
2 3 4 s

Segmentos 1 2 4

0.8 0.4 0.2

h

Integral 0.1728 1.0688 1.4848

e„%
89.5 34.9 9.5

| ¡

Use esta información junto con la ecuación (22.5) para calcular la estimación mejorada de la integral. Las estimaciones de uno y dos segmentos se pueden combinar para dar

| Solución. |

/ = -(1.0688) - ^(0.1728) = 1.367467

| El error de la integral mejorada es E, = 1.640533 - 1.367467 = 0.273067 (£, = 16.6%), j el cual es superior a las estimaciones sobre las cuales se basa. j De la misma manera, las estimaciones para dos y cuatro segmentos se pueden com| binar para obtener | ¡ '4 1 í ! / = - ( 1 . 4 8 4 8 ) - - ( 1 . 0 6 8 8 ) = 1.623467 que representa un error deE = 1.640533 - 1.623467 = 0.017067 (e = 1.0%).
t t

La ecuación (22.4) proporciona una forma de combinar dos aplicaciones de la regla trapezoidal con un error 0(h ) para calcular una tercera estimación con un error de 0(h ). Este procedimiento es un subconjunto de un método más general para combinar integrales y obtener estimaciones mejoradas. Como ilustración, en el ejemplo 22.1, calculamos dos integrales mejoradas de 0(h ) sobre la base de tres estimaciones de la regla trapezoidal. Esos dos cálculos mejorados pueden, a su vez, combinarse para obtener aun un mejor valor con 0(h ). Para el caso especial donde las estimaciones del trapezoide original están basadas sobre sucesivas mitades de tamaño de paso, la ecuación usada para la exactitud de 0(h ) es
2 4 4 6 6

/ ^ —/,„ - — /, 15 "' 15
m 6 s

v

(22.6) '

donde I e I¡ son las estimaciones mayor y menor, respectivamente. De manera similar, dos resultados 0(h ) pueden combinarse para calcular una integral que es 0(h ) por medio de (22.7)

22.2
EJEMPLO 2 2 . 2 Corrección de error de orden luperior para estimaciones de la integral

J Enunciado del problema, lin el ejemplo 22.1 usamos la extrapolación de Richardson ¡ para calcular dos estimaciones de la integral de 0(h ). Utilice la ecuación (22.6) para | combinar esas estimaciones y calcular una integral con 0(h ).
4 6

] ! 1

Solución. Las dos estimaciones de la integral de 0(h ) obtenidas en el ejemplo 22 .1 fueron 1.367467 y 1.623467. Estos valores pueden sustituirse en la ecuación (22.6) para
4

obtener

i
|
I

/ = ( 1 . 6 2 3 4 6 7 ) - ^ ( 1 . 3 6 7 4 6 7 ) = 1.640533 que es una respuesta correcta con las siete cifras significativas que se han utilizado en este ejemplo. 2 2 . 2 . 2 El a l g o r i t m o de integración de R o m b e r g Observe que los coeficientes en cada una de las ecuaciones de extrapolación [ecuaciones (22.5), (22.6) y (22.7)] aumentan hasta 1. De esta manera, éstos representan los factores ponderados que, al aumentar la exactitud, dan un peso relativamente mayor sobre la estimación de la integral superior. Estas formulaciones se pueden expresar en una forma general que se ajusta muy bien para la implementación en computadora:

| l

y+l,jfc-l
7
J+l k

(22.8)

donde I , . ! = las integrales más y menos exactas, respectivamente; e Ij = la &I integral mejorada. El subíndice k significa el nivel de la integración, donde k = 1 corresponde a la regla trapezoidal original, k = 2 corresponde a 0(h ), k = 3 a 0(h ), y así en forma sucesiva. El subíndice j se usa para distinguir entre las estimaciones más (f + 1) y menos (/') exactas. Por ejemplo, para k = 2 yj = 1, la ecuación (22.8) se convierte en
k 4 6

•i lk2

I 1,2

4/ ,i - / 1,1

la cual es equivalente a la ecuación (22.5). La forma general representada por la ecuación (22.8) es atribuida a Romberg, y su aplicación sistemática para evaluar integrales se denomina integración de Romberg. La figura 22.3 es una ilustración gráfica de la secuencia de la estimación de la integral generada con este procedimiento. Cada matriz corresponde a una sola iteración. La primera celumna contiene las evaluaciones de la regla trapezoidal que están designadas por fp, donde j — 1 es para una aplicución de un solo segmento (el tamaño de paso es b — a), j = 2 es para una aplicación con dos segmentos [el tamaño de paso es (b — a)/2],j = 3 es para una aplicación de cuatro tegmentos [el tamaño de paso es (b — a)/4], y asi sucesivamente. Las otras columnas di la matriz son generadas de manera sistemática mediante la ecuación (22.8) para obtener OBda ve/, mejores estimaciones do la integral.

652

INTEGRACIÓN DE ECUACIONES

a)

0.1728001.0688000.172800 1.068800 • 1.484800 • 0.172800 1.068800 1.484800 • 1.600800 •

.367467

0(h*)

0(n«)

b)

FIGURA 22.3 Ilustración gráfica de la secuencia de las estimaciones de la integración que se generó con la integración de Romberg.

.367467 .623467 -

.640533

c)

.367467 .623467 • .639467 •

.640533: 1.640533-

.640533

Por ejemplo, la primera iteración (véase figura 22.3a) involucra calcular estimaciones con la regla trapezoidal para uno y dos segmentos ( / [ , e I ). La ecuación (22.8) se A usa entonces para calcular el elemento J, = 1.367467, el cual tiene un error de Ahora, debemos verificar para establecer si este resultado es conveniente para nuestras necesidades. Como en los otros métodos aproximados en este libro, se requiere una terminación, o criterio de paro, para asegurar la exactitud de los resultados. Un método que puede emplearse para el propósito actual es [véase ecuación (3.5)]
21 2

0(h ).
(22.9)

-

Iu - i

100%

FIGURA 22.4 Pseudocódigo para la integración de Romberg que usa la versión de segmentos de igual tamaño de la regla trapezoidal a partir de la figura 2 2 . 1 .

FUNCTION Rhomberq (a, b, maxit, es) LOCAL 1(10,10) n = 1 • /,_, = TrapEq(n, a, b) iter = O DO Iter = iter + 1 n = 2*""
W u = TrapEq(n, a, b) D0k = 2, iter + 1 j = 2 + iter - k
+

END DO ea = A35((l - í J / l ,) * 100 IF (Iter £ maxit OR ea <, es) EXIT END DO
1¡tter+Í
l f t

liter+

Rhorntot? m /

)(((frt(

22.3

Cl

donde e„ «• una eatimaelón del error relativo porcentual. De esta mnncru, corno se hizo antes en otros procesos llerottvoN, comparamos la nueva estimación con el valor anterior. Cuando el cambio entre I ON valores anteriores y nuevos como el que representa E está por debajo de un criterio de error preespecificado £ , el cálculo termina. Para la figura 22.3a, esta evaluación indica un 87.4% de cambio sobre el curso de la primera iteración. El objetivo de la segunda iteración (véase figura 22.36) es obtener Ja estimación 0(h ), (/j ) . Para hacer esto, se determina una estimación adicional con la regla trapezoidal, 7 ! = 1.4848. Esto se combina entonces con I mediante la ecuación (22.8) para generar I = 1.623467. El resultado se combina, a su vez, con /, para obtener /, so 1.640533. La ecuación (22.9) se puede aplicar para determinar que este resultado representa un cambio del 22.6% cuando se compara con el resultado previo / , . La tercera iteración (véase figura 22.3c) continúa el proceso en la misma forma. En este caso, una estimación trapezoidal se agrega a la primera columna, y entonces la ecuación (22.8) se aplica para calcular en forma sucesiva integrales más exactas a lo largo de la diagonal inferior. Después de sólo tres iteraciones, debido a que evaluamos un polinomio de quinto orden, el resultado ( 1 , = 1.640533) es exacto. La integración de Romberg es más eficiente que la regla trapezoidal y las reglas de Simpson analizadas en el capítulo 21. Por ejemplo, para la determinación de una integral como la expuesta en la figura 22.1, la regla de Simpson 1/3 requeriría una aplicación con 256 segmentos para dar un estimado de 1.640533. Podría no ser posible realizar aproximaciones más finas debido al error de redondeo. En contraste, la integración de Romberg da un resultado exacto (hasta con siete cifras significativas) basado en la combinación de las reglas trapezoidales con uno, dos, cuatro y ocho segmentos; es decir, ¡con sólo 13 evaluaciones de la función! La figura 22.4 representa el pseudocódigo para la integración de Romberg. Al usar ciclos, este algoritmo implementa el método en forma eficiente. La integración de Romberg está diseñada para casos donde se conoce la función que será integrada. Esto se debe al conocimiento de la función que permite las evaluaciones requeridas para la implementación inicial de la regla trapezoidal. Los datos tabulados están rara vez en la forma requerida para dividirlos a la mitad sucesivamente.
a s 6 3 3 2X 22 2 3 2 4

C U A D R A T U R A DE G A U S S En el capítulo 21 estudiamos el grupo de integración numérica o fórmulas de cuadratura conocidas como ecuaciones de Newton-Cotes. Una característica de éstas (con excepción del caso especial de la sección 21.3) es que la estimación de la integral se basó sobre valores de la función uniformemente espaciados. En consecuencia, la localización de los puntos base que se usó en esas ecuaciones fue predeterminado o fijo. Por ejemplo, como se describe en la figura 22.5a, la regla trapezoidal se basa en el cálculo del área bajo la línea recta que conecta los valores de la función en los extremos del intervalo de integración. La fórmula que se usa para calcular el área es l=(b-a) f(a) + f(b) 2 (22.10)

donde a y b = límites de integración y h — a = ancho del intervalo de integración. Debido a que la regla trapezoidal debo pasar a través de los puntos extremo, exiaten O A A O A como el de la figura 22,5a donde la fórmula resulta en un error grande,

654

INTEGRACIÓN DE ECUACIONES

FIGURA

22.5

o) Ilustración gráfica de la regla trapezoidal como el área bajo la línea recta que une puntos extremo fijos, b] Una estimación de la integral mejorada obtenida al tomar el área bajo la línea recta que pasa por dos puntos intermedios. Al posicionar esos puntos en forma inteligente, los errores positivo y negativo se equilibran, lo cual proporciona una estimación .mejorada de la integral.

a)

Ahora, suponga que la restricción de los puntos base fijos fue eliminada y se tiene la libertad de evaluar el área bajo una línea recta que conecta dos puntos cualquiera sobre la curva. Al ubicar esos puntos en forma inteligente, podríamos definir una línea recta que equilibraría los errores negativo y positivo. De ahí que, como en la figura 22. 5b, podríamos llegar a una evaluación mejorada de la integral. Cuadratura de Gauss es el nombre para una clase de técnicas para implementar tal estrategia. Las fórmulas particulares de cuadratura de Gauss descritas en esta sección se denominan fórmulas de Gauss-Legendre. Antes de exponer el procedimiento, mostraremos cómo las fórmulas de integración numérica tales como la regla trapezoidal pueden derivarse mediante el método de coeficientes indeterminados. Este método entonces se empleará para desarrollar las fórmulas de Gauss-Legendre.

22.3.1

Método de coeficientes i n d e t e r m i n a d o s

En el capítulo 21 derivamos la regla trapezoidal al integrar un polinomio de interpolación lineal y por un razonamiento geométrico. El método de coeficientes indeterminados ofrece un tercer procedimiento que también tiene utilidad para derivar otras técnicas de integración como la cuadratura de Gauss. Para ilustrar el procedimiento, HC expresa la ecuación (22.10) como
f22.ll)

donde In* c «• uonulanlo», Ahora noto que la reglu trapezoidal deberla dur rcmi liado» exactos cuando In lunolón Hu,|etn a integración es una constante o unu Uncu roela. Dos ecuaciones simpleN que reprcsenlun osos casos son .y = 1 y y = x. Ambas se ilustran en la figura 22.6. A s i , se deberla cumplir las siguientes igualdades:
-(b~a)/2

y

C'O +

C\ =
b-a

I

1 dx
a)/2 /•(p-a), fO-a)/2 = /

- C O —

H

2

b-a C'i — - — 2

J-(b-a) .l-(b-a)/2

x dx

o, evaluando las integrales,

c + c\ = b - a
0

FIGURA 22.6 Dos integrales que deberían ser evaluadas exactamente por la regla trapezoidal: a) una constante y b) una línea recta.

656

INTEGRACIÓN DE ECUACIONES y

b —a - c o —

b —a + c , — = 0

Estas dos ecuaciones con dos incógnitas se pueden resolver para b —a

la cual, al sustituirse en la ecuación (22.11), da
I =
b

-^ <^f(b)
m+

que es equivalente a la regla trapezoidal. 22.3.2 D e s a r r o l l o de la fórmula de Gauss-Legendre de d o s p u n t o s

Como fue el caso para el desarrollo anterior de la regla trapezoidal, el objetivo de la cuadratura de Gauss es determinar los coeficientes de una ecuación de la forma I =c f(xo)
0

+ Cif(xi)

(22.12)

donde las c = coeficientes desconocidos. Sin embargo, en contraste con la regla trapezoidal que usa los puntos extremo fijos ay b, los argumentos de la función x y x, no están fijos en los puntos extremo, pero son desconocidos (véase figura 22.7). De esta manera, ahora tenemos un total de cuatro incógnitas que deben ser evaluadas y, en consecuencia, requerimos cuatro condiciones para determinarlas con exactitud.
0

FIGURA 2 2 . 7
Ilustración gráfica de las variables desconocidas XQ y x, para integración por medio de cuadratura de Gauss.

5

^

/

-1

XQ

X,

1

X

Asi oomo p a n t i n f l a trapezoidal, podomos obtener dos de esas condicioneii al suponer que la ecuación (22,12) ujuslu la integral do una constante y de una llmclón lineal con exactitud, Donpiióa, paru tener las otras dos condiciones, sólo oxtenderémoi este razonamiento al suponer que también ajusta la integral de una función parabólica (y = x ) y de una cúbica (y = x ). Para hacer esto, determinamos las cuatro incógnitas y en la condición derivamos una fórmula de integración lineal de dos puntos que es exacta para cúbicas. Las cuatro ecuaciones que habrán de resolverse son:
2 3

cof(xo)

+c f(x )
l ]

(22.13)
C\f(Xi)

Cof(Xo) +
cof(xo) + c\f(xi)

dx

=0

(22.14)
-

£
:

: dx =
2

3

(22.15) (22.16)

co/Oo)

+ C l / ( * l )

: dx = 0
3

Las ecuaciones (22.13) a la (22.16) pueden ser resueltas simultáneamente para c =
0 0

Ci =

1

x = — \ = = -0.5773503... V3 x = ~ = 0.5773503... V3
x

que puede ser sustituida en la ecuación (22.12) para obtener la fórmula de Gauss-Legendro de dos puntos

(22.17)

Así, llegamos a un resultado interesante en que la simple suma de los valores de la función enx = l / V j y — 1 /V3 dan una estimación de la integral que tiene una exactitud de tercer orden. Observe que los límites de integración en las ecuaciones (22.13) a (22.16) son desde — 1 a 1. Esto se hizo para simplificar la matemática y para hacer la formulación tan general como sea posible. Es posible usar un simple cambio de variable para trasladar otros límites de integración en esta forma. Esto se realiza al suponer que una nueva variable x se relaciona con la variable original x en una forma lineal, como en
d

(ID

+a\x

(22.18)
tl

Si el limite inferior, x = a, corresponde a x = — 1, estos valores podrán sustituirse en lu ecuación (22.18) para dar
a - un | </,(- I)

(22.19)

658

INTÍORACIÓN DE

ECUACIONES

ü e manera similar, el límite superior, x = b, corresponde a x = 1, para dar
u

b = a +a ([)
() l

(22.20)

Las ecuaciones (22.19) y (22.20) podrán resolverse simultáneamente para b + a y b — a (22.22) las cuales se pueden sustituir en la ecuación (22.18) para obtener x = (b + a) + (b 2 a)x
d

(22.21)

(22.23)

Esta ecuación puede diferenciarse para dar dx = - y - dx (22.24)

d

Las ecuaciones (22.23) y (22.24) podrán sustituirse para x y dx, respectivamente, en la ecuación que se habrá de integrar. Esas sustituciones efectivamente transforman el intervalo de integración sin cambiar el valor de la integral. El siguiente ejemplo ilustra cómo se realiza esto en la práctica.

EJEMPLO 22.3

Fórmula de Gauss-Legendre de dos puntos

Enunciado del problema .

Use la ecuación (22.17) para evaluar la integral de
2

f(x) = 0.2 + 25x - 200x

+ 675x

3

- 900x + 4 0 0 *
4

5

entre los límites x — 0 a 0.8. Recuerde que éste fue el mismo problema que resolvimos en el capítulo 21 con una variedad de formulaciones de Newton-Cotes. El valor exacto de la integral es 1 .640533. Solución. Antes de integrar la función, debemos realizar un cambio de variable para que los límites sean de — 1 a + 1 . Para ello, sustituimos a = 0 y ¿ = 0 . 8 e n l a ecuación (22.23) para obtener x = 0.4 + 0.4Ad

La derivada de esta relación es [véase ecuación (22.24)]
I

dx - 0 .4 dx

d

Ambas ecuaciones pueden ser sustituidas en la ecuación original para dar
,•11.H

/ Jo

=j

(0.2 I 2.\v

2()(h' I

[0.2 + 25(0.4 +
4

(>15.\ 0Ax )
d
í/

m
675(0.4 + 0.4x,,)
;1

J

-900A'

4

- 200(0.4 +
5 d

0.4x f +
d

+400r )í/.A'
,

- 900(0.4 + 0.4x¿) + 400(0.4 + 0.4x ) ]0.4 dx

Por tanto, el lado derecho está en la forma adecuada para evaluación mediante cuadratura de Gauss. La función transformada se puede evaluar en — 1/V3 para ser igual a 0.516741 v e n - 1 / V 3 para ser igual a 1.305837. Por tanto, la integral, de acuerdo con la ecuación (22.17), es / = 0.516741 + 1.305837 = 1.822578 la cual representa un error relativo porcentual de — 11.1 %. Este resultado es comparable en magnitud a la aplicación de cuatro segmentos de la regla trapezoidal (tabla 21.1) o a una simple aplicación de las reglas de Simpson 1/3 y 3/8 (véase ejemplos 21.4 y 21.6). Es posible predecir este último resultado debido a que las reglas de Simpson son también de tercer orden de exactitud. Sin embargo, como se buscó una selección inteligente de los puntos base, la cuadratura de Gauss alcanza esta exactitud con base en sólo dos evaluaciones de la función.

TABLA 22.1

Factores de peso c y argumentos de la función x usados en las fórmulas de Gauss-Legendre.
Factores de peso
C

Puntos
0

Argumentos de l a f u n c i ó n
x

E r r o r de truncamiento

C)

= 1.0000000 = 1.0000000

o = -0.577350269 = 0.577350269

C

= 0.5555556 = 0.8888889 c = 0.5555556
0
2 c

o -0.774596669 i = 0.0 0.774596669 x
x x 2

o

0.3478548

Cl
c

c

= 0.6521452 2 = 0.6521452 3 = 0.3478548
0

= -0.861136312 = -0.339981044 x = 0.339981044 3 = 0.861136312
X

0
l

x

2

X

= = C2 = 3 = = C
C

Cl

c

4

0.2369269 0.4786287 0.5688889 0.4786287 0.2369269 0.1713245

= -0.906179846 = -0.538469310 x = 0.0
X

0
l

x

2

x

3 =
4

0.538469310

X

= 0.906179846

Co
c

l

= 0.3607616

c

2 = 0.4679139

c.'i

C - 0.360761 ó
0.1713245

A

- 0.4679139

-

-0.932469514 = -0.661209386 x = -0.238619186 0.238619186 3 0.661209386 0,9324695 M í
X

0

x

l

2

x

*A
x

-

660

INTEGRACIÓN DE ECUACIONES

22.3.3

F ó r m u l a s de p u n t o s u p e r i o r

Más allá de la fórmula de dos puntos descrita en la sección anterior, se puede desarrollar versiones de punto superior en la forma general / = c /(jr ) + c i / ( * i ) +
0 0

• • • +

C„_,/(JC„_I)

(22.25)

donde n = número de puntos. Los valores de las c y las x incluyendo la fórmula con seis puntos se resumen en la tabla 22.1.
EJEMPLO 2 2 . 4 Fórmula de Gauss-Legendre de tres puntos

Enunciado del problema. Con la fórmula de tres puntos de la tabla 22.1 calcule la integral para la misma función que en el ejemplo 22.3. Solución. De acuerdo con la tabla 22.1, la fórmula de tres puntos es

/ = 0.5555556/(-0.7745967) + 0.8888889/(0) + 0.5555556/(0.7745967) la cual es igual a / = 0.2813013 + 0.8732444 + 0.4859876 = 1.640533 que es exacta.

Debido a que la cuadratura de Gauss requiere evaluaciones de la función en puntos espaciados uniformemente dentro del intervalo de integración, no es apropiada para casos donde la función se desconoce. Así, no es adecuada para problemas de ingeniería que tratan con datos tabulados. Sin embargo, cuando se conoce la función, su eficiencia puede ser una ventaja decisiva. Esto es en particular cierto cuando se debe realizar muchas evaluaciones de la integral.
EJEMPLO 22.5 Aplicación de la cuadratura de Gauss al problema del paracaidista en caída

Enunciado del problema. múltiple para evaluar

En el ejemplo 21.3 se usó la regla trapezoidal de aplicación

donde g = 9.8, c = 12.5 y m = 68.1. El valor exacto de la integral se determinó por cálculo y fue de 289.4351. Recuerde que la mejor estimación obtenida mediante la regla trapezoidal con 500 segmentos fue 289.4348 con un |e,| s 1.15 X 10" %. Repita este cálculo usando la cuadratura de Gauss.
4

Solución.

Después de modificar la función, se obtienen los siguientes resultados:

Estimación con dos puntos = 290.0145 Estimación con tres puntos = 289.4393

¡arrollar

Estimación con CUBtm punto» 289.4352 Bstimiiclón con cinco puntoH 289.4351 Estimación con seis p u n t o s 289.4351 Así, las estimaciones c o n c i n c o y seis puntos dan resultados séptima cifra significativa.
que

(22.25) con seis

son exactos hasta la

22.3.4

A n á l i s i s de e r r o r p a r a la c u a d r a t u r a de G a u s s

ilcule la

El error para las fórmulas de Gauss-Legendre se especifica por lo general con (Carnahan y cois., 1969) E, = 2 "+ [(n + l ) ! ]
2 3 4 2 n + 2 ) ( g ) ( 2 2 2 6 )

( 2 / i + 3) [(2n + 2) !])7) donde n — número de puntos menos uno y / " ( < ^ ) = la (2« + 2)-ésima derivada de la función después del cambio de variable con ¿| localizada en algún lugar sobre el intervalo desde —1 a 1. Al comparar la ecuación (22.26) con la tabla 21.2 queda expuesta la superioridad de la cuadratura de Gauss sobre las fórmulas de Newton-Cotes, contando con que las derivadas de orden superior no aumenten sustancialmente con un incremento en ra. El problema 22.8 al final de este capítulo ilustra un caso donde las fórmulas de Gauss-Legendre tienen un desempeño pobre. En esas situaciones, sería preferible la api i cación múltiple de la regla de Simpson o de integración de Romberg. Sin embargo, pura muchas funciones confrontadas en la práctica de la ingeniería, la cuadratura de Gauss proporciona un medio eficiente para la evaluación de las integrales.
(2 +2)

i puntos para caería que íciencia zar mu-

22.4

INTEGRALES IMPROPIAS Hasta aquí, tratamos en forma exclusiva con integrales que tienen límites finitos c integrandos acotados. Aunque esos tipos son de uso común en ingeniería, habrá ocasiones en que se deba evaluar integrales impropias. En esta sección nos concentraremos en un tipo de integral impropia (es decir, una con un límite inferior de — °° y uno superior de + o o Tales integrales a menudo pueden evaluarse realizando un cambio de variable que transforma el rango infinito en uno que es finito. La siguiente identidad sirve para este propósito y trabaja para cualquier función que disminuye hacia cero al menos tan rápido como l/x en tanto x se aproxima al infinito:
2

da licación

linó por : la regla pita este

Í' *=.CMT)'"
w
J

<22

' »
27

dos:

para ab > 0. Por tanto, se puede usar sólo cuando a es positiva y b es °°, o cuando a es —o» y b es negativa. Para casos donde los límites son desde - « a u n valor positivo o desde un valor negativo a °°, la integral se implementa en dos pasos. Por ejemplo,

f[.\)dx-j f{x)dx\ \ JXx)dx % i -nu
J A

662

INTEORACIÓN DE ECUACIONES

donde —A se elige como un valor negativo lo suficientemente grande para que la función comience a aproximarse a cero en forma asintótica al menos tan rápido como 1/x . Después la integral ha sido dividida en dos partes: la primera podrá evaluarse con la ecuación (22.27) y la segunda con una fórmula cerrada de Newton-Cotes tal como la regla de Simpson 1/3. Un problema con el uso de la ecuación (22.27) para evaluar una integral es que la función trasformada será singular en uno de los límites. Pueden usarse las fórmulas de integración abierta para evitar este dilema en tanto nos permita la evaluación de la integral sin emplear datos en los puntos extremo del intervalo de integración. Para permitir la máxima flexibilidad, se requiere de una versión de aplicación múltiple de una de las fórmulas de la tabla 21.4. Las versiones de aplicación múltiple de las fórmulas abiertas podrán confeccionarse mediante fórmulas cerradas para los segmentos interiores y fórmulas abiertas para los extremos. Por ejemplo, la regla trapezoidal de segmentos múltiples y la regla del punto medio se pueden combinar para dar
2

r

f(x) dx = h

+ £/(*<)
[=2

n-2

Además, es posible desarrollar fórmulas semiabiertas para casos donde uno u otro extremo del intervalo es cerrado. Por ejemplo, una fórmula que es abierta en el límite inferior y cerrada en el superior está dada por f(x) dx = h

« i
(=2
3/2

Aunque se puede usar estas relaciones, una fórmula conveniente es (Press y cois., 1986) / " /(*) dx = h[f(xi )
/2

JXo
E J E M P L O 22.6

+ f(x )

+ ••• +

f(x - /2)
n 3

+ f(x„- )]
m

(22.29)

la cual es conocida como la regla extendida de punto medio. Observe que esta fórmula se basa en los límites de integración que son k/2 después y antes del primer y último dato (véase figura 22.8).
Evaluación de una integral impropia

;

Enunciado del problema. La distribución normal acumulativa es una fórmula importante en estadística (véase figura 22.9): FIGURA 22 .8
Colocación de datos en relación con los límites de integración para la regla extendida de punto medio.

* / i2 % 2 * 6 «
1 — \

* n e / 8
/I—I

* n 3 2 / * n i «
L _
1
0

1

FIGURA 2 2 . 9
o) La distribución normal, b) la abscisa transformada en términos de la desviación normal estandarizada, y c) la distribución normal acumulativa. El área achurada en a) y el punto on c) representan la probabilidad de que un evento aleatorio sea menor que la media más una desviación estándar.

N(x)

=
y

(E22.6.I)

donde x = (y — y)ls se llama desviación estándar normalizada. Representa un cambio de variable para escalar la distribución normal de tal forma que esté centrada en cero y lu distancia u lo largo de la abscisa sea medida en múltiplos de la desviación cstrindur (véase finura 22.%). Le ecuación (E22.6.1) representa lu probabilidad de que un evento sea menor que x. P A R E J E M P L O , si x 1, la ecuación (1'.22,6.1) podrá usarse pura determinar que la proba-

664
|

INTEGRACIÓN DE ECUACIONES

bilidad de ocurrencia de un evento es menor que una desviación estándar por arriba de la media es N(l) = 0.8413. En otras palabras, si ocurren 100 eventos, aproximadamente 84 serán menores que la media más una desviación estándar. Como la ecuación (E22.6.1) no puede evaluarse en una forma funcional simple, se resuelve numéricamente y se enlista en tablas de estadísticas. Use la ecuación (22.28) en conjunto con la regla de Simpson 1/3 y la regla extendida de punto medio para determinar numéricamente N(l). Solución. como N{x) La ecuación (E22.6.1) se puede expresar en términos de la ecuación (22.28)

-Lf
1
llTt .

i'"'e-* ' dx+
2 2

V27T \J-oo

J-2

f
2,¿)

e- ' dx\
x2 2

/

La primera integral podrá evaluarse mediante la ecuación (22.27) para dar
-2 , 0 !

/"
J-co

e-rl dx=
2

f
J - l / 2
R

\e~^ dt
~

Después la regla extendida de punto medio con h = 1/8 se empleará para estimar
0

i
^ 1/2 '

,
dt =

1
- [ / ( J C _
7

/ 1 6 )

+

/ ( - T - 5 / 1 6 )

+

/ ( * - 3 / l

6

)

+

/ U - l / 1 6 ) ]

=

- [ 0 . 3 8 3 3 + 0.0612 + 0 + 0] = 0.0556

Es factible usar la regla de Simpson 1/3 con h = 0.5 para estimar la segunda integral como e-*-'
2

dx
0 . 1 3 5 3 + 4 ( 0 . 3 2 4 7 + 0 . 8 8 2 5 + 0 . 8 8 2 5 ) + 2 ( 0 . 6 0 6 5 + 1) + 0 . 6 0 6 5 3(6)

_ [1
=

( 2)]

2.0523

Por tanto, el resultado final se calculará como
7V(1)

= --L:(0.0556 + 2 . 0 5 2 3 )
V2TT

= 0.8409

la cual representa un error e, = 0.046%.

«>

El cálculo anteriorpuede ser mejorado de diferentes maneras. Primero, se podría usar fórmulas de orden superior; por ejemplo, mediante una integración de Romberg. Segundo, puede usarse más puntos. Press y cois. (1986) exploran con detalle ambas opciones. Además de los límites infinitos, hay otras formas en las cuales una integral puede ser impropia. Ejemplos comunes incluyen casos donde la integral es singular en los límites o en un punto dentro de lo integral. Press y cois. (1986) proporcionan un buen análisis lobre lo» medioi par» meat^aMiMtltuecionei,

P R O B L E M A ! ••-«^•PH »*
PROBLEMAS

443

12,1 Uso la integración d eR o m b e r gp a r ae v a u la r
^ ' (A• + \/x) dx
2

b)

e

y

sen y dy
2

i •dy m i ue x a c t t iu dd e e = 0.5%. Sus resultados d e b e r á n presen- i o (i + / x i + y^) Urso e n la f o r m ad e la figura 22.3. Use el valor v e r d a d e r od e 4. N113 p a r ad e t e r m n ia r el error v e r d a d e r o e, d e l resultado q u e e d) s ( ye dy nblivo c o n la integración d eR o m b e r g . Verifique q u e e, s e am e n o rq u e cl criterio d ep a r o e. II.I Use la integración d eR o m b e r gp a r au no r d e nd eh p a r a e^dx f 2 i pvuliur O b s e r v eq u e d) e s la distribución n o r m a l( r e c u e r d e la figura 22.9). 22.10Desarrolle u np r o g r a m ae nc o m p u t a d o r ad e uso a m g ia b e l dx p a r a la regla trapezoidal d es e g m e n t o s múltiples y p a r a la regla d e Simpson 1/3 c o nb a s ee n la figura 22.1. P r u é b e o l c o n la intec o m p a r e e y £,. g r a c ó ind e
c)
IHIII

r

s

y

s

é)

s

a

U 'i H r l o

„20(Jf-l) s e n Use el valor v e r d a d e r od e 0.0602297 p a r ac a c lu a l re ,p a r a • « 4. +X c o nu n a1 e x a c t t iu d del o r d e nd e h . Sus resultados d e b e r á n22 pre.11 Desarrolle u np r o g r a m ae nc o m p u t a d o r ap a r a la integraN o n t u r s ee n la f o r m ad e la figura 22.3. c ó ind eR o m b e r gc o nb a s ee n la figura 22.4. P r u é b e o l c o n lo» Z 2 . 4 0 b t e n g au n aa p r o x m i a c ó i nd e la integral del p r o b e lm a 22.1, resultados d e los e e jm p o l s 22.3 y 22.4 y c o n la función en el p e r ou h o r au s e las fórmulas d eG a u s s L e g e n d r ec o n dos, tres y p r o b e lm a 22.10. puntos. C a c lu e l e, p a r ac a d ac a s oc o nb a s ee n la sol u ci n 22.12ó Desarrol le u np r o g r a m ae nc o m p u t a d o r ad eu s oa m g ia b e ls analítica. p a r a la c u a d r a t u r ad e Gauss. P r u é b e o l c o n los resultados d e I ON 12.5 O b t e n g au n ae s t m i a c ó i nd e la integral d e lp r o b e lm ae 22.2, e jm p o l s 22.3 y 22.4 y c o n la función e n el p r o b e lm a 22.10. p e r ou h o r au s e las fórmulas d eG a u s s L e g e n d r ec o n dos, tres y 22.13Use el p r o g r a m aq u e desarrolló e n el p r o b e lm a 22.11 p a r a puntos. C a c lu e l e , p a r ac a d ac a s oc o nb a s ee n la sol uci ó n los p resol v er r o b e lm a s a) 22.1, b) 22.2 y c) 22.3. NIIN IHI CU. 22.14 Utilice el p r o g r a m aq u e desarrollo e n el p r o b e lm a 22.12 111>( ) b t c n g au ne s t m i a d od e la integral del p r o b e lm a 22.3 m - ver los p p a r ae resol r o b e lm a s á) 22.4, b) 22.5 y c) 22.6. illiinlo las fórmulas d eG a u s s L e g e n d r ec o n seis puntos. 22.1 SDesarrolle u np r o g r a m aq u em i p e lm e n t e la regla e x t e n d d ia ZZ,7 R e a c il e el c á c lu o l d e los e e jm p o l s 21.3 y 22.5 p a r a el p a r a d e p u n t om e d o i e nf o r m a iterativa. Inicie las i n t e g r a c i o n e s con caidista e nc a d ía ,p e r oa h o r au s e la i n t e g r a c i ó nd eR o m b e r g (e u n a e s t m i a c ó i n inicial b a s a d ae nu n solo p u n t oyc o n la regla de ~ 0.01%). p u n t om e d o i a partir d e la t a b a l 21.4. D e s p u é sa p q il u ed em a n e r a ll.H limplee las fórmulas d eG a u s s L e g e n d r ed e s d ed o sc h a s t a la e s u e s v i a c u a c ó i n (22.29) c o n el intervalo dividido e n t r e 3 en NC I H p u n t o sp a r a resolver c a d ae t a p a ;e s t o es, h = (b — a)/3, (b - a)/9, (b — á)l27, e t c é t e ra. O b s e r v eq u ee s t o significa q u eu n tercio d e la función estimad ah a b r á sido d e t e r m n ia d ae n la iteración previa. Desarrolle m dx I + 2x algoritmo d em a n e r aq u e capitalice esta p r o p e id a d . Ejecute i t eraci o nes h a s t a q u e l a a p r o x m i a c ó i n d e l error e s t m i a d os e enInterprete sus resultados al c o m p a r a r o lsc o n la e c u a c ó i n (22.26). c u e n t r e p o r d e b a o j d e u n cri t eri o d e p a r o p r e e s p e c f i c a d o e . PrueII.') Use i n t e g r a c i ó nn u m é r c iap a r ae v a u la r las sigui e ntes in teb e el p r o g r a m a m e d a i n t e l a e v a u l a c ó i n d e l e e j m p o l 22.6. lirulcs:
A:
2

IZ. I Use la integración d eR o m b e r gp a r ae v a u la r

/

é' Jú

dx

Jo

A°'(1.2-

A)(l

) dx

%

n

O H lir o t

s

2

s

dx

_

x(x + 2)

CAPÍTULO 2 3 Diferenciación numérica
En el capítulo 4 ya se introdujo la noción de diferenciación numérica. Recuerde que se emplearon las expansiones por serie de Taylor para deducir las aproximaciones de las derivadas por diferencias divididas finitas. En el capítulo 4 desarrollamos las aproximaciones de diferencias hacia adelante, hacia atrás y centradas de las derivadas primera y mayores. Recuerde que, en el mejor de los casos, esas estimaciones tienen errores que fueron 0(h ); es decir, sus errores fueron proporcionales al cuadrado de su tamaño de paso. Este nivel de exactitud se debe al número de términos de la serie de Taylor que fueron retenidos durante la deducción de esas fórmulas. Ahora ilustraremos cómo desarrollar fórmulas de mayor exactitud para retener más términos.
2

23.1

DIFERENCIACIÓN DE F Ó R M U L A S C O N ALTA

EXACTITUD

Como se mencionó antes, se puede generar fórmulas por diferencias divididas de alta exactitud al incluir términos adicionales en la expansión de la serie de Taylor. Por ejemplo, la expansión de la serie de Taylor hacia adelante podría escribirse como [véase ecuación (4.21)] (23.1)

f(x i)
i+

=

f(Xi)

+ f'(x,)h

+

t-^-h

1

la cual puede resolverse para (23.2) En el capítulo 4 truncamos este resultado al excluir los términos de la segunda derivada y superiores y nos quedamos con un resultado final de

fXx¡)=

Kx ¿-m
i+
h
2

(23.3)

+ 0(h)

En contraste con este procedimiento, ahora retenemos el término de la segunda derivada al sustituir la siguiente aproximación de ésta [recuerde la ecuación (4.24)] (23.4)

en la ecuación (23.2) para dar
/U/+1
) - / ( * < )

JlhrO 2f(x¡ ) + f(xi)

h

h +

0(h u )
2

f ¡ R ~

23.1
Primora dsrlvndn
'IMII 'W

[A L T A X l'A C T U lID
21,

I IKII

Oih)
Ol/r'l

f'lx Segunda derivada

f(x, )-2f(x
+ 2

i + 1

) + f(x,| ) + 2f(xJ

h
+3

2

~f(x, ) + 4 f ( x , ) - 5 f | x
+ 2

í + 1

Oih) íW)
Oih] 0{li')

Tercera derivada FIGURA 23.1 f"'(x f(x

fórmulas por diferencias divididas finitas hacia adelante: se presentan dos versiones para cada derivada. La última versión incorpora más términos de la serie de expansión de Taylor y, en consecuencia, es más exacta.

Cuarta derivada f"""M • •

f"U) =
+4

-3f[x,| + 1 4 f ( x ) - 24f|x )+ 18 f | x , i ) - 5f[x¡¡
h
3

i + 3

|-3f(x

i + 2

] +

3f(x

i + 1

)-f(x )
i

+ 4

+ 3 i

+ 2 ;

+

2h

3

h f|x, ) - 4 f ( x ) + 6 f (x ) - 4f|x
4 í+3 (+2

i+1

) + Hx¡)
+2

-2í{x )
l+5

+ 1 1 f(x,- ) - 2 4 f | x , ) + 2 6 f ( x , l +4 +3

14f(x,- ) + 3f(x,[
+1

FIGURA

23.2

Primera derivada I

fórmulas por diferencias divididas finitas hacia atrás: so presentan dos versiones pura cada derivada. La úlllma versión incorpora más lóiminos de la serie de oxpunsión de Taylor y, en i onsecuencia, es más nxncta.

i. i
J

3f|x,-)-4f(x,--i) +
2h Segunda derivada

0(/,| f(x,_ )
2

o\h )
3

W 'f =
í'"(x ,,„,
1 , 1

fk)-2f(x _,|
(

+

f|x _ |
( 2

2f|x,)-5f|x,-i) + 4f|x -2 )-f|x,-- )
i

;

h

2

h Tercera derivada

2

0{h)
2 3 4

,_ "

5f\x,)ÍM Mf>.|

f ( x ) - 3 í [ x _ , ] + 3flx _ |-/ |x ,-_3)
¡ i ; 2 :

h

3

1 8 f | x l i l + 2 4 í | x , _ l - 14f|x,-_ ) + 3f|x,_ |
;

2i?

Cuarta derivada

1,11

" .

Al{x,
M/(x, ,] |

o[h) Ü[h)

,1 + 6/lx, ,) /i"

4/(x,

,| I /(*, „| y/{«, .,|

,„„,

;M M\, ,| | I lí |x, „]

668

DlFIMNCIACIÓN NUMÉRICA
l'rlmoui dorlvada fc'rror

p( .)
x

=

+ 8f(x, i) - 8f(x,-]| + f|x,-_ )
+ 2

0 ( f ) 4 )

12/) Segunda derivada p'( j = ^k+i) - 2f(x,-) + f|x,_i)
Xj 0

^ j
2

f»i .1 _ - ^ , Mx,-|-

+ 2

) + 16f|x, ) - 30f|x,| + 16f(x _]) - f|x,- |
+1 f 2 ] 2 h 2

n |

, ,
4

Tercera derivada p"( )
x¡ =

f(x ¡+2) - 2f(x¡+]| + 2f(x,- | - f(x,_ |
l 2

0

^ )
2

2fi p„

3

(Xi) =

- f j x , ) + 8f|x, ) - 1 3f|x, ) + 1 3f(x,_)) - 8f[x,-- ) + f(x,-- )
+ 3 +2 +1 2 3

0 ( / i 4 )

Cuarta derivada p"<( .)
x =

^IXÍ+2)

- 4 f ( x i ) + 6f(x,) - 4f(xi_i| 4- f|x,_ )
í+ 2

0

(

/

í

2j

fi

4

f

,„

f|;;)

__ - f ( x , ] + 12f(x, | - 39f(x | + 56f(x,| - 39í(x,_i| + 12f(x,- l + f(x,_ |
+3 +2 ;+1 2 3

^

FIGURA 23.3

Fórmulas por diferencias divididas finitas centradas: se presentan dos versiones para cada derivada. La última versión incorpora más términos de la serie de expansión de Taylor y, en consecuencia, es más exacta.

o, al agrupar términos,
fXx¡) =

-^)+y-3Ax»
2h

+

0(h2)

Observe que la inclusión del término de la segunda derivada mejoró la exactitud en 0{h ). Se puede desarrollar versiones mejoradas similares para las fórmulas hacia atrás y centradas, así como para las aproximaciones de derivadas superiores. Las fórmulas se resumen en las figuras 23.1 a 23.3 junto con los resultados del capítulo 4. El siguiente ejemplo ilustra la utilidad de esas fórmulas para la estimación de las derivadas.
2

EJEMPLO 23.1

Diferenciación de fórmulas de alta exactitud

Enunciado del problema.
f(x) = -O.lx
4

Recuerde que en el ejemplo 4.4 estimamos la derivada de
3

-0.15JC

- 0.5 JT - 0.25x + 1.2
2

enjjx • O.S^sando diferencias djvldidaí finitas y un tamaño de paso de h = 0.25,

23.2
Hacia cUlanta O(h) Estimación -26.5 Hacia a t r á s O(h) -0.714 21.7

JE
Centrada

0.934 -2.4

donde los errores fueron calculados con base en el valor verdadero de —0.9125. Repita este cálculo, pero ahora emplee fórmulas de alta exactitud a partir de las figuras 23.1 a la 23.3. Solución.
x¡-2
JC,-_I

Los datos necesarios para este ejemplo son
= 0 /(x,_ ) =
2

1.2

= 0.25

/(JC,-_I)

= 1.103516

x, = 0.5 A -,+1 = 0.75
x
i+2

f(x¡) = 0.925 ) = 0.6363281
f(x )
i+2

= 1

= 0.2
2

La diferencia hacia adelante de exactitud 0(h ) se calcula como (véase figura 23.1) /'(0.5) -0.2 + 4(0.6363281) - 3(0.925) = -0.859375 2(0.25)
2

£, = 5.82%

La diferencia hacia atrás de exactitud 0(h ) se calcula como (véase figura 23.2) f (0.5) = 3(0.925) - 4 ( 1 . 0 3 5 1 5 6 ) + 1.2 2(0.25)
4

-0.878125

3.77%

La diferencia centrada de exactitud 0(h ) se calcula como (véase figura 23.3) /'(0.5) =
J

- 0 . 2 + 8 ( 0 . 6 3 6 3 2 8 1 ) - 8 1.035156) + 1.2 — —— — = -0.9125 12(0.25)

(23.5)

Como se esperaba, los errores para las diferencias hacia adelante y hacia atrás son considerablemente más exactas que los resultados del ejemplo 3.13. Sin embargo, de manera sorprendente, la diferencia centrada da un resultado perfecto. Esto es porque las fórmulas que se basan en la serie de Taylor son equivalentes a los polinomios que pasan a través de los puntos.

E, =

0%

23.2

E X T R A P O L A C I Ó N DE R I C H A R D S O N Hasta aquí hemos visto que hay dos formas para mejorar la estimación de las derivadas cuando se empican diferencias divididas finitas: 1) disminuir el tamaño de paso o 2) con una fórmula de orden superior que emplee más puntos. Un tercer procedimiento, basado en la extrapolación do Riehardson, usu dos estimaciones de la derivada para calcular una tercera aproximación más exacta.

i

670

DIFERENCIACIÓN NUMÉRICA

Recuerde de la sección 22,1.1 que la extrapolación de Riehardson proporciona un medio para obtener una estimación mejorada de la integral / por medio de la Fórmula [véase ecuación (22.4)] / ^l(h )+
2 1

[/fe)-/(/»!)]

(23.6)

(h\/h Y - 1
2

donde I(h ) e I(h ) son estimaciones de la integral usando dos tamaños de paso h y h . Debido a su conveniencia cuando se expresa como un algoritmo de cómputo, esta fórmula es usualmente escrita para el caso en el que h = h l2, como en
x 2 x 2 2 x

I = P(h )-~I(h )
2 l

(23.7)

De manera similar, la ecuación (23.7) se escribirá para las derivadas como ; D = \D(h )-\DQi )
2 x

(23.8)
5
2 4

/

|

i

Para aproximaciones por diferencias centradas con 0{h ), la aplicación de esta fórmula dará una nueva estimación de la derivada de 0(/¡ ).
EJEMPLO 2 3 . 2 Extrapolación de Riehardson

Enunciado del problema . Usando la misma función que en el ejemplo 23.1, estime la primera derivada en x — 0.5 empleando tamaños de paso de h — 0.5 y h = 0.25. Después use la ecuación (23.8) para calcular una estimación mejorada con la extrapolación de Riehardson. Recuerde que el valor verdadero es —0.9125.
x 2

Solución. Las estimaciones de la primera derivada podrán calcularse con diferencias centradas como 0.2-1.2 - - = -1.0

D(0.5) = y D(0.25) =

e, = - 9 . 6 %

0.6363281 - 1.103516 „„„ — = -0.934375
c

e, = - 2 . 4 %
n

La estimación mejorada puede determinarse al aplicar la ecuación (23.8) para obtener 4 1 D = -(-0.934375) - - ( - 1 ) = -0.9125 que para el caso actual es un resultado perfecto.

El ejemplo anterior dio un resultado perfecto pues la función sujeta a análisis fue un polinomio de cuarto orden. El resultado perfecto se debió al hecho de que la extrapolación de Riehardson es en realidad equivalente al ajuste de un polinomio de orden superior a

23.3

4W

Ira vés de lo» ditlo» para después evaluar las derivadas por dit'orencius divididus centradas. Así, el C M O actual aJuNta la derivada del polinomio de cuarto orden en forma precisa. Para la mayoría do las otras funciones, por supuesto, esto no podría ocurrir y nuestra estimación de lu derivada podría ser mejorada, pero no perfecta. En consecuencia, como fue el caso para la aplicación de la extrapolación de Riehardson, el procedimiento puede aplicarse de manera iterativa mediante un algoritmo Romberg hasta que el resultado se halle en un criterio de error aceptable. 23.3 DERIVADAS DE D A T O S D E S I G U A L M E N T E ESPACIADOS

Los procedimientos analizados hasta ahora se encuentran diseñados principalmente para determinar la derivada de una función dada. Para las aproximaciones por diferencias divididas finitas de la sección 23.1, los datos debían estar uniformemente espaciados. Para la técnica de extrapolación de Riehardson, los datos teman que encontrarse espaciados uniformemente y generados en forma sucesiva para intervalos a la mitad. Tal control de espaciamiento de datos está a menudo disponible sólo en casos donde podemos usar una función para generar una tabla de valores. En contraste, la información derivada de manera empírica (es decir, datos a partir de experimentos o estudios de campo) es con frecuencia agrupada en intervalos iguales, Tal información no puede ser analizada con las técnicas estudiadas hasta ahora. Una manera para manejar datos desigualmente espaciados es mediante el ajuste de una interpolación polinomial de Lagrange de segundo orden [recuerde la ecuación (18 .23)] para cada conjunto de tres puntos adyacentes. Recuerde que este polinomio no requiere que los puntos estén igualmente espaciados. El polinomio de segundo orden se puede diferenciar analíticamente para dar f'(x) =/(*,-!)
2x - x, (Xi-i Xi)(x¡-\ -Xj+i - X
i +

2x
i) f(x¡)

— Xj-i

— x¡+] - x
i + i

(Xj -x¡-i)(x¡

)

+ /(*/ + !) (X

2x
i +

— Xj-\
i

— x¡
+ i

(23.9)
-x¡)

i -Xi-i)(x

donde x es el valor en el cual se quiere estimar la derivada. Aunque esta ecuación es ciertamente más complicada que las aproximaciones de la primera derivada de las figuras 23.1 a la 23.3, tiene importantes ventajas. Primero, se puede usar para estimar lu derivada en cualquier punto dentro de un rango preescrito por los tres puntos. Segundo, los mismos puntos no tienen que estar igualmente espaciados. Tercero, la estimación de la derivada es de la misma exactitud que la diferencia centrada [véase ecuación (4.22)]. De hecho, para puntos igualmente espaciados, la ecuación (23.9) evaluada en x — x, se reduce a la ecuación (4.22).
EJEMPLO 2 3 . 3 Diferenciación de datos desigualmente espaciados

Enunciado del problema. Como en la figura 23.4, un gradiente de temperatura se puede medir abajo en el suelo. El flujo de calor en la interface suelo-aire puedo ser calculada con la ley de Fourier, </(.- - 0) = -kpC
(IT

Ti

672

DIFERENCIACIÓN NUMÉRICA

Aire Suelo

1 2 .5

1 0 1 2 f1 3 5 . •r ( ° C ) -, ,

3.75

FIGURA

23.4

7 ,c m t
2 3

Temperatura contra profundidad en el suelo.

donde q = flujo de calor (W/m ), k — coeficiente de difusividad térmica en el suelo ( = 3.5 X 10~ m /s), p = densidad del suelo ( = 1 800 kg/m ) y C — calor específico del suelo (ss 840 J/(kg • °C). Observe que un valor positivo del flujo significa que el calor se transfiere del aire al suelo. Use diferenciación numérica para evaluar el gradiente en la interface suelo-aire y emplee dicha estimación para determinar el flujo de calor hacia el piso.
7 2

Solución.

La ecuación (23.9) se puede usar para calcular la derivada como

/'(,) = 1 3 . 5 2 0 ) 0 3 . 7 5 ( 0- 1 . 2 5 ) ( 0 -3 7 .5 ) ( 1 2 .( 5 0 ) ( 1 . 2 5-3 7 .5 ) 2 ( 0 ) -0 - 1 2 .5 ( 3 7 .5 - 0 )( 3 7 .5 - 1 2 .5 ) +1 1 0 4 4 . +1 4 4 . -1 3 .3 3 3 3 3=1 3 .3 3 3 3 3
W > - l - * - 3 - 7 5 +12 °C/cm este valor puede ser usado para calcular el flujo de calor (advierta que 1 W = 1 J/s),

ai; = 0 )=3 . 5 x 10"^ (l 00§) ( 40^) ( 1 3 3 . 3 3 3 3 ^ ) =7 0 5 .6 W/m
8 8 2

23.4

D E R V IA D A S

E INTEGRALES

P A R AD A T O S

CON ERRORES

Además de espacios desiguales, otro problema que se vincula con la diferenciación empírica de datos es lo que usualmente incluye error de medición. Un defecto de la diferenciación numérica es que tiende a amplificar los errores en los datos. La figura 23. 5 a muestra datos uniformes sin errores que ul ser diferenciados en forma numérica dan un rosultado uniforme (véase figura 23.36). fin contraste, la figura 23,Se usa los mismos

23.4

BATOS CON

BM0RE3

'4FIGURA 23.5 llir.tn II I O N de cómo se I M I ilili> nn los pequeños M I L >i• • •. I M I los datos por Mitiillu do la diferenciación iiiiiin''ik_u: a) datos sin error, /'| |I I i lifeienciación
IIIIIIN''iii

M

a resultante, c) datos

un I> liíir cados ligeramente, i /) li I dilerenciación irv.iilianio manifestando un
IIUINI'riln IIII

en la variabilidad.

mitraste, la operación de integración

I M V I ' I M I

| I M ivióndose de d) a c) al li ii M U MI <;l área bajo d}] tiende o suavizar los un los datos.

1 1 I ILI ' I I U A R

datos, pero con algunos puntos altos y algunos ligeramente bajos. Esta pequeña modifi cación es apenas aparente en la figura 23.5c. Sin embargo, el efecto resultante en la figura 23.5d es significativo, ya que el proceso de diferenciación amplifica los errorcN. Como se esperaba, el principal procedimiento para determinar derivadas para dalos imprecisos es usar regresión por mínimos cuadrados para ajustar una función suave diferenciable con los datos. En ausencia de cualquier otra información, una regresión polinomial de orden inferior podría ser una buena primera selección. Obviamente, si lu relación funcional entre las variables dependiente e independiente es conocida, esta rclu ción deberá formar la base para el ajuste por mínimos cuadrados.

23.4.1

D I F E R E N C I A C I Ó N CONTRA I N T E G R A C I Ó N D E D A T O S INCIERTOS

Como las técnicas de ajuste de curvas, la regresión se puede usar para diferenciar dalos inciertos, un proceso similar podría emplearse para integración. Sin embargo, debido a la diferencia en estabilidad entre diferenciación e integración, esto se hace en raras ocn siones. Como se ilustró en la figura 23.5, la diferenciación tiende a ser inestable; es decir, amplifica los errores. En contraste, cl hecho tic que la integración sea un proceso que involucra In suma de términos tiende n hacerlo muy consecuente con respecto a dalos Inciertns. En esencia, como se suman los punios para una integral, los errores alentónos poMlllvo y negativo tienden a cancelarse. En contraste, debido n que lu diferenciación es UNA RUilrieeión, los errores aleatorios positivo y negativo tienden a sumarse.

674
23.5 INTEGRACIÓN/DIFERENCIACIÓN CON LIBRERÍAS Y PAQUETES NUMÉRICA

En la actualidad hay librerías y paquetes de software que contienen grandes capacidades para integración y diferenciación numérica. En esta sección le daremos una muestra de las más útiles. 23.5.1 Mathcad

Mathcad tiene operadores que realizan integración y diferenciación numérica. Éstos emplean y son similares a los símbolos matemáticos tradicionales que usted ha usado desde sus estudios en el nivel medio superior o en el primer semestre de licenciatura. El operador de integración usa una secuencia de evaluaciones de la integral, para lo cual utiliza la regla trapezoidal y el algoritmo de Romberg. Se realizan iteraciones hasta que los resultados sucesivos varían menos que TOL. El operador de la derivada usa un método similar para calcular las derivadas entre un orden de 0 y 5. Este operador crea una tabla de aproximaciones con base en cálculos por diferencias divididas mediante varios pasos y tamaños de paso. Se usan las técnicas de extrapolación con el fin de estimar los valores para un tamaño de paso cero de una manera que se parece al método de Riehardson. La figura 23.6 muestra un ejemplo de Mathcad donde f(x) se crea con el símbolo definido (: = 0 , y entonces la integral se calcula sobre un rango que va de x = 0 a x = 0.8. En este caso, usamos un polinomio simple, el cual empleamos en todo el capítulo 21. Observe que el rango lo han definido las variables a y b como entrada usando el símbolo de definición. La figura 23.7 muestra un ejemplo de Mathcad donde f(x) es creado mediante un símbolo de definición (: = ) y entonces la primera y tercera derivadas se calculan en un punto donde x = - 6 . Observe que la localización del punto y el orden de la derivada son introducidos mediante el símbolo de definición.

FIGURA

23.6

Pantalla de Mathcad para determinar la integral de un polinomio por medio de integración de Romberg.

F e l i E d t iV e w i J n s e r tF o m ra tM n a iS y m b c o l s lW n d o w i H p e l N U M E R C I A L L YC A L C Ú L A T EN IT E G R A L S E n e t raf u n c o i tn : f ( x )= : 0 2 .+ 2 5 x 2 0 0 x + .6 7 5 x 9 0 0 x + 4 0 0 x E n e t r0 n ie t g r a o i ln i n t e r v a l : a = : b= : 0 8 .
2 3 4 J

N u m c i r a li n t e g r a l :

23.5 INIIJPJJGPCIACLÁN N U M É R I C A CON L I B R E R Í A S

4M

23.5.2

MATLAB

MATLAB tiene una variedad de funciones prediseñadas que permiten integrar y diferenciar funciones y datos. El siguiente ejemplo ilustra cómo se puede usar algunas de ellas.
EJEMPLO 2 3 . 4 Usando MATLAB para integración y diferenciación

Enunciado del problema. diferenciar la función

Explore cómo MATLAB puede emplearse para integrur y + 675x - 900x + 400x
4

f(x) = 0.2 + 25x - 200x

2

3

5

desde a — 0 hasta b — 0.8. Recuerde de los capítulos 21 y 22 que el valor verdadero de la integral podrá determinarse en forma analítica para ser 1.640533. Solución. Primero, usaremos la función quad del MATLAB para integrar la función. Para usar quad, primero desarrollamos un archivo M que contendrá la función. Por medio de un editor de textos podemos crear el siguiente archivo:
function y=f x ( x ) y=0.2+25*x-200*x. 2+675*x. 3-900*x. 4+400*x. 5;
A A A A

Éste puede guardarse en el directorio de MATLAB como fx.m. Después de entrar a MATLAB, podemos llamar a quad tecleando
>> Q=quad('fx',0,.8)

donde la segunda y tercera entradas son los límites de integración. El resultado es a=
1.6405

Asi, M A T L A B proporciona una estimación exacta de la integral. Ahora investiguemos cómo M A T L A B maneja integrales de datos tabulados. Para ello, repetiremos el ejemplo 21.7, donde probarnos la función en intervalos desiguales

676

DIFERENCIACIÓN NUMÉRICA

(recuerde la tabla 21.3). Podemos generar la misma información en MATLAB al definir primero los valores de la variable independiente,
>> x=C0 .12 .22 .32 .36 .4 .44 .54 .64 .7 .SI;

Después, generamos un vector y que contiene los valores correspondientes de la variable dependiente al llamar a fx,
>> y = Co L u m n s 1 through 7 y = f x ( x )

0.2000
Columns 8

1.3097
through

1.3052
11

1.7434 0.2320

2.0749

2.4560

2.8430

3.5073

3.1819

2.3630

Podemos integrar esos valores al llamar a la función trapz,
>> integraL = t r a p z ( x , y ) =

i n t e g r a l

1.5948

trapz, como implica su nombre, aplica la regla trapezoidal a cada intervalo y suma los resultados para obtener la integral total. Por último, podemos diferenciar los datos espaciados desigualmente en x y y. Para ello usamos la función diff, la cual sólo determina las diferencias entre los elementos adyacentes de un vector, por ejemplo,
>> ans d i f f ( x ) = 1 8 through 7

CoLumns

0.1200
CoLumns

0.1000
through

0.1000
10

0.0400

0.0400

0.0400

0.1000

0.1000

0.0600

0.1000

El resultado representa las diferencias entre cada par de elementos de x. Para calcular las aproximaciones por diferencias divididas de la derivada, realizamos sólo una división del vector de las diferencias y entre las diferencias x al teclear
>> d=di f f ( y ) . / d i ff(x)

con la cual se obtiene d =
CoLumns 1 8 through 7

9.2477
CoLumns

-0.0449
through

4.3815
10

8.2877

9.5274

9.6746

6.6431

-3.2537

-13.6488

-21.3100

Estas representan estimaciones burdas de las derivadas para cada intervalo. Tal procedimiento podría refinarse mediante capuciamientos más finos.

TABLA 23.1
Categoría Cuadratura univariable

Rutlnai IMSL poro
Rutinas

Inorar

y diferenciar.

Capacidad

QDAG QDAGP QDAGI QDAWO QDAWF QDAWS QDAWC QDNG Cuadratura multidimensional TWODQ QAND Reglas de Gauss y recurrencias de tres términos GQRUL GQRCF RECCF RECQR FQRUL Diferenciación DERIV

Adaptativa de propósito general con singulaildadi» on puntos extremos Adaptativa de propósito general Adaptativa de propósito general con puntos de singulaikkid Adaptativa de propósito general con intervalos Infinito», Adaptativa con oscilación ponderada (trigonométrico) Adaptativa de Fourier ponderada (trigonométrica) Adaptativa algebraica ponderada con singularidad»» un puntos extremo Adaptativa de Cauchy ponderada con valor principal No adaptativa de propósito general

Cuadratura bidimensional (integral iterada) Adaptativa cuadratura N-dimensional sobre un hiperrectángulo

Regla cuadratura de Gauss para pesos clásicos Regla cuadratura de Gauss a partir de coeficientes dt> recurrencia Coeficientes de recurrencia para pesos clásicos Coeficientes de recurrencia a partir de la regla de cuadralim i Regla de cuadratura de Fejer

Aproximación a la primera, segunda y tercera derivado

23.5.3

IMSL

IMSL tiene varias rutinas para integración y diferenciación (véase tabla 23 .1). En cl presente análisis, nos concentraremos en la rutina QDAG. Dicha rutina integra una función por medio de un esquema adaptable en forma global basado en las reglas GaussKronrod. QDAG se implementa con la siguiente declaración CALL:
C A L L QDAG ( F , A , B , E R R A B S , E R R R E L , I R U L E , R E S U L T , E R R E S T )

donde F = Función que introduce el usuario para que sea integrada. La forma es F(X), donde X es la variable independiente. Observe que F se debe declarar como EXTERNAL en el programa de llamado. A = Límite inferior de integración. (Entrada) D = Límite superior de integración. (Entrada) HRRA13S — Exactitud absoluta deseada. (Entrada) ERRREL — Exactitud relativa descada. (Entrada) IliULE Selección de la regla de cuadratura. (Entrada). IRULE 2 se recomienda para la mayoría de las funciono», Sí la función tiene una

678

DIFERENCIACIÓN NUMÉRICA

singularidad pico, use IRULE = 1; si la función es oscilatoria, IRULE = 6. RESULT = Estimación de la integral desde A a B de F. (Salida) ERREST = Estimación del valor absoluto del error. (Salida)
EJEMPLO 2 3 . 5 Usando IMSL para integrar una función

I i j | I

Enunciado del problema.

Use QDAG para determinar la integral de
2 3 4 5

f(x) = 0.2 + 25x - 200x + 675x - 900x + 400*

desde a = 0 a b = 0.8. Recuerde de los capítulos 21 y 22 que el valor exacto de la integral se puede determinar en forma analítica para que sea de 1.640533.

1
j I j I | j í | j | í | I ¡ \ j \ ¡ I

| Solución. Un ejemplo del programa principal en Fortran 90 y de ia función QDAG que \ se usa para resolver este problema se describirá como

P R O G R A M Intégrate USE mimsl IMPLICIT N O N E INTEGER : :i ru le = 1 REAL::a=0.,b=0.8,errabs=0.0.errrel=0.001 REAL::errest,res,f EXTERNAL f CALL Q D A G (f,a,errabs,errrel,irule,res,errest) PRINT •(•' Computed = , F 8 . 4 ) ' , res PRINT ' ( • ' Error estímate =' ' , 1PE10 . 3 ) ' , errest
,I

E N D P R O G R A M FUNCTION f(x) IMPLICIT N O N E REAL::x,f f = 0 . 2 + 25. *X-200.*X**2 + 675.*X**3.-900.*X**4 + 400.*X**5 E N D FUNCTION
Output:

C o m p u t e d = 1.6405 Error estímate = 5.000E-05
PROBLEMAS

x

2 hacia adelante y 23.2 Repita el problema 23.1, pero ahora para y = log x con 23.1 Calcule aproximaciones por diferencias hacia atrás de aproximaciones evaluación por diferencia en x — 20 con h = 2. central de 0(h ) y 0(h ) para la primera derivada dc>> = sen x en 23.3 Use aproximaciones por diferencias centradas para estimar A 0.1. 2 c en x — I pura h ~ = rc/4 usando un valor de Estimo la prímoru cl error y relativo segunda derivadas de y =
2 4

0(h) y 0(h ), y

porcentual e, pura cada aproximación.

h — Jtí\2.

U m p M l a m b a í fórmulas

0{h ) y ü(h )
v

para

sus estimacion

1.2 3 7 O N I I I I I H I ' lu primera Ivailn de = sen en mediante el uso tic luniaftos 1.807 0.7468 0.6522 0.1684 0.03192 paNo de //, = 7t/3 y h = TI /6. Emplee diferencias centradas do x fi(/i ) para las estimaciones iniciales. donde = Compare sus resultados con las deriv 1 , 1 . ñ Repita ol problema 23.4, pero ahora para la primera derivaverdaderas. DA ti» In x on x = 4 usando h = 2 y /i = 1. 4 para determinar la primera deri- 2 3 . 1 2 Recuerde que para el problema del paracaidista en caldu, 1.1.A límplec la ecuación (23.9) la velocidad está dada por V A D A ilo — 7x — lOx — 8 en JC = 0 con base en los VALORES .r = 1 2. Compare este resultado con l 2 9.8) 68.1) _ , ,, (P23.12A) AL valor verdadero y con una estimación obtenida usando aproxi12.5 ' maciones por diferencias centradas con base en h = 1. 11.7 Pruebe que para datos igualmente espaciados, la ecuación ( ) t')) so reduce a la ecuación (4.22) en x = x¡. y la distancia recorrida se puede obtener por I ' . H ( alcule las aproximaciones por diferencias centradas de pri(P23.12A) mer orden de 0(h ) para cada una de las siguientes funciones en d(t)= {l e m)dt t¿--> 3 In ubicación especificada y para el tamaño de paso especifico: Use Mathcad para integrar la ecuación desde O a l O . e n * = 0.5, 0.2 eos b) Integre en forma analítica la ecuación (P23.126) con la con= tan en = 3, = 0.1 dición inicial d = 0 en t = 0. Evalúe el resultado en / = 10 en = 1, 0.1 para confirmar a). ,)> = e* + x e n * = 1, 0.25 Use Mathcad para diferenciar la ecuación en / » Í 1 . > I ,os siguientes datos se reunieron para la distancia recorri10. da contra el tiempo para un cohete: d) Evalúe la ecuación (P23.12a) en / = 10 para confirmare). 0 2 3 4 5 2 3 . 1 3 La distribución normal se define como
2 )

1,1.41 Isc la extrapolación de Riehardson puní

y x x = TtIA
y 2 3

f(x) 5e~ x.
( ( ( 1 2 / 6 8

y= 3x —0.5,x = yx =
() 4

(l^f _Jo x + 4x-l5 enxh == 0, h = a) 0.5 y =(x x/3) x x h I» y h= = y= sen (0.5 íx)lx x h V) c)
(

(P23.12a)

(P23.12b)

0

2

8

18 3 2 5 0

/(*) =

1

~x /2
¿

I Isc diferenciación numérica para estimar la velocidad del cohelo y la aceleración para cada tiempo. 1.1.10 Desarrolle un subprograma de uso amigable con el fin de api ¡car un algoritmo de Romberg para estimar la derivada de una Función dada. 1 \. 11 Desarrolle un subprograma de uso amigable para obtener la estimación de la primera derivada para datos espaciados desigualmente. Pruébelo con los siguientes datos

1 a l y a) Use Mathcad para integrar esta función desde x = desde —2 a 2. b) Emplee Mathcad para determinar el punto de inflexión do esta función. Como la función es simétrica, limite su análisis para la x positiva. 2 3 . 1 4 Use la función quad de MATLAB para integrar la ecuu-

ción (P23.12a) desde t = 0 a 10. 2 3 . 1 5 Los siguientes datos se generaron a partir de la distribución normal:
X

-2 0.053991

-1.5 0.129518

-1 0.241971

-0.5 0.352065

0 0.398942

0.5 0.352065

1 0.241971

1.5

2

f(x)

0.12951 3 0.053991

a) Use MATLAB para integrar estos datos desde x = — 1 a 1 y desde —2 a 2. b) Emplee MATLAB para estimar los puntos de inflexión de esos datos. 2 3 . 1 6 Use IMSL para integrar la distribución normal (véase cl problema 23.13) d e s d e * = - I a 1 , desde - 2 a 2 y desde - 3 a 3.

CAPITULO 2 4 A p l i c a c i o n e s e n la i n g e n i e r í a : integración numérica y diferenciación
El propósito del presente capítulo es aplicar los métodos de integración y diferenciación numérica, expuestos en la parte seis, a problemas prácticos de la ingeniería. Se mencionarán dos de las situaciones de ocurrencia más frecuente. En el caso de los métodos de integración, se puede expresar la función sujeta a estudio en forma analítica pero es muy complicada para que esté lista a evaluarse mediante los métodos de cálculo. Se aplican los métodos numéricos a situaciones de este tipo por medio de la expresión analítica con el fin de generar una tabla de argumentos y valores de función. En el segundo caso, la función que habrá de evaluarse se halla inherentemente en forma tabular. Este tipo de función a menudo representa una serie de mediciones, observaciones o alguna otra información empírica. Los datos para cualquiera de los casos son compatibles directamente con diferentes esquemas analizados en esta parte del libro. La sección 24.1, que trata con cálculos de calor en la ingeniería química, involucra ecuaciones. En esta aplicación, una función analítica se integra en forma numérica con el fin de determinar el calor requerido para aumentar la temperatura de un material. Las secciones 24.2 y 24.3 también involucran funciones que están disponibles en forma de ecuación. La sección 24.2, la cual se toma de la ingeniería civil, usa integración numérica para determinar la fuerza total del viento que actúa sobre el mástil de un bote de carreras. La sección 24.3 determina la raíz media cuadrática de la corriente para un circuito eléctrico. Este ejemplo se usa para demostrar la utilidad de la integración de Romberg y la cuadratura de Gauss. La sección 24.4 se concentra en el análisis de información tabular para determinar el trabajo necesario para mover un bloque. Aunque esta aplicación tiene una conexión directa con la ingeniería mecánica, se relaciona con todas las otras áreas de la ingeniería. Entre otras cosas, usamos este ejemplo para ilustrar la integración de datos espaciados desigualmente.

24.1

INTEGRACIÓN PARA DETERMINAR LA CANTIDAD TOTAL DE CALOR (INGENIERÍA QUÍMICA/PETROLERA) Antecedentes. Se emplean cálculos de calor en forma rutinaria en la ingeniería química y petrolera así como en muchos otros campos de la ingeniería. Esta aplicación proporciona un simple pero útil ejemplo de tales cálculos. La determinación de la cantidad de calor requerido para elevar la temperatura de un material es un problema con el que tratamos frecuentemente. La característica necesaria

' 24J ^1|^^^^•pp^íC^r^MIW^^ LA'CWTIDID'TOTAL D EC A L O R
para llevar l cabo este cálculo es la capacidad calorífica c, lisie parámetro representa la cantidad de calor requerida para aumentar una unidad de temperatura a una masu unitaria. Si c es constante sobro el rango de temperaturas sujetas a examen, el calor requerido AH (en calorías) se puede calcular por AH=mcAT (24.1)

donde c tiene unidades de cal/(g • °C), m = masa (g) y AT = cambio en temperatura (°C). Por ejemplo, la cantidad de calor necesario para aumentar a 20 gramos de agua desde 5 a 10°C es igual a

AH = 20(1)(10- 5) = 100 cal
donde la capacidad calorífica del agua es aproximadamente 1 cal/(g • °C). Tal cálculo es propicio cuando AT es pequeño. Sin embargo, para grandes cambios de temperatura, la capacidad calorífica no es constante y, de hecho, varía en función de la temperatura. Por ejemplo, la capacidad calorífica de un material no se podría aumentar con la temperatura de acuerdo con una relación como c(T) = 0 . 1 3 2 +

1.56 x 10" r
4

+

2.64 x 10~ r

7 2

(24.2)

En este ejemplo se le pide calcular el calor necesario para elevar 1 000 gramos de este material desde - 1 0 0 a 200°C. Solución. c(T): La ecuación

(PT6.4) proporciona una forma para calcular el valor promedio

c(T) dT c(T) =
J

-\
¡2

—i

-r~
I

(24.3)

la cual se puede sustituir en la ecuación (24.1) para dar AH — m f
2

c(T) dT
t

(24.4)

donde AT = T — r . Ahora como, para el caso actual, c(7), es una cuadrática simple, AH puede determinarse de manera analítica. La ecuación (24.2) se sustituye en la ecuación (24.4) y el resultado se integra para dar un valor exacto de AH = 42 732 cal. Es útil e instructivo comparar este resultado con los métodos numéricos expuestos en el capítulo 21. Para realizarlo, es necesario generar una tabla de valores de c para varios valores de T:
T,°C -100 -50 0 50 100 1.')() c, cal/(g •4°C) 0.1190 0.12486 0.13200 0.14046 0.15024 0.16134 0.17376

200

682

APLICACIONES EN LA INGENIERÍA: INTEGRACIÓN NUMÉRICA Y DIFERENCIACIÓN

Estos puntos se usan en conjunto con la regla de Simpson 1/3 con seis segmentos para calcular una estimación de la integral de 42 732. Tal resultado puede sustituirse en la ecuación (24.4) para obtener un valor de AH = 42 732 cal, el cual concuerda exactamente con la solución analítica. Esta exacta concordancia podría ocurrir sin importar cuántos segmentos se usaron. Esto se espera debido a que c es una función cuadrática y la regla de Simpson es exacta para polinomios de tercer orden o menores (véase la sección 21.2.1). Los resultados que se obtuvieron con la regla trapezoidal se listan en la tabla 24.1. Se observa que la regla trapezoidal es también capaz de estimar el calor total en forma exacta. Sin embargo, un pequeño paso (< 10°C) se requiere para una exactitud de cinco cifras. Este ejemplo es una buena ilustración del porqué la regla de Simpson es muy popular. Es fácil realizarla con una calculadora o, mejor aún, con una computadora. Además, es por lo común lo suficientemente exacto para tamaños de paso relativamente grandes y es exacto para polinomios de tercer orden o menores. 24.2 F U E R Z A EFECTIVA S O B R E EL M Á S T I L DE U N B O T E DE CARRERAS (INGENIERÍA CIVIL/AMBIENTAL) Antecedentes. En la figura 24.1a se muestra una sección transversal de un bote de carreras. Las fuerzas del viento (/), ejercidas por pie de mástil de los botes varían como una función de la distancia por arriba de la cubierta del bote (z), como se muestra en la figura 24.16. Calcule la fuerza de tensión T e n el cable izquierdo que soporta el mástil; además, se supone que el cable derecho que soporta el mástil está por completo flojo y que el mástil une la cubierta de modo que transmite fuerzas horizontales y verticales pero no momentos. Suponga que el mástil permanece vertical. Solución. Para proceder con este problema, se requiere que la fuerza distribuida / se convierta en una fuerza equivalente total F y se calcule su localización d por arriba de la cubierta (véase la figura 24.2). Este cálculo se complica por el hecho de que la fuerza ejercida por pie de mástil varía con la distancia por arriba de la cubierta. La fuerza total ejercida sobre el mástil se puede expresar como la integral de una función continua:

f

=c {^y
2oo
300 150 100 50 25 10 5 1 0.05

2:/io

dz

(24 5)

-

TABLA 24.1

Resultados con el uso de la regla trapezoidal con diferentes tamaños de paso.
AH 96 43 42 42 42 42 42 42 42 048 029 864 765 740 733.3 732.3 732.01 /:)2,00003

T a m a ñ o de p a s o , °C

e,[%)
125 0.7 0.3 0.07 0.018 <0.01 <0.01 <0.01 <0.01

24.9 •

WBLMA^TIL-WüWWBlWéiaWlUS
\ >t?V

é N

¡t#p##*W|»lft CÉBIM que soportan el mástil Mástil
Viento

FIGURA 24.1 u) Succión transversal de un
LINIO DI?L

i

z=0

de carreras, b) Fuerzas

viento /•ejercidas por 3 pies

I no de mástil como una liindón de la distancia z por NI liba de la cubierta del bolo.

FIGURA 24.2 I )|(i(jrama de cuerpo libre fuerzas ejercidas j l mástil de un velero.

Esta integral no lineal es difícil de evaluar en forma analítica. Por tanto, es conveniente emplear procedimientos numéricos para este problema, tales como las reglas de Simpson y la trapezoidal. Esto se lleva a cabo al calcular/(z) para diferentes valores de z y después usar la ecuación (21.10) o (21.18). Por ejemplo, la tabla 24.2 tiene valores de /(z) para un tamaño de paso de 3 pies que proporciona datos para la regla de Simpson 1/3 o para la regla trapezoidal. Los resultados para diferentes tamaños de paso se encuentran en la tabla 24.3. Se observa que ambos métodos dan un valor de F = 1 480.6 Ib en tanto el tamaño de paso se vuelve pequeño. En este caso, para tamaños de 0.05 pies para la regla trapezoidal y de 0.5 pies para la de Simpson proporcionan buenos resultados. La línea de acción efectiva de F (véase figura 24.2) se puede calcular con la evaluación de la integral
/•30

zf(i) d = / /(z)

di (24.6)

Jo dz
/•30

d= 13.05 pies

/ d = Jo

200z[z/(5 + z)]e- •2:/30 dz 1 480.6 (24.7)

T •H

T A B L A 2 4 . 2 Valores de f(z) para un tamaño de paso de 3 pies que proporciona los datos para las reglas trapezoidal y de Simpson 1 / 3 . /, j ) L M 0 3 6 12 ÍW, lb/ple 0 61,40 73.13 70.5Ó 63,43 30 55.18 47.14 .'IVII.'I 33 4? 2/ HV 23,20 15 18 21 24 27
O

684

APLICACIONES EN LA INGENIERÍA: INTEGRACIÓN NUMÉRICA Y DIFERENCIACIÓN T A B L A 2 4 . 3 Valores de F calculados con base en las diferentes versiones de las reglas trapezoidal y de Simpson 1 / 3 .
Técnica Regla trapezoidal T a m a ñ o de p a s o , pies 15 10 6 3
1

Segmentos 2 3 5 10 30 60 120 300 600 2 6 10 30 60

F,lb 1 001.7 1 122.3 1 372.3 1 450.8 1 477.1 1 479.7 1 480.3 1 480.5 1 480.6 1 219.6 1 462.9 1 476.9 1 480.5 1 480.6

Regla de Simpson 1/3

0.5 0.25 0.1 0.05 15 5 3
1

0.5

Dicha integral podrá evaluarse mediante métodos similares a los anteriores. Por ejemplo, la regla de Simpson 1/3 con un tamaño de paso de 0.5 da d = 19 326.9/1 480.6 = 13.05 pies. Con F y d conocidos a partir de los métodos numéricos, se puede usar un diagrama de cuerpo libre para escribir ecuaciones de equilibrio de fuerzas y momentos. Este diagrama de cuerpo libre se muestra en la figura 24.2. Al sumar fuerzas en la dirección vertical y horizontal y tomar momentos con respecto al punto 0 se obtiene ZF ZF
H

= 0 = F-

Tsen6-H

(24.8) (24.9) (24.10)

V

= 0=V-Tcos6
0

X M = 0 = 2V-Fd

donde T = tensión en el cable y H y V = reacciones desconocidas sobre el mástil transmitidas por la cubierta. La dirección, así como la magnitud de H y V son desconocidas. La ecuación (24.10) se puede resolver directamente ya que se desconocen F y d. ^ ^ 3
= i

1 480.6)(13.05)_ 3

=

6

4

4

(

)

6

1

b

Por tanto, a partir de la ecuación (24.9), T = ^ - = eos 9
6 4 4

°0.995
6

=

6 4 7 3 Ib

y de la ecuación (24.8), H = F — T sen 9 = 1 480.6 - (6 473)(0.0995) = 836.54 Ib Esas fuerzas ahora permiten proceder con otros aspectos del diseño estructural del bote, tales como los cables y cl sistema de soporte de la cubierta para cl mástil. Este problema ilustra bita dos usos de la I U Ü 9 G R A C I Ó A I U U F I Á H C I que pueden encontrarse durante cl disc-

ño de estructura» en Ingeniería, Se observa que timbas reglas, lu trapezoidal y lu de Simpson 1/3, son fáciles de aplicar y son herramientas para la solución de problemas prácticos. La regla de Simpson 1/3 es más exacta que la trapezoidal para el mismo tamaño de paso por lo que con frecuencia es preferida.

24.3

R A Í Z MEDIA CUADRÁTICA DE LA C O R R I E N T E P O R I N T E G R A C I Ó N N U M É R I C A ( I N G E N I E R Í A ELÉCTRICA) Antecedentes. El valor promedio de una corriente eléctrica oscilatoria en un periodo puede ser cero. Por ejemplo, suponga que la corriente es descrita por un sinusoide simple: i(f)= sen (2n/T), donde Tes el periodo. El valor promedio de esta función se puede determinar por la siguiente ecuación: j sen dt Jo \ T I T-0

/=

=

-eos(2n) + eos0 —l = 0 T
y

A pesar del hecho de que el resultado neto es cero, tal corriente es capaz de realizar trabajo y generar calor. Por tanto, los ingenieros eléctricos a menudo caracterizan esa corriente por

/RMS = > (t)dt (24.11) donde i(f) = corriente instantánea. Calcule la RMS o raíz media cuadrática de la forma de onda en la figura 24.3 mediante la regla trapezoidal, la regla de Simpson 1/3, integración de Romberg y cuadratura de Gauss para T = 1 s.
2

J-

FIGURA

24.3 /f Para 0 < f < 772, /(r) = 1 0 e - " s e n (2n-ír) Para 772, < f < 7", /(f) = 0 '
r

I lin 1 1 órnente eléctrica vi II i<indo de manera imilúcJica.

686

APLICACIONES EN LA INGENIERÍA: INTEGRACIÓN NUMÉRICA Y DIFERENCIACIÓN TABLA 24.4 Valores para la Integral calculada mediante el uso de diferentes esquemas numéricos. El error relativo porcentual E , se basa sobre un valor verdadero de 1 5 . 4 1 2 6 1 .
Segmentos 1 2 4 8 16 32 64 128 2 4 8 16 32 Integral 0.0 15.16327 15.40143 15.41 1 9 6 15.41257 15.41261 15.41261 15.41261 20.21769 15.48082 15.41547 15.41277 15.41 161 <>(%) 100 1.62 0.0725 4.21 x 10" 2.59 x 1 0 " 1.62 x 10~ 1.30 x 1 0 " 0 -31.2 -0.443 -0.0186 1.06 x 1 0 " 0

Técnica Regla trapezoidal

3

4

5

6

Regla de Simpson 1/3

3

Solución. En la tabla 2 4 . 4 se enlista las estimaciones de la integral para las diferentes aplicaciones de la regla trapezoidal y de la regla de Simpson 1 / 3 . Observe que la regla de Simpson es más exacta que la trapezoidal. El valor exacto para la integral es 1 5 . 4 1 2 6 1 . Este resultado se obtuvo mediante una regla trapezoidal con 1 2 8 segmentos o una regla de Simpson con 3 2 segmentos. La misma estimación se determina también con la integración de Romberg (véase la figura
24.4).

Además, la cuadratura de Gauss también se usa para realizar la misma estimación. La determinación de la raíz media cuadrática de la corriente involucra la evaluación de la integral (T = 1 ) .
/•1/2

/

=

/

( I O Í T '

Jo
Í =

s e n 2 7 r ) í j

dt

( 2 4 . 1 2 )

Primero, se realiza un cambio de variable al aplicar las ecuaciones para obtener 1 1 1
4
+

( 2 2 . 2 3 )

y

( 2 2 . 2 4 )

4

d
Í R F

t

=


dt

Hartarlo
integración de Romberg para estimar la'-RMS de la corriente.
0

°^
15.16327 15.40143 15.41196 15.41257
15,41261

"
15.16503 15.41111 15.41225 15.41261 15.41502 15.41262 15.41261 15.41261 15.41261

^
15.41261

20.21769 15.48082 15.41547 15.41277 15.41262

24.41
TABLA 2 4 . 3

PARAICAKUCWrSBTIWBAAJ
R«»ulladoa al usar las fórmulas de la cuadratura de Gauss para varios puntos para aproximar la integral.
Estimación 11.9978243 15.6575502 15.4058023 15.4126391 15.4126109 22.1 -1.59 4.42 x 10" -2.01 x 10" -1.82 x 10"

Puntos 2 3 4 5 ó

2

4

5

Esas relaciones pueden ser sustituidas en la ecuación (24.12) para obtener
1 0 e

-[l/4 (l/4)
+

( í í

]

s

e

n

2

n

(
(

— dt 4

(24.13)

Para la fórmula de Gauss-Legendre de dos puntos, esta función se evalúa en t = — 1/V3 y 1/V3, y los resultados son 7.684096 y 4.313728, respectivamente. Estos valores pueden sustituirse en la ecuación (22.17) para dar un estimado de la integral de 11.99782, el cual representa un error de e = 22.1%. La fórmula para tres puntos es (véase tabla 22.1)
d

/ = 0.5555556(1.237449) + 0.8888889(15.16327) +0.5555556(2.684915) = 15.65755 | e , | = 1.6%

Los resultados al usar las fórmulas para puntos mayores se resumen en la tabla 24.5. La estimación de la integral de 15.41261 se puede sustituir en la ecuación (24.12) para calcular una I de 3.925890 A. Este resultado podría entonces emplearse como guía en otros aspectos del diseño y operación del circuito.
i m s

I N T E G R A C I Ó N N U M É R I C A P A R A CALCULAR EL T R A B A J O (INGENIERÍA MECÁNICA/AEROESPACIAL) Antecedentes. Muchos problemas de ingeniería involucran el cálculo de trabajo. La fórmula general es Trabajo = fuerza x distancia Cuando se introdujo este concepto en sus estudios de física en el nivel medio superior, se le presentó algunas aplicaciones simples mediante el uso de fuerzas que permanecían constantes en todo el desplazamiento. Por ejemplo, si una fuerza de 10 libras era usada para empujar un bloque una distancia de 15 pies, el trabajo se calculaba como 150 Ib • pie. Aunque ese simple cálculo es útil para introducir el concepto, la solución de problemas realísticos son por lo común más complejos. Por ejemplo, suponga que la fuer/a varía durante el curso del cálculo. En tales casos, la ecuación para el trabajo se puedo exprcaar como

688

APLICACIONES EN LA INGENIERÍA: INTEGRACIÓN NUMÉRICA Y DIFERENCIACIÓN

W

=

dx
0 n

(24.14)

donde W = trabajo (Ib • pie), x y x = las posiciones inicial y final, respectivamente, y F(x) es una fuerza que varía en función de la posición. Si F{x) es fácil de integrar, la ecuación (24.14) se puede evaluar en forma analítica. Sin embargo, en la solución de un problema realístico, la fuerza podría no ser expresada de esa manera. De hecho, cuando se analizan los datos medidos, la fuerza podría estar disponible sólo en forma tabular. Para tales casos, la integración numérica es la única opción viable para la evaluación. Se tiene mayor complejidad si el ángulo entre la fuerza y la dirección del movimiento también varía en función de su posición (véase figura 24.5). La ecuación de trabajo puede modificarse más al tomar en cuenta este efecto, como en (24.15) De nuevo, si F(x) y 9 (x) son simples funciones, la ecuación (24.15) se podría resolver de manera analítica. Sin embargo, como en la figura 24.5, es más común que la relación
FIGURA 24.5

El caso de una fuerza variable actuando sobre un bloque. Para este caso, el ángulo, así como la magnitud, de la fuerza varía.

i,

X.ft

0

0 x,ft

30

TABLA

24.é

x ,p i * s
0 5 10 15 20 25 30

Data para le futría F(x) y «I ángulo 0(x) coma una función de lo po&ición x.

f | j t ) ,I b
0.0 9.0 13.0 14.0 10.5 12.0 5.0

» ,r a d

0.50 1.40 0.75 0.90 1.30 1.48 1.50

F[x) eos
0.0000 1.5297 9.5120 8.7025 2.8087 1.0881 0.3537

F ( x )

0

funcional sea complicada. Para esta situación, los métodos numéricos proporcionan la única alternativa para determinar la integral. Suponga que usted debe realizar el cálculo para la situación mostrada en la figura 24.5. Aunque la figura muestra los valores continuos de F(x) y 9(x), imagine también que, debido a las restricciones experimentales, usted cuenta sólo con mediciones discretas a intervalos de x — 5 pies (véase tabla 24.6). Use versiones de aplicación simple y múltiple de la regla trapezoidal y de las reglas de Simpson 1/3 y 3/8 para calcular el trabajo con esos datos. Solución. Los resultados del análisis se resumen en la tabla 24.7. Un error relativo porcentual e¡ fue calculado con referencia al valor verdadero de la integral de 129,52 cuya estimación se hizo con base en los valores tomados de la figura 24.5 con intervaloi de 1 pie. Los resultados son interesantes, ya que la mayor exactitud ocurre para simple regla trapezoidal con dos segmentos. Puede obtenerse estimaciones más refinadas con m á s segmentos; también se puede obtener resultados menos exactos con las reglas de Simpson. La razón para este aparente resultado contraintuitivo es que el espaciamiento burdo de los puntos no es adecuado para capturar las variaciones de las fuerzas y ángulos. Esto es en particular evidente en la figura 24.6, donde graficamos la curva continua para el

O i r U R A 24.6 I Inu gráfica continua de F[x)
nm |0(x)] contra posición i un los siete puntos discretos mudos para desarrollar la Inloi Ilación numérica nulimuda en la tabla 2 4 . 7 . i tli.Miive cómo el uso de los puntos para i uidderizar esta función que vuilo continuamente deja

n n io l

l i n i u dos picos en x = 2 . 5y
I7 ' .') pies.
x, pies

690

APLICACIONES EN LA INGENIERÍA: INTEGRACIÓN NUMÉRICA Y DIFERENCIACIÓN TABLA 24.7 Estimaciones del trabajo calculado usando la regla trapezoidal y las reglas de Simpson. El error relativo porcentual e, como se calculó con referencia a un valor verdadero de la integral (1 29.52 Ib • pie) fue estimado con base en los valores en intervalos de 1 pie.
Segmentos Trabajo

Técnica Trapezoidal

Regla de Simpson 1 / 3 Regla de Simpson 3 / 8

1 2 3 6 2 6

5 3 .1 1 3 3 1 .9 1 2 4 9 .8 1 1 9 0 .9 1 7 5 8 .2 1 1 7 1 .3 1 3 9 9 .3

9 5 9 . 2 8 .4 3 5 .1 8 0 .5 3 5 7 .5 9 5 .7 8 . 0 4

producto de F(x) y eos [#(*)]. Observe cómo el uso de siete puntos para caracterizar la función que varía en forma continua no toca los dos picos en x = 2.5 y 12.5 pies. La omisión de estos dos puntos limita efectivamente la exactitud de la integración numérica estimada en la tabla 24.7. El hecho de que la regla trapezoidal con dos segmentos dé el resultado más exacto se debe a la selección del posicionamiento de los puntos para este problema en particular (véase figura 24.7). La conclusión resultante de la figura 24.6 es que debe hacerse un número adecuado de mediciones para calcular con exactitud las integrales. Para el caso actual, si los datos estuvieran disponibles enF(2.5) eos [0(2.5)] = 4.3500yF(12.5) eos [0(12.5)] = 11.3600, podríamos determinar una estimación de la integral con el uso del algoritmo para datos espaciados desigualmente descrito en la sección 21.3. La figura 24.8 ilustra la segmentación desigual para este caso. Si se incluyen los dos puntos adicionales se obtiene una estimación de la integral mejorada de 126.9 (e = 2.02%). Así, la inclusión de los datos adicionales podría incorporar los picos que antes no se tomaron en cuenta y, en consecuencia, tener los mejores resultados.
(

FIGURA

24.7

Ilustración gráfica del porqué la regla trapezoidal con dos segmentos da una buena estimación de la integral para este caso en particular. Por suerte, el uso de dos trapezoides ocurre para llevar a un balance equilibrado entre los errores negativo y positivo.

co

x, p l « i

inlos que resulta de la lin lii'.iún de dos puntos inlii dmales en x = 2.5 y \V '> orí los datos de la luíilu 24.6. Se muestran las lúi mulos de integración iiiiiiii'nii.a aplicadas a cada i I I I I | I I I I I I I de segmentos.

59 C O C O C O C O CL E

Q. E W A> Q

(fl

s
(O O. SO

55

£

Q.

o

CU

55

CU D

PROBLEMAS
lli||«IILURIA

química/petrolera

14.1 Kcalice el mismo cálculo que en la sección 24.1, pero ahora Míenle la cantidad de calor requerido para elevar la temperatura ili< I .*)()() gramos del material desde —150 a 50°C. Use la regla lio Simpson para sus cálculos, con valores de incremento de Tde 1<r<'. 14,l Kepita el problema 24.1, pero ahora use integración de Uniubcrg con e = 0.01%. M. l Kepila el problema 24.1, pero ahora use la fórmula de GaussI I'tjeiulre con dos y tres puntos. Interprete sus resultados. 1<M I ,a integración proporciona un medio para calcular cuánta N N I N I I entra o sale de un reactor en un periodo específico, como en
s

Use integración numérica con el fin de evaluar esta O C U H Ü I Ó I I para los datos en la tabla P24.4. Observe que Q = 4 mVmin. 2 4 . 5 La concentración química a la salida de un reactor do mezcla completa se mide como
t, min c, mg/m
3

0
10

2
20

4
30

6
40

8
60

12 72

16 70

TABLA P 2 4 . 4

Valores de concentración medida en la tubería de salida de un reactor.
e, m g / m
10 22 35 47 55 58 52 40 37 32 34
3

t, m i n

M

\
Ji\

Qcdt

di uiilc /, y t = tiempo inicial y final. Esta fórmula tiene sentido Intuitivo si usted recuerda la analogía entre integración y mmmloria. Así, la integral representa la sumatoria del producto (lid Unjo por la concentración para dar la masa total entrando o (tullendo desde t a t . Si la razón de flujo es constante, Q puede «el obtenida de la integral:
2 { 2

M

Q

I

cdl

(P24.4)

0 5 10 15 20 25 30 35 40 45 50

692

APLICACIONES EN LA INGENIERÍA: INTEGRACIÓN NUMÉRICA Y DIFERENCIACIÓN

Para una salida de flujo de Q = 12 nr/min, estime la masa de químicos que existe en el reactor desde t = 0 hasta 20 min. 24.6 ha primera ley de difusión de Fick establece que Flujo másico = D de dx
2

(P24.6)

donde flujo másico = cantidad de masa que pasa a través de una unidad de área por unidad de tiempo (g/cm /s), D = coeficiente de difusión (cm /s), c = concentración, y x = distancia (cm). Un ingeniero ambiental mide la siguiente concentración de un contaminante en los sedimentos depositados en un lago (x = 0 en el punto de contacto sedimento-agua y aumenta hacia abajo):
2

duos de petróleo entre diferentes localizaciones y una refinería. Usted sabe que, debido a la fricción en el fondo, la velocidad varía con la profundidad en el canal. Si su técnico tiene tiempo para realizar sólo dos mediciones de velocidad, ¿a qué profundidades las tomaría para obtener la mejor estimación de la velocidad promedio? Establezca sus recomendaciones en términos del porcentaje de la profundidad total d medida desde la superficie del fluido. Por ejemplo, la medición en la superficie sería del 0%d, mientras que en el fondo sería del 100%*/.
Ingeniería civil/ambiental

x, cm c, 1 0 " g/cm
6 3

0 0.1

1 0.4

3 0.9

Use la mejor técnica de diferenciación numérica disponible para estimar la derivada en* = 0. Emplee dicha estimación junto con la ecuación (P24.6) para calcular el flujo másico de contaminantes fuera de los sedimentos y dentro de las aguas recubiertas (D = 2x10"* cm /s). Para un lago con 3 x 10 m de sedimentos, ¿cuánta contaminación podría ser transportada hacia el lago en un año? 24.7 Los siguientes datos fueron colectados cuando se cargaba un gran buque petrolero:
2 6 2

24.9 Realice el mismo cálculo que en la sección 24.2, pero ahora use la integración de Romberg con un orden de h para evaluar la integral. 24.10 Realice el mismo cálculo que en la sección 24.2, pero ahora use la cuadratura de Gauss para evaluar la integral. 24.11 Calcule F mediante la regla trapezoidal y las reglas de Simpson 1/3 y 3/8. Divida el mástil en intervalos de cinco pies.
s

F=

Jo
f /
30

250z

e- dz 6+ z

7 / l nz/l0

f, min V, 1 0 barriles
6

0 0.5

15 0.65

30 0.73

45 0.88

60 1.03

90 1.14

120 1.30

Calcule la razón de flujo Q (es decir, d VIdi) para cada tiempo del orden de h . 24.8 Usted se interesa en la medición de la velocidad de un fluido en un canal abierto angosto rectangular que transporta resi2

24.12 Las áreas de sección transversal (A) son requeridas para diferentes tareas en la ingeniería de abastecimiento de aguas: entre otras, pronósticos de inundación y diseño de reservorios. A menos que se disponga de dispositivos electrónicos sonoros para obtener perfiles continuos del fondo del canal, el ingeniero debe confiar en mediciones discretas de la profundidad para calcular A. Un ejemplo de una corriente común con su sección transversal se muestra en la figura P24.12. Los puntos representan ubicaciones donde se ancló un bote y tomó lecturas a diferentes profundidades. Use dos aplicaciones de la regla trapezoidal (h = 4 y 2 m) y la regla de Simpson 1/3 para estimar el área de sección transversal a partir de esos datos.

w

PRO!

i 0

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

i

1 000

2 000 Distancia, pies

3 000

FIGURA P24.13 Un campo limitado por dos caminos y una cresta.

M 1 1 Durante un reconocimiento de campo, se le pide calcular p| Arca del campo mostrado en la figura P24.13. Use las reglas do Simpson para determinar el área. M i l Un estudio de ingeniería de transporte requiere el cálculo del número total de autos que pasan por una intersección en un

periodo de 24 horas. Una persona visita la intersección varia» veces durante un día y cuenta el número de autos que pasan por el lugar en un minuto. Utilice estos datos, que se resumen en la tabla P24.14, para estimar el número total de autos que pasa a diario por la intersección (sea cuidadoso con las unidades).

24.15 La fuerza del viento distribuida en un lado de un rascacielos es registrada como
Altura /, m *» Fuerza, F[l\, N/m 0 0 30 350 60 1 000 90 120 150 3 000 180 3 300 210 3 500 240 3 600

1 500 2 600

Calcule la fuorzu neta y la linea de acción debida a este viento dlitrlbuldo,

694

APLICACIONES EN LA INGENIERÍA: INTEGRACIÓN NUMÉRICA Y DIFERENCIACIÓN TABLA P24.14 Razón de flujo de tráfico (autos/min) para una intersección medida en diferentes tiempos en un periodo de 24 horas.
Razón 2 2 0 2 5 8 25 Tiempo 9:00 10:30 1 1:30 12:30 2:00 4:00 5:00 A.M. A.M. A.M. P.M. P.M. P.M. P.M. Razón 12 5 10 12 7 9 28 Tiempo 6:00 7:00 8:00 9:00 10:00 11:00 1 2:00 Razón 22 10 9 11 co 9 3

Tiempo 12:00 2:00 4:00 5:00 6:00 7:00 8:00 medianoche A.M. A.M. A.M. A.M. A.M. A.M.

P.M. P.M. P.M. P.M. P.M. P.M. medianoche

24.16 El agua ejerce presión sobre la cara corriente arriba de una presa como se muestra en la figura P24.16. La presión se puede caracterizar por p(z) = pg(D - z)
2

donde w(z) = ancho de la cara de la presa (m) en la elevación z (véase la figura P24.166). La línea de acción también se puede obtener al evaluar
f
D =

(P24.16)
pgzw(z){D - z) dz

donde p(z) = presión en paséales (o N/m ) ejercida a una elevación z metros por arriba del fondo del reservorio; p — densidad del agua, la cual, para este problema, se supone es constante 10 kg/m ; g = aceleración debida a la gravedad (9.8 m/s ); y D = elevación (en m) de la superficie del agua por arriba del fondo del reservorio. De acuerdo con la ecuación (P24.16), la presión se incrementa con la profundidad, como se ilustra en la figura P24.16a. Si se omite la presión atmosférica (ya que trabaja contra ambos lados de la cara de la presa y de esta forma se cancelan), la fuerza/puede ser determinada al multiplicar la presión por el área de la cara de la presa (como se muestra en la figura P24.16b). Debido a que ambas, la presión y el área, varían con la elevación, la fuerza total se obtiene al evaluar
3 3 2

4_

Use la regla de Simpson para calcular f y d. Verifique los resultados con su programa de computadora para la regla trapezoidal. 24.17 Para estimar el tamaño de una nueva presa, usted tiene que determinar el volumen total de agua (m ) que fluye por un río en un año. Usted dispone de los siguientes datos promedio, con muchos registros anuales, para el río:
t 3

/ Jo

pgw(z)(D

- z) dz

Fecha

Med- Med- Med- Med- Med- Med- Med- Med- MedEne. Feb. Mar. Abr. Jun. Sept. Oct. Nov. Dic. 23 27 Flujo, mVs 31 37 80 1 19 102 20 21 Determine el volumen. Sea cuidadoso con las unidades, y tenga cuidado al realizar una estimación adecuada del flujo en los puntos extremos.

fr =

JO
(

Pgw(z)(D

- Z ) dz

FIGURA

P24.16

Agua que ejerce presión sobre la cara corriente arriba de una presa: a) vista lateral donde se muestra que la fuerza aumenta linealmente con la profundidad;fo)vista frontal en la cual se muestra el ancho de la presa en metros.

íl'.'
24.IH Los «utos que se enlistan en la siguiente luhlu diui mediciones horarias del flujo de calor q (cul/um'Vh) en 1 ti superficie de un colector solar. Como ingeniero arquitecto, usted debe estimar el calor total absorbido por un panel colector de 150 000 «tit durante un periodo de 14 horas. El panel tiene una eficiencia do absorción e del 4 5 % . El calor total absorbido lo proporUlnnu
J

ab

Jo
/

qA dt

dundo A = área y q = flujo de calor.
0
0.10
1 2

3
5.32 6.29 7.80 3.00 8.57 8.03 7.04 6.27 5.56 3.54

13

1.62

.00

0.20

M. I '> lil flujo de calor q es la cantidad de calor que fluye a través di- un área del material por unidad de tiempo. Se puede calcular din la ley de Fourier, , dT dx donde./ tiene unidades de J/m /s o W / m y ¿ e s un coeficiente de conductividad térmica que parametriza las propiedades de conducción de calor del material y tiene las unidades de W/(°C • m). T temperatura (°C); y x = distancia (m) a lo largo de la trayectoria de flujo de calor. La ley de Fourier es usada rutinariamente por ingenieros arquitectos para determinar el flujo de calor II travos de paredes. Las siguientes temperaturas son medidas en nuil pared de piedra:
2 2

di
donde V = caída de voltaje (V), L = inductancia (en henrys; 1 H = 1 V-s/A),; = corriente (A), y t = tiempo (s). Determino la caída de voltaje como una función del tiempo a partir de lo» siguientes datos para una inductancia de 4 H.
L

t
/'

0. 0.

0.1

0.2 0.3

0.3

0.5 0.8

0.7 1.9

0.15

0.55

24.24 Suponga que la corriente a través de un resistor es descrita por la función

¡(0 = (60 - tf + (60 - f) sen (V7)
y la resistencia es una función de la corriente, R = 10/ + 2¿
2/3

x, m

0
20

0.1
17

0.2
15

/,"C

SI el Unjo en x = 0 es de 60 W/m , calcule k. Ingrali-ría eléctrica M 20 Kcalice el mismo cálculo que en la sección 24.3, pero ahoIÍI pina la corriente especificada por ;'(0 = 4e~ /'(/) = 0

Calcule el voltaje promedio desde t — 0 a 60 mediante la rcglu de Simpson 1/3 de segmentos múltiples. Ingeniería mecánica/aeroespacial 24.25 Realice el mismo cálculo que en la sección 24.4, pero uhora use la regla de Simpson de segmentos múltiples para calcular:
F(x) = \.5x0.04 .T
2

' sen

2M

para 0 < t < Til para 772 < t<T

donde ' / ' = 1 s. Use la cuadratura de Gauss con cinco puntos para ("¡lunar la integral. M.2I Repita el problema 24.20, pero ahora use la regla de Simpson 1/3. 24.22 Kepita el problema 24.20, pero ahora use la integración de Koniberg con <•:, - 1%. 24.2.1 La ley de l'iiraday caracteriza la calda de voltaje a través de un inductor como

Emplee los valores de 6 de la tabla 24.6. 24.26 Realice el mismo cálculo que en la sección 24.4, pero ahora use la siguiente ecuación para el cálculo: 0(x) = 0 . 8 + 0.125* - 0 . 0 0 9 j r + (2 x 10
2

V

Kmplec la ecuación del problema 24.25 para /''(.ir). Use 4, 8 y 16 KBgmentoN de la regla trape /oidul puní calcular la integral.

696

A P L I C A C I O N E S EN LA INGENIERÍA:

INTEGRACIÓN NUMÉRICA Y DIFERENCIACIÓN

24.27 Repita el problema 24.26, pero ahora use lu regla de Simpson 1/3. 24.2H Vuelva a realizar el problema 24.26, pero ahora use la integración de Romberg con e = 0.5%. 24.2'> Repita el problema 24.26, pero ahora use la cuadratura de (luuss. 2 4 M . ) El trabajo realizado por un objeto es igual a la fuerza por lu distancia recorrida en la dirección de la fuerza. La velocidad ilo un objeto en la dirección de una fuerza está dada por
s

FIGURA P24.31

I)

r= 4/ i) = 24 + (6 - O

2

0<í <6 6 < t < 14 Si una bola de metal se calienta a 90°C y se deja caer en agua que se mantiene a una temperatura constante de T = 25°C, la temperatura de la bola cambiará, como en
a

donde v = m/s. Emplee la regla trapezoidal de aplicación múltiplo para determinar el trabajo si una fuerza constante de 200 N scuplica para todo?. 24.31 La razón de enfriamiento de un cuerpo (véase figura 1*24.31) se puede expresar como
- 1 = -k(T

Tiempo, min

0 90

5 49.9

10 33.8

15 28.4

20 26.2

25 25.4

al

- T)
a

donde T = temperatura del cuerpo (°C), T = temperatura del medio ambiente (°C) y k = constante de proporcionalidad (por minuto). Así, esta ecuación (llamada ley de enfriamiento de Newton) especifica que la razón de enfriamiento es proporcional a la diferencia en temperaturas del cuerpo y del medio ambiente.
a

Utilice diferenciación numérica para determinar dTIdt para cada valor de tiempo. Grafique dTIdt contra T — T y emplee regresión lineal para evaluar k. 24.32 Una barra sujeta a una carga axial (véase figura P24.32a) se deformará, como se muestra en la curva esfuerzo-deformación unitaria en la figura P24.32¿>. El área bajo la curva va desde un esfuerzo cero hasta el punto de ruptura y se le llama módulo
a

1

°C

FIGURA

P24.32
3 2

o) Una barra bajo carga axial y b) la curva resultante esfuerzo-deformación unitaria donde el esfuerzo está en kilolibras por pulgada cuadrada ( 1 0 lb/pulg ) y la deformación unitaria es adimensional.

tͥ riRltln

del inutoriul. Proporciona una M E D I D A de la energía pin uuidiid de volumen requerido para caunir la ruptura del mahirlal. Como tal, es representativo de la habilidad del material |lMh resistir una carga por impacto. Use integración numérica B M H enleular los módulos de rigidez para la curva esfuerzo-deFIGURA P24.33 fttf tune ION unitaria que se tiene en la figura P24.326. 1 4 . 1 1 S I se conoce la velocidad de distribución de unfluidotransportándose a través de una tubería (véase figura P24.33), se puede calcular la razón de flujo Q (es decir, el volumen de agua que donde r es la distancia radial medida hacia afuera del centro de pn>IN a través de la tubería por unidad de tiempo) con dundo nes la velocidad y A es el área de la sección transversal de la tubería. Si la distribución de velocidad está dada por lu tubería. (Para entender el significado de esta relación en forma 1/6 « = 2.O(l-¿) fínica, recuerde la conexión cercana entre sumatoria e integración.) I'aru un tubo circular, Portante,

Q = IvdA,
0

A = rcP'ydA = licrdr. ka
3

• A )

(2irr) dr

donde r es el radio total (en este caso, 2 cm), calcule Q usando la regla trapezoidal de aplicación múltiple. Analice sus resultados. 24.34 Mediante los siguientes datos, calcule el trabajo realizado al estirar un resorte que tiene una constante de resorte de 3 X 10 N/m, en 0.45 m.
2

x=

F, 1 0 N
x, m

0
0

0.01
0.05

0.028
0.10

0.04o
0.15

0.063 0.20

0.082 0.25

0.11

0.13 0.35

0.30

M. La posición de un avión caza sobre un portaaviones fue Itimuda durante el aterrizaje:
I,
%

24.37 La velocidad hacia arriba de un cohete se puede calcular con la siguiente fórmula:
1 ( v = u ln
m

0 154

0.51
186

1.03
209

1.74
250

2.36
262

3.24
272

3.82
274

— gt \m -qtj donde v = velocidad hacia arriba, u = velocidad a la cual se donde x es la distancia desde el extremo del portaaviones. Estiexpulsa el combustible relativo al cohete, m = masa inicial del me lu velocidad y la aceleración usando dicohete en el tiempo / = 0, q = razón de consumo de combustiferenciación numérica. ble y g = aceleración hacia abajo debido a la gravedad (se supo14 \b limplee la regla trapezoidal de aplicación múltiple para ne constante = 9.8 m/s ). Si u = 2 000 m/s, m = 150 000 kg y evaluar lu distancia vertical recorrida por un cohete si la velociq = 2 600 kg/s, use la regla trapezoidal y la de Simpson 1/3 con dad vertical está dada por seis segmentos, la cuadratura de Gauss con seis puntos y los métodos de Romberg del orden de /¡ para determinar qué tan .. 1 Oí - 5/ 0</<10 alto volará el cohete en 30 segundos. S m
0

°

\

ti)

(dx/dt) b)
10<í <20

(dv/df)

0

2

0

2

8

1. -: 1 0 0 0 - 5 ?
1 »

45/ + 2(/ - 2 0 )

2

20 < / < 30

E P I L O G O : PARTE SEIS
PT6.4 E L E M E N T O S DE JUICIO La tabla PT6.4 proporciona un resumen de los elementos de juicio involucrados en la integración numérica o cuadratura. La mayoría de esos métodos se basa en la simple interpretación física de una integral como el área bajo una curva. Estas técnicas están diseñadas para evaluar la integral de dos casos diferentes: 1) una función matemática y 2) datos discretos en forma tabular. Las fórmulas de Newton-Cotes son los principales métodos analizados en el capítulo 21. Se aplican a ambas funciones, continuas y discretas, y ambas versiones están disponibles: las cerradas y las abiertas. Las fórmulas abiertas, las cuales tienen límites de integración que se extienden más allá del rango de los datos, son usadas muy rara vez para la evaluación de integrales definidas. Sin embargo, son de utilidad para la solución de ecuaciones diferenciales ordinarias y para la evaluación de integrales impropias. Las fórmulas cerradas de Newton-Cotes se basan en el reemplazo de una función matemática o datos tabulados por un polinomio de interpolación que es fácil de integrar. La versión más simple es la regla trapezoidal, la cual se basa en el cálculo del área bajo una línea recta reuniendo valores adyacentes de la función. Una forma para mejorar la exactitud de la regla trapezoidal es dividir el intervalo de integración desde a hasta b en un número de segmentos y aplicar el método a cada uno de ellos. Además de aplicar la regla trapezoidal con segmentos más finos, otra forma de obtener una estimación más exacta de la integral es con polinomios de orden superior para conectar los puntos. Si se emplea una ecuación cuadrática, el resultado es la regla de Simpson 1/3; si se usa una ecuación cúbica, será la regla de Simpson 3/8. Como son mucho más exactas que la regla trapezoidal, por lo común son preferidas esas fórmulas y se dispone de versiones de aplicación múltiple. Para situaciones con un número de

TABLA PT6.4

Comparación de las características de métodos alternativos para la integración numérica. Las comparaciones se basan en la experiencia general y no toman en cuenta el comportamiento de funciones especiales.
Datos necesarios p a r a Datos requeridos para n aplicaciones n+ 1 2n+ 1 >3 N/D E r r o r de truncamiento Aplicación Amplia Amplia Amplia Rara Requiere que í[x) sea conocida N/D Rflqiilme que l[x) i t a conocida E s f u e r z o de programación Fácil Fácil Fácil Fácil Moderado 16.il inaproplacla puní dalos Inbulaira Inupioplciflti
|KII(]

Método Regla trapezoidal Regla de Simpson 1 /3 Reglas de Simpson 1 / 3 y 3/8 Newton-Cotes de orden superior Integración de Romberg Cuadratura de Gauss

u n a aplicación 2 3 3 o4 >5 3

Comentarios

•¿2

dalos lubulutoj

P T ¿ , " g | ^ p B S AVAN1AD0S Y
segmentoi par, «o recomienda la aplicación múltiple de lu regla 1/3. Para un número de segmentos impar se puede aplicar la regla 3/8 a los últimos tres segmentos y la regla 1/3 a los segmentos restantes. También se dispone de fórmulas de Newton-Cotes de orden superior. Sin embargo, se usan muy rara vez en la práctica. Donde se requiere de alta exactitud, también se dispone de las fórmulas de integración de Romberg y la cuadratura de Gauss. Debe observarse que ambas son de valor práctico sólo en casos donde se dispone de la función. Estas técnicas no son adecuadas para datos tabulados.

RELACIONES IMPORTANTES Y FÓRMULAS La tabla PT6.5 resume información importante que se expuso en la parte seis. Esta tabla se puede consultar para un acceso rápido de relaciones importantes y fórmulas.

MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES Aunque revisamos diferentes técnicas de integración numérica, hay otros métodos que tienen utilidad en la práctica de la ingeniería. Por ejemplo, la integración adaptativa de Simpson se basa en la división del intervalo de integración en una serie de subintervalos de anchura h. Después se usa la regla de Simpson 1/3 para evaluar la integral de cada subintervalo al dividir el tamaño de paso a la mitad en una forma iterativa; es decir, con un tamaño de paso de h, h/2, h/4, hl% y así sucesivamente. Se continúa con las iteraciones para cada subintervalo hasta que la estimación del error aproximado esté por debajo de un criterio de paro preestablecido e . La integral total se calcula entonces como la sumatoria de las estimaciones de la integral en los subintervalos. Esta técnica es en especial valiosa para funciones complicadas que tienen regiones que muestran variaciones de orden inferior y superior. Un análisis para la integración adaptativa se puede encontrar en Gerald y Wheatley (1984) y Rice (1983). Además, pueden usarse los esquemas adaptativos para resolver ecuaciones diferenciales ordinarias con el fin de evaluar integrales complicadas, como se expuso en la PT6.1 y se analizará en el capítulo 25. Otro método para obtener integrales es mediante el ajuste de los datos con segmentarias cúbicas. Las ecuaciones cúbicas resultantes se pueden integrar de manera fácil (Forsythe y cois., 1977). Algunas veces se usa también un procedimiento similar en diferenciación. Por último, además de las fórmulas de Gauss-Legendre analizadas en la sección 22.2, hay una variedad de otras fórmulas de cuadratura. Carnahan, Luther y Wilkes (1969) y Ralston y Rabinowitz (1978) resumen muchos de esos procedimientos. En resumen, lo anterior tiene la intención de proporcionarle nuevas formas para una exploración profunda del tema. Además, todas las referencias anteriores describen las técnicas básicas tratadas en la parte seis. Le recomendamos consultar esas fuentes alternativas para ampliar su conocimiento de los métodos numéricos en integración.
s

700
TABLA P T 6 . 5
Método

EPÍLOGO: PARTE SEIS Resumen de información importante presentada en la parte seis.
Formulación Interpretaciones gráficas Error

R e g a lt r a p e z o i d a l
fia) +

f[b)
a

Ifa 12 fll

--n i
4
3

R e g a lt r a p e z o i d a l f|x| + 2 g M + frj d ea p l i c a c i ó nm ú p i t l e l /~b | —a ) ^
0

Ib-o) ., 12n = x
0 2 f

R e g a ld eS m ip s o n 1 /3

/ ~ [b - o ]
f( |
XQ

b=x „x I b 2880
0

+

4 f ( ) + f( )
X] X2

| fx ) A

4 2 R e g a ld eS m ip s o n 1 /3 l °> + M + N +M d ea p l i c a c i ó nm ú p i t le l / ~ (b - a) — — ^
n-l n - 2

f x

:

Z

:

Z

a=x
f

b=X 2

x

f

I b - o)'
" 180n
4

f|4]

R e g a ld eS m ip s o n3 8 ( x o ) + 3f f ( x )+f ( x ) //~ ( b -,o )f r|x,| + 3
2

3

Ib 6480
XQ

a l -

a =

b=x / ', l c -1
'/,* + 1, le- 1

3

x

I n e tg r a c ó in d eR o m b e g r C u a d r a u tr a d eG a u s s

a '/.* =

4

k-

0 ( r i )
i 2

/~ c r M / +c i f ( x i ]+•••+c „ _ i f ( x „ _ i )

f < > ( £ )
2 + n 2

ECUACIONES DIFERENCIALES ORDINARIAS
PT7.1 MOTIVACIÓN En el primer capítulo de este libro derivamos la siguiente ecuación basada en la segunda ley de Newton para calcular la velocidad v del paracaidista en caída como una función del tiempo t [recuerde la ecuación (1.9)]: dv ~n=S--v dt
c

m

(PT7.1)

donde g es la constante gravitacional, m es la masa y c es el coeficiente de arrastre. Tales ecuaciones, que se componen de una función desconocida y de sus derivadas, son llamadas ecuaciones diferenciales. La ecuación (PT7.1) es algunas veces conocida como ecuación de razón, ya que expresa la razón de cambio de una variable como una función de las variables y los parámetros. Tales ecuaciones desempeñan un papel importante en ingeniería debido a que muchos fenómenos físicos son en el contexto matemático mejor formulados en términos de su razón de cambio. En la ecuación (PT7.1), la cantidad que habrá de ser diferenciada, v, es conocida como variable dependiente. La cantidad con respecto a la cual v es diferenciada, t, se conoce como variable independiente. Cuando la función involucra una variable independiente, la ecuación es llamada ecuación diferencial ordinaria (o EDO). Esto contrasta con una ecuación diferencial parcial (o EDP) que involucra dos o más variables independientes. Las ecuaciones diferenciales se clasifican también en cuanto a su orden. Por ejemplo, la ecuación (PT7. 1) se conoce como ecuación de primer orden, ya que la derivada más alta es una primera derivada. Una ecuación de segundo orden podría incluir una segunda derivada. Por ejemplo, la ecuación que describe la posición x de un sistema masa-resorte con amortiguamiento es la ecuación de segundo orden (recuerde la sección 8.4), dx dx m— +c—+kx=0 dt dt
2 T 2

(PT7.2)

donde c es un coeficiente de amortiguamiento y k es una constante del resorte. De manera similar, una ecuación de n-ésimo orden podría incluir una «-ésima derivada. Ecuaciones de orden superior pueden ser reducidas a un sistema de ecuaciones de primer orden. Para la ecuación (PT7.2), esto se realiza al definir una nueva variable y, donde dx )' = J. (PT7.3)

704

ICUACIONES DIFERENCIALES ORDINARIAS

lo anterior se puede diferenciar para obtener dy_ dt
=

d]x_ dt
2

(PT7.4)

Las ecuaciones (PT7.3) y (PT7.4) pueden entonces ser sustituidas en la ecuación (PT7.2) para dar m^+cy dt o dy
^ = -

+ kx^O

(PT7.5)

cy + kx
m

-

(

P T 7

- )
6

Así, las ecuaciones (PT7.3) y (PT7.6) son un par de ecuaciones de primer orden equivalentes a la ecuación de segundo orden original. Debido a que otras ecuaciones diferenciales de n-ésimo orden pueden ser reducidas en forma similar, esta parte de nuestro libro se concentra sobre la solución de ecuaciones de primer orden. Algunas aplicaciones de la ingeniería en el capítulo 28 tratan con la solución de EDO de segundo orden por reducción a un par de ecuaciones de primer orden.

PT7.T.1

M é t o d o s p a r a r e s o l v e r EDO s i n el u s o de computadora

Sin una computadora, las EDO se resuelven con frecuencia con técnicas de integración analítica. Por ejemplo, la ecuación (PT7.1) se podría multiplicar por dt e integrarse para obtener v = J (g- -v)dt
C

(PT7.7)

El lado derecho de esta ecuación se conoce como integral indefinida debido a que los límites de integración no están especificados. Esto contrasta con las integrales definidas que se analizaron en la parte seis [compare la ecuación (PT7.7) con la ecuación PT6.6]. Una solución analítica para la ecuación (PT7.7) se obtiene si la integral indefinida puede evaluarse en forma exacta como una ecuación. Por ejemplo, recuerde que para el problema del paracaidista en caída, la ecuación (PT7.7) se resolvió analíticamente con la ecuación (1.10) (suponga que v — 0 en t = 0):
„(,) = 1 ^(1-e-e-/™)') (1.10)

c

La mecánica para derivar tales soluciones analíticas se analizará en la sección PT7.2. Mientras tanto, lo relevante es que las soluciones exactas para muchas EDO de importancia práctica no están disponibles. Como lo es para la mayoría de las situaciones analizadas en otras partes de esto libro, I ON métodos numéricos ofrecen la única alterna^ (iva viable, para esos cusoa. ' HBiifll4*' numéricos por lo común requieren de
vW

computadcrtm, unten del auge de éstas los ingenieros se hallaban limitados en el alcance de sus investigaciones. Un método muy importante que los ingenieros y matemáticos aplicados desarrollaron para superar este dilema fue la linearización. Una ecuación diferencial ordinaria lineal es aquella que se ajusta a la forma general a„(x)y
w

+ • • • + a (x)y' + a (x)y
{ 0

= f(x)

(PT7.8)

donde y-"' es la H-ésima derivada de y con respecto a x y las a yf son funciones específicas de x. Esta ecuación se conoce como lineal debido a que no hay productos o funciones no lineales de la variable dependiente y sus derivadas. La importancia práctica de las EDO lineales es que se pueden resolver analíticamente. En contraste, la mayoría de las ecuaciones no lineales no pueden ser resueltas en forma exacta. Así, en la era antes de la computadora, una táctica para resolver ecuaciones no lineales era linearizarlas. Un ejemplo simple es la aplicación de las EDO para predecir el movimiento de un péndulo oscilante (véase la figura PT7.1). De manera similar a como se hizo en la derivación del problema del paracaidista en caída, se puede usar la segunda ley de Newton para desarrollar la siguiente ecuación diferencial (véase la sección 28.4 para la derivación completa): ~ dt + 2 - sen 0 = 0 l (PT7.9)

donde 0es el ángulo de desplazamiento del péndulo, g es la constante gravitacional y / es la longitud del péndulo. Esta ecuación es no lineal debido al término sen 6. Una forma para obtener una solución analítica es darse cuenta que para pequeños desplazamientos del péndulo a partir de su condición de equilibrio (es decir, para pequeños valores de 6), send=6 (PT.10)

Así, suponemos que nos interesamos sólo en casos donde 0 es pequeña, la ecuación (PT7.10) se puede sustituir en la ecuación (PT7.9) para dar — + ^ = 0 (PT7.11)

Tenemos, por tanto, que transformar la ecuación (PT7.9) en una forma lineal que es fáci 1 de resolver de manera analítica. Aunque la linearización es una herramienta muy valiosa para resolver problemas en ingeniería, existen casos donde no se puede utilizar. Por ejemplo, suponga que nos interesamos en estudiar el comportamiento del péndulo para grandes desplazamientos desde el equilibrio. En tales casos, los métodos numéricos ofrecen una opción viable para obtener soluciones. En la actualidad, la disponibilidad tan amplia de las computadoras coloca esta opción al alcance de todos los ingenieros. PT7.1.2 E D O y práctica de la ingeniería

Las leyes fundamentales de la física, mecánica, electricidad y termodinámica están basadas con frecuencia en observaciones empíricas que explicon variaciones en las propio-

706

ECUACIONES DIFERENCIALES ORDINARIAS TABLA PT7.1 Ejemplos de las leyes fundamentales que se escriben en términos de la razón de cambio de variables (f = tiempo y x = posición).
E x p r e s i ó n matemática
aV_

Ley Segunda ley de Newton del movimiento Ley del calor de Fourier

Ley de difusión de Fick

Ley de Faraday (caída de voltaje a través de un inductor)

AV,

F ám q= dx dx J= dt
-D —

Variables y parámetros Velocidad (v), fuerza {() y masa (m) Flujo de calor \q), conductividad térmica [k] y temperatura [T] Flujo másico [J], coeficiente de difusión (D) y concentración (c) Caída de voltaje (AV ), inductancia (í) y corriente (/)
¡(

dades físicas y estados de los sistemas. Más que en describir directamente el estado de los sistemas físicos, las leyes se usan a menudo en términos de los cambios espacial y temporal. En la tabla PT7.1 se enlistan varios ejemplos. Esas leyes definen mecanismos de cambio. Cuando se combinan con las leyes de conservación de la energía, masa o momentum, resultan ecuaciones diferenciales. La integración subsecuente de estas ecuaciones diferenciales originan funciones matemáticas que describen el estado espacial y temporal de un sistema en términos de variaciones de energía, masa o velocidad. El problema del paracaidista en caída introducido en el capítulo 1 es un ejemplo de la derivación de una ecuación diferencial ordinaria a partir de una ley fundamental. Recuerde que la segunda ley de Newton se usó para desarrollar una EDO que describe la razón del cambio de velocidad de un paracaidista en caída. Al integrar esta relación, obtenemos una ecuación para predecir la velocidad de caída como una función del tiempo (véase figura PT7.2). Esta ecuación se podría utilizar en diferentes formas, entre ellas para propósitos de diseño. De hecho, tales relaciones matemáticas son la base para la solución de un gran número de problemas de ingeniería. Sin embargo, como se describió en la sección anterior, muchas de las ecuaciones diferenciales de importancia práctica no se pueden resolver mediante métodos analíticos de cálculo. Así, los métodos que se analizan en los siguientes capítulos son extremadamente importantes en todos los campos de la ingeniería. PT7.2 ANTECEDENTES MATEMÁTICOS

Una solución de una ecuación diferencial ordinaria es una función específica de la variable independiente y de parámetros que satisfacen la ecuación diferencial original. Para ilustrar este concepto, empecemos con una función dada
y m -0.5JC + Ax 1(1*' i

(PT7.12)

4

s

FT775P"

M A T E M Á T I C O S
F-ffW
LEY FILLOA

dv

c

EDO

v= — ( 1 -<rWm )r)

/

Analítica

Numérica

c

v,

+ 1

= v +(sr-—v ¡)Af
(

\

m

Solución

FIGURA PT7.2 La secuencia de eventos en la aplicación de EDO para resolver problemas de ingeniería. El ejemplo mostrado es la velocidad de un paracaidista en caída.

la cual es un polinomio de cuarto orden (véase figura PT7.3a). Ahora, si diferenciamos la ecuación (PT7.12), obtenemos una EDO:
-f- = -2x dx
3

+ I2x

2

- 20x +

8.5

(PT7.13)

Esta ecuación también describe el comportamiento del polinomio, pero de una manera diferente a la ecuación (PT7.12). Más que representar explícitamente los valores de y para cada valor de x, la ecuación (PT7.13) da la razón de cambio de y con respecto a x (es decir, la pendiente) para cada valor de x. La figura PT7.3 muestra a la función y la derivada graneadas contra x. Observe cómo el valor cero de las derivadas corresponde al punto en el cual la función original es plana; es decir, tiene una pendiente cero. También los valores absolutos máximos de las derivadas están en los extremos del intervalo donde las pendientes de la función son las más grandes. Como se acaba de mostrar, aunque podemos determinar una ecuación diferencial dando a la función original, el objetivo aquí es determinar la función original dada la ecuación diferencial. La función original entonces representa la solución. Para el caso actual, podemos determinar esta solución de manera analítica al integrar la ecuación (PT7.13):

Aplicando la regla de integración (recuerde la tabla PT6.2)

708

ICUACIONES DIFERENCIALES ORDINARIAS

FIGURA

PT7.3
4

Gráficas de a] y contra x y b) dy/dx contra x para la función y = - O . í x 8 . 5 x + 1.

+ 4 x - 1 Ox +
3 2

para cada término de la ecuación se obtiene la solución y = - 0 . 5 * + 4x - I0x
4 3 2

+ 8.5* + C

(PT7.14)

la cual es idéntica a la función original con una notable excepción. En el curso de diferenciación y después de la integración, perdemos el valor constante de 1 en la ecuación original y ganamos el valor C. Esta C es llamada constante de integración. El hecho de que aparezca esa constante arbitraria indica que la solución no es única. De hecho, lo es pero de un número infinito de funciones posibles (correspondiente a un número infinito de posibles valores de Q que satisfacen la ecuación diferencial. Por ejemplo, la figura PT7.4 muestra seis funciones posibles que satisfacen la ecuación (PT7.14). Por tanto, para especificar la solución por completo, la ecuación diferencial comúnmente se encuentra acompañada por condiciones auxiliares. Para las EDO de primer orden, un tipo de condición auxiliar llamada valor inicial es requerida para determinar la constante y obtener una solución única. Por ejemplo, la ecuación (PT7.13) se podría acompañar por la condición inicial que en x = 0, y = 1. Estos valores podrían sustituirse en la ecuación (PT7.14):
1 - - 0 . 5 ( 0 ) + 4(0)-' - lütOD'+JUCO) + C
4

(PT7.15)

FT7.3

«HJIUCIÓN

fif

FIGURA PT7.4 Seis posibles soluciones para la integral de -2X + 1 2.x - 2 0 x +8.5. Cada una conforma un valor diferente de la constante de integración C.
3 2

para determinar C = 1. Por tanto, la solución única que satisface a la ecuación diferencial y a la condición inicial especificada se obtiene al sustituir C = 1 en la ecuación (PT7.14) para dar y = - 0 . 5 x + Ax - I0x
4 3 2

+ 8.5x + 1

(PT7.16)

De esta forma, hemos "sujetado" la ecuación (PT7.14) al forzarla a pasar a través de ln condición inicial, y al hacerlo desarrollamos una solución única para la EDO y completamos un círculo con la función original [véase ecuación (PT7.12)]. Las condiciones iniciales usualmente tienen interpretaciones muy tangibles para las ecuaciones diferenciales derivadas de las condiciones de problemas físicos. Por ejemplo, en el problema del paracaidista en caída, la condición inicial fue un reflejo del hecho físico de que en el tiempo cero la velocidad vertical fue cero. Si el paracaidista hubiese estado en movimiento vertical en el tiempo cero, la solución debería haberse modificado al tomar en cuenta esta velocidad inicial. Cuando tratamos con una ecuación diferencial de n-ésimo orden, se requiere de n condiciones para obtener una solución única. Si se especifican todas las condiciones en el mismo valor de la variable independiente (por ejemplo, en* o t — 0), entonces al problema se le conoce como problema de valor inicial. Esto contrasta con los problemas de valor límite donde la especificación de condiciones ocurre con diferentes valores de la variable independiente. Los capítulos 25 y 26 se concentrarán sobre problemas de valor inicial. Los problemas de valor límite se abordarán en el capítulo 27 junto con los de valores propios. PT7.3 ORIENTACIÓN Antes de proceder con los método» numéricos para la solución de ecuaciones diferenciaIos ordinarias, podría ser de utilidad alguna orientación. El siguiente material tiene como

FT7.I5)

ECUACIONES DIFERENCIALES ORDINARIAS

propósito darle una revisión del material que se analizará en lu parte siete. Además, formulamos objetivos para concentrar sus estudios sobre el área de estudio.

PT7.3. T

Alcance y r e v i s i ó n

La figura PT7.5 proporciona una revisión de la parte siete. Dos categorías amplias de métodos numéricos para problemas de valor inicial se analizarán en esta parte del libro. Los métodos de un paso, los cuales se verán en el capítulo 25, permiten el cálculo y¡ , dada la ecuación diferencial y y¡. Los métodos de multipasos, que se abordarán en el capítulo 26, requieren valores adicionales de y además de los de /'. Todos los métodos, excepto los métodos de un paso del capítulo 25, pertenecen a las llamadas técnicas de Runge-Kutta. Aunque el capítulo podría haberse organizado alrededor de esta noción teórica, optamos por un procedimiento más gráfico e intuitivo para introducir los métodos. De esta manera, empezamos el capítulo con el método de Euler, el cual tiene una muy directa interpretación gráfica. Luego se ven las mejoras al método de Euler (las técnicas de Heun y las de punto medio). Después de esta introducción, desarrollamos de manera formal el concepto de procedimiento de Runge-Kutta (o RK) y demostramos cómo las técnicas anteriores son los métodos RK de primer y segundo orden. Continuamos con un análisis de las formulaciones RK de orden superior que se usan con frecuencia en la solución de problemas de ingeniería. Además, cubrimos la aplicación de los métodos de un paso a sistemas de EDO. Por último, el capítulo termina con un análisis de los métodos RK adaptativos que en forma automática ajustan el tamaño de paso en respuesta al error de truncamiento del cálculo. El capítulo 26 comienza con una descripción de las EDO rígidas, que se encuentran tanto en forma individual como en sistemas de EDO, y para su solución ambos tienen componentes lentos y rápidos. Introducimos la idea de una técnica de solución implícita como uno de los remedios más comunes para este problema. Después, analizamos los métodos de multipaso. Estos algoritmos retienen información de los pasos anteriores para capturar con más efectividad la trayectoria de la solución. También dan una estimación del error de truncamiento que se puede usar para implementar un control de tamaños de paso. En esta sección primero tomamos un procedimiento visual e intuitivo al usar un método simple (el Heun de no autoinicio) para introducir todas las características esenciales de los procedimientos de multipaso. En el capítulo 27 regresamos a los problemas de valor límite y de valores propios. Para los primeros, introducimos tanto los métodos de disparo como los de diferencias finitas. Para los últimos, analizamos diferentes procedimientos, entre ellos los métodos de polinomios y los de potencias. Por último, el capítulo concluye con una descripción de la aplicación de varios paquetes de software y librerías para la solución de EDO y valores propios. El capítulo 28 se dedica a aplicaciones en todos los campos de la ingeniería. Por último, se incluye una sección de revisión breve al final de la parte siete. Este epílogo resume y compara las fórmulas importantes y conceptos relacionados con las EDO. La comparación incluye un análisis de los elementos de juicio que son relevantes en su implementación en la práctica do la ingeniería. El epílogo también resume fórmulas importantes c incluye referencias de lomas avanzudos.

3 W
ulcniás,

plias de el libro. i°y,- + i> ín en el ;en a las do alreivo para e Euler, método lucción, oRK)y ¡egundo r que se irnos la termina ú tamauentran s tienen nplícita n inforia de la de usar >mamos autoinie multioropios. '.rendas nétodos :ripción EDO y ¡ría. Por epílogo D O . La :s en su 5rmulas

PARTE SIETE Ecuaciones diferenciales ordinarias

'Métodos de Heun^ y del punto medio 25.3 Runge-Kutta .

2 5 2 .

CAPITULO 25 Métodos de Runge-Kutta

Ingeniería mecánica

2 8 4 .
CAPITULO 28 Aplicaciones en ingeniería CAPÍTULO 26 Métodos rígidos y de multipaso

Métodos s^adaptatlvos R I O

2 5 Ü 5 ~

25.4 Sistemas de EDO

Ingeniería •léctrlca

2 8 ! .

Ingeniería civil

2 8 2 .
Librerías y paquetes

Rigidez

2 6 1 .

CAPITULO 27 Problemas de valor límite y valores propios

2 7 3 .

Problemas con valores en la frontera

2 7 1 .

Métodos multipaso

2 6 2 .

flOURA

PT7.5

k't'l iü.'.ontación esquemática de la organización de la parte siete: Ecuaciones diferenciales ordinarias.

712

ICUACIONIS DIFERENCIALES ORDINARIAS

PT7.3.2

M e t a s y objetivos

Objetivos d e estudio. Después de completar la parte siete, usted debe aumentar de manera notoria su capacidad para enfrentar y resolver ecuaciones diferenciales ordinarias y problemas de valores propios. Las metas de estudio en general deberían incluir el manejo de las técnicas, y una capacidad para asegurar la confiabilidad de las respuestas, y poder seleccionar el "mejor" método (o métodos) para cualquier problema en particular. Además de estos objetivos generales, debería dominar los objetivos de estudio específicos que se enlistan en la tabla PT7 .2. Objetivos d e cómputo. Se le proporcionó ya el software y algoritmos para implementar las técnicas analizadas en la parte siete. Todo tiene utilidad como herramientas de aprendizaje. El software para su computadora personal TOOLKIT de métodos numéricos es de uso amigable. Emplea el método de Runge-Kutta de cuarto orden para la solución de
TABLA PT7.2 Objetivos de estudio específicos para la parte siete.

1. Entender las representaciones visuales de los métodos de Euler, de Heun y del punto medio. 2. Conocer la relación del método de Euler con la expansión de la serie de Taylor y el conocimiento que esto proporciona con respecto al error del método. 3. Entender la diferencia entre los errores de truncamiento local y global y cómo se relacionan con la selección de un método numérico para un problema en particular. 4. Conocer el orden y la dependencia del tamaño de paso de los errores de truncamiento global para todos los métodos descritos en la parte siete; entender cómo dichos errores tienen que ver con ia exactitud de las técnicas. 5. Entender la base de los métodos predictor-corrector. En particular, percatarse que la eficiencia del corrector es dependiente de la exactitud del predictor. 6. Conocer la forma general de los métodos de Runge-Kutta. Entender la deducción del método RK de segundo orden y cómo se relaciona con la expansión en serie de Taylor; darse cuenta de que hay un número infinito de versiones posibles para los métodos RK de segundo orden y superiores. 7. Saber cómo aplicar cualquiera de los métodos RK a sistemas de ecuaciones; poder reducir una EDO de n-ésimo orden a un sistema de n EDO de primer orden. 8. Reconocer el tipo de problema en contexto donde es importante el ajuste del tamaño de paso. 9. Entender cómo se integra el control del tamaño de paso adaptativo en un método RK de cuarto orden. 10. Reconocer de qué modo la combinación de los componentes lentos y rápidos hacen una ecuación o un sistema de ecuaciones rígidos. 1 1. Entender la distinción entre esquemas de solución implícitos y explícitos para EDO. En particular, reconocer cómo el último 1) aminora la rigidez del problema y 2) complica la mecánica de solución. 12. Entender la diferencia entre problemas de valor inicial y de valores en la frontera. 1 3. Saber la diferencia entre los métodos de multipaso y de un paso; darse cuenta que todos los métodos multipaso son predictor-corrector, pero no a la inversa. 14. Entender la conexión entre fórmulas de integración y métodos predictor-corrector. 15. Reconocer la diferencia fundamental entre las fórmulas de integración de Newton-Cotes y la de Adams. 16. Saber lo racional detrás de los métodos de polinomios y los de potencia para determinar valores propios; en particular, reconocer sus fortalezas y limitaciones. 17. Entender cómo la deflación de Hoteller permite que el método de potencias se utilice para calculai los valores propios intermedios. 18. Saber cómo usar los paquetes de sollwdn» y/o librerías para integrar las EDO y evaluar los V O I O I U Í , propios.

hasta cinco Hl)() simultáneas. Las gráficas asociudas con este software le permitirán visualizar con facilidad la solución de gráficas como las xy donde se tiene la(s) variable(s) dependiente(s) contra la variable independiente. El software es muy fácil de aplicar para resolver muchos problemas prácticos y puede usarse con el fin de verificar los resultados de cualquier programa en computadora que usted haya desarrollado. Además, se proporciona los algoritmos para muchos otros métodos en la parte siete. Esta información le permitirá aumentar su librería de software. Por ejemplo, puede encontrar útil desde un punto de vista profesional tener el software que emplea el método de Runge-Kutta de cuarto orden para más de cinco ecuaciones y resolver las EDO con un procedimiento adaptativo de tamaño de paso. Por último, una de sus más importantes metas debería ser el dominio de los paquetes de software de propósito general que están disponibles ampliamente. En particular, debería convertirse en un entusiasta usuario de esas herramientas para implementar métodos numéricos en la solución de problemas de ingeniería.

CAPITULO 2 5 Métodos de Runge-Kutta

Este capítulo se dirige a la resolución de ecuaciones diferenciales de la forma
-r

dx

= /(•*> y)

En el capítulo 1 usamos un método numérico dirigido a resolver una ecuación como la anterior para el cálculo de la velocidad del paracaidista en caída. Recuerde que el método fue de la forma general Nuevo valor = valor anterior + pendiente x tamaño de paso, o en términos matemáticos,
i+i

y =yi +<ph
( +

(25.1)

De acuerdo con esta ecuación, la pendiente estimada < ¡ > se usa para extrapolar desde un valor anterior y- a un nuevo v a l o r ^ , en una distanciad (véase figura 25.1). Esta fórmula se puede aplicar paso a paso para calcular el valor en el futuro y, por tanto, trazar la trayectoria de la solución.

FIGURA

25.1

Ilustración gráfica del método de un paso.

/i»
25/í M É T O D OD EE U L E R y
Error

x

FIGURA 25.2
Método de Euler.

Todos los métodos de un paso se pueden expresar en esta forma general, que sólo va a diferir en la manera en la cual se estima la pendiente. Como en el problema del paracaidista en caida, el procedimiento más simple es usar la ecuación diferencial para estimar la pendiente derivada enx¡ al inicio del intervalo. En otras palabras, la pendiente al inicio del intervalo es tomada como una aproximación de la pendiente promedio sobre todo el intervalo. Este procedimiento, llamado método de Euler, se analiza en la primera parte de este capítulo. Después continuamos con otros métodos de un paso que cumplen estimaciones de pendiente en forma alterna, y cuyas resultantes serán predicciones más exactas. Todas estas técnicas se conocen por lo general como métodos de Runge-Kutta.

25.1

M É T O D O DE E U L E R La primera derivada proporciona una estimación directa de la pendiente en x¡ (véase figura 25.2):

= la ecuación diferencial y donde/ (x¡, y¡) es evaluada enx¡ y y¡. Tal estimación podrá sustituirse en la ecuación (25.1):
y¡+\ =y¡ +f(x¡,y¡)h (25.2)

4> f(x¡, i)

Esta fórmula es conocida como el método de Euler (o de Euler-Cauchy o de punto medio). Se predice un nuevo valor de y por medio de la pendiente (igual a la primera derivada en el valor original de x) que habrá de extrapolarse en forma lineal sobre el lamaflo do puso h (véase figura 25.2).

716
EJEMPLO 25. 1

MÉTODOS DE RUNGE-KUTTA Método de Euler

| Enunciado del problema. \ ecuación (PT7. 13):

Use el método de Euler para integrar numéricamente la

í

— = -2x dx

3

+ 12x - 20* + 8.5
2

desde* = Ohastax = 4con un tamaño depaso 0 .5. La condición inicial en* = Oesy = 1. Recuerde que la solución exacta la da la ecuación (PT7.16): y = - 0 . 5 * + 4 x - 10x + 8.5* + 1
4 3 2

Solución. i

Se puede usar la ecuación (25.2) para implementar el método de Euler: ^ \ ; VU :

y(0.5) = y(0) + /(O, 1)0.5 donde y (0) = 1 y la pendiente estimada e n * = 0 es /(O, 1) = - 2 ( 0 ) + 12(0) - 20(0) + 8.5 = 8.5
3 2

* '

I

¡J

Por tanto, \ y (0.5) = 1.0 + 8.5(0.5) = 5.25 La solución real en * = 0 .5 es y = - 0 . 5 ( 0 . 5 ) + 4(0.5) - 10(0.5) + 8.5(0.5) + 1 = 3.21875
4 3 2

TABLA 25.1

Comparación de los valores verdadero y aproximado de la integral de y' = -2X + 1 2X - 20x + 8.5, con la condición inicial de que y = 1 en x = 0. Los valores aproximados se calcularon mediante el método de Euler con un tamaño de paso de 0.5. El error local se refiere al error incurrido sobre un solo paso. Se calcula con una expansión de la serie de Taylor como en el ejemplo 25.2. El error global es la discrepancia total debida a los pasos anteriores así como a los actuales.
3 2

E r r o r r e l a t i v o porcentual

X 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

Xverdadero •3,?'.B75-> 3.00000 2.21875 2.00000 2.71875 4.00000 4.71875 3.00000

YEuler '^25000) 6.12500 4.50000 4.75000 5.87500 7,12500
/.0Ü000

Global

Local

í ooooo)

-63.1 -95.8 131.0 -125.0 -74.7 46.9 -51.0 133.3

-63.1 -28.0 -1.41 20.5 17.3 4.0 -1 1.3 -53.0

25.1 MÍTOOO D EE U L E R

7TT

O O

2

4

x

FIGURA

25.3
3 2

Comparación de la solución verdadera con una solución numérica mediante el método de Euler para la integral de y' = - 2 X + 1 2 X - 20x + 8 . 5 desde x = 0 hasta x = 4 con un tamaño de paso de 0.5. La condición inicial en x = 0 es y = 1.

Así, el error es E, = verdadero - aproximado = 3.21875 - 5.25 = - 2 . 0 3 1 2 5 o, expresada como error relativo porcentual, e, — —63.1%. Para el segundo paso, y ( l ) = },(0.5) + / ( 0 . 5 , 5.25)0.5 = 5.25 + [~2(0.5) + 12(0.5) - 20(0.5) + 8.5] 0.5
3 2

= 5.875 La solución real en x = 1.0 es 3.0 y, por tanto, el error relativo porcentual es - 9 5 . 8 % . El cálculo se repite y los resultados se compilan en la tabla 25.1 y la figura 25.3. Observe que aunque el cálculo captura la tendencia general de la solución verdadera, el error es considerable. Como se analiza en la siguiente sección, este error se puede reducir al usar un tamaño de paso más pequeño.

El ejemplo anterior usa un polinomio simple para la ecuación diferencial con el fin de facilitar el siguiente análisis de error. De esta forma,
dy dx » /(O

718

MÉTODOS DE RUNGE-KUTTA

Obviamente, un caso más general (y más común) involucra varios EDO que dependen de ambos, x y y,
-r = dx ftx, y)

Conforme avancemos en esta parte del texto, nuestros ejemplos involucrarán en forma gradual un número de EDO que dependen de ambas variables: independientes y dependientes. 25.1.1 A n á l i s i s de e r r o r p a r a el método de Euler

La solución numérica de los EDO involucra dos tipos de error (recuerde los capítulos 3 y 4): 1. 2. Errores de truncamiento, o discretización, causados por la naturaleza de las técnicas empleadas para aproximar los valores de y. Errores de redondeo, que son el resultado del número límite de cifras significativas que puede retener una computadora.

Los errores de truncamiento se componen de dos partes. La primera es un error de truncamiento local que resulta de una aplicación del método en cuestión sobre un paso sencillo. La segunda es un error de truncamiento propagado que resulta de las aproximaciones producidas durante los pasos previos. La suma de los dos és el total, o error de truncamiento global. Se puede obtener cierto conocimiento acerca de la magnitud y propiedades del error de truncamiento al derivar el método de Euler directamente de la expansión de la serie de Taylor. Para ello, observe que la ecuación diferencial sujeta a integración será de la forma general: y ' = /(JF, >0 (25.3)

donde y ' = dy/dx, yxyy son las variables independiente y dependiente, respectivamente. Si la solución (es decir, la función que describe el comportamiento de y) tiene derivadas continuas, puede representarse por una expansión de la serie de Taylor con respecto a los valores de inicio (x¡, y¡), como en [recuerde la ecuación (4.7)] y,
+ 1

= y, + yjh + ^h
n

2

z!

+ --- + \ h

n

n\

+ R„

(25.4)

donde h = x¡ j — x¡yR *. =

= término remanente, definido como (25.5,

donde ¿j está en algún lugar en el intervalo de x¡ a x . Es posible desarrollar una forma alternativa al sustituir la ecuación (25.3) en las ecuaciones (25.4) y (25.5) para obtener
¡+1

y , , , = v- + ,/U„ v,)/, I
(

• " ;;
/ Ü

V

' V

1

1- /-- - A'::
1 (

V

- /,»
Í)

t (Hh"">

(25.6)

2!

25 .1

MÉTODO DE EULER
1 1

719

donde 0(h" ) especifica que el error de funcionamiento local es proporcional al tamaño de paso elevado a la potencia (« + l)-ésima. Al comparar las ecuaciones (25.2) y (25.6), puede verse que el método de Euler corresponde a la serie de Taylor hasta e incluyendo el término f(x¡, y¡)h. Además, la comparación indica que ocurre un error de truncamiento porque aproximamos la solución verdadera mediante un número finito de términos de la serie de Taylor. De esta forma truncamos, o dejamos fuera, una parte de la solución verdadera. Por ejemplo, el error de truncamiento en el método de Euler es atribuible a los términos remanentes en la serie de expansión de Taylor que no se incluyeron en la ecuación (25.2). Al restar la ecuación (25.2) de la (25.6) se tiene + 0(h )
n+l

(25.7)

donde E = error de truncamiento local verdadero. Para h lo suficientemente pequeña, los errores en los términos de la ecuación (25.7) disminuyen con frecuencia en tanto aumenta el orden (recuerde el ejemplo 4.2 y el análisis que lo acompaña), y el resultado a menudo es representado como
t

2!

(25.8)

E =
a a

O(lr)

(25.9)

donde E = error de truncamiento local aproximado.

EJEMPLO 2 5 . 2

Estimación de la serie de Taylor por el método del error de Euler

\ Enunciando del problema. Use la ecuación (25.7) para estimar el error del paso inicial del ejemplo 25.1. Úsela también para determinar el error debido a cada uno de los términos de orden superior de la serie de expansión de Taylor. Solución. Debido a que tratamos con un polinomio, podemos usar la serie de Taylor para obtener estimaciones exactas en el método de Euler. La ecuación (25.7) se puede escribir como E,

f'ixi, yi)_
3!
2

4! h2+ /"(*,-, y,-)

ft3

+

/

( 3 )

(*My,)

/ 7

4

(E25.2.1)

donde f'(x¡, y¡) — primera derivada de la ecuación diferencial (que es, la segunda derivada de la solución). Para el presente caso, ésta es /"(.v.. y.) = -6x yf"(x¡, + 2Ax - 20 (E25.2.2)

y¡) es lu segunda derivada de la EDO * - 12v + 24 (E25.2.3)

f"iM,y,)

MÉTODOS DE RUNGE-KUTTA

y/* (x,-, y¡) es la tercera derivada de la EDO
3)

/ >(x -,y,0 = - 1 2
(3 (

(IÍ25.2 .4)

Podemos omitir términos adicionales (esto es, derivadas de cuarto y superiores) de la ecuación (E25.2.1), ya que para este caso en particular son igual a cero. Se debería observar que para otras funciones (por ejemplo, funciones trascendentales como sinusoides o exponenciales) esto podría no necesariamente ser cierto, y los términos de orden superior podrían tener valores diferentes a cero. Sin embargo, para el presente caso, las ecuaciones (E25.2.1) a la (E25.2.4) definen por completo el error de truncamiento para una sola aplicación del método de Euler. Por ejemplo, el error de truncamiento del término de segundo orden se puede calcular como - 6 ( 0 . 0 ) + 24(0.0) - 20 E,,2 = — - — ^ — (0.5) = - 2 . 5
2 7 2

(E25.2.5)

Para el término de tercer orden: £,, =
3

- 1 2 ( 0 . 0 ) + 24 o

(0.5) = 0.5
J

y para el término de cuarto orden: E, = — 12 (0.5) = - 0 . 0 3 1 2 5 24
4

4

Estos tres resultados pueden ser agregados para obtener el error de truncamiento total: E, = E,, + £ , 3 + E
2 f tA

= - 2 . 5 + 0.5 - 0.03125 = -2.03125

el cual es exactamente el error en que se incurría en el paso inicial del ejemplo 25.1, Observe como E > E > E el cual soporta la aproximación representada por In ecuación (25.8).
t2 t3 t¥

Como se ilustra en el ejemplo 25.2, la serie de Taylor proporciona un medio para cuantificar el error en el método de Euler. Sin embargo, existen limitaciones asociadas con su uso para este propósito: 1. La serie de Taylor proporciona sólo un estimado del error de truncamiento local; en decir, el error creado durante un solo paso del método. No proporciona una medida del error propagado y, por tanto, del error de truncamiento global. En la tabla 25.1 incluimos los errores de truncamiento global y local para el ejemplo 25.1. El error local se calculó para cada tamaño de tiempo con la ecuación (25.2), pero mediante el uso del valor verdadero de y¡ (la segunda columna de la tabla) para calcular y¡ , , en lugar del valor aproximado (la tercera columna), como se hizo en el método ele Euler. Como se esperaba, el error de truncamiento local absoluto promedio (25%) es menor que el error global promedio (90%). La única razón que tendríamos puní hacer estos cálculos do error a&tetoi, en que conocemos el valor verdadero a priorl,

2.

Éito no podrí«aer ol caso en un problema real. En consecuencia, como lo nnalizaromoa dtapuói, usted debe aplicar con frecuencia técnicas tales como ol método de Euler usando varios tamaños de paso diferentes para obtener una estimación indirecta de los errores involucrados. Como se mencionó antes, en problemas reales con frecuencia tratamos con funciones que son más complicadas que los polinomios simples. En consecuencia, las derivadas necesarias para evaluar la expansión de la serie de Taylor podrían no siempre ser fáciles de obtener.

Aunque estas limitaciones impiden el análisis de error exacto para la mayoría de los problemas prácticos, la serie de Taylor proporciona todavía un conocimiento valioso en el comportamiento del método de Euler. De acuerdo con la ecuación (25.9), vemos que el error local es proporcional al cuadrado del tamaño de paso y a la primera derivada de la ecuación diferencial. Se puede también demostrar que el error de truncamiento global es 0(h); es decir, es proporcional al tamaño de paso (Carnahan y cois., 1969). Estas observaciones nos llevan a las siguientes conclusiones útiles: 1. 2. Se puede reducir el error al disminuir el tamaño de paso. El método proporcionará predicciones libres de error si la función en turno (es decir, la solución de la ecuación diferencial) es lineal, debido a que para una línea recta, la segunda derivada podría ser cero.

Esta última conclusión tiene sentido intuitivo, ya que el método de Euler usa segmento» de línea recta para aproximar la solución. De ahí que se haga referencia al método de Euler como uno de primer orden. Debería también observarse que este patrón general se cumple para métodos do orden superior de un paso, que se describen en las siguientes páginas. Es decir, un método de M -ésimo orden dará resultados perfectos si la solución en turno es un polinomio de n-ésimo orden. Además, el error de truncamiento local será 0(h" ) y el error global 0(h").
+1

EJEMPLO 2 5 . 3

Efecto del tamaño de paso reducido sobre el método de Euler

Enunciadodel problema. ño de paso de 0.25.

Repita el cálculo del ejemplo 25.1, pero ahora use un tama-

\ i í j i j |

Solución. El cálculo se repite, y los resultados se compilan en la figura 25.4a. Al volver el tamaño de paso a la mitad se reduce el valor absoluto del error global promedio al 4 0 % y el valor absoluto del error local al 6.4%. Esto es equiparable a los errores global y local del ejemplo 25.1 de 90% y 24.8%. Así, como se esperaba, el error local disminuye a un cuarto y el error global a la mitad. Observe también cómo el error local cambia de signo para valores intermedios a lo largo del rango. Esto se debe principalmente a que la primera derivada de la ecuación diferencial es una parábola que cambia de signo [recuerde la ecuación (E25.2.2) y vea la figura 25.46]. Como el error local es proporcional a esta función, el efecto neto de la oscilación en el signo es para mantener el error global de un crecimiento continuo en tanto so ejecuta ol cálculo. Así, desde x = 0 hasta x — 1.25, todos los errores locales son negativo» y, en consecuencia, el error global aumenta sobre este intervalo. En la sección

722

M É T O D O S DE

RUNGE-KUTTA

«J'i< " ¡

1

. . ' .:"

:

iv i "i.! •

\
¡
j J \

FIGURA 25.4
a)
C O M P A R A C I Ó N D E D O S S O L U C I O N E S N U M É R I C A S C O N EL M É T O D O D E EULER M E D I A N T E EL U S O D E Y 0 . 2 5 . TAMAÑOS D E PASO D E 0 . 5

b)

C O M P A R A C I Ó N D E L ERROR D E T R U N C A M I E N T O LOCAL

VERDADERO

Y E S T I M A D O P A R A EL C A S O D O N D E EL T A M A Ñ O D E P A S O E S 0 . 5 . SE BASA E N LA E C U A C I Ó N (E25.2.5).

O B S E R V E Q U E EL ERROR " E S T I M A D O "

j
\
!

i j

intermedia del rango, los errores locales positivos comienzan a reducir el error global. Cerca del extremo, se invierte el proceso y de nuevo aumenta el error global. Si el error local cambia en forma continua el signo sobre el intervalo de cálculo, el efecto neto será con frecuencia reducir el error global. Sin embargo, donde los errores locales son del mismo signo, la solución numérica puede divergir cada vez más de la solución verdadera en tanto se ejecuta el cálculo. Tales resultados se conocen como inestables. El efecto de reducciones adicionales en el tamaño de paso sobre el error de truncamiento global del método de Euler se ilustra en la figura 25.5. Esta gráfica muestra cl errar relativo porcentual en x • 5 tono UM función del tamaño de paso para el problo-

5

, Pieos . , 50 ,. 500

5 000

1

0.1

0.01

0.001

Tamaño de paso

FIGURA 2 5 . 5
Efecto del tamaño de paso sobre el error de truncamiento global del método de Euler paia la integral de y' = -2x + 1 2X - 20x + 8.5. La gráfica muestra el error global relativo porcentual absoluto en x = 5 como una función del tamaño de paso.
3 2

ma que estamos examinando en los ejemplos 25.1 al 25.3. Observe que aun cuando h so reduzca a 0.001, el error todavía excede 0.1 %. Como este tamaño de paso corresponde a 5 000 pasos para ejecutar desde x = 0 hasta x — 5, la gráfica sugiere una técnica do primer orden como el método de Euler que demanda gran esfuerzo computacional para obtener otros niveles de error aceptables. Más adelante en este capítulo, presentamos técnicas de orden superior que dan mucha mayor exactitud con el mismo esfuerzo computacional. Sin embargo, debería observarse que, a pesar de su ineficiencia, la simplicidad del método de Euler lo hace una opción extremadamente atractiva para muchos problemas de ingeniería. Ya que es muy fácil de programar, la técnica es en particular útil para análisis rápidos. En la próxima sección se desarrolla un algoritmo de cómputo para el método de Euler. 25.1.2 A l g o r i t m o p a r a el método de Euler

Los algoritmos para las técnicas de un paso como el método de Euler, son en extremo simples de programar. Como se especificó en el inicio de este capítulo, todos los métodos de un paso tienen la forma general Nuevo valor = viejo valor + pendiente x tamaño de peso La única forma en la que difieren los métodos es en el cálculo de la pendiente. (25.10)

M É T O D O SD E RUNGE-KUTTA
Suponga que usted quiere realizar el cálculo simple expuesto en la tabla 25.1. Esto es, a usted le gustaría usar el método de Euler para integrar / = -2x + \2x - 20x + 8.5, con la condición inicial de que y = 1 enx = 0. A usted le gustaría integrarla hasta x = 4 usando un tamaño de paso de 0.5, y que desplegara todos los resultados. Un pseudocódigo simple para realizar lo anterior podría ser como el que está escrito en la figura 25.6. Aunque este programa "hará el trabajo" de duplicar los resultados de la tabla 25.1, no está muy bien diseñado. Primero, y el más importante, no es muy modular. Aunque esto no es muy importante para un programa así de pequeño, podría ser crítico si deseamos modificar y mejorar el algoritmo. Además, existen varios factores relacionados con la forma en que establecemos las iteraciones. Por ejemplo, suponga que el tamaño de paso se habrá de volver muy pequeño para obtener mayor exactitud. En tales casos, debido a que cada valor calculado se despliega, el número de variables de salida podría ser muy grande. Además, el algoritmo está imposibilitado sobre la suposición de que el intervalo de cálculo es uniformemente divisible entre el tamaño de paso. Por último, la acumulación de x en la línea x = x + dx puede estar sujeta a cuantización de errores de la clase analizada en la sección 3.4.1. Por ejemplo, si dx fuera cambiada a 0.01 y se usara la representación estándar IEEE de punto flotante (cerca de siete cifras significativas), el resultado al final del cálculo podría ser 3.999997 en lugar de 4. ¡Para dx = 0.001, podría ser 3.999892!
2 2

FIGURA

25.6

Pseudocódigo paro una versión "muda" del método de Euler.

'set ¡ntegratíon range x¡ = O xf = 4 'initialize variables

y =i

X = XÍ
'eet step eize and determine 'number of calculation steps dx. = 0.5 nc (xf-xi)/dx 'output initial condition PRINT x, y 'loop to impiement Euler's method 'and dieplay reeulte DO i =1,nc dydx = -2X + 12X - 20x + 3.5 y = y + dydx • dx x = x + dx PRINT x, y END OQ .
3 2

1. Esto 20x + hasta x os. Un o en la IA 25. 1 , ^.unque deseamos las pequeilado se joritmo temente x + dx 4 .1. Por le punto >dría ser

• I • • • I H H • fl I H H • • fl S fl H

En la figura 25,7 NO despliega un algoritmo mucho más modular que evilu esas dificultades. 1(1 nluorilnio no da la salida A todos los valores calculados. En lugar do esto, el usuario especifica un intervalo de salida, xout, que indica el intervalo en el cual los resultados calculados se guardan en arreglos, xp y yp . Estos valores se guardan en arreglos de tal modo que se tenga salida en diferentes formas una vez que termine el cálculo (por ejemplo, impresión, gráficas, escritura en un archivo). El programa principal toma grandes tamaños de paso y llama A una rutina denominada Integrator que hace los tamaños de cálculo más pequeños. Observe que los ciclos controlan ambas salidas de paso, grandes y pequeños, en condiciones lógicas. Así, los intervalos no tienen que ser uniformemente divisibles entre los tamaños de paso, La rutina Integrator llama después A la rutina Euler que toma un solo tamaño de paso con el método de Euler. La rutina Euler llama A la rutina Derívate que calcula el valor de la derivada. Mientras que tal modularización podría parecer que sobrepasa al caso actual, facilitara en gran medida la modificación del programa en las últimas secciones. Por ejemplo, aunque el programa de la figura 25.7 está diseñado específicamente para implementar el método de Euler, el módulo de Euler es la única parte en que el método es específico, Así, todo lo que se requiere para aplicar este algoritmo con otros métodos de un paso es modificar esta rutina.
m m

FIGURA

25.7

Pseudocódigo para una versión modular "mejorada" del método de Euler.

Assign valúes for y = initial valué dependent variable xi = initial valué independent variable xf = final valué independent variable dx = caiculation step size xout = output interval

a) Programa principal o "manejado!*" b) Rutina para tomar un paso de salida
5U3 Integrator (x, y, h, xend) DO IF (xend - x < h) THEN h = xend - x CALL Euler (x, y, h, ynew) y = ynew IF (x > xend) EXIT END DO END SUB

x = xi
m=0

cj Método de Euler para una sola EDO
3U3 Euler (x, y, h, ynew) CALL Derivs(x, y, dydx) ynew = y + dydx * h x =x +h END S U B

DO xend = x + xout IF (xend > xf) THEN xend = xf h = dx CALL Integrator (x, y, h, xend) m = m+ 1 xp = x
m

d] Rutina para determinar la derivada
5U3 Derive (x, y, dydx) dydx = ... END SUB

ENP DO KF.5ULTS DISFLAY END
IF (x £ xf) EXIT

yp =y
m

726

MÉTODOS DE RUNGÉ-KUTTA

EJEMPLO 2 5 . 4

Rto iv l tindo a l
E D O con

computadora

Enunciado del problema. Se puede desarrollar un programa de cómputo a partir del pseudocódigo de la figura 25.7. Podemos usar este software para resolver otro problema asociado dv con la caída c del paracaidista. Usted recordará de la parte uno que nuestro mo— = g v (E25.4.1) delo matemático para la velocidad se basó en la segunda ley de Newton en la forma dt m Esta ecuación diferencial se resolvió tanto de manera analítica (ejemplo 1.1) como numérica con el método de Euler (ejemplo 1.2). Esas soluciones fueron para el caso en el g = 9.8, c = 12.5, m = 68.1 y v = 0 en t = 0. El objetivo del presente ejemplo es repetir esos cálculos numéricos mediante un modelo más complicado para la velocidad con base en una descripción matemática más completa de la fuerza de arrastre causada por la resistencia del viento. Este modelo lo proporciona dv dt = g v + a m
m4x

(E25.4.2)

donde g,myc son las mismas que en la ecuación (E25.4.1), y a, b y i» son constantes empíricas, las cuales para este caso son igual a 8.3, 2.2 y 46, respectivamente. Observe que este modelo tiene mayor capacidad para ajustar con exactitud mediciones empíricas de fuerzas de arrastre contra velocidad que el modelo lineal simple del ejemplo 1.1. Sin embargo, este aumento en la flexibilidad se gana a expensas de evaluar tres coeficientes en lugar de uno. Además, el modelo matemático resultante es más difícil de resolver en forma analítica. En este caso, el método de Euler proporciona una alternativa conveniente para obtener una solución numérica aproximada.

|

FIGURA

25.8

j j

Resultados gráficos para la solución de la EDO no lineal [véase ecuación (E25.4.2)]. Observe que la gráfica también muestra la solución para el modelo lineal [véase ecuación (E25.4.1)] para propósitos comparativos.

Lineal

No lineal

23.] MftftPCM EULER
Solución. Los resultados para ambos modelos, lineal y no lineal, se despliegan en la figura 2 5 H . con un tamaño de paso de integración de 0.1 s. La gráfica de esta figura muestra también un traslape de la solución del modelo lineal para propósitos de comparación. Los resultados de las dos simulaciones indican en qué medida el aumento de la complejidad de la formulación en la fuerza de arrastre afecta la velocidad del paracaidista. En este caso, la velocidad terminal disminuye debido a la resistencia causada por los términos de orden superior en la ecuación (E25.4.2). Podría probarse en forma similar modelos alternativos. La combinación de una solución generada con la computadora hace de esto una tarea fácil y eficiente. Tales beneficios deberían permitirle dedicar más tiempo para considerar alternativas creativas y aspectos holísticos del problema en lugar de los tediosos cálculos a mano.

25.1.3

Métodos p a r a la serie de T a y l o r de o r d e n s u p e r i o r

Una manera para reducir el error del método de Euler podría ser la inclusión de términos de orden superior en la expansión de la serie de Taylor para su solución. Por ejemplo, con la inclusión del término de segundo orden en la ecuación (25.6) se obtiene
f'(xi,yi) y¡+i = y, + f(xi,y¡)h +
J y 7

^

h

2

(25.11)

con un error de truncamiento local de 6 Aunque la incorporación de términos de orden superior es lo suficientemente simple para implementarse en los polinomios, su inclusión no es tan trivial cuando la EDO es más complicada. En particular, las EDO que son una función tanto de la variable dependiente como de la independiente, requieren diferenciación por la regla de la cadena. Por ejemplo, la primera derivada de f(x, y) es
df(x,y)
/ < * . * > = £ -

,
+

df(x,y)dy
- 1 7 - *

La segunda derivada es
d[df/dx + {df/dy)(dy/dx)] dx
t

d[df/dx

+ dy

(df/dy){dy/dx)]dy dx

f'Xxi.Vi) Las derivadas de orden superior se hacen mucho más complicadas.

En consecuencia, como se describe en las siguientes secciones, se han desarrollado métodos alternativos de un paso, Esos esquemas son comparables en desempeño con los procedimientos de la serio de Taylor de orden superior, pero requieren sólo del cálculo de las primeras derivadas.

728

MÉTODOS DE RUNGE-KUTTA

25.2

M E J O R A S DEL M É T O D O DE EULER Una fuente fundamental de error en el método de Euler es que la derivada al inicio del intervalo supuestamente se aplica a través de todo el intervalo. Se dispone de dos simples modificaciones para evitar este defecto. Como se demostrará en la sección 25.3, de hecho ambas modificaciones pertenecen a una clase mayor de técnicas de solución llamadas métodos de Runge-Kutta. Sin embargo, como éstos poseen una interpretación gráfica muy directa, los presentaremos primero para su derivación formal como métodos Runge-Kutta. 25.2.1 Método de H e u n

Un método para mejorar la estimación de la pendiente involucra la determinación de dos derivadas para el intervalo (una en el punto inicial y otra en el final). Las dos derivadas se promedian después con el fin de obtener una estimación mejorada de la pendiente para todo el intervalo. Este procedimiento, conocido como el método de Heun, se ilustra en forma gráfica en la figura 25.9.

FIGURA

25.9

Ilustración gráfica del método de Heun. o) Predictor y b) corrector.

zarRecuerdo que en el método PBL M É T O D O - P E B U E W de Euler, la pendiente al inicio de un intervalo
y¡ = f(x¡, y,) se usa para extrapolar linealmente a y ¡ .
+ l

mmm¡
+ f(xi,yi)h

(25.12)

y?+i=yi

(25.13) en el método de sino una predicO. La ecuación que permite el

Para el método estándar de Euler deberemos parar aquí. Sin embargo, Heun l a y ; calculada en la ecuación (25.13) no es la respuesta final, ción intermedia. Es por esto que la distinguimos con un superíndice (25.13) es llamada ecuaciónpredictor. Mejora una estimación de y cálculo de una estimación de la pendiente al final del intervalo:
+ 1 i+l

y'

¡+1

=f(x ,y? )
i+í +l

(25.14)

Así, las dos pendientes [véase ecuaciones (25.12) y (25.14)] pueden combinarse con el fin de obtener una pendiente promedio para el intervalo:
-,
y
=

y'¡ + y¡ i
+

=

/ f e , y , ) + /(x, ,y,Q )
+ 1 f l

2

2

Esta pendiente promedio se utiliza después para extrapolar linealmente desde y¡ hasta y usando el método de Euler:
¡+l

, / ( * ; , y , ) + /(*,+), y ° y ¿ + i = y; + 2

+ 1

),
h

la cual es conocida como ecuación corrector. El método de Heun es un procedimiento predictor-corrector. Todos los métodos multipaso que se analizarán más tarde en el capítulo 26 son de este tipo. El método de Heun es el único método predictor-corrector de un solo paso que se describe en este libro. Como se desarrolló antes, se puede expresar en forma concisa como Predictor (figura 25.9a): Corrector (figura 25.96): y° y = y, + f( y,)h ^ <+»'^+>
x

i+}

X¡>

(25.15) (25.16)

l+l

= y, + - "
f( X

y,)

+

) h

Observe que como la ecuación (25.16) t i e n e y en ambos lados del signo igual, se puede aplicar en una forma iterativa. Esto es, una estimación anterior podrá usarse de manera repetida para proporcionar una estimación mejorada d e y , ¡ . El proceso se ilustra en la figura 25.10. Debería entenderse que este proceso iterativo no necesariamente converge sobre la respuesta verdadera sino que lo hará sobre una estimada con un error de truncamiento finito, como se demostrará en el siguiente ejemplo. Como con los métodos iterativos similares analizados en secciones anteriores de este libro, un criterio de terminación para la convergencia del corrector está dado por [recuerde la ecuación (3.5)]
í+1 +

FIGURA 2 5 . 1 0 Representación gráfica de la iteración del corrector del método de Heun para obtener un estimado mejorado.

i y¿+i donde y{ ¡ y y{ mente.
+

j-i

yi
i+

100%

(25.17)

+x

resultan de la iiteración anterior y actual del corrector, respectiva-

EJEMPLO 2 5 . 5

Método de Heun

Enunciado del problema. Use el método de Heun para integrar y' = 4e — Q.5y desde x — 0 hasta x = 4 con un tamaño de paso de 1. La condición inicial en x — 0 es y = 2.
0M

Solución. Antes de resolver el problema de manera numérica, podemos usar cálculo para determinar la siguiente solución analítica ) + 2e - 0 . 5 A (E25.5.I)

y

1.3

v

Esta fórmula se usará para generar los valores de la solución verdadera en la tabla 25.2. Primero, la pendiente en (x , y ) se calcula como
0 0

y = 4e° - 0.5(2) = 3
0

Este resultado difiere mucho de la pendiente promedio actual para el intervalo de 0 a 1.0. la cual es igual a 4.1946, como se calculó de la ecuación diferencial con la ecuación (PT6.4).

T A B L A 35.3

Comparación de los valores verdadero y aproximado d« la Integral de y' m 4e - 0.5y, con la condición inicial de que y - 2 en x » 0. Loi valores aproximados se calcularon mediante el método de Heun con un tamaño de paso de 1. Se muestran dos casos que correspondan a números diferentes de iteraciones del corrector, ¡unto con el error relativo porcentual absoluto.
0Bx

Iteraciones del m é t o d o d e H e u n 1 15 (%) 0.00 8.18 9.94 10.46 10.62 y .
H

Xvtrdadaro
0 1 2 3 4 2.0000000 6.1946314 14.8439219 33.6771718 75.3389626

y .un
H

u n

i £ f i (%) 0 .00 2 .68 3 .09 3.17 3.18

2.0000000 6.7010819 16.3197819 37.1992489 83.3377674

2.0000000 6.3608655 15.3022367 34.7432761 77.7350962

La solución numérica se obtiene al usar el predictor [véase ecuación (25.15)] para obtener un estimado de y en 1.0:
y°i = 2 + 3(1) = 5

Observe que éste es el resultado que se podría obtener con el método estándar de Euler. El valor verdadero en la tabla 25.2 muestra que corresponde a un error relativo porcentual del 25.3%. Ahora, para mejorar el estimado para y usamos el valor y\ para predecir la pendiente al final del intervalo:
i + v y

\ = f( ,y°)
Xl

= 4e

o m )

- 0.5(5) = 6.402164

la cual puede combinarse con la pendiente inicial para obtener una pendiente promedio sobre el intervalo desde x — 0 hasta 1: 3 + 6.402164
y

2

que es más cercana a la pendiente promedio verdadera de 4.1946. Este resultado puede ser sustituido en el corrector [véase ecuación (25.16)] para dar la predicción en x = 1: yi = 2 + 4.701082(1) = 6.701082 la cual representa un error relativo porcentual de - 8 . 1 8 % . Así, el método de Heun sin iteración del corrector reduce el valor absoluto del error por un factor de 2.4 al compararlo con el método de Euler. Ahora dicho estimado podrá usarse para refinar o corregir la predicción de y, al sustituir el nuevo resultado en el lado derecho de la ecuación (25.16): [3 + 4<? y, = 2 + ±
a8<1)

-0.5(6.701082)1 — ^ 1 = 6.275811

732

MÉTODOS DE RUNGE-KUTTA

el cual representa un error relativo porcentual del 1.31 %. Este resultado, a su vez, puede sustituirse en la ecuación (25.16) para corregir aún más: [3 + 4 e y, = 2 + i
a 8 ( 1 )

-0.5(6.275811)1 ~ ^ 1 = 6.382129

que representa un |£,| de 3.03%. Observe cómo los errores algunas veces crecen en tanto se ejecutan las iteraciones. Tales incrementos pueden ocurrir en especial para grandes tamaños de paso, y nos previenen de dar la conclusión general de que con una iteración adicional se mejorará el resultado. Sin embargo, para tamaños de paso lo suficientemente pequeños, las iteraciones deberán converger eventualmente sobre un solo valor. Para nuestro caso, 6.360865, el cual representa un error relativo del 2.68%, se tiene después de 15 iteraciones. La tabla 25.2 muestra los resultados de los cálculos restantes mediante el uso del método con 1 y 15 iteraciones por paso.

En el ejemplo anterior, la derivada es una función de la variable dependiente y y de la variable independiente x. Para casos tales como los polinomios, donde la EDO es únicamente función de la variable independiente, el paso predictor [véase ecuación (25.26)] no es requerido y el corrector se aplica sólo una vez para cada iteración. Para esos casos, la técnica se expresa en forma concisa como y¡+\ = y¡ + ^
h

(25.18)

Observe la similitud entre el lado derecho de la ecuación (25.18) y la regla trapezoidal [véase ecuación (21.3)]. La conexión entre los dos métodos se puede demostrar formalmente al iniciar con la ecuación diferencial ordinaria d tí \

Tal ecuación podrá resolverse para y por integración: r

la cual da

y dx V .+ iI /"• /+l dy = J f(x)dx
/
y , + i - y , = jT'
+

(25.19)

mdx

(25.20)

y,-+i =y¡

mdx

(25.21)

Ahora, recuerde del capítulo 21 que In regla trapezoidal [véase ecuación (21.3)] se puede definir como

rmMTTODO

D EB U L Í H

M
(25.22) (25.23)

,/(\\d\

/ ( A , )

| - / ( . V / | | )

donde h = x,^, — x,- Al sustituir la ecuación (25.22) en la (25.21) se tiene
f(x,)
y ,-+i =

+ x

f(x )
i+{

3'/ H

"

la cual es equivalente a la ecuación (25.18). Como la ecuación (25.23) es una expresión directa de la regla trapezoidal, el error de truncamiento local está dado por [recuerde la ecuación (21.6)]
E, — h

'

12

(25.24)

donde § está entre x¡ y x . Así, el método es de segundo orden porque la segunda derivada de la EDO es cero cuando la solución verdadera es cuadrática. Además, los errores local y global son 0(h ) y 0(h ), respectivamente. Por tanto, al disminuir el tamaño de paso aumenta el error a una velocidad mayor que para el método de Euler. La figura 25.11, que muestra el resultado con el uso del método de Heun para resolver el polinomio del ejemplo 25.1, demuestra este comportamiento.
i+l 2 2

25.2.2

Método del p u n t o medio (o del polígono mejorado)

La figura 25.12 ilustra otra modificación simple del método de Euler. Conocido como método del punto medio (o del polígono mejorado o el modificado de Euler), esta técnica usa el método de Euler para predecir un valor de y en el punto medio del intervalo (véase la figura 25.12a):
y,-+i /2

=

>•/ +

/(A"Í,

y¡)-

(25.25)

Después, este valor predicho se usa para calcular una pendiente en el punto medio:
y;+i/2
= /fe+i/2,

y, + i / 2 )

(25.26)

el cual se toma para representar una aproximación válida de la pendiente promedio para todo el intervalo. Dicha pendiente es usada después para extrapolar linealmente desde x¡ hasta x¡ (véase figura 25.126):
+ {

(25.27) Observe que c o m o y no está en los dos lados, el corrector [véase ecuación (25.27)] no puede aplicarse de manera iterativa para mejorar la solución. Como en la sección anterior, esto procedimiento podrá también conectarse con las fórmulas de integración de Newton-Cotes. Recuerde de la tabla 21.4 que la fórmula más simple do integración abierta de Nowton-Cotos, la cual se denomina método de punto medio, ae puede representar como
i + 1

734

MÉTODOS DE RUNGE-KUTTA

FIGURA

25.12

Ilustración gráfica del método de punto medio. a) ecuación (25.25) y b) ecuación (25.27).

Pendiente = f ( x

ft1/2

, y,

+ 1/2

)

yf

Pendiente =

f(x,1/2. 1 2 /)
+

mSm
\ )</> = (b ÍV)/(.\ i)

donde x, es el punto medio del intervalo (a, b). Con el uso de la nomenclatura para el caso actual, podrá expresarse como

La sustitución de esta fórmula en la ecuación (25.21) da la ecuación (25.27). De esta manera, así como el método de Heun puede ser conocido como la regla trapezoidal, el método de punto medio obtiene su nombre de la fórmula de integración en turno sobre la cual se basa. El método de punto medio es superior al método de Euler debido a que utiliza una estimación de la pendiente en el punto medio del intervalo de predicción. Recuerde de nuestra diferenciación numérica en la sección 4.1.3 que las diferencias divididas finitas centradas son mejores aproximaciones de las derivadas que cualquiera de las versiones hacia adelante o hacia atrás. En este contexto, una aproximación centrada, como la de la ecuación (25.26) tiene un error de truncamiento local de 0(h ) en comparación con la aproximación hacia adelante del método de Euler, el cual tiene un error de 0(h). En consecuencia, los errores local y global del método de punto medio son 0(h ) y 0(A ), respectivamente.
2 3 2

25.2.3

A l g o r i t m o s de cómputo p a r a los métodos de H e u n y de punto medio

Ambos métodos, el de Heun con un solo corrector y el de punto medio, se pueden programar fácilmente con la estructura general mostrada en la figura 25.7. Como en I UN figuras 25.13a y 25.13Z>, se puede escribir rutinas simples que tomen el lugar de la rutina de Euler en la figura 25.7. Sin embargo, cuando se va a implementar la versión iterativa del método de Heun, se requiere de algunas modificaciones (aunque estén localizadas dentro de un simple módulo). Desarrollamos el pseudocódigo para este propósito en la figura 25.13c. Este algoritmo se puede combinar con la figura 25.7 con el fin de desarrollar el software para el método iterativo de Heun.

25.2.4

Resumen

Al componer el método de Euler desarrollamos dos nuevas técnicas de segundo orden. Aun cuando esas versiones requieren más esfuerzo computacional para determinar In pendiente, la reducción que se tiene en el error nos permite concluir en una sección subsecuente (véase sección 25.3.4) que usualmente la exactitud mejorada vale el esfuerzo. Aunque existen ciertos casos donde técnicas fácilmente programables, como el método de Euler, pueden aplicarse con ventaja, los métodos de Heun y de punto medio son por lo goncrul superiores y se deberían implementar si se es consistente con los objetivos del problema.

736

MÉTODOS DE RUNGE-KUTTA

a)

Htun

LIMPIA

sin corrector

c) Heun con corrector
SU /3 Heunlter

(x, Y, h, YRI<SIV)

CALL Derive dyldx) 5U3 Heun (x, y,(x, h, y, ynew) ye = y + dyldx • h CALL Derivs(x + h, ye, dyZdx) 5hpe = (dyldx + dyZdx)/2 ynew = Y + Slope • h x =x +h END 5U3

es = 0.01 maxlt = 20 CALL Der\vs(x, y, dyldx) ye=y + dyldx • h iter = O DO yeold = ye CALL Der¡vs(x + H, ye, dyZdx) slope = (dyldx + dyZdx)/2 ye = Y + slope • h iter = iter + 1

b) Método del punto medio
CALL Der\vs(x, dydx) SU£? Midpoint (x, y, Y, h, ynew) ym = y + dydx • h/Z CALL Derivs (x + h/Z, ym, dymdx) ynew = y + dymdx • h x =x+h END 5U3

IF (ea < es OK iter > maxit) EXIT END DO ynew = ye

x=x + h
END 5U3
F I G U R A 7.5.13 Pseudocódigo para implementar los métodos a) Heun simple, b) punto medio y c) Heun iterativo.

Como se hace notar al inicio de esta sección, el método de Heun (sin iteraciones) y el de punto medio y, de hecho, la misma técnica de Euler son versiones de una clase nú» amplia de procedimiento de un paso denominados métodos de Runge-Kutta. Ahora V P remos el desarrollo formal de esas técnicas.

2 5 . 3

M É T O D O S D I RUNGE-KUTTA

Los métodos de Runge-Kutta (RK) logran la exactitud del procedimiento de una serie úl Taylor sin requerir el cálculo de derivadas superiores. Existen muchas variaciones, peni todas se pueden denotar en la forma generalizada de la ecuación (25.1): y¡+\ = y¡ +<Ptx¡,y¡,h)h
(25JH)

donde <j> (x¡, y¡, h) es conocida como función incremento, la cual puede inteipieltwií como una pendiente representativa sobre el intervalo. La función incremento .se m t l h l por lo general como

(¡¡ t= +U2k¡ + • • • a k
£

(23,

/,A-|

I

n

n

clónelo Un ti «on corialanles y In* k son *i ~ . / b i . ,v )
(

(25.29o) (25.29/)) q k h)
22 2

A'2 = ,/'(.v, I p\h, y¡ I

tfí\k\h)

k-i = /(-V/ + /?2¿, y/ +qi\k\h+

(25.29c)

= f(xr+

Pn-ih,y¡

+ q„-\,\k\h

+ q_ kh
n h2 2

H

h q„-\, -\k„-\h)
n

(25.29<¿)

Observe que las £ son relaciones de recurrencia. Esto es, k¡ aparece en la ecuación para k , la cual aparece en la ecuación para k , etcétera. Como cada k es una evaluación funcional, esta recurrencia hace que los métodos RK sean eficientes para cálculos en computadora. Es posible concebir varios tipos de métodos Runge-Kutta al emplear diferentes números de términos en la función incremento como la especificada por n. Observe que el método Runge-Kutta (RK) de primer orden con n — 1 es, de hecho, el método de Euler, Una vez que se elige n, se evalúan las a, p y q al igualar la ecuación (25.28) a los términos en la serie de expansión de Taylor (véase cuadro 25.1). Así, al menos para las versiones de orden inferior, el número de términos n con frecuencia representa el orden de la aproximación. Por ejemplo, en la siguiente sección, los métodos RK de segundo orden usan la función incremento con dos términos (n = 2). Esos métodos de segundo orden serán exactos si la solución de la ecuación diferencial es cuadrática. Además, como I QS términos con h y mayores son eliminados durante la derivación, el error do truncamiento local es 0(h}) y el global es 0(h ). En secciones subsecuentes desarrollaremos métodos RK de tercer y cuarto orden (n = 3 y 4). Para esos casos, los errores do truncamiento global son 0(h ) y 0(h ), respectivamente.
2 3 3 2 3 A

25.3.1

M é t o d o s R u n g e - K u t t a d e segundo o r d e n

La versión de segundo orden de la ecuación (25.28) es y¡+i = y¡ + (a\k\ + a k )h
2 2

(25.30)

donde ki = f(x¡,y¡) k = f(x, + pih, y, +q k\h)
2 u 2

(25.30a) (25.30/))

Como se describe en el cuadro 25.1, los valores para a,, a ,P\ y <?n son evaluados al igualur el término de segundo orden do la ecuación (25.30) con la expansión de la serie do Taylor. Para realizar esto, desarrollamos lies ecuaciones para evaluar las cuatro consuntos doMuonocidus. Las tres C C U U C Í O I I O N son

«l f

iit -

(25,31) I

738

M É T O D O S D i RUNGE-KUTTA
(25.32)

(25.33)

Cuadro 2 5 . 1 Lu versión a segundo orden de la ecuación (25.28) es

D e d u c c ó in d eo ls m é o td o sR u n g e K u a t d es e g u n d oo r d e n
(B25.1.1) Si se aplica este método para expandir la ecuación (B25.1.3) w tiene
f(x¡ + p\h, y¡ + quhh)

y¡\ \ = y, + (a k +a k )h
l 1 2 2

donde y/)
y

c

>

('''

= f(x¡, y¡) + p\h —

(B25.1.2)

+á k\h—
u

9 / dx

dy

+ (Hlf)

ki = ñx¡+pih,yi+qukih)

(B25.1.3)

Este resultado podrá sustituirse junto con la ecuación (B25.1.2) en la (B25.1.1) para dar
y
i+l

Al usar la ecuación (B25.1.1) debemos determinar los valores para las constantes a ,a ,p y q - Para ello, recordamos que la serie de Taylor de segundo orden para>> en términos de y, y /(*/• y) escrita como [véase ecuación (25.11)]
l 2 i it ¡+1 e s t a

= y¡ + aihf(x

b

y¡) + a hf(x¡, y,-) + a p\h
2 2

+dx
y¡)^- + r ><//')

+a qnh f(Xi,
2 2

yi+i - y¡ + /fe y¡)h +

donde / ' f e , y¡) debe determinarse por diferenciación usando la regla de la cadena (véase sección 25.1.3): (B25.1.5)
, 9/Uy) ,

/'fe, , 2
y ¡)
df(x,y)dy

dy

(B25.1.4)

o, al agrupar términos,

y¡+\ = y¡ + [«i/fe, y¡) + a f(x¡, y¡)]h
2

+ a. p\—
2

b( b e t3 /b 3 ,9/" +a2 ?n/te,y,) 9 x 9 y_
2

— /i + 0(fc )
3

(«25.1,7)

Si sustituimos ecuación en la ecuación (B25.1.4) se i (x¡, y,) =la— +(B25.1.5) — -r tiene dx dy dx y, =v + / U , y ^ + ( - + - - j 2 7
/ ¡

Ahora, si comparamos términos comunes en las ecuación»» (B25.1.6) y (B25.1.7), determinamos que para hacer equivalen tes a las dos ecuaciones, se debe cumplir lo siguiente:

(B25.1.6)

+ 1

La estrategia básica que habrá de resaltarse en los métodos RungeKutta es el uso de manipulaciones algebraicas para resolver los valores de a¡, a , p¡ y q , lo cual provoca que las ecuaciones (B25.1.1) y (B25.1.6) sean equivalentes. Para ello, primero usamos una serie de Taylor para expandir la ecuación (B25.1.3). La serie de Taylor para una función de dos variables se define como [recuerde la ecuación (4.26)]
2 u

b b ?, = j aiqu
ai + a = 1
2

1 <>iP2 = ^

1

K(x + r, y + . v ) = x(x, y) + r—

9 # 9 #
+x

r o iH , —H

Las anteriores tres ecuaciones simultáneas contienen las cuitlfU constantes desconocidas. Como hay una incógnitu más quo el número de ecuaciones, no existe un conjunto único do cnnulimtes que satisfagan las ecuaciones. Sin embargo, al suponer u n valor para una de las constantes, podemos determinar las nlrui F,n consecuencia, existe una familia de métodos do sc|tumla orden min quo una sola versión.

2 3 , 3 M IW W P B RUNGE-KUTTA
2

i:!

<Jüi i ,v

Como tenoinos tres ecuaciones con cuatro incógnitas, debemos suponer el valor de una de estas incógnitas para determinar las otras tres. Suponga que especificamos un valor para a . Entonces se puede resolver de manera simultánea las ecuaciones (25.31) a (25.33) para obtener ai = 1 - a
2

(25.34) 1

Pl=qn =

2V

2
2

(25.35)

Debido a que podemos elegir un número infinito de valores para a , hay un número interminable de métodos RK de segundo orden. Cada versión podría dar exactamente los mismos resultados si la solución de la EDO fuera cuadrática, lineal o una constante. Sin embargo, se obtienen diferentes resultados cuando (como es típicamente el caso) la solución es más complicada. A continuación presentamos tres de las versiones más comúnmente usadas y preferidas: Método d e Heun con un solo corrector ( o = 1 / 2 ) . Si suponemos que a es 1/2, las ecuaciones (25.34) y (25.35) podrán resolverse para a¡ = 1/2 y p = q = 1. Estos parámetros, al ser sustituidos en la ecuación (25.30), dan
2 2 { n

y i=y
í+

i

+ (^k

l

+ \ h ^

(25.36)

donde *i = /(*¿, y,0 k = f(x¡ + h, y¡ + k h)
2 x x 2

(25.36a) (25.366)

Observe que k es la pendiente al inicio del intervalo y k es la del final. En consecuencia, este método Runge-Kutta de segundo orden es de hecho la técnica de Heun sin iteración. El método d e punto medio ( a = 1 ) . Si suponemos que a es 1, entonces a, = 0, p = q — 1/2, y la ecuación (25.30) es ahora
2 2 x n

y. donde

+

1

=y.

+ kh
2

(25.37)

*i = / ( * i , y/)

(25.37a)

*2 = f(x¡

+ -h,y¡ +
l

X

-k^

(25.376)

É l t t M el método del punto medio.

MÉTODOS DE RUNGE-KUTTA
v

_

Mfttodo Rulitori ( a 2 / 3 ) . Ralston (1962) y Ralston y Rubinowilz (1978) dolorminuron que al seleccionar a ~ 2/3 se obtiene un límite mínimo sobre el error de Irun camionto para los algoritmos de R K de segundo orden. Para esla versión, ti 1/3 y
2 t

Pi=V\i=

3

/

4

:

donde k\=f{x¡,y¡) (25.38«)

ki = f(x¡

+ \h, y,- + \hh^

(25.386)

Comparación de varios e s q u e m a s RK d e segundo orden

Enunciado del problema. Use el método de punto medio [véase ecuación (25.37)| y el método de Ralston [véase ecuación (25.38)] para integrar numéricamente la ecuación (PT7.13):
f(.x, y) = - 2 J T -f 12x
2

-

20JC +

8.5

desde x = 0 hasta x = 4 usando un tamaño de paso de 0.5. La condición inicial en .v 0 es y = 1. Compare los resultados con los valores obtenidos con otro algoritmo RK de segundo orden: el método de Heun sin corrector de iteración (tabla 25.3). Solución. El primer paso en el método de punto medio es el uso de la ecuación (25.3 la) para calcular ki = - 2 ( 0 ) + 12(0) - 20(0) + 8.5 = 8.5
3 2

Sin embargo, como la EDO es una función sólo de x, tal resultado carece de relevanri» sobre el segundo paso [el uso de la ecuación (25.376)] para calcular k = - 2 ( 0 . 2 5 ) + 12(0.25) - 20(0.25) 4- 8.5 = 4.21875
3 2 2

Observe que tal estimación de la pendiente es mucho más cercana al valor promedio para el intervalo (4.4375) que la pendiente al inicio del intervalo (8.5) que podría habar sido usada por el procedimiento de Euler. La pendiente en el punto medio puede entonces sustituirse en la ecuación (25.37) para predecir
v

(0.5) = 1 + 4.21875(0.5) - 3. 109375

K , = 3.4%

£1 calculo le repite, y los r e t u l t a d p i M m u m e n en la figura 25.14 y tublu 25.3,

FIGURA

25.14

Comparación de la solución verdadera con soluciones numéricas usando tres métodos RK de segundo orden y el método de Euler.

Por medio del método de Ralston, k para el primer intervalo es también igual a 8.5 y [véase ecuación (25.386)]
x

k = - 2 ( 0 . 3 7 5 ) + 12(0.375) - 20(0.375) + 8.5 = 2.58203125
3 2

2

T A B L A 2 5 . 3 Comparación de los valores verdadero y aproximado de la integral da y' = - 2 X + 12X - 20x + 8.5, con la condición inicial de que y - 1 en x = 0. Los valores aproximados se calcularon por medio de tres versiones de los métodos RK de segundo orden con un tamaño de paso de 0.5.
3 2

Heun
X

Punto medio
(%)

RK Ralston de s e g u n d o o r d e n
(%)

Xverdadero 1.00000 3.21875 3.00000 2.21875 2.00000 2.71875 4 ,00000 4 ,71875 3 00000

y

l£,l

y

l£,l

y

| ,l
£

(%)

0.0 0.5 1.0 1.5 2.0 2,5 3.0 3,5 4.0

1 .00000 3.43750 3.37500 2.68750 2.50000 3.18750 4.37500 4,93750 3 .00000

0 6.8 12.5 21.1 25,0 17.2 9.4 4,6 0

1.00000 3.109375 2.81250 1.984375 1,75 2,484375 3.81250 4 .609375 3

0 3.4 ó.3 10.6 12.5 8.6 4 ,7 2.3 0

1.00000 3.277344 3.101563 2.347656 2.140625 2.855469 4.117188 4 ,800781 3.031250

0 1.8 3.4 5.8 7.0 5,0 2.9 1,7 10

MÉTODOS DE RUNGE-KUTTA

La pendiente promedio se calcula por </, = 1 (8.5) + ^(2.58203125) = 4.5546875 la cual se usará para predecir y (0.5) = 1 + 4.5546875(0.5) = 3.27734375 s, = - 1 . 8 2 %

Los cálculos se repiten y los resultados se resumen en la figura 25.14 y tabla 25.3. Observe que todos los métodos RK de segundo orden son superiores al método de Euler.

25.3.2

M é t o d o s de R u n g e - K u t t a de tercer o r d e n

Para n = 3, se puede hacer un desarrollo similar al del método de segundo orden. El resultado de dicho desarrollo es de seis ecuaciones con ocho incógnitas. Por tanto, se debe especificar con antelación los valores para las dos incógnitas con el fin de establecer los parámetros restantes. Una versión común que resulta es

y

t+

i=y¡

+ -7 ( i +
k

4

k

2

+

*3>*

(

2

5

-

3

9

)

donde k =f(x ,y )
x l i

(25.39a) + -h, y¡ +
l l

k = f(x¡
2

-k h^
x

(25.3%) (25.39c)

k = f(x¡ + h, y¡ - kih + 2k h)
3 2

Observe que si la derivada es sólo una función de x, este método de tercer orden se reduce a la regla de Simpson 1/3. Ralston (1962) y Ralston y Rabinowitz (1978) desarrollaron una versión alternativa que proporciona un límite mínimo sobre el error de truncamiento. En cualquier caso, los métodos RK de tercer orden tienen errores local y global de 0(h ) y 0(h ), respectivamente, y dan resultados exactos cuando la solución es unn cúbica. Al tratarse de polinomios, la ecuación (25.39) será también exacta cuando ln ecuación diferencial es cúbica y la solución es de cuarto orden. Ello se debe a que lu regla de Simpson 1/3 proporciona estimaciones exactas de la integral para cúbicas (recuerde el cuadro 21.3).
4 3

25.3.3

M é t o d o s R u n g e - K u t t a de cuarto o r d e n

El más popular de los métodos RK es el de cuarto orden. Como hicimos notar con lo* procedimientos de segundo orden, hay un número infinito de versiones. La siguiente, <sn la forma de uso más común y, por tunlo, 8 0 le conoce como método RK clásico de cuarto

25 J FFLFPGI D E RUNGE-KUTTA
y
t + 1 2 3

>HI

R ><- i
4

*-/:iortM

- >/, + — (*, + 2 ¿ + 2k + k )h

(25 .40)

donde
*i = / ( * , - . (25.40a)

*2 = /(•*/ + ¿ A , yi + ^ i * )

(25 .406)

¿3 =

+ \h, y¡ + ^hhj

'

(25.40c)

h = f (XÍ + h,y¡ + kih)

(25.40a)

Observe que para las EDO que sólo son función de x, el método RK clásico de cuarto orden es similar a la regla de Simpson 1/3. Además, el método RK.de cuarto orden tiene similitud con el procedimiento de Heun en cuanto a que las estimacionei múltiples de la pendiente son desarrolladas para alcanzar una pendiente promedio mejorada para el intervalo. Como se muestra en la figura 25.15, cada una de las & representa una pendiente. La ecuación (25.40) entonces representa un promedio ponderado de éstas para llegar a la pendiente mejorada.

FIGURA 25.15
Ilustración gráfica de las pendientes estimadas, entre la que se cuenta el método RK de cuarto orden.

744
EJEMPLO 2 5 . 7

M T t O D O S
i ¡ í

DE

RUNGE-KUTTA

Método RK clásico de cuarto orden

Enunciado del problema. (25.40)] para integrar a) f(x,y) = -2x
3 2

Use el método RK clásico de cuarto orden [véase ecuación

+ l2x -20x

+ 8.5

mediante un tamaño de paso de h = 0.5 y una condición inicial de y = 1 en x = 0; y b) f(x,y) =4e *
0S

-0.5y

usando h = 0.5 con v(0) = 2 desde x = 0 hasta 0.5.
] Solución.

a)

Se usa desde la ecuación (25.40a) hasta la (25.40úT) para calcular k = 8.5, k = 4.21875, k — 4.21875 y £ = 1.25; las cuales se sustituyen en la ecuación (25.40) para obtener
x 2 3 4

y(0.5) = 1 + j^[8.5 + 2 ( 4 . 2 1 8 7 5 ) + 2(4.21875)+ 1.25] J 0.5 \

í

la cual es exacta. Así, como la solución verdadera es de cuarto orden [véase ecuación (PT7.16)], el método de cuarto orden da un resultado exacto. b) Para este caso, la pendiente al inicio del intervalo se calcula como ¿i = / ( 0 , 2) = 4 e ° '
8(0)

=3.21875

- 0.5(2) = 3

Este valor se usa para calcular un valor de y y una pendiente en el punto medio, y(0.25) =2 + 3(0.25) = 2.75 k = /(0.25, 2.75) = 4 e ° 2 8 ( a 2 5 )

- 0.5(2.75) = 3.510611

Esta pendiente a su vez se utiliza para calcular otro valor de y y otra pendiente en el punto medio, i | y(0.25) = 2 + 3.510611(0.25) = 2 . 8 7 7 6 5 3 k = JX0.25, 2.877653) = 4 e
3 o m 2 5 )

i
1 | |

- 0.5(2.877653) = 3.446785

l
|

Después, esta pendiente se usará para calcular un valor de y y una pendiente al final del intervalo, y(0.5) = 2 + 3.071785(0.5) = 3.723392 h = /(0.5, 3.723392) = 4 e
a 8 ( 0

-

5 )

- 0.5(3.723392) = 4.105603

Por último, las cuatro estimaciones de la pendiente se combinan para obtener unu pendiente promedio. Esta última es entonces usada para realizar la predicción coneluyente al final del intervalo. , ,

25.3

M É T O D O S DE RUNGE-KUTTA

741

$ = - h + 2(3.510611) + 2(3.446785) + 4.105603] = 3.503399 6
L

y(0.5) = 2 + 3.503399(0.5) = 3.751669 la cual se compara de manera favorable con la solución verdadera de 3.751521.

25.3.4

Métodos de Runge-Kutta de orden s u p e r i o r

Donde se requiere resultados más exactos, es recomendable el método de Butcher (1964) y el método RK de quinto orden: . + -L (7^ + 32 *3 + 12Á: + 32k + 7k )h
4 5 6

y ¡ +

l

=

y

(25.41)

donde *i = / ( * / . }7) (25.41a)

4 k = / ( x¡ + -h, y¡ + \kih)
2

(25.416)

h = f(x¡ + -h, y¡ + ^ h + ^k h )
X 2

(25.41c)

h = f(xi

+ -h, y¡ - -k h + hh )
l X 2

(25 Aid)

* s = f(x¡

+ ífi, y¡ + ^k,h 3

+ 2
2

y U f c )
4

(25.41e) 12
4

x¡ + h, y¡ - -k\h + -k h + -jk h - —k h + -k h\ (25.41/) Observe la similitud entre el método de Butcher y la regla de Boole en la tabla 21.2. Están disponibles las fórmulas RK de orden superior como el método de Butcher, pero en general, la ganancia en exactitud para métodos mayores de cuarto orden está afectada por el esfuerzo computacional y complejidad adicional.
3 5

(

12

8

\

Comparación de los métodos de Runge-Kutta

Enunciado del problema. para resolver f(x,y) =4e
0Hx

Use los métodos RK desde el primero hasta el quinto orden

-0.5y

746

MÉTODOS DE RUNGE-KUTTA

oon^(0) <• 2 desde x = 0 hasta x = 4 con varios tamaños de paso. Compare la exactitud de los diferentes métodos con el resultado en x — 4 con base en la respuesta exacta y(4) = 75.33896. Solución. Se realiza el cálculo mediante los métodos de Euler, el no iterativo de Heun, el RK de tercer orden [véase ecuación (25.39)], el RK clásico de cuarto orden y el RK de Butcher de quinto orden. Los resultados se presentan en la figura 25.16, donde graf icamos el valor absoluto del error relativo porcentual contra el esfuerzo computacional. Esta última cantidad es equivalente al número requerida de evaluaciones de la función para obtener el resultado, como en Esfuerzo = n b-a (E25.8.1)

donde «y = número de evaluaciones de la función involucradas en particular en el cálculo RK. Para órdenes < 4, «yes igual al orden del método; sin embargo, observe que la técnica de Butcher de quinto orden requiere seis evaluaciones de la función [véase ecuaciones (25.41a) a la (25.41/)]. La cantidad (b — á)lh es la integración total del intervalo dividida entre el tamaño de paso (es decir, es el número de aplicaciones de la

FIGURA

25.16

; Comparación del error relativo porcentual contra el esfuerzo computacional para los • ; métodos RK desde el primero hasta el quinto orden.

2G,Í

I H W O S D E R U N O B - K U T T A

- H

«

«

J

j j | I í ) s

técnieu HK puní obtener resultado). Asi, como las evaluaciones de la función son con frecuencia pasos consumidores de tiempo, la ecuación (E25.8.1) proporciona una modida burda del tiempo de ejecución requerido para alcanzar la respuesta. La inspección de la figura 25.16 nos lleva a diferentes conclusiones: primero, los métodos de orden superior alcanzan mayor exactitud para el mismo esfuerzo computacional; segundo, la ganancia en exactitud con el esfuerzo adicional tiende a disminuir después de un punto. (Observe que las curvas primero caen con rapidez y después tienden a nivelarse.)

El ejemplo 25.9 y la figura 25.16 podrían llevarnos a la conclusión de que las técnicas RK de orden superior son siempre los métodos de preferencia. Sin embargo, otros factores tales como el costo de programación y los requerimientos de exactitud del problema deben ser considerados cuando se elija una técnica de solución. Tales elementos de juicio se explorarán con detalle en las aplicaciones de ingeniería en el capítulo 28 y en el epílogo de la parte siete.

25.3.5

A l g o r i t m o s de cómputo p a r a los métodos de R u n g e - K u t t a

Como con todos los métodos expuestos en este capítulo, las técnicas RK se ajustan muy bien al algoritmo general delineado en la figura 25.7. La figura 25.17 presenta el pseudocódigo para determinar la pendiente del método RK clásico de cuarto orden [véase ecuación (25.40)]. Las subrutinas que calculan las pendientes para todas las otras versiones se pueden programar fácilmente en forma similar.

FIGURA 25.17 Pseudocódigo para determinar un solo paso del método RK de cuarto orden.

SUB KK4 (x, y, b, ynew) CALL Perívs(x, y, k1) ym - y + kl • h/Z CALL Derívs(x + h/Z, ym, kZ) ym = y + kZ • h/Z CALL Derívs(x + h/Z, ym, k3) ye = y + k3 • h CALL Derívs(x + h, ye, k4) &\opc = (k1 + Z(kZ + k3) + k4)/6 ynew = y + elope • h x • x +h END

au»

MÉTODOS DE RUNGE-KUTTA
25.4 SISTEMAS DE ECUACIONES Muchos problemas prácticos de ingeniería y ciencia requieren la solución de un sistema de ecuaciones diferenciales ordinarias simultáneas más que una sola ecuación. Tales sistemas pueden representarse por lo general como dyi dx dyi dx

fi(x,y\,y ,
2

...,y„)

fi(x,

y i , y , . . . , y„)
2

dy„
d x

= / „ ( * , y,, y , . . . , ; y )
2 B

(

2

5

A

2

)

La solución de tal sistema requiere de que se conozcan las n condiciones iniciales en el valor inicial de x.
25.4.1 Método de Euler

Todos los métodos analizados en este capítulo para simples ecuaciones pueden extenderse al sistema que se mostró antes. Aplicaciones en la ingeniería pueden involucrar miles de ecuaciones simultáneas. En este caso, el procedimiento para resolver un sistema de ecuaciones simplemente involucra aplicar la técnica de un paso para cada ecuación en cada paso antes de proceder con el siguiente. Esto se ilustra mejor con el siguiente ejemplo para el método de Euler simple.
EJEMPLO 2 5 . 9

Resolución de sistemas de EDO mediante el método de Euler
Enunciado del problema. Resuelva el siguiente conjunto de ecuaciones diferenciales usando el método de Euler, suponiendo que x — 0, y = 4 y y — 6. Integre para x = 2 con un tamaño de paso de 0.5.
{ 2

— = -0.5yi dx Solución. (25.2):

— = 4-0.3y dx

2

- O.lví

'

Se implementa el método de Euler para cada variable como en la ecuación (;
v

yi (0.5) = 4 + [-0.5(4)]0.5 = 3 y (0.5) = 6 + [4 - 0.3(6) - 0.1 (4)J0.5 = 6.9
2

.

,

I

Observe que v,(0) = 4 se usa en lu segunda ecuación más que la V](0.5) — 3 calculiidu con U primera ecuación. Al PROOCFCRÁI manera similar se tiene

X

Yi 4 3 2.25 1.6875 1.265625 6 6.9 7.715 8.44525 9.094087

0 0.5 1.0 1.5 2.0

25.4.2

Métodos de R u n g e - K u t t a

Observe que cualquiera de los métodos RK de orden superior expuestos en este capítulo se pueden aplicar a sistemas de ecuaciones. Sin embargo, debe tenerse cuidado al determinar las pendientes. La figura 25.15 es útil para visualizar la forma adecuada de hacer esto para el método de cuarto orden. Es decir, desarrollamos primero las pendientes para todas las variables en el valor inicial. Esas pendientes (un conjunto de las k ) se usarán entonces para hacer predicciones de la variable dependiente en el punto medio del intervalo. Dichos valores de punto medio se utilizan, a su vez, para calcular un conjunto de pendientes en el punto medio (las k ). Esas nuevas pendientes se toman como punto de inicio para hacer otro conjunto de predicciones de punto medio que arriben a nuevas predicciones de pendiente en el punto medio (las k ). Éstas después se emplearán con el fin de hacer predicciones al final del intervalo y serán usadas para desarrollar pendientes al final del intervalo (las k ). Por último, las k se combinan en un conjunto de funciones incremento [como en la ecuación (25.40)] y son llevadas de nuevo al inicio para hacer la predicción final. El siguiente ejemplo ilustra el procedimiento.
{ 2 3 4

EJEMPLO 2 5 . 1 0

Resolución de sistemas de E D O mediante el método RK de cuario orden

Enunciado del problema. del ejemplo 25.9. Solución. ',
M

Use el método RK de cuarto orden para resolver las EDO

Primero, debemos resolver para todas las pendientes al inicio del intervalo:

* = / ( 0 , 4 . 6 ) = -0.5(4) = - 2 ¿,
2

= / ( 0 , 4, 6) = 4 - 0.3(6) - 0.1(4) = 1.8

donde k¡j es el /-ésimo valor de k para lay-ésima variable dependiente. Después, debemos calcular los primeros valores de y y y en el punto medio:
x 2

y, y + k.2

h

0.5 = 4 + ( - 2 ) — -3.5 0.5 = 6 + ( 1 . 8 ) — = 6.45

h

x 2

los cuales se usarán para calcular el primer conjunto de pendientes de punto medio, . *2 .i = ^(0.25,3.5,6.45) - •• 1.75 /o • =R /(0.25, 3.5, 6.45) 1.715

750

MÉTODOS DE RUNGE-KUTTA

Éstos se usan para determinar el segundo conjunto de predicciones de punto medio, I i j y, +k 2A

h h

0.5 = 4 + ( - 1 . 7 5 ) — = 3.5625 0.5 = 6 + ( 1 . 7 1 5 ) — = 6.42875

y + k,~
2 2 2

el cual será utilizado para calcular el segundo conjunto de pendientes de punto medio, ¿3.1 = /(0.25, 3.5625, 6.42875) = - 1 . 7 8 1 2 5 I • | ¡ I h.i = /(0.25, 3.5625, 6.42875) = 1.715125 Éstos se utilizarán para determinar las predicciones al final del intervalo y, +k \h
X

= 4 + (-1.78125X0.5) = 3.109375 = 6 + (1.715125)(0.5) = 6.857563

yi + k h
X2

los cuales serán usados para calcular las pendientes al final del intervalo,

I
| i I ; ; k
4A

= / ( 0 . 5 , 3.109375, 6.857563) = -1.554688

k .2 = /(0.5, 3.109375, 6.857563) = 1.631794 Los valores de k se pueden entonces usar para calcular [véase ecuación (25.40)]:
4

i¡ !

vi(0.5) = 4 + - [ - 2 + 2 ( - 1 . 7 5 - 1.78125) - 1.554688J0.5 = 3.115234
6

>' (0.5) = 6 + - [ 1 . 8 + 2(1.715 + 1.715125) + 1.631794J0.5 = 6.857670 6
2

Al proceder en forma similar para los pasos restantes, se obtiene

X
0 0.5 1.0 1.5 2.0

y i

Yi 6 6.857670 7.632106 8.326886 8.946865

4 3.115234 2.426171 1.889523 1.471577

25.4.3

A l g o r i t m o de cómputo p a r a r e s o l v e r s i s t e m a s de E D O

El código de cómputo para resolver una simple EDO con el método de Euler (vónso figura 25.7) puede fácilmente extenderse a sistemas de ecuaciones. Las modificacioncN incluyen:

2 3 , 4 1 1 1 H fC U A C O IN e S • •'
1. 2. 3. 4. 5.

Introducir el numero de ecuaciones, n. Integrar I ON valores iniciales para cada una de las n variables dependientes. Modificar el algoritmo de tal manera que calcule las pendientes para cada una de las variables dependientes. Incluir ecuaciones adicionales con el fin de calcular valores de las derivadas para cada una de las EDO. Incluir ciclos con el propósito de calcular un nuevo valor para cada variable dependiente.

m

Tal algoritmo se bosqueja en la figura 25.18 para el método RK de cuarto orden. Observe cómo es similar en estructura y organización a la figura 25.7. La mayoría de las diferencias se relacionan con el hecho de que 1) trata con n ecuaciones y 2) el detalle adicional del método RK de cuarto orden.
EJEMPLO 2 5 . 1 1 Resolución de sistemas de E D O con la computadora

Enunciado del problema. En el software TOOLKIT de métodos numéricos asociado con el texto, se tiene un programa de cómputo de uso amigable para implementar el método RK de cuarto orden a sistemas. Este software es conveniente para comparar diferentes modelos de un sistema físico. Por ejemplo, un modelo lineal para un péndulo oscilante está dado por [recuerde la ecuación (PT7.11)]

dyi dx
x 2

dyi =l ó . l y i dx

donde y y y — desplazamiento angular y velocidad. Un modelo no lineal del mismo sistema es [recuerde la ecuación (PT7.9)]

dy-s dy¡, dx dx
V4
3 4 3

-16.1 sen (y )
3

donde y y y = desplazamiento angular y velocidad para el caso no lineal. Use el TOOLKIT de métodos numéricos para resolver estos sistemas en dos casos: a) un pequeño desplazamiento inicial ( y , = y = 0.1 radianes; y = y = 0) y b) un gran desplazamiento ( V ) = y = 7i/4 = 0.785398 radianes; y = y = 0).
3 2 4 2 4

Solución. Presione el botón Solve de las EDO en el menú principal del TOOLKIT para tener una pantalla similar a la figura 25.19a. Dicha pantalla contiene espacios para la entrada y salida de información asociada con la solución de hasta 5 EDO simultáneas de primer orden. a) Introduzca los valores apropiados para Start X (inicio de X), Finish X (termina X), Step Size (tamaño de paso), Output Interval (intervalo de salida) y los parámetros para la gráfica como se muestra en la figura 25.19a. Introduzca las ecuaciones y valores iniciales y después haga clic sobre el botón Cale. Después haga clic en las cuatro variables que quiera desplegar en l a parte superior de la gráfica (Y I ,Y2 ,Y3 Y4 ) hagn clic en el botón Plot, L U N calculados pura I ON modelos lineal

y

y

l e N u l t u t l o s

752

MÉTODOS DE RUNGE-KUTTA

a)

PROGRAMA

PRINCIPAL O

" M A N E J A D

•"

b)

RUTINA P A R A

TOMAR

U N

P A S O D E

SALIDA

Aeelgn valúes for n - number of equatione y¡ = ¡nitial valúes of n dependent variables xi - initíal valué ¡ndependent variable xf = final valué ¡ndependent variable dx = calculation step slze xout = output Interval x = xi m = 0

SUB Inteqrator

(x, y, n, h, xend)

DO IF (xend - x < h) THEN h = xend - x CALL RK4 (x, y, n, h) IF (x > xend) EXIT END DO END 5UB
C) M É T O D O U N R K D E D E CUARTO O R D E N E D O P A R A SISTEMA

X

DO 1 = 1, n

Pm=
yp,>=y
;

X

5UB RK4 (x, y, n, h) CALL Derive (x,y, k1) DO ¡ = 1,n ym¡ = y¡ + k1¡ * h/2 END DO CALL Derive (x + h/2, ym, k2) DO 1=1, n ym =y + k2 *h/2 END DO CALL Derive (x + h/2, ym, k3) DO i = 1,n ye = y, + k3¡ * h END DO CALL Derive (x + h, ye, k4) DO i=1,n elope-, = (k1, + 2*(k2 +k3 )+k4 )/6 y¡ = y, + elope; * h END DO x =x +h END 5UB
i i i : ¡ i i

END DO DO xend = x + xout IF (xend > xf) THEN xend = xf h = dx CALL Inteqrator (x, y, n, h, xend) m = m+ 1 DO 1 = 1, n yp m=y¡ END DO IF (x > xf) EXIT LOOF DI5FLAY KE5ULT5 END
i

D)

RUTINA

PARA

DETERMINAR

DERIVADAS

SUB Derive (x, y, dy) dy, = ... dy = ... END SUB
2

FIGURA 25.18 Pseudocódigo para sistemas del método RK de cuarto orden.

23,1

A D A P T A T I V 0 3 DSHJNOL-WOTA > ¡> •

Function

«oles i i I PIOURA 2 5 . 1 9 lliin [Kintallas para la opción "Resolver EDO" del TOOLKIT de métodos numéricos para péndulos lineal y no lineal con tlnil iln/cimiento inicial o) pequeño y b] grande.

a)

i d X • i V d / t X * 2 Y 1 5 3 0 . J S 4 9 F 0 2 . d Y c 2 K / 1 6 1 . = J 1 . 3 . 5 / 0 1 5 7 : d Y 3 ¿ d X = Y 3 6 3 2 . 1 3 G 3 F ! 0 2 d Y « d / X . _ _ Y 4 _ _ ^ 3 . 7 3 8 3 7 1 d Y d 5 X / = Y 5 0
Variable Valué
"•*<*».•:•..•

*

i C e t a t b)

He»

y no lineal son casi idénticos. Esto cumple las expectativas debido a que cuando el desplazamiento inicial es pequeño, sen (9) = 6. b) Cuando el desplazamiento inicial es n/4 — 0.785398, las soluciones son mucho más distintas y la diferencia es magnificada en tanto el tiempo sea cada vez mayor (véase la figura 25.196). Esto se esperaba, ya que la suposición de que sen (6) = 0 e s pobre cuando theta es grande.

25.5

M É T O D O S A D A P T A T I V O S DE R U N G E - K U T T A Hasta ahora, presentamos métodos para resolver las EDO que emplean un tamaño de paso constante. Para un número significativo de problemas, esto puede representar una seria limitación. Por ejemplo, suponga que intentamos integrar una EDO con una solución del tipo expuesto en la figura 25.20. Para la mayor parte del rango, la solución cambia de manera gradual. Tal comportamiento sugiere la posibilidad de emplear un gran tamaño de paso para obtener resultados adecuados; sin embargo, para una región localizada desde x = 1.75 hasta x = 2.25, la solución pasa por un cambio abrupto. Las consecuencias prácticas al tratar con esas funciones es que se podría requerir un tamaño de paso muy pequeño para capturar en forma exacta el comportamiento impulsivo. Si se hubiera empleado un algoritmo con tamaño de paso constante, el tamaño de paso más pequeño necesario para la región del cambio abrupto podría haberse aplicado a todo el cálculo. En consecuencia, un tamaño de paso más pequeño que el necesario (y por tanto, muchos más cálculos) podría ser una pérdida de tiempo en las regiones de cambio gradual.

754

M É T O D O S DE RUNGE-KUTTA

yn
1

0

2

3

x

FIGURA 2 5 . 2 0 Un ejemplo de uno solución para una EDO que exhibe un cambio abrupto. El ajuste automático paso-tamaño tiene grandes ventajas para esos casos.

Los algoritmos que ajustan automáticamente el tamaño de paso pueden evitar tal exceso y de otra forma son una gran ventaja. Como se "adaptan" a la trayectoria de la solución, se dice que tienen un control adaptativo de tamaño de paso. La implementación de tales procedimientos requiere la obtención de un estimado del error de truncamiento local en cada paso. Dicho error estimado puede servir después como base para alargar o disminuir el tamaño de paso. Antes de proceder, debemos mencionar que además de resolver EDO, los métodos descritos en este capítulo pueden también usarse para evaluar integrales definidas. Como se menciona en la introducción de la parte seis, la evaluación de la integral

es equivalente a resolver la ecuación diferencial

para y(b) dada la condición inicial y (a) = 0. Así, se puede emplear las siguientes técnicas para evaluar con eficacia las integrales definidas que involucran funciones que por lo general son uniformes, pero exhiben regiones de cambio abrupto. Existen dos procedimientos importantes para incorporar el control adaptativo de tamaño de paso en los método» de un palo. En el primero, el error se estima como lu

2 Í l ¡ 1 J Ü 0 S A D A P T A T I V O S PE RUNOITOW <Tantro dos predicciones mediante el uso del método KK. del mismo orden, poro con dilbrenlON tiimuños de paso. En el segundo, el error de truncamiento local se cstimu
diferencia c o m o la dil'orcncia entre dos predicciones usando métodos RK de diferente orden. 25.5.1 Método a d a p t a t i v o R K o de m i t a d de p a s o

El método de mitad de paso (o RK adaptativo) involucra tomar dos veces cada paso, una vez como paso total e independientemente como dos mitades de paso. La diferencia en los dos resultados representa un estimado del error de truncamiento local. Si y, designa la predicción de un solo paso, y y designa la predicción mediante dos mitades de paso, el error A puede representarse como
2

A = y - yi
2

(25.43)

Además de proporcionar un criterio para el control del tamaño de paso, la ecuación (25.43) puede usarse también para corregir la predicción y . Para la versión RK de cuarto orden, la corrección es
2

y <- y + ~
2 2

(25.44)

Dicha estimación es una exacta de quinto orden.

EJEMPLO 2 5 . 1 2

Método RK adaptativo de cuarto orden

|

Enunciado del problema . Use el método RK adaptativo de cuarto orden para integrar y'= 4 — fj.5y desde x — 0 hasta 2 usando h = 2 y la condición inicialy(0) = 2. Ésta es la misma ecuación diferencial que antes se resolvió en el ejemplo 25.5. Recuerde que < la solución verdadera es y (2) = 14.84392.
0Sx e

Solución.

La predicción simple con un tamaño de paso h se calcula como

y (2) = 2 + - [ 3 + 2(6.40216 + 4.70108) + 14.11105]2 = 15.10584 6 Las dos predicciones de mitad de paso son 1 y ( l ) = 2 + - [ 3 + 2(4.21730 + 3.91297) + 5.945681]! = 6.20104

y (2) = 6.20104 + -[5.80164 + 2(8.72954 + 7.99756) + 12.71283]1 6 Por tanto, el error aproximado es
K,,

14.86249

14.86249 •-- 15.10584 15

*-

0,01622

756 | |

MÉTODOS DE RUNGE-KUTTA

ol cual se compara de manera favorable con el error verdadero de /-;, = 14.84392 - 14.86249 = -0.01857 El error estimado puede usarse también para concebir la predicción y (2) = 14.86249 - 0.01622 = 14.84627 la cual tiene una E = -0.00235.
t

25.5.2

Método R u n g e - K u t t a Fehlberg

Además de dividir el paso como una estrategia para ajustar el tamaño de paso, un procedimiento alternativo en la obtención de una estimación del error involucra calcular dos predicciones RK de diferente orden. Los resultados pueden ser restados después para obtener un estimado del error de truncamiento local. Un defecto de tal procedimiento es que aumenta en gran medida el esfuerzo computacional. Por ejemplo, para una predicción de cuarto y quinto orden se tiene un total de 10 evaluaciones de la función por cada paso. El método de Runge-Kutta Fehlberg o RK encapsulada hábilmente evita este problema al usar un método RK de quinto orden que emplea las evaluaciones de la función a partir del método RK de cuarto orden. ¡Así, el procedimiento genera la estimación del error con base en sólo seis evaluaciones de la función. Para el caso actual, usamos la siguiente estimación de cuarto orden * . = * +
+

/ 37

250, + ^

125, 512 , \ + 5^*4 +

(25.45)

junto con la fórmula de quinto orden: . + t-

v

v

y,+\

>,

y
i)
1

/

2825 , 18 5 7 5 , 13 5 2 5 , k, -{ k + k 4
3 4

277 — -k
1 4 3 3 6

5

1 + -k
4

2J

6

4

g

i ^

4

8

3

8

4

3

-r

5

5

2

%

»j
6

\ \h

(25.46

donde ki = f(x¡, y

ki = ftxj + -h,y¡ h = f[x, + ^h, 3

(

1

+

-k]h
x

y, + ^k h 3
x

+ 9
2

~k h
2

x¡ + -h, y¡ + —k h - —k h + -k h ( 11 5 70 35, , ¿ 5 = f[x¡ + h, y¡ - —kih + -k h - —k h + —k h
3

(
X

6

= \

J
i

2

3

A

+

7 8*'

y ¡

+

1631 , 5 l m
W

+

575 , , 44 275 , , 175 H A-,j/I 110 592 5 Í 2 * * ' 13 824
2

253 \ ' + - - k<h 4 096 /

23,3

ADAPTATIVOS DB ^NOi'KUHtt»^

Asi, Iti HIJO NO puede resolver con la ecuación (25.46) y el error estimado como lu diferencia de I I I N estimaciones de quinto y cuarto orden. Debería observarse que los coeficientes particulares usados antes los desarrollaron Cash y Karp (1990). Por tanto, algunas veces se le llama el método RK Cash-Karp.

m

EJEMPLO 2 5 . 1 3

Método de Runge-Kutta Fehlberg

Enunciado del problema. Use la versión Cash-Karp del procedimiento de RungeKutta Fehlberg para realizar el mismo cálculo del ejemplo 25.12 desde* = 0 a 2 usando h = 2. Solución.
X

El cálculo de las k se puede resumir en la siguiente tabla:
Y)
3 3.908511 4.359883 6.832587 12.09831 10.13237

y

k k k k k

2

4

5

6

0 0.4 0.6 1.2 2 1.75

2 3.2 4.20883 7.228398 15.42765 12.17686

Entonces, éstas pueden usarse para calcular la predicción de cuarto orden / 37 250 125 512 = 2+ 1 — 3 + — 4 . 3 5 9 8 8 3 + — 6 . 8 3 2 5 8 7 + 10.13237 )2 = 14.83192 \378 621 594 1 771

y i

junto con una fórmula de quinto orden: y, = 2 + ( ^ 3 + 1^4.359883 + 1^6.832587 27 648 48 384 55 296

+

1 \ 12.09831 + -10.13237 12 = 14.38677 14 336 4

277

I

El error estimado se obtiene al restar esos dos resultados para dar E = 14.83677 - 14.83192 = 0.004842
a

25.5.3

Control d e t a m a ñ o d e p a s o

Ahora que desarrollamos formas para estimar el error de truncamiento local, se puede usar para ajustar el tamaño de paso. En general, la estrategia es incrementar el tamaño de paso si el error es demasiado pequeño y disminuirlo si es muy grande. Press y cois. (1992) han sugerido el siguiente criterio para cumplir con lo anterior: h iictual (25.47)

758

MÉTODOS DE RUNGE-KUTTA

donde h ¡ y h = tamaño de paso actual y nuevo, A , = exactitud actual calculada, A = exactitud deseada, y a = exponente constante que es igual a 0.2 cuando aumenta el tamaño de paso (por ejemplo, cuando A < A ) y 0.25 disminuye el tamaño de paso ( A > A^). El parámetro clave en la ecuación (25.47) es obviamente A ya que es su vehículo para especificar la exactitud deseada. Una manera para realizarlo sería relacionar A . con un nivel relativo de error. Aunque esto funciona bien sólo cuando ocurren valores positivos, puede causar problemas para soluciones que pasan por cero. Por ejemplo, usted podría estar simulando una función oscilatoria que repetidamente pasa por cero, pero está limitada por valores máximos absolutos. Para tal caso, podría necesitar estos valores máximos para figurar en la exactitud deseada. Una manera más general de manejar esos casos es determinar A como
mm nuev0 aclull n u e v o actual nuev0 actual n u e v o nU( n u e v o

V(1

^ N U E V O ^^ E S C A L A
donde e = nivel de tolerancia global. Su elección d e y determinará entonces cómo se ha escalado el error. Por ejemplo, s i y = y, la exactitud será manejada en términos del error relativo fraccional. Si usted trata ahora con un caso donde desee errores relativos constantes a un límite máximo preestablecido, existe ya u n a y igual a ese límite. Un truco sugerido por Press y cois. (1992) para obtener los errores relativos constantes, excepto aquellos que cruzan muy cerca de cero, es
e s c a l a e s c a l a e s c a l a

^ E S C A L A=W+* dx
Ésta es la versión que usaremos en nuestro algoritmo. 25.5.4 A l g o r i t m o de cómputo

dy

Las figuras 25.21 y 25.22 muestran el pseudocódigo para implementar la versión de Cash-Karp del algoritmo Runge-Kutta Fehlberg. Este algoritmo es acondicionado des P U E S de una implementación más detallada por Press y cois. (1992) para sistemas deEDO. La figura 25.21 implementa un solo paso de la rutina Cash-Karp (que son las ecuaciones 25.45 y 25.46). La figura 25.22 bosqueja un programa principal general junto con una subrutina que de hecho adapta el tamaño de paso.
EJEMPLO 2 5 . 1 4 Aplicación en computadora de un esquema adaptativo RK de cuarto orden

Enunciado del problema. El método RK adaptativo es muy apropiado para la siguienlc ecuación diferencial ordinaria

dx

+ 0.6y = iOg-<*-2)7P(O.075)']

(E25.14.I)

Observe que para la condición inicial, y (0) = 0.5, la solución general es
y = 0.5e (H25.14.2)

2

3

.

»

4

J

I

0

D

0

S

ADAPTATIVOS OE

H

Ü

I

W

W

W

U

T

T

A

OUVROUTINE RKkc (y, dy,x,\\,yout, yetr)

rARAMETER(a2=0.2.a3=0.3M=O.6,a5=Ua6=0.375
bZI=0.2,b3U3./40.,b32=9J40.,b4U0.3,b42=-0.9, b43=1.2,b5l=-1V54.,b52=2.5,b53=-70./27., b54=35./27.,b6U163U55296.,b62=175./512., b63=575/.13&24.,b64=44275.ñ10592.,b65=253./4096., cU37./37&.,c3=250./62Uc4=125./594., c6=512J1771.,dcUcl-2&25./2764&., dc3=c3-18575./4&3&4.,dc4=c4- l3525./55296„ dc5=-277./14336.,dc6=c€>-0.25)
/

FIGURA 25.21 l'Miudocódigo para un solo I« I.M > para el método RK i ní.li-Karp.

ytemp=y+b21*h*dy CALL Derive (x+a2*h,ytemp,k2) ytemp=y+h*(b31*dy+b32*k2) CALL Derive(x+a3*h,ytemp,k3) ytemp=y+h*(b41*dy+b42»k2+b43*k3) CALL Derive (x+a4*h,ytemp,k4) ytemp=y+h*(b51*dy+b52*k2+b53*k3+b54*k4) CALL Derive(x+a5*h,ytemp,k5) ytemp=y+h*(b61*dy+b62*k2+b63*k3+b64*k4+b65*k5) CALL Derive(x+a6*h, ytemp,k6) yout=y+h*(c1*dy+c3*k3+c4*k4+c6*k6) yerr=h*(dc1*dy+dc3*k3+dc4*k4+dc5*k5+dc6*k6) ENDRKkc

FIGURA 2 5 . 2 2 iSniídocódigo para resolver muí simple EDO: 1 1) piograma principal y /I] rutina adaptativo I li' poso.

A )

P R O G R A M A

P R I N C I P A L

b)

R U T I N A

A D A P T A T I V O

D

E

P A S O

INPUTxi.xf.yi maxetep=100 hi~.5; tiny = l x 10~ epe=0.00005 prínt *, xi.yi x=xí

5

y=y¡ h=h¡ ietep=0 DO IF (ietep > maxetep AND x < xf) EXIT ietep=ietep+1 CALL Deríve(x,y,dy) yecal=ABS(y)+ABS(h*dy)+tiny IF (x+h>xf) THEN h=xf-x CALL Adapt (x,y,dy,h,yecal,epe,hnxt) PRINTx,y h=hnxt ENDDO END

SUB Adapt (x,y,dy,htry,yecal,epe,hnxt) PARAMETER(eafety=0.9,econ=1.39e-4) h=htry DO CALL RKkc(y,dy,x,h,ytemp,yerr) emax=abe(yerr/yecal/eps) IF emax<1EXIT htemp=safety*h *emax~° h=max(abe(htemp),0.25*abs(h)) xnew=x+h IF xnew = x THEN pauee END DO IF emax > econ THEN hnxt=eafety*emax~ *h ELSE hnxt=4. *h END IF x=x+h y=ytemp END Adapt
25 2

MÉTODOS DE RUNGE-KUTTA

FIGURA

25.23

o) Una función forzada en forma de campana que induce un cambio abrupto en la solución de una EDO [véase ecuación (E25.14.1)]: b) La solución. Los puntos indican las predicciones para una rutina adaptativo paso-tamaño.

la cual es una curva uniforme que gradualmente se aproxima a cero en tanto x aumenta. En contraste, la solución particular tiene una transición abrupta en la vecindad de x = 2 debido a la naturaleza de la función forzada (véase la figura 25.23a). Use un esquema estándar RK de cuarto orden para resolver la ecuación (E25.14.1) desde x = 0 hasta 4. Después emplee el esquema adaptativo descrito en esta sección para realizar el mismo cálculo. Solución. Primero se usa el esquema clásico de cuarto orden para calcular la curva en la figura 25.236. Para hacer este cálculo se usa un tamaño de paso de 0.1 a fin de que NO hagan 4/(0.1) = 40 aplicaciones de la técnica. Después, el cálculo se repite con un tama ño de paso de 0.05 para un total de 80 aplicaciones. La principal discrepancia entre los dos resultados ocurre en la región que va de 1.8 a 2.0. La magnitud de la discrepancia es de alrededor de 0.1 a 0.2%. Después, se desarrolla el algoritmo mostrado en las figuras 25.21 y 25.22 en un programa de cómputo y se usa puiu renolvor el mismo problema. Se elige un tamaño de

PRi paso de 0,3 y unti f ~ 0.00005. Los resultados NO superponen on la figura 25.23/). Observe cómo se loman grandes pasos en las regiones de cambio gradual. Después, en la vecindad de x 2 disminuyen los pasos para tomar en cuenta la naturaleza abrupta de la función forzada.

La utilidad de un esquema de integración adaptativo obviamente depende de la naturaleza de las funciones que habrán de modelarse. Es en particular ventajoso para aquellas soluciones con grandes tramos uniformes y con regiones cortas de cambio abrupto. Además, tiene utilidad en aquellas situaciones donde no se conoce de antemano el tamaño correcto de paso. Para esos casos, la rutina adaptativa "sentirá" su camino para la solución mientras mantiene los resultados dentro de la tolerancia deseada. Asi, andará lento por regiones de cambio abrupto y acelerará el paso cuando las variaciones sean más graduales.

PROBLEMAS

MIIHIIIICII

V i IK e s u c v la e ls i g u i e n t ep r o b e l m ad ev a l o ri n i c i a l8 e m a n e r ae 2 5 .d R e s u e v l a ls i g u i e n t ep r o b e l m ac o ne lm é o t d oR K p a r ae li n t e r v a l oq u ev ad ex = 0 a2 : t oo r d e n :
V-V

•2y

d o n d ey ( 0 ) = 4 y y( '0 )=0 .R e s u e v la d e s d ex = 0 i l t m t ei ( '0 )=1 .G r a f q iu el as o l u c i ó n . =p 0 . 5 .r G r a f q ie u ee s u sr e s u l t a d o s . 1*.2 I I s ce lm é o t d od eE u e lr c o nh = 0 5 . y0 2 .5 a r a e s o l v r l p r n h l c i n a2 5 . 1 .G r a f q iu el o sr e s u l t a d o ss o b r el am s m ia 2 5 9 . g r á f R i c a e s u e v la d e s d et= 0h a s t a3c o n h = 0.1 u m |m c o m p a r a rv s i u a m le n e t l ae x a c t i u dd el o sd o s a t m a ñ o s d e( m é o t d o H e u n s i nc o r r e c t o r ) y b) e lm é o t d oR Kd e |u tm i d e nod eR a l s t o n : V í 1 1I s ee lm é o t d od eH e u nc o nh = 0 5 . p a r ar e s o l v e re lp r o b l e dy_ n in ¡S. I .I t e r ee lc o r r e c t o rc o n e = 1%. s e n ( í ) y ( 0 )=1 1 V 4U s ee lm é o t d od ep u n o t m e d o i c o nh= 0 5 . dt y •• 0 2 .5y p a r a m in v le re lp r o b e l m a2 5 . 1 . 5 1 .e 0 R e s u e v l e l i g u i e n t ep r o b e l m ae nf o r m an u m é r c i a I* * >tI s ee lm é o t d oc l á s i c oR Kd ec u a r t o2 o r d n c o n ha = 0 5 .s p a r a = 0 h a s t a 3 : M i o v lc re lp r o b e l m a2 5 . 1 . d V !< >K e p a t i l o sp r o b e l m a sd e l2 5 1 . a l2 5 . 5 ,p e r oa h o r ap a r ae l « I a n i c n t ep r o b e l m ad ev a l o ri n i c i a ls o b r ee li n t e r v a l oq u ev a= d e xy+t y(0) = 1 -O u I: U s ee lm é o t d oR Kd et e r c e ro r d e nc o nu na t m a ñ o 2 5 . 1 1U s ee lm é o t d o a) d eE u e lr y b) e lm é o t d oR K o r d e np a r ar e s o l v e r ( H v ) v y v ( 0 )=i I V 7U s el o sm é o td o s a) d eE u e lr y b) d edyH e u n( s i ni t e r a c i ó n ) p i n ir e s o l v e r dx ~2y + 5 e "
s 2

J- cu

dz dt12 en un i t- v dx
2

muño de

s o b r e a l4 r u n g o q u ev ad ex = 0 a 1 m e d a i n e tu i l n n i l e ,i ( '0) = 2 y y ( ' 0 )=0 .R c s u c v lu d e s d ox * 0 h a s t a m e d o 0 2 .s c o n y 0 )=2 y z ( 0 )=4 . d i a n t e // — 0.1. C o m p a e rl o sm é o td o sa lg n i f l e i t rI H N o l u c i o n o s .(

762

MÉTODOS DE RUNGE-KUTTA

25.12 Calcule el primer paso del ejemplo 25.14 usando el método adaptativo RK de cuarto orden con h = 0.5. Verifique si el ajuste paso-tamaño es el correcto. 25.13 Si e = 0.001, determine si se requiere un ajuste en el tamaño de paso para el ejemplo 25.12. 25.14 Use el procedimiento RK-Fehlberg para realizar el mismo cálculo que en el ejemplo 25.12 desde x = 0 hasta 1 con h = 1. 25.15 Escriba un programa en computadora con base en la figura 25.7. Entre otras cosas, inserte comentarios para la documentación del programa con el fin de identificar lo que en cada sección se intenta realizar. 25.16 Pruebe el programa que usted desarrolló en el problema 25.15 con los mismos cálculos por realizar de los ejemplos 25.1 y 25.4.

25.17 Desarrolle un programa de uso amigable para el método de Heun con un corrector iterativo. Pruebe el programa usando los resultados de la tabla 25.2. 25.18 Desarrolle un programa de cómputo de uso amigable para el método clásico RK de cuarto orden. Pruebe el programa con los mismos cálculos por realizar del ejemplo 25.7 y del problema 25.5. 25.19 Desarrolle un programa de cómputo de uso amigable para sistemas de ecuaciones mediante el uso del método RK de cuarto orden. Use este programa con los mismos cálculos por realizar del ejemplo 25.10.

CAPÍTULO 2 6

Métodos rígidos y de rnultipaso
El presente capítulo cubre dos áreas de estudio. Primero, describimos las EDO rígidas, que pueden estar tanto en forma individual como en sistemas y ambas tienen componentes rápidos y lentos para su solución. Introducimos la idea de una técnica de solución implícita como una de uso común para remediar este problema. Después analizamos loi métodos de rnultipaso. Estos algoritmos retienen información de pasos anteriores para capturar con más efectividad la trayectoria de la solución. También dan la estimación del error de truncamiento que se usa para implementar el control adaptativo tamaño-paso.

26.1

RIGIDEZ El término rigidez es usado para denominar a un problema especial que puede surgir en la solución de ecuaciones diferenciales ordinarias. Un sistema rígido es aquel que involucra un cambio rápido en sus componentes junto con un cambio lento de algunos. En muchos casos, la variación rápida de componentes son transitorios efímeros que terminan rápidamente, después de lo cual la solución es dominada por la variación lenta de componentes. Aunque los fenómenos transitorios existen sólo para una parte del intervalo de integración, pueden dictar el paso del tiempo para toda la solución. Tanto las EDO individuales como los sistemas pueden ser rígidas. Un ejemplo de una EDO rígida simple es = - 1 OOOy + 3 000 - 2 000e"' (26.1)

dt

Si y(0) = 0, la solución analítica se puede desarrollar como

y = 3 - 0,9986-'

0 0 0 í

- 2.002e"'

(26.2)

Como se muestra en la figura 26.1, la solución se halla dominada al principio por el término rápido exponencial ( e ° ' ) . Después de un periodo muy corto t < 0.005, esta parte transistoria termina y la solución será gobernada por el exponencial lento (e~'). Se puede ganar cierto conocimiento en el tamaño de paso necesario para la estabilidad de tal solución al examinar la parte homogénea de la ecuación (26.1),
- 1 00

% = -ay Si y(0) = y , puede usarse cálculo paru determinar la solución como
u

dt
s

(26.3)

y

y„r "'

764

M É T O D O S RÍGIDOS Y DE MULTIPASO

3

y

2

1!

i
0 2 4
x

0 '

FIGURA 26.1 Gráfica de una solución rígida de una sola EDO. Aunque la solución parece comenzar en 1, existe en realidad una forma transitoria rápida de y = 0 a 1 que ocurre en menos de 0 . 0 0 5 unidades de tiempo. Esta forma transitoria es perceptible sólo cuando la respuesta es vista sobre una escala más fina en el origen.

Así, la solución e n y asintóticamente se aproxima a cero. Es factible usar el método de Euler para resolver el mismo problema en forma numérica:
0

y¡+\

=

y>

+

~^

h

Al sustituir la ecuación (26.3) se tiene y,+i = y,o y
i+l

-ay¡h

= y¡{\ - ah)

(26.4)

La estabilidad de esta fórmula sin duda depende del tamaño de paso A. Es decir, 11 — ah \ debe ser menor que 1. Así, si h > 21a, | y,-1 - » ° ° como i —• °°. Para la parte transitoria rápida de la ecuación (26.2), se puede usar este criterio con el fin de mostrar que el tamaño de paso para mantener la estabilidad debe ser < 2/1 000 = 0.002. Además, debería observarse que mientras el criterio mantenga estabilidad (CN decir, una solución acotada), un tamaño de paso aún más pequeño pudiera ser requerido para obtener una solución exacta. Así, aunque ocurra la parte transitoria para sólo uiin pequeña fracción del intervalo de integración, éste controla el máximo tamaño de patín permitido. Sin ahondar mucho, usted podría suponer que las rutinas adaptativas de tamaño de paso descritas al final del capítulo podrían ofrecer una solución para este dilema. Qui/fl pensaría que ellas podrían usar pasos pequeños durante las partes transistorias rápidas y grandes pasos para las otras. Sin embargo, éste no es el caso, ya que los requerimiento»! de estabilidad todavía requerirán p u o i muy pequeños a través de toda la solución.

T

U

Kn lugar de tmnr procedimientos explícitos, los métodos implícitos ofrecen un remedio alternativo. Tules representaciones se denominan cógnita aparece en ambos lados de la ecuación. Se puede desarrollar una forma implícita del método de liuler al evaluar la derivada en el tiempo futuro,
.V/+1

iinplia'tus,

de

A esto se le llama método de Euler hacia atrás o implícito. Si se sustituye la ecuación (26.3) se obtiene y, + i = V Í ay h
i+y

la cual se puede resolver para
y¡ y¡+\
=

(26.5)

1 +ah

Para este caso, sin importar el tamaño de paso, \y¡\ —;0 como i - » °°. De ahí que el procedimiento es llamado incondicionalmente estable.
EJEMPLO 2 6 . 1 Euler explícito e implícito Enunciado del problema.

ÉL =
dt

Use ambos métodos: el explícito y el implícito para resolver

-1 OOOy + 3 000 - 2 000e~

dondey(O) = 0. a) Use el método de Euler explícito con tamaños de paso de 0.0005 y 0.0015 para resolver a y entre / = 0 y 0.006. b) Use el método de Euler implícito con un tamaño de paso de 0.05 para resolver a y entre 0 y 0.4.
Sol

U C I O N .
Para este problema, el método de Euler explícito es y.
+ 1

a)

= . + ( - 1 000y¡ + 3 000 - 2 OOOe~'0A
y

b)

El resultado para h = 0.005 se despliega en la figura 26.2a junto con la solución analítica. Aunque exhibe algún error de truncamiento, el resultado captura la forma general de la solución analítica. En contraste, cuando se aumenta el tamaño de paso a un valor justo debajo de la estabilidad límite (h = 0.0015) la solución manifiesta oscilaciones. Usando h > 0.002 daría como resultado una solución por completo inestable; es decir, tendería al infinito en tanto progresa la solución. El método de Euler implícito es y.
+ )

= y. + ( - 1 0 0 0 y

l + 1

+ 3 000 - 2

000Í?-'

Í + 1

)¿

Ahora como la EDO es lineal, podemos reordenar esta ecuación de tal forma que y¡ | esté aislada en el lado izquierdo,
y, + 3 OOO/i - 2 000/K? '"'
I + I

000/1

766

MÉTODOS RÍGIDOS Y DE MULTIPASO

n = 0.0015

FIGURA 26.2

Solución de una EDO "rígida" con los métodos de Euler o) explícito y b) implícito.

El resultado para h = 0.05 se despliega en la figura 26.2b junto con la solución analítica. Observe que aun cuando usamos un tamaño de paso mucho mayor que aquel que ha inducido inestabilidad en el método de Euler explícito, la solución numérica ajusta muy bien sobre el resultado analítico.

Los sistemas de EDO pueden también ser rígidos. Un ejemplo es
d

J± = _ 5 y , + 3 v dt

2

(26.6a)

^

dt

= lOOyi - 301y

2

(26.6/0

Para las condiciones iniciales y ^0) = 52.29 yy (0)
2

= 83.82, la solución exacta es (26.7«)

y, = 5 2 . 9 6 e - 3

9899

' - 0.67c-

302

-

0101

'
'

y = 17.83e- 2 3

9899

' + 65.99c-

3 0 2

-

0 1 0 1

(26.7/»)

Advierta que los exponentes son negativos y difieren por cerca de 2 órdenes de magni tud. Como con la ecuación simple, son los exponentes grandes los que responden rápida mente y son el corazón de la rígidas del sistema.

Z O . r fl^Mff<VMULTIPA5Q
Un método implícito de Euler para sistemas puede ser formulado para el actual ejemplo como
y u + i = y\,¡ + ( - 5 y u + i + 3y ,/+i)fc
2

(26.8a)
(26M)

y2,,+i = yi,¡ + (100>'I,

!+1

- 301y ,/ i)A
2 +

Al agrupar términos se tiene
(1 + 5h)y
u¡+i

- 3hy ,i+¡
2

= yi,,2 +1

-100/2y

u+1

+ ( 1 + 301/z)y ,

=y ,
2>

( 2 6 . 9 a ) ( 2 6 . 9 6 )

Así, podemos ver que el problema consiste en resolver un conjunto de ecuaciones simultáneas por cada paso de tiempo. Para EDO no lineales, la solución ahora es más difícil, ya que involucra resolver un sistema de ecuaciones simultáneas no lineales (recuerde la sección 6.5). Así, aunque « o gana estabilidad a través de procedimientos implícitos, se paga el precio en forma de complejidad agregada a la solución. El método de Euler implícito es incondicionalmente estable y exacto para el primer orden. Es también posible desarrollar de manera similar un esquema de integración para la regla trapezoidal implícita exacta de segundo orden para sistemas rígidos. Es usualmente deseable tener métodos de orden superior. Las fórmulas de Adams-Moulton descritas más tarde en este capítulo pueden también usarse para determinar métodos implícitos de orden superior. Sin embargo, los límites de estabilidad de tales procedimientos se hallan muy limitados cuando se aplica a sistemas rígidos. Gear (1971) desarrolló una serie especial de esquemas implícitos que tienen límites de estabilidad mucho mayores basados en las fórmulas diferenciadas hacia atrás. Se hacen intensos esfuerzos para desarrollar software que implemente en forma eficiente los métodos de Gear. Como resultado, éste es quizás el método más favorecido para resolver sistemas rígidos. Además, Rosenbrock y otros proponen algoritmos Runge-Kutta implícitos donde los términos k aparecen implícitamente. Esos métodos tienen características buenas de estabilidad y son bastante adecuados para resolver sistemas de ecuaciones diferenciales ordinarias rígidas.

MÉTODOS

MULTIPASO

Los métodos de un paso descritos en las secciones anteriores utilizan información en un solo punto x¡ para predecir un valor de la variable dependiente y en un punto futuro x (véase figura 26.3a). Procedimientos alternativos, llamados métodos rnultipaso (véase figura 26.3*3), se basan en el conocimiento de que, una vez empezado el cálculo, se tiene información valiosa de los puntos anteriores y está a nuestra disposición. La curvatura de las líneas que conectan esos valores previos proporcionan información con respecto a la trayectoria de la solución. Los métodos rnultipaso explorados en este capítulo aprovechan esta información para resolver las EDO. Antes de describir las versiones de orden superior, presentaremos un método simple do segundo orden que sirve para demostrar las características generales de loi procedimientos rnultipaso.
i + 1 ¡+l

768

FIGURA

26.3

Ilustración gráfica de la diferencia fundamental entre los métodos para resolver EDO o) de un paso y b) de multipasos.

X

/+1

X

a)

26.2,1
+i

EF M É T O D O D E H E U N D E N O

autoínicío

Recuerde que el procedimiento de Heun usa el método de Euler como un predictor [vea se ecuación (25.15)]: (26.10) yf = yi + f(x )h
hyi

y la regla trapezoidal como un corrector [véase ecuación (25.16)]:
/(.Y ,-, y,-) + / ( . v i , y , " i )
f+ + A

=

yi

+

(26.1
2

Así, el predictor y el corrector tienen errores de truncamiento local de 0(h ) y <9(/;'), respectivamente. Esto sugiere que el predictor es el enlace débil en el método, pues tiene el error más grande. Esta debilidad es significativa debido a que la eficiencia del paso corrector iterativo depende de la exactitud de la predicción inicial. En consecuencia, una forma para mejorar el método de Heun es mediante el desarrollo de un predictor que tenga un error local de 0(h ). Esto se puede cumplir al usar el método de Euler y la pendiente eny , y una información extra del punto anterior Y¡__ como en
3 ( ]

y,_, +/(.v,-,y /)2 /i

(26.1.')

Observe que la ecuación (26.12) alcanza 0(h ) a expensas de emplear un tamaño de paso más grande, 2h. Además, observe que la ecuación (26.12) no es de autoinicio, ya que involucra un valor previo de la variable dependiente y¡_,. Tal valor podría no estar disponible en un problema común de valor inicial. A causa de ello, las ecuaciones (26.11) y (26.12) son llamadas método de Heun de. no autoinicio. Como se ilustra en la figura 26.4, la derivada estimada en la ecuación (26.12) s c < localiza ahora en el punto medio más que al inicio del intervalo sobre el cual se hace In predicción. Como se demostrará después, esta ubicación centrada mejora el error del predictor a 0(.h ). Sin embargo, IB»F#DI .progcdcr a una deducción formal del método dt
s

26.2

Muimso

»..;\ A l.
Pendiente - Hx , y¡L,
M

FIGURA 26.4 Una ilustración gráfica del método de Heun de no auloinicio, a) El método de punto medio que se usa como un predictor. b) La regla trapezoidal que se emplea como un corredor

Heun de no autoinicio, resumiremos el método y lo expresaremos usando una nomenclatura ligeramente modificada: Predictor: Corrector:

y%, = y*_ , + f(x„ y"¡)h
1 +

^ ^ Mi&#.í
(paray = 1,2,..., m)

(20.13)

i

(26.14)

donde los superíndices se agregaron para denotar que el corrector se aplica iterativamente dey — l a ni para obtener soluciones refinadas. Observe que y " y y"L\ son ios resulta dos finales de las iteraciones del corrector en los pasos de tiempo anteriores. iteraciones son terminadas en cualquier paso de tiempo con base en el criterio de paro
1

L i n

\>„\

-

'/ 1 i\ i

i

11)0%

(26.15)

770

M É T O D O S RÍGIDOS Y DE MULTIPASO

Cuando e es menor que una tolerancia de error e preestablecida, se terminan las iteraciones. En este punto, y = m. El uso de las ecuaciones (26.13) a la (26.15) para resolver una EDO se demuestra en el siguiente ejemplo.
u v

EJEMPLO 2 6 . 2

Método de Heun de no autoinicio

| \ I ¡ |

Enunciado del problema. Use el método de Heun de no autoinicio para realizar los mismos cálculos igual que en el ejemplo 25.5 mediante el método de Heun. Es decir, integrar y' — 4e° — O.Sy d e x = 0 a x = 4 usando un tamaño de paso de 1.0. Como cu el ejemplo 25.5, la condición inicial enx = 0 es y — 2. Sin embargo, como aquí tratamos conunmétodo demultipaso, requerimos la información adicional de que y = —0.3929953 1 en x = — 1.
,8x

Solución. El predictor [véase ecuación (26.13)] se usa para extrapolar linealmente ele x — — 1 a i = 1. y? = -0.3929953 + [ 4 e ° '
8(0)

- 0.5(2)] 2 = 5.607005

El corrector [véase ecuación (26.14)] es entonces usado para calcular el valor:
4e

o.8(0) _

0.5(2) + 4 e

0 8 ( 1 )

- 0.5(5.607005). •1 = 6.549331

la cual representa un error relativo porcentual de —5.73% (valor verdadero = 6.194631). Este error es algo más pequeño que el valor de —8.18% incurrido en el Heun de auto inicio. Ahora, la ecuación (26.14) se puede aplicar de manera iterativa para mejorar la solución:
y\ = 2 + 3
+ 4 e

o.8(i)

_o.5(6.549331)

1 = 6.313749

que representa un e de —1.92%. Puede determinarse un estimado de error aproximado usando la ecuación (26.15):
t

6.313749-6.549331

6.313749
s

100% = 3.7%
a

La ecuación (26.14) se puede aplicar de manera iterativa hasta que e esté por debajo de un valor preespecificado de e . Como fue el caso con el método de Heun (recuerde el ejemplo 25.5), las iteraciones convergen sobre un valor de 6.360865 (e, = —2.68%). Sin embargo, como el valor del predictor inicial es más exacto, el método de multipaso converge a una razón algo más rápida. Para el segundo paso, el predictor es y» = 2+ [4<?°'
8(l)

- 0.5(6.360865)] 2 = 13.44346

F, = 9.43%

que es superior a la predicción de 12.08260 ( E , = 18%)) que fue calculada con el método de Heun original. El primer corrtetorda.13.76693 (e, = 6.8%), o iteraciones subsecuente*

26.2 MÉTODOSMULTiBMO iU convergen sobre el mismo resultado como uc obtuvo con el método de Heun de autoinicio: 15.30224 —3.1%). Como con el P O N O anterior, la razón de convergencia del corrector ha sido mejorada debido a la mejor predicción inicial.

(t:,

IWUm^

m

Deducción y análisis del error de las fórmulas del psedictor-corrector.

Ya emplea-

mos conceptos gráficos para deducir el Heun de no autoinicio. Ahora mostraremos cómo las mismas ecuaciones se pueden deducir matemáticamente. Esta deducción es en particular interesante porque vincula las ideas del ajuste de curvas, de la integración numérica y de las EDO. El ejercicio también es útil porque proporciona un procedimiento simple para desarrollar métodos de multipaso de orden superior y estima sus errores. La deducción se basa en resolver la EDO general
d

— = f(x,y) dx Esta ecuación se puede resolver al multiplicar ambos lados por dx e integrando entre los límites iei + 1: /

y

fi

^

ry¡+\
dy =

r ¡+\ f(x, y ) dx
x

El lado izquierdo se puede integrar y evaluar mediante el teorema fundamental [recuerde la ecuación (25.21)]: y¡+i=y, + J Í ' ' f(x,y)dx
+

(26.16)

La ecuación (26.16) representa una solución a la EDO si la integral puede ser evaluada. Es decir, proporciona un medio para calcular un nuevo valor de la variable dependiente y , con base en un valor previo de y¡ y la ecuación diferencial. Las fórmulas de integración numérica como las que se desarrollaron en el capítulo 21 proporcionan una manera de hacer esta evaluación. Por ejemplo, la regla trapezoidal [véase ecuación (21.3)] se puede usar para evaluar la integral, como en
i+

f(x,y)
l+ x

dx =

h

(26.17)

donde h = x — x¡ es el tamaño de paso. Al sustituir la ecuación (26.17) en la ecuación (26.16) se tiene , f(x¡, y,-) + f{x , y¡+\ = y¡ + 2
i+]

y,-+i)

la cual es la ecuación corrector para el método de Heun. Como ésta se basa en la regla trapezoidal, el error de truncamiento puede tomarse directamente de la tabla 21.2, /'.;•• ¡ l'\ (^)
0) 2

=

- - - - / ' Y U )

(26.18)

donde el Muperfndice c designa que eslo ON el error del corrector.

772

MÉTODOS RÍGIDOS Y DE MULTIPASO

Un procedimiento similar puede ser usado para deducir al predictor. Para oslo caso, los limites de integración van de / — 1 a / +• l:

Jy¡-\I J *¡-\
/'Vi II /•»'/ + !

/

dy =

f{x, y) dx

que se puede integrar y rearreglar para obtener y \=y¡-\+¡
i+

f{x,y)dx

(26.19)

Ahora, más que usar una fórmula cerrada de la tabla 21.2, la primera fórmula de integra ción abierta de Newton-Cotes (véase tabla 21.4) se puede usar para evaluar la integral, como en
f{x,y)dx = 2hf(x ,y,)
i

(26.20)

la cual es llamada método de punto medio. Sustituyendo la ecuación (26.20) en la ecua ción (26.19) se obtiene
y
i +

i = y,-_i +

2hf(Xj,yj)

el cual es el predictor para el Heun de no autoinicio. Como con el corrector, el error de truncamiento local se puede tomar directamente de la tabla 21.4:
E =

P

Vy'(?) =
3 P

\lyfiHp)

(26.21)

donde el subíndice p designa que éste es el error del predictor. Así, el predictor y el corrector para el método de Heun de no autoinicio tiene errores de truncamiento del mismo orden. Además de actualizar la exactitud del predictor, este hecho tiene beneficios adicionales relacionados con el análisis del error, como se elabu rara en la siguiente sección. Estimación DE ERRORES. Si el predictor y el corrector de un método multipaso son del mismo orden, el error de truncamiento local puede estimarse durante el curso de un cálculo. Esto es una tremenda ventaja, ya que establece un criterio para el ajuste del tamaño de paso. El error de truncamiento local para el predictor se estima con la ecuación (26..' I ) Dicho error estimado se puede combinar con el estimado d e y del paso predictor pata dar [recuerde nuestra definición básica de la ecuación (3.1)]
í + I

Valor verdadero — y°

¡+l

+ - hy 3
3

0)

(<? )

(26..'..!)

Mediante un procedimiento similar, el error estimado para el corrector [véase EEIIIUMII (26.18)] se puede combinar con el resultado del corrector v¡, , para dar Valor verdadero i * ™ ,,

V l ' "^ , )
1

(20..U)

La ecuación (¿h.i.i) puede s e r restada de lii ecuación (2<>.2.í) para dar < > v,'",, v,",, ^//V'IS) donde ¿; está ahora entre x¡_, y x rearregla el resultado se tiene

(20.24)

( + 1

. Ahora, si se divide la ecuación (26.24) entre 5 y se

5 >, + 1 } 3 (y Observe que los lados derecho de las ecuaciones (26.18) y (26.25) son idénticos, con la = (26.25) excepción del argumento de la tercera derivada. Si no hay una variación apreciable sobre el intervalo en cuestión, podemos suponer que los lados derecho son iguales y, por tanto, los lados izquierdo deberían ser equivalentes, como en

0

_

,,m i

'+y -±h v '(^) 19"
5

E, = - ^

(26.26)

Así, llegamos a una relación que puede ser usada para estimar el error de truncamiento por paso con base en dos cantidades [el predictor (y° ¡) y el corrector ( y ™ ) ] , que son de rutina subproductos del cálculo.
i+
+1

Estimación del error de truncamiento por paso

Enunciado del problema. Use la ecuación (26.26) para estimar el error de trunca miento por paso del ejemplo 26.2. Observe que los valores verdaderos e n x = 1 y 2 son 6.194631 y 14.84392, respectivamente. Solución. En x = 1, el predictor de 5,607005 y el corrector da 6.360865. Estos valores se pueden sustituir en la ecuación (26.26) para dar
í + 1

£

c

=

- 6

3 6 0 8 6 5

¡

5

^

= - 0 . 1 5 0 7 7 22

la cual se compara bien con el error exacto, E, = 6.194631 - 6.360865 = -0.1662341 Enx = 2, el predictor da 13.44346 y la trayectoria da 15.30224, la cual se usa para calcular
¡ + 1 £ t

,

=

_ 15-30224-13.44346

=

que también se compara favorablemente con el error exacto, E, = 14.843992 — 15.302.M = -0.4583148.

Lo fácil con que puede eslimuiíto el error mediante la ecuación (26.26) proporciona una base racional para el ajuMe del Inmuno de paso durante el curso de un cálculo. I'or

774

MÉTODOS RÍGIDOS Y DE MULTIPASO

ejemplo, si la ecuación (26.26) indica que el error es mayor que un nivel aceptable, el tamaño de paso podría ser disminuido. Modificadores. Antes de analizar los algoritmos de cómputo, debemos observar otras dos formas en las cuales el método de Heun de no autoinicio puede hacerse más exacto y eficiente. Primero, debería percatarse que además de proporcionar un criterio para el ajuste tamaño-paso, la ecuación (26.26) representa una estimación numérica de la discrepancia entre el valor final corregido en cada p a s o y y el valor verdadero. Así, puede agregarse directamente a y para refinar el estimado aún más:
¡ + 1 i+x

y y
i+i

m

— y° (26.27)

<- y i
i+

La ecuación (26.27) es llamada modificador corrector. (El símbolo « - se lee como "es remplazado por".) El lado izquierdo es el valor modificado de y"¡ . Una segunda mejora que relaciona más la eficiencia del programa es un modificador predictor, el cual se designa para ajustar el resultado predictor de tal forma que esté más cerca del valor convergente final del corrector. Esto es ventajoso debido a que, como se observó al inicio de esta sección, el número de iteraciones del corrector es altamente dependiente de la exactitud de la predicción inicial. En consecuencia, si la predicción es modificada adecuadamente, podríamos reducir el número de iteraciones requerido para convergir sobre el último valor del corrector. Tal modificador puede deducirse en forma simple al suponer que la tercera derivada es relativamente constante de un paso a otro. Por tanto, al usar el resultado del paso previo en /, la ecuación (26.5) se puede resolver para
+ x

h^M^-^yf-y?)
<3) (3)

(26.28)

la cual, suponiendo quey (^) = y ( ^ , ) , se pueda sustituir en la ecuación (26.21) para dar E =

P

l(y?-y?)

(26.29)

que se puede usar para modificar el resultado del predictor

y ,< y ,
0 + 1

0 + 1

+í ( y r y , ° )

(26.30)

EJEMPLO 2 6 . 4 i j

Efecto d e modificadores sobre los resultados predictor-corrector Enunciado del problema. Vuelva a calcular el ejemplo 26.3 usando los modificadorcn como se especifican en la figura 26.5. Solución. Como en el ejemplo 26.3, el predictor inicial resultante es 5.607005. Ya que el modificador del predictor [véusc ocuución (26.30)] requiere valores de una iteración previa, no es posible emplearlo para mejorar este resultado inicial. Sin embargo, la ecua-

26,2 *toD06MUmnASO
Pradlcton y° , +

778

+ f|x„ ^ 2 h
+ u

(Guarde el resultado como y° i =
M o d i f i c a d o r predictor:

, donde el subíndice u designa que la variable es no modificable)

Corrector:

y*^, = y?

f[x, y?) + f\x u y ^ i ) ,
h

n

para / = 1 a iteraciones máximas m)

2
Verificación de e r r o r : 100%
VÍ .-1

(Si le l > criterio de error, asigne / = / + 1 y repita el corrector; si e < criterio de error, guarde el resultado como )/£., = y% ,)
0

a

u

}

E r r o r del corrector e s t i m a d o :

(Si el cálculo continúa, asigne /'=/'+ 1 y regrese al predictor.) FIGURA 2 6 . 5 La secuencia de fórmulas usadas para implementar el método de Heun de no autoinicio. Observe que es posible usar la estimación del error del corrector para modificar el corrector. Sin embargo, como esto puede afectar la estabilidad del corrector, el modificador no se incluye en este algoritmo. La estimación del error del corrector está incluida debido a su utilidad para el ajuste tamaño de paso.

ción (26.27) se puede usar para modificar el valor corregido de 6.360865 (e = —2.684%),
t

como en y? = 6.360865 6.360865 - 5.607005 „ „, ^ = 6.210093
n n n

el cual representa un e, = —0.25%. Así, el error se reduce un orden de magnitud. Para la siguiente iteración, el predictor [véase ecuación (26.13)] se usa para calcular y° = 2 + [ 4 e
a 8 ( 0 )

- 0.5(6.210093)] 2 = 13.59423

e, = 8 .42%

el cual es casi la mitad del error del predictor para la segunda iteración del ejemplo 26.3, que fue de e¡ = 18.6%. Esta mejora ocurre debido a que utilizamos aquí un estimado superior de y (6.210093 en lugar de 6,360865) en el predictor. En otras palabras, los errorea propagado y global se reducen por In inclusión del modificador corrector.

MÉTODOS RÍGIDOS Y D E M U L T I P A S O

Ahora debido a que tenemos información de la iteración anterior, la ecuación ( ¿6..(0) se puede emplear para modificar el predictor, como en y' = 13.59423 + -(6.360865 - 5.607005) = 14.19732
1

4

=

4.30%

lo cual, de nuevo, reduce el error a la mitad. Esta modificación no tiene efecto en la salida final del subsecuente paso corrector. Sin importar si se usan los predictores modificados o no modificados, el corrector por último convergerá sobre la respuesta correcta. Sin embargo, como la razón o eficiencia de convergencia depende de la exactitud de la predicción inicial, la modificación puede reducir el número de iteraciones requerido para la convergencia. La implementación del corrector da un resultado de 15.21178 (e, — —2.48%), el cual representa una mejora sobre el ejemplo 26.3 debido a la reducción del error global. Por último, este resultado se puede modificar usando la ecuación (26.27): y'¡' = 15.21178 15.21178 - 13.59423 = 14.88827 e, = - 0 . 3 0 %

De nuevo, el error se redujo un orden de magnitud.

Como en el ejemplo anterior, la inclusión de los modificadores incrementa tanto la eficiencia como la exactitud de los métodos multipaso. En particular, el corrector modificador efectivamente incrementa el orden de la técnica. Así, el método de Heun de no autoinicio sin modificadores es de tercer orden más que de segundo orden, como es el caso para la versión no modificada. Sin embargo, debería observarse que hay sitúa ciones donde el corrector modificador afectará la estabilidad del proceso de iteración del corrector. Como consecuencia, el modificador no se incluye en el algoritmo de Heun de no autoinicio bosquejado en la figura 26.5. No obstante, el corrector modifica dor puede todavía tener utilidad para el control de tamaño de paso, como se analizará después. 26.2.2 Control del t a m a ñ o de paso y p r o g r a m a s de cómputo

Tamaño de paso constante. Es relativamente simple desarrollar una versión tamano de paso constante del método de Heun de no autoinicio. La única complicación es que se requiere de un método de un paso para generar el punto extra necesario para comenzar el cálculo. Además, como se emplea un tamaño de paso constante, se debe elegir un valor <le h antes del cálculo. En general, la experiencia indica que un tamaño de paso óptimo debe ría ser lo suficientemente pequeño para asegurar la convergencia con dos iteraciones del corrector (Hull y Creemer, 1963). Además, debe ser lo suficientemente pequeño para dar un error de truncamiento lo más pequeño posible. Al mismo tiempo, el tamaño de paso debería ser tan grande como sea posible para minimizar el costo de ejecución y el error de redondeo. Como se hizo con los otros métodos para las EDO, la única forma práctica para asegurar la magnitud dol error global es comparando los resultados para el miimo problema pero con un t u a | | % é b t f i q a la mitad.

778

MÉTODOS RÍGIDOS Y DE MULTIPASO

FIGURA 2 6 . 6
Una gráfica que muestra cómo la estrategia de disminuir a la mitad y duplicar el paso permite el uso de b) valores calculados previamente para un método multipaso de tercer orden, a) Disminuyendo a la mitad; c) duplicando.

ejemplo, las fórmulas de Newton-Cotes de orden superior desarrolladas en el capítulo 21 se podrían usar para este propósito. Antes de hacer una descripción de esos métodos de orden superior, revisaremos his fórmulas de integración más comunes sobre las cuales están basadas. Como se mencionó antes, la primera de éstas son las fórmulas de Newton-Cotes. Sin embargo, hay una clase llamada fórmulas de Adams que también revisaremos y que a menudo resultan elegidas . Como se ilustra en la figura 26.7, la diferencia fundamental entre las fórmuhiN de Newton-Cotes y las de Adams se relaciona con la manera en la cual se aplica ln integral para obtener la solución. Como se ilustra en la figura 26.7a, las fórmulas de Newton-Cotes estiman la integral sobre un intervalo que abarca varios puntos. Esta integral se usa entonces para proyectar desde el inicio del intervalo hasta el final. En contrae te, las fórmulas de Adams (figura usan un conjunto de puntos de un intervalo para estimar únicamente la integral para el último segmento en el intervalo. Esta integral HC usa entonces para proyectar a través de este último segmento.

26.1b)

Fórmula» de Newton-Cotes, Alguna* de las fórmulas más conocidas para resolver •0UI0Í9MI diferenciales MrdlMafelatlifcMUl en el ajuste de una i n t a r n o l a o i A n

Am

26.2 H^08MULTIB»,SO

f l f

'u- =y¡+
í

\f(x,y)dx

FIGURA 26.7

Ilustración de la diferencia fundamental entre las fórmulas de integración de Newton-Cotes y Adams. a) Las fórmulas de Newton-Cotes usan una serie de puntos para obtener un estimado de la integral sobre un número de segmentos. La estimación se usa después para proyectar a través de todo el rango, b) Las fórmulas de Adams usan una serie de puntos para obtener la estimación de la integral para un solo segmento. El estimado después es usado para proyectar a través del segmento.

polinomios de n-ésimo grado con n + 1 valores conocidos de y y después con el uso de esta ecuación para calcular la integral. Como se analizó antes en el capítulo 21, las fórmulas de integración de Newton-Cotes se basan en tal procedimiento y son de dos tipos: formas abiertas y cerradas. Fórmulas abiertas. Para n puntos igualmente espaciados, las fórmulas abiertas se pueden expresar en la forma de una solución de una EDO, como se hizo antes para ln ecuación (26. I ) . La ecuación general para este propósito es
o

V)| I -

Y,

J',,(x)il.\

(26.31)

MÉT0D0S_Rl_GIDOS
y
i+l

dondef„(x) es una interpolación polinoinial de n-ésinio orden. I,a evaluación de la irilcY de DE integración MULTIPASOabierta de Newton-Cotes de /i-ésimo orden (véase gral emplea la fórmula la tabla 21.4). Por ejemplo, si n = 1,
= yi-i+2hfi (26.32)

donde f¡ es una abreviatura para f(x¡, y¡); es decir, la ecuación diferencial evaluada en .v, y y¡. Se hace referencia a la ecuación (26.32) como el método de punto medio, que se utilizó antes como predictor en el método de Heun de no autoinicio. Para n — 2, 3h
y¡+i = y¡~2 + y (/i- + fi-i)

y para n = 3 y = _ + y ( 2 / , - - / , „ ! + 2/}_ )
3 2

Ah

¡ + x

y í

(26.33)

La ecuación (26.33) se ilustra gráficamente en la figura 26.8a. Fórmulas cerradas. La forma cerrada se puede expresar de manera general como y,+\=y,-n+\+ I f„(x)dx (26.34)

donde la integral es aproximada por una fórmula de integración cerrada de Newton Cotes de «-ésimo orden (véase la tabla 21.2). Por ejemplo, para n = 1,

la cual es equivalente a la regla trapezoidal. Para n = 2, h.
y,

y¡+\ = y, + -j{fi + f¡+\).
+]

h

+ i = yi-i + + 4f¡ + f¡ ) (26.35) que es equivalente a la regla de Simpson 1/3. La ecuación (26.35) se ilustra en la figiiia 26.86. El otro tipo de fórmulas de integración que es posible usar resolver las EDO son las fórmulas de Adams. Muchos algoritmos de cómputo de uso generalizado para la solución de EDO por multipaso se basan en estos métodos. Fórmulas abiertas (deAdams-Bashforth). Las fórmulas de Adams se pueden dedil cir en diferentes formas. Una técnica es escribir una expansión de la serie de Tayloi alrededor de x¡.
y¡+i = y, + f¡h + y / í
2

Fórmulas cíe Ádams,
y,-ii - v, i /'(y; i

paui

+ y/¡

3

+ •••

que también puede escribirse como /, i ^ / , ' i •••] (7o.io)

Ilustración gráfica de las fórmulas de integración de Newton-Cotes abierta y cerrada, La fórmula abierta de tercer orden [véase ecuación b) la regla de Simpson [véase ecuación

F G IU R A2 6 . 8 o ) 1 / 3

( 2 6 . 3 5 ) ] .

( 2 6 . 3 3 ) ]y

Recuerde de la sección 4.1.3 que se puede usar una diferencia hacia atrás para aproximur la derivada:
f! = + 4+ + Olh )
2

f

h 2 la cual se puede sustituir en la ecuación (26.36), h { /, + h -

V; i l

=

.Vi

+

+

+

0(h )
2

+ -/, +

h

1

o, agrupnndo términos.

(26.37)

v,,i v , i /,(•]./; - ~ y .; ,j t W'T • W)

782 TABLA 26.1

MÉTODOS RÍGIDOS Y DE MULTIPASO Coeficiente y t r r o r da truncamiento para predictores de Adams-Bashforth.
E r r o r do truncamiento local

Ordan 1

0o

01

02

03

04

05

1

2

3/2

-1/2

3

23/12

-16/12

5/12

4

55/24

-59/24

37/24

-9/24

720 251/720

5

1 901/720

-2 774/720

2 616/720

-1 274/720

1 440 -475/720
1 9 0 8 7

6

4 277/720

-7923/720

9 982/720

-7 298/720

2 877/720

60 480

Esta fórmula es conocida comofórmula de Adams abierta de segundo orden. Las fórmulas de Adams abiertas son referidas también como fórmulas de Adams-Bashforth. En consecuencia, la ecuación (26.37) algunas veces es llamada segunda fórmula de AdamsBashforth. Es posible desarrollar fórmulas de Adams-Bashforth de orden superior al sustituir aproximaciones de diferencia superior en la ecuación (26.36). La fórmula de Adams abierta de w-ésimo orden puede ser representada por lo general como
n-l

yi
i+

=y¡+h^2
<t=o
k

Mt-k + 0(h )
n+l

(26.38)

Los coeficientes fi se ilustran en la tabla 26.1. La versión de cuarto orden se ilustra en la figura 26.9a. Observe que la versión de primer orden es el método de Euler. Fórmulas cerradas (deAdams-Moulton). Una serie de Taylor hacia atrás alrededor de x¡ se puede escribir como
+l

fi fu i 1 u2
i

•'i' + l

•'' + 1 1,3 i
+

y¡ = y<+\ - f+\ Al resolver p a r a y
¡ + 1

h

+ — se tiene -

h

~

~jr"

"'
+ • • •) (26.39)

yt+i = y¡ +h(f i
i+

+ jf¡'

+l

Se puede usar una h diferencia 2 para aproximar la primera derivada:

TABLA 26.2

Coeficientes y error de truncamltnto para predictores de Adams-Moulton. I r r o r de truncamiento local

Orden

p

0

/3,
1/2

0

2

0

3

0

4

0

5

1/2

5/12

8/12

-1/12

-—frVl(U
3
24 1/24 720 19/720 27 1 440 27/1440 863 60 480 106/720

12

9/24

19/24

-5/24

251/720

646/720

-264/720

475/1440

1427/1440

-798/1440

482/1440

-173/1440

/ if l' |)
7 6

la cual podrá sustituirse en la ecuación (26.39), y agrupando términos da 2 2 ')
f

f i + 1

+

y

~ 12

Esta fórmula es conocida como fórmula de Adams cerrada de segundo orden o segunda fórmula de Adams-Moulton. Observe también que es la regla trapezoidal. La fórmula de Adams cerrada de n-ésimo orden se puede escribir por lo general como
y¡+\ =

y¡+hJ2 Pkfi l-k rc-l k=0
+ k

+

0(h )
n+l

Los coeficientes ¡} se listan en la tabla 26.2. El método de cuarto orden se ilustra en la figura 26.96. 26.2.4 M é t o d o s m u l t i p a s o de o r d e n s u p e r i o r

Ahora que ya desarrollamos de manera formal las fórmulas de integración de Newton-. Cotes y Adams, podemos usarlas para deducir métodos multipaso de orden superior. Como ocurrió con el método de Heun de no autoinicio, las fórmulas de integración se aplican en serie como métodos predictor-corrector. Además, si las fórmulas abiertas y cerradas tienen errores de truncamiento local del mismo orden, es posible incorporar modificadores del tipo listado en la figura 26.5 para mejorar la exactitud y permitir el control del tamaño de paso. El cuadro 26.1 proporciona ecuaciones generales para esos modificadores. En la siguiente sección presentamos dos de los procedimientos multipaso de orden superior más comunes: el método de Milne y el método de Adams de cuarto orden. Método de Milne. El método de Milne es el más común de los métodos multipaso basado on las fórmulas de integración do Ncwton-Cotes. Usa la fórmula de NewtonC O I O H de tren puntos como un predictor:

784

MÉTODOS RÍGIDOS Y DE MULTIPASO

FIGURA

26.9

Ilustración gráfica de las fórmulas de integración de Adams abierta y cerrada, a) La cuarta fórmula de Adams-Bashforth abierta y b) la cuarta fórmula de Adams-Moulton cerrada.

( 2 / de T tres - /puntos T i + 2 (regla / £ ) de Simpson 1/3) como un y la fórmula +l cerrada de Newton-Cotes corrector:
T 2

y? = yr-3 +
¿ 1 = ^ + ^ 1 + ^

Ah

(26.40)

"

+

^

,

)

(26.41)

Los modificadores predictor y corrector para el método de Milne se desarrollarán u partir de las fórmulas del cuadro 26.1 y los coeficientes de error en las tablas 21.2 y 21.4: (26.42)

* P =

! ( * • - y ? )

« r - - 2 5 W "

+

| - r f | l )

(26.43)

Cuadro 2 6 . 1

Deducción d e relaciones generales p a r a modificadores Ahora, al dividir la ecuación entre r\ + V^JS^ multiplicar ol último término por 8JS y rearreglar se proporciona un estimado del error de truncamiento local del corrector
c p

I ,n relación entre el valor verdadero, la aproximación y el error tío un predictor puede representarse por lo general como Valor verdadero = y° , + ^ h"
H +

(B26.1.1)

E =
c

-

t] 8 + t] S
c p p

(B26.1.4)

c

donde r¡ y S = numerador y denominador de la constante del error de truncamiento para un predictor ya sea de Newton-Cotes abierto (tabla 21.4) o de Adams-Bashforth (tabla 26.1) y n es el orden.
p p

Para el modificador predictor, la ecuación (B26.1.3) se puedo resolver en el paso anterior por
h"y " \%)
l +l

= -

f r)t&p + rip8
S

(yf-yf)

c

Una relación similar se puede desarrollar para el corrector: Valor verdadero = f}

la cual podrá sustituirse en el término del error de la ecuación (B26.1.1) para dar
ripSc T) 8 + r¡pS
C P c

+x

- — A" y
+

, + 1 )

(| )
c

(B26.1.2)

(y?-y?)

(B26.1.5)

donde rj y 8 = numerador y denominador de la constante del error de truncamiento para un corrector ya sea de Newton-Cotes cerrado (tabla 21.2) o de Adams-Moulton (tabla 26.2). Como se bizo en la deducción de la ecuación (26.24), la ecuación (B26.1.1) se puede restar de la ecuación (B26.1.2) para dar
c C

o v+ ! y? " — - >/
m

r¡ + r}pS /Sp ,
c c

+1

( +1)

+l

Se

(?)

(B26.1.3)

Las ecuaciones (B26.1.4) y (B26.1.5) son versiones genéralo» de modificadores que se pueden usar para mejorar los algoritmo» multipaso. Por ejemplo, el método de Milne tiene r\ — 14, 8 •« 45, íj = 1, S = 90. Al sustituir estos valores en las ecuacione* (B26.1.4) y (B26.1.5) se obtiene las ecuaciones (26.43) y (26.42). Podrán desarrollarse modificadores similares para otros paren de fórmulas abiertas y cerradas que tengan errores de truncamiento local del mismo orden.
p p c c

EJEMPLO 26.5

Método de Milne

Enunciado del problema. Use el método de Milne para integrar}>'= 4e — 0.5y de x = 0 a x = 4 usando un tamaño de paso de 1. La condición inicial en x = 0 es y = 2. Como tratamos con un método multipaso se requiere de puntos previos. En una aplicación real, un método de un paso tal como un R K de cuarto orden podría usarse para calcular los puntos requeridos. Para el presente ejemplo, usaremos una solución analítica [recuerde la ecuación (E25.5.1) del ejemplo 25.5] para calcular los valores exactos en x¡_ = -2>,x¡_ = -2yx = - 1 de>>,._3 = - 4 . 5 4 7 3 0 2 , y¡_ = - 2 . 3 0 6 1 6 0 y>,_, = —0.3929953, respectivamente.
0Sx 3 2 Hl 2

Solución.

El predictor [véase ecuación (26.40)] se usa para calcular un valor e n * = 1: 4ÍD
e,

= 2.8%

y*} = - 4 . 5 4 7 3 0 + - y - [ 2 ( 3 ) - 1.99381 + 2(1.96067)] = 6.02272 El corrector [véase ecuación (26.41)] se emplea entonces para calcular i -0.3929953 + -[1.99381 + 4(3) + 5.890802] = 6.235210 -0.66%

Este resultado podrá sustituirse en la ecuación (26.41) para corregir el estimado en forma iterativa. Este proceso converge sobre un valor final corregido de 6.204855 (e, = -0,17%).

766

MÉTODOS RÍGIDOS Y DE MULTIPASO Este valor es más exacto que el estimado comparable de 6.360865 (e, = —2.68%) obtenido antes con el método de Heun de no autoinicio (véase los ejemplos 26.2 al 26.4). Los resultados para los pasos restantes sony(2) = 14.86031 (e = —0.11%), y(3) = 33.72426 (e = - 0 . 1 4 % ) yy(4) = 75.43295 (e = - 0 . 1 2 % ) .
t
(

t

Como en el ejemplo anterior, el método de Milne con frecuencia da resultados de alta exactitud. Sin embargo, hay ciertos casos donde su desempeño es pobre (véase Ralston y Rabinowitz, 1978). Antes de entrar en detalles sobre esos casos, describiremos otro procedimiento multipaso de orden superior (el método de Adams de cuarto orden). Método de Adams de cuarto orden. Un método popular de multipaso basado en las fórmulas de integración de Adams usa la fórmula de Adams-Bashforth de cuarto orden (véase la tabla 26.1) como el predictor:

y?

+l

= + *(§/, g/,-, +
m
yf' ~ y? +

f f, -2
m 4

-

¿/,

m 3

)

(26.44)

y la fórmula de Adams-Moulton de cuarto orden (véase la tabla 26.2) como el corrector:

yj

+ i

=

h(¿/¿i

1

+

f f,
4

m

-

¿ / T , + ¿/,-- )
2

(26.45)

Los modificadores predictor y corrector para el método de Adams de cuarto orden podrán desarrollarse a partir de las fórmulas del cuadro 26.1 y los coeficientes de error en las tablas 26.1 y 26.2 como
E

p

=

^ ( y " ' - y " )

(26-46) ( -47)
26

E - - — (v"< - v ° ) 270^ '
+ 1 + 1

EJEMPLO 2 6 . 6

Método de Adams de cuarto orden

Enunciado del problema. Use el método de Adams de cuarto orden para resolver el mismo problema que en el ejemplo 26.5. Solución. El predictor [véase ecuación (26.44)] se usa para calcular un valor e n * = 1.

'55 59 37 y® = 2 + l ( ^ 9.9 + +^ 1 ..9 6 0 6 6 7 - ^ 2 . 6 3 6 5 2 2 8 ) = 6.007539 —33 - ^ 1 .1 93 98 31 841 4 — ,24 24 24 24 3.1% que es comparable al resultado mediante el uso del método de Milne pero algo menos exacto. El corrector [véase ecuación (26.45)] se emplea entonces para calcular i = 2 +1
1

v

/ o 19 —5.898394 I 3 V24 24

5 1 \ — 1.993814 H 1.900666 = 6.253214 24 24 /

*, « - 0 . 9 6 %

¥

2é.l4HIPDn8MULTIfift80

ÍES?

ol cual en ilo nuevo comparable, pero monos exucto que ol resultado producto del método de Milne. linio resultado se puede sustituir en la ecuación (26.45) para corregir de muñera iterativo el estimado. E l proceso converge sobre un valor final corregido de 6.214424 (e, = 0.32%), que es un resultado exacto, pero otra vez algo inferior al que se obtuvo con el método de Milne.

Estabilidad de métodos multipaso. La exactitud superior del método de Milne exhibida en los ejemplos 26.5 y 26.6 podría anticiparse con base en los términos de error para los predictores [véase ecuaciones (26.42) y (26.46)] y los correctores [véase ecuaciones (26.43) y (26.47)]. Los coeficientes para el método de Milne, 14/45 y 1/90, son más pequeños que los de Adams de cuarto orden, 251/720 y 19/720. Además, el método de Milne emplea menos evaluaciones de la función para alcanzar esas altas exactitudes. De acuerdo con el valor, esos resultados podrían llevarnos a la conclusión de que el método de Milne es superior y, por lo tanto, preferible a los de Adams de cuarto orden. Aunque esta conclusión se cumple para la mayoría de los casos, hay ocasiones en las que el método de Milne se desempeña inaceptablemente. Tal comportamiento se exhibe en el siguiente ejemplo.
EJEMPLO 2 6 . 7 Estabilidad de los métodos de Milne y Adams de cuarto orden

| Enunciado del problema. j para resolver

Emplee los métodos de Milne y Adams de cuarto orden

FIGURA 26.10

Ilustración gráfica de la inestabilidad del método de Milne.

0.005

-

. Método de Milne Solución verdadera

«te» -urtii

788

MÉTODOS RÍGIDOS Y DE MULTIPASO

j con la condición inicial de que y = 1 e n * = 0. Resuelva esta ecuación de x = 0 ax = 10 usando un tamaño de paso de h = 0.5. Observe que la solución analítica es y = e~ . j /
x

|

i

Solución. Los resultados, como se resumen en la figura 26.10, indican problemas con el método de Milne. Poco después del inicio del cálculo, los errores empiezan a crecer y oscilar en signo. Para x = 10 el error relativo ha crecido al 2 8 3 1 % y el mismo valor predicho comienza a oscilar en signo. En contraste, los resultados para el método de Adams podrían ser mucho más aceptables. Aunque el error también crezca, lo haría a razón lenta. Además, las discrepancias podrían no exhibir los extraños cambios en signo expuestos por el método de Milne.

El inaceptable comportamiento manifestado en el ejemplo anterior por el método de Milne es referido como una inestabilidad. Aunque no siempre ocurre, tal posibilidad nos lleva a la conclusión de que el procedimiento de Milne debería evitarse. Así, el método de Adams de cuarto orden es normalmente el preferido. La inestabilidad del método de Milne se debe al corrector. En consecuencia, se ha hecho intentos para rectificar el defecto al desarrollar correctores estables. Una alternativa usada comúnmente que emplea este procedimiento es el método de Hamming, el cual usa el predictor Milne y un corrector estable:
i yi
i+

-

W

-y?-2

+ Hyti
8

+ fr
2

-

fr-i)

que tiene un error de truncamiento local:

El método de Hamming también incluye modificadores de la forma

£

< = - I 5 I « " « - A , )

El lector puede obtener información adicional sobre éste y otros métodos multipaso en muchas fuentes (Hamming, 1973; Lapidus y Seinfield, 1971).

PROBLEMAS
26.1 Dada — = —100 OOOy + 100 OOOe" ' - e~*
1

a) ^

dx

-UMMluclón de x - 0 a 2 mando un tamaño de paio de 0.1.

Estime el tamaño de paso necesario para mantener estabilidad mediante el uso del método de Eulcr explícito. Sl^(0) ~ 0, use el método de Euler implícito para obtener

P R O B L E M A S
26.2 Dada = 30(sen t - y) + 3 eos t

719
Use un tamaño de paño do 0.5 y valores iniciales dey(2.5) = 1.2, y(3) = 1,^(3.5) = 0.8571429 y y(4) = 0.75. Obtenga sus soluciones usando las siguientes técnicas: a) el método de Heun de no autoinicio (e = 1%) y b) el método de Adams de cuarto orden (e = 0.01%). [Nota: las respuestas exactas obtenidas de manera analítica son,y(4.5) = 0.6666667 y y(5) = O.6.] Calcule los errores relativos porcentuales s, para sus resultados. 26.7Resuelva el siguiente problema de valor inicial de x = 0 a x = 0.5:
s s

dt

Si y (0) = 1, use el método de Euler implícito para obtener una solución de x = 0 a 2 usando un tamaño de paso de 0.4. 26.3 Dada ^ í - = 999.x, + 1 999x dt
2

^ = 1 OOOx, - 2 000x, dt Si x (0) = x (0) = 1, obtenga una solución de t = 0 a 0.2 mediante un tamaño de paso de 0.05 con los métodos de Euler a) explícito y b) implícito. 26.4 Resuelva el siguiente problema de valor inicial sobre el intervalo que va de * = 2 a x = 3:
{ 2

Use el método de Heun de no autoinicio con un tamaño de paso de 0.25. Si y(-0.25) = 1.277355, emplee un método RK de cuarto orden con un tamaño de paso de 0.25 para predecir el valor de inicio eny(0). 26.8 Resuelva el siguiente problema de valor inicial deje = 1.5 a x = 2.5: dy_ _ -y dx 1+ x Use el método de Adams de cuarto orden. Emplee un tamaño de paso de 0.5 y el método RK de cuarto orden para predecir los valores de inicio si y(Q) = 2. 26.9 Desarrolle un programa para el método de Euler implícito para una sola EDO lineal. Pruébelo con los datos del ejemplo 26,1 b. 26.10 Desarrolle un programa por el método de Euler implícito para un par de EDO lineales. Pruébelo al resolver la ecuación (26.6). 26.11 Desarrolle un programa de uso amigable para el método de Heun de no autoinicio sin un modificador predictor. Emplee un método RK de cuarto orden para calcular los valores de inicio. Pruebe el programa con los datos del ejemplo 26.3. 26.12 Use el programa que desarrolló en el problema 26.11 para resolver el problema 26.7.

dx Use el método de Heun de no autoinicio con un tamaño de paso de 0.5 y condiciones iniciales dey(1.5) = 5.222138 yy(2.0) = 4.143883. Itere el corrector para e — 0.1%. (Nota: los resultados exactos obtenidos analíticamente son y(2.5) = 3.27388 y yQ.O) = 2.577988.] Calcule los errores relativos porcentuales verdaderos £, para sus resultados. 26.5 Repita el problema 26.4, pero ahora use el método de Adams de cuarto orden (e = 0.0\%). (Nota: y(0.5) = 8.132548yy(1.0) = 6.542609.] Itere el corrector con e = 0.01%. 26.6 Resuelva el siguiente problema de valor inicial de x = 4 a 5:
s s s

ÍL dx

=

_Z

x

CAPÍTULO 2 7 Problemas de valores en la frontera y de valores propios
De nuestro análisis al inicio de la parte siete, recuerde que una ecuación diferencial ordinaria se acompaña de condiciones auxiliares. Estas condiciones se usan para evaluar las constantes de integración que resultan durante la solución de la ecuación. Para una ecuación de n-ésimo orden, se requieren n condiciones. Si todas las condiciones se especifican en el mismo valor de la variable independiente, entonces estamos tratando con un problema de valor inicial (véase figura 27. la). Hasta aquí, el material de la parte siete se ha dedicado a este tipo de problema.

FIGURA

27.1

Problemas de valor inicial contra valores a la frontera. a) Un problema de valor Inicial donde todas las condiciones se especifican en el mismo valor de la variable independiente. b) Un problema con valores a la frontera donde las condiciones se especifican on diferentes valores de la variable independiente.

d!K

dy

2

dt

• W y,. y )
2
0

donde en f = 0, y, = y,

y y¡ =

y

20

Condiciones iniciales

donde en x = 0 , y = y

0

x=L,y

=y

L

Condición frontera

Condición frontera

Hn contraje, hay otra aplicación en la cual las condiciones no son conocidas en un solo punto, sino, más bien, son conocidas en diferentes valores de la variable independiente. Como estos valores se especifican a menudo en los puntos extremos o fronteras de un sistema, se les conoce como problemas de valores en la frontera (véase figura 27.16). Una variedad de importantes aplicaciones en ingeniería están dentro de esta clase. En este capítulo analizamos dos procedimientos generales para obtener su solución: el método de disparo y la aproximación por diferencias finitas. Además, presentamos técnicas para enfocar un tipo especial de problema de valores en la frontera: la determinación de valores propios. Por supuesto, los valores propios también tienen muchas aplicaciones que van más allá de las que involucran problemas de valores en la frontera. MÉTODOS GENERALES PARA PROBLEMAS DE V A L O R E S E N LA F R O N T E R A Se puede usar la conservación del calor para desarrollar un balance de calor para una barra larga y delgada (véase figura 27.2). Si la barra no está aislada en toda su longitud y el sistema se encuentra en estado estable, la ecuación resultante es ^+h'(T -T)=0
a 2

(27.1)

donde /¡'es un coeficiente de transferencia de calor (cm~ ) que parametriza la razón de disipación de calor con el aire circundante, y T es la temperatura del aire circundante (°Q. Para obtener una solución para la ecuación (27.1) se deben tener las condiciones en la frontera adecuadas. Un caso simple se presenta donde los valores de las temperaturas en los extremos de la barra se mantienen con valores fijos. Estos valores se pueden expresar matemáticamente como
a

T(0) = Ti T{L) = T
2

Con estas condiciones, la ecuación (27.1) se puede resolver de manera analítica mediante el cálculo. Para una barra de 10 metros con T = 20, T = 40, T = 200 y h' = 0.01, el resultado es
a x 2

FIGURA

27.2

Una barra uniforme no aislada colocada entre dos cuerpos de temperatura constante, pero diferente. Para este caso, I > 7 y í > T .
t 2 2 a

792

PROBLEMAS DE VALORES E N LA FRONTERA Y DE VALORES PROPIOS

T = 73.4523é>

au

- 53.4523<T

au

+ 20

(27.2)

En las siguientes secciones, se resolverá el mismo problema usando procedimientos numéricos. 27.1.1 El método de d i s p a r o

El método de disparo se basa en convertir el problema de valor en la frontera en un problema equivalente de valor inicial. Posteriormente se implanta un procedimiento de prueba y error para resolver la versión de valor inicial. El procedimiento se puede ilustrar con un ejemplo.
EJEMPLO 27 .1 El método de disparo

Enunciado del problema. Úsese el método de disparo para resolver la ecuación (27.1), para una barra de 10 metros con h' = 0.01 m , T = 20, y las condiciones frontera
- 2 a

7(0) = 4 0

T(10)=200

Solución. Usando el mismo procedimiento que se empleó para transformar la ecuación (PT7.2) en las ecuaciones (PT7.3) y (PT7.6), la ecuación de segundo orden se puej de expresar como dos EDO de primer orden: — = i dx (E27.1.1)

i

%= ' -

h (T Ta)

(E27.1.2)

Para resolver estas ecuaciones, se requiere un valor inicial para z. Por el método de disparo, intuimos un valor (digamos, z(0) = 10). Entonces, la solución se obtiene integrando las ecuaciones (E27.1. 1) y (E27.1.2) simultáneamente. Por ejemplo, mediante un método RK de cuarto orden con un tamaño de paso de 2, obtenemos un valor en el extremo del intervalo de 7/(10) = 168.3797 (véase figura 27.3a), el cual difiere de las condiciones frontera de 7/(10) = 200. Por tanto, debemos hacer otra suposición, z(0) = 20, y realizar de nuevo el cálculo. Esta vez, se obtiene el resultado de 7(10) = 285.8980 (véase figura 27.36). Ahora, como la EDO original es lineal, los valores t z(0) = 10
7

7*(10) = 168.3797

I
|

z(0)=20

7/(10) = 285.8980

J están relacionados linealmente. Así, pueden ser usados para calcular el valor de z(0) que dé 71(10) = 200. Se puede emplear una fórmula de interpolación lineal [recuerde la eouaeión (18.2)] para este proeiiifc*

27. 1 '

MtPPCT OCNiRAttS PARA P^^éi^üCÉH' ÉNIA HttMliÁ 7W

FIGURA 27.3

El método de disparo: o) el primer "disparo", b) el segundo "disparo" y c) el "golpe" final exacto.

2 (0) = 10 +
v

——— (200 - 168.3797) = 12.6907 2 8 5 . 8 9 8 0 - 168.3797

í |

Entonces, este valor puede ser usado para determinar la solución correcta, como se ilustra en la figura 27.3c.

preoim il ente

Problema» no lineales de dos puntos. Para problemas no lineales con valores en la frontera, IB Interpolación lineal o extrapolación a través de dos puntos de solución no da como resultado una eitimación exacta de la condición a la frontera requerida p i n «luan/ar una solución exacta, Una alternativa es realizar tres aplicaciones del

794

PROBLEMAS DE VALORES EN LA FRONTERA Y DE VALORES PROPIOS

método de disparo y usar una interpolación cuadrática del polinomio para eslimar la condición frontera adecuada. Sin embargo, es improbable que este procedimiento dé la respuesta exacta, y se necesitarían iteraciones adicionales para obtener la solución. Otro procedimiento para un problema no lineal implica reformularlo como un problema de raíces. Recuerde que la forma general de un problema de raíz es hallar el valor de x que haga que la función f(x) = 0. Ahora, usemos el ejemplo 27.1 para entender cómo se puede reformular en esta forma el método de disparo. Primero, reconocemos que la solución del par de ecuaciones diferenciales es también una "función" en el sentido que suponemos una condición en el extremo izquierdo de la barra, z , y la integración nos da una predicción de la temperatura en el extremo derecho, r . Así, podemos pensar en la integración como
0 1 0

TÍO

=

/(zo)
0

Es decir, esto representa un proceso por medio del cual una suposición de z da una predicción de T . Visto de esta manera, podemos ver que lo que deseamos es el valor de z que dé un valor específico de T . Si, como en el ejemplo, deseamos r = 200, podemos plantear el problema como
l0 0 w 1 0

200 = / ( z )
0

Al llevar la meta de 200 al lado derecho de la ecuación, generamos una nueva función, g(z ), que representa la diferencia entre lo que tenemos, f(x ), y lo que queremos, 200.
0 0

8(z )
0

= / ( z ) - 200
0

Si llevamos esta nueva función a cero, obtendremos la solución. El siguiente ejemplo ilustra el procedimiento.
EJEMPLO 2 7 . 2

El método del disparo p a r a problemas no lineales Enunciado del problema. Aunque sirvió para nuestros propósitos de probar un problema simple de valores en la frontera, nuestro modelo para la barra en la ecuación (27.1) no fue muy realista. Tal barra podría perder calor por mecanismos tales como la radiación, que son no lineales. Supóngase que la siguiente EDO no lineal se usa para simular la temperatura de ln barra calentada: dT
2

donde h " — 5 X 10~ . Ahora, aunque todavía no es una muy buena representación de ln transferencia de calor, esta ecuación es lo suficientemente clara para permitirnos ilustrar cómo se puede usar el método del disparo para resolver un problema no lineal de diw puntos con valores en la frontera. Las condiciones restantes del problema son las que se especifican en el ejemplo 27.1.
8

Ix

1

h"(T

a

-T)

4

= 0

lab

Solución. L a ecuación de segundo orden se puede expresar como dos EDO de primor orden!" • • • ' • • • U W M *«M< I « V < 1

i
i

i

dT dx

_

^-= "(T-T )*
h a

í

1 ¡ | ! |

Ahora, estas ecuaciones se pueden integrar usando cualquiera de los métodos descritos en los capítulos 25 y 26. Usamos la versión de tamaño de paso constante del procedimiento RK de cuarto orden descrito en el capítulo 25. Pusimos en práctica este procedimiento como una función macro de Excel escrita en Visual BASIC. La función integró las ecuaciones con base en un valor inicial para z(0) y dio el resultado de la temperatura en x = 10. La diferencia entre este valor y la meta de 200 se introdujo después en una celda de la hoja de cálculo. El Solver de Excel se utilizó entonces para ajustar el valor de z(0) hasta que la diferencia fuera cero. El resultado se muestra en la figura 27.4 junto con el caso lineal original. Como se esperaba, el caso no lineal está más curvado que el modelo lineal. Esto se debe a la cuarta potencia en la relación de transferencia de calor. El método de disparo se vuelve difícil para ecuaciones de orden superior, donde la necesidad de suponer dos o más condiciones hace algo más difícil el procedimiento. Por estas razones, se dispone de métodos alternos, que se describen a continuación. 27.1.2 Métodos por diferencias f i n i t a s

Las opciones alternas más comunes del método de disparo son los procedimientos por diferencias finitas. En estas técnicas, las diferencias divididas finitas se sustituyen por las derivadas en la ecuación original. Así, una ecuación diferencial lineal se transforma en un conjunto de ecuaciones algebraicas simultáneas que pueden ser resueltas usando los métodos de la parte tres.

PROBLEMAS DE VALORES EN LA FRONTERA Y DE VALORES PROPIOS

Para el caso de la figura 27.2, la aproximación por diferencias divididas finitas para la segunda derivada es (recuerde la figura 23.3)
dT
2 =

r,-

+ 1

-2r,+r,_

1

dx

2

Ax

2

Esta aproximación se puede sustituir en la ecuación (27.1) para dar

Agrupando términos da -Ti-! +(2 + h'Ax )T¡
2

- Ti
i+

= h'Ax T
2

a

(27.3)

Esta ecuación es válida para cada uno de los nodos interiores de la barra. Para los nodos interiores primero y último, T _ yT , respectivamente, se especifican por las condiciones frontera. Por tanto, el conjunto resultante de ecuaciones algebraicas lineales será tridiagonal. Como tal, se puede resolver con los eficientes algoritmos de que se dispone para tales sistemas (véase la sección 11.1).
t x ¡+l

EJEMPLO 2 7 . 3

Aproximación por diferencias finitas de problemas con valores a la frontera

j \

Enunciado del problema. Use el procedimiento por diferencias finitas para resolver el mismo problema del ejemplo 27.1. Solución. Empleando los parámetros del ejemplo 27.1, podemos escribir la ecuación (27.3) para la barra mostrada en la figura 27.2. El uso de cuatro nodos interiores con un segmento de longitud Ax = 2 metros, da como resultado las siguientes ecuaciones: [2.04 -1 0 0 -1
[_

; •

o

-1 2.04 -1 0 2.04 0

0 -1 2.04 -1 -1 -1

0 0 -1 2.04 2.04

Ti T Tz T
2 A

40.8 0.8 0.8 200.8

las cuales se pueden resolver para {T}
T

= L 65.9698

93.7785

124.5382

159.4795 J

La tabla 27.1 proporciona una comparación entre la solución analítica [véase ecuación (27.2)] y las soluciones numéricas obtenidas en los ejemplos 27.1 y 27.3. Observe que hay algunas discrepancias entre los procedimientos. Para ambos métodos numéricos, estos errores se pueden mitigar disminuyendo sus respectivos tamaños de paso. Aunque las dos técnicas se desempeñan bien para el caso actual, se prefiere el procedimiento por diferencias finitas debido a la facilidad con la que se puede extender a casos más complejos.

TABLA 27.1

w.

Comparación de la solución anall lea exacta con los métodos de disparo y de diferencias finitas.
Verdadera M é t o d o de d i s p a r o Diferencias finitas

0 2 4 6

40 65.9518 93.7478 124.5036 159.4534 200

40 65.9520 93.7481 124.5039 159.4538 200

40 65.9698 93.7785 124.5382 159.4795 200

Además de los métodos por diferencias finitas y de disparo, existen otras técnicas disponibles para resolver problemas con valores a la frontera. Algunos de éstos se describen en la parte siete. Éstos incluyen soluciones en estado estable (capítulo 29) y transitorio (capítulo 30) de problemas con valores a la frontera en dos dimensiones, usando soluciones por diferencias finitas y en estado estable del problema unidimensional dentro de la aproximación del elemento finito (capítulo 31).

27.2

P R O B L E M A S DE V A L O R E S P R O P I O S Los problemas de valores propios, o de valores característicos, son una clase especial de problemas con valores a la frontera que son comunes en el contexto de problemas de ingeniería que involucran vibraciones, elasticidad y otros sistemas oscilantes. Además, se usan en una amplia variedad de contextos en ingeniería que van más allá de problemas de valores en la frontera. Antes de describir los métodos numéricos para resolver esos problemas, presentaremos alguna información general como antecedente. Esta incluye el análisis de la importancia tanto matemática como ingenieril de los valores propios. 27.2.1 Antecedentes matemáticos

En la parte tres se estudian métodos para resolver conjuntos de ecuaciones algebraicas lineales de la forma general [A]{X] = {B} Tales sistemas son llamados no homogéneos debido a la presencia del vector {B} en el lado derecho de la igualdad. Si las ecuaciones correspondientes a tal sistema son linealmente independientes (es decir, que tienen un determinante distinto de cero), tendrán una solución única. En otras palabras, existe un conjunto de valores x que equilibrará las ecuaciones. En contraste, un sistema algebraico lineal homogéneo tiene la forma general \A]\X} = 0 Aunque ion posibles las soluciones no triviales (es decir, soluciones direntes de todas las x • 0) de tales sistemas, generalmente no ion únicas. En lugar de esto, las ecuaciones

PROBLEMAS DE VALORES EN LA FRONTERA Y DE VALORES PROPIOS

simultáneas establecen relaciones entre las x que se pueden satisfacer por diferentes combinaciones de valores. Comúnmente, los problemas de valores propios relacionados con la ingeniería tienen la forma general (an - X)xi + ax
l2 2

-1
2

1h

ax
Xn 2n

n

—0 = O

0 2 1 * 1 + ( « 2 2 - X)x -\

ax

n

a xi+
nl

a„ x
2

2

-I

f- (a„„ - k)x

n

—O

donde X es un parámetro desconocido llamado valor propio, o valor característico. Una solución {X] para tal sistema se conoce como vector propio. El conjunto de ecuaciones anterior puede también ser expresado de manera concisa como [[A]-X[I]]{X}=0 (27.4)

La solución de la ecuación (27.4) depende de la determinación de X. Una manera de realizarlo se basa en el hecho que el determinante de la matriz [[A] — X[7]] debe ser igual a cero para que existan soluciones no triviales. La expansión del determinante da un polinomio en X. Las raíces de este polinomio son las soluciones de los valores propios. En la siguiente sección se proporcionará un ejemplo de este procedimiento. 27.2.2 Antecedentes físicos

El sistema masa-resorte de la figura 27.5a es un contexto simple para ilustrar cómo ocurren los valores propios en los problemas físicos. También ayudará a ilustrar algunos de los conceptos matemáticos presentados en la sección anterior.

FIGURA

27.5

Al colocar las masas lejos de su equilibrio se crean fuerzas en los resortes que, después de liberadas, hacen oscilar las masas. Las posiciones de las masas pueden estar referidas a coordenadas locales con orígenes en sus respectivas posiciones de equilibrio.

VALORES F T O r que W cada masa ™ Pnrn simplificar el análisis, suponga no está sujcla n fuerzas externas o de amortiguamiento. Además, suponga que cada resorte tiene la misma longitud natural / y la misma constante de resorte k. Por último, suponga que el desplazamiento de cada resorte se mide con relación a su sistema coordenado local con un origen en la posición de equilibrio del resorte (véase figura 21.5b). Bajo estos supuestos, se puede emplear la segunda ley de Newton para desarrollar un balance de fuerzas para cada masa (recuerde la sección 12.4), dx
2 x

27.^Y'|JBf|l|BrPE

It

2

= —kx\ + k(x

2

X\)

- A - , ) - kx dt donde x¡ es el desplazamiento de la masa i respecto de su posición de equilibrio (véase figura 27. 5b). Estas ecuaciones se pueden expresar como d X\ k(-2x¡ + x ) = 0 (27.5a) ~dt ~
2 T 2