Sum´rio a

I Sistemas Lineares
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7
9 9 9 10 12 13 15 15 17 21 21 23 24 25 25 28 30 31 31 34 35 37 39 39 42 47

1 Exemplos de aplica¸˜es de sistemas lineares co 1.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . ca 1.2 Provetas . . . . . . . . . . . . . . . . . . . . . . . 1.3 Petr´leo . . . . . . . . . . . . . . . . . . . . . . . o 1.4 Cores . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Interpola¸˜o polinomial . . . . . . . . . . . . . . ca 1.6 Outros problemas de determina¸˜o de polinˆmios ca o 1.7 Splines . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Problemas de contorno . . . . . . . . . . . . . . . 2 Entendendo os sistemas lineares 2.1 Sistemas lineares e interse¸˜es de hiperplanos co 2.2 Transforma¸˜es lineares . . . . . . . . . . . . co 2.3 Nota¸˜o e interpreta¸˜o . . . . . . . . . . . . ca ca 2.4 Invers˜o de matrizes . . . . . . . . . . . . . . a 2.5 Explorando a linearidade . . . . . . . . . . . 2.6 Existˆncia e unicidade de solu¸˜es . . . . . . e co 2.7 Injetividade, sobrejetividade... glup! . . . . . 2.8 O determinante . . . . . . . . . . . . . . . . . 2.8.1 Dimens˜o 2 . . . . . . . . . . . . . . . a 2.8.2 Dimens˜o 3 . . . . . . . . . . . . . . . a 2.8.3 Dimens˜o n . . . . . . . . . . . . . . . a 2.9 Quadro comparativo . . . . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

3 O M´todo de Escalonamento e 3.1 O m´todo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 3.2 Algarismos significativos . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 O determinante no M´todo de Escalonamento . . . . . . . . . . . . . . . e 1

2 3.4 3.5 A desvantagem da Regra de Cramer . . . . . . . . . Sistemas mal-condicionados e refinamento de solu¸˜o ca 3.5.1 Sistemas mal-condicionados . . . . . . . . . . 3.5.2 Matrizes de Hilbert . . . . . . . . . . . . . . . 3.5.3 Refinamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

´ SUMARIO . . . . . . . . . . . . . . . 48 50 50 51 52 57 57 58 61 61

4 M´todos iterativos e 4.1 O M´todo de Jacobi . . . e 4.2 Crit´rio das Linhas . . . . e 4.3 Crit´rio de parada . . . . e 4.4 O M´todo de Gauss-Seidel e

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

II

Ajuste de Fun¸˜es co
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

67
69 69 70 71 71 72 73 74 75 75 81 81 82 83 85 87 87 88 88 91 93 93 95

5 Ajuste de fun¸˜es co 5.1 O problema do ajuste . . . . . . 5.2 Os m´ ınimos quadrados . . . . . . 5.3 Parˆmetros . . . . . . . . . . . . a 5.3.1 Densidade . . . . . . . . . 5.3.2 Caten´ria . . . . . . . . . a 5.3.3 Naftalinas e fun¸˜es afins co 5.3.4 Decaimento exponencial . 5.3.5 Leis de potˆncia e fractais e 5.3.6 Gaussiana . . . . . . . . .

6 Fun¸˜es lineares nos parˆmetros co a 6.1 Dependˆncia linear dos parˆmetros . . . . . . . . e a 6.2 Cont´ ınuo vs. discreto . . . . . . . . . . . . . . . . 6.3 Um parˆmetro . . . . . . . . . . . . . . . . . . . a 6.4 Dois parˆmetros . . . . . . . . . . . . . . . . . . a 6.5 Ajuste de qualquer fun¸˜o linear nos parˆmetros ca a 6.6 O caso cont´ ınuo . . . . . . . . . . . . . . . . . . . 6.7 Exemplos . . . . . . . . . . . . . . . . . . . . . . 6.7.1 Dinamˆmetro . . . . . . . . . . . . . . . . o 6.7.2 Cosseno aproximado por um polinˆmio . o

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

7 Levando a s´rio o produto escalar e 7.1 Produto escalar e distˆncia . . . . . . . . . . . . . . . . . . . . . . . . . a 7.2 Existˆncia e unicidade de solu¸˜es no ajuste linear . . . . . . . . . . . . e co

´ SUMARIO 7.3 7.4 O caso cont´ ınuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Outros produtos escalares: pesos . . . . . . . . . . . . . . . . . . . . . .

3 97 98 101 101 103 105 106 109

8 Fam´ ılias ortogonais 8.1 Defini¸˜es e exemplos . . . . . . . . . . . . . . . . co 8.2 Calculando polinˆmios ortogonais por recorrˆncia . o e 8.3 Um exemplo de aplica¸˜o de polinˆmios ortogonais ca o 8.4 Exemplo de an´lise harmˆnica . . . . . . . . . . . a o 8.5 Uso de fun¸˜es tabeladas por mudan¸a de vari´vel co c a

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

III

Equa¸˜es e Zeros de Fun¸˜es co co

111
113 113 114 114 117 120 121 125 125 126 127 128 130 135 137 138 141 142 145 147 149 151 153

9 Zeros de fun¸˜es e o M´todo da Dicotomia co e 9.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . ca 9.2 Raiz c´bica de 10 . . . . . . . . . . . . . . . . . . . u 9.3 P´ra-quedista ou bolinha em queda dentro d’´gua a a 9.4 O cilindro deitado . . . . . . . . . . . . . . . . . . 9.5 Caten´ria . . . . . . . . . . . . . . . . . . . . . . . a 9.6 M´todo da Dicotomia . . . . . . . . . . . . . . . . e

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

10 M´todos iterativos e 10.1 Plano geral . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Pontos fixos . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Fun¸˜es auxiliares candidatas . . . . . . . . . . . . . . co 10.4 Visualizando itera¸˜es . . . . . . . . . . . . . . . . . . co 10.5 Iterando perto de pontos fixos . . . . . . . . . . . . . . 10.6 Teorema do Valor M´dio e velocidade de convergˆncia e e ∗ ) = 0: convergˆncia quadr´tica . . 10.6.1 O caso ϕ (x e a 10.7 Calculando zeros de fun¸˜es - a escolha de ϕ . . . . . co 10.8 A escolha de x0 . . . . . . . . . . . . . . . . . . . . . . 10.9 Um crit´rio de parada . . . . . . . . . . . . . . . . . . e 11 O M´todo de Newton e 11.1 Quando o M´todo de Newton funciona? . . . e 11.1.1 Retirando a hip´tese f (x∗ ) = 0 . . . . o 11.2 M´todo de Newton em dimens˜es mais altas . e o 11.2.1 Determina¸˜o da forma de uma corda ca

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

4

´ SUMARIO

IV

Interpola¸˜o Polinomial ca

155
157

12 Estimativa do erro nas interpola¸˜es co

13 T´cnicas de interpola¸˜o e ca 163 13.1 Polinˆmios de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 o 13.2 Forma de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 13.2.1 Exemplo do uso da forma de Newton . . . . . . . . . . . . . . . . 167

V

Integra¸˜o de Fun¸˜es ca co

171
173 173 174 176 179 180 185 186

14 Importˆncia da integra¸˜o num´rica a ca e 14.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . ca 14.2 C´lculo de ´reas . . . . . . . . . . . . . . a a 14.3 Comprimento de curvas e gr´ficos . . . . . a 14.4 Distˆncia percorrida e tempo decorrido . . a 14.5 Per´ ıodo do pˆndulo e as integrais el´ e ıpticas 14.6 C´lculo de π e de logaritmos . . . . . . . a 14.7 A gaussiana . . . . . . . . . . . . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

15 M´todos de integra¸˜o num´rica e ca e 187 15.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 ca 15.2 O M´todo dos Trap´zios . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 e e 15.3 O M´todo de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 e 16 Estimativa do erro nos m´todos de integra¸˜o e ca 193 16.1 F´rmulas de erro e compara¸˜o dos m´todos . . . . . . . . . . . . . . . . 193 o ca e 16.2 Aplica¸˜o das f´rmulas de erro . . . . . . . . . . . . . . . . . . . . . . . 195 ca o 17 Obten¸˜o das f´rmulas de erro ca o 17.1 Primeira Abordagem - M´todo dos Trap´zios e e 17.2 Primeira Abordagem - M´todo de Simpson . e 17.3 Segunda Abordagem - M´todo dos Trap´zios e e 17.4 Segunda Abordagem - M´todo de Simpson . . e 17.5 Terceira Abordagem - M´todo dos Trap´zios . e e 17.6 Terceira Abordagem - M´todo de Simpson . . e 201 202 203 204 205 206 206

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

´ SUMARIO

5

VI

Equa¸˜es Diferenciais co

209
211 211 213 214 214 214 215 216 217 218 220 220 221 223 227 227 228 230 233 235 240 243 243 244 246 247 249 250 252 257 258 260 261 262

18 Breve introdu¸˜o `s equa¸˜es diferenciais ca a co 18.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . ca 18.2 Solu¸˜o de equa¸˜es autˆnomas e separ´veis . . . . . . . . ca co o a 18.3 Alguns exemplos . . . . . . . . . . . . . . . . . . . . . . . 18.3.1 Naftalinas . . . . . . . . . . . . . . . . . . . . . . . 18.3.2 Crescimento populacional a taxas constantes . . . 18.3.3 P´ra-quedista . . . . . . . . . . . . . . . . . . . . . a 18.3.4 Crescimento populacional com restri¸˜es de espa¸o co c 18.3.5 Caten´ria . . . . . . . . . . . . . . . . . . . . . . . a 18.3.6 Escoamento de um copo furado . . . . . . . . . . . 18.3.7 Dada ϕ do M´todo de Newton, quem ´ f ? . . . . . e e 18.3.8 Transferˆncia de calor . . . . . . . . . . . . . . . . e 18.4 Entendimento qualitativo de equa¸˜es autˆnomas . . . . . co o 18.5 Equa¸˜es diferenciais com mais vari´veis . . . . . . . . . . co a 19 Solu¸˜o num´rica de equa¸˜es diferenciais ca e co 19.1 Equa¸˜es separ´veis . . . . . . . . . . . . . . . . . co a 19.2 Discretiza¸˜o . . . . . . . . . . . . . . . . . . . . . ca 19.3 O M´todo de Euler . . . . . . . . . . . . . . . . . . e 19.4 Indo para segunda ordem . . . . . . . . . . . . . . 19.5 Runge-Kutta . . . . . . . . . . . . . . . . . . . . . 19.6 Runge-Kutta em sistemas de equa¸˜es autˆnomas . co o A Revis˜o de C´lculo a a A.1 Derivadas . . . . . . . . . . . . . . . . . . . . . . . A.2 Primitivas . . . . . . . . . . . . . . . . . . . . . . . A.3 Integral . . . . . . . . . . . . . . . . . . . . . . . . A.4 A integral indefinida . . . . . . . . . . . . . . . . . A.5 O Teorema Fundamental do C´lculo . . . . . . . . a A.6 A praticidade do Teorema Fundamental do C´lculo a A.7 O logaritmo . . . . . . . . . . . . . . . . . . . . . . A.8 O Teorema do Valor M´dio . . . . . . . . . . . . . e A.9 A Regra da Cadeia . . . . . . . . . . . . . . . . . . A.10 Regras do produto e do quociente . . . . . . . . . . A.11 Truques de primitiviza¸˜o: integra¸˜o por partes . ca ca A.12 Truques de primitiviza¸˜o: substitui¸˜o . . . . . . ca ca

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

6 B F´rmula de Taylor o B.1 Introdu¸˜o . . . . . . . . . . . . . . . ca B.1.1 Polinˆmios de grau zero . . . o B.1.2 Aproxima¸˜o da fun¸˜o nula ca ca B.1.3 Aproxima¸˜o de grau 1 . . . ca B.2 Polinˆmio e F´rmula de Taylor . . . o o

´ SUMARIO 265 265 266 266 267 268

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

Parte I

Sistemas Lineares

7

Cap´ ıtulo 1

Exemplos de aplica¸˜es de co sistemas lineares
1.1 Introdu¸˜o ca

Um sistema linear ´ um conjunto de m equa¸˜es, com n inc´gnitas x1 , x2 , . . ., xn , da e co o seguinte forma: a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 . . . am1 x1 + am2 x2 + . . . + amn xn = bm Os n´meros aij s˜o os coeficientes do sistema linear, e s˜o fornecidos no problema. Os bi ’s u a a s˜o chamados de termos independentes. Aqui estudaremos apenas os sistemas lineares a que tenham tantas equa¸˜es quanto inc´gnitas, isto ´, m = n. Trataremos neste Cap´ co o e ıtulo de alguns exemplos onde se aplicam sistemas lineares, no Cap´ ıtulo 2 entenderemos um pouco da teoria envolvida (por exemplo, a rela¸˜o entre o determinante dos coeficientes ca do sistema e a existˆncia e unicidade de solu¸˜es), no Cap´ e co ıtulo 3 falaremos de sua solu¸˜o ca pelo M´todo de Escalonamento e no Cap´ e ıtulo 4, finalmente, exporemos dois m´todos e iterativos de resolu¸˜o dos sistemas lineares (que, infelizmente, s´ funcionam em certos ca o casos).

1.2

Provetas

Considere o seguinte problema. Quatro tipos de materiais particulados est˜o distribu´ a ıdos por quatro provetas, e em cada proveta os materiais s˜o dispostos em camadas, n˜o a a misturadas, de modo que seja poss´ medir facilmente o volume de cada material em ıvel 9

10

CAP´ ITULO 1. EXEMPLOS DE APLICACOES DE SISTEMAS LINEARES ¸˜

cada uma delas. Dado que possamos medir a massa total de cada proveta, e que saibamos a massa da proveta vazia, queremos calcular a densidade de cada um dos materiais. Para colocar o problema em termos matem´ticos, chamemos os materiais de A, a B, C e D, e suas densidades respectivas de D D D D ρA , ρB , ρC e ρD . Essas s˜o as inc´gnitas a o do problema, n´meros que queremos desu C C C C cobrir. B Entre os dados dispon´ ıveis para resolvˆ-lo e B B est˜o a massa conjunta dos quatro materia B A A ais em cada uma das provetas (numeradas A A de 1 a 4), que chamaremos de m1 , m2 , m3 1 2 3 4 e m4 , j´ descontada a tara das provetas. a Al´m disso, temos o volume de cada um dos materiais em cada uma das provetas. e Chamaremos de v1A , v1B , v1C e v1D o volume dos materiais A, B, C e D na Proveta 1, v2A , v2B , v2C e v2D o volume dos materiais A, B, C e D na Proveta 2, e assim por diante. Como a densidade ´ a raz˜o entre massa e volume, a massa do material A na Proveta e a 1 ´ v1A · ρA . Estendendo esse racioc´ e ınio para os demais materiais, obtemos que a massa total m1 contida na Proveta 1 ´ e v1A · ρA + v1B · ρB + v1C · ρC + v1D · ρD . Considerando as quatro provetas, obteremos quatro equa¸˜es: co v1A · ρA + v1B v2A · ρA + v2B v3A · ρA + v3B v4A · ρA + v4B · ρB · ρB · ρB · ρB + v1C + v2C + v3C + v4C · ρC · ρC · ρC · ρC + v1D · ρD + v2D · ρD + v3D · ρD + v4D · ρD = m1 = m2 = m3 = m4
0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 " # " # " #  " #   " #             ¦ §  ¦ § ¦ § ¦ § ¦ § ¦ § ¦ § ¦ § 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 " # " # " #  " #   " #             ¦ §  ¦ § ¦ § ¦ § ¦ § ¦ § ¦ § ¦ § 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 " # " # " #  " #   " #             ¦ §  ¦ § ¦ § ¦ § ¦ § ¦ § ¦ § ¦ § ( ) ( ) ( ) ( ) ( ) ! ! ! ! ! ! ! ! ! ! ! ! !           ¤ ¥   ¤ ¥ ¤ ¥ ¤ ¥ ¤ ¥ ( ) ( ) ( ) ( ) ( ) ! ! ! ! ! ! ! ! ! ! ! ! !           ¤ ¥   ¤ ¥ ¤ ¥ ¤ ¥ ¤ ¥ & ' & ' & ' & ' & ' & ' & ' & ' & ' & '                       ¢ £   ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ & ' & ' & ' & ' & ' & ' & ' & ' & ' & '                       ¢ £   ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ & ' & ' & ' & ' & ' & ' & ' & ' & ' & '                       ¢ £   ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ ¢ £ $ % $ % $ % $ % $ % $ % $ %   $ %           ¨ © ¨ © ¨ © ¨ © ¨ © ¨ © ¨ © ¨ © ¨ © ¨ ©   ¡   ¡   ¡   ¡   ¡   ¡ $ % $ % $ % $ % $ % $ % $ %   $ %           ¨ © ¨ © ¨ © ¨ © ¨ © ¨ © ¨ © ¨ © ¨ © ¨ ©   ¡   ¡   ¡   ¡   ¡   ¡

Trata-se de um sistema linear de quatro equa¸˜es e quatro inc´gnitas. co o Uma poss´ ıvel aplica¸˜o em Geologia seria a seguinte. Uma sonda faz o papel das ca provetas, e uma coluna de material ´ retirada, contendo materiais diferentes dispostos e em camadas (pode ser at´ uma sonda coletando material gelado). A sonda permitiria e medir a dimens˜o de cada camada, mas n˜o poder´ a a ıamos desmanchar a coluna para medir a densidade de cada material isoladamente, sob o risco de alterar a compacta¸˜o. ca

1.3

Petr´leo o

Outro problema para Ge´logos e afins. Em trˆs po¸os de petr´leo, situados em regi˜es o e c o o distintas, o material coletado tem diferentes concentra¸˜es de duas substˆncias A e B. co a

´ 1.3. PETROLEO

11

Uma central recebe o petr´leo dos trˆs po¸os, mas antes do refino precisa obter uma o e c mistura com uma concentra¸˜o escolhida das substˆncias A e B. A pergunta ´: em cada ca a e litro de petr´leo que ser´ gerado para o refino, quanto petr´leo de cada po¸o se deve o a o c colocar? Mais uma vez equacionemos o problema: chamaremos de c1A a concentra¸˜o de A no ca petr´leo do Po¸o 1, c1B a concentra¸˜o de B no petr´leo do Po¸o 1, e assim por diante. o c ca o c Essa informa¸˜o ´ conhecida previamente. As concentra¸˜es que queremos obter s˜o ca e co a chamadas de cA e cB . As inc´gnitas s˜o as quantidades relativas de petr´leo de cada o a o po¸o que colocaremos na mistura final, que chamaremos de q1 , q2 e q3 . Elas s˜o medidas c a em litros, e devem ser tais que q1 + q2 + q3 = 1 . Al´m disso, a concentra¸˜o do material A ap´s a mistura dos trˆs ser´ dada por e ca o e a c1A · q1 + c2A · q2 + c3A · q3 . Pensando o mesmo sobre o material B, ficamos com trˆs equa¸˜es lineares e trˆs inc´gnitas: e co e o c1A · q1 + c2A · q2 + c3A · q3 = cA c1B · q1 + c2B · q2 + c3B · q3 = cB q1 + q2 + q3 = 1 Aqui ´ importante salientar que o problema n˜o teria uma solu¸˜o satisfat´ria para e a ca o qualquer escolha de cA e cB . Por exemplo, se a concentra¸˜o cA desejada na mistura ca for superior `s concentra¸˜es de A em cada um dos po¸os, n˜o h´ como obter a mistura a co c a a satisfatoriamente. Mesmo assim poderia haver uma solu¸˜o matem´tica para a equa¸˜o, ca a ca na qual provavelmente uma das inc´gnitas q1 , q2 ou q3 teria que ser negativa! o Portanto no problema real devemos adicionar a exigˆncia de que os valores q1 , q2 e e q3 encontrados n˜o sejam negativos. a O conjunto de valores de cA e cB para os quais cB haveria uma solu¸˜o para esse problema pode ca (c1A ,c1B ) ser representado da seguinte forma. Queremos um par de concentra¸˜es (cA , cB ) tal que co possiveis (cA ,cB ) existam q1 , q2 e q3 satisfazendo as equa¸˜es co acima. Esse conjunto de possibilidades est´ a representado no plano cartesiano na figura ao (c3A ,c3B ) lado, e ´ denominado envolt´ria convexa dos e o (c2A ,c2B ) pontos (c1A , c1B ), (c2A , c2B ) e (c3A , c3B ). Ele ´ o menor conjunto convexo que cont´m os e e cA pontos citados.

12

CAP´ ITULO 1. EXEMPLOS DE APLICACOES DE SISTEMAS LINEARES ¸˜

1.4

Cores

Um exemplo muito semelhante pode ser obtido trabalhando-se com combina¸˜es de co cores. A maior parte das cores conhecidas podem ser formadas pela combina¸˜o de trˆs ca e cores: vermelho (R), verde (G) e azul (B), as letras correspondendo ` nomenclatura em a inglˆs red-green-blue, que chamaremos de cores puras. e Isto significa que as cores poB dem ser representadas por trˆs e n´meros n˜o-negativos, cada um u a indicando a quantidade de cada uma das trˆs cores, e esses e n´meros s˜o geometricamente u a vistos pela posi¸˜o que represenca tam no primeiro octante formado G pelos trˆs eixos coordenados no e R espa¸o tridimensional. c No entanto h´ um bocado de informa¸˜o redundante nessa representa¸˜o, uma vez a ca ca que o ponto (1, 1, 1) deve resultar na mesma cor que (3, 3, 3), a unica diferen¸a sendo a ´ c quantidade de material produzido.

B
azul (0,0,1)

Se pensarmos que os n´meros xR , xG , xB u denotam a quantidade de litros de cada cor pura e sempre quisermos produzir exatamente 1 litro de mistura, ent˜o ´ nea e cess´rio que a xR + xG + xB = 1 .

(1,0,0)

(0,1,0)

G
vermelho verde

R

A equa¸˜o acima restringe o espa¸o de coca c res poss´ ıveis a intersec¸˜o do plano xR + ` ca xG + xB = 1 com o primeiro octante, que ´ o triˆngulo mostrado na figura ao lado. e a

Cada ponto Q desse triˆngulo ´ obtido como combina¸˜o convexa de (1, 0, 0), (0, 1, 0) a e ca e (0, 0, 1), isto ´, e Q = (qR , qG , qB ) = qR (1, 0, 0) + qG (0, 1, 0) + qB (0, 0, 1) , com a condi¸˜o de que qR + qG + qB = 1. Chamaremos de T esse triˆngulo. ca a Suponha agora que produzimos quatro cores distintas Q(1) , Q(2) , Q(3) e Q(4) , sendo que (i) (i) (i) Q(i) = (qR , qG , qB )

1.5. INTERPOLACAO POLINOMIAL ¸˜ para cada i = 1, 2, 3, 4. Elas s˜o representadas por pontos no tri˜ngulo T . a a O conjunto de todas as combina¸˜es co poss´ ıveis dessas quatro cores (formando um litro) ´ o menor conjunto convexo em e T que cont´m essas quatro cores, como e ilustra a figura ao lado. Se Q ´ uma tal e cor, ent˜o a Q = x1 Q(1) + x2 Q(2) + x3 Q(3) + x4 Q(4) , com x1 + x2 + x3 + x4 = 1.
R
Q (4)

13

B

Q (2) Q
(1)

Q (3)

G

Por exemplo, suponha que a cor cinza, dada por Q = ( 1 , 1 , 1 ), esteja contida nesse 3 3 3 menor conjunto convexo, e gostar´ ıamos de determinar as quantidades x1 , x2 , x3 e x4 das cores Q(1) , Q(2) , Q(3) e Q(4) que produzam 1 litro da cor cinza Q. Isso nos d´ quatro a equa¸˜es lineares nas inc´gnitas x1 , x2 , x3 e x4 : co o qR x1 (1) qG x1 (1) qB x1 x1
(1)

+ qR x2 (2) + qG x2 (2) + qB x2 + x2

(2)

+ qR x3 (3) + qG x3 (3) + qB x3 + x3

(3)

+ qR x4 (4) + qG x4 (4) + qB x4 + x4

(4)

= 1 3 = 1 3 = 1 3 = 1

1.5

Interpola¸˜o polinomial ca

Imagine que queiramos passar um polinˆmio quadr´tico (isto ´, uma par´bola) pelos o a e a pontos (x1 , y1 ), (x2 , y2 ) e (x3 , y3 ), desde que x1 , x2 e x3 sejam todos diferentes entre si.
p(x) y1 x2 x1 y2 x3 y3

Um polinˆmio quadr´tico ´ escrito, na sua forma geral, como o a e p(x) = ax2 + bx + c . Como neste problema nosso objetivo ´ determinar o polinˆmio quadr´tico, as inc´gnitas e o a o s˜o os trˆs coeficientes a, b e c. Para encontrar as inc´gnitas dispomos de trˆs equa¸˜es, a e o e co

14

CAP´ ITULO 1. EXEMPLOS DE APLICACOES DE SISTEMAS LINEARES ¸˜

pois o gr´fico do polinˆmio deve passar pelos trˆs pontos dados: p(x1 ) = y1 , p(x2 ) = y2 a o e e p(x3 ) = y3 . Explicitando as equa¸˜es, ficamos com co ax2 + bx1 + c = y1 1 ax2 + bx2 + c = y2 2 ax2 + bx3 + c = y3 3 e reescrevendo-as evidenciamos o car´ter de sistema linear do problema: a x2 · a + x1 · b + c = y1 1 x2 · a + x2 · b + c = y2 2 x2 · a + x3 · b + c = y3 3 Nem ´ preciso dizer que o mesmo tipo de problema se generaliza para um n´mero e u qualquer n de pontos. Sejam os pares (x1 , y1 ), . . . , (xn , yn ), com os xi ’s distintos dois a dois. Queremos achar um polinˆmio p(x) cujo gr´fico passe pelos pontos dados, isto ´: o a e p(x1 ) = y1 , p(x2 ) = y2 , . . . , p(xn ) = yn .

yn y y x1 x2 y2
n-1 1

xn-1

xn

Se procurarmos por um polinˆmio de grau k teremos k + 1 coeficientes a determinar. o Como temos que satisfazer n equa¸˜es, isso sugere que fixemos k = n − 1. Assim, temos co o sistema de n equa¸˜es, onde os coeficientes s˜o as n inc´gnitas: co a o a0 + x1 · a1 + x2 · a2 + . . . + xn−1 · an−1 1 1 a0 + x2 · a1 + x2 · a2 + . . . + xn−1 · an−1 2 2 . . . . . . . . . . . . . . . 2 ·a n−1 · a a0 + xn · a1 + xn 2 + . . . + xn n−1 = y1 = y2 . = . . = yn

Podemos nos perguntar se sempre existe solu¸˜o para esse sistema, e se ela ´ unica. ca e´ A resposta ´ sim (desde que os xi ’s sejam distintos entre si, mas veremos a justificativa e mais adiante, na Se¸˜o 2.7. ca Exerc´ ıcio. Ache o unico polinˆmio de grau 3 passando pelos pontos (−1, 0), (0, 1), ´ o (3, −1) e (4, 0).

ˆ 1.6. OUTROS PROBLEMAS DE DETERMINACAO DE POLINOMIOS ¸˜

15

1.6

Outros problemas de determina¸˜o de polinˆmios ca o

Outro problema de interpola¸˜o polinomial que pode ser reduzido a um sistema linear ca ocorre quando s˜o impostas condi¸˜es nas derivadas do polinˆmio, em determinados a co o pontos. A id´ia fica mais clara a partir do seguinte exemplo. e Problema: “achar um polinˆmio tal que p(−1) = 1, p(3) = 0, p (−1) = 0 e p (3) = o 0”. Isto ´, fixa-se o valor e a derivada de p em dois pontos, o que d´ 4 equa¸˜es. e a co Com um polinˆmio de grau 3, fica-se com 4 inc´gnitas. Explicitamente, se p(x) = o o a0 + a1 x + a2 x2 + a3 x3 , ent˜o as 4 equa¸˜es se transformam em a co a0 − a1 a0 + 3a1 a1 a1 + a2 + 9a2 − 2a2 + 6a2 − a3 + 27a3 + 3a3 + 27a3 = = = = 1 0 0 0

Tamb´m pode-se impor alguma condi¸˜o de integral definida para o polinˆmio. Por e ca o 2 + bx + c ´ polinˆmio de grau 2 e sabemos que exemplo, se p(x) = ax e o
2

p(x)dx = 3 ,
1

isso nos d´ uma equa¸˜o linear, pois a ca
2 1

p(x)dx = a =

x2 x3 2 |1 + b |2 + cx|2 1 3 2 1 7 3 a+ b+c. 3 2

1.7

Splines

H´ tamb´m o problema de “spline”. Dados pontos (x0 , y0 ), . . . , (xn , yn ) (a numera¸˜o a e ca come¸a de zero, desta vez) como na figura abaixo com n = 5, achar uma fun¸˜o que c ca seja: 1. um polinˆmio c´bico em cada intervalo [xk−1 , xk ], com k = 1, . . . , n; o u 2. igual aos valores especificados yk nos pontos xk ; 3. duas vezes diferenci´vel e com derivada segunda cont´ a ınua, inclusive nos pontos extremos dos intervalos (em particular, a fun¸˜o tamb´m deve ser diferenci´vel); ca e a 4. com derivada zero nos extremos (ou com valores especificados da derivada nos extremos).

16

CAP´ ITULO 1. EXEMPLOS DE APLICACOES DE SISTEMAS LINEARES ¸˜

x0

x1

x2

x3

x4

x5

Os pontos x0 , . . . , xn s˜o chamados de n´dulos. a o Nesse problema temos que achar n polinˆmios c´bicos (um para cada intervalo), e o u s˜o portanto 4n inc´gnitas (quatro coeficientes de cada polinˆmio). Ser´ que temos 4n a o o a equa¸˜es tamb´m? co e Vejamos. Chamaremos de p1 (x), . . . , pn (x) os polinˆmios, sendo que o polinˆmio o o pk (x) corresponde ao intervalo [xk−1 , xk ]. Temos que impor os valores extremos p1 (x0 ) = y0 , pn (xn ) = yn (no desenho, y0 e yn s˜o iguais a zero). J´ temos duas equa¸˜es. Al´m disso, devemos a a co e impor a segunda condi¸˜o especificada acima, nos demais n´dulos (mais 2n−2 equa¸˜es): ca o co p1 (x1 ) = y1 e p2 (x1 ) = y1 , . . . , pn−1 (xn−1 ) = yn−1 e pn (xn−1 ) = yn−1 . At´ agora totalizamos 2n equa¸˜es. Temos ainda que impor as derivadas nos extremos e co (zero neste caso): p1 (x0 ) = 0 , pn (xn ) = 0 , e tamb´m a continuidade da derivada em cada n´dulo: e o p1 (x1 ) = p2 (x1 ) , . . . , pn−1 (xn−1 ) = pn (xn−1 ) , perfazendo mais n + 1 equa¸˜es. Finalmente, temos que impor tamb´m a continuidade co e da segunda derivada nos n´dulos, com mais n − 1 equa¸˜es: o co p1 (x1 ) = p2 (x1 ) , . . . , pn−1 (xn−1 ) = pn (xn−1 ) . Ao todo s˜o 4n equa¸˜es! a co ´ E poss´ mostrar que o sistema da´ resultante sempre tem unica solu¸˜o. ıvel ı ´ ca Exerc´ ıcio. Monte o sistema linear relativo ao spline dos pontos da figura, com os seguintes dados:

1.8. PROBLEMAS DE CONTORNO k 0 1 2 3 4 5 xk -3.0 -1.4 0.0 1.5 2.5 4.0 yk 0.0 0.7 2.0 2.5 1.0 0.0

17

Exerc´ ıcio. Fa¸a um spline c´bico com os pontos (−1, 0), (0, 1) e (1, 0), com derivada c u zero nos extremos.

1.8

Problemas de contorno

O problema do equil´ ıbrio termost´tico (ou tamb´m do eletrost´tico) ´ outro exemplo de a e a e redu¸˜o a um sistema linear. ca Suponha uma situa¸˜o como ca a mostrada na figura ao lado, com trˆs fontes de calor: e 1. O entorno do quadrado, a ` temperatura Ta 2. O quadrado inclinado, ` a temperatura Tb 3. A barra, ` temperatura a Tc A quest˜o ´: como se disa e tribuir´ a temperatura, no a equil´ ıbrio, em fun¸˜o da ca posi¸˜o (x, y)? ca O mesmo problema pode ser formulado com um potencial eletrost´tico V (x, y), ao a inv´s da temperatura, se nas regi˜es mostradas fix´ssemos valores Va , Vb e Vc . Na e o a verdade, os valores Ta , Tb , Tc nem precisariam ser fixos: poderiam variar conforme a posi¸˜o. ca Esse problema ´ modelado pela equa¸˜o de Laplace e ca ∂2T ∂2T + =0, ∂x2 ∂y 2

Tb

Ta
(x,y) T(x,y)

Tc

18

CAP´ ITULO 1. EXEMPLOS DE APLICACOES DE SISTEMAS LINEARES ¸˜

significando que devemos procurar uma fun¸˜o cont´ ca ınua T (x, y) cujo valor sobre as fontes seja aquele pr´-determinado e tal que fora delas satisfa¸a essa equa¸˜o. e c ca Para obter uma solu¸˜o ca num´rica, discretizamos o e plano (x, y) com uma rede quadrada, como mostra a figura ao lado. Em seguida, numeramos os v´rtices da e malha cujas temperaturas n˜o est˜o fixadas, em quala a quer ordem (por exemplo, adotamos da esquerda para a direita, e de cima para baixo).

Tb

Ta

Tc

Na posi¸˜o i queremos determinar a temperatura Ti , no equil´ ca ıbrio. Se forem N v´rtices, ser˜o N inc´gnitas T1 , T2 , . . . , TN a determinar. A equa¸˜o de Laplace, quando e a o ca discretizada, se traduz no fato de que a temperatura de equil´ ıbrio na posi¸˜o i tem que ca ser igual ` m´dia da temperatura nos quatro vizinhos imediatos (na vertical e horizontal). a e Para cada v´rtice, isso se traduzir´ numa equa¸˜o (linear), e a reuni˜o de todas essas e a ca a equa¸˜es formar´ um sistema linear de N equa¸˜es e N inc´gnitas. co a co o Vejamos um exemplo, com uma grade de poucos v´rtices. O desenho e da figura ao lado mostra uma grade 9 × 8. Chamaremos de N o n´mero u de linhas (no exemplo, N = 9) e M o n´mero de colunas (no exemplo, u M = 8). Na grade fixamos Ta nas posi¸˜es (4, 4), (5, 3), (5, 4), (5, 5) co e (6, 4) (embora a posi¸˜o interna ca (5, 4) n˜o v´ servir para nada), e a a Tb nas posi¸˜es (1, s) e (9, s), para co s = 1, . . . , 8, e (r, 1), (r, 8), para r = 1, . . . , 9. Veja que estamos usando r para indexar as linhas e s para indexar as colunas.

s
1 
    

2 
   

3 
      

4 
     

5
! !   

6
" "# # ! !

7
$ $% % i $ $ " "# #

8

1
&' &

Ta
c bc b ` a ` a ` a b b ` ` ` ¦ § ¦ § ¦ § ¦ § ¨ © ¨ © ¤ ¤ ¥ ¥ ¨ © ¨ © ¤ ¤ ¢ £ ¢ £ ¢ £ ¢ £ 2 3 2 3 2 3 4 5 4 5 4 5

5 6
6 7

r

A discretiza¸˜o da equa¸˜o de Laplace significa que, nos v´rtices em que a temperaca ca e tura n˜o foi fixada, o valor da temperatura ser´ dado pela m´dia dos valores dos quatro a a e

TU

U

T

RS

S

RS

S

PQ

Q

PQ

Q

HI

I

HI

I

FG

G

FG

G

D

E

D

E

D

E

D

E

BC

B

B

B

@A

@

9

VW

V

T

V

V

T

R

R

P

P

H

H

F

F

C

89

8

8
A

X

Y

W

X

7
9

d

e

d

e

X

Y

X

Y

d

d

X

X

 

¡

 

¡

 

¡

 

¡

0

1

0

1

4

f

g

f

g

d

e

f

f

d

(

)

(

)

3
0 1

hi

h

f

g

h

h

2
( )

f 

' 6 7 6 7

Tb

1.8. PROBLEMAS DE CONTORNO

19

v´rtices mais pr´ximos. Numeraremos esses v´rtices da seguinte forma: da esquerda e o e para a direita e de cima para baixo (como na leitura de um texto em portuguˆs), e e para o v´rtice i queremos saber a temperatura de equil´ e ıbrio Ti . Assim, para o primeiro v´rtice, teremos e 1 T1 = (Tb + Tb + T2 + T7 ) , 4 pois o vizinho de cima e o vizinho ` esquerda tˆm valor fixo Tb e os vizinhos ` direita e a e a embaixo s˜o as inc´gnitas T2 e T7 . Rearranjando a equa¸˜o temos a o ca 4T1 − T2 − T7 = 2Tb . Na figura, vemos que h´ 37 v´rtices livres, portanto 37 inc´gnitas T1 , T2 , . . . , T37 a serem a e o determinadas. Por´m cada v´rtice livre produz uma equa¸˜o, donde resulta um sistema e e ca linear com 37 equa¸˜es e 37 inc´gnitas. co o

20

CAP´ ITULO 1. EXEMPLOS DE APLICACOES DE SISTEMAS LINEARES ¸˜

Cap´ ıtulo 2

Entendendo os sistemas lineares
2.1 Sistemas lineares e interse¸˜es de hiperplanos co

Pode-se melhorar bastante a compreens˜o dos sistemas lineares se os interpretarmos sob a o ponto de vista geom´trico. e Considere o sistema 5x + 2y = 3 , −x + y = 1

em que procuramos x e y que simultaneamente satisfa¸am as equa¸˜es dadas. c co Podemos olhar para uma equa¸˜o de cada vez, examinando o conjunto dos pares ca (x, y) que satisfazem a primeira e depois o conjunto dos (x, y) que satisfazem a segunda. O que estamos procurando ´ a intersec¸˜o desses dois conjuntos, isto ´, os pontos do e ca e plano que satisfazem as duas equa¸˜es ao mesmo tempo. co A equa¸˜o 5x + 2y = 3 determina ca uma reta. Observe que essa reta ´ e 3 o gr´fico da fun¸˜o y(x) = 2 − 5 x, a ca 2 que tem inclina¸˜o − 5 e cruza o ca 2 eixo das ordenadas em 3 . A ou2 tra equa¸˜o determina outra reta, ca gr´fico da fun¸˜o y(x) = 1 + x, que a ca tem inclina¸˜o 1 e cruza a ordenada ca em 1. 21

3 2

5x+2y=3

22

CAP´ ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

y=1+x
3 2 1

5x+2y=3

Na figura ao lado desenhamos as duas retas, e constatamos que elas devem se cruzar num unico ponto. ´ Esse ponto, por estar simultaneamente nas duas retas, satisfaz as duas equa¸˜es. Portanto ele ´ a co e solu¸˜o procurada do sistema linear. ca

Por essa interpreta¸˜o entende-se porque alguns ca sistemas podem n˜o ter solu¸˜o. Isso acontece a ca se as retas forem paralelas mas n˜o coincidentes, a como no sistema abaixo: −2x + 2y = 0 . −x + y = 1

y=1+x y=x
1

As retas s˜o os gr´ficos das fun¸˜es y = 1 + x e a a co y = x, como mostra a figura ao lado. Outra coisa que pode acontecer ´ a existˆncia de uma infinidade de solu¸˜es. Basta e e co que as duas equa¸˜es determinem a mesma reta, como neste exemplo: co −2x + 2y = 2 . −x + y = 1 Nem sempre a equa¸˜o de uma reta deterca mina o gr´fico de uma fun¸˜o y(x). Esse a ca ser´ sempre o caso quando o coeficiente a que multiplica y for igual a zero. Por exemplo, a equa¸˜o 2x = 3 representa ca uma reta vertical, pois ´ o conjunto de toe dos os (x, y) tais que x = 3 . 2

x= 3 ou 2x=3 2

0

3/2

E no caso de 3 equa¸˜es a 3 inc´gnitas? Bom, nesse caso cada uma das equa¸˜es co o co determina um plano, e as solu¸˜es s˜o todos os pontos de intersec¸˜o dos trˆs planos. co a ca e Como no caso de 2 inc´gnitas, pode haver uma solu¸˜o, nenhuma ou uma infinidade o ca delas. Num sistema de n equa¸˜es a n inc´gnitas devemos imaginar que cada equa¸˜o co o ca determina um hiperplano de dimens˜o n − 1 no espa¸o de dimens˜o n. Infelizmente n˜o a c a a podemos visualizar nada disso, mas isso n˜o nos impede de teorizar sobre o assunto. a

2.2. TRANSFORMACOES LINEARES ¸˜

23

2.2

Transforma¸˜es lineares co

Outra maneira bastante importante de se entender os sistemas lineares ´ atrav´s do e e conceito de transforma¸˜es lineares, e dele nos ocuparemos at´ o final do Cap´ co e ıtulo. Tomemos novamente o exemplo 5x + 2y = 3 . −x + y = 1 Essa equa¸˜o pode ser escrita na nota¸˜o matricial ca ca 5 2 −1 1 x y = 3 1 .

Para compactar ainda mais a nota¸˜o, chamaremos de A a matriz, u o vetor (matriz ca coluna) de coordenadas x e y e b o vetor (matriz coluna) de coordenadas 3 e 1, e escreveremos Au = b . Essa forma de escrever sugere que pensemos A como uma fun¸˜o (ou transforma¸˜o, ou ca ca ainda aplica¸˜o) que toma um vetor qualquer u e transforma num outro vetor Au. ca −1 , ent˜o a Por exemplo, se u = 2 Au = como mostra a figura abaixo. 5 2 −1 1 −1 2 = −1 4 ,

u=(−1,2)

Au=(−1,4)

Num sistema linear o que temos ´ o problema inverso: dado o vetor b (a coluna de e x termos independentes ` direita), qual ´ o vetor u = a e tal que Au = b? y ´ a E f´cil ver que essa id´ia funciona da mesma forma em dimens˜es mais altas. Se o e o sistema linear tem n equa¸˜es e n inc´gnitas ent˜o os coeficientes formam uma matriz A co o a

24

CAP´ ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

que pode ser usada como uma aplica¸˜o (ou transforma¸˜o, ou fun¸˜o) levando vetoresca ca ca coluna   x1  .  u= .  . xn em vetores Au. Apesar de n˜o ser nossa preocupa¸˜o aqui, na verdade nem ´ preciso a ca e que o n´mero de inc´gnitas iguale o n´mero de equa¸˜es para termos esse tipo de u o u co interpreta¸˜o. Pois o sistema linear ca a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 . . . am1 x1 + am2 x2 + . . . + amn xn = bm que tem m equa¸˜es e n inc´gnitas, pode ser escrito na forma matricial co o      a11 . . . a1n x1 b1  . .  .  =  .  . .. .  .   .   . . . . . . am1 . . . amn xn bm Agora a matriz dos coeficientes, que tem m linhas e n colunas, leva, por multiplica¸˜o, ca vetores-coluna de tamanho n em vetores-coluna de tamanho n (ou seja, ´ uma aplica¸˜o e ca n em Rm ). de R

,

2.3

Nota¸˜o e interpreta¸˜o ca ca

Vale a pena neste ponto fazermos alguns coment´rios a respeito da nota¸˜o, o que evitar´ a ca a confus˜es mais tarde. Como vimos, a matriz A dos coeficientes, que ´ n × n, pode ser o e vista tamb´m como uma aplica¸˜o, mas n˜o faremos distin¸˜o na nota¸˜o. Como matriz, e ca a ca ca A multiplica um vetor-coluna de tamanho n e o resultado ´ um outro vetor-coluna de e tamanho n. Em nota¸˜o compacta temos Au = b. Como aplica¸˜o, A toma um vetor u ca ca de Rn e transforma em outro vetor b de Rn . A rigor dever´ ıamos escrever A(u) = b, mas n˜o o faremos. Por raz˜es de praticidade a o (e tamb´m est´ticas, por que n˜o?) usaremos os parˆnteses somente quando for preciso e e a e deixar claro que A se aplica a toda uma express˜o, por exemplo, A(u + v), ao inv´s de a e Au + v, que poderia dar a impress˜o de que aplicamos A em u e depois somamos v, a quando na verdade primeiro somamos u com v e depois aplicamos A. Portanto n˜o faremos distin¸˜o clara entre a matriz A e a aplica¸˜o A, pois usaremos a ca ca a mesma nota¸˜o nos dois casos. Para abusar mais um pouquinho, escreveremos muitas ca

˜ 2.4. INVERSAO DE MATRIZES

25

vezes os vetores como n-upla, ao inv´s de vetores-coluna, com as coordenadas separadas e por v´ ırgulas, como por exemplo na frase “tome u = (x1 , . . . , xn ) e b = Au...”, ficando claro que se quisermos calcular b devemos dispor o vetor u em coluna e multiplicar por A, ` esquerda. a

2.4

Invers˜o de matrizes a

Antes de prosseguir, observamos que a nota¸˜o matricial nos propicia relacionar conceica tos aparentemente distantes. Por exemplo, o problema de inverter uma matriz quadrada A de tamanho n ´ equivalente a resolver n sistemas lineares. e A inversa de A ´ definida como a matriz U tal que AU = Id, onde Id ´ a matriz e e identidade, que tem 1 ao longo da diagonal principal e 0 no restante. A propriedade fundamental da matriz identidade ´ que Id · A = A e A · Id = A, funcionando de forma e an´loga ao n´mero 1 na multiplica¸˜o usual entre n´meros reais. A diferen¸a principal a u ca u c entre a multiplica¸˜o de n´meros reais e a multiplica¸˜o de matrizes ´ que a segunda ca u ca e n˜o ´ comutativa: h´ (muitos) exemplos onde A · U n˜o ´ igual a U · A (tente verificar a e a a e com matrizes 2 por 2, escolhidas ao acaso). Suponha que tenhamos A = {aij }n×n e queiramos achar U = {uij }n×n tal que A · U = Id. Explicitamente, queremos resolver      a11 a12 . . . a1n u11 u12 . . . u1n 1 0 ... 0  a21 a22 . . . a2n   u21 u22 . . . u2n   0 1 ... 0      . .  . .  =  ... ... ... ...  . .. ..  .  . . .    . . ... . ... . . . 0 0 ... 1 an1 an2 . . . ann un1 un2 . . . unn ´ a E f´cil ver que temos a´ n equa¸˜es do tipo Au = b, onde u e b s˜o colunas de U e Id na ı co a mesma posi¸ao. Por exemplo, para essa equa¸˜o ser satisfeita deve valer c˜ ca      a11 a12 . . . a1n u11 1  a21 a22 . . . a2n   u12   0        . .  .  =  .  , .. .  .   .   . . ... . . . . an1 an2 . . . ann que corresponde ` primeira coluna. a un1 0

2.5

Explorando a linearidade

A propriedade mais importante da fun¸˜o que leva vetores u em Au ´ a linearidade. A ca e linearidade significa que, para quaisquer vetores u1 e u2 tem-se A(u1 + u2 ) = Au1 + Au2 ,

26

CAP´ ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

e que, para qualquer vetor u e qualquer n´mero real α, u A(αu) = αAu . Observe que isso ´ equivalente a dizer que para quaisquer vetores u1 e u2 e n´meros α e u e β vale A(αu1 + βu2 ) = αAu1 + βAu2 . Fica como exerc´ para o leitor demonstrar a linearidade (em dimens˜o 2), supondo ıcio a que A= a b c d

´ uma matriz da forma mais geral poss´ e ıvel! N˜o ´ dif´ tente!, e depois procure mostrar a e ıcil, no caso geral, para matrizes n × n. Para entendermos o significado geom´trico da linearidade, vejamos primeiro o que ´ e e a soma de vetores e sua multiplica¸˜o por um n´mero (comumente chamado de escalar). ca u A multiplica¸˜o de um vetor (x, y) por um escalar α ´ o vetor (αx, αy), isto ´, cada ca e e coordenada ´ multiplicada por α. Isto significa que os dois vetores s˜o colineares, mas o e a tamanho do novo vetor ´ |α| vezes o tamanho do vetor original. Al´m disso, se α for um e e n´mero negativo, o sentido do novo vetor ser´ oposto ao do vetor original (ver figura u a abaixo). Dizer ent˜o que A(αu) = αAu significa dizer: “tomar a imagem de um vetor u a multiplicado por α ´ o mesmo que tomar a imagem de u e depois multiplicar por α”. e Isto mostra que, se conhecermos Au ent˜o saberemos quem ´ A(αu) para qualquer α!! a e A soma de dois vetores ´ vista geometricamente pela Lei dos Paralelogramos. Se e u1 = (x1 , y1 ) e u2 = (x2 , y2 ) ent˜o a u1 + u2 = (x1 + x2 , y1 + y2 ) , como mostrado na figura abaixo.

u

αu (α > 1 )

u1+ u2 y 2

u y 1
αu (α < 0)

x1

x2

2.5. EXPLORANDO A LINEARIDADE

27

Dizer que A(u1 + u2 ) = Au1 + Au2 significa: “obter a soma por meio da Lei do Paralelogramo e depois aplicar a transforma¸˜o A ´ o mesmo que aplicar a transforma¸˜o ca e ca a cada um dos vetores e depois somar pela Lei do Paralelogramo”. Vejamos a principal conseq¨ˆncia da linearidade. Para isso, chamemos a aten¸˜o ue ca para dois vetores especiais do plano: e1 = (1, 0) e e2 = (0, 1). Eles s˜o chamados de a vetores canˆnicos. Sua importˆncia reside no fato de que se u = (x, y) ´ um vetor o a e qualquer ent˜o a u = (x, y) = (x, 0) + (0, y) = x(1, 0) + y(0, 1) = xe1 + ye2 . Dizemos que u ´ uma combina¸˜o linear de e1 e e2 (isto ´, a soma de dois vetores, um e ca e colinear a e1 e o outro colinear a e2 ). Usando a linearidade, temos ent˜o a Au = A(xe1 + ye2 ) = xAe1 + yAe2 . Isto significa que se soubermos Ae1 e Ae2 ent˜o saberemos automaticamente Au, para a qualquer vetor u!! Em outras palavras, a a¸˜o da aplica¸˜o linear A fica completamente ca ca determinada pelo seu resultado em e1 e e2 ! Por exemplo, na figura abaixo mostramos como calcular Au, se u = (1.5, 2), se Ae1 e Ae2 forem como ilustrado.

2

u

Au Ae1 Ae2

e2 e1
1.5

Isso sugere que o sistema de coordenadas cartesiano original ´ transferido para um e outro sistema de coordenadas, medido a partir de combina¸˜es lineares de Ae1 e Ae2 . co Fica refor¸ado assim o car´ter geom´trico dos sistemas lineares. Pois se dermos b no c a e lado direito do desenho, temos um “m´todo” para achar u tal que Au = b (vide figura e abaixo). Basta “medir” as coordenadas de b no sistema de coordenadas das combina¸˜es co de Ae1 e Ae2 , e depois procurar no sistema cartesiano tradicional, ` esquerda, o vetor a que tem essas coordenadas!

28

CAP´ ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

e2 u e1 Ae2 b b=Au

Ae1

Vale aqui uma observa¸˜o bastante pertinente: “os vetores Ae1 e Ae2 s˜o as colunas ca a ´ a da matriz A”. E f´cil ver a raz˜o: a Ae1 = a b c d 1 0 = a c , Ae2 = a b c d 0 1 = b d .

Tudo ocorre de forma semelhante em dimens˜o qualquer n. A soma de vetores a tamb´m ´ obtida pela soma das coordenadas dos vetores. Tamb´m como em dimens˜o e e e a 2, a aplica¸˜o que leva vetores u em vetores Au ´ linear. Os vetores canˆnicos s˜o ca e o a e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . ., en = (0, 0, . . . , 0, 1). Qualquer vetor pode ser escrito como combina¸˜o linear dos vetores canˆnicos, pois ca o u = (x1 , x2 , . . . , xn ) = x1 e1 + x2 e2 + . . . + xn en . Isto implica que saber Ae1 , . . . , Aen permite calcular automaticamente qualquer Au.

2.6

Existˆncia e unicidade de solu¸˜es e co
Ae2=(−4,6)

Voltando a pensar em dimens˜o 2, observe que esse a “esquema geom´trico” para achar u tal que Au = b e ficaria prejudicado se por alguma raz˜o Ae1 e Ae2 fosa sem vetores colineares. Isso aconteceria se os vetorescoluna da matriz A fossem colineares, como por exemplo na matriz 2 −4 . −3 6 Neste caso, teremos Ae1 e Ae2 como na figura ao lado.

Ae1=(2,−3)

ˆ 2.6. EXISTENCIA E UNICIDADE DE SOLUCOES ¸˜

29

O desastre ocorre se tivermos um vetor b que n˜o seja colinear a eles e quisermos a ´ f´cil ver porque n˜o vai existir esse vetor: todo vetor u = (x, y) achar u tal que Au = b. E a a se escreve como combina¸˜o linear u = xe1 + ye2 , logo Au = xAe1 + yAe2 . S´ que se ca o Ae1 e Ae2 forem colineares ent˜o Au tamb´m ser´ colinear a eles. Em resumo, para a e a qualquer escolha de u, o vetor imagem Au estar´ sempre sobre a mesma reta, na mesma a dire¸˜o de Ae1 e Ae2 (a aplica¸˜o A leva todo o R2 sobre uma reta, uma aplica¸˜o longe ca ca ca de ser injetiva!). Portanto ´ imposs´ que exista Au = b se b n˜o for colinear com esses e ıvel a dois vetores! ´ Esse tipo de problema ocorre justamente nos sistemas indeterminados. E o caso em que o sistema n˜o tem solu¸˜o. Por outro lado, se b for colinear a Ae1 e Ae2 ent˜o a ca a haver´ infinitas solu¸˜es, isto ´, infinitas escolhas de u tais que Au = b. Para mostrar a co e isso, escrevemos Ae2 = αAe1 (j´ que eles s˜o colineares, e supondo que Ae1 seja n˜oa a a nulo), e Au = xAe1 + yAe2 = xAe1 + αyAe1 = (x + αy)Ae1 . Ao mesmo tempo, com a hip´tese de que b seja colinear a Ae1 temos o b = βAe1 . Ent˜o Au = b desde que a x + αy = β , o que determina uma reta de possibilidades de x e y. Pensando em geral, em dimens˜o n, o problema de se achar u tal que Au = b ter´ a a solu¸˜o garantida sempre que possamos achar n´meros x1 , . . . , xn tais que ca u b = x1 Ae1 + . . . + xn Aen , isto ´, sempre que {Ae1 , . . . , Aen } formar uma base, pois ent˜o pela linearidade, e a b = A(x1 e1 + . . . + xn en ) = Au , se chamarmos u = (x1 , . . . , xn ). Pode-se demonstrar que {Ae1 , . . . , Aen } n˜o forma uma base se e somente se um dos a vetores Aei for combina¸˜o linear dos demais. Sempre que {Ae1 , . . . , Aen } (lembre-se, ca s˜o as colunas da matriz A) n˜o formar uma base, teremos duas situa¸˜es poss´ a a co ıveis para a equa¸˜o Au = b, dependendo de b: se b n˜o for combina¸˜o linear de {Ae1 , . . . , Aen } ca a ca ent˜o a equa¸˜o n˜o ter´ solu¸˜o; e se b for combina¸˜o linear de {Ae1 , . . . , Aen } ent˜o a ca a a ca ca a haver´ uma infinidade de solu¸˜es da equa¸˜o (tente mostrar isso!). a co ca J´ se {Ae1 , . . . , Aen } formar uma base ent˜o b se escreve de forma unica como a a ´ b = x1 Ae1 + . . . + xn Aen , implicando que existe uma unica solu¸˜o para Au = b, a saber u = (x1 , . . . , xn ). ´ ca

30

CAP´ ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

2.7

Injetividade, sobrejetividade... glup!

Valem aqui alguns coment´rios complementares sobre a discuss˜o te´rica que estamos a a o levando. Acabamos de ver que a matriz de coeficientes A nos deixa duas op¸˜es: 1) para co todo b, Au = b tem solu¸˜o (portanto a aplica¸˜o A ´ sobrejetiva) e essa solu¸˜o ´ unica ca ca e ca e ´ (donde Au = Av implica u = v, isto ´, a aplica¸˜o A ´ tamb´m injetiva); 2) existe b tal e ca e e que Au = b n˜o tem solu¸˜o (logo A n˜o ´ sobrejetiva) e existe b tal que Au = b tem a ca a e v´rias solu¸˜es (logo A n˜o ´ injetiva). Ou seja, das duas uma: ou A ´ bijetiva ou n˜o a co a e e a ´ nem sobrejetiva nem injetiva. e Uma caracter´ ıstica t´ ıpica de uma aplica¸˜o linear A ´ que se A n˜o for injetiva ent˜o ca e a a h´ um vetor w n˜o-nulo (de fato, uma infinidade deles) tal que Aw = 0. Pois se A n˜o a a a ´ injetiva ent˜o existem u e v, com u = v, tais que Au = Av. Logo Au − Av = 0, e pela e a linearidade A(u − v) = 0 . Chame w = u − v. Esse vetor ´ n˜o-nulo porque u = v, e assim demonstramos nossa e a afirmativa. Para ilustrar, apliquemos essas id´ias ao problema de interpola¸˜o polinomial da e ca Se¸˜o 1.5. L´ quer´ ca a ıamos passar o gr´fico de um polinˆmio p(x) de grau n − 1 por n a o pontos fixados (com abscissas distintas). Isto ´, dados (x1 , y1 ), . . . , (xn , yn ) quer´ e ıamos n−1 tal que p(x ) = y , . . . , p(x ) = y , e isso nos achar p(x) = a0 + a1 x + . . . + an−1 x 1 1 n n levou imediatamente a um sistema linear onde as inc´gnitas s˜o os n coeficientes do o a polinˆmio: o      1 x1 x2 . . . xn−1 a0 y1 1 1  1 x2 x2 . . . xn−1   a1   y2  2 2       . . . . .  .  =  .  . . . . . .  .   .   . . . . . . . 1 xn x2 . . . xn−1 n n an−1 yn Queremos mostrar que essa equa¸˜o sempre tem solu¸˜o e essa solu¸˜o ´ unica. ca ca ca e ´ Como vimos acima, isso acontece se e somente se a matriz A dos coeficientes for uma aplica¸˜o injetiva. ca Suponha por contradi¸˜o que essa matriz A n˜o fosse injetiva. Ent˜o existiria um ca a a conjunto de coeficientes w = (a0 , a1 , . . . , an−1 ) n˜o-nulo (isto ´, pelo menos um dos a e coeficientes diferente de zero) tal que Aw = 0. Ou seja, ter´ ıamos um polinˆmio q(x) de o grau n − 1 (no m´ximo), n˜o-nulo, tal que q(x1 ) = 0, . . . , q(xn ) = 0, isto ´, com n ra´ a a e ızes distintas. Mas polinˆmios n˜o-nulos de grau n − 1 tˆm no m´ximo n − 1 ra´ (prove usando o a e a ızes seus conhecimentos de c´lculo!), portanto chegamos a uma contradi¸˜o, o que mostra a ca que A obrigatoriamente tem que ser injetiva!

2.8. O DETERMINANTE

31

2.8

O determinante

O determinante da matriz A dos coeficientes de um sistema linear serve como instrumento para saber se {Ae1 , . . . , Aen } ´ uma base, indicando se o sistema tem ou n˜o unica e a ´ solu¸˜o. De fato, esta Se¸˜o tem a pretens˜o de convencer o leitor de que det A = 0 ca ca a se e somente se {Ae1 , . . . , Aen } ´ uma base. A id´ia ´ explicar o que ´ o determinante e e e e de uma forma intuitiva e geom´trica, mas o leitor pode encontrar abordagens diferentes e em outros livros. ´ E preciso salientar que o determinante ser´ inicialmente definido para um conjunto a de n vetores (em Rn ) e depois definiremos det A = det(Ae1 , . . . , Aen ) . Come¸aremos a discuss˜o em dimens˜o 2, e depois comentaremos sua generaliza¸˜o c a a ca para dimens˜o qualquer. a

2.8.1

Dimens˜o 2 a

O determinante d´, de certa forma, uma medida do quanto dois vetores est˜o perto a a de ser colineares. Definiremos o determinante de um par ordenado de vetores (u1 , u2 ), denotando-o por det(u1 , u2 ) , como sendo a ´rea do paralelogramo determinado por esses dois vetores, com um “sinal”. a Sendo assim, dois vetores ser˜o colineares entre si se e somente se seu determinante for a nulo. O determinante de uma matriz A 2 × 2 ´ definido como sendo o determinante do e par (Ae1 , Ae2 ): det A ≡ det(Ae1 , Ae2 ) . Desse modo, fica evidente que o determinante de A ´ diferente de zero se e somente e se o sistema Au = b admitir unica solu¸˜o (n˜o importando quais sejam os termos ´ ca a independentes, isto ´, o vetor b da equa¸˜o). Lembrando tamb´m que Ae1 e Ae2 s˜o as e ca e a colunas da matriz A, segue que det A = 0 se e somente se suas colunas forem colineares. Para que a defini¸˜o fique completa, precisamos estabelecer melhor o que ´ o paca e ralelogramo determinado pelos dois vetores e definir de maneira inequ´ ıvoca o sinal do determinante. Al´m disso, precisamos saber calcular o determinante, e o leitor ver´ que e a a defini¸˜o dada aqui coincide com aquela que ele provavelmente j´ conhece. ca a Chamaremos de P (u1 , u2 ) o paralelogramo determinado por u1 e u2 . Ele ´ definido e como sendo o conjunto P (u1 , u2 ) = {su1 + tu2 ; 0 ≤ s ≤ 1 , 0 ≤ t ≤ 1} .

32

CAP´ ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

Isso porque, se 0 ≤ s, su1 ´ um vetor com o mesmo sentido que u1 , e se s ≤ 1, su1 ´ um e e vetor de tamanho menor ou igual ao tamanho de u1 . O mesmo ocorre com tu2 , para 0 ≤ t ≤ 1. O paralelogramo ´ constitu´ ent˜o de todas as somas de vetores desse tipo. e ıdo a O sinal de det(u1 , u2 ) ´ definido assim, se u1 e u2 n˜o s˜o colineares: se (u1 , u2 ) e a a pode ser suavemente alterado at´ que coincida com o par de vetores canˆnicos (e1 , e2 ) e o (na ordem correspondente, isto ´, u1 ´ alterado at´ coincidir com e1 , e u2 com e2 ), de e e e forma que os vetores nunca se tornem colineares ao longo do processo, ent˜o o sinal ´ a e positivo. Caso contr´rio ´ negativo. Veja dois exemplos com sinais diferentes na figura a e abaixo. O da esquerda ´ o positivo. e

u2 u1 u1

u2
Da´ resulta que det(e1 , e2 ) = +1 (sinal positivo e ´rea igual a 1) e que det(e2 , e1 ) = ı a −1. Al´m disso, mais geralmente, det(u1 , u2 ) = − det(u2 , u1 ), ou seja, se trocarmos a e ordem dos vetores ent˜o o sinal do determinante ser´ trocado. a a Uma propriedade importante do determinante ´ a linearidade com respeito a cada e um dos vetores. Ou seja, precisamos mostrar que det(αu, v) = α det(u, v) e que det(u1 + u2 , v) = det(u1 , v) + det(u2 , v) . Observe que se isso for verdade, ent˜o enunciados semelhantes s˜o v´lidos para o segundo a a a vetor do par. Por exemplo, det(u, αv) = − det(αv, u) = −α det(v, u) = α det(u, v) . Para mostrar as duas propriedades de linearidade recorremos a princ´ ıpios geom´trie cos. Veja nas figuras abaixo o que acontece em cada caso. No segundo caso, o princ´ ıpio de Cavalieri garante que a ´rea de P (u1 , v) mais a ´rea de P (u2 , v) ´ igual ` ´rea de a a e a a P (u1 + u2 , v) (aten¸˜o, a figura ´ no plano, n˜o se trata de desenho em perspectiva!). ca e a

2.8. O DETERMINANTE

33

P(u1+ u ,v) 2 v
αu

v u P(α u,v) P(u1 ,v) u1 u1+ u2 u2 P(u2 ,v)

P(u,v)

Esse argumento convence facilmente no caso em que det(u1 , v) e det(u2 , v) tenham o mesmo sinal. Se esse n˜o for o caso, ent˜o sugere-se provar que a a det(u1 , v) = det((u1 + u2 ) + (−u2 ), v) = det(u1 + u2 , v) + det(−u2 , v) , pois ´ f´cil ver que det(−u2 , v) = − det(u2 , v). e a Com essas propriedades todas garantimos o c´lculo de qualquer determinante. Para a ver isso, escrevemos u1 = (x1 , y1 ), u2 = (x2 , y2 ), mas lembramos a outra forma de escrever esses vetores, como combina¸˜o linear de e1 e e2 : u1 = x1 e1 + y1 e2 e u2 = ca x2 e1 + y2 e2 . Ent˜o a det(u1 , u2 ) = det(x1 e1 + y1 e2 , x2 e1 + y2 e2 ) = x1 det(e1 , x2 e1 + y2 e2 ) + y1 det(e2 , x2 e1 + y2 e2 ) , aplicando a linearidade no primeiro vetor do par. Aplicando novamente a linearidade no segundo vetor do par, temos det(u1 , u2 ) = x1 (x2 det(e1 , e1 ) + y2 det(e1 , e2 )) + y1 (x2 det(e2 , e1 ) + y2 det(e2 , e2 )) . Como det(e1 , e1 ) = det(e2 , e2 ) = 0, det(e1 , e2 ) = +1 e det(e2 , e1 ) = −1, ent˜o a det(u1 , u2 ) = x1 y2 − x2 y1 . Numa matriz a b c d os vetores coluna s˜o u1 = (a, c) e u2 = (b, d), de forma que a det A = ad − bc . Bom, essa ´ a f´rmula usual do determinante que aprendemos desde o Col´gio!! e o e Vale a pena lembrar as propriedades essenciais do determinante que permitem calcul´-lo para qualquer par de vetores: a

34

CAP´ ITULO 2. ENTENDENDO OS SISTEMAS LINEARES 1. det(e1 , e2 ) = 1 (normaliza¸˜o); ca 2. det(u, v) = − det(v, u) (alternˆncia); a 3. det(αu + βv, w) = α det(u, w) + β det(v, w) (linearidade).

2.8.2

Dimens˜o 3 a

Em dimens˜o 3, podemos definir o paralelep´ a ıpedo P (u1 , u2 , u3 ), onde u1 , u2 , u3 s˜o vea tores de R3 como o conjunto P (u1 , u2 , u3 ) = {ru1 + su2 + tu3 ; 0 ≤ r, s, t ≤ 1} (n˜o ´ dif´ ver o que seria um paralelep´ a e ıcil ıpedo em dimens˜o mais alta, generalizando a essa defini¸˜o). O determinante det(u1 , u2 , u3 ) ser´ o volume desse paralelep´ ca a ıpedo, com um sinal que devemos convencionar. De qualquer forma, um determinante nulo corresponde a um conjunto de trˆs vetores e em que um deles ´ combina¸˜o linear dos outros, pois da´ n˜o resulta um paralelep´ e ca ı a ıpedo com volume. O sinal do determinante ´ convencionado de maneira an´loga ao que fizemos em e a dimens˜o 2. Se {u1 , u2 , u3 } ´ uma base (ou seja, nenhum ´ combina¸˜o linear dos a e e ca outros), o sinal de det(u1 , u2 , u3 ) ser´ positivo se a trinca ordenada (u1 , u2 , u3 ) puder a ser suavemente deformada at´ (e1 , e2 , e3 ) sem que nunca deixe de formar uma base. e Essa defini¸˜o ´ pouco pr´tica: como calcular det A = det(Ae1 , Ae2 , Ae3 )? Mais ca e a uma vez, ´ conveniente demonstrar as propriedades b´sicas do determinante e us´-las e a a para os c´lculos. As propriedades b´sicas s˜o (tente se convencer vocˆ mesmo por que a a a e elas valem): 1. det(e1 , e2 , e3 ) = +1; 2. det(u1 , u2 , u3 ) = det(u3 , u1 , u2 ) = det(u2 , u3 , u1 ) = − det(u3 , u2 , u1 ) = − det(u1 , u3 , u2 ) = − det(u2 , u1 , u3 ); 3. det(αu + βv, u2 , u3 ) = α det(u, u2 , u3 ) + β det(v, u2 , u3 ) . Na segunda propriedade, note que qualquer troca entre vetores muda o sinal do determinante. A troca pode ocorrer com qualquer par de posi¸˜es: primeira com segunda, co segunda com terceira e primeira com terceira. Isso implica em particular que sempre que houver vetores repetidos na trinca ent˜o o determinante ´ nulo, pois, por exemplo, a e det(u, u, v) = − det(u, u, v) , logo det(u, u, v) = 0.

2.8. O DETERMINANTE Podemos usar essas regras para calcular o determinante da matriz 3 × 3   a11 a12 a13 A =  a21 a22 a23  , a31 a32 a33

35

que ´ o determinante de seus vetores-coluna, na ordem em que se apresentam. Temos, e pela linearidade (propriedade 3), det A = det ((a11 , a21 , a31 ), (a12 , a22 , a32 ), (a13 , a23 , a33 )) = det(a11 e1 + a21 e2 + a31 e3 , a12 e1 + a22 e2 + a32 e3 , a13 e1 + a23 e2 + a33 e3 ) = a11 a12 a13 det(e1 , e1 , e1 ) + . . . + a31 a32 a33 det(e3 , e3 , e3 ) . Dos 27 termos s˜o n˜o nulos apenas os determinantes det(ei , ej , ek ) tais que i, j, k s˜o a a a todos distintos. Logo det A = a11 a22 a33 det(e1 , e2 , e3 ) + a11 a32 a23 det(e1 , e3 , e2 ) +a21 a12 a33 det(e2 , e1 , e3 ) + a21 a32 a13 det(e2 , e3 , e1 ) +a31 a12 a23 det(e3 , e1 , e2 ) + a31 a22 a13 det e3 , e2 , e1 . Todos os determinantes restantes s˜o iguais a +1 ou −1. J´ sabemos que det(e1 , e2 , e3 ) = a a +1, logo det(e1 , e3 , e2 ) = −1. Isso implica det(e3 , e1 , e2 ) = +1 e det(e3 , e2 , e1 ) = −1. Que por sua vez implica det(e2 , e3 , e1 ) = +1 e det(e2 , e1 , e3 ) = −1. Ent˜o a det A = a11 (a22 a33 − a32 a23 ) + a21 (a32 a13 − a12 a33 ) + a31 (a12 a23 − a22 a13 ) . Esse ´ o conhecido determinante de uma matriz 3 × 3!! e

2.8.3

Dimens˜o n a

Em dimens˜o n existe o conceito de volume - comumente conhecido como hipervolume. a No entanto, vimos que as propriedades de normaliza¸˜o, alternˆncia e linearidade bastam ca a para definir inequivocamente o valor do determinante de uma n-upla de vetores. Assim, definimos det(u1 , . . . , un ) atrav´s de suas propriedades: e 1. Normaliza¸˜o: det(e1 , . . . , en ) = 1; ca 2. Alternˆncia: para todo par i, j entre 1 e n, vale a det(u1 , . . . , ui , . . . , uj , . . . , un ) = − det(u1 , . . . , uj , . . . , ui , . . . , un ) 3. Linearidade: det(αu + βv, u2 , . . . , un ) = α det(u, u2 , . . . , un ) + β det(v, u2 , . . . , un ).

36

CAP´ ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

Decorre dessas regras que o determinante de uma matriz A = {aij }n×n ´ e det A =
(i1 ,...,in )

ai1 1 ai2 2 . . . ain n det(ei1 , ei2 , . . . , ein ) .

J´ det(ei1 , ei2 , . . . , ein ) ´: nulo, se ocorre algum n´mero repetido na lista (i1 , . . . , in ); +1, a e u se (i1 , . . . , in ) pode ser levado em (1, 2, . . . , n) por um n´mero par de trocas de posi¸˜es; u co e −1 se ((i1 , . . . , in ) pode ser levado em (1, 2, . . . , n) por um n´mero ´ u ımpar de trocas de posi¸˜es (´ necess´rio observar que se (i1 , . . . , in ) pode ser levado em (1, . . . , n) por um co e a n´mero par de trocas de posi¸˜es ent˜o n˜o h´ como fazer o mesmo com um n´mero u co a a a u ´ ımpar, e vice-versa). Sem falarmos em hipervolume, vericamos tamb´m das trˆs propriedades que se um e e dos vetores for combina¸˜o linear dos demais ent˜o o determinante ´ nulo. Isso porque ca a e det(α2 u2 + . . . + αn un , u2 , . . . , un ) = = α2 det(u2 , u2 , . . . , un ) + . . . + αn det(un , u2 , . . . , un ) = 0 , pois vetores repetidos levam a determinante nulo, por causa da regra de alternˆncia. a A implica¸˜o contr´ria n˜o ´ t˜o ´bvia, a partir das trˆs propriedades: mostrar que ca a a e a o e se o determinante ´ nulo ent˜o um dos vetores ´ combina¸˜o linear dos outros. e a e ca Provaremos a afirma¸˜o equivalente: “se os vetores u1 , . . . , un formam uma base ca ent˜o det(u1 , . . . , un ) ´ n˜o-nulo”. a e a Primeiro relacionamos det(u1 , . . . , un ) com o determinante de uma matriz, definimos A como sendo a matriz tal que Ae1 = u1 , . . . , Aen = un , isto ´, tal que suas colunas e sejam os vetores u1 , . . . , un . Ent˜o det A = det(u1 , . . . , un ). O que queremos mostrar ´ a e que det A = 0 e a hip´tese que temos ´ que os vetores Ae1 , . . . , Aen formam uma base. o e Pela observa¸˜o acima, basta provarmos que A tem uma inversa. ca Em seguida, observamos que A tem uma inversa. Para entender por que, basta ver que para todo b ∈ Rn ´ poss´ encontrar u ∈ Rn tal que Au = b (j´ vimos que para e ıvel a aplica¸˜es lineares a sobrejetividade implica automaticamente na bijetividade). Ora, co como {Ae1 , . . . , Aen } ´ base ent˜o existem n´meros x1 , . . . , xn tais que e a u b = x1 Ae1 + . . . + xn Aen . Logo b = A(x1 e1 + . . . + xn en ) , e encontramos u = (x1 , . . . , xn ). A inversa de A ´ denotada por A−1 , portanto u = A−1 b. e Na Se¸˜o3.3 vamos mostrar que se A tem inversa ent˜o det A = 0, o que completa a ca a demonstra¸˜o. Para isso, usaremos o pr´prio m´todo de resolu¸˜o dos sistemas lineares, ca o e ca o M´todo de Escalonamento, do qual iremos falar no pr´ximo Cap´ e o ıtulo.

2.9. QUADRO COMPARATIVO

37

No entanto, podemos seguir outro argumento, baseado na seguinte f´rmula: se A e o B s˜o matrizes quadradas de tamanho n ent˜o a a det(AB) = det A · det B . Esta f´rmula pode ser deduzida das propriedades do determinante, mas n˜o o faremos o a aqui. Ao inv´s disso, daremos uma intui¸˜o geom´trica de sua veracidade, logo abaixo. e ca e A aplica¸˜o da f´rmula se faz assim: como A tem inversa A−1 , escrevemos AA−1 = ca o Id. Isto porque se aplicarmos A−1 a um vetor e depois aplicarmos A voltaremos ao vetor original. Ou seja, AA−1 u = u para qualquer u e AA−1 s´ pode ser a identidade. o Pela f´rmula do determinante, temos o det(AA−1 ) = det A · det A−1 = det Id = 1 , portanto det A n˜o pode ser nulo. a J´ para entender a intui¸˜o geom´trica da f´rmula det(AB) = det(A) det(B), de a ca e o forma n˜o rigorosa, lembremos que det A representa o volume com sinal de P (Ae1 , . . . , Aen ) a (o leitor pode pensar em dimens˜o 3). O paralelep´ a ıpedo P (Ae1 , . . . , Aen ) ´ a imagem e pela transforma¸˜o A do paralelep´ ca ıpedo P (e1 , . . . , en ), de volume unit´rio. Da lineaa ridade decorre que todo paralelep´ ıpedo formado por m´ltiplos dos vetores canˆnicos, u o quando transformado por A, tem seu volume multiplicado por det A. Da´ decorre (inı tuitivamente, mas n˜o t˜o facilmente do ponto de vista matem´tico) que o volume de a a a qualquer conjunto ´ multiplicado por det A pela transforma¸˜o A. e ca A intui¸˜o pode ser assim expressa: o conjunto ´ aproximado por pequenos paraca e lelep´ ıpedos disjuntos, cujo volume total est´ pr´ximo do volume total do conjunto, e a o quanto menores forem esses paralelep´ ıpedos melhor ser´ a aproxima¸˜o. Ao transfora ca marmos o conjunto pela aplica¸˜o A, podemos imaginar tamb´m a transforma¸˜o desses ca e ca pequenos paralelep´ ıpedos, que ter´ seu volume multiplicado por det A. a Portanto, se aplicarmos B e depois A, o volume dos conjuntos ser´ multiplicado por a det B e depois por det A. Este ´ o sentido da f´rmula! e o

2.9

Quadro comparativo

Para resumir tudo o que dissemos at´ agora sobre a existˆncia e a unicidade de solu¸˜es e e co de um sistema linear, fa¸amos um quadro comparativo que ilustra as unicas duas alterc ´ nativas que podem ocorrer para a matriz de coeficientes A, quando se quer resolver um sistema linear Au = b. Alternativa 1. 1. Para qualquer b, sempre existe unica solu¸˜o para Au = b ´ ca

38

CAP´ ITULO 2. ENTENDENDO OS SISTEMAS LINEARES 2. A ´ bijetiva, como transforma¸˜o linear e ca 3. Au = 0 implica u = 0 4. As colunas de A s˜o linearmente independentes a 5. As linhas de A s˜o linearmente independentes a 6. det A = 0

Alternativa 2. 1. Ou b ´ tal que Au = b n˜o tem solu¸˜o ou b ´ tal que Au = b tem infinitas solu¸˜es, e a ca e co e sempre existem exemplos dos dois casos 2. A n˜o ´ nem injetiva nem sobrejetiva a e 3. Existe u = 0 tal que Au = 0 4. As colunas de A s˜o linearmente dependentes a 5. As linhas de A s˜o linearmente dependentes a 6. det A = 0

Cap´ ıtulo 3

O M´todo de Escalonamento e
3.1 O m´todo e

Nesta Se¸˜o discutiremos um m´todo de resolu¸˜o de sistemas lineares, chamado M´todo ca e ca e do Escalonamento. O m´todo se baseia, em primeiro lugar, no fato de que um sistema e triangularizado como abaixo tem f´cil solu¸˜o: a ca a11 x1 + a12 x2 + a13 x3 + . . . + a1n xn a22 x2 + a23 x3 + . . . + a2n xn a33 x3 + . . . + a3n xn = b1 = b2 = b3 . . .

ann xn = bn Na verdade, ´ tanto necess´rio quanto suficiente que todos os coeficientes na diagonal e a sejam n˜o-nulos para que se explicite a solu¸˜o de forma unica (se um dos termos da a ca diagonal for nulo ent˜o haver´ vari´veis livres e uma infinidade de solu¸˜es). A solu¸˜o, a a a co ca nesse caso, se obt´m a partir da ultima equa¸˜o. Primeiro, isola-se xn : e ´ ca xn = A pen´ltima equa¸˜o ´ u ca e an−1,n−1 xn−1 + an−1,n xn = bn−1 , ent˜o a xn−1 = 1 an−1,n−1 (bn−1 − an−1,n xn ) . 1 bn . ann

Como xn j´ foi determinado, da equa¸˜o acima determina-se tamb´m xn−1 . E assim a ca e por diante, at´ se conseguir o valor de x1 . e 39

40

´ CAP´ ITULO 3. O METODO DE ESCALONAMENTO

Um sistema triangularizado torna-se ent˜o o objetivo do m´todo. Para ser mais a e preciso, pretende-se obter um sistema linear triangularizado equivalente ao original. Aqui entenderemos que dois sistemas lineares s˜o equivalentes se eles possuem exaa tamente as mesmas solu¸˜es, ou seja: se um conjunto de n´meros x1 , . . . , xn ´ solu¸˜o co u e ca de um sistema ent˜o automaticamente ser´ solu¸˜o do outro. a a ca Pode-se trocar um sistema linear por outro equivalente atrav´s do seguinte processo. e Escolhem-se duas linhas, a linha i e a linha j, e no lugar da linha j coloca-se uma linha que seja combina¸˜o linear da linha i com a linha j, exceto que essa combina¸˜o linear ca ca n˜o pode ser somente a linha i (sen˜o a informa¸˜o sobre a linha j desaparece, o que a a ca pode tornar o sistema indeterminado). Mais precisamente, o sistema linear a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 . . . an1 x1 + an2 x2 + . . . + ann xn = bn passa a ter, no lugar da linha j, a seguinte linha: (αaj1 + βai1 )x1 + . . . + (αajn + βain )xn = αbj + βbi , ´ onde α = 0, para que a linha j n˜o seja meramente substitu´ pela linha i. E evidente a ıda que qualquer solu¸˜o do sistema linear original ser´ solu¸˜o do sistema linear alterado. ca a ca Ser´ que vale o inverso? a De fato, sim. Se os n´meros x1 , . . . , xn formam uma solu¸˜o do sistema alterado, u ca ent˜o j´ garantimos que esses n´meros satisfazem todas as equa¸˜es do sistema original, a a u co exceto possivelmente a equa¸˜o j. Acontece que subtraindo da linha alterada a linha ca i multiplicada por β vemos que a linha j ´ automaticamente satisfeita, contanto que e α = 0. O essencial nesse “truque” ´ que podemos controlar α e β de forma que a linha e substituta tenha um zero em certa posi¸˜o. Por exemplo, suponha que na linha i o ca termo aik (k-´sima coluna) seja diferente de zero. Com isso, podemos substituir a linha e j por uma linha em que na k-´sima coluna o coeficiente seja nulo. Basta colocar a linha e 1 · (linha j) − Assim, o k-´simo coeficiente ser´ e a ajk − ajk · aik = 0 . aik ajk · (linha i) . aik

Usando judiciosamente essa opera¸˜o podemos ir substituindo as linhas, uma por ca uma, at´ chegar a um sistema triangularizado equivalente ao original. Antes de explicar e

´ 3.1. O METODO

41

o procedimento, no entanto, convencionemos uma forma mais f´cil de escrever o sisa tema linear: a forma matricial. Nessa forma de escrever, s´ colocamos o que realmente o interessa no sistema linear: os coeficientes. Numa matriz de n linhas e n + 1 colunas colocamos todos eles, deixando a ultima coluna para os termos independentes (e em ´ geral separando essa coluna das demais para n˜o haver confus˜o): a a   a11 a12 . . . a1n | b1  a21 a22 . . . a2n | b2     . . . . .  . . . .   . . . . . . an1 an2 . . . ann | bn Uma observa¸˜o importante que devemos fazer neste ponto da exposi¸˜o ´ que a ca ca e ordem das linhas n˜o importa na montagem da equa¸˜o, pois as linhas s˜o as equa¸˜es, a ca a co e todas as equa¸˜es devem ser satisfeitas ao mesmo tempo. J´ a ordem das colunas ´ co a e importante, pois a primeira coluna representa a inc´gnita x1 , a segunda representa a o inc´gnita x2 , etc. Se quisermos trocar a ordem das colunas, teremos antes que renumerar o as inc´gnitas! o O procedimento de escalonamento funciona assim. Primeiramente verificamos se a11 = 0. Se n˜o for, procuramos alguma linha cujo primeiro coeficiente seja diferente a de zero e a trocamos de posi¸˜o com a primeira. Se n˜o houver nenhuma linha cujo ca a primeiro coeficiente seja n˜o-nulo ent˜o x1 n˜o entra no sistema linear e pode ser, a a a a princ´ ıpio, qualquer. Al´m disso, percebe-se que de fato o sistema linear envolve apenas e n − 1 inc´gnitas em n equa¸˜es, havendo grande chance de n˜o ter solu¸˜o. De qualquer o co a ca forma, se isso acontecer n˜o haver´ nada a ser feito nessa primeira etapa e poderemos a a passar imediatamente ` etapa seguinte. a O objetivo da primeira etapa ´ usar o fato de que a11 = 0 para trocar uma a uma as e linhas de 2 a n por linhas cujo primeiro coeficiente seja nulo, usando o truque descrito acima. Ou seja, a j-´sima linha (j = 2, . . . , n) ser´ substitu´ pela linha e a ıda (linha j) − aj1 · (linha 1) . a11

O sistema linear ficar´ ent˜o da seguinte forma: a a  a11 a12 . . . a1n  0 a22 . . . a2n   . . . . . . .  . . . . . 0

 | b1 | b2   .  , .  .

an2 . . . ann | bn

onde ´ preciso lembrar que, por causa das opera¸˜es com linhas, os coeficientes n˜o s˜o e co a a os mesmos do sistema linear original!.

42

´ CAP´ ITULO 3. O METODO DE ESCALONAMENTO

Nessa primeira etapa descrita, o n´mero a11 ´ chamado de pivˆ. Em cada etapa u e o haver´ um pivˆ, como veremos adiante. Vimos que o pivˆ tem que ser necessariamente a o o diferente de zero, o que pode ser conseguido atrav´s de uma troca de linhas. De fato, e ´ poss´ at´ escolher o pivˆ, dentre os v´rios n´meros da primeira coluna que sejam e ıvel e o a u diferentes de zero. Na maioria das situa¸˜es em que se resolve um sistema linear por co este m´todo, atrav´s de calculadora ou computador, ´ mais vantajoso, sob o ponto de e e e vista dos erros de c´lculo (veja discuss˜o mais adiante) originados de arredondamentos, a a escolher o pivˆ como sendo o maior dos n´meros dispon´ o u ıveis na coluna. Aqui entendese por “maior” n´mero aquele que tem o maior valor absoluto dentro da coluna. Esse u procedimento ´ chamado de condensa¸˜o pivotal. e ca Na segunda etapa, verificamos se a22 = 0. Se n˜o for, procuramos entre as linhas a abaixo da segunda alguma cujo segundo coeficiente seja n˜o-nulo. Se n˜o houver, pasa a samos diretamente para a terceira etapa. Se houver, trocamos a linha encontrada com a segunda linha. Observe que a primeira linha n˜o ser´ mais alterada, nem trocada de a a posi¸˜o com outras. Aqui o pivˆ ser´ o n´mero diferente de zero da segunda coluna, ca o a u escolhido entre a segunda linha e a ultima. Mais uma vez, pode-se adotar a condensa¸˜o ´ ca pivotal, tomando como pivˆ o maior em valor absoluto. o Se ap´s a troca tivermos a22 = 0, podemos usar nosso truque para zerar todos o os segundos coeficientes desde a linha 3 at´ a ultima linha. Trocaremos cada linha e ´ j = 3, . . . , n pela linha aj2 · (linha 2) , (linha j) − a22 e ficaremos com um sistema linear da forma  a11 a12 a13 . . . a1n  0 a22 a23 . . . a2n   0 0 a33 . . . a3n   . . . . . . . . . .  . . . . . 0 0 an3 . . . ann  | b1 | b2   | b3  ,  .  .  . | bn

lembrando mais uma vez que os coeficientes s˜o diferentes em rela¸˜o ` etapa anterior, a ca a exceto os da primeira linha, que ficam inalterados. ´ a E f´cil ver que em n − 1 etapas teremos um sistema linear triangularizado que, como j´ observamos acima, pode ser facilmente resolvido. a

3.2

Algarismos significativos

Em geral recorremos a um computador, ou no m´ ınimo usamos uma calculadora, quando se trata de resolver sistemas lineares razoavelmente grandes. Por exemplo, dificilmente nos aventurar´ ıamos na resolu¸˜o ` m˜o do problema de contorno da Se¸˜o 1.8, que ca a a ca

3.2. ALGARISMOS SIGNIFICATIVOS

43

resulta num sistema linear de 37 inc´gnitas. E isso ´ pouco: imagine uma grade bem o e mais fina! A solu¸˜o de um sistema linear pelo M´todo do Escalonamento ´ exata, na medida em ca e e que o resultado final pode ser expresso em termos de fra¸˜es envolvendo os coeficientes co do sistema linear original. No entanto, calculadoras e computadores n˜o trabalham a dessa forma. Num computador ou numa calculadora cient´ ıfica os n´meros s˜o representados em u a ponto flutuante, baseados na nota¸˜o decimal (internamente pode ser em outra base, ca mas o que nos aparece ´, em geral, a nota¸˜o decimal). Na nota¸˜o de ponto flutuante, e ca ca um n´mero tem um expoente e uma mantissa. Se x ´ um n´mero real, seu expoente u e u ser´ o n´mero inteiro n tal que a u 10n−1 ≤ x < 10n .
x e e A mantissa de x, de ordem k, ´ a representa¸˜o decimal de 10n at´ a k-´sima casa e ca decimal, com arredondamento. Em geral as calculadoras usam k > 6, e computadores mais modernos podem usar valores bem mais altos. Por exemplo, quando pe¸o para c √ minha calculadora o valor de 50000 ela me responde

223.6067977 Observe que x = √ 50000 ´ tal que e 102 ≤ x < 103 , portanto o expoente ´ n = 3 nesse exemplo. Ent˜o e a x ≈ 0.2236067977 × 103 . A mantissa de x de ordem 10 ´ o n´mero e u 0.2236067977 As m´quinas trabalham com um tamanho fixo para a mantissa: na calculadora que a eu usei, esse tamanho ´ 10. A ordem k da mantissa que escolhemos para operar com e um n´mero ´ tamb´m chamada de “n´mero de algarismos significativos”. u e e u Antes de discorrermos sobre como fazer opera¸˜es aritm´ticas com n´meros nessa co e u representa¸˜o (a chamada “aritm´tica de ponto flutuante”), vejamos como se d´ o proca e a cesso de arredondamento. Suponha que um n´mero x se escreva da seguinte forma, na u nota¸˜o decimal: ca x = Np Np−1 . . . N1 N0 .N−1 N−2 N−3 . . . , onde Np , . . . , N0 , N−1 , N−2 , . . . s˜o os algarismos da nota¸˜o, de fato n´meros entre 0 e a ca u ` 9, j´ que se trata de representa¸ao na base 10. A direita a seq¨ˆncia dos Ni ’s pode ser a c˜ ue

44

´ CAP´ ITULO 3. O METODO DE ESCALONAMENTO

infinita (e inclusive h´ n´meros que podem ser escritos de duas formas diferentes, por a u exemplo 0.999 . . . = 1.000 . . .). Assumiremos que ela seja sempre infinita, pois mesmo que n˜o seja podemos torn´-la completando a seq¨ˆncia com zeros. a a ue Essa nota¸˜o representa uma s´rie, isto ´, uma soma de infinitos termos: ca e e x = Np · 10p + Np−1 · 10p−1 + . . . + N1 · 101 + N0 · 100 + N−1 · 10−1 + N−2 · 10−2 + . . . Mesmo sem estarmos familiarizados com s´ries, podemos entender o n´mero x da see u guinte forma: x est´ entre Np · 10p e (Np + 1) · 10p , mas tamb´m est´ entre Np · 10p + a e a Np−1 · 10p−1 e Np · 10p + (Np−1 + 1) · 10p−1 , e assim por diante. Se quisermos arredondar na k-´sima casa decimal depois da v´ e ırgula, observamos primeiramente que x ´ maior ou igual a e Np · 10p + . . . + N1 · 101 + N0 + N−1 · 10−1 + . . . + N−k · 10−k e menor do que Np · 10p + . . . + N1 · 101 + N0 + N−1 · 10−1 + . . . + (N−k + 1) · 10−k , e, para simplificar a nota¸˜o, definiremos ca X = Np · 10p + . . . + N1 · 101 + N0 + N−1 · 10−1 + . . . + N−k+1 · 10−k+1 , de forma que X + N−k · 10−k ≤ x < X + (N−k + 1) · 10−k . Para obter o arredondamento de x na k-´sima casa decimal, que denotaremos por x, e ˆ precisamos saber se x est´ mais pr´ximo de X + N−k · 10−k ou de X + (N−k + 1) · 10−k . a o Isso ´ determinado pelo algarismo seguinte na expans˜o decimal de x, isto ´, N−k−1 . e a e Podemos seguir a regra: se N−k−1 = 0, 1, 2, 3, 4, ent˜o x = X + N−k · 10−k ; j´ se a ˆ a −k . N−k−1 = 5, 6, 7, 8, 9 ent˜o x = X + (N−k + 1) · 10 a ˆ No segundo caso ´ preciso tomar cuidado ao se voltar para a nota¸˜o decimal. Se e ca 0 ≤ N−k ≤ 8, ent˜o a x = Np . . . N0 .N−1 . . . N−k+1 (N−k + 1) . ˆ Se, no entanto, N−k = 9, teremos N−k + 1 = 10. Isso faz com que no lugar de N−k + 1 coloquemos um zero e somemos 1 ao algarismo precedente, N−k+1 . Mas se N−k+1 for tamb´m igual a 9, ent˜o trocamos esse n´mero por um zero e somamos 1 ao precedente, e a u at´ isso n˜o mais acontecer. Por exemplo, o arredondamento de 1.5769996 para a sexta e a casa decimal ´ 1.577000. e Agora voltemos ` quest˜o das opera¸˜es aritm´ticas. No mundo das m´quinas, a a co e a elas devem ser feitas sempre respeitando um certo n´mero pr´-fixado de algarismos u e significativos. Para entender bem, nada melhor do que alguns exemplos.

3.2. ALGARISMOS SIGNIFICATIVOS

45

Digamos que se queira efetuar a opera¸˜o 2.236 + 12.448, com 4 algarismos sigca nificativos. O primeiro n´mero j´ est´ escrito com 4 algarismos significativos, pois u a a 2.236 = 0.2236 · 101 , mas o seguinte n˜o, pois 12.448 = 0.12448 · 102 . Ent˜o arredondaa a mos o segundo para que fique com 4 algarismos significativos, resultando 0.1245 · 102 , ou 12.45, e fazemos a soma: 12.45 + 2.236 = 14.686. A soma, no entanto, tem 5 algarismos significativos, logo somos obrigados a arredondar o resultado: 14.69. Observe que ter´ ıamos obtido um n´mero ligeiramente diferente se n˜o houv´ssemos arredondado u a e 12.448 para 12.45, pois 2.236 + 12.448 = 14.684 que, arredondado, fica 14.68. ´ a E f´cil ver que haver´ um ac´mulo de erro se um grande n´mero de opera¸˜es a u u co aritm´ticas for efetuado em cadeia. e Vejamos um exemplo de subtra¸˜o: queremos subtrair 0.122 de 943 com 3 algarismos ca significativos. Isso d´ 943, ap´s arredondamento. Da´ pode-se ver que em alguns casos a o ı a ordem das opera¸˜es de adi¸˜o e subtra¸˜o pode ser importante. Por exemplo, co ca ca (943 − 0.122) − 0.405 = 943 − 0.405 = 943 , mas 943 − (0.122 + 0.405) = 943 − 0.527 = 942 . ´ E preciso tomar bastante cuidado com subtra¸˜es e somas de n´meros com expoentes co u d´ ıspares, principalmente se essas opera¸˜es forem feitas em grande n´mero. Sen˜o corco u a remos o risco de subtrair 9430 vezes o n´mero 0.1 de 943 e continuar com 943, ao inv´s u e de obter zero!! Tamb´m deve-se tomar cuidado com a subtra¸˜o de n´meros muito e ca u parecidos, cuja diferen¸a se encontre al´m dos d´ c e ıgitos significativos, pois pode-se obter um zero onde deveria haver um n´mero simplesmente muito pequeno! u Como regra geral, cada opera¸˜o deve ser feita (se poss´ ca ıvel com mais algarismos do que os significativos, o dobro em geral) e o resultado da opera¸˜o arredondado. O ca mesmo vale para as opera¸˜es de multiplica¸˜o e divis˜o. Por exemplo, 5.35/7.22, com co ca a 3 algarismos significativos, d´ 0.741 (confira!). a Para ilustrar, fa¸amos o escalonamento e a resolu¸˜o de um sistema linear de ordem c ca 3, usando 3 algarismos significativos. Este exemplo servir´ para ilustrar como, em linhas a gerais, se d´ a resolu¸˜o de um sistema por um programa de computador. Evidentea ca mente um bom programa (h´ alguns j´ prontos para uso) tratar´ de minimizar o quanto a a a for poss´ ıvel os erros de arredondamento causados pelo n´mero limitado de algarismos u significativos. Aqui, ao contr´rio, tentaremos levar ao p´ da letra a regra de arredona e dar ap´s cada opera¸˜o. A regra s´ n˜o ser´ muito clara sobre a ordem de seguidas o ca o a a adi¸˜es ou multiplica¸˜es: neste caso, faremos o arredondamento ap´s todas as adi¸˜es co co o co (ou multiplica¸˜es). co Ap´s o exemplo, sugerimos ao leitor, como exerc´ o ıcio, que implemente no computador, usando alguma linguagem (C, Pascal, Fortran, Basic, etc), um programa que resolva

46

´ CAP´ ITULO 3. O METODO DE ESCALONAMENTO (que a ordem seja apenas limitada por problemas

sistemas lineares de qualquer ordem de falta de mem´ria, por exemplo). o Considere o sistema  3  1 2

 1 2 | −1 1 0 | 2  , 2 −1 | 1

9 que tem apenas coeficientes inteiros. Ele tem solu¸˜o exata (x1 , x2 , x3 ) = (− 2 , 13 , 3), que ca 2 pode ser obtida por escalonamento tamb´m, sem arredondamento (mantendo fra¸˜es). e co N˜o h´ arredondamentos a fazer, no princ´ a a ıpio, porque todos os coeficientes s˜o inteia ros. O “3” da primeira coluna serve como pivˆ, pois ´ maior do que os demais coeficientes o e da mesma coluna. A primeira etapa consiste em subtrair da segunda e da terceira linha m´ltiplos convenientes da primeira para que s´ reste o “3” como coeficiente n˜o nulo. u o a 1 Para a segunda linha, o m´ltiplo tem que ser 3 = 0.333, enquanto que para a terceira u 2 linha ele tem que ser 3 = 0.667. Chamaremos esses m´ltiplos de multiplicadores. u O leitor pode achar estranho que 1−0.333×3 = 1−0.999 = 0.001, o que faz com que de fato o primeiro coeficiente da segunda linha n˜o se anule. Isso ser´ ignorado na hora a a de se fazer o escalonamento. Observe que a escolha do multiplicador como 0.334 n˜o a ajudaria a resolver o problema. A unica solu¸˜o seria n˜o arredondar o multiplicador ´ ca a antes de fazer a conta, mas nem sempre ´ isso o que acontece num programa. e Dessa primeira etapa sai o sistema

 3 1 2 | −1  0 0.667 −0.666 | 2.33  . 0 1.33 −2.33 | 1.67 Olhando para a segunda coluna, nota-se que a terceira linha deve servir como pivˆ, pois o 1.33 ´ maior do que 0.667. Ent˜o faz-se a troca da segunda linha com a terceira, ficando e a   3 1 2 | −1  0 1.33 −2.33 | 1.67  . 0 0.667 −0.666 | 2.33 Para a terceira linha, usa-se o multiplicador 0.667 = 0.502 , 1.33 e da´ temos ı   3 1 2 | −1  0 1.33 −2.33 | 1.67  . 0 0 0.504 | 1.49

´ 3.3. O DETERMINANTE NO METODO DE ESCALONAMENTO Portanto

47

1.49 = 2.96 , 0.504 1.67 + 2.33 × 2.96 1.67 + 6.90 8.57 x2 = = = = 6.44 1.33 1.33 1.33 x3 = x1 = 13.4 −1 − 6.44 − 2 × 2.96 =− = −4.47 . 3 3

e

1 Observe que n˜o ´ preciso, quando se for dividir por 3, calcular 3 , arredondar e depois a e multiplicar pelo numerador. A divis˜o ´ considerada uma opera¸˜o elementar. a e ca Comparando com a solu¸˜o exata, podemos ver que o maior erro absoluto foi de ca 0.06. Mais adiante, na Subse¸˜o 3.5.3, veremos como melhorar o c´lculo, usando o ca a refinamento de solu¸˜es. co

Exerc´ ıcio. Fa¸a as contas intermedi´rias do exemplo acima. Resolva o sistema do c a exemplo acima usando apenas 2 algarismos significativos. Exerc´ ıcio. Implemente a resolu¸˜o por escalonamento no computador. ca Exerc´ ıcio. Resolva o sistema linear 7.01 2.52 | 10.1 0.031 0.789 | 2.6 com 3 algarismos significativos.

3.3

O determinante no M´todo de Escalonamento e

Observemos em primeiro lugar que as propriedades do determinante de uma n-upla de vetores (u1 , . . . , un ) de Rn (normaliza¸˜o, alternˆncia e linearidade) podem ser formuca a ladas diretamente para uma matriz A: 1) det(Id) = 1; 2) a troca de duas colunas faz mudar o sinal do determinante; e 3) se uma coluna se escreve como combina¸˜o αu + βv, ca ent˜o o determinante ´ a soma de α vezes o determinante da mesma matriz com a coa e luna αu + βv trocada por u com β vezes o determinante da mesma matriz com a coluna αu + βv trocada por v. Por exemplo, suponha que queiramos calcular det(u1 , u2 , . . . , uj + βui , . . . , un ) , que, em termos matriciais, significa somar um m´ltiplo da i-´sima coluna ` j-´sima u e a e coluna. Pelas propriedades do determinante, det(u1 , u2 , . . . , uj + βui , . . . , un ) = det(u1 , u2 , . . . , uj , . . . , un ) ,

48

´ CAP´ ITULO 3. O METODO DE ESCALONAMENTO

logo o determinante n˜o se altera quando somamos a uma coluna um m´ltiplo de uma a u outra. Em seguida, ressaltamos que as mesmas propriedades s˜o v´lidas com linhas ao a a inv´s de colunas. Isso porque n˜o ´ dif´ mostrar que a transposta de A, denotada por e a e ıcil AT , que ´ a matriz A onde se trocam colunas por linhas, tem o mesmo determinante e que A. Logo as propriedades de det A em rela¸˜o a suas linhas s˜o as mesmas que ca a T = det A em rela¸˜o a suas colunas. det A ca Portanto todas as opera¸˜es realizadas no M´todo de Escalonamento n˜o alteram o co e a determinante da matriz de coeficientes, exceto as trocas de linhas, feitas por conta da condensa¸˜o pivotal, pois cada troca de linha muda o sinal do determinante. ca Por outro lado, o resultado final do escalonamento ´ uma matriz triangular, cujo e determinante ´ dado pelo produto dos coeficientes da diagonal. Ent˜o o determinante e a do sistema ser´ zero se e somente se ap´s o escalonamento houver um termo nulo na a o diagonal, e nesse caso o sistema ser´ imposs´ ou indeterminado. a ıvel Isto completa o argumento da Subse¸˜o 2.8.3, onde quer´ ca ıamos provar que se A tem inversa ent˜o det A = 0. Pois se A tem inversa, segue que o sistema tem unica solu¸˜o e a ´ ca todos os termos da diagonal s˜o n˜o-nulos, e por conseguinte o determinante do sistema a a tamb´m ´ n˜o-nulo. e e a

3.4

A desvantagem da Regra de Cramer

A Regra de Cramer ´ uma f´rmula bastante pr´tica de se resolver Au = b, usando e o a a no¸˜o de determinante. Suponha que det A = 0. Nesse caso, existe unica solu¸˜o ca ´ ca u = (x1 , . . . , xn ) para Au = b, mas quais s˜o os valores de x1 , . . . , xn ? a Note que se trocarmos a i-´sima coluna pelo vetor b e calcularmos o determinante e da matriz resultante teremos det(. . . , Aei−1 , b, Aei+1 , . . .) = det(. . . , Aei−1 , x1 Ae1 + . . . + xn Aen , Aei+1 , . . .) , pois b = Au = x1 Ae1 + . . . + xn Aen , pela linearidade de A. Pela linearidade do determinante, podemos separ´-lo na soma de n determinantes, onde em cada um deles teremos a na i-´sima posi¸˜o um dos vetores xj Aej . No entanto, apenas o determinante com xi Aei e ca ser´ n˜o-nulo: a a det(. . . , Aei−1 , b, Aei+1 , . . .) = det(. . . , Aei−1 , xi Aei , Aei+1 , . . .) . Mais uma vez pela linearidade, podemos tirar o escalar xi , que ficar´ multiplicado pelo a pr´prio determinante da matriz A: o det(. . . , Aei−1 , b, Aei+1 , . . .) = xi det A .

3.4. A DESVANTAGEM DA REGRA DE CRAMER Logo xi = det(. . . , Aei−1 , b, Aei+1 , . . .) , det A

49

que ´ a Regra de Cramer. e A desvantagem da Regra de Cramer ´ que o n´mero de opera¸˜es necess´rias para e u co a se chegar ` solu¸˜o ´ em geral muito maior do que no M´todo de Escalonamento. Essa a ca e e compara¸˜o ´ feita assim: calcula-se o n´mero de opera¸˜es aritm´ticas necess´rias em ca e u co e a cada m´todo em fun¸˜o do tamanho n do sistema linear. Ent˜o vˆ-se que num m´todo e ca a e e esse n´mero cresce muito mais rapidamente com n do que no outro. Para facilitar a u compara¸˜o, ignoraremos as instru¸˜es de controle de fluxo que seriam necess´rias caso ca co a os m´todos fossem implementados num computador. e Um n´mero de opera¸˜es aritm´ticas muito grande ´ desvantajoso por duas raz˜es: u co e e o aumenta o tempo de computa¸˜o e aumenta a propaga¸˜o dos erros de arredondamento. ca ca O n´mero de produtos de n termos que aparecem no c´lculo de um determinante u a ´ n! (mostre isso), ou seja, s˜o n! opera¸˜es de adi¸˜o. Para obter cada produto s˜o e a co ca a n − 1 multiplica¸˜es, totalizando n!(n − 1) opera¸˜es de multiplica¸˜o. Para calcular as co co ca n inc´gnitas, a Regra de Cramer pede n + 1 determinantes, logo s˜o n!(n + 1) adi¸˜es e o a co n!(n − 1)(n + 1) multiplica¸˜es, mais as n divis˜es ao final de tudo. co o E quanto ao M´todo de Escalonamento, quantas opera¸˜es aritm´ticas ser˜o necese co e a s´rias? Em vez de darmos a resposta sugere-se ao leitor fazer por ele mesmo, como a indicado no seguinte exerc´ ıcio. Exerc´ ıcio. Mostre que o n´mero de adi¸˜es/subtra¸˜es, multiplica¸˜es e divis˜es necesu co co co o s´rias para se completar o M´todo de Escalonamento num sistema linear de n equa¸˜es a e co 3 , para cada uma delas. e n inc´gnitas n˜o passa de 2n o a Se quisermos comparar o n´mero de opera¸˜es totais, vemos que na Regra de Cramer u co s˜o necess´rias mais do que n! opera¸˜es. a a co Exerc´ ıcio. Mostre que, quando n ´ grande ent˜o n! ´ muito maior do que 2n3 . De e a e fato, a raz˜o a 6n3 n! vai a zero quando n vai a infinito. Se vocˆ mostrou isso com sucesso, ver´ ent˜o que e a a seu argumento serve para mostrar que, qualquer que seja a potˆncia p, a raz˜o e a np n! sempre vai a zero. Verifique! Na verdade, devemos tomar um certo cuidado com a maneira pela qual fizemos a compara¸˜o entre os dois m´todos. Se estivermos pensando em tempo de computa¸˜o, ca e ca

50

´ CAP´ ITULO 3. O METODO DE ESCALONAMENTO

precisamos saber quanto a m´quina gasta para fazer cada uma das opera¸˜es. A divis˜o a co a certamente gasta mais tempo do que as outras opera¸˜es, e o M´todo de Cramer apreco e senta menos divis˜es (apenas n) do que o M´todo de Escalonamento (cada multiplicador o e ´ calculado atrav´s de uma divis˜o). J´ na contabilidade das outras opera¸˜es o M´todo e e a a co e de Cramer perde do M´todo de Escalonamento, por causa do exerc´ acima. e ıcio Exerc´ ıcio. Suponha que uma divis˜o nunca demore mais do que T vezes uma multia plica¸˜o, onde T ´ uma constante qualquer maior do que zero, e a multiplica¸˜o tome ca e ca o mesmo tempo que a adi¸˜o e a subtra¸˜o. Decida qual dos m´todos ´ mais vantajoso, ca ca e e sob o ponto de vista de tempo de computa¸˜o para complet´-lo. ca a

3.5
3.5.1

Sistemas mal-condicionados e refinamento de solu¸˜o ca
Sistemas mal-condicionados

Na teoria, se um sistema linear Au = b satisfaz det A = 0, ent˜o existe uma e s´ uma a o solu¸˜o u. Na pr´tica, por´m, quando resolvemos o sistema via computador, erros podem ca a e se acumular e a solu¸˜o se afastar da solu¸˜o verdadeira. Isso pode ser parcialmente ca ca sanado pela Condensa¸˜o Pivotal, descrita no Cap´ ca ıtulo 3, e pelo M´todo de Refinamento, e do qual daremos uma id´ia abaixo. e O principal problema vem do fato de que muitas vezes os coeficientes do sistema e os termos independentes s˜o retirados de medidas f´ a ısicas ou de modelos aproximados. Para alguns sistemas, a solu¸˜o pode depender sensivelmente de seus coeficientes, a ca ponto de pequenas incertezas em seus valores provocarem grandes altera¸˜es na solu¸˜o co ca final. Esses sistemas s˜o chamados de mal-condicionados. a Para exemplificar, consideremos o sistema 2 × 2 x + y = 1 99x + 100y = 99.5 ,

que tem solu¸˜o unica e exata x = 0.5, y = 0.5. Agora considere o sistema ca ´ x + y = 1 99.4x + 99.9y = 99.2 ,

com altera¸˜es de n˜o mais do que 0.5% nos coeficientes originais (o que ´ bastante co a e razo´vel para uma medida experimental). Sua solu¸˜o unica e exata ´ x = 1.4, y = −0.4, a ca ´ e radicalmente diferente da anterior. Para entender porque isso acontece, experimente o leitor, para cada um dos dois sistemas, desenhar as retas que correspondem a cada uma das equa¸˜es. Nota-se que co o problema ´ devido ao fato de que as retas correspondentes a cada equa¸˜o s˜o quase e ca a

3.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUCAO ¸˜

51

paralelas, o que faz com que o ponto de intersec¸˜o das duas seja muito sens´ ca ıvel a pequenas mudan¸as nos coeficientes. c A id´ia vale em dimens˜es mais altas, se pensarmos em hiperplanos quase paralelos, e o no lugar de retas. Podemos tamb´m pensar nos vetores-coluna de A (ou nos vetorese linha): se Ae1 , Ae2 , . . . , Aen forem “quase” linearmente dependentes, ent˜o o sistema a ser´ mal-condicionado. a Uma maneira de se “medir” o condicionamento da matriz seria calculando seu determinante (embora muitas vezes s´ possamos conhecˆ-lo depois de escalonar a matriz). O o e determinante ´ o hipervolume (com sinal) do hiperparalelep´ e ıpedo formado pelos vetorescoluna Ae1 , Ae2 , . . . , Aen . Se esses vetores forem quase linearmente dependentes, ent˜o a o hiperparalelep´ ıpedo ser´ “achatado”, e portanto ter´ volume pequeno. O argumento a a s´ falha no sentido de que o volume n˜o depende somente do grau de achatamento do hio a perparalelep´ ıpedo, mas tamb´m do comprimento de cada vetor. Ent˜o uma medida mais e a confi´vel seria tomar o hipervolume do hiperparalelep´ a ıpedo formado pela normaliza¸˜o ca desses vetores, isto ´, pelos vetores e vi = Aei . Aei

Esse n´mero estar´ entre 0 e 1, e quando estiver perto de zero significa que a matriz ´ u a e mal-condicionada. Em resumo, o n´mero de condicionamento pode ser achado assim: (i) substitua cada u coluna Aei da matriz pelo vetor vi = Aei , lembrando que a norma (euclideana) u Aei de um vetor u = (x1 , . . . , xn ) ´ dada por u = (x2 + . . . + x2 )1/2 ; (ii) calcule o valor e n 1 absoluto do determinante da nova matriz; (iii) observe se o n´mero obtido est´ pr´ximo u a o de zero ou de um: se estiver perto de zero ent˜o a matriz A ´ mal-condicionada. a e H´ outras medidas do condicionamento de uma matriz, assim como h´ f´rmulas que a a o relacionam o erro cometido no M´todo de Escalonamento com essas medidas e com o e n´mero de algarismos significativos utilizados nas contas. Isso tudo no entanto foge u ao escopo dessas notas. Al´m do mais, medidas de condicionamento s˜o dificilmente e a aplic´veis na pr´tica, pois s˜o t˜o (ou mais) dif´ a a a a ıceis de serem obtidas quanto a pr´pria o solu¸˜o do sistema linear. ca

3.5.2

Matrizes de Hilbert
o problema do mau condicionamento, suge-

Para que o leitor se familiarize melhor com rimos que acompanhe o seguinte Exemplo. Considere o sistema  1  x1 + 2 x2 1 1 x1 + 3 x2  2 1 1 3 x1 + 4 x2

+ + +

1 3 x3 1 4 x3 1 5 x3

= 1 = 1 = 1

.

52

´ CAP´ ITULO 3. O METODO DE ESCALONAMENTO

Resolvendo o sistema por escalonamento (sem troca de linhas, pois n˜o s˜o nea a cess´rias para a condensa¸˜o pivotal), e fazendo contas com fra¸˜es exatas, obtemos a a ca co solu¸˜o exata (x1 , x2 , x3 ) = (3, −24, 30). ca Se, por outro lado, usarmos dois algarismos significativos ( 1 = 0.33, por exemplo) 3 e seguirmos exatamente o mesmo procedimento, obteremos (0.9, −11, 17). Com trˆs e algarismos significativos, chegaremos em (2.64, −21.8, 27.8), resultado mais pr´ximo mas o ainda estranhamente longe da solu¸˜o exata. ca Matrizes do tipo   1 1 1 1 ··· 2 3 n 1 1 1  1 · · · n+1  3 4  2   . . . . .  . . . . . .   . . . . . 1 1 1 1 n n+1 n+2 · · · 2n−1 s˜o chamadas de matrizes de Hilbert, e aparecem naturalmente no problema do ajuste a polinomial, como veremos mais adiante (vide Subse¸˜o 6.7.2). ca

3.5.3

Refinamento

Uma das maneiras de sanar o problema de se encontrar uma solu¸˜o “ruim”, causada ca pelo mau condicionamento do sistema, ´ fazer o refinamento, que consiste em obter uma e solu¸˜o u de Au = b, mesmo que n˜o correta (por causa dos erros de arredondamento), ca ˆ a e depois melhor´-la. a Para melhorar u, definimos a diferen¸a w = u − u para a solu¸˜o verdadeira u, e ˆ c ˆ ca tentamos calcular w. Como u = u + w, ent˜o ˆ a b = Au = A(ˆ + w) , u logo Aw = b − Aˆ . u Ou seja, a diferen¸a w entre u e u ´ a solu¸˜o de um sistema linear, onde os termos c ˆ e ca independentes s˜o dados por b − Aˆ e os coeficientes s˜o os mesmos do sistema linear a u a original (o que facilita as coisas do ponto de vista de programa¸˜o). ca O m´todo pode ser implementado assim: calcula-se a primeira solu¸˜o aproximada e ca (0) . Calcula-se ent˜o w (0) = u − u(0) resolvendo-se o sistema u a Aw(0) = b − Au(0) . Se a solu¸˜o desse sistema n˜o contivesse erros, ent˜o u = u(0) + w(0) seria a solu¸˜o ca a a ca correta. Como erros s˜o inevit´veis, u(0) + w(0) pode n˜o ser a solu¸˜o exata, e ser´ a a a ca a (1) . Calcula-se ent˜o w (1) = u − u(1) , resolvendo-se chamada de u a Aw(1) = b − Au(1) ,

3.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUCAO ¸˜

53

e em seguida define-se u(2) = u(1) + w(1) . E assim por diante. Vejamos um exemplo ilustrativo. Na Se¸˜o 3.2, usamos 3 algarismos significativos ca para resolver   3 1 2 | −1  1 1 0 | 2  . 2 2 −1 | 1 Os passos do escalonamento ali usados s˜o importantes para n˜o se repetir as mesmas a a contas a cada etapa do refinamento. A solu¸˜o obtida pode ser considerada uma primeira aproxima¸˜o, chamada de u(0) : ca ca   −4.47 u(0) =  6.44  . 2.96 Calculamos ent˜o Au(0) , que ´ o teste usual para ver se u(0) ´ realmente solu¸˜o. Obtea e e ca mos   −1.04 Au(0) =  1.97  , 1 sempre usando 3 algarismos significativos, e ent˜o tiramos a diferen¸a a c   0.04 b − Au(0) =  0.03  . 0 Agora queremos obter w do sistema Aw = b − Au(0) , para chegar ` etapa seguinte, a com u(1) = u(0) + w. Ou seja, temos que resolver o sistema   3 1 2 | 0.04  1 1 0 | 0.03  . 3 2 −1 | 0 Se procedermos ao escalonamento, seguiremos exatamente os mesmos passos feitos na Se¸˜o 3.2. Ent˜o n˜o precisamos fazer tudo de novo no lado esquerdo, somente no vetor ca a a de termos independentes do lado direito. As transforma¸˜es do lado direito s˜o co a         0.04 0.04 0.04 0.04 (iii) (ii) (i)  0.03  −→  0.0167  −→  −0.0267  −→  −0.0267  , 0.0301 0.0167 −0.0267 0

54

´ CAP´ ITULO 3. O METODO DE ESCALONAMENTO

onde em (i) subtra´ ımos da segunda linha 0.333 vezes a primeira linha e da terceira linha subtra´ ımos 0.667 vezes a primeira linha, em (ii) trocamos as posi¸˜es da segunda e da co terceira linhas e em (iii) subtra´ ımos da terceira linha 0.502 vezes a segunda linha. O sistema escalonado fica   3 1 2 | 0.04  0 1.33 −2.33 | −0.0267  , 0 0 0.504 | 0.0301 e da´ chegamos a w = (w1 , w2 , w3 ) = (−0.0543, 0.0842, 0.0597). Somando com u(0) ı obtemos u(1) = (−4.52, 6.52, 3.02), com erro absoluto m´ximo de 0.02. a (1) = (−1.04, 2, 0.94), nada muito melhor do que Au(0) . Para conferir, notamos que Au De fato, mesmo com a possibilidade de refinamento, a solu¸˜o de partida j´ era bastante ca a razo´vel. Vale a pena o leitor fazer mais algumas etapas, e conferir os seguintes valores: a     −4.44 −4.53 u(2) =  6.44  , u(3) =  6.53  . 2.96 3.02 Com a limita¸˜o do n´mero de algarismos significativos, n˜o ´ certeza que o refinaca u a e mento levar´ ` melhor aproxima¸˜o da solu¸˜o correta. Melhores resultados s˜o obtidos aa ca ca a se, no c´lculo de b − Au(i) , for usada precis˜o dupla (isto ´, o dobro de algarismos siga a e nificativos), uma vez que b e Au(i) s˜o vetores cujas coordenadas tˆm valores muito a e pr´ximos. Obviamente os benef´ o ıcios da precis˜o dupla podem ser usados nos computaa dores e calculadoras modernos, quando se escrevem v´rias opera¸˜es concatenadas na a co mesma linha e o arredondamento para precis˜o simples s´ ´ feito no final. Isto diminui a oe sensivelmente o ac´mulo de erros. u ´ E preciso tamb´m colocar um crit´rio de parada, principalmente no caso de se fazer e e a implementa¸˜o no computador. O crit´rio pode ser feito nas solu¸˜es u(i) ou nos ca e co testes Au(i) . Por exemplo, se u(i) = (u1 , u2 , . . . , un ) e u(i+1) = (ˆ1 , u2 , . . . , un ), pode-se u ˆ ˆ comparar o quanto as coordenadas variam, relativamente, da etapa i para a etapa i + 1, olhando para os n´meros u |u1 − u1 | ˆ |un − un | ˆ , ... , , ... , |u1 | |un | e pedindo que eles sejam menores do que um certo valor (por exemplo, 0.05, significando 5% de varia¸˜o). O problema ´ quando o denominador ´ igual a zero. Pode-se convenca e e cionar que: (i) se uj = 0 e uj = 0 ent˜o a varia¸˜o ´ zero; (ii) se uj = 0 e uj = 0, ent˜o ˆ a ca e ˆ a a varia¸˜o ´ igual a 1 (o que, em geral, far´ com que o processo continue). ca e a Exerc´ ıcio. Melhorar o programa que implementa o M´todo de Escalonamento com e condensa¸˜o pivotal, acrescentando o refinamento, com algum crit´rio de parada. Para ca e

3.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUCAO ¸˜

55

fazer o refinamento, o programa deve utilizar o “hist´rico” do escalonamento, isto ´, os o e multiplicadores e as trocas de linha (para que n˜o se repita tudo a cada etapa). a Exerc´ ıcio. Tome o sistema discutido na Subse¸˜o 3.5.2 e sua solu¸˜o obtida com 2 ca ca (0) . Obtenha o refinamento u(1) , calculando algarismos significativos, chamando-a de u b − Au(0) com dupla precis˜o. a Exerc´ ıcio. Considere o sistema   1/2 1/3 1/4 | −1  1/3 1/4 1/5 | 0  . 1/4 1/5 1/6 | 1 1. Ache sua solu¸˜o exata. ca 2. Resolva-o com dois algarismos significativos. 3. Agora fa¸a a seguinte experiˆncia: escreva o mesmo sistema, arredondando para c e dois algarismos significativos, mas a partir da´ ache sua solu¸˜o usando o m´ximo ı ca a de algarismos significativos que sua calculadora permite. Compare com a solu¸˜o ca exata. Isto mostra que o refinamento tamb´m ´ limitado pelo arredondamento e e inicial que, num sistema mal-condicionado, pode alterar drasticamente a solu¸˜o. ca

56

´ CAP´ ITULO 3. O METODO DE ESCALONAMENTO

Cap´ ıtulo 4

M´todos iterativos e
4.1 O M´todo de Jacobi e

O M´todo de Jacobi ´ um procedimento iterativo para a resolu¸˜o de sistemas lineares. e e ca Tem a vantagem de ser mais simples de se implementar no computador do que o M´todo e de Escalonamento, e est´ menos sujeito ao ac´mulo de erros de arredondamento. Seu a u grande defeito, no entanto, ´ n˜o funcionar em todos os casos. e a Suponha um sistema linear nas inc´gnitas x1 , ..., xn da seguinte forma: o a11 x1 a21 x1 . . . + a12 x2 + a22 x2 . . . + a13 x3 + . . . + a1n xn = b1 + ... + . . . + a2n xn = b2 . . . . . . . . . . . . + ... + . . . + ann xn = bn

an1 x1 + an2 x2

Suponha tamb´m que todos os termos aii sejam diferentes de zero (i = 1, . . . , n). Se e n˜o for o caso, isso `s vezes pode ser resolvido com uma troca na ordem das equa¸˜es. a a co Ent˜o a solu¸˜o desse sistema satisfaz a ca 1 [b1 − a12 x2 − a13 x3 − . . . − a1n xn ] a11 1 x2 = [b2 − a21 x1 − a23 x3 − . . . − a2n xn ] a22 . . . . . . 1 xn = [bn − an1 x1 − an2 x2 − . . . − an,n−1 xn−1 ] ann x1 = Em outras palavras, se (x1 , . . . , xn ) for solu¸˜o do sistema e esses valores forem “colocaca dos” no lado direito das equa¸˜es, ent˜o resultar˜o no lado esquerdo os mesmos valores co a a x1 , . . . , xn . 57

58

´ CAP´ ITULO 4. METODOS ITERATIVOS
(0) (0)

O M´todo de Jacobi consiste em “chutar” valores x1 , . . . , xn , colocar esses valores e (1) (1) no lado direito das equa¸˜es, obter da´ x1 , . . . , xn , em seguida colocar esses novos co ı (2) (2) valores nas equa¸˜es e obter x1 , . . . , xn , etc. Ent˜o co a 1 (k) (k) b1 − a12 x2 − a13 x3 − . . . − a1n x(k) n a11 1 (k) (k) (k+1) b2 − a21 x1 − a23 x3 − . . . − a2n x(k) x2 = n a22 . . . . . . 1 (k) (k) (k) x(k+1) = bn − an1 x1 − an2 x2 − . . . − an,n−1 xn−1 n ann x1
(k+1)

=

Espera-se que para todo i = 1, . . . , n a seq¨ˆncia {xi }k convirja para o valor verdadeiro ue xi . Como dissemos, no entanto, nem sempre ocorre essa convergˆncia. Ser´ que ´ poss´ e a e ıvel saber de antem˜o se o m´todo vai ou n˜o vai funcionar? a e a Daremos um crit´rio, chamado de ‘Crit´rio das Linhas’ que, se for satisfeito, implica e e na convergˆncia do M´todo. Infelizmente, da´ n˜o poderemos concluir a afirmativa e e ı a inversa. Isto ´, ´ falso dizer “n˜o satisfaz o Crit´rio das Linhas ent˜o n˜o converge”. e e a e a a Pode haver sistemas em que o M´todo de Jacobi funcione por´m n˜o satisfa¸a o Crit´rio e e a c e das Linhas.

(k)

4.2

Crit´rio das Linhas e
n

O Crit´rio das Linhas pede que e |aij | < |aii | j=1 j=i para todo i = 1, . . . , n. Em palavras: “o valor absoluto do termo diagonal na linha i ´ e maior do que a soma dos valores absolutos de todos os outros termos na mesma linha”. ´ E importante observar que o Crit´rio das Linhas pode deixar de ser satisfeito se e houver troca na ordem das equa¸˜es, e vice-versa: uma troca cuidadosa pode fazer com co que o sistema passe a satisfazer o Crit´rio. e Teorema. Se o sistema linear satisfaz o Crit´rio das Linhas ent˜o o M´todo de Jacobi e a e converge. Sugerimos o seguinte exerc´ ıcio, antes de passarmos ` demonstra¸˜o desse Teorema. a ca

´ 4.2. CRITERIO DAS LINHAS

59

Exerc´ ıcio. Mostre que os sistemas lineares gerados por problemas de contorno (Se¸˜o 1.8) ca em geral n˜o satisfazem o Crit´rio das Linhas. Mesmo assim, monte um programa de a e computador que resolva o problema, baseado no M´todo de Jacobi. O que acontece? e Para provar o Teorema, precisamos mostrar (usando o Crit´rio das Linhas) que e (k) (k) (k) (0) (0) (0) as seq¨ˆncias x1 , x2 ,...,xn , formadas a partir dos chutes iniciais x1 , x2 ,...,xn , ue convergem para os valores procurados x1 , . . . , xn . Ent˜o precisamos mostrar que a |x1 − x1 | −→ 0 , |x2 − x2 | −→ 0 , . . . , |x(k) − xn | −→ 0 , n ou, introduzindo uma nota¸˜o mais compacta, de forma que ca ∆(k) = max{|x1 − x1 |, . . . , |x(k) − xn |} −→ 0 . n De fato, iremos mostrar que ∆(k) decai geometricamente, isto ´, existem um λ < 1 e e uma constante c > 0 tal que ∆(k) ≤ cλk , e isso provar´ nossa afirma¸˜o. a ca J´ para conseguir essa desigualdade, provaremos que para todo k ≥ 1 vale a ∆(k) ≤ λ∆(k − 1) . Ent˜o teremos a ∆(1) ≤ λ∆(0) ∆(2) ≤ λ∆(1) ≤ λ2 ∆(0) . . . . . . ∆(k) ≤ λk ∆(0) , ou seja, a constante c pode ser o pr´prio ∆(0), que ´ a maior diferen¸a entre o valor o e c inicial e a solu¸˜o verdadeira. ca Por sua vez, provar que ∆(k) ≤ λ∆(k − 1) remete a provar que, para todo i = 1, . . . , n, vale |xi
(k) (k) k→∞ (k) k→∞ (k) k→∞ k→∞

− xi | ≤ λ∆(k − 1) = λ max |xi
i=1,...,n

(k−1)

− xi | .

Faremos a demonstra¸˜o completa para i = 1, mas ficar´ claro que o argumento valer´ ca a a para todo i = 1, . . . , n, desde que escolhamos λ adequadamente. Precisamos escrever (k) xi − xi , lembrando que x1 =
(k)

1 (k−1) (k−1) b1 − a12 x2 − a13 x3 − . . . − a1n x(k−1) n a11

60 e, como os x1 , . . . , xn formam uma solu¸˜o, ca x1 = Ent˜o a x1 − x1 =
(k)

´ CAP´ ITULO 4. METODOS ITERATIVOS

1 (b1 − a12 x2 − a13 x3 − . . . − a1n xn ) . a11

1 (k−1) (k−1) (k−1) a12 (x2 − x2 ) + a13 (x3 − x3 ) + . . . + a1n (xn − xn ) a11

.

Tomando o valor absoluto (o m´dulo) e lembrando que “o m´dulo da soma ´ menor ou o o e igual ` soma dos m´dulos”, temos a o |x1 − x1 | ≤ 1 (k−1) (k−1) |a12 | · |x2 − x2 | + |a13 | · |x3 − x3 | + . . . + |a1n | · |xn − x(k−1) | n |a11 | Note, no entanto, que por defini¸˜o ca |xj − xj portanto |x1 − x1 | ≤ Agora definimos a constante λ1 = |a12 | + |a13 | + . . . + |a1n | , |a11 |
(k) (k−1) (k)

.

| ≤ max |xi − xi
i=1,...,n

(k−1)

| ≡ ∆(k − 1) ,

|a12 | + |a13 | + . . . + |a1n | ∆(k − 1) . |a11 |

que deve ser menor do que 1, pelo Crit´rio das Linhas. Ent˜o e a |x1 − x1 | ≤ λ1 ∆(k − 1) . Para as outras linhas todo o procedimento ´ an´logo, e sempre resultar´ e a a |xi para todo i = 1, . . . , n, onde 1 λi = |aii |
n (k) (k)

− xi | ≤ λi ∆(k − 1) ,

|aij | . j=1 j=i

´ 4.3. CRITERIO DE PARADA

61

O Crit´rio das Linhas garante que λi < 1, para todo i = 1, . . . , n. Se definirmos agora e λ = max λi ,
i=1,...,n

ent˜o a |xi logo ∆(k) ≤ λ∆(k − 1) , como quer´ ıamos demonstrar!
(k)

− xi | ≤ λ∆(k − 1) ,

4.3

Crit´rio de parada e

Ao implementar o M´todo de Jacobi no computador ´ preciso fornecer ao computador e e um crit´rio de parada para o programa. Isso ´ feito fixando-se uma precis˜o relativa p, e e a que far´ o programa parar (no passo k) se a |xi
(k+1)

− xi | ≤ p|xi | ,
(k)

(k)

(k)

para todo i = 1, . . . , n. Ou seja, se |xi | = 0, ent˜o a varia¸˜o relativa de um passo a ca para outro (k+1) (k) |xi − xi | |xi | tem que ser menor ou igual a p. E se xi = 0 ent˜o xi a tamb´m deve ser zero. e ´ preciso ter, no entanto, bastante cuidado com a escolha de p, pois muitas vezes E a velocidade de convergˆncia do m´todo ´ muito lenta. Mesmo longe da solu¸˜o, a e e e ca varia¸˜o relativa das solu¸˜es aproximadas pode ser muito pequena. ca co
(k) (k+1) (k)

4.4

O M´todo de Gauss-Seidel e

O M´todo de Jacobi poderia ser aplicado nos problemas de contorno da Se¸˜o 1.8, mas e ca somente pelo Crit´rio das Linhas n˜o seria poss´ e a ıvel afirmar que haveria convergˆncia, e pois os v´rtices livres produzem equa¸˜es onde o elemento da diagonal ´ exatamente e co e igual ` soma dos demais termos, o que significa, na nota¸˜o da Se¸˜o anterior, que a ca ca λi = 1, para alguns valores de i. Experimentos num´ricos evidenciam que de fato h´ convergˆncia do M´todo de Jae a e e cobi nesses casos, embora ela seja muito lenta, principalmente se o n´mero de v´rtices u e da grade for muito grande. Embora a convergˆncia possa ser demonstrada matematie camente, com crit´rios menos exigentes que o Crit´rio das Linhas, discutiremos nesta e e

62

´ CAP´ ITULO 4. METODOS ITERATIVOS

Se¸˜o uma varia¸˜o do M´todo de Jacobi, chamada de M´todo de Gauss-Seidel. Sua ca ca e e efic´cia ficar´ demonstrada a partir de uma hip´tese mais fraca que o Crit´rio das Lia a o e nhas, chamada de Crit´rio de Sassenfeld. N˜o ser´ dif´ mostrar que os problemas de e a a ıcil contorno citados satisfazem esse crit´rio, desde que se tenha um m´ e ınimo de cuidado na numera¸˜o dos v´rtices livres. ca e (k+1) (k+1) (k) No M´todo de Jacobi, calcula-se o vetor (x1 e , . . . , xn ) a partir do vetor (x1 , (k) . . ., xn ) da seguinte forma:  (k+1)     (k)    a12 a13 0 · · · a1n x1 x1 b1 /a11 a11 a11 a11  (k+1)   a23 a2n   (k)    a21 0 · · · a22   x2   x2   b2 /a22   a22 a22  = − . . . . . .  .  , .    . . . . .  .  .   . . . . . . . .    .  an1 an2 an3 (k+1) (k) bn /ann ··· 0 xn xn ann ann ann ou, de forma sucinta, u(k+1) = w − Bu(k) . Em cada etapa, as coordenadas x1 , . . ., xn de u(k+1) s˜o obtidas todas de uma a (k) (k) (k) . vez s´, a partir das coordenadas x1 , . . ., xn de u o J´ no M´todo de Gauss-Seidel as coordenadas atualizadas s˜o imediatamente usadas a e a na atualiza¸˜o das demais. Explicitamente, temos ca x1 1 a11 1 (k+1) x2 = a22 1 (k+1) x3 = a33 . . . . . . 1 (k+1) xn = ann
(k+1) (k+1) (k+1)

=

b1 − a12 x2 − a13 x3 − . . . − a1n x(k) n b2 − a21 x1 b3 − a31 x1
(k+1)

(k)

(k)

− a23 x3 − . . . − a2n x(k) n − a32 x3
(k+1)

(k)

(k+1)

− . . . − a3n x(k) n

bn − an1 x1

(k+1)

− an2 x2

(k+1)

− . . . − an,n−1 xn−1

(k+1)

Para introduzir o Crit´rio de Sassenfeld e discutir a convergˆncia, ´ melhor ilustrare e e mos com um sistema com 4 equa¸˜es. Depois enunciaremos o Crit´rio para sistemas co e com um n´mero qualquer de equa¸˜es, e ficar´ claro que os argumentos se generalizam. u co a Com isso, evitaremos o excesso de elipses (os trˆs pontinhos), e o crit´rio emergir´ de e e a modo natural. Assim como na Se¸˜o anterior, queremos avaliar a diferen¸a entre a aproxima¸˜o ca c ca obtida na etapa k e a solu¸˜o original, e mostrar que essa diferen¸a se reduz a cada ca c etapa. Para medir essa diferen¸a, tomamos c ∆(k) = max |xi
i=1,...,n (k)

− xk | ,

´ 4.4. O METODO DE GAUSS-SEIDEL

63

onde x1 , . . . , xn representa a solu¸˜o verdadeira. Mais uma vez, nosso objetivo ´ mostrar ca e que existe λ < 1 tal que ∆(k + 1) ≤ λ∆(k) , e para isso precisaremos mostrar que |xi
(k+1)

− xi | ≤ λ∆(k)

para todo i = 1, . . . , n. Num sistema de 4 equa¸˜es e 4 inc´gnitas temos co o x1 x2
(k+1)

− x1 = − x1 = − x1 = − x1 =

(k+1)

x3 x4

(k+1)

(k+1)

1 a11 1 a22 1 a33 1 a44

a12 (x2 − x2 ) + a13 (x3 − x3 ) + a14 (x4 − x4 ) a21 (x1 − x1 a31 (x1 − x1 a41 (x1 − x1
(k+1)

(k)

(k)

(k)

) + a23 (x3 − x3 ) + a24 (x4 − x4 ) ) + a32 (x2 − x2 ) + a42 (x2 − x2
(k+1)

(k)

(k)

(k+1)

) + a34 (x4 − x4 ) ) + a43 (x3 − x3
(k+1)

(k)

(k+1)

(k+1)

)

Da primeira equa¸˜o, sai ca |x1
(k+1)

− x1 | ≤

|a12 | |a13 | |a14 | (k) (k) (k) · |x2 − x2 | + · |x3 − x3 | + · |x4 − x4 | , |a11 | |a11 | |a11 |

Como |xi − xi | ≤ ∆(k), para todo i = 1, 2, 3, 4, ent˜o a |x1 Definimos β1 = para ficar com |x1
(k+1) (k+1)

(k)

− x1 | ≤

|a12 | + |a13 | + |a14 | ∆(k) . |a11 |

|a12 | + |a13 | + |a14 | , |a11 | − x1 | ≤ β1 ∆(k) .

Agora levamos em conta essa ultima inequa¸˜o para mostrar que ´ ca |x2
(k+1)

− x2 | ≤

β1 |a21 | + |a23 | + |a24 | ∆(k) ≡ β2 ∆(k) . |a22 |

Continuando, obtemos |x3
(k+1)

− x3 | ≤

β1 |a31 | + β2 |a32 | + |a34 | ∆(k) ≡ β3 ∆(k) |a33 |

64 e |x4
(k+1)

´ CAP´ ITULO 4. METODOS ITERATIVOS

− x4 | ≤

β1 |a41 | + β2 |a42 | + β3 |a43 | ∆(k) ≡ β4 ∆(k) . |a44 |

Em conclus˜o, mostramos que a |xi logo ∆(k + 1) ≤ ( max βi )∆k .
i=1,2,3,4 (k+1)

− xi | ≤ βi ∆(k) ,

Se cada um dos n´meros β1 , β2 , β3 e β4 for menor do que 1, ent˜o teremos ∆(k + 1) ≤ u a λ∆(k), com λ < 1. Para um sistema linear de n equa¸˜es e n inc´gnitas, o Crit´rio de Sassenfeld pode co o e ser enunciado de forma indutiva, da seguinte maneira. Primeiro, β1 = |a12 | + |a13 | + . . . + |a1n | , |a11 |

como no Crit´rio das Linhas. Os demais coeficientes s˜o definidos indutivamente. Sue a ponha que j´ tenham sido definidos β1 , β2 , . . ., βi−1 , para i ≥ 2. Ent˜o βi se define a a como β1 |ai1 | + . . . + βi−1 |ai,i−1 | + |ai,i+1 | + . . . + |ain | βi = , |aii | isto ´, no numerador os βi ’s aparecem multiplicando os coeficientes da linha i ` esquerda e a da diagonal, enquanto que os coeficientes ` direita da diagonal s˜o multiplicados por 1. a a O coeficiente da diagonal aparece no denominador (como no Crit´rio das Linhas) e n˜o e a aparece no numerador. Exerc´ ıcio. Mostre que os problemas de contorno da Se¸˜o 1.8 satisfazem o Crit´rio de ca e Sassenfeld. Exerc´ ıcio. Obtenha a solu¸˜o com 3 algarismos significativos do sistema linear ca 4x1 + 2x2 + x3 = 11 −x1 + 2x2 = 3 2x1 + x2 + 4x3 = 16 usando o M´todo de Jacobi e o M´todo de Gauss-Seidel. Compare a velocidade de e e convergˆncia nos dois m´todos. e e

´ 4.4. O METODO DE GAUSS-SEIDEL

65

1 2 5 x w 7

3 y z 1 3 0

Exerc´ ıcio. Considere a tabela acima. Use o M´todo de Gauss-Seidel para achar e x, y, z, w tais que cada casinha que contenha uma inc´gnita seja a m´dia das quatro o e adjacentes (considerando apenas verticais e horizontais). Fa¸a 4 itera¸˜es, partindo de c co (x0 , y0 , z0 , w0 ) = (0, 0, 0, 0), e arredondando para 2 algarismos significativos ap´s cada o etapa.

66

´ CAP´ ITULO 4. METODOS ITERATIVOS

Parte II

Ajuste de Fun¸˜es co

67

Cap´ ıtulo 5

Ajuste de fun¸˜es co
5.1 O problema do ajuste
y
Em medidas experimentais, freq¨entemente nos deu paramos com uma tabela de dados (xi , yi ), i = 1, . . . , N , que representamos visualmente por meio de um gr´fico. Em geral, esperamos que haja uma rela¸˜o a ca entre a vari´vel y e a vari´vel x, que seria expressa por a a uma fun¸˜o: y = f (x). ca

yi xi

x

Muitas vezes n˜o dispomos de um modelo que explique a dependˆncia de y em a e rela¸˜o a x, de forma que n˜o podemos deduzir essa fun¸˜o apenas de teoria. De fato, ca a ca o experimento pode se dar justamente como uma forma de investigar essa rela¸˜o, para ca criar um embasamento da teoria sobre dados reais. Mesmo que o experimento n˜o culmine num modelo te´rico, ´ sempre desej´vel ter a o e a um modelo preditor, quer dizer, ´ interessante saber prever, pelo menos de forma aproe ximada, em que resultar´ a medida de y se soubermos x. Por exemplo, suponha que a queiramos usar um el´stico como dinamˆmetro. Para isso, fixamos uma das extremidaa o des do el´stico e na outra extremidade penduramos o objeto do qual desejamos conhecer a o peso. Quanto mais pesado for o objeto, mais o el´stico se distender´, isso ´ ´bvio, mas a a eo n´s gostar´ o ıamos de obter, a partir da distens˜o do el´stico, um valor num´rico para seu a a e peso. Neste exemplo, x ´ a distens˜o do el´stico e y o peso do objeto (ou poderia ser o e a a contr´rio, se desej´ssemos prever a distens˜o que o el´stico teria para um determinado a a a a peso). 69

70

CAP´ ITULO 5. AJUSTE DE FUNCOES ¸˜

Para ter uma f´rmula a ser usada no dinamˆmetro precisamos conhecer muito bem o o como se comporta nosso el´stico. Para isso, fazemos v´rias medidas do montante da a a distens˜o em fun¸˜o do peso do objeto, o que nos dar´ uma cole¸˜o de dados (xi , yi ), a ca a ca i = 1, . . . , N . O que n´s queremos agora ´ encontrar uma fun¸˜o y = f (x) que se o e ca ´ aproxime o melhor poss´ desses dados, mas como? E desej´vel tamb´m que a f´rmula ıvel a e o de f n˜o seja muito complicada, pois isso facilitaria mais tarde sua utiliza¸˜o como a ca preditor. ´ E claro que o problema, colocado dessa forma, parece muito complicado. No entanto, podemos restringir bastante o universo das fun¸˜es candidatas, e dentro desse conjunto co menor de fun¸˜es procurar aquela que melhor se adapte a nossos pontos. co Al´m disso, ´ preciso estabelecer um crit´rio comparativo do que seja a qualidade e e e de uma aproxima¸˜o. Isto ´, como decidir se uma fun¸˜o se adequa mais aos dados do ca e ca que outra?

5.2

Os m´ ınimos quadrados

Precisamos de uma medida num´rica para avaliar a qualidade de uma aproxima¸˜o. e ca Isto ´, temos uma cole¸˜o de dados (xi , yi ), i = 1, . . . , N , e queremos avaliar o quanto e ca uma determinada fun¸˜o f difere desses dados, associando a f um n´mero Q(f ). Esse ca u n´mero deve ser sempre n˜o-negativo, e deve ser usado de forma comparativa: se Q(f1 ) u a for menor do que Q(f2 ) ent˜o f1 ´ uma aproxima¸˜o aos dados melhor do que f2 . a e ca Evidentemente h´ um certo grau de arbitrariedade no m´todo que escolhemos para a e determinar Q. Aqui adotaremos o mais comum deles, que pode ser justificado por raz˜es o estat´ ısticas fora do alcance destas notas, e ´ conhecido como qui-quadrado (sem pesos, e na Se¸˜o 7.4 abordamos o qui-quadrado com pesos): ca a distˆncia de f (x) aos dados experimentais ´ definida a e como sendo y f
N

Q(f ) =
i=1

(f (xi ) − yi )2 .

f(xi ) yi xi

Em palavras, temos que avaliar, para cada xi , a diferen¸a entre o dado yi e o valor de f em xi , elevar essa c diferen¸a ao quadrado e depois somar os resultados c obtidos para cada xi .

x

Exerc´ ıcio. Dados os pontos (−2.8, −1.6), (1.6, −0.6), (3.0, 2.4), (4.5, 4.0), (6.0, 5.7) e as fun¸˜es afins f1 (x) = −0.8 + 0.86x e f2 (x) = −1.0 + 1.32x, qual das duas fun¸˜es co co se ajusta melhor aos dados, usando o crit´rio do qui-quadrado? Desenhe as retas e os e pontos em papel milimetrado antes de fazer as contas, e procure adivinhar o resultado

ˆ 5.3. PARAMETROS por antecipa¸˜o. ca

71

5.3

Parˆmetros a

Precisamos resolver tamb´m a quest˜o do conjunto de fun¸˜es aonde vamos procurar e a co aquela que minimiza o qui-quadrado. Veja que o problema em alguns casos perde o sentido se n˜o fizermos isso. De fato, para qualquer conjunto de dados (xi , yi ), i = a 1, . . . , N , onde os xi ’s nunca se repitam, sempre podemos achar um polinˆmio de grau o N − 1 tal que p(xi ) = yi , para todo i = 1, . . . , N , como vimos nas Se¸˜es 1.5 e 2.7. Com co isso, Q(p) ´ zero e n˜o h´ como encontrar uma fun¸˜o melhor do que essa. e a a ca O bom senso, no entanto, levar´ a concluir que isso n˜o vale a pena. Duas raz˜es a a o concretas podem ser dadas imediatamente: se a quantidade de dados for muito grande, ser´ necess´rio achar um polinˆmio de grau bastante grande para interpolar esses dados. a a o Haver´ a dificuldade de se achar o polinˆmio e depois a dificuldade de se utiliz´-lo. a o a Menos objetiva do que essa raz˜o ´ o fato bastante comum em experiˆncias de que a e e sabemos muitas vezes de antem˜o que tipo de fun¸˜o estamos procurando. Para ilustrar, a ca vejamos alguns exemplos.

5.3.1

Densidade

Suponha que queiramos determinar a densidade de um certo material. O procedimento ´ claro, se dispusermos dos instrumentos adequados. Basta medir o volume de uma e certa quantidade de material, sua massa e proceder ` raz˜o massa por volume. a a Se estivermos um pouco mais preocupados com a precis˜o do resultado, faremos a mais medidas e, evidentemente, tiraremos a m´dia dos resultados. Se, no entanto, essas e medidas forem tomadas com volumes diferentes, conv´m fazer um gr´fico Massa (m) vs. e a Volume (V). Veremos que podemos tamb´m tirar um valor para a densidade a partir e desse gr´fico. a Chamando de ρ0 a densidade do material, temos que m = f (V ) = ρ0 V , o que em portuguˆs pode ser assim entendido: “a massa do material depende apenas de seu e volume, e essa dependˆncia ´ explicitamente dada por ρ0 V , onde ρ0 ´ uma constante e e e fixa chamada densidade”. Se admitirmos que isso ´ verdade podemos tentar, a partir e do gr´fico, achar o valor de ρ0 . a Para achar o valor de ρ0 que melhor se adapta aos dados experimentais recorremos ao qui-quadrado. Olhamos (num sentido abstrato) para todas as poss´ ıveis fun¸˜es fρ (V ) = co ρV , cujos gr´ficos s˜o retas de inclina¸˜o ρ, passando pela origem. Observe que cada a a ca fun¸˜o fρ ´ uma fun¸˜o de uma vari´vel (V ), mas que depende do n´mero ρ, que ´ ca e ca a u e chamado de parˆmetro. a Para cada fun¸˜o fρ podemos medir o qui-quadrado Q(fρ ), e depois procurar o ca parˆmetro ρ para o qual Q(fρ ) ´ m´ a e ınimo. Como ρ varia ao longo da reta real, a fun¸˜o ca

72

CAP´ ITULO 5. AJUSTE DE FUNCOES ¸˜

ρ → Q(fρ ) ´ uma fun¸˜o de uma vari´vel, que denotaremos simplesmente por Q(ρ). Note e ca a agora que ρ, que era parˆmetro para fρ (V ), agora ´ a pr´pria vari´vel de Q(ρ) = Q(fρ )! a e o a Podemos visualizar Q(ρ) atrav´s de um gr´fico. Se e a houver um m´ ınimo, ele pode ser encontrado com exaQ(ρ) tid˜o procurando-se ρ0 tal que a Q (ρ0 ) = 0 . (Por´m aten¸˜o: Q (ρ) = 0 n˜o implica necessariae ca a mente que ρ seja m´ ınimo, poderia se tratar de um m´ximo, ou um ponto de inflex˜o com derivada zero. a a Somento o inverso ´ v´lido: se ρ for m´ e a ınimo, ent˜o a Q (ρ) = 0.)

ρ0

ρ

5.3.2

Caten´ria a

Quando suspendemos uma corrente em dois pontos de sustenta¸˜o, n˜o necessariamente hoca a rizontalmente alinhados, ela assume um determinado formato (entre os dois pontos de sustenta¸˜o), dado pela fun¸˜o caten´ria: ca ca a 1 f (x) = (cosh(cx) − 1) , c onde cosh ´ a fun¸˜o conhecida como cosseno hiperb´lico, e ´ dada por e ca o e ex + e−x . 2 Observe que a fun¸˜o foi dada de tal forma que para x = 0 ela vale 0, ou seja, a origem ca das coordenadas ´ imposta como sendo o ponto de m´ e ınimo da corrente (uma justificativa para essa fun¸˜o ser´ dada na Subse¸˜o 18.3.5). ca a ca Na express˜o de f tamb´m aparece uma constante c, que ´ um n´mero. Esse n´mero a e e u u n˜o ´ conhecido a priori, pois depende de v´rias coisas, a come¸ar pela posi¸˜o dos a e a c ca pontos de sustenta¸˜o. O n´mero c ´ outro t´ ca u e ıpico exemplo de um parˆmetro. Se usarmos a sempre a mesma corrente ele pode ser modificado atrav´s da mudan¸a dos pontos de e c sustenta¸˜o, e ´ razoavelmente dif´ saber que valor ele vai assumir ao pendurarmos a ca e ıcil corrente. No entanto, j´ que se trata de uma medida experimental, poder´ a ıamos medir a posi¸˜o ca da corrente em alguns pontos, convencionando x para a horizontal e y para a vertical, obtendo assim um conjunto de dados (xi , yi ), i = 1, . . . , N . Conv´m, al´m disso, detere e minar a posi¸˜o exata do m´ ca ınimo, que ser´ o ponto (x, y) = (0, 0). Agora sabemos que a cosh x =

x

ˆ 5.3. PARAMETROS

73

a corrente assume a forma de uma fun¸˜o f como acima, mas nos resta saber com que ca valor de c isso acontece. Como proceder? Para explicitar a existˆncia de um parˆmetro, que obviamente faz parte da defini¸˜o e a ca da fun¸˜o, adota-se a nota¸˜o ca ca 1 fc (x) = (cosh(cx) − 1) . c Para cada fun¸˜o fc podemos medir o qui-quadrado Q(fc ), e depois procurar o parˆmetro ca a c para o qual Q(fc ) ´ m´ e ınimo. Como c varia ao longo da reta real, a fun¸˜o c → Q(fc ) ca ´ uma fun¸˜o de uma vari´vel, que denotaremos simplesmente por Q(c). e ca a

5.3.3

Naftalinas e fun¸˜es afins co

Uma bolinha de naftalina perde seu material, por sublima¸˜o, a uma taxa proporcional ca a sua superf´ ıcie. Como evolui o raio da naftalina em fun¸˜o do tempo? ca Se V (t) ´ o volume da bolinha, ent˜o a hip´tese implica que e a o ˙ V (t) = −α4πr(t)2 , isto ´, a taxa de perda de volume ´ proporcional ` ´rea da superf´ da bolinha. Por e e aa ıcie outro lado 4 V (r) = πr3 , 3 de forma que 4 V (t) = V (r(t)) = πr(t)3 3 e ˙ V (t) = 4πr(t)2 r(t) . ˙ ˙ (t) e cancelando r(t)2 , ficamos com Juntando as duas equa¸˜es em V co r(t) = −α , ˙ logo r(t) ´ uma fun¸˜o de derivada constante negativa, ou seja, ´ uma fun¸˜o afim. e ca e ca Portanto r(t) = r0 − αt , onde r0 = r(0). Num experimento, supondo que o racioc´ ınio acima se confirme, teremos uma s´rie e de dados (ti , ri ) que se dispor˜o aproximadamente sobre uma reta. Cada reta n˜o a a vertical do plano ´ gr´fico de r(t) = a + bt, e gostar´ e a ıamos de achar o par (a, b) que melhor aproxime os dados experimentais, isto ´, que produza o menor qui-quadrado e poss´ ıvel. Desta feita, o qui-quadrado ´ uma fun¸˜o de duas vari´veis, pois para cada e ca a par (a, b) teremos uma fun¸˜o diferente a + bt e um qui-quadrado Q(a, b). Ao contr´rio ca a dos problemas da densidade e da caten´ria, aqui aparece uma fun¸˜o que envolve dois a ca parˆmetros. a

74

CAP´ ITULO 5. AJUSTE DE FUNCOES ¸˜

5.3.4

Decaimento exponencial

Um material cont´m um is´topo radioativo, e emite radia¸˜o, que pode ser detectada por e o ca um contador geiger. A emiss˜o de radia¸˜o ´ proporcional ` quantidade de is´topo, e ´ a ca e a o e oriunda de seu decaimento. Veremos mais adiante (Subse¸˜o 18.3.2) que a quantidade do ca is´topo decresce (na maioria dos casos) exponencialmente. Ou seja, a radia¸˜o emitida o ca por unidade de tempo R(t) obedece ` lei a R(t) = R0 e−αt , onde t ´ o tempo (a vari´vel) e R0 , α s˜o dois parˆmetros. A constante R0 ´ a quantidade e a a a e de radia¸˜o emitida por unidade de tempo no instante t = 0 e α > 0 representa a taxa ca de decaimento: quanto maior for α mais r´pido ele ser´. a a A meia-vida do is´topo ´ o tempo T necess´rio para que sua quantidade caia pela o e a metade. Admitindo a proporcionalidade entre a radia¸˜o emitida e a quantidade do ca is´topo, T ´ tal que o e R0 R(T ) = , 2 isto ´, e R0 = R0 e−αT , 2 equa¸˜o que resolvida nos d´ ca a log 2 T = . α O conceito de meia-vida ´ muito usado para data¸˜o de f´sseis, atrav´s da detere ca o e mina¸˜o da quantidade de carbono-14, em rela¸˜o ao is´topo mais abundante carbonoca ca o 12: quanto menor for a quantidade de carbono-14, mais antigo ´ o material. e A fun¸˜o a dois parˆmetros R(t) recai no caso afim quando tiramos o logaritmo: ca a log R(t) = log R0 − αt , ou seja, L(t) ≡ log R(t) ´ uma fun¸˜o afim, onde −α ´ sua derivada. Os pap´is mono-log, e ca e e vendidos em algumas papelarias, s˜o uma maneira de se plotar o logaritmo dos dados a da ordenada, log R(t), em fun¸˜o dos dados da abscissa, t, sem fazer contas. ca Isto n˜o vale quando o decaimento exponencial ´ assint´tico a um valor diferente de a e o zero, em fun¸˜es do tipo co f (t) = b + ce−αt . N˜o adianta tirar o logaritmo, pois o logaritmo de uma soma n˜o pode ser desmembrado. a a Esse tipo de fun¸˜o tem trˆs parˆmetros, e pode ocorrer, por exemplo, no decaimento ca e a de temperatura de um corpo em contato com um reservat´rio mais frio, mas cuja temo peratura n˜o ´ necessariamente zero. a e

ˆ 5.3. PARAMETROS

75

5.3.5

Leis de potˆncia e fractais e

Para fun¸˜es f (x) = cxα , que tˆm dois parˆmetros, recomenda-se tamb´m tirar o logaco e a e ritmo: log f (x) = log c + α log x . Desta vez, log f (x) ´ uma fun¸˜o afim de log x, e o papel recomendado para se plotar e ca os dados, em busca de uma reta, ´ o o log-log. e Esse tipo de fun¸˜o aparece ligado ao conceito de fractal. Para exemplificar, tome ca a linha do litoral, fotografada num mapa de sat´lite, e suponha que a foto do sat´lite e e tenha boa resolu¸˜o, para que se possa fazer uma an´lise razoavelmente detalhada. ca a Escolha um tamanho l e divida o mapa em quadrados de tamanho l. Para facilitarmos o argumento suporemos que o mapa ´ quadrado e escolheremos apenas valores de e l que sejam iguais ` lateral do mapa dividida por um n´mero inteiro, de forma que s´ a u o haja uma maneira de se dividir o mapa em quadrados. Em seguida contamos o n´mero u N (l) de quadrados que intersectam a linha do litoral. Tomamos valores de l cada vez menores, e para cada l contamos N (l). A experiˆncia e tem mostrado que, dentro dos limites inerentes ao experimento, N (l) ´ proporcional a e l−d , onde d ´ a chamada dimens˜o fractal daquele peda¸o de litoral. O nome fractal e a c vem do fato de que d pode ser um n´mero fracion´rio (n˜o inteiro), e o inesperado vem u a a do fato de que se o litoral fosse uma reta ent˜o d seria igual a 1! Ocorre que em geral d a ´ maior do que 1... e Exerc´ ıcio. Munido de bons mapas, fa¸a o experimento acima sugerido, e coloque os c dados N (l) versus l em papel log-log. Se realmente N (l) = cl−d ent˜o vocˆ ver´ uma reta a e a de inclina¸˜o negativa, e a dimens˜o fractal d ser´ o valor absoluto dessa inclina¸˜o. ca a a ca Preste aten¸˜o em desconsiderar valores de l muito grandes ou muito pequenos, onde ca fatalmente n˜o se ver´ uma reta. a a

5.3.6

Gaussiana

Suponha que v´rias medidas foram feitas de um mesmo fenˆmeno, por exemplo, o tempo a o de queda de um objeto que ´ solto, a partir do repouso, sempre da mesma altura. S˜o e a feitas n medidas T1 , . . . , Tn , e dessas medidas constr´i-se um histograma. Para fazer o o histograma, escolhe-se um intervalo ∆t e divide-se a reta dos tempos em intervalos de tamanho ∆t.

76

CAP´ ITULO 5. AJUSTE DE FUNCOES ¸˜

Esses intervalos podem ser numerados: I1 , . . . , IN , mas para a nunj mera¸˜o ser finita ´ preciso n˜o inca e a cluir aqueles que est˜o longe dos a tempos medidos. Para cada intervalo Ij conta-se o n´mero de mediu das Ti que incidem em Ij , chamando esse n´mero de nj . O histograma ´ u e I1 I2 Ij IN desenhado construindo-se barras de ∆t base Ij e altura igual a nj . Nesse problema e em v´rios outros, a tendˆncia do histograma ´ adotar o formato a e e aproximado de um “sino”. O valor mais prov´vel do que deve ser o tempo de queda a (que servir´ por exemplo para se estimar a acelera¸˜o da gravidade) se situa pr´ximo a ca o dos intervalos que apresentam maiores valores de nj , isto ´, no “cume” do sino. e Se o experimento n˜o tiver erros sistem´ticos, o formato de sino ser´ tanto melhor a a a ´ aproximado quanto mais medidas forem feitas e quanto menor forem os intervalos. E claro que a diminui¸˜o dos intervalos e o aumento do n´mero de medidas devem ser ca u feitos de forma acoplada, mas isso j´ ´ outra hist´ria... ae o O leitor mais atento pode estar pensando que ao mudarmos o n´mero n de experiu mentos ou o tamanho do intervalo b´sico ∆t n˜o poderemos comparar um histograma a a ´ com outro. E claro que se aumentarmos o n´mero n ent˜o em m´dia os nj ’s devem auu a e mentar, o que dar´ histogramas radicalmente diferentes quando n = 500 ou n = 5000, a por exemplo, mantidos iguais os ∆t’s. Por outro lado, se mantivermos n mas, digamos, diminuirmos pela metade o tamanho dos intervalos, isso far´ com que em m´dia os nj ’s a e caiam pela metade. Assim, seria interessante ter um histograma que n˜o dependesse a demais de n e ∆t, e permitisse comparar histogramas do mesmo fenˆmeno constru´ o ıdos de formas diferentes. Para isso, em vez de colocarmos as barras ` altura nj , fazemos um reescalonamento a da ordenada, colocando as barras ` altura a nj . n∆t Com isso, a soma total da ´rea das barras ser´ igual a 1, pois cada barra ter´ ´rea a a aa ∆t · e a soma da ´rea de todas as barras ser´ a a
N j=1

nj nj = n∆t n

nj 1 = n n

N

nj =
j=1

1 ·n=1. n

ˆ 5.3. PARAMETROS

77

Al´m disso, o histograma passa a ter a seguinte fun¸˜o utilit´ria. Se quisermos saber e ca a a propor¸˜o de eventos Ti que caiu num determinado conjunto de Ij ’s, basta medir ca a ´rea total das barras sobre esses intervalos. Esse n´mero ser´ um n´mero entre 0 a u a u e 1 (que multiplicado por 100 dar´ a porcentagem de eventos ocorridos nos intervalos a considerados). ` A medida em que se dimui ∆t e se aumenta n, o formato do histograma se aproxima cada vez mais de um formato de sino, agora fixo. Esse formato de sino ´ tipicamente e descrito pela fun¸˜o Gaussiana ca 1 (t − τ )2 f (t) = √ exp{− }. 2σ 2 σ 2π Observe que essa fun¸˜o depende de dois parˆmetros, σ e τ , ent˜o seria mais correto ca a a denot´-la por a fσ,τ (t) . O fator que multiplica a exponencial est´ colocado para normalizar a fun¸˜o, isto ´, a ca e fazer com que a ´rea debaixo de seu gr´fico seja sempre igual a 1, n˜o importando os a a a valores de σ e τ . Para entender melhor essa fun¸˜o, observe ca que ela ´ uma varia¸˜o de e ca h(t) = exp{−t2 } = e
−t2

1 h(t) = e−t 0
2

.

A fun¸˜o h(t) tem um m´ximo em t = 0 e ca a h(0) = 1, e decresce ` direita e ` esquerda a a (simetricamente), indo a zero quando t vai a +∞ ou −∞. Se agora tomarmos hτ (t) = exp{−(t−τ )2 }, a fun¸˜o valer´ 1 e atingir´ ca a a o m´ximo em t = τ , e decrescer´ ` direita a aa e esquerda de τ . Ent˜o o parˆmetro τ tem a a o papel de “deslocar o sino” para a direita ou para a esquerda, conforme for positivo ou negativo, e seu valor sempre representa a posi¸˜o do “cume”. ca

t

1

hτ (t) τ
t

0

Por outro lado, se considerarmos hσ (t) = exp{− t2 } = exp{− 2σ 2 t √ 2σ
2

t } = h( √ ) 2σ

78

CAP´ ITULO 5. AJUSTE DE FUNCOES ¸˜

√ ent˜o teremos o seguinte efeito: se 2σ > 1, ent˜o o valor de hσ (t) ser´ o valor de h a a a √t , que ´ menor do que t. Isso far´ com que a curva decres¸a mais lentamente, em 2σ e a c √ alargando o sino. Se, ao contr´rio, 2σ < 1, a curva decrescer´ mais rapidamente. a a

2σ <1

2σ >1

h hσ hσ(t)=h( t )

h
t t

t

0
hσ(t)=h( t )

t

t

t

Em resumo, combinando os dois parˆmetros, τ indica a posi¸˜o horizontal do cume, a ca enquanto que σ indica o qu˜o “agudo” ´ o pico. A altura do pico ´ dada pelo fator de a e e 1 normaliza¸˜o σ√2π , escolhido de forma que a integral de f seja igual a 1. ca Finalmente, estando de posse de um histograma, e admitindo as considera¸˜es acima, co queremos saber qual ´ o melhor par de parˆmetros (σ, τ ) que aproxima o formato delie a neado pelas barras. Para isso, podemos tratar as barras como pontos, tomando t1 , . . . , tN como os pontos centrais dos intervalos I1 , . . . , IN , e y1 , . . . , yN a altura das respectivas barras. Com esses dados, podemos sempre estimar o qui-quadrado Q(fσ,τ ), procurando o par (σ, τ ) que o minimize. A fun¸˜o fσ,τ encontrada serve como um preditor do experimento. Se quisermos ca saber em m´dia qual ´ a propor¸˜o de medidas que ocorrer´ entre ta e tb , bastar´ e e ca a a encontrar a ´rea do histograma entre ta e tb , que ´ aproximadamente o mesmo que a e calcular a integral
tb

fσ,τ (t)dt .
ta

Pode-se mostrar (isso tamb´m j´ ´ outra hist´ria...) que os melhores parˆmetros τ e ae o a e σ s˜o a m´dia e o desvio-padr˜o da cole¸˜o de dados t1 , . . . , tn . Ou seja, a e a ca 1 τ= n e σ2 = 1 n
n n

ti ,
i=1

(ti − τ )2 .
i=1

ˆ 5.3. PARAMETROS

79

Isso resolve o problema de se achar o menor qui-quadrado, mas raros s˜o os casos em a que a solu¸˜o ´ t˜o expl´ ca e a ıcita!

80

CAP´ ITULO 5. AJUSTE DE FUNCOES ¸˜

Cap´ ıtulo 6

Fun¸˜es lineares nos parˆmetros co a
6.1 Dependˆncia linear dos parˆmetros e a

Estaremos particularmente interessados nos casos em que a dependˆncia da fun¸˜o nos e ca parˆmetros ´ linear. Colocando de forma geral, isso significa que, se a fun¸˜o tiver k a e ca parˆmetros a1 , a2 , . . . , ak , ent˜o f = fa1 ,...,ak se escreve como a a f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) . Por exemplo, na fun¸˜o ca ax + bsenx identificamos a1 = a, a2 = b, g1 (x) = x e g2 (x) = senx. Ou sen˜o na fun¸˜o afim a ca a + bx identificamos a1 = a, a2 = b, g1 (x) = 1 (isto ´, a fun¸˜o identicamente igual a 1) e e ca g2 (x) = x. Mesmo uma fun¸˜o linear ca ax tem apenas um parˆmetro: a1 = a e g1 (x) = x. a ´ E preciso n˜o confundir entre “fun¸˜o linear nos parˆmetros” e “fun¸˜o linear”. Uma a ca a ca fun¸˜o linear de uma vari´vel ´ sempre da forma ax, e reservamos o termo fun¸˜o afim ca a e ca para fun¸˜es da forma a+bx. J´ uma fun¸˜o linear nos parˆmetros n˜o ´ necessariamente co a ca a a e linear em x, basta ver os exemplos que demos acima. Analisemos, sob essa ´tica, com que tipos de problemas nos deparamos nos exemplos o do Cap´ ıtulo anterior. No exemplo do c´lculo da densidade temos uma fun¸˜o do tipo f (x) = ax, que ´ a ca e 1 linear no parˆmetro a e na vari´vel x. A fun¸˜o da caten´ria f (x) = c (cosh(cx) − 1) ´ a a ca a e um exemplo de fun¸˜o com apenas 1 parˆmetro que por´m n˜o ´ linear nesse parˆmetro. ca a e a e a 81

82

ˆ CAP´ ITULO 6. FUNCOES LINEARES NOS PARAMETROS ¸˜

As fun¸˜es afins das naftalinas s˜o lineares nos parˆmetros. J´ o decaimento exponencial co a a a −bx n˜o ´, mas o problema pode ser transformado num problema de fun¸˜o f (x) = ae a e ca afim (e portanto linear nos parˆmetros), pois a log f (x) = log a − bx . J´ f (x) = c + a tem trˆs parˆmetros e n˜o ´ linear em b: se b fosse fixado (n˜o e a a e a considerado como parˆmetro), ent˜o sim ter´ a a ıamos a linearidade. A lei de potˆncia f (x) = axb tamb´m n˜o ´ linear no parˆmetro b, mas pode ser e e a e a transformada num problema linear atrav´s do logaritmo. e Finalmente, a fun¸˜o Gaussiana n˜o ´ linear nos parˆmetros “m´dia” e “desvioca a e a e padr˜o”, mas estes podem ser encontrados, para se ajustarem aos dados experimentais, a da maneira tradicional. Trataremos a partir de agora apenas do ajuste de fun¸˜es lineares nos parˆmetros. co a V´rios casos onde a dependˆncia no parˆmetro ´ n˜o linear podem ser adaptados, mas a e a e a sem d´vida deve-se pensar caso a caso. Destacam-se entre os ajustes lineares os ajustes u por polinˆmios o f (x) = a0 + a1 x + a2 x2 + . . . + ak xk e os ajustes por fun¸˜es trigonom´tricas co e f (x) = a0 + a1 cos(x) + a2 cos(2x) + . . . + ak cos(kx)+ +b1 sen(x) + b2 sen(2x) + . . . + bk sen(lx) . ae−bx

6.2

Cont´ ınuo vs. discreto

Vale a pena aqui introduzir um problema de ajuste ligeiramente modificado em rela¸˜o ca ao que vimos discutindo at´ agora. Suponha que conhecemos determinada fun¸˜o y(x) e ca num intervalo fixo [c, d] e gostar´ ıamos de aproxim´-la o melhor poss´ a ıvel por alguma fun¸˜o do tipo ca f (x) = a1 g1 (x) + . . . + ak gk (x) . Observe que antes t´ ınhamos um conjunto de dados (xi , yi ), com i variando de 1 at´ e N . Agora nossa informa¸˜o se d´ num conjunto infinito de pontos: sabemos todos os ca a (x, y(x)), com x variando no intervalo [c, d], porque conhecemos a fun¸˜o y(x). ca Mais uma vez precisamos de um crit´rio para quantificar a proximidade entre f e os e dados, ou seja, entre f e y. O correspondente qui-quadrado, neste caso, ´ dado por e
d

Q(f ) =
c

(f (x) − y(x))2 dx .

e o objetivo ´ procurar o conjunto de parˆmetros (a1 , a2 , . . . , ak ) que minimize Q(f ). e a Este conceito pode ser util quando y(x) tem uma express˜o conhecida mas muito ´ a complicada, e a substitu´ ımos por uma express˜o polinomial ou trigonom´trica f (x). a e

ˆ 6.3. UM PARAMETRO

83

6.3

Um parˆmetro a
y

Para introduzirmos o assunto gradualmente, conv´m come¸ar pelas situa¸˜es e c co mais simples. Suponha que temos N dados (x1 , y1 ), (x2 , y2 ), . . ., (xN , yN ) como na figura ao lado e que queiramos ajustar uma fun¸˜o linear f (x) = ax a esses ca pontos. Isto significa que queremos achar o valor de a que melhor aproxima os pontos dados. Na figura, a reta pontilhada indica mais ou menos o que esperamos do nosso ajuste.

x
x1 x2 x3 x4 x5 x6

Em vez de tratarmos esse caso em particular, faremos uma discuss˜o um pouco mais a geral. Isto ´, suponha que tenhamos dados como acima e queiramos ajustar uma fun¸˜o e ca fa (x) = ag(x), com um parˆmetro e linear nesse unico parˆmetro. O caso da fun¸˜o a ´ a ca linear ´ apenas um caso particular, correspondente ` fun¸˜o g(x) = x. e a ca Para cada a, podemos calcular o qui-quadrado Q(fa ), que denotaremos simplesmente por Q(a). Explicitamente
N N

Q(a) =
i=1

(fa (xi ) − yi )2 =
i=1

(ag(xi ) − yi )2 .

A fun¸˜o Q(a) deve ser assim entendida: para cada a calculamos o erro Q(a) cometido ca entre a fun¸˜o fa (x) = ag(x) e os dados yi . Nossa tarefa ser´ procurar o valor a0 tal ca a que Q(a0 ) seja m´ ınimo. Notemos que para cada i vale
2 (ag(xi ) − yi )2 = g(xi )2 · a2 − 2g(xi )yi · a + yi ,

isto ´, cada termo da soma que define Q(a) ´ um polinˆmio quadr´tico na vari´vel e e o a a a. Como a soma de polinˆmios quadr´ticos ´ um polinˆmio quadr´tico, ent˜o Q(a) o a e o a a tamb´m ´ um polinˆmio quadr´tico na vari´vel a. Isto pode ser visto diretamente se e e o a a desenvolvermos a soma que define Q(a):
N N N

Q(a) =
i=1

g(xi )2

a2 − 2
i=1

g(xi )yi

a+
i=1

2 yi .

O gr´fico de Q(a) ´, portanto, uma par´bola. A concavidade ´ “para cima”, pois o a e a e termo que multiplica a2 ´ certamente positivo, por ser uma soma de quadrados. e

84

ˆ CAP´ ITULO 6. FUNCOES LINEARES NOS PARAMETROS ¸˜

Em conclus˜o, achar o m´ a ınimo da fun¸˜o Q(a) se resume a achar o m´ ca ınimo de uma par´bola. a Conhecendo o c´lculo diferencial, sabemos que podemos procurar o ponto de m´ a ınimo d da par´bola pelo ponto que anula a derivada, ou seja, procuramos a solu¸˜o de da Q(a) = a ca 0. Ent˜o calcularemos a derivada de Q(a), mas n˜o pela express˜o acima, e sim pela exa a a press˜o original, que se prestar´ mais a generaliza¸˜es quando tivermos mais parˆmetros. a a co a Temos N d ∂ Q(a) = (ag(xi ) − yi )2 , da ∂a
i=1

se lembrarmos que “a derivada da soma ´ a soma das derivadas”. Al´m disso, pela Regra e e da Cadeia, “a derivada de algo ao quadrado ´ duas vezes esse algo vezes a derivada do e algo”, temos que N d Q(a) = 2g(xi )(ag(xi ) − yi ) , da
i=1

lembrando que a derivada ´ em rela¸˜o ao parˆmetro a!!!! e ca a O fator 2 pode ser posto em evidˆncia no somat´rio, de forma que quando igualarmos e o a derivada de Q(a) a zero ele desaparece. Ent˜o queremos resolver a
N

ag(xi )2 − g(xi )yi = 0 .
i=1

Rearranjando,
N N


i=1

g(xi ) =
i=1

2

g(xi )yi ,

donde sai facilmente o valor de a: a=
N i=1 g(xi )yi N 2 i=1 g(xi )

.

Esse ´ o a0 que est´vamos procurando! e a No caso de uma reta, a fun¸˜o g(x) ´ igual a x, e portanto a0 ´ dado por ca e e a0 =
N i=1 xi yi N 2 i=1 xi

.

Exerc´ ıcio. Invente um conjunto de dados que estejam pr´ximos de uma reta passando o pela origem (N = 6, por exemplo), e depois ajuste uma fun¸˜o ax. Num papel milimeca trado, coloque os dados e depois esboce a reta obtida.

ˆ 6.4. DOIS PARAMETROS

85

6.4

Dois parˆmetros a

Suponha que queiramos ajustar uma reta aos dados experimentais, mas n˜o necessariaa mente uma reta que passe pelo zero. Para isso, precisamos ajustar uma fun¸˜o na forma ca f (x) = a + bx, isto ´, uma fun¸˜o afim. Esse problema se insere no caso geral de ajuste e ca de uma fun¸˜o com dois parˆmetros, que de forma geral pode ser escrita como ca a fa1 ,a2 (x) = a1 g1 (x) + a2 g2 (x) . Raciocinando como na Se¸˜o anterior, queremos minimizar a fun¸˜o erro ca ca
N

Q(fa1 ,a2 ) =
i=1

(fa1 ,a2 (xi ) − yi )2 .

Agora, por´m, a fun¸˜o erro depende de dois parˆmetros, a1 e a2 , por causa da forma e ca a de f , e a denotaremos por Q(a1 , a2 ):
N

Q(a1 , a2 ) =
i=1

(a1 g1 (xi ) + a2 g2 (xi ) − yi )2 .

Precisamos de 3 dimens˜es para tra¸ar um gr´fico da fun¸˜o Q. o c a ca No ponto de m´ ınimo de Q necessariamente todas as derivadas parciais se anulam. No presente caso, elas s˜o duas: em rela¸˜o a a1 e em rela¸˜o a a2 . Observe que n˜o a ca ca a necessariamente (a princ´ ıpio, sem um exame mais aprofundado) vale o inverso, isto ´, e se as derivadas parciais se anularem ent˜o n˜o obrigatoriamente se trata de um ponto a a de m´ ınimo. Portanto o par de parˆmetros procurado deve satisfazer duas exigˆncias simultˆneas: a e a ∂Q ∂Q (a1 , a2 ) = 0 e (a1 , a2 ) = 0 . ∂a1 ∂a2 Se acharmos um ponto que satisfa¸a essas duas exigˆncias teremos um candidato a ponto c e de m´ ınimo de Q(a1 , a2 ). Adiante, no Cap´ ıtulo 7, discutiremos melhor at´ que ponto podemos confiar que a e solu¸˜o desse problema seja realmente o m´ ca ınimo procurado. As duas equa¸˜es podem ser escritas explicitamente, e ap´s elabora¸˜o as deixaremos co o ca em uma forma conveniente. Temos
N i=1 N i=1

∂ (a1 g1 (xi ) + a2 g2 (xi ) − yi )2 = 0 ∂a1 ∂ (a1 g1 (xi ) + a2 g2 (xi ) − yi )2 = 0 ∂a2

86

ˆ CAP´ ITULO 6. FUNCOES LINEARES NOS PARAMETROS ¸˜

Usando a Regra da Cadeia, fazemos as derivadas parciais, obtendo
N

2g1 (xi )(a1 g1 (xi ) + a2 g2 (xi ) − yi ) = 0
i=1 N

2g2 (xi )(a1 g1 (xi ) + a2 g2 (xi ) − yi ) = 0
i=1

Os somat´rios podem ainda ser decompostos: o
N N N

2a1
i=1 N

g1 (xi )2 + 2a2
i=1 N

g1 (xi )g2 (xi ) − 2
i=1 N

g1 (xi )yi = 0

2a1
i=1

g2 (xi )g1 (xi ) + 2a2
i=1

g2 (xi )g2 (xi ) − 2
i=1

g2 (xi )yi = 0

Rearranjando de forma adequada fica evidente que reca´ ımos num sistema linear de duas equa¸˜es nas inc´gnitas a1 e a2 : co o
N i=1 g1 (xi )g1 (xi ) N i=1 g2 (xi )g1 (xi )

· a1 + · a1 +

N i=1 g1 (xi )g2 (xi ) N i=1 g2 (xi )g2 (xi )

· a2 = · a2 =

N i=1 g1 (xi )yi N i=1 g2 (xi )yi

Todos os coeficientes do sistema linear s˜o tirados dos dados do problema, sendo que a somente os termos independentes usam os yi ’s. Aqui vale a pena introduzir uma nota¸˜o simplificadora, que tornar´ muito mais ca a f´cil a aplica¸˜o do acima exposto em problemas pr´ticos. Denotaremos por gl , gm a a ca a soma
N

gl (xi )gm (xi )
i=1

e por gl , y a soma
N

gl (xi )yi .
i=1

Com essa nomenclatura, reescrevemos o sistema linear: g1 , g1 a1 + g2 , g1 a1 + g1 , g2 a2 = g2 , g2 a2 = g1 , y g2 , y ,

que o torna muito mais simples de memorizar! Exerc´ ıcio. Construa um conjunto de dados e ajuste uma reta, n˜o necessariamente a passando pela origem, usando o exposto nesta Se¸˜o. ca

ˆ 6.5. AJUSTE DE QUALQUER FUNCAO LINEAR NOS PARAMETROS ¸˜

87

6.5

Ajuste de qualquer fun¸˜o linear nos parˆmetros ca a

As id´ias das Se¸˜es anteriores podem ser usadas em qualquer situa¸˜o que se queira e co ca ajustar uma fun¸˜o que dependa linearmente dos parˆmetros, dada por ca a f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) , onde k ´ o n´mero de parˆmetros. e u a A fun¸˜o Q, que d´ o erro do ajuste, depende agora dos k parˆmetros a1 , . . ., ak : ca a a
N

Q(a1 , a2 , . . . , ak ) =
i=1

(a1 g1 (xi ) + a2 g2 (xi ) + . . . + ak gk (xi ) − yi )2 .

Se o m´ ınimo de Q ocorre em (a1 , a2 , . . . , ak ) ent˜o a ∂Q (a1 , a2 , . . . , ak ) = 0 , ∂al para todo l entre 1 e k, simultaneamente. Isso nos d´ k equa¸˜es, lineares nos parˆmetros a co a (sugere-se ao leitor fazer as passagens). Abaixo, mostramos as k equa¸˜es, usando a co nota¸˜o introduzida ao final da Se¸˜o anterior: ca ca g1 , g1 a1 + g2 , g1 a1 + . . . gk , g1 a1 + g1 , g2 a2 + . . . + g2 , g2 a2 + . . . + . . . ... gk , g2 a2 + . . . + g1 , gk ak = g2 , gk ak = . . . = gk , gk ak = g1 , y g2 , y . . . gk , y

Logo adiante veremos a raz˜o de se utilizar essa nota¸˜o para os somat´rios, idˆntica a ca o e a ` utilizada para o produto escalar de dois vetores. Aqui entendemos como vetores os conjuntos de dados da abscissa x = (x1 , . . . , xN ), da ordenada y = (y1 , . . . , yN ), e os valores das fun¸˜es gl avaliados em cada um desses pontos: gl = (gl (x1 ), . . . , gl (xN )). co Assim a nota¸˜o faz sentido! ca

6.6

O caso cont´ ınuo

No caso cont´ ınuo, tudo se passa de maneira an´loga. Suponha que temos uma fun¸˜o a ca y(x) definida no intervalo [c, d], e gostar´ ıamos de procurar uma fun¸˜o da forma ca f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) , que se aproxime dela o melhor poss´ ıvel. O erro do ajuste tamb´m ´ uma fun¸˜o dos k e e ca parˆmetros, mas desta vez ´ calculado por meio de uma integral, ao inv´s de uma soma: a e e
d

Q(a1 , a2 , . . . , ak ) =
c

(a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) − y(x))2 dx .

88

ˆ CAP´ ITULO 6. FUNCOES LINEARES NOS PARAMETROS ¸˜

´ ´ E util comparar com o caso discreto. A soma ao longo do ´ ındice i foi substitu´ pela ıda integral na vari´vel x, dentro do intervalo [c, d]. Ao mesmo tempo, os yi deram lugar a aos valores da fun¸˜o y(x). ca Mais uma vez, o ponto de m´ ınimo de Q deve, necessariamente, anular todas as k derivadas parciais de Q, o que nos d´ um crit´rio de busca para esse m´ a e ınimo, se resolvermos as k equa¸˜es resultantes. Para cada l = 1, . . . , k obtemos a equa¸˜o co ca 0= ∂Q ∂ (a1 , a2 , . . . , ak ) = ∂al ∂al
d c

(a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) − y(x))2 dx .

Como a vari´vel de integra¸ao x ´ diferente da vari´vel de diferencia¸˜o al , podemos a c˜ e a ca intercambiar a ordem das opera¸˜es, obtendo co
d

0=
c

2gl (x) (a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) − y(x)) dx ,

e, depois de uma simples manipula¸˜o da equa¸˜o, chegando a ca ca gl , g1 a1 + gl , g2 a2 + . . . + gl , gk ak = gl , y , onde gl , gm =
c d

gl (x)gm (x)dx
d

e gl , y =
c

gl (x)y(x)dx .

Juntando-se as k equa¸˜es resulta um sistema linear idˆntico `quele obtido no caso co e a discreto, exceto pelo fato de que os “produtos escalares” s˜o calculados por uma integral, a ao inv´s de uma soma. e

6.7

Exemplos

Para que n˜o fique tudo muito abstrato, fa¸amos dois exemplos nesta Se¸˜o, um para o a c ca caso discreto e um para o caso cont´ ınuo.

6.7.1

Dinamˆmetro o

Suponha que precisemos usar um el´stico como dinamˆmetro, para pesar objetos. O a o el´stico ´ forte, e ag¨enta v´rios quilos. Queremos calibrar o el´stico para que a medida a e u a a do peso possa ser inferida pela distens˜o que ele provoca no el´stico, que pode ser a a facilmente medida por uma r´gua. e

6.7. EXEMPLOS

89

Para tanto, penduramos o el´stico no teto, por uma ponta, e na outra atrelamos a um balde, cujo peso n˜o ´ suficiente para distender o el´stico (melhor ainda, serve para a e a colocar o el´stico muito pr´ximo ` posi¸˜o de repouso, e esticado). Com uma jarra, a o a ca colocamos ´gua no balde, e a cada litro colocado (x) medimos a distens˜o y do el´stico. a a a Os dados encontrados est˜o na tabela abaixo. a i 0 1 2 3 4 5 6 7 8 9 10 11 xi (kg) 0 1 2 3 4 5 6 7 8 9 10 11 yi (cm) 0.0 1.0 5.5 13.0 23.5 34.5 42.0 47.0 50.5 53.0 54.5 55.5

Os dados da tabela s˜o fict´ a ıcios, mas qualitativamente se assemelham bastante a experiˆncias reais. Nota-se que a resposta do el´stico ´ menor para pesos pequenos e e a e grandes, e atinge seu m´ximo aproximadamente entre 3 e 5 quilos. a Discutiremos o ajuste da fun¸˜o y(x) (distens˜o em fun¸˜o do peso), embora na ca a ca apresenta¸˜o do problema est´ ca ıvessemos interessados na fun¸˜o inversa x(y), que d´ o ca a peso em fun¸˜o da distens˜o. Se o leitor fizer um gr´fico dos dados da tabela, ver´ que a ca a a a fun¸˜o peso em fun¸˜o da distens˜o parece ser singular em 0 (tem uma derivada infinita), ca ca a e esse tipo de fun¸˜o se presta muito mal ao tipo de ajuste que faremos, baseado em ca polinˆmios. O problema desaparece se olharmos para y(x), pois esta fun¸˜o parece ter o ca derivada zero em x = 0. Se pensarmos em ajustar y(x) por um polinˆmio, temos primeiramente que escolher o seu grau. Claramente o grau desse polinˆmio deve ser maior do que 2, pois retas e o par´bolas n˜o tˆm pontos de inflex˜o, como aparenta ser o caso. Polinˆmios c´bicos a a e a o u podem ter o formato desejado, mas talvez convenha ter um pouco mais de liberdade no ajuste usando polinˆmios de quarto grau. o Para ajustar um polinˆmio de quarto grau temos que resolver um problema a 5 o parˆmetros. Isso recair´ num sistema linear de 5 equa¸˜es e 5 inc´gnitas, e nesse caso a a co o conv´m ter implementado um programa de computador para resolvˆ-lo. Como queremos e e apenas exemplificar as coisas, restringiremo-nos a um certo conjunto dos polinˆmios o

90

ˆ CAP´ ITULO 6. FUNCOES LINEARES NOS PARAMETROS ¸˜

de quarto grau, que reduzir´ nosso problema a apenas 3 parˆmetros, embora o mais a a recomend´vel seja seguir a primeira solu¸˜o. a ca Observe que se f (x) = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 ent˜o f (0) = c0 . Como n´s j´ a o a sabemos que f (0) = 0, pois a nenhum peso corresponde nenhuma distens˜o, ent˜o j´ a a a podemos supor que c0 = 0. Al´m disso, o gr´fico d´ a forte sensa¸˜o de que f (0) = 0, e e a a ca como f (0) = c1 , ter´ ıamos c1 tamb´m igual a zero. Desta forma, procuraremos o menor e qui-quadrado entre a fam´ ılia f (x) = a1 x2 + a2 x3 + a3 x4 , linear em seus trˆs parˆmetros. Para uniformizar a nota¸˜o com a parte te´rica, temos e a ca o g1 (x) = x2 , g2 (x) = x3 e g3 (x) = x4 . Agora temos que calcular os produtos escalares gl , gm , com l e m variando entre 1 e 3. Como essas fun¸˜es s˜o potˆncias de x, nossa tarefa fica razoavelmente facilitada, co a e porque v´rios dos produtos escalares ser˜o iguais. Por exemplo, a a
11 11

g1 , g3 =
i=0

x2 x4 == i i
i=0

x6 , i

´ igual a e
11

g2 , g2 =
i=0

x3 x3 . i i

O sistema linear fica   x4 i x5 i x6 i x5 i x6 i x7 i x6 | i x7 | i x8 | i  yi x2 i yi x3  . i yi x4 i

Calculando os coeficientes e resolvendo, obtemos a1 = 2.5040, a2 = −0.28427 e a3 = 0.0088925. Se o leitor tentar resolver o sistema por conta pr´pria ver´ que ele ´ exo a e tremamente mal-condicionado. A solu¸˜o apresentada foi obtida com 10 algarismos ca significativos, e arredondada somente ao final para 5 algarismos significativos. Recomenda-se verificar se a fun¸˜o obtida ca f (x) = 2.5040x2 − 0.28427x3 + 0.0088925x4 ´ compat´ e ıvel com os dados (pelo menos visualmente), e isso pode ser feito atrav´s de e seu esbo¸o no gr´fico, junto com os dados experimentais. Este teste sempre vale a pena c a em problemas de ajuste, para saber se n˜o houve algum erro de conta. a Outro teste de compatibilidade m´ ınimo ´ observar que a1 teria que ser realmente e positivo, pois a concavidade do gr´fico ´ para cima em x = 0, e que a2 teria que ser a e negativo, para poder criar o ponto de inflex˜o na regi˜o x > 0. a a

6.7. EXEMPLOS

91

6.7.2

Cosseno aproximado por um polinˆmio o

Para exemplificar um ajuste linear cont´ ınuo, tomemos a fun¸˜o y(x) = cos x no intervalo ca π π [− 2 , 2 ]. Gostar´ ıamos de aproxim´-la tamb´m por um polinˆmio, desta vez de grau 2. a e o Antes de resolver o problema, vale a pena investigar o que achamos que ser´ o a resultado. Se f (x) = a1 + a2 x + a3 x2 ´ o polinˆmio procurado, quanto devem ser, e o aproximadamente, os valores dos coeficientes? Como o cosseno vale 1 em x = 0, ´ uma fun¸˜o par, tem concavidade para baixo e e ca π π a o a ısticas se anula em − 2 e + 2 , ent˜o imaginamos um polinˆmio quadr´tico com caracter´ semelhantes. Ele teria que ter a1 = 1 (para valer 1 em x = 0) e a2 = 0 (por ser par´bola a centrada na origem). Al´m disso, a3 teria que ser negativo. Para que o polinˆmio se e o anule em π ´ preciso que 2 e π 2 1 + a3 =0, 2 logo a3 deve estar pr´ximo de −0.4. o Veremos se nossos palpites se confirmam. Temos que calcular os produtos escalares, que agora s˜o integrais. Por exemplo, a g1 (x), g1 (x) =
π 2

1 · 1dx = π .

−π 2

Algumas integrais s˜o nulas, pois o intervalo de integra¸˜o ´ sim´trico e os integrandos a ca e e ´ s˜o fun¸˜es ´ a co ımpares. E o caso de g1 , g2 e g2 , g3 , por exemplo. Precisamos calcular
π 2

x2 dx =

−π 2

π3 , 12

π 2

x4 dx =

−π 2

π5 , 80

e do lado dos termos independentes
π 2

cos x = 2 ,

−π 2

a integral de x cos x ´ nula, por ser ´ e ımpar, e resta calcular
π 2

x2 cos x , duas vezes, dando 1 π 2 − 4. 2 | | |  2  0  . 1 2 2π − 4

−π 2

usando a t´cnica de Integra¸˜o por Partes e ca O sistema linear fica igual a  3 π 0 π 12 3  0  0 π 12 π3 π5 0 80 12

92

ˆ CAP´ ITULO 6. FUNCOES LINEARES NOS PARAMETROS ¸˜

Da segunda equa¸˜o conclui-se imediatamente que a2 = 0, o que reduz o sistema linear ca a duas equa¸˜es e duas inc´gnitas. Resolvendo o sistema, obt´m-se a1 = 0.98016 e co o e a3 = −0.41777, valores bem pr´ximos das estimativas iniciais. o O m´todo que apresentamos, apesar de simples, tem problemas quando implemene ´ tado numericamente. E comum que os sistemas lineares a serem resolvidos sejam muito mal condicionados. Por exemplo, no caso do ajuste de uma fun¸˜o y(x) definida no ca intervalo [0, 1] por um polinˆmio o f (x) = a0 + a1 x + . . . + ak xk , temos gl (x) = xl−1 , com l = 0, . . . , k, e
1

gl , gm =
0

xl+m dx =

1 . l+m+1

Isto implica que a matriz dos coeficientes do sistema linear ´ uma matriz de Hilbert, que ´ e e um conhecido exemplo de matriz mal condicionada, como discutimos na Subse¸˜o 3.5.2. ca No Cap´ ıtulo 8 discutiremos outra forma de se fazer ajustes, que s˜o especialmente a uteis para ajustes polinomiais e trigonom´tricos. Antes, por´m, discorreremos um pouco ´ e e mais abstratamente sobre o m´todo dos m´ e ınimos quadrados, investigando, por exemplo, quest˜es como a unicidade, embora o Cap´ o ıtulo 8 possa ser compreendido sem o aux´ ılio do Cap´ ıtulo 7. Exerc´ ıcio. Ajuste f (x) = a(arctan x)2 aos seguintes dados xi yi por m´ ınimos quadrados. Exerc´ ıcio. Ajuste f (x) = a+b(x−1)2 por m´ ınimos quadrados ` fun¸˜o y(x) = x3 −3x, a ca no intervalo [0, 2]. 0.0 0.0 1.0 0.25 2.0 1.00 3.0 1.50 4.0 1.65

Cap´ ıtulo 7

Levando a s´rio o produto escalar e
7.1 Produto escalar e distˆncia a

Vale a pena aqui uma pequena digress˜o, que nos levar´ a uma compreens˜o melhor a a a do problema do ajuste de fun¸˜es lineares nos parˆmetros e nos permitir´, al´m disso, co a a e dispor de outras maneiras de realizar o ajuste. Primeiramente, como de praxe, concentremo-nos no problema de ajuste discreto onde, dados os pontos (x1 , y1 ), (x2 , y2 ), . . . , (xN , yN ), queremos achar o conjunto de parˆmetros (a1 , . . . , ak ) que minimize o qui-quadrado de a f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) , para um certo conjunto de fun¸˜es previamente fixadas g1 (x), . . . , gk (x). co Para entendermos o problema de forma geom´trica, consideremos o espa¸o RN das e c N -uplas u = (u1 , . . . , uN ), isto ´, o espa¸o de vetores N -dimensional. Assim, os valores e c da ordenada nos pontos dados podem ser representados por um vetor de RN : y = (y1 , y2 , . . . , yN ) . Al´m disso, cada uma das fun¸˜es gl (x), l = 1, . . . , k gera um vetor de RN , cujas e co coordenadas s˜o os valores da fun¸˜o nos pontos x1 , . . . , xN : a ca gl = (gl (x1 ), gl (x2 ), . . . , gl (xN )) . O produto escalar ou produto interno em RN ´ a fun¸˜o que associa a cada par de e ca vetores u = (u1 , . . . , uN ) e v = (v1 , . . . , vN ) o n´mero real u u, v = u1 v1 + u2 v2 + . . . + uN vN . Sendo assim, fica evidente que a defini¸˜o que demos de gl , gm corresponde exatamente ca ao produto escalar dos vetores gl e gm , e gl , y ´ o produto escalar dos vetores gl e y. e 93

94

´ CAP´ ITULO 7. LEVANDO A SERIO O PRODUTO ESCALAR

O produto escalar fornece automaticamente uma no¸˜o de tamanho de vetores (ou ca norma de vetores, no jarg˜o matem´tico) e, em conseq¨ˆncia, de distˆncia no espa¸o a a ue a c RN . Em R2 , o tamanho u de um vetor u = (u1 , u2 ) ´ dado pelo Teorema de Pit´goras: e a ´ a u = u2 + u2 . E f´cil ver com o Teorema de Pit´goras que em R3 a norma de um a 1 2 2 + u2 + u2 . A generaliza¸˜o em RN ´ vetor u = (u1 , u2 , u3 ) ´ dada por u = u1 e ca e 2 3 natural. A norma de u = (u1 , . . . , uN ) ´ dada por e u = u2 + u2 + . . . + u2 , 1 2 N

express˜o que pode ser escrita em termos do produto escalar: a u = u, u .

A no¸˜o de norma d´ origem ` id´ia de distˆncia em RN . Olhando agora u e v como ca a a e a pontos, a distˆncia entre eles ´ a norma do vetor u−v (ou v −u, tanto faz). Denotaremos a e essa distˆncia por d(u, v) e, explicitamente, ela vale a
N

d(u, v) =

u − v, u − v =
i=1

(ui − vi )2 .

Podemos ainda relacionar o qui-quadrado com isso tudo. O qui-quadrado de uma fun¸˜o f (para esses dados), denotado por Q(f ), ´ dado por ca e
N

Q(f ) =
i=1

(f (xi ) − yi )2 .

Se chamarmos de f o vetor (f (x1 ), f (x2 ), . . . , f (xN )), ent˜o a Q(f ) = f − y, f − y = d(f, y)2 . Portanto, minimizar o qui-quadrado ´ um problema de minimizar a distˆncia ao vetor e a y no espa¸o RN . c Quando limitamos f (x) a ser uma combina¸˜o linear das fun¸˜es g1 (x), . . . , gk (x) ca co estamos, automaticamente, limitando o vetor f a ser uma combina¸˜o linear dos vetores ca g1 , . . . , gk . Isso implica que vamos procurar f que minimiza a distˆncia ao vetor y apenas a entre os vetores que s˜o uma combina¸˜o linear dos vetores g1 , . . . , gk . a ca Mas o que ´ o conjunto dos vetores que s˜o combina¸˜o linear dos vetores g1 , . . . , gk ? e a ca Esse tipo de conjunto ´ chamado de subespa¸o vetorial (de RN ). Um subespa¸o vetorial e c c ´ um conjunto com a seguinte propriedade: qualquer combina¸˜o linear de vetores do e ca conjunto ´ tamb´m um vetor do conjunto. Por exemplo, em R3 um subespa¸o vetorial e e c

ˆ 7.2. EXISTENCIA E UNICIDADE DE SOLUCOES NO AJUSTE LINEAR ¸˜

95

s´ pode ser de um dos seguintes tipos: a origem (dimens˜o zero), isto ´, o conjunto o a e formado apenas pelo ponto (0, 0, 0); uma reta que passa pela origem (dimens˜o 1); um a plano que passa pela origem (dimens˜o 2); ou todo o R3 (dimens˜o 3). Note que todo a a subespa¸o cont´m a origem, pois se u pertence ao subespa¸o ent˜o u − u = 0 tamb´m c e c a e N tamb´m existem subespa¸os de todas as dimens˜es variando desde pertence. Em R e c o zero at´ N . e Pois bem, o problema do ajuste se reduz agora a achar, dentro do subespa¸o formado c a pelas combina¸˜es lineares de g1 , . . . , gl , o ponto que minimiza a distˆncia a um certo co ponto y. Disso trataremos na pr´xima Se¸˜o. o ca

7.2

Existˆncia e unicidade de solu¸˜es no ajuste linear e co

Nesta Se¸˜o discutiremos a possibilidade de solu¸˜o para o problema do ajuste linear, ca ca no caso discreto. Deixaremos o caso cont´ ınuo para a pr´xima Se¸˜o. Lembraremos o ca ´ alguns fatos de Geometria Anal´ ıtica e Algebra Linear, sem demonstr´-los todos. Os que a faltarem podem ser encontrados em textos cl´ssicos, voltados especificamente para esse a assunto. Seja G um subespa¸o de RN . Definimos o subespa¸o G⊥ dos vetores de RN ortogonais c c a todo vetor de G, lembrando que u e v s˜o ortogonais se u, v = 0. Fica para o leitor a mostrar que G⊥ ´ um subespa¸o. e c O primeiro fato para o qual chamaremos a aten¸˜o ´ o seguinte: qualquer y ∈ RN ca e pode ser escrito como soma de um vetor de G com um vetor de G⊥ . Para mostrar isso, tome uma base ortonormal {w1 , . . . , wr } de G (a existˆncia dessa base ´ um dos fatos que e e ´ ficam de lado nessa exposi¸˜o, mas o leitor pode encontrar nos livros de Algebra Linear ca no t´pico “Ortogonaliza¸˜o de Gram-Schimdt”). O que caracteriza esse conjunto como o ca base ortonormal ´ o fato de ser base (todo vetor de G pode ser escrito como combina¸˜o e ca linear dos vetores desse conjunto) e wi , wj ser igual a zero se i = j e igual a 1 se i = j. Agora tome o vetor
r

u=
i=1

y, wi wi .

O vetor u ´ uma soma de m´ltiplos dos wi ’s (de fato, ´ a soma da proje¸˜o de y sobre e u e ca as dire¸˜es dadas pelos wi ’s), portanto ´ um vetor de G. Por outro lado, vamos mostrar co e que y − u ´ um vetor de G⊥ . Com isso, teremos e y = (y − u) + u , mostrando que y pode ser escrito como soma de um vetor de G⊥ (o vetor y − u) com um vetor de G (o vetor u).

96

´ CAP´ ITULO 7. LEVANDO A SERIO O PRODUTO ESCALAR

Mostrar que y − u ∈ G⊥ ´ mostrar que y − u ´ ortogonal a qualquer vetor de G. Um e e vetor qualquer g de G pode ser escrito como combina¸˜o linear dos vetores da base: ca
r

g=
i=1

αi wi .

Para mostrar que y − u, g = 0 basta substituir a express˜o de u e a express˜o de g, a a em termos dos vetores da base, e levar em conta que a base ´ ortonormal. Fica como e exerc´ ıcio!!! A segunda observa¸˜o ´ que a decomposi¸˜o de um vetor y em uma soma de dois ca e ca ⊥ ´ unica. Em outras palavras, se y = u + v = u + v , com vetores, um de G e outro de G e ´ ˜ ˜ u, u ∈ G e v, v ∈ G⊥ , ent˜o u = u e v = v . Para mostrar isso, vamos apenas nos utilizar ˜ ˜ a ˜ ˜ do fato de que o unico vetor que pertence a ambos os subespa¸os ´ a origem (pois se u ´ c e pertence a ambos os subespa¸os, ent˜o u ´ ortogonal a ele mesmo, ou seja, u, u = 0; c a e s´ que u, u = u 2 , e o unico vetor que tem norma zero ´ o vetor nulo). Se y = u + v o ´ e e y = u + v ent˜o ˜ ˜ a 0 = y − y = (u − u) + (v − v ) , ˜ ˜ isto ´, e u−u=v−v . ˜ ˜ Do lado esquerdo da igualdade temos um vetor de G e do lado direito da igualdade temos um vetor de G⊥ , e eles s˜o iguais. Logo eles tˆm que ser ambos nulos, e a afirma¸˜o a e ca segue. O vetor u = r y, wi wi ´ a componente de y no subespa¸o G, tamb´m chamada e c e i=1 de proje¸˜o de y em G. A terceira observa¸˜o que temos a fazer ´ que o vetor u ´ o ca ca e e (´nico) elemento de G ` menor distˆncia de y. Para ver a raz˜o, tome um outro vetor u a a a qualquer g ∈ G. A distˆncia de g a y ´ a raiz quadrada de g −y, g −y , que mostraremos a e ser maior do que a distˆncia de u a y, que ´ a raiz quadrada de u − y, u − y . Para a e comparar as duas distˆncias, escrevemos a g −y, g −y = g −u+u−y, g −u+u−y = g −u, g −u +2 g −u, u−y + u−y, u−y , mas como g − u ∈ G e u − y ∈ G⊥ , segue que g − u, u − y = 0. Al´m disso, g − u, g − u e ´ positivo, logo e g − y, g − y > u − y, u − y , onde a desigualdade estrita confirma a unicidade. Finalmente lembremos que, no problema do ajuste, o subespa¸o vetorial em quest˜o c a ´ o conjunto de todas as combina¸˜es lineares dos vetores g1 , . . . , gk . Nesse subespa¸o, e co c existe um unico elemento que minimiza a distˆncia ao ponto y, como conclu´ ´ a ımos acima. Ser´ que da´ podemos concluir que sempre existe um unico conjunto de parˆmetros a ı ´ a (a1 , . . . , ak ) tal que f = a1 g1 + . . . + ak gk minimiza a distˆncia a y? a

7.3. O CASO CONT´ INUO

97

A resposta ´ n˜o, nem sempre!! Embora s´ haja um elemento u do subespa¸o que e a o c minimize a distˆncia, pode haver diversas maneiras de se escrever esse elemento como a combina¸˜o linear dos vetores g1 , . . . , gk . Para que haja apenas uma maneira de se ca escrever u ´ preciso que os vetores g1 , . . . , gk sejam linearmente independentes, isto ´, e e que nenhum deles possa ser escrito como combina¸˜o linear dos outros. ca Por exemplo, suponha que o n´mero N de pontos dados seja menor do que o n´mero u u k de fun¸˜es do ajuste. N˜o h´ como ter k > N vetores linearmente independentes em co a a RN , portanto certamente n˜o ser´ unica a solu¸˜o para o problema de ajuste. a a´ ca Outro exemplo, suponha que g1 (x) = 1, g2 (x) = x, g3 (x) = x2 , . . ., gk (x) = xk−1 , e N ≥ k. Ser´ que a solu¸˜o do problema de ajuste ´ unica? A resposta ´ sim, mas o a ca e´ e leitor est´ convidado a justific´-la inspirando-se no que est´ escrito na Se¸˜o 2.7. a a a ca

7.3

O caso cont´ ınuo

No caso cont´ ınuo n˜o temos um espa¸o de dimens˜o finita (RN ) para trabalhar. Que a c a espa¸o utilizamos? Ser´ que as id´ias das se¸˜es anteriores tamb´m se aplicam? Veremos c a e co e que sim, quase sem modifica¸˜es! co No lugar de RN consideramos um espa¸o de fun¸˜es, que podemos particularizar c co (para n˜o dificultar as coisas). Suponha que y(x) seja uma fun¸˜o cont´ a ca ınua definida no intervalo [c, d]. Ent˜o consideramos o conjunto E de todas as fun¸˜es cont´ a co ınuas definidas nesse intervalo. Em E est˜o definidas a adi¸˜o e a multiplica¸˜o por n´meros reais: se a ca ca u h1 e h2 s˜o fun¸˜es de E, ent˜o define-se a fun¸˜o h = h1 + h2 como sendo aquela que a co a ca leva x em h(x) = h1 (x) + h2 (x), e se α ´ um n´mero real, define-se a fun¸˜o h = αh1 e u ca como sendo aquela que leva x em h(x) = αh1 (x). O conjunto E ´ um espa¸o vetorial e c porque essas opera¸˜es sempre resultam em elementos de E. A origem ou elemento nulo co de E ´ a fun¸˜o identicamente nula em [c, d], e assim por diante. e ca O espa¸o vetorial E n˜o tem dimens˜o finita porque n˜o podemos escolher um c a a a n´mero finito de elementos h1 , . . . , hn que gere E, isto ´, tal que qualquer elemento u e de E possa ser escrito como combina¸˜o linear desses elementos. No entanto, dado o ca conjunto de fun¸˜es g1 , . . . , gk (aquelas com as quais queremos fazer o ajuste), o conco junto de todas as suas combina¸˜es lineares ´ um subespa¸o vetorial de dimens˜o finita co e c a de E (que chamaremos de G). Podemos tamb´m definir um produto interno, ou produto escalar em E. Se h e f s˜o e a fun¸˜es de E, ent˜o co a
d

h, f =
c

h(x)f (x)dx ,

que foi a defini¸˜o que usamos previamente, como nota¸˜o. ca ca Observe o leitor que nas considera¸˜es que fizemos nas Se¸˜es anteriores, s´ nos co co o utilizamos das propriedades do produto interno, a saber:

98

´ CAP´ ITULO 7. LEVANDO A SERIO O PRODUTO ESCALAR 1. Simetria: u, v = v, u ; 2. Linearidade: αu + βv, w = α u, w + β v, w ; 3. Positividade: se u = 0, u, u > 0.

Essas propriedades podem ser usadas para definir o produto interno, como fizemos com o determinante no Cap´ ıtulo 2. N˜o ´ dif´ mostrar que a defini¸˜o acima de h, f a e ıcil ca no espa¸o E ´ a de um produto interno, e da´ seguem as conseq¨ˆncias que advˆm c e ı ue e diretamente dessas propriedades. O subespa¸o G tem dimens˜o finita, logo tem uma base ortonormal, e da´ podemos c a ı mostrar que todo elemento y ∈ E pode ser decomposto de forma unica como uma soma ´ de duas fun¸˜es: co y =f +ξ , onde f ∈ G e ξ ∈ G⊥ . A fun¸˜o f ´ a proje¸˜o de y em G, e minimiza a distˆncia de y ca e ca a aos pontos de G, sendo portanto uma solu¸˜o do problema de ajuste. ca

7.4

Outros produtos escalares: pesos

Pensando novamente no caso discreto (mas com conseq¨ˆncias igualmente v´lidas no ue a caso cont´ ınuo), notamos que o c´lculo do qui-quadrado pressup˜e uniformidade dos a o dados (xi , yi ), isto ´, cada dado entra com igual peso na f´rmula e o
N

Q(f ) =
i=1

(f (xi ) − yi )2 .

No entanto, ´ comum sabermos, em geral em medidas experimentais, que certos e dados s˜o mais confi´veis do que outros. A atribui¸˜o de um peso a cada dado se daria a a ca da seguinte forma: para cada i escolhemos um certo pi > 0, que entra no cˆmputo do o qui-quadrado da seguinte maneira:
N

Q(f ) =
i=1

pi (f (xi ) − yi )2 .

Assim, quanto mais alto for wi maior ser´ a contribui¸˜o do dado (xi , yi ) para o quia ca quadrado. Por conseguinte, ao procurarmos minimizar o qui-quadrado teremos que obter menores diferen¸as f (xi ) − yi para os valores de i tais que pi seja mais alto. Isso far´ c a com que a fun¸˜o f (x) ajustada “aproxime” melhor esses pontos (xi , yi ) em detrimento ca de outros que tenham menor peso.

7.4. OUTROS PRODUTOS ESCALARES: PESOS Em medidas experimentais, em geral, o peso ´ dado pelo inverso da variˆncia e a pi = 1 2 , σi

99

uma estimativa do erro que deve ser obtida de forma independente. Quando todos os dados tˆm estimativas de erro iguais, ent˜o o m´todo de m´ e a e ınimos quadrados se reduz a `quele que hav´ ıamos visto anteriormente. No caso cont´ ınuo o peso ´ uma fun¸˜o p(x) definida no intervalo [c, d] da fun¸˜o dada e ca ca y(x), e o qui-quadrado ´ dado pela express˜o e a
d

Q(f ) =
c

p(x)(f (x) − y(x))2 dx .

Se o qui-quadrado adotado tem pesos, temos que reformular a defini¸˜o do produto ca escalar entre dois vetores u = (u1 , . . . , uN ) e v = (v1 , . . . , vN ) para
N

u, v =
i=1

pi ui vi ,

e no caso cont´ ınuo, se u(x) e v(x) s˜o fun¸˜es do intervalo [c, d], para a co
d

u, v =
c

p(x)u(x)v(x)dx .

Esses produtos escalares satisfazem as propriedades que se esperam dos produtos escalares: simetria, linearidade e positividade. Toda a argumenta¸˜o feita anteriormente ca se segue de forma idˆntica, e o menor qui-quadrado entre a fam´ de fun¸˜es a k e ılia co parˆmetros f (x) = a1 g1 (x) + . . . + ak gk (x) ser´ para a k-upla (a1 , . . . , ak ) que satisfaz o a a sistema linear g1 , g1 a1 + g2 , g1 a1 + . . . gk , g1 a1 + g1 , g2 a2 + . . . + g2 , g2 a2 + . . . + . . . ... gk , g2 a2 + . . . + g1 , gk ak = g2 , gk ak = . . . = gk , gk ak = g1 , y g2 , y . . . gk , y

,

onde os produtos escalares foram modificados para incluir os pesos.

100

´ CAP´ ITULO 7. LEVANDO A SERIO O PRODUTO ESCALAR

Cap´ ıtulo 8

Fam´ ılias ortogonais
8.1 Defini¸˜es e exemplos co
g1 , g1 a1 + g2 , g1 a1 + . . . gk , g1 a1 + g1 , g2 a2 + . . . + g2 , g2 a2 + . . . + . . . ... gk , g2 a2 + . . . + g1 , gk ak = g2 , gk ak = . . . = gk , gk ak = g1 , y g2 , y . . . gk , y

Podemos observar que a resolu¸˜o do sistema linear ca

seria enormemente facilitada se as fun¸˜es g1 , . . . , gk satisfizessem a propriedade de que co os produtos escalares mistos sejam nulos, isto ´, e gl , gm = 0 , se l = m. Isto ´ o mesmo que dizer que as fun¸˜es g1 , . . . , gk s˜o todas ortogonais entre e co a si ou, de modo similar, que a fam´ de fun¸˜es {g1 , . . . , gk } ´ ortogonal. ılia co e Neste caso, ter´ ıamos gl , y , al = gl , gl e portanto k y, gl f= gl . gl , gl
l=1

Melhor ainda seria se a fam´ {g1 , . . . , gk } fosse ortonormal, isto ´, gl , gl = 1 para ılia e todo l = 1, . . . , k, pois a f´rmula ficaria o
k

f=
l=1

y, gl gl . 101

102

CAP´ ITULO 8. FAM´ ILIAS ORTOGONAIS

O leitor que acompanhou atentamente o Cap´ ıtulo 7 perceber´ que esta nada mais ´ a e que a f´rmula da proje¸˜o de y no subespa¸o G das combina¸˜es lineares de g1 , . . . , gk . o ca c co Vejamos a partir de agora um exemplo de como podemos fazer um ajuste de m´ ınimos quadrados sem recorrer a um sistema linear, usando, ao inv´s, o conceito de ortogonalie dade. O exemplo ´ de um ajuste cont´ e ınuo, mas as id´ias de apllicam no caso discreto. e Como primeiro exemplo, fixemos o intervalo [0, 1] como dom´ ınio para as fun¸˜es de co E (isto ´, c = 0 e d = 1). Se tomarmos as fun¸˜es g1 (x) = 1, g2 (x) = x, g3 (x) = x2 , e co . . ., gk (x) = xk−1 , o subespa¸o G de suas combina¸˜es lineares consiste de todos os c co polinˆmios de grau at´ k − 1. N˜o ´ dif´ mostrar que essas fun¸˜es s˜o linearmente o e a e ıcil co a independentes, formando portanto uma base de G. No entanto, elas n˜o s˜o ortogonais a a entre si (e tampouco tˆm norma igual a 1). Para ver isso, basta tomar um dos produtos e internos: 1 1 1 g1 , g2 = g1 (x)g2 (x)dx = xdx = = 0 . 2 0 0 E ent˜o como construir uma base ortonormal (ou ortogonal) de G? Faremos isso a inspirados no processo de Ortogonaliza¸˜o de Gram-Schimdt. S´ para n˜o confundir, ca o a denominaremos os vetores dessa nova base de f1 , . . . , fk . Imporemos primeiramente que o primeiro vetor da base seja a fun¸˜o constante igual a 1: f1 (x) ≡ 1. A segunda ca fun¸˜o ser´ um polinˆmio de grau 1: f2 (x) = a + bx, mas podemos supor que b = 1, se ca a o multiplicarmos por uma constante (multiplica¸˜es por constantes s´ mudam a norma, co o mas n˜o influenciam na ortogonalidade). Al´m disso, queremos que ele seja ortogonal a e ao primeiro, ou seja, queremos que
1 1

f1 , f2 =
0

f1 (x)f2 (x)dx =
0

(a + x)dx = 0 .

Isso nos obriga a ter a = − 1 , logo 2 1 f2 (x) = − + x . 2 A terceira fun¸˜o ser´ um polinˆmio de grau 2, cujo coeficiente de ordem mais alta ca a o tamb´m ser´ igual a 1: f3 (x) = a + bx + x2 (a e b diferentes dos anteriores, aqui e a usados somente como parˆmetros auxiliares). Esta fun¸˜o deve ser ortogonal `s duas a ca a previamente criadas, isto ´, e f1 , f3 = 0 , f2 , f3 = 0 . Da primeira equa¸˜o sai ca
1

(a + bx + x2 )dx = 0 ,
0

ˆ ˆ 8.2. CALCULANDO POLINOMIOS ORTOGONAIS POR RECORRENCIA e da segunda sai
1 0

103

1 (− + x)(a + bx + x2 )dx = 0 . 2

As duas equa¸˜es reunidas formam um sistema linear nas inc´gnitas a e b, e resolvendo-o co o fica determinada a fun¸˜o f3 . ca O processo continua do mesmo jeito, at´ se chegar ` k-´sima fun¸˜o. Observe que e a e ca n˜o nos livramos totalmente dos sistemas lineares para acharmos a base ortogonal, a mas nosso trabalho ficar´ enormemente facilitado se algu´m j´ tiver feito isso por n´s. a e a o Existem tabelas de polinˆmios ortogonais prontas para serem usadas! Cada fam´ leva o ılia em conta a defini¸˜o do produto escalar utilizado que, em nosso caso, depende somente ca do intervalo de integra¸˜o (e do peso, se for o caso). Veremos logo adiante como usar ca tabelas de fun¸˜es ortogonais. co Exerc´ ıcio. Considere (x1 , x2 , x3 , x4 ) = (0.0, 0.2, 0.7, 1.3) e o produto escalar
4

f, g =
i=1

f (xi )g(xi ) .

Ache p(x) = x2 + ax + b que seja ortogonal a q(x) = x, em rela¸˜o a esse produto ca escalar. Exerc´ ıcio. Mostre que as fun¸˜es senx e cos x s˜o ortogonais no intervalo [0, 2π] co a (admitindo-se o produto escalar com peso uniforme).

8.2

Calculando polinˆmios ortogonais por recorrˆncia o e

Na Se¸˜o anterior vimos que podemos recorrer a polinˆmios ortogonais para facilitar a ca o resolu¸˜o do problema de ajuste. No entanto,a obten¸˜o dos polinˆmios ortogonais recai ca ca o na resolu¸˜o de v´rios sistemas lineares, tarefa que pode ser t˜o ou mais trabalhosa do ca a a que se n˜o us´ssemos esses polinˆmios. a a o A boa not´ ıcia, por´m, ´ que h´ uma maneira mais f´cil de se calcular os polinˆmios e e a a o ortogonais, atrav´s de uma rela¸˜o de recorrˆncia. Essa rela¸˜o de recorrˆncia fune ca e ca e ciona tanto no caso discreto (com qualquer conjunto de pontos x1 , . . . , xN ) como no caso cont´ ınuo (com qualquer intervalo de integra¸˜o), com ou sem pesos, ou seja, com ca qualquer dos produtos internos que descrevemos. Procede-se assim: fixa-se f0 (x) ≡ 1 e calcula-se o primeiro polinˆmio f1 (x) = x + a, o da mesma forma que fizemos previamente. O valor de a ir´ depender do produto interno, a e ´ escolhido de maneira que f0 , f1 = 0. Agora suponha que o processo continua, como e descrito na Se¸˜o anterior, obtendo-se polinˆmios f2 , f3 , f4 , etc, de graus 2, 3, 4, etc, ca o exigindo-se apenas que o coeficiente de mais alto grau seja sempre igual a 1.

104

CAP´ ITULO 8. FAM´ ILIAS ORTOGONAIS

c o Em cada etapa, {f0 , f1 , . . . , fk } gera o subespa¸o formado por todos os polinˆmios de grau k (mostre isso como exerc´ ıcio, com um argumento indutivo). Observe que come¸amos a numerar nossos polinˆmios a partir de zero, pois assim c o seu ´ ındice assim corresponder´ exatamente a seu grau, facilitando os argumentos. a O ponto central ´ a seguinte afirma¸˜o, que permitir´ calcular fk (x), para k ≥ 2, e ca a somente com os polinˆmios fk−1 e fk−2 : “para todo k ≥ 2, vale o xfk−1 (x) − fk (x) = ak fk−1 (x) + bk fk−2 (x) , onde ak e bk s˜o coeficientes apropriados.” a Note que para k = 2 ela ´ verdadeira e porque xf1 (x) − f2 (x) ´ um polinˆmio de grau 1 (o termo x2 cancela, pois os coeficientes de mais alto grau s˜o e o a sempre iguais a 1). Logo esse polinˆmio pode ser escrito como combina¸˜o linear de f0 o ca e f1 , isto ´ e xf1 (x) − f2 (x) = a2 f1 (x) + b2 f0 (x) . Para k ≥ 3 o racioc´ ınio ´ parecido, mas h´ uma pequena dificuldade a resolver. O e a polinˆmio o xfk−1 (x) − fk (x) tem grau k − 1, pois o termo xk se cancela. Segue que ele pode ser escrito como ˜ combina¸˜o linear dos vetores fk−1 , fk−2 , . . ., f1 , f0 . Chamaremos de f a parte dessa ca combina¸˜o linear que corresponde ` combina¸˜o de polinˆmios fj com j ≤ k − 3. Ent˜o ca a ca o a ˜ xfk−1 (x) − fk (x) = ak fk−1 (x) + bk fk−2 (x) + f (x) . ˜e A nossa afirma¸˜o estar´ demonstrada se provarmos que f ´ identicamente nulo. ca a ˜ ´ um polinˆmio de grau no m´ximo k − 3, basta mostrarmos que Como f e o a ˜ f , fj = 0 ˜ para todo j ≤ k − 3. Isolando f na express˜o acima, usamos o fato de que, se j ≤ k − 3, a ent˜o fk , fj = 0, fk−1 , fj = 0 e fk−2 , fj = 0, restando apenas mostrar que a xfk−1 (x), fj (x) = 0 . A´ entra o “pulo do gato”, pois se observarmos as defini¸˜es dos produtos internos, ı co veremos que xfk−1 (x), fj (x) = fk−1 (x), xfj (x) . Como xfj (x) tem grau j + 1, e j + 1 ´ menor do que k − 1, ent˜o xfj (x) pode ser escrito e a como combina¸˜o linear de f0 , f1 , . . ., fk−2 , e o produto interno resulta nulo. ca

ˆ 8.3. UM EXEMPLO DE APLICACAO DE POLINOMIOS ORTOGONAIS ¸˜

105

Talvez fosse mais did´tico apresentar o uso da afirma¸˜o antes de sua demonstra¸˜o. a ca ca Optamos pelo contr´rio porque a afirma¸˜o n˜o parece ser muito ´bvia. Ela d´ uma a ca a o a f´rmula para fk (x) em fun¸˜o dos dois polinˆmios anteriores: o ca o fk (x) = (x − ak )fk−1 (x) − bk fk−2 (x) , sendo apenas necess´rio calcular ak e bk . Para isso, fazemos o produto interno da equa¸˜o a ca por fk−1 (a fim de obter ak ) e por fk−2 (a fim de obter bk ). Ou seja, de xfk−1 , fk−1 − fk , fk−1 = ak fk−1 , fk−1 + bk fk−2 , fk−1 resulta ak = e de xfk−1 , fk−2 − fk , fk−2 = ak fk−1 , fk−2 + bk fk−2 , fk−2 resulta bk = xfk−1 , fk−2 . fk−2 , fk−2 xfk−1 , fk−1 , fk−1 , fk−1

Exerc´ ıcio. Obtenha os quatro primeiros polinˆmios ortogonais usando o m´todo acima o e descrito, para o produto interno
1

f, g =
−1

f (x)g(x)dx .

8.3

Um exemplo de aplica¸˜o de polinˆmios ortogonais ca o

Gostar´ ıamos de aproximar a fun¸˜o y(x) = senx (em radianos) no intervalo [−1, 1] ca por um polinˆmio c´bico. Fazendo o exerc´ do final da Se¸˜o anterior, constatamos o u ıcio ca que qualquer polinˆmio c´bico pode ser gerado por combina¸˜o linear dos polinˆmios o u ca o ortogonais f0 (x) = 1 , f1 (x) = x , f2 (x) = x2 − 1 3 , f3 (x) = x3 − x . 3 5

Estamos procurando o melhor conjunto de parˆmetros que ajuste a f = a0 f0 + a1 f1 + a2 f2 + a3 f3 ,

106

CAP´ ITULO 8. FAM´ ILIAS ORTOGONAIS

e como vimos anteriormente, f ´ dada pela proje¸˜o de y no espa¸o G das combina¸˜es e ca c co lineares desses polinˆmios. Como eles s˜o ortogonais, f ´ facilmente calcul´vel, isto ´, o a e a e cada um dos coeficientes al , l = 0, 1, 2, 3 ´ dado por e al = y, fl . fl , fl

Os denominadores s˜o as normas ao quadrado. Temos a f0 , f0 = 2 , f1 , f1 = 2 8 8 , f2 , f2 = , f3 , f3 = . 3 45 175

Exerc´ ıcio. Termine o exemplo. Calcule os produtos y, fl , onde ser´ preciso integrar a xl senx (sugest˜o: integra¸˜o por partes). Tente n˜o errar nas contas. Obtenha os a ca a coeficientes e explicite a fun¸˜o f como um polinˆmio c´bico. Desenhe um gr´fico do ca o u a polinˆmio obtido e compare com a fun¸˜o h(x) = senx. o ca Exerc´ ıcio. Ajuste, por m´ ınimos quadrados, um polinˆmio de primeiro grau ` fun¸˜o o a ca h(x) = senx no intervalo [0, 1], usando polinˆmios ortogonais. o Exerc´ ıcio. Ajuste um polinˆmio quadr´tico ` fun¸˜o ex em [−1, 1] usando polinˆmios o a a ca o ortogonais.

8.4

Exemplo de an´lise harmˆnica a o

Al´m dos polinˆmios ortogonais, ´ muito importante tamb´m a seguinte fam´ de e o e e ılia fun¸˜es trigonom´tricas, definidas no intervalo [0, 2π], que ´ a cole¸˜o de todas as fun¸˜es co e e ca co do tipo
k

a0 +
l=1

(al cos lx + bl senlx) .

Todas as fun¸˜es 1, cos x, cos 2x, cos 3x, . . ., senx, sen2x, sen3x, etc, s˜o ortogonais co a entre si (prove!). Portanto, se quisermos ajustar y por uma fun¸˜o desse tipo, teremos ca a0 = e bl = 1 π
0

1 2π

y(x)dx , al =
0 2π

1 π

y(x) cos(lx)dx
0

y(x)sen(lx)dx ,

1 para todo l = 1, 2, 3, . . . , k. O fator 2π em a0 corresponde ` norma ao quadrado da a 1 fun¸˜o 1, e os fatores π nos demais termos correspondem ` norma ao quadrado de cada ca a uma das fun¸˜es restantes (prove tamb´m isto!). co e

´ ˆ 8.4. EXEMPLO DE ANALISE HARMONICA

107

Esse tipo de ajuste ´ chamado de an´lise harmˆnica. e a o O problema ´ que em geral a fun¸˜o a ser ajustada n˜o se encontra definida no e ca a intervalo [0, 2π], e mesmo assim gostar´ ıamos de aproxim´-la por fun¸˜es trigonom´tricas. a co e Mas a´ se o intervalo for escrito como [c, d], basta usar as fun¸˜es ı, co 1 , sen(2πl x−c x−c ) , cos(2πl ) , l = 1, 2, . . . d−c d−c

Para exemplificar, faremos a an´lise harmˆnica de y(x) = x(1 − x) (uma par´bola) a o a no intervalo [0, 1]. Teremos que usar as fun¸˜es 1, sen(2πlx), cos(2πlx), l = 1, 2, . . ., que co s˜o ortogonais entre si. a 1 Primeiro calculamos as normas ao quadrado. Temos a mais f´cil, 0 1 · 1dx = 1. a Al´m disso e
1

sen2 (2πlx)dx =
0

1 2πl

2πl

sen2 udu =
0

l 2πl

sen2 udu ,
0

e analogamente
1 2π

cos2 (2πlx)dx = 2πl2
0 2π 2π 0

cos2 u . = 1 2, = 1 6.

As integrais 0 sen2 udu e 0 cos2 udu s˜o iguais a π (prove, usando que cos 2u a 2 u = 2 cos2 u − 1), portanto todas as normas ao quadrado s˜o iguais a 1 − 2sen a excetuando-se a primeira fun¸˜o, que tem norma 1. ca Agora temos que calcular os produtos internos dessas fun¸˜es com a fun¸˜o y(x) co ca x(1 − x) = x − x2 . Com a primeira fun¸˜o ´ a pr´pria integral de x(1 − x), que vale ca e o Ent˜o a 1 1 0 1 · x(1 − x)dx a0 = = . 1 6 1 · 1dx
0

Depois observamos que os bl ’s s˜o todos nulos. Isso porque a fun¸˜o x(1−x) ´ par em a ca e rela¸˜o a x = 1 , e as fun¸˜es sen(2πlx) s˜o ´ ca co a ımpares em rela¸˜o ao mesmo ponto, donde ca 2 o produto das duas ´ ´ e ımpar em rela¸˜o a x = 1 . Como o intervalo [0, 1] ´ sim´trico em ca e e 2 1 torno de x = 2 , ent˜o a
1

x(1 − x)sen(2πlx)dx = 0 ,
0

para todo l ≥ 1. S´ nos resta obter o al =
1 0 x(1

− x) cos(2πlx)dx
1 2

.

108 Com u = 2πlx obtemos al = 2 (2πl)2
2πl

CAP´ ITULO 8. FAM´ ILIAS ORTOGONAIS

u cos udu −
0

2 (2πl)3

2πl

u2 cos udu .
0

A primeira integral ´ nula, porque u cos u pode ser escrito como (u − πl) cos u + πl cos u. e O primeiro termo da soma ´ uma fun¸˜o ´ e ca ımpar em rela¸˜o a x = πl, que ´ o ponto ca e intermedi´rio do intervalo, e portanto sua integral ´ nula. E a integral de cos u em a e qualquer per´ ıodo completo tamb´m ´ nula. e e Quanto ` segunda integral, integramos por partes duas vezes e achamos a primitiva a 2 senu + 2u cos u − 2senu de u2 cos u. Usando a primitiva, chegamos em u al = − 1 π 2 l2 .

Assim podemos fazer o ajuste de x(1 − x) usando quantas fun¸˜es trigonom´tricas co e quisermos. Se formos at´ l = k, teremos e f (x) = 1 1 − 2 6 π
k l=1

1 cos(2πlx) l2

(o leitor est´ convidado a fazer um gr´fico de x(1 − x) e um gr´fico de f (x) para l = 2 a a a e comparar visualmente o resultado). Est´ fora do escopo deste livro demonstrar isto, mas se tomarmos k indo para infinito a a fun¸˜o de ajuste f (x) estar´ cada vez mais perto da fun¸˜o ajustada y(x) = x(1 − x). ca a ca Em particular, f (0) estar´ cada vez mais perto de y(0), que ´ igual a zero. Portanto a e 1 1 lim − 2 k→∞ 6 π Escrito de outra forma,
k k→∞ k l=1

1 =0. l2

lim

l=1

1 π2 = . 2 l 6

O limite da soma ´ denotado como se a soma fosse infinita e
∞ l=1

1 ≡ lim l2 k→∞

k i=1

1 . l2

Assim, podemos obter uma f´rmula para π: o

π=

6
l=1

1 . l2

´ 8.5. USO DE FUNCOES TABELADAS POR MUDANCA DE VARIAVEL ¸˜ ¸

109

Exerc´ ıcio. Fa¸a um pequeno programa de computador para ver se a f´rmula acima est´ c o a correta. O computador ser´ necess´rio porque a convergˆncia para o limite ´ bastante a a e e lenta, e um valor de k muito grande ´ necess´rio para se conseguir uma boa aproxima¸˜o e a ca de π.

8.5

Uso de fun¸˜es tabeladas por mudan¸a de vari´vel co c a

Freq¨entemente conhecemos uma fam´ de polinˆmios ortogonais (por exemplo, usando u ılia o uma tabela), ou mesmo a fam´ de fun¸˜es trigonom´tricas acima mencionada, mas ılia co e a fun¸˜o h(x) da qual queremos fazer o ajuste est´ definida em um intervalo diferente. ca a Ser´ que ainda assim podemos aproveitar a informa¸˜o dispon´ a ca ıvel? A resposta ´ sim, e a maneira ´ simples: recorremos a uma mudan¸a de vari´veis e e c a afim. Assumiremos que temos uma fam´ de fun¸˜es ortogonais f0 , f1 , . . . tabelada no ılia co intervalo [c, d], e gostar´ ıamos de ter uma fam´ de fun¸˜es ortogonais no intervalo [ˆ, d]. ılia co c ˆ ˆ no Em primeiro lugar, constru´ ımos uma fun¸˜o afim L que leve o intervalo [ˆ, d] ca c intervalo [c, d], sobrejetivamente. Isso pode ser feito explicitamente: L(x) = c + d−c (x − c) . ˆ ˆ ˆ d−c

Sua inversa tamb´m pode ser calculada de forma expl´ e ıcita: L−1 (x) = c + ˆ ˆ ˆ d−c (x − c) . d−c

Para facilitar a nota¸˜o, chamaremos de λ o coeficiente linear de L: ca λ= d−c ˆ ˆ d−c

Afirmamos que a fam´ f0 , f1 , . . . dada por ılia ˆ ˆ ˆ fl (x) = fl (L(x)) ´ ortogonal com respeito ao produto interno usual do intervalo [ˆ, d]. Para isso, s´ e c ˆ o precisamos mostrar que
ˆ d c ˆ

ˆ ˆ fl (x)fk (x)dx = 0 ,

para l = k, usando a informa¸˜o de que, nesse caso, ca
d

fl (x)fk (x)dx = 0 .
c

110 Entretanto
c ˆ

CAP´ ITULO 8. FAM´ ILIAS ORTOGONAIS

ˆ d

ˆ ˆ fl (x)fk (x)dx =
c ˆ

ˆ d

fl (L(x))fk (L(x))dx

e, fazendo a mudan¸a de vari´veis u = L(x) (com du = L (x)dx = λdx), obtemos c a
ˆ L(d) L(ˆ) c

1 1 fl (u)fk (u) du = λ λ

d

fl (u)fk (u)du = 0 .
c

Observe que consideramos apenas o caso cont´ ınuo, com peso uniforme. Outras situa¸˜es podem ser consideradas, tomando-se os devidos cuidados, mas n˜o discutiremos co a receitas gerais aqui. Perceba tamb´m que no exemplo de an´lise harmˆnica da Se¸˜o passada n´s fizemos e a o ca o isso, pois originalmente hav´ ıamos apresentado fun¸˜es trigonom´tricas ortogonais entre co e si no intervalo [0, 2π], mas no exemplo fizemos a an´lise harmˆnica adaptada para o a o intervalo [0, 1]. Al´m do mais, olhando para o que fizemos, no caso de as fun¸˜es f0 , f1 , . . . serem e co ˆ ˆ polinˆmios ent˜o as fun¸˜es f0 , f1 , . . . tamb´m ser˜o polinˆmios, respectivamente de o a co e a o mesmo grau. Vejamos um exemplo, para ilustrar. Na Se¸˜o 8.3 obtivemos os polinˆmios ortogonais ca o 1 f0 (x) = 1, f1 (x) = x, f2 (x) = x2 − 3 , f3 (x) = x3 − 3 x, relativamente ao produto interno 5 usual no intervalo [−1, 1], por´m gostar´ e ıamos de fazer um ajuste polinomial no intervalo [1, 2]. Ent˜o procedemos como descrito acima. Achamos primeiro a fun¸˜o afim L que leve a ca o intervalo [1, 2] no intervalo [−1, 1], dada por L(x) = −1 + 2(x − 1) = 2x − 3 (procure sua pr´pria maneira de ach´-la!). Os polinˆmios procurados s˜o dados por o a o a ˆ fl = fl ◦ L. Portanto ˆ f1 (x) ˆ f2 (x) ˆ f3 (x) ˆ f4 (x) = = = = f1 (L(x)) = 1 f2 (L(x)) = L(x) = −3 + 2x 1 f3 (L(x)) = L(x)2 − 3 = 4x2 − 12x + 26 3 3 f4 (L(x)) = L(x)3 − 5 L(x) = 8x3 − 36x2 + 54x − 6 x − 5

126 5

Parte III

Equa¸˜es e Zeros de Fun¸˜es co co

111

Cap´ ıtulo 9

Zeros de fun¸˜es e o M´todo da co e Dicotomia
9.1 Introdu¸˜o ca

Considere o seguinte problema: “dada uma fun¸˜o real f , achar suas ra´ ca ızes, isto ´, os e valores de x para os quais f (x) = 0”, como ilustra a figura abaixo (os pontos pretos indicam as ra´ ızes da fun¸˜o representada no desenho). ca

f

Pode a princ´ ıpio parecer um problema espec´ ıfico, mas ele aparece toda vez que tivermos uma equa¸˜o a ser resolvida. Uma equa¸˜o nada mais ´ do que uma express˜o ca ca e a f1 (x) = f2 (x) , onde procuramos o(s) valor(es) de x que a satisfa¸a(m). Ora, mas isso ´ o mesmo que c e achar as ra´ ızes da fun¸˜o f (x) = f1 (x) − f2 (x). ca Al´m disso, o problema se relaciona com a invers˜o de fun¸˜es. Por exemplo, tee a co mos uma fun¸˜o g(x) conhecida, mas gostar´ ca ıamos de determinar g −1 em certos pontos. −1 (y) ´ definido como sendo o valor x tal que g(x) = y temos que, para Lembrando que g e 113

114

´ CAP´ ITULO 9. ZEROS DE FUNCOES E O METODO DA DICOTOMIA ¸˜

um dado y, resolver a equa¸˜o g(x) = y e determinar x = g −1 (y). Resolver a equa¸˜o ca ca g(x) = y ´ o mesmo que achar um zero da fun¸˜o f (x) = g(x) − y. e ca Nas pr´ximas Se¸˜es veremos alguns exemplos que ilustram o problema. o co

9.2

Raiz c´ bica de 10 u

Suponha que queiramos achar um n´mero√ positivo tal que x3 = 10. Esse n´mero ´ o u x ¯ ¯ u e que denominamos a raiz c´bica de 10, ou 3 10. u Graficamente, encontramos x pela intersec¸˜o ¯ ca 3 } com {y = 10}, como mostra a fiy=x3 de {y = x 10 gura ao lado. Observe tamb´m que o problema e y=10 ´ equivalente a resolver a equa¸˜o e ca x3 − 10 = 0 , ou seja, estamos procurando a raiz de f (x) = x3 − 10.
x

9.3

P´ra-quedista ou bolinha em queda dentro d’´gua a a

Imagine um p´ra-quedista que abre seu p´ra-quedas no instante t = 0, da altura h0 . a a Ou, alternativamente, uma bolinha que parte do repouso ` altura h0 dentro de um a tubo cheio d’´gua, e cai sob a for¸a da gravidade. Levando em conta que a queda n˜o a c a ´ completamente livre, isto ´, o meio oferece resistˆncia ao movimento, quanto tempo e e e levar´ a queda do p´ra-quedista ou da bolinha? a a

h0 h0

A diferen¸a b´sica entre os dois problemas ´ a velocidade inicial. No caso do p´rac a e a quedista, ela ´ bastante alta, e o p´ra-quedas tender´ a amortecˆ-la at´ atingir uma e a a e e

´ ´ 9.3. PARA-QUEDISTA OU BOLINHA EM QUEDA DENTRO D’AGUA

115

velocidade compat´ com a possibilidade do corpo humano suportar o choque com o ıvel solo. No caso da bolinha, a velocidade inicial ´ zero e cresce com o tempo. e Empiricamente, constata-se que o meio oferece resistˆncia ao movimento com uma e for¸a tanto maior quanto maior for a velocidade. c Num gr´fico, ter´ a ıamos algo como mostrado na figura ao lado. Isso implica que h´ um valor de a força de velocidade v ∗ para o qual a for¸a de resistˆncia resistencia c e ´ exatamente igual ` for¸a da gravidade. Se o e a c mg corpo em queda est´ a essa velocidade, a for¸a a c da gravidade e a resistˆncia do meio se anulam e entre si, e a resultante das for¸as ´ zero. Isso c e implica que o corpo n˜o ser´ acelerado (nem dea a v* velocidade sacelerado), e portanto permanecer´ constantea mente em movimento ` velocidade v ∗ . a Por outro lado, se a velocidade inicialmente ´ maior do que v ∗ , ent˜o a for¸a de e a c resistˆncia ser´ maior do que a for¸a de gravidade, o que far´ com que o corpo reduza e a c a sua velocidade. Tudo sugere que os gr´ficos Velocidade vs. Tempo tenham o seguinte a aspecto, dependendo da rela¸˜o entre v0 e v ∗ , onde v0 ´ a velocidade inicial do corpo. ca e

v v0 = v* t

v0 v*

v v* v0 t

v

t

Sob a hip´tese de que a for¸a de resistˆncia do ar ´ proporcional ` velocidade do o c e e a corpo, em valor absoluto, ´ poss´ mostrar que a evolu¸˜o da velocidade em fun¸˜o do e ıvel ca ca tempo ´ dada por e v(t) − v∗ = (v0 − v∗ )e− v∗ t , onde g ´ a constante de gravidade ` superf´ terrestre (vide Se¸˜o 18.3.3 para uma e a ıcie ca justificativa). Como interpretar essa f´rmula? Ora, note que se definirmos ∆v(t) = v(t) − v ∗ , isto o ´, a diferen¸a entre a velocidade do corpo e a velocidade de equil´ e c ıbrio, a f´rmula apenas o g diz que ∆v no instante t ´ igual a ∆v no instante t = 0 multiplicado por e− v∗ t . Isso e est´ de acordo com as figuras que hav´ a ıamos desenhado.
g

116

´ CAP´ ITULO 9. ZEROS DE FUNCOES E O METODO DA DICOTOMIA ¸˜

Sabendo agora como evolui a velocidade do corpo em fun¸˜o do tempo, como podemos deduzir a evolu¸˜o da ca ca altura h(t)? Primeiro precisamos fixar coerentemente as coordenadas. Temos considerado velocidades positivas para corpos em queda, logo temos que medir a altura, com a coordenada h, de cima para baixo. Por conveniˆncia, fixaremos o zero de h como sendo ` e a altura h0 , de forma que o solo ser´ atingido no instante a T tal que h(T ) = h0 .

0

h= h0 h

v v0 v* 0 h(t)
Ent˜o a
t

O espa¸o percorrido ´ dado pela integral da vec e locidade no intervalo de tempo considerado. Assim,
t

h(t) − h(0) =
0

v(s)ds ,

t

onde h(0) = 0, pela maneira como fixamos a coordenada. No gr´fico de velocidades, isso cora responde a achar a ´rea sob a curva v(t). A a vari´vel s ´ usada como auxiliar, para diferir do a e extremo de integra¸˜o. ca

h(t) =
0 t

(v ∗ + [v(0) − v ∗ ]e− v∗ s )ds v ∗ ds + [v(0) − v ∗ ]
0 T

g

=
0

e− v∗ s ds

g

g v∗ = v ∗ t + [v(0) − v ∗ ](− )(e− v∗ t − 1) . g

Logo h(t) =

g v∗ v∗ [v(0) − v ∗ ] + v ∗ t − [v(0) − v ∗ ]e− v∗ t . g g

Agora, se quisermos achar T tal que h(T ) = h0 , teremos que resolver a equa¸˜o ca h0 =
g v∗ v∗ [v(0) − v ∗ ] + v ∗ T − [v(0) − v ∗ ]e− v∗ T . g g

9.4. O CILINDRO DEITADO Chamando v∗ [v(0) − v ∗ ] − h0 g B = v∗ v∗ C = [v(0) − v ∗ ] g v∗ D = g A =

117

ent˜o estamos procurando a raiz da fun¸˜o a ca f (t) = A + Bt − Ce−Dt . Graficamente, essa raiz ´ dada pela e proje¸˜o na abscissa do encontro entre a ca reta A + Bt com a fun¸˜o Ce−Dt , vide ao ca lado.

A+Bt

Ce−Dt T t

9.4

O cilindro deitado

Considere um cilindro colocado horizontalmente sobre um plano, paralelo ao solo, como na figura ao lado. O cilindro tem uma abertura, na parte superior, para a coloca¸˜o de ´gua (para draca a matizar o exemplo, imagine um contˆiner e de petr´leo, gigante, com esse formato e o nessa posi¸˜o). O problema ´: como deca e terminar uma escala com marca¸˜es que co indiquem o volume de ´gua dentro do cia lindro (e n˜o simplesmente a altura do a n´ da ´gua)? ıvel a Para ver a rela¸˜o entre essa quest˜o e o problema de achar o zero de uma fun¸˜o, ca a ca quantifiquemos um pouco mais o problema. Seja l o comprimento do cilindro e r o raio

118

´ CAP´ ITULO 9. ZEROS DE FUNCOES E O METODO DA DICOTOMIA ¸˜

de uma se¸˜o transversal, perpendicular ao seu eixo. O volume total do cilindro ´ dado ca e por v = l · πr2 ,

pois πr2 ´ a “´rea da base” e l a “altura” do cilindro, embora ele esteja deitado. e a

r

θ L A(h)

rcos(θ) h

Se ele estiver cheio at´ a altura h ent˜o e a o volume de ´gua ali contido ser´ l vezes a a a ´rea preenchida pela ´gua numa se¸˜o a a ca transversal qualquer, que chamaremos de A(h). Note que h varia entre 0 e 2r, e que A(0) = 0, A(2r) = πr2 e A(r) = 1 πr2 . 2 Mas e os outros valores de h? Como achar a fun¸˜o A(h)? ca

Aqui podemos fazer um pouco de geometria: supomos que h < r (o racioc´ ınio ser´ a completamente an´logo para h > r) e consideramos o ˆngulo θ formado entre a vertical a a e a linha L. A rela¸˜o entre h e θ ´ simples: r cos θ + h = r, ou seja, h = r(1 − cos θ). ca e Lembremos agora que a ´rea de um setor de ˆngulo θ pode ser achada por regra de a a trˆs, lembrando que para θ = 2π a ´rea ´ πr2 : e a e

1 θ = 2π −→ πr2 =⇒ a(θ) = θr2 . θ −→ a(θ) 2

Como mostra a figura, a ´rea que queremos calcular ´ menor do que a ´rea de dois setores a e a de ˆngulo θ (perfazendo θr2 ), e o excedente ´ a ´rea de dois triˆngulos-retˆngulos. a e a a a A ´rea excedente ´ o produto d1 d2 , onde d1 = r cos θ e d2 = r sin θ. Logo a e

A(h) = θr2 − r2 sin θ cos θ = r2 (θ −

1 sin 2θ) , 2

9.4. O CILINDRO DEITADO

119

θ=π
lembrando que θ depende de h pela rela¸˜o h = ca r(1 − cos θ). Essa conta sugere que talvez seja mais f´cil fazer a escala ao longo do contorno do a cilindro, parametrizado pelo ˆngulo θ, como se a fossem as marcas de um rel´gio (pode-se fazer o uma escala vertical, mas as contas ficar˜o mais a complicadas).

3l 2l
θ=0

1l

´ a E f´cil ver que a mesma f´rmula vale quando h > r (verifique!). Resumindo, o o volume v(θ) depende de θ pela f´rmula o v(θ) = lr2 (θ − 1 sin 2θ) , 2

onde θ varia entre 0 e π. O gr´fico de v(θ) (de fato, o gr´fico de v = v(θ)/lr2 ) est´ a a ˜ a esbo¸ado na figura abaixo. c

v v = lr 2 π

v (θ) v =θ

1 2

1 v = −2 sen(2 ) θ

0
1 2

π

θ

v Na figura, colocamos na vertical a vari´vel v = lr2 , de forma que o gr´fico fique a ˜ a independente do raio r e do comprimento l do cilindro. As linhas pontilhadas indicam as duas fun¸˜es (θ e − 1 sin 2θ) que somadas produzem a fun¸˜o v (θ) = v(θ) . co ca ˜ 2 lr 2

120

´ CAP´ ITULO 9. ZEROS DE FUNCOES E O METODO DA DICOTOMIA ¸˜ A fun¸˜o v (θ) tem derivada nula em θ = 0 (e por simetria em θ = π), pois ca ˜ v (θ) = 1 − 1 · 2 cos 2θ 2

e v (0) = 1 − cos(0) = 0 . Suponha agora que o volume total do cilindro seja da ordem de 10 litros e que ¯ queremos marcar, no contorno do cilindro, o valor de θ correspondente a um volume de ¯ ¯ a ´gua de 3 litros. Isso corresponde, no gr´fico, a achar o valor de θ para o qual v(θ) = 3 a (se o volume for medido em litros). Esse ´ o problema de achar a raiz da fun¸˜o v(θ) − 3. O mesmo procedimento pode e ca ser adotado para se calcular as marquinhas correspondentes a outros valores do volume, de forma que toda a escala possa ser constru´ ıda.

9.5

Caten´ria a

Mais uma vez, suponhamos uma corrente pendurada em dois pontos de sustenta¸˜o. ca Seu formato, como j´ dissemos, ´ o do gr´fico da fun¸˜o a e a ca f (x) = 1 (cosh(cx) − 1) , c

desde que a origem do plano cartesiano coincida com o ponto de m´ ınimo da curva. Na Subse¸˜o 5.3.2 propusemos uma maneira de achar o parˆmetro c experimentalca a mente, atrav´s de um ajuste de fun¸˜es, no caso n˜o linear. Aqui veremos que, a partir e co a da posi¸˜o de um unico ponto da corrente (excetuando o ponto de m´ ca ´ ınimo), podemos achar o parˆmetro c. Para tanto, reduziremos o problema a achar o zero de uma fun¸˜o a ca cuja vari´vel ´ o parˆmetro c. a e a Suponha que a corrente passa por um certo ponto (x0 , y0 ) = (0, 0). Isso significa que y0 = f (x0 ) = Ent˜o a cosh(cx0 ) − cy0 − 1 = 0 , isto ´, o parˆmetro c ´, necessariamente, um zero da fun¸˜o e a e ca F (c) = cosh(cx0 ) − cy0 − 1 . Graficamente, podemos pensar tamb´m que c ´ o cruzamento do gr´fico de cosh(cx0 ) e e a com o gr´fico da fun¸˜o afim 1 + cy0 . Da convexidade do cosseno hiperb´lico segue que a ca o 1 (cosh(cx0 ) − 1) . c

´ 9.6. METODO DA DICOTOMIA

121

h´ apenas dois pontos onde as fun¸˜es coincidem, e um deles ´ c = 0. Como c n˜o a co e a pode ser zero (pois aparece no denominador, na express˜o da fun¸˜o f ), ent˜o c fica a ca a completamente determinado uma vez dado (x0 , y0 ). Para calcular c explicitamente, no entanto, ´ necess´rio algum m´todo num´rico. e a e e

9.6

M´todo da Dicotomia e

Nesta Se¸˜o apresentaremos o M´todo da Dicotomia, que ´ um m´todo intuitivo de se ca e e e achar a raiz de uma fun¸˜o. M´todos mais sofisticados ser˜o estudados nos pr´ximos ca e a o Cap´ ıtulos. O primeiro passo ´ isolar a raiz x∗ dentro de um intervalo onde a fun¸˜o seja e ca mon´tona: ou crescente ou decrescente. Sejam a0 e b0 os extremos desse intervalo. o Observamos ent˜o que a fun¸˜o assume valores com a ca sinais opostos nesses extremos, isto ´, e
f

f (a0 ) · f (b0 ) < 0 .

a0

x* b0 No desenho ao lado, f (a0 ) < 0 e f (b0 ) > 0. Seria ao contr´rio se no desenho a fun¸˜o fosse decrescente. a ca Esse primeiro passo depende muito do conhecimento pr´vio que se tem a respeito da fun¸˜o. e ca Em seguida passamos a cercar a raiz com intervalos, cada intervalo com um tamanho igual ` metade do tamanho do intervalo anterior. a Para ilustrar o m´todo, usemos a fun¸˜o f (x) = x3 − 20. Observe que achar x∗ tal e ca ∗ ) = 0 ´ o mesmo que achar a raiz c´ bica de 20. que f (x e u

1. Escolhemos a0 = 2, pois 23 − 20 < 0 e b0 = 3, pois 33 − 20 > 0. 2. Escolhemos o ponto m´dio do intervalo, ao qual chamaremos provisoriamente de e c0 : a0 + b0 c0 = . 2 Neste caso, c0 = 2.5. 3. Testamos o valor de f em c0 : f (c0 ) = f (2.5) = 2.53 − 20 = −4.375 < 0 . Conclu´ ımos que x∗ est´ ` direita de c0 , o que nos faz definir o novo intervalo aa [a1 , b1 ] = [c0 , b0 ] .

122

´ CAP´ ITULO 9. ZEROS DE FUNCOES E O METODO DA DICOTOMIA ¸˜

4. Repetimos o procedimento 2), agora com o intervalo [a1 , b1 ], ou seja, calculamos o ponto m´dio e a1 + b1 c1 = = 2.75 . 2 5. Avaliamos f em c1 : f (c1 ) = f (2.75) = 2.753 − 20 = 0.796875 > 0 . Conclu´ ımos que x∗ est´ ` esquerda de c1 , o que nos faz definir o novo intervalo aa [a2 , b2 ] = [a1 , c1 ] . Prosseguindo, colocamos os dados numa tabela, indo at´ a d´cima etapa: e e
3 n an bn cn rn ± en rn 0 2 3 2.5 2.5 ± 0.5 15.6 1 2.5 3 2.75 2.75 ± 0.25 20.8 2 2.5 2.75 2.625 2.63 ± 0.13 18.2 3 2.625 2.75 2.6875 2.69 ± 0.07 19.5 4 2.6875 2.75 2.71875 2.72 ± 0.04 20.12 5 2.6875 2.71875 2.703125 2.703 ± 0.016 19.75 6 2.703125 2.71875 2.7109375 2.711 ± 0.008 19.93 7 2.7109375 2.71875 2.71484375 2.715 ± 0.005 20.013 8 2.7109375 2.71484375 2.712890625 2.7129 ± 0.0020 19.966 9 2.712890625 2.71484375 2.713867188 2.7139 ± 0.0011 19.989 10 2.713867188 2.71484375 2.714355469 2.7144 ± 0.0006 19.9996

Na tabela, calculamos os extremos e centros dos intervalos usando todas as casas decimais dispon´ ıveis na calculadora. No entanto em cada etapa s´ sabemos com certeza que o a raiz est´ entre an e bn , portanto o erro em assumi-la com o valor de cn ´ a e bn − an . 2 Os valores de rn s˜o arredondamentos de cn at´ uma certa casa decimal, com um erro a e en garantindo que a raiz esteja entre rn − en e rn + en . O crit´rio para a determina¸˜o de rn e en foi o seguinte. Primeiro determinou-se o e ca erro 1 (bn − an ), com todas as casas decimais poss´ ıveis. De posse desse valor, escolheu-se 2 o n´mero de algarismos significativos para expressar en , 1 ou 2. O crit´rio dessa escolha u e baseou-se num certo grau de “razoabilidade”, de forma que: (i) o primeiro ou os dois primeiros algarismos significativos de en sejam uma dentre as possibilidades 10, 11, 12,

´ 9.6. METODO DA DICOTOMIA

123

13, 14, 15, . . ., 24, 25, 3, 4, 5, 6, 7, 8 e 9; (ii) tomando rn como o arredondamento de cn na casa decimal correspondente ` ultima casa decimal de en , o intervalo [rn − en , rn + en ] a´ contenha o intervalo [an , bn ]; (iii) en seja o menor poss´ ıvel. 1 Por exemplo, para n = 4 temos 2 (b4 − a4 ) = 0.03125, ent˜o tomamos e4 = 0.04 a (n˜o podemos usar 0.03, sen˜o a condi¸˜o (ii) pode n˜o ser satisfeita). Em seguida a a ca a ´ arredondamos c4 = 2.71875 na segunda casa decimal, obtendo r4 = 2.72. E preciso a´ ı testar a condi¸˜o (iii): 2.72 − 0.04 = 2.68 < a4 e 2.72 + 0.04 = 2.76 > b4 , tudo bem. Se ca essa condi¸˜o n˜o fosse satisfeita, en teria que ser ligeiramente aumentado, respeitando ca a (i), (ii) e (iii) ao mesmo tempo.

124

´ CAP´ ITULO 9. ZEROS DE FUNCOES E O METODO DA DICOTOMIA ¸˜

Cap´ ıtulo 10

M´todos iterativos e
10.1 Plano geral

Neste Cap´ ıtulo discutiremos a determina¸˜o de zeros de fun¸˜es por meio de m´todos ca co e iterativos. Os m´todos iterativos (n˜o s˜o interativos, aten¸˜o!) s˜o realizados da see a a ca a guinte maneira. 1. Dada a fun¸˜o f da qual se procura uma raiz x∗ , “fabrica-se” uma fun¸˜o auxiliar ca ca ϕ (quais caracter´ ısticas ela deve ter e como ach´-la, veremos aos poucos). a 2. Arrisca-se um “palpite” inicial x0 , e a partir desse palpite constr´i-se uma seq¨ˆncia o ue de valores x0 , x1 , x2 , . . ., onde o valor xk+1 depende do valor xk pela rela¸˜o ca xk+1 = ϕ(xk ) . 3. Se a escolha de ϕ e de x0 for feita com algum crit´rio, espera-se que a seq¨ˆncia e ue {xk }k convirja para x∗ , como mostra esquematicamente a figura abaixo. 4. Com algum crit´rio de parada, em fun¸˜o da precis˜o que se deseja na resposta, e ca a toma-se um dos xk ’s como aproxima¸˜o de x∗ . ca

f x*
¨ § ¦§ ¦ ¤¥ ¤ ¥  ¡   © ¨© ¡ ¢£ ¢ £

x1

x2 x3

x0

125

126

´ CAP´ ITULO 10. METODOS ITERATIVOS

10.2

Pontos fixos

A primeira observa¸˜o pertinente a respeito do plano geral tra¸ado acima ´ sobre o tipo ca c e ∗ , em rela¸˜o ` aplica¸˜o ϕ (em rela¸˜o ` fun¸˜o f j´ sabemos: de ponto que deve ser x ca a ca ca a ca a x∗ ´ uma raiz de f ). Supondo que, no m´ e ınimo, ϕ seja uma fun¸˜o cont´ ca ınua, notamos que, se xk tende a x∗ , ent˜o ϕ(xk ) deve tender a ϕ(x∗ ) (´ a defini¸˜o de fun¸˜o cont´ a e ca ca ınua, pense nisso!). Por outro lado tem-se que ϕ(xk ) = xk+1 , ent˜o a seq¨ˆncia ϕ(xk ) ´ a pr´pria a ue e o seq¨ˆncia dos xk , adiantada no ´ ue ındice k de uma unidade. Como ϕ(xk ) tende a ϕ(x∗ ), ∗ ). Ora, mas se x tende ao mesmo tempo para x∗ e para ϕ(x∗ ), a ent˜o xk tende a ϕ(x a k conclus˜o ´ que x∗ e ϕ(x∗ ) tˆm que ser iguais! a e e Para resumir, uma condi¸˜o necess´ria para que o plano geral de achar a raiz x∗ de ca a f por itera¸˜o de uma fun¸˜o ϕ funcione ´ que, no m´ ca ca e ınimo, valha ϕ(x∗ ) = x∗ . Esta condi¸˜o, no entanto, n˜o ´ suficiente para que o plano dˆ certo, como veremos ca a e e mais adiante. Todo ponto x para o qual se tenha ϕ(x) = x ´ chamado de ponto fixo da fun¸˜o ϕ. O e ca que acabamos de concluir ´ que a fun¸˜o auxiliar ϕ deve ter a raiz x∗ de f como ponto e ca fixo. Um ponto fixo da fun¸˜o ϕ ´ localizado pelo cruzamento do gr´fico de y = ϕ(x) com ca e a o gr´fico de y = x, a diagonal, ao contr´rio das ra´ a a ızes de f , que s˜o localizadas pelo a cruzamento do gr´fico de f com a abscissa (y = 0). Na figura abaixo, por exemplo, a a fun¸˜o ϕ esbo¸ada tem 2 pontos fixos (suas quatro ra´ ca c ızes n˜o nos interessam). a

ϕ
¡  ¡   £ ¢£ ¢

Exerc´ ıcio. Determine os pontos fixos (se houver) de ϕ(x) = x2 − x + 0.5. Esboce o gr´fico de ϕ. Construa a seq¨ˆncia de iterados xk+1 = ϕ(xk ) a partir de x0 = 0. A a ue

10.3. FUNCOES AUXILIARES CANDIDATAS ¸˜

127

seq¨ˆncia converge? Se converge, converge para algum ponto fixo? Fa¸a o mesmo para ue c x0 = 2, e depois para x0 = 1.5. Exerc´ ıcios de itera¸˜o ficam bem mais f´ceis com uma boa calculadora cient´ ca a ıfica. Algumas vezes ´ preciso iterar bastante, por isso conv´m reduzir ao m´ximo o n´mero e e a u de opera¸˜es na m´quina em cada etapa. Em algumas calculadoras, existe uma vari´vel co a a ` vezes essa vari´vel pode ser de mem´ria que guarda a resposta do ultimo c´lculo. As o ´ a a colocada na f´rmula completa. Por exemplo, em algumas calculadoras CASIO essa o vari´vel chama-se “Ans”. Procede-se assim, para x0 = 1.5 e ϕ(x) = x2 − x + 0.5: (i) a escreve-se 1.5 e aperta-se “EXE”, fazendo com que 1.5 seja armazenado em “Ans”; (ii) escreve-se “Ans2 − Ans + 0.5”, aperta-se “EXE” e aparece a resposta 1.25, que ´ o x1 e (e esta resposta ´ armazenada em “Ans”, substituindo o valor anterior); (iii) apertando e “EXE” novamente a calculadora far´ a mesma conta, s´ que a partir do novo valor de a o “Ans”, que ´ o x1 , assim aparecer´ o valor de x2 ; (iv) a partir da´ ´ s´ ir apertando e a ı e o “EXE” que v˜o aparecendo os xk ’s, em seq¨ˆncia. a ue Se a calculadora n˜o dispuser desses recursos, mesmo assim ela deve ter maneiras a de armazenar valores em mem´ria. Guarde o resultado xk na mem´ria e procure us´-la o o a na hora de calcular xk+1 . Calculadoras que permitem colocar a f´rmula inteira antes de o fazer a conta s˜o as melhores para isso. a H´ tamb´m, ´ claro, a possibilidade de se fazer um pequeno programa em computador a e e para realizar essas contas. Qualquer linguagem que lide facilmente com n´meros reais u serve para isso. Exerc´ ıcio. Tome ϕ(x) = 3.1x(1 − x) e x0 = 0.3. O que acontece com a seq¨ˆncia de ue iterados? Exerc´ ıcio. Tome ϕ(x) = 4x(1 − x) e x0 = 0.3. O que acontece com a seq¨ˆncia de ue iterados?

10.3

Fun¸˜es auxiliares candidatas co

´ E natural nos questionarmos se podemos achar uma fun¸˜o ϕ tal que ϕ(x∗ ) = x∗ se n˜o ca a ∗ , afinal estamos desenvolvendo um m´todo cuja finalidade conhecemos exatamente x e ultima ´ justamente achar x∗ ! Acontece que por um pequeno truque isto ´ perfeitamente ´ e e poss´ ıvel, e de maneira surpreendentemente simples! Para come¸ar, tome a fun¸˜o f (x) e adicione a ela a fun¸˜o identidade, isto ´, defina c ca ca e ϕ(x) = x + f (x) . Note que se x∗ for uma raiz de f ent˜o a ϕ(x∗ ) = x∗ + f (x∗ ) = x∗ ,

128

´ CAP´ ITULO 10. METODOS ITERATIVOS

isto ´, x∗ ´ um ponto fixo de ϕ. Inversamente, se x∗ for um ponto fixo de ϕ ent˜o x∗ e e a ser´ tamb´m uma raiz de f . Em conclus˜o, se ϕ for definida dessa maneira ent˜o as a e a a ra´ ızes de f coincidir˜o exatamente com os pontos fixos de ϕ! a O mesmo acontecer´ se definirmos a ϕ(x) = x + αf (x) , onde α ´ um n´mero real qualquer, ou mesmo e u ϕ(x) = x + α(x)f (x) , onde α(x) ´ uma fun¸˜o (cont´ e ca ınua) qualquer. Como n˜o devemos nunca dispensar um a desenho, em tudo o que fazemos na matem´tica, vejamos como podemos esbo¸ar a c ϕ(x) = x + αf (x) diretamente a partir do esbo¸o do gr´fico da fun¸˜o f . Se α for poc a ca sitivo, ao multiplicarmos a fun¸˜o f por α ca estaremos “encolhendo” (se α < 1) ou “dilatando” (se α > 1) o gr´fico na dire¸˜o a ca vertical. Nas ra´ ızes, como a fun¸˜o vale ca zero, o efeito ´ nulo. Se α for negativo o e gr´fico ser´, al´m disso, refletido em torno a a e da abscissa. Depois dessa multiplica¸˜o ca temos apenas que “somar” o gr´fico rea sultante ` diagonal. Na figura ao lado a esbo¸amos o processo com α igual a − 1 . c 2

ϕ(x) = x

1 2

f(x)

f(x)

1 2

f(x)

Exerc´ ıcio. Considere f (x) = sen(x) (n˜o se esque¸a, x em radianos!). Esboce o gr´fico a c a de ϕ(x) = x + f (x). Esboce tamb´m o gr´fico de ψ(x) = x − 1 f (x). Itere ϕ e ψ a partir e a 2 da condi¸˜o inicial x = 1 e compare os resultados. ca

10.4

Visualizando itera¸˜es co

´ E importante se ter no¸˜o visual do processo de itera¸˜o de uma fun¸˜o ϕ, e para isso ca ca ca veremos como fazer itera¸˜es usando apenas o esbo¸o da fun¸˜o. Obviamente haver´ co c ca a um ac´mulo de erro quando fizermos itera¸˜es sucessivas, mas os desenhos nos ajudar˜o u co a

10.4. VISUALIZANDO ITERACOES ¸˜

129

a melhor compreender os diversos tipos de comportamentos presentes nos m´todos itee rativos. A primeira coisa que devemos fazer ´ dee senhar o gr´fico da fun¸˜o, e em seguida a ca a diagonal, que nos auxiliar´. Depois esa colhemos uma condi¸˜o inicial x0 (´ apeca e nas um ponto da abscissa), e o objetivo ´ encontrar a posi¸˜o, na abscissa, de e ca x1 = ϕ(x0 ). Movendo-nos verticalmente, encontraremos o gr´fico de ϕ, na posi¸˜o a ca (x0 , ϕ(x0 )). Como ϕ(x0 ) = x1 , este ´ o e ponto (x0 , x1 ), ou seja, j´ encontramos x1 , a mas ele ´ a segunda coordenada do ponto e encontrado. Nosso objetivo, no entanto, ´ e encontrar o ponto da abscissa (x1 , 0).

ϕ(x)

(x1 , 0)

(x0 , 0)

(x1 , x1)

(x0 , x1)

Ent˜o movemo-nos horizontalmente, isto ´, mantendo fixa a segunda coordenada, a a e partir de (x0 , x1 ) at´ encontrar a diagonal. Na diagonal, os valores da primeira e da e segunda coordenada s˜o iguais; como a segunda foi mantida sempre igual a x1 , ent˜o a a esse ponto ser´ (x1 , x1 ), e com um movimento vertical determinamos x1 sobre a abscissa. a Para a determina¸˜o de x2 o procedimento ´ an´logo: movimento vertical at´ enca e a e contrar o gr´fico, depois movimento horizontal at´ encontrar a diagonal e finalmente a e movimento vertical at´ encontrar a abscissa. E assim por diante! e Observe que podemos poupar um pouco de trabalho quando fazemos uma s´rie e de itera¸˜es sucessivas. De x0 vamos verticalmente at´ o gr´fico (` altura x1 ), depois co e a a horizontalmente at´ a diagonal (` posi¸˜o horizontal x1 ). Depois, de acordo com o que foi e a ca descrito acima, ir´ ıamos verticalmente at´ a abscissa (` altura zero) e ent˜o verticalmente e a a at´ o gr´fico (` altura x2 = ϕ(x1 )). Ora, a composi¸˜o de dois movimentos verticais e a a ca ainda ´ um movimento vertical, que poderia ser feito de uma vez s´. Ou seja, logo e o ap´s nos movermos horizontalmente at´ a diagonal, encontrando (x1 , x1 ), podemos nos o e mover verticalmente at´ o gr´fico, encontrando (x1 , x2 ). Em seguida continuamos, indo e a horizontalmente at´ a diagonal, no ponto (x2 , x2 ), e depois verticalmente at´ o gr´fico, e e a no ponto (x2 , x3 ), e assim por diante. Coletando as primeiras coordenadas de cada ponto de encontro com o gr´fico, teremos a seq¨ˆncia de iterados a partir de x0 . Veja na figura a ue abaixo uma ilustra¸˜o desse procedimento. ca

130

´ CAP´ ITULO 10. METODOS ITERATIVOS

ϕ(x)
x4 x3 x1 x2 x0

Exerc´ ıcio. Fa¸a um esbo¸o de ϕ = 2x(1 − x) e itere a partir das seguintes condi¸˜es c c co iniciais: (i)x0 = −0.5; (ii) x0 = 0.0; (iii) x0 = 0.25; (iv) x0 = 0.5; (v) x0 = 0.75; (vi) x0 = 1.0; (vii) x0 = 1.25. O que acontece com cada seq¨ˆncia de iterados? Converge, ue n˜o converge? D´ para inferir o que acontecer´ com o restante das condi¸˜es iniciais? a a a co Exerc´ ıcio. Como se explica um ponto fixo no procedimento acima? Exerc´ ıcio. Se a regra fosse “verticalmente at´ a diagonal e horizontalmente at´ o e e gr´fico”, o procedimento estaria bem definido? A regra seria clara? a Exerc´ ıcio. Uma pr´-imagem de um ponto y pela fun¸˜o ϕ ´ um ponto x tal que ϕ(x) = e ca e y. Muitas vezes um ponto tem mais do que uma pr´-imagem. Usando um gr´fico de ϕ, e a invente um m´todo r´pido para achar todas as pr´-imagens de um ponto dado (suponha e a e que o ponto dado foi indicado sobre a abscissa).

10.5

Iterando perto de pontos fixos

Vejamos agora, atrav´s de esbo¸os, o que acontece com a seq¨ˆncia de iterados quando e c ue a condi¸˜o inicial est´ pr´xima de um ponto fixo. A pergunta a ser respondida ´: ser´ ca a o e a que ela converge para esse ponto fixo? A resposta ´ de suma importˆncia, uma vez e a que nosso objetivo ´ encontrar o ponto fixo por aproxima¸˜es sucessivas. Sem isso, n˜o e co a teremos condi¸˜o de preencher o terceiro item do nosso plano geral, tra¸ado no come¸o ca c c do Cap´ ıtulo. Para come¸ar, adotaremos como hip´tese que o ponto fixo x∗ seja isolado, isto ´, que c o e ∗ n˜o exista nenhum outro ponto fixo. Isto tamb´m numa vizinhan¸a (pequena) de x a c e significa que perto de x∗ o gr´fico de ϕ s´ toca a diagonal no pr´prio x∗ . a o o

10.5. ITERANDO PERTO DE PONTOS FIXOS Na figura ao lado mostramos os ingredientes b´sicos de que necessitaa remos: o gr´fico de ϕ, pr´ximo a a o x∗ , a diagonal e o que chamaremos de diagonal secund´ria em x∗ , que a ´ a reta de inclina¸˜o −1 passando e ca por (x∗ , x∗ ). Para simplificar, assumiremos que tamb´m a diagonal e secund´ria s´ seja intersectada pelo a o gr´fico de ϕ no ponto (x∗ , x∗ ). Essas a hip´teses n˜o s˜o demasiadamente o a a restritivas: ´ raro encontrar um caso e em que elas n˜o sejam respeitadas. a

131

ϕ
x*

x*

Assim, podemos imaginar diversas possibilidades para o gr´fico de ϕ, de acordo com a a posi¸˜o em rela¸˜o ao cone duplo formado pela diagonal e pela diagonal secund´ria, ca ca a como mostra a figura abaixo. Nos diagramas, hachuramos o que queremos convencionar como a “parte interna” do cone, entre as duas diagonais.

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(i)

(j)

(l)

132

´ CAP´ ITULO 10. METODOS ITERATIVOS

Nos casos (d), (e), (f ) e (g) o gr´fico de ϕ tangencia a diagonal em x∗ . Isto tem a um significado, se ϕ for uma fun¸˜o diferenci´vel: ϕ (x∗ ) = 1, pois basta lembrar que a ca a derivada ´ a inclina¸˜o da reta tangente ao gr´fico. Nos casos (h), (i), (j) e (l) o gr´fico e ca a a de ϕ tangencia a diagonal secund´ria em x∗ , ou seja, ϕ (x∗ ) = −1. a No caso (a), a tangente ao gr´fico de ϕ em x∗ ´ uma reta de inclina¸˜o menor do a e ca que 1 (pois ´ menor do que a inclina¸˜o da diagonal) e maior do que −1 (ou seja, menos e ca negativa do que a inclina¸˜o da diagonal secund´ria). Portanto ca a −1 < ϕ (x∗ ) < +1 no caso (a). No caso (b) temos ϕ (x∗ ) < −1 e no caso (c) temos ϕ (x∗ ) > +1 . Em resumo, podemos considerar 3 possibilidades, de acordo com o m´dulo de ϕ (x∗ ): o (i) |ϕ (x∗ )| < 1, caso (a); (ii) |ϕ (x∗ )| > 1, casos (b) e (c); (iii) |ϕ (x∗ )| = 1, casos (d) a (l). Uma esp´cie de rec´ e ıproca tamb´m ´ v´lida: sempre que |ϕ (x∗ )| for menor do que 1 e e a ∗ assumir´ o aspecto de (a), e sempre que |ϕ (x∗ )| for o gr´fico de ϕ na vizinhan¸a de x a c a maior do que 1 ele assumir´ o aspecto de (b) ou (c), de acordo com o sinal. No entanto, a se |ϕ (x∗ )| for igual a 1, haver´ todas as possibilidades mostradas de (d) at´ (l). a e Nosso objetivo ´ fazer uma an´lise da convergˆncia das seq¨ˆncias x0 , x1 = ϕ(x0 ), e a e ue x2 = ϕ(x1 ), . . . para o ponto fixo x∗ , quando x0 ´ escolhido perto de x∗ , por´m restringie e remos nossa argumenta¸˜o apenas aos casos (a), (b) e (c). A raz˜o ´ que, primeiramente, ca a e alguns dos outros casos podem ser facilmente analisados de forma semelhante (e outros n˜o t˜o facilmente), como mostram os exerc´ a a ıcios propostos abaixo. Al´m disso, cada e caso apresentar´ um comportamento distinto: pode haver convergˆncia ou n˜o, e em a e a alguns casos a resposta depende at´ de saber se x0 est´ ` esquerda ou ` direita de x∗ ! e aa a No caso (a) note que, se xk estiver pr´ximo a x∗ ent˜o ϕ(xk ) estar´ dentro do cone, o a a isto ´, e xk − x∗ < ϕ(xk ) − x∗ < x∗ − xk , (xk < x∗ ) ou xk − x∗ > ϕ(xk ) − x∗ > x∗ − xk , (xk > x∗ ) pois y = x∗ + (x − x∗ ) e y = x∗ − (x − x∗ ) s˜o as diagonais principal e secund´ria a a passando por x∗ . Isto ´ o mesmo que e |ϕ(xk ) − x∗ | < |xk − x∗ | ,

10.5. ITERANDO PERTO DE PONTOS FIXOS

133

a a a ou seja, xk+1 = ϕ(xk ) est´ mais perto de x∗ do que est´ xk . O mesmo valer´ de xk+1 para xk+2 , de modo que os iterados xk , xk+1 , . . . se aproximar˜o cada vez mais de x∗ a (veja exerc´ abaixo para tornar mais rigoroso este argumento). ıcio Outra maneira (mais intuitiva) de se chegar ` mesma conclus˜o ´ esbo¸ando a a a e c evolu¸˜o dos iterados no desenho, como mostra a figura abaixo, em duas situa¸˜es: ca co ϕ (x∗ ) > 0 e ϕ (x∗ ) < 0. Observe pela figura que quando ϕ (x∗ ) < 0 os iterados xk , xk+1 , . . . se alternam ` direita e ` esquerda de x∗ , quando est˜o suficientemente pr´ximos a a a o de x∗ .

ϕ
x* x*

ϕ
x* xk xk+1 xk+2 xk+3 xk xk+2 x* xk+3 xk+1

Nos casos (b) e (c) ocorre o oposto: tem-se |xk+1 − x∗ | > |xk − x∗ | , o que impossibilita a aproxima¸˜o a x∗ e, em verdade, afasta os iterados de x∗ . Isto ca pode ser visto na figura abaixo.

ϕ

ϕ

x*

x*

x* xk+3 xk+2 xk+1 xk xk+2

x* xk xk+1 xk+3

134

´ CAP´ ITULO 10. METODOS ITERATIVOS

Quando o ponto fixo ´ tal que a seq¨ˆncia de iterados iniciada em sua proximidade e ue converge para ele, dizemos que o ponto fixo ´ atrator. Se, ao contr´rio, os iterados e a se afastam, mesmo que xk esteja arbitrariamente pr´ximo de x∗ , ent˜o dizemos que o o a ponto fixo ´ repulsor. e Da argumenta¸˜o acima, conclu´ ca ımos que se |ϕ (x∗ )| < 1 ent˜o x∗ ´ um ponto fixo a e ∗ )| > 1 ent˜o x∗ ´ um ponto fixo repulsor. Se |ϕ (x∗ )| = 1 atrator, enquanto que se |ϕ (x a e n˜o ´ poss´ a e ıvel prever o comportamento dos iterados, a n˜o ser que se tenha outras a informa¸˜es sobre ϕ, em geral ligadas a derivadas de ordem mais alta. Veja mais sobre co isso nos exerc´ ıcios abaixo. Exerc´ ıcio. Esboce a fun¸˜o ϕ(x) = e4 − x e determine seus pontos fixos, dizendo quem ca ´ atrator e quem ´ repulsor apenas atrav´s do desenho do gr´fico. e e e a Exerc´ ıcio. Considere a equa¸˜o e−x = x − 1. Investigue se ϕ(x) = e−x + 1 pode ser ca util para achar a solu¸˜o. Ache-a. ´ ca Exerc´ ıcio. Este exerc´ ´ um conjunto de “observa¸˜es dirigidas” a respeito dos casos ıcio e co n˜o discutidos, onde a derivada de ϕ no ponto fixo tem m´dulo 1. O leitor deve tentar se a o convencer ao m´ximo de cada uma delas, usando desenhos, principalmente. O exerc´ a ıcio ajudar´ a fixar melhor a teoria discutida nesta Se¸˜o. a ca 1. Nos casos (e) e (i) o ponto fixo ´ atrator. e 2. Nos casos (g) e (l) o ponto fixo ´ repulsor. e 3. Nos casos (e), (i), (g) e (l) a segunda derivada de ϕ ´ nula. A terceira derivada e n˜o pode ser negativa em (i) e em (g), e n˜o pode ser positiva em (e) e (l). a a 4. A segunda derivada n˜o pode ser negativa em (d) e (h), e n˜o pode ser positiva a a em (f) e (j). 5. No caso (d), o ponto fixo ´ atrator pelo lado esquerdo e repulsor pelo lado direito. e J´ em (f) ele ´ atrator pelo lado direito e repulsor pelo esquerdo. a e 6. Os casos (h) e (j) s˜o os mais delicados. H´ alternˆncia de lado na itera¸˜o, pois a a a ca a derivada ´ negativa. Olhando para o caso (h), h´ aproxima¸˜o para o ponto fixo e a ca a cada vez que se passa pelo lado direito e afastamento a cada vez que se passa pelo lado esquerdo, e n˜o ´ claro a priori qual vai prevalecer (no caso (j) ocorre o a e oposto). Tente fazer desenhos caprichados criando casos onde h´ atra¸˜o e outros a ca onde h´ repuls˜o, sempre no caso (h), e depois tente o mesmo para o caso (j). a a Exerc´ ıcio. Este exerc´ ıcio ´ opcional, para aqueles que gostam de um pouco mais de e rigor nos argumentos. Observamos que no caso (a) ocorre |xk+1 − x∗ | < |xk − x∗ |, o que implicaria que a seqˆˆncia |xk − x∗ | vai a zero (equivalente a dizer que xk tende a ue
x

´ ˆ 10.6. TEOREMA DO VALOR MEDIO E VELOCIDADE DE CONVERGENCIA 135 x∗ ). Isso no entanto n˜o tem que ser necessariamente verdade, quer dizer, nem toda a seq¨ˆncia em que cada termo ´ menor do que seu predecessor vai a zero. Por exemplo, ue e 1 a seq¨ˆncia 1 + k , que tende a 1 e ´ decrescente. No entanto, se usarmos as hip´teses ue e o estabelecidas de in´ ıcio, isso ser´ verdade. Para isso, verifique as seguintes observa¸˜es: a co 1. Se a seq¨ˆncia for mon´tona, isto ´, ficar s´ do lado direito ou s´ do lado esquerdo, ue o e o o e se |xk − x∗ | n˜o for a zero, ent˜o a seq¨ˆncia tem que convergir para um outro a a ue ponto x que n˜o ´ x∗ . ˆ a e 2. Pelo que vimos na Se¸˜o 10.2, o ponto x teria que ser um outro ponto fixo de x∗ , ca ˆ mas n´s j´ t´ o a ınhamos isolado uma vizinhan¸a de x∗ sem nenhum outro ponto fixo. c Ent˜o esta situa¸˜o n˜o pode ocorrer. a ca a 3. J´ se a seq¨ˆncia n˜o for mon´tona, pode acontecer tamb´m de que |xk −x∗ | tenda a ue a o e para um valor maior do que zero, e xk fique alternando de lado, tendendo para dois pontos simetricamente posicionados em torno de x∗ . Mostre que nesses pontos o gr´fico de ϕ tocaria a diagonal secund´ria, contradizendo tamb´m as hip´teses. a a e o

10.6

Teorema do Valor M´dio e velocidade de convergˆncia e e

A Se¸˜o anterior pode ser resumida na seguinte afirma¸˜o: “se x∗ ´ ponto fixo e se ca ca e |ϕ (x∗ )| < 1 ent˜o x∗ ´ atrator, e se |ϕ (x∗ )| > 1 ent˜o x∗ ´ repulsor”. a e a e Vamos demonstrar essa afirma¸˜o de maneira mais simples, sem usar o desenho, ca usando o Teorema do Valor M´dio. A demonstra¸˜o tamb´m nos ajudar´ a saber qual e ca e a ´ a velocidade de convergˆncia no caso de o ponto fixo ser atrator. A unica hip´tese e e ´ o adicional ser´ que a derivada de ϕ ´ uma fun¸˜o cont´ a e ca ınua, hip´tese que se verifica na o maioria dos casos. Chamemos de γ a derivada de ϕ em x∗ . Como a derivada de ϕ ´ uma fun¸˜o e ca ∗ . Em outras palavras, cont´ ınua, ela deve assumir valores pr´ximos de γ perto de x o podemos isolar uma vizinhan¸a de x∗ , de preferˆncia sim´trica, de tal forma que para c e e qualquer x escolhido dentro dessa vizinhan¸a ter-se-´ c a |ϕ (x) − γ| muito pequeno. Suponha agora que γ ´ um n´mero de m´dulo menor do que 1 (´ o caso em que e u o e ∗ ´ um atrator). Ent˜o, podemos encontrar uma vizinhan¸a de queremos mostrar que x e a c x∗ em que |ϕ (x) − γ| seja t˜o pequena que tamb´m |ϕ (x)| seja menor do que 1, ou a e mesmo menor do que um certo λ tamb´m menor do que 1, para todo x na vizinhan¸a. e c ∗ | com |x − x∗ |. Como x ∗ = Nosso interesse ´ comparar |xk+1 − x e k k+1 = ϕ(xk ) e x ϕ(x∗ ) ent˜o queremos comparar |ϕ(xk ) − ϕ(x∗ )| com |xk − x∗ |. Ora, isso tem toda a a

136 “cara” de Teorema do Valor M´dio, pois e

´ CAP´ ITULO 10. METODOS ITERATIVOS

ϕ(xk ) − ϕ(x∗ ) = ϕ (ck )(xk − x∗ ) , para algum n´mero ck entre xk e x∗ . Se xk estiver na vizinhan¸a acima referida, ent˜o u c a ck tamb´m estar´, e teremos |ϕ (ck )| menor do que λ. Logo e a |ϕ(xk ) − ϕ(x∗ )| ≤ λ|xk − x∗ | . Ent˜o a cada itera¸˜o a distˆncia de xk a x∗ ´ multiplicada por um n´mero menor a ca a e u do que λ, o que caracteriza uma convergˆncia (ao menos) geom´trica (lembre-se de uma e e P.G. de raz˜o menor do que 1). a O importante de se escolher uma vizinhan¸a sim´trica em torno do ponto fixo ´ que c e e isso garante que o ponto xk+1 cair´ ainda dentro da mesma vizinhan¸a, e o argumento a c poder´ ser repetido ad infinitum. Logo adiante (na Subse¸˜o 10.8) falaremos um pouco a ca mais sobre este assunto. Observe tamb´m que a mesma igualdade do Teorema do Valor M´dio mostra que, ` e e a medida que os iterados se aproximam do ponto fixo, a raz˜o entre |xk+1 − x∗ | e |xk − x∗ | a se aproxima de |γ| = |ϕ (x∗ )|. Pois como ϕ (ck ) = xk+1 − x∗ , xk − x∗

e ck , estando “espremido” entre x∗ e xk , tamb´m se aproxima de x∗ , ent˜o ϕ (ck ) se e a aproxima de ϕ (x∗ ), por causa da continuidade da derivada. Exerc´ ıcio. Observe que se |ϕ (x∗ )| > 1 ent˜o o Teorema do Valor M´dio implica que a e n˜o pode haver convergˆncia para o ponto fixo. a e Exerc´ ıcio. Tome a fun¸˜o ϕ(x) = e4 − x. Iterando a partir de x0 = 0, ache seu ponto ca ∗ mais ` esquerda, mas guarde os iterados. Calcule ϕ (x∗ ) e compare com as raz˜es fixo x a o xk+1 − x∗ . xk − x∗ Exerc´ ıcio. Este exerc´ ıcio ´ para transformar a informa¸˜o sobre a velocidade de cone ca vergˆncia em informa¸˜o sobre o tempo de convergˆncia. O exerc´ e ca e ıcio fornecer´ apenas a uma resposta aproximada, baseada em suposi¸˜es que nem sempre s˜o satisfeitas. Supoco a nha que a distˆncia da condi¸˜o inicial x0 ao ponto fixo x∗ seja da ordem de D. Suponha a ca tamb´m que a condi¸˜o inicial esteja numa vizinhan¸a do ponto fixo onde a fun¸˜o ´ e ca c ca e aproximadamente linear, com inclina¸˜o dada pela derivada de ϕ no ponto fixo, o que ca significa que a taxa geom´trica de aproxima¸˜o ´ mais ou menos constante. Calcule o e ca e
x

´ ˆ 10.6. TEOREMA DO VALOR MEDIO E VELOCIDADE DE CONVERGENCIA 137 a n´mero de itera¸˜es k necess´rias para que xk esteja mais perto do que a distˆncia p de u co a ∗. x ´ Exerc´ ıcio. E poss´ existir uma fun¸˜o cont´ ıvel ca ınua ϕ que tenha apenas dois pontos fixos, ambos atratores? Justifique sua resposta.

10.6.1

O caso ϕ (x∗ ) = 0: convergˆncia quadr´tica e a

No caso em que ϕ (x∗ ) = 0 a raz˜o entre |xk+1 − x∗ | e |xk − x∗ | se aproxima de zero, a o que significa que a taxa de convergˆncia ´ melhor do que qualquer raz˜o geom´trica. e e a e Podemos ir mais al´m no Teorema do Valor M´dio, aplicando-o novamente desta feita e e na derivada de ϕ, e obter uma informa¸˜o mais precisa sobre a taxa de convergˆncia. ca e Para aplicar o Teorema do Valor M´dio na derivada de ϕ assumiremos que ϕ seja duas e vezes diferenci´vel. Depois acrescentaremos a hip´tese de que essa segunda derivada a o tamb´m seja cont´ e ınua. Retomando a desigualdade obtida no Teorema do Valor M´dio, temos e xk+1 − x∗ = ϕ (ck )(xk − x∗ ) . Mas se ϕ (x∗ ) = 0 ent˜o podemos usar o Teorema do Valor M´dio. Existe dk entre ck e a e x∗ tal que ϕ (ck ) = ϕ (ck ) − ϕ (x∗ ) = ϕ (dk )(ck − x∗ ) . Portanto |xk+1 − x∗ | = |ϕ (dk )| · |ck − x∗ | · |xk − x∗ | . Como ck est´ entre xk e x∗ , ent˜o |ck − x∗ | ≤ |xk − x∗ |; al´m disso, supondo que ϕ seja a a e cont´ ınua, os valores de ϕ (dk ) estar˜o muito pr´ximos de ϕ (x∗ ), e portanto estar˜o a o a limitados por uma constante C, em m´dulo. Ent˜o, se xk estiver nessa vizinhan¸a, o a c ter-se-´ a |xk+1 − x∗ | ≤ C|xk − x∗ |2 , que motiva a definir o regime de convergˆncia com o nome de convergˆncia quadr´tica. e e a Um ponto fixo com derivada nula ´ tamb´m chamado de super-atrator, por causa da e e rapidez com que se d´ a convergˆncia. a e Exerc´ ıcio.Chame de a0 a distˆncia de x0 ao super-atrator x∗ , e de ak a distˆncia de xk a a ∗ . Suponha que em todos os iterados vale a estimativa de convergˆncia quadr´tica, ax e a com constante C. Mostre que k 1 ak ≤ (Ca0 )2 , C ∗ da distˆncia p s˜o necess´rias e que para se aproximar xk de x a a a ln Cp 1 ln ln 2 ln Ca0

138

´ CAP´ ITULO 10. METODOS ITERATIVOS

itera¸˜es. Compare com a convergˆncia geom´trica. co e e
1 Exerc´ ıcio. Itere ϕ(x) = x + senx e ψ(x) = x + 2 senx, a partir da condi¸˜o inicial ca x0 = 1, e compare as velocidades de convergˆncia, ` luz do que foi exposto acima. e a

10.7

Calculando zeros de fun¸˜es - a escolha de ϕ co

Podemos neste momento retornar ao plano geral tra¸ado no come¸o do Cap´ c c ıtulo para achar uma raiz x∗ de uma fun¸˜o f , pois j´ temos todos os ingredientes para isso: ca a uma maneira de se construir fun¸˜es ϕ que tenham x∗ como ponto fixo, por exemplo, co escrevendo ϕ(x) = x + αf (x); e crit´rios para saber se o ponto fixo x∗ ´ atrator ou n˜o. e e a Nosso objetivo ´ explorar a escolha de α na express˜o ϕ(x) = x + αf (x) de modo e a que a raiz procurada x∗ seja um atrator e o plano geral funcione. De acordo com o que dissemos, ´ preciso que a derivada ϕ (x∗ ) tenha m´dulo menor e o do que 1. A derivada de ϕ sabemos calcular, em fun¸˜o da derivada da f : ca ϕ (x) = 1 + αf (x) , Observe que se f (x∗ ) for igual a zero ent˜o ϕ (x∗ ) ser´ igual a 1, e a´ n˜o poderemos a a ı a saber se h´ convergˆncia ou n˜o. Na verdade podemos saber sim, se desenharmos o a e a gr´fico de ϕ. a Por exemplo, tome a fun¸˜o f (x) = (x − 1)2 , ca que tem raiz x∗ = 1. Essa raiz ´ ponto fixo de e ϕ(x) = x + 0.1f (x) = 2 f(x) = x + 0.1(x−1) x + 0.1(x − 1)2 , como mostra a figura ao lado. Sabemos que se iniciarmos a itera¸˜o com ca 1 x0 perto e ` esquerda a de 1, ent˜o a seq¨ˆncia a ue convergir´ para o ponto a fixo. Ocorre no entanto que nos casos onde a derivada ´ 1, mesmo havendo convergˆncia e e ela se d´ de forma muito lenta, que n˜o chega nem a ser geom´trica. Mais adiante a a e veremos como superar este problema. Consideremos ent˜o o caso f (x∗ ) = 0. Ora, pedir que |ϕ (x∗ )| seja menor do que 1 a ´ o mesmo que pedir que e −1 < 1 + αf (x∗ ) < +1 .

10.7. CALCULANDO ZEROS DE FUNCOES - A ESCOLHA DE ϕ ¸˜ Ou seja α deve estar entre 0 e − f
2 (x∗ ) .

139

Exerc´ ıcio.Verifique o intervalo de escolhas poss´ ıveis de α para se calcular a raiz x∗ = π de f (x) = senx usando a fun¸˜o de itera¸˜o ϕ(x) = x + αsenx. Confira a resposta ca ca usando desenhos. Notemos agora que, apesar de haver todo um intervalo de poss´ ıveis escolhas de α, h´ uma escolha preferencial, que faz com que a derivada de ϕ no ponto fixo seja nula e a ´ o ele seja super-atrator. E s´ escolher α de modo que 1 + αf (x∗ ) seja igual a zero, isto ´, e α=− 1 . f (x∗ )

Essa escolha de α garantiria convergˆncia r´pida, mas o leitor atento pode perguntar: e a como escolher α em fun¸˜o de f (x∗ ) se para saber f (x∗ ) precisamos conhecer x∗ , que ca ´ justamente o que estamos procurando? e A pergunta faz todo sentido pois, apesar de estar claro em teoria que valor de α ´ e necess´rio para o m´todo funcionar, n˜o ´ claro na pr´tica como proceder, uma vez que a e a e a n˜o dispomos do valor de f (x∗ ). a H´ duas respostas para esta quest˜o, cuja eficiˆncia vai depender do tipo de problema a a e que se quer resolver. Uma das respostas ser´ o M´todo de Newton, do qual falaremos no pr´ximo Cap´ a e o ıtulo. Em vez de usarmos a fun¸˜o ca f (x) ϕ(x) = x − , f (x∗ ) a qual n˜o podemos determinar por n˜o conhecermos x∗ , usamos a a ϕ(x) = x − f (x) . f (x)

Se x estiver pr´ximo de x∗ ent˜o f (x) estar´ pr´ximo de f (x∗ ), e jogar´ um papel o a a o a semelhante. Em cada itera¸˜o, o fator que multiplica f (x), em vez de fixo e igual a ca 1 − f (x∗ ) , ´ vari´vel e igual a − f 1 . Observe que essa fun¸˜o ´ do tipo e a ca e (x) ϕ(x) = x + α(x)f (x) , introduzida previamente, com o unico problema que α(x) = − f 1 n˜o ´ cont´ ´ ınua onde (x) a e a derivada se anula. Voltaremos ao assunto adiante. A outra resposta n˜o ´ t˜o f´cil de dar, e em linhas gerais consiste no seguinte a e a a procedimento. Lembrando que nosso objetivo ´ achar α tal que −1 < 1 + αf (x∗ ) < +1, e suponha que consigamos isolar a raiz da fun¸˜o num intervalo [a, b] e mostrar que, ca dentro desse intervalo, sua derivada f (x) satisfaz −1 < 1 + αf (x) < +1 para todo x

140

´ CAP´ ITULO 10. METODOS ITERATIVOS

no intervalo. Ora, se satisfaz para todo x ∈ [a, b] em particular satisfaz para x∗ , e ent˜o a estaremos prontos para usar esse valor de α. Ent˜o tudo o que queremos ´ que a e −2 < αf (x) < 0 , x ∈ [a, b] . Em primeiro lugar, temos que escolher [a, b] de forma que sua derivada n˜o se anule: a ou ´ sempre negativa ou ´ sempre positiva. Se a derivada f (x) for negativa, mas muito e e alta em valor absoluto, basta escolher α positivo e pequeno. J´ se a derivada f (x) for a positiva e alta em valor absoluto, basta multiplicar por α negativo e pequeno. Exerc´ ıcio. Considere a equa¸˜o f (x) = e−x − cos x = 0. O objetivo do exerc´ ca ıcio ´ trabalhar com uma fun¸ao ϕ(x) = x + αf (x) para achar a menor raiz positiva de e c˜ f , admitindo o fato de que essa raiz, que chamaremos de x∗ , seja a unica localizada ´ π a a estritamente entre 0 e 2 (isso n˜o parece f´cil de se mostrar, mas se quiser tente!). 1. Mostre que f (1) < 0 e f ( π ) > 0, o que indica que a raiz procurada est´ no intervalo a 2 π [a, b] = [1, 2 ]. 2. Estime valores m e M tais que m ≤ f (x) ≤ M para todo x ∈ [1, π ] (ser´ preciso investigar em detalhe o comportamento das a 2 −x2 e cos x no intervalo considerado). derivadas de e 3. Use o item anterior para escolher α de modo que −1 < ϕ (x) < 1, para todo x ∈ [1, π ]. 2 4. Determine qual extremo est´ mais pr´ximo de x∗ : x = 1 ou x = π ? a o 2 5. Use esse extremo como condi¸˜o inicial e itere, para determinar a raiz com precis˜o ca a −4 . de 10 Exerc´ ıcio. Compare as fun¸˜es de itera¸˜o ϕ1 , ϕ2 , ϕ3 e ϕ4 dadas abaixo, no que co ca diz respeito ` efic´cia de se obter a solu¸˜o da equa¸˜o cos x = x2 (considerando-se a a ca ca condi¸˜es iniciais apropriadas). Ache a solu¸˜o, com o maior n´mero de casas decimais co ca u poss´ ıveis. ϕ1 (x) = cos x − 2x2 , ϕ2 (x) = − cos x + x2 , 1 xsenx + cos x + x2 ϕ3 (x) = x + (cos x − x2 ) , ϕ4 (x) = . 8 senx + 2x
2

10.8. A ESCOLHA DE X0

141

10.8

A escolha de x0

Observe que para saber o qu˜o pr´ximo da raiz o ponto inicial x0 pode ser escolhido, a o podemos adotar o seguinte procedimento. Em primeiro lugar, usar o M´todo da Dicotomia para cercar um intervalo pequeno e [a, b] que contenha a raiz, e depois eventualmente encolher mais ainda o intervalo para que a derivada de f n˜o se anule, como comentado na Se¸˜o anterior. Isso permitir´ a ca a escolher α e construir ϕ para fazer as itera¸˜es. co Essas considera¸˜es servir˜o tamb´m para o M´todo de Newton, do qual falaremos co a e e no pr´ximo Cap´ o ıtulo. O importante ´ conseguir o intervalo [a, b] de forma a isolar a raiz e e obter que |ϕ (x)| ≤ λ < 1 em todo o intervalo. Isso far´ com que a |xk+1 − x∗ | ≤ λ|xk − x∗ | , se xk estiver em [a, b] (conclus˜o que pode ser obtida mesmo sem conhecermos x∗ ). a Observe que o problema n˜o termina neste ponto. Uma vez escolhido x0 dentro do a intervalo [a, b], com a condi¸˜o sobre a derivada satisfeita, ent˜o teremos certeza que x1 ca a estar´ mais pr´ximo da raiz x∗ do que x0 . a o Isso n˜o garante, no entanto, que x1 esa teja dentro do intervalo [a, b], e se isso n˜o a x0 x* x acontecer, n˜o poderemos mais saber se x2 a 1 ∗ mais do que x (vide se aproximar´ de x a 1 a b figura ao lado). Uma solu¸˜o para esse obst´culo ´ tomar x0 como sendo o extremo do intervalo [a, b] ca a e que esteja mais pr´ximo da raiz x∗ . Por exemplo, suponha que b seja esse extremo, isto o ´, e |b − x∗ | < |a − x∗ | . Tomando x0 = b, teremos |x1 − x∗ | < |b − x∗ |, logo x1 ∈ [a, b]. O mesmo acontecer´ com a os termos seguintes da seq¨ˆncia, pois todos eles estar˜o a uma distˆncia da raiz menor ue a a do que a distˆncia de b a essa raiz. a S´ que esse racioc´ s´ funcionar´ na pr´tica se soubermos determinar qual extremo o ınio o a a do intervalo [a, b] est´ mais pr´ximo da raiz. O truque ´ o seguinte: olhamos para o a o e ponto m´dio do intervalo e chamamos esse ponto de x0 (pelo menos provisoriamente: o e chute inicial x0 ser´ de fato o extremo do intervalo que estamos tentando determinar). a Calculando x1 , sabemos que a distˆncia de x1 ` raiz x∗ ser´ menor do que a distˆncia a a a a de x0 a x∗ . Ent˜o basta ver se x1 cai ` direita ou ` esquerda de x0 . a a a

142

´ CAP´ ITULO 10. METODOS ITERATIVOS

Se x1 > x0 ent˜o conclu´ a ımos que x∗ > x0 (logo o extremo direito do intervalo est´ a x* x 1 mais pr´ximo da raiz), pois se x∗ estivesse o x > x0 1 a ` esquerda de x0 e x1 ` direita, ent˜o a a a b ∗ | > |x − x∗ |, absurdo, x0 = a+b ter´ ıamos |x1 − x 0 2 pois em [a, b] a distˆncia ` raiz deve dia a minuir! Note que o argumento funciona mesmo que x1 caia fora do intervalo [a, b]. x x* 1 Se x1 < x0 ent˜o conclu´ a ımos que x∗ < x0 . x < x0 1 a O argumento ´ o mesmo que no caso ane b x0 = a+b terior. 2 Se porventura x1 = x0 , ent˜o x0 ´ a raiz (prove!), e ambos os extremos est˜o a igual a e a distˆncia dela. a

10.9

Um crit´rio de parada e

Existem v´rios crit´rios de parada, isto ´, regras para se considerar um determinado a e e iterado xk como a aproxima¸˜o desejada para a raiz procurada x∗ . Os crit´rios de ca e parada s˜o importantes primeiramente por raz˜o de coerˆncia (imagine uma extensa a a e lista de ra´ ızes sendo calculadas numericamente, ´ preciso uniformizar a maneira de e encontr´-las), e em segundo lugar para automatizar os procedimentos. a Alguns crit´rios de parada, como aquele que vamos ver aqui, fornecem tamb´m a e e margem de erro da aproxima¸˜o. ca O crit´rio do qual falaremos aqui funciona quando, no entorno da raiz, a fun¸˜o ´ e ca e mon´tona, isto ´, se x1 < x∗ < x2 ent˜o os valores de f (x1 ) e f (x2 ) tˆm sinais opostos, o e a e ou seja, f (x1 )f (x2 ) < 0 . Suponha que queiramos determinar uma aproxima¸˜o de x∗ com precis˜o p. Isto ca a significa que gostar´ ıamos de encontrar um valor x tal que a verdadeira raiz x∗ esteja no ¯ intervalo [¯ − p, x + p] (a interpreta¸˜o do que significa exatamente a precis˜o p varia x ¯ ca a de acordo com o gosto do freguˆs, esta ´ a que adotaremos neste livro). e e Como estamos supondo que f ´ mon´tona, isso s´ acontecer´ se f assumir sinais e o o a opostos em x − p e x + p. ¯ ¯ Bom, ent˜o nada mais temos a fazer do que iterar a fun¸˜o auxiliar ϕ, obtendo a ca valores x0 , x1 , . . . , xk , . . ., e para cada iterado xk calcular f (xk − p)f (xk + p) . Se esse produto for negativo, ent˜o podemos considerar xk como sendo a aproxima¸˜o a ca desejada.

´ 10.9. UM CRITERIO DE PARADA

143

´ E claro que devemos prestar um pouco de aten¸˜o para o n´mero de casas decimais ca u que usamos nas contas, e se fixarmos xk talvez queiramos arredondar para uma casa decimal compat´ ıvel com a precis˜o desejada. Isso pode ser feito com bom senso, mas a se tivermos que automatizar para um programa de computador conv´m tomar certos e cuidados. Para exemplificar, seja f (x) = e−x −x+1 = 0, que tem unica raiz (veja isto esbo¸ando ´ c o gr´fico!). Usaremos ϕ(x) = e−x + 1 como fun¸˜o auxiliar, para achar a raiz x∗ com a ca precis˜o p = 10−2 . a Partindo de x0 = 0, obtemos os iterados. Temos que usar no m´ ınimo um n´mero de u casas decimais compat´ com a precis˜o desejada, por exemplo 4 parece ser razo´vel. ıvel a a Neste caso, faremos as contas com todas os algarismos significativos da calculadora, e cada etapa arredondaremos para a quarta casa decimal, a fim de minimizar os erros. Ent˜o x1 = 2, x2 = 1.1353, x3 = 1.3213, x4 = 1.2668, x5 = 1.2817, x6 = 1.2776, a x7 = 1.2787. Como f (1.27) > 0 e f (1.29) < 0 ent˜o podemos considerar a aproxima¸˜o a ca x = 1.28. Observe que pelo crit´rio de parada j´ poder´ ¯ e a ıamos parar em x5 , no entanto ao arredondarmos para 1.28 conv´m fazer o teste novamente. Os iterados x6 e x7 foram e a rigor desnecess´rios. a

144

´ CAP´ ITULO 10. METODOS ITERATIVOS

Cap´ ıtulo 11

O M´todo de Newton e
Como j´ mencionado no Cap´ a ıtulo anterior, o M´todo de Newton consiste em fazer a e itera¸˜o ca f (xk ) xk+1 = xk − , f (xk ) a partir de uma condi¸˜o inicial bem escolhida x0 , e assim obter aproxima¸˜es sucessivas ca co ∗ de f . de alguma raiz x

A maneira de achar x1 em fun¸˜o de x0 , ca e igualmente depois de achar xk+1 em fun¸˜o de xk , tem uma forte inspira¸˜o ca ca geom´trica: olhamos para a reta tangente e ao gr´fico de f no ponto (xk , f (xk )) e dea finimos xk+1 como sendo o ponto de encontro dessa reta com a abscissa.

f(x0 ) f x* x 1 x0

Vejamos como a f´rmula acima se relaciona com esta id´ia geom´trica. Para isso, o e e notamos que a inclina¸˜o da reta tangente ao gr´fico de f no ponto (xk , f (xk )) ´ dada ca a e pela derivada f (xk ). A unica reta com inclina¸˜o f (xk ) que passa por (xk , f (xk )) ´ ´ ca e dada por y = f (xk ) + f (xk )(x − xk ) . O ponto xk+1 ´ definido como o valor de x para o qual y = 0, isto ´ e e 0 = f (xk ) + f (xk )(xk+1 − xk ) , 145

146 ou

´ CAP´ ITULO 11. O METODO DE NEWTON

f (xk ) , f (xk ) desde que f (xk ) = 0 (hip´tese que assumiremos gratuitamente, para facilitar os arguo mentos). A t´ ıtulo de exemplo apliquemos o m´todo no exemplo f (x) = x3 − 20, para compae rarmos com o M´todo da Dicotomia. e Para f (x) = x3 − 20 temos f (x) = 3x2 , ent˜o a f´rmula de itera¸˜o fica a o ca xk+1 = xk − xk+1 = xk − que neste caso pode ser simplificada para xk+1 = 2x3 + 20 k . 3x2 k x3 − 20 k , 3x2 k

Em primeiro lugar “chutamos” o valor de x0 , por exemplo x0 = 3, e obtemos x1 : x1 = 2 · 33 + 20 74 = = 2.7407407 . 3 · 32 27

´ E claro que a ultima igualdade n˜o ´ de fato uma igualdade, pois um arredondamento ´ a e foi efetuado. Neste exemplo, usaremos 7 casas decimais depois da v´ ırgula. A partir de x1 calculamos x2 , e assim por diante. Os resultados se encontram na tabela abaixo. n xn x3 n 0 3 27 1 2.7407407 20.6 2 2.7146696 20.0056 3 2.7144176 19.9999996 4 2.7144176 19.9999996 Surpreendente! Em poucos iterados chega-se a um valor com precis˜o de muitas casas a decimais! Podemos testar a precis˜o desse valor usando o mesmo princ´ a ıpio do M´todo da e Dicotomia. Por exemplo, queremos saber se essa resposta tem precis˜o de 0.0000001. a Ent˜o verificamos se os n´meros f (2.7144175) e f (2.7144177) tˆm sinais opostos. Ora, a u e f (2.7144175) = 2.71441753 − 20 = −0.0000026 < 0 e f (2.7144177) = 2.71441773 − 20 = 0.0000018 > 0 , donde conclu´ ımos que √ 3 20 = 2.7144176 ± 0.0000001 .

´ 11.1. QUANDO O METODO DE NEWTON FUNCIONA?

147

11.1

Quando o M´todo de Newton funciona? e

Ser´ que o M´todo de Newton sempre funciona? Ser´ que qualquer chute inicial levar´ a e a a ∗ procurada? a uma seq¨ˆncia x1 , x2 , x3 , x4 , . . . , xk , . . . convergindo ` raiz x ue a Se formulada a pergunta desse jeito, a resposta ´ n˜o! Vejamos dois argumentos e a bastante simplistas para justificar o porquˆ. e O primeiro: imagine uma fun¸˜o com duas ra´ ca ızes, f (x) = x2 − 4, por exemplo. Para qualquer escolha de x0 , a seq¨ˆncia x1 , x2 , x3 , x4 , . . . , xn , . . . s´ poder´ convergir para ue o a uma das ra´ ızes! A outra fatalmente ser´ esquecida, e isso pode acontecer quando menos a esperarmos!

O segundo: mesmo que s´ haja o ∗ e que x esteja “razouma raiz x 0 avelmente perto” dela, a seq¨ˆncia ue x1 , x2 , x3 , x4 , . . . , xn , . . . pode se afastar! Veja um exemplo na figura ao lado.

f x* x0 x 1

No entanto, quase sempre podemos garantir que “se x0 for escolhida suficientemente pr´xima de x∗ ent˜o a seq¨ˆncia x1 , x2 , x3 , x4 , . . . , xn , . . . convergir´ para x∗ ”. O “quase o a ue a sempre” se refere `s hip´teses que devemos exigir que a fun¸˜o f satisfa¸a. Por exemplo, a o ca c pediremos sempre que f seja uma fun¸˜o diferenci´vel, com derivada cont´ ca a ınua. Mais ainda, devemos examinar como f se comporta perto da raiz (infelizmente, nem sempre isso ´ poss´ sem se conhecer a raiz!!). e ıvel Na hip´tese de que f (x∗ ) = 0 e que a condi¸˜o inicial x0 seja escolhida suficieno ca temente perto da raiz ent˜o a convergˆncia ser´ bastante r´pida, mais r´pida do que a e a a a qualquer seq¨ˆncia geom´trica. De fato, a convergˆncia ´ (no m´ ue e e e ınimo) quadr´tica, se a usarmos os resultados deduzidos no Cap´ ıtulo anterior: basta mostrar que a derivada da f fun¸˜o de itera¸˜o ϕ(x) = x − f (x) , calculada na raiz x∗ , vale zero. ca ca (x) Ora, usando as regras usuais de deriva¸˜o, obtemos ca ϕ (x) = f (x)f (x) , f (x)2

e como f (x∗ ) = 0, segue que ϕ (x∗ ) = 0. No caso f (x∗ ) = 0 n˜o podemos aplicar o racioc´ a ınio diretamente, porque teremos uma divis˜o “zero sobre zero”. Esse caso ser´ analisado na pr´xima Subse¸˜o. Antes a a o ca disso, vale a pena fazer alguns exerc´ ıcios. Exerc´ ıcio. Use o M´todo de Newton para resolver as seguintes equa¸˜es: e co

148 1. −2 + 3x = e−x 2. x5 + 3x2 − x + 1 = 0 3. cos x + 0.5x = 0

´ CAP´ ITULO 11. O METODO DE NEWTON

4. 0.3x4 + 0.2x3 + x2 + 0.1x + 0.5 = 0 5. 0.3x4 − x3 − x2 − 2x + 2 = 0 Aten¸˜o: alta probabilidade de pegadinhas. ca

2

ψ

2

1

1

1

2

1

2

f
Exerc´ ıcio. Considere a fun¸˜o ψ cujo gr´fico est´ mostrado na figura acima, ` esca a a a querda. 1. (1.0) Descreva, justificando (pode usar desenhos nas justificativas!), o que acontece com a seq¨ˆncia x0 , x1 = ψ(x0 ), . . . , xk = ψ k (x0 ), . . . para cada uma das cinco ue possibilidades: (i) x0 = 0.0; (ii) x0 = 1.0; (iii) x0 = 1.5; (iv) x0 = 2.2; (v) x0 = 2.7. 2. (1.5) A fun¸˜o ψ pode ser a fun¸˜o de itera¸˜o de M´todo de Newton aplicado ` ca ca ca e a fun¸˜o f acima, ` direita? Dˆ duas justificativas essencialmente diferentes para ca a e sua resposta. Exerc´ ıcio. Esboce uma fun¸˜o que tenha ra´ ca ızes a e b (com a < b), mas para o qual exista uma condi¸˜o inicial x0 entre a e b tal que o M´todo de Newton produza um ca e resultado divergente (apesar de o M´todo estar bem definido para x0 e todos os seus e iterados posteriores). Justifique sua resposta da melhor forma que puder. Exerc´ ıcio. Encontre numericamente o valor de x tal que e−x = x, com precis˜o a −7 . p = 10
2

´ 11.1. QUANDO O METODO DE NEWTON FUNCIONA? Exerc´ ıcio. Considere a caten´ria dada por a g(x) = 1 (cosh(cx) − 1) . c

149

Repare que g(0) = 0, isto ´, a curva passa por (x, y) = (0, 0). Se a curva tamb´m passa e e por (x, y) = (1, 1), qual ´ o valor de c? e Exerc´ ıcio. Considere f (x) = x5 , que tem unica raiz x∗ = 0. Se o M´todo de Newton ´ e for aplicado a partir da condi¸˜o inicial x0 = 1, qual ser´ o menor valor de k para o ca a qual xk < 10−20 ? Exerc´ ıcio. Considere a fun¸˜o f da figura abaixo. Se usarmos o M´todo de Newton ca e para essa fun¸˜o, teremos que considerar iterados de ca ϕ(x) = x − f (x) . f (x)

Esboce o gr´fico de ϕ, com base na intui¸˜o geom´trica sobre o M´todo de Newton. N˜o a ca e e a esque¸a de desenhar: abscissa, ordenada, diagonal e os pontos a, b e c. c

f

a

b

c

11.1.1

Retirando a hip´tese f (x∗ ) = 0 o

A hip´tese de que a derivada de f seja diferente de zero na raiz x∗ n˜o ´ necess´ria para o a e a se mostrar convergˆncia, e pode ser substitu´ por uma hip´tese bem mais fraca, desde e ıda o que o chute inicial x0 esteja suficientemente pr´ximo de x∗ . o Antes de deduzir resultados gerais, vejamos o que acontece com alguns exemplos. Consideremos f (x) = ax2 , que tem raiz em x = 0, mas a derivada de f na raiz ´ e nula. Montando a fun¸˜o de itera¸˜o do M´todo de Newton obtemos ca ca e ϕ(x) = x − f (x) ax2 =x− , f (x) 2ax

150

´ CAP´ ITULO 11. O METODO DE NEWTON

que a princ´ ıpio n˜o estaria definida em x = 0. No entanto, as itera¸˜es s˜o tomadas a co a fora do zero, onde ϕ est´ bem definida. Al´m disso, a express˜o pode ser simplificada a e a de modo a esconder o problema: x ϕ(x) = . 2 Agora a derivada de ϕ no zero de f ´ igual a 1 , que significa que a seq¨ˆncia de iterados e ue 2 ir´ convergir para a raiz zero ` raz˜o geom´trica de 1 . a a a e 2 Se considerarmos f (x) = axn , ent˜o teremos a ϕ(x) = (1 − 1 )x , n

1 e portanto 1 − n ser´ a raz˜o da convergˆncia geom´trica. a a e e Aparentemente, essas considera¸˜es levam a crer que quando f (x∗ ) = 0 o M´todo co e de Newton ainda funciona, mas a velocidade de convergˆncia passa a ser mais lenta (de e quadr´tica passa a ser apenas geom´trica). At´ que ponto isso pode ser generalizado? a e e A melhor maneira de compreender o que se passa ´ por meio de polinˆmios de Taylor e o (vide o Apˆndice B para uma revis˜o sobre o assunto). Para facilitar os argumentos, e a suporemos que a fun¸˜o f pode ser diferenciada infinitamente. A expans˜o de f em ca a torno de x∗ ´ assim escrita: e

f (x) = f (x∗ ) + f (x∗ )(x − x∗ ) +

f (x∗ ) f (n) (x∗ ) (x − x∗ )2 + . . . + (x − x∗ )n + o((x − x∗ )n ) , 2 n!

onde o((x − x∗ )n ) indica a presen¸a de termos de ordem mais alta do que (x − x∗ )n , ou c em outras palavras, denota a presen¸a de um resto que vai a zero mais rapidamente do c ∗ )n quando x tende a x∗ . que (x − x Como x∗ ´ a raiz de f , e estamos supondo que f tem derivada nula em x∗ , os dois e primeiros termos ser˜o nulos, necessariamente. J´ a derivada segunda pode ou n˜o ser a a a nula. Para a maioria das situa¸˜es, haver´ um primeiro termo n˜o nulo, de ordem m, co a a que pode ser 2 ou mais. Assim, podemos escrever f como f (x) = ou ainda, f (x) = f (m) (x∗ ) m! o((x − x∗ )m ) (x − x∗ )m 1 + (m) ∗ m! f (x ) (x − x∗ )m . f (m) (x∗ ) (x − x∗ )m + o((x − x∗ )m ) , m!

Como o((x − x∗ )m ) tem ordem mais alta do que (x − x∗ )m , o quociente dos dois vai a zero, e assim podemos escrever f (x) = f (m) (x∗ ) (x − x∗ )m (1 + r1 (x)) , m!

´ ˜ 11.2. METODO DE NEWTON EM DIMENSOES MAIS ALTAS

151

onde r1 (x) vai a zero quando x tende a x∗ . Da mesma forma, a fun¸˜o f (x) pode ser expressa na sua f´rmula de Taylor. Desta ca o vez, o primeiro termo n˜o nulo ser´ de ordem m − 1, e teremos a a f (x) = m f (m) (x∗ ) (x − x∗ )m−1 (1 + r2 (x)) , m!

onde r2 (x) vai a zero quando x tende a x∗ . Posto tudo isso, podemos montar a fun¸˜o de itera¸˜o ϕ, usando essas express˜es no ca ca o lugar de f (x) e f (x): 1 1 + r1 (x) ϕ(x) = x − (x − x∗ ) . m 1 + r2 (x) Subtraindo x∗ dos dois lados, e colocando (x − x∗ ) em evidˆncia no lado direito da e equa¸˜o, obtemos ca 1 1 + r1 (x) ϕ(x) − x∗ = (x − x∗ ) 1 − . m 1 + r2 (x) S´ que o quociente envolvendo r1 e r2 tende a 1, ent˜o o a ϕ(x) − x∗ x − x∗
1 tende a 1 − m . Esta ´ a raz˜o assint´tica de convergˆncia geom´trica do M´todo de e a o e e e Newton, que s´ depende da ordem m da fun¸˜o f em x∗ . o ca

11.2

M´todo de Newton em dimens˜es mais altas e o

Suponha que F : Rn → Rn seja uma fun¸˜o diferenci´vel e estejamos procurando um ca a ponto x∗ tal que F (x∗ ) = 0. Esse ´ o an´logo multidimensional do problema que vimos e a discutindo at´ agora. Se ao leitor o problema parece muito abstrato, observe que F e leva (x1 , . . . , xn ) num elemento de Rn , que pode ser explicitado por cada uma de suas componentes, isto ´, e F (x1 , x2 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fn (x1 , . . . , xn )) . Ent˜o achar um zero de F ´ achar uma solu¸˜o para o sistema de equa¸˜es a e ca co f1 (x1 , . . . , xn ) = 0 f2 (x1 , . . . , xn ) = 0 . . . fn (x1 , . . . , xn ) = 0

152

´ CAP´ ITULO 11. O METODO DE NEWTON

que n˜o ´ necessariamente linear. a e Para generalizar, devemos examinar com cuidado a motiva¸˜o do m´todo em dica e mens˜o 1. Para definir x(k+1) em fun¸˜o de x(k) , passamos uma reta por x(k) com a a ca mesma inclina¸˜o que a derivada de f em x(k) (usaremos essa forma de indexar para ca n˜o confundir com o ´ a ındice que indica as coordenadas de x, quando x ∈ Rn ). Isto ´ o e mesmo que aproximar f pela sua expans˜o em Taylor de ordem 1: a f (x) = f (x(k) ) + f (x(k) )(x − x(k) ) + R1 (x) , mas ignorando R1 . O ponto x(k) era definido pelo encontro dessa reta com o zero, ou seja 0 = f (x(k) ) + f (x(k) )(x(k+1) − x(k) ) , e a f´rmula do M´todo de Newton foi obtida isolando-se x(k+1) nessa equa¸˜o. o e ca A expans˜o em Taylor ´ igualmente v´lida em dimens˜o mais alta. Para primeira a e a a ordem, por exemplo, podemos escrever F (x) = F (x(k) ) + DF (x(k) )(x − x(k) ) + R1 (x) , onde x ∈ Rn , R1 ´ uma fun¸˜o de Rn em Rn (assim como F ) e DF (x) ´ a matriz e ca e jacobiana no ponto x, isto ´ e  ∂f  ∂f1 ∂f1 1 . . . ∂xn 1 2  ∂x2 ∂x2 ∂f ∂f ∂f2   ∂x1 ∂x2 . . . ∂xn   . DF (x) =  . . .  , . . . .  . . .   .
∂fn ∂x1 ∂fn ∂x2

...

∂fn ∂xn

sendo que por economia de espa¸o fica impl´ c ıcito que cada uma das derivadas parciais ´ e calculada no ponto x. Portanto, o termo DF (x(k) )(x − x(k) ) ´ a multiplica¸˜o de uma e ca matriz por um vetor (coluna), que resulta em outro vetor. O resto R1 tem a propriedade de que lim
x→x(k)

R1 (x) =0, x − x(k)

tomando-se o cuidado de tomar a norma no denominador, porque afinal n˜o faz sentido a dividir por vetores. Para definir x(k+1) , ignoramos R1 e igualamos a aproxima¸˜o de primeira ordem a ca zero: 0 = F (x(k) ) + DF (x(k) )(x(k+1) − x(k) ) , ou seja, DF (x(k) )x(k+1) = DF (x(k) )x(k) − F (x(k) ) .

´ ˜ 11.2. METODO DE NEWTON EM DIMENSOES MAIS ALTAS

153

Observe que essa equa¸˜o ´ um sistema linear, onde x(k+1) ´ a inc´gnita, a matriz de ca e e o (k) ) e o vetor de termos independentes ´ dado coeficientes ´ a matriz jacobiana DF (x e e por DF (x(k) )x(k) − F (x(k) ). Assim como a solu¸˜o de um sistema linear ´ um encontro de hiperplanos em Rn , a ca e solu¸˜o de um sistema n˜o-linear ´ um encontro de hipersuperf´ ca a e ıcies em Rn . Para n = 2, os hiperplanos s˜o retas e as hipersuperf´ a ıcies s˜o curvas. Sugere-se fazer o seguinte a exerc´ para fixar id´ias. ıcio e Exerc´ ıcio. Achar numericamente a intersec¸˜o das curvas dadas por x2 +y 2 −1 = 0 (um ca 1 4 2 −1 = 0. Bom, pelo menos organize uma estrat´gia baseada c´ ırculo!) e 2 x +3(1−cos y) e no M´todo de Newton. Quanto ao chute inicial, isso ´ um problema, principalmente e e porque pode haver mais do que uma intersec¸˜o entre as curvas. ca

11.2.1

Determina¸˜o da forma de uma corda ca

Uma aplica¸˜o interessante do M´todo de Newton em dimens˜o 3 ocorre na determina¸˜o ca e a ca do formato de uma corda a partir das coordenadas de dois pontos (podem ser os pontos de sustenta¸˜o, por exemplo) e do comprimento da corda entre os dois pontos. A ca implementa¸˜o desta id´ia deve ser feita com o aux´ do computador, pela quantidade ca e ılio de c´lculos a serem feitos, mas mesmo assim deve-se prestar bastante aten¸˜o para o a ca chute da condi¸˜o inicial, que pode freq¨entemente levar o m´todo a divergir. ca u e Como vimos na Subse¸˜o 5.3.2, uma corda ou corrente pendurada assume o formato ca do gr´fico da fun¸˜o a ca 1 cosh(cx) , c conhecida como caten´ria. a No entanto, assume-se a´ que a origem das coordenadas esteja uma unidade abaixo ı do ponto mais baixo da corda. De modo geral, se quisermos deslocar a corda na vertical, precisamos acrescentar um parˆmetro h, que ser´ somado ` express˜o acima, e se a a a a quisermos deslocar a corda horizontalmente em a unidades ent˜o devemos trocar x por a x − a, de modo que 1 f (x) = cosh(c(x − a)) + h c ´ a maneira mais geral de se representar o formato da corda. e Se nosso modelo pretende ser consistente, deveria prever exatamente a forma da corda, desde que informemos dois pontos de sustenta¸˜o e o comprimento total da corda ca entre os dois pontos. Ou seja, com essas trˆs informa¸˜es deveria ser poss´ determinar e co ıvel c, a e h, e portanto f . Sejam (x0 , y0 ) e (x1 , y1 ) os pontos de sustenta¸˜o. Ent˜o ca a y0 = 1 cosh(c(x0 − a)) + h c

154 e

´ CAP´ ITULO 11. O METODO DE NEWTON

1 cosh(c(x1 − a)) + h . c O comprimento da corda entre os pontos de sustenta¸˜o ser´ chamado de l. Portanto ca a y1 =
x1

l=
x0

1 + f (x)2 dx

(ver Se¸˜o 14.3 adiante, para uma justificativa desta f´rmula). Como ca o f (x) = sinh(c(x − a)) , e 1 + sinh2 t = cosh2 t , logo l=
x0 x1

cosh(c(x − a))dx =

1 {sinh(c(x1 − a)) − sinh(c(x0 − a))} . c e trˆs inc´gnitas: e o 0 0 0

Com isso, obtivemos um sistema n˜o-linear de trˆs equa¸˜es a e co  c(y0 − h) − cosh(c(x0 − a)) =  c(y1 − h) − cosh(c(x1 − a)) =  lc + sinh(c(x0 − a)) − sinh(c(x1 − a)) =

O sistema pode ser resolvido numericamente pelo M´todo de Newton. e

Parte IV

Interpola¸˜o Polinomial ca

155

Cap´ ıtulo 12

Estimativa do erro nas interpola¸˜es co
Voltemos ` quest˜o (abordada nas Se¸˜es 1.5 e 2.7) da interpola¸˜o de um polinˆmio de a a co ca o grau k a k + 1 pontos dados (t0 , z0 ), (t1 , z1 ), . . ., (tk , zk ), que ser´ importante na Parte a seguinte do livro, onde falaremos de integra¸˜o de fun¸˜es. ca co Nesta Parte do livro, usaremos t como vari´vel (no lugar de x), valores z (no lugar de a y) e pontos indexados de 0 a k (no lugar de n). Tudo isso justamente para n˜o fazermos a confus˜o na Parte V, quando usaremos alguns conceitos aqui expostos. a Imagine que utilizemos a interpola¸˜o polinomial como uma maneira de “aproximar” ca uma fun¸˜o. Mais precisamente, seja f : [tL , tR ] → R uma fun¸˜o (cuja regularidade s´ ca ca o especificaremos adiante) e uma parti¸˜o de seu dom´ ca ınio tL = t0 < t1 < t2 < . . . < tk−1 < tk = tR , n˜o necessariamente a intervalos regulares. Assumiremos sempre que tL < tR e que a k ≥ 1. Aos k + 1 pontos (t0 , f (t0 )), (t1 , f (t1 )), . . ., (tk , f (tk )) podemos interpolar um polinˆmio p(t) de grau k, que ´ unico. A pergunta ´: quanto se perde ao se trocar f (t) o e ´ e pelo polinˆmio interpolador p(t)? Ou seja, qu˜o grande ´ a diferen¸a f (t) − p(t), para o a e c cada ponto t do intervalo [tL , tR ]? Vejamos primeiro como deve ser a fun¸˜o diferen¸a F (t) ≡ f (t) − p(t). Para k = 1 a ca c parti¸˜o tem que ser tL = t0 < t1 = tR , e o polinˆmio interpolador ´ a fun¸˜o afim cujo ca o e ca gr´fico passa por (t0 , f (t0 )) e (t1 , f (t1 )). Como p(t0 ) = f (t0 ) e p(t1 ) = f (t1 ), ent˜o F a a se anula em t0 e t1 . Veja na figura abaixo, esquematicamente, como devem ser f e p (` a esquerda) e F (` direita). a 157

158

CAP´ ITULO 12. ESTIMATIVA DO ERRO NAS INTERPOLACOES ¸˜

p
t0

t0

t1

f

t1

F

Pelas mesmas raz˜es, para valores quaisquer de k, a fun¸˜o F se anula em todos os o ca pontos t0 , t1 , . . ., tk da parti¸˜o. Ela pode at´ se anular em outros pontos, mas n˜o ´ ca e a e necess´rio que isto ocorra. Veja na figura abaixo uma situa¸˜o com k = 2, onde p tem a ca que ser um polinˆmio quadr´tico. o a
§

p
¥ ¤¥ ¤ ¡  ¡       £ ¢£ ¢ © ¨© ¨

t0

t1

t2

Se p e f n˜o diferem nos pontos da parti¸˜o, quanto ser´ a diferen¸a para os demais a ca a c valores de t? Para responder, tentaremos definir uma fun¸˜o (n˜o-negativa) S(t) tal que ca a −S(t) ≤ F (t) ≤ S(t) (ou |F (t)| ≤ S(t)) para todo t ∈ [tL , tR ], sabendo de antem˜o que S(t) pode se anular a em t0 , t1 , . . . , tk .

¦

f 
 

¦§

F
t0 t1 t2

159 A forma de S e −S, em linha pontilhada, seria algo assim (para k = 4):

S
¥ ¤¥ ¤ © ¨©

F − S
¨ § ¦§ ¦

t0

t1

t2

t3

´ E claro que S deveria ser do tipo mais simples poss´ ıvel. Uma tentativa ´ olhar para e um polinˆmio n˜o-nulo q(t) de grau k + 1 que se anule nos pontos t0 , . . . , tk e tomar o a S(t) = c|q(t)|, onde c ´ uma constante positiva. O polinˆmio e o q(t) = (t − t0 )(t − t1 ) . . . (t − tk ) , por exemplo, satisfaz a condi¸˜o pedida. ca O que faremos agora ´ mostrar que uma tal estimativa ´ poss´ e e ıvel, e al´m do mais e apresentar um valor de c, que possa ser calculado a partir de algum conhecimento sobre a fun¸˜o f . ca De fato, mostraremos um resultado mais forte, que implicar´ automaticamente o a que queremos. Provaremos que, para cada t ∈ [tL , tR ] existe um outro ponto s = st (st indica a dependˆncia de s em rela¸˜o a t) tal que e ca F (t) = F (k+1) (s) q(t) , (k + 1)!

onde F (k+1) (s) indica a derivada (k + 1)-´sima de F em s. e Como conseq¨ˆncia dessa afirma¸˜o, teremos que ue ca |F (t)| ≤ F (k+1) (s) s∈[tL ,tR ] (k + 1)! max |q(t)| .

Al´m disso, n˜o devemos esquecer que F (t) = f (t) − p(t), onde p(t) ´ polinˆmio de grau e a e o k. Como a derivada (k + 1)-´sima de um polinˆmio de grau k ´ zero, ent˜o e o e a F (k+1) = f (k+1) ,

¤

¤

£ ¢£ ¢  ¡  

¡

t4

160 logo

CAP´ ITULO 12. ESTIMATIVA DO ERRO NAS INTERPOLACOES ¸˜

|F (t)| ≤ e podemos tomar

f (k+1) (s) s∈[tL ,tR ] (k + 1)! max f (k+1) (s) . s∈[tL ,tR ] (k + 1)!

|q(t)| ,

c = max

´ E claro que esta resposta s´ ´ poss´ o e ıvel se f for uma fun¸˜o pelo menos (k + 1) vezes ca ´ diferenci´vel. E o que ocorre com a maioria das fun¸˜es com que nos deparamos na a co pr´tica, mas pode haver exce¸˜es. a co Finalmente s´ nos falta provar a afirma¸˜o, que diz que para cada t em [tL , tR ] existe o ca um s neste mesmo intervalo tal que (k + 1)!F (t) = F (k+1) (s)q(t) . A afirma¸˜o ´ trivialmente v´lida se t for um dos pontos t0 , t1 , . . . , tk , pois F e q se ca e a anulam nesses pontos, e os dois lados da equa¸˜o ficam iguais a zero. Resta-nos assim ca provar a afirma¸˜o quando t n˜o ´ nenhum desses pontos. ca a e Em primeiro lugar, fazemos a constata¸˜o esperta de que (k + 1)! ´ a (k + 1)-´sima ca e e k+1 ´ igual a 1. derivada de q, pois o polinˆmio q tem grau (k + 1) e o coeficiente de t o e Ent˜o nos bastar´ demonstrar que existe s = st tal que a a q (k+1) (s)F (t) − F (k+1) (s)q(t) = 0 . Para isso definimos a fun¸˜o ca G(s) = q(s)F (t) − F (s)q(t) , lembrando que t est´ fixo, neste racioc´ a ınio. Desta maneira, queremos apenas mostrar (k+1) se anula. que existe s onde G Acontece que G ´ uma fun¸˜o que se anula em todos os pontos t0 , t1 , . . . , tk , pois e ca tanto q como F se anulam nesses pontos, mas G tamb´m se anula em s = t, pois e G(t) = q(t)F (t) − F (t)q(t) = 0 . Como estamos interessados no caso em que t n˜o ´ nenhum dos pontos t0 , t1 , . . . , tk , a e ent˜o G se anula em pelo menos k + 2 pontos distintos. Pelo Teorema do Valor M´dio, a e entre cada par consecutivo de pontos onde G se anula h´ um ponto onde a derivada de a G se anula. Portanto G se anula, obrigatoriamente, em pelo menos k + 1 pontos. Pelo mesmo racioc´ ınio, G se anula em pelo menos k pontos. Continuando indutivamente, (k) se anula em 2 pontos e, finalmente, que G(k+1) se anula em 1 ponto, temos que G como quer´ ıamos demonstrar.

161 Tendo em vista que os resultados deste Cap´ ıtulo ser˜o usados no Cap´ a ıtulo 17, resumimos a estimativa obtida (com a nota¸˜o j´ exposta): ca a |f (t) − p(t)| ≤ c|q(t)| , onde f (k+1) (s) s∈[tL ,tR ] (k + 1)!

c = max e

q(t) = (t − t0 )(t − t1 ) . . . (t − tk ) .

162

CAP´ ITULO 12. ESTIMATIVA DO ERRO NAS INTERPOLACOES ¸˜

Cap´ ıtulo 13

T´cnicas de interpola¸˜o e ca
Neste Cap´ ıtulo apresentaremos duas t´cnicas de interpola¸˜o que servem como alternae ca tivas ao m´todo j´ descrito na Se¸˜o 1.5 de redu¸˜o a um sistema linear. e a ca ca

13.1

Polinˆmios de Lagrange o
(t − t1 )(t − t2 ) · · · (t − tk ) ,

Considere o polinˆmio o que tem grau k e se anula em t1 , . . . , tk . Al´m disso, em t0 ele vale (t0 −t1 )(t0 −t2 ) · · · (t0 − e tk ), e portanto o polinˆmio o L0 (t) = (t − t1 )(t − t2 ) · · · (t − tk ) (t0 − t1 )(t0 − t2 ) · · · (t0 − tk )

vale 1 em t0 e zero nos demais pontos t1 , . . . , tk . Analogamente, podemos definir, para cada ti , um polinˆmio Li (t) de grau k que vale 1 em ti e zero nos demais pontos. o Agora observe que a soma de polinˆmios de grau k ´ um polinˆmio de grau k, logo o e o c0 L0 (t) + c1 L1 (t) + . . . + ck Lk (t) ´ um polinˆmio de grau k, que vale c0 em t0 , c1 em t1 , ..., ck em tk . Portanto, se e o quisermos achar um polinˆmio de grau k que valha z0 , . . . , zk nos pontos t0 , . . . , tk basta o tomar os ci ’s iguais aos zi ’s: p(t) = z0 L0 (t) + z1 L1 (t) + . . . + zk Lk (t) . Essa ´ uma maneira de achar o polinˆmio interpolador sem resolver nenhum sistema e o linear! Os polinˆmios Li s˜o conhecidos como polinˆmios de Lagrange. o a o 163

164

´ CAP´ ITULO 13. TECNICAS DE INTERPOLACAO ¸˜

13.2

Forma de Newton

J´ vimos duas maneiras de fazer uma interpola¸˜o polinomial: atrav´s de um sistema a ca e linear, onde as inc´gnitas s˜o os coeficientes do polinˆmio que se quer determinar, e o a o cada ponto da interpola¸˜o gera uma equa¸˜o; e atrav´s de uma combina¸˜o linear dos ca ca e ca polinˆmios de Lagrange. o Nesta Se¸˜o veremos outra forma de interpolar, chamada forma de Newton. Ela leva ca certa vantagem em um aspecto: ´ mais f´cil acrescentar um ponto ` interpola¸˜o, sem e a a ca ter que desmanchar (ou revisar) as contas feitas anteriormente. Para obter esse novo m´todo, teremos que investigar um pouco mais alguns aspectos e subjacentes ` interpola¸˜o. a ca Seja (t0 , z0 ), (t1 , z1 ), . . . , (tk , zk ) o conjunto de pontos que se deseja interpolar. A unica exigˆncia, como de h´bito, ´ que os ti ’s sejam dois a dois distintos, mas n˜o h´ ´ e a e a a necessidade que sua enumera¸˜o respeite a ordem em que eles se disp˜em sobre a reta, ca o e os zi ’s podem ser experimentais ou provenientes de uma fun¸˜o (zi = f (ti )), tanto faz. ca Olharemos para as interpola¸˜es parciais, que envolvem apenas certos subconjuntos co dos pontos acima. Mais precisamente, sejam i e j tais que 0 ≤ i ≤ j ≤ k e seja pi (t) o j polinˆmio interpolador dos pontos (ti , zi ), . . . , (tj , zj ). Assim, o polinˆmio interpolador o o e o procurado ´ p(t) = p0 (t), enquanto que pi (t) ´ o polinˆmio interpolador de um ponto e i k i (t) ≡ z , isto ´, tem grau zero e ´ identicamente igual a z ). Lembremos s´ (portanto pi o e e i i que o grau (m´ximo) de pi (t) ´ j − i, pois pi (t) ´ o polinˆmio interpolador de j − i + 1 a e e o j j pontos. Chamaremos de ordem de pi (t) ao n´mero j −i+1, que nada mais ´ do que o n´mero u e u j de pontos que ele interpola. Em seguida podemos observar que um polinˆmio de ordem l > 1 se relaciona de o forma mais ou menos simples com algum polinˆmio de ordem inferior. Por exemplo, o com i < j tome pi (t) e pi (t), que diferem entre si pelo fato de que pi (t) n˜o abrange a j j−1 j−1 tj em sua interpola¸˜o. Nos pontos ti , . . . , tj−1 eles coincidem, pois assumem os mesmos ca valores zi , . . . , zj−1 , respectivamente. Portanto a diferen¸a pi (t)−pi (t) ´ um polinˆmio c j e o j−1 de grau no m´ximo j − i, que se anula nos pontos ti , . . . , tj−1 , ou seja, a pi (t) − pi (t) = c(t − ti )(t − ti+1 ) . . . (t − tj−1 ) . j j−1 (13.1)

A constante c depende dos pares (ti , zi ), . . . , (tj , zj ) (pois estes determinam pi (t) e j pi (t)), e ser´ denotada por a j−1 ω(ti , ti+1 , . . . , tj ) , assumindo-se implicitamente que os zi ’s est˜o automaticamente associados aos ti ’s. a Podemos alternativamente suprimir o primeiro ponto da lista, e da mesma forma teremos ˜ (13.2) pi (t) − pi+1 (t) = c(t − ti+1 ) . . . (t − tj ) , j j

13.2. FORMA DE NEWTON onde c ´ denotada por ˜e α(ti , . . . , tj ) .

165

A vantagem de se determinar os ω’s (ou α’s) ´ clara, pois da´ sairia o polinˆmio e ı o interpolador, por indu¸˜o. Ter´ ca ıamos p0 (t) = p0 (t) + ω(t0 , t1 , . . . , tk )(t − t0 )(t − t1 ) . . . (t − tk−1 ) , k k−1 mas tamb´m e p0 (t) = p0 (t) + ω(t0 , . . . , tk−1 )(t − t0 ) . . . (t − tk−2 ) , k−1 k−2 e assim por diante, de forma que p0 (t) = p0 (t) + ω(t0 , t1 )(t − t0 )+ 0 k +ω(t0 , t1 , t2 )(t − t0 )(t − t1 ) + . . . + ω(t0 , . . . , tk )(t − t0 ) . . . (t − tk−1 ) . Como p0 (t) ≡ z0 , convencionaremos que ω(t0 ) = z0 (e ω(ti ) = zi , para todo i = 0, . . . , k), 0 para que a nota¸˜o fique uniforme. ca Se procedˆssemos inversamente na ordem dos pontos, chegar´ e ıamos em p0 (t) = α(tk ) + α(tk−1 , tk )(t − tk )+ k +α(tk−2 , tk−1 , tk )(t − tk−1 )(t − tk ) + . . . + α(t0 , . . . , tk )(t − t1 ) . . . (t − tk ) , estipulando-se que α(ti ) = zi , ∀i = 0, . . . , k. Os ω’s (e analogamente os α’s) s˜o chamados de diferen¸as divididas, porque podem a c ser deduzidos da Equa¸˜o 13.1, colocando-se t = tj . Assim ca pi (tj ) − pi (tj ) j j−1 ω(ti , . . . , tj ) = , (tj − ti ) . . . (tj − tj−1 ) onde conhecemos pi (tj ) = zj , mas pi (tj ) depende de se conhecer previamente o poj j−1 linˆmio pi (t). Isso possibilita achar os ω’s indutivamente, mas ´ um caminho trabao e j−1 lhoso. Nosso objetivo ´ buscar um meio mais f´cil de determinar ω’s e α’s, embora n˜o e a a possamos nos livrar de alguma indu¸˜o. ca Partiremos de uma pequena observa¸˜o sobre os polinˆmios de ordem 1 e 2 (um e ca o dois pontos), e depois enunciaremos um resultado geral que servir´ a nossos prop´sitos. a o N˜o h´ muito o que dizer em ordem 1: a interpola¸˜o de um ponto ´ um polinˆmio a a ca e o de grau zero, portanto pi (t) = zi = ω(ti ) = α(ti ) , i por defini¸˜o. ca

166

´ CAP´ ITULO 13. TECNICAS DE INTERPOLACAO ¸˜

J´ a interpola¸˜o de dois pontos ti e ti+1 (0 ≤ i ≤ k − 1) ´ um polinˆmio de grau 1, a ca e o cujo gr´fico ´ uma reta. Temos a e pi (t) = zi + ω(ti , ti+1 )(t − ti ) , i+1 que pode ser obtido da Equa¸˜o 13.1 diretamente. Mas ω(ti , ti+1 ) ´ tamb´m a inclina¸˜o ca e e ca da reta que passa por (ti , zi ) e (ti+1 , zi+1 ), logo ω(ti , ti+1 ) = Analogamente, pi (t) = zi+1 + α(ti , ti+1 )(t − ti+1 ) , i+1 donde α(ti , ti+1 ) = ω(ti , ti+1 ), pois α(ti , ti+1 ) ´ a inclina¸˜o da mesma reta! e ca Assim mostramos que ω’s e α’s coincidem at´ ordem 2 e relacionamos ω’s de ordem 2 e com ω’s de ordem 1. Vejamos como generalizar nossas observa¸˜es para qualquer ordem. co Mostraremos o seguinte enunciado: “para todo par i, j tal que 0 ≤ i ≤ j, temos α(ti , . . . , tj ) = ω(xi , . . . , xj ), e se i < j temos ω(ti , . . . , tj ) = ω(ti+1 , . . . , tj ) − ω(ti , . . . , tj−1 ) . tj − ti (13.3) ω(ti+1 ) − ω(ti ) zi+1 − zi = . ti+1 − ti ti+1 − ti

O enunciado j´ foi demonstrado acima em ordens 1 e 2, isto ´, sempre que j−i+1 ≤ 2. a e Sejam agora i e j tais que j − i + 1 ≥ 3 e considere os polinˆmios pi+1 (t) e pi (t) que o j−1 j interpolam j − i pontos, e portanto tˆm grau (m´ximo) j − i − 1. Como eles coincidem e a em ti+1 , . . . , tj−1 , ent˜o a pi+1 (t) − pi (t) = a(t − ti+1 ) . . . (t − tj−1 ) . j−1 j (13.4)

Acharemos o valor de a de trˆs maneiras diferentes, o que fornecer´ as igualdades que e a queremos demonstrar. (i) Tomamos t = tj na Equa¸˜o 13.4. Ent˜o ca a a(tj − ti+1 ) . . . (tj − tj−1 ) = pi+1 (tj ) − pi (tj ) . j−1 j Como pi+1 (t) inclui tj em sua interpola¸˜o, pi+1 (tj ) = zj , mas zj tamb´m ´ o valor de ca e e j j i (t ), logo o lado direito ´ igual a pj j e pi (tj ) − pi (tj ) = ω(ti , . . . , tj )(tj − ti )(tj − ti+1 ) . . . (tj − tj−1 ) . j j−1 Da´ segue que ı a = (tj − ti )ω(ti , . . . , tj ) .

13.2. FORMA DE NEWTON (ii) Tomamos t = ti na Equa¸˜o 13.4. Ent˜o ca a a(ti − ti+1 ) . . . (ti − tj−1 ) = pi+1 (ti ) − pi (ti ) . j−1 j O lado direito ´ igual a e pi+1 (ti ) − pi (ti ) = −α(ti , . . . , tj )(ti − ti+1 ) . . . (ti − tj ) , j j logo a = (tj − ti )α(ti , . . . , tj ) , o que mostra que α(ti , . . . , tj ) = ω(ti , . . . , tj ).

167

(iii) Depois que vimos que ω’s e α’s coincidem, usamos a mesma Equa¸˜o 13.4, manipulandoca a de outra forma, para estabelecer a rela¸˜o dos ω’s com seus correspondentes de ordem ca inferior. Observe que pi+1 (t) − pi (t) = pi+1 (t) − pi+1 (t) + pi+1 (t) − pi (t) , j−1 j−1 j j j−1 j−1 que, pela defini¸˜o de ω’s e α’s, ´ igual a ca e ω(ti+1 , . . . , tj )(t − ti+1 ) . . . (t − tj−1 ) − α(ti , . . . , tj−1 )(t − ti+1 ) . . . (t − tj−1 ) . Como α(ti , . . . , tj−1 ) = ω(ti , . . . , tj−1 ), segue que pi+1 (t) − pi (t) = [ω(ti+1 , . . . , tj ) − ω(ti , . . . , tj−1 )] (t − ti+1 ) . . . (t − tj−1 ) . j−1 j Ent˜o a a = ω(ti+1 , . . . , tj ) − ω(ti , . . . , tj−1 ) . Como j´ sabemos que a = (tj − ti )ω(ti , . . . , tj ), conclu´ a ımos a Equa¸˜o 13.3. ca

13.2.1

Exemplo do uso da forma de Newton

A Equa¸˜o 13.3 permite que calculemos os ω’s em fun¸˜o de seus correspondentes de ca ca ordem inferior. Isso ´ poss´ porque conhecemos os ω’s de ordem 1, que s˜o os zi ’s. A e ıvel a

168

´ CAP´ ITULO 13. TECNICAS DE INTERPOLACAO ¸˜

seguinte tabela mostra como podemos esquematizar as informa¸˜es. co t0 t1 t2 . . . . . . . . . ω(t0 ) ω(t0 , t1 ) ω(t1 ) ω(t1 , t2 ) ω(t2 ) . . . . . . . . . . . . . . . . . . ω(tk−1 , tk−2 ) tk−1 ω(tk−1 ) ω(tk−1 , tk ) tk ω(tk ) Cada ω(ti , . . . , tj ) pode ser obtido da diferen¸a entre os dois elementos adjacentes da c coluna imediatamente ` esquerda (o de baixo menos o de cima), dividida pela diferen¸a a c tj − ti , onde ti e tj s˜o encontrados como as extremidades da base da pirˆmide (deitada) a a da qual ω(ti , . . . , tj ) ´ o cume. e 1 Por exemplo, se quisermos achar o polinˆmio interpolador dos pontos (0, 1), ( 2 , 1 ), o 2 3 ( 2 , −1), (2, 0), acabaremos por montar a seguinte tabela (confira!): 0
1 2 3 2

ω(t0 , t1 , t2 ) ··· . . . . . . . . . ··· ω(tk−2 , tk−1 , tk )

. . . . . . . . .

ω(t0 , . . . , tk−1 ) ω(t0 , . . . , tk ) ω(t1 , . . . , tk )

tk−2 ω(tk−2 )

1 −1
1 2

−3 2 2

−1 3
7 3

4 3

−1 0

2

Da tabela, tiramos o polinˆmio interpolador procurado: o 1 1 4 1 3 p(t) = 1 + (−1) · (x − 0) + (− )(x − 0)(x − ) + (x − 0)(x − )(x − ) . 3 2 3 2 2 Juntando termos de mesmo grau, ficamos com 1 4 p(t) = 1 + t − 3t2 + t3 . 6 3 Para verificar que deu certo, testamos os valores p(0), p( 1 ), p( 3 ) e p(2) e vemos que 2 2 batem com 1, 1 , −1 e 0. 2

13.2. FORMA DE NEWTON

169

H´ outras formas de se tirar o mesmo polinˆmio da tabela. Por exemplo, pegando a o os ω’s de baixo: 3 4 3 1 7 p(t) = 0 + 2(t − 2) + (t − 2)(t − ) + (t − 2)(t − )(t − ) . 3 2 3 2 2 Ou sen˜o em “zigue-zague”: a p(t) = ω(t2 )+ω(t1 , t2 )(t−t2 )+ω(t0 , t1 , t2 )(t−t2 )(t−t1 )+ω(t0 , t1 , t2 , t3 )(t−t2 )(t−t1 )(t−t0 ) , que ´ igual a e 3 3 1 3 1 4 3 1 −1 − (t − ) − (t − )(t − ) + (t − )(t − )(t − 0) . 2 2 3 2 2 3 2 2 O “zigue-zague” pode servir para se escolher os melhores coeficientes, facilitando a tarefa de juntar termos de mesmo grau logo depois, mas n˜o ´ aconselh´vel por ser mais a e a sujeito a erros.

170

´ CAP´ ITULO 13. TECNICAS DE INTERPOLACAO ¸˜

Parte V

Integra¸˜o de Fun¸˜es ca co

171

Cap´ ıtulo 14

Importˆncia da integra¸˜o a ca num´rica e
14.1 Introdu¸˜o ca

No pr´ximo Cap´ o ıtulo falaremos de m´todos num´ricos para o c´lculo de integrais defie e a nidas, mas antes devemos atentar para a raz˜o de sua utilidade. O C´lculo ensina que, a a para se obter
b

f (x)dx ,
a

basta achar uma primitiva, isto ´, uma fun¸˜o F (x) tal que F (x) = f (x), de forma que e ca
b

f (x)dx = F (b) − F (a)
a

(vide Apˆndice A). e Uma fun¸ao f ´, em geral, dada por uma “f´rmula”, que nada mais ´ do que a comc˜ e o e bina¸˜o finita, via somas, multiplica¸˜es, divis˜es e composi¸˜es de fun¸˜es elementares. ca co o co co As fun¸˜es elementares s˜o as usuais: potˆncias de x (negativas e positivas), fun¸˜es co a e co trigonom´tricas e suas inversas, logaritmo e exponencial. e Entretanto, no mundo abstrato de todas as fun¸˜es poss´ co ıveis, essas fun¸˜es formam co apenas uma min´scula parte. Em outras palavras, a grande maioria das fun¸˜es n˜o u co a tem uma f´rmula que as represente, embora nas aplica¸˜es do ‘mundo real’ os modelos o co freq¨entemente conduzam a fun¸˜es descritas por meio de f´rmulas. u co o Mesmo se nos restringirmos apenas `s fun¸˜es dadas por f´rmulas, acabaremos por a co o nos deparar com um fato matem´tico: nem todas elas admitem uma primitiva que a tamb´m seja escrita como combina¸˜o (finita) de fun¸˜es elementares! e ca co 173

174

ˆ ´ CAP´ ITULO 14. IMPORTANCIA DA INTEGRACAO NUMERICA ¸˜

´ E claro que existe o recurso de se escrever a primitiva F como uma combina¸˜o ca infinita de fun¸˜es elementares, por exemplo atrav´s de uma s´rie de potˆncias co e e e

F (x) =
k=0

ck xk .

Isto ´ poss´ (em muitos casos de forma at´ razoavelmente f´cil), mas com dois incone ıvel e a venientes: primeiro, quando formos avaliar F (a) e F (b) atrav´s da s´rie (ou da f´rmula e e o infinita) pode ser necess´ria uma quantidade t˜o grande de termos (ou opera¸˜es) que a a co inviabilize ou torne muito lento o c´lculo. Al´m disso, nem sempre s´ries de potˆncia a e e e convergem para todos os valores de x, o que exigiria uma an´lise criteriosa do alcance a dessa convergˆncia, em cada caso. e De outra parte, ´ preciso tamb´m dispor de instrumentos para estimar integrais e e a partir de dados experimentais. As aplica¸˜es mais ´bvias se encontram no c´lculo co o a de comprimentos, ´reas, volumes, massa, centro de massa, distˆncia percorrida, tempo a a decorrido, etc. No que segue, discutiremos algum exemplos onde a integra¸˜o num´rica ca e se faz necess´ria: ora por se tratar de medida experimental ora porque n˜o h´ primitiva a a a elementar da fun¸˜o que se quer integrar. ca

14.2

C´lculo de ´reas a a

Gostar´ ıamos de um m´todo sise tem´tico para estimar a ´rea de figua a ras planas como a mostrada ao lado (poderia ser uma ilha, por exemplo). Para isso, vamos nos basear no Princ´ ıpio de Cavalieri, que diz: “dados dois conjuntos A e B, se houver uma linha L tal que toda perpendicular a L cruze A e B em intervalos de tamanhos iguais, ent˜o A e B a tˆm a mesma ´rea.” e a Por exemplo, os triˆngulos da figura abaixo (` esquerda) tˆm ´reas iguais, pois cada a a e a reta R horizontal, ` altura y, cruza os triˆngulos em segmentos de tamanho igual a l(y). a a Para entender porque l(y) ´ igual para os dois triˆngulos, observe que em ambos l(y) e a varia como uma fun¸˜o afim (“linearmente”), em y = 0 tem-se l(0) = b (os triˆngulos ca a tˆm bases de igual tamanho) e em y = h tem-se l(h) = 0 (os triˆngulos tˆm alturas e a e iguais). Portanto a fun¸˜o l(y) tem o aspecto mostrado ` direita, na figura. ca a Isso explica porque todos os triˆngulos com base e altura iguais tˆm a mesma ´rea, a e a 1 que pode ser obtida de um deles, por exemplo o da direita. Essa ´rea vale 2 bh, e o a

´ ´ 14.2. CALCULO DE AREAS

175

leitor pode observar que essa tamb´m ´ a ´rea sob o gr´fico de l(y) (observa¸˜o que ser´ e e a a ca a importante logo adiante).

y h b l(y) y 0 b b h

O Princ´ ıpio de Cavalieri tem uma formula¸˜o an´loga para volumes. Dois s´lidos ca a o S e T ter˜o mesmo volume se houver uma linha L tal que todo plano perpendicular a a L cruze S e T em regi˜es de ´reas iguais. Para o leitor que ainda n˜o acreditou nesse o a a princ´ ıpio, imagine uma pilha de cartas com um arame passando no meio, e ent˜o incline a e retor¸a o arame, de forma que a pilha fique desalinhada. As duas pilhas continuam c tendo a mesma altura, a ´rea de cada corte ´ a mesma, e o volume (que ´ a soma dos a e e volumes “infinitesimais” das cartas) se mant´m. e O que podemos fazer com uma figura plana em geral ´ criar uma segunda fie gura com mesma ´rea apoiada no eixo hoa rizontal. Na pr´tica, temos que fazer isso a para um n´mero discreto de cortes veru ticais: medimos o comprimento do corte e transferimos esse valor para a segunda figura. Assim, a segunda figura ´ um e esbo¸o do gr´fico “Comprimento do corte c a vs. Posi¸˜o do corte”, mais precisamente ca ´ a regi˜o compreendida entre esse gr´fico e a a e a linha horizontal. Quando o corte ocorrer em dois intervalos separados a altura do gr´fico ser´ igual ` soma dos compria a a mentos das duas intersec¸˜es. co

x0 x1 ......

x6 


......

x11

x

y
! !  £ ¢£ ¢ # "# "             © ¨© ¨ ¦ § ¦ § ¤¥ ¤ ¥ ¡  ¡  

x

Ao final, teremos uma seq¨ˆncia de pontos x0 , x1 , . . . , xn , que fornecem a posi¸˜o de ue ca cada corte, e valores correspondentes y0 , y1 , . . . , yn , que s˜o os respectivos comprimentos a de cada corte. Esses dados ´ que ser˜o usados para se fazer a integra¸˜o. e a ca

176

ˆ ´ CAP´ ITULO 14. IMPORTANCIA DA INTEGRACAO NUMERICA ¸˜

O curioso ´ que o mesmo tipo de “coleta de dados” ser´ feito para a integra¸˜o de e a ca uma fun¸˜o f (x) dada por uma f´rmula. Se a integra¸˜o se der no intervalo [a, b], ent˜o ca o ca a deve-se dividir o intervalo com uma parti¸˜o ca a = x0 < x1 < x2 < . . . < xn = b e tomar os valores da fun¸˜o nos extremos dos intervalos da parti¸˜o: ca ca y0 = f (x0 ) , y1 = f (x1 ) , . . . , yn = f (xn ) (que podem at´ ser negativos). A partir desses dados, a maneira de se proceder ser´ a e a mesma, tanto no caso ’experimental’ como no caso ’te´rico’. A unica diferen¸a ´ que o ´ c e no caso ’te´rico’ n´s teremos, na maioria dos casos, uma maneira de delimitar o erro o o cometido na integra¸˜o. ca O volume de um lago ou de uma montanha tamb´m ´ pass´ e e ıvel de ser estimado usando esse tipo de dados. Pode-se fazer isso em duas etapas. Primeiramente, escolhese uma dire¸˜o (x, por exemplo) onde se posicionar˜o, perpendicularmente, as retas dos ca a “cortes”. Para cada corte do lago, posicionado em xi , estima-se sua ´rea A(xi ), usando a dados (yi , zi ). Depois estima-se a integral da fun¸˜o “´rea do corte”, usando-se os dados ca a (xi , A(xi )), que resulta no volume.

14.3

Comprimento de curvas e gr´ficos a

Considere o seguinte problema: “calcular o comprimento do gr´fico da fun¸˜o f entre a ca a e b”. Se a fun¸˜o f for diferenci´vel, esse problema remete a uma integral. ca a Para entender melhor, tentemos aproximar a curva por pequenos segmentos de reta e seu comprimento pela soma dos tamanhos desses segmentos. Como sempre, dividimos o intervalo [a, b] com uma parti¸˜o a = x0 < x1 < . . . < xn = b e em cada intervalo ca [xi , xi+1 ] (i = 0, . . . , n − 1) aproximamos a fun¸˜o pelo segmento de reta que une os ca pontos (xi , f (xi )) e (xi+1 , f (xi+1 )). Pelo Teorema de Pit´goras, esse segmento tem a tamanho igual a (xi+1 − xi )2 + (f (xi+1 ) − f (xi ))2 . Para simplificar um pouco, podemos supor que todos os intervalos tenham o mesmo tamanho ∆x. Al´m disso, aproximamos a diferen¸a f (xi+1 ) − f (xi ) por f (xi )∆x, de e c forma que somando para todos os segmentos obtenhamos, aproximadamente,
n−1

∆x 1 + f (xi )2 .
i=0

Fazendo ∆x ir a zero estaremos, por um lado, fazendo com que a soma dos comprimentos dos segmentos esteja cada vez mais pr´xima do comprimento verdadeiro da curva e, por o

´ 14.3. COMPRIMENTO DE CURVAS E GRAFICOS

177

outro lado, fazendo com que a aproxima¸˜o pela derivada seja cada vez mais fidedigna. ca No limite, teremos um n´mero que ´ ao mesmo tempo o comprimento da curva e tamb´m u e e a integral
b

1 + f (x)2 dx .
a

O gr´fico de f entre a e b ´ um caso particular de curva no plano. Cada ponto a e dessa curva pode ser obtido tomando-se t no intervalo [a, b] e ent˜o o ponto (t, f (t)). a Podemos imaginar esse processo como uma fun¸˜o com dom´ ca ınio [a, b] e contradom´ ınio R2 , que leva t em (t, f (t)). Na verdade, podemos generalizar para situa¸˜es que n˜o co a correspondam a gr´ficos de fun¸˜es. Por exemplo, tome a fun¸˜o a co ca γ(t) = (cos t, sent) , com t variando no intervalo [0, 2π]. Para cada t, o ponto γ(t) ´ um ponto do c´ e ırculo unit´rio, correspondente a um giro de ˆngulo t. Uma elipse ´ a imagem da fun¸˜o a a e ca γ(t) = (α cos t, βsent) , com t variando em [0, 2π]. Basta ver que se (x, y) pertence ` curva ent˜o (x, y) = a a (α cos t, βsent), para algum t, logo x2 y2 + 2 =1. α2 β Uma curva γ(t) ´ expressa com duas fun¸˜es, uma para cada coordenada: γ(t) = e co (x(t), y(t)). Se quisermos calcular o comprimento total da curva (com t variando no intervalo [a, b]), podemos proceder com uma id´ia semelhante ` exposta acima para e a calcular o comprimento do gr´fico de uma fun¸˜o. Dividimos o intervalo [a, b] com a ca uma parti¸˜o a = t0 < t1 < . . . < tn = b (com intervalos iguais de tamanho ∆t) e ca aproximamos o comprimento da curva pela soma
n−1

γ(ti+1 ) − γ(ti ) .
i=0

Cada termo da soma ´ a distˆncia entre dois pontos consecutivos γ(ti ) e γ(ti+1 ). Esta e a distˆncia ´ dada explicitamente por a e (x(ti+1 ) − x(ti ))2 + (y(ti+1 ) − y(ti ))2 , pelo Teorema de Pit´goras. a Se cada uma das fun¸˜es coordenadas for diferenci´vel, a distˆncia ser´ aproximaco a a a damente igual a ∆t x (ti )2 + y (ti )2 ,

178 ou

ˆ ´ CAP´ ITULO 14. IMPORTANCIA DA INTEGRACAO NUMERICA ¸˜

∆t (x (ti ), y (ti ) . O vetor γ (t) = (x (ti ), y (ti )) ´ o vetor derivada da curva γ(t). Somando o comprimento e dos segmentos e fazendo o limite quando ∆t vai a zero, conclu´ ımos que o comprimento da curva ´ dado pela integral e
b

γ (t) dt .
a

Por exemplo, no caso do c´ ırculo unit´rio, γ(t) = (cos t, sent) e γ (t) = (−sent, cos t), a logo γ (t) = 1. Portanto o comprimento do c´ ırculo ´ e
2π 2π

γ (t) dt =
0 0

dt = 2π ,

como era de se esperar! No caso da elipse, seu per´ ımetro l depende de a e b, que s˜o os tamanhos dos semia eixos. Estamos sempre supondo que a e b s˜o positivos, e iremos tamb´m assumir a e que a < b, isto ´, que o semi-eixo maior da elipse est´ na vertical. Tomando γ(t) = e a (a cos t, bsent), temos γ (t) = (−asent, b cos t), de forma que o per´ ımetro p da elipse ´ e dado por

p=
0

a2 sen2 t + b2 cos2 t dt .

Por raz˜es de simetria, podemos integrar somente de 0 a π e multiplicar por quatro. o 2 Al´m disso podemos substituir cos2 por 1 − sen2 , e colocar b em evidˆncia na integral: e e p = 4b
0
π 2

1 − κ2 sen2 tdt ,

onde κ2 ´ definido como sendo e 1−

a2 , b2

um n´mero positivo e menor do que 1 (ele vale 1 quando a elipse ´ um c´ u e ırculo, e 0 quando a elipse degenera num segmento de reta vertical). A integral 1 − κ2 sen2 tdt ´ conhecida como integral el´ e ıptica do primeiro tipo, e n˜o admite uma express˜o via a a combina¸˜o finita de fun¸˜es elementares. Em outras palavras, n˜o h´ uma f´rmula ca co a a o fechada para o per´ ımetro da elipse.

ˆ 14.4. DISTANCIA PERCORRIDA E TEMPO DECORRIDO

179

14.4

Distˆncia percorrida e tempo decorrido a

A F´ ısica est´ repleta de conceitos definidos por meio de integra¸˜o. Faremos aqui uma a ca pequena discuss˜o sobre movimentos unidimensionais, isto ´, movimentos num espa¸o a e c cuja posi¸˜o possa ser determinada por apenas uma coordenada. Pode ser o movimento ca de uma part´ ıcula numa reta, um carro numa estrada, um pˆndulo simples, etc. O caso e do pˆndulo ser´ discutido com detalhes na pr´xima Se¸˜o. e a o ca O movimento unidimensional de um corpo pode ser descrito por uma fun¸˜o x(t), ca onde x(t) indica a posi¸˜o em cada instante de tempo t. No caso de um pˆndulo, sua ca e posi¸˜o ´ indicada por um ˆngulo θ(t) (para ser mais preciso, sua posi¸˜o ´ circular), ca e a ca e medido a partir da posi¸˜o vertical mais baixa. ca A velocidade do corpo v(t) ´ a derivada da fun¸˜o x(t): e ca v(t) = x (t) , e a acelera¸˜o ´ a derivada de v(t). No caso em que a posi¸˜o ´ descrita por um ˆngulo, ca e ca e a falamos em velocidade angular, denotada por ω(t): ω(t) = θ (t) . Conhecendo a posi¸˜o inicial x0 (no instante t = 0) e a maneira como evolui a ca velocidade em fun¸˜o do tempo, podemos recuperar a fun¸˜o posi¸˜o: ca ca ca
t

x(t) = x0 +
0

v(τ )dτ ,

equa¸˜o que nada mais ´ do que o Teorema Fundamental do C´lculo. Fisicamente, ca e a podemos pensar que no instante τ , a velocidade ´ v(τ ) e, sendo cont´ e ınua, assume valores pr´ximos a v(τ ) em instantes pr´ximos a τ . Tomando um intervalo de tempo ∆τ o o pr´ximo a τ , teremos que a distˆncia percorrida ser´ aproximadamente igual a v(τ )∆τ . o a a Da divis˜o em pedacinhos de tamanho ∆τ do intervalo de tempo onde percurso ´ acoma e panhado, a distˆncia percorrida ´ a integral de v(τ ), o que justifica a f´rmula de forma a e o emp´ ırica. Da mesma forma, em coordenadas angulares, temos
t

θ(t) = θ0 +
0

ω(τ )dτ .

Ocorre entretanto que, em muitas aplica¸˜es f´ co ısicas, conhecemos a velocidade em fun¸˜o da posi¸˜o, e n˜o do tempo. O pˆndulo ser´ um exemplo disso. N˜o vamos ca ca a e a a discorrer a respeito de outros exemplos, mas imagine o leitor que seja esse o caso. E suponha que agora o problema ´ outro: da posi¸˜o inicial x0 at´ a posi¸˜o final x, em e ca e ca cada ponto ξ sabe-se que a velocidade assume o valor v(ξ) (mas nunca se anula). Quanto tempo durou o percurso?

180

ˆ ´ CAP´ ITULO 14. IMPORTANCIA DA INTEGRACAO NUMERICA ¸˜

A exigˆncia de que a velocidade n˜o se anule no percurso pode ser justificada ase a sim: se o corpo p´ra numa posi¸˜o ξ, e depois recobra seu movimento, n˜o h´ como a ca a a saber quanto tempo ele ficou parado, logo n˜o h´ como obter uma resposta unica para a a ´ a pergunta. Eventualmente poderemos considerar que a velocidade se anule instantaneamente, principalmente se se tratar de ξ = x0 ou ξ = x. Como no caso anterior, podemos dividir o espa¸o percorrido em pequenos intervalos c de tamanho ∆ξ. Em cada intervalo, a velocidade ´ aproximadamente constante, por e exemplo, pr´xima ao valor v(ξ) do extremo do intervalo. O tempo dispendido nesse o pequeno trecho de percurso ´ aproximadamente igual a e ∆ξ . v(ξ) Portanto somando esses tempos e fazendo ∆ξ ir a zero, teremos que o tempo decorrido ser´ a x 1 T = dξ . x0 v(ξ) No caso angular, temos
θ

T =
θ0

1 dξ , ω(ξ)

onde ξ agora representa a vari´vel angular de posi¸˜o. Esta f´rmula ser´ aplicada na a ca o a pr´xima Se¸˜o para se calcular o per´ o ca ıodo do pˆndulo simples. e

14.5

Per´ ıodo do pˆndulo e as integrais el´ e ıpticas

Consideremos um pˆndulo simples sem atrito. Mostraremos que a Lei de Conserva¸˜o e ca da Energia implica que a velocidade depende somente da posi¸˜o do pˆndulo. ca e A energia cin´tica do pˆndulo ´ dada por 1 mv 2 , onde v representa sua velocidade e e e 2 linear. Se o comprimento da haste for igual a l, essa velocidade ´ igual a lω, onde ω ´ a e e velocidade angular. Por outro lado, a energia potencial ´ igual a mgh, onde h ´ a altura do pˆndulo em e e e rela¸˜o ao solo. A bem da verdade a energia potencial ´ uma grandeza relativa, o que ca e quer dizer que podemos somar uma constante a essa energia e nada se alterar´. Ou a ainda, quer dizer que podemos supor que o solo est´ na altura que quisermos, inclusive a acima do pˆndulo!! Aqui assumiremos que o solo est´ na altura do ponto mais baixo do e a pˆndulo, de forma que a h se relaciona com a coordenada angular θ por e h = l − l cos θ .

ˆ 14.5. PER´ IODO DO PENDULO E AS INTEGRAIS EL´ IPTICAS

181

A energia total ´ a soma da energia cin´tica com a energia potencial, e essa energia e e ´ constante: e 1 2 2 ml ω + mgl(1 − cos θ) = E . 2 Mas quanto vale essa constante E? Observe que a constante E tem a ver com a amplitude θ0 do movimento: quanto maior for a amplitude, maior ser´ essa energia. Para n˜o ficar d´vidas, θ0 representa a a u o ˆngulo m´ximo que o pˆndulo alcan¸a a partir da posi¸˜o vertical mais baixa, logo o a a e c ca maior valor que pode assumir, em tese, ´ π (estamos evitando considerar o movimento em e que a posi¸˜o θ = π ´ “atravessada”). Quando o pˆndulo atinge o ˆngulo m´ximo (θ0 ou ca e e a a −θ0 , tanto faz), h´ uma revers˜o do movimento, e a velocidade angular instantaneamente a a se anula. Nesse caso, a energia cin´tica ´ nula, e toda a energia se concentra na energia e e potencial. Em outras palavras, a energia total E ´ igual ` energia potencial no ˆngulo e a a m´ximo θ0 . a Substituindo na equa¸˜o acima, obtemos ca ω2 = 2g [(1 − cos θ0 ) − (1 − cos θ)] . l

A express˜o entre colchetes pode ser simplificada para cos θ − cos θ0 , por´m mais tarde a e voltaremos a deix´-la dessa forma por raz˜es t´cnicas. a o e Notemos que essa equa¸˜o tem duas solu¸˜es, uma positiva e uma negativa. De toda ca co forma, ela evidencia a dependˆncia da velocidade angular em rela¸˜o ` posi¸˜o: fixada a e ca a ca amplitude θ0 do movimento, para cada posi¸˜o θ (entre −θ0 e θ0 ), a velocidade angular ca ω s´ pode assumir dois valores, um negativo e um positivo, e ambos de igual m´dulo. o o Um dos valores representa o movimento de “ida” do pˆndulo e o outro de “volta”. e Para obter o per´ ıodo do pˆndulo, podemos calcular o tempo decorrido para se ir de e −θ0 at´ θ0 , no movimento de “ida” (velocidade angular positiva). De fato, pela simetria e

¢

£

¢

£

¢

£

¢

£

¢

£

¢

£

 ¡

θ

l h

182

ˆ ´ CAP´ ITULO 14. IMPORTANCIA DA INTEGRACAO NUMERICA ¸˜

do movimento, basta analisar o percurso de θ = 0 at´ θ = θ0 , percorrido em um quarto e do per´ ıodo. Levando em conta as considera¸˜es da Se¸˜o anterior, teremos co ca T = 4 logo T =4· l 2g
θ0 θ0 0

1 dθ , ω(θ)


0

1 dθ . cos θ − cos θ0

Vale apenas examinarmos com mais aten¸˜o essa integral, tentando esbo¸ar o inteca c grando. Primeiro desenhamos a fun¸˜o cos θ, marcando a altura de cos θ0 (que pode ca ser negativo, se θ0 > π ). A partir da´ esbo¸amos a fun¸˜o cos θ − cos θ0 , no intervalo ı c ca 2 [0, θ0 ], que ´ o que nos interessa. Essa fun¸˜o tem derivada n˜o nula em θ0 , a n˜o ser e ca a a que θ0 = π, mas esse caso n˜o ser´ considerado. a a

cos θ −cos θ0

(cos θ −cos θ0 )

1/2

(cos θ −cos θ0 )

− 1/2

0

π 2

θ

0

π

θ
0

θ

θ
0

0

θ

θ

0

ımos a raiz dessa fun¸˜o, e observamos que a inclina¸˜o da fun¸˜o ca ca ca √ Em seguida, extra´ cos θ − cos θ0 vai a infinito quando θ vai a θ0 . Como a fun¸˜o original tinha “cara” de ca 1 c(θ0 − θ) (perto de θ0 ), quando tiramos a raiz ela fica com “cara” de c(θ0 − θ) 2 (basta √ e co comparar com os gr´ficos y = cx e y = cx, por´m afirma¸˜es mais precisas podem ser a obtidas usando F´rmula de Taylor, vide Apˆndice B). o e 1 1 Acontece que o integrando ´ (cos θ − cos θ0 )− 2 , que tem “cara” de c(θ0 − θ)− 2 perto e ´ de θ0 . E uma fun¸˜o divergente em θ0 (vai a infinito), e ´ natural que nos questioca e nemos sobre a convergˆncia da integral. Fisicamente sabemos que a integral tem que e convergir, pois o pˆndulo alcan¸a o ˆngulo de amplitude m´xima em tempo finito. Mas e c a a e matematicamente? 1 ´ E emp´ ırico por´m extremamente v´lido pensar na integrabilidade da fun¸˜o x− 2 e a ca entre 0 e 1. Neste caso, a divergˆncia ocorre em x = 0. Essa integral existe, pois se e tomarmos a integral
1 a

x−1/2 dx = 2x1/2

1 a

= 2(1 − a1/2 ) ,

ˆ 14.5. PER´ IODO DO PENDULO E AS INTEGRAIS EL´ IPTICAS

183

teremos que ela tende a 2 quando a tende a zero, e portanto converge. De fato, a integral de qualquer fun¸˜o x−α , com 0 < α < 1 existe em (0, 1), pelas mesmas raz˜es. Fica ca o para o leitor verificar que o mesmo n˜o ocorre com α ≥ 1! a Apesar de n˜o haver problema quanto ` convergˆncia da integral que fornece o a a e per´ ıodo do pˆndulo, veremos no pr´ximo Cap´ e o ıtulo que nossos m´todos se prestar˜o e a mais a fun¸˜es que sejam cont´ co ınuas no intervalo de integra¸˜o, inclusive nos extremos. ca O “pulo do gato” neste caso ´ que uma mudan¸a de coordenadas (muito) esperta pode e c transformar a integral acima numa outra cujo integrando seja uma fun¸˜o cont´ ca ınua dentro de um intervalo, isto ´, sem pontos de divergˆncia. Fa¸amos ent˜o essa mudan¸a e e c a c de coordenadas, que a bem da verdade ser´ uma seq¨ˆncia de duas substitui¸˜es. a ue co A primeira substitui¸˜o ser´ inofensiva. Faremos η = θθ0 (logo dη = dθ ), e ficaremos ca a θ0 com uma integral no intervalo (0, 1) (independentemente de θ0 ): T =4· l · θ0 2g
1 0

1 cos(ηθ0 ) − cos θ0

dη .

Em seguida lembramos de como estava escrito o radicando, para obtermos cos(ηθ0 ) − cos θ0 = (1 − cos θ0 ) − (1 − cos(ηθ0 )) =
1

1 − cos θ0 · 1 −

1 − cos(ηθ0 ) , 1 − cos θ0

e j´ tiramos o fator (1 − cos θ0 )− 2 para fora da integral. S´ para n˜o nos perdermos nas a o a contas, o conjunto de termos que multiplica a integral ´ e 4· Observe que a fra¸˜o ca 1 − cos(ηθ0 ) 1 − cos θ0 varia monotamente de 0 a 1 quando η varia de 0 a 1. Fazemos ent˜o a substitui¸˜o a ca sen2 ξ = 1 − cos(ηθ0 ) , 1 − cos θ0 l θ0 . ·√ 2g 1 − cos θ0

dη onde ξ varia entre 0 e π . Da´ teremos uma integral de 0 a π de cos ξ , mas precisamos ı 2 2 colocar tudo em fun¸˜o de ξ. Diferenciando os dois lados da equa¸˜o acima e dividindo ca ca por cos ξ, obtemos dη θ0 2senξdξ = sen(θ0 η) , 1 − cos θ0 cos ξ

184 logo

ˆ ´ CAP´ ITULO 14. IMPORTANCIA DA INTEGRACAO NUMERICA ¸˜

2(1 − cos θ0 ) senξ dη = · dξ . cos ξ θ0 sen(θ0 η) Note que ainda temos um termo dependendo de η. Da equa¸˜o onde introduzimos a ca substitui¸˜o, podemos isolar cos(θ0 η): ca cos(θ0 η) = 1 − (1 − cos θ0 )sen2 ξ , logo sen(θ0 η) = ou, simplificando, sen(θ0 η) = J´ que a
1−cos θ0 2

1 − [1 − (1 − cos θ0 )sen2 ξ]2

2

1 − cos θ0 senξ

1−

1 − cos θ0 sen2 ξ . 2

´ sempre um n´mero n˜o negativo, denominamos e u a κ2 = 1 − cos θ0 , 2
π 2

e juntando tudo obtemos (depois de v´rios cancelamentos) a T =4 l g 1 1 − κ2 sen2 ξ dξ .

0

Se θ0 < π ent˜o κ2 < 1 e o denominador do integrando nunca se anula. Portanto a este integrando ´ cont´ e ınuo no intervalo [0, π ]. No caso em que θ0 = π o integrando ´ e 2 π divergente em 2 e a pr´pria integral ´ divergente (o leitor ´ convidado a comparar com o e e sua intui¸˜o f´ ca ısica). De fato, quanto mais θ0 se aproxima de π maior se torna T , em outras palavras, o per´ ıodo do movimento vai a infinito quando a amplitude se aproxima de π. Por outro lado, quando a amplitude se aproxima de 0 significa que κ2 se aproxima de 0, e o integrando se aproxima da fun¸˜o constante igual a 1. Isso implica que o per´ ca ıodo se aproxima do conhecido valor l . 2π g A integral 1 1 − κ2 sen2 ξ dξ ,

com 0 < κ2 < 1, ´ conhecida como integral el´ e ıptica do segundo tipo e n˜o pode ser a expressa por meio de combina¸˜es finitas de fun¸˜es elementares. Portanto n˜o h´ uma co co a a f´rmula fechada para o per´ o ıodo do pˆndulo em fun¸˜o da amplitude do movimento. e ca

´ 14.6. CALCULO DE π E DE LOGARITMOS

185

14.6

C´lculo de π e de logaritmos a

A integra¸˜o num´rica se presta tamb´m para calcular constantes matem´ticas, por ca e e a exemplo o n´mero π, que ´ definido como sendo a √rea do c´ u e a ´ ırculo unit´rio. Como para a o c´ ırculo unit´rio se tem x2 + y 2 = 1, ent˜o y = ± 1 − x2 , ou seja, a a
1

π=2
−1

1 − x2 dx .

Aqui ´ poss´ at´ achar uma primitiva para o integrando, mas o problema ´ que essa e ıvel e e primitiva acabar´ sendo expressa em termos de π. Pode-se mostrar teoricamente que a o lado direito ´ igual ao esquerdo, obtendo-se uma bela equa¸˜o π = π!!!! O valor e ca num´rico de π s´ poder´ ser obtido, no entanto, se fizermos a integra¸˜o precisa da e o a ca fun¸˜o no integrando. ca Outra maneira de se obter π via integra¸ao ´ usando o fato de que c˜ e (arctan x) = Como arctan(0) = 0, ent˜o a
x

1 . 1 + x2

arctan x =
0

1 dt . 1 + t2

A´ nos aproveitamos do fato de que arctan 1 = π , de forma a podermos expressar π ı 4 como uma integral 1 1 π=4 dt . 2 0 1+t Lembremos tamb´m que o logaritmo ´ definido atrav´s de uma integra¸˜o. Como e e e ca
x

ln x ≡
1

1 dt t

(vide Apˆndice A), ent˜o para cada x o valor num´rico de ln x ser´ obtido como uma e a e a a ´rea debaixo do gr´fico de uma fun¸˜o. a ca A constante e ´ definida como sendo o (´nico) n´mero que satisfaz a equa¸˜o e u u ca ln x = 1 . Ele pode ser obtido, por exemplo, resolvendo-se essa equa¸˜o pelo M´todo de Newton. ca e S´ que, para sermos honestos, temos que aplicar o M´todo de Newton calculando todos o e os logaritmos atrav´s da integra¸˜o num´rica (vide Exerc´ na Se¸˜o 16.2). e ca e ıcio ca

186

ˆ ´ CAP´ ITULO 14. IMPORTANCIA DA INTEGRACAO NUMERICA ¸˜

14.7

A gaussiana

Como vimos na Subse¸˜o 5.3.6, a distribui¸˜o de probabilidade mais comum na natureza ca ca ´ dada pela fun¸˜o e ca (t − τ )2 1 }. Pτ,σ (x) = √ exp{− 2σ 2 σ 2π Para sabermos a probabilidade de ocorrer um evento dentro do intervalo [a, b] precisamos calcular a integral
b

Pτ,σ (t)dt .
a

´ E um pouco chato calcular integrais com essas constantes, mas atrav´s de uma e 2 mudan¸a de coordenadas podemos reduzir o problema a calcular integrais de e−x . Por c exemplo, tomemos u = t − τ (du = dt). Ent˜o a
b a

1 Pτ,σ (t)dt = √ σ 2π

b−τ a−τ

e− 2σ2 du .
u √ σ 2

u2

Em seguida, fazemos outra mudan¸a de coordenadas x = c 1 √ 2
b−τ √ σ 2

(dx =

du √ ). σ 2

Obtemos


2

π

e−x dx ,
a−τ √ σ 2 b−τ √ . σ 2

2

a−τ √ σ 2

isto ´, uma integral de e−x no intervalo [A, B], onde A = e
2

eB=

Acontece que e−x ´ uma daquelas fun¸˜es que n˜o tˆm f´rmula para sua primitiva, e e co a e o a partir da´ s´ se prossegue com estimativas num´ricas. Em probabilidade, como ´ muito ı o e e freq¨ente o uso dessa integral, adotam-se tabelas com precis˜o limitada mas razo´vel, u a a que servem para a maioria dos prop´sitos. Essas tabelas podem ser facilmente montadas o com os m´todos de integra¸˜o do pr´ximo Cap´ e ca o ıtulo.

Cap´ ıtulo 15

M´todos de integra¸˜o num´rica e ca e
15.1 Introdu¸˜o ca

Queremos resolver o seguinte problema: “dada uma fun¸˜o f : [a, b] → R, achar a ca integral de f nesse intervalo, denotada por
b

f (x)dx .
a

Aqui trataremos de dois m´todos de integra¸˜o de fun¸˜es, a saber, o M´todo dos e ca co e Trap´zios e o M´todo de Simpson. e e

15.2

O M´todo dos Trap´zios e e

A primeira coisa a fazer ´ dividir o intervalo [a, b] em n intervalos (n˜o necessariamente e a de tamanhos iguais). Isto ´, fixar x0 = a (extremo esquerdo do intervalo) e xn = b e (extremo direito do intervalo), e escolher pontos x1 , . . . , xn−1 entre a e b de modo que valha a = x0 < x1 < x2 < x3 < . . . < xn−1 < xn = b . Em seguida, deve-se estimar a ´rea (com sinal) entre cada par de pontos sucessivos. a Por exemplo, entre xi e xi+1 : podemos aproximar essa ´rea tomando o retˆngulo cuja a a base ´ o intervalo [xi , xi+1 ] e cuja altura seja a m´dia entre f (xi ) e f (xi+1 ). Esse e e retˆngulo ter´ ´rea de a aa f (xi ) + f (xi+1 ) · (xi+1 − xi ) . 2 Finalmente, somam-se as estimativas de cada retˆngulo, obtendo-se a ´rea (aproxia a mada) total. 187

188

´ ´ CAP´ ITULO 15. METODOS DE INTEGRACAO NUMERICA ¸˜

Algumas observa¸˜es s˜o pertinentes. Para come¸ar, por que o M´todo dos Trap´zios co a c e e assim se chama? Afinal, nenhum trap´zio apareceu para justificar o nome...! e Observe que em vez de termos pego o retˆngulo com altura m´dia a e (f (xi ) + f (xi+1 ))/2 poder´ ıamos ao inv´s ter pego o trap´zio cujos e e v´rtices s˜o (xi , 0), (xi+1 , 0), (xi+1 , f (xi+1 )) e (xi , f (xi )). A ´rea e a a f(x i+1) desse trap´zio pode ser calculada da seguinte forma: completamos f(x ) e i a altura com um trap´zio de mesmas propor¸˜es, formando um e co retˆngulo de altura f (xi ) + f (xi+1 ) e base xi+1 − xi . A ´rea desse a a retˆngulo ´ o dobro da ´rea do trap´zio, donde essa ultima deve a e a e ´ valer f (xi ) + f (xi+1 ) xi xi+1 · (xi+1 − xi ) , 2 ou seja, o mesmo valor que t´ ınhamos obtido de outra forma! N˜o ´ preciso que o espa¸amento entre os pontos seja sempre igual, mas se for facilita a e c bastante. Suponha que a distˆncia entre eles seja igual a h, isto ´, a e x1 − x0 = x2 − x1 = x3 − x2 = . . . = xn − xn−1 = h . Ent˜o o trap´zio com base [xi , xi+1 ] tem ´rea a e a h (f (xi ) + f (xi+1 )) . 2 Para todos os trap´zios aparece a multiplica¸˜o por h , portanto podemos deixar essa e ca 2 multiplica¸˜o por ultimo (o que ´ o mesmo que colocar em evidˆncia esse fator). Ent˜o ca ´ e e a a ´rea total dos trap´zios ser´ a e a h (f (x0 ) + f (x1 ) + f (x1 ) + f (x2 ) + f (x2 ) + f (x3 ) + . . . 2 . . . + f (xn−2 ) + f (xn−1 ) + f (xn−1 ) + f (xn )) . Excetuando o primeiro e o ultimo termo, todos os outros aparecem duas vezes na soma. ´ Ent˜o a ´rea total ser´ a a a h {f (x0 ) + 2f (x1 ) + 2f (x2 ) + . . . + 2f (xn−1 ) + f (xn )} . 2 Isso facilita bastante na hora de se fazer as contas!! Outra pergunta: que erro estamos cometendo ao fazer a aproxima¸˜o da ´rea por ca a trap´zios? Veremos mais adiante como calcular esse erro. Por enquanto ficamos com e a percep¸˜o (correta) de que nosso resultado ser´ tanto mais preciso quanto menor ca a for o tamanho dos intervalinhos da divis˜o. Nem sempre por´m nos interessa calcular a e a integral de fun¸˜es exatamente conhecidas, pois muitas vezes estamos diante de uma co

´ ´ 15.2. O METODO DOS TRAPEZIOS

189

fun¸˜o obtida atrav´s de dados experimentais. Ou sen˜o queremos simplesmente estimar ca e a a ´rea de uma regi˜o, e colhemos os dados de forma semelhante ao que foi feito acima: a a para cada xi , medimos o valor yi da fun¸˜o. Todo o procedimento ser´ o mesmo. A ca a unica coisa ´ que n˜o poderemos controlar a precis˜o da estimativa, por falta de mais ´ e a a informa¸˜es sobre a fun¸˜o e devido ao erro inerente aos dados experimentais. co ca Para exemplificar o uso do M´todo dos Trap´zios, ilustremos com um exemplo cujo e e resultado ´ bem conhecido. Sabendo que a derivada da fun¸˜o arctan ´ 1+x2 , segue que e ca e 1
1 0

1 π dx = arctan(1) − arctan(0) = , 2 1+x 4

pelo Teorema Fundamental do C´lculo. Logo a estimativa dessa integral levar´ a uma a a estimativa do valor de π. Como ainda n˜o falamos em estimativa de erro para o M´todo, nossa escolha em a e rela¸˜o ao tamanho dos intervalos da parti¸˜o e ao n´mero de algarismos significativos ca ca u ser´ arbitr´ria. Mais adiante veremos como fazer escolhas mais conscientes. a a Dividiremos o intervalo [0, 1] em 10 intervalos iguais, ou seja, faremos h = 0.1. Ent˜o a π 0.1 ≈ {f (0) + 2f (0.1) + 2f (0.2) + . . . + 2f (0.9) + f (1)} , 4 2
1 onde f (x) = 1+x2 ´ a fun¸˜o do integrando. Os dados para realizar essa soma (com 5 e ca algarismos significativos) s˜o: a

i 0 1 2 3 4 5 6 7 8 9 10 Ent˜o a

xi 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

f (xi ) 1.0000 0.99010 0.96514 0.91743 0.86207 0.80000 0.73529 0.67114 0.60976 0.55249 0.50000

f (0) + 2f (0.1) + 2f (0.2) + . . . + 2f (0.9) + f (1) ≈ 15.700 , logo 0.1 × 15.700 = 3.1400 , 2 valor ` distˆncia de aproximadamente 1.6 × 10−3 do valor verdadeiro. a a π ≈4×

190

´ ´ CAP´ ITULO 15. METODOS DE INTEGRACAO NUMERICA ¸˜

15.3

O M´todo de Simpson e

Se notarmos bem, no M´todo dos Trap´zios o que n´s fizemos foi aproximar a fun¸˜o e e o ca f , em cada intervalo, por uma reta coincidente com a fun¸˜o nos extremos. O M´todo ca e de Simpson ´ um melhoramento dessa estrat´gia, pois considera polinˆmios quadr´ticos e e o a como forma de aproximar a fun¸˜o. Vejamos como ele funciona. ca Como no M´todo dos Trap´zios, a primeira coisa a fazer ´ dividir o intervalo de e e e integra¸˜o em intervalinhos, s´ que agora em um n´mero par de intervalos. Ou seja, ca o u denominar x0 = a, x2n = b e escolher pontos intermedi´rios a a = x0 < x1 < x2 < . . . < x2n−2 < x2n−1 < x2n = b . Depois para cada i = 0, . . . , n − 1 considerar os trˆs pontos x2i , x2i+1 , x2i+2 e os e valores respectivos da fun¸˜o avaliada nesses trˆs pontos: f (x2i ), f (x2i+1 ), f (x2i+2 ). ca e Para simplificar a nota¸˜o, chamar esses valores de y2i , y2i+1 , y2i+2 . ca Em seguida encontrar o unico polinˆmio quadr´tico (isto ´, de grau 2) pi (x) tal que ´ o a e pi (x2i ) = y2i , pi (x2i+1 ) = y2i+1 , pi (x2i+2 ) = y2i+2 , e usar esse polinˆmio pi (x) como aproxima¸˜o para a fun¸˜o no intervalo [x2i , x2i+2 ] (o o ca ca polinˆmio pode ser achado com qualquer um dos m´todos descritos na Se¸˜o 1.5 ou no o e ca Cap´ ıtulo 13). Assim a integral
x2i+2

f (x)dx
x2i

´ aproximada pela integral e

x2i+2

pi (x)dx .
x2i

Finalmente, h´ que se somar as aproxima¸˜es obtidas em cada intervalo para se obter a co a aproxima¸˜o de ca
b

f (x)dx .
a

Vejamos como fica o caso em que todos os intervalos da parti¸˜o tˆm o mesmo ca e tamanho h. Resultar´ da´ uma f´rmula bastante elegante para a aproxima¸˜o da integral a ı o ca (parecida com a f´rmula de integra¸˜o pelo M´todo dos Trap´zios), conhecida como o ca e e f´rmula de Simpson. o Em primeiro lugar, temos que desenvolver em detalhe o passo do procedimento que consiste em achar o polinˆmio interpolador pelos trˆs pontos (x2i , y2i ), (x2i+1 , y2i+1 ) o e e (x2i+2 , y2i+2 ). Como n˜o estamos interessados no polinˆmio em si mas sim na sua a o integral definida no intervalo [x2i , x2i+2 ], ser´ mais simples trabalharmos no intervalo a

´ 15.3. O METODO DE SIMPSON

191

[−h, h], interpolando os pontos (−h, y2i ), (0, y2i+1 ) e (h, y2i+2 ) (fica ao leitor detalhista a tarefa de mostrar por que isso pode ser realmente feito). O polinˆmio interpolador p(x) = pi (x) pode ser calculado como no Cap´ o ıtulo 13, com o aux´ dos polinˆmios de Lagrange: ılio o p(x) = y2i isto ´, e p(x) = Da´ que ı
h

(x + h)(x − h) (x + h)x x(x − h) + y2i+1 + y2i+2 , (−h)(−2h) h(−h) (2h)(h)

1 {x(x − h)y2i − 2(x + h)(x − h)y2i+1 + x(x + h)y2i+2 } . 2h2

p(x)dx =
−h

1 2h2

h

h

h

y2i
−h

x(x − h)dx − 2y2i+1
−h

(x + h)(x − h)dx + y2i+2
−h

x(x + h)dx

.

Fazemos ent˜o uma a uma cada uma das trˆs integrais: a e
h h

x(x − h)dx =
−h

(x2 − hx)dx =
−h 2 h x

3 −h 2 = h3 . 3 Semelhantemente,
h

=

h x3

−h

2

==

h

h3 (−h)3 − 3 3

−h

h2 (−h)2 − 2 2

=

(x + h)(x − h)dx =
−h

4 x2 − h2 dx = − h3 3 −h

h

e

2 (x + h)xdx = h3 . 3 −h Com esses valores, voltamos ` integral de p(x): a
h

h

p(x)dx =
−h

h (y2i + 4y2i+1 + y2i+2 ) . 3

Observe como, ` semelhan¸a do M´todo dos Trap´zios, essa f´rmula facilita o cˆmputo a c e e o o geral da aproxima¸˜o, mesmo com uma subdivis˜o em muitos intervalos. Se, como ca a

192

´ ´ CAP´ ITULO 15. METODOS DE INTEGRACAO NUMERICA ¸˜

acima, tivermos a parti¸˜o do intervalo [a, b] em 2n intervalos, todos com tamanho h, ca ent˜o a soma de todas as aproxima¸˜es ser´ a co a h {(y0 + 4y1 + y2 ) + (y2 + 4y3 + y4 ) + . . . + (y2n−2 + 4y2n−1 + y2n )} , 3 que ´ igual a e h {y0 + 4y1 + 2y2 + 4y3 + 2y4 + . . . + 2y2n−2 + 4y2n−1 + y2n } . 3 Para exemplificar e comparar com o M´todo dos Trap´zios, calculemos a mesma e e 1 1 integral 0 1+x2 dx usando a mesma divis˜o de intervalinhos (neste caso ´ poss´ porque a e ıvel o n´mero de intervalos ´ par). Usaremos 9 algarismos significativos. Obtemos u e 2(y2 + y4 + y6 + y8 ) = 6.33731529 e 4(y1 + y3 + y5 + y7 + y9 ) = 15.7246294 , de modo que
1 0

1 0.1 dx ≈ (1.0000 + 6.33731529 + 15.7246294 + 0.50000) , 2 1+x 3
1

ou seja, π=4
0

1 dx ≈ 3.14159263 , 1 + x2

valor que difere de π por menos do que 3 × 10−8 , resultado bem melhor do que o obtido no M´todo dos Trap´zios. e e

Cap´ ıtulo 16

Estimativa do erro nos m´todos e de integra¸˜o ca
16.1 F´rmulas de erro e compara¸˜o dos m´todos o ca e

Aparentemente o M´todo de Simpson se revela melhor do que o M´todo dos Trap´zios. e e e Para verificar melhor essa afirma¸˜o, olhemos para a seguinte tabela, que mostra os ca c´lculos feitos para se obter π com os dois m´todos para os valores de h iguais a 1 , a e 4 1 1 1 , 16 e 32 . Os c´lculos foram feitos com o software Maple, usando-se 20 algarismos a 8 significativos. A primeira coluna indica o n´mero de intervalos da parti¸˜o e a coluna u ca seguinte o tamanho de cada intervalo da parti¸˜o. Na terceira e na quinta os valores ca de T (h) e S(h), multiplicados por quatro (para comparar com π). Usaremos T (h) 1 1 para denotar a estimativa da integral 0 1+x2 dx com o M´todo dos Trap´zios e S(h) a e e estimativa da mesma integral com o M´todo de Simpson. Na quarta e na sexta est˜o as e a diferen¸as, em valor absoluto, entre os n´meros obtidos e o valor c u π = 3.1415926535897932385 , fornecido pelo Maple com 20 algarismos significativos. n h 4T (h) |4T (h) − π| 4S(h) |4S(h) − π| 4 1/4 3.131 0.011 3.141569 2.4 × 10−5 8 1/8 3.1390 0.0026 3.14159250 1.5 × 10−7 16 1/16 3.14094 0.00065 3.1415926512 2.4 × 10−9 32 1/32 3.14143 0.00016 3.141592653552 3.7 × 10−11 Na tabela podemos observar que o M´todo de Simpson n˜o s´ ´ mais eficiente (come a oe pare na primeira linha, por exemplo), mas a cada vez que h ´ diminu´ a sua efic´cia ´ e ıdo a e 193

´ 194 CAP´ ITULO 16. ESTIMATIVA DO ERRO NOS METODOS DE INTEGRACAO ¸˜ proporcionalmente maior do que a do M´todo dos Trap´zios. A cada vez que h ´ redue e e zido por 2, o erro no M´todo dos Trap´zios diminui aproximadamente 4 vezes, enquanto e e que no M´todo de Simpson, neste exemplo, a redu¸˜o ´ de pelo menos 64 vezes!! e ca e Devotaremos o restante deste Cap´ ıtulo ` discuss˜o da efic´cia dos dois m´todos. a a a e Gostar´ ıamos de ter, por exemplo, uma estimativa m´xima para o erro cometido na a integra¸˜o de uma fun¸˜o f : [a, b] → R, dado o tamanho h dos intervalos da parti¸˜o. ca ca ca Essa estimativa ser´ chamada de ET , no caso do M´todo dos Trap´zios, e ES , no caso a e e do M´todo de Simpson. Tanto ET como ES depender˜o de f , do tamanho total b − a e a do intervalo de integra¸˜o e de h. No entanto, assumiremos f e o intervalo [a, b] como ca fixos, de forma que freq¨entemente exprimiremos apenas a dependˆncia em rela¸˜o a h, u e ca dessas estimativas: ET = ET (h) e ES = ES (h). O significado de ET (h) (e similarmente de ES (h)) ´ o seguinte. Se calcularmos e T (h), ent˜o saberemos, com absoluta certeza, que o valor correto da integral est´ entre a a ´ T (h) − ET (h) e T (h) + ET (h). E claro que essa interpreta¸˜o n˜o leva em conta os ca a erros de arredondamento cometidos nos c´lculos, devidos ` limita¸˜o no n´mero de a a ca u algarismos significativos. Por outro lado, o conhecimento pr´vio do erro inerente ao e processo permite avaliar com quantos algarismos significativos deve ser feita a integra¸˜o. ca Al´m disso ´ importante salientar que ET (h) (e similarmente ES (h)) n˜o mede a e e a real diferen¸a entre o valor obtido T (h) e o valor verdadeiro. Essa diferen¸a ´, com c c e certeza, apenas menor do que ET (h). Por exemplo, na determina¸˜o de π que fizemos ca acima, o c´lculo de ET (h) e ES (h), de acordo com as f´rmulas que discutiremos abaixo, a o leva a valores muito maiores do que a real diferen¸a entre os valores de T (h) e S(h) e c o valor verdadeiro. Pode-se dizer ent˜o que a previs˜o de erro foi bastante pessimista. a a Em outros casos, por´m, ela pode acabar sendo realista, e isso vai depender muito da e fun¸˜o integranda. ca Na Se¸˜o seguinte nos preocuparemos em calcular ET (h) e ES (h). Usaremos trˆs ca e abordagens diferentes para o problema, obtendo ao final resultados similares, e adotaremos, na pr´tica, aquelas que julgaremos ser as melhores estimativas. Os resultados a est˜o expostos na tabela abaixo. a 1a | · |b − a|h2 | · |b − a|h3 2a
1 2 12 max |f | · |b − a|h 1 (iv) | · |b − a|h4 180 max |f

3a
5 2 12 max |f | · |b − a|h 1 (iv) | · |b − a|h4 45 max |f

ET (h) ES (h)

1 12 max |f 1 24 max |f

Para entendermos melhor o significado desta tabela, percebemos primeiro que todas as f´rmulas s˜o do tipo Chβ , com β igual a 2, 3 ou 4. Nas constantes, est´ presente o o a a m´ximo valor absoluto de certas derivadas de f , m´ximo que deve ser avaliado dentro a a do intervalo [a, b]. Quem ser´ menor, C2 h2 , C3 h3 ou C4 h4 ? Ou colocando em n´meros, a t´ a u ıtulo de exemplo, quem ´ menor, 1000h4 ou 0.2h2 ? e

´ 16.2. APLICACAO DAS FORMULAS DE ERRO ¸˜

195

Evidentemente n˜o h´ resposta a essa pergunta, pois se h = 0.5, por exemplo, ent˜o a a a 4 = 62.5, que ´ (bem) maior do que 0.2h2 = 0.05, mas por outro lado se h = 0.01 1000h e ent˜o 1000h4 = 10−5 , menor do que 0.2h2 = 2 × 10−5 . Na verdade, mesmo que 1000h4 a seja maior do que 0.2h2 , para certos valores de h, isso nunca vai acontecer se h for suficientemente pequeno, pois 1000h4 = 5000h2 → 0 0.2h2 quando h tende a zero. O limite indica mais ainda do que isso: a raz˜o entre 1000h4 e a 2 ´ tanto menor quanto menor for h. Se, por exemplo, quisermos que 1000h4 seja 0.2h e 100 vezes menor do que 0.2h2 , ent˜o basta tomar h menor do que 0.0014 (truncamento a de 500000−1/2 ). Nesta linha de racioc´ ınio, quando h tende a ser pequeno, as melhores estimativas tendem a ser aquelas que tˆm mais alta potˆncia de h. S˜o melhores nesse sentido, e e a portanto, as estimativas do M´todo de Simpson, e dentre elas a segunda, pois, dentre e as duas com h4 , ´ aquela com menor constante multiplicativa: e ES (h) = 1 max |f (iv) | · |b − a|h4 . 180

As trˆs estimativas para o M´todo dos Trap´zios s˜o da mesma ordem (h2 ), sendo a e e e a terceira um pouco pior do que as outras duas, por apresentar constante multiplicativa maior. Ent˜o a 1 ET (h) = max |f | · |b − a|h2 . 12 Essas duas estimativas s˜o as que iremos adotar nas aplica¸˜es pr´ticas. a co a

16.2

Aplica¸˜o das f´rmulas de erro ca o
2

Nesta Se¸˜o aplicaremos as f´rmulas de erro no c´lculo de ca o a ln 2 =
1

1 dx . x

Suponha que queiramos calcular ln 2 com precis˜o de 5 × 10−5 , ou seja queremos que a o valor correto esteja a menos de 5 × 10−5 do valor estimado. Usaremos as f´rmulas o de erro para determinar em quanto devemos fixar h para obter estimativas com essa precis˜o. a Examinemos primeiramente o M´todo dos Trap´zios. Sua f´rmula de erro envolve e e o |b−a|, que ´ igual a 1, e o maior valor absoluto da derivada segunda de f nesse intervalo. e 1 1 2 Ora, como f (x) = x , ent˜o f (x) = − x2 e f (x) = x3 . Logo f (x) ´ uma fun¸˜o positiva a e ca

´ 196 CAP´ ITULO 16. ESTIMATIVA DO ERRO NOS METODOS DE INTEGRACAO ¸˜ e decrescente no intervalo considerado, atingindo seu m´ximo necessariamente em x = 1. a O valor desse m´ximo ´ f (1) = 2. Assim sendo, a f´rmula de erro fica a e o ET (h) = h2 . 6

Essa f´rmula representa o erro m´ximo da estimativa. Portanto, se quisermos gao a rantir que o erro da estimativa seja menor do que 5 × 10−5 , basta garantir que ET (h) seja menor do que esse valor, isto ´, gostar´ e ıamos de escolher h de tal forma que h2 < 5 × 10−5 . 6 Isto ´ o mesmo que pedir e h< 30 × 10−5 = 0.01732 . . .

At´ agora, a conclus˜o ´ que qualquer valor de h menor do que 0.01732 . . . servir´ e a e a para obter a estimativa com a precis˜o desejada, usando-se o M´todo dos Trap´zios. a e e Acontece que h tamb´m deve ser tal que o comprimento total do intervalo seja um e m´ltiplo inteiro de h. Ou seja, devemos ter u b−a =n. h Como b − a = 1 e h < 0.01732 . . . ent˜o a n= b−a 1 1 = > = 57.7 . . . , h h 0.01732 . . .

implicando que n deve ser maior ou igual a 58. Ent˜o precisamos dividir o intervalo a [1, 2] em no m´ ınimo 58 intervalinhos para conseguir a estimativa desejada, com a precis˜o a requerida! E o M´todo de Simpson, ser´ que ´ mais vantajoso neste exemplo? Ser´ que com e a e a menos intervalos na parti¸˜o conseguiremos garantir a mesma precis˜o? Agora temos ca a que nos concentrar na f´rmula de ES (h), que depende do m´ximo valor absoluto da o a 2 6 24 quarta derivada, entre 1 e 2. Como f (x) = x3 , temos f (x) = − x4 e f (iv) (x) = x5 . Essa fun¸˜o ´ positiva e decrescente em [1, 2] de forma que seu m´ximo ´ atingido em ca e a e x = 1 e ´ igual a 24. Ent˜o e a ES (h) = 24 4 2 h = h4 . 180 15

Como queremos ES (h) < 5 × 10−5 , basta tomar h tal que 2 4 h < 5 × 10−5 , 15

´ 16.2. APLICACAO DAS FORMULAS DE ERRO ¸˜ isto ´, e h< 15 · 5 × 10−5 2
1 4

197

= 0.139 . . . .

Ent˜o o n´mero n de intervalos da parti¸˜o ser´ maior do que a u ca a 1 = 7.18 . . . 0.139 . . . Aqui deve-se prestar uma aten¸˜o a mais: no M´todo de Simpson o n´mero de intervalos ca e u deve ser par. Portanto n = 8 j´ ´ uma boa escolha! ae Como o M´todo de Simpson se revela consideravelmente menos trabalhoso para se e obter, garantidamente, a precis˜o desejada, fa¸amos os c´lculos correspondentes. Mas a c a antes teremos que determinar o n´mero de algarismos significativos ou de casas decimais u envolvidos. Na verdade, como se trata de delimitar um erro absoluto, ´ melhor considerar e fixo o n´mero de casas decimais. u Observe que o erro em cada arredondamento de f (xi ) ´ de, no m´ximo, 0.5 × 10−N , e a onde N ´ o n´mero de casas decimais utilizadas. Usando N casas decimais, a soma e u f (x0 ) + 4f (x1 ) + 2f (x2 ) + 4f (x3 ) + 2f (x4 ) + 4f (x5 ) + 2f (x6 ) + 4f (x7 ) + f (x8 ) acumular´ no m´ximo 20 vezes esse valor (20 ´ a soma dos coeficientes dos f (xi )’s). O a a e erro acumulado ser´, no m´ximo, 10×10−N , ou seja, da ordem da casa decimal anterior. a a 1 e Acontece que depois essa soma ser´ multiplicada por h , que ´ igual a 24 , de forma que a 3 o erro m´ximo por arredondamento no valor final ficar´ menor do que 0.5 × 10−N (por a a exemplo, se usarmos 5 casas decimais o arredondamento provocar´ erro de no m´ximo a a −5 ). Pela f´rmula de Simpson, a ado¸˜o de n = 8 nos leva a um erro m´ximo 0.5 × 10 o ca a 2 15 1 8
4

ES (h) =

≈ 3.26 × 10−5 ,

de forma que um erro adicional de 10−5 por arredondamento n˜o nos tirar´ da margem a a previamente delimitada de 5×10−5 . O que nos faz concluir que o uso de 5 casas decimais ´ suficiente para os c´lculos. e a Ent˜o vamos a eles! A tabela abaixo mostra os valores de f nos pontos da parti¸˜o, a ca arredondados para 5 casas decimais.

´ 198 CAP´ ITULO 16. ESTIMATIVA DO ERRO NOS METODOS DE INTEGRACAO ¸˜

i 0 1 2 3 4 5 6 7 8 Obtemos

xi 1.000 1.125 1.250 1.375 1.500 1.625 1.750 1.875 2.000

f (xi ) 1.00000 0.88889 0.80000 0.72727 0.66667 0.61538 0.57143 0.53333 0.50000

1 1 S( ) = × 16.63568 = 0.69315 , 8 24 que difere do valor verdadeiro por menos do que 10−5 , dentro, portanto e com folga, da precis˜o pedida. a Exerc´ ıcio. A integral
2 1

ex dx x

´ maior ou menor do que 3? Justifique sua resposta e dˆ uma estimativa para a integral. e e Exerc´ ıcio. Investigue, de maneira geral, como deve se dar a escolha do n´mero de u casas decimais dos c´lculos do M´todo dos Trap´zios e do M´todo de Simpson, baseado a e e e no que foi feito no exemplo acima, e levando em conta a precis˜o que se quer atingir no a resultado final. Proponha uma “receita” para essa escolha. Exerc´ ıcio. Determine uma f´rmula para S( h ) em fun¸˜o de T (h) e T ( h ). o ca 2 2 Exerc´ ıcio. Procure integrar numericamente fun¸˜es cujas primitivas sejam conhecico das, de forma a comparar os resultados obtidos com os valores exatos. Examine a 2 integra¸˜o num´rica da fun¸˜o Gaussiana e−x , largamente utilizada em Probabilidade ca e ca e Estat´ ıstica. Exerc´ ıcio. Considere a fun¸˜o ln x = 1 1 dt. O objetivo deste exerc´ ca ıcio ´ ver que o e t n´mero e pode ser obtido atrav´s da solu¸˜o num´rica da equa¸˜o ln x = 1, usando o u e ca e ca M´todo de Newton e calculando logaritmos somente atrav´s da defini¸˜o. e e ca 1. Determine a fun¸˜o de itera¸˜o ϕ do M´todo de Newton, que resolve esta equa¸˜o ca ca e ca numericamente. 2. Determine o erro m´ximo de se calcular ln x, para 1 ≤ x ≤ 3, usando o M´todo a e de Simpson com 8 intervalos.
x

´ 16.2. APLICACAO DAS FORMULAS DE ERRO ¸˜

199

3. Tome x0 = 3 e calcule x1 = ϕ(x0 ) (use 4 casas decimais para os valores de 1 , e 8 t intervalos para a integra¸˜o). ca 4. Calcule x2 = ϕ(x1 ), com 4 casas decimais e 8 intervalos. 5. Discuta uma estrat´gia que vocˆ adotaria para mostrar que e est´, com certeza, e e a no intervalo [2.716, 2.720]. Exerc´ ıcio. Usando o m´todo de m´ e ınimos quadrados, aproxime e−x por um polinˆmio o de grau 4 no intervalo [−1, 1]. Para isso, use a fam´ de polinˆmios ortogonais (nesse ılia o 3 intervalo) g0 (x) = 1, g1 (x) = x, g2 (x) = x2 − 1 , g3 (x) = x3 − 3 x, g4 (x) = x4 − 6 x2 + 35 , 3 5 7 2 8 8 sabendo que < g0 , g0 >= 2, < g1 , g1 >= 3 , < g2 , g2 >= 45 , < g3 , g3 >= 175 , < 128 g4 , g4 >= 11025 . Observe que ser´ preciso calcular a integral gaussiana. Outras integrais a ou ser˜o nulas (porque o integrando ´ ´ a e ımpar) ou podem ser reduzidas, por sucessivas integra¸˜es por partes, a integral gaussiana. Estime os valores num´ricos usando uma co ` e aproxima¸˜o para essa integral. ca Exerc´ ıcio. Considere a equa¸˜o f (x) = ca
x −t2 dt 0 e
2

− 1 = 0.

1. Defina a fun¸˜o de itera¸˜o ϕ do M´todo de Newton para resolver a equa¸˜o. ca ca e ca 2. Com x0 = 1, obtenha x1 = ϕ(x0 ).

´ 200 CAP´ ITULO 16. ESTIMATIVA DO ERRO NOS METODOS DE INTEGRACAO ¸˜

Cap´ ıtulo 17

Obten¸˜o das f´rmulas de erro ca o
Como dissemos no Cap´ ıtulo anterior, dedicaremos este Cap´ ıtulo para a obten¸˜o das ca f´rmulas de erro mencionadas. Seguiremos trˆs abordagens, com a finalidade de propor o e diferentes vis˜es de como se pode estimar a integral da diferen¸a entre a fun¸˜o verdao c ca deira e o polinˆmio interpolador que a substitui. O leitor reconhecer´ que a primeira o a abordagem ´ a continua¸˜o natural das estimativas do erro de interpola¸˜o obtidas no e ca ca Cap´ ıtulo 12. Todas as f´rmulas de erro mencionadas pressup˜em que os intervalos da parti¸˜o o o ca sejam de igual tamanho. Poder´ ıamos, evidentemente, determinar f´rmulas mais gerais o que levassem em conta um espa¸amento irregular, mas sem d´vida isso seria um pouco c u menos interessante. As id´ias da primeira abordagem, por exemplo, podem ser seguidas e no caso geral, se isso for da necessidade do leitor, mas deve-se atentar para o fato de que as f´rmulas de erro n˜o ser˜o t˜o boas quanto as outras. o a a a Em todas as abordagens, a f´rmula de erro ´ obtida primeiro para uma unidade o e b´sica. No M´todo dos Trap´zios, a unidade b´sica ´ um intervalo [xi , xi+1 ], de tamanho a e e a e h. Para cada intervalo obt´m-se uma f´rmula eT (h), e como o n´mero de intervalos ´ e o u e igual a n ent˜o a ET (h) = neT (h) . Acontece que n tamb´m ´ o tamanho total do intervalo de integra¸˜o dividido por h, de e e ca forma que |b − a| ET (h) = eT (h) . h Por exemplo, na primeira e na segunda abordagens obteremos 1 eT (h) = max |f |h3 , 12 logo |b − a| ET (h) = max |f |h2 . 12 201

202

´ CAP´ ITULO 17. OBTENCAO DAS FORMULAS DE ERRO ¸˜

Observe que tamb´m h´ uma perda em rela¸˜o ` constante multiplicativa, pois na e a ca a f´rmula de eT (h) o m´ximo valor absoluto da segunda derivada ´ obtido dentro da o a e unidade b´sica, enquanto que na f´rmula de ET (h) trata-se do m´ximo ao longo de a o a todo o intervalo de integra¸˜o. ca J´ no M´todo de Simpson, a unidade b´sica ´ um intervalo da forma [x2i , x2i+2 ], que a e a e tem tamanho 2h. Em cada intervalo desses troca-se f por um polinˆmio quadr´tico e o a examina-se a diferen¸a produzida na integra¸˜o. A f´rmula de erro para a unidade ser´ c ca o a |b−a| denotada por eS (h). Como s˜o n unidades b´sicas e 2n = h , resulta que a a ES (h) = neS (h) = |b − a| eS (h) . 2h

As f´rmulas de erro das unidades b´sicas (de acordo com a abordagem) est˜o contidas o a a na tabela abaixo. 1a 1 3 12 max |f | · h 1 4 12 max |f | · h 2a 1 3 12 max |f | · h 1 (iv) | · h5 90 max |f 3a 5 3 12 max |f | · h 2 (iv) | · h5 45 max |f

eT (h) eS (h)

Finalmente, vale notar que, via uma mudan¸a de coordenadas, os intervalos [xi , xi+1 ] c do M´todo dos Trap´zios podem ser tomados como sendo [0, h], e as unidades [x2i , x2i+2 ] e e do M´todo de Simpson podem ser tomados como sendo [−h, h]. e No M´todo dos Trap´zios, definimos p(x) como o polinˆmio interpolador de grau 1 e e o por (0, f (0)) e (h, f (h)), e procuramos limitar a diferen¸a c
h

∆(h) =
0

(f (x) − p(x)) dx ,

em valor absoluto, por eT (h). No M´todo de Simpson, definimos p(x) como sendo o polinˆmio quadr´tico por e o a (−h, f (−h)), (0, f (0)) e (h, f (h)), e procuramos limitar a diferen¸a c
h

∆(h) =
−h

(f (x) − p(x)) dx ,

em valor absoluto, por eS (h).

17.1

Primeira Abordagem - M´todo dos Trap´zios e e

1 Mostraremos que |∆(h)| ≤ 12 max |f | · h3 (vide tabela acima). De acordo com o exposto no Cap´ ıtulo 12, a diferen¸a c

f (x) − p(x)

´ 17.2. PRIMEIRA ABORDAGEM - METODO DE SIMPSON pode ser limitada, em [0, h], da seguinte forma: −cx(h − x) ≤ f (x) − p(x) ≤ cx(h − x) , onde c= Ent˜o, pela defini¸˜o de ∆(h), temos a ca
h

203

1 max |f | . 2! [0,h]

|∆(h)| ≤ c
0

x(h − x)dx = c

h3 , 6

e segue o que quer´ ıamos demonstrar.

17.2

Primeira Abordagem - M´todo de Simpson e

1 Mostraremos que |∆(h)| ≤ 12 max |f | · h4 . De acordo com o Cap´ ıtulo 12, |f (x) − p(x)| ≤ c|q(x)| , onde q(x) = (x + h)x(h − x) 1 e c = 3! max[−h,h] |f | . Ent˜o a h

|∆(h)| ≤ c
−h

|q(x)|dx .

Como q ´ fun¸˜o ´ e ca ımpar, |q| ´ fun¸˜o par, de forma que e ca
h

|∆(h)| ≤ 2c
0

|q(x)|dx .

Al´m disso, em [0, h] a fun¸˜o q ´ positiva, e portanto s´ precisamos obter a integral e ca e o
h

(x + h)x(h − x)dx =
0

h4 . 4

Logo c |∆(h)| ≤ h4 , 2 de onde segue o que quer´ ıamos demonstrar.

204

´ CAP´ ITULO 17. OBTENCAO DAS FORMULAS DE ERRO ¸˜

17.3

Segunda Abordagem - M´todo dos Trap´zios e e

1 Iremos mostrar que |∆(h)| ≤ 12 max |f | · h3 . h Queremos avaliar o erro de se aproximar a integral 0 f (x)dx pela ´rea do trap´zio a e h a 2 (f (0) + f (h)). Para isso, consideraremos h como vari´vel e estimaremos o erro ∆(h) em fun¸˜o dessa vari´vel. Temos ca a h

∆(h) =
0

f (x)dx −

h (f (0) + f (h)) . 2

Se P for uma primitiva de f (isto ´, P (x) = f (x)), ent˜o e a ∆(h) = P (h) − P (0) − h (f (0) + f (h)) . 2

Observamos ent˜o que ∆(0) = 0, o que era de se esperar, pois nenhum erro ´ cometido a e se h ´ nulo. Se pudermos limitar a derivada de ∆(h) ent˜o limitaremos seu crescimento, e a em fun¸˜o do tamanho de h. Temos ca ∆ (h) = P (h) − Como P = f , ent˜o a 1 h (f (h) − f (0)) − f (h) . 2 2 Notamos tamb´m que ∆ (0) = 0, o que nos sugere derivar ainda mais uma vez, para e delimitar o crescimento de ∆ : ∆ (h) = h ∆ (h) = − f (h) . 2 Ent˜o a |∆ (h)| ≤ C onde C = max |f | .
[0,h]

1 h (f (0) + f (h)) − f (h) . 2 2

h , 2

Com o crescimento controlado de ∆ , voltamos a integrar:
h h

∆ (h) = ∆ (0) +
0

∆ (t)dt =
0 h

∆ (t)dt .

Logo
h

|∆ (h)| ≤
0

|∆ (t)|dt ≤ C
0

t h2 dt = C . 2 4

´ 17.4. SEGUNDA ABORDAGEM - METODO DE SIMPSON Integrando mais uma vez, |∆(h)| ≤ C
0 h 2 t

205

4

dt = (max |f |) ·

h3 . 12

Como quer´ ıamos demonstrar!

17.4

Segunda Abordagem - M´todo de Simpson e
1 90

Queremos mostrar que |∆(h)| ≤ Temos que avaliar
h

max |f (iv) | · h5 .

∆(h) =
−h

f (x)dx −

h (f (−h) + 4f (0) + f (h)) . 3

Os passos s˜o semelhantes `queles do M´todo dos Trap´zios, mas agora temos que a a e e derivar e integrar uma vez a mais. Derivando trˆs vezes chegamos a e ∆ (h) = − h f (h) − f (−h) , 3

com ∆(0) = ∆ (0) = ∆ (0) = 0. Pelo Teorema do Valor M´dio, existe ξ = ξ(h) no e intervalo [−h, +h] tal que f (h) − f (−h) = f (iv) (ξ) · 2h . Portanto, se C = max |f (iv) |
[−h,h]

ent˜o a |∆ (h)| ≤ C e, por integra¸˜es sucessivas, co |∆ (h)| ≤ C |∆ (h)| ≤ C |∆(h)| ≤ C 2h3 , 9 h4 , 18 h5 . 90 2h2 , 3

206

´ CAP´ ITULO 17. OBTENCAO DAS FORMULAS DE ERRO ¸˜

17.5

Terceira Abordagem - M´todo dos Trap´zios e e

5 Obteremos |∆(h)| ≤ 12 max |f | · h3 . Nesta abordagem do c´lculo de erro, levamos em conta a expans˜o em Taylor da a a fun¸˜o f (vide Apˆndice B. O m´todo ´ um pouco mais intuitivo que os anteriores, mas ca e e e produz resultados um pouco piores (n˜o na ordem de h, mas nas constantes multiplicaa tivas). Como na Segunda Abordagem, olhamos para h

∆(h) =
0

f (x)dx −

h [f (h) + f (0)] . 2

A fun¸˜o f se escreve como ca f (x) = f (0) + f (0)x + R(x) , onde |R(x)| ≤ max |f | J´ que f (0)h = a
h 0 f

x2 . 2

(0)dx, temos
h

∆(h) =
0 h

f (x) − f (0)dx + f (0)xdx −
0

h [f (0) − f (h)] 2
h

=

h [f (0) − f (h)] + 2

R(x)dx
0

= f (0)

h h2 h − [f (h) − f (0)] + R(x)dx 2 2 0 h h2 h = f (0) − f (0)h + R(h) + R(x)dx 2 2 0 h h = − R(h) + R(x)dx . 2 0

Usando a estimativa em |R(x)|, conclu´ ımos que |∆(h)| ≤ max |f | 5h3 . 12

17.6

Terceira Abordagem - M´todo de Simpson e
2 45

Iremos mostrar que ∆(h) ≤

max |f (iv) | · h5 .

´ 17.6. TERCEIRA ABORDAGEM - METODO DE SIMPSON

207

Em primeiro lugar, observaremos que o M´todo de Simpson, aplicado em pares de e intervalos iguais, ´ exato para polinˆmios c´bicos. e o u Sem perda de generalidade, suponha que queiramos integrar g(x) = ax3 + bx2 + cx + d em [−h, h]. O M´todo de Simpson nos d´ a aproxima¸˜o e a ca h (g(−h) + 4g(0) + g(h)) . 3 Mas g(−h) + g(h) = 2bh2 + 2d . Al´m disso, g(0) = d, logo e h bh2 (g(−h) + 4g(0) + g(h)) = 2h( + d) . 3 3 Por outro lado, vemos que esse ´ exatamente o valor da integral, pois e
h

(ax3 + bx2 + cx + d)dx = a
−h

x4 h x3 x2 |−h + b |h + c |h + dxh . −h 4 3 −h 2 −h

O primeiro e o terceiro termos s˜o nulos, logo a integral vale a 2b h3 + 2dh , 3

que ´ o mesmo valor dado pelo M´todo de Simpson. e e Agora consideremos uma fun¸˜o f suficientemente diferenci´vel. Ela pode ser escrita ca a como seu polinˆmio de Taylor de ordem 3 mais um resto R(x): o f (x) = f (0) + f (0)x + onde f (0) 2 f (0) 3 x + x + R(x) , 2 3!

R(x) −→ 0 x3 quando x → 0. Chamaremos de p3 o polinˆmio de Taylor, de forma que o f (x) − p3 (x) = R(x) . Adiante teremos uma f´rmula mais expl´ o ıcita para esse resto, que permitir´ qualificar as a constantes envolvidas.

208

´ CAP´ ITULO 17. OBTENCAO DAS FORMULAS DE ERRO ¸˜
h −h f (x)dx,

Queremos avaliar o erro cometido pelo M´todo de Simpson para integrar e isto ´, olharemos para a diferen¸a e c
h

∆(h) =
−h

f (x)dx −

h (f (−h) + 4f (0) + f (h)) . 3

Sabendo que o M´todo de Simpson ´ exato para grau trˆs, temos e e e
h

p3 (x)dx =
−h

h (p3 (−h) + 4p3 (0) + p3 (h)) , 3

logo, lembrando que p3 (0) = f (0) e que f (x) − p3 (x) = R(x),
h

∆(h) =
−h

R(x)dx −

h (R(−h) + R(h)) . 3

Usaremos a seguinte estimativa para o resto: |R(x)| ≤ max |f (iv) |
[0,x]

x4 , 4! 2h5 5! 2h5 . 45

de forma que
h

R(x)dx ≤ max |f (iv) |
−h [−h,h]

e |∆(h)| ≤ max |f (iv) |
[−h,h]

2h5 2h5 + 5! 3 · 4!

= max |f (iv) |
[−h,h]

Parte VI

Equa¸˜es Diferenciais co

209

Cap´ ıtulo 18

Breve introdu¸˜o `s equa¸˜es ca a co diferenciais
18.1 Introdu¸˜o ca

Uma equa¸˜o diferencial de uma vari´vel real ´ uma equa¸˜o em que a inc´gnita ´ uma ca a e ca o e fun¸˜o real x : [a, b] → R. Esta equa¸˜o coloca em rela¸˜o a fun¸˜o e sua derivada. ca ca ca ca O tipo mais simples de equa¸˜o diferencial ´ o problema de achar uma primitiva de ca e uma dada fun¸˜o. Por exemplo, ca x (t) = f (t) , ∀t ∈ [a, b] , significa que a derivada da fun¸˜o x(t) ´ igual a f (t) para todo t entre a e b. Em ca e outras palavras, a fun¸˜o x(t) ´ uma primitiva da fun¸˜o f (t). Na nota¸˜o de Leibniz, ca e ca ca escrevemos x(t) = f (t)dt + C , indicando que todas as primitivas de f diferem por uma constante. Mais precisamente, se F1 e F2 s˜o primitivas de f ent˜o existe uma constante C, que depende ´ claro de F1 a a e e F2 , tal que F1 (t) − F2 (t) = C para todo t ∈ I. Uma primitiva em particular pode ser dada pela integral indefinida
t

F (t) =
t0

f (s)ds ,

para um determinado t0 ∈ [a, b]. Neste caso, F (t0 ) = 0. Se adicionarmos ` equa¸˜o diferencial x (t) = f (t) a exigˆncia de que x(t0 ) = x0 , a ca e ent˜o fica determinada a unica primitiva que ´ solu¸˜o desse problema: a ´ e ca
t

x(t) = x0 +
t0

f (s)ds .

211

212

CAP´ ITULO 18. BREVE INTRODUCAO AS EQUACOES DIFERENCIAIS ¸˜ ` ¸˜

Essa exigˆncia extra ´ conhecida como um problema de valor inicial. e e Em geral as equa¸˜es diferenciais n˜o se resumem t˜o simplesmente a um problema co a a de integra¸˜o. Por exemplo, a derivada de x(t) pode depender de x(t), como na seguinte ca equa¸˜o: ca x (t) = x(t) , t ∈ R . ´ a E f´cil verificar que x(t) = et ´ solu¸˜o. Ela n˜o ´ a unica, pois x(t) = cet tamb´m ´ e ca a e ´ e e solu¸˜o da equa¸˜o diferencial para todo c ∈ R. No entanto, se impusermos o problema ca ca de valor inicial x(t0 ) = x0 e supusermos x(t) = cet , ent˜o a constante c fica univocamente a determinada por x0 = x(t0 ) = cet0 , donde x(t) = x0 et−t0 . Ao contr´rio do exemplo anterior, n˜o ´ claro ainda neste ponto que x(t) seja a unica a a e ´ solu¸˜o da equa¸˜o diferencial x (t) = x(t) satisfazendo o problema de valor inicial ca ca x(t0 ) = x0 , pois a princ´ ıpio poderia haver uma solu¸˜o que n˜o fosse da forma x(t) = ca a cet . De fato veremos que esse n˜o ´ o caso, pelo menos para essa equa¸˜o (vide a e ca Subse¸˜o 18.3.2). ca De modo geral, uma equa¸˜o diferencial ´ colocada assim: a derivada de x(t) depende ca e de t e de x(t), isto ´, e x (t) = f (t, x(t)) , onde f aqui denota uma fun¸˜o de duas vari´veis (n˜o nos preocuparemos por enquanto ca a a com o dom´ ınio da fun¸˜o f ). Na nota¸˜o compacta escreve-se ca ca x = f (t, x) , ficando impl´ ıcito o argumento das fun¸˜es x e x . Por exemplo, x = t2 sen(tx) significa co 2 sen(tx(t)). As fun¸˜es x(t) que verificam x (t) = f (t, x(t)) s˜o chamadas x (t) = t co a solu¸˜es da equa¸˜o diferencial. co ca Al´m disso, como nos dois exemplos acima, pode-se colocar o problema de valor e inicial x(t0 ) = x0 . O problema de achar x(t) tal que x = f (t, x) x(t0 ) = x0 ´ comumente conhecido como problema de Cauchy. e Dizemos que uma equa¸˜o diferencial ´ autˆnoma quando f s´ depende de x, isto ca e o o ´ f (t, x) = X(x) (na medida do poss´ e ıvel usaremos a letra f para as equa¸˜es n˜o co a autˆnomas e X para as autˆnomas, por quest˜es de tradi¸˜o). o o o ca

ˆ ´ 18.2. SOLUCAO DE EQUACOES AUTONOMAS E SEPARAVEIS ¸˜ ¸˜

213

Pensando no caso autˆnomo, suponha que j´ conhe¸amos uma solu¸˜o para o proo a c ca blema de Cauchy x = X(x), x(0) = x0 . Seja x(t) essa solu¸˜o, isto ´ x (t) = X(˜(t)) ˜ ca e ˜ x e x(0) = x0 . Ent˜o ´ f´cil ver que x(t) = x(t − t0 ) ´ solu¸˜o do problema de Cauchy ˜ a e a ˜ e ca x = X(x), x(t0 ) = x0 . Em outras palavras, no caso de equa¸˜es autˆnomas basta co o estudar o problema de Cauchy com t0 = 0. Al´m das equa¸˜es autˆnomas, temos tamb´m as equa¸˜es separ´veis, onde f (t, x) e co o e co a ´ o produto de uma fun¸˜o que s´ depende de t por uma fun¸˜o que s´ depende de x: e ca o ca o f (t, x) = g(t)X(x) . Veremos adiante que equa¸˜es autˆnomas e separ´veis s˜o facilmente sol´veis, a co o a a u menos de integra¸˜es e invers˜es, isto ´, podemos escrever suas solu¸˜es em termos de co o e co inversas de primitivas de fun¸˜es elementares, mas eventualmente essas solu¸˜es n˜o co co a podem ser obtidas explicitamente.

18.2

Solu¸˜o de equa¸˜es autˆnomas e separ´veis ca co o a

Em primeiro lugar observamos que, de algum modo, equa¸˜es autˆnomas representam co o um caso particular das equa¸˜es separ´veis. Pois uma equa¸˜o autˆnoma x = X(x) co a ca o ˙ tamb´m se escreve como x = g(t)X(x), se tomarmos g(t) ≡ 1. e ˙ Para discutir as solu¸˜es de x = g(t)X(x), observamos primeiramente que se X(x∗ ) = co ˙ ∗ ´ solu¸˜o, pois x(t) ≡ 0 e g(t)X(x(t)) = g(t)X(x∗ ) ≡ 0. Um ponto x∗ 0 ent˜o x(t) ≡ x e a ca ˙ dessa forma ´ chamado de singularidade da equa¸˜o. e ca Est´ fora do escopo destas notas, mas com condi¸˜es razo´veis sobre g e X (por a co a exemplo, g cont´ ınua e X diferenci´vel e com derivada cont´ a ınua), pode-se mostrar que se x(t) = x∗ para algum instante t ent˜o x(t) ≡ x∗ . Em outras palavras, n˜o h´ como a a a uma solu¸˜o x(t) chegar e sair de uma singularidade. ca Na verdade, sob essas mesmas hip´teses ´ poss´ mostrar que duas solu¸˜es quaiso e ıvel co quer x(t) e x(t) ou s˜o idˆnticas (x(t) = x(t), para todo t) ou nunca se cruzam ˜ a e ˜ (x(t) = x(t), para todo t). ˜ Fora das singularidades, podemos encontrar a solu¸˜o da seguinte maneira. Primeiro ca escrevemos a equa¸˜o com a vari´vel t explicitada: ca a x(t) = g(t)X(x(t)) . ˙ O instante inicial ´ t0 , e gostar´ e ıamos de saber x(t) se x(t0 ) = x0 (problema de Cauchy). Como estamos supondo que x(t) n˜o passa por singularidade, ent˜o X(x(t)) n˜o se a a a anula, e podemos dividir os dois lados da equa¸˜o por X(x(t)), e integrar de t0 a t: ca
t t0

1 x(s)ds = ˙ X(x(s))

t

g(s)ds .
t0

214

CAP´ ITULO 18. BREVE INTRODUCAO AS EQUACOES DIFERENCIAIS ¸˜ ` ¸˜

No lado esquerdo fazemos a substitui¸˜o u = x(s), de forma que du = x(s)ds. Ent˜o ca ˙ a
x(t) x0

1 du = X(u)

t

g(s)ds .
t0

A partir da´ podemos, em teoria, encontrar x(t), mas sua express˜o expl´ ı a ıcita depender´ de podermos cumprir certas etapas. Por exemplo, se acharmos uma primitiva F a 1 para X e uma primitiva G para g, ent˜o a equa¸˜o ficar´ a ca a F (x(t)) = F (x0 ) + G(t) − G(t0 ) . Se, al´m disso, conseguirmos achar a inversa de F (pelo menos numa regi˜o delimitada e a 1 entre duas singularidades isso em tese ´ poss´ e ıvel, pois F = X n˜o troca de sinal, mas a achar uma express˜o expl´ a ıcita ´ outra coisa!), teremos e x(t) = F −1 (F (x0 ) + G(t) − G(t0 )) .

18.3

Alguns exemplos

Nesta Se¸˜o examinaremos alguns exemplos de equa¸˜es diferenciais que surgem da ca co modelagem de problemas do “mundo real”, e discutiremos sua solu¸˜o. ca

18.3.1

Naftalinas

Na Subse¸˜o 5.3.3 abordamos a perda de material de uma bolinha de naftalina em fun¸˜o ca ca do tempo, e chegamos ` conclus˜o de que seu raio r(t) obedece ` equa¸˜o a a a ca r(t) = −α , ˙ onde β ´ uma constante positiva. e Podemos dizer que a equa¸˜o ´ autˆnoma, mas ´ muito mais do que isso. Ela diz que ca e o e r(t) ´ uma fun¸˜o de derivada constante negativa, ou seja, ´ uma fun¸˜o afim. Portanto e ca e ca r(t) = r0 − αt , onde r0 = r(0). Este caso n˜o passa de uma simples primitiviza¸˜o. a ca

18.3.2

Crescimento populacional a taxas constantes

Se tomarmos t como sendo o tempo, e x(t) como sendo a popula¸˜o de determinada ca esp´cie no instante t, podemos, por aproxima¸˜o, supor que x(t) varia continuamente e ca (hip´tese razo´vel se a popula¸˜o ´ grande). A taxa de varia¸˜o da popula¸˜o ´ medida o a ca e ca ca e

18.3. ALGUNS EXEMPLOS

215

percentualmente, isto ´, mede-se o incremento (ou decrescimento) x(t + h) − x(t), do e instante t para o instante t + h, e divide-se pela popula¸˜o que havia no instante t: ca x(t + h) − x(t) . x(t) Mesmo assim, esse valor ´ muito dependente do tempo h decorrido entre os dois instantes, e sendo muito mais razo´vel, portanto, dividir tudo por h. Fazendo depois o limite quando a h tende a zero, ficamos com x (t) α(t) = , x(t) onde α(t) indica a taxa de crescimento instantˆneo no instante t. a A hip´tese Malthusiana de crescimento ´ que α(t) seja constante, isto ´, α(t) ≡ α, o o e e que leva ` equa¸˜o a ca x (t) = αx(t) . Podemos deduzir a solu¸˜o, sem apelar para “chutes”. A unica singularidade da ca ´ equa¸˜o ´ x∗ = 0, e queremos achar as solu¸˜es que n˜o passam pelo zero. Ent˜o ca e co a a
x(t) x0

1 du = α(t − t0 ) , u

portanto log x(t) = log x0 + α(t − t0 ) e, exponenciando os dois lados, x(t) = x0 eα(t−t0 ) . Um modelo como este se presta tamb´m ` modelagem do decaimento radioativo, e a onde a taxa de decaimento de uma amostra de um is´topo ´ proporcional ` quantidade o e a desse mesmo is´topo. o

18.3.3

P´ra-quedista a

Al´m do crescimento populacional e do decaimento radioativo, equa¸˜es do tipo x = αx e co ˙ explicam o comportamento da velocidade do p´ra-quedista. Se v(t) ´ velocidade do a e p´ra-quedista (supondo positiva se estiver indo de cima para baixo), ent˜o v(t) ´ a a a ˙ e acelera¸˜o, e pela Segunda Lei de Newton vale ca mv(t) = mg − αv(t) , ˙

216

CAP´ ITULO 18. BREVE INTRODUCAO AS EQUACOES DIFERENCIAIS ¸˜ ` ¸˜

onde o termo αv(t) corresponde ` for¸a de resistˆncia exercida em sentido contr´rio ao do a c e a movimento e de intensidade proporcional ` velocidade. Isso d´ uma equa¸˜o autˆnoma a a ca o em v(t). A velocidade de equil´ ıbrio v ∗ ´ definida como sendo aquela para a qual a resultante e ∗ = mg . Se definirmos w(t) = v(t) − v ∗ (ou seja, a diferen¸a de for¸as ´ nula, portanto v c e c α entre a velocidade e a velocidade de equil´ ıbrio, em cada instante), teremos mw(t) = mv(t) = mg − αv(t) = αv ∗ − αv(t) = −αw(t) . ˙ ˙ Como
α m g v∗ ,

=

ent˜o a w(t) = w0 e− v∗ t ,
g

se w0 = w(0). A equa¸˜o tamb´m poderia ser resolvida diretamente, pela integra¸˜o ca e ca
v(t) v0

m dv = t , mg − αv

seguindo o m´todo sugerido para equa¸˜es autˆnomas e separ´veis. e co o a

18.3.4

Crescimento populacional com restri¸˜es de espa¸o co c

Um modelo ligeiramente mais realista do que o proposto na Subse¸˜o 18.3.2 levaria em ca conta a limita¸˜o de espa¸o e alimento que uma popula¸˜o enfrenta quando se torna ca c ca muito grande. Esse modelo preveria que: (i) se a popula¸˜o for muito grande, a taxa ca de crescimento α(t) deveria ser negativa, e tanto mais negativa quanto maior for a popula¸˜o; (ii) se a popula¸˜o for muito pequena, a taxa de crescimento deveria ser ca ca positiva, e tanto mais positiva quanto menor for a popula¸˜o (respeitando ´ claro a ca e velocidade de reprodu¸˜o m´xima da esp´cie). ca a e Nesse modelo, portanto, α(t) dependeria exclusivamente da popula¸˜o, sendo mais ca justo escrever α(t) = h(x(t)) . A fun¸˜o h(x) assumiria um valor positivo em x = 0, correspondente a uma taxa de ca crescimento ideal da popula¸˜o, sem limita¸˜o f´ ca ca ısica alguma. Essa taxa decresceria continuamente com o aumento de x, ao ponto de se tornar negativa para x grande. Por exemplo, h(x) = a − bx, com a e b positivos, satisfaz a essas exigˆncias. Neste e caso, ter´ ıamos a equa¸˜o diferencial ca x (t) = x(t) (a − bx(t)) ou, em nota¸˜o compacta, ca x = x(a − bx) . Poder´ ıamos resolver explicitamente esta equa¸ao, mas achamos que ela se presta c˜ muito mais a um exame qualitativo, do qual iremos falar na pr´xima Se¸˜o. o ca

18.3. ALGUNS EXEMPLOS

217

18.3.5

Caten´ria a

J´ falamos mais de uma vez sobre a caten´ria, mas em nenhum momento justificamos a a porque uma corda (ou corrente) pendurada por dois pontos assume o formato de um cosseno hiperb´lico. o A dedu¸˜o mais razo´vel passa por uma equa¸˜o diferencial. Vejamos. ca a ca Em primeiro lugar, chamaremos de t a coordenada horizontal e de x a coordenada vertical no plano da corda, para manter a nota¸˜o que usamos at´ este ca e ´ comum o emprego de y e x ponto da exposi¸˜o. E ca para essas vari´veis, de forma que a equa¸˜o diferena ca cial se escreva como y = f (x, y), mas n˜o o faremos a para evitar confus˜o. A origem das coordenadas ser´ a a colocada sobre o ponto de m´ ınimo da corda.
  ¡   ¡

x
¢ £ ¢ £   ¢ £ ¢ £ ¡   ¡

t

Como estamos modelando uma corda parada, temos um equil´ ıbrio de for¸as sobre a c corda, que podemos investigar. As for¸as existem realmente, porque h´ o peso da corda c a agindo verticalmente e as for¸as de tens˜o para contrabalan¸ar. c a c Faremos a an´lise desse equil´ a ıbrio de for¸as sobre um segmento da corda, entre o c ponto (0, 0) e um ponto arbitr´rio (t, x(t)) da corda, onde x(t) indica a fun¸˜o cujo a ca gr´fico coincide com seu formato. a Para se obter a for¸a peso agindo sobre esse peda¸o, ´ preciso calcular seu compric c e mento e multiplicar pela densidade linear da corda (que suporemos constante e igual a um certo n´mero δ). O comprimento l(t) do gr´fico de x(t) entre 0 e t ´ dado pela u a e integral
t

l(t) =
0

1 + x (s)2 ds .

As for¸as de tens˜o agem no segmento tangencialmente ` corda. Estando j´ equic a a a libradas localmente no interior do segmento, restam as for¸as nos extremos. Em (0, 0) c ´ uma for¸a horizontal, de intensidade f0 desconhecida. Em (t, x(t)) ´ uma for¸a de e c e c intensidade f (t) desconhecida, inclinada com ˆngulo θ = θ(t) cuja tangente ´ igual a a e x (t). Do equil´ ıbrio de for¸as horizontal obt´m-se c e f0 = f (t) cos θ e do equil´ ıbrio vertical δgl(t) = f (t)senθ .

218

CAP´ ITULO 18. BREVE INTRODUCAO AS EQUACOES DIFERENCIAIS ¸˜ ` ¸˜

Dividindo a segunda equa¸˜o pela primeira ficamos com ca tan θ = δg l(t) . f0

J´ sabemos que tan θ = x (t) e que l(t) ´ dado por uma integral. Derivando ambos os a e lados obtemos x (t) = c 1 + x (t)2 , onde c = δg . Essa ´ uma equa¸˜o autˆnoma onde a fun¸˜o inc´gnita ´ x (t). e ca o ca o e f0 ´ f´cil ver que x (t) = senh(ct) ´ solu¸˜o. Pois derivando mais uma vez obteremos E a e ca x (t) = c cosh(ct) e, por outro lado, 1 + senh2 (ct) = cosh2 (ct) = cosh(ct) .

Al´m disso, x (t) = senh(ct) verifica x (0) = 0, isto ´, a inclina¸˜o da corda ´ zero no e e ca e ponto de m´ ınimo. Agora basta integrar x (t) para obter x(t). Como x(0) = 0 ent˜o a x(t) = 1 (cosh(ct) − 1) . c

18.3.6

Escoamento de um copo furado

Neste exemplo, imagine um copo cheio d’´gua, com um buraco no fundo, por onde a a a ´gua escoa. Suponha que no instante t = 0 a altura do n´ da ´gua seja igual a h0 . ıvel a Como evolui com o tempo o n´ ıvel h da ´gua? Em quanto tempo o copo se esvaziar´ a a completamente? Se o copo tem um formato diferente, por exemplo, seu raio aumenta ou diminui conforme a altura, como se comporta a fun¸˜o h(t)? ca Com algum grau de empirismo, ´ poss´ e ıvel modelar o problema atrav´s de uma e equa¸˜o diferencial. ca O dado emp´ ırico refere-se ` taxa de sa´ de ´gua pelo buraco, medida em volume a ıda a por unidade de tempo. Espera-se primeiramente que ela seja proporcional ` ´rea do a a buraco (a qual chamaremos de a0 ), mas n˜o, a princ´ a ıpio, da sua forma. Tamb´m n˜o se e a espera, em primeira aproxima¸˜o, que ela dependa do formato do copo. Por outro lado, ca ela deve ser proporcional ` velocidade da ´gua que sai do buraco. Essa sua velocidade, a a por sua vez, dependeria da altura h, como se a coluna de ´gua ca´ a ısse dessa altura, √ alcan¸ando uma velocidade da ordem de h (lembre-se que para um corpo em queda c livre, a partir do repouso, a velocidade ´ proporcional ` raiz da distˆncia j´ percorrida). e a a a Ent˜o a taxa de varia¸˜o do volume do copo seria a ca V (t) = −ca0 h(t) .

18.3. ALGUNS EXEMPLOS

219

Por outro lado, o decrescimento do volume implica no decrescimento do n´ ıvel da a ´gua h. Observe, no entanto, que quanto maior for a ´rea da se¸˜o transversal ao copo a ca na altura h menor ser´ o decrescimento do n´ a ıvel, para uma mesma perda de volume. Ou pensando inversamente, se o copo for muito fino ` altura h ent˜o o n´ cair´ mais a a ıvel a rapidamente. Para quantificar isso, notemos que o volume de ´gua ´ completamente determinado a e pelo n´ h atrav´s da fun¸˜o ıvel e ca
h

V (h) =
0

A(u)du ,

onde A(h) ´ a fun¸˜o que d´ a ´rea da se¸˜o correspondente ` altura h. Pelo Teorema e ca a a ca a Fundamental do C´lculo, a V (h) = A(h) . A fun¸˜o V (t) resulta ent˜o da fun¸˜o h(t) pela rela¸˜o ca a ca ca V (t) ≡ V (h(t)) . Logo, pela Regra da Cadeia, V (t) = V (h(t))h (t) = A(h(t))h (t) . Juntando com a equa¸˜o emp´ ca ırica acima, temos A(h(t))h (t) = −ca0 h(t) ,

que ´ uma equa¸˜o diferencial autˆnoma, se a escrevermos na forma tradicional: e ca o √ h h = −ca0 . A(h) O exemplo mais simples ´ o copo reto, quer dizer, cujas se¸˜es horizontais tˆm todas e co e a mesma ´rea A. Neste caso, a equa¸˜o se reduz a a ca h (t) = − Tomando t0 = 0 e h(0) = h0 , temos
h(t) h0

ca0 A

h(t) .

1 √ dh = −βt , h

onde β =

ca0 A .

O lado esquerdo pode ser integrado: 2( h(t) − h0 ) = −βt ,

220

CAP´ ITULO 18. BREVE INTRODUCAO AS EQUACOES DIFERENCIAIS ¸˜ ` ¸˜

e h(t) pode ser isolado: h(t) = β h0 − t 2
2

.

Portanto h(t) ´ uma fun¸˜o quadr´tica em t, que vale h0 em t = 0, e se anula no seu e ca a √ 2 h0 ponto de m´ ınimo, t = β .

18.3.7

Dada ϕ do M´todo de Newton, quem ´ f ? e e

Um problema te´rico que pode ser resolvido com o aux´ de equa¸˜es diferenciais o ılio co separ´veis ´ o de achar a fun¸˜o f que, no M´todo de Newton, gera uma dada fun¸˜o a e ca e ca de itera¸˜o ϕ. Em outras palavras, dada a fun¸˜o ϕ e sabendo-se que ca ca ϕ(x) = x − f (x) , f (x)

achar f . Manipulando, obtemos a equa¸˜o separ´vel ca a f (x) = 1 f (x) , x − ϕ(x)

onde x faz o papel de t e f o papel de x. A equa¸˜o s´ est´ definida fora dos pontos ca o a fixos de ϕ, mas uma an´lise criteriosa mostra que as solu¸˜es muitas vezes se estendem a co continuamente a esses pontos (´ um bom exerc´ e ıcio!).

18.3.8

Transferˆncia de calor e

Um corpo est´ em contato com um grande reservat´rio, cuja temperatura ´ uma fun¸˜o a o e ca do tempo T (t). Seja x(t) a temperatura do corpo no instante t. A cada instante, a varia¸˜o da temperatura do corpo ´ proporcional ` diferen¸a entre sua temperatura e a ca e a c temperatura do reservat´rio. Equacionando: o x(t) = α (T (t) − x(t)) , ˙ onde α ´ uma constante positiva. e Aqui n˜o se trata mais de uma equa¸˜o autˆnoma, pois se escrevermos x = f (t, x) a ca o ˙ ent˜o a f (t, x) = α (T (t) − x) . Esta equa¸˜o tampouco ´ separ´vel, mas ainda assim ´ simples o suficiente para ser ca e a e sol´vel. Ela se enquadra no conjunto das equa¸˜es do tipo u co x = a(t)x + b(t) , ˙

ˆ 18.4. ENTENDIMENTO QUALITATIVO DE EQUACOES AUTONOMAS ¸˜

221

cuja solu¸˜o discutiremos abaixo. ca O caso em que b(t) = 0 ´ um caso particular de equa¸˜o separ´vel, que tem solu¸˜o e ca a ca
t

x(t) = x0 exp{
t0

a(s)ds}

se x0 = x(t0 ). Para o problema afim x = a(t)x + b(t), x(t0 ) = x0 , com solu¸˜o x(t), usamos um ˙ ca truque: examinamos a derivada de y(t) = x(t)e y(t) = x(t)e ˙ ˙

t t0

t t0

a(s)ds

. Obtemos
t t0

a(s)ds

− x(t)a(t)e

a(s)ds

,

por´m substituindo x(t) por a(t)x(t) + b(t), ficamos com e ˙ y(t) = b(t)e ˙ e portanto
t −
t t0

a(s)ds

,

y(t) = y(t0 ) +
t0

b(r)e

r t0

a(s)ds

dr .

Como y(t0 ) = x0 , obtemos a solu¸˜o ca x(t) = e
t t0

a(s)ds

t

x0 +
t0

b(r)e

r t0

a(s)ds

dr

.

A unicidade ´ garantida pela unicidade da integra¸˜o de y com a condi¸˜o y(t0 ) = x0 . e ca ˙ ca

18.4

Entendimento qualitativo de equa¸˜es autˆnomas co o

At´ agora n˜o discutimos nada sobre a representa¸˜o gr´fica das solu¸˜es de uma equa¸˜o e a ca a co ca diferencial, mas naturalmente o mais ´bvio ´ desenharmos o gr´fico da solu¸˜o x(t). O o e a ca que veremos nesta Se¸˜o ´ que ´ muito f´cil desenharmos o esbo¸o de algumas solu¸˜es ca e e a c co (variando a condi¸˜o inicial) de equa¸˜es autˆnomas, sem resolvˆ-las! ca co o e Para come¸ar, vimos que se x∗ ´ uma singularidade da equa¸˜o autˆnoma x = X(x), c e ca o ˙ ent˜o x(t) ≡ x∗ ´ solu¸˜o. Num diagrama em que coloquemos t na abscissa e x na a e ca ordenada, esse tipo de solu¸˜o ´ uma linha reta horizontal ` altura de x∗ . Portanto ca e a as primeiras solu¸˜es que podemos identificar na equa¸˜o s˜o essas solu¸˜es constantes, co ca a co cada uma correspondendo a um zero da fun¸˜o X. ca Em cada intervalo entre duas singularidades e nos intervalos entre a ultima sin´ gularidade e o infinito, o sinal de X n˜o muda, pois se mudasse haveria uma outra a

222

CAP´ ITULO 18. BREVE INTRODUCAO AS EQUACOES DIFERENCIAIS ¸˜ ` ¸˜

singularidade no intervalo, pelo Teorema de Bolzano. Seja I um intervalo desses, e suponha que x(t) est´ em I. Como X(x(t)) = x(t), ent˜o o sinal de x(t) ´ o mesmo que o a ˙ a ˙ e sinal de X(x(t)), e esse sinal ´ sempre o mesmo enquanto x(t) estiver em I. e Como as solu¸˜es n˜o cruzam as singularidades (isto ´ garantido por um Teorema, co a e se X for deriv´vel e com derivada cont´ a ınua), uma solu¸˜o x(t) est´ sempre confinada a ca a um mesmo intervalo, o que implica que o sinal de x(t) ´ sempre o mesmo, para todo t. ˙ e O que ´ o mesmo que dizer que x(t) ou ´ crescente ou ´ decrescente, e uma ou outra e e e op¸˜o ser´ determinada pelo sinal de X no intervalo onde est´ confinada a solu¸˜o. ca a a ca Na figura abaixo, por exemplo, ilustramos esquematicamente uma fun¸˜o (arbitr´ria) ca a ∗ , x∗ , x∗ e x∗ . A fun¸˜o ´ negativa ` esquerda de x∗ X(x), com quatro singularidades x1 2 3 ca e a 4 1 e entre x∗ e x∗ , e positiva ` direita de x∗ e nos intervalos entre x∗ e x∗ e entre x∗ e x∗ . a 3 4 4 1 2 2 3

X(x)

x* 1

x* 2
x

x* 3

x* 4

O diagrama abaixo ilustra algumas solu¸˜es (uma para cada intervalo). co

As solu¸˜es s˜o assint´ticas, para t indo a mais ou menos infinito, `s singularidades co a o a (de fato, em equa¸˜es autˆnomas, as solu¸˜es n˜o podem ser assint´ticas a pontos que co o co a o n˜o sejam singularidades). a Uma maneira mais compacta de se representar qualitativamente o comportamento das solu¸˜es dessa equa¸˜o diferencial ´ usando um diagrama onde s´ entra a reta dos co ca e o x’s, como mostra a figura abaixo. As setas entre as singularidades indicam para que lado as solu¸˜es naquele intervalo tendem quando t tende a infinito. co

§ ¦§ ¦ ¤¥ ¤

¥
£ ¢£ ¢ § ¦§ ¦ ¥ ¤¥ ¤ ¡  ¡   ¢ ¢

£

¢£

¢

¡  ¡  

x

x* 4 x* 3 x* 2 t x* 1

´ 18.5. EQUACOES DIFERENCIAIS COM MAIS VARIAVEIS ¸˜

223

x* 1

x* 2

x* 3

x* 4

Assim fica f´cil, por exemplo, entender a equa¸˜o de crescimento populacional a ca x = x(a − bx) . ˙ Como essa equa¸˜o s´ faz sentido para x ≥ 0, nos restringiremos a essa regi˜o. Nessa ca o a ∗ = 0 e x∗ = a . Isso regi˜o, a fun¸˜o X(x) = x(a − bx) tem duas singularidades: x1 a ca 2 b significa que a popula¸˜o nula e a popula¸˜o igual a x∗ s˜o solu¸˜es de equil´ ca ca a co ıbrio. 2 Entre as duas, X(x) ´ positiva e ` direita de x∗ a fun¸˜o X(x) ´ negativa. Isso e a ca e 2 significa que se a popula¸˜o inicial est´ abaixo da popula¸˜o de equil´ ca a ca ıbrio ent˜o tena der´ a aumentar assintoticamente at´ o equil´ a e ıbrio x∗ . E se come¸ar acima decrescer´ c a 2 assintoticamente at´ o mesmo equil´ e ıbrio.

18.5

Equa¸˜es diferenciais com mais vari´veis co a

Existem tamb´m os chamados sistemas de equa¸˜es diferenciais (de primeira ordem), e co que envolvem simultaneamente duas ou mais fun¸˜es e suas respectivas primeiras derico vadas. Por exemplo, x = 3x2 − y + 3 ˙ . y = sin x + yx3 ˙ Neste caso, achar uma solu¸˜o para o sistema significa encontrar duas fun¸˜es x(t) e ca co y(t) que simultaneamente verifiquem x(t) = 3x(t)2 − y(t) + 3 ˙ y(t) = sin x(t) + y(t)x(t)3 ˙ .

Esse tipo de problema parece ser bastante ´rido ` primeira vista, mas se torna mais a a atraente se o interpretarmos do ponto de vista geom´trico. e Podemos olhar as fun¸˜es x(t) e y(t) como as coordeco nadas de uma curva γ : t → (x(t), y(t)) no plano xy. A derivada da curva γ, dada por γ(t) = (x(t), y(t)), ˙ ˙ ˙ representa o vetor tangente ` curva. O sistema de a equa¸˜es diferenciais diz ent˜o que, em cada instante co a t, o vetor tangente ` curva γ(t) dado por γ(t) = a ˙ (x(t), y(t)) tem que ser exatamente igual ao vetor ˙ ˙ (3x(t)2 − y(t) + 3, sin x(t) + y(t)x(t)3 ).
y

§ ¦§ ¦ ¤¥

¥ ¤ £ ¢£ ¢  ¡  

¡

x

. γ(t) x γ (t)=(x(t),y(t))

224

CAP´ ITULO 18. BREVE INTRODUCAO AS EQUACOES DIFERENCIAIS ¸˜ ` ¸˜

Perceba que esse sistema de equa¸˜es diferenciais j´ fixa, para cada ponto (x, y), co a qual ser´ o vetor tangente de uma solu¸˜o que por ali passar em algum instante: (3x2 − a ca y + 3, sin x + yx3 ). Essa fun¸˜o que associa para cada ponto um vetor (que deve ser ca sempre tangente `s solu¸˜es do sistema) ´ chamada de campo de vetores. Uma maneira a co e de esbo¸ar um campo de vetores ´ mostrando os vetores correspondentes a alguns pontos c e do plano (x, y).

y

x

Para um sistema de equa¸˜es diferenciais como esse tamb´m podemos estabelecer o co e problema de Cauchy: dado um ponto (x0 , y0 ) e um instante t0 achar uma solu¸˜o γ(t) ca tal que γ(t0 ) = (x0 , y0 ). Modelos de crescimento populacional envolvendo mais do que uma esp´cie s˜o um e a t´ ıpico exemplo de sistemas de equa¸˜es diferenciais. Cada vari´vel do sistema representa co a a popula¸˜o de uma esp´cie. Por exemplo, se x(t) for a popula¸˜o de tartarugas e y(t) ca e ca for a popula¸˜o de jacar´s, podemos tecer as seguintes considera¸˜es. Em primeiro ca e co lugar, a popula¸˜o de tartarugas n˜o precisa dos jacar´s para sobreviver, mas tem suas ca a e limita¸˜es de espa¸o e alimento usuais. Como na Subse¸˜o 18.3.4, a taxa de crescimento co c ca proporcional da popula¸˜o ´ uma fun¸˜o parecida com A−Bx(t), mas deve-se descontar ca e ca um termo tanto maior quanto maior for a popula¸˜o de jacar´s, por exemplo Cy(t). ca e Ent˜o ter´ a ıamos x (t) = A − Bx(t) − Cy(t) . x(t) Por outro lado, supondo que os jacar´s precisem se alimentar das tartarugas para soe breviverem, sua taxa de crescimento proporcional na ausˆncia de tartarugas ´ negativa, e e e ser´ mais negativa ainda se sua popula¸˜o for muito grande, tamb´m por problemas a ca e relativos ` limita¸˜o do espa¸o. Por outro lado, quanto maior for a popula¸˜o de tara ca c ca tarugas, mais facilidade a popula¸˜o ter´ para crescer. Dessas considera¸˜es, ´ razo´vel ca a co e a supor que y (t) = −D − Ey(t) + F x(t) . y(t)

´ 18.5. EQUACOES DIFERENCIAIS COM MAIS VARIAVEIS ¸˜ Juntando tudo, ficamos com o sistema x = (A − Bx − Cy)x ˙ y = (−D − Ey + F x)y ˙ .

225

´ E claro que todo esse racioc´ ´ hipot´tico, pois carece de dados reais. No entanto, ınio e e cada situa¸˜o onde duas ou mais esp´cies se influenciam mutuamente, seja numa rela¸˜o ca e ca predador-presa seja numa rela¸˜o de competi¸˜o pelo mesmo alimento ou espa¸o, esse ca ca c tipo de modelagem pode ser feito. Outra classe de exemplos relevante vem das equa¸˜es diferenciais de segunda ordem co (isto ´, que envolvem a segunda derivada), por exemplo, qualquer equa¸˜o do tipo e ca x = Γ(x, x). Com um pequeno truque podemos transformar essa equa¸˜o num sistema ¨ ˙ ca de duas equa¸˜es de primeira ordem. Basta definir uma segunda vari´vel (na verdade, co a uma segunda fun¸˜o do tempo) v(t) = x(t), de forma que x(t) = v(t). Ent˜o ficamos ca ˙ ¨ ˙ a com as duas equa¸˜es co x = v ˙ , v = Γ(x, v) ˙ onde a primeira equa¸˜o vem simplesmente da defini¸˜o de v. ca ca Por exemplo, tomemos a equa¸˜o do pˆndulo ca e g ¨ θ = − senθ . l ˙ Chamando ω(t) = θ(t), ficamos com ˙ θ = ω ω = − g senθ ˙ l .

226

CAP´ ITULO 18. BREVE INTRODUCAO AS EQUACOES DIFERENCIAIS ¸˜ ` ¸˜

Cap´ ıtulo 19

Solu¸˜o num´rica de equa¸˜es ca e co diferenciais
Neste Cap´ ıtulo estudaremos algumas maneiras de se resolver numericamente uma equa¸˜o ca diferencial do tipo x = f (t, x), e veremos no final como generalizar as id´ias para di˙ e mens˜es mais altas. o

19.1

Equa¸˜es separ´veis co a

Para come¸ar, veremos nesta Se¸˜o que j´ dispomos dos m´todos necess´rios para resolc ca a e a vermos as equa¸˜es separ´veis. Os m´todos propostos posteriormente ser˜o, entretanto, co a e a muito mais gerais e, inclusive, mais pr´ticos. a Como vimos no Cap´ ıtulo anterior, se x = g(t)X(x) for a equa¸˜o, F for uma primitiva ˙ ca 1 de X e G for uma primitiva de g, ent˜o a x(t) = F −1 (F (x0 ) + G(t) − G(t0 )) . Acontece que nem sempre ´ poss´ obter integrais expl´ e ıvel ıcitas, e aqui temos que resolver duas. Resolvendo ou n˜o, uma delas ainda ter´ que ser invertida, o que tamb´m ´ dif´ a a e e ıcil ou imposs´ ıvel, na maioria dos casos. Todos esses problemas poderiam ser solucionados numericamente. A primitiva de g pode ser definida como
t

G(t) =
t0

g(s)ds ,
1 X

de forma que G(t0 ) = 0 e, da mesma forma, a primitiva de como x 1 F (x) = du , x0 X(u) 227

se define naturalmente

228

´ CAP´ ITULO 19. SOLUCAO NUMERICA DE EQUACOES DIFERENCIAIS ¸˜ ¸˜

resultando em F (x0 ) = 0, e portanto x(t) = F −1 (G(t)) . As duas primitivas podem ser obtidas nos pontos que se quiser, usando os m´todos de e integra¸˜o num´rica discutidos na Parte V. J´ ao problema de invers˜o da fun¸˜o F ca e a a ca pode-se aplicar o M´todo de Newton. e Para sermos mais precisos, imagine que queiramos calcular x(t) num determinado instante t, e todas as opera¸˜es mencionadas acima tenham que ser feitas numericamente. co Em primeiro lugar, calculamos G(t) usando integra¸˜o num´rica (com a melhor precis˜o ca e a poss´ ıvel, ´ claro), e depois teremos que achar x(t) tal que e F (x(t)) = G(t) , tomando-se os cuidados necess´rios para que seja buscada a solu¸˜o que nos interessa. a ca Ou seja, x(t) ´ solu¸˜o da equa¸˜o e ca ca f (x) = F (x) − G(t) = 0 . Como F (x) =
1 X(x) ,

a fun¸˜o de itera¸˜o para o M´todo de Newton fica ca ca e ϕ(x) = x − X(x) (F (x) − G(t)) .

Com um palpite inicial x0 temos que iterar a fun¸˜o ϕ, de forma a obter x1 , x2 , etc, at´ ca e chegar pr´ximo ` raiz com a precis˜o desejada. Ent˜o o a a a
xk

xk+1 = xk − X(xk ) −G(t) +
x0

1 du X(u)

,

isto ´, em cada etapa da itera¸˜o ´ preciso estimar F (xk ) usando algum m´todo de e ca e e integra¸˜o num´rica. O erro pode, em tese, ser controlado, usando-se estimativas de ca e erro das duas integra¸˜es e tamb´m do M´todo de Newton. co e e Se o procedimento acima for implementado no computador e x(t) for calculado para v´rios valores de t, em seq¨ˆncia, o melhor palpite para a condi¸˜o inicial x0 do M´todo a ue ca e de Newton ´ o valor de x(t) obtido na etapa anterior, pois a fun¸˜o x(t) ´ cont´ e ca e ınua.

19.2

Discretiza¸˜o ca

O fundamento da solu¸˜o num´rica de equa¸˜es diferenciais x = f (t, x) ´ a discretiza¸˜o ca e co ˙ e ca da vari´vel t. Se [a, b] ´ o intervalo onde gostar´ a e ıamos de achar a solu¸˜o x(t) ent˜o ca a dividimos esse intervalo com uma parti¸˜o regular ca a = t0 < t1 < t2 < . . . < tn−1 < tn = b ,

19.2. DISCRETIZACAO ¸˜

229

onde a diferen¸a entre pontos sucessivos ´ igual a h (o chamado passo). “Determinar c e numericamente” a fun¸˜o x(t) significa achar, com precis˜o suficientemente boa, os ca a valores x0 = x(t0 ), x1 = x(t1 ), . . ., xn = x(tn ). Em suma, a solu¸˜o num´rica de uma equa¸˜o diferencial peca, inevitavelmente, pela ca e ca imprecis˜o em t, pois os valores de x(t) s˜o calculados somente para uma quantidade a a finita de valores de t, e pela imprecis˜o na determina¸˜o de x(t), sendo que ambas podem a ca ser minimizadas, segundo os m´todos propostos abaixo, pela redu¸˜o do passo h. Ao e ca mesmo tempo esta ´, para muitos prop´sitos, a melhor alternativa dispon´ e o ıvel, visto que a maioria das equa¸˜es diferenciais n˜o admite solu¸˜o expl´ co a ca ıcita, em termos de fun¸˜es co elementares. Em todos os m´todos, obteremos a solu¸˜o num´rica por recorrˆncia. A condi¸˜o e ca e e ca inicial x0 = x(t0 ) ´ dada (sen˜o n˜o h´ sentido no problema, uma vez que existe uma e a a a infinidade de solu¸˜es da mesma equa¸˜o), e a partir dela obter-se-˜o, em sucess˜o, os co ca a a valores de x1 , x2 , etc. Como tk+1 = tk + h (para k = 0, . . . , n − 1), a estimativa de xk+1 = x(tk+1 ) pode ser obtida a partir da estimativa de xk = x(tk ) por meio de uma expans˜o em Taylor. a Para simplificar a nota¸˜o, denotaremos tk por t, a partir de agora, e xk por x(t), ou `s ca a vezes simplesmente por x. Ent˜o a x(t + h) = x(t) + x (t)h + 1 (m) 1 x (t)h2 + . . . + x (t)hm + o(hm ) , 2! m!

onde o(hm ) denota o resto da expans˜o, que vai a zero quando h tende a zero mesmo se a m (tipicamente, termos de ordem m + 1 ou mais). E claro que a fun¸˜o ´ dividido por h ca precisa ser diferenci´vel at´ ordem m para valer essa express˜o, mas em geral esse ´ o a e a e caso. A express˜o significa que, quanto menor for h, melhor o polinˆmio em h (sem o a o resto) aproximar´ x(t + h). Al´m disso, geralmente mas nem sempre, quanto maior for a e m melhor ser´ a aproxima¸˜o e, principalmente, mais efetiva se tornar´ a redu¸˜o de h a ca a ca como instrumento para melhorar a precis˜o de x(t + h) atrav´s do polinˆmio. a e o As derivadas de x(t) se relacionam com as derivadas de f atrav´s da equa¸˜o difee ca rencial, s´ que f ´ uma fun¸˜o de duas vari´veis, t e x. Por exemplo, da pr´pria equa¸˜o o e ca a o ca temos a igualdade x (t) = f (t, x(t)). Quanto ` segunda derivada temos a d ∂f ∂f f (t, x(t)) = (t, x(t)) + x (t) (t, x(t)) , dt ∂t ∂x pela Regra da Cadeia aplicada a fun¸˜es de duas vari´veis, e portanto co a x (t) = ∂f ∂f (t, x(t)) + f (t, x(t)) (t, x(t)) . ∂t ∂t Aqui vale, antes de prosseguirmos, simplificar a nota¸˜o. Na maioria dos casos, as ca derivadas de x ser˜o calculadas em t, e todas as derivadas parciais de f , de qualquer a x (t) =

230

´ CAP´ ITULO 19. SOLUCAO NUMERICA DE EQUACOES DIFERENCIAIS ¸˜ ¸˜

ordem, em (t, x(t)). Assim, s´ indicaremos explicitamente o ponto onde est˜o sendo o a calculadas as fun¸˜es e suas derivadas se esses pontos n˜o forem t e x(t). Nessa nota¸˜o, co a ca teremos ∂f ∂f x = +f . ∂t ∂x Para simplificarmos mais ainda, denotaremos as derivadas parciais de f com um sub´ ındice. Por exemplo, ∂2f . ftx = ∂t∂x Na hip´tese de que f seja uma fun¸˜o de classe C 2 (jarg˜o matem´tico para dizer que f o ca a a tem derivadas parciais at´ segunda ordem, e cont´ e ınuas), ent˜o um teorema (o Teorema a de Schwarz) garante que a ordem das derivadas parciais pode ser trocada, de forma que podemos trocar ftx por fxt , ou ainda fttx por fxtt ou ftxt . Segue dessas considera¸˜es que a express˜o de x(t + h) pode ser escrita, at´ a ordem co a e desejada, inteiramente em fun¸˜o de f e de suas derivadas parciais. Neste Cap´ ca ıtulo, iremos tecer considera¸˜es somente at´ ordem 4, mesmo assim precisaremos da express˜o co e a de x e x . Para obter x temos que derivar em rela¸˜o a t a express˜o de x , ca a lembrando sempre que cada derivada parcial de f tamb´m depende de (t, x(t)), e que a e regra da Cadeia deve ser usada. Ent˜o, como x = ft + f fx , obtemos a x = ftt + f ftx + (ft + f fx )fx + f (fxt + f fxx ) e, reagrupando os termos, x = ft fx + f (fx )2 + ftt + 2f ftx + f 2 fxx ,
2 onde fx denota (fx )2 e n˜o a derivada em rela¸˜o a x de f composta com si mesma. a ca Sugere-se fortemente ao leitor que verifique essa conta, e em seguida que verifique que

x

2 3 = ft fx + f fx +

+fx ftt + 3ft ftx + 5f fx ftx + 3f ft fxx + 4f 2 fx fxx + fttt + 3f fttx + 3f 2 ftxx + f 3 fxxx . Ao leitor assustado com o tamanho das express˜es recomenda-se paciˆncia: ao final, o e todos os algoritmos que derivar˜o desta linha de racioc´ a ınio ser˜o extremamente sima ples! Veremos nas pr´ximas Se¸˜es de que maneira podemos implementar as id´ias ora o co e expostas, e suas poss´ ıveis varia¸˜es. co

19.3

O M´todo de Euler e

O M´todo de Euler consiste em tomar a aproxima¸˜o de primeira ordem de x(t + h): e ca x(t + h) = x(t) + x (t)h + o(h) .

´ 19.3. O METODO DE EULER

231

O resto o(h) indica que o erro em tomar essa aproxima¸˜o ser´, em geral, da ordem de ca a 2 ou mais. h Como x = f , o M´todo sugere que, na pr´tica, obtenhamos xk+1 = x(tk+1 ) = e a x(tk + h) como xk+1 = xk + f (tk , xk )h . A itera¸˜o a partir de x0 acumular´ um erro da ordem de h2 em cada etapa, podendo ca a 2 . Como n = b−a , ent˜o o erro acumulado ser´ da ordem acumular ao final um erro de nh a a h de (b − a)h. A t´ ıtulo de ilustra¸˜o, vejamos um exemplo cuja solu¸˜o exata ´ conhecida. Tomemos ca ca e a equa¸˜o separ´vel x = −3t2 x, no intervalo [0, 1], com x(0) = 2. Para achar a solu¸˜o ca a ca expl´ ıcita, temos que isolar x(t) em
x(t) 2

1 du = − u

t

3s2 ds ,
0

isto ´, e log x(t) − log 2 = −t3 . Ent˜o x(t) = 2e−t . a Compararemos essa solu¸˜o exata com a solu¸˜o obtida pelo M´todo de Euler com ca ca e passo h = 0.1. Antes de apresentar o resultado, calculemos os primeiros valores xk com cuidado, para fixarmos melhor o entendimento do m´todo. e Temos x1 = x0 + f (t0 , x0 )h , com t0 = 0, x0 = 2 e f (t, x) = −3t2 x. Portanto x1 = x0 = 2. Depois, temos x2 = x1 + f (t1 , x1 )h = x1 − 3t2 x1 h , 1 de forma que substituindo os valores conseguimos x2 = 2 − 3 × 0.12 × 2 × 0.1 = 2 − 6 × 10−3 = 1.994 . O resultado est´ na tabela abaixo, arredondados para 3 casas decimais depois de obtido a cada xk .
3

232

´ CAP´ ITULO 19. SOLUCAO NUMERICA DE EQUACOES DIFERENCIAIS ¸˜ ¸˜

k 0 1 2 3 4 5 6 7 8 9 10

tk 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

xk 2.000 2.000 1.994 1.970 1.917 1.825 1.688 1.506 1.285 1.038 0.786

2e−tk 2.000 1.998 1.984 1.947 1.876 1.765 1.611 1.419 1.199 0.965 0.736

3

O maior erro cometido em rela¸˜o ` solu¸˜o verdadeira ca a ca ocorreu em tk = 0.7 (1.506 − 1.419 = 0.087), mas n˜o a ´ preciso tomar chegou a 0.1, o tamanho do passo. E cuidado com a avalia¸˜o do erro, pois sabemos apenas ca que ele pode ser da ordem de h, mas isso significa apenas que ele ´ menor do que uma constante vezes e h. Essa constante pode ser muito grande, de forma que a informa¸˜o n˜o ´ suficiente para estimar o erro. ca a e No entanto, ela diz que, se reduzirmos h ent˜o o erro a m´ximo se reduzir´ proporcionalmente. a a

Por exemplo, vejamos o que resulta da mesma equa¸˜o com passo igual a 0.05, com ca quatro casas decimais. k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 tk 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00 xk 2.0000 2.0000 1.9993 1.9963 1.9896 1.9777 1.9592 1.9326 1.8971 1.8516 1.7954 1.7281 1.6497 1.5606 1.4617 1.3543 1.2400 1.1210 0.9995 0.8781 0.7592 2e−tk 2.0000 1.9998 1.9980 1.9933 1.9841 1.9690 1.9467 1.9161 1.8760 1.8258 1.7650 1.6935 1.6115 1.5197 1.4193 1.3116 1.1986 1.0822 0.9648 0.8485 0.7358
3

19.4. INDO PARA SEGUNDA ORDEM

233

A maior diferen¸a em rela¸˜o ao valor verdadeiro n˜o passou de 0.043, em tk = 0.75, c ca a que ´ metade da discrepˆncia obtida com passo igual a 0.1. e a Exerc´ ıcio. Considere a equa¸˜o diferencial x = x2 − sent, com a condi¸˜o inicial ca ca x(0) = 1. Obtenha uma discretiza¸˜o/aproxima¸˜o da solu¸˜o usando o M´todo de ca ca ca e Euler de primeira ordem, no intervalo [0, 0.6], com passo h = 0.1.

19.4

Indo para segunda ordem

Para que a redu¸˜o de h seja mais eficiente ´ preciso fazer com que a ordem de grandeza ca e do erro dependa de h elevado a uma potˆncia mais alta. Para isso, ´ preciso ir al´m da e e e aproxima¸˜o de primeira ordem em x(t+h). Consideremos, por exemplo, a aproxima¸˜o ca ca de segunda ordem: 1 x(t + h) ≈ x + x h + x h2 , 2 onde x = f e x = ft + f fx . Ent˜o, ainda no exemplo x = −3t2 x, temos f (t, x) = −3t2 x, ft (t, x) = −6tx e a fx (t, x) = −3t2 . Substituindo essas express˜es, com a nota¸˜o x(t + h) = xk+1 , x = xk , o ca t = tk , obtemos a rela¸˜o de recorrˆncia ca e 3 xk+1 = xk + 3tk xk h −tk − h + t3 h 2 k .

O erro m´ximo cometido em cada itera¸˜o ´ da ordem de h3 , portanto o erro m´ximo a ca e a 2 . Isso significa que a acumulado ao longo de todo o intervalo ´ da ordem de (b − a)h e redu¸˜o do passo pela metade provoca redu¸˜o no erro da ordem de quatro vezes. ca ca Exerc´ ıcio. Use a rela¸˜o de recorrˆncia acima com passo 0.1, a partir da mesma ca e condi¸˜o inicial x(0) = 2 e compare com os resultados obtidos anteriormente. ca Apesar da vantagem em rela¸˜o ` precis˜o, ao passar para segunda ordem acabamos ca a a por nos envolver com uma fun¸˜o de itera¸˜o muito mais complicada, apesar de a exca ca press˜o de f (t, x) ser muito simples. V´rios fatores contribuem para isso: as express˜es a a o das derivadas parciais de f e a combina¸˜o da f´rmula, que envolve v´rios termos. Indo ca o a para ordem ainda mais alta essas complica¸˜es aumentam bastante e exigem, da parte co do programador, o c´lculo de todas as derivadas parciais envolvidas e a montagem das a f´rmulas. o O que faremos no restante desta Se¸˜o ´ explorar uma observa¸˜o a respeito da ca e ca expans˜o de x(t + h) at´ segunda ordem, que nos permitir´ implementar um m´todo a e a e computacionalmente mais simples. Na Se¸˜o seguinte veremos como esse m´todo pode ca e ser generalizado inclusive para ordens mais altas, sem expressivo acr´scimo da complee xidade algor´ ıtmica, embora a dedu¸˜o do algoritmo propriamente dito possa ficar cada ca

234

´ CAP´ ITULO 19. SOLUCAO NUMERICA DE EQUACOES DIFERENCIAIS ¸˜ ¸˜

vez mais complicada. Essa abordagem ´ conhecida como M´todo de Runge-Kutta de e e integra¸˜o das equa¸˜es diferenciais. ca co Estamos interessados na diferen¸a x(t + h) − x(t), dada por c 1 x(t + h) − x(t) = hf + h2 (ft + f fx ) + o(h2 ) , 2 que escreveremos assim: 1 x(t + h) − x(t) = h f + (hft + hf fx ) + o(h2 ) . 2 Ent˜o reparamos que o termo hft + hf fx tem certa semelhan¸a com a expans˜o da a c a fun¸˜o de duas vari´veis f (t, x) at´ primeira ordem: ca a e f (t + ∆t, x + ∆x) = f (t, x) + ft (t, x)∆t + fx (t, x)∆x + o(∆t, ∆t) , onde o(∆t, ∆x) denota um termo (o resto) muito menor do que a norma de (∆t, ∆x), isto √ ´, muito menor do que ∆t2 + ∆x2 . “Muito menor” significa que esse termo, quando e √ √ dividido por ∆t2 + ∆x2 , vai a zero, se ∆t2 + ∆x2 vai a zero. Logo, se tomarmos ∆t = h e ∆x = hf ent˜o teremos a f (t + h, x + hf ) − f (t, x) = hft (t, x) + hf (t, x)fx (t, x) + o(h) , pois √ ∆t2 + ∆x2 = h 1 + f 2 . Na nota¸˜o compacta que propusemos, temos ca hft + hf fx = f (t + h, x + hf ) − f + o(h) . Portanto x(t + h) − x(t) = h f + 1 (f (t + h, x + hf ) − f ) + o(h2 ) 2

(a soma de dois termos o(h2 ) ´ um termo o(h2 )). Ou seja, e x(t + h) − x(t) = h (f (t, x) + f (t + h, x + hf )) . 2

Vejamos como isso se d´ na pr´tica, ao passarmos de xk para xk+1 . Pensando em a a termos de algoritmo, temos que calcular ξ1 = f (tk , xk ) e, tomando esse valor de ξ1 , calcular ξ2 = f (tk + h, xk + hξ1 ) . Assim xk+1 = xk + h (ξ1 + ξ2 ) . 2

19.5. RUNGE-KUTTA

235

A vantagem desse m´todo ´ que n˜o precisamos calcular derivadas parciais de f , e o e e a algoritmo fica consideravelmente mais simples. Apenas calculamos ξ1 (que ´ o valor de e f no ponto (tk , xk )), e depois usamos ξ1 para calcular outro valor de f , desta feita no ponto (tk + h, xk + hξ1 ). O acr´scimo em xk para se chegar a xk+1 ser´ a m´dia desses e a e dois valores, multiplicada pelo passo h. Na tabela abaixo fazemos esse algoritmo, com o problema x = −3t2 x, x(0) = 2, no intervalo [0, 1]. Usando o passo h = 0.1, a coluna ξ1 significa ξ1 = −3t2 xk k e a coluna ξ2 significa ξ2 = −3t2 (xk + hξ1 ) , k+1 pois tk + h = tk+1 . k 0 1 2 3 4 5 6 7 8 9 10 tk 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 2e−tk 2.0000 1.9980 1.9841 1.9467 1.8760 1.7650 1.6115 1.4193 1.1986 0.96478 0.73576
3

h xk ξ1 ξ2 2 (ξ1 + ξ2 ) 2.0000 0 −.060000 −0.0030000 1.9970 −0.059910 −0.23892 −0.014942 1.9821 −0.23785 −0.52875 −0.038330 1.9438 −0.52483 −0.90783 −0.071633 1.8722 −0.89866 −1.3368 −0.11177 1.7604 −1.3203 −1.7586 −0.15395 1.6065 −1.7350 −2.1065 −0.19208 1.4144 −2.0792 −2.3164 −0.21978 1.1946 −2.2936 −2.3455 −0.23196 0.96264 −2.3392 −2.1862 −0.22627 0.73637 − − −

Observamos que a diferen¸a para o valor correto foi de, no m´ximo, 0.005. c a

19.5

Runge-Kutta

O m´todo de Runge-Kutta ´ uma generaliza¸˜o do algoritmo que desenvolvemos em e e ca segunda ordem, para que n˜o seja preciso calcular derivadas parciais de f , e vale para a qualquer ordem m. Pensando na passagem de xk para xk+1 a id´ia ´ escrever e e x(t + h) − x(t) = h(γ1 ξ1 + γ2 ξ2 + . . . + γm ξm ) ,

236 onde

´ CAP´ ITULO 19. SOLUCAO NUMERICA DE EQUACOES DIFERENCIAIS ¸˜ ¸˜

ξ1 = f (tk , xk ) , ξ2 = f (tk + a1 h, xk + b1 ξ1 h) , ξ3 = f (tk + a2 h, xk + b2 ξ2 h) , . . . . . . . . . ξm = f (tk + am−1 h, xk + bm−1 ξm−1 h) . Ou seja, dentro de cada etapa k ´ preciso fazer uma recorrˆncia de tamanho m, onde e e cada ξi (i ≥ 2) ´ calculado em fun¸˜o de ξi−1 , partindo de ξ1 = f (tk , xk ). e ca Na Se¸˜o anterior, t´ ca ınhamos m = 2, γ1 = γ2 = 1 e a1 = b1 = 1. Agora considerare2 mos o caso m = 3, e tentaremos determinar as constantes γ1 , γ2 e γ3 , assim como a1 , b1 , a2 e b2 . Ao final, veremos que existe uma certa liberdade na escolha dessas constantes. A maneira de se organizar para uma tarefa dessas ´ a seguinte. Desenvolveremos os e dois lados da equa¸˜o ca x(t + h) − x(t) = γ1 ξ1 + γ2 ξ2 + γ3 ξ3 h at´ ordem 2 em h (seria ordem 3, mas estamos dividindo tudo por h), e obteremos v´rios e a termos envolvendo derivadas parciais de f . Como ocorre com polinˆmios, ´ preciso o e haver igualdade termo a termo. Cada uma dessas igualdades ser´ uma equa¸˜o onde as a ca inc´gnitas s˜o as constantes procuradas, e o problema ficar´ reduzido ` resolu¸˜o desse o a a a ca sistema (n˜o linear) de equa¸˜es. a co O lado esquerdo da equa¸˜o ´ mais conhecido: ca e x(t + h) − x(t) 1 1 = x + x h + x h2 + o(h2 ) , h 2 6 onde as express˜es de x , x e x j´ foram deduzidas na Se¸˜o 19.2. Introduzindo essas o a ca express˜es, ficamos com o 1 1 1 1 1 1 1 2 f + hft + hf fx + h2 ft fx + h2 f fx + h2 ftt + h2 f ftx + h2 f 2 fxx . 2 2 6 6 6 3 6 Os termos est˜o separados um a um, propositalmente, porque isso tornar´ mais f´cil a a a a compara¸˜o com o outro lado da equa¸˜o. ca ca Com rela¸˜o ao outro lado, ´ preciso calcular ξ1 , ξ2 e ξ3 , at´ ordem h2 . J´ sabemos ca e e a que ξ1 = f . E sabendo ξi calculamos ξi+1 por ξi+1 = f (t + ai h, x + bi ξi h) .

19.5. RUNGE-KUTTA Expandindo f at´ segunda ordem, obtemos e ξi+1 = f (t + ai h, x + bi ξi h) =

237

1 1 = f + (ai h)ft + (bi ξi h)fx + (ai h)2 ftt + (ai h)(bi ξi h)ftx + (bi ξi h)2 fxx + o(h2 ) . 2 2 Por outro lado, ξi j´ foi calculado de maneira semelhante, e sua express˜o deveria ser a a substitu´ na express˜o de ξi+1 . ıda a No caso m = 3, temos ξ1 = f , portanto ξ2 = f (t + a1 h, x + b1 hf ) = 1 1 = f + a1 hft + b1 hf fx + a2 h2 ftt + a1 b1 h2 f ftx + b2 h2 f 2 fxx + o(h2 ) . 2 1 2 1 J´ a express˜o de ξ3 ´ mais complicada, pois devemos substituir a express˜o de ξ2 a a e a em cada lugar onde aparece. Por sorte, podemos desprezar os termos que tenha ordem mais alta do que h2 . Por exemplo, b2 hξ2 fx = b2 h(f + a1 hft + b1 hf fx )fx + o(h2 ) , uma vez que os termos com h2 , quando multiplicados por h, ficam h3 , isto ´, s˜o termos e a 2 ). H´ outros dois termos a expandir: o(h a a2 b2 h2 ξ2 ftx = a2 b2 h2 f ftx + o(h2 ) e 1 2 2 2 1 b h ξ fxx = b2 h2 f 2 fxx + o(h2 ) . 2 2 2 2 2 Ent˜o a
2 ξ3 = f + (a2 hft ) + (b2 hf fx + a1 b2 h2 ft fx + b1 b2 h2 fx )+ 1 1 + a2 h2 ftt + a2 b2 h2 f ftx + b2 h2 f 2 fxx + o(h2 ) . 2 2 2 2

Finalmente, podemos reunir γ1 ξ1 + γ2 ξ2 + γ3 x3 , e conseguiremos uma soma com os seguintes termos: (γ1 + γ2 + γ3 )f , (γ2 a1 + γ3 a2 )hft , (γ2 b1 + γ3 b2 )hf fx , γ3 a1 b2 h2 ft fx , 2 γ3 b1 b2 h2 f fx , 1 (γ2 a2 + γ3 a2 )h2 ftt , (γ2 a1 b1 + γ3 a2 b2 )h2 f ftx e (γ2 b2 + γ3 b2 )h2 f 2 fxx . 1 2 1 2 2 Da compara¸˜o termo a termo com a expans˜o de ca a x(t + h) − x(t) , h

238

´ CAP´ ITULO 19. SOLUCAO NUMERICA DE EQUACOES DIFERENCIAIS ¸˜ ¸˜

que corresponde ao “lado esquerdo” da equa¸˜o, obtemos as seguintes equa¸˜es: ca co f: hft : hf fx : h2 ft fx :
2 h2 f fx :

h2 ftt : h2 f ftx : h2 f 2 fxx :

1 1 2 1 2 1 6 1 6 1 6 1 3 1 6

= γ1 + γ2 + γ3 = γ2 a1 + γ3 a2 = γ2 b1 + γ3 b2 = γ3 a1 b2 = γ3 b1 b2 = 1 (γ2 a2 + γ3 a2 ) 1 2 2 1 (γ2 b2 + γ3 b2 ) 1 2 2

(19.1) (19.2) (19.3) (19.4) (19.5) (19.6) (19.7) (19.8)

= γ2 a1 b1 + γ3 a2 b2 =

A primeira equa¸˜o ´ a unica que envolve γ1 , assim γ1 ficar´ determinado assim que ca e ´ a γ2 e γ3 forem determinados. Da quarta e da quinta equa¸˜es tiramos imediatamente co que a1 = b1 . Levando isso em conta na sexta e na s´tima equa¸˜es resulta que tamb´m e co e a2 = b2 . Com isso, as trˆs ultimas equa¸˜es se tornam idˆnticas, a quarta e a quinta e ´ co e tamb´m, e a segunda e a terceira idem. Em resumo, ficamos com trˆs equa¸˜es nas e e co quatro inc´gnitas a1 , a2 , γ2 e γ3 : o 1 2 1 6 1 3 = γ2 a1 + γ3 a2 = γ3 a1 a2 = γ2 a2 + γ3 a2 1 2

Havendo uma inc´gnita a mais do que o n´mero de equa¸˜es, abre-se a possibilidade o u co para a existˆncia de uma infinidade de solu¸˜es. Podemos escolher um valor para a2 , e co por exemplo, mas algumas escolhas podem tornar o sistema imposs´ ıvel. No entanto, saberemos como escolher se tratarmos a2 como uma constante, em vez de uma inc´gnita. o 1 Da segunda equa¸˜o γ2 a2 = 6a1 colocada na primeira obtemos ca γ2 a1 + Multiplicando por a1 resulta γ2 a2 = 1 1 1 = . 6a1 2 a1 1 − , 2 6

19.5. RUNGE-KUTTA que junto com a segunda pode ser substitu´ na terceira equa¸˜o, levando a ıda ca 3a2 − 3a1 + a2 = 0 , 1 depois de mais uma multiplica¸˜o por a1 e simplifica¸˜es. Ent˜o ca co a a1 = 3± √ 9 − 12a2 . 6

239

Se tomarmos a2 = 3 teremos necessariamente que a1 = 1 . Com esses valores, obtemos 4 2 4 γ3 = 9 , γ2 = 2 e γ1 = 2 . 9 9 A conclus˜o ´ que o M´todo de Runge-Kutta pode ser aplicado com a e e x(t + h) − x(t) = h (2ξ1 + 3ξ2 + 4ξ3 ) + o(h3 ) , 9

1 onde ξ1 = f (t, x), ξ2 = f (t + 2 h, x + 1 ξ1 h) e ξ3 = f (t + 3 h, x + 3 ξ2 h). 2 4 4

Exerc´ ıcio. Use o algoritmo de Runge-Kutta de ordem 3 deduzido acima na equa¸˜o ca diferencial separ´vel x = −3t2 x, x(0) = 2. Aumente o n´mero de algarismos significaa u tivos. De preferˆncia, crie um programa de computador para testar os algoritmos. e
1 Exerc´ ıcio. Na Se¸˜o anterior, obtivemos m = 2, γ1 = γ2 = 2 e a1 = b1 = 1 para o ca M´todo de Runge-Kutta de ordem 2. No entanto, como vimos em ordem 3, pode haver e outras maneiras de implement´-lo, pois as equa¸˜es que determinam a escolha dos γi ’s, a co ai ’s e bi ’s tˆm mais do que uma solu¸˜o. Baseando-se no racioc´ e ca ınio feito em ordem 3, ache todas as poss´ ıveis implementa¸˜es do M´todo de Runge-Kutta em ordem 2. co e

Exerc´ ıcio. Considere a equa¸˜o x = ex t, com a condi¸˜o inicial x(0) = 1. Obtenha ca ca uma discretiza¸˜o/aproxima¸˜o da solu¸˜o em [0, 0.5], usando o M´todo de Runge-Kutta ca ca ca e de segunda ordem. Exerc´ ıcio. Considere a mesma equa¸˜o e a mesma condi¸˜o inicial do Exerc´ ca ca ıcio anterior. Aproveite o fato de ser uma equa¸˜o separ´vel para obter x(0.5) usando o M´todo ca a e de Newton e o M´todo de Simpson combinados. Para o M´todo de Newton, use condi¸˜o e e ca inicial igual a 1 e calcule 3 iterados posteriores. Para o M´todo de Simpson use n = 4. e Discuta o erro envolvido ao se resolver a equa¸˜o dessa maneira, da melhor forma que ca vocˆ puder. Compare com o resultado da quest˜o anterior. e a Exerc´ ıcio. O algoritmo de Runge-Kutta de ordem 4 pode ser deduzido de forma an´loga. a Para isso ´ preciso fazer as contas com muito cuidado. Tente partir da suposi¸˜o de que e ca x(t + h) − x(t) = h(αξ1 + βξ2 + γξ3 + γξ4 ) + o(h4 ) ,

2

240 onde

´ CAP´ ITULO 19. SOLUCAO NUMERICA DE EQUACOES DIFERENCIAIS ¸˜ ¸˜

ξ1 = f (t, x) , ξ2 = f (t + bh, x + bξ1 h) , ξ3 = f (t + ch, x + cξ2 h) , ξ4 = f (t + dh, x + dξ3 h) , e mostre que essas constantes podem assumir os seguintes valores: α = 1 , β = 2 , γ = 2 , 6 6 6 δ = 1 , b = 1 , c = 1 e d = 1. 6 2 2 Exerc´ ıcio. Implemente o M´todo de Runge-Kutta de ordem 4 no computador. e

19.6

Runge-Kutta em sistemas de equa¸˜es autˆnomas co o

A resolu¸˜o num´rica de um sistema de equa¸˜es autˆnomas ´ muito semelhante ao ca e co o e que j´ fizemos antes. Desenvolveremos o M´todo de Runge-Kutta de ordem 2 para um a e sistema de duas equa¸˜es, e o leitor ver´ que o M´todo pode ser aplicado a qualquer co a e tipo de sistema de equa¸˜es diferenciais, autˆnomas ou n˜o, em qualquer ordem, tudo co o a dependendo de se deduzir o algoritmo convenientemente. H´ atualmente muitos prograa mas de computador com os algoritmos j´ implementados, bastando ao usu´rio somente a a digitar as equa¸˜es. Outros algoritmos mais finos s˜o tamb´m usados, para minimizar co a e ainda mais os erros, principalmente quando se trata de integrar a equa¸˜o diferencial ca ´ em grandes intervalos de tempo. E recomend´vel, no entanto, saber minimamente como a eles funcionam. Suponha que queiramos integrar o sistema de equa¸˜es diferenciais co x y At´ segunda ordem, temos e x(t + h) − x(t) = hx + h x + o(h2 ) 2 2 y(t + h) − y(t) = hy + h y + o(h2 ) 2 Como x = f e y = g, ent˜o a x = x fx + y fy = f fx + gfy e y = x gx + y gy = f gx + ggy .
2

= f (x, y) = g(x, y)

.

.

ˆ 19.6. RUNGE-KUTTA EM SISTEMAS DE EQUACOES AUTONOMAS ¸˜ Ent˜o a

241

x(t + h) − x(t) = h f + 1 (hf fx + hgfy ) + o(h2 ) 2 y(t + h) − y(t) = h g + 1 (hf gx + hggy ) + o(h2 ) 2 hf fx + hgfy = f (x + f h, y + gh) − f (x, y) + o(h)

.

Mas e hf gx + hggy = g(x + f h, y + gh) − f (x, y) + o(h) . Portanto x(t + h) − x(t) = y(t + h) − y(t) =
h 2 h 2

(f (x, y) + f (x + f h, y + gh)) + o(h2 ) (g(x, y) + g(x + f h, y + gh)) + o(h2 )

.

Exerc´ ıcio. Considere o sistema de equa¸˜es diferenciais co x = x2 + y ˙ 1 y = 1+x ˙ Se x(0) = −0.5 e y(0) = 0.2, estime t > 0 necess´rio para que a solu¸˜o (x(t), y(t)) a ca cruze o eixo y, usando o M´todo de Euler de primeira ordem com passo 0.1. e Exerc´ ıcio. Deduzir o M´todo de Runge-Kutta de ordem 4 para sistemas autˆnomos de e o duas equa¸˜es. co Exerc´ ıcio. Usar os M´todos de Runge-Kutta para integrar os sistemas de equa¸˜es e co diferenciais da Se¸˜o 18.5. ca

242

´ CAP´ ITULO 19. SOLUCAO NUMERICA DE EQUACOES DIFERENCIAIS ¸˜ ¸˜

Apˆndice A e

Revis˜o de C´lculo a a
Este Apˆndice ´ uma revis˜o breve e informal dos principais conceitos de C´lculo de e e a a uma vari´vel. a

A.1

Derivadas

Considere uma fun¸˜o real f (x). A inca clina¸˜o do gr´fico de f no ponto (x, f (x)) ca a ´ dada pelo limite do quociente e f (x + h) − f (x) h quando h tende a zero (pela direita ou pela esquerda). Esse limite ´ denotado por e

f(x+h) f(x+h)-f(x) f(x) x h x+h

f (x) , e a fun¸˜o f (x), que d´ a inclina¸˜o do gr´fico para cada x, ´ chamada derivada da ca a ca a e fun¸˜o f . ca Por exemplo, se f (x) = x2 , o gr´fico de f ´ uma par´bola, e a derivada, para cada a e a x, ´ o limite de e f (x + h) − f (x) (x + h)2 − x2 = = 2x + h . h h Evidentemente, quando h tende a zero, o limite ´ igual a 2x, e portanto f (x) = 2x se e f (x) = x2 . 243

244

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO

Algumas derivadas usuais. A fun¸˜o constante f (x) = c tem derivada nula em todo ca ponto: f (x) = 0 (pudera, o gr´fico de uma fun¸˜o constante ´ uma reta horizontal). a ca e A derivada de uma fun¸˜o afim f (x) = ax + b ´ uma fun¸˜o constante: f (x) = a, ca e ca pois a inclina¸˜o do gr´fico (que ´ uma reta) ´ sempre dada pelo coeficiente a. Pode-se ca a e e n , com n inteiro (negativo ou positivo) por´m diferente mostrar tamb´m que se f (x) = x e e de zero, ent˜o f (x) = nxn−1 . Por exemplo, se f (x) = x, ent˜o f (x) = 1 · x0 = 1, ou se a a 1 1 a f (x) = x−1 = x ent˜o f (x) = −x−2 = − x2 . Temos tamb´m as derivadas de fun¸˜es trigonom´tricas. Se f (x) = sin x ent˜o e co e a f (x) = cos x, e se f (x) = cos x ent˜o f (x) = − sin x. Para obter essas derivadas ´ a e preciso mostrar antes que sin x lim =1, x→0 x resultado que pode ser obtido de forma geom´trica. e Poder´ ıamos discorrer um pouco mais sobre derivadas, falando de outras fun¸˜es e de co regras de deriva¸˜o de fun¸˜es mais complicadas. Deixaremos por´m essa discuss˜o para ca co e a logo adiante. S´ faremos antes uma observa¸˜o que certamente j´ nos ampliar´ bastante o ca a a o leque de fun¸˜es que sabemos derivar. Digamos que uma fun¸˜o h(x) se escreva como co ca combina¸˜o linear de duas outras fun¸˜es f (x) e g(x), isto ´, ca co e h(x) = af (x) + bg(x) . Ent˜o a derivada de h ´ a combina¸˜o linear das derivadas: a e ca h (x) = af (x) + bg (x) .

Em particular, a derivada da fun¸˜o f (x) + C ´ igual ` deca e a rivada da fun¸˜o f (x), pois a ca derivada da fun¸˜o constante ca ´ zero (veja na figura ao lado e duas fun¸˜es que diferem apeco nas pela adi¸˜o de uma consca tante).

C

f(x)+C
C

f(x)
C

x

A.2

Primitivas

Podemos agora colocar o seguinte problema: “dada uma fun¸˜o g(x), achar uma fun¸˜o ca ca ´ f (x) cuja derivada f (x) seja igual a g(x)”. E um problema “inverso” ao de achar a

A.2. PRIMITIVAS

245

derivada. Qualquer fun¸˜o f (x) cuja derivada seja igual a g(x) ser´ chamada de uma ca a primitiva de g(x). Por exemplo, queremos achar uma primitiva de g(x) = x2 . Ora, sabemos que a 1 derivada de x3 ´ 3x2 (pela Se¸˜o anterior), portanto f (x) = 3 x3 ´ uma primitiva de e ca e 2 (o fator de 1 ´ necess´rio para se cancelar o expoente que “cai” ao se derivar). g(x) = x e a 3 Esse problema levanta duas quest˜es: primeiro, ser´ que sempre existe uma primitiva o a para a fun¸˜o g? E se existe, ser´ que ´ unica? ca a e´ Vejamos primeiro que n˜o h´ chance de s´ haver uma primitiva para cada fun¸˜o. Por a a o ca exemplo, suponha que encontramos uma primitiva f (x) para g(x), isto ´, f (x) = g(x). e Agora consideramos uma outra fun¸˜o F (x) = f (x) + C. Pelo que vimos na Se¸˜o ca ca anterior, F (x) = f (x) = g(x) . Em outras palavras, se encontrarmos uma primitiva f (x) ent˜o todas as fun¸˜es do tipo a co f (x) + C ser˜o tamb´m primitivas, para qualquer valor de C. a e A pergunta natural que viria em seguida seria: e al´m dessas, ser´ que h´ outras e a a primitivas? A resposta ´ n˜o. Suponha que f1 (x) e f2 (x) sejam duas primitivas da e a mesma fun¸˜o g(x), isto ´, ca e f1 (x) = g(x) = f2 (x) . Agora considere a fun¸˜o F (x) = f1 (x) − f2 (x) que para cada valor de x d´ a diferen¸a ca a c entre os valores das duas fun¸˜es. Ent˜o co a F (x) = f1 (x) − f2 (x) = g(x) − g(x) = 0 , para qualquer x. Ent˜o a fun¸˜o diferen¸a tem inclina¸˜o zero, ou seja, ´ uma fun¸˜o a ca c ca e ca constante (se o dom´ ınio tiver s´ um peda¸o): o c F (x) = C . De onde conclu´ ımos que f1 (x) = f2 (x) + C!! Colocando em palavras, acabamos de demonstrar que se duas fun¸˜es s˜o primitivas co a da mesma fun¸˜o ent˜o elas necessariamente diferem por uma constante. Isso tem conca a seq¨ˆncias pr´ticas importantes: se encontrarmos uma primitiva ent˜o automaticamente ue a a conheceremos todas as outras! Voltaremos ao assunto ap´s a Se¸˜o seguinte. o ca

246

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO

A.3

Integral

Considere uma fun¸˜o f (x) definida no inca tervalo [a, b], n˜o-negativa, como mostra a a figura ao lado. A ´rea da regi˜o acima a a da abscissa e abaixo do gr´fico da fun¸˜o a ca ´ chamada de integral de f no intervalo e [a, b], e recebe a nota¸˜o ca
b

f

f (x)dx .
a

a

b

A1

f A3

A integral tamb´m pode ser definida para e fun¸˜es que assumem valores negativos. co Nesse caso, n˜o podemos interpretar a ina tegral como ´rea, a n˜o ser que usemos a a a id´ia de “´rea com sinal”, isto ´, a ´rea ´ e a e a e contada positivamente quando a fun¸˜o ´ ca e positiva e negativamente quando a fun¸˜o ca ´ negativa. Assim, na figura ao lado temos e
b

a A2

b
a

f (x)dx = A1 − A2 + A3 ,

onde A1 , A2 e A3 s˜o as ´reas das regi˜es a a o sombreadas. Tamb´m devemos convencionar o significado do s´ e ımbolo acima da integral quando a n˜o ´ menor ou igual a b. A conven¸˜o ´ a seguinte: se a > b ent˜o a e ca e a
b a

f (x)dx ≡ −
a b

f (x)dx .

Em palavras, fazer a integra¸˜o do extremo direito para o esquerdo resulta no mesmo ca que fazer da esquerda para a direita, s´ que com o sinal oposto. o Com essa regra, obtemos a seguinte propriedade, para qualquer trinca de n´meros u a, b, c, n˜o importando sua ordem: a
b c c

f (x)dx +
a b

f (x)dx =
a

f (x)dx .

Isso parece ´bvio no caso em que a < b < c, mas confira a validade da f´rmula em outros o o casos!

A.4. A INTEGRAL INDEFINIDA

247

A.4

A integral indefinida

Na Se¸˜o anterior, falamos da integral de uma fun¸˜o entre dois extremos fixos. Se ca ca resolvermos mudar um dos extremos, obteremos um resultado diferente para a integral, mesmo que a fun¸˜o n˜o se altere. Isso sugere que um dos extremos do intervalo de ca a integra¸˜o possa ser considerado uma vari´vel, do qual depende o valor da integral da ca a fun¸˜o. ca Por exemplo, considere a fun¸˜o linear ca g(x) = x, e fixe 0 como um dos extremos de integra¸˜o. Quanto vale ca
w

w

g(x)=x

g(x)dx ?
0

Ora, se w ≥ 0, a integral ´ a ´rea do e a triˆngulo-retˆngulo esbo¸ado na figura ao a a c 2 lado: w . 2

0 0
2

x w

Se w < 0, a integral ´ tamb´m, em valor absoluto, igual a w , mas qual seria o e e 2 sinal? Primeiro vemos que a ´rea deve ser contada negativamente, pois ` esquerda do a a zero g(x) ´ negativa. Por outro lado, se w < 0 ent˜o a integral est´ sendo percorrida e a a da direita para a esquerda, o que acarreta uma segunda mudan¸a de sinal. Isso implica c 2 que tamb´m no caso w < 0 a integral vale w . Conclu´ e ımos que 2
w

xdx =
0

w2 , 2

para qualquer w. Agora podemos criar uma fun¸˜o que a cada w associe a integral de g de 0 a w, e ca chamaremos de f essa fun¸˜o: ca
w

f (w) ≡
0

g(x)dx .

No exemplo, g(x) = x, e portanto
w

f (w) =
0

xdx =

w2 . 2

Essa fun¸˜o f ´ chamada de uma integral indefinida de g. Ela ´ apenas uma e n˜o a ca e e a integral indefinida porque o extremo fixo de integra¸˜o foi escolhido arbitrariamente. ca

248

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO

w

g(x)=x

Por exemplo, considere outra integral in˜ definida f , onde o extremo fixo de integra¸˜o seja 1 e n˜o 0: ca a ˜ f (w) ≡
1 w

f(w) x
0

xdx .

0

1

w

˜ Quanto vale f (w)?

Observe que, pela regra de integra¸˜o das triplas a, b, c, podemos escrever ca
1 w w

xdx +
0 1

xdx =
0

xdx .

O primeiro termo do lado esquerdo vale 1 . Al´m disso, o segundo termo do lado esquerdo e 2 ˜(w), e o lado direito da equa¸˜o ´ f (w). Ent˜o da equa¸˜o ´ a fun¸˜o f ca e ca ca e a 1 ˜ f (w) = f (w) + , 2 e as duas fun¸˜es diferem por uma constante. Ali´s esse fato ´ bastante geral, e suas co a e raz˜es saltam ` vista imediatamente desse exemplo: as integrais indefinidas de uma o a fun¸˜o, assim como suas primitivas, diferem umas das outras por uma constante. ca E ser´ que h´ alguma rela¸˜o entre as primitivas e as integrais indefinidas? Respona a ca deremos a essa pergunta na pr´xima Se¸˜o. o ca Antes de prosseguir, fa¸amos uma observa¸˜o a respeito da nota¸˜o. Sempre falamos c ca ca de fun¸˜es dependentes da vari´vel x, mas agora apareceram fun¸˜es que dependem da co a co vari´vel w! Ora, esses nomes, x e w, s˜o apenas nomes, que ` fun¸˜o n˜o interessam. a a a ca a 2 w2 Assim, se f (w) = 2 e queremos avaliar f (x) ent˜o teremos f (x) = x . O que interessa a 2 ´ que essa fun¸˜o em particular toma um n´mero qualquer em seu dom´ e ca u ınio, eleva-o ao quadrado e divide o resultado por dois. Tanto faz se indicamos esse processo por 2 2 f (w) = w ou por f (x) = x ! 2 2 Entendido isso, pode-se perguntar ent˜o porque n˜o definimos de uma vez a a
x

f (x) =
0

xdx ?

Por que n˜o usar de uma vez a vari´vel x como extremo de integra¸˜o? Trata-se a´ de a a ca ı um cuidado que tomamos para n˜o misturar as coisas. A vari´vel indicada dentro da a a

´ A.5. O TEOREMA FUNDAMENTAL DO CALCULO

249

integra¸˜o muda enquanto os extremos est˜o fixos. Para cada x, temos que percorrer ca a ´ mais justo, portanto, usar um outro nome o intervalo [0, x] para calcular a integral. E para indicar esse processo, evitando assim confus˜es. Seria prefer´ ent˜o escrever o ıvel a
x

f (x) =
0

tdt ,

ou f (x) =
0

x

udu ,

usando, enfim, qualquer letra que n˜o seja aquela utilizada nos extremos da integra¸˜o. a ca

A.5

O Teorema Fundamental do C´lculo a

Nas se¸˜es anteriores vimos o que s˜o primitivas e integrais indefinidas de uma fun¸˜o co a ca g. Uma primitiva de g ´ qualquer fun¸˜o f cuja derivada ´ igual a g, e uma integral e ca e indefinida ´ qualquer fun¸˜o da forma e ca
x

f (x) =
a

g(t)dt .

O Teorema Fundamental do C´lculo diz exatamente que as integrais indefinidas de g a s˜o tamb´m primitivas de g. a e Argumentaremos em favor do Teorema, sem excesso de tecnicalidades. O importante ´ entender por que ele ´ verdadeiro. e e Considere a integral indefinida de g, dada por
x

f (x) =
a

g(t)dt .

Para mostrarmos que essa fun¸˜o ´ uma primitiva de g basta mostrar que f (x) = g(x). ca e Lembramos ent˜o de como definimos a derivada f (x): ´ o limite da express˜o a e a f (x + h) − f (x) h quando h tende a zero. Ou seja, ´ o limite de e 1 h
x+h x

g(t)dt −
a a

g(t)dt

.

250 Lembrando que
x+h x x+h

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO

x+h

g(t)dt =
a a

g(t)dt +
x

g(t)dt ,

x

g(t)dt

o limite que pretendemos examinar se torna 1 x+h g(t)dt . h x

g a x x+h

Agora olhemos bem para essa express˜o, e observemos a figura. A integral ´ feita no a e intervalo [x, x + h] (de largura h, evidentemente), e a fun¸˜o ali tem altura de aproxica madamente g(x), se h for bastante pequeno. Portanto a integral est´ pr´xima do valor a o h · g(x). Lembrando que ainda temos que dividir por h, ent˜o toda a express˜o fica a a quase igual a g(x), e levando ao limite ser´ exatamente igual a g(x). a Interpretando geometricamente, significa que a inclina¸˜o de f em x ser´ tanto maior ca a quanto maior for o valor g(x). Pois f (x + h) ser´ f (x) mais a integral de g entre x e a x + h, que vale aproximadamente h · g(x), ou seja f (x + h) ≈ f (x) + h · g(x) . Donde f (x + h) − f (x) ≈ g(x) . h
2

No exemplo da Se¸˜o anterior, vimos que f (x) = x ´ uma integral indefinida de ca 2 e g(x) = x. Pelo Teorema Fundamental do C´lculo, f (x) deve ser tamb´m uma primitiva. a e 1 De fato, f (x) = 2 · 2x = x.

A.6

A praticidade do Teorema Fundamental do C´lculo a

Veremos agora que o Teorema Fundamental do C´lculo opera um verdadeiro milagre. a Ele torna o c´lculo de ´reas e integrais uma tarefa muito mais f´cil do que poder´ a a a ıamos imaginar! Suponha que queiramos calcular a integral de uma fun¸˜o g no intervalo [a, b]: ca
b

g(t)dt .
a

Poder´ ıamos olhar essa integral da seguinte forma. Chamamos de F a integral indefinida de g com extremo fixo de integra¸˜o igual a a: ca
x

F (x) =
a

g(t)dt .

´ A.6. A PRATICIDADE DO TEOREMA FUNDAMENTAL DO CALCULO

251

Isso faz com que a integral que queremos calcular seja o valor de F em b, isto ´, F (b). e Observe tamb´m que F (a) = 0. e Por outro lado, F ´ uma primitiva de g, de acordo com o Teorema Fundamental e do C´lculo. Suponha que por alguma raz˜o j´ conhe¸amos alguma primitiva f (x) de a a a c g(x). Isso pode parecer estranho, mas ´ algo muito comum quando sabemos derivar e 4 uma grande quantidade de fun¸˜es. Por exemplo, se g(x) = x3 , sabemos que f (x) = x co 4 ´ uma primitiva de g, porque sabemos a regra de deriva¸˜o das potˆncias. e ca e Como F (x) e f (x) s˜o ambas primitivas de g, ent˜o elas diferem por uma constante, a a digamos C: f (x) − F (x) = C , para todo x no intervalo [a, b]. Se escolhermos x = a ou x = b a equa¸˜o continua v´lida: ca a f (a) − F (a) = C = f (b) − F (b) , de onde tiramos que F (b) − F (a) = f (b) − f (a) . Mas F (b) = F (b) − F (a) era exatamente a integral que quer´ ıamos calcular! Resumindo: para qualquer f (x) primitiva de g(x) temos
b

g(t)dt = f (b) − f (a) .
a

O c´lculo da integral torna-se uma simples tarefa de subtra¸˜o, desde que j´ conhe¸amos a ca a c uma primitiva da fun¸˜o!! ca Por exemplo, qual ´ a ´rea sob o gr´fico da fun¸˜o g(x) = x3 para x variando no e a a ca 4 e a intervalo [1, 2]? Ora, como f (x) = x ´ uma primitiva de g(x), ent˜o 4
2

t3 dt = f (2) − f (1) =
1

24 14 15 − = . 4 4 4

F´cil, n˜o?! a a Existe uma nota¸˜o que facilita a vida quando calculamos integrais na pr´tica. Esca a crevemos f (t)|b = f (b) − f (a) . a Assim, com essa nota¸˜o, ca t4 . 4 1 1 Outra nota¸˜o bastante utilizada se aproveita do fato de que primitivas e integrais ca indefinidas s˜o a mesma coisa. Ent˜o, quando queremos dizer que f (x) ´ primitiva de a a e g(x) escrevemos t3 dt = g(x)dx = f (x) + C ,
2 2

252

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO

sem indicar extremos de integra¸˜o. A constante somada ´ simb´lica e apenas indica ca e o que a express˜o dada em f (x) n˜o ´ a unica primitiva de g, e as demais podem ser a a e ´ obtidas somando-se uma constante a ela. Essa nota¸˜o ´ conhecida como nota¸˜o de ca e ca Leibniz. Por exemplo,

sin x = − cos x + C .

A.7

O logaritmo

Uma das fun¸˜es mais importantes definidas a partir de uma integral indefinida ´ o logaco e ritmo natural. A abordagem que seguiremos aqui para falar de logaritmos, exponenciais, etc, n˜o ´ das mais usuais, por´m talvez seja mais f´cil at´ do que aquela que estamos a e e a e acostumados a ver desde os tempos do col´gio. Ao final nada do que j´ sab´ e a ıamos anteriormente ser´ derrubado. Pelo contr´rio, iremos chegar a nossas certezas atrav´s de a a e uma argumenta¸˜o l´gica. ca o
1 Considere a fun¸˜o g(x) = x , cujo gr´fico ca a est´ desenhado ao lado. Essa fun¸˜o dia ca verge em x = 0 e n˜o est´ definida nesse a a ponto. Restringiremo-nos de in´ ` parte ıcio a positiva do dom´ ınio e definiremos, para x > 0, o logaritmo natural de x como sendo a integral de g de 1 at´ x: e x

1 g(x)= x

1 1 ln x x

ln x ≡
1

1 dt . t

Observe no desenho que, para x > 1 essa fun¸˜o ´ positiva e representa a ´rea sob ca e a o gr´fico de g no intervalo [1, x]. Para x < 1, no entanto, a integral corre em sentido a contr´rio, logo vale o negativo da ´rea sob o gr´fico. Al´m disso, evidentemente, ln 1 = 0. a a a e

A.7. O LOGARITMO

253

ln x

Lembremos sempre que essa fun¸˜o, por ser uma ca 1 1 primitiva de x tem derivada exatamente igual a x : (ln x) =
x

1 . x

1

O gr´fico de ln x est´ esbo¸ado ao lado. Quando a a c x tende a zero a fun¸˜o tende a −∞ e quando x ca tende a infinito a fun¸˜o tamb´m tende a infinito. ca e Esses fatos podem ser demonstrados levando-se em conta os coment´rios abaixo. a

A propriedade mais marcante que conhecemos ´ que “o logaritmo do produto ´ a e e soma dos logaritmos”, isto ´, e

ln xy = ln x + ln y .

Essa propriedade pode ser deduzida da defini¸˜o que demos. Pois isso ´ o mesmo que ca e provar que

xy 1

1 dt = t

x 1

1 dt + t

y 1

1 dt . t

Para tanto, separamos a integral do lado esquerdo em dois peda¸os: c

xy 1

1 dt = t

x 1

1 dt + t

xy x

1 dt . t

S´ falta verificar que o

xy 1 x t dt

´ igual a e

y 1 1 t dt.

254

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO A integral 1 1 dt ´ a ´rea da regi˜o A na figura ao e a a t lado, dada por A = {(t, s) ; 1 ≤ t ≤ y , 0 ≤ s ≤ 1/t} , e a outra integral, dada por
xy 1 x t dt y

A 1 1/ y 1 B 1/x 1/xy x xy y

´ a ´rea da regi˜o B, e a a

B = {(t, s) ; x ≤ t ≤ xy , 0 ≤ s ≤ 1/t} . Mostremos a seguinte afirma¸˜o: “(t, s) ´ um ponto ca e 1 de A se e somente se (xt, x s) ´ um ponto de B”. e Assim, B ´ obtido de A pela multiplica¸˜o por x e ca 1 na horizontal e por x na vertical. Em termos de a ´rea, as duas multiplica¸˜es se cancelam, e a ´rea co a de B tem que ser igual ` ´rea de A. aa

J´ a afirma¸˜o ´ mostrada assim: (t, s) ∈ A se e somente se 1 ≤ t ≤ y e 0 ≤ s ≤ 1 , a ca e t 1 1 1 que ocorre se e somente se x ≤ xt ≤ xy e 0 ≤ x s ≤ xt , ou seja, (xt, x s) ∈ B. Da f´rmula ln xy = ln x + ln y decorre, por exemplo, que ln xn = n ln x, se n ≥ 0 o ´ inteiro. Para ver isso, primeiro verificamos que se n = 0 ent˜o xn = x0 = 1 e e a ln x0 = ln 1 = 0 = 0 · ln x. Se n = 1 a f´rmula tamb´m est´ trivialmente correta. Se o e a n ≥ 2 basta fazer a recurs˜o a ln xn = ln x · xn−1 = ln x + ln xn−1 = ln x + ln x · xn−2 = 2 ln x + ln xn−2 = . . . = ... = n ln x . Al´m disso, como ln 1 = ln x · e
1 x 1 = ln x + ln x ent˜o a

ln

1 = − ln x . x

Assim podemos dizer que ln x−n = −n ln x, e que a f´rmula tamb´m vale para os inteiros o e negativos. Tendo ent˜o a defini¸˜o do logaritmo natural, podemos definir outros logaritmos. Se a ca b ´ positivo e b = 1, chamaremos de logaritmo de x na base b ao n´mero e u logb x ≡ ln x . ln b

A.7. O LOGARITMO

255

Essa defini¸˜o pode parecer estranha. Afinal, a defini¸˜o a que estamos acostumados ca ca diz assim: o n´mero r = logb x ´ aquele tal que u e br = x . Mas essa propriedade pode ser demonstrada (em vez de definida). Pois se n ´ um n´mero e u inteiro e bn = x ent˜o a ln x ln bn n ln b = = =n. ln b ln b ln b

logb x =

E quanto a potˆncias com n´meros n˜o inteiros? A princ´ e u a ıpio n˜o sabemos o que isso a significa, mas podemos adiante defini-las inspirados no que vimos acima. Antes, por´m, observemos que o logaritmo natue ral ´ um logaritmo em alguma base. Suponha que e achemos um n´mero e tal que ln e = 1. Ent˜o u a ln x = ln x ln x = = loge x . 1 ln e
1 x 1 e

ln x

Esse n´mero e existe e ´ chamado de n´mero de u e u Euler. Ele vale, at´ a nona casa decimal depois da e v´ ırgula, 2.718281828 . . .

Outra defini¸˜o que prov´m do logaritmo natural ´ a da fun¸˜o exponencial. A ca e e ca fun¸˜o exponencial ´ a inversa da fun¸˜o logaritmo natural e ´ denotada por exp(x). ca e ca e Geometricamente, se quisermos achar exp(x), temos que

• desenhar o gr´fico do logaritmo natural a

• localizar x na ordenada (e n˜o na abscissa!) a

• procurar exp(x) como o unico ponto da abscissa tal que (exp(x), x) esteja sobre o ´ gr´fico (ver figura abaixo, ` esquerda). a a

256

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO

ln x

exp(x) 1 x x

1 exp(x)

Ent˜o o gr´fico da exponencial assume o aspecto da figura acima, ` direita. Enquanto a a a o dom´ ınio do logaritmo natural ´ o conjunto dos n´meros positivos e sua imagem o e u conjunto de todos os n´meros reais, com a exponencial ocorre o inverso: ela est´ definida u a para todos os n´meros reais, mas s´ assume valores positivos. u o Lembremos tamb´m que a defini¸˜o geom´trica dada acima significa que exp(ln x) = e ca e x, para todo x > 0, e que ln(exp(x)) = x, para todo x. A exponencial tem a seguinte propriedade: “a exponencial da soma ´ o produto das e exponenciais”. Matematicamente, exp(x + y) = exp(x) · exp(y) . Isso ocorre pois, por um lado x + y = ln exp(x + y) , e por outro x + y = ln exp(x) + ln exp(y) = ln(exp(x) · exp(y)) , de onde segue a igualdade. Agora, inspirados no fato de que para n´meros inteiros n e b > 0 vale u bn = exp(ln bn ) = exp(n ln b) , definiremos a opera¸˜o de potencia¸˜o br , com b > 0 e r qualquer: ca ca br ≡ exp(r ln b) .

´ A.8. O TEOREMA DO VALOR MEDIO

257

´ a E f´cil ver que br bs = br+s , que decorre da propriedade da exponencial que acabamos de demonstrar. Da´ temos que, por exemplo, ı b 2 · b 2 = b 2 + 2 = b1 = b . ou seja, √ 1 b2 = b . √ 1 Isso explica por que denotamos b n ≡ n b. Finalmente, ´ interessante notar que, com essa defini¸˜o, e ca ex = exp(x ln e) = exp(x) , isto ´, a exponencial ´ a potencia¸˜o do n´mero de Euler e! e e ca u
1 1 1 1

A.8

O Teorema do Valor M´dio e

Cientes do fato de que o c´lculo de integrais depende de nossa capacidade de achar pria mitivas, o que por sua vez depende de nossos conhecimentos sobre deriva¸˜o de fun¸˜es, ca co voltemos ao estudo das derivadas! Nesta curta Se¸˜o, enunciaremos o Teorema do Valor ca M´dio. Depois, nas demais se¸˜es, obteremos regras de deriva¸˜o e delas conseguiremos e co ca tamb´m m´todos de primitiviza¸˜o. e e ca Imagine uma fun¸˜o definida num intervalo [a, b], ca cujo gr´fico ´ mostrado na figura ao lado. Agora a e f(b) trace uma reta L ligando os pontos (a, f (a)) e (b, f (b)) (indicada na figura por uma linha tracejada). A inclina¸˜o dessa reta ´ dada por ca e
f(a)

f (b) − f (a) . b−a

a

c

b

O Teorema do Valor M´dio diz que existe (pelo menos) um ponto c no intervalo e [a, b] tal que a reta tangente a (c, f (c)) ´ paralela ` reta L. Como a inclina¸˜o dessa reta e a ca tangente ´ dada por f (c), ent˜o o Teorema do Valor M´dio diz que existe c ∈ [a, b] tal e a e que f (b) − f (a) f (c) = , b−a ou tal que f (c)(b − a) = f (b) − f (a) .

258

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO

O Teorema do Valor M´dio tamb´m tem sua vers˜o em termos de integrais. Seja g e e a uma fun¸˜o cont´ ca ınua no intervalo [a, b], e seja f sua primitiva. Ent˜o existe c em [a, b] a tal que
b

g(t)dt = f (b) − f (a) = f (c)(b − a) = g(c)(b − a) .
a

Ou seja, a integral pode ser trocada pela integral da fun¸˜o constante g(c), que vale ca g(c)(b − a).

A.9

A Regra da Cadeia

Freq¨entemente nos deparamos com fun¸˜es compostas, e queremos achar suas derivau co das. Por exemplo, f (x) = sin(x2 ) ´ uma fun¸˜o composta, resultante de se aplicar a e ca fun¸˜o seno ap´s se elevar o n´mero ao quadrado. Usaremos o desenho abaixo para ca o u representar essa composi¸˜o: ca

u(x)= x 2

v(x)=sen x

x

x2

sen(x2)

f(x)=sen(x2)
De acordo com a figura, f (x) = v(u(x)) . A Regra da Cadeia nos d´ uma forma de calcular a derivada de f desde que saibamos a derivar as fun¸˜es que a comp˜em. A motiva¸˜o que daremos de sua veracidade ser´ co o ca a baseada na hip´tese de que as derivadas de u e v s˜o fun¸˜es que variam continuamente. o a co Para calcularmos a derivada de f lembremos que devemos examinar o quociente f (x + h) − f (x) h e calcular seu limite quando h tende a zero.

A.9. A REGRA DA CADEIA

259

u
c(h) x x+h d(h) u(x) u(x+h)

v
f(x) f(x+h)

f
Agora notemos que f (x) = v(u(x)) e f (x + h) = v(u(x + h)). Pelo Teorema do Valor M´dio, existe um ponto d = d(h) (sim, ele depende de h, mas `s vezes escreveremos e a apenas d) entre u(x) e u(x + h) (acompanhe na figura) tal que f (x + h) − f (x) = v(u(x + h)) − v(u(x)) = v (d) · (u(x + h) − u(x)) . Al´m disso, novamente por causa do Teorema do Valor M´dio, existe c = c(h) entre x e e e x + h tal que u(x + h) − u(x) = u (c) · (x + h − x) = u (c) · h . Juntando as duas equa¸˜es, obtemos co f (x + h) − f (x) = v (d) · u (c) . h Acontece que quando h tende a zero o ponto c(h) tende a x (pois est´ entre x e x + h), a e o ponto d(h) tende a u(x). Como assumimos que as derivadas s˜o cont´ a ınuas, ent˜o a u (c) tende a u (x) e v (d) tende a v (u(x)). Assim temos a Regra da Cadeia: se f (x) = v(u(x)) ent˜o a f (x) = v (u(x)) · u (x) . ´ E muito comum a Regra da Cadeia ser aplicada quando a primeira fun¸˜o ´ linear. ca e Por exemplo, se f (x) = cos(2x) (u(x) = 2x, v(x) = cos(x)), ent˜o a f (x) = v (u(x)) · u (x) = − sin(2x) · 2 = −2 sin(2x) . Outra aplica¸˜o ocorre com fun¸˜es inversas. Se u(x) e v(x) s˜o inversas uma da ca co a outra, ent˜o a u(v(x)) = x para todo x no dom´ ınio de v e v(u(x)) = x

260

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO

para todo x no dom´ de u. Isso ocorre por exemplo com as fun¸˜es ln x e ex . Derivando ınio co dos dois lados de qualquer uma das equa¸˜es, usando a Regra da Cadeia, temos co u (v(x)) · v (x) = 1 , v (u(x)) · u (x) = 1 .
1 Vejamos como isso fica se u(x) = ex e v(x) = ln x. J´ sabemos que v (x) = x (pela a pr´pria defini¸˜o do logaritmo!). Usaremos a segunda express˜o para calcular a derivada o ca a x . Temos de u(x) = e 1 1 u (x) = = 1 = u(x) . v (u(x)) u(x)

Conclus˜o: a derivada de ex ´ ex !! a e Agora tamb´m podemos derivar f (x) = bx . Como bx = ex ln b , ent˜o e a f (x) = (ln b) · ex ln b , pela Regra da Cadeia, isto ´, e f (x) = (ln b)bx .

A.10

Regras do produto e do quociente

Quando f (x) = u(x)v(x), quanto vale f (x)? Precisamos calcular o limite 1 1 {f (x + h) − f (x)} = {u(x + h)v(x + h) − u(x)v(x)} . h h De maneira esperta, subtra´ ımos e somamos u(x + h)v(x), sem alterar o valor da express˜o: a 1 {u(x + h)v(x + h) − u(x + h)v(x) + u(x + h)v(x) − u(x)v(x)} , h e depois a arrumamos de forma conveniente: u(x + h) u(x + h) − u(x) v(x + h) − v(x) + v(x) . h h

Quando h tende a zero, essa express˜o tende a a u(x)v (x) + u (x)v(x) . Conclus˜o: a (u(x)v(x)) = u (x)v(x) + u(x)v (x) ,

A.11. TRUQUES DE PRIMITIVIZACAO: INTEGRACAO POR PARTES ¸˜ ¸˜ que ´ a conhecida Regra do Produto. Por exemplo, e (x2 e2x ) = 2xe2x + x2 · 2e2x = 2x(1 + x)e2x .

261

A Regra do Produto tamb´m pode ser usada para calcular a derivada de um quocie ente u(x) f (x) = , v(x) ´ o desde que v(x) = 0. E s´ pensar que f (x) tamb´m ´ um produto: e e f (x) = u(x) v(x) = u(x) · 1 v(x) = u (x)v(x) + u(x) 1 v(x) .

1 S´ que precisamos saber calcular a derivada de v(x) ! Para isso lan¸amos m˜o da Regra o c a 1 1 1 da Cadeia: v(x) ´ a fun¸˜o x aplicada ap´s a fun¸˜o v(x). Como a derivada de x ´ −1 , e ca o ca e x2 ent˜o a 1 −1 = v (x) · . v(x) v(x)2

Logo u(x) v(x) = u (x) −v (x) + u(x) · . v(x) v(x)2

Colocando sob o mesmo denominador, u(x) v(x) = u (x)v(x) − u(x)v (x) . v(x)2

Essa express˜o tamb´m ´ conhecida como Regra do Quociente. a e e Sugere-se ao leitor testar seus conhecimentos de t´cnicas de deriva¸˜o com as fun¸˜es e ca co trigonom´tricas, j´ sabendo as derivadas de seno e cosseno. Por exemplo, a fun¸˜o tane a ca gente, que ´ seno sobre cosseno, pode ser derivada com a Regra do Quociente. Obter as e derivadas das fun¸˜es secante, cossecante e cotangente. Obter as derivadas das inversas co das fun¸˜es trigonom´tricas, arcsin, arctan, etc. Em todos os casos procurar desenhar co e o gr´fico dessas fun¸˜es e interpretar as express˜es obtidas!! a co o

A.11

Truques de primitiviza¸˜o: integra¸˜o por partes ca ca

Se rearranjarmos a express˜o da Regra do Produto, teremos a u(x)v (x) = (u(x)v(x)) − u (x)v(x) .

262

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO

Havendo a igualdade, os dois lados da equa¸˜o ter˜o as mesmas primitivas (que diferem ca a no m´ximo por uma constante): a u(x)v (x)dx = Como (u(x)v(x)) dx − u (x)v(x)dx + C .

(u(x)v(x)) dx = u(x)v(x) + C ent˜o a u(x)v (x)dx = u(x)v(x) − u (x)v(x)dx + C .

Essa ´ a conhecida f´rmula de Integra¸˜o por Partes! e o ca Por exemplo, queremos achar uma primitiva de xex . Se chamarmos u(x) = x e v (x) = ex ent˜o u (x) = 1 e v(x) = ex (na verdade ex + C, mas isso n˜o far´ diferen¸a, a a a c confira!!). Ent˜o a xex dx = xex − 1ex dx + C = xex − ex + C = ex (x − 1) + C .

Para conferir, basta derivar a primitiva obtida: (ex (x − 1)) = ex (x − 1) + ex = xex . H´ que se tomar cuidado para n˜o se escolher u de forma errada. Se cham´ssemos a a a u(x) = ex e v (x) = x ter´ ıamos u (x) = ex e v(x) = 1 x2 , e ent˜o a 2 1 ex xdx = x2 ex − 2 1 2 x x e dx , 2

o que n˜o melhora nossa situa¸˜o, pois agora precisamos achar a primitiva de x2 ex ! a ca

A.12

Truques de primitiviza¸˜o: substitui¸˜o ca ca

Se da Regra do Produto decorre a Integra¸˜o por Partes, da Regra da Cadeia segue a ca t´cnica de Substitui¸˜o. A Regra da Cadeia diz que e ca f (g(x)) = f (g(x))f (x) . Em termos de primitivas, temos f (g(x))f (x)dx = f (g(x)) dx + C = f (g(x)) + C .

A.12. TRUQUES DE PRIMITIVIZACAO: SUBSTITUICAO ¸˜ ¸˜ Por exemplo, podemos nos deparar com h(g(x))g (x)dx . Se acharmos f tal que f (x) = h(x) (isto ´, uma primitiva de h) ent˜o e a h(g(x))g (x)dx = f (g(x))g (x)dx = f (g(x)) + C .

263

Embora ao leitor n˜o pare¸a acrescentar nada nesse caso, esse processo pode ser autoa c matizado da seguinte forma: 1. Definir nova vari´vel u = g(x), com du = g (x)dx. a 2. Substituir na integral a nova vari´vel: a h(u)du.

3. Resolver o novo problema, que ´ o mesmo que achar uma primitiva de h: e h(u)du = f (u) + C . 4. Retornar o valor de u = g(x), obtendo f (g(x)) + C . Por exemplo, queremos calcular Ficamos com √ x 1 + x2 dx. Fazemos u = x2 , donde du = 2xdx. 1√ 1 + udu . 2

S´ precisamos saber uma primitiva de (1 + u)1/2 . Mas esta ´ f´cil: tentemos o e a 2 (1 + u)3/2 . 3 Substituindo u = x2 na resposta, obtemos 1 x 1 + x2 dx = (1 + x2 )3/2 + C . 3 Em algumas situa¸˜es n˜o ´ evidente a substitui¸˜o a ser feita. Seja H(x)dx a co a e ca primitiva a calcular. Chame u = g(x), escolha que ´ apenas uma tentativa e depende e do ’feeling’ em rela¸˜o ao problema. Se for poss´ inverter a fun¸˜o g ent˜o teremos ca ıvel ca a −1 (u). Agora du = g (x)dx, isto ´, x=g e du = g (g −1 (u))dx ,

264 logo dx = du g

ˆ ˜ ´ APENDICE A. REVISAO DE CALCULO

(g −1 (u))

= (g −1 ) (u)du .

Ent˜o a substitui¸˜o pela nova vari´vel leva a a ca a H(g −1 (u)) · (g −1 ) (u)du . Eventualmente ´ mais f´cil calcular a primitiva de e a H(g −1 (u)) · (g −1 ) (u) do que a primitiva de H(x). Se F (u) for a tal primitiva, ent˜o basta substituir u = g(x) a para obter a primitiva desejada de H: H(x)dx = F (g(x)) + C . √ Vejamos um exemplo. Queremos determinar x2 x + 1dx. Podemos fazer a subs√ titui¸˜o u = x + 1. Ent˜o invertemos e obtemos x = u2 − 1, com dx = 2udu. Em ca a seguida fazemos a substitui¸˜o na integral, obtendo ca 2(u2 − 1)2 u2 du . Essa primitiva ´ f´cil de achar, pois trata-se de um polinˆmio: basta integrar termo a e a o termo, para obter 2 4 2 u3 ( − u2 + u4 ) + C . 3 5 7 Substituindo novamente u por (x + 1)1/2 , chegamos ` primitiva procurada: a 2 (x + 1)3/2 7 8 4 − x + x2 15 5 +C .

Apˆndice B e

F´rmula de Taylor o
B.1 Introdu¸˜o ca

Na Parte II deste livro ´ abordada a quest˜o da aproxima¸˜o de uma fun¸˜o por poe a ca ca linˆmios: dado um n´mero inteiro n maior ou igual a zero, qual ´ o melhor polinˆmio, o u e o entre aqueles de grau menor ou igual a n, a aproximar uma certa fun¸˜o cont´ ca ınua f definida no intervalo [a, b]? Ali a quest˜o s´ pode ser respondida se antes se definir um crit´rio (relativo) de a o e proximidade. Isto ´, uma maneira de dizer o quanto um polinˆmio est´ distante de f , e o a que permita decidir, entre dois dados polinˆmios, qual ´ aquele que est´ mais perto de o e a f . O crit´rio adotado ´ o do “qui-quadrado”: se p ´ o polinˆmio ent˜o mede-se e e e o a
b

Q(p) =
a

(f (x) − p(x))2 dx ,

que ´ sempre um n´mero maior ou igual a zero. e u Esse crit´rio leva em conta a proximidade de f e p em todo o intervalo [a, b]. De e nada adianta que p seja exatamente igual a f em certa parte do intervalo se em outra a diferen¸a se torna enorme, fazendo aumentar o valor da integral. c Neste Apˆndice estamos interessados em outro ponto de vista para se definir a melhor e aproxima¸˜o polinomial de f . Agora n˜o estamos preocupados em aproximar f num ca a dado intervalo fixo, mas sim “na vizinhan¸a de um ponto”. Fixado um ponto w, n˜o c a nos interessar´ o que acontece com a fun¸˜o “longe” do ponto w. a ca Tentemos precisar melhor os conceitos. Seja f uma fun¸˜o, para come¸ar cont´ ca c ınua, e w um ponto onde ela esteja definida. Sejam p e q dois polinˆmios. Diremos que p o aproxima f em w melhor do que q se p(x) − f (x) <1 q(x) − f (x) 265

266

ˆ ´ APENDICE B. FORMULA DE TAYLOR

quando x est´ suficientemente perto de w. Ou seja, se tomarmos x suficientemente a pr´ximo de w ent˜o a diferen¸a |p(x) − f (x)| fica menor do que a diferen¸a |q(x) − f (x)|. o a c c Obviamente a fra¸˜o s´ ´ tomada quando o denominador for n˜o nulo. ca o e a Em geral, teremos que essa fra¸˜o vai a zero, o que pode ser expresso da seguinte ca maneira: p(x) − f (x) lim =0. x→w q(x) − f (x) Podemos ver alguns exemplos simples, para aos poucos chegarmos a enunciados mais gerais.

B.1.1

Polinˆmios de grau zero o

Por exemplo, suponha que f seja uma fun¸˜o (cont´ ca ınua) que assume o valor A em w. E suponha que p e q sejam polinˆmios de grau zero, isto ´, s˜o polinˆmios constantes: o e a o p(x) = a0 e p(x) = b0 , para todo x, com a0 = b0 . Para sabermos qual dos polinˆmios o aproxima melhor a fun¸˜o f em w, temos que olhar para o quociente ca p(x) − f (x) a0 − f (x) = q(x) − f (x) b0 − f (x) Como f (x) tende a A ` medida que x tende a w, podemos ver quais s˜o as possibilidades. a a Primeiro, se tanto a0 quanto b0 forem diferentes de A, ent˜o o quociente tende a a a0 − A , b0 − A que ser´ menor do que 1 se a0 estiver mais pr´ximo de A do que b0 . Neste caso, como a o esse ´ o valor limite, quando x estiver bem pr´ximo de w o quociente ser´ tamb´m menor e o a e do que 1, e ent˜o p aproximar´ melhor do que q em w. Se for o contr´rio, isto ´, b0 mais a a a e perto de A do que a0 ent˜o ser´ q que aproximar´ melhor. a a a Se a0 = A ent˜o teremos que a diferen¸a a0 − f (x) tende a zero quando x tende a a c w, enquanto b0 − f (x) tende a b0 − a0 . Neste caso a fra¸˜o ir´ a zero. ca a Conclui-se portanto que o melhor polinˆmio de grau zero que aproxima f em w ´ o e p(x) = f (w) = A.

B.1.2

Aproxima¸˜o da fun¸˜o nula ca ca

Vale a pena entender tamb´m o que se passa com a fun¸˜o f (x) ≡ 0, a fun¸˜o nula, e ca ca tomando, para facilitar, o ponto w = 0. Pela Subse¸˜o anterior, o melhor polinˆmio de ca o grau zero que aproxima f em w ´ p(x) ≡ 0. Tamb´m p(x) ≡ 0 = 0 + 0 · x ´ o melhor e e e polinˆmio de grau 1 a aproximar f , de fato, para qualquer n ´ o melhor polinˆmio de o e o grau n. Fica para o leitor se divertir em demonstrar (ou verificar) isso.

B.1. INTRODUCAO ¸˜

267

B.1.3

Aproxima¸˜o de grau 1 ca

Vejamos como melhor aproximar uma fun¸˜o f em w por um polinˆmio de grau 1, ca o supondo que ela seja deriv´vel. a Em primeiro lugar, ´ f´cil ver que o polinˆmio p(x) deve ter, como termo de grau e a o zero, o valor de f em w, pela mesma raz˜o com que o melhor polinˆmio de grau zero a o tinha que ser igual a f (w). Ent˜o a p(x) = f (w) + α(x − w) (lembrando que polinˆmios de grau 1 tˆm retas como gr´fico, e esta ´ uma maneira de se o e a e escrever a reta que passa por (w, f (w)) e tem inclina¸˜o α), ou seja, precisamos apenas ca procurar o valor de α. Como f ´ deriv´vel, ent˜o existe o limite e a a f (w) = lim Isto ´ o mesmo que dizer que a diferen¸a e c f (w) − f (x) − f (w) x−w f (x) − f (w) . x→w x−w

tende a zero quando x tende a w. Afirmamos que p(x) = f (w) + f (w)(x − w) ´ o melhor polinˆmio de grau 1 que e o aproxima f em w, em detrimento de outros polinˆmios q(x) = f (w) + α(x − w), com o α = f (w). Basta olharmos para a fra¸˜o ca f (x) − p(x) f (x) − f (w) − f (w)(x − w) = . f (x) − q(x) f (x) − f (w) − α(x − w) Colocando x − w em evidˆncia no numerador e no denominador, ficamos com e
f (x)−f (w) − f (w) x−w f (x)−f (w) −α x−w

.

Quando x tende a w, o numerador tende a zero, pelas considera¸˜es acima, enquanto co que o denominador tende a f (w) − α, que ´ diferente de zero. Portanto a fra¸˜o toda e ca vai a zero, mostrando o que hav´ ıamos afirmado. Conclui-se ent˜o que a melhor aproxima¸˜o de grau 1 de f em w corresponde ` a ca a (´nica) reta que passa por w e tem inclina¸˜o f (w). u ca

268

ˆ ´ APENDICE B. FORMULA DE TAYLOR

B.2

Polinˆmio e F´rmula de Taylor o o

A ultima afirma¸˜o da Se¸˜o anterior ´ mais ou menos intuitiva. Ela diz que a melhor ´ ca ca e reta que aproxima um gr´fico em dado ponto ´ a reta tangente ao gr´fico nesse ponto. a e a Outra maneira de se ler essa conclus˜o ´ a seguinte. O polinˆmio p(x) de grau 1 que a e o melhor aproxima f em w ´ aquele tal que p(w) = f (w) e p (w) = f (w). e Esta segunda maneira de pensar se presta facilmente a generaliza¸˜es. De fato, podeco se mostrar (e o faremos logo abaixo) que o polinˆmio de grau n que melhor aproxima f o em w ´ aquele (´nico) tal que e u p(w) = f (w) , p (w) = f (w) , p (w) = f (w) , . . . , p(n) (w) = f (n) (w) , ou seja, cujas derivadas at´ ordem n coincidem com as derivadas de f em w. e ´ claro que ao fazermos tal afirma¸˜o estamos automaticamente supondo que f pode E ca ser diferenciada n vezes em w! Para facilitar as coisas iremos supor que a fun¸˜o f ´ ca e tantas vezes diferenci´vel quanto queiramos, e al´m do mais todas as suas derivadas de a e qualquer ordem s˜o fun¸˜es cont´ a co ınuas. Esse ´, de fato, o caso da maioria das fun¸˜es e co com que iremos nos deparar em aplica¸˜es (obviamente h´ exce¸˜es, e nesses casos h´ co a co a que se tomar os devidos cuidados). O leitor pode facilmente verificar, usando as regras de deriva¸˜o, que o polinˆmio ca o pn (x) = f (w) + f (w)(x − w) + f (w) f (n) (w) (x − w)2 + . . . + (x − w)n 2 n!

satisfaz as exigˆncias acima. Este ´ o chamado polinˆmio de Taylor de ordem n de f e e o em w. Antes de examinarmos a veracidade da generaliza¸˜o feita acima, podemos tamb´m ca e nos perguntar em que grau ´ boa a aproxima¸˜o por polinˆmios, em w, da fun¸˜o f . e ca o ca Mais especificamente, podemos investigar a diferen¸a f (x)−pn (x) quando x se aproxima c de w. De fato, responderemos todas as indaga¸˜es de uma s´ vez. Comecemos examinando co o a diferen¸a entre f (x) e a aproxima¸˜o de primeira ordem p1 (x) = f (w) + f (w)(x − w). c ca Chamemos de R1 (x) (“R” de resto) essa diferen¸a. Ent˜o c a R1 (x) = f (x) − f (w) − f (w)(x − w) . A id´ia ´ reescrever essa express˜o de forma que possamos avaliar o tamanho de R1 (x). e e a Pelo Teorema Fundamental do C´lculo, temos a
x

R1 (x) =
w

f (t)dt − f (w)(x − w)

ˆ ´ B.2. POLINOMIO E FORMULA DE TAYLOR e, nesta nova express˜o, podemos reconhecer a integra¸˜o por partes a ca
x

269

R1 (x) =
w

(x − t)f (t)dt .

Podemos agora estimar R1 (x), usando o Teorema do Valor M´dio, em sua vers˜o e a integral. Ou seja, existe ξ entre w e x, que depende de x, tal que R1 (x) = (x − w)(x − ξ)f (ξ) . Portanto temos |R1 (x)| = |x − ξ| · |f (ξ)| . |x − w|

Quando x tende a w a diferen¸a |x − ξ| tende a zero, uma vez que ξ est´ entre w e x. c a Al´m disso, como estamos supondo que todas as derivadas de f sejam cont´ e ınuas, f (ξ) tende a f (w). Logo |R1 (x)| lim =0. x→w |x − w| Conclui-se ent˜o que o resto n˜o s´ tende a zero quando x tende a w como tende a a a o zero mais rapidamente do que a diferen¸a x − w. c A segunda etapa ´ ver o que acontece com ordens mais altas. Vejamos o que acontece e ao passarmos para ordem 2. Como p2 (x) = p1 (x) + temos R2 (x) = f (x) − p2 (x) = f (x) − p1 (x) − Mas f (x) − p1 (x) = R1 (x), de forma que
x

f (w) (x − w)2 , 2 f (w) (x − w)2 . 2

R2 (x) =
w

(x − t)f (t)dt −

f (w) (x − w)2 , 2

express˜o esta que sai da integra¸˜o por partes de a ca R2 (x) = 1 2
x

(x − t)2 f (t)dt .
w

Usando novamente o Teorema do Valor M´dio para a integral, conseguimos mostrar que e |R2 (x)| =0. x→w |x − w|2 lim

270

ˆ ´ APENDICE B. FORMULA DE TAYLOR Prosseguindo indutivamente (fica para o leitor se certificar disto), conclui-se que f (x) = pn (x) + Rn (x) ,

conhecida como f´rmula de Taylor de ordem n para f em w, onde o Rn (x) = 1 n!
x

(x − t)n f (n+1) (t)dt .
w

A fun¸˜o Rn tem a propriedade de que ca lim |Rn (x)| =0. |x − w|n

x→w

Se delimitarmos um intervalo onde a (n + 1)-´sima derivada de f seja cont´ e ınua, seu (n+1) |. Como o m´dulo ter´ um m´ximo nesse intervalo, que denotaremos por max |f o a a m´dulo da integral ´ menor ou igual ` integral do m´dulo (em um intervalo orientado o e a o positivamente), temos |Rn (x)| ≤ e |Rn (x)| ≤ max |f (n+1) | n! 1 n!
x

|x − t|n |f (n+1) (t)|dt
w x

|x − t|n dt .
w

Fazendo um gr´fico de |x − t|n entre w e x, e prevendo as possibilidades de que x < w a e w < x, o leitor pode verificar facilmente que
x |x−w|

|x − t|n dt =
w 0

un du =

|x − w|n+1 . n+1

Ent˜o a |Rn (x)| ≤ max |f (n+1) | |x − w|n+1 . (n + 1)!

Podemos agora entender a raz˜o pela qual o polinˆmio de Taylor pn ´ a melhor a o e aproxima¸˜o de grau n de f em w. Primeiro notamos que ca Rn (x) =0 x→w (x − w)m lim para qualquer m menor ou igual a n (tiramos os m´dulos para facilitar as coisas, uma o vez que o limite de uma express˜o ´ zero se e somente se o limite do m´dulo da mesma a e o

ˆ ´ B.2. POLINOMIO E FORMULA DE TAYLOR

271

express˜o ´ zero). Basta multiplicar o numerador e o denominador por (x − w)n−m , a e ficando com Rn (x) (x − w)n−m , (x − w)n que vai a zero porque ´ um produto de dois termos que v˜o a zero. e a Suponhamos agora outro polinˆmio q de grau (no m´ximo) n. Como q e pn n˜o o a a s˜o iguais, a diferen¸a entre eles ´ um polinˆmio de grau no m´ximo n, que podemos a c e o a escrever como am (x − w)m + am+1 (x − w)m+1 + . . . + an (x − w)n . O n´mero m ´ o grau correspondente ao primeiro coeficiente n˜o-nulo do polinˆmio u e a o (quando escrito nessa forma), e pode ser qualquer inteiro entre 0 e n. Ent˜o a pn (x) − q(x) = (x − w)m (am + Q(x)) , onde Q(x) = am+1 (x − w) + am+2 (x − w)2 + . . . + an (x − w)n−m , polinˆmio que vai a o zero quando x tende a w. Finalmente comparamos a proximidade de pn e q com f , para mostrar que pn est´ a mais pr´ximo de f em w do que q. Temos o f (x) − pn (x) Rn (x) = , f (x) − q(x) Rn (x) + pn (x) − q(x) lembrando da pr´pria defini¸˜o de Rn . A partir das considera¸˜es acima, essa fra¸˜o o ca co ca pode ser escrita como Rn (x) , Rn (x) (x − w)m (am + Q(x) + (x−w)m ) de onde nota-se que ela deve ir a zero quando x tende a w.

Sign up to vote on this title
UsefulNot useful