You are on page 1of 39

1

ALAp 1 - INTRODUÇÃO
O objetivo deste capítulo incial é introduzir algumas idéias básicas que nos ocuparão
transversalmente em praticamente todos os demais capítulos desta disciplina. As duas mais importantes são:
O espaço vetorial n, no qual trabalharemos em 90% deste livro.
A idéia de LINEARIDADE, que tem muitos desdobramentos e traduz uma propriedade tão
fundamental na modelagem de muitos dos fenômenos naturais, que você a continuará vendo de
muitas formas diferentes em várias outras disciplinas de seu curso. Em particular faremos, ainda
neste primeiro capítulo, uma rápida introdução às funções lineares, que é o objeto central de estudo
nesta disciplina.

Ao final deste capítulo introdutório daremos um panorama do que tratará este livro, situando aquilo
que nos parece relevante numa disciplina introdutória de Álgebra Linear Aplicada, dirigida a cursos de
Engenharia e Ciências Exatas. Em particular, diremos como se distribuem os demais capítulos. Na seção 1.l
lhe damos algumas orientações sobre o uso deste texto.

1.1 - PRELIMINARES
Uma das características mais relevantes da Álgebra Linear consiste na sua vocação para modelar,
matematicamente, fenômenos tão diversos quanto problemas de difusão, circuitos elétricos, imagens de
tomografia computadorizada, cálculo de estruturas em construção civil, sistemas de controle, problemas de
otimização, de estatística, econometria, etc... Historicamente, o grande problema no uso da Álgebra Linear
para modelar problemas da realidade, residia no fato de resultarem em problemas por vezes muito simples,
do ponto de vista teórico, porém impossíveis de se resolver, na prática, por conta de exigirem uma
capacidade computacional inimaginável até meados deste século. A álgebra linear é, sem dúvida, um dos
campos da matemática cuja importância para as Engenharias e Ciências Exatas mais se expandiu com a
fantástica multiplicação da capacidade computacional colocada a disposição da humanidade a partir da
década de 60. Na primeira metade do século XX seria praticamente impossível realizar a multiplicação de
duas matrizes 100x100. Mesmo em meados da década de 70, tal tarefa requeria um computador bastante
sofisticado para a época. Hoje, em 2009, multiplicar duas matrizes 1000x1000 em menos de um segundo é
o padrão, nos microcomputadores mais simples disponíveis no mercado. Tradicionalmente, a álgebra
linear era dada de uma forma mais abstrata e o tratamento mais numérico era visto em disciplinas como o
Cálculo Numérico (hoje correspondente, em muitos cursos de engenharia, a uma disciplina
frequentemente denominada “Métodos Computacionais”). Nestes últimos vinte anos, expandiu-se
fantasticamente o acesso a softwares matemáticos muito amigáveis e poderosos. Isto tem produzido novos
enfoques no ensino da Álgebra Linear, na direção de aproximá-la mais de aspectos computacionais
usualmente situados no Cálculo Numérico. Nas referências [1], [2], [3], [4], [5], [6] e [9], indicadas na
bibliografia complementar recomendada ao final do capítulo, pode-se claramente perceber os sinais desta
tendência.

Apesar de preocupado com aplicações e dirigido para alunos de Engenharia e Ciências Exatas, não
podemos perder de vista que este é um livro introdutório de Álgebra Linear. Entendemos que, numa primeira
disciplina de Álgebra Linear o tratamento cuidadoso dos conceitos básicos e a compreensão dos principais
2

resultados matemáticos continua sendo a questão central, mesmo que o enfoque possa ser bastante diferente
do tradicional. Portanto, o fundamental é compreender bem os conceitos que permitem aos seres humanos
construir algoritmos com a Álgebra Linear e aplicá-los para resolever problemas. A novidade destes
últimos 10 anos em termos de ensino, tem sido levar também em conta, em alguma medida, mesmo num
curso inicial de Álgebra Linear, que as contas são executadas em computadores. Daí que um cuidado bem
maior com o formalismo matricial tem sido a tônica. Alguma atenção a aspectos numéricos derivados de
erros de arredondamento já se insinuam também por aqui, muito embora de forma bem secundária.
Gostaríamos, ainda, de explicitar melhor o significado do termo “Aplicada” no título do livro. Percebemos
que, em alguns de nossos alunos, ele gera a expectativa de uma disciplina centrada em aplicações, .
inclusive com muitas delas voltadas para o seu campo profissional específico. Se, por um lado, certamente
trataremos de algumas aplicações importantes da Álgebra Linear, de outra parte não nos parece possível, e
nem mesmo recomendável, um primeiro contato com a Álgebra Linear carregado de aplicações muito
específicas. Para nós, o termo “Aplicada”, no título, significa duas coisas:

i - Dar um enfoque à Álgebra Linear mais “pé no chão”, ou seja, antenado no formato matricial segundo o
qual se codifica a programação matemática relativa à Álgebra Linear nas aplicações às Engenharias e
Ciências Exatas. Contudo, não cobraremos familiaridade dos alunos com a programação (computacional)
dos métodos a serem apresentados. Como já dissemos acima, a tarefa de programar métodos numéricos
usualmente faz parte de uma disciplina posterior, no currículo dos alunos de Engenharia e Ciências Exatas.
Ainda assim, frequentemente tangenciaremos, no texto, questões ligadas à programação computacional dos
algoritmos discutidos e, temos em mente que, para esta disciplina é importante realizar algumas aulas em
laboratórios de informática, com o uso de softwares como o Scilab, Matlab, Maple ou Mathematica. Ao final
de cada capítulo, propomos uma série de questões a serem realizadas com o auxílio do computador.
ii - Apresentar exemplos e problemas que permitam aos alunos vislumbrar a importância que a Álgebra
Linear pode ter na modelagem de fenômenos, bem como entender melhor a teoria apresentada ao vê-la
“funcionando” como modelo matemático de fenômenos. No entanto, não nos preocuparemos em aprofundar
a análise de fenômenos muito específicos de aplicações a um ou outro campo do conhecimento, até mesmo
pelo fato que isto fatalmente ocorrerá em disciplinas específicas de cada curso que necessitem de Álgebra
Linear.

Este texto começou a ser escrito em 1997, num trabalho que os autores estavam se propondo a fazer,
em equipe, para ministrar a disciplina “Álgebra Linear Aplicada”, num esforço de adequá-la aos cursos das
Engenharias e a alguns dos cursos de Ciências Exatas e da Terra, na UFRN. Na ocasião, sequer podíamos
contar com textos como [1], [2] e [3], cuja abordagem nos parece a desejável para a disciplina. Desde
1997, ele foi servindo como principal texto de referência para a disciplina, e colocado à disposição dos
alunos para xerox. Volta e meia tem sido renovado em função das críticas, autocríticas e sugestões que nos
iam chegando. Começou a ser escrito a partir de transparências que usávamos nas aulas. Foram sendo
complementadas com notas explicativas e muitos exercícios. A idéia é que cada aluno tente os exercícios
logo após ver, no texto, os conceitos introduzidos em cada seção. Ao final de cada capítulo colocamos
também alguns exercícios suplementares a disposição dos alunos. Colocamos dois tipos de qualificação nos
exercícios. 5* significa que o exercício no 5 é mais difícil. 5+ significa que o exercício no 5 é importante do
ponto de vista teórico (não necessariamente difícil). 5+* significa que, além de importante teoricamente, ele
também representa um desafio superior aos demais, em dificuldade. Os exercícios ímpares, bem como
3

aqueles qualificados como importantes teoricamente (+), mesmo que pares, estarão resolvidos com a
resolução colocada à sua disposição.

Achamos fundamental a compreensão e correta manipulação dos conceitos e resultados, o que não é
a mesma coisa que ter habilidade em deduzir formalmente lemas e teoremas. Procuramos evitar excessos
de formalismo, privilegiando uma abordagem bem mais informal do que a que se encontra na maioria dos
livros textos. Mesmo assim, para poder manipular adequadamente os conceitos da Álgebra Linear, algum
formalismo é minimamente necessário. Em muitas situações, ao invés de sobrecarregar o texto com
demonstrações, preferimos pedir ao aluno que tente verificar alguma propriedade que provavelmente teria
sido trabalhada em sala de aula, com o cuidado de registrar tal verificação junto com os exercícios
resolvidos. Uma proposição é uma afirmação que se faz sobre uma realidade. Por exemplo, “todo homem é
mortal”. Ou ainda, um teorema matemático. Um prerequisito que julgamos essencial no trabalho em
Álgebra Linear (aliás em qualquer área ligada às Ciências Exatas) é o entendimento do que significa uma
proposição correta em Matemática. Ou seja, as proposições que nos interessam na Álgebra Linear só
admitem dois julgamentos de valor. Ou bem são verdadeiras, ou falsas. Saber discernir se uma determinada
proposição é verdadeira ou falsa corresponde a saber em que condições podemos usar informações úteis para
resolver os problemas que surgem. Tal discernimento, essencialmente, depende do conteúdo matemático
em questão, mas há também algumas questões de forma que são basicamente questões de lógica. Ao longo
de todo o texto há algumas questões tipo “Certo ou Errado? Justifique”, nas quais esperamos que você
aprimore sua compreensão dos conceitos e da teoria apresentados. No apêndice A, relembraremos alguns
aspectos bem elementares de lógica que podem ajudá-lo nesta tarefa.

Ao final deste capítulo introdutório daremos uma idéia panorâmica dos principais temas a serem
abordados no texto, concluindo a introdução que faremos, neste capítulo, de alguns conceitos que se farão
transversalmente presentes em todos os capítulos.

1.2 - IDENTIFICAÇÃO FUNDAMENTAL DA MATEMÁTICA


Uma das características fundamentais na evolução da matemática reside na generalização de seus
conceitos e paradigmas, num sentido de tornar as teorias matemáticas relevantes cada vez mais
abrangentes. Por exemplo, os primeiros homens primitivos aprenderam a contar e, desde cedo, a associar
objetos a pequenas marcas sequenciadas num pedaço de osso. Depois vieram as frações, que generalizam a
idéia de números naturais, no sentido que podemos entender os números naturais como as frações de
números naturais cujo denominador vale 1. A associação destas frações a pontos de uma reta se dá de uma
maneira bastante natural, conforme aprendemos no 10 grau. Os gregos, há cerca de 2.500 anos levaram um
grande susto ao descobrirem que, num certo sentido, há mais pontos numa reta do que frações. Por exemplo,
a hipotenusa de um triângulo retângulo, cujos catetos valem 1, não pode ser escrita como quociente de dois
números naturais. Muito embora, a civilização grega de então tenha contornado brilhantemente esta
dificuldade e centrado sua matemática em idéias fundadas na geometria, a idéia de um conjunto contínuo de
números (ou seja, a idéia de se associar univocamente os pontos de uma reta a um conjunto de números)
permaneceu por muitos séculos um ideal a se perseguir do ponto de vista teórico. Os gregos passaram a
conceituar números como segmentos geométricos de uma reta e, grosso modo, também foi assim na Europa,
após o renascimento, até o século XIX. Isto corresponde a uma primeira maneira de generalizar a idéia de
4

números racionais. Só no século XIX se chegou à generalização da idéia de números racionais com uma
construção do conjunto dos números reais mais abstrata e independente de conceitos geométricos. Tal
construção estabelece teoricamente uma identificação fundamental na matemática, qual seja a identificação
formal entre uma reta geométrica e o conjunto dos números reais. Uma generalização do conjunto dos
números racionais que, curiosamente, se deu bem antes, foi a dos números negativos, ou seja, de forma a
poder resolver equações do tipo x + 1 = 0. Um “defeito” do conjunto dos números reais é o de não admitir
soluções para equações do tipo x2 +1 = 0. O conjunto dos números complexos, cuja construção se colocava
já a partir do século XVI, constitui uma generalização do conjunto dos números reais que visa sanar este
“defeito” do conjunto dos números reais. [ ILUSTRAÇÃO !!!!!***]

Extraímos como lição da “historinha” acima, a importância da generalização na formação dos


conceitos fundamentais em matemática. Cada uma das generalizações dos conceitos de números se refletiu
na criação de ferramentas matemáticas mais poderosas e que, num certo sentido, englobavam as anteriores.
A matemática no século XX tem como característica fundamental o estudo de estruturas mais gerais que
englobam, de forma natural, várias situações particulares aparentemente bastante diferentes. Um exemplo
típico é a teoria dos conjuntos. Podemos estabelecer vários resultados matemáticos sobre conjuntos. Por
outro lado muitos dos objetos relevantes da matemática podem ser pensados como conjuntos. Por exemplo, o
conjunto dos números reais, o conjunto das funções definidas em 2, etc. Portanto afirmações que forem
verdadeiras sobre conjuntos em geral, podem ser aplicadas a cada um destes conjuntos.

Esperamos conseguir deixar este ponto mais claro ao longo do curso, uma vez que a Álgebra Linear
tem esta característica típica do século XX, ou seja de comportar uma apresentação bem mais geral, com
resultados que se aplicam em várias situações aparentemente bem diferentes. A grande maioria dos livros-
texto de Álgebra Linear disponíveis expõem a teoria de Espaços Vetoriais numa forma mais abstrata,
dentro do paradigma do século XX, ou seja, indo do mais geral ao particular. Embora consideremos
importante que, mesmo num curso inicial, o estudante já tenha um primeiro contato com esta forma mais
abstrata de fazer matemática, típica do século XX, preferimos ir mais devagar e consolidar primeiro os
conceitos importantes da álgebra linear no n. Só no penúltimo capítulo trabalharemos sua generalização
para o Cn e dedicamos o capítulo final do livro a indicar como se faz a generalização dos conceitos para
espaços vetoriais abstratos, tendo porém a preocupação de mostrar aplicações específicas que explicitem as
vantagens de uma abordagem mais abstrata. Acreditamos que, desta forma, fazemos o caminho inverso do
que é seguido usualmente nos textos de álgebra linear disponíveis no mercado, mas nos mantemos mais
próximos da construção histórica dos conceitos a serem estudados. Ou seja, os principais resultados da
álgebra linear já eram conhecidos em meados do século XIX no Rn e no Cn, embora sem a roupagem na
qual os escrevemos atualmente, dada pela teoria dos conjuntos e alguns aspectos de notação que facilitam
imensamente a abordagem. Entendemos que desta forma fica mais fácil para alunos com relativamente
pouca vivência da matemática do século XX, não só apreender os conceitos básicos da álgebra linear, mas
igualmente a importância da generalização dos conceitos para estruturas mais abstratas.

Generalizações importantes da identificação de uma reta geométrica com o conjunto dos números
reais consistem na identificação cartesiana usual de um plano com o conjunto 2 = x = {(x1,x2) | xi
, para i = 1,2}, bem como do espaço tridimensional com o conjunto 3 = x x = {(x1,x2, x3) | xi ,
5

para i = 1,2,3}. Num certo sentido, no segundo grau você já teve contato com problemas típicos de álgebra
linear no 2 e no 3, através de aplicações à geometria analítica. Por exemplo, para achar a interseção de
duas retas no 2, tipicamente, se recai num problema de resolver um sistema com duas equações lineares e
duas incógnitas. Podemos dizer que o grosso da álgebra linear que estudaremos se fará no conjunto

n
= x x.......x ={(x1,x2,......,xn) : xi , para i = 1,2,....,n}

(conjunto dos nos reais)


0
________________________________________

PLANO CARTESIANO

(2,1)

2
= x ={( x1,x2): x1 e x2 } (0,0)

__________________________________________

ESPAÇO TRIDIMENSIONAL CARTESIANO

(1,1,2)

3
= x x = {( x1, x2, x3): x1, x2 e x3 } (0,0,0)

_____________________________________________
4
= x x x ={(x1,x2,x3 ,x4 ): xi } Espaço-tempo

n
= x x.......x ={(x1,x2,......,xn) : xi } Fenômenos modelados por n nos
6

Observamos que, do ponto de vista da teoria dos conjuntos , o 125 é um conjunto tão bem definido
como 2 ou o 3. No entanto, não sabemos mais experimentá-lo geometricamente com nossa percepção
visual, se n > 4. Apesar disto, conforme veremos nos capítulos 4 e 5, saberemos pensar geometricamente o
n
, para qualquer número natural n, por maior que seja. Por incrível que pareça, tal fato tem aplicações
muito importantes. Na verdade, podemos desenvolver uma intuição sensorial sobre o 4, com a idéia de
movimento, já que para descrever movimentos precisamos de uma quarta variável tempo. Se quisermos
pensar no 5, podemos pensar em movimentos nos quais haja uma quinta variável relevante, por exemplo
temperatura. Na verdade, sempre que a descrição de um fenômeno pedir 5 variáveis independentes teremos
um fenômeno modelado no 5.. Abaixo, no exemplo 1, descrevemos a digitalização de uma fotografia
representada por um ponto em 240.000.
A importância de trabalharmos no n, com n qualquer e não apenas com n = 2 ou 3, reside no fato
que n, usualmente, representa o número de variáveis dos problemas em questão. A maioria dos problemas
relevantes de aplicação da Álgebra Linear necessitam de muitas variáveis para seu equacionamento.
Tipicamente, em 2009, um problema até cinco mil variáveis poderia ser classificado como de médio porte e
um de grande porte pode chegar a milhões de variáveis. No capítulo 3 exemplificaremos problemas típicos
de pequeno, médio e grande porte.

Exemplo 1 - Digitalização de uma fotografia


Uma fotografia em preto e branco, num retângulo Q, pode ser pensada como uma função
f: Q [0,1]
que a cada ponto x ∈ Q, associa f(x) como sendo a intensidade de cinza naquele ponto x. Em geral f(x) = 0
indica um ponto preto, f(x) = 1 um ponto branco. f(x) = 1/5 corresponderá a um tom de cinza mais escuro
que um outro para o qual f(y) = 1/3. Contudo, uma tal função é uma idealização da fotografia, no sentido
que, por um lado, não temos como expressar f(x) por meio de fórmulas que dêm o valor exato de f(x) num
número finito de operações, para todos os infinitos valores de x ∈ Q. Pelo outro, não faz muito sentido
querer distinguir o valor de f(x) em dois pontos muito próximos, pois nossa vista não consegue mesmo
discernir como distintos, dois pontos que estejam a uma distância suficientemente pequena entre si.
Tampouco adianta considerar todos os infinitos tons de cinza possíveis em [0,1]. Nossa vista tampouco
consegue distinguir entre dois tons de cinza muito próximos. D aí surge a possibilidade de digitalizar a
fotografia, que corresponde a particionar o retângulo Q em retângulos bem pequenos, de forma a substituir a
função F por uma aproximação que seja constante em cada um destes pequenos retângulos, bem como
discretizar o conjunto de tons de cinza para um número finito de possibilidades. Digamos em 256 tons
distintos, para poder representar o tom de cinza em cada um dos pequenos retângulos por 1 Byte (= 8 bits
28 distintos valores de cinza). Na prática, particiona-se Q usando uma malha com M linhas horizontais e N
verticais, gerando MN pequenos retângulos, ou pixels. A cada um destes pixels, o tom de cinza é
representado como um número inteiro entre 0 e 255. Podemos representar a foto de duas maneiras:
Como uma matriz FM, de M linhas e N colunas, cuja entrada FMij seja a melhor aproximação, dentre
os 256 tons de cinza disponíveis, para o valor de f(x) em algum ponto do correspondente pixel Qij,
imediatamente abaixo da linha i e vizinho, pela direita da coluna j.
7

Podemos enumerar cada um dos MN pixels, linha por linha, de cima para baixo e da esquerda
para a direita. Ao i-ésimo deles associa-se o tom de cinza por um número inteiro Fi, entre 0 e 255,
do mesmo jeito que antes. Neste caso, Fi = FMkj, com i = mk+j. Com isto obtemos um ponto F = (
F1, F2, ... , FMN) ∈ MN como representação digital da fotografia f(x).1

Para fixar idéias, a foto de Hanna e Leno 2 que reproduzimos abaixo, foi digitalizada com 671 linhas
horizontais e 917 linhas verticais, gerando um ponto no 615307

. A segunda figura corresponde a um trecho destacado num retângulo, perto do pescoço de Hanna.
Trata-se de um trecho da foto com 90x123 =11070 pixels, amplificado cerca de 56 vezes, relativamente ao
tamanho da foto original. A terceira foto corresponde a um trecho bem pequeno da coleira de Hanna,
correspondente a 18x26 = 468 pixels e está amplificada cerca de 1300 vezes, relativamente ao tamanho com
o qual reproduzimos acima a foto original.

1
Na verdade as duas formas de representar digitalmente a fotografia expressam o fato que toda matriz MxN pode ser igualmente
expressa como um ponto de MN, desde que a armazenemos linha por linha. Na seção ***, veremos uma situação na qual a
representação de uma imagem por um ponto do MN se impõe naturalmente e voltaremos a isto no começo do capítulo 2. O que
importa, matematicamente, é que a fotografia fica representada com MN bytes, ordenados numa malha bem definida.
Matematicamente, isto pode ser modelado como um ponto de MN.
2
Leno (à direita) e Hanna (à esquerda) eram, digamos assim, lindos, queridíssimos e virgens os dois, quando esta foto foi feita.
Nunca tinham, digamos assim, namorado antes. Num fim de semana, Hanna estava no cio e seus donos os juntaram, pela
primeira vez, para ver no que dava. Hanna não queria de jeito nenhum e Leno se comportou como um perfeito cavalheiro. Não
forçou em nenhum momento. O máximo que se conseguiu flagrar foi esta foto aí dos dois meio que nariz com nariz, dando a
impressão de um beijo canino, agora ia.... Mas que nada, logo em seguida, Hanna sentava-se e não tinha conversa. Bem, ao final
de semana, pensamos, fica para o próximo cio. Pelo menos ficaram amigos e foi divertido ver os dois, tiramos lindas fotos. Mas
qual nada, os donos de Leno ficaram muito orgulhosos de seu jeitosíssimo cavalheiro e *** meses depois Hanna deu à luz 7
lindos filhotes...
8

Trecho com 90x123 pixels = 11.07 Kb. Amplificação de aprox. 56 vezes

Trecho da coleira de Hanna com 18x26 pixels = 468 Bytes. Amplific. de aprox. 1300

O ponto a destacar é que aí fica bem nítida a digitalização da imagem. Ou seja, os 468 quadradinhos
nos quais o tom de cinza é constante ficam bem visíveis. Contudo, a a resolução da digitalização desta foto
não suporta uma tal amplificação, tornando quase irreconhecível a imagem reproduzida . Matematicamente
a foto original é usualmente tratada ora como matriz com 671 linhas e 917 colunas, ora como um ponto de
671x917
= 615307. Em particular, há um arsenal de ferramentas na álgebra linear muito útil para tratar destas
imagens. Teremos a oportunidade, mais ao final do livro, de ver uma técnica muito interessante de Álgebra
Linear para compactar esta foto, de forma a representá-la satisfatoriamente com bem menos Kilobytes.3 A

3
Na matriz 18x26 que reproduzimos representando o pequeno trecho fica bem nítido que os valores de alguns pixels, como os
correspondentes à coleira, variam fortemente com relação a vizinhos, indicando contrastes bem marcantes na foto. Já outros tem
tons de cinza com bem pouca variação entre vizinhos, como é o caso da submatriz formada pelas 9 colunas ao final das 3
primeiras linhas, na matriz abaixo, indicando pouca variação na fotografia. Isto indica redundância na informação. Por exemplo,
se tomássemos todos os valores nestas 27 posições como sendo um tom médio, digamos, 115, dá para perceber nas figuras
apresentadas, que isto seria praticamente imperceptível, na foto original. É este fato que permite diminuir drasticamente a
9

tabela abaixo corresponde a uma matriz 18x26 e suas entradas representam exatamente os tons de cinza em
cada um dos 468 pontos do trecho da foto logo acima. Ou ainda, como um ponto de 468, por exemplo,
lendo a tabela abaixo, linha por linha.
132 122 118 122 122 99 151 204 123 83 105 120 126 128 122 116 116 117 114 113 109 110 114 111 104 102
108 92 110 123 122 105 113 202 236 148 92 116 126 124 123 119 116 116 112 111 112 114 112 112 108 101
78 77 99 111 111 101 96 174 254 237 142 103 123 125 120 119 120 117 109 108 110 112 107 103 106 103
63 66 74 81 97 136 188 195 194 227 228 141 105 124 120 114 116 114 108 103 104 108 104 99 98 104
63 94 116 134 166 217 220 160 101 124 217 216 119 121 115 110 110 107 105 99 97 105 107 104 102 108
179 224 236 219 196 186 142 104 85 76 132 207 147 115 115 107 103 104 103 99 98 104 108 108 112 111
249 254 243 184 125 109 104 99 94 80 122 173 137 106 109 107 100 100 100 103 104 103 106 109 107 107
196 206 156 100 85 88 97 103 86 82 166 236 182 107 99 108 102 99 98 103 105 104 104 105 102 106
119 112 95 91 94 97 99 114 81 87 154 229 237 151 103 94 99 102 101 102 101 107 112 104 100 106
109 105 101 96 100 105 97 152 185 162 150 166 171 147 126 100 101 104 103 101 99 104 113 103 108 104
94 98 102 98 102 107 95 151 247 242 154 115 96 100 128 117 107 102 101 95 92 102 110 102 114 107
101 98 99 101 103 100 99 120 191 194 120 83 87 92 109 118 112 102 99 97 90 94 97 101 104 112
106 101 97 97 100 97 98 96 105 106 96 90 79 89 106 106 103 99 97 97 92 90 92 99 103 113
101 101 98 96 97 96 94 94 93 100 111 102 87 91 94 107 137 103 79 92 93 87 94 101 106 116
97 100 100 98 97 92 89 88 87 93 116 133 91 83 79 135 232 201 127 109 74 74 94 102 103 109
101 102 100 98 95 94 91 86 87 88 102 172 118 69 71 146 230 224 168 196 165 91 74 97 102 104
103 102 98 96 94 95 96 94 90 94 91 158 213 166 113 172 180 133 113 124 213 224 102 67 96 102
104 105 103 98 96 98 97 96 93 98 95 108 219 252 179 181 132 77 75 95 117 179 176 85 78 102

2 3
1.3 – Soma de pontos de e e multiplicação de pontos por números
Apenas definir os conjuntos 2 e no 3 é pouco. Precisamos saber como operar com seus pontos
No 2 e no 3, a física aponta o caminho. Veja que podemos representar vetores da física como pontos do
2
ou do 3 aplicados na origem. Na verdade, esta identificação de vetores como pontos 2 e do 3 é uma
antiga conhecida sua e corresponde à maneira mais fácil de somar duas forças aplicadas sobre um corpo. Ou
seja, em linguagem da física, se F = F1 + F2 e G = G1 + G2 e c ∈ então:

F+G = (F1+G1) + (F2 +G2)


cF = cF1 + cF2

Em termos de coordenadas, = (1,0) , = (0,1), F = (F1, F2), G = (G1, G2) e estas operações
correspondem a:

F+G = (F1+G1, F2 +G2)


cF = (cF1 , cF2)
2
Este é o mote para definir soma de pontos do 2 e multiplicá-los por números. Denotamos o
com esta soma usual de pontos e a multiplicação por números reais como:
2
V=( , +, *)

quantidade de números necessária para reproduzir adequadamente a foto, muito embora haja dezenas de formas diferentes de
fazer a compactação da imagem. A grande maioria recorrendo a algoritmos de álgebra linear, de uma forma ou de outra.
10

A soma de pontos do 2, conforme a definimos acima, leva ainda o nome de regra do paralelogramo, em
alusão ao fato que, como você bem sabe, a soma de dois vetores no 2, com origem comum em (0,0), é a
diagonal do paralelogramo definido pela origem e pelos pontos F = (F1,F2), G = (G1 ,G2), conforme a
figura abaixo. (Vide ainda os exercícios 1.1 e 1.2)

x2

2v (F1 + G1,F2 + G2)


(G1,G2)

v (F1,F2)

x1

Desta forma, temos uma maneira bem natural de operar com pontos do 2. Talvez do fato de
corresponder a soma de vetores da Física, daí se tenha começado a pensar na estrutura algébrica (R2, +,*)
como um espaço vetorial e a se designar os pontos de 2 como vetores. Da mesma maneira poderíamos ter
definido V = ( 3, + , *) de modo a honrar a soma de vetores tridimensionais da física. Como muitas vezes
sucede, esta estrutura algébrica é muito útil para representar vetores da física, mas se mostrou importante
também em outras áreas. Por exemplo, o Cálculo Diferencial e Integral em várias variáveis nela se baseia. A
soma de pontos e sua multiplicação por números é facilmente generalizável para pontos com n coordenadas
e é isto que faremos na próxima seção.

2
Observação 1.1 Propriedades Estruturais de ( , + , *)
Desde criancinhas vocês estão acostumados com propriedades satisfeitas por números reais a, b e c
tais como a + (b + c) = (a+b) + c, a+b = b+a, a + 0 = 0 + a, a + (-a) = 0, (a+b)c = ac + bc, etc. Deve ter
tido algum professor de matemática, destes tidos como chato, que tentou lhe fazer decorar os nomes destas
propriedades: associativa, comutativa, etc. Depois, no segundo grau, você viu que estas mesmas
propriedades eram herdadas pela soma de vetores do 2 e do 3, sendo que a multiplicação era feita entre
vetores e números reais. Por exemplo, se a = (2,3) e b = (4,5)

a + b = (2,3) + (4,5) = (2+3, 4+5) = (3+2, 5+4) = (3,2) + (5,4) = b + a, ou seja, a+b = b+a

Se você observar bem esta conta aí de cima, a soma de a e b é comutativa por herdar esta propriedade
dos números reais, em cada uma das duas coordenadas. O mesmo acontece com outras propriedades
11

elementares da aritmética. Por exemplo, a associatividade. Desde criancinha, você sabe que (2+3) + 4 = 2 +
(3 + 4). Ao tomarmos pontos no 2, isto se transforma em:
(a+b) + c = ((a1, a2) + (b1,b2) ) + (c1,c2) = (a1+b1,a2+b2) + (c1,c2) = (a1+b1+c1,a2+b2+c2) = a + (b+c)

Ou seja, a soma de pontos do 2 é associativa. Uma outra mais fácil ainda: 2 + 0 = 2.


Quando olhamos pontos no 2, isto fica: a + (0,0) = (a1,a2) + (0,0) = (a1 + 0, a2 + 0) = a. Ou seja,
há um elemento nulo no , que somado a qualquer ponto a do 2, não altera o valor de a.
2

A relação 2 + (-2) = 0 você sabe desde criancinha. No segundo grau, você se acostumou ao fato
que, dado a = (a1,a2) sempre podemos considerar seu simétrico –a = (-a1, -a2) , de tal modo que a + (-a) =
0.
Igualmente você também sabe, desde criancinha, distribuir produtos a forma 2*(3+4) = 2*3 + 2*4.
Com pontos do 2, isto acaba gerando a propriedade distributiva:

*(a+b) = *((a1,a2) + (b1,b2)) = *(a1+a2,b1+b2) = ( *a1 + *b1, *a2 + *b2) = *a + *b

Do mesmo jeito, você provavelmente já incorporou que muitas das propriedades que valiam para
soma e multiplicação de números, continuam valendo para soma de vetores no plano e para multiplicação de
vetores no plano por números. Contudo, apesar de sua verificação formal ser muito fácil, são MUITO
importantes. Nelas se baseia a visão moderna, mais geral, de espaços vetoriais. Por isto as chamamos de
estruturais. Serão denotadas por EV1, EV2, ..., EV6. Volta e meia voltaremos a elas.

Dados v, v‟,v‟‟ em V = (R2, + , * ) , bem como números reais e ‟:

EV1 - A soma de vetores é associativa, isto é, (v + v’) + v’’ = v + (v’+ v’’)


EV2 - A soma de vetores é comutativa, isto é, v + v’ = v’+ v
2
EV3 - 0 = (0,0) é o elemento nulo de , ou seja, v+0 =0 +v=v
EV4 - Existe sempre um simétrico (-v) com relação à soma, no sentido que
v + (-v) = (-v) + v = 0
EV5 - A multiplicação por escalares é distributiva com relação à soma e produto:
( v + v’) = v + v’
( + ‟) v = v + ’v
’ v ’v

EV6 - O número 1 é o elemento neutro da multiplicação de números por vetores, ou seja,


1*v = v
12

Exercícios da seção 1.3


Exerc. 1.1 - Considere x = (1, 2) e x‟ = (2, -4 ). Calcule x +x‟, represente geométricamente x, x‟ e x+x‟ num
mesmo plano cartesiano e explique porque o segmento que liga a origem (0,0) ao ponto x +x „ é a diagonal
de um paralelogramo cuja outra diagonal é o segmento que liga x e x‟.
Exerc. 1.2 + - Verifique que a regra do paralelogramo acima descrita vale em geral. Ou seja, dados dois
pontos quaisquer x, x‟ em 2, não colineares com a origem (0,0), o segmento que liga a origem a x +x„ é a
diagonal de um paralelogramo cuja outra diagonal é o segmento que liga x e x‟.

Exerc. 1.3 + - Defina V = ( 3, +, *) e esboce um desenho que represente a soma de pontos no 3


( + ), bem
como a multiplicação de pontos do 3 por números reais ( * ).

n
1.4 Soma de pontos de e multiplicação de pontos por números
A soma de pontos no 2 e no 3
, bem como sua multiplicação por números reais se generalizam
naturalmente para o n como:

(x1,x2,…,xn) + (x1’,x2’,…, xn’) = (x1 + x1’, x2 + x2’ ,…, xn + xn’)

*(x1,x2, …, xn) = (x1,x2…, xn) = ( x1, x2, …, xn)


n
Ou seja, do mesmo jeito que antes podemos definir V = ( ,+,*).
4
Por exemplo, no ( ,+,*):
(2,3,1,3) + ( 1,-3,2,-4) = (3,0,3,-1)

3*(1,4,-2,-4) =3 (1,4,-2,-4) =(3, 12,-6,-12)

Observação 1.2 Como seria uma interpretação geométrica disto? O que poderia significar,
4
geometricamente, somar pontos do ? Por enquanto, não temos como saber. Afinal, perdemos a
interpretação geométrica da regra do paralelogramo, neste primeiro momento. A boa notícia é que com a
definição de V = ( 4,+,*) iniciamos uma viagem surpreendente para nós, seres humanos condenados a uma
visão espacial de 3 dimensões. Informalmente, se entendemos um espaço de 4 dimensões como um espaço
no qual são necessários 4 números reais para descrever seus pontos, todos nós vivemos experiências em
quatro dimensões. Um movimento precisa de quatro números para ser descrito. Portanto, um movimento é
um fenômeno que ocorre num espaço de quatro dimensões. Contudo, faria sentido pensar geometricamente
espaços com dimensão maior do que nossa capacidade visual? Exatamente aí reside a boa notícia.
Pretendemos convencê-lo, já ao final do capítulo 5 deste livro, que uma compreensão geométrica de
espaços com quatro ou mais dimensões não apenas é possível, mas é algo muito fértil do ponto de vista da
matemática e suas aplicações.

Observação 1.3 - Observe que + e * podem ser pensados como funções


13

n n n *: n n
+: x e x
(x , y) x+y ( , y) y

Exercício da seção 1.4


Exerc. 1.4 + - O objetivo deste exercício é que você se convença que as propriedades estruturais EV1-EV6,
listadas para pontos do 2, como estão na observação 1.1, funcionam do mesmo jeito em qualquer n
,
para qualquer n.
i - Verifique que as propriedades EV1-EV6 valem em V = ( 3,+,*).
ii - Verifique que as propriedades EV1-EV6 valem em V = ( 4,+,*).
Iii – E em V = ( n,+,*), também valem? 4

n
1.5 COMBINAÇÃO LINEAR (CL) NO .
Da geometria analítica no plano, você sabe que, dados X = (X1, X2) e Y = (Y1, Y2) , ponto médio M, do
segmento de reta que liga X a Y, tem coordenadas

M=

Podemos entender que o ponto M combina linearmente os pontos X e Y com pesos iguais. Esta idéia de
Combinação Linear (CL) é uma idéia recorrente na álgebra linear. De maneira mais geral:

Definição 1.1 COMBINAÇÃO LINEAR (CL)


n
Sejam v1, v2, , vm vetores do e c1, c2, , cm números reais. Diz-se que

c1v1 + c2v2 + + cmvm

é uma combinação linear de v1, v2, , vm com pesos (ou coeficientes) c1, c2, , cm.

Veremos a seguir 8 exemplos de combinações lineares, em diferentes contextos:

Exemplo 1.2 – O ponto médio do segmento que liga X a Y, M = ½ X + ½ Y, é uma CL de X e Y com


pesos ½ e ½.
4
No capitulo 2, você verá que EV1-EV6 valem também para somas de matrizes mxn e multiplicação de matrizes por números.
Na observação *** e no capítulo 4 comentaremos que EV1-EV6 também valem quando v, v‟e v‟‟ são funções de em , a soma
é entendida como a soma usual de funções e a multiplicação é entendida como a usual multiplicação de funçoes por números. O
fato é que podemos encontrar muitas situações na matemática nas quais dispomos de um conjunto V, com uma soma de elementos
definida em V e uma multiplicação por números, satisfazendo EV1-EV6. Este fato é a ponte que gerou um tratamento bem mais
abstrato da Álgebra Linear e que virou um padrão no século XX. A boa notícia aí, é que o para o conteúdo usual da Álgebra
Linear, e que é um pedacinho bem pequeno de toda a teoria abstrata de Espaços Vetoriais, fazer quase tudo no n e, ao final, sair
para o Cn é o essencial, está de bom tamanho e é um bom treino no formalismo matricial, tão necessário para as aplicações. No
último capítulo deste livro, voltamos a este tema...
14

Exemplo 1.3 - Sejam v1 = (1,2,3,4), v2 = (2,4,6,8) e v3 = (3,6,9,12) e c1 = 3, c2 = -2 e c3 = 1. Então


c1v1 + c2v2 + c3v3 = 3 (1,2,3,4) + (-2)2 (2,4,6,8) + 1 (3,6,9,12) = (2, 4,6, 8)

é uma combinação linear de v1, v2 e v3, com pesos 3, -2 e 1.

Exemplo 1.4– Suponha que as médias aritméticas das notas nas provas de Matemática, Português,
Geografia e História das 3 turmas de uma mesma série de um certo colégio estejam armazenadas,
respectivamente, como coordenadas dos vetores T1 = ( 6.2 , 6.5, 7.2 , 7.3) , T2 = (5.8, 6.4, 7.4, 6.9) e T3 =
(6.0, 5.8, 6.6, 7.2). Sabendo que T1 e T2 correspondem a turmas de 30 alunos, e T3 de 40, qual o vetor que
armazena as médias aritméticas das notas nas provas dos 100 alunos das três turmas?

Verifique que se fosse só matemática, a média aritmética das notas dos 100 alunos seria dada por
30 30 40
6 .2 5 .8 6.0 = 6.0. Nas quatro matérias simultaneamente, será:
100 100 100

30 30 40
T1 T2 T3 =
100 100 100
= .3 ( 6.2 , 6.5, 7.2 , 7.3) + .3 (5.8, 6.4, 7.4, 6.9) + .4 (6.0, 5.8, 6.6, 7.2) =
= (6.00, 6.19, 7.02 7.14)
Ou seja, a média aritmética nas quatro matérias de toda a série é uma CL de T1, T2 e T3 com pesos
30/100, 30/100 e 40/100.

3
Exemplo 1.5 - Da mecânica sabemos que , se temos pontos materiais de massas m1, m2 , ... e mk no ,
situados nos pontos P1, P2, e Pk, sabemos que seu centro de massa é definido por:
m1 m2 mk
P1 P2  Pk , onde M = m1 + m2 + + mk .
M M M
Ou seja, o centro de massa dos pontos considerados é uma CL de P1, P2, e Pk com pesos
m1 m2 m
, , , k .
M M M
Exemplo 1.6 - – Uma empresa fabrica três tipos de brinquedos. O gasto, em reais, de cada unidade de
brinquedo com mão de obra, insumos, comercialização e outras despesas é apresentado na tabela abaixo:

B1 (R$) B2 (R$) B3 (R$)


Mão de obra 5,00 3,00 2,00
Insumos 12,00 9,00 8,50
Comercialização 6,00 4,00 3,50
Outras despesas 3,00 2,50 2,50

A fábrica produz, num dado mês, x1 unidades do brinquedo B1, x2 unidades do brinquedo B2 e x3
unidades de B3. Representando pelo vetor D no 4 a despesa da fábrica, neste mês, discriminada,
respectivamente, por cada um dos itens da tabela, teremos:
15

D1 5 3 2 5x1 3x 2 2x 3
D2 12 9 8,5 12 x1 9x 2 8,5x 3
D= = x1 + x2 + x3 =
D3 6 4 3,5 6x1 4x 2 3,5x 3
D4 3 2,5 2,5 3x1 2,5x 2 2,5x 3

O vetor de despesas D é, neste caso, uma CL das colunas da tabela, com pesos x1, x2, x3. Veja que
neste caso foi mais conveniente, do ponto de vista visual, representar um ponto do 4 por um vetor disposto
na forma de coluna. Como representação de pontos do 4 não há nenhum problema nisto, uma vez que
sabemos perfeitamente a ordem de cada coordenada no vetor, estejam as coordenadas do ponto do 4 em
questão dispostas numa coluna ou numa linha.

Exemplo 1.7 - Pergunta: X = (1,1) é CL de A = (1,2) e B = (2,1)?


Se for, existem c1 e c2, tais que (1,1) = c1A + c2B = (c1+2c2, 2c1+c2). Resolvendo o sistema de duas
c1 2c2 1
equações e duas incógnitas , achamos c1 = 1/3 e c2=1/3.
2c1 c2 1
Ou seja, (1,1) é combinação linear de (1,2) e (2,1) com pesos 1/3 e 1/3.
O exemplo a seguir mostra que a CL do exemplo anterior depende apenas do fato que A e B não
estão numa mesma reta que a origem (0,0).

Exemplo 1.8 – Se A e B são pontos do 2 e não estão numa mesma reta contendo a origem (0,0), então
todo ponto do 2 se escreve como CL de A e B.

Seja Q um ponto qualquer do plano e considere um paralelogramo OPQR tal que:


i – A diagonal OQ tem seus vértices na origem O = (0,0) e em Q.
ii –P e R estão na direção de A e de B respectivamente, ou seja, P = c1A e R = c2B.

Q = P+R=c1A+c2B
Observe que neste caso, pela regra
do paralelogramo,
P=c1A R =c2B
Q = P + R = c1A + c2B. Ou seja,
B
Q resulta como CL de A e B.
A

Exemplo 1.9 – Se A e B são pontos do 3, então o conjunto = {c1A + c2B | c1 e c2 são nos reais}, formado
por todas as combinações lineares de A e B, representa:
i - Uma reta contendo a origem (0,0,0) e A, caso B seja um múltiplo de A e A 0. Ou seja, se B = cA,
então c1A + c2B = (c1 + c2c)A também é múltiplo de A.
ii – Um plano contendo O = (0,0,0), A e B, caso O, A e B não sejam colineares. A razão, neste caso, é
muito parecida com a do exemplo anterior, já que os pontos O, P = c1A, Q = c1 A + c2B e R = c2B serão,
para todo par de números reais c1 e c2, vértices de um paralelogramo no plano que contem O, A e B.
16

Observação 1.4 - Na verdade, a idéia de Combinação Linear é importante não apenas no n, mas também é
muito útil em outras situações. Por exemplo, é natural pensar na função f: , dada por f(x) = 3x + 2
sen(x) –3 cos(x) como uma CL das funções f1(x) = x, f2(x) = sen(x) e f3(x) = cos(x), com pesos 3,2 e –3.

Exercícios das seção 1.5


Exerc. 1.5 - Ache o vetor do 4 que somado a 2*(1,-3,-2,4) dá (2,5,3,-1)
Exerc. 1.6 - Ache o ponto médio do segmento que liga (1,2,1) a (2, -1,1)
Exerc. 1.7 - Sejam v1 = (1,2,3), v2 = (2,3,4) e v3 = (1,1,1).
i – Calcule a combinação linear de v1, v2 e v3 com pesos c1 = 2, 2 e –2.
ii – Ache c1 e c2 de tal forma que v3 seja combinação linear de v1 e v2 com pesos c1 e c2.
iii – Verifique que v = (1,0,0) não é combinação linear de v1 e v2.
iv - Verifique que v = (1,0,0) não é combinação linear de v1 , v2 e v3.
v - Verifique que todo ponto do 3 é combinação linear de v, v1 e v2.
vi - Interprete o significado geométrico de ii,iii,iv e v.
Exerc. 1.8 - Mostre que as coordenadas do centro de massa G de três corpos de igual massa e situados em
A, B e C será o baricentro do triângulo ABC. (Ponto de encontro das medianas)
Exerc. 1.9 - Como você definiria o ponto médio do segmento que une dois pontos do 4 ?

1.6 - PRODUTO MATRIZ -VETOR


Voltando ao exemplo 1.5, o vetor que representa os custos mensais da produção de brinquedos em
função do vetor das quantidades de brinquedos produzidos x = (x1, x2,x3), pode ser escrito na forma:

D1 5 3 2 5x1 3x 2 2x 3
D2 12 9 8,5 12 x1 9x 2 8,5x 3
D= = x1 + x2 + x3 =
D3 6 4 3,5 6x1 4x 2 3,5x 3
D4 3 2,5 2,5 3x1 2,5x 2 2,5x 3

Isto motiva as definições de matriz (de números reais), bem como do produto matriz-vetor. Uma
matriz mxn, pode ser pensada como uma tabela com m linhas e n colunas (de números reais, no caso).
No exemplo 1.5, por exemplo, a tabela lá apresentada pode ser entendida como uma matriz C, 4x3.
Convenciona-se apresentá-la na forma:

5 3 2
12 9 8.5
C=
6 4 3.5
3 2.5 2.5

Denotando as colunas de C como C(1), C(2) e C(3), o produto da matriz C pelo vetor x define-se pela
expressão acima para D, ou seja:
17

5x 1 3x 2 2x 3
12 x 1 9x 2 8,5x 3
D = Cx = x1 C(1) + x2 C(2) + x3C(3) =
6 x 1 4 x 2 3 ,5 x 3
3x 1 2,5x 2 2,5x 3
Imaginamos que você tenha reconhecido, do lado esquerdo da identidade acima o produto de uma
matriz por um vetor, conforme viu no 20 grau. O produto matriz-vetor é o tijolo de toda nossa construção,
nesta disciplina.

Definição 1.2 - PRODUTO MATRIZ-VETOR

Podemos pensar numa matriz A com m linhas e n colunas de números reais como formada por n
colunas de vetores do m. Dado ainda um vetor x no n, definimos o produto A*x como o vetor do m
formado pela combinação linear das colunas de A, com pesos x1, x2 , , xn. Se A(1), A(2), , A(n)
denotam as colunas de A, o produto de A por x, também denotado por Ax, se escreve:
A 11 x 1 A 12 x 2 A 1n x n
A 21 x 1 A 22 x 2 A 2n x n
................
Ax = x1 A(1) + x2 A(2) + + xnA(n) = ................ (1.1)
................
A n1 x 1 A n2 x 2 A nn x n

Observação 1.5 – Talvez pareça um pouco de exagero dar toda esta volta para definir uma coisa que você
já conhecia de maneira mais simples. Afinal, para multiplicar uma matriz por um vetor é tão fácil
“multiplicar” cada linha Ai da matriz pelo vetor x, do jeito que está à direita nas duas fórmulas acima.
Inclusive com o jeitão de lado esquerdo de um sistema de equações lineares, um conhecido seu ainda do 20
grau. Isto você provavelmente ainda se lembra lá do 20 grau, não? Pois bem, pode continuar a lembrar deste
jeito, por que isto é verdade, importante e a relação acima é muito fácil mesmo de verificar. É só notar que o
vetor mais a direita é facilmente identificável como a soma de n vetores na forma,
A 1k x k
A 2k x k
....
x k A (k )
.... , onde k = 1,...,n
....
A nk x k
18

5 3 2
1
12 9 8.5
Ou seja, para multiplicar C = , por b = 2 é fácil fazê-lo na forma usual:
6 4 3.5
3
3 2.5 2.5

5 3 2
1
12 9 8.5
Cb = 2 =
6 4 3.5
3
3 2.5 2.5

Com matrizes e vetores numéricos, só para fazer uma continha na mão, é verdade que basta esta maneira de
ver. De quebra ainda dá para reconhecer uma coisa muito importante que é o fato de podermos ver cada
linha de C*b como o produto interno de um vetor-linha Ci por b, para quem lembra de produto interno entre
dois vetores, lá do segundo grau, ou da Física. Nosso ponto aqui é que se trata de duas maneiras distintas de
olhar para o produto matriz-vetor, ambas MUITO importantes. Você se surpreenderá de ver, em vários
momentos nesta disciplina, que às vezes olhar de um jeito resolve facilmente um determinado problema,
enquanto que olhar do outro só complica e vice versa. O exercício 1.11 é um primeiro exemplo disto.

1.7 - QUESTÕES IMPORTANTES DE NOTAÇÃO


Aqui gostaríamos de fixar algumas notações fundamentais para nós nesta disciplina e que seguiremos à risca
até o final deste livro.

A = Amxn, significa que A é uma matriz de números reais com m linhas e n colunas. A exceção
se dará a partir do capítulo 8, no qual começarão a aparecer matrizes de números complexos.
Se A é uma matriz, Aij denotará o elemento na linha i e na coluna j de A
Se A é uma matriz, Ai denotará sempre a i-ésima linha de A.
Se A é uma matriz, A(j) denotará sempre a j-ésima coluna de A. 5

Gostamos de pensar numa matriz A = A4x5 como particionada de duas maneiras distintas:

5
Como 4 vetores do , um em cada linha da matriz. Ou seja

5
, onde cada linha Ai é um vetor do : Ai= (Ai1 Ai2 Ai3 Ai4 Ai5).

4
Como 5 vetores do , um em cada coluna da matriz. Ou seja:
5
O parêntesis (i), em A(i), é para distinguir da potência i de A. Ou seja, A2 significará A*A e A(2) a segunda coluna de A
19

A = ( A(1) A(2) A(3) A(4) A(5)) , onde cada coluna A(j) é um vetor do 4
: A(j) =

Neste contexto, o produto da matriz A = Amxn por um vetor x ∈ n,


Se vemos A como particionada em colunas, Ax é uma combinação linear das colunas de A,
Ax = x1A(1) + x2A(2) + + xnA(n)
Se vemos A como particionada em linhas, a i-ésima coordenada de Ax é o número

Aix = (Ai1 Ai2 Ain) = Ai1x1 + Ai2x2 + + Ainxn

Como você viu acima, às vezes escrevemos vetores deitados numa linha, às vezes em pé, numa
coluna. Na verdade, a idéia de vetor do n se presta a isto mesmo, visto que se trata de uma n-upla ordenada
e que não faz diferença nenhuma representá-la de uma maneira ou de outra. Contudo, cometeremos ao longo
da disciplina, um certo abuso de notação que é deliberadamente “confundir” um vetor do n, ora como
uma matriz 1xn, às vezes chamada de matriz-linha, ora como uma matriz nx1, às vezes também
chamada matriz-coluna, apesar de, a rigor serem objetos matemáticos diferentes. Tal “abuso”de notação
fica justificado pelo fato que, em cada contexto estará bem claro o que se quer e pelas enormes vantagens
operacionais que teremos em fazê-lo. Softwares numéricos como o matlab e o scilab sequer reconhecem
vetores como objetos matemáticos distintos de matrizes. Vetores no Matlab e no Scilab sempre estão
definidos ora como matriz-linha, ora como matriz-coluna. Em particular, a forma default (padrão) de
representar um vetor é na vertical, dado que a definição usual de produto matriz-vetor utiliza vetores
representados na vertical, como se fossem matrizes-coluna.

Exercícios da seções 1.7 e 1.8

Exercício 1.10 i - Calcule a despesa mensal da fábrica de brinquedos, no nosso exemplo 1.6, da subseção
1.7, para produzir 100 unidades de cada um dos 3 brinquedos.
ii – Sabendo que a receita com os brinquedos é dada pela função R(x) = Cx – b, onde C = (30 20 20)
e b = 1000, ela terá lucro ou prejuízo se x1 = x2 = x3 = 100. Qual é a menor produção da fábrica, com iguais
quantidades produzidas de x1 , x2 e x3 , de modo a que não haja prejuízo.

Exercício 1.11 - Considere A = eb=

i - Calcule A*b, coordenada a coordenada, com Ai*b


ii – Tente mostrar que a terceira coluna de b é uma combinação linear das duas primeiras colunas de A, sem
resolver nenhum sistema linear e sem usar que A*b é uma combinação linear das colunas de A.
(Sugestão: Se estiver muito difícil desista e tente o item iii. Provavelmente é bem difícil mesmo resolver este item ii,
satisfazendo as condições pedidas. A idéia é você ver que pensando em A*b como uma combinação linear das
20

colunas de A, neste caso, dá para escrever a terceira coluna de A como combinação linear das outras duas sem ter que
resolver nenhum sistema linear adicional
iii – Calcule A*b como combinação linear das colunas de A e tente, novamente escrever a terceira coluna de
A como uma combinação linear das duas primeiras colunas de A, sem resolver nenhum sistema linear.

Exercício 1.12 - Dados A = , x= , y= ez= , calcule Ax , Ay e Az

Exercício 1.13 - Considere A = , B= ex=


i - Ache uma matriz C tal que A(Bx) = Cx e mostre que C = (AB(1) AB(2)), ou seja, mostre que as colunas
de C são os vetores AB(1) e AB(2)
ii – Mostre que o que aconteceu acima não foi uma coincidência, ou seja, que para quaisquer matrizes A, B e
vetor x, teremos A(Bx) = Cx , onde C = (AB(1) AB(2))
iii – Este item é para quem já viu produto de matrizes. O que esta matriz C dos itens i e ii tem a ver com o
produto das matrizes A e B?
Exercício 1.14 Dados A = ,x= e y= e número real c, verifique que
i - A(x+y) = Ax+ Ay.
Ii = A(cx) = cAx

1.8 – LINEARIDADE DO PRODUTO MATRIZ-VETOR

No exercício 1.14 lhe pedimos que verificasse valer , naquele caso particular, que:
LP1 A(x+y) = Ax + Ay
LP2 A(cx) = cAx
Agora vamos mostrar que LP1 e LP2 valem em geral, para toda matriz A = A mxn, vetores x e y no n e
número real c. Tais propriedades, apesar de muito simples de estabelecer, constituem as propriedades mais
fundamentais do produto matriz-vetor. Às duas, conjuntamente, chamamos de Linearidade do Produto
Matriz-Vetor. Na verdade, a idéia de linearidade constitui um tema transversal em toda a disciplina e vai
longe na matemática. Não é à toa que a disciplina se chama de Álgebra LINEAR. Provavelmente vocês
ainda se lembram destas propriedades LP1 e LP2 lá do segundo grau ou da Física, no caso de vetores de 2
e 3, muito embora talvez não sob o nome de linearidade. Vamos treinar um pouquinho nossa notação,
junto com as propriedades estruturais EV1-EV6, para fazer com todos os detalhes formais sua verificação.
Elas merecem :
I – A(x+y) = (x+y)1A(1) + + (x+y)nA(n) (A(x+y) como CL das colunas de A)
(1) (n)
= (x1 + y1)A + + (xn + yn)A (Definição de x+y)
(1) (1) (n) (n)
= x1A + y1A + + xnA + ynA (Distribuindo soma de nos * vetor Prop. EV5.1)
= + (Comutando vetores Prop. EV2)

= Ax + Ay
21

II – A(cx) = = c( ) = cAx (Prop. EV5.2)

Exercícios da subseção 1.8


O exercício tem um + pelo fato que LP é uma definição alternativa importante de linearidade. O + do
exercício 1.16 vem do fato de nele introduzimos a idéia de bilinearidade e a exemplificarmos com o
produto usual de números. O + do exercício 1.17 é que lá você vai estabelecer uma propriedade muito
importante para funções f: , a qual veremos na subseção seguinte ser generalizável para funções f: n
m
.

Exercício 1.15 + - Mostre que o produto Ax satisfaz a propriedade LP abaixo, para todos os vetores x e y
no n e todos os números reais c e d
LP: A(cx + dy) = cAx + dAy

Exercício 1.16 + - Mostre que o produto de números reais é bilinear, no sentido que:
Linearidade à direita - Fixado x ∈ e dados nos reais , y e y‟ valem
LD1: x(y+y‟) = xy + xy‟
LD2: x( y‟) = x*y‟
Linearidade à direita - Fixado y ∈ e dados nos reais ,x e x‟ valem
LE1: ( x + x‟)y = xy + x‟y
LE2: ( y)x = (yx)
Exercício 1.17 +
i – Mostre que f: , dada por f(x) = 3x é uma função linear no sentido que
L1: f(x+y) = f(x) + f(y), para todo par de nos reais x e y
L2: f(cx) = cf(x), sempre que c e x forem nos reais
ii – Mostre que f e g: , dadas por f(x) = 3x + 1 e g(x) = x2 não são funções lineares, no sentido que não
satisfazem L1 e L2, conforme enunciadas no item i
iii + – Mostre que se f: é uma função linear, então existe um número real c, tal que f(x) = cx.
(Sugestão: Aplique a propriedade L2 a 1*x

1.9 FUNÇÕES LINEARES

No exercício 1.17, você pode brincar um pouco com a idéia de funçào linear f: . O modelo da fábrica
4 3
de brinquedos do exemplo 1.6 gera uma função D: , que descreve os custos de produção da
fábrica e é dada pela fórmula
5x 1 3x 2 2x 3
12 x 1 9x 2 8 ,5 x 3
D(x) = Ax =
6 x 1 4 x 2 3 ,5 x 3
3x 1 2,5x 2 2,5x 3
22

Na verdade a toda matriz A = Amxn podemos associar uma função T: n m


, dada pela fórmula T(x) = Ax.
Veja que, para uma tal função T, as propriedades LP1 e LP2 se escrevem como

T(x+y) = A(x+y) = Ax + Ay = T(x) + T(y)


T(cx) = A(cx) = cAx = cT(x)

n m
Isto gera a definição de função linear f: como sendo uma que satisfaça as propriedades:

L1: f(x + y) = f(x) + f(y), para todos os vetores x e y em n


L2: f(cx) = cf(x), para todo vetor x no n e todo n0 real c

n m
Uma definição mais enxuta de função linear, juntando L1 e L2 diria que uma f: é uma função linear
se satisfizer, para todo x,y ∈ n e todos os nos reais c e d, a propriedade:

L: f( cx + d y) = cf(x) + df(y)

No exercício 1.18, lhe pedimos para demonstrar que uma função satisfazendo L1 e L2 satisfaz também L e
vice versa. Acreditamos que você não terá dificuldade em fazê-lo. Olhando desta maneira, uma função L é
uma função que leva uma combinação linear dos vetores x e y, numa correspondente combinação linear dos
vetores f(x) e f(y).
Bem, já temos pelo menos uma classe de funções lineares, que são aquelas dadas pelo produto
matriz-vetor. No caso m = n = 1, isto significa f(x) = (A11)x = A11x é uma função linear, se A = A11 = (A11).
Para todos os efeitos práticos, podemos “confundir” a matriz A = (A11) com o número real A11. No
exercício 1.17 você viu que as únicas funções lineares f: são estas. Cabe a importante pergunta aí:

n m
Que outras funções lineares f: existem, além das definidas por T(x) = Ax, para A = Amxn?
A resposta é: NENHUMA! Todas as funções lineares f: n m
são do tipo produto matriz-vetor.
Demonstração:
O argumento para vê-lo é bem fácil de acompanhar e generaliza o que lhe foi sugerido no exercício 1.17.
Suponha que f: n m
seja uma função linear e que x ∈ n .
Começamos com o caso n = 2.
x= f(x) = f ) (usando a suposta linearidade de f(x))

= = = Ax, onde

A=

No caso geral veja que, de modo análogo, ao partir de


23

x= ,

a linearidade de f nos permite distribuir (vide exerc 1.18ii) e obter

f(x) = f )

= )=

Em palavras, se f: n m
é linear, então f(x) = Ax, onde A = Amxn é uma matriz cujas colunas são A(k) =
f(I(k)) . Cada I(k) é um vetor que vale zero em todas as coordenadas exceto na k-ésima, onde vale 1.
Fim da demonstração
Exercícios da seção 1.9
Exerc. 1.18 - i - Mostre que uma função f: n m
satisfaz L1 + L2 sss satisfaz L, onde L1, L2 e L são
definidas loga acima no texto.
ii – Mostre que se f é linear, então a propriedade L vale para qualquer combinação linear de n vetores. Ou
seja, f(c1A(1) + c2A(2) + ... + cnA(n)) = c1 f(A(1)) + c2 f(A(2)) + ... + cn f(A(n))

Exerc. 1.19 - Reproduzimos na tabela abaixo a quantidade, em kg, de substâncias I, II, III que se encontra
em cada kg dos alimentos A, B, C.

A B C Suponha que uma pessoa combine os três alimentos comendo x1 gramas de A, x2


I 0,1 0,2 0,2 y1
II 0,4 0,3 0,1 gramas de B e x3 gramas de C. Denote por y = y 2 o vetor das quantidades de
III 0,2 0,3 0,2
y3
substâncias I, II e III, respectivamente ingeridas. Ache a expressão da função que a cada vetor x de
alimentos ingeridos associa o correspondente vetor y das substâncias.

Exerc. 1.20 – A tabela abaixo nos dá as quantidades de calorias, gorduras, colesterol e sódio presentes em
alimentos com os quais se deseja fazer sanduíches.

Pão Queijo Prato Presunto Manteiga Margarina Queijo magro


(fatia) (100 g) (100g) (100 g) (100 g) (100 g)
Calorias 70 122 120 360 360 95
Gordura (g) 0,8 10 5 40 40 6
Colesterol (mg) 0 32 50 120 0 5
Sódio (mg) 127 209 1527 410 400 365
24

2
x2
Considere que um sanduíche com duas fatias corresponde a um vetor x = , onde cada xi é,

x6
respectivamente, a quantidade de cada um dos alimentos da tabela, medida em gramas.

70 122 120 360 360 95


0,8 10 5 40 40 6
Considere a correspondente matriz A = .
0 32 50 120 0 5
127 209 1527 410 400 365

I - Verifique que y = Ax é uma função que a cada sanduíche associa a quantidade de calorias, gorduras,
colesterol e sódio nele contidas.

ii – Calcule o vetor da quantidade de calorias, gorduras, colestorol e sódio num mixto quente feito com duas
fatias de pão, 40 g de queijo, 40 g de presunto e 15 g de manteiga.

iii – Calcule a quantidade de queijo magro a ser usada num sanduíche de queijo quente feito com duas fatias
de pão, 15 g de margarina, queijo magro e a mesma quantidade de calorias que o anterior. Calcule também a
quantidade de colesterol ingerida num tal sanduíche.
2 2
Exercício 1.21 Suponha que T: seja uma função linear tal que

1 1 0 3
T( )= , e T( )=
0 2 1 1

x1 1 3 1 3 x1
Mostre que T( ) = x1 + x2 =
x2 2 1 2 1 x2

n m
Exercício 1.22 + - Verifique que se T: é uma função linear, então T(0) = 0

2
1.10 – FUNÇÕES LINEARES EM e

As funções lineares f: são todas do tipo f(x) = mx. São tão simples que pouco há o que dizer
sobre elas.
No 2, já há bem mais funções lineares. Em particular, muitas das funções que são usadas na
computação gráfica tais como zoom, rotação, projeção, reflexão numa reta e, cizalhamento podem ser
realizadas com funções lineares de 2 em 2. Vale dizer, como produto matriz-vetor.

Exemplo 1.10 - Zoom


25

0 2 2
Sejam , A e TA : dada por
0

x 0 x x
T
A y 0 y y

y y

TA v
v v

x x

Exemplo 1.11 Reflexão em torno do eixo dos x

1 0 x x x
Seja A e considere T A
0 1 A y y y

y y

TA
(x,y)

x x
(x,-y)

Exemplo 1.12 - Esticando arestas de um quadrado, de forma a transformá-lo num retângulo:

1 1 .
Sejam S(1) = , S(2) =
1 1
2 2
Procuramos T: , linear e tal que:
26

T
1 2
- T multiplica por 2 os vetores na direção 1
1 2 1

T
1 4 - T multiplica por 4 os vetores na direção S(2) = 1
1 4 1
Veja que S(1) e S(2) não são colineares com a origem. No exemplo 1.8, vimos que todo ponto do 2
se
escreverá como combinação linear de S(1) e S(2). Neste caso particular, é fácil fazer esta conta.
Ou seja, dado x ∈ 2:

1 1 1 2 x1 1 2 x1
x = 1 + 2
1 1 1 2 x2 1 2 x2

Resolvendo o sistema de duas equações lineares acima, obtemos

1 = e 2 =

1 1 1 1
Impondo a linearidade, para x = 1 + 2 = + . teremos
1 1 1 1

1 1 1 1
Tx = 1T + 2T =2 1 +4 2 =
1 1 1 1

2 1 4 2
= =
2 1 4 2

3 1
Ou seja, neste caso T(x) = Ax, com A=
1 3
Geometricamente:
27

y y

T(1,1) = (2,2)
(1,1) T

(2,0) x x
(1,-1)
T(2,0) =(4,-2)

T(1,-1) = (4,-4)

Exemplo 13 - Cizalhamento

1 1
Considere A = e TA(x) = Ax
0 1

1 1 0 1
Dado que T( ) = e T( ) = , a imagem de um
0 0 1 1

quadrado [0,1]x[0,1] por TA será:


28

Exemplo 1.14 - Rotação de um ângulo

y y

(x,y) = R x,y) = (x‟,y‟) = (r cos( , r sen(


(r cos , r sen )
R (r cos , r sen

x x

Uma rotação de um ângulo leva (x,y) =( r cos , r sen ) em (x‟,y‟) onde


x r cos( ) r cos cos r
sen sen

x y

obtemos x‟ = x cos ( ) - y sen( )


analogamente y‟ = r sen( + ( ) + ycos( )

Ou seja, rotações são transformações lineares no plano dadas por:

x x cos y sen cos sen x


R
y y cos x sen sen cos y

Exercícios da seção 1.10

Exercício 1.23 - i - Defina P: 2 2


, como sendo a projeção ortogonal na reta do 2, de equação y = mx.
Ou seja, x – P(x) deve ser ortogonal a reta dada. Mostre que T é uma função linear
ii - Considere a reflexão R: 2 2
, com relação à reta y = mx. Ou seja R(x) é a imagem no espelho y =
mx, do ponto x. Matematicamente isto significa que, se x não estiver na reta, o segmento que liga x e R(x) é
ortogonal a reta de equação y = mx e seu ponto médio está em y = mx. Mostre que R também é uma função
linear.

2 2
Exercício 1.24 – Ache uma função linear T: tal que T(2,1) = (1,2) e T(1,2) = (2,1). Mostre que
2
T(T(x)) = x para todo x

120000
1.11 - Uma função linear em
29

Se consideramos a densidade do tecido encefálico contido numa seção de um cérebro, podemos representá-
la por uma função : Q [0,1], onde Q é um retângulo contendo a imagem de tal seção. Nos pontos fora
do cérebro, tal densidade vale 0. 1 seria um limite superior para os possíveis valores da densidade
encefálica. Ou seja, seria calibrada de forma a que (s) < 1, sempre. A densidade pode ser visualizada,
tal qual uma fotografia, os pontos mais densos corresponderiam a valores mais próximos de 0 e os menos
densos a valores maiores. Tais imagens são muito úteis para um médico analisar visualmente a existência de
anomalias, como tumores por exemplo, no cérebro de seus pacientes.

Ao emitirmos um feixe de partículas numa posição T da cabeça de um indíviduo, e medirmos a


correspondente radiação que atravessa o cérebro e chega a uma posição R, este estreito feixe de raios será
mais ou menos atenuado, conforme a densidade de tecido existente no percurso. Estamos interessados em
representar a função yTR( ) que a cada par Transmissor-Receptor, associa a atenuação de energia no raio
TR, transmitido em T e recebido em R. Estaremos supondo também que R e T estejam num mesmo plano
horizontal, como na figura abaixo.
Do mesmo jeito que fizemos com a fotografia de Hanna e Leno, o usual é considerar-se uma
digitalização desta densidade . Abaixo apresentamos uma digitalização da densidade numa seção horizontal
do cérebro de um indíviduo e só para fixarmos idéias consideramos uma malha de 40 linhas horizontais e 30
linhas verticais. Na verdade tal digitalização é grosseira demais, visto que visualmente pode-se perceber que
não é constante em cada pixel, nesta resolução. Contudo é útil na exposição e serve para entender como
funciona a digitalização. Neste caso, é conveniente representarmos a digitalização de por um ponto s ∈
1200, ordenado linha a linha, da direita para a esquerda., conforme a figura abaixo. Isto nos permite

associar, para este raio TR e a um dado pixel, digamos k, no percurso de TR, uma atenuação
proporcional a densidade sk e ao comprimento Ak do raio no pixel k. Estamos considerando Ak = 0,
caso o raio TR não atravesse o k-ésimo pixel.

Ou seja, no caso do raio TR da figura que começa no pixel 631 e atravessa os pixels 631, 632,
633, 634, 635, 636, 606, 607, ······· , 591, 592, 593, 594, 595, 565, 566, 567, 568, 569, 570. Portanto a
contribuição de cada um destes pixels na perda de energia do raio emitido em T vai ser k*Ai*si, onde
Ai vale o comprimento do raio TR no i-ésimo pixel. Em particular, Ai = 0, se o i-ésimo pixel não estiver
no caminho do raio TR. Ou seja:
YTR=k(A631s631 + A632s632 + ······· + A570s570) = k As,

onde A = A1x1200 é um vetor linha com grande números de zeros e s é o vetor que discretiza a
densidade
30

No caso de termos m pares transmissor-receptor, teremos m equações como a que obtivemos para yTR.
Enumerando estas equações de 1 a m e os correspondentes vetores linhas como vetores A1, A2 , ..., Am , de
forma a considerá-los como linhas de uma matriz A, podemos escrever as m equações na forma:

y1=k(A11 s1 + A12 s2 + ······· + A1n sn) = k A1 s,


y2= k(A21 s1 + A22 s2 + ······· + A2n sn) = k A2 s,

ym= k(Am1 s1 + Am2 s2 + ······· + Amn sn) = k Am s,


Moral da História: A discretização da função que a m pares de transmissor-receptor colocados na cabeça
de um indivíduo associa a atenuação da energia detectada nos respectivos trajetos é uma função linear
T: 1200 m
, dada por
31

T(s) = kAs.
onde Ai = A1x1200 armazena os comprimentos de passagem do raio correspondente ao i-ésimo par
transmissor receptor pelos pixels que atravessa, e s é uma discretização da densidade de tecido na seção do
cérebro estudada. Na prática, as resoluções são muito mais finas que esta. Por exemplo, a da imagem do
cérebro que utilizamos acima corresponde a aprox. 300x400 pixels. Do mesmo modo, chegaríamos neste
caso a uma função linear definida em 120000. Na verdade, usualmente o que se quer conhecer é a densidade
discretizada s e o que a tomografia faz é medir as atenuações em milhares de pares transmissor-receptor
colocados no cérebro de um indivíduo. De modo que mede-se y para tentar depois calcular a densidade s
resolvendo o sistema linear (kA)s = y. Ou seja, um problema de tomografia médica pode corresponder a
encontrar uma solução para um sistema de equações lineares com 120.000 variáveis. Como a matriz A pode
ser muito grande (tipo 40.000x120.000), os métodos para encontrar soluções de tais sistemas lineares
fogem completamente do tema a ser tratado numa disciplina inicial de Álgebra Linear. Via de regra, se
baseiam em explorar a particularidade desta matriz A ser muito esparsa, ou seja, o fato de A ter
relativamente bem poucas entradas não nulas.

1.11 ORGANIZAÇÃO DO LIVRO

O principal objetivo de uma disciplina inicial de Álgebra Linear, para nós, consiste em entender bem
as funções lineares no n, vale dizer, entender bem o produto matriz-vetor.

No capítulo 3, estudaremos a resolução dos sistemas de equações lineares, vale dizer da equação Ax
= b, para algum vetor b no m. Você certamente já se deparou com vários problemas que terminam num
sistema de equações lineares. Este é, certamente, o problema de Álgebra Linear mais básico e que mais
surge nas aplicações. Conforme ficará mais claro no capítulo 3, a quantidade de problemas concretos que se
pode reduzir à resolução de um sistema de equações lineares Ax = b é impressionante. No capítulo 2
trabalharemos ainda algumas propriedades algébricas de operações com matrizes, essenciais para resolver
sistemas de equações lineares eficientemente, bem como em todos os demais capítulos deste texto.

No capítulo 4, atacamos as propriedades algébricas de V= ( n, +, *), importantes por si só, e


essenciais para podermos estudar adequadamente o produto matriz-vetor como uma função.

Define-se o produto interno usual de vetores x e y no n pela fórmula:


x y = x1y1 + x2 y2 + + xnyn (1.2)

Provavelmente você já se deparou com o produto interno de vetores no 2 e no 3, seja na física,


seja no cálculo ou em geometria. No capítulo 5, trabalhamos as propriedades geométricas do n,
proporcionadas pelo produto interno. Faremos aplicações interessantes da idéia de projeção ortogonal em
determinados tipos de subconjuntos do n como, por exemplo, o ajuste de funções que modelam
fenômenos a dados experimentais.

O capítulo 6 é dedicado a determinantes, e tem o papel de pré-requisito para o capítulo 8. É ainda um


complemento dos capítulos 2 e 3.
n m
Nos capítulos 7 e 8 voltamos a trabalhar o produto matriz-vetor como uma função TA: ,
n
dada por TA(x) = Ax , de forma a entender como se “comportam” as funções lineares no A
32

quantidade de problemas que podem ser modelados por este tipo de funções é impressionante. Trabalhamos
alguns deles nos capítulos 7 e 8. Para cada A que se fixe, muita coisa relevante, não-trivial e com grande
significado nas aplicações pode ser dita sobre o comportamento da função TA(x) = Ax.

Já no capítulo 8 veremos que, para estudar a função TA(x) = Ax , mesmo considerando que a matriz
A tem entradas reais, é muito útil permitir que x seja um vetor com entradas complexas. Vale dizer, um
ponto de Cn . A partir desta motivação, no capítulo 9 generalizaremos para o Cn a teoria feita para o n. No
capítulo 10, damos algumas indicações de como se pode generalizar, para espaços vetoriais abstratos, a
teoria feita no n. Trabalharemos algumas aplicações importantes no sentido de justificar o esforço.

Este livro foi escrito com base numa disciplina oferecida durante mais de 10 anos a alunos de
graduação em engenharia e ciências exatas na UFRN, com seis aulas semanais de 50 minutos, durante 15
semanas úteis,. Ou seja, cerca de 90 aulas úteis de 50 minutos. Usualmente dividimos o programa em três
partes, separadas entre si por uma avaliação. Na primeira parte trabalhamos os capítulos 1-3. Na segunda, os
capítulos 4 e 5, e na terceira, usualmente trabalhamos os capítulos 6-9. Muitas vezes o capítulo 9 fica
prejudicado e o 10 poucas vezes é efetivamente trabalhado, a depender da turma e do curso específico. A
rigor, para trabalhar com alguma tranquilidade tudo o que está nestes 10 capítulos, o aconselhável seria
fazê-lo em dois semestres com, pelo menos, 4 aulas semanais cada. Indicamos, a seguir, uma bibliografia
complementar:

Bibliografia Complementar

D. C. Lay, Álgebra Linear e suas aplicações, Livros Técnicos e Científicos.


B. Kolman, Introdução à Álgebra Linear com aplicações, Livros Técnicos e Científicos
D. Poole, Álgebra Linear, Thomson
H. Anton, R. C. Busby, Álgebra Linear Contemporânea, Bookman

T. Lawson, Álgebra Linear, Editora Edgard Bluecher,


S. J. Leon, Álgebra Linear com Aplicações, Livros Técnicos e Científicos, RJ.
Anton-Rorres – Álgebra Linear com Aplicações - Bookman
J. L. Boldrini, S. I. R. Costa, V. L. Figueiredo e H. G. Wentzler, Álgebra Linear - Harbra &
Row do Brasil .
Lipschutz S. - Álgebra Linear - 3a edição (Coleção Schaum - 1994 em diante) -McGrawHill –Makron
G. Strang, Linear Algebra and its applications - Academic Press.

1.12 (Opcional) DUAS OBSERVAÇÕES PARA QUEM GOSTA DE VER ADIANTE

A primeira observação é para apontar em que sentido o conceito de função linear é bem mais
abrangente que o de produto matriz-vetor. A segunda visa esclarecer um pouco como as idéias de
função linear e matriz foram surgindo no tempo.
33

O conceito de função linear aparece, não apenas no n, mas em contextos bem diversos. Por
exemplo, a derivação de funções é uma operação linear. Essencialmente você usou e abusou deste fato no
Cálculo I. Para ser um pouco mais preciso, considere o conjunto
V = {f: : f tem derivadas de todas as ordens}.
Do cálculo I você sabe que funções f: dadas como polinômios, sen(kx), cos(kx) ou ekx são
elementos de V. Em V temos as operações usuais de soma de funções e de multiplicação de funções por
números. Por exemplo, se f: e g: são dadas por f(x) = x2 + 2x e g(x) = sen(3x), então:
f+g: é dada por (f+g)(x) = x2 + 2x + sen(3x), que também terá derivadas de todas as ordens
3f: é dada por (3f)(x) = 3*(x2 + 2x) = 3x2 + 6x, que também terá derivadas de todas as ordens

Na verdade, isto acontece com todas as funções que estão em V, ou seja, ao somar duas funções com todas
as derivadas, obtemos uma função com todas as derivadas. Ao multiplicar uma função com todas as
derivadas por uma constante, obtemos uma nova função com todas as derivadas.

Veja que, além disto, podemos pensar na derivada como uma função D:V V, que a cada f, lhe associa sua
derivada D(f). Em resumo, D:V V é tal que:
D(f): e D(f)(x) = f’(x)
Por exemplo, se f: é dada por f(x) = x2 + 3x, então D(f): será definida por D(f)(x) = 2x + 3.

Como você sabe do cálculo I, se f e g estão em V e c é um número real:

L1: D(f+g) = D(f) + D(g) (Derivada da soma é a soma das derivadas)


L2: D(cf) = cD(f) ( A derivada de cf(x) é cf’(x) )

Portanto D é uma função linear. Para completar a analogia é bem fácil ver que em V valem as operações
EV1-EV6. Modernamente se entende V como um espaço vetorial, por causa disto e D:V V é uma função
linear. A diferença importante entre as funções lineares definidas em V e as definidas em n é que não faz
sequer sentido dizer que D(f) é um produto matriz-vetor, no sentido usual.

Moral da história: O conceito de função linear é bem mais amplo que o de produto matriz-vetor e se
generaliza para contextos bem diversos. Contudo, quando f: n m
é linear, aí sim, podemos dizer que
f(x) se descreve como um produto matriz-vetor. Inclusive esta é uma das grandes vantagens que temos de
restringir o estudo da Álgebra Linear ao n, como faremos nesta disciplina.

Observação 1.6: Historicamente, a idéia de função linear é bem anterior à de matriz. Veja que a fórmula de
D(x) no começo desta subseção, pode ser descrita como tendo um polinômio homogêneo de grau 1 (sem
termo independente), nas variáveis x1, x2 e x3, em cada uma das coordenadas de D(x). O que vimos na seção
1.9 é que todas as funções lineares f: n m
são assim. Funções descritas por polinômios homogêneos do
grau 1 nas suas variáveis já eram reconhecidas como funções lineares no início do século XVIII. É que
elas surgem naturalmente em vários contextos. Por exemplo, como vimos nos exemplos 1.10 a 1.14, bem
34

como no exercício 1.23, rotações, reflexões e projeções em retas contendo a origem, geram funções no 2
que são lineares. Na verdade, a idéia de matriz surgiu com Gauss, já no século XIX, ao compor duas
funções lineares e perceber que obtinha uma terceira função linear, mais ou menos como lhe pedimos de
fazer no exercício 1.13.
35

EXERCÍCIOS RESOLVIDOS ( ÍMPARES E OS COM A MARCA +).

Exercício1.1
Temos que x + x‟ = ( 1, 2) + (2 , -4) = ( 3 , -2) (1,2)
Note que a inclinação ( ângulo com o eixo-x ) do segmento que
liga os pontos (1, 2 ) e (3, -2 ) é a mesma do segmento que liga
a origem ao ponto (2, -4) e o mesmo ocorre com segmento que liga
os pontos (2, -4)e (3, -2) e o segmento que liga a origem ao ponto (1, 2).
Portanto o quadrilátero da figura 1.1 ao lado é um paralelogramo. x+x‟
(3, -2)

(2,-4)
Exercício 1.2+ -Sejam x = ( a , b) e x‟= ( a‟, b‟) e Q = x +x‟ = ( a + a‟, b +b‟) como na figura 1.2
abaixo. Observe que a inclinação ( ângulo com o eixo-x ) do segmento Ox ( b/a ) é a mesma do segmento
x‟Q, O mesmo ocorre com os segmentos xQ e Ox‟. Portanto o quadrilátero da figura 1.2 é um
paralelogramo.

x‟

figura 1.2
3
Exercício 1.3+ Se v = ( v1 ,v2 ,v3) e w = (w1 , w2 , w3) são elementos de e c definimos cv = (cv1,
cv2, cv3 ) e v + w =(v1+w1, v2 +w2, v3 +w3)

cv3 v+
w
w
v
c
3 v
v
v
v cv2
2
figura 1.3 v
cv11 figura 1.4

Exercício 1.4 Seja V = n = { ( x1 , x2 ,..., xn ) ; xi }.


Dados dois elementos x = ( x1 , x2 ,..., xn ) e y = ( y1 ,y2 ,...,yn) e vamos definir a soma
36
n n
usual de elementos do e o produto de um número por um elemento do como se segue:
x + y = ( x1 + y1 , x2 + y2 ,... xn + yn )
.x = ( x1 , x2 ,..., xn)
n
Verificando que ( , + , . ) satisfaz as propriedades P1 -P6.

EV1. Propriedade Associativa.


Sejam x = ( x1 , x2 ,..., xn ) y = ( y1 ,y2,..., yn) e z = ( z1 , z2 ,... zn )
[ x + y ] + z = [( x1 + y1 , x2 + y2 ,..., xn + yn )] + ( z1 , z2 ,..., zn ) =
= ( x1 + y1+z1 , x2 + y2 +z2 ,..., xn + yn +zn ) =
= (x1 , x2 ,..., xn ) + [( y1+z1 , y2 +z2 ,..., yn +zn )] =
= x + [ y + z]

EV2. Propriedade Comutativa.


x + y = ( x1 + y1 , x2 + y2 ,..., xn + yn ) = ( y1 + x1 , y2 + x2 ,..., yn + xn) = y + x

EV3. Existência de um Elemento Neutro ( Elemento Zero) para a soma.


n n
Existe um elemento 0 = ( 0 , 0 ,...,0 ) tal que 0 + x = x + 0 qualquer que seja x ,
Isto é:
( 0 ,0 ,..., 0 ) + ( x1 , x2 ,..., xn ) = ( 0+x1, 0 + x2 ,..., 0 + xn ) = (x1, x2 ,..., xn)

EV4 . Existência de um Simétrico em relação a soma.


n n
Para todo x existe um elemento x‟ ( que chamaremos x‟= -x ) tal que x + x‟ = 0.
Isto é:
Dado x = ( x1 , x2 ,..., xn ) tome x‟ = -x = ( -x1 , -x2 ,..., -xn ) e teremos:
x + x‟= ( x1 , x2 ,..., xn ) + ( -x1 , -x2 ,..., -xn ) = ( 0 , 0 ,..., 0 ) = 0

EV5. Sejam x , y como antes e e ‟ números reais então:


i. Distributividade da soma de escalares pelo produto por vetor.
( + ‟).x = ( ( + ‟)x1 , ( + ‟)x2 ,..., ( + ‟)xn ) =
= ( x1 + ‟x1 , x2 + ‟x2 ,..., xn ‟xn) =
= ( x1 , x2 ,..., xn ) + ( ‟x1 , ‟x2 ,... ‟xn) =
= ( x1 , x2 ,..., xn ) + ‟( x1 , x2 ,..., xn ) = .x + ‟x.

ii. Distributividade do produto de um escalar pela soma de vetores.


( x + y ) = ( x1 +y1, x2 + y2 ,..., xn + yn ) = ( ( x1 + y1) , ( x2 +y2) ,..., ( xn + yn)) =
= ( x1 + y1 , x2 + y2 ,..., xn + yn) =
= ( x1 , x2 ,..., xn) +( y1 , y2 ,..., yn) = .x + .y

iii. Associatividade do produto de escalares pelo produto por vetor.


( ‟).x = ( ‟x1 , ‟x2 ,..., ‟xn ) = ( ‟x1 , ‟x2 ,..., ‟xn) = ( ‟x).

EV6. O número 1 é neutro na multiplicação de números por vetores. Isto é:


1.x = ( 1x1 , 1x2 ,..., 1xn ) = ( x1, x2,..., xn ) = x

Exercício 1.5 - Se y + 2*(1,-3,-2,4) = (2,5,3,-1) y = (2,5,3,-1) - 2*(1,-3,-2,4) = (0,11,9,-9)


37

Exercício 1.7 i - Temos que 2v1 + 2v2 +(-2)v3 = ( 4, 8 , 12 )

ii. Teremos c1(1 , 2 ,3 ) + c2( 2, 3, 4) = (1 , 1, 1) acarretando que c1+2c2 = 1, 2c1+ 3c2 = 1 e 3c1 +4c2 =1
que nos fornece c1 = -1 e c2 = 1.

iii. Suponhamos que (1,0,0 ) = c1(1 , 2 ,3 ) + c2( 2, 3, 4). Então teríamos que c1 + 2c2 = 1 e 2c1 +3c2 = 0
o que evidentemente é impossível.

iv. Observe que pelo ítem ii se v = (1 , 0 , 0) fosse combinação linear de v1 , v2 e v3 então v seria
combinação linear de v1 e v2 e pelo ítem iii isto não é possível.

v. Suponha que ( b1 , b2 ,b3) é um vetor qualquer de 3. Queremos saber se existem constantes c1 , c2 , c3


tais que c1(1 , 2 ,3 ) + c2( 2, 3, 4) + c3(1 , 0, 0) = ( b1 , b2 ,b3) o que equivale resolver o sistema
c1 2c 2 c3 b1
2c1 3c 2 b2 que tem como solução c1 = -b3 +2b2/3 , c2 = b3 – b2/2 e c3 = b1 – b3 + b2/3.
3c1 4c 2 b3

Exercício 1.9 - Seja M o ponto médio de PQ . ( ver figura 1.5 ) OP OQ


OQ OP P
Temos que PM = . Por outro lado
2
M
OQ OP OP OQ
OM OP
2 2 Q

Portanto seria uma generalização natural definir o ponto O


médio que liga dois pontos P e Q de 4 ( ou n) como
acima.
figura 1.5

Exercício 1.11

i - A1b = (1 2 -2) = 1*2+2*(-1)+ (-2)2 = 0 ; A2b = (-2 2 2) = 0; A3b = (1 2 0) =0

ii - Se você achou alguma solução interessante aqui, mande-nos um e-mail... No olhômetro, poderíamos
pensar que se houver c1 e c2 tais que c1A(1) + c2A(2) = A(3), como A33 = 0, então c1 tem que ser – 2c2. Na linha
dois se pede que 2c1 + 2c2 = -1. Portanto 2c2 = 1, o que significa c2 = ½ e c1 = -1.
(Esta “solução” pode ser questionada dizendo-se que, no fundo resolvemos um sistema linear de maneira disfarçada e
portanto não atendemos exatamente às especificações do enunciado do problema)
iii – Neste caso, 0 = A*b = 2A(1) – A(2) + 2A(3) 2A(3) = - 2A(1) + A(2) A(3) = - A(1) +1/2A(2)
38

Exercício 1.13 - Considere A = , B= ex=

i - Bx = e A(Bx) = =

Por outro lado AB(1) = = C(1) e AB(2) = = C(2), conforme se pede.


ii – A(Bx) = A(x1B(1) + x2B(2)) = (Bx como CL de B(1) e B(2)
= x1 AB(1) + x2 AB(2) = (Linearidade)
= (AB(1) AB(2)) = Cx
iii – C = (AB(1) AB(2)) é o produto usual de matrizes e o ponto aqui é que esta conta justifica a definição de
produto de matrizes. For por aí que Gauss descobriu o produto de matrizes, ou seja um produto nos
coeficientes dependentes de um sistema linear tal que a ABx = A(Bx), para todo x ∈ 2

Exercício 1.15+ A(cx + dy) = A(cx) + A(dy) - Pela propriedade L1


= cA(x) + dA(y) - Pela propriedade L2

Exercício 1.16+ É só observar que as propriedades LD1 e LE1 são as propriedades distributivas dos
números reais. LD2 e LE2 usam as propriedades comutativa e associativa da soma de números reais

Exercício 1.17+ i– L1: f(x+ y) = 3(x+y) = 3x + 3y = f(x) + f(y)


L2 f(cx) = 3(cx) = c*3x = cf(x)
Ii - Basta ver que L2 não vale para x =1, pois f(2) = 7 2f(1) = 8 e g(2) = 4 2g(1) = 2
iii + Se f é linear f(x) = f(1*x) = f(1)x = cx, onde c = f(1)

y1 0,1x1 0,2 x2 0,2 x3 0,1 0,2 0,2 x1


Exercício 1.19 - Neste caso teremos y2 0,4 x1 0,3 x2 0,1x3 0,4 0,3 0,1 x2 .
y3 0,3 x1 0,3 x2 0,2 x3 0,3 0,3 0,2 x3
0,1 0,2 0,3
Logo a função pedida é y =Ax onde A = 0,4 0,3 0,1
0,3 0,3 0,2

Exercício 1.21
x 1 0 x1 1 0
Temos que 1 x1 x2 .( é uma combinação linear dos vetores e ).
x2 0 1 x2 0 1

x1 1 0 1 0
Usando o fato que T é linear teremos T T ( x1 x2 ) T ( x1 ) T ( x2 )=
x2 0 1 0 1
1 0 1 3
= x1T ( ) x 2 T ( ) = x1 x2 = Ax
0 1 2 1
39

1 3 x1
onde A = ex= .
2 1 x2

Exercício 1.22 + Se T é linear T(0) = T(2*0) = 2*T(0) T(0) = 0

Exercício 1.23 -
x* P(x)

R(x)

i –Duas coisas caracterizam P(x):

i.1 – P(x) está na mesma direção que um vetor na direção da reta. Podemos, portanto supor que:

P(x) = c , para algum número real c


2
i.2 – P(x) – x é ortogonal a . Lembrando do produto interno em , isto signfica que

(P(x) – x). =0 [c - ] =0 c - mx1 + cm2 –mx2 c = m (x1 + x2)/(1+m2)

Segue que P(x) = c = 1/(1+m2) .


Portanto P(x) é linear, já que é dada por uma fórmula tipo produto matriz vetor

ii – Veja que R(x) – T(x) = T(x) – x R(x) = 2T(x) + x =

Portanto R(x) também é linear, por ser igualmente dada por um produto matriz-vetor