You are on page 1of 81

% % o o a i r a a i ar VV ee PP dd xa PP aa x T ,11 a 7 o 1 00 2, T g 7 e o r 2 g p e r m p -22 91 m 0 ,1 EE -2 6 9 0 o 1 , t 6 u o 1 dt ou rd ,66 ,2 P o 9 9 ,2 6 2 1, 2 -1 2 9, 19 00 2, -1 ,77 ,3 2 3 7 3 25 1, 1 ,5 -2 37 3, 3 , 2 1 7 1 , 6 3 3 2 , 23 26 ,3 45 5 ,5 2 47 1, ,7 -5 16 ,4 2 ,33 -6 4 1 , 6 3 1 2 1 , 6 53 3 ,3 -1 9 0 ,3 5 12 4, ,2 0 26 14 ,9 1 , 1 4 6 4 , 9 2 1 1 , 9 97 ,7 45 0 ,5 9 61 2, 6 ,1 -0 4 25 4 , 1 , 6 2 5 6 , 9 2 4 1 , -9 24 ,4 ,5 1 3 2 -, 5 78 ,8 -2 98 3, 1 ,8 -1 7 -, 2 6 9 1 1 , 6 15 ,5 -1 83 9 ,3 1 16 1, ,6 -0 9 73 ,8 0 , 1 1 3 0 , 7 7 0 3 , 79 37 96 ,9 07 5 5 ,7 7 -, 7 , 0 5 5 1 , 0 , 5 6 7 , 1 9 1 0 2, -1 97 ,7 -2 39 5 ,9 9 53 1, ,3 -7 24 ,3 1 ,4 5 -, 15 7 4 2 1 , 4 34 ,4 56 7 ,6 ,2 3 0 2 -, 7, 08 10 ,5 , 8 0 0 8 0 1 1 , 1,6 42 18 47 ,2 79 3 ,9 4 92 1, ,2 -3 ,7 2 ,7 9 -, 33 4 -1 4 -, -2 -4 4 ,66 2 6 ,4 6 -, 71 ,1 ,3 10 ,2 0 3 -6 -0 7 -, 3 1, 1 -0 1,4 13 62 ,2 54 1 ,4 6 17 , ,7 5 -7 1 69 , 0 , 1 1 9 7 , 5 6 0 , 5 09 ,9 41 4 ,1 ,7 0 0 7 -, 85 4, ,4 ,5 88 0 1 8 , 1 1,2 46 ,6 -1 09 1 ,9 4 -, 47 8 ,7 1 04 ,0 0 , 4 4 8 , 3 0 0 , ,6 -3 6 6 57 1, ,7 51 6 1 3 ,1 5 1 1 , 0 , 5 3 , 8 1 0 , 58 1 8 ,8 32 5 ,2 5 54 1, ,4 -5 31 13 ,3 1 ,1 5 1 5 3 13 1, 5, 38 ,8 69 6 ,9 ,9 3 1 ,8 9 6, 19 ,6 0 -9 8 1, , 1 0 39 ,9 0,8 14 0 ,4 ,1 3 2, 2 -0 1 49 ,1 , ,9 2 44 2 3 /96 4 1 , 3 16 5 1 ,6 , 9 8 1 5 1, -1 22 85 8, ,5 19 1 2 8 l/96 1 , 2 73 ,3 94 1 ,4 0,6 -1 7 21 ,1 -1, ,9 18 ,9 1 3 2 1 9 18 1, 3, o/96

6 87 ,7 9 ,99 8 -, 38 ,8 54 12 ,9 1 ,4 -9 -2 3 , 8 /9 5 1 66 1 1 , e 9 8 ,1 /t 1 75 ,1 ,5 84 ,4 222 86 15 ,7 6 0,4 - 1, 0 , 8 6 5 9 , 7 / 8 1 t 6 0 u 9 / 51 17 17 ,1 24 2 ,4 5 -, 06 8 ,6 2 2 1 , 6 1 , 0 7 8 9 , 0 / 1 1 6 1 1 v -0, 9 ,7 o/ 1 v 52 34 ,7 ,2 -4 49 ,9 -0 72 6 0,2 - -1, ,5 0 ,2 -3 4 9 0 , 6 / 7 6 0 z 9 6 e / 84 z ,4 -1 93 2 ,3 8 04 1, ,4 9 2 66 33 , 7 1 , 0 1 9 , 9 / 6 3 7 1 1 , n a/9 13 19 ,3 n 01 8 ,1 1 82 ,2 8, 16 ,0 7 0 0 ,44 8 6 9 , 0 / 4 1 7 0 , v 9 0 e / 0 0,2 0,4 0,6 0,8 1 1,4 f 5 ,881,2 0 ev ,5 8 2, 4 ,99 ,4 0 ,5 7 0 4 9 2 4 4 9 , 3 , / 7 r 0 4 9 9 a 3 1 ,9 m 73 ar/ 3 ,3 1 -, 05 ,5 58 21 ,7 7 0 ,8 -3 0 , 2 /9 5 21 7 r 0 1 , 9 b 2 / 83 a r 8 1 , 4 3 ,8 83 -, ab 0 ,55 ,4 7 0 ,66 -3 5 0 9 , 6 / 6 i 7 0 , a 9 6 / 82 ,2 m ai 51 9 ,1 8 -, 08 m 2 ,8 9 08 ,5 7 0 ,8 0 2 9 , 2 / 0 7 0 2 , n 9 u/ jn 58 2 ,8 27 6 ,7 ju 5 1, 5 3 ,88 2 6 9 1 , 7 1 , 8 1 5 3 9 , 2 / 9 1 l 7 1 u jl /9 -2, ,55 89 ju 2 ,9 ,1 5 4, 3 1 -, 72 15 ,8 7 ,2 -5 42 9 3 4 / 7 1 7 , o 9 4 ,5 g / ao -4 ,5 ,88 51 ag 2 4 ,1 -4 8 7 4 , 7 0 , 5 2 9 , 1 / 7 4 t 7 0 1 , e /9 st 18 ,8 -1 21 7 ,1 se 1 16 ,6 -6 7, ,2 7 3 ,55 1 -, 6 8 /9 5 t 7 3 1 , u 9 8 / o 46 t 2 ,6 -1 6 2 ,2 -1 ou 4 2, ,7 -3 ,6 7 -1 2 2 7 3 9 4 , / 7 2 v 9 4 o/ 54 nv ,4 86 2 ,6 5 -, 37 no ,7 8 35 2 29 , 7 4 , 3 5 9 9 , 7 / 3 2 7 4 , z e/9 -7 76 dz ,6 ,8 6 0 7 8 -, 43 1, de ,3 -6 45 8 1 ,5 -0 4 1 9 , 5 / 4 8 1 , n 9 5 a / j 94 ,4 64 6 ,4 jan 98 9 83 3, ,3 6 54 13 ,6 0 , 8 3 4 3 , 7 / 5 1 8 0 2 , v 9 e/ 63 fv 27 ,3 27 5 ,7 6 fe 57 , 4 1 ,7 2 5 1 2 , 8 0 , 5 5 4 1 9 , 0 / 1 2 8 r 0 a /9 41 -0, ,1 m ar 18 0 ,8 4 78 5, m ,8 37 48 ,1 8 3 ,7 -8 7 50 9 , 5 / 3 4 8 r 3 1 , 9 b 5 / 73 ar ,3 -1 93 1 ,3 7 ab 09 , 1 7 ,9 9 1 2 4 , 8 0 , 0 1 7 9 , 6 / 2 4 i 8 0 2 , a /9 32 26 m ,2 ai 01 4 ,1 3 04 m ,4 -1 4, 54 ,0 8 0 ,4 0 -, 1 9 0 / 5 8 0 5 , n 9 0 u / j 73 8 ,3 -5 6 5 ,8 jun 98 7 -, 5 ,77 08 ,6 1 ,8 -5 7 5 , 7 / 0 l 8 1 4 , u 9 7 j 96 4 ,6 25 jul/ 6 ,5 9 95 , ,5 ,8 2 -6 6 , 8 1 5 9 8 6 9 , , / 8 1 5 o g/9 37 ao ,7 12 4 3 27 1, ag ,7 -4 12 18 8 2 ,8 2 -, 1 9 6 / 1 t 8 2 , e 9 6 / s 29 ,9 09 8 ,9 set 98 2 95 2, ,5 -8 39 13 ,0 4 , 9 2 9 3 , 6 / 3 1 t 8 4 , u 9 -6 06 ot/ ,6 53 4 ,3 0 ou 45 2, 6 4 ,5 5 4 5 2 , 8 2 , 4 2 6 4 9 , 5 / 5 2 8 2 v 9 5, o/ 08 nv ,8 ,3 6 8 0 3 82 1, no ,2 8, 8 2 ,77 8 -, 16 22 9 6 / 7 8 2 1 , z 9 6 e / 69 dz ,9 -1 49 7 ,9 6 63 de 1, 6 6 ,3 -7 4 4 1 , 9 6 , 6 1 6 6 9 , 4 / 4 1 6 2 , n -4 a/9 jn 04 ,4 -2 57 7 ,7 ,4 ja 0 3, 2 4 -, 98 25 ,5 ,8 -5 37 99 2 0 / 9 2 2 , v 9 0 e / 21 f 9 2 ,1 1 ,9 ,2 2 f ev 0 2 1, 46 ,9 9 , ,55 6 9 0 8 / 5 4 r 1 , 9 a 8 19 1 ,9 m ar/ 97 2 ,7 1 -, 43 6 m ,3 9 -0 2 0 , 9 1 , 4 6 0 9 , 0 / 0 r 1 2 , -0 b /9 97 ar ,7 -2 27 2 ,7 ,6 9 ab 1, 5 -2 -3 6 ,2 9 , ,77 1 3 9 5 9 / 7 i 3 , a 9 9 / 65 3 ,5 m ai 15 5 -5 6 39 2, m ,9 5 18 9 -1 0 , 3 2 8 9 , 0 / 1 0 , n 9 u/ jn -0 ,33 29 0 ,9 ju 3 -, 89 5 2 ,9 , 2 0 3 , 9 2 3 8 5 2 9 , , / 3 l 2 u 4 -3 jl /9 ju 3,88 -12,3

ANDERSON LITAIFF SALOMO NEVES

y = 0,8965x + 0,0253 R2 = 0,7855

ANLISE DE DADOS QUANTITATIVOS E REGRESSO LINEAR SIMPLES


1,6 1,8

INTRODUO ECONOMETRIA:

Notas de Aula e Fichas Tcnicas para as aulas iniciais do curso de Econometria

Orientador: Prof. Dr. Luiz Roberto Nascimento

Universidade Federal do Amazonas UFAM Faculdade de Estudos Sociais FES Departamento de Economia e Anlise - DEA

UNIVERSIDADE FEDERAL DO AMAZONAS FACULDADE DE ESTUDOS SOCIAIS DEPARTAMENTO DE ECONOMIA E ANLISE

INTRODUO ECONOMETRIA: ANLISE DE DADOS QUANTITATIVOS E REGRESSO LINEAR SIMPLES

Material didtico para as aulas iniciais do curso de econometria do curso de cincias econmicas da Universidade Federal do Amazonas - UFAM

Anderson Litaiff Feitosa da Costa Salomo Franco Neves Orientador: Prof. Dr. Luiz Roberto Nascimento Coelho

Manaus 2007

NDICE
Apresentao......................................................................................................... Introduo.............................................................................................................. Definies e Conceitos Bsicos.......................................................................... 1. Populao......................................................................................................... 2. Amostra............................................................................................................. 3. Unidade Observacional.................................................................................... 4. Varivel............................................................................................................. 5. Medidas Estatsticas......................................................................................... 6. Inferncia.......................................................................................................... Captulo 1: Descrevendo Dados Quantitativos................................................... 1.1 Representao Tabular.................................................................................. 1.2 Medidas Estatsticas....................................................................................... 1.2.1 Medidas de Posio (Tendncia Central)................................................. 1.2.1.1 Mdia Aritmtica.................................................................................. 1.2.1.2 Mediana............................................................................................... 1.2.1.3 Moda................................................................................................... 1.2.1.4 Exemplo de aplicao......................................................................... 1.2.2 Medidas de Variao................................................................................ 1.2.2.1 Medidas Absolutas de Variao.......................................................... 1.2.2.2 Medida Relativa de Variao.............................................................. 1.2.2.3 Exemplo de Aplicao......................................................................... 1.2.3 Medidas de Assimetria.............................................................................. 1.2.4 Outras Medidas Descritivas...................................................................... 1.3 Representao Grfica................................................................................ 1.3.1 Histograma............................................................................................. 1.3.2 Box Plot.................................................................................................. Captulo 2: Correlao.......................................................................................... Capitulo 3: O Modelo Linear a Duas Variveis (Regresso Linear Simples)... Captulo 4: Testes do Modelo: ANOVA e t de Student....................................... Captulo 5: Anlise dos Resduos e Previso..................................................... Consideraes Finais............................................................................................ Bibliografia............................................................................................................. ANEXOS..................................................................................................................
4 5 6 6 6 6 6 6 7 8 8 9 10 10 12 12 13 13 14 17 17 18 19 20 20 21 23 27 34 37 40 41 42

APRESENTAO
Anderson Litaiff Feitosa da Costa: Graduado em Filosofia pela Universidade Federal do Amazonas - UFAM. Atualmente finalista do curso de Economia e Mestrando em Desenvolvimento Regional na rea de industrializao. Trabalhou em Consultoria Econmica, pesquisador na rea de Economia da Populao pelo PIATAM e atualmente trabalha na rea de Comrcio Exterior. Entre suas atividades como discente foi monitor e um dos elaboradores do material didtico das aulas do curso de Contabilidade Social ministradas pelo professor Francisco de Assis Mouro.

Salomo Franco Neves: Graduado em Economia pela Universidade Federal do Amazonas - UFAM. Atualmente est em processo de preparao para o exame de qualificao no Mestrado em Desenvolvimento Regional na rea de Industrializao e est em processo de concluso de sua especializao em Administrao de Empresas pelo Instituto Superior de Administrao e Economia da Amaznia - ISAE/FGV. Foi estagirio do Departamento de Anlise Econmica da Secretaria de Estado de Planejamento e Desenvolvimento Econmico SEPLAN/AM e atualmente monitor presencial do curso de Especializao em Desenvolvimento Regional Sustentvel pelo consrcio INEPAD/ UFMT. No que se refere s atividades em sala de aula, foi monitor nos cursos de Contabilidade Social, Teoria Macroeconmica I e II, Desenvolvimento Scio Econmico e Economia dos Recursos Naturais e do Meio Ambiente e prestou estgio de Docncia nos cursos de Poltica e Planejamento Econmico e Teoria Macroeconmica II.

INTRODUO Salomo Neves A sociedade se transforma a toda hora: medida que o tempo passa novas tendncias so criadas e novos comportamentos so observados. Dada a necessidade de no apenas observar o comportamento da sociedade, mas tambm de notar suas particularidades e apontar novos rumos, a busca por maneiras de mensurar todos esses fenmenos tem tido um nvel de importncia cada vez maior. Uma das formas mais eficientes de se mensurar tas processos tem sido obtidas via anlise de dados estatsticos, onde quanto maior for a sua disponibilidade e nvel de homogeneidade maior a capacidade de se conseguir explicar, pelo menos de forma aproximada, a realidade. A utilizao de tcnicas estatsticas se estende a praticamente todas as reas do conhecimento, dada a sua capacidade de simplificar e fornecer uma noo quantitativa e qualitativa dos fenmenos que afetam a sociedade. Na economia no diferente: independente da rea onde o economista trabalha a estatstica est presente, ora em seus estudos de mercado, ora em seus artigos e papers publicados em peridicos especializados, ora em projees e pesquisas de ordem governamental. Ao conjunto de tcnicas estatsticas aplicadas economia d-se o nome de econometria. Dado isto, cabe a seguinte pergunta: de que forma a econometria est presente na vida do economista? A econometria est presente atravs de vrias tcnicas, onde se costuma dividi-las basicamente em anlise de dados quantitativos e qualitativos, ambas com suas respectivas medidas e particularidades. O objetivo destas notas de aula fornecer aos alunos do curso de econometria e reas afins noes bsicas da anlise de dados quantitativos, onde especificamente sero apresentadas algumas de suas tcnicas mais importantes nesse sentido. Estas notas de aula esto divididas em cinco captulos: o primeiro captulo destinase a conceituao das principais medidas estatsticas utilizadas para se analisar o comportamento de uma varivel de forma singular; os captulos seguintes abordam as principais tcnicas para a anlise das variveis de forma conjunta, enfatizando tcnicas como correlao, regresso linear simples e anlise de varincia e de resduos. As tcnicas economtricas so de extrema importncia na vida do economista: o domnio da econometria fornece ao usurio uma base mais ampla para a realizao de anlises mais complexas sobre a realidade, o que acaba sendo um diferencial no ato de tomadas de deciso e consequentemente nos efeitos de poltica econmica e captao de recursos, tornando a anlise econmica muito mais eficiente e eficaz.

Definies e conceitos bsicos 1. Populao o conjunto de todos os elementos (unidades observacionais) que constituem a abrangncia do estudo. Exemplos: 1.1. Conjunto dos 5507 municpios brasileiros. 1.2. Conjunto constitudo pelos alunos deste curso. 1.3. Conjunto dos discursos proferidos pelo presidente da repblica desde a sua posse. 2. Amostra um subconjunto da populao. Exemplos: 2.1. Conjunto de municpios da regio Nordeste 2.2. Alunos deste curso que residem no Rio de Janeiro. 2.3. Discursos proferidos pelo presidente da repblica em recintos abertos. 3. Unidade Observacional a portadora da(s) caracterstica(s), ou propriedade(s), que se deseja investigar. Exemplos: 3.1. Cada um dos 5507 municpios brasileiros. 3.2. Cada discurso presidencial. 4. Varivel a representao simblica da caracterstica ou propriedade que se deseja investigar. Exemplos: 4.1. Receita tributria municipal arrecadada no ano passado. 4.2. Gnero dos alunos 4.3. Emprego da expresso jamais neste pas. 5. Medidas Estatsticas So os parmetros da populao, ou amostra, em apreo. Permitem reduzir a totalidade dos dados a apenas um certo nmero de medidas. Exemplos: 5.1. Receita tributria municipal mdia. 5.2. Percentagem de mulheres. 5.3. Freqncia com que a expresso jamais neste pas foi utilizada em cada discurso.

6. Inferncia o processo de generalizar na populao os resultados obtidos em uma amostra. Exemplos: 6.1. Como a receita tributria municipal mdia da regio Nordeste de $ 150.000.000 podemos concluir que, no Brasil, esta receita de $ 150.000.000, em mdia. 6.2. Como a turma do Rio de Janeiro tem 40% de mulheres, conclumos que todas as turmas deste curso tm 40% de mulheres. 6.3. Como o presidente utilizou a expresso jamais neste pas 25 vezes, em mdia, nos discursos em recintos abertos desde a sua posse, podemos concluir que em seus discursos utilizam, em mdia, 25 vezes essa expresso.

UFAM/ FES/ DEA

Econometria

Ficha I

Captulo 1: Descrevendo dados quantitativos Dados quantitativos so aqueles expressos pelas variveis com nveis de mensurao intervalar ou de razo. Ou seja, so aqueles nos quais as variveis assumem valores numa escala mtrica definida por uma origem e uma unidade fixas ou no. Como esses valores tm significado concreto: Todas as operaes matemticas envolvendo os valores da distribuio so vlidas; As medidas de posio, variao e forma permitem a simplificao de todos os valores da distribuio para alguns poucos parmetros; As representaes tabulares servem apenas para efeito de simplificao visual dos valores da distribuio; As representaes grficas so muito mais informativas.

As variveis quantitativas podem ser tambm, classificadas como discretas, quando assumem um nmero finito pontual de valores, ou contnuas, quando assumem um nmero infinito de valores, geralmente em intervalos. 1.1 Representao Tabular Quando o nmero de observaes grande e os valores so diferenciados entre si, h que se representa-los de modo resumido. Para dados quantitativos, a melhor forma de representao tabular por meio de distribuies de freqncia por classes de valores. No h um modo nico para se construir uma tabela de freqncia por classe de valores. No entanto, algumas regras so apresentadas abaixo, visando facilitar esse procedimento. A escolha do nmero de classes a ser considerado depende do nmero de observaes, do menor e do maior valor da srie. Embora subjetiva, essa escolha deve recair para algo entre cinco e dez classes, devendo se evitar classes com baixo nmero de observaes. Um modo aproximado de se determinar o nmero de classes calculando a raiz quadrada do nmero de observaes. As classes no precisam ter amplitude constante, mas, por uma questo de simplificao da construo da representao grfica, geralmente consideramos classes com intervalos constantes. O clculo da amplitude dos intervalos das classes pode ser feito dividindo-se a amplitude da distribuio diferena entre o maior e o menor valor da amostra pelo nmero de classes. Como as classes devem ser exaustivas no pode haver uma observao sem classe e mutuamente exclusivas uma observao tem que ser alocada em uma a apenas uma classe , importante definir os limites das classes que sero includas ou excludas em cada classe. Como se pode notar, esse procedimento deve ser feito apenas para efeito de representao dos dados. O clculo das medidas estatsticas deve ser feito utilizando-se os dados efetivamente observados. Quando estes no so disponveis Anderson Litaiff Salomo Neves

9 UFAM/ FES/ DEA Econometria Ficha I

e apenas uma tabela fornecida dados secundrios as medidas estatsticas so calculadas assumindo-se que nesse caso, so valores aproximados. Exemplo: uma amostra de 40 pessoas selecionadas de uma populao forneceu a seguinte distribuio das idades, em anos completos:
71 49 78 58 74 83 64 86 65 58 55 64 72 65 89 56 64 68 56 45 41 60 50 73 62 76 71 54 62 86 58 85 58 74 57 70 82 53 75 73

Para analisar os dados expostos, a primeira coisa que deve ser feita a definir em quantas classes vamos organizar a amostra, que obtida atravs da raiz quadrada do nmero de valores da amostra. Como 40 6,4 e a escolha das 6 classes levaria a baixa freqncia na maior parte delas, optamos por trabalhar com 5 classes de idades. A amplitude de cada classe ser igual a:
h= 89 41 = 9,6 10 anos 5

A tabela contendo a distribuio de freqncia por classe de valores ser da forma:


Classes de Idades (anos) 40 -| 50 50 -| 60 60 -| 70 70 -| 80 80 -| 90 TOTAL Freqncia 4 11 9 10 6 40

De acordo com a notao utilizada, as classes incluem o limite superior, mas no incluem o limite inferior de cada classe. 1.2 Medidas Estatsticas O conhecimento de uma populao, ou de uma amostra , por extenso, o conhecimento dos parmetros, ou medidas estatsticas, associados a essa populao, ou amostra. Assim, a representao, ou caracterizao, de uma srie de dados quantitativos por uns poucos parmetros permite um conhecimento razovel da populao ou amostra. Geralmente, so utilizados trs tipos de medidas estatsticas: Medidas de posio: mdia, separatrizes e moda. Posicionam a distribuio no eixo da escala da varivel estudada; Medidas de variao: amplitude, desvio mdio, desvio padro e coeficiente de variao. Informam o grau de homogeneidade da distribuio; Medidas de forma: assimetria. Verifica a forma de distribuio e a adequao de outros parmetros. Salomo Neves

Anderson Litaiff

10 UFAM/ FES/ DEA Econometria Ficha I

H que se fazer uma distino entre a notao utilizada para as medidas estatsticas relativas a uma populao e uma amostra. Por conveno, parmetros populacionais so representados por letras gregas, enquanto os parmetros estimados de uma amostra so representados por letras latinas. Assim, a mdia de uma populao representada por e a de uma amostra por X , por exemplo. 1.2.1 Medidas de Posio (Tendncia Central) Representar os valores de uma srie de observaes a respeito de uma varivel no uma tarefa das mais simples. O maior problema prtico decorrente da aplicao do parmetro certo para a distribuio inadequada. Por exemplo, a renda per capita de um pas mede a riqueza produzida pelo pas, num perodo, dividida pelo tamanho da populao nesse perodo, fornecendo uma idia de riqueza mdia dessa populao. No entanto, quando o grau de concentrao dessa riqueza no informado, pode-se ter uma idia errada da riqueza individual para os pases com elevada concentrao de renda. Concluso: medidas de posio devem, sempre que possvel ser analisadas juntamente com outros tipos de medidas para um conhecimento mais amplo do objeto de interesse. O objetivo das medidas de posio o de fixar a distribuio dos valores no eixo da escala da varivel em termos do seu valor central, posicional e de maior freqncia. Abaixo so apresentadas as trs principais medidas de posio, com suas aplicaes, vantagens e desvantagens. 1.2.1.1 Mdia Aritmtica Uma das medidas estatsticas mais utilizadas na representao de uma distribuio de dados a mdia aritmtica, na sua forma simples, ou ponderada. No primeiro caso, dividimos a soma de todos os valores da srie pelo nmero de observaes, enquanto, no segundo, mais utilizados nas distribuies de freqncias, os valores so ponderados pelas freqncias com que ocorrem e depois divididos pelo total das freqncias. Considere o exemplo das idades das 40 pessoas de uma amostra, conforme representado acima. Como se trata de uma distribuio de freqncias por classes de valores, devemos supor que as observaes de cada classe esto concentradas no ponto mdio de cada classe e esse sero valor considerado no clculo da mdia das idades, conforme abaixo:
Classes de Idades (anos) 40 -| 50 50 -| 60 60 -| 70 70 -| 80 80 -| 90 TOTAL

Ponto Mdio Freqncia (Xi) (fi) 45 55 65 75 85 4 11 9 10 6 40

Xifi 180 605 585 750 510 2630

Anderson Litaiff

Salomo Neves

11 UFAM/ FES/ DEA Econometria Ficha I

A segunda coluna representa o ponto mdio de cada classe, a terceira o nmero de pessoas com idade nas respectivas classes e a ltima coluna o total das idades de cada classe, isto , o produto entre os pontos mdios de cada classe e as respectivas freqncias. Se somarmos as idades de todas as pessoas da amostra encontraremos 2.630 anos. Dividindo esse valor pelo nmero de pessoas na amostra, 40, encontraremos a mdia da amostra igual a 65,75 anos, ou 65 anos e 9 meses. Essa mdia, assim como qualquer medida calculada a partir de uma distribuio de freqncias por classes de valores, no exata. Uma rpida inspeo na distribuio dos valores levar ao clculo da mdia como sendo 66 anos. Esse valor, sim, representa a verdadeira mdia da amostra, por considerar os valores efetivamente observados, sem a assuno de que os valores de cada classe esto concentrados em torno do ponto mdio. Com isso, podemos concluir que, se dispormos dos valores observados, podemos organiz-los e represent-los por meio de uma tabela, mas calculamos as medidas estatsticas diretamente com eles. Se considerarmos uma distribuio de freqncias, podemos calcular a mdia aritmtica por:

X
i =1 m i =1

i i

f
m

para dados populacionais, e


i

X
X =
i =1 m i =1

i i

para dados amostrais,


i

Onde m representa o nmero de classes na populao e na amostra. A mdia representa o centro da distribuio de valores e expressa na mesma unidade das observaes R$, cm, etc. Pela simplicidade e facilidade de clculo e de interpretao, a mdia a medida estatstica mais utilizada para representar uma distribuio de valores muitas vezes, no entanto, sua utilizao precria e no indicada. A principal vantagem da mdia a facilidade de clculo tanto para grupos quanto para subgrupos ou extratos. Como a mdia influenciada por valores extremos da distribuio, ela s deve ser utilizada em distribuies simetrias ou levemente assimtricas e em distribuies no heterogneas. Sua aplicao nesses dois casos precria e de pouca utilidade, pois perde sentido prtico e capacidade de representar a distribuio que a originou. Tambm nos casos de distribuies em que o fenmeno tem uma evoluo no linear, como as sries de valores financeiros no tempo, de acordo com uma capitalizao composta, a mdia mais recomendada seria a geomtrica. Finalmente, Anderson Litaiff Salomo Neves

12 UFAM/ FES/ DEA Econometria Ficha I

no se recomenda a aplicao da mdia aritmtica nas sries cujos valores representam relaes recprocas, como por exemplo velocidades, expressas pela relao entre espao e tempo. Nesse ltimo caso, recomenda-se a utilizao da mdia harmnica. 1.2.1.2 Mediana O que fazer quando a mdia aritmtica no puder ser utilizada face ao alto grau de heterogeneidade da distribuio, ou por sua assimetria elevada devido a existncia de valores afastados da distribuio? Pense nas taxas de retorno de portfolios diferentes, ou dos valores obtidos em uma pesquisa de salrios para um cargo em particular. Ainda assim, podemos representar uma distribuio por uma medida menos sensvel a valores extremos. o caso da mediana, medida que divide a distribuio de valores em duas partes iguais: 50% acima e 50% abaixo do seu valor. Como a mdia, a mediana expressa na mesma unidade de observaes R$, cm, etc. Ao contrrio da mdia, no entanto, o seu tratamento algbrico no to amigvel. Como definida,essa medida no influenciada pelos valores observados, mas pela freqncia com que os valores ocorrem na distribuio. Ordenada a srie de valores, crescente ou decrescentemente, determina-se a posio dividindo-se o nmero de observaes por 2, que o nmero de partes iguais em que a distribuio ser dividida. O valor mediano ser o da varivel relativa posio encontrada. Caso a srie tenha um nmero par de observaes, a mediana ser a mdia dos 2 termos centrais. De volta distribuio de idades, ordenando os valores de modo crescente, no sentido horizontal, teramos a nova distribuio:
41 58 65 74 45 58 65 75 49 58 68 76 50 58 70 78 53 60 71 82 54 62 71 83 55 62 72 85 56 64 73 86 56 64 73 86 57 64 74 89

Como a srie tem um nmero par de observaes, 40, h dois termos centrais, o vigsimo e o vigsimo primeiro, cujos valores so 64 e 65, respectivamente. Identificados os termos centrais, a mediana ser a mdia desses termos centrais, ou seja:
Md =

64 + 65 = 64,5 anos 2

Caso a srie tivesse um nmero mpar de observaes, teramos apenas um termo central e a mediana seria o valor referente a esse termo central. 1.2.1.3 Moda o valor, ou classe de valores, de maior freqncia na distribuio. Sua importncia ressaltar o valor, ou classe, dominante na distribuio. Como funo da Anderson Litaiff Salomo Neves

13 UFAM/ FES/ DEA Econometria Ficha I

freqncia, sua aplicao no depende do nvel de mensurao da varivel, sendo aplicada tanto a fenmenos qualitativos quanto quantitativos. Uma distribuio pode ser amodal, quando no existir uma valor dominante, ou bimodal, trimodal, etc. medida que a distribuio apresente duas, trs, ou mais valores modais. No h clculo envolvido na determinao da moda, porm sua aplicao mais restrita do que os parmetros anteriores. Como a mediana, seu valor no influenciado pela existncia de valores extremos na distribuio. A idade de 58 anos aquela que aparece o maior nmero de vezes sendo, portanto a idade modal. De acordo com a tabela de freqncia e classe modal a segunda, ou seja, aquela cujas idades variam entre 50 e 60 anos, com 11 pessoas nela posicionadas. 1.2.1.4 Exemplo de aplicao Considere a distribuio do nmero de horas semanais de estudo de uma amostra de 15 alunos deste curso, conforme a srie: 15, 20, 18, 16, 18, 21, 19, 10, 14, 18, 17, 20, 18, 15, 16. A mdia da amostra expressa por:

X
X =
i =1

40

fi =

15

15 + 20 + 18 + K + 16 = 17 horas semanais 15

Ordenando os valores de modo crescente e considerando que a srie tem nmero mpar de observaes, a mediana ser o nmero de horas estudadas pelo 8 aluno que mais estuda: M d = 18 horas A quantidade de horas estudadas de maior freqncia, ou modal, de 18 horas. Quatro pessoas na amostra estudam 18 horas por semana ( M o = 18 ), que faz dela o valor dominante modal da srie. Os valores das medidas estatsticas permitem antecipar a forma da distribuio do ponto de vista de sua assimetria. De um modo geral, quando X > M d > M o , dizemos que a distribuio assimtrica direita (ou positivamente assimtrica). Quando X < M d < M o , a distribuio dita assimtrica esquerda (ou negativamente assimtrica), que o caso do exemplo acima. 1.2.2 Medidas de Variao As medidas de posio se propem a representar uma distribuio de valores, como j mencionamos. Permitem, tambm, a comparao de distribuies acerca do Anderson Litaiff Salomo Neves

14 UFAM/ FES/ DEA Econometria Ficha I

mesmo fenmeno em locais ou perodos diferentes como, por exemplo, a comparao entre as expectativas de vida das populaes dos pases nos cinco continentes. Alm disso, a mdia aritmtica uma medida de representao quando a distribuio for simtrica e no heterognea. Mas o que entendemos por distribuio heterognea? Quando uma distribuio dita homognea? Relatrios financeiros utilizam o termo volatilidade. O que isso representa? Essas e outras questes so respondidas luz das medidas de variao. As medidas de variao constituem importante instrumento para avaliar a amplitude com que as observaes variam e como os valores esto distribudos em torno de algum valor-critrio. Elas podem ser de carter absoluto ou relativo percentual , como apresentadas a seguir. 1.2.2.1 Medidas Absolutas de Variao As medidas absolutas de variao so expressas na mesma unidade da varivel, ou alguma funo dela. As principais so: Amplitude da Distribuio A amplitude da distribuio a diferena entre o maior e o menor valor da distribuio, ou seja:
H = X x,

Onde X o maior e x o menor valor da distribuio. Apesar de fornecer uma idia do espectro de variao dos dados, essa medida pobre, pois s considera dois de seus valores, deixando de informar como os demais valores esto distribudos. Com essa medida, podemos avaliar apenas qual extremo est influenciando mais a mdia, por exemplo. Observando a distribuio ordenada das idades das pessoas na amostra, notamos que a menor idade foi 41 e a maior 89 anos, logo as idades tiveram uma amplitude de variao na ordem de 48 anos. Desvio Mdio Para suprir as deficincias da amplitude da distribuio, necessrio definirmos uma medida de variao no s incorpore todas as observaes mas tambm mea como essas observaes esto dispostas em relao a um valor-critrio. Estabeleceu-se como valor-critrio a mdia da distribuio. Como a soma dos afastamentos das observaes em relao mdia nula a mdia o valor central da distribuio , tornou-se a mdia dos valores absolutos dos desvios das observaes em relao mdia da distribuio, ou seja:

Anderson Litaiff

Salomo Neves

15 UFAM/ FES/ DEA Econometria Ficha I

| X
=
i =1

| . fi
para a populao e
i

f
i =1

| X
DM =
i =1

i m

X | . fi
para a amostra.
i

f
i =1

Note que, para o clculo do desvio mdio da populao, usamos a mdia da populao, , enquanto, para a amostra, usamos a mdia da amostra, X . De volta ao exemplo das idades, calculamos o desvio mdio das idades utilizando a distribuio das freqncias como planilha de clculo, de acordo com o quadro abaixo:
Classes de Idades (anos) 40 -| 50 50 -| 60 60 -| 70 70 -| 80 80 -| 90 TOTAL Ponto Mdio Freqncia (Xi) (fi) 45 55 65 75 85 4 11 9 10 6 40 |Xi-66| 21 11 1 9 19 |Xi-66|fi 84 121 9 90 114 418

Aplicando a frmula acima encontramos DM = Varincia

418 = 10,45 anos. 40

Embora o desvio mdio seja uma medida melhor do que a amplitude da distribuio, por utilizar todos os valores da distribuio, ainda no uma medida ideal, pois no discrimina os pequenos dos grandes afastamentos em relao mdia. Se, para eliminar o problema, dos sinais, ao invs de considerarmos os valores absolutos, elevarmos os afastamentos ao quadrado, estaremos no apenas eliminando o problema dos sinais como tambm potencializando os afastamentos, enfatizando penalizando os grandes desvios em relao s observaes mais prximas da mdia. Como resultado, definimos a medida de variao, denominada varincia, como:

2 =

(X
i =1

)2 . fi N
para a populao e

Anderson Litaiff

Salomo Neves

16 UFAM/ FES/ DEA Econometria Ficha I

S2 =

(X
i =1

X )2 . fi
para a amostra.

n 1

A razo de termos (n 1) no denominador da varincia da amostra est relacionada ao processo de estimao de parmetros de uma populao por dados amostrais. Embora a varincia represente um passo frente em relao s mediadas de variao anteriormente apresentadas, ela padece de um problema complicado: sua unidade de medida do fenmeno, elevada ao quadrado. Avaliar uma medida quadrtica no uma tarefa das mais simples, certo?
Classes de Idades (anos) 40 -| 50 50 -| 60 60 -| 70 70 -| 80 80 -| 90 TOTAL Ponto Mdio Freqncia (Xi) (fi) 45 55 65 75 85 4 11 9 10 6 40 (Xi-66) 441 121 1 81 361
2

(Xi-66) fi 1764 1331 9 810 2166 6080

Aplicando a frmula da varincia da amostra obtemos S 2 =

6080 = 155,9 anos2. O 39 julgamento da ordem de grandeza desse nmero fica prejudicado porque ele representa uma medida quadrtica.

Desvio Padro Para manter as mesmas propriedades da varincia e restituir a unidade de medida do fenmeno, expressa pela varivel X, devemos extrair a raiz quadrada da varincia. Definimos, ento, a medida de disperso dos dados em relao mdia da distribuio como o desvio padro.

(X
i =1 m

)2 . fi N

para a populao e

(X
S=
i =1

X )2 . fi

n 1

para a amostra.

No exemplo das idades, extraindo a raiz quadrada da varincia obtemos S = 155,9 = 12,5 anos. Restitumos, ento, a mesma unidade de medida da varivel estudada anos. Note que o desvio padro maior do que o desvio mdio. Isso decorrente do fato do desvio padro dar maior nfase aos valores mais afastados da mdia potencializando-os. Anderson Litaiff Salomo Neves

17
UFAM/ FES/ DEA Econometria Ficha I

O nico problema do desvio padro a dificuldade de se avaliar a sua ordem de grandeza, ou seja, julgar se um valor do desvio padro calculado para uma distribuio elevado ou baixo. A alternativa trabalhar com medidas relativas de variao. 1.2.2.2 Medida Relativa de Variao Medidas absolutas, via de regra, face dificuldade de se estabelecer uma base de comparao que permita concluir sobre a ordem de grandeza na medida obtida. Por exemplo, at que ponto podemos dizer que 144 anos2 exprime uma grande variao das idades? Como vimos, a varincia uma medida quadrtica, o que torna a sua ordem de grandeza difcil de ser avaliada. Tudo bem, extramos a sua raiz quadrada. Ser que 12 anos pode ser considerada uma alta disperso das idades em torno da mdia? A amostra heterognea em relao a idade mdia de seus membros? Por que, numa distribuio, uma disperso igual a 12 baixa e, em outra, alta? Como comparar disperses oriundas de distribuies com mdias diferentes? Como se v, a medida absoluta de disperso dos dados tem limitaes no tocante s concluses. Principalmente na comparao de grupos com mdias diferentes. Como o desvio padro varia com a ordem de grandeza da mdia, comparar grupos, quanto sua variao, quando as respectivas mdias so diferentes, no pode ser feito com os desvios padres. Surge, ento, a medida relativa, adimensional, isto , sem unidade de medida, definida como coeficiente de variao:

para a populao e
S para a amostra X

CV =

O coeficiente de variao mede a percentagem de disperso dos dados em relao mdia, podendo ser expressa em termos decimais ou percentuais multiplicandoo por 100. Dizemos que uma distribuio homognea quando a variabilidade relativa, expressa pelo coeficiente de variao, no ultrapassar 20%. Obviamente, a distribuio no deixa de ser homognea para valores acima de 20%, mas vai perdendo grau de homogeneidade na medida em que o coeficiente aumenta.
12,5 = 0,19 ou 19%, dentro dos limites 66 de homogeneidade estabelecidos por essa medida.

O coeficiente de variao das idades CV =

1.2.2.3 Exemplo de Aplicao Considere, ainda, a distribuio das horas de estudo dos 15 alunos deste curso apresentada no item 1.2.1.4. Identificamos quantas horas o aluno que menos estudou na amostra como sendo 10 horas e 21 horas o que mais estudou, isto , a amostra apresentou intervalo de variao de 11 horas.

Anderson Litaiff

Salomo Neves

18
UFAM/ FES/ DEA Econometria Ficha I

Calculando a mdia dos desvios absolutos das observaes em relao mdia de 17 horas da distribuio, pelo desvio mdio da amostra, obtemos:

| X
DM =
i =1

40

17 | = 2,13 horas.

15

O desvio padro da amostra, expresso como a raiz quadrada da varincia, igual a:

S = S2 =

(X
i =1

40

17) 2 = 7,86 = 2,8 horas

14

Note que difcil tomarmos o desvio padro para classificarmos a distribuio quanto ao seu grau de homogeneidade. Como a mdia da amostra igual a 17 horas, a variao relativa, expressa pelo coeficiente de variao da amostra igual a:
CV = S 2,8 = = 0,16 , ou 16%. X 17

Como o coeficiente de variao inferior a 20%, podemos concluir que a amostra homognea em relao s horas de estudo dos alunos. 1.2.3 Medidas de Assimetria Sabemos que a mdia uma medida estatstica de representao de uma distribuio, mas sua distribuio est sujeita a algumas caractersticas dessa distribuio. Uma dessas caractersticas o baixo grau de assimetria de distribuio. Para verificarmos o tipo e o grau de assimetria da distribuio, utilizamos a medida estatstica adimensional denominada coeficiente de assimetria, definido como:

(X
i =1 n

)3
para populao e

N 3

(X
CA =
i =1

X )3
para a amostra

nS 3

Quando esse coeficiente positivo, dizemos que a distribuio tem assimetria positiva, ou direita, isto , h algumas poucas observaes mais elevadas direita da mdia. Quando assume valor negativo, a assimetria negativa, ou assimtrica negativa, com algumas observaes mais afastadas esquerda da mdia. Quando o valor desse coeficiente se aproxima de zero, dizemos que a distribuio tende a simetria, o que faz com que os valores das medidas de posio se igualem.

Anderson Litaiff

Salomo Neves

19
UFAM/ FES/ DEA Econometria Ficha I

No exemplo das idades, o coeficiente de assimetria igual ao 0,08 ou 8% , indicando que a distribuio das idades na amostra pode ser considerada simtrica ou levemente assimtrica direita. 1.2.4 Outras Medidas Descritivas Muitas vezes torna-se necessrio complementar a informao de uma distribuio com outras medidas que possam descreve-la melhor. Podemos, tambm, estar diante de problemas que exijam outros tipos de tratamento como, por exemplo, escolher os 10% dos alunos mais adiantados, ou dos 25% dos melhores candidatos a um cargo. A exemplo da mediana, que separa metade da distribuio acima e metade abaixo do seu valor, podemos fazer cortes com base em separatrizes, definidas como medidas que dividem a distribuio em partes iguais. Um tipo conhecido de separatriz so os percentis, que dividem uma distribuio em 100 partes iguais. Note que, como definida, a mediana o percentil de ordem 50 ou 50 percentil em uma distribuio ordenada de valores. Outros casos particulares de percentis so, por exemplo, os quartis definidos como as separatrizes que cortam a distribuio em quatro partes iguais , 25% (Q1), 50%(Q2 ou Md) e 75%(Q3) , e os decis que dividem a distribuio em dez partes iguais D1 a D9. Resumindo, para dividir uma distribuio em K partes iguais definimos (K 1) separatrizes. A tabela abaixo fornece um resumo das principais medidas que descrevem a distribuio das idades das 40 pessoas que compem a amostra fornecida no item 1.1. Para a elaborao da tabela foi utilizado o Microsoft Excel.
Estatstica Descritiva Mdia Erro padro Mediana Modo (moda) Desvio padro Varincia da amostra Curtose Assimetria Intervalo (amplitude) Mnimo Mximo Soma Contagem (observaes (n)) Nvel de confiana(95,0%) 66 1,887203874 64,5 58 11,9357253 142,4615385 0,629280346 0,086382124 48 41 89 2640 40 3,817230104

Anderson Litaiff

Salomo Neves

20
UFAM/ FES/ DEA Econometria Ficha I

No que se refere aos dados para os percentis da amostra, os resultados foram os seguintes:
percentil 10 25 50 75 90 valores 52,7 57,75 64,5 74 83,2

Analise as medidas acima e tire concluses acerca da distribuio. 1.3 Representao Grfica As variveis quantitativas, ao contrrio das qualitativas, devido ao fato de possurem uma escala com origem e unidade fixas ou no , permitem representao grfica com maior grau de informao sobre a distribuio de seus valores. A definio da melhor forma de representar a distribuio de uma varivel quantitativa depende do tipo da srie estudada temporal, geogrfica ou especificativa. Sries temporais so representadas por grficos de linha que permitem a visualizao da tendncia do fenmeno no tempo, este localizado no eixo das abscissas. Sries geogrficas so representadas por barras ou blocos que permitem identificar as localizaes onde o fenmeno estudado atua com mais intensidade. As demais distribuies podem ser representadas por dois tipos principais de grficos: Histogramas e Box Plots. 1.3.1 Histograma Histograma um grfico de barras justapostas contendo as classes de valores na abscissa e as freqncias, absolutas ou relativas nas ordenadas, centradas nos pontos mdios das classes. Quando os intervalos de classes da varivel no so constantes, a rea da barra deve ser proporcional freqncia da classe. Nesse caso, devemos dividir a freqncia de cada classe pela amplitude da respectiva classe. Considere o histograma construdo para os dados das idades do exemplo do item 1.1. Note que, pela linha unindo as barras do histograma, tambm denominada poligonal caracterstica, a distribuio, embora no simtrica, guarda uma moderada simetria em relao aos valores centrais. A linha poligonal caracterstica desempenha um papel importante na identificao da simetria dos dados. No exemplo, notamos que ela mostra uma forma levemente assimtrica, como as medidas descritivas j haviam antecipado.

Anderson Litaiff

Salomo Neves

21
UFAM/ FES/ DEA Econometria Ficha I

Segue abaixo o grfico do histograma elaborado com o Software Minitab 14.2


Histogram of Idade (anos)
Normal 7 6 5 Frequency 4 3 2 1 0
Mean StDev N 66 11,94 40

40

50

60 70 Idade (anos)

80

90

1.3.2 Box Plot O diagrama de Box Plot uma forma de representar graficamente os dados da distribuio de uma varivel quantitativa em funo de seus parmetros descritivos. O grfico abaixo representa o Box Plot para os dados das idades da amostra do item 1.1. Na sua construo, so considerados os quartis e os limites da distribuio, permitindo uma visualizao do posicionamento da distribuio na escala da varivel. Para melhor compreenso deste grfico, note que a escala de medida da varivel encontra-se na linha vertical do quadrado onde est inserido o grfico. Na caixa retangular vertical do grfico, so fornecidos os quartis Q1 na parte inferior, e Q3 na parte superior da caixa. Entre eles, encontra-se a mediana da distribuio. Alguns Box Plots apresentam, ainda, a mdia dentro da caixa. Observe que 50% da distribuio tm valores dentro da caixa. As linhas verticais que saem da caixa terminam nos limites inferior, x, e superior, X, da distribuio quando esses valores estiverem a uma distancia inferior a 1,5 desvio quartlico dos respectivos quartis. Entre esses limites, encontram-se os valores considerados tpicos da distribuio. Define-se como desvio quartlico a distncia entre o 1 e o 3 quartil:
d q = Q3 Q1

Observaes com afastamento superior a 1,5 desvio quartlico acima do 3 quartil ou abaixo do 1 quartil so consideradas atpicas, ou possivelmente outliers, aparecendo no grfico como asteriscos. Nesse caso, ao invs dos limites da distribuio, estes so substitudos no Box Plot pelo valor:

Anderson Litaiff

Salomo Neves

22
UFAM/ FES/ DEA Econometria Ficha I

Q3 + 1,5d q limite terico superior se houver valor atpico superior;

Ou
Q1 1,5d q limite terico inferior se houver valor atpico inferior.

Quanto maior for o valor do desvio quartlico, maior a variabilidade da distribuio, e quanto mais prxima a caixa estiver de um dos extremos, maior a evidncia sobre a assimetria da distribuio.
Boxplot of Idade (anos)
90

X At 1,5dq Q3

80

Idade (anos)

70

Md
60

dq

Q1 At 1,5dq x

50

40

Os Box Plots so de grande utilidade tambm quando uma varivel quantitativa analisada luz das categorias de uma varivel qualitativa, como, por exemplo, a distribuio de salrios para cada categoria da varivel formao educacional, esta medida pelo ltimo nvel de instruo completo das unidades observveis sem formao, nvel fundamental, nvel mdio, nvel superior e ps-graduao.

Anderson Litaiff

Salomo Neves

UFAM/ FES/ DEA Captulo 2: Correlao

Econometria

Ficha II

Considere a tabela abaixo, contendo os dados oriundos de uma amostra constituda de 10 empresas. Foram levantados os valores gastos em propaganda (X) e os volumes de vendas (Y), ambas em R$1.000, durante um ms.
Propaganda (X) Vendas (Y) 25 75 27 89 24 70 28 82 23 70 26 85 30 84 28 80 26 78 23 67

Podemos dispor esses dados em um grfico denominado Diagrama de Disperso, conforme abaixo:
Diagrama de Disperso
90

85

Volume de Vendas (R$ 1.000)

80

75

70

65

60 22 24 26 28 30 32

Gastos em propaganda (R$ 1.000)

Pelos pontos dispostos nesse grfico, percebemos que existe um certo padro de comportamento envolvendo essas duas variveis. Mais ainda, podemos dizer que h uma associao positiva entre elas, no sentido que, para uma variao de uma unidade numa varivel, digamos gastos em propaganda, corresponder uma variao no mesmo sentido de outra varivel, volume de vendas. Em outras palavras, quanto mais uma firma gasta em propaganda, maior ser o volume de vendas. Pode-se tambm em princpio, antecipar que a relao aproximadamente Anderson Litaiff Salomo Neves

24
UFAM/ FES/ DEA Econometria Ficha II

linear, isto , que as variaes correspondentes varivel volume de vendas so constantes para variaes de R$1.000 em gastos em propaganda. A questo que se coloca, ento, saber o quo relacionadas essas variveis esto, isto , o grau de associao entre elas. Para entendermos melhor o processo de obteno desta medida, faamos uma mudana na origem dos dados, definindo um novo sistema coordenado, passando pelo ponto das mdias das medidas de acordo com o grafico abaixo. Note que ao trocarmos de escala de X para x = X X e de Y para y = Y Y , estamos fazendo do ponto ( X ; Y ) a nossa nova origem do plano x0y. Ao fazermos tal transformao, estamos definindo no novo espao quatro quadrantes.
15

10

Gastos em Propaganda (R$ 1.000)

II
5

0 -4 -3 -2 -1 0 1 2 3 4 5

-5

IV
-10

III
-15

Volume de Vendas (R$ 1.000)

Considere agora, o produto x.y ou ( X X ).(Y Y ) na escala anterior. Se somarmos todos esses produtos e dividirmos por (n-1) teremos uma idia do tipo de variao conjunta das duas variveis. Caso o resultado seja positivo, significa que a maior parte dos pontos est concentrada em torno dos quadrantes I e III, ao passo que, se o resultado for negativo a contrao dos pontos estar em torno dos quadrantes II e IV. No primeiro caso, teramos a informao de que a variao conjunta positiva a um aumento de uma unidade em uma das variveis corresponder uma diminuio da outra. Quando houver uma nuvem de pontos distribudos em torno dos quatro quadrantes, a variao conjunta ser aproximadamente zero e dizemos que no h associao relevante entre as variveis.

Anderson Litaiff

Salomo Neves

25
UFAM/ FES/ DEA Econometria Ficha II

Definimos, assim, uma medida de associao que mede como as variveis esto relacionadas, positiva ou negativamente, por meio da medida de variao conjunta ou covarincia:

xy
S XY =
i =1

(X
=
i =1

X ).(Yi Y ) n 1

n 1

Embora tenhamos a informao de como as variveis esto relacionadas, ou o sentido de relao, o resultado dessa medida pouco informativo. A sua ordem ou grandeza depende da unidade utilizada na mensurao das variveis. Se as variveis tivessem sido medidas em Euros, por exemplo, o valor da covarincia iria variar, sem que, necessariamente, o grau da associao entre as variveis se alterasse. Para evitarmos esse problema e fixarmos uma medida do grau de relao entre as variveis, trabalhamos com as variveis na forma padronizada, definindo uma medida adimensional, relativa, da associao entre elas o coeficiente de correlao linear de Pearson. De acordo com o estabelecido acima, esse coeficiente expresso na seguinte forma:

(X
rXY =
Ou simplesmente
i =1

X ).(Yi Y )

(n 1) S X SY

rXY =

x y x y
i i 2 i

2 i

Conclumos, ento, que o coeficiente de correlao nada mais do que a covarincia entre as variveis, quando essas so expressas na forma padronizada. Seu intervalo de variao [-1; 1]. Tal como a covarincia, quando positiva, a correlao indica que as variveis so diretamente relacionadas e, quando negativa, que as variveis so inversamente relacionadas. Usualmente, dizemos que a correlao forte quando seu valor absoluto for de pelo menos 80%. Uma observao importante: o coeficiente de correlao mede o grau de associao linear entre as variveis, portanto, caso seu valor esteja prximo de zero, no significa, necessariamente, ausncia da relao. Simplesmente as variveis no so linearmente associadas, podendo estar associadas de modo curvilneo, por exemplo. Outra observao que as formulas acima fornecem a covarincia e o coeficiente de correlao para os dados amostrais. Caso os dados sejam oriundos de uma populao deve-se utilizar N ao invs de (n-1) no denominador e tambm as mdias sero as da populao. A notao do coeficiente de correlao da populao a letra grega (rho). Anderson Litaiff Salomo Neves

26
UFAM/ FES/ DEA Econometria Ficha II

Considerando o exemplo da distribuio dos gastos em propaganda e o volume de vendas, temos, inicialmente, as estatsticas descritivas:
Variaveis (R$ 1.000) Propaganda Vendas Mdia 26 78 Desvio 2,309 7,333

A matriz das covarincias1 apresenta, na diagonal principal, o valor das varincias de cada varivel e, fora da diagonal, as covarincias entre as varincias. Note que a covarincia de uma varivel com ela mesma nada mais do que a varincia da varivel.
Covarincia Propaganda (X) Vendas (Y) Propaganda (X) 5,3 13,7 Vendas (Y) 13,7 53,8

A matriz das correlaes apresenta a unidade na diagonal principal, porque a correlao de uma varivel com ela mesma de 1,000. Fora da diagonal, apresenta a correlao entre as variveis. Nos dois casos, covarincia e correlao, as matrizes so simtricas, obviamente.
Correlao Propaganda (X) Vendas (Y) Propaganda (X) 1 Vendas (Y) 0,807 1

Conclumos, no nosso exemplo, que as idades e os pesos so fortemente e diretamente relacionados, pois a correlao de aproximadamente 81%.

A matriz das covarincias calcula um resultado aproximado desse quando calculada no Microsoft Excel, dado o fato de este programa calcular a covarincia como se fosse para uma populao, atravs da frmula Cov( X ,Y ) = 1 n ( X )(Y ) , obtendo o seguinte resultado:
1

i =1

Propaganda (X) Vendas (Y)

Propaganda (X) Vendas (Y) 4,8 12,3 48,4

Anderson Litaiff

Salomo Neves

UFAM/ FES/ DEA

Econometria

Ficha III

Capitulo 3: O Modelo Linear a Duas Variveis (Regresso Linear Simples) Conceitualmente, um modelo pode ser caracterizado como uma representao terica da realidade que se deseja investigar. Os modelos podem ser classificados de vrias maneiras, dependendo da rea do estudo, do nmero de variveis e de outros fatores. No presente caso, seria importante a distino entre um modelo determinstico e um probabilstico. Um modelo dito determinstico quando expressa uma relao exata entre as variveis que o compem. Seus parmetros so obtidos diretamente por uma transformao ou calculados em funo de outros. Nos modelos determinsticos, os parmetros no so estimados por meio de amostras. Sabemos, por exemplo, que num triangulo-retngulo, o quadrado da hipotenusa obtido pela soma dos quadrados dos catetos. Isto sempre verdadeiro, independente das dimenses d tringulo. Outro exemplo de um modelo determinstico fornecido pela teoria das medidas, que nos permite transformar uma medida expressa em graus Fahrenheit para graus Celsius pela relao:
C=
5 180 F 9 9

Geralmente, o grau de certeza que depositamos nas relaes expressas por modelos determinsticos denominado certeza lgica. Um modelo dito probabilstico quando seus parmetros so estimados com base em informaes amostrais e inferidos na populao de interesse. medida que cada amostra nos levar a estimativas diferentes, haver sempre uma flutuao entre o valor do parmetro estimado na amostra e o verdadeiro, mas desconhecido, valor do parmetro na populao. A esta flutuao, chamamos erro amostral que, por ser no to observvel, impe uma srie de premissas. Logo, um modelo probabilstico constitudo de duas parcelas: uma determinstica, que expressa a forma analtica da relao entre as variveis; e outra aleatria probabilstica , que expressa a diferena entre o valor observado da varivel explicada na amostra e seu verdadeiro valor na populao. Ao contrrio dos modelos determinsticos, que so sempre verdadeiros, os modelos probabilsticos podem ter a sua veracidade testada antes de utilizados o grau de certeza que depositamos nas inferncias feitas com base nesses modelos denominado certeza probabilstica ou certeza estatstica. Como exemplo de um modelo probabilstico, suponha que uma fbrica produza peas de reposio e aloca a mo de obra mensalmente no processo de produo, de acordo com a demanda deste produto. O total de pecas produzido em um ms pode ser estimado se tivermos uma srie de observaes (Xi, Yi), onde Xi representa o quantitativo de mo de obra alocada no ms i (varivel independente), e Yi o total de pecas produzidas naquele ms i (varivel dependente). O quadro abaixo apresenta uma amostra de 10 meses de observaes. Ao plotarmos os pontos num diagrama de disperso, teremos uma idia preliminar do tipo de relao funcional existente entre as variveis, assim como fizemos quando avaliamos a associao entre as variveis no captulo anterior.

Anderson Litaiff

Salomo Neves

28
UFAM/ FES/ DEA Econometria
Peas (1.000) 51 68 72 89 108 125 130 135 150 170 Mao de Obra (Homens-Hora) 20 30 30 40 50 60 60 60 70 80

Ficha III

Ms 1 2 3 4 5 6 7 8 9 10

De acordo com os dados acima, construmos um diagrama de disperso conforme o grfico abaixo para melhor visualizar o padro da relao entre as variveis. Segundo o grfico, podemos concluir que existe, efetivamente, uma relao positiva entre a mo de obra alocada e a quantidade de pecas produzidas, como se era de esperar. Traando uma linha vertical e horizontal pelas mdias das variveis, notamos que todos os pontos esto concentrados nos quadrantes I e III, confirmando essa concluso.
Ttulo do grfico y Y
80

60

40

20

Peas (1.000)

x
0 -40 -30 -20 -10 -20 0 10 20 30 40

-40

-60

-80

Mo de Obra (homens-hora)

Se houver um padro de comportamento entre as duas variveis, ser razovel tentar ajustar o conjunto de pontos observados a uma funo matemtica f(x) que possibilite fazer projees sobre uma delas, Y, em funo de valores observados da outra, X. Nesse caso, estaremos querendo conhecer a quantidade de pecas produzidas em funo da quantidade de homens-hora alocada ao processo. Para isso, assumindo um padro de relao linear entre as variveis, fazemos passar uma reta que aponte a tendncia do comportamento expresso pelos pontos (X, Y) observados. Essa reta fornece os valores estimados, Y , da varivel dependente, Anderson Litaiff Salomo Neves
^

29
UFAM/ FES/ DEA Econometria Ficha III

quantidade de peas produzidas, para diferentes valores da varivel independente, mo de obra. Note que a reta no passa por todos os lados, seno por alguns, logo podemos expressar cada valor observado Y como a soma de duas parcelas: uma fornecida pela reta, Y , e outra relativa a um resduo, definido pela distncia vertical entre o ponto Y e a reta Y para cada valor X, na amostra. Ento, definidas as variveis que sero o ponto da nossa investigao, e antecipada a forma linear da relao entre elas, postulamos, matematicamente, o modelo de regresso linear simples para a populao como:
^ ^

Y = 0 + 1 X + ,
Onde:

Y o vetor contendo as observaes da varivel explicada na populao; X o vetor contendo as observaes da varivel explicativa na populao; 0 o coeficiente linear do modelo, na populao; 1 o coeficiente angular do modelo na populao; o vetor n-dimensional relativo ao erro amostral de cada observao na populao.

O coeficiente linear, ou intercepto, 0 entendido como o valor da varivel explicada quando a varivel explicativa for igual a zero e expressa na mesma unidade de medida de Y. no caso presente, como Y est expresso em 1.000 peas, ento 0 fornece a quantidade de milheiros de peas produzidas quando nenhuma mo de obra alocada. O coeficiente angular, ou inclinao, 1 fornece a variao em Y para uma unidade de variao em X, sendo expresso na unidade de Y sobre a de X. Assim, no nosso exemplo, a inclinao 1 fornece a quantidade de peas que sero produzidas para cada homem-hora a mais alocado ao processo (1.000 peas por homem-hora). O erro amostral uma varivel aleatria no observvel e estimado pelos resduos, isto , a diferena entre o valor observado Y e o valor estimado pela reta,

Y , para cada valor observado de X na amostra. A incluso desse termo no modelo pode ser justificada por:
1. Erros na mensurao das variveis; 2. No incluso de variveis relevantes para explicar o comportamento de Y; 3. Problema na especificao da forma linear relao funcional entre X e Y. Consequentemente conclui-se que o modelo linear composto por dois componentes:

Determinstico: 0 + 1 X ; Probabilstico: erro aleatrio

Anderson Litaiff

Salomo Neves

30
UFAM/ FES/ DEA Econometria Ficha III

O que ir ditar a forma da relao funcional envolvendo as variveis X e Y a da forma da distribuio dos pontos no diagrama de disperso. Como no trabalhamos com os valores da populao, mas com os dados da amostra, precisamos estimar os coeficientes linear e angular da reta e, com base nos resultados, podemos avaliar a acuidade, ou grau de ajustamento, da reta estimada aos dados observados na amostra. Estimadores de Mnimos Quadrados Como o modelo apresentado refere-se aos dados da populao, e como os dados com que trabalhamos so, invariavelmente, oriundos de uma amostra, a questo agora se resume em estabelecer um critrio para estimar os parmetros da reta. Sabemos que uma reta fica perfeitamente caracterizada quando conhecemos seus coeficientes (linear e angular). No caso, temos trs parmetros para estimarmos os dois coeficientes e a varincia dos erros, 2 . Temos definido acima o conceito de erro, para os dados da populao, e mencionamos que estimamos esses valores pelos resduos, definidos como a diferena entre os dados observados, Y, na amostra, e os estimados pela reta, Y = b0 + b1 X . Para estimar os parmetros da populao, 0 e 1, precisamos definir um critrio. O critrio dos mnimos quadrados permite a estimao daqueles parmetros por meio da minimizao da soma dos valores residuais de todas as observaes da amostra, elevados ao quadrado. Isto equivale a dizer:
min ei2 = min (Yi Y i ) 2 = min (Yi b0 b1 X ) 2 .
i =1 i =1 i =1 n n ^ n
^

Estimando os coeficientes da reta e a varincia dos erros por esse mtodo, obtemos a melhor reta que pode ser obtida para explicar a tendncia na relao entre as duas variveis e a varincia dos erros. Como resultado da minimizao acima, chegamos s equaes normais da reta:

Y = b0 + b1 X
Onde

b1

xy , para = x
1 2 1

x = ( X X ) e y = (Y Y )

Alm disso, 2 = S2 = residual.

(Yi Yi )2
i

n2

estima a varincia dos erros pela varincia

Anderson Litaiff

Salomo Neves

31
UFAM/ FES/ DEA Econometria Ficha III

Esses valores so fornecidos pelos pacotes estatsticos e pelo Excel, de modo que no h necessidade de guardarmos as frmulas para clculos mo. No entanto, em uma rpida observao na primeira equao normal, notamos que um ponto particular pertence reta: o ponto constitudo pelas mdias das variveis, ( X , Y ) . Como mencionado anteriormente, esse ponto no precisa ser, necessariamente, observado, embora no exemplo das peas produzidas e mo de obra alocada no ponto (50, 110), observado por uma firma, pertena reta. O grfico permite tambm uma visualizao deste fato. Utilizando a opo regresso, da ferramenta anlise de dados, o Excel fornece os valores do coeficiente intercepto (b0 = 10,1) e o da inclinao, referente varivel mo de obra (b1 = 2,0), com uma casa decimal. A interpretao desses coeficientes que, caso nenhuma mo de obra seja alocada ao processo de fabricao das pecas, seriam produzidas 10,1 mil peas, o que carece de sentido, e que para cada homem-hora adicional alocado no processo de produo, seriam produzidas 2 mil peas. A falta de sentido do intercepto resultante do problema da escala com que as variveis foram obtidas. Nenhuma observao prxima de 0 mo de obra foi feita, sendo todos os valores referentes a esta varivel observados a partir de 35 homens-hora, at mesmo porque no haveria sentido em registrarmos tal observao. Por esse motivo, ns iremos concentrar nossos esforos no teste e interpretao apenas da inclinao. Todos os pacotes estatsticos, incluindo o Excel, resumem os resultados de uma anlise de regresso linear em trs blocos de resultados. No primeiro, feita uma avaliao do grau de ajustamento do modelo como um todo; no segundo, realizado um teste estatstico para avaliar se o modelo realmente linear; finalmente, o terceiro bloco fornece os valores dos coeficientes e seus valores padronizados, pela estatstica t de Student, para testar at que ponto eles so efetivamente diferentes de zero. Como medida profiltica, sugere-se uma anlise dos resduos, para avaliarmos a possvel existncia de alguns valores mais afastados do conjunto de pontos observados, ou outliers. Os resduos so extremamente teis tambm na anlise de plausibilidade das premissas do modelo. Esse tpico, no entanto, no ser coberto neste tpico. Avaliao do Modelo Obter a equao da reta no nos autoriza a utiliz-la para fazer as previses e inferncias que desejamos fazer. Antes, algumas avaliaes devem ser realizadas para termos alguma idia da eficcia e adequao do modelo. Caso nenhuma varivel independente explique as variaes de Y, provavelmente podemos trabalhar apenas com a varivel Y, de modo unidimensional, e resumir todas as observaes de Y pela sua mdia. Dentre as tcnicas utilizadas para avaliar a eficcia do modelo, o coeficiente de correlao seria uma primeira possibilidade. Como ele mede o grau de associao linear entre as variveis, a correlao poderia indicar a adequao da reta aos dados. Quanto maior o valor de r, mais confiana ns teremos no modelo. Outra medida de adequao o coeficiente de determinao do modelo, expresso pelo percentual da variao total de Y que explicada pelo modelo. Para melhor entendimento desse conceito, considere o grfico abaixo:

Anderson Litaiff

Salomo Neves

32
UFAM/ FES/ DEA Econometria Ficha III

Observado (Yi )
No Explicada
^

Reta de Regresso

Total

Pr evisto (Y i )
Explicada

Xi

De acordo com o grfico acima, para um particular valor de X, Xi, podemos associar trs possveis pontos envolvendo valores de Y: o par de valores observados (X, Y); o par com o valor estimado, ou previsto de Y, sobre a reta de regresso (X, Y ); e, finalmente o par com a mdia de Y, (X, Y ). Da mesma forma, definimos trs distncias envolvendo os valores de Y: a distncia total (Y Y ) ; a no explicada pela reta, obtida pelo resduo (Y Y ) ; e a explicada pela reta (Y Y ) . Pode-se provar que a distncia total igual soma entre a no explicada e a explicada, conforme o grfico. Definimos como medida de variao a soma das distncias ao quadrado. Podemos provar que a variao total pode ser desmembrada pela variao no explicada e a explicada, ou seja:
^ ^ ^

(Y Y ) = (Y Y ) + (Y Y )
2 2

A medida de variao total, esquerda do sinal de igualdade, no depende dos valores de X, logo, independentemente da varivel explicativa no modelo, a variao total no se altera. As parcelas direita do sinal de igualdade, no entanto, dependem dos valores de X, que resultaro em Y . Portanto, como a variao total fixa, o modelo ser tanto melhor quanto maior for a variao explicada, o que resulta
^

Anderson Litaiff

Salomo Neves

33
UFAM/ FES/ DEA Econometria Ficha III

em uma menor variao no explicada. Dividindo-se ambos os membros pela variao total, ficamos com:

(Y Y ) 1= (Y Y )

2 2

(Y Y ) + (Y Y )

2 2

A primeira parcela da soma direita do sinal de igualdade expressa o percentual da variao total no explicada pelo modelo, enquanto a segunda parcela a percentagem da variao total que explicada pelo modelo. A esta ltima, damos o nome de coeficiente de determinao, cuja notao r2. Quanto maior for esse coeficiente, melhor ser o modelo, pois maior a capacidade da varivel independente em explicar a variao da varivel dependente. Sendo o quadrado do coeficiente de correlao, o coeficiente de determinao varia entre 0 e 1. Finalmente, uma medida absoluta de avaliao do modelo a raiz quadrada da varincia residual, conhecida como erro padro de estimativa do modelo, S = S2 . Quanto menor for o valor desta medida, melhor ser o modelo. Por ser uma medida absoluta, essa medida deve servir como um parmetro de escolha entre duas possveis variveis independentes, candidatas a explicar Y pelo modelo linear a varivel X que levar ao menor valor de S dever ser a escolhida para explicar Y.

Anderson Litaiff

Salomo Neves

UFAM/ FES/ DEA

Econometria

Ficha IV

Captulo 4: Testes do Modelo: ANOVA e t de Student Como visto no captulo anterior, a variao total da varivel dependente invarivel presena da varivel dependente. Vimos ainda que esta variao pode ser desmembrada entre as variaes explicada e no explicada pelo modelo. Portanto, faz sentido testarmos at que ponto vale a pena a incorporao de X no modelo. Em princpio, bastaria comparar a variao explicada com a no explicada e, se a primeira fosse maior do que a segunda, maior a evidncia da adequao da incorporao da varivel independente, X, no modelo. Esta a idia que est por trs da anlise de varincia: achar a razo entre a variao explicada e a no explicada para ver se ela grande. Intuitivamente, quanto maior essa razo, melhor. Considere a Tabela de ANOVA abaixo. Ela foi extrada do exemplo das peas produzidas em relao mo de obra alocada.
ANOVA Fontes de Variao Regresso Resduo Total gl 1 8 9 SQ 13520,12 63,48 13583,60 MQ 13520,12 7,94 F F de significao 1703,80 1,30684E-10

Na primeira coluna, definimos as trs fontes de variao: a variao total; a no explicada, ou devida aos resduos; e a devida ao modelo, ou explicada. Na segunda coluna, encontramos os graus de liberdade associados a cada fonte de variao. A idia que, cada vez que um parmetro estimado, a fonte de variao perde 1 grau de liberdade, dentre os n (observaes) que constituem o nmero de parcela das variaes. Assim, para a variao total, como precisamos estimar a mdia Y , a variao total fica com (n 1) graus de liberdade. Para os resduos, como so estimados dois parmetros para se obter Y , isto , de a e b, perde-se dois graus de liberdade e fica-se com (n 2). Os graus de liberdade da regresso podem ser obtidos por diferena. As somas dos quadrados na terceira coluna fornecem os valores da decomposio das variaes feitas acima. No seria justo comparar a soma dos quadrados da regresso com a soma dos quadrados dos resduos, pois elas tem graus de liberdade diferentes, portanto, antes de acharmos a razo entre as duas fontes de variao, devemos achar as mdias dos quadrados, de acordo com a coluna 4, dividindo a soma dos quadrados pelos respectivos graus de liberdade. Se a razo entre as mdias dos quadrados calculada, e denominada como F, for muito grande, maior ser a evidencia de que o modelo bom, pois maior ser a participao da regresso sobre os resduos, em mdia. A medida de quo grande fornecida pela ltima coluna, F, de significao. Quanto maior for o valor da razo F, menor ser o valor F de significao. O primeiro est numa escala de valores reais no negativos, enquanto o segundo representa uma medida de probabilidade. Assim, quanto menor for o F de significao, abaixo de 5% por exemplo, maior a nossa crena no modelo. No caso do exemplo acima, o valor do F de significao bem menor do que 5%, logo podemos dizer que o modelo linear deve ser aceito, isto , a varivel X explica a varivel Y de modo significativo.
^

Anderson Litaiff

Salomo Neves

35
UFAM/ FES/ DEA Econometria Ficha IV

Em geral, o que se faz com uma tabela de ANOVA um teste de hipteses:

H 0 : Y = 0 + , contra H 1 : Y = 0 + 1 X + .
A hiptese nula H0 a de que o modelo, no caso expresso pela varivel X, no explica as variaes de Y. A alternativa, ao contrrio, postula a validade do modelo com a varivel independente X explicando Y. Por exemplo: se o valor de significao de F for menor do que 0,05, devemos rejeitar a hiptese nula, concluindo que o modelo explica as variaes de Y. Quando apenas uma varivel explicativa est presente no modelo, testar modelo ser, por extenso, testar a significncia da varivel X no modelo. Alm do teste, a tabela de ANOVA fornece algumas informaes importantes. Se dividirmos a soma dos quadrados da regresso pela soma dos quadrados total, teremos o coeficiente de determinao, r; a mdia dos quadrados dos resduos nada mais dos quadrados dos resduos nada mais dos que a medida de varincia residual S. No nosso exemplo, o coeficiente de determinao do modelo igual a 13.520,12/13.583,60 = 0,995, o que significa que 99,5% da variao total da quantidade de peas produzidas pode ser explicada pela quantidade de homenshora alocados ao processo de produo. A varincia residual de 7,93 peas2 s deve ser analisada para comparar com outra possvel varivel que possa competir com a mo de obra para explicar a variao das quantidades de peas produzidas. De um modo geral, podemos especificar uma tabela de ANOVA da seguinte forma:
Fontes de Variao Regresso Resduos Total Graus de Liberdade 1 (n - 2) (n - 1) Soma dos Quadrados SQReg SQRes SQTot = SQReg + SQRes Quadrado Mdio SQReg/1 SQRes/(n - 2) SQTot/(n - 1) SQReg/[SQRes/(n - 2)] P(F > Fc) Fc Calculado F Significao

Onde

Soma dos quadrados total: SQTot mdia: (Yi Y )


^

variao das observaes em torno da

Soma dos quadrados da regresso (modelo): SQReg variao dos valores estimados em torno da mdia: (Y i Y ) Soma dos quadrados dos resduos (erros) SQRes variao das observaes em torno dos valores estimados: (Yi Yi )
^

. Finalmente, os pacotes estatsticos e o Excel apresentam estatsticas relativas s estimaes dos coeficientes: seus valores, os desvios das suas distribuies de amostragem; os valores da estatstica t; e os valores de significao para o teste da

Anderson Litaiff

Salomo Neves

36
UFAM/ FES/ DEA Econometria Ficha IV

significncia de seus valores. Para o caso do nosso exemplo, o quadro gerado pelo Excel foi:
Interseo - b0 Mao de Obra (Homens-Hora) - b1 Coeficientes 10,1 2,0 Erro padro 2,57 0,048 Stat t 3,921 41,277 valor-P 0,00441 1,31E-10

A primeira coluna especifica o coeficiente, enquanto a segunda fornece os valores estimados pelo mtodo de mnimos quadrados. A terceira coluna apresenta o valor do desvio padro dos coeficientes (caso vrias amostras tivessem sido selecionadas e as estimativas dos coeficientes anotadas, essa medida fornece o nvel de variao das estimativas dos coeficientes). Dividindo o valor do coeficiente pelo erro padro, obtemos o valor da estatstica t, como consta a quarta coluna. A ltima coluna apresenta o valor significncia do teste de cada coeficiente e anlogo ao valor de F de significao do teste da ANOVA: quanto menor for o seu valor em relao ao nvel de significncia do teste, 5% por exemplo, maior a evidncia na rejeio de H0. O teste em questo definido como:

H 0 : = 0 (X no explica Y) H1 : 0 (X explica Y)
Geralmente, estaremos interessados em testar apenas o coeficiente angular do modelo. Caso no se consiga rejeitar H0, concluiremos que a varivel X no significativa ao nvel de significncia com que se trabalha. No modelo de regresso linear simples, este teste mesmo do teste da ANOVA realizado acima. No exemplo, note que o valor-p igual ao F de significao da ANOVA, o que implica que estamos aceitando o modelo, ou a varivel independente, como significativa, com o mesmo grau de certeza. A regra bsica para o teste de hipteses, tanto pela ANOVA como pelo teste t, comparar o valor da significao do teste (F de significao ou valor-p) com o nvel de significncia do teste, 5% geralmente. Caso F de significao (ou valor-p) seja menor que 0,05, rejeitamos H0, caso contrrio, no podemos rejeit-la. No nosso exemplo, como os valores de significao so (bem) menores do que 5%, podemos rejeitar H0 com bastante evidncia em favor do modelo. Testar hipteses com base nos valores de significao sempre mais conveniente do que com os valores da estatstica, pois, ao contrrio desta, aquela dispensa o uso de tabelas de distribuio de probabilidades, como a normal ou a t, pois s depende do nvel de significncia que estabelecido por ns.

Anderson Litaiff

Salomo Neves

UFAM/ FES/ DEA

Econometria

Ficha V

Captulo 5: Anlise dos Resduos e Previso Independentemente da aceitao da adequao do modelo, devemos sempre proceder a uma anlise j conhecida: a possibilidade da existncia de outlier na distribuio. A incluso de dados que no pertencem distribuio sempre uma fonte de rudo ao processo de aceitao do modelo, na medida em que aumenta demasiadamente e de modo esprio a varincia residual. Como resultado, a soma dos quadrados dos resduos fica inflada, aumentando a probabilidade de cometermos um erro ao rejeitarmos o modelo (no rejeitando H0) quando ele verdadeiro. A utilizao de um modelo que passa a prova dos testes de hipteses, mas traz problemas no detectados perigosa e pode levar a concluses nefastas em aplicaes, como por exemplo, nos processos de planejamento estratgico das empresas, nos quais uma previso de vendas baseada em um modelo pode colocar em risco a prpria sade financeira da empresa. O elemento fundamental, tanto para uma investigao da existncia de outlier, como para uma anlise de falta de plausibilidade nas premissas, a anlise dos resduos. por meio dos resduos que descobrimos problemas em um processo de utilizao de um modelo de regresso Avaliao da Existncia de Outlier Consideramos como outlier a observao que se afasta do padro de tendncia dos demais pontos. Para efeito de ilustrao, considere o grfico abaixo:
14 12 10 Y 8 6 4 2 4 6 8 X 10 12 14 16

Note que, se no fosse a ocorrncia da observao afastada, o padro dos pontos indicaria uma relao quase perfeita entre X e Y. com aquela observao, a inclinao aumentou fortemente, influenciado por um ponto acima dos demais. A distncia vertical entre os pontos e a reta, sem a observao, seria praticamente nula, enquanto com a observao passa a ser elevada considerando o padro alterado. Existem varias formas de se identificar um possvel outlier, inclusive testes estatsticos, porm, para efeito deste mdulo, ser indicada a utilizao dos resduos Anderson Litaiff Salomo Neves

38
UFAM/ FES/ DEA Econometria Ficha V

padronizados. Resduos padronizados acima de 2,5, em valor absoluto, j podem ser considerados, em princpio, candidatos a outlier. Devemos procurar as possveis causas da ocorrncia de valores esprios na distribuio. Muitas vezes pode ser simplesmente em erro de digitao, ou at a existncia de algum valor efetivamente observado e que seja o prprio motivo da investigao. A possibilidade de expurgo de uma observao outlier deve ser considerada, porm, a repercusso desse expurgo tambm deve ser avaliada. A distribuio dos resduos padronizados2 das regresses, com e sem o outlier, do grfico acima mostrado abaixo3:
^

Y 7,46 6,77 12,74 7,11 7,81 8,84 6,08 5,39 8,15 6,42 5,73

X 10 8 13 9 11 14 6 4 12 7 5

Y
7,9995 7,0001 9,4986 7,4998 8,4992 9,9983 6,0007 5,0013 8,9989 6,5004 5,5010

Residuo -0,5395 -0,2301 3,2414 -0,3898 -0,6892 -1,1583 0,0793 0,3887 -0,8489 -0,0804 0,2290

Residuo Resduo Resduo padro padrao sem outlier sem outlier -0,4600 -0,1962 2,7637 -0,3323 -0,5876 -0,9876 0,0676 0,3314 -0,7238 -0,0685 0,1952 0,0004 0,0012 -0,0042 0,005 -0,0012 0,002 0,0028 -0,0004 -0,0034 -0,0026 0,1377 0,4130 -1,4455 1,7208 -0,4130 0,6883 0,9636 -0,1377 -1,1701 -0,8948

Note que o 3 caso tem resduo padronizado igual a 2,7637 quando a observao est presente e, sem ela, a distribuio dos resduos padronizados no apresenta grandes distores, tendo maior valor o 5 caso com um resduo padro de 1,72. Previso Somente aps a realizao de todas as anlises e testes pertinentes, estaremos em condies de utilizar o modelo de regresso, caso este se mostre adequado. Fazer previses nada mais do que estimar um valor da varivel dependente para um particular valor da varivel independente. Como todo processo de estimao, esta pode ser feita de modo pontual com intervalos. Para efeito deste curso apenas as estimaes pontuais sero feitas.

O resduo padro encontrado dividindo-se o resduo pelo seu desvio padro, ou seja:
^ ^

(Y Y ) Re sduo Padro = = S

(Yi Yi )

(Yi Yi ) 2
i

n2

Vale lembrar que os dados de resduo padro, quando calculados no Excel, podem sofrer pequenas distores em relao aos dados calculados manualmente, devido aos problemas de arredondamento e principalmente pelo fato da varincia dos resduos (erros) ser calculada com n-1 em seu denominador.

Anderson Litaiff

Salomo Neves

39
UFAM/ FES/ DEA Econometria Ficha V

Pode-se provar que o processo de estimao, de acordo com o modelo de regresso linear, fornece estimativas no tendenciosas dos verdadeiros valores populacionais quando o modelo correto. Assim, dado um valor de X0 de X, obtemos uma estimativa no tendenciosa de Y0 por meio de:
^

Y0 = b0 + b1 X 0

Note que a equao da reta estimada no possui o termo aleatrio, nem sua estimativa (resduos). A estimativa do valor de Y fornecida diretamente pelo modelo, substituindo X pelo valor dele assumido, X0. No exemplo das peas e da mo de obra, podemos estimar, ou fazer uma previso de qual seria a produo caso o processo trabalhasse com X0 = 60 homens-hora por ms. O valor estimado seria ento:
Y0 = 10,1 + 2.(60) = 130 peas
^

Nada mais simples, mas para se chegar a esse valor foi necessrio todo o trabalho de investigao da adequao, ou no, do modelo.

Anderson Litaiff

Salomo Neves

Consideraes Finais Muitas vezes, apenas uma varivel no suficiente para explicar um percentual da variao total que permita previses confiveis. Se o objetivo da modelagem no se restringir investigao de relao entre as variveis, mas permitir previses confiveis, devemos incorporar mais variveis ao modelo. No de modo indiscriminado, mas considerando que desejamos explicar grande parte da variao de Y por meio do menor nmero possvel de variveis independentes. Assim, a complexidade do modelo ficar reduzida, permitindo inferncias mais precisas e simples de interpretar. Este texto deve ser entendido como uma introduo ao modelo de regresso linear simples. O aluno interessado em expandir os seus conhecimentos poder recorrer bibliografia constante no programa da disciplina.

Bibliografia BALASSIANO, Moises. Aplicando Mtodos Quantitativos Administrao. 2.ed. Rio de Janeiro: FGV - Curso FGV Executivo Jr., 2005. 104 p. MICROSOFT OFFICE EXCEL 2003. Ajuda do Microsoft Excel. 1985-2003 Microsoft Corporation. MINITAB Release 14.20. 1972 - 2005 Minitab Inc. HOFFMANN, Rodolfo. Estatstica para Economistas. 3.ed. So Paulo: Pioneira Thomson Learning, 2001. 1 reimpresso da 3.ed. rev. e ampl. de 1998. 430 p.

ANEXOS Com o propsito de ampliar ainda mais o leque de opes de material acerca do tema proposto, segue como anexos alguns textos complementares s tcnicas estatsticas abordadas at ento. O texto referente a anlise de regresso utilizando o Minitab 14 foi utilizada como material didtico nas aulas de um minicurso com o mesmo nome, durante a I Semana de Economia da UFAM. J os textos sobre nmeros-ndice e matrizes de insumo-produto foram pertencem ao material didtico do curso de Contabilidade Social do curso de Economia da UFAM, elaborada em parceria entre o professor Francisco de Assis Mouro e Anderson Litaiff, na poca seu monitor.

Fundamentos de Minitab: Anlise de Regresso INTRODUO Um dos grandes trunfos do economista sempre foi o seu potencial de anlise. Basicamente, quando se observa um determinado problema na sociedade, os cientistas tentam, de alguma forma, sistematiza-lo, procurando de alguma forma encontrar uma possvel explicao para tais fatos. Da convergncia entre o lado da sistematizao da realidade, e do perfil psico-social (juzos de valor) das partes envolvidas no estudo, surge o que chamamos de anlise econmica. justamente atravs da anlise econmica que obtemos insumos para poder ento aplicar as suas diretrizes de poltica econmica, onde todos os agentes envolvidos atuaro de forma aplicar a soluo encontrada para o problema em questo. Para que isso acontea, a obteno de dados estatsticos que possam explicar a natureza do fato fundamental para que se tenha um bom modelo, devido ao fato de que, quanto mais dados forem disponveis, e quanto mais homogeneizados eles forem, no sentido de critrios de mensurao, melhor vai ser o modelo, pois melhor ser a capacidade de o modelo explicar a realidade. Por isso, o economista que tem domnio no somente sobre os dados estatsticos em si, mas que tem a capacidade de demonstrar um determinado grau de relao entre eles, tem grande vantagem, pois sua anlise da realidade ser muito mais rica. Dado isso, o objetivo deste trabalho mostrar como feita anlise de regresso linear, utilizando o software Minitab 14.2 sendo que, especificamente, se procurar mostrar quais so os recursos oferecidos pelo programa na anlise de regresso, assim como enfatizar a importncia da regresso linear como instrumento de anlise econmica. A regresso linear uma das mais importantes ferramentas de trabalho do economista, devido a sua capacidade de demonstrar no somente o relacionamento entre as variveis, mas tambm o grau de explicabilidade e influncia que uma determinada varivel tem sobre as demais. As equaes de oferta, demanda, custo, etc. no foram determinadas aleatoriamente: normalmente, pegam-se os dados obtidos via uma pesquisa estatstica, onde obtemos uma srie histrica; com os dados em mos, utiliza-se os mtodos de regresso, para demonstrar o grau de poder explicativo tem uma varivel sobre as demais. Por exemplo: Nos cursos de macroeconomia, muito comum estudarmos o comportamento da funo consumo, para entendermos o quanto que as variaes da renda disponvel podem influenciar no consumo privado. Contudo, apenas a renda disponvel que pode influenciar as decises de consumo? Qual a intensidade desse grau de influncia? Para responder a estas e muitas outras perguntas que utilizamos das tcnicas de regresso. Este trabalho estar dividido em duas partes: na primeira, ser realizada uma pequena reviso sobre regresso linear simples; na outra, utilizaremos o Minitab 14.2 para calcular a regresso, interpretando os coeficientes obtidos.

Salomo Neves

3 Fundamentos de Minitab: Anlise de Regresso REGRESSO LINEAR SIMPLES: CONCEITOS BSICOS O principal objetivo da anlise de regresso avaliar o relacionamento entre variveis. Basicamente, procura mostrar a capacidade de uma varivel ser explicada pelas variaes de outra. Esse grau de dependncia normalmente demonstrado atravs de uma relao linear, por uma equao da reta:
Y = + X

Onde o intercepto ou valor independente, e o o coeficiente angular. Para estimarmos os valores de e , utilizamos as seguintes equaes: ( X Y) X Y n = ( X) X
i i ^ i i 2 2 i i

e =Y X

Onde

Yi = Xi =

Y
n n

Quando formos calcular os dados considerando o desvio, ou seja, o grau de variao dos dados em torno da mdia, as equaes so as seguintes:
Y = + X , sendo = Y X

x y x
i 2

, para x = ( X X ) e y = (Y Y )

Para determinar em que grau de preciso as duas variveis se correlacionam, obtm-se um coeficiente de correlao dado por:

r=

x y x y
i i 2 i

2 i

Quanto mais prximo de 1 for o r2, mais razo h para assumir que as duas variveis apresentam uma funo linear. Elevando o valor de r ao quadrado, obtemos o coeficiente de determinao, que explica a capacidade das variaes de X explicarem as variaes em Y. Aplicando as equaes, encontramos a equao de regresso, com a relao entre as variveis do modelo explicadas sob a forma de uma funo Y = + X .

Salomo Neves

4 Fundamentos de Minitab: Anlise de Regresso ANOVA Como j dito, a variao total da varivel dependente invarivel presena da varivel dependente. Vimos ainda que esta variao pode ser desmembrada entre as variaes explicada e no explicada pelo modelo. Portanto, faz sentido testarmos at que ponto vale a pena a incorporao de X no modelo. Em princpio, bastaria comparar a variao explicada com a no explicada e, se a primeira fosse maior do que a segunda, maior a evidncia da adequao da incorporao da varivel independente, X, no modelo. Esta a idia que est por trs da anlise de varincia: achar a razo entre a variao explicada e a no explicada para ver se ela grande. Intuitivamente, quanto maior essa razo, melhor. Na primeira coluna, definimos as trs fontes de variao: a variao total; a no explicada, ou devida aos resduos; e a devida ao modelo, ou explicada. Na segunda coluna, encontramos os graus de liberdade associados a cada fonte de variao. A idia que, cada vez que um parmetro estimado, a fonte de variao perde 1 grau de liberdade, dentre os n (observaes) que constituem o nmero de parcela das variaes. Assim, para a variao total, como precisamos estimar a mdia Y , a variao total fica com (n 1) graus de liberdade. Para os resduos, como so estimados dois parmetros para se obter Y , isto , de e , perde-se dois graus de liberdade e fica-se com (n 2). Os graus de liberdade da regresso podem ser obtidos por diferena. As somas dos quadrados na terceira coluna fornecem os valores da decomposio das variaes feitas acima. No seria justo comparar a soma dos quadrados da regresso com a soma dos quadrados dos resduos, pois elas tem graus de liberdade diferentes, portanto, antes de acharmos a razo entre as duas fontes de variao, devemos achar as mdias dos quadrados, de acordo com a coluna 4, dividindo a soma dos quadrados pelos respectivos graus de liberdade. Se a razo entre as mdias dos quadrados calculada, e denominada como F, for muito grande, maior ser a evidencia de que o modelo bom, pois maior ser a participao da regresso sobre os resduos, em mdia. A medida de quo grande fornecida pela ltima coluna, F, de significao. Quanto maior for o valor da razo F, menor ser o valor F de significao. O primeiro est numa escala de valores reais no negativos, enquanto o segundo representa uma medida de probabilidade. Assim, quanto menor for o F de significao, abaixo de 5% por exemplo, maior a nossa crena no modelo. Em geral, o que se faz com uma tabela de ANOVA um teste de hipteses:
^

H 0 : Y = 0 + , contra H 1 : Y = 0 + 1 X + .
A hiptese nula H0 a de que o modelo, no caso expresso pela varivel X, no explica as variaes de Y. A alternativa, ao contrrio, postula a validade do modelo com a varivel independente X explicando Y. Por exemplo: se o valor de significao de F for menor do que 0,05, devemos rejeitar a hiptese nula, concluindo que o modelo explica as variaes de Y. Quando apenas uma varivel explicativa est presente no modelo, testar modelo ser, por extenso, testar a significncia da varivel X no modelo. Salomo Neves

5 Fundamentos de Minitab: Anlise de Regresso

Alm do teste, a tabela de ANOVA fornece algumas informaes importantes. Se dividirmos a soma dos quadrados da regresso pela soma dos quadrados total, teremos o coeficiente de determinao, r; a mdia dos quadrados dos resduos nada mais dos quadrados dos resduos nada mais dos que a medida de varincia residual S. De um modo geral, podemos especificar uma tabela de ANOVA da seguinte forma:
Fontes de Variao Regresso Resduos Total Graus de Liberdade 1 (n - 2) (n - 1) Soma dos Quadrados SQReg SQRes SQTot = SQReg + SQRes Quadrado Mdio SQReg/1 SQRes/(n - 2) SQTot/(n - 1) SQReg/[SQRes/(n - 2)] P(F > Fc) Fc Calculado F Significao

Onde Soma dos quadrados total: SQTot variao das observaes em torno da mdia: (Yi Y ) Soma dos quadrados da regresso (modelo): SQReg variao dos valores estimados em torno da mdia: (Y i Y ) Soma dos quadrados dos resduos (erros) SQRes variao das observaes em torno dos valores estimados: (Yi Yi )
^ ^

Salomo Neves

6
Fundamentos de Minitab: Anlise de Regresso ANLISE DE REGRESSO UTILIZANDO O MINITAB O Minitab um programa estatstico que calcula no apenas a regresso, como tambm muitas outras ferramentas utilizadas na estatstica, sendo um timo pacote para auxlio na construo de insumos para a anlise econmica, principalmente para pesquisas e estudos de mercado. Aqui temos a tela inicial do Minitab. Ela composta por 3 janelas: uma destinada a exibio dos clculos realizados (session); outra para se colocar os dados em que se vai trabalhar (worksheet) e por fim o gerenciador dos projetos em que voc est trabalhando (Project Manager). O Project Manager uma das novidades que o usurio encontra no Minitab 14, pois ele no se encontra disponvel nas verses anteriores.

Para exemplificar, vamos montar uma equao da reta baseada no seguinte exemplo: a equao que expressa o consumo uma das mais conhecidas por parte dos alunos do curso de economia. Basicamente, demonstramos como a deciso de consumo influenciada por duas situaes bem distintas: a influenciada e a no influenciada pelo nvel de renda disponvel. A parte no influenciada pelo consumo chamamos de consumo autnomo, ou incompressvel, e corresponde a situaes que no so influenciadas pelo nvel de renda do agente econmico, como alimentao, vesturio, algo que ele adquire acima de seu poder oramentrio, etc. A parte que influenciada pelas variaes do nvel de renda disponvel, chamada tambm de propenso marginal a consumir, vai explicitar a intensidade da variao do consumo, dada as possveis variaes no nvel de renda disponvel.

Salomo Neves

7
Fundamentos de Minitab: Anlise de Regresso Para montarmos a nossa equao de consumo, vamos nos basear nos dados disponibilizados pelas Contas Nacionais, do IBGE.
Tabela 2072 - Contas econmicas trimestrais Brasil Varivel Trimestre Renda disponvel bruta janeiro-maro 1991 (Milhes de Cruzeiros) abril-junho 1991 (Milhes de Cruzeiros) julho-setembro 1991 (Milhes de Cruzeiros) outubro-dezembro 1991 (Milhes de Cruzeiros) janeiro-maro 1992 (Milhes de Cruzeiros) abril-junho 1992 (Milhes de Cruzeiros) julho-setembro 1992 (Milhes de Cruzeiros) outubro-dezembro 1992 (Milhes de Cruzeiros) janeiro-maro 1993 (Milhes de Cruzeiros Reais) abril-junho 1993 (Milhes de Cruzeiros Reais) julho-setembro 1993 (Milhes de Cruzeiros Reais) outubro-dezembro 1993 (Milhes de Cruzeiros Reais) janeiro-maro 1994 (Milhes de Reais) abril-junho 1994 (Milhes de Reais) julho-setembro 1994 (Milhes de Reais) outubro-dezembro 1994 (Milhes de Reais) janeiro-maro 1995 (Milhes de Reais) abril-junho 1995 (Milhes de Reais) julho-setembro 1995 (Milhes de Reais) outubro-dezembro 1995 (Milhes de Reais) janeiro-maro 1996 (Milhes de Reais) abril-junho 1996 (Milhes de Reais) julho-setembro 1996 (Milhes de Reais) outubro-dezembro 1996 (Milhes de Reais) janeiro-maro 1997 (Milhes de Reais) abril-junho 1997 (Milhes de Reais) julho-setembro 1997 (Milhes de Reais) Despesas de consumo final

18.619 28.908 41.534 73.519 132.337 248.690 463.303 890.819

-15.377 -22.049 -34.578 -59.743 -104.483 -192.738 -375.079 -712.819

1.771 3.959

-1.402 -3.105

9.665

-7.560

22.533 18.565 65.421 127.655 133.130 141.542 152.518 165.320 179.982 169.024 186.952 201.505 211.758 191.048 207.706 219.808

-18.073 -17.688 -54.858 -92.584 -105.514 -115.705 -121.408 -133.994 -142.455 -139.850 -149.268 -169.729 -171.967 -163.126 -172.241 -184.915

Salomo Neves

8
Fundamentos de Minitab: Anlise de Regresso
outubro-dezembro 1997 (Milhes de Reais) janeiro-maro 1998 (Milhes de Reais) abril-junho 1998 (Milhes de Reais) julho-setembro 1998 (Milhes de Reais) outubro-dezembro 1998 (Milhes de Reais) janeiro-maro 1999 (Milhes de Reais) abril-junho 1999 (Milhes de Reais) julho-setembro 1999 (Milhes de Reais) outubro-dezembro 1999 (Milhes de Reais) janeiro-maro 2000 (Milhes de Reais) abril-junho 2000 (Milhes de Reais) julho-setembro 2000 (Milhes de Reais) outubro-dezembro 2000 (Milhes de Reais) janeiro-maro 2001 (Milhes de Reais) abril-junho 2001 (Milhes de Reais) julho-setembro 2001 (Milhes de Reais) outubro-dezembro 2001 (Milhes de Reais) janeiro-maro 2002 (Milhes de Reais) abril-junho 2002 (Milhes de Reais) julho-setembro 2002 (Milhes de Reais) outubro-dezembro 2002 (Milhes de Reais) janeiro-maro 2003 (Milhes de Reais) abril-junho 2003 (Milhes de Reais) julho-setembro 2003 (Milhes de Reais) outubro-dezembro 2003 (Milhes de Reais) janeiro-maro 2004 (Milhes de Reais) abril-junho 2004 (Milhes de Reais) julho-setembro 2004 (Milhes de Reais) outubro-dezembro 2004 (Milhes de Reais) janeiro-maro 2005 (Milhes de Reais) abril-junho 2005 (Milhes de Reais) julho-setembro 2005 (Milhes de Reais) outubro-dezembro 2005 (Milhes de Reais)

236.754 208.301 227.261 229.307 229.740 215.420 238.159 235.832 253.355 246.386 260.938 280.081 284.043 271.628 284.066 294.363 307.261 293.375 318.140 334.479 355.357 349.130 370.618 389.252 400.784 384.857 421.047 447.275 464.515 426.743 464.615 485.735 507.545

-183.918 -176.622 -181.371 -194.396 -188.650 -182.294 -190.451 -206.364 -213.420 -196.717 -213.196 -227.028 -243.715 -221.481 -233.539 -237.139 -264.342 -238.700 -257.272 -260.866 -295.302 -274.960 -289.695 -299.548 -328.411 -293.117 -312.098 -331.147 -371.216 -328.662 -349.828 -365.059 -410.538

Salomo Neves

9
Fundamentos de Minitab: Anlise de Regresso
Nota: 1 - At 1994 , a poupana bruta inclui as transferncias de capital.

2 - At 1999, a conta de capital equivale s transferncias de capital enviadas e recebidas do resto do mundo. A partir de 2000, a mesma inclui transferncias de capital e bens no financeiros no produzidos-cesso de marcas e patentes.

3 - At 1999, os dados anuais so equivalentes aos dados das publicaes do Sistema de Contas Nacionais. Aps 2000, os dados do Balano de pagamentos esto ajustados com as sries mais recentes divulgados pelo Banco Central.

Fonte: IBGE - Contas Nacionais (Trimestral)

Antes de realizar os clculos, vamos multiplicar a coluna despesas de consumo final por -1, para caracterizarmos apenas o consumo em si. Pode-se fazer isso rapidamente utilizando o Excel. Depois disso, copie os dados do Excel para a planilha de trabalho do Minitab (Worksheet). Realizar clculos de regresso linear com o Minitab bastante simples. V em Stat, Regression, Regression.

Salomo Neves

10
Fundamentos de Minitab: Anlise de Regresso Tendo selecionado a opo, aparecer a seguinte tela, pedindo para voc colocar os dados:

Onde Response o local onde deve-se colocar a varivel Explicada, ou seja, Y; e Predictors, onde colocamos as variveis explicativas, o que vai caracterizar se a regresso linear simples (uma varivel explicativa) ou mltipla (mais de uma varivel explicativa) Neste caso, como estamos querendo mostrar como o consumo influenciado pelas variaes da renda disponvel, escolheremos Despesas de consumo final como Y (Response) e a renda disponvel bruta como X (Predictor). Alm disso, o Minitab possui outras funes que podem melhorar o potencial de anlise do modelo estudado. Estes recursos esto classificados nesta tela, da seguinte forma: GRAPHS Mostra os grficos que voc pode colocar em sua anlise de regresso.

Salomo Neves

11
Fundamentos de Minitab: Anlise de Regresso Residuals for Plots: Pergunta quais os resduos que voc vai querer no grfico, se so os normais (Regular), padronizados (Standarized), que so os resduos normais divididos pelo desvio padro dos resduos, com o objetivo padronizar as variveis, e por fim, os resduos deletados pelo modelo. Nesse exemplo, vamos escolher os resduos normais. Na plotagem dos resduos, escolhemos os grficos que vo aparecer na sua anlise. Podemos escolher os seguintes: Histogram of residuals: Mostra a freqncia dos resduos. Normal plot of residuals: Plota os resduos. Residuals versus fits: Mostra os resduos e os dados ajustados pela equao ( Y ) Residuals versus order: Mostra os resduos e os dados observados (Y) Uma novidade do Minitab 14 que agora podemos pedir para colocar os quatro graficos em um s (four in one). Voc tambm pode comparar os resduos com qualquer outra varivel estudada no seu modelo (Residuals versus the variables) RESULTS Mostra o que voc deseja que aparea no clculo da regresso. As opes so as seguintes:
^

Display nothig: no mostra nada Regression equation, table of coefficients, s, R-squared, and basic analysis of variance: Mostra a equao da regresso, a tabela dos coeficientes obtidos, o desvio dos erros, o coeficiente de determinao (r) e o quadro da anlise de varincia simplificada (ANOVA) In addition, sequential sums of squares and the unusual observations in the table of fits and residuals: mostra todo o item anterior mais as somas dos quadrados mais as observaes incomuns (outliers) nas tabelas dos dados ajustados e na tabela dos resduos. In addition, full table of fits and residuals: mostra todos os itens anteriores mais a tabela completa dos dados ajustados e dos resduos.

Salomo Neves

12
Fundamentos de Minitab: Anlise de Regresso OPTIONS Aqui temos as seguintes opes: em weights podemos escolher uma varivel peso no modelo, caso se queira fazer uma regresso ponderada. Em Fit intercept, decidese se quer colocar ou no um termo constante (coeficiente a). Caso no se escolha essa opo, a reta de regresso passar pela origem. Em Display, as opes so as seguintes: Variance Inflation Factors (VIF): utilizado para detectar a presena de multicolearidade (associao linear forte) entre as variveis peditoras. Se VIF for = 1, indica que no h associao linear e se for maior do que 1, existe associao linear. Se o valor de VIF for maior o que 10, h multicolinearidade grave. Durbin-Watson statistic: calcula a estatstica D de Durbin-Watson, que vai detectar autocorrelao nos resduos; o valor obtido deve ser comparado tabela do teste. Se D > limite superior, no h correlao; se D < limite inferior, existe correlao positiva e se D estiver entre os limites, o teste inconclusivo. PRESS and predicted R-square: opo utilizada para calcular a estatstica PRESS e o r ajustado. Outra caixa desse submenu Prediction intervals for new observations. Nessa caixa podemos entrar com um valor ou com uma coluna de valores de varivel preditora, com base na qual queremos prever a varivel resposta. As outras opes deste submenu nos permitem escolher o intervalo de confiana (confidence level) e ainda inserir as seguintes estatsticas na planilha: Fits (valores ajustados pela reta de regresso), SE of Fits (erros padro dos ajustes) Confidence Limit (limites de confiana) e Prediction Limits (intervalos de previso)

Salomo Neves

13
Fundamentos de Minitab: Anlise de Regresso STORAGE Mostra os dados adicionais que voc quer que sejam mostrados em sua planilha (worksheet). Voc pode colocar em sua planilha os valores dos resduos, dos resduos padro, etc (Diagnostic Measures). Alm destes, pode-se colocar tambm os valores que mostram as caractersticas da sua equao de regresso (Characteristics of Estimated Equation), como os coeficientes obtidos, os dados ajustados, a matriz inversa, caso se esteja fazendo uma regresso mltipla, etc.

Para este exemplo, vamos pedir para amostrar os resduos, os resduos padro, os coeficientes e os dados ajustados pela equao.

Tendo escolhido todos os recursos que se utilizar no modelo em questo e confirmando na tela principal da regresso, vamos obter os resultados da seguinte forma:

Salomo Neves

14
Fundamentos de Minitab: Anlise de Regresso
Regression Analysis: Despesas de cons versus Renda disponvel
The regression equation is Despesas de consumo final = 4432 + 0,784 Renda disponvel bruta

Predictor Constant Renda disponvel bruta

Coef 4432 0,783912

SE Coef 2214 0,007488

T 2,00 104,69

P 0,050 0,000

S = 9126,25

R-Sq = 99,5%

R-Sq(adj) = 99,5%

Analysis of Variance Source Regression Residual Error Total DF 1 58 59 SS 9,12872E+11 4830730531 9,17703E+11 MS 9,12872E+11 83288457 F 10960,37 P 0,000

Unusual Observations Despesas de consumo final 712819 264342 312098 331147 349828 365059

Obs 8 44 54 55 58 59

Renda disponvel bruta 890819 307261 421047 447275 464615 485735

Fit 702755 245297 334496 355056 368649 385205

SE Fit 4938 1253 1738 1887 1990 2120

Residual 10064 19045 -22398 -23909 -18821 -20146

St Resid 1,31 X 2,11R -2,50R -2,68R -2,11R -2,27R

R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large influence.

Durbin-Watson statistic = 1,35988

Normplot of Residuals for Despesas de consumo final Residuals vs Fits for Despesas de consumo final Residual Histogram for Despesas de consumo final Residuals vs Order for Despesas de consumo final

A equao de regresso encontrada foi:


Despesas de consumo final = 4432 + 0,784 Renda disponvel bruta

O termo 4432 corresponde ao consumo autnomo, que acontece independente do nvel de renda disponvel. Significa que, caso o nvel de renda disponvel for zero, o consumo vai ser 4432. j 0,784 corresponde ao coeficiente angular da equao, considerada tambm como a propenso marginal a consumir: para cada aumento da renda disponvel em 1 unidade, o consumo vai crescer em 0,784. Salomo Neves

15
Fundamentos de Minitab: Anlise de Regresso

Analisando as estatsticas de regresso, chegamos aos seguintes resultados:


S = 9126,25 R-Sq = 99,5% R-Sq(adj) = 99,5%

O coeficiente de determinao r (R-Sq) mostra que as variaes de X podem explicar as variaes de Y em 99,5%, caracterizando um bom modelo; o coeficiente de determinao dos dados ajustados (R-Sq(Adj)) mostra que as variaes de X podem explicar as variaes dos dados ajustados pela equao de regresso em 99,5%, o que comprova que o modelo bom. J S corresponde ao desvio dos erros e est em 9126,25, fato que indica que a probabilidade de erro bastante alta. Para comprovar mesmo se o modelo bom ou no, deve-se fazer a anlise dos resduos. Esse o principal objetivo dos grficos de plotagem dos resduos. Observemos os grficos: Histogram of the Residuals
Histogram of the Residuals
(response is Despesas de consumo final) 16 14 12 Frequency 10 8 6 4 2 0 -20000 -10000 0 Residual 10000 20000

O histograma vai amostrar as freqncias dos resduos.

Salomo Neves

16
Fundamentos de Minitab: Anlise de Regresso Normal Probability Plot of the Residuals
Normal Probability Plot of the Residuals
(response is Despesas de consumo final)
99,9 99 95 90 80 70 60 50 40 30 20 10 5 1 0,1

Percent

-30000

-20000

-10000

0 Residual

10000

20000

30000

Este grfico mostra como os resduos vo estar organizados, de acordo com cada percentil da amostra. Residuals Versus the Order of the Data
Residuals Versus the Order of the Data
(response is Despesas de consumo final) 20000

10000

Residual

-10000

-20000

-30000 1 5 10 15 20 25 30 35 40 Observation Order 45 50 55 60

Mostra o comportamento dos resduos em relao aos valores observados. Salomo Neves

17
Fundamentos de Minitab: Anlise de Regresso Residuals Versus the Fitted Values
Residuals Versus the Fitted Values
(response is Despesas de consumo final) 20000

10000

Residual

-10000

-20000

-30000 0 100000 200000 300000 400000 Fitted Value 500000 600000 700000

Mostra como esto se comportando os resduos em relao aos dados ajustados pela equao de regresso. Para que o modelo seja realmente bom, os dados observados aqui devem estar os mais dispersos possvel, de forma homognea, sem se concentrarem em torno na linha do ponto zero do grfico. Nesse caso, observa-se que os dados esto muito concentrados no canto esquerdo do grfico, fazendo uma tendncia em forma de < (heterocedasticidade). Isso indica que este modelo no bom, mesmo tendo um coeficiente de determinao de 99,5%, pois a anlise dos resduos mostra que os dados utilizados podem ser tendenciosos ou no suficientes para explicar as variaes no nvel de consumo. Portanto, chega-se a seguinte concluso: apesar de haver uma correlao muito forte entre a renda disponvel e o consumo, ela no suficiente para explicar totalmente as variaes do consumo. Isso significa que existem outras variveis que podem explicar o aumento do consumo, como por exemplo o lanamento de um novo produto, variaes nos nveis de preos, fatores sazonais, etc.

Salomo Neves

18
Fundamentos de Minitab: Anlise de Regresso FITTED LINE PLOT Outra maneira de fazer os clculos de regresso linear utilizando o comando fitted line plot (Stat, Regression, Fitted Line Plot).

Este comando calcula a regresso de forma mais rpida e dinmica, sendo muito til quando queremos elaborar modelos com regresso a nvel potencial ou logartmico. Quando ativar a opo, a seguinte tela vai aparecer:

Onde se determinar no apenas as variveis explicativas e explicadas do modelo, mas tambm o tipo de regresso a ser obtido: linear, quadrtico ou cbico. Assim como no mtodo anterior, tambm temos opes para tornar mais completa a anlise do modelo.

Salomo Neves

19
Fundamentos de Minitab: Anlise de Regresso A nica diferena do comando Fitted Line Plot, em realacao ao mtodo anterior, vai estar no comando OPTIONS:

Em transformations podemos pedir para mostrarem o log de Y e de X. Em Display Options, pode-se mostrar o intervalo de confiana e o intervalo de predio. Ainda utilizando o mesmo exemplo, a nica novidade o grfico que mostra os intervalos e valores da estatstica de regresso, assim como a equao da reta e os intervalos de confiana e de previso:
Fitted Line Plot
Despesas de consumo final = 4432 + 0,7839 Renda disponvel bruta 800000 Despesas de consumo final 700000 600000 500000 400000 300000 200000 100000 0
0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 0 0 0 0 0 0 0 0 0 1 2 3 4 5 6 7 8 9 Renda disponvel bruta
Regression 95% CI 95% PI S R-Sq R-Sq(adj) 9126,25 99,5% 99,5%

Onde PI o intervalo de previso e CI o intervalo de confiana. Para eles aparecerem no grfico, deve-se ativar essas opes no submenu OPTIONS.

Salomo Neves

20
Fundamentos de Minitab: Anlise de Regresso BIBLIOGRAFIA BUARQUE, Cristovam. Avaliao Econmica de Projetos: uma apresentao didtica. 8 reimp. Com a colaborao de Hugo Javier Ochoa; Traduzido do espanhol por Maria do Carmo Duarte de Oliveira. Rio de Janeiro: Elvesier, 1984. 272 p. 20 reimpresso. BALASSIANO, Moises. Aplicando Mtodos Quantitativos Administrao. 2.ed. Rio de Janeiro: FGV - Curso FGV Executivo Jr., 2005. 104 p. HOFFMANN, Rodolfo. Estatstica para Economistas. 3.ed. So Paulo: Pioneira Thomson Learning, 2001. 1 reimpresso da 3.ed. rev. e ampl. de 1998. 430 p.

Salomo Neves

Contabilidade Social: Apostila 6 Prof. Assis Mouro

METODOLOGIA DE PROGRAMAO MACROECONMICA ATRAVS DA MATRIZ INSUMO-PRODUTO 1. OBSERVAES INICIAIS O Sistema de Contas Nacionais ocupa-se dos resultados finais da atividade econmica, conforme os clculos do PIB-RIB-DIB. A articulao contbil desse conjunto de fluxos e a prpria concepo terica dos sistemas de Contas Nacionais, foram diretamente influenciadas pela necessidade de mensurao dos agregados macroeconmicos dos modelos keynesianos, destacando, assim, cada uma das principais categorias integrantes da OFERTA e DEMANDA AGREGADAS, alm de outras transaes significativamente relacionadas com o nvel da atividade e do emprego na economia, atendendo, portanto, s necessidades da anlise e das polticas econmicas voltadas para o objetivo do equilbrio global da economia. Pode-se, agora, trazer um outro mtodo quantitativo desses mesmos agregados, isto a MATRIZ INSUMO/PRODUTO, que nesse caso, envolve tambm, as relaes existentes nas diversas CADEIAS PRODUTIVAS (Relaes Intra e Intersetoriais) da economia a exemplo da Demanda Intermediria BI. Em outras palavras, as relaes que integram a CADEIA PRODUTIVA, definem as responsabilidades de cada setor, desde a extrao das matrias primas, passando pelo processamento intermedirio, transformao em produto acabado e devida comercializao no mercado final, caracterizando, assim, uma radiografia do VBP - Valor Bruto da Produo. Numa interpretao complementar, a metodologia de insumo-produto objetiva, por conseguinte, registrar as transaes que se efetuam no decorrer do PPG - Processo Produtivo Geral. Nas tabelas de INSUMO/PRODUTO alm da mensurao do Produto e da Renda, o que se procura, em essncia, quantificar como se geram o Produto e a Renda, em circunstncias de interdependncia entre os diversos ramos de atividade econmica. O mtodo em foco, possibilita o clculo dos COEFICIENTES TCNICOS DE PRODUO, indicador que determina o grau de dependncia inter-setorial, ou seja o estado da tecnologia do Sistema Econmico. O nvel tecnolgico, portanto, dado pelas propores de insumo necessrias, em cada setor, para a produo da totalidade de bens e servios finais. Tais coeficientes, convertem-se nos instrumentos de manipulao das polticas de Programao Macro-econmicas, uma vez que, estar-se- lidando com os eventuais pontos de estrangulamento da produo.

2. UM MODELO DE MATRIZ DE INSUMO-PRODUTO

Destinao dos Produtos

DEMANDA INTERMEDIRIA Demanda dos Bens Madereira Serraria Movelaria Comrcio rios (SubTotal 1) 3 2 1 2 8 2 10 25 3 28 38 7 2 3 5 17 10 27 43 10 53 80 10 23 4 8 45 13 58 57 15 72 130 0 20 55 10 85 17 102 39 12 51 153 20 47 63 25 155 42 197 164 40 204 401 8 17 44 88 157 Consumo Governo)

DEMANDA FINAL Valor Bruto de FBFK E (Privado e Governo) Exportao Demanda (Sub-Total 2) Produo dos Mercados) = Sub-Totais (1 + 2) Agregada (Faturamento Geral

Intermedi (Privado e

Origem dos Insumos Madereira Serraria Movelaria Comrcio Sub-Total 3 Importao Sub-Total 4
CTEX , Salrios, TIR, Juros e Lucros Brutos

6 13 16 23 58

4 3 7 17 31

18 33 67 128 246

38 80 130 153 401

Demanda Agregada

Impostos Indiretos Lquidos (ii s) Sub-Total 5 Valor Bruto da Produo = SubTotais (4 + 5)

VABpma = PIBpma

Contabilidade Social: Apostila 6 Prof. Assis Mouro

3. POLTICAS DE PLANEJAMENTO E PROGRAMAO ECONMICA A ttulo de exemplificao de uma Poltica de Planejamento e Programao Econmica, utilizar-se- a MATRIZ DE INSUMO/PRODUTO demonstrada acima, para projeo de um aumento de 50% na DEMANDA AGREGADA, e a respectiva necessidade de adequao da OFERTA AGREGADA respeitado o nvel tecnolgico da economia, conforme os COEFICIENTES TCNICOS DE PRODUAO. RESOLUO: 1) Projetou-se um aumento de 50% da DEMANDA AGREGADA, portanto, os seus novos valore sero: Demanda Agregada (Y) 27 49,5 100,5 192 2) O passo seguinte a construo da matriz dos COEFICIENTES TCNICOS DE PRODUO. Observando-se as colunas da MATRIZ DE INSUMO-PRODUTO, nas quais esto relacionados os totais das compras de insumos, o total de importaes e as remuneraes pagas aos fatores mobilizados pela produo, que constituem o VAB, por deduo lgica, dividindo-se cada um dos valores da DEMANDA INTERMEDIRIA pelo total do Faturamento (VBP) de cada setor, obtm-se o COEFICIENTE TCNICO DE PRODUO. a11= x11/X1 = 3 / 38 A= a21= x21/X1 = 2 / 38 a31= x31/X1 = 1 / 38 a41= x41/X1 = 2 / 38 a12= x12/X2 = 7 / 80 a22= x22/X2 = 2 / 80 a32= x32/X2 = 3 / 80 a42= x42/X2 = 5 / 80 a13= x13/X3 = 10 / 130 a23= x23/X3 = 23 / 130 a33= x33/X3 = 4 / 130 a43= x33/X3 = 8 / 130 a14= x14/X4 = 0 / 153 a24= x24/X4 = 20 / 153 a34= x34/X4 = 55 / 153 a44= x44/X4 = 10 / 153

Contabilidade Social: Apostila 6 Prof. Assis Mouro

0,078947 A= 0,052632 0,026316 0,052632

0,0875 0,025 0,0375 0,0625

0,076923 0,176923 0,030769 0,061538

0 0,130719 0,359477 0,065359

Obs.: O VBP representa os 100% do Faturamento Total, logo calculando-se os COEFICIENTES do Total das Importaes e do VAB e somando-os aos COEFICIENTES da Demanda Intermediria (todos convertidos em porcentagens), o valor obtido corresponder aos 100%. b11 = M1 / X1 = 2 / 38 B= b21 = V21 / X1 = 25 / 38 b31 = V31 / X1= 3 / 38 b12 = M12 / X2 = 10 / 80 b22 = V22 / X2 = 43 / 80 b32 = V32 / X2 = 10 / 80 b13 = M13 / X3 = 13 / 130 b23 = V23 / X3 = 57 / 130 b33 = V33 / X3 = 15 / 130 b14 = M14 / X4 = 17 / 153 b24 = V24 / X4 = 39 / 153 b34 = V34 / X4 = 12 / 153

0,052632 B= 0,657895 0,078947

0,125 0,5375 0,125

0,1 0,438462 0,115385

0,111111 0,254902 0,078431

Somando-se os vetores-coluna das Matrizes A e B (em percentagem), obtem-se:

7,894737% A= 5,263158% 2,631579% 5,263158%

8,75% 2,5% 3,75% 6,25% +

7,692308% 17,69231% 3,076923% 6,153846%

0% 13,0719% 35,94771% 6,535948%

5,263158% B= 65,78947% 7,894737% VBP =

12,5% 53,75% 12,5%

10% 43,84615% 11,53846%

11,11111% 25,4902% 7,843137%

100%

100%

100%

100%

Contabilidade Social: Apostila 6 Prof. Assis Mouro

3) A Metodologia utilizada para construo da MATRIZ DE INSUMO-PRODUTO estabelece a seguinte relao algbrica: x11 x21 x31 x41 + x12 + x22 + x32 + x42 + x13 + x23 + x33 + x43 + x14 + x24 + x34 + x44 + Y1 + Y2 + Y3 + Y4 = X1 = X2 = X3 = X4

Por meio da Matriz A, reescrever-se- os termos x da forma que se segue: a11.X1 a21.X1 a31.X1 a41.X1 + a12.X2 + a22.X2 + a32.X2 + a42.X2 + a13.X3 + a23.X3 + a33.X3 + a43.X3 + a14.X4 + a24.X4 + a34.X4 + a44.X4 + Y1 + Y2 + Y3 + Y4 = X1 = X2 = X3 = X4

Transfere-se X para o 1. membro e Y para o 2. membro da equao, multiplicar-se- todos os termos por (1) e colocar-se- o X em evidncia: a11.X1 a21.X1 a31.X1 a41.X1 X1 - a21.X1 - a31.X1 - a41.X1 + a12.X2 + a22.X2 + a32.X2 + a42.X2 - a11.X1 + X2 - a32.X2 - a42.X2 + a13.X3 + a23.X3 + a33.X3 + a43.X3 - a12.X2 - a22.X2 + X3 - a43.X3 + a14.X4 + a24.X4 + a34.X4 + a44.X4 - a13.X3 - a23.X3 - a33.X3 + X4 - X1 - X2 - X3 - X4 - a14.X4 - a24.X4 - a34.X4 - a44.X4 = -Y1 = -Y2 = -Y3 = - Y4 = Y1 = Y2 = Y3 = Y4

Contabilidade Social: Apostila 6 Prof. Assis Mouro

(1 - a11) . X1 - a21.X1 - a31.X1 - a41.X1

- a12.X2 (1 - a22) . X2 - a32.X2 - a42.X2

- a13.X3 - a23.X3 (1 - a33) . X3 - a43.X3

- a14.X4 - a24.X4 - a34.X4 (1 - a44) . X4

= Y1 = Y2 = Y3 = Y4

Percebe-se, portanto, que a Matriz acima resultado da seguinte equao: [IA].[X]=[Y] onde: I = Matriz Identidade; A = Matriz dos Coeficientes Tcnicos de Produo; X = Matriz dos Valores Brutos da Produo (VBP); Y = Matriz da Demanda Agregada. Interessa-nos, entretanto, calcular os novos Valores Brutos da Produo decorrentes da projeo de uma expanso da DEMANDA AGREGADA. Isolando a Matriz X tem-se: [ X ] = [ Y ] / [ I A ] ou [ X ] = [ I A ]-1 . [ Y ] PORTANTO: [IA]= 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0,07894 0,05263 0,02631 0,05263 0,0875 0,025 0,0375 0,0625 0,07692 0,17692 0,03076 0,06153 0 0,13071 0,35947 0,06535 = 0,921053 - 0,0875 - 0,07692 0 - 0,05263 0,975 - 0,17692 - 0,13071 - 0,02631 - 0,0375 0,969231 - 0,35947 - 0,05263 - 0,0625 - 0,06153 0,934641

[ I A ]-1 = 1,098221 0,079563 0,059254 0,071065 0,10647 1,055729 0,073951 0,081462 0,110233 0,213618 1,076902 0,091397 0,057288 0,229815 0,424536 1,116476

Contabilidade Social: Apostila 6 Prof. Assis Mouro

[ X ] = [ I A ]-1 . [ Y ] X1 X2 X3 X4 = 1,098221 0,10647 0,110233 0,057288 x 27 49,5 100,5 192 0,079563 1,055729 0,213618 0,229815 0,059254 0,073951 1,076902 0,424536 0,071065 0,081462 0,091397 1,116476

X1 X2 X3 X4 =

57 120 195 229,5

4) Conhecendo-se os Valores Brutos da Produo, recorre-se Matriz dos Coeficientes Tcnicos de Produo, para o estabelecimento da nova estrutura da MATRIZ DE INSUMO-PRODUTO. DEMANDA INTERMEDIRIA
MADEIREIRA SERRARIA MOVELARIA COMRCIO x14 = a14.X4 = 0 . 229,5

MADEIREIRA x11 = a11.X1 = 0,078947 . 57 x12 = a12.X2 = 0,0875 . 120 x13 = a13.X3 = 0,076923 . 195 SERRARIA MOVELARIA COMRCIO x21 = a21.X1 = 0,052632 . 57 x22 = a22.X2 = 0,025 . 120

x23 = a23.X3 =0,176923 . 195 x24 = a24.X4 = 0,130719 . 229,5 x33 = a33.X3 =0,030769 . 195 x43 = a43.X3 =0,061538 . 195 x34 = a34.X4 =0,359477 . 229,5 x44 = a44.X4 =0,065359 . 229,5

x31 = a31.X1 = 0,026316 . 57 x32 = a32.X2 = 0,0375 . 120 x41 = a41.X1 = 0,052632 . 57 x42 = a42.X2 =0,0625 . 120

MADEIREIRA SERRARIA MOVELARIA COMRCIO MADEIREIRA SERRARIA MOVELARIA COMRCIO 4,5 3 1,5 3 10,5 3 4,5 7,5 15 34,5 6 12 0 30 82,5 15

Contabilidade Social: Apostila 6 Prof. Assis Mouro

IMPORTAO E VAB MADEIREIRA IMPORTAO CTEX, Salrios, TIR, Juros e Lucros Brutos Impostos Indiretos Lquidos (ii s) M1 = b11 . X1 = 0,052632 . 57 V21 = b21 . X1 = 0,657895 . 57 V31 = b31 . X1 = 0,078947 . 57 MADEIREIRA IMPORTAO CTEX, Salrios, TIR, Juros e Lucros Brutos Impostos Indiretos Lquidos (ii s) DEMANDA FINAL Ano 1: Consumo c11 = C1 / Y1 = 8 / 18 C= c21 = C2 / Y2 = 17 / 33 c31 = C3 / Y3 = 44 / 67 c41 = C4 / Y4 = 88 / 128 Consumo 0,444444 C= 0,515152 0,656716 0,6875 FBFK E c12 = F1 / Y1 = 6 / 18 c22 = F2 / Y2 = 13 / 33 c32 = F3 / Y3 = 16 / 67 c42 = F4 / Y4 = 23 / 128 FBFK E 0,333333 0,393939 0,238806 0,179688 Exportao c13 = E1 / Y1 = 4 / 18 c23 = E2 / Y2 = 3 / 33 c33 = E3 / Y3 = 7 / 67 c43 = E4 / Y4 = 17 / 128 Exportao 0,222222 0,090909 0,104478 0,132813 3 37,5 4,5 SERRARIA M2 = b12 . X2 = 0,125 . 120 V22 = b22 . X2 = 0,5375 . 120 V32 = b32 . X1 = 0,125 . 120 SERRARIA 15 64,5 15 MOVELARIA M3 = b13 . X3 = 0,1 . 195 V23 = b23 . X3 V33 = b33 . X3 COMRCIO M4 = b14 . X4 = 0,111111 . 229,5 V24 = b24 . X4 V34 = b34 . X4

= 0,438462 . 195 = 0,254902 . 229,5 = 0,115385 . 195 = 0,078431 . 229,5 MOVELARIA COMRCIO 19,5 85,5 22,5 25,5 58,5 18

Contabilidade Social: Apostila 6 Prof. Assis Mouro

Ano 2: Consumo C1 = c11.Y1 = 0,4444 . 27 C= C2 = c21.Y2 = 0,515152 . 27 C2 = c21.Y2 = 0,515152 . 27 C2 = c21.Y2 = 0,515152 . 27 FBFK E F1 = c12.Y1 = 0,3333 . 27 Exportao E1 = c13.Y1 = 0,2222 . 27

F2 = c22.Y2 = 0,393939. 49,5 E2 = c23.Y2 = 0,090909 . 49,5 F2 = c22.Y2 = 0,393939. 49,5 E2 = c23.Y2 = 0,090909 . 49,5 F2 = c22.Y2 = 0,393939. 49,5 E2 = c23.Y2 = 0,090909 . 49,5

Consumo 12 25,5 66 132

FBFK E 9 19,5 24 34,5

Exportao 6 4,5 10,5 25,5

C=

5) A seguir, a nova estrutura da MATRIZ DE INSUMO-PRODUTO:

Destinao dos Produtos

DEMANDA INTERMEDIRIA Demanda dos Bens Madereira Serraria Movelaria Comrcio rios (SubTotal 1) 4,5 3 1,5 3 12 3 15
37,5

DEMANDA FINAL Valor Bruto de Consumo Governo) FBFK E (Privado e Governo) Exportao Demanda (Sub-Total 2) Produo dos Mercados) = Sub-Totais (1 + 2) Agregada (Faturamento Geral

Intermedi (Privado e

Origem dos Insumos Madereira Serraria Movelaria Comrcio Sub-Total 3 Importao Sub-Total 4
CTEX , Salrios, TIR, Juros e Lucros Brutos
64,5 85,5 58,5

10,5 3 4,5 7,5 25,5 15 40,5

15 34,5 6 12 67,5 19,5 87

0 30 82,5 15 127,5 25,5 153

30 70,5 94,5 37,5 232,5 63 295,5 246 60 306 601,5

12 25,5 66 132 235,5

9 19,5 24 34,5 87

6 4,5 10,5 25,5 46,5

27 49,5 100,5 192 369

57 120 195 229,5 601,5

Demanda Agregada

Impostos Indiretos Lquidos (ii s) Sub-Total 5 Valor Bruto da Produo = SubTotais (4 + 5) 57 120 195 229,5
4,5 15 22,5 18

VABpma = PIBpma

42

79,5

108

76,5

Contabilidade Social: Apostila 7 Prof. Assis Mouro

OS AGREGADOS MACROECONMICOS PREOS CONSTANTES 1. OBSERVAES INICIAIS Neste captulo examinar-se-o os principais mtodos estatsticos aplicados para o clculo de valores agregados que sejam intertemporalmente e internacionalmente comparveis. Cabe considerar que, ao longo de sucessivos perodos de tempo, ocorrem variaes no valor da unidade monetria. Ou seja, que o poder aquisitivo da moeda, em determinado perodo, pode ser distinto daquele que se observa em outro perodo. Logicamente, essa alterao repercute sobre o sistema de preos relativos. Em conseqncia, quando se deseja analisar o comportamento do sistema econmico em perodos de tempos distintos, ou seja, quando se deseja estabelecer comparaes intertemporais, mister eliminar-se a variao no poder aquisitivo da moeda sem o que a comparao perderia sentido analtico. necessrio, portanto, encontrar uma forma de expressar os fluxos econmicos reais ou financeiros em TERMOS CONSTANTES, pois como os preos, de forma geral, expandem-se de um ano para outro, o valor do produto agregado assimila essa expanso, refletindo assim no apenas a expanso real da economia, resultante do esforo social de produo, mas tambm o crescimento inflacionrio dos preos. Em outras palavras, trata-se de medir os grandes agregados macroeconmicos a preos constantes, abstraindo-se das variaes no valor da moeda. Assim procedendo, haver sentido econmico na afirmativa de que o Produto Interno Bruto, ou qualquer outro agregado macroeconmico, durante certo perodo de tempo e em determinado pas, cresceu a uma taxa acumulativa de 5% ao ano, por exemplo. No mbito destas comparaes, estabelecer-se- inicialmente a diferena conceitual bsica entre VARIAO NOMINAL e VARIAO REAL, para, em seguida, estudarmos os principais mtodos de transformao de estimativas nominais e reais, com o emprego de nmeros-ndices. 2. AS COMPARAES INTERTEMPORAIS 2.1. VARIAO NOMINAL E VARIAO REAL Para a anlise dos problemas relacionados s comparaes intertemporais, faz-se necessrio inicialmente diferenciar os conceitos de VARIAO NOMINAL e de VARIAO REAL dos agregados macroeconmicos.

Contabilidade Social: Apostila 7 Prof. Assis Mouro

A razo de ser desta diferenciao est em que a estimativa final dos agregados apresentada em UNIDADES MONETRIAS. No restando dvidas quanto nica unidade de medida que se pode empregar para a mensurao dos valores dos agregados macroeconmicos, cabem algumas observaes quanto representatividade das estimativas resultantes para fins de comparaes intertemporais, pois o valor da moeda no permanece constante ao longo de sucessivos perodos de tempo. Praticamente todas as transaes econmicas contabilizadas entre os diferentes agentes econmicos que transacionam em econmicas sob presso inflacionria, incorporaro aumentos nominais, ainda que o nvel real das quantidades transacionadas no registre nenhuma alta. Pode-se extrair, ento, por meio das observaes, as diferenas fundamentais entre os conceitos de variao nominal e variao real: VARIAO NOMINAL Incorpora no s as variaes havidas nas quantidades transacionadas, como tambm as variaes do valor da moeda. VARIAO REAL Limita-se a registrar as variaes quantitativas dos bens e servios finais produzidos e adquiridos (ticas da Produo e da Despesa), ou ento, as variaes quantitativas do emprego de recursos produtivos e dos correspondentes nveis de duas remuneraes. Portanto, para que as comparaes intertemporais dos agregados macroeconmicos tenham sentido, faz-se necessria depurao da variao nominal (presso inflacionria) do valor da moeda. Em outras palavras, as estimativas precisam ser expressas a preos constantes. Mantendo-se constantes os preos, os agregados registraro apenas as variaes reais das transaes, ou seja, variaes ocorridas no QUANTUM das transaes econmicas, eliminando-se, desta forma, as influncias nominais decorrentes das variaes havidas no poder aquisitivo da moeda. 3. METODOLOGIAS PARA O CLCULO DOS AGREGADOS PREOS CONSTANTES 3.1 OS NDICES DE LASPEYRES, PAASCHE E FISHER H dois caminhos diferentes para se calcular os ndices acima mencionados. O primeiro caminho, denominado MTODO DIRETO, consiste em aplicar os preos vigentes (os pesos) no perodo base ao volume fsico transacionado nos sucessivos perodos em considerao, obtendo-se, desta forma, o que se convencionou chamar de NDICES DE QUANTUM. O segundo caminho, denominado MTODO INDIRETO, consiste em calcular a expanso mdia ponderada

Contabilidade Social: Apostila 7 Prof. Assis Mouro

dos preos, por meio destes NDICES DE PREOS, se deflacionam os valores correntes das estimativas dos sucessivos perodos, por meio dos. 3.1.1. OS NDICES DE QUANTUM MTODO DIRETO Designando por p0 os preos dos artigos includos no ndice, vigorantes no ano base; por q0 as quantidades consumidas no mesmo ano, e por p1 e q1 respectivamente os preos e as quantidades no ano cujo ndice se quer determinar, temos, entre muitas outras, as seguintes frmulas para o clculo dos ndices de quantidade. Vale ressaltar que os preos constituem os pesos destes ndices. a) Frmula de LASPEYRES: L = p0 x q1 L = p0 x q0 b) Frmula de PAASCHE: P = p1 x q1 P = p1 x q0 c) Frmula ideal de FISHER: F = p0 x q1 x p1 x q1 P= p0 x q0 = p1 x q0

Mdia geomtrica entre as duas primeiras expresses (Laspeyres e Paasche)

Contabilidade Social: Apostila 7 Prof. Assis Mouro

3.1.2. OS NDICES DE PREO MTODO INDIRETO Utilizando-se a mesma nomenclatura empregada nos NDICES DE QUANTUM, tem-se as seguintes frmulas para o clculo dos ndices ponderados ou NDICES DE PREOS. Vale ressaltar que as quantidades constituem os pesos destes ndices. a) Frmula de LASPEYRES: L = p1 x q0 L = p0 x q0 Expresso que tem a vantagem de no exigir os valores q1, sempre os mais difceis de obter. b) Frmula de PAASCHE: P = p1 x q1 P = p0 x q1 c) Frmula ideal de FISHER: F = p1 x q0 x p1 x q1 P= p0 x q0 = p0 x q1

Mdia geomtrica entre as duas primeiras expresses (Laspeyres e Paasche) As frmulas que contiverem a expresso q1, isto , quantidades consumidas nas diversas pocas, so de execuo mais difcil na prtica, porque muito rara a obteno de tais dados a tempo.

Contabilidade Social: Apostila 7 Prof. Assis Mouro

4. A MENSURAO DOS AGREGADOS PREOS CONSTANTES NO BRASIL De acordo com o manual de metodologia publicado pelo DCS/IBRE, os dois mtodos utilizados para o clculo de dados a preos constantes so o da deflao dos valores a preos correntes (MTODO INDIRETO) e o da projeo dos valores do ano base atravs da aplicao de ndices de quantum adequados (MTODO DIRETO). Internacionalmente, o primeiro mtodo INDIRETO mais difundido, mas o Brasil tem-se, de um modo geral, optado pelo segundo MTODO INDIRETO. Uma primeira razo da dessa escolha tem sido a no disponibilidade de ndices de preos especficos, que reflitam adequadamente a variao ocorrida dentro de cada fluxo. Outra causa so os elevadssimos nveis histricos de inflao registrados no pas, que fazem com que qualquer desvio no clculo dos ndices gere distores de grande monta na estimativa do crescimento real. Dentre as frmulas empregadas para o clculo dos NDICES DE QUANTUM, o Brasil utiliza a do tipo LASPEYRES. Por indisponibilidade de dados bsicos, s tem sido possvel estimar ndices do produto real para os setores agropecurio, industrial (subdividido por seus quatro subsetores: Indstrias Extrativas, de Transformao, Produo e Distribuio de Eletricidade, Gs e gua e Indstria de Construo) e, no mbito do setor servios, para os subsetores de comrcio e de transportes e comunicaes. Desta maneira, a hiptese implcita de que os setores para os quais no h ndices de quantum especficos teriam evoludo a um ritmo idntico ao da mdia ponderada da variao dos setores cujo comportamento pode ser medido diretamente. A responsabilidade de mensurao dos ndices de QUANTUM no Brasil faz parte do conjunto de atribuies do IBGE. Uma vez calculado o ndice de QUANTUM, o IBGE o aplica sobre a srie de preos correntes para obter o PIB a preos constantes. A partir dessas duas sries correlatas, diversos clculos podem ser realizados objetivando a facilitao na manipulao desses mesmos dados, a exemplo do DEFLATOR IMPLCITO, que conceitualmente o resultado do quociente entre o produto a preos correntes e o produto a preos constantes. A partir da srie de Deflatores Implcitos calculada, possvel a mensurao da variao anual deste indicador, informao esta disponibilizada no peridico CONJUNTURA ECONMICA, publicado pela FUNDAO GETLIO VARGAS. Portanto, este captulo objetiva a demonstrao de uma metodologia para o clculo do PIB a preos constantes a partir da manipulao das informaes disponveis no apndice CONJUNTURA ESTATSTICA, tabela CONTAS NACIONAIS, do peridico CONJUNTURA ECONMICA/FGV.

Contabilidade Social: Apostila 7 Prof. Assis Mouro

4.1. UM EXEMPLO PRTICO Por meio dos dados disponveis no peridico CONJUNTURA ECONMICA, construiu-se a tabela a seguir. Cabe-nos agora a tarefa de calcular as informaes restantes, implicando na mensurao dos AGREGADOS A PREOS CONSTANTES.
PIB em milhes de Reais Perodo 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 Preos Correntes 0,0116 0,0603 0,641 14,1 349 646 779 871 914 974 1101 1199 1346 1556 1769 Deflator Implcito

Variao do PIB Real Variao Anual (%)

Preos Constantes Base (%) Variao (Ano-Base 1994) 1994 = 100 Anual (%) 416,68 969,01 1996,15 2240,17 77,55 17,41 8,25 4,85 5,7 8,36 7,44 10,16 14,99 22,26

349

100

As informaes disponveis no peridico, extradas para a construo da tabela so: O PERODO, o PIB PRECOS CORRENTES (no qual est computado a alta dos preos ocasionada pela presso inflacionria) e a VARIACAO ANUAL DO DEFLATOR IMPLCITO, ou seja, as variaes ano a ano dos ndices de QUANTUM. Portanto, por meio dessas informaes, torna-se possvel o clculo do PIB PREOS CONSTANTES e da sua VARIAO REAL. 1 . PASSO: Escolher um dos anos do perodo como ANO-BASE. Todas as informaes calculadas tero como referncia este ano. O ano escolhido para o exemplo ser 1994 e suas implicaes sero as seguintes: O PIB PREOS CONSTANTES de 1994 ser igual ao seu PIB PREOS CORRENTES; A BASE do DEFLATOR IMPLCITO ser igual 100, no ano-base de 1994.

Contabilidade Social: Apostila 7 Prof. Assis Mouro

2 . PASSO: Calcular as BASES do DEFLATOR IMPLCITO para todos os anos, atravs das seguintes frmulas: Para anos INFERIORES ao ANO-BASE: DEFLATOR IMPLCITO ano n = EXEMPLO: DEFLATOR IMPLCITO ano 93 = (DEFLATOR IMPLICTO ano 94 /100) [1 + (VARIAO DO DEFLATOR IMPLCITO ano 94 / 100)] (100/100) [1 + (2.240,17/ 100)] 4,273194% . . (DEFLATOR IMPLICTO ano (n+1) /100) [1 + (VARIAO DO DEFLATOR IMPLCITO ano (n+1) / 100)] .

DEFLATOR IMPLCITO ano 93 =

DEFLATOR IMPLCITO ano 93 =0,04273194 Para anos SUPERIORES ao ANO-BASE:

DEFLATOR IMPLCITO ano n = (DEFLATOR IMPLCITO ano (n1)/100)x[1 + (VARIAO DO DEFLATOR IMPLCITO ano n)] 100 EXEMPLO: DEFLATOR IMPLCITO ano 95 = (DEFLATOR IMPLCITO ano 94/100)x[1 + (VARIAO DO DEFLATOR IMPLCITO ano 95)] 100 DEFLATOR IMPLCITO ano 95 = (100/100)x[1+(77,55)/100] DEFLATOR IMPLCITO ano 95 = 1,7755 3 . PASSO: Calcular o PIB PREOS CONSTANTES para todos os anos, atravs da seguinte frmula: DEFLATOR IMPLCITO BASE ano n = PREOS CORRENTES ano n PREOS CONSTANTES ano n OU 177,55%

Contabilidade Social: Apostila 7 Prof. Assis Mouro

PREOS CONSTANTES ano n = PREOS CORRENTES ano n DEFLATOR IMPLCITO BASE ano n EXEMPLO 1: PREOS CONSTANTES ano 93 = PREOS CORRENTES ano 93 DEFLATOR IMPLCITO BASE ano 93 PREOS CONSTANTES ano 93 = __14,1___ 0,04273194 PREOS CONSTANTES ano 93 = R$ 329,96397 Bilhes de Reais EXEMPLO 2: PREOS CONSTANTES ano 95 = PREOS CORRENTES ano 95 DEFLATOR IMPLCITO BASE ano 95 PREOS CONSTANTES ano 95 = __646___ 1,7755 PREOS CONSTANTES ano 93 = R$ 363,8411715 Bilhes de Reais 4 . PASSO: Calcular a VARIAO REAL DO PIB para todos os anos, atravs da seguinte frmula: PIB ano n = [(. PIB PREOS CONSTANTES ano n .) 1] x 100 PIB PREOS CONSTANTES ano (n 1) EXEMPLO: PIB ano 91 = [(. PIB PREOS CONSTANTES ano 91 .) 1] x 100 PIB PREOS CONSTANTES ano 90 PIB ano 91 = [(. 316,2050816 .) 1] x 100 314,2904414 PIB ano 91 = 0,609194512%

Contabilidade Social: Apostila 7 Prof. Assis Mouro

5 . PASSO: Completar a Tabela:


PIB em milhes de Reais Perodo 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 Preos Correntes 0,0116 0,0603 0,641 14,1 349 646 779 871 914 974 1101 1199 1346 1556 1769 Deflator Implcito Variao do PIB Real Variao Anual (%) 0,609194512 -0,560495961 4,939435991 5,769123823 4,252484671 2,706954513 3,288695461 0,082836615 0,817929444 4,318027292 1,359827896 1,906514930 0,532031534 -7,010513647

Preos Constantes Base (%) Variao (Ano-Base 1994) 1994 = 100 Anual (%) 314,2904414 316,2050816 314,4327648 329,96397 349 363,8411715 373,6901865 385,9797187 386,2994513 389,4591082 406,2760588 411,800714 419,6517561 421,8844357 392,3081698 0,0036909 0,0190699 0,2038592 4,2731938 100 177,55 208,46146 225,65953 236,60401 250,09044 270,998 291,16025 320,74213 368,82138 450,92102 416,68 969,01 1996,15 2240,17 77,55 17,41 8,25 4,85 5,7 8,36 7,44 10,16 14,99 22,26

6 . PASSO: Construir uma nova tabela, tendo como ano-base 2001 e construir outra com ano-base 2004::
PIB em milhes de Reais Perodo 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 Preos Correntes 0,0116 0,0603 0,641 14,1 349 646 779 871 914 974 1101 1199 1346 1556 1769 Deflator Implcito Variao do PIB Real Variao Anual (%)

Preos Constantes Base (%) Variao (Ano-Base 1994) 1994 = 100 Anual (%) 416,68 969,01 1996,15 2240,17 77,55 17,41 8,25 4,85 5,7 8,36 7,44 10,16 14,99 22,26

1101

100