You are on page 1of 17

Econometria Aplicada com uso do R

Alexandre Rodrigues Loures


Universidade Federal da Paraba
Centro de Ciencias Sociais Aplicadas
Programa de Pos-Graduac

a o em Economia
10 de maio de 2015

Econometria Aplicada com R

LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

Captulo 1
Introduca o
1.1
1.1.1

Funcoes
basicas do R
Usando o R como uma calculadora

Pode-se utilizar a linha de comando do R para realizar as quatro operacoes


matematica basicas e outras operacoes
simples.
## Exemplos:
## realizando uma soma
2+2
## [1] 4

o
## realizando uma subtrac
a
15-3
## [1] 12

o
## realizando uma multiplicac
a
2*8
## [1] 16

## realizando uma divis


ao
35/7
## [1] 5
3

Econometria Aplicada com R

CAPITULO
1. INTRODUC
AO

## extraindo a raiz quadrada


sqrt(16)
## [1] 4
Tambem e possvel utiliza-la para realizar operacoes
mais complexas.
## Exemplos:
## calculando o neperiano de 8
log(8)
## [1] 2.079442
## calculando o logaritmo na base 10 de 8
log(8,10)
## [1] 0.90309
## calculando o logaritmo na base 5 de 8
log(8,5)
## [1] 1.29203
## calculando a tangente de 9
tan(9)
## [1] -0.4523157
Outra funcionalidade do R e poder atribuir um valor qualquer a um objeto e
depois utiliza-lo para fazer tanto operacoes
simples quanto complexas.
## Exemplos:
` "q"
## igualando a divis
ao de 200 por 10 a
q<-200/10
## obtendo o resultado da divis
ao anterior
q
LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

Econometria Aplicada com R

1.1. FUNC
OES
BASICAS
DO R

## [1] 20
## multiplicando o objeto "q" por 2
q*2
## [1] 40
## obtendo o seno do objeto "q"
sin(q)
## [1] 0.9129453
## somando 30 ao objeto "q"
q+30
## [1] 50
## subtraindo o objeto "q" de 100
100-q
## [1] 80

LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

Econometria Aplicada com R

LOURES, A. R.

CAPITULO
1. INTRODUC
AO

UNIVERSIDADE FEDERAL DA PARAIBA

Captulo 2
Estatstica Basica
2.1
2.1.1

Medidas de posica o
Medias

Media aritmetica simples


Media aritmetica simples e a soma dos valores de uma serie dividido pelo numero

total de elementos dessa serie. Essa e a media mais utilizada no dia a dia. Sendo a
representaca o matematica como se segue:
n
X

x=

xi

i=1

(2.1)

em que:
xi e cada elemento da serie; e
n e o numero
de elementos da serie.

Para calcular a media aritmetica simples no R utiliza-se a seguinte sintaxe:


## Exemplo:
## criando uma s
erie de dados qualquer
x<-c(15,40,10,25,26,33)
## sintaxe para calcular a m
edia aritm
etica simples
mean(x)
## [1] 24.83333

Media geometrica
Media geometrica e a media das medias e e igual a raiz nesima do produto
(multiplicaca o) entre os elementos de uma serie cuja representaca o matematica e
7

CAPITULO
2. ESTATISTICA
BASICA

Econometria Aplicada com R


como se segue:
g=

x1 x2 xn

(2.2)

ou
1

g = (x1 x2 xn ) n

(2.3)

em que:
xi e cada elemento da serie; e
n e o numero
de elementos da serie.

Ha alguns packages no R que possuem uma sintaxe para o calculo da media


geometrica, contudo, pode-se lembrar da formula
dessa media e calcula-la direta
mente sem o uso de um comando especfico para esse calculo.
## Exemplo:
## criando uma s
erie de dados qualquer
x<-c(15,40,10,25,26,33)
## fazendo o produto interno dos elementos de "x"
prod(x)
## [1] 128700000
## n
umero de elementos da s
erie
n<-6
## calculando a m
edia geom
etrica
prod(x)(1/n)
## [1] 22.46966

Media harmonica

Quando se trata de grandezas inversamente proporcionais (por exemplo: custo e


quantidade) utiliza-se a media harmonica.
Ou seja, essa e aplicada para calcular

o custo medio de bens comprados com uma quantia monetaria fixa, a velocidade
media, etc.. Pois custo medio e igual a C = Pq e velocidade media e igual a V = dt , isto
e , o custo e inversamente proporcional a` quantidade e a velocidade e inversamente
proporcional ao tempo. A formula
da media harmonica
e :

LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA


2.1. MEDIDAS DE POSIC
AO

Econometria Aplicada com R

h=

1
x1

1
x2

n
+ +

1
xn

(2.4)

em que:
xi e cada elemento da serie; e
n e o numero
de elementos da serie.

Assim como para as medias aritmetica simples e a geometrica ha alguns packages


do R que possuem uma sintaxe para o calculo da media harmonica,
entretanto, nao

ha necessidade de instala-los para executar esse calculo, basta entender a formula


e

aplica-la manualmente no R.
## Exemplo:
## criando uma s
erie de dados qualquer
x<-c(15,40,10,25,26,33)
## dividindo 1 (um) por cada elemento do objeto "x"
a<-1/x
## somando os elementos do objeto "a"
b<-sum(a)
## n
umero de elementos da s
erie
n<-6
## calculando a m
edia harm
onica
n/b
## [1] 19.97129

2.1.2

Mediana

A mediana de uma serie de dados qualquer separa a metade inferior da metade


superior. Isto e , 50% da serie terao valores inferiores ou iguais a` mediana e os outros
50% da serie terao valores superiores ou iguais a` mediana. Ha duas observacoes

que precisam ser feitas. Primeiramente, e que os dados devem ser trabalhados
ordenadamente (pode ser ordem crescente ou decrescente), ou seja, nao se deve
trabalhar com dados brutos, isto e , sem ordenaca o. Por exemplo, uma serie de
dados brutos {7,9,1,5,3} precisa ser ordenada {1,3,5,7,9} ou {9,7,5,3,1}. Segundo, deve
verificar se o numero
de termos da serie e par ou mpar, pois havera uma formula

de calculo distinta para cada uma das situacoes.


como uma ultima
observaca o, as

LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

CAPITULO
2. ESTATISTICA
BASICA

Econometria Aplicada com R

formulas
aplicadas no calculo da mediana nao reporta o valor mediano, mas sim, a

posica o em que se encontra o valor mediano. E de posse dessas posicoes


retorna-se
a` serie de dados para localizar a mediana.
Se o numero
de termos da serie dada for par a mediana sera o termo de ordem

.
dado pela formula:
PMd = n+1

2
Se o numero
de termos da serie dada for mpar a mediana sera a media

aritmetica simples dos termos de ordem dados pelas formulas:


PMd = n2 e

PMd = n2 + 1.
em que:
PMd e a posica o do valor mediano na serie; e
n e o numero
de elementos da serie.

Exemplo 2.1: Qual a mediana da serie {1,3,5,7,9}? (Note que a serie ja esta
ordenada, isto e , nao sao dados brutos)
Uma vez que o numero
de termos da serie e mpar aplica-se apenas a formula

n+1
PMd = 2 . Entao,
5+1
2
6
=
2
= 3

PMd =

Logo, o valor mediano encontra-se na 3o. posica o, ou seja, a mediana e Md = 5.


Exemplo 2.2: Qual a mediana da serie {1,3,5,7,9,10}? (Note que a serie ja esta
ordenada, isto e , nao sao dados brutos)
Agora o numero
de termos da serie e par e, portanto, aplica-se as duas formulas:

n
n
PMd = 2 e PMd = 2 + 1. Sendo assim,
6
2
= 3

PMd =
e
PMd

=
=
=4

6
+1
2
3+1

Entao, o valor mediano sera a media aritmetica simples dos valores que se encontram na 3o. e 4o. posicoes
e que sao, respectivamente, 5 e 7.
5+7
2
12
=
2
= 6

x =

LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

10

Econometria Aplicada com R

2.1. MEDIDAS DE POSIC


AO

Logo, a mediana e igual a` Md = 6.


Contudo, no R os valores reportados para a sintaxe da mediana sao os valores
medianos correspondentes a` serie de dados.
## Exemplo:
## criando a s
erie de dados
a<-c(1,3,5,7,9)
## calculando a mediana da s
erie
median(a)
## [1] 5
Para a outra serie tem-se:
## Exemplo:
## criando a s
erie de dados
b<-c(1,3,5,7,9,10)
## calculando a mediana da s
erie
median(b)
## [1] 6

2.1.3

Moda

A moda e o valor da serie que mais ocorre, ou seja, aquele com maior frequencia.
Contudo, em uma serie pode ser que nao haja nenhum termo que se repete e, sendo
assim, tal serie e denominada de amodal. Por sua vez, se dois elementos ocorrem
com maior frequencia a serie e chamada de bimodal e nos casos em que houver mais
de dois elementos que repetem tem-se uma serie multimodal ou polimodal.
No R ha duas formas para se calcular a moda. Se a serie for pequena, facilitando
a identificaca o visual da moda, utilizase a sintaxe table(nome da serie) que reportara os
termos da serie e, abaixo desses, apresentara a frequencia com que cada um ocorre.
Mas para os casos em que a serie e muito grande, o que dificultara a identificaca o
visual, usa-se a sintaxe subset(table(nome da serie),table(nome da serie)==max(table(nome
da serie))) cuja sada apresentara o termo modal e abaixo desse a frequencia com qual
ocorre.

LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

11

Econometria Aplicada com R

CAPITULO
2. ESTATISTICA
BASICA

## Exemplo:
## criando uma s
erie de dados
w<-c(1,2,3,4,4,4,5,6,7)
## encontrando visualmente a moda da s
erie
table(w)
## w
## 1 2 3 4 5 6 7
## 1 1 1 3 1 1 1
Ou ainda pode-se utilizar uma funca o que ira reportar o valor da moda, ou seja,
ira reportar apenas o valor modal e nao a frequencia para cada um dos elementos
da serie.
## Exemplo:
## criando uma s
erie de dados
z<-c(1,2,3,4,4,4,5,6,7)
## encontrando a moda da s
erie
subset(table(z),table(z)==max(table(z)))
## 4
## 3

LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

12

Captulo 3
Regressao Linear Simples
A analise de regressao linear simples estuda a relaca o linear entre duas variaveis
quantitativas. Sendo uma denominada de variavel dependente e a outra de variavel
independente. Essa analise e realizada sob dois pontos de vista distintos:
1. regressao que expressa a forma da relaca o linear entre as duas variaveis; e
2. correlaca o que quantifica a forca dessa relaca o.
Essa relaca o e representada por um modelo matematico, isto e , por uma equaca o
que ira associar a variavel explicada com a variavel explicativa. Sendo a representaca o
matematica dessa associaca o como se segue:
Y = 0 + 1 X +

(3.1)

em que:
Y e a variavel explicada ou dependente que sera calculada e por isso mesmo e
aleatoria;

0 e 1 sao os parametros desconhecidos do modelo que irao ser calculados.


Quando se esta trabalhando com a populaca o se diz que esses sao as estimativas,
contudo, se estiver trabalhando com uma amostra se diz que esses sao os estimadores
dos verdadeiros valores;
X e a variavel explicativa ou independente medida sem erro, isto e , sem aleatoriedade; e
e a variavel aleatoria
residual na qual encontram-se todas as outras variaveis que
influenciam o comportamento da variavel dependente Y e que nao foram includas
no modelo matematico. Ou seja, sao influencias sobre a variavel explicada Y que
nao podem ser explicadas linearmente pelo comportamento da variavel explicativa
X.
Exemplo 3.1: Sera utilizada a Tabela I.1 do livro Econometria Basica, traduca o
da 4 edica o, de Damodar Gujarati.
## Exemplo:
## criando um data.frame com os dados da Tabela I.1
13

Econometria Aplicada com R

LINEAR SIMPLES
CAPITULO
3. REGRESSAO

cons_pessoal<-data.frame(
ano=c(1982,1983,1984,1985,1986,1987,1988,
1989,1990,1991,1992,1993,1994,1995,1996),
dcp=c(3081.5,3240.6,3407.6,
3566.5,3708.7,3822.3,3972.7,4064.6,4132.2,4105.8,4219.8,4343.6,4486.0,
4595.3,4714.1),
pib=c(4620.3,4803.7,5140.1,5323.5,5487.7,5649.5,5865.2,
6062.0,6136.3,6079.4,6244.4,6389.6,6610.7,6742.1,6928.4)
)
## chamando o data.frame criado
cons_pessoal
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

ano
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996

dcp
3081.5
3240.6
3407.6
3566.5
3708.7
3822.3
3972.7
4064.6
4132.2
4105.8
4219.8
4343.6
4486.0
4595.3
4714.1

pib
4620.3
4803.7
5140.1
5323.5
5487.7
5649.5
5865.2
6062.0
6136.3
6079.4
6244.4
6389.6
6610.7
6742.1
6928.4

## obtendo as estatisticas descritvas dos dados


summary(cons_pessoal$dcp)
##
##

Min. 1st Qu.


3082
3638

Median
4065

Mean 3rd Qu.


3964
4282

Max.
4714

Mean 3rd Qu.


5872
6317

Max.
6928

summary(cons_pessoal$pib)
##
##

Min. 1st Qu.


4620
5406

Median
6062

## anexando a base a area de trabalho


attach(cons_pessoal)
## plotando um gr
afico para os valores y e x
plot(pib,dcp)
LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

14

Econometria Aplicada com R

4500

4000

dcp

3500

5000

5500

6000

6500

7000

pib

## adicionando a reta estimada da regress


ao
plot(pib,dcp)
abline(lm(dcppib),col="red",lwd=2)
LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

15


LINEAR SIMPLES
CAPITULO
3. REGRESSAO

Econometria Aplicada com R

4500

4000

dcp

3500

5000

5500

6000

6500

7000

pib

## estimando a regress
ao simples entre dcp e pib
reg<-lm(dcppib)
## chamando a regress
ao linear simples entre dcp e pib
reg
##
##
##
##
##
##
##

Call:
lm(formula = dcp pib)
Coefficients:
(Intercept)
-184.0780

pib
0.7064

## chamando o sum
ario da regress
ao linear simples entre dcp e pib
LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

16

Econometria Aplicada com R

summary(reg)
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##

Call:
lm(formula = dcp pib)
Residuals:
Min
1Q
-39.330 -8.601

Median
1.761

3Q
14.769

Max
31.306

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.841e+02 4.626e+01 -3.979 0.00157 **
pib
7.064e-01 7.827e-03 90.247 < 2e-16 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 20.29 on 13 degrees of freedom
Multiple R-squared: 0.9984,Adjusted R-squared: 0.9983
F-statistic: 8145 on 1 and 13 DF, p-value: < 2.2e-16

LOURES, A. R.

UNIVERSIDADE FEDERAL DA PARAIBA

17

You might also like