Escola de Administração Fazendária – ESAF

Tema: Ajuste Fiscal e Dívida Pública
SubTema: Ajuste Fiscal e Equilíbrio Macroeconômico
Título: MODELO DE PREVISÃO PARA ARRECADAÇÃO TRIBUTÁRIA
i
SUMÁRI O
1 - INTRODUÇÃO 1
2 - REVISÃO BIBLIOGRÁFICA 6
2.1 - SÉRIES TEMPORAIS 6
2.1.1 - Estacionariedade 7
2.1.2 - Função de autocorrelação 8
2.1.3 - Operador de diferença e operador de defasagem 10
2.1.4 - O modelo auto-regressivo (AR) 11
2.1.4.1 - A função de autocorrelação parcial (PACF) 13
2.1.5 - O modelo de médias móveis (MA) 15
2.1.6 - O modelo auto-regressivo de médias móveis (ARMA) 16
2.1.7 - O modelo auto-regressivo integrado de médias móveis (ARIMA) 17
2.1.8 - O modelo sazonal auto-regressivo integrado de médias móveis (SARIMA)
17
2.2- MÉTODOS DE PREVISÃO 19
2.2.1 - Alisamento exponencial 20
2.2.2 - Método de Box-Jenkins 24
2.2.2.1 - Identificação 25
2.2.2.2 - Estimação 29
2.2.2.3 - Verificação de diagnóstico 30
2.3 - Métodos de comparação de previsão 31
2.4 - Softwares estatísticos 33
2.4.1 - O programa R 33
2.4.2 - O programa ITSM2000 33
3 - ANÁLISE DO MÉTODO DE PREVISÃO UTILIZADO PELA SECRETARIA DA
RECEITA FEDERAL (SRF) 35
3.1 - Descrição do método de indicadores 35
3.2 - Resultados 37
3.3 - Análise econométrica 41
4 - ANÁLISE E PREVISÃO DA SÉRIE TEMPORAL DO IMPOSTO SOBRE A
RENDA (IR) 43
4.1 - Considerações gerais 43
ii
4.2 - Análise exploratória 44
4.3 - Modelagem e previsão 50
4.3.1 - Alisamento exponencial 50
4.3.2 - Método Box-Jenkins 52
5 - DISCUSSÃO DOS RESULTADOS 71
5.1 - Comparação de resultados 71
5.2 - Escolha do método de previsão 77
5.3 - Escolha de um modelo SARIMA 79
5.4 - Resultados da previsão para outros impostos 80
5.5 - Previsões com horizonte reduzido 84
6 - CONCLUSÃO 88
7 - REFERÊNCIAS BIBLIOGRÁFICAS 91
APÊNDICE A 93
APÊNDICE B 95
1
1 - I NTRODUÇÃO
Uma das finalidades da Secretaria da Receita Federal (SRF), estabelecida em
seu Regimento Interno pela Portaria nº 227, de 03 de março de 1998, é a “de
realizar a previsão, o acompanhamento, a análise e o controle das receitas sob sua
administração, assim como a de coordenar e consolidar as previsões das demais
receitas federais, para subsidiar a proposta orçamentária da União”. Além de
expresso no Regimento Interno, a atividade de previsão de receitas públicas é um
dos requisitos essenciais da Responsabilidade na Gestão Fiscal, instituída pela
denominada Lei de Responsabilidade Fiscal (Lei Complementar nº 101, de 04 de
maio de 2000, artigo 11).
Dentro desse contexto institucional, a atividade de previsão consiste em
produzir estimativas da arrecadação de todos os tributos e contribuições
administrados pela SRF e demais receitas federais para o exercício seguinte. Então,
pode-se ter como objetivos básicos da atividade de previsão da arrecadação
tributária federal a de constituir-se em um instrumento gerencial aos administradores
e a de subsidiar a elaboração da proposta do Orçamento Geral da União.
Dessa maneira, a previsão da arrecadação dos tributos federais é uma
atividade que exerce influência na atividade econômica do país e não pode ser
relegada a uma atividade meramente cumpridora de exigências legais. Por isso, a
atividade de previsão dos tributos deve possuir características que façam dela uma
ferramenta segura de apoio para a tomada de decisões futura dos policymakers,
2
como planos de investimentos governamentais e planejamento de políticas públicas
de longo prazo. Assim, as previsões devem caracterizar-se pela precisão ou
acurácia de seus resultados, pela simplicidade dos métodos empregados e,
sobretudo, pela confiabilidade estatística dos modelos empregados para gerar as
previsões.
Em vista disso, o presente trabalho tem por objetivo principal desenvolver um
método de previsão baseado em modelos estatísticos e econométricos para a
previsão das receitas tributárias federais. Secundariamente, o trabalho mostrará que
o método de previsão utilizado atualmente no âmbito da Secretaria, denominado
método de indicadores, trata-se de uma prática, embora intuitiva,
econometricamente limitada.
Para cumprir os objetivos, analisou-se o poder preditivo do método de
indicadores e comparou-o a alguns métodos de previsão existentes, como
alisamento exponencial e modelos ARIMA (metodologia Box-Jenkins). A análise
detalhada dos procedimentos foi efetuada para a série temporal da arrecadação
agregada do Imposto sobre a Renda (IR) de julho de 1994 a junho de 1999, com os
meses do ano de 2000 servindo como parâmetros de comparação para as previsões
geradas. Foram estimadas também as previsões para os Impostos de Renda das
Pessoas Físicas e Jurídicas e o Imposto de Renda Retido na Fonte - Rendimentos
do Trabalho.
Esta dissertação encontra-se organizada em três partes principais: uma
revisão bibliográfica que aborda os conceitos básicos de séries temporais e os
3
softwares utilizados nos cálculos; a apresentação dos resultados obtidos para a
previsão dos valores futuros da série do IR para o ano de 2000 pelos métodos dos
indicadores, pelo método de alisamento exponencial e pelo método de Box-Jenkins;
e a discussão sobre os resultados obtidos.
A revisão bibliográfica compreende o estudo dos conceitos básicos de séries
temporais, buscando apresentá-los de forma simples e didática, para que esses
conceitos pudessem ser aplicados no embasamento teórico das metodologias de
previsão. Além disso, os softwares, R para Windows e ITSM2000 para Windows,
também foram objeto de abordagem detalhada.
Os resultados são apresentados por meio de gráficos e tabelas. A
comparação dos resultados se dá na parte da discussão, onde os resultados para os
três métodos são analisados detidamente e seus desempenhos preditivos colocados
à prova. Nessa parte, uma metodologia de previsão é indicada como satisfatória
para gerar as previsões dos tributos federais administrados pela Receita Federal.
A continuação desta dissertação está organizada em mais 5 capítulos: revisão
bibliográfica, análise do método dos indicadores, análise e previsão do IR, discussão
dos resultados e conclusão.
No capítulo 2 é realizado um resumo dos principais conceitos sobre séries
temporais, que envolvem a caracterização da estacionariedade de uma série,
funções de autocorrelação e autocorrelação parcial, modelos auto-regressivos, de
médias móveis e sua combinação, modelos integrados e modelos sazonais. Em
4
seguida, faz-se uma apresentação do método de previsão por alisamento
exponencial, mostrando-se os algoritmo de Holt-Winters sazonal aditivo e
multiplicativo, e da metodologia de Box-Jenkins, apresentando-se as três etapas do
ciclo iterativo que a compõe. A seguir, mostram-se os métodos mais utilizados para
a comparação dos resultados de previsão, os chamados índices de acurácia ou
precisão, e uma medida de acurácia, o MSE, é escolhida. Conclui-se o capítulo com
uma apresentação dos programas estatísticos empregados nesta dissertação, o R
para Windows e o ITSM2000 para Windows.
No capítulo 3 é feita uma análise dos métodos dos indicadores com a
descrição do método, a apresentação dos resultados das previsões geradas para 12
meses do ano de 2000 para os impostos de Renda agregado, o imposto de renda
sobre Pessoas Físicas e Jurídicas e o imposto de Renda Retido na Fonte -
Rendimentos sobre o Trabalho. A seguir, uma análise econométrica é empregada no
método para se determinar a confiança estatística das previsões geradas pelo
método utilizado pela Receita Federal.
No capítulo 4 é efetuada uma análise exploratória da série do IR agregado e
possíveis valores outliers são considerados. Ressalta-se que por causa dos outliers
6 diferentes séries do IR serão analisadas. Em seguida, são geradas previsões para
a série do IR pelos métodos de alisamento exponencial e Box-Jenkins. Todas as
etapas da metodologia de Box-Jenkins são explicadas e possíveis modelos são
escolhidos por meio de um critério de seleção de modelos, o BIC. Os modelos
escolhidos são testados pelos métodos de diagnóstico disponíveis no programa R.
5
No capítulo 5 os resultados obtidos nos capítulos 3 e 4 são comparados
utilizando os valores do BIC e do MSE. A seguir, faz-se uma escolha do método com
melhores capacidades preditivas que servirá como sugestão para a utilização pela
Secretaria da Receita Federal. Em seguida, são apresentadas as previsões para as
séries desagregadadas do IR, ou seja, as séries do IRPF, IRPJ e IRRF (rendimentos
do trabalho) e comparadas com as previsões obtidas pelo método dos indicadores.
Conclui-se apresentando previsões para horizontes reduzidos, com 1 passo e 3
passos à frente, de maneira que tal procedimento possa servir como uma espécie de
ajuste de previsões já realizadas.
O capítulo final faz uma conclusão sobre os métodos empregados na
dissertação, sugere mudanças na forma de produção de previsões e indica
possíveis extensões do trabalho.
6
2 - REVI SÃO BI BLI OGRÁFI CA
Neste capítulo serão apresentados os conceitos básicos de séries temporais para
subsidiar a explicação dos métodos de previsão por alisamento exponencial e
metodologia Box-Jenkins. Além disso, os softwares estatísticos utilizados neste
trabalho são analisados e seu funcionamento é apresentado.
2. 1 - SÉRI ES TEMPORAI S
Uma série temporal caracteriza-se como um conjunto de observações que
representa uma variável observada ao longo do tempo. Quando as observações são
obtidas continuamente, isto é, a todo instante ao longo do tempo, diz-se que a série
temporal é contínua, cuja representação é X(t). Contrariamente, uma série temporal
discreta é aquela em que as observações são tomadas em um conjunto discreto, ou
seja, em intervalos fixos de tempo, cuja representação é dada por X
t
.
Uma série temporal {x
t
} é a realização de uma família de variáveis aleatórias
{X
t
}. De outra maneira, um modelo de série temporal para dados observados {x
t
} é
uma especificação das distribuições de uma seqüência de variáveis aleatórias {X
t
}
da qual {x
t
} é denominada uma realização [Brockwell & Davis, 1996]. São
necessários para a caracterização da seqüência de variáveis aleatórias somente os
momentos de primeira e segunda ordem da distribuição conjunta [Granger &
Newbold, 1986]. O momento de primeira ordem é definido como o valor esperado ou
média de X
t
:
7
( ).
t t
X E · µ
O momento de segunda ordem é definido como o produto esperado ou a covariância
entre X
t
e X
s
:
( ) ( )( ) [ ] . , cov
, s s t t s t s t
X X E X X µ µ γ − − · ·
Define-se também a variância de X
t
como
( ) ( ) ( )( ) [ ] ( ) [ ]. var , cov
2
, t t t t t t t t t t t
X E X X E X X X µ µ µ γ − · − − · · ·
2.1.1 - Est aci onar i edade
Uma série temporal {X
t
} é dita ser (fracamente) estacionária se
( ) ; µ ·
t
X E (i)
;
2
,
∞ < ·
x t t
(ii) σ γ
.
, s t s t
(iii)

· γ γ
Então, um processo estacionário apresenta média (condição (i)) e
variância (condição (ii)) constantes ao longo do tempo t e a covariância (condição
(iii)) entre os dois pontos dependente da distância entre esses pontos e
independente do tempo t [Granger & Newbold, 1986].
Em vista da condição (iii), tem-se que
0
2
γ σ ·
x
e a covariância é usualmente escrita como
( ). , cov
t h t h
X X
+
· γ
(1.4)
(1.5)
(1.2)
(1.3)
(1.1)
8
2.1.2 - Função de aut ocor r el ação
Define-se a função de autocovariância de uma série temporal
estacionária {X
t
} como
( ) ( ) . , cov
t h t x
X X h
+
· γ
A função de autocorrelação (ACF) de uma série temporal estacionária
{X
t
} é definida como
( )
( )
( )
( ). ,
0
t h t
x
x
x
X X cor
h
h
+
· ·
γ
γ
ρ
As funções de autocovariância e de autocorrelação fornecem uma
medida útil do grau de dependência entre os valores de uma série temporal em
diferentes períodos. As autocorrelações medem ainda o tamanho e a força da
“memória” do processo.
O gráfico das autocorrelações amostrais versus h é chamado de
correlograma. Tal gráfico apresenta valores que serão utilizados para caracterizar as
propriedades lineares ou não do mecanismo gerador do processo [Granger &
Newbold, 1986]. Porém, não é simples examinar um correlograma e extrair dele as
correspondentes propriedades populacionais. O que se faz necessário é averiguar
alguns modelos plausíveis que provejam correlogramas de formas reconhecidas.
As funções de autocovariância e autocorrelação amostrais podem ser
(1.6)
(1.7)
9
calculadas para qualquer conjunto de dados e não estão restritas a observações de
séries temporais estacionárias [Brockwell & Davis, 1996]. Para dados contendo
tendência, a ACF exibirá um decaimento lento na medida que t aumenta, conforme
mostra a Figura 1.1. Para dados com um componente periódico determinístico,
como sazonalidade, a ACF exibirá um comportamento similar ao período, conforme
a Figura 1.2.
-1.00
-.80
-.60
-.40
-.20
.00
.20
.40
.60
.80
1.00
0 5 10 15 20 25 30 35 40
SampleACF
Figura 1.1 - Correlograma para um série com tendência
-1.00
-.80
-.60
-.40
-.20
.00
.20
.40
.60
.80
1.00
0 5 10 15 20 25 30 35 40
ACF amostral
10
Figura 1.2 - Correlograma para um série com sazonalidade
Assim, o correlograma pode ser utilizado como um indicador de não-
estacionariedade da série temporal [Brockwell & Davis, 1996]. Deve-se notar que as
linhas tracejadas nas Figuras 1.1 e 1.2 representam limites de significância
estatística, acima dos quais as autocorrelações são consideradas significativamente
diferentes de zero.
2. 1. 3 - Oper ador de di f er ença e oper ador de def asagem
Considere a série temporal {X
t
}, com t = 0,..., n. A primeira diferença da
série é definida como
,... 3 , 2 , 1 ,
1
· − · ∆

t x x x
t t t
O operador ∆ é denominado operador de diferença. Generalizando (1.8), a n-ésima
diferença da série é dada por
( )
( )
.
! !
!
, 1
.
0
1
1 1
r n r
n
r
n
onde x
r
n
x x x
r t
r
n
r
t
n
t
n
t
n

·

,
_

¸
¸

,
_

¸
¸
− · ∆ − ∆ · ∆

·

− −

Deve-se notar que n observações são perdidas ao se calcular a n-ésima diferença.
O operador de defasagem B é definido como
.
1 −
·
t t
x Bx
Generalizando (1.10),
,... 2 , 1 , 0 , · ·

n x x B
n t t
n
O operador B pode ser utilizado na forma polinomial, de maneira que
(1.8)
(1.9)
(1.10)
11
t n t n t t t
k x d x d x d x · + + + +
− − −
L
2 2 1 1
pode ser escrito como
( )
t t
n
n
k x B d B d B d · + + + + L
2
2 1
1
ou
( ) ,
t t
k x B d ·
onde
( ) ( ). 1
1
n
n
B d B d B d + + + · L
2. 1. 4 - O model o aut o- r egr essi v o ( AR)
Um modelo auto-regressivo é definido de maneira que os valores da
série no tempo t dependem dos valores passados. Mais especificamente o modelo
autoregressivo de orem p AR(p) é
,
1
1 2 1 1 ∑
·
− − − −
+ · + + + + ·
p
j
t j t j t p t p t t t
X X X X c X ε φ ε φ φ φ L
onde a série {ε
t
} é ruído branco
1
com média zero e E[X
t
ε
t+s
] = 0, para s>0.
Escrevendo a equação (1.12) em termos do polinômio do operador de defasagem B
tem-se que
( ) .
t t
c X B ε φ + ·
O polinômio φ(B) de ordem p é chamado de polinômio AR e tem-se que
( ) . 1
2
2 1
p
p
B B B B φ φ φ φ − − − − · L
Para que a condição de estacionariedade para modelos AR(p) seja
(1.11)
(1.12)
(1.13)
12
satisfeita é necessário que as raízes do polinômio φ(B) estejam foram do círculo
unitário (no plano complexo). Para um modelo AR(1),
,
1 1 t t t
X c X ε φ + + ·

a condição de estacionariedade é satisfeita quando |φ |<1.
Assumindo que a condição de estacionariedade está satisfeita, a média
do processo AR(p) é obtida tomando os valores esperados em (1.12),
, ...
2 1
µ φ µ φ µ φ µ
p
c + + + + ·
ou ainda,
( )
p
c
φ φ φ
µ
− − − −
·
L
2 1
1
As autocovariâncias são calculadas multiplicando-se ambos os lados de (1.14) por
(X
t-j
- µ) e tomando os valores esperados,
. 0 ,
, 2 , 1 ,
2
1 1
1 1
{
· + + +
· + +
·
− −
h
h
p p
p h p h
h
σ γ φ γ φ
γ φ γ φ
γ
L
L L
A autocorrelação é obtida dividindo-se a equação (1.15) por γ
0,
L L , 2 , 1 ,
1 1
· + + ·
− −
h
p h p h h
ρ φ ρ φ ρ
As p equações obtidas de (1.16) são denominadas de equações de Yule-Walker e
podem ser escritas na forma matricial como
, ñ ö P ·
onde
( ) ( )

·

·
p 2 1 1
ö ñ φ φ φ ρ ρ ρ , , , , , , ,
2
L L
p

1
Para definição sobre o processo ruído branco consultar [Granger & Newbold, 1986]
(1.15)
(1.16)
.
(1.14)
13
e
1
1
1
1
1
]
1

¸

·
− − −


1
1
1
3 2 1
2 1 1
1 2 1
K
M M M
K
K
p p p
p
p
ρ ρ ρ
ρ ρ ρ
ρ ρ ρ
P
.
Então,
ñ, P ö
1 −
·
de forma que os parâmetros auto-regressivos podem ser expressos como uma
função das p autocorrelações [Mills, 1990].
O comportamento da função de autocorrelação de um processo auto-
regressivo é uma mistura de decaimento exponencial e/ou decaimento senoidal. Se
as raízes da equação auto-regressiva forem reais, então as autocorrelações
decairão exponencialmente. Caso as raízes sejam complexas, o decaimento será na
forma senoidal [Granger & Newbold, 1986].
2.1.4.1 - A f unção de aut ocor r el ação par ci al ( PACF)
Em um processo AR(1), X
t
e X
t-2
são correlacionados, mesmo que X
t-2
não apareça diretamente no modelo. O valor da correlação entre X
t
e X
t-2
(i.e., ρ
2
) é
igual à correlação entre X
t
e X
t-1

1
) multiplicada pela correlação entre X
t-1
e X
t-2

1
),
de forma que ρ
2
= ρ
1
2
. Assim, toda essa correlação “indireta” está presente na ACF
de qualquer processo auto-regressivo [Enders, 1995].
Dessa maneira, define-se a função de autocorrelação parcial
14
(PACF) como a seqüência de correlações entre (X
t
e X
t-1
), (X
t
e X
t-2
), (X
t
e X
t-3
) e
assim por diante, desde que os efeitos de defasagens anteriores sobre X
t
permaneçam constantes [Hill, Griffiths & Judge, 1999]. A PACF é calculada como o
valor do coeficiente φ
kk
na equação
.
2 2 1 1 t k t kk t k t k t
e X X X X + + + + ·
− − −
φ φ φ L
O coeficiente φ
kk
é obtido das equações de Yule-Walker aplicadas a
(1.17). Tais equações são dadas por (1.16) e, substituindo p = k e φ
i
= φ
ii
, tem-se
[Mills, 1990]
.
1
1
1
1
1
1 2 1
2 3 1
1 2 1
1 2 1
2 3 1
1 2 1
ρ ρ ρ
ρ ρ ρ
ρ ρ ρ
ρ ρ ρ ρ
ρ ρ ρ
ρ ρ ρ
φ
L
M M L M M
L
L
L
M M L M M
L
L
− −
− −
− −
− −


·
k k
k k
k k
k k k
k
k
kk
Assim, para um processo AR(p) não há correlação entre X
t
e X
t-k
para
k > p [Mills, 1990]. Então, todos os valores de φ
kk
para k > p são zero e a PACF para
um processo AR(p) puro apresenta um “corte” para zero para defasagens maiores
que p [Enders, 1995].
Assim, pode-se resumir que um processo AR(p) é descrito por:
- possuir uma função de autocorrelação, ACF, que é uma
combinação de decaimentos exponenciais e senoidais e tamanho
(1.17)
15
infinito; e
- possuir uma função de autocorrelação, PACF, que é zero para
defasagens maiores que p.
2. 1. 5 - O model o de médi as móv ei s ( MA)
O modelo de médias móveis de ordem q, MA(q), é dado pela forma
, 1 ,
0
0 2 2 1 1 ∑
·
− − − −
≡ + · + + + + + ·
q
j
j t j q t q t t t t
X θ ε θ µ ε θ ε θ ε θ ε µ L
onde {ε
t
} é ruído branco com média zero. Alternativamente,
( ) ( ) , 1 ,
1
q
q t t
B B B B X θ θ θ ε θ + + + · · L
onde θ(B) é o polinômio do operador de defasagem B. Um processo MA(q) é dito ser
invertível se as raízes de
0 1
2
2 1
· + + + +
q
q
z z z θ θ θ L
se encontrarem fora do círculo unitário.
As autocovariâncias de ordem superior são
( )( ) ( )( )
q j t q j t j t q t q t t j t t j
E X X E
− − − − − − − −
+ + + + + + · − − · ε θ ε θ ε ε θ ε θ ε µ µ γ L L
1 1 1 1
e, como os termos envolvendo produtos de ε´s em diferentes instantes de tempo têm
valor esperado zero, para j > q, γ
j
= 0, seguindo que
( ) , , , 2 , 1 ,
2
1 1 1
q j
j q q j j
L L · + + + ·
− +
σ θ θ θ θ θ γ
. , 0 q j
j
> · γ
Dessa feita, para um processo MA(q) a ACF apresenta um “corte” para zero para
(1.18)
(1.19)
16
defasagens maiores que q [Mills, 1990]. A função de autocorrelação parcial de um
processo MA(q) possui tamanho infinito [Mills, 1990].
Pode-se resumir que um processo MA(q) é descrito por:
- possuir uma ACF que é zero para defasagens maiores que q; e
- possuir uma PACF que é uma combinação de decaimentos
exponenciais e senoidais e tamanho infinito.
2. 1. 6 - O model o aut o- r egr essi v o de médi as móv ei s
( ARMA)
Um processo ARMA(p,q) é uma generalização dos modelos AR(p) e
MA(q), sendo definido como
q t q t t t p t p t t t
X X X c X
− − − − − −
+ + + + + + + + + · ε θ ε θ ε θ ε φ φ φ L L
2 2 1 1 2 2 1 1
ou ainda na forma polinomial
( ) ( ) .
t t
B c X B ε θ φ + ·
A série temporal {X
t
} é estacionária se e somente se as raízes de φ(z)
estiverem fora do círculo unitário. A série temporal {X
t
} é invertível se e somente se
as raízes de θ(z) estiverem fora do círculo unitário. Para os modelos ARMA, as
funções de autocorrelação (ACF) e autocorrelação parciais (PACF) decaem até o
infinito em vez de apresentarem um “corte” em alguma defasagem particular, como
ocorre com os processos AR e MA puros [Mills, 1990]. Assim, para um processo
ARMA(p,q), a ACF decairá, seja diretamente ou oscilando ao redor de zero, a partir
(1.20)
17
da defasagem q. Por sua vez, a PACF decairá, seja diretamente ou oscilando ao
redor de zero, a partir da defasagem p [Enders, 1995].
2. 1. 7 - O model o aut o- r egr essi v o i nt egr ado de médi as
móvei s ( ARI MA)
Se d for um número inteiro não-negativo, então uma série temporal {X
t
}
é dita ser um processo ARIMA(p,d,q) ou um processo integrado de ordem d se
( )
t
d
t
d
t
X X B Y ∆ · − · 1
for um processo ARMA(p,q) causal [Brockwell & Davis, 1996]. Um processo
integrado é utilizado para séries não-estacionárias.
Assim, um modelo ARMA(p,q) é um modelo ARIMA(p,0,q).
Alternativamente, {X
t
} deve satisfazer
( ) ( ) ( ) , ] 1 [
t t
d
B X B B ε θ µ φ · − −
onde {ε
t
} é ruído branco com média zero, φ(B) e θ(B) são polinômios de ordem p e q,
respectivamente, φ(B) é um operador estacionário, µ é a média de ∆
d
X
t
e d é a
ordem de diferenciação. A ordem de diferenciação será 0 ou 1 para a maioria dos
processos e raramente d = 2 [Granger & Newbold, 1986].
2. 1. 8 - O model o sazonal aut o- r egr essi v o i nt egr ado de
médi as móvei s ( SARI MA)
Suponha uma série temporal sazonal não-estacionária {X
t
} observada s
(1.21)
18
períodos por ano, de maneira que s = 4 para séries trimestrais e s = 12 para séries
mensais. Uma forma de remover a sazonalidade da série e transformá-la em uma
série estacionária {Z
t
}, para que um modelo ARIMA possa ser empregado, é efetuar
uma diferenciação sazonal, nos moldes da diferenciação vista anteriormente. Assim,
( ) . 1
t t
s
s t t
Z X B X X · − · −

Contudo, em muitos casos é necessário adicionar ao modelo uma modelagem de Z
t
determinada por seu padrão sazonal, então
( )( ) ( ) , 1
t
s
t
D
s s
Z B X B B Θ · − Φ
onde
( ) ( ) , 1
1
Ps
Ps
s
s
s
B B B Φ − − Φ − · Φ L
( ) ( ). 1
1
Qs
Qs
s
s
s
B B B Θ + + Θ + · Θ L
Pela equação (1.22), nota-se que o padrão sazonal é aleatório entre os ciclos s
[Brockwell & Davis, 1996].
Se a sazonalidade da série Z
t
tiver sido filtrada, um modelo
ARIMA(p,d,q) regular pode representar Z
t
, assim
( )( ) ( ) , 1
t t
d
B X B B ε θ φ · −
onde
( ) ( ), 1
1
p
p
B B B φ φ φ − − − · L
( ) ( ), 1
1
q
q
B B B θ θ θ + + + · L
e {ε
t
} é ruído branco com média zero.
Combinando (1.22) e (1.23), chega-se a classe de modelos sazonais
(1.22)
(1.23)
19
multiplicativos ARIMA(p,d,q)x(P,D,Q) ou SARIMA,
( ) ( )( ) ( ) ( ) ( ) , 1 1
t
s
t
D
s d s
B B X B B B B ε θ φ Θ · − − Φ
onde {ε
t
} é ruído branco com média zero. Nessa classe de modelos permite-se tanto
a diferenciação regular quanto a diferenciação sazonal. Nota-se que a série
diferenciada pode ser representada usando tanto componentes auto-regressivos e
de médias móveis regulares quanto sazonais. Em geral, o valor para D é raramente
maior que um e os valores de P e Q não ultrapassam 2 [Brockwell & Davis, 1996].
O processo representado por (1.24) é causal se e somente se φ(B) ≠ 0
e Φ (B) ≠ 0, para | z | ≤ 1, ou seja, se as raízes do polinômios auto-regressivos se
encontrarem fora do círculo unitário [Brockwell & Davis, 1996]. Um modelo particular
dessa classe de modelos é o chamado modelo “airline”, um modelo
SARIMA(0,1,1)(0,1,1).
A seguir, os modelos teóricos apresentados nessa seção serão
aplicados nas metodologias de previsão de alisamento exponencial e Box-Jenkins.
Tais metodologias utilizam conceitos e procedimentos diferentes para produzir
prognósticos de séries univariadas, que são séries que possuem somente um
conjunto de dados.
2. 2- MÉTODOS DE PREVI SÃO
Nesta seção, serão apresentados dois métodos de previsão. O primeiro
método, denominado de alisamento exponencial (exponential smoothing), é
(1.24)
20
considerado um método automático de previsão e seu procedimento é bem simples.
O segundo método, denominado de metodologia Box-Jenkins, é um método de
utilização mais complexa que o anterior e emprega a classe de modelos
ARIMA/SARIMA em sua concepção.
2.2.1 - Al i sament o ex ponenci al
O alisamento exponencial é um procedimento geral para obtenção de
algoritmos de previsão automática que produz resultados relativamente acurados, de
maneira rápida e barata [Granger & Newbold, 1986].
A forma mais simples de alisamento exponencial é aquela para séries
temporais que não possuem sazonalidade nem tendência crescente ou decrescente.
O objetivo é estimar o “nível” (ou a “média”) presente da série e usar esse nível
como previsão de valores futuros. O nível da série no tempo t é estimado como
( ) ( ) , 1 1
2
2
1
L + − + − + ·
− − t t t t
x x x x α α α α α
com 0 < α < 1. Uma forma mais simples de cálculo é obtida substituindo t por t-1 e
multiplicando os dois lados de (1.46) por (1-α), o que leva a
( ) . 1
1 −
− + ·
t t t
x x x α α
A previsão de todos os valores futuros (f
n,h
), com h = 1, 2,. . ., é obtida utilizando-se a
equação (1.26), i.e.,
.
, n h n
x f ·
Para se iniciar o algoritmo é necessário especificar um valor inicial, que usualmente
é [Granger & Newbold, 1986]
.
1 1
x x ·
(1.25)
(1.26)
21
O peso de cada termo é determinado pelo valor de α, a constante de
suavização. A escolha dessa constante é feita de maneira que seu valor minimize a
soma dos erros quadrados [Janacek, 2001]. O erro de previsão é definido como
,
1 , 1 −
− ·
t t t
f x e
para t = 3, 4, ... , n. Então, a soma dos erros quadrados é dada por
( ) .
3
2
1 , 1
3
2
∑ ∑
·

·
− · ·
n
t
t t
n
t
t
f x e S
Caso a série temporal apresente tendência, a equação (1.26) não é
capaz de fazer previsões de movimentos crescentes ou decrescentes futuros. O
algoritmo de alisamento exponencial de Holt-Winters leva em consideração esses
movimentos e permite estimar também a inclinação atual da série.
O nível e a inclinação da série são dados, respectivamente, por
( )( )
( ) ( ) , 1
, 1
1 1
1 1
− −
− −
− + − ·
+ − + ·
t t t t
t t t t
T x x T
T x x x
β β
α α
com 0 < α < 1 e 0 < β < 1, constantes de suavização. As previsões são obtidas
supondo um acréscimo ou decréscimo continuado dado pela última estimativa de
inclinação; assim,
. , , 4 , 3 ,
,
n h hT x f
n n h n
K · + ·
Os possíveis valores iniciais do algoritmo são
.
,
1 2 2
2 2
x x T
x x
− ·
·
Os valores para as constantes de suavização são obtidos como anteriormente, de
forma que seus valores minimizem a soma dos quadrados dos erros de previsão um
(1.27)
22
passo à frente. O erro de previsão é dado por
( ) . , , 5 , 4 ,
1 1 1 , 1
n t T x x f x e
t t t t t t
K · + − · − ·
− − −
Então, a soma dos erros quadrados é
( ) .
4
2
1 , 1
4
2
∑ ∑
·

·
− · ·
n
t
t t
n
t
t
f x e S
Se a série temporal contiver movimentos sazonais de período s, o
algoritmo de Holt-Winters precisa ser modificado para que a sazonalidade seja
estimada. Assim, o algoritmo de Holt-Winters sazonal é definido de modo que para
cada período seja necessário estimar um fator de sazonalidade, F
t
. No instante t, a
última estimativa do fator de sazonalidade para o período é F
t-s
(obtido do mesmo
período do ano anterior) [Cribari-Neto, 2000]. As equações para o nível, a inclinação
e para o fator de sazonalidade são, considerando que a sazonalidade seja aditiva,
( ) ( )( )
( ) ( )
( ) ( )( ) , 1
, 1
, 1
1 1
1 1
s t t t t
t t t t
t t s t t t
F x x F
T x x T
T x F x x

− −
− − −
− + − ·
− + − ·
+ − + − ·
γ γ
β β
α α
com 0 < α < 1 , 0 < β < 1 e 0 < γ < 1, constantes de suavização. As previsões são
dadas por
M
K
K
, 2 , , 2 , 1 ,
, , , 2 , 1 ,
2
,
s s s h F hT x
s h F hT x f
s h t n n
s h t n n h n
+ + · + + ·
· + + ·
− +
− +
Considerando a sazonalidade multiplicativa, as equações para o nível,
a inclinação e para o fator de sazonalidade são, respectivamente,
(1.28)
23
( )( )
( ) ( )
( )( ) , 1
, 1
, 1
1 1
1 1
s t
t
t
t
t t t t
t t
s t
t
t
F
x
x
F
T x x T
T x
F
x
x

− −
− −

− +

,
_

¸
¸
·
− + − ·
+ − +

,
_

¸
¸
·
γ γ
β β
α α
com 0 < α < 1 , 0 < β < 1 e 0 < γ < 1, constantes de suavização. As previsões são
dadas por
( )
( )
.
, 2 , , 2 , 1 ,
, , , 2 , 1 ,
2
,
M
K
K
s s s h F hT x
s h F hT x f
s h t n n
s h t n n h n
+ + · + ·
· + ·
− +
− +
Os possíveis valores iniciais do algoritmo podem ser [Brockwell & Davis, 1996]
( )
( ) ( ) . , , 1 , 1
,
,
1
1 1
1
1 1
s i i T x x F
s
x x
T
x x
s i i i
s
s
s s
K · − + − ·

·
·
+
+
+
+ +
Tanto para a sazonalidade aditiva quanto para a sazonalidade
multiplicativa, os valores das constantes de suavização são calculados de forma a
minimizar a soma dos quadrados dos erros de previsão um passo à frente. O erro de
previsão é
( ) . , , 5 1 , 14 ,
1 1 1 , 1
n t F T x x f x e
s t t t t t t t
K · + + − · − ·
− − − −
Então, a soma dos erros quadrados é
( ) .
14
2
1 , 1
14
2
∑ ∑
·

·
− · ·
n
t
t t
n
t
t
f x e S
As formas aditivas e multiplicativas do algoritmo de Holt-Winters
sazonal podem fornecer previsões bem diferentes. Se a série apresentar oscilações
(1.29)
24
sazonais aproximadamente constantes, o modelo aditivo é mais indicado. Porém, se
as oscilações sazonais forem proporcionais ao nível da série, o modelo multiplicativo
é mais indicado. Alternativamente, pode-se utilizar os dois procedimentos e escolher
aquele que fornece a menor soma dos erros de previsão um passo à frente ao
quadrado [Cribari-Neto, 2000].
2. 2. 2 - Mét odo de Box - Jenk i ns
Dada uma série temporal não-sazonal não-estacionária {X
t
}, considere
que ela possa ser representada por um modelo da classe ARIMA(p,d,q),

( )( ) ( ) , 1
t t
d
B X B B ε θ φ · −
onde
( ) ( ) , 1
1
p
p
B B B φ φ φ − − − · L
( ) ( ). 1
1
q
q
B B B θ θ θ + + + · L
O objetivo da metodologia de Box-Jenkins [Box & Jenkins, 1970] é
encontrar um modelo estocástico linear da classe ARIMA que possa ter gerado {X
t
} e
que esse modelo possa ser utilizado para fornecer previsões de valores futuros da
série [Granger & Newbold, 1986]. Caso a série temporal {X
t
} apresente
sazonalidade, {X
t
} pode ser representada por um modelo da classe
SARIMA(p,d,q) (P,D,Q), conforme a equação (1.24).
A estratégia de modelagem, tanto para modelos sazonais quanto para
não-sazonais, é baseada em um ciclo de três etapas iterativas:
25
(i) identificação do modelo;
(ii) estimação do modelo; e
(iii) verificação de diagnóstico.
A etapa de identificação consiste em selecionar valores para p, d, q e
P, D, Q (no caso de modelos sazonais). Essa etapa envolve subjetividade e
julgamento pessoal. Na etapa de estimação, os coeficientes identificados na etapa
anterior são estimados usando técnicas estatísticas. A última etapa indica se o
modelo identificado e estimado descreve adequadamente o comportamento dos
dados da série {X
t
}. Caso o modelo não seja adequado, o ciclo deve começar
novamente [Cribari-Neto, 2000].
Um conceito importante nessa metodologia é o princípio da parcimônia
[Enders, 1995]. Tal princípio sugere que modelos mais simples, com poucos
parâmetros, produzem melhores previsões que modelos superparametrizados. Um
modelo parcimonioso ajusta bem os dados sem incorporar coeficientes inúteis. O
objetivo é se aproximar do processo gerador original dos dados e não descrevê-lo
exatamente [Enders, 1995].
2.2.2.1 - I dent i f i cação
Essa etapa é considerada a mais difícil e delicada, e não há consenso
sobre qual a melhor estratégia a ser seguida [Granger & Newbold, 1986]. Dentre as
várias estratégias existentes, duas se destacam: a análise das funções de
26
autocorrelação e autocorrelação parcial amostrais, e o uso de um critério de seleção
de modelos.
Para utilizar a primeira estratégia é necessário reconhecer modelos
AR, MA e ARMA por meio das características da ACF e da PACF. A Tabela 2.1
resume as propriedades da ACF e da PACF para diversos modelos ARIMA [Mills,
1990]. Para modelos sazonais, o comportamento da ACF e da PACF deve ser
analisado também próximo da defasagem sazonal, por exemplo, defasagem 12 para
dados mensais e defasagem 4 para dados trimestrais. A Tabela 2.2 resume as
propriedades da ACF e da PACF para modelos SARIMA [Bowerman & O’Connell,
1987].
Tabela 2.1 - Propriedades da ACF e da PACF para vários modelos ARIMA
Modelo ACF PACF
(1,d,0)
Decaimento exponencial ou
oscilatório
φ
kk
=0 para k > 1
(2,d,0)
Decaimento exponencial ou
senoidal
φ
kk
=0 para k > 2
(p,d,0)
Decaimento exponencial e/ou
senoidal
φ
kk
=0 para k > p
(0,d,1)
ρ
k
= 0 para k > 1 Dominado por decaimento
exponencial
(0,d,2)
ρ
k
= 0 para k > 2 Dominado por decaimento
exponencial ou senoidal
(0,d,q)
ρ
k
= 0 para k > q Dominado pela combinação
linear de decaimento
exponencial e/ou senoidal
(1,d,1)
Decaimento exponencial a
partir da defasagem 1
Dominado por decaimento
exponencial a partir da
defasagem 1
(p,d,q)
Decaimento exponencial e/ou
senoidal depois da defasagem
q-p
Dominado por decaimento
exponencial ou senoidal
depois da defasagem q-p
27
Tabela 2.2 - Propriedades da ACF e da PACF para modelos SARIMA
Modelo ACF PACF
(P,D,0) Decaimento Picos nas defasagens s, 2s, ...Ps
e corte após Ps
(0,D,Q) Picos nas defasagens s, 2s, ...Qs
e corte após Qs
Decaimento
(P,D,0)
ou
(0,D,Q)
Picos nas defasagens s, 2s, ...Qs
e corte após Qs
Picos nas defasagens s, 2s, ...Ps
e corte após Ps
(P,D,0)
e
(0,D,Q)
Decaimento rápido na
defasagem sazonal
Decaimento rápido na
defasagem sazonal
Nenhum
operador
sazonal
Valores pequenos em todas as
defasagens sazonais (não há
picos)
Valores pequenos em todas as
defasagens sazonais (não há
picos)
Além de identificar os valores para p e q (e os valores de P e Q para
modelos SARIMA), o grau de diferenciação da série (valor d e valor D para modelos
sazonais) precisa ser conhecido. Para tanto, utiliza-se também a inspeção da ACF e
da PACF amostrais. Para um modelo não-sazonal, um comportamento suave
persistente nas autocorrelações amostrais em defasagens altas indica não-
estacionariedade, i.e., necessidade de diferenciação. Assim, deve-se diferenciar a
série para sucessivos valores positivos de d e examinar o correlograma de {∆
d
X
t
}
[Cribari-Neto, 2000].
A segunda estratégia para identificar os valores de p, d, q é utilizar um
critério de informação que selecione os modelos por meio de um conjunto de
“regras” [Mills, 1990]. Os critérios de seleção para modelos ARIMA mais utilizados
são o AIC (Akaike information criterion), o AICC (Akaike information criterion
corrected) e o BIC (Bayesian information criterion). Esses critérios incorporam um
termo de penalidade para o aumento do número de parâmetros (p e q) no modelo,
28
de forma que modelos mais “parcimoniosos”, ou seja, com o menor número de
parâmetros, sejam escolhidos. As equações para esses critérios, sendo T o número
de observações, são [Cribari-Neto, 2000]
( )
( )
( ) , log
ˆ
log 2
,
1
2
ˆ
log 2
, 2
ˆ
log 2
T q p L BIC
q p T
T q p
L AICC
q p L AIC
+ + − ·
− − −
+
+ − ·
+ + − ·
onde L representa a verossimilhança maximizada.
O critério AIC superestima assintoticamente a ordem verdadeira do
modelo [Granger & Newbold, 1986] apresentando tendência a escolher modelos
superparametrizados [Cribari-Neto, 2000]. O AICC é uma versão corrigida do AIC
que incorpora uma correção de viés para amostras finitas, possuindo uma
penalidade mais forte para modelos de ordem elevada [Brockwell & Davis, 1996].
O BIC é um critério consistente, de forma que ele fornece estimativas
de p e q que convergem em probabilidade para os valores verdadeiros à medida que
T tende a infinito [Brockwell & Davis, 1996]. Já os critérios AIC e AICC não são
consistentes. Por outro lado, o AIC é assintoticamente eficiente para modelos
puramente auto-regressivos.
Na prática, a seleção de modelos é feita calculando o valor do critério
(o BIC, por exemplo) para todos os modelos ARIMA associados aos valores de p, d
e q de forma que p,q =0,1,2,3,4,5 e d =0,1. Assim, seleciona-se o modelo que
apresenta o menor valor do BIC e modelos alternativos cuja diferença para o valor
^
29
mínimo do BIC seja inferior a 2 [Brockwell & Davis, 1996]. Para a modelagem
SARIMA, a quantidade de modelos investigados é maior, pois além dos valores de
p, d e q, deve-se incluir ainda os valores para P,Q = 0,1,2 e D = 0,1. Porém, os
modelos são selecionados pelos mesmos critérios que os utilizados para os modelos
ARIMA.
2.2.2.2 - Est i mação
Assumindo que um modelo ARIMA da forma
( )( ) ( )
t
q
q t
d p
p
B B X B B B ε θ θ φ φ + + + · − − − − L L
1 1
1 1 1
seja escolhido conforme a etapa anterior, o objetivo agora é estimar, utilizando o
método de máxima verossimilhança (ML)
2
, os parâmetros φ φ = (φ
1
,...,φ
p
)´,
θ θ = (θ
1
,...,θ
q
)´ e σ
2
, a variância de ε
t
.
A estimação da ML é difícil e geralmente requer muito tempo de
processamento computacional. Desta forma, existem alternativas que aproximam a
função de máxima verossimilhança. Duas dessas alternativas são o MQE (mínimos
quadrados exatos) e o MQC (mínimos quadrados condicional). Contudo, alguns
estudos têm sugerido [Ansley & Newbold, 1980] que o método de máxima
verossimilhança é superior aos demais.
Para a modelagem SARIMA o procedimento é idêntico ao mostrado
para a modelagem ARIMA, com a superioridade da estimação por máxima

2
Para uma demonstração da estimativa de ML, consultar [Mills, 1990].
(1.30)
30
verossimilhança sendo ainda mais pronunciada para modelos sazonais [Ansley &
Newbold, 1980].
2.2.2.3 - Ver i f i cação de di agnóst i co
A correta especificação de um modelo ARIMA ou SARIMA é verificada
no termo ε
t
, pois ele deve constituir um processo ruído branco [Granger & Newbold,
1986]. Assim, a verificação da adequabilidade do modelo é efetuada nas
autocorrelações amostrais dos erros (ε
t
), as quais seguem assintoticamente uma
distribuição normal, com média zero e desvio padrão n
- ½
, se forem provenientes de
um ruído branco. Como os erros verdadeiros (ε
t
) não são conhecidos, a inferência
baseia-se nas estimativas dos erros, os resíduos ε
t
.
Dessa forma, se o modelo estiver corretamente especificado, os
resíduos não devem apresentar correlação serial, pois toda a dinâmica dos dados já
foi capturada pelo modelo [Cribari-Neto, 2000]. A autocorrelação amostral dos
resíduos de ordem j é calculada como [Granger & Newbold, 1986]
( ) .
ˆ
ˆ ˆ
ˆ
1
2
1


·
+ ·

·
T
t
t
T
j t
j t t
j
r
ε
ε ε
ε
Então, os valores das autocorrelações residuais devem estar contidos no intervalo
de confiança assintótico de 95% que é [Cribari-Neto, 2000]
1
]
1

¸


T T
2
,
2
,
31
onde T indica o número de observações da série.
Em adição ao exame das autocorrelações individuais dos resíduos um
teste conjunto das primeiras m autocorrelações pode ser utilizado, que é conhecido
por teste Ljung-Box. Tal teste “portmanteau” compara o valor de
( ) ( ) ( )
j j
m
j
r j T T T Q εˆ 2
2
1
1

·

− + ·
com valores tabulados da distribuição do χ
2
(qui-quadrado) com (m - p - q) graus de
liberdade e com a rejeição da hipótese nula (de que o modelo é adequado) para
valores de Q maiores que o valor crítico assintótico [Granger & Newbold, 1986]. O
valor de m deve ser pelo menos igual a √T [Cribari-Neto, 2000].
2. 3 - Mét odos de compar ação de pr ev i são
Um dos métodos de escolha do melhor mecanismo de previsão é a
comparação dos valores previstos (X
t
) com os valores observados da série (X
t
), o
que caracteriza a acurácia ou a capacidade preditiva do mecanismo utilizado. Os
três métodos mais populares de medição da acurácia utilizam os resíduos em seus
cálculos [Kvanli et al.,1996]. Esses métodos são o desvio absoluto médio (MAD), o
erro quadrático médio (MSE) e o erro percentual absoluto médio (MAPE). Assim, os
resíduos são definidos como
.
ˆ
t t t
X X e − ·
O desvio absoluto médio (MAD) é definido como a média dos valores
^
32
absolutos de cada resíduo e é representado por
,
n
e
MAD
t ∑
·
onde n é o número de valores previstos obtidos dos dados passados.
O erro quadrático médio (MSE) é a média dos valores quadráticos de cada
resíduo, assim
.
2
n
e
MSE
t

·
O erro percentual absoluto médio (MAPE) considera o erro relativo de cada
previsão. O erro relativo em cada período t é definido como e
t
/X
t
. Então,
.
n
X
e
MAPE
t
t

·
Não há consenso entre os estatísticos sobre qual método é preferível. Assim,
se erros elevados de previsão são inaceitáveis, então o uso do MSE faz-se
necessário. Entretanto, se é possível ignorar alguns erros elevados, o MAD funciona
melhor. E o MAPE é utilizado para comparar a acurácia (precisão) de duas séries
temporais diferentes [Kvanli, et al., 1996]. Dessa forma, o MSE será utilizado como
critério de acurácia para as comparações dos métodos de previsão apresentados
neste trabalho.
33
2.4 - Sof t w ar es est at íst i cos
2. 4. 1 - O pr ogr ama R
O programa R é um sistema para computação estatística e gráfica. Ele
provê, dentre outras coisas, uma linguagem de programação, ferramentas gráficas
de alto nível, interface com outras linguagens de programação e ferramentas para
depuração. O R é uma versão gratuita do programa S-PLUS comercializado pela
MathSoft, Inc. Essa plataforma possui várias qualidades. A primeira é ser um
programa gratuito e de livre distribuição. A segunda é permitir a criação de novas
funções e a possibilidade de modificação das funções internas. O R pode ser obtido
via Internet no endereço www.r-project.org e possui versões para os sistemas
operacionais Windows, Unix e Macintosh.
2. 4. 2 - O pr ogr ama I TSM2000
O programa ITSM2000, diferentemente do R, é um programa
proprietário. Não há a possibilidade de alteração de suas funções, nem a
possibilidade de distribuição gratuita. O programa (versão Windows) acompanha o
livro “Introducion to Time Series and Forecasting” de Peter Brockwell & Richard
Davis. Trata-se de um programa simples e bastante intuitivo, baseado em escolhas
de menu e botões, seguindo o padrão dos programas para o sistema operacional
Windows.
Contudo, o ITSM2000 é um programa razoavelmente preciso e
34
completo, permitindo estimação de modelos ARIMA por máxima verossimilhança
exata [Cribari-Neto, 2000]. O critério de seleção de modelos utilizado no programa é
o AICC.
No próximo capítulo, o método de previsão utilizado no âmbito da
Secretaria da Receita Federal será descrito e detalhado. A descrição envolve a
formulação teórica do método, bem como os resultados obtidos na sua aplicação.
Os resultados mostrados neste capítulo restringem-se ao Imposto sobre a Renda e
seus componentes mais significativos.
35
3 - Anál i se do mét odo de pr evi são ut i l i zado
pel a Secr et ar i a da Recei t a Feder al ( SRF)
Este capítulo descreve sucintamente o método de previsão utilizado pela SRF,
mostra as previsões geradas por tal método e faz uma análise econométrica,
mostrando sua inadequabilidade como instrumento estatisticamente confiável de
previsão.
3. 1 - Descr i ção do mét odo de i ndi cador es
O método utilizado no âmbito da SRF, denominado de indicadores, consiste
na multiplicação da arrecadação do período anterior por:
- um índice de preço que represente a variação inflacionária a que
está sujeito o fato econômico gerador da arrecadação;
- um índice de quantidade que represente a variação real desse fato
gerador;
- um índice que represente o efeito causado na arrecadação por
modificações na legislação tributária;
- outros índices que representem quaisquer influências na
arrecadação tributária.
Esse método pode ser resumido genericamente na fórmula
36
( )( )( )( ), 1 1 1 1
1
U L Q P X X
t t
∆ + ∆ + ∆ + ∆ + ·

onde
X
t
= arrecadação prevista para determinado período do ano t;
X
t-1
= arrecadação efetiva do mesmo período do ano t-1;
∆P = variação percentual do indicador de preços;
∆Q = variação percentual do indicador de quantidades;
∆L = variação percentual decorrente de alterações da legislação; normalmente
significa variação de alíquotas;
∆U = variação percentual de qualquer outro indicador que tenha influência na
arrecadação e não possa ser enquadrado nos indicadores básicos (preço,
quantidade e legislação).
Os termos (1+∆P), (1+∆Q) e (1+∆L) são denominados, respectivamente,
Efeito-Preço, Efeito-Quantidade e Efeito-Legislação. O termo (1+∆U) representa o
Efeito-Residual. A qualidade da previsão com a utilização desse método depende da
obtenção de bons indicadores de preço e quantidade específicos para cada caso
(tributo, setor econômico ou item de receita).
Os órgãos de pesquisa de preços e acompanhamento da conjuntura
econômica (IBGE, FGV, IPEA) são fontes importantes para se identificar quais os
índices de preço e quantidade melhor se adequam aos vários tributos. Na Tabela 3.1
estão relacionados alguns tributos e seus principais indicadores de preço e
quantidade.
(3.1)
37
A SRF mantém registro de séries históricas dos principais indicadores de
preços e algumas séries de quantidade. As projeções dos parâmetros
macroeconômicos (inflação, PIB, taxa de câmbio e taxa de juros) que influenciam os
diversos indicadores são elaboradas pela Secretaria de Política Econômica do
Ministério da Fazenda (SPE).
Tabela 3.1 - Tributos e seus indicadores de preço e quantidade
INDICADORES ESPECÍFICOS TRIBUTO/CONTRIBUIÇÃO
PREÇO QUANTIDADE
Imposto de Importação Taxa de câmbio
Volume de importações
tributadas, em dólar
IPI - Bebidas Índice de preços de bebidas
Volume de vendas de bebidas ao
mercado interno
IPI - Automóveis
Índice de preços da indústria
automobilística
Volume de vendas de
automóveis ao mercado interno
Imposto de Renda Pessoa
Física - IRPF
IGP - Índice Geral de Preços Número de contribuintes
Imposto de Renda Pessoa
Jurídica - IRPFJ
IGP - Índice Geral de Preços PIB
Imposto de Renda Retido na
Fonte - IRRF - Trabalho
Variação nominal de salários Nível de emprego
Imposto de Renda Retido na
Fonte - IRRF - Capital
Taxa de juros
Volume em R$ de aplicações
financeiras
IOF - Imposto sobre
operações financeiras
Variação nominal do volume de credito e prêmios de seguro (em
R$)
COFINS IGP - Índice Geral de Preços PIB
3. 2 - Resul t ados
Os resultados obtidos pela SRF com a utilização do método dos indicadores
para os componentes mais significativos da série do Imposto de Renda estão
mostrados na Tabela 3.2, juntamente com os valores reais da arrecadação, a
diferença percentual entre a previsão e o valor observado (∆%) e o valor do critério
38
de acurácia MSE.
Tabela 3.2 - Previsão gerada pelo método dos indicadores
Série Imposto sobre a Renda - Agregado
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previsão 5.042 3.619 5.641 4.079 4.777 3.820 3.952 4.486 3.666 3.854 4.154 4.847 51.937
Real
5.156 4.206 5.718 4.713 4.113 4.261 4.937 4.619 4.375 4.825 4.705 6.546 58.174
∆ ∆%
-2,22 -13,97 -1,35 -13,46 16,13 -10,34 -19,96 -2,88 -16,20 -20,12 -11,70 -25,95 -10,72
∆ ∆% média -10,17
MSE
585.247
Série Imposto de Renda Pessoa Física - IRPF
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previsão 136 106 124 819 424 401 405 383 381 138 124 136 3.578
Real
209 159 173 829 407 334 371 336 334 182 226 194 3.754
∆ ∆% -35,09 -33,33 -28,14 -1,20 4,30 20,09 9,05 13,97 14,19 -23,96 -45,14 -30,04 -4,70
∆ ∆% média -11,28
MSE
3.062
Série Imposto de Renda Pessoa Jurídica - IRPJ
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previsão 1.305 1.029 2.338 1.180 1.019 871 1.195 1.014 857 1.177 854 937 13.777
Real
1.519 1.629 2.652 1.501 963 1.013 1.866 1.285 1.111 1.901 1.159 1.592 18.191
∆ ∆%
-14,11 -36,84 -11,82 -21,37 5,83 -13,99 -35,97 -21,07 -22,84 -38,09 -26,34 -41,12 -24,26
∆ ∆% média -23,14
MSE
188.725
Série Imposto de Renda Retido na Fonte - Rendimentos do Trabalho
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previsão 1.370 1.302 1.454 1.052 1.557 1.219 1.222 1.528 1.236 1.246 1.723 2.072 16.980
Real
1.462 1.306 1.625 1.227 1.494 1.333 1.350 1.547 1.476 1.435 1.755 2.870 18.880
∆ ∆% -6,31 -0,32 -10,53 -14,29 4,20 -8,53 -9,49 -1,24 -16,24 -13,17 -1,80 -27,82 -10,06
∆ ∆% média -8,80
MSE
69.494
As Figuras 3.1, 3.2, 3.3 e 3.4 mostram o gráfico da série temporal do imposto,
somente para o ano de 1999, em preto, o valor da arrecadação real no ano de 2000
em azul e o valor da previsão para o ano de 2000 em vermelho pontilhado, para
cada um dos impostos constantes na Tabela 3.2. Todos os valores da arrecadação
são mostrados a preços constantes de junho de 2000.
39
Figura 3.1 - Gráfico do valor real e da previsão gerada
Figura 3.2 - Gráfico do valor real e da previsão gerada
40
Figura 3.3 - Gráfico do valor real e da previsão gerada
Figura 3.4 - Gráfico do valor real e da previsão gerada
41
3. 3 - Anál i se economét r i ca
Considere novamente a equação que descreve o método dos indicadores
( )( )( )( ). 1 1 1 1
1
U L Q P X X
t t
∆ + ∆ + ∆ + ∆ + ·

Substituindo o resultado da multiplicação dos índices entre parênteses por uma
constante c
t
, a equação (3.2) fica
.
1 −
·
t t t
X c X
Caso ∆P, ∆Q, ∆L e ∆U sejam simultaneamente zero, ou seja, não ocorram
alterações percentuais em nenhum dos índices, o valor de c
t
em (3.3) será igual a 1
e a previsão será igual ao último valor observado. Caso um dos índices apresente
variação percentual positiva, por exemplo ∆P = 10%, ceteris paribus, o valor de c
t
em
(3.3) será igual a 1,1. Caso a variação percentual seja negativa, por exemplo ∆P = -
10%, ceteris paribus, o valor de c
t
em (3.3) será igual a 0,9. Assim, c
t
pode assumir,
dependendo do sinal da variação percentual, valores maiores ou menores que 1.
Generalizando, caso haja variações positivas e negativas simultâneas em todos os
índices, o valor de c
t
na equação (3.3) pode assumir valores maiores ou menores
que zero.
A equação (3.3) assemelha-se a uma estrutura AR(1), conforme mostra a
equação (1.12), a menos do termo de erro ε
t
e do fato que em (3.3) c
t
varia com t.
Assim, o método dos indicadores deve ser considerado como uma representação de
um modelo auto-regressivo de ordem 1 uma vez que X
t-1
representa a arrecadação
efetiva no período anterior.
(3.3)
(3.2)
42
Contudo, além de não conter um termo residual, o método dos indicadores
falha em reproduzir um AR(1) ao possibilitar que o valor de c
t
possa assumir
qualquer valor diferente de zero. E, como já foi visto, todo processo auto-regressivo
de ordem 1 que apresenta o valor absoluto de sua raiz como maior que 1 não pode
representar um processo estacionário. Então, não há perda alguma em se
desconsiderar processos AR(1) com |φ
1
| > 1 [Brockwell & Davis, 1996].
Desta maneira, o método dos indicadores utilizado pela Secretaria da Receita
Federal não está reproduzindo um processo auto-regressivo causal, estacionário.
Suas previsões não são confiáveis, uma vez que as condições básicas de
estacionariedade não são satisfeitas. Por isso, tal método deveria ser abandonado
em prol de alguma outra metodologia mais adequada.
Tal metodologia pode ser alguma das que serão mostradas no próximo
capítulo, que inicia-se com uma análise exploratória da série agregada do Imposto
sobre a Renda. Depois, as metodologias de previsão por alisamento exponencial e
modelagem SARIMA serão empregadas para essa série e os resultados das
previsões obtidas passarão por uma análise detalhada.
43
4 - Anál i se e pr evi são da sér i e t empor al do
I mpost o sobr e a Renda ( I R)
Este capítulo começa com considerações gerais sobre a série temporal do IR e suas
especificidades na utilização desse trabalho. A seguir, são empregadas as
metodologias de previsão de Holt-Winters sazonal e Box-Jenkins para a obtenção de
valores futuros para a série do IR.
4. 1 - Consi der ações ger ai s
O Imposto sobre a Renda foi escolhido para a análise nesse trabalho devido a
sua importância na arrecadação federal. De acordo com a Tabela 4.1, verifica-se
que esse imposto correspondeu a mais de 30% tanto das receitas administradas
pela SRF quanto do total arrecadado pela União Federal no ano de 2000 (em
valores nominais).
Existem dados mensais da série histórica do Imposto de Renda, assim como
de todos os tributos federais, desde janeiro de 1986. Dessa forma, há mais de 180
observações na série temporal. Apesar de ser um número razoável de observações,
deve-se considerar as inúmeras mudanças econômicas ocorridas no Brasil desde
então para se utilizar todos esses dados em uma análise econométrica. Assim,
neste trabalho optou-se por utilizar os dados disponíveis após a implementação do
Plano Real, por ser esse um período de estabilidade inflacionária persistente.
44
Tabela 4.1 - Participação do Imposto sobre a Renda na arrecadação total da
SRF - 2000
Imposto R$ - milhões % - administradas % - arrecadação
Imposto sobre a Importação 8.510,1 5,12 4,83
Imposto sobre a Exportação 2,5 0,00 0,00
Imposto sobre Produtos Industrializados 18.839,1 11,33 10,70
Imposto sobre a Renda 56.396,6 33,92 32,04
I.O.F. - Imposto s/ Operações Financeiras 3.126,7 1,88 1,78
I.T.R. - Imposto Territorial Rural 267,0 0,16 0,15
CPMF - Contrib. Movimentação Financeira 14.544,6 8,75 8,26
Cofins - Contribuição Seguridade Social 39.903,2 24,00 22,67
Contribuição para o Pis/Pasep 10.043,0 6,04 5,71
CSLL - Contribuição Social s/ Lucro 9.278,0 5,58 5,27
Contrib. p/ Plano Seg. Social Servidores 3.626,6 2,18 2,06
Contribuição para o Fundaf 372,4 0,22 0,21
Outras Receitas Administradas 1.350,3 0,81 0,77
Receitas de Loterias 951,6 0,57 0,54
Demais 398,7 0,24 0,23
Receitas Administradas pela SRF 166.260,10 100,00 94,45
Total da Arrecadação Federal 176.020,60 100,00
Fonte: Secretaria da Receita Federal - MF
Desta maneira, os dados analisados foram divididos em duas partes. A
primeira parte corresponde aos valores observados a partir de julho de 1994 até o
mês de dezembro de 1999. Esses dados serão utilizados pelos métodos de
alisamento exponencial e de Box-Jenkins para prever os dados conhecidos da
segunda parte, os valores da arrecadação do ano de 2000. A medida de acurácia de
previsão empregada será o MSE. A seguir, será feita uma análise exploratória sobre
a série do Imposto de Renda.
4. 2 - Anál i se ex pl or at ór i a
O Imposto de Renda possui a seguinte classificação: IRPF - Pessoa Física,
IRPJ - Pessoa Jurídica, IRRF - Retido na Fonte. O IRRF apresenta ainda quatro
subdivisões, a saber: Rendimentos do Trabalho, Rendimentos do Capital, Remessas
45
para o Exterior e Outros Rendimentos
Desta maneira, oito séries distintas de dados precisam ser analisadas. Para
simplificação e para evitar repetição de procedimentos, somente a série agrupada do
imposto será descrita e analisada detalhadamente. Para as séries do IRPF , do IRPJ
e do IRRF - Rendimentos do Trabalho, somente os resultados serão apresentados.
A série do imposto de renda {IR} analisada possui 66 observações e seu
gráfico é apresentado na Figura 4.1 em milhões de reais. Os dados foram ajustados
pelo índice de preços IGP-DI divulgado pela Fundação Getúlio Vargas em janeiro de
2000, com base em junho de 2000. Assim, os dados são expressos em reais de
junho de 2000 e podem ser interpretados como a preços constantes, sem centavos.
A Tabela 4.2 mostra os valores em milhões de reais das observações da série {IR}.
Figura 4.1 - Gráfico da série do IR
46
Tabela 4.2 - Valores do Imposto sobre a Renda agregado em R$-milhões
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
1994 2.546 2.677 2.731 2.507 2.574 4.052
1995 3.950 3.041 4.245 3.042 5.295 3.568 3.411 3.550 3467 3.425 3.458 4.309
1996 3.532 2.883 6.992 3.502 3.629 3.260 3.657 3.201 3.397 3.339 3.359 6.101
1997 4.095 3.102 4.093 4.375 3.411 3.419 4.145 3.345 3.511 4.055 3.492 5.987
1998 6.331 4.366 5.869 4.780 3.463 3.575 5.246 4.989 4.529 4.189 3.834 5.890
1999 5.139 5.718 6.127 5.187 4.083 4.268 4.519 3.683 5184 4.210 3.654 5.952
2000 5.156 4.206 5.718 4.713 4.113 4.261 4.937 4.619 4.375 4.825 4.705 6.546
A série {IR} apresenta uma média amostral de 4,099 bilhões de reais com um
desvio padrão de 1,047 bilhões de reais. O valor máximo das observações é de
6,992 bilhões de reais, que corresponde ao mês de março de 1996, e o valor mínimo
é de 2,507 bilhões de reais, referente ao mês de outubro de 1994. Nota-se, pela
Figura 4.1, que há uma flutuação considerável na série, que pode estar sendo
causada por movimentos sazonais. A distribuição de freqüências de {IR} está
mostrada no histograma da Figura 4.2, em milhões de reais. Verifica-se que a
distribuição é positivamente assimétrica, com o valor do coeficiente de assimetria de
Pearson igual a 0,809. O coeficiente de curtose é 2,90 e a distribuição do {IR} é dita
platicúrtica relativamente à distribuição normal.
Figura 4.2 - Histograma da série
47
A presença de movimentos sazonais na série {IR} pode ser observada na
Figura 4.3, que mostra a componente de sazonalidade presente na série. Nota-se
claramente um comportamento sazonal homogêneo e estável em todos os anos da
série, o que caracteriza a série como uma série sazonal.
Figura 4.3 - Componente sazonal do IR
Em relação ao crescimento da arrecadação do IR, a taxa média de
crescimento é de 5,43% ao mês, com a taxa mediana ficando em 0,23% ao mês. O
gráfico na Figura 4.4 mostra a taxa de crescimento da série {IR} e a Figura 4.5
mostra o histograma da taxa de crescimento da série. Pelo gráfico da Figura 4.4,
nota-se que o crescimento máximo foi entre os meses de fevereiro e março de 1996,
142,5%. Esse crescimento elevado deveu-se principalmente ao pagamento
antecipado do ajuste anual do IRPJ realizado em março daquele ano. Anteriormente,
esse pagamento era estendido até o mês de maio [Folha de S. Paulo, 1996].
O crescimento mínimo foi entre os meses de março e abril de 1996, -49,9%.
48
Tal decréscimo deveu-se em parte na decisão da Secretaria da Receita Federal em
processar as declarações do IRPF, recolhidas até o dia 31 de abril, apenas no final
de maio [Folha de S. Paulo, 1996]. O valor elevado do desvio padrão, 32,58%,
evidencia a alta variabilidade na arrecadação desse imposto, o que pode ser
corrigido mediante o uso da série transformada em logaritmo.
Figura 4.4 - Gráfico da taxa de crescimento do IR
Figura 4.5 - Histograma da taxa de crescimento
49
Pelo gráfico da Figura 4.4, pelo histograma na Figura 4.5 e pela descrição dos
valores máximos e mínimos da taxa de crescimento, verifica-se que claramente o
valor de março de 1996, 6,99 bilhões de reais, é uma observação que destoa das
demais, ou seja, essa observação é um outlier e pode distorcer todo o
comportamento da série.
A evolução da arrecadação pode ser observada na Figura 4.6, que mostra a
componente de tendência da série. Observam-se quatro níveis principais nesse
gráfico, o 1º nível, que vai até novembro de 1995, apresenta um elevado
crescimento da série; o 2º nível, que compreende os meses de dezembro de 1995 a
fevereiro de 1997, mostra um crescimento quase nulo da arrecadação; o 3º nível,
que vai até janeiro de 1999, mostra novamente um crescimento elevado da série e o
4º nível, que compreende o ano de 1999, apresenta um início de diminuição da
arrecadação.
Figura 4.6 - Componente de tendência da série - crescimento da arrecadação
50
Devido à elevada variabilidade da série, a transformação de Box-Cox com
λ = 0 (transformação logarítmica) será empregada e a série resultante será também
modelada. Dado que o valor de março de 1996 é um outlier, ele será substituído
pelo menor valor para o mês de março na série e também pelo valor médio dos
meses de março na série [Venables & Ripley, 1999]. Desta maneira, além da série
original do IR, serão modeladas mais 5 séries: uma série utilizando o valor do mês
de março como o menor valor dos meses de março {IRmodif}, outra série utilizando
o valor médio dos meses de março {IRmodif2} e as transformações logarítmicas de
{IR}, {IRmodif} e {IRmodif2}, que serão denominadas log{IR}, log{IRmodif} e
log{IRmodif2}.
4. 3 - Model agem e pr ev i são
4.3.1 - Al i sament o ex ponenci al
Como o método de alisamento exponencial é considerado um
procedimento automático de previsão, não se faz necessário aplicar nenhuma
estratégia de modelagem, a menos para verificar se existem tendências ou
sazonalidades. Desta maneira, o algoritmo de Holt-Winters sazonal aditivo será
empregado para a previsão das séries por meio da utilização do programa
ITSM2000. A Tabela 4.3 mostra os valores otimizados das constantes de suavização
da equação (1.28), α, β e γ , para cada uma das séries analisadas. As Tabelas 4.4,
4.5 e 4.6 mostram as previsões obtidas para cada uma das séries, a diferença
percentual entre a previsão e o valor observado (∆%) e o valor do MSE.
51
Tabela 4.3 - Coeficientes otimizados
Coeficientes otimizados
Séries
α β γ
{IR} 0,09 0,07 0,48
log{IR} 0,13 0,10 0,55
{IRmodif} 0,10 0,06 0,69
log{IRmodif} 0,14 0,07 0,68
{IRmodif2} 0,10 0,07 0,61
log{IRmodif2} 0,13 0,10 0,64
Tabela 4.4 - Previsões geradas para as séries {IR} e log {IR}
Série {IR} Série log{IR}
Mês/2000
Arrecadação Real
em R$ milhões previsão ∆% MSE Previsão ∆% MSE
Janeiro 5.156 5.670 9,97 - 5.622 9,04 -
Fevereiro 4.206 5.135 22,09 - 4.996 18,78 -
Março 5.718 6.180 8,08 - 6.072 6,19 -
Abril 4.713 5.126 8,76 - 4.977 5,60 -
Maio 4.113 4.376 6,39 - 4.070 -1,05 -
Junho 4.261 4.350 2,09 - 4.111 -3,52 -
Julho 4.937 4.994 1,15 - 4.788 -3,02 -
Agosto 4.619 4.427 -4,16 - 4.140 -10,37 -
Setembro 4.375 5.030 14,97 - 4.841 10,65 -
Outubro 4.825 4.538 -5,95 - 4.289 -11,11 -
Novembro 4.705 4.140 -12,01 - 3.845 -18,28 -
Dezembro 6.546 6.355 -2,92 - 6.225 -4,90 -
Total 58.174 60.321 3,69 207.963 57.976 -0,34 221.613
Diferença percentual média 4,04 -0,17
Tabela 4.5 - Previsões geradas para as séries {IRmodif} e log{IRmodif}
Série {IRmodif} Série log{IRmodif}
Mês/2000
Arrecadação Real
em R$ milhões previsão ∆% MSE previsão ∆% MSE
Janeiro 5.156 5.709 10,73 - 5.706 10,67 -
Fevereiro 4.206 5.488 30,48 - 5.309 26,22 -
Março 5.718 6.140 7,38 - 6.038 5,60 -
Abril 4.713 5.225 10,86 - 5.092 8,04 -
Maio 4.113 4.163 1,22 - 4.020 -2,26 -
Junho 4.261 4.289 0,66 - 4.139 -2,86 -
Julho 4.937 4.915 -0,45 - 4.806 -2,65 -
Agosto 4.619 4.285 -7,23 - 4.141 -10,35 -
Setembro 4.375 5.187 18,56 - 5.055 15,54 -
Outubro 4.825 4.499 -6,76 - 4.376 -9,31 -
Novembro 4.705 4.043 -14,07 - 3.903 -17,05 -
Dezembro 6.546 6.332 -3,27 - 6.364 -2,78 -
Total 58.174 60.275 3,61 312.879 58.949 1,33 281.221
Diferença percentual média 4,01 1,57
52
Tabela 4.6 - Previsões geradas para a série {IRmodif2}
Série {IRmodif2} Série log{IRmodif2}
Mês/2000
Arrecadação Real
em R$ milhões previsão ∆% MSE previsão ∆% MSE
Janeiro 5.156 5.687 10,30 - 5.652 9,62 -
Fevereiro 4.206 5.327 26,65 - 5.185 23,28 -
Março 5.718 6.107 6,80 - 6.027 5,40 -
Abril 4.713 5.164 9,57 - 5.034 6,81 -
Maio 4.113 4.183 1,70 - 3.995 -2,87 -
Junho 4.261 4.271 0,23 - 4.087 -4,08 -
Julho 4.937 4.921 -0,32 - 4.746 -3,87 -
Agosto 4.619 4.309 -6,71 - 4.083 -11,60 -
Setembro 4.375 5.089 16,32 - 4.915 12,34 -
Outubro 4.825 4.475 -7,25 - 4.280 -11,30 -
Novembro 4.705 4.037 -14,20 - 3.815 -18,92 -
Dezembro 6.546 6.306 -3,67 - 6.199 -5,30 -
Total 58.174 59.876 2,93 260.900 58.018 -0,27 272.674
Diferença percentual média 3,29 -0,04
4. 3. 2 - Mét odo Box - Jenk i ns
A estratégia de modelagem de Box-Jenkins consiste de três etapas,
conforme explicitado anteriormente. Para a etapa de identificação é utilizado o
correlograma da série, para uma aproximação inicial, e um procedimento de procura
dos menores valores do critério de seleção BIC. Inicialmente, a análise recairá sobre
as funções de autocorrelação amostral.
O correlograma da série {IR} está mostrado na Figura 4.7, com o
número de defasagens indo de 0

a 36 (36 corresponde a 3 no eixo horizontal). Os
picos nas autocorrelações de ordem 1, 3 e 9 indicam a não-estacionariedade da
série e sugerem a necessidade de diferenciação, talvez d = 1. Além disso, os valores
das autocorrelações indicam que o valor do termo de médias móveis pode ser de
ordem 1 ou 3, p = 0 e q = 1 ou 3.
53
Figura 4.7 - Função de autocorrelação amostral de {IR}
Ao se analisar o correlograma da primeira diferença de {IR},
mostrado na Figura 4.8, evidencia-se fortemente que o termo de médias móveis
pode ser de ordem 1, uma vez que todas as autocorrelações amostrais entre as
defasagens 2 e 10 são estatisticamente iguais a zero.
Figura 4.8 - Função de autocorrelação amostral da primeira diferença de
{IR}
54
Já os valores de ρ(12) = 0,44, ρ(24) = 0,21 e ρ(36) = 0,08 na série {IR}
indicam a presença de sazonalidade e sugerem que o valor do termo de médias
móveis sazonal pode ser de ordem 1, P = 0 e Q = 1, além da necessidade de
diferenciação sazonal, D = 1. A sazonalidade pode ser evidenciada também no
gráfico da primeira diferença da série, cujos valores de ρ(12), ρ(24) e ρ(36) são 0,45,
0,32 e 0,19, respectivamente.
O gráfico da diferença sazonal, D = 1, confirma a suspeita de não-
estacionariedade e da existência de sazonalidade na série original {IR}. O resultado,
mostrado na Figura 4.9, indica autocorrelações amostrais estatisticamente iguais a
zero em todas as defasagens, menos nas defasagens 12 e 29, sendo que esse
último valor pode ser explicado como erro amostral [Granger & Newbold, 1986].
Figura 4.9 - Função de autocorrelação amostral da 12ª diferença de { IR}
Esses resultados sugerem o exame da série diferenciada duas vezes,
55
uma diferenciação regular e outra sazonal, de forma que d = 1 e D = 1
simultaneamente. O correlograma para essa diferenciação dupla está mostrado na
Figura 4.10. Notam-se valores estatisticamente diferentes de zero na defasagem 1,
o que sugere um termo MA(1), e nas defasagens 12 e 13, o que sugere fortemente a
presença de sazonalidades, de forma que Q = 1. Então, um modelo SARIMA(p = 0,
d = 1, q = 1)(P = 0, D = 1, Q = 1), representado por
( )( ) ( )( ) , 1 1 1 1
12
1 1
12
t t
B B X B B ε θ Θ + + · − −
pode ser uma estimada inicial para a análise da série em questão. Essa análise
revela-se idêntica para a série do log{IR}.
Figura 4.10 - ACF amostral da 1º e 12º diferenças de { IR}
A série {IRmodif} apresenta um comportamento que se aproxima da
estacionariedade mais do que a série original {IR}, o que comprova o fato que o
outlier de março de 1996 distorce a série. O correlograma da primeira diferença para
a série {IRmodif} não apresenta um valor estatisticamente diferente de zero na
56
defasagem 11, mas os valores referentes às defasagens 1 e 12 são significativos. Já
o correlograma da 12ª diferença mostra-se totalmente estacionário, representando
um processo ruído branco, o que significa que todo movimento sazonal foi absorvido
pela diferenciação, caracterizando o termo de média móvel sazonal como zero,
Q = 0.
O correlograma para a dupla diferenciação não apresenta pico na
defasagem 12, mas nas defasagens 1 e 13 o valor da autocorrelação amostral é
significativo. Assim, tanto a 1ª diferença quanto a 12ª diferença produzem resultados
estacionários, o que pode ser indicativo que d = D = 1. Dessa maneira, espera-se
que os modelos SARIMA(0,1,1)(0,1,0) ou SARIMA(0,1,1)(0,1,1) possam representar
adequadamente a série {IRmodif}.
Para a série log{IRmodif}, o comportamento da série se aproxima mais
da condição de estacionariedade do que a série {IRmodif}. O correlograma da
primeira diferença é idêntico ao da série {IRmodif}. O correlograma da 12ª diferença
apresenta somente um valor estatisticamente diferente de zero na defasagem 1, o
que sugere q = 1 e Q = 0. O correlograma da 1ª e 12ª diferenças simultâneas
apresenta também somente um valor elevado na defasagem 1, o que sugere que
novamente q = 1 e Q = 0. Assim, tanto pode ocorrer a diferenciação regular ou não,
de forma que d = 0 ou d = 1 e espera-se que os modelos SARIMA(0,1,1)(0,1,0) e
SARIMA(0,0,1)(0,1,0) possam representar adequadamente a série log{IRmodif}.
A série {IRmodif2} não se aproxima tanto da condição de
estacionariedade do quanto a série {IRmodif}, mostrando-se bem próxima da série
57
original {IR}. Assim, os correlogramas da 1ª diferença e da 1ª e 12ª diferenças
simultâneas possuem um comportamento similar ao correlograma da série {IR}. O
correlograma da 12ª diferença apresenta somente um valor estatisticamente
diferente de zero na defasagem 12, o que característico de série sazonal. Assim,
espera-se que um modelo SARIMA(0,1,1)(0,1,1) possa representar adequadamente
a série {IRmodif2}.
A série log{IRmodif2} apresenta no correlograma da 1ª diferença um
comportamento similar ao correlograma de {IR}. O correlograma da 12ª diferença
apresenta um valor estatisticamente diferente de zero na defasagem 11,
caracterizando o termo sazonal. No correlograma da 1ª e 12ª diferenças simultâneas
há picos na defasagem 1 e 12. Então, espera-se que um modelo
SARIMA(0,1,1)(0,1,1) possa representar adequadamente a série log{IRmodif2}.
Deve-se destacar que para as 5 séries descritas acima o correlograma
da série sem diferenciação é semelhante ao da série original {IR}, com picos nas
defasagens 1, 3 e 12, caracterizando a necessidade de diferenciação serial.
Após a análise feita com os correlogramas, a identificação dos modelos
a serem estimados utilizará um critério de seleção de modelos. A escolha dos
modelos se baseia na minimização do valor do BIC. Esse critério foi utilizado por ser
um critério consistente, ou seja, quanto maior as observações, mais ele seleciona
um modelo que se aproxima do verdadeiro mecanismo gerador de dados, e por ele
ser parcimonioso, ou seja, por tipicamente escolher modelos com poucos
parâmetros.
58
Aqueles modelos que apresentarem o menor valor para o BIC e os que
tiverem valor até duas unidades a mais que o menor valor do BIC serão escolhidos.
Deve-se notar que a função interna do R, a função arima0, não informa o valor do
critério BIC, mas sim do AIC. Dessa maneira, a função arima0 foi modificada para
que o valor do BIC fosse informado.
Assim, será utilizada uma função externa ao programa R obtida de
[Cribari-Neto, 2000] que se encontra no Apêndice A. Tal função calcula, para um
dado conjunto inicial de d, P, D, e Q, o valor do BIC para diferentes valores de p e q,
com 0 ≤ p ≤ 4 e 0 ≤ q ≤ 4. Assim, esses valores do BIC são armazenados em uma
matriz, cuja posição (ij) representa os valores p e q, calculados como
. 1 1 − · − · j q e i p
Os intervalos possíveis para os valores de d, P, D, e Q são definidos
como D = [1], P = [0,2], Q = [0,2], d = [0,1]. Assim, para cada série são examinados
450 modelos e seus respectivos valores do BIC, uma vez que há 18 combinações
possíveis de modelos com os valores de d, P, D, e Q conforme definidos acima e a
matriz gerada pela função externa é de tamanho 5x5, ou seja, apresenta 25
elementos ou 25 valores de p e q. A Tabela 4.7 traz, para cada série, os modelos
escolhidos pelo menor valor do critério BIC e aqueles modelos que diferem em até
duas unidades do menor valor do BIC. Os resultados resumidos dos 450 modelos
possíveis de cada série estão mostrados no Apêndice B.
Assim, para a série {IR}, a Tabela 4.7 mostra que o modelo que
apresenta o menor valor do critério BIC é o modelo airline, ou seja, um modelo
59
SARIMA(0,1,1)(0,1,1). O modelo alternativo que também será estimado é um
modelo SARIMA(0,1,1)(1,1,0). Essa conclusão coincide com a oriunda da análise
dos correlogramas.
Tabela 4.7 - Valores do BIC e modelos escolhidos
Modelos
Série
(p,d,q) (P,D,Q)
BIC
(0,1,1) (0,1,1) 873
{IR}
(0,1,1) (1,1,0) 874,9
(0,1,1) (0,1,1) -18,5
(0,1,1) (1,1,0) -16,7 log{IR}
(1,0,1) (0,1,1) -16,4
(0,1,1) (0,1,0) 857,2
(0,1,1) (0,1,1) 857,9
(0,1,1) (1,1,0) 859,1
{IRmodif}
(1,1,1) (0,1,0) 859,3
(0,0,1) (0,1,0) -32,8
(0,1,1) (0,1,0) -32,3
(1,0,1) (0,1,0) -31,7
(0,1,1) (0,1,1) -30,9
(1,0,0) (0,1,1) -30,7
log{IRmodif}
(1,0,0) (1,1,0) -30,7
(0,1,1) (0,1,1) 861,6
(0,1,1) (1,1,0) 863,3
(0,1,2) (0,1,1) 863,5
{IRmodif2}
(1,1,1) (0,1,1) 863,8
(1,0,0) (0,1,0) -27,3
(0,0,1) (0,1,0) -26,7
(0,1,1) (0,1,1) -26,7
(0,1,1) (0,1,0) -25,5
log{IRmodif2}
(0,1,1) (1,1,0) -25,3
Nota-se, para a série log{IR}, que o modelo que apresenta o menor
valor do critério BIC é novamente o modelo airline, ou seja, um modelo
SARIMA(0,1,1)(0,1,1). Os modelos alternativos que também serão estimados são
um modelo SARIMA(0,1,1)(1,1,0) e um modelo SARIMA(1,0,1)(0,1,1). Outra vez, a
análise efetuada com os correlogramas acertou ao sugerir o modelo airline como um
modelo adequado para a série log{IR}.
60
Para a série {IRmodif} o modelo com menor valor do BIC é um
SARIMA(0,1,1)(0,1,0), mas o modelo airline, SARIMA(0,1,1)(0,1,1), apresenta um
valor do BIC muito próximo ao daquele modelo. Assim, além desses dois, um
modelo SARIMA(0,1,1)(1,1,0) e outro SARIMA(1,1,1)(0,1,0) também serão
estimados. Para essa série, a análise dos correlogramas está novamente certa, pois
sugeriu os mesmos dois modelos que também apresentaram o menor valor para o
BIC.
A série log{IRmodif} apresentou 6 modelos diferentes para serem
estimados. O modelo que possui o menor BIC é um SARIMA(0,0,1)(0,1,0), mas o
modelo SARIMA(0,1,1)(0,1,0) possui o valor do BIC muito próximo ao do modelo
anterior. Esses dois modelos se distinguem por causa da diferenciação regular, ou
seja, o valor de d. E tal fato foi previsto corretamente na análise dos correlogramas
da série. Além desses dois modelos, os modelos SARIMA(1,0,1)(0,1,0),
SARIMA(1,0,0)(0,1,1), SARIMA(0,1,1)(0,1,1) e SARIMA (1,0,0)(1,1,0) serão também
estimados.
Para a série {IRmodif2} o modelo que apresenta o menor valor do BIC
é novamente um modelo airline, SARIMA(0,1,1)(0,1,1). Além desse modelo, os
modelos SARIMA(0,1,1)(1,1,0), SARIMA(0,1,2)(0,1,1) e SARIMA(1,1,1)(0,1,1) serão
estimados. O exame das autocorrelações amostrais feito anteriormente revelou
também que um possível modelo para estimação era o modelo airline.
O modelo que possui o menor valor do BIC, para a série log{IRmodif2},
é um SARIMA(1,0,0)(0,1,0). Mais 4 modelos apresentam um valor de BIC próximo
ao do menor valor, SARIMA(0,0,1)(0,1,0), SARIMA(0,1,1)(0,1,1),
61
SARIMA(0,1,1)(0,1,0) e SARIMA(0,1,1)(1,1,0). Nessa série, a análise do
correlograma não revelou apropriadamente o modelo principal a ser estimado,
porém ainda assim o modelo airline foi especificado.
Após a identificação dos prováveis modelos, a etapa da estimação
gerará os valores estimados dos parâmetros φ, θ, Φ e Θ e, por conseqüência, as
previsões. Para essa etapa, as funções internas do R arima0 e predict serão
utilizadas. Assim, de posse dos modelos escolhidos pela etapa anterior, que são
aqueles com menor valor do BIC e aqueles com uma diferença para o menor BIC
não superior a 2 unidades, calcula-se para cada série a previsão para 12 meses, a
diferença percentual entre o valor previsto e o valor real (∆%) e o valor do MSE.
As Tabelas 4.8, 4.9, 4.10, 4.11, 4.12 e 4.13 mostram os resultados das
previsões para as séries {IR}, log{IR}, {IRmodif}, log{IRmodif}, {IRmodif2} e
log{IRmodif2}, respectivamente. A Tabela 4.14 mostra o cálculo das estatísticas t,
que medem a significância estatística dos parâmetros estimados, para serem
comparados com o valor de 1,96 que corresponde ao nível assintótica da
distribuição normal a 95% de significância, para aqueles modelos com o menor valor
do BIC, conforme mostrados na Tabela 4.7.
As Figuras 4.11, 4.12, 4.13, 4.14, 4.15 e 4.16 mostram,
respectivamente, para cada uma das séries {IR}, log{IR}, {IRmodif}, log{IRmodif},
{IRmodif2} e log{IRmodif2}, um gráfico da previsão gerada pelos modelos com o
menor valor do BIC. O gráfico é composto da série temporal do imposto de renda
somente para o ano de 1999 em preto, o valor da arrecadação real no ano de
62
2000 em azul e o valor da previsão gerada para o ano de 2000 em vermelho
pontilhado.
Tabela 4.8 - Previsões geradas para a série {IR} - valores em R$ milhões
(0,1,1)(0,1,1) (0,1,1)(1,1,0)
Mês Real
Prev. ∆ ∆% Prev. ∆ ∆%
Jan 5.156 5.708 10,71 6.232 20,87
Fev 4.206 5.058 20,26 5.555 32,07
Mar 5.718 6.443 12,68 6.504 13,75
Abr 4.713 5.293 12,31 5.491 16,51
Mai 4.113 4.750 15,49 4.282 4,11
Jun 4.261 4.573 7,32 4.430 3,97
Jul 4.937 5.161 4,54 5.382 9,01
Ago 4.619 4.681 1,34 4.832 4,61
Set 4.375 5.098 16,53 5.365 22,63
Out 4.825 4.773 -1,08 4.704 -2,51
Nov 4.705 4.439 -5,65 4.247 -9,73
Dez 6.546 6.560 0,21 6.426 -1,83
Total 58.174 62.537 7,50 63.450 9,07
∆ ∆% média 7,89 9,45
MSE 253.846 476.673
Figura 4.11 - Gráfico da previsão gerada para o modelo SARIMA(0,1,1)(0,1,1)
63
Tabela 4.9 - Previsões geradas para a série log{IR} - valores em R$ milhões
(0,1,1)(0,1,1) (0,1,1)(1,1,0) (1,0,1)(0,1,1)
Mês Real
Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆%
Jan 5.156 5.636 9,31 6.025 16,85 5.586 8,34
Fev 4.206 4.967 18,09 5.464 29,91 4.930 17,21
Mar 5.718 6.401 11,94 6.451 12,82 6.319 10,51
Abr 4.713 5.223 10,82 5.372 13,98 5.158 9,44
Mai 4.113 4.370 6,25 4.081 -0,78 4.294 4,40
Jun 4.261 4.322 1,43 4.243 -0,42 4.249 -0,28
Jul 4.937 5.027 1,82 5.165 4,62 4.935 -0,04
Ago 4.619 4.378 -5,22 4.497 -2,64 4.287 -7,19
Set 4.375 5.010 14,51 5.247 19,93 4.912 12,27
Out 4.825 4.561 -5,47 4.505 -6,63 4.458 -7,61
Nov 4.705 4.118 -12,48 4.000 -14,98 4.016 -14,64
Dez 6.546 6.616 1,07 6.354 -2,93 6.446 -1,53
Total 58.174 60.629 4,22 61.404 5,55 59.590 2,43
∆ ∆% média 4,34 5,81 2,57
MSE 207.871 397.849 193.268
Figura 4.12 - Gráfico da previsão gerada para o modelo SARIMA(0,1,1)(0,1,1)
64
Tabela 4.10 - Previsões geradas para a série {IRmodif} - valores em R$ milhões
(0,1,1)(0,1,0) (0,1,1)(0,1,1) (0,1,1)(1,1,0) (1,1,1)(0,1,0)
Mês Real
Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆%
Jan 5.156 5.153 -0,06 5.505 6,77 5.547 7,58 5.388 4,50
Fev 4.206 5.732 36,28 5.283 25,61 5.521 31,26 6.015 43,01
Mar 5.718 6.141 7,40 6.040 5,63 6.190 8,25 6.437 12,57
Abr 4.713 5.201 10,35 5.181 9,93 5.215 10,65 5.500 16,70
Mai 4.113 4.097 -0,39 4.137 0,58 4.060 -1,29 4.396 6,88
Jun 4.261 4.282 0,49 4.239 -0,52 4.228 -0,77 4.582 7,53
Jul 4.937 4.533 -8,18 4.860 -1,56 4.817 -2,43 4.833 -2,11
Ago 4.619 3.697 -19,96 4.194 -9,20 4.118 -10,85 3.997 -13,47
Set 4.375 5.198 18,81 5.047 15,36 5.153 17,78 5.498 25,67
Out 4.825 4.224 -12,46 4.401 -8,79 4.330 -10,26 4.524 -6,24
Nov 4.705 3.668 -22,04 3.922 -16,64 3.821 -18,79 3.968 -15,66
Dez 6.546 5.966 -8,86 6.171 -5,73 6.062 -7,39 6.266 -4,28
Total 58.174 57.892 -0,48 58.980 1,39 59.062 1,53 61.404
∆ ∆% média 0,12 1,79 1,98 6,26
MSE 517.505 264.761 374.351 584.730
Figura 4.13 - Gráfico da previsão gerada para o modelo SARIMA(0,1,1)(0,1,0)
65
Tabela 4.11 - Previsões geradas para a série log{IRmodif} - valores em R$
milhões
(0,0,1)(0,1,0) (0,1,1)(0,1,0) (1,0,1)(0,1,0) (0,1,1)(0,1,1) (1,0,0)(0,1,1) (1,0,0)(1,1,0)
Mês Real
Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆%
Jan 5.156 5.171 0,29 5.100 -1,09 5.114 -0,81 5.431 5,33 5.238 1,59 5.243 1,69
Fev 4.206 5.718 35,95 5.674 34,90 5.695 35,40 5.217 24,04 5.583 32,74 5.615 33,50
Mar 5.718 6.127 7,15 6.080 6,33 6.106 6,79 6.032 5,49 6.094 6,58 6.113 6,91
Abr 4.713 5.187 10,06 5.147 9,21 5.172 9,74 5.143 9,12 5.149 9,25 5.158 9,44
Mai 4.113 4.083 -0,73 4.052 -1,48 4.073 -0,97 4.035 -1,90 4.026 -2,12 4.034 -1,92
Jun 4.261 4.268 0,16 4.235 -0,61 4.260 -0,02 4.157 -2,44 4.202 -1,38 4.212 -1,15
Jul 4.937 4.519 -8,47 4.484 -9,18 4.512 -8,61 4.781 -3,16 4.570 -7,43 4.570 -7,43
Ago 4.619 3.683 -20,26 3.655 -20,87 3.678 -20,37 4.049 -12,34 3.770 -18,38 3.768 -18,42
Set 4.375 5.184 18,49 5.144 17,58 5.178 18,35 5.001 14,31 5.114 16,89 5.132 17,30
Out 4.825 4.210 -12,75 4.178 -13,41 4.206 -12,83 4.321 -10,45 4.207 -12,81 4.208 -12,79
Nov 4.705 3.654 -22,34 3.626 -22,93 3.651 -22,40 3.814 -18,94 3.667 -22,06 3.667 -22,06
Dez 6.546 5.952 -9,07 5.906 -9,78 5.948 -9,14 6.157 -5,94 5.947 -9,15 5.947 -9,15
Total 58.174 57.756 -0,72 57.281 -1,54 57.593 -1,00 58.138 -0,06 57.567 -1,04 57.667 -0,87
∆ ∆% média -0,13 -0,84 -0,41 0,26 -0,52 -0,34
MSE 518.353 516.689 512.026 278.206 455.430 467.035
Figura 4.14 - Gráfico da previsão gerada para o modelo SARIMA(0,1,1)(0,1,0)
66
Tabela 4.12 - Previsões geradas para a série {IRmodif2} - valores em R$
milhões
(0,1,1)(0,1,1) (0,1,1)(1,1,0) (0,1,2)(0,1,1) (1,1,1)(0,1,1)
Mês Real
Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆%
Jan 5.156 5.624 9,08 5.847 13,40 5.720 10,94 5.704 10,63
Fev 4.206 5.194 23,49 5.523 31,31 5.406 28,53 5.378 27,86
Mar 5.718 6.151 7,57 6.320 10,53 6.332 10,74 6.325 10,62
Abr 4.713 5.247 11,33 5.327 13,03 5.428 15,17 5.425 15,11
Mai 4.113 4.360 6,01 4.147 0,83 4.503 9,48 4.507 9,58
Jun 4.261 4.370 2,56 4.306 1,06 4.533 6,38 4.533 6,38
Jul 4.937 5.021 1,70 5.061 2,51 5.183 4,98 5.184 5,00
Ago 4.619 4.420 -4,31 4.431 -4,07 4.567 -1,13 4.570 -1,06
Set 4.375 5.079 16,09 5.236 19,68 5.264 20,32 5.260 20,23
Out 4.825 4.571 -5,26 4.487 -7,01 4.728 -2,01 4.729 -1,99
Nov 4.705 4.139 -12,03 4.002 -14,94 4.285 -8,93 4.289 -8,84
Dez 6.546 6.358 -2,87 6.214 -5,07 6.512 -0,52 6.515 -0,47
Total 58.174 60.534 4,06 60.901 4,69 62.461 7,37 62.419 7,30
∆ ∆% média 4,45 5,10 7,83 7,75
MSE 225.266 372.106 326.076 317.364
Figura 4.15 - Gráfico da previsão gerada para o modelo SARIMA(0,1,1)(0,1,1)
67
Tabela 4.13 - Previsões geradas para a série log{IRmodif2} - valores em R$
milhões
(0,0,1)(0,1,0) (0,1,1)(0,1,0) (1,0,1)(0,1,0) (0,1,1)(0,1,1) (1,0,0)(0,1,1)
Mês Real
Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆% Prev. ∆ ∆%
Jan 5.156 5.160 0,08 5.173 0,33 5.502 6,71 5.143 -0,25 5.714 10,82
Fev 4.206 5.727 36,16 5.718 35,95 4.993 18,71 5.723 36,07 5.448 29,53
Mar 5.718 6.131 7,22 6.127 7,15 6.101 6,70 6.132 7,24 6.281 9,85
Abr 4.713 5.188 10,08 5.187 10,06 5.134 8,93 5.191 10,14 5.251 11,42
Mai 4.113 4.083 -0,73 4.083 -0,73 4.162 1,19 4.086 -0,66 4.024 -2,16
Jun 4.261 4.268 0,16 4.268 0,16 4.193 -1,60 4.271 0,23 4.190 -1,67
Jul 4.937 4.519 -8,47 4.519 -8,47 4.889 -0,97 4.523 -8,39 4.929 -0,16
Ago 4.619 3.683 -20,26 3.683 -20,26 4.208 -8,90 3.686 -20,20 4.222 -8,59
Set 4.375 5.184 18,49 5.184 18,49 4.944 13,01 5.188 18,58 5.158 17,90
Out 4.825 4.210 -12,75 4.210 -12,75 4.418 -8,44 4.213 -12,68 4.369 -9,45
Nov 4.705 3.654 -22,34 3.654 -22,34 3.949 -16,07 3.657 -22,27 3.857 -18,02
Dez 6.546 5.952 -9,07 5.952 -9,07 6.362 -2,81 5.957 -9,00 6.166 -5,81
Total 58.174 57.759 -0,71 57.758 -0,72 58.855 1,17 57.770 -0,69 59.609 2,47
∆ ∆% média -0,12 -0,12 1,37 -0,10 2,80
MSE 520.964 518.359 194.672 518.733 359.625
Figura 4.16 - Gráfico da previsão gerada para o modelo SARIMA(1,0,0)(0,1,0)
68
Tabela 4.14 - Cálculo das estatísticas t para os modelos com menor BIC
Parâmetros estimados
Série Modelo
erro-padrão
estatística t
(em valor absoluto)
-1,00 -0,69
{IR} (0,1,1)(0,1,1)
0,13 0,27
7,69 2,55
-0,84 -0,57
log{IR} (0,1,1)(0,1,1)
0,12 0,20
7,00 2,85
-0,78
{IRmodif} (0,1,1)(0,1,0)
0,12
6,50
0,41
log{IRmodif} (0,0,1)(0,1,0)
0,11
3,72
-0,87 -0,50
{IRmodif2} (0,1,1)(0,1,1)
0,15 0,20
5,80 2,50
0,39
log{IRmodif2} (0,0,1)(0,1,0)
0,12
8,33
Após a obtenção das previsões, a próxima etapa do método de Box-
Jenkins é a verificação da qualidade do ajuste. Por causa da quantidade de modelos
selecionados, somente aqueles modelos que apresentaram o menor valor do BIC
são verificados. Para essa verificação, a função interna do R arima0.diag será
utilizada, mas com algumas modificações. Como a função original não traça as
bandas assintóticas da distribuição normal (1,96 e -1,96) no gráfico dos Resíduos
Normalizados, tais linhas foram incorporadas.
A função original calcula os valores p para a estatística Box-Pierce e
não para a estatística Ljung-Box, e isso também foi modificado, uma vez que a
estatística Ljung-Box é tipicamente mais precisa em amostras pequenas. Nesse
mesmo gráfico, como todos os valores p devem estar acima de 0,05 e abaixo de 1, o
limite do eixo vertical foi aumentado para que uma linha tracejada fosse traçada
justamente no limite de y = 1. Além disso, os títulos e as legendas dos gráficos estão
em português.
69
Os gráficos de diagnóstico para o modelo SARIMA(0,1,1)(0,1,1) da
série {IR}, cuja equação estimada é dada por
( )( ) ( )( )
[ ] [ ] 27 , 0 13 , 0
, 69 , 0 1 1 1 1
12 12
t t
B B X B B ε − − · − −
onde os valores entre colchetes representam os valores aproximados do erro padrão
para os parâmetros estimados, sugerem a validade do modelo.
Os gráficos de diagnóstico para o modelo SARIMA(0,1,1)(0,1,1) da
série log{IR}, cuja equação estimada é dada por
( )( ) ( )( )
[ ] [ ] 20 , 0 12 , 0
, 57 , 0 1 84 , 0 1 1 1
12 12
t t
B B X B B ε − − · − −
onde os valores entre colchetes representam os valores aproximados do erro padrão
para os parâmetros estimados, sugerem a validade do modelo.
Os gráficos de diagnóstico para o modelo SARIMA(0,1,1)(0,1,0) da série
{IRmodif}, cuja equação estimada é dada por
( )( ) ( )
[ ] 12 , 0
, 78 , 0 1 1 1
12
t t
B X B B ε − · − −
onde os valores entre colchetes representam os valores aproximados do erro padrão
para os parâmetros estimados, sugerem a validade do modelo.
Os gráficos de diagnóstico para o modelo SARIMA(0,0,1)(0,1,0) da série
log{IRmodif}, cuja equação estimada é dada por
( ) ( )
[ ] 11 , 0
, 41 , 0 1 1
12
t t
B X B ε + · −
70
onde os valores entre colchetes representam os valores aproximados do erro padrão
para os parâmetros estimados, sugerem a validade do modelo.
Os gráficos de diagnóstico para o modelo SARIMA(0,1,1)(0,1,1) da série
{IRmodif2}, cuja equação estimada é dada por
( )( ) ( )( )
[ ] [ ] 20 , 0 15 , 0
, 50 , 0 1 87 , 0 1 1 1
12 12
t t
B B X B B ε − − · − −
onde os valores entre colchetes representam os valores aproximados do erro padrão
para os parâmetros estimados, sugerem a validade do modelo.
Os gráficos de diagnóstico para o modelo SARIMA(0,0,1)(0,1,0) da série
log{IRmodif2}, cuja equação estimada é dada por
( )( )
[ ] 12 , 0
, 1 39 , 0 1
12
t t
X B B ε · − +
onde os valores entre colchetes representam os valores aproximados do erro padrão
para os parâmetros estimados, sugerem a validade do modelo.
Após a apresentação dos resultados obtidos para as previsões
oriundas dos diversos métodos, no próximo capítulo discutir-se-ão as previsões e
será feita uma comparação entre os três métodos de previsão apresentados até
aqui. Depois da comparação, um dos métodos será recomendado para realizar
previsões na SRF. De posse desse método, serão geradas previsões para as séries
desagregadadas do IR (IRPF, IRPJ e IRRF-trab) e seus resultados serão
comparados com os valores obtidos pelo método dos indicadores. Por fim, serão
realizadas previsões com o horizonte reduzido para 1 passo e 3 passos à frente.
71
5 - Di scussão dos r esul t ados
Neste capítulo, serão comparados os resultados obtidos pelo método de
indicadores, pelo algoritmo de Holt-Winters sazonal e pela modelagem de Box-
Jenkins para a série {IR} e faz-se a escolha de um método de previsão para
representar os dados. Serão apresentados ainda os resultados para mais três
impostos que compõem o Imposto sobre a Renda. Além disso, são obtidas
previsões para 1 passo e 3 passos à frente.
5. 1 - Compar ação de r esul t ados
Apesar de o método utilizado pela SRF não ser estatisticamente confiável,
deve-se comparar os resultados obtidos pelo método dos indicadores com os
oriundos dos métodos de alisamento exponencial e Box-Jenkins, para analisar o
melhoramento nos resultados de previsão introduzido pela adoção dessas novas
técnicas econométricas, estatisticamente mais confiáveis.
Como o método dos indicadores utiliza somente a série de dados sem
transformação, inicialmente a comparação será feita com os resultados para a série
intitulada {IR}. Teoricamente, a comparação pode se basear no valor do MSE, uma
vez que os valores reais estão disponíveis. A Tabela 5.1 resume os resultados das
Tabelas 3.2, 4.3 e 4.7. O modelo SARIMA escolhido foi aquele de menor valor do
BIC, que coincidentemente também possui o menor valor de MSE.
72
Tabela 5.1 - Comparação de resultados para a série {IR}
Índices
Método
∆% agregada ∆% média MSE
Indicadores -10,72 -10,17 585.247
Holt-Winters sazonal 3,69 4,04 207.963
SARIMA(0,1,1)( 0,1,1) 7,5 7,9 253.846
Apesar de o valor da diferença percentual ser um índice meramente
ilustrativo, que mostra quão próximo o modelo previu o valor observado, esse valor
pode ser utilizado como comparação didática entre os modelos. Assim, os modelos
de alisamento exponencial e de Box-Jenkins aproximam-se melhor dos valores
observados para a série{IR} quando comparados aos valores das diferenças
percentuais dos métodos. Verifica-se ainda que as previsões geradas pelo método
de indicadores subestimam as receitas anuais totais em mais de 10% e subestimam,
na média, as arrecadações mensais em mais de 10%.
Além disso, nota-se que as metodologias de alisamento exponencial e Box-
Jenkins superaram a capacidade preditiva do métodos de indicadores, pois elas
apresentam menores valores de MSE. A diferença do MSE entre os dois métodos e
do métodos de indicadores é maior que 100%, o que indica a presença de grandes
resíduos gerados pelo método utilizado pela SRF, caracterizando novamente a
inadequabilidade desse método. A comparação entre os métodos de Holt-Winters e
Box-Jenkins será apresentada a seguir.
Como o método dos indicadores não inclui uma análise exploratória dos
dados da série histórica e como o valor de março de 1996 é uma observação outlier,
a comparação agora será feita entre as metodologias alisamento exponencial (HWS)
e Box-Jenkins, e entre as séries {IR}, log{IR}, {IRmodif}, log{IRmodif}, {IRmodif2}
73
e log{IRmodif2}. Essa comparação utilizará o menor valor do MSE para caracterizar
o modelo com a melhor capacidade preditiva. A Tabela 5.2 resume as informações
das Tabelas 4.3, 4.4, 4.5, 4.7, 4.8, 4.9, 4.10, 4.11 e 4.12. Os 6 modelos SARIMA
foram escolhidos pelo critério de menor BIC.
Tabela 5.2 - Comparação de resultados para todas as séries
Índices
Série Método/Modelo
∆% agregada ∆% média MSE
HWS 3,69 4,04 207.963
{IR}
SARIMA(0,1,1)( 0,1,1) 7,5 7,9 253.846
HWS -0,34 -0,17 221.613
log{IR}
SARIMA(0,1,1)( 0,1,1) 4,22 4,34 207.871
HWS 3,61 4,01 312.879
{IRmodif}
SARIMA(0,1,1)( 0,1,0) -0,48 -0,12 517.505
HWS 1,33 1,57 281.221
log{IRmodif}
SARIMA(0,0,1)( 0,1,0) -0,72 -0,13 518.353
HWS 2,93 3,29 260.900
{IRmodif2}
SARIMA(0,1,1)( 0,1,1) 4,06 4,45 225.266
HWS -0,27 -0,04 272.674
log{IRmodif2}
SARIMA(0,0,1)( 0,1,0) -0,71 -0,12 520.964
Em relação à série {IR}, o método de alisamento exponencial forneceu
melhores previsões do que o modelo SARIMA, pois os valores das diferenças
percentuais são menores para o primeiro método. Ainda, a capacidade preditiva do
método HWS é melhor que a do método Box-Jenkins em termos do valor do MSE.
Os dois métodos superestimaram as previsões da arrecadação total e a média da
arrecadação mensal.
Para a série log{IR}, o método de alisamento exponencial conseguiu
aproximar-se com diferenças quase nulas dos valores observados, visto que a ∆%
agregada é inexpressiva. Contudo, a modelagem SARIMA possui uma capacidade
74
preditiva superior, pois o valor do seu MSE é inferior ao valor do MSE para o
método HWS. A modelagem HWS subestimou tanto a arrecadação agregada quanto
a arrecadação média mensal. Já o método Box-Jenkins superestimou as receitas em
aproximadamente 4%.
A transformação da série {IR} em logaritmos produziu efeitos diversos nas
duas modelagens. Para o alisamento exponencial, a transformação fez as diferenças
percentuais se reduzirem a quase zero, mas o valor do MSE aumentou em
aproximadamente 10%. Em relação ao método Box-Jenkins, a transformação
diminui tanto as diferenças percentuais quanto o MSE. Assim, a transformação
logarítmica conseguiu estabilizar a série e apresentar previsões melhores do que a
série original.
Em relação à série {IRmodif}, nota-se que a modelagem SARIMA aproximou-
se mais dos valores reais observados, com diferenças percentuais próximas de zero,
mas o valor do MSE foi menor para a modelagem HWS. Assim, para essa série, o
método de alisamento exponencial apresenta uma melhor capacidade preditiva. A
modelagem SARIMA subestimou as receitas enquanto que HWS superestimou a
arrecadação em 4%.
Em relação à série log{IRmodif}, a capacidade preditiva do método HWS é
muito superior à do método Box-Jenkins, visto que a diferença entre os MSE é maior
que 80%. As diferenças percentuais são menores para a modelagem. Tal qual na
série {IRmodif}, a modelagem SARIMA subestimou as receitas enquanto que HWS
superestimou a arrecadação em 2%.
75
Assim, a transformação logarítmica da série {IRmodif} produziu efeitos
diversos nas duas modelagens. Para a modelagem HWS, os logaritmos diminuíram
tanto o valor do MSE quanto os valores das diferenças percentuais. Por outro lado, a
metodologia Box-Jenkins não captou muito bem essa transformação, uma vez que
suas diferenças percentuais e o valor do MSE mantiveram-se constantes.
Para a série {IRmodif2}, verifica-se que a modelagem SARIMA possui uma
capacidade de previsão superior ao método HWS em cerca de 20% e as diferenças
percentuais são menores para o método HWS. As duas modelagens
superestimaram as receitas total e a média mensal entre 3 e 4%. A transformação
logarítmica fez com que as duas modelagens diminuíssem suas capacidades
preditivas, sendo que o método Box-Jenkins apresentou uma piora maior, pois a
diferença entre os MSE é de mais de 100%. Nota-se que os logaritmos fizeram as
diferenças percentuais serem reduzidas para próximo de zero para os dois métodos.
A substituição do valor outlier de março de 1996, ou seja, a transformação da
série {IR} em {IRmodif} e em {IRmodif2}, produziu efeitos diversos nas duas
modelagens. Para o método de alisamento exponencial essas transformações
diminuíram a capacidade preditiva do método. O valor do MSE aumentou em cerca
de 50% para a transformação {IRmodif} e em cerca de 30% para a transformação
{IRmodif2}. Nota-se que as diferenças percentuais se mantiveram praticamente
constantes nas duas transformações.
Para o método de Box-Jenkins a transformação da série original {IR} em
{IRmodif} diminui sensivelmente a capacidade preditiva do método. O valor do MSE
76
aumentou em mais de 100%. Porém, a transformação {IRmodif2} aumentou a
capacidade de previsão do método, pois o valor do MSE diminuiu 10%. Nota-se que
as diferenças percentuais para a transformação {IRmodif} são bem próximas de
zero, enquanto que para a outra transformação essas diferenças são próximas de
4%.
As transformações logarítmicas das séries, log{IR} em log{IRmodif} e em
log{IRmodif2}, produzirem efeitos iguais para as duas modelagens. Os valores do
MSE para a série log{IR} nas duas modelagens são menores do que os mesmos
valores para as séries log{IRmodif} e log{IRmodif2}. Isso mostra que para os
logaritmos a substituição do outlier diminuiu a capacidade preditiva dos métodos de
alisamento exponencial e Box-Jenkins.
A Tabela 5.1 mostra ainda que a modelagem HWS se adapta melhor à série
original {IR}, com o valor do MSE em 207.963. A modelagem Box-Jenkins adapta-se
melhor à série log{IR}, com o valor do MSE em 207.871. Em termos da diferença
percentual agregada, a modelagem HWS produziu as menores diferenças na série
log{IRmodif2}, -0,27%. A modelagem Box-Jenkins produziu as menores diferenças
na série {IRmodif}, 0,48%.
Em relação à significância estatística dos modelos SARIMA constantes da
Tabela 4.14 e da tabela 5.2, deve-se comparar os valores absolutos calculados para
a estatística t com o valor crítico de 1,96, que corresponde ao nível assintótico da
distribuição normal para 5% de significância. Assim, deve-se rejeitar a hipótese nula
que os parâmetros são individualmente nulos, com 95% de confiança, para todos os
77
modelos constantes da Tabela 4.14. Porém, tais testes devem ser tomados com
cautela, devido ao fato que o número reduzido de observações pode causar viés nas
estimativas das variâncias [Ansley & Newbold, 1980]. Por isso, os testes de
significância estatística não serão considerados.
5. 2 - Escol ha do mét odo de pr ev i são
Pelo explicitado na seção anterior, os dois métodos de previsão, baseados no
algoritmo de Holt-Winters sazonal e de Box-Jenkins, apresentaram resultados muito
parecidos entre si, tanto para valores de MSE quanto para as diferenças percentuais
agregadas. Então, a escolha do método poderia ser feita em relação a
características de simplicidade, automaticidade ou praticidade no uso. Assim, a
escolha mais óbvia seria o método de alisamento exponencial em detrimento ao
método de Box-Jenkins.
Contudo, nem sempre o método de alisamento exponencial produz previsões
iguais ou superiores ao método de Box-Jenkins. Em um estudo realizado por Paul
Newbold e Clive Granger [Newbold & Granger, 1974] com 106 séries econômicas
(80 mensais e 26 trimestrais), incluindo séries macro e microeconômicas sazonais e
não-sazonais, a capacidade preditiva dos métodos de Box-Jenkins e alisamento
exponencial foi comparada utilizando o critério do MSE. A Tabela 5.3 mostra a
percentagem de ocasiões que o método Box-Jenkins (BJ) superou o alisamento
exponencial (HW) para previsões até 8 passos a frente.
78
Tabela 5.3 - Percentagem (%) de vezes que BJ superou HW
Passos à frente
1 2 3 4 5 6 7 8
BJ:HW 73 64 60 58 58 57 58 58
Nota-se pela Tabela 5.3 que a metodologia de Box-Jenkins é claramente
superior ao método de alisamento exponencial para previsões poucos passos à
frente. Quando o horizonte de previsão é mais longo, a vantagem comparativa do
método ARIMA diminui. Mas isso é devido principalmente à influência das séries
não-sazonais e, ao se considerar somente séries sazonais, a vantagem do método
Box-Jenkins persiste a longo prazo [Newbold & Granger, 1974]. Ao se analisar mais
detalhadamente as previsões um passo à frente, nota-se que
. 8 , 0
previsões de
previsões de
·
HW MSE
ARIMA MSE
Isso mostra que os erros de previsão do método Box-Jenkins são 20% inferiores aos
erros do método de alisamento exponencial.
Os autores sugerem ainda algumas regras que servem de base para decidir
qual método de previsão escolher:
(a) Para séries com até 30 observações o método de Holt-Winters deve ser
utilizado.
(b) Para séries com mais de 30 e menos de 50 observações não há muita
certeza, e pode-se escolher entre Holt-Winters e modelos ARIMA.
(c) Para séries com mais de 50 observações, se o custo de previsão não
for importante, deve-se utilizar modelos ARIMA. Caso o custo de previsão
seja importante, deve-se utilizar Holt-Winters ou modelos AR.
79
Então, recomenda-se que a modelagem Box-Jenkins seja seguida para se
fazer as previsões da série do Imposto de Renda e, generalizando, para todas as
previsões dos tributos administrados pela Secretaria da Receita Federal.
5. 3 - Escol ha de um model o SARI MA
Como na prática não se dispõe dos dados futuros para que o modelo com a
melhor capacidade preditiva (menor valor de MSE) seja escolhido, o valor do critério
BIC deve ser utilizado. Assim, analisando a Tabela 4.6, nota-se que o modelo com o
menor valor de BIC é um modelo SARIMA(0,1,1)(0,1,0) com uma diferença de 0,7
unidades para um modelo SARIMA(0,1,1)(0,1,1), para a série {IRmodif}. Nota-se
que, para as três séries não transformadas em logaritmo, o modelo com o menor
BIC é o modelo airline.
Para as séries logarítmicas, o modelo com menor BIC é um
SARIMA(0,0,1)(0,1,0) com uma diferença de 0,5 unidades para um modelo
SARIMA(0,1,1)(0,1,0), para a série log{IRmodif}. Para as séries logarítmicas, o
modelo airline não obteve um valor para o BIC competitivo.
Assim, se em termos do valor do MSE as transformações no valor outlier
tiveram pouco sucesso, conforme visto na seção 5.1, para a análise do valor do BIC
a transformação do valor do mês de março para o menor valor da série mostrou-se
satisfatória. Os modelos selecionados que possuem o menor valor do BIC são os
das séries {IRmodif} e log{IRmodif}, conforme mostra a Tabela 4.6. Ainda, ao se
analisar as Tabelas 4.9 e 4.10, nota-se que esses modelos apresentam valores
80
muito baixos para as diferenças percentuais agregadas, o modelo
SARIMA(0,1,1)(0,1,0), da série {IRmodif}, produziu uma ∆% agregada de -0,48% e o
modelo SARIMA(0,0,1)(0,1,0), da série log{IRmodif}, produziu uma ∆% agregada de
-0,72%.
Desta maneira, apesar de a diferença em termos de BIC ser menor que 0,1%
para os modelos SARIMA da série {IRmodif}, a escolha do modelo deve ser feita
respeitando-se o princípio da parcimônia, aquele em que modelos mais simples
sempre devem ser preferidos. Então, o modelo SARIMA(0,1,1)(0,1,0) é escolhido em
vez do modelo airline. A equação do modelo ajustado é dada por
( )( ) ( )
[ ] 12 , 0
78 , 0 1 1 1
12
t t
B X B B ε − · − −
e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado.
Para a série log{IRmodif}, o modelo escolhido é um SARIMA(0,0,1)(0,1,0),
respeitando-se o princípio da parcimônia. A equação do modelo ajustado é dada por
( ) ( )
[ ] 11 , 0
41 , 0 1 1
12
t t
B X B ε + · −
e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado.
5. 4 - Resul t ados da pr ev i são par a out r os i mpost os
Com o objetivo de evitar repetições, as previsões para os impostos sobre a
renda de Pessoas Físicas (IRPF), Pessoas Jurídicas (IRPJ) e o imposto de renda
retido na fonte - Rendimentos do Trabalho (IRRF- trab) não serão analisadas tão
81
detidamente quanto a previsão para o imposto de renda agregado. Os resultados
obtidos pelo método dos indicadores, conforme mostra a Tabela 3.2, serão
comparados aos obtidos por modelos SARIMA. Tais modelos foram escolhidos
conforme os procedimentos apresentados na seção 5.3, ou seja, modelos com o
menor valor do BIC, que respeitem o princípio da parcimônia.
Além das séries do {IRPF}, {IRPJ} e {IRRF-trab} foram investigadas também
as transformações logarítmicas para as mesmas. Assim, a Tabela 5.4 mostra as
previsões obtidas para as séries {IRPF}, log{IRPF}, {IRPJ}, log{IRPJ} e {IRRF-trab} e
log{IRRF-trab}, de acordo com cada método de previsão.
Tabela 5.4 - Comparação de resultados para as outras séries
Índices
Série Método/Modelo
∆% agregada ∆% média MSE
Indicadores -4,70 -11,28 3.602
{IRPF}
SARIMA(0,1,1)(0,1,0) -2,50 -5,84 3.171
log{IRPF} SARIMA(0,1,1)(0,1,0) 0,75 -2,64 3.631
Indicadores -24,26 -23,14 188.725
{IRPJ}
SARIMA(0,1,1)(0,1,1) -18,93 -19,23 117.418
log{IRPJ} SARIMA(0,0,0)(0,1,1) -15,94 -14,37 104.643
Indicadores -10,06 -8,8 69.494
{IRRF-trab}
SARIMA(0,1,1)(0,1,1) -9,94 -8,55 59.961
log{IRRF-trab} SARIMA(1,0,0)(0,1,0) -9,79 -8,55 60.765
Nota-se pela análise da Tabela 5.4 que todos os modelos SARIMA possuem
capacidade preditiva superior ao método dos indicadores, i.e., possuem o valor do
MSE inferior ao obtido pelo método dos indicadores. A única exceção é o modelo
SARIMA(0,1,1)(0,1,0) da série log{IRPF}. Porém, a diferença dos valores do MSE
para as duas previsões é desprezível, cerca de 1%. Verifica-se também que os
82
valores das diferenças percentuais calculadas para os modelos SARIMA são bem
inferiores que para o método dos indicadores.
Além disso, nota-se que a utilização da transformação logarítmica trouxe
resultados benéficos, em termos do MSE, somente para a série {IRPJ}, cujo valor do
MSE foi reduzido em torno de 10%. As duas outras séries apresentaram ou
resultado pior, com diminuição da capacidade preditiva em cerca de 13% para a
série {IRPF}, ou resultado praticamente constante, com diminuição em torno 1,5%
para a série {IRRF-trab}.
O modelo SARIMA(0,1,1)(0,1,0) estimado para a série {IRPF} possui equação
de acordo com
( )( ) ( )
[ ] 085 , 0
84 , 0 1 1 1
12
t t
B X B B ε − · − −
e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado. Os
valores entre colchetes representam os valores aproximados do erro padrão para os
parâmetros estimados.
O modelo SARIMA(0,1,1)(0,1,0) estimado para a série log{IRPF} possui
equação de acordo com
( )( ) ( )
[ ] 081 , 0
81 , 0 1 1 1
12
t t
B X B B ε − · − −
e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado. Os
valores entre colchetes representam os valores aproximados do erro padrão para os
parâmetros estimados.
83
O modelo SARIMA(0,1,1)(0,1,1) estimado para a série {IRPJ} possui equação
de acordo com
( )( ) ( )
[ ] [ ] 32 , 0 17 , 0
) 1 ( 97 , 0 1 1 1
12 12
t t
B B X B B ε − − · − −
e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado. Os
valores entre colchetes representam os valores aproximados do erro padrão para os
parâmetros estimados.
O modelo SARIMA(0,0,0)(0,1,1) estimado para a série log{IRPJ} possui
equação de acordo com
( )
[ ] 20 , 0
) 63 , 0 1 ( 1
12 12
t t
B X B ε − · −
e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado. Os
valores entre colchetes representam os valores aproximados do erro padrão para os
parâmetros estimados.
O modelo SARIMA(0,1,1)(0,1,1) estimado para a série {IRRF-trab} possui
equação de acordo com
( )( ) ( )
[ ] [ ] 24 , 0 11 , 0
) 45 , 0 1 ( 62 , 0 1 1 1
12 12
t t
B B X B B ε − − · − −
e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado. Os
valores entre colchetes representam os valores aproximados do erro padrão para os
parâmetros estimados.
O modelo SARIMA(1,0,0)(0,1,0) estimado para a série log{IRRF-trab} possui
84
equação de acordo com
( )( )
[ ] 11 , 0
12
1 59 , 0 1
t t
X B B ε · − −
e os gráficos de diagnóstico sugerem a validade do modelo. Os valores entre
colchetes representam os valores aproximados do erro padrão para os parâmetros
estimados.
5. 5 - Pr ev i sões com hor i zont e r eduzi do
Em conformidade com o estudo realizado por Paul Newbold e Clive Granger
[Newbold & Granger, 1974], o horizonte de previsão será reduzido para que os dois
métodos de previsão, alisamento exponencial e Box-Jenkins, possam ser
comparados em relação ao grau de acurácia, que será medido pelo MSE. As
previsões serão feitas para 1 passo e 3 passos à frente para a série log{IR}, de
forma que se utilizará a série com observações até janeiro de 2000 para prever o
valor da arrecadação do mês de fevereiro de 2000 e com observações até março de
2000 para fazer previsões para os meses de abril, maio e junho de 2000.
Os métodos de previsão utilizados serão alisamento exponencial e método
Box-Jenkins. O modelo para o método Box-Jenkins é um SARIMA(0,1,1)(0,1,1), que
possui o menor valor para o critério do BIC para a série log{IR}, conforme mostra a
Tabela 4.7. A Tabela 5.5 mostra os resultados obtidos para a previsão 1 passo à
frente para cada método e a Tabela 5.6 mostra os resultados para a previsão 3
passos à frente para cada método.
85
Tabela 5.5 - Previsões geradas 1 passo à frente - valores em R$ milhões
Mês
Método/Modelo
Fevereiro
∆% MSE
HWS 4.897 16,43 477.481
SARIMA(0,1,1)(0,1,1) 4.489 15,28 413.449
Valor arrecadado real 4.206
Tabela 5.6 - Previsões geradas 3 passos à frente - valores em R$ milhões
Mês
Método/Modelo
Abril Maio Junho
∆% -
agregada
∆% -
média
MSE
HWS 4.673 3.860 3.856 -5,33 -5,50 76.545
SARIMA(0,1,1)(0,1,1) 4.873 4.207 4.088 0,62 0,54 21.455
Valor arrecadado real 4.713 4.113 4.621
Pela Tabela 5.5, nota-se que o modelo SARIMA forneceu melhores previsões
do que o método HWS, pois o valor da diferença percentual é menor para o modelo
airline. Ainda, a capacidade preditiva do modelo SARIMA é superior em cerca de
10% em relação ao método HWS, em termos do valor do MSE. Os dois métodos
superestimaram a previsão mensal em torno de 15%.
Pela Tabela 5.6, verifica-se que o modelo SARIMA possui características
preditivas superiores ao método de alisamento exponencial, pois os valores da
diferença percentual agregada e média são quase nulos para a modelagem Box-
Jenkins. Além disso, a diferença dos valores do MSE para os dois métodos é
superior a 300%, indicando que, em termos de precisão segundo o MSE, o modelo
SARIMA é mais de 3 vezes preciso. Então, evidencia-se pela análise das duas
tabelas que o método de Box-Jenkins produziu previsões superiores em relação ao
método de alisamento exponencial para horizontes curtos de previsão, o que está de
acordo com o estudo dos autores mencionados.
86
Além de se comparar os dois métodos de previsão, a redução do horizonte de
previsão pode ser útil para se revisar e ajustar as previsões calculadas
anteriormente. Assim, pode-se imaginar uma estratégia de revisão a cada bimestre
ou trimestre à medida que novas observações vão sendo acrescentadas à série. Por
exemplo, suponha que ocorra uma revisão em meados do final de 1º trimestre para
ajustar as previsões efetuadas para o 2º trimestre, que foram calculadas com um
modelo com horizonte de 12 passos à frente.
Ao se comparar os dados de previsão para os meses do 2º trimestre da
Tabela 4.9 com os dados da Tabela 5.6, nota-se uma clara melhoria em relação
tanto ao valores das diferenças agregadas e médias quanto em relação ao valor do
MSE. A Tabela 5.7 mostra os resultados dessa comparação utilizando um modelo
SARIMA(0,1,1)(0,1,1) para a série log{IR}. A Figura 5.1 mostra graficamente tal
comparação, na qual a reta azul representa o valor real, a reta vermelha a previsão
com 3 passos à frente e a reta verde a previsão com 12 passos à frente.
Tabela 5.7 - Comparação entre previsões - valores em R$ milhões
Mês Nº de passos à frente do
modelo Abril Maio Junho
∆% -
agregada
∆% -
média
MSE
3 4.873 4.207 4.088 0,62 0,54 21.455
12 5.223 4.370 4.322 6,33 6,17 109.957
Valor arrecadado real 4.713 4.113 4.621
87
Figura 5.1 - Comparação gráfica da revisão da arrecadação
88
6 - Concl usão
O objetivo principal desse trabalho foi aplicar métodos estatísticos e
econométricos na busca de previsões mais confiáveis e mais acuradas para a
arrecadação do tributo federal denominado como Imposto sobre a Renda. Ao
mesmo tempo, buscou-se mostrar que o método atualmente utilizado pela Secretaria
da Receita Federal, conhecido como método de indicadores, poderia ser aprimorada
econometricamente mediante a utilização da metodologia proposta neste estudo.
Os métodos estatísticos de previsão utilizados ao longo do trabalho foram o
alisamento exponencial, principalmente o algoritmo de Holt-Winters sazonal aditivo,
e a metodologia de Box-Jenkins, principalmente a modelagem SARIMA. Tais
métodos se mostraram superiores ao método de indicadores, gerando previsões
mais acuradas. Um fato importante relacionado ao uso dessas modelagens é que
sua utilização depende apenas dos dados históricos da série temporal em questão,
ou seja, as modelagens trabalham com séries temporais univariadas.
Apesar de parecer paradoxal que as previsões obtidas com modelos mais
simples possam gerar previsões mais precisas, tal fato está bem estabelecido na
literatura [Cooper, 1972]. Existem também comparações entre os vários métodos de
previsão com modelos univariados, sendo o principal estudo realizado por [Newbold
& Granger, 1974]. Os autores mostraram a superioridade da modelagem SARIMA
em relação a métodos de modelagem automático. Nesse mesmo estudo, os autores
verificaram que a combinação de métodos de previsão pode gerar resultados tão ou
89
mais precisos que a utilização dos métodos individualmente.
Assim, fica aqui a primeira recomendação para um futuro trabalho, estudar os
resultados da combinação do método de Box-Jenkins com o alisamento exponencial
e verificar a precisão das previsões geradas. Essa combinação pode ser pensada
como uma combinação linear entre os dois métodos, de forma que os pesos
associados ao métodos possam ser estimados.
A comparação entre os métodos efetuada nesta dissertação teve como
principal função a escolha de uma metodologia que pudesse ser aplicada para a
previsão de todos os tributos federais. Assim, a escolha da metodologia Box-Jenkins
foi amplamente amparada na literatura e no estudo de caso aqui exposto. Porém,
pode surgir a dúvida por que nessa comparação não foram utilizados também os
resultados de uma regressão.
Primeiramente, porque a modelagem de uma regressão requer um total
conhecimento da relação entre as variáveis do modelo, o que no caso de
arrecadação tributária poderia gerar modelos subparametrizados ou
superparametrizados, uma vez que a arrecadação de tributos é dependente de
muitas variáveis econômicas. Tal fato poderia gerar modelos incorretamente
especificados, principalmente se o analista possuir pouca experiência com modelos
de regressão. Além disso, Gourieroux & Monfort (1997), em uma comparação entre
a modelagem ARIMA e a modelagem de regressão, mostraram que o erro relativo
de previsão da modelagem ARIMA foi inferior 2,5 pontos percentuais em relação a
modelos de regressão.
90
Portanto, como uma segunda sugestão para um futuro trabalho sugere-se
incluir variáveis exógenas, tais como o PIB, o consumo de energia elétrica ou o
comportamento da taxa de juros, entre outras, no modelo ARIMA e estudar a classe
de modelos ARMAX.
Por fim, depreende-se do estudo que a Secretaria da Receita Federal poderia
aprimorar fortemente sua previsão de arrecadação, em particular do Imposto de
Renda, com a metodologia ora proposta, que permitiu reduzir o erro de previsão
médio de 10% para 0,17% aproximadamente, para o período janeiro de 2000 a
dezembro de 2000. Neste sentido, este trabalho mostrou que existem metodologias
econometricamente mais apropriadas que fornecem previsões muito superiores e de
uma maneira relativamente simples, apesar do trabalho de modelagem ser
“artesanal” que poderiam complementar o método dos indicadores correntemente
utilizado pela Receita Federal.
Ainda, cabe destacar que a utilização das técnicas aqui consideradas pode
tornar o trabalho tanto do analista de previsões quanto do administrador mais eficaz,
uma vez que o primeiro não precisará de tantas variáveis em seu modelo e o
segundo poderá tomar decisões mais realistas e precisas quando utilizar os
resultados das previsões como instrumento de planejamento econômico.
91
7 - Ref er ênci as bi bl i ogr áf i cas
[1] Ansley, C.F. & Newbold, P. (1980). Finite sample properties of estimators
for autoregressive moving average models. Journal of Econometrics.13, 159-
183.
[2] Bowerman, B.L. & O’Connell, R.T. (1987). Time Series Forecasting, Unified
Concepts and Computer Implementation, 2ª Edição. Boston: Duxbury Press.
[3] Box, G.E.P., & Jenkins, G.M. (1970). Time Series Analysis, Forecasting
and Control. San Francisco: Holden Day.
[4] Brockwell, P.J. & Davis, R.A. (1996). Introduction to Time Series and
Forecasting. NewYork: Springer-Verlag.
[5] Cooper, R.L. (1972). The predictive performance of quartely econometric
models of the United States. Em Hickman, B.G. (ed.) Econometric Models of
Cyclical Behavior. New York: Columbia University Press.
[6] Cribari-Neto, F. (2000). Método de Previsão de Arrecadação Tributária.
MIMEO
[7] Enders, W. (1995). Applied Econometric Time Series. New York: John
Wiley & Sons.
[8] Folha de S. Paulo. Jornal Folha de S. Paulo edição de 17/05/1996. Editoria
Dinheiro, páginas 2 a 4.
[9] Gourieroux, C. & Monfort, A. (1997). Time Series and Dinamics Models.
New York: Cambridge University Press.
[10] Granger, C.W.J. & Newbold, P. (1986). Forecasting Economic Time
Series. New York: Academic Press.
92
[11] Hill, R.C., Griffiths, W.E. & Judge, G.G. (1999). Econometria. São Paulo:
Editora Saraiva.
[12] Janacek, G. (2001). Practical Time Series. London: Arnold Publishers.
[13] Kvanli, A.H, Guynes, C.S. & Pavur, R..J. (1996). Introduction to Business
Statistics, A Computer Integrated Approach, 4ª Edição. St.Paul: West
Publishing Company.
[14] Mills, T.C. (1990). Time Series Techniques for Economists. Cambridge:
Cambridge University Press.
[15] Newbold, P. & Granger, C.W.J. (1974). Experience with forecasting
univariate time series and the combination of forecasts. Journal of the Royal
Statistics Society A, 137, 131-146.
[16] Venables, W.N. & Ripley, B.D. (1999). Modern Applied Statistics with S-
PLUS 3
rd
Edition. New York: Springer-Verlag.
93
Apêndi ce A
94
Este apêndice apresenta a função utilizada no R para a seleção de modelos com
base nos valores do BIC. Tal função foi adaptada de Cribari-Neto (2000) e calcula,
para uma dada configuração inicial de P, D, Q, d, uma matriz com o valor do BIC
para diversas combinação de valores de p e q.
bic<-function(serie,d,P,D,Q)
{
M<-matrix(0,5,5)
if(P==0 && Q==0)
{
for(i in 0:4)
{
for(j in 0:4)
{
if(i==0 && j==0) M[1,1]<-NA
else
M[i+1,j+1]<-
my.arima0(serie,order=c(i,d,j),seasonal=list(order=c(P,D,Q)))$aic
}
}
}
else
{
for(i in 0:4)
{
for(j in 0:4)
{
M[i+1,j+1]<-
my.arima0(serie,order=c(i,d,j),seasonal=list(order=c(P,D,Q)))$aic
}
}
}
M.AIC<-M
return(M)
}
95
Apêndi ce B
96
Este apêndice apresenta os resultados do valor do critério de seleção de modelos
BIC para cada série. Em cada tabela estão listados os modelos com o menor BIC
para uma dada configuração inicial dos valores de P, D, Q, d e aqueles modelos que
possuem uma diferença de até dois para o BIC do modelo com menor BIC.
Tabela B.1 - Modelos e valores para o BIC da série {IR}
Modelo Modelo Modelo Modelo
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(0,0,1) (0,1,0) 897,6 (0,0,1) (1,1,0) 894,7 (1,0,0) (2,1,0) 898,4 (0,1,1) (0,1,1) 873
(1,0,0) (0,1,0) 897,7 (0,0,0) (1,1,0) 895,6 (0,0,1) (2,1,0) 898,9 (0,1,1) (0,1,2) 877,1
(1,0,1) (0,1,1) 892 (1,0,1) (1,1,1) 896,1 (1,0,1) (2,1,1) 901,5 (0,1,1) (1,1,0) 874,9
(1,0,1) (0,1,2) 896,8 (1,0,0) (1,1,1) 898,5 (1,0,0) (2,1,1) 902,1 (0,1,1) (1,1,1) 887,1
(0,0,1) (0,1,2) 898,1 (0,0,1) (1,1,1) 898,9 (0,0,1) (2,1,1) 902,4 (0,1,1) (1,1,2) 881,3
(1,0,0) (0,1,2) 898,5 (1,0,1) (1,1,2) 900,3 (1,0,1) (2,1,2) 904,2 (0,1,1) (2,1,0) 877,3
(1,0,1) (1,1,0) 893,9 (0,0,1) (1,1,2) 902,5 (1,0,0) (2,1,2) 906 (0,1,1) (2,1,1) 881,5
(1,0,0) (1,1,0) 894,3 (1,0,1) (2,1,0) 896 (0,1,1) (0,1,0) 881,9 (0,1,1) (2,1,2) 885,4
Tabela B.2 - Modelos e valores para o BIC da série log{IR}
Modelo Modelo Modelo Modelo
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(1,0,0) (0,1,0) -14,5 (1,0,1) (1,1,1) -12 (1,0,0) (2,1,1) -6,6
(0,1,1) (1,1,0) -16,7
(0,0,1) (0,1,0) -14,5 (1,0,0) (1,1,1) -10,4 (0,0,1) (2,1,1) -6,3 (0,1,2) (1,1,0) -15
(1,0,1) (0,1,1) -16,4 (0,0,1) (1,1,2) -6,6 (1,0,1) (2,1,2) -3,6 (1,1,1) (1,1,0) -14,5
(1,0,0) (0,1,1) -14 (1,0,0) (1,1,2) -6,4 (1,0,0) (2,1,2) -2,9 (0,1,1) (1,1,1) -14,4
(0,0,1) (0,1,2) -10,7 (1,0,1) (1,1,2) -5,1 (0,0,1) (2,1,2) -2,8 (0,1,1) (1,1,2) -10,2
(1,0,0) (0,1,2) -10,6 (1,0,1) (2,1,0) -11,2 (0,1,1) (0,1,0) -13,1 (0,1,1) (2,1,0) -14,2
(1,0,1) (1,1,0) -14,7 (1,0,0) (2,1,0) -10,4 (0,1,2) (0,1,0) -11,3 (0,1,1) (2,1,1) -10,1
(1,0,0) (1,1,0) -14,6 (0,0,1) (2,1,0) -9,7
(0,1,1) (0,1,1) -18,5 (0,1,1) (2,1,2) -6,1
(0,0,1) (1,1,0) -13,7 (1,0,1) (2,1,1) -7,9 (0,1,1) (0,1,2) -14,4
Tabela B.3 - Modelos e valores para o BIC da série {IRmodif}
Modelo Modelo Modelo Modelo
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(1,0,0) (0,1,0) 872 (0,0,1) (1,1,0) 877,2 (0,0,1) (2,1,2) 889,7 (0,1,2) (1,1,0) 861
(0,0,1) (0,1,0) 873,4 (1,0,0) (1,1,1) 879,5 (0,0,0) (2,1,2) 890,1 (0,1,1) (1,1,1) 861
(1,0,1) (0,1,0) 874,4 (1,0,1) (1,1,1) 880,2 (0,1,1) (0,1,0) 857.2 (1,1,1) (1,1,1) 863.4
(1,0,0) (0,1,1) 875,3 (0,0,1) (1,1,1) 881,4 (1,1,1) (0,1,0) 859.3 (0,1,2) (1,1,1) 863.6
(1,0,1) (0,1,1) 876,1 (1,0,1) (1,1,2) 883 (0,1,2) (0,1,0) 859.9 (0,0,0) (1,1,2) 879.7
(0,0,1) (0,1,1) 877,2 (1,0,0) (1,1,2) 883,2 (0,1,1) (0,1,1) 857.9 (0,0,0) (2,1,0) 875.6
(1,0,1) (0,1,2) 879,1 (1,0,1) (2,1,0) 879,1 (0,1,2) (0,1,1) 859.8 (0,0,0) (2,1,1) 879.8
(1,0,0) (0,1,2) 879,4 (1,0,0) (2,1,0) 879,4 (1,1,1) (0,1,1) 860.1 (0,0,0) (2,1,2) 883.8
(0,0,1) (0,1,2) 881,4 (0,0,1) (2,1,0) 881,4 (0,0,0) (0,1,2) 875.8
(1,0,0) (1,1,0) 875,4 (0,0,1) (2,1,1) 884,6 (0,1,1) (1,1,0) 859.1
(1,0,1) (1,1,0) 877 (0,0,0) (2,1,1) 886,4 (1,1,1) (1,1,0) 860.9
97
Tabela B.4 - Modelos e valores para o BIC da série log{IRmodif}
Modelo Modelo Modelo Modelo BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
(0,0,1) (0,1,0) -32,8 (0,0,1) (1,1,1) -27 (1,0,0) (2,1,2) -19,5 (1,1,1) (1,1,0) -28,3
(1,0,1) (0,1,0) -31,7 (1,0,1) (1,1,1) -25,2 (1,0,1) (2,1,2) -17,8 (0,1,2) (1,1,0) -28,2
(1,0,0) (0,1,1) -30,7 (1,0,0) (1,1,2) -22,8 (0,0,1) (2,1,2) -16,3 (0,1,1) (1,1,1) -27,7
(1,0,1) (0,1,1) -29,2 (1,0,1) (1,1,2) -21,9 (0,1,1) (0,1,0) -32,3 (0,1,2) (1,1,1) -25
(0,0,1) (0,1,1) -28,6 (0,0,1) (1,1,2) -21,2 (0,1,2) (0,1,0) -30,4 (0,0,1) (1,1,2) -24,1
(1,0,0) (0,1,2) -26,7 (1,0,0) (2,1,0) -26,8 (1,1,1) (0,1,0) -30 (0,1,2) (1,1,2) -22,4
(1,0,1) (0,1,2) -26,1 (1,0,1) (2,1,0) -25,1 (0,1,1) (0,1,1) -30,9 (1,1,1) (1,1,2) -22,2
(0,0,1) (0,1,2) -24,4 (0,0,1) (2,1,0) -24,4 (1,1,1) (0,1,1) -29 (0,0,1) (2,1,0) -28,1
(1,0,0) (1,1,0) -30,7 (1,0,0) (2,1,1) -22,7 (0,1,2) (0,1,1) -28,9 (0,0,1) (2,1,1) -23,9
(0,0,1) (1,1,0) -28,6 (1,0,1) (2,1,1) -21,9 (0,1,1) (0,1,2) -28,2 (0,1,2) (2,1,1) -22,6
(1,0,1) (1,1,0) -28,2 (0,0,1) (2,1,1) -20,6 (0,1,1) (1,1,0) -29,9 (0,0,1) (2,1,2) -20
Tabela B.5 - Modelos e valores para o BIC da série {IRmodif2}
Modelo Modelo Modelo Modelo BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
(1,0,0) (0,1,0) 879,4 (2,0,1) (1,1,2) 888,6 (0,1,2) (0,1,1) 863,5 (0,1,1) (1,1,2) 869,6
(0,0,1) (0,1,0) 879,8 (1,0,0) (2,1,0) 884,8 (1,1,1) (0,1,1) 863,8 (0,1,2) (1,1,2) 871,7
(1,0,1) (0,1,1) 880,1 (1,0,1) (2,1,0) 885,1 (0,1,1) (0,1,2) 865,5 (1,1,1) (1,1,2) 871,9
(1,0,0) (0,1,1) 880,9 (1,0,1) (2,1,1) 888,2 (0,1,2) (0,1,2) 867,7 (0,1,1) (2,1,0) 865,7
(1,0,1) (0,1,2) 884 (1,0,0) (2,1,1) 888,8 (1,1,1) (0,1,2) 867,9 (0,1,2) (2,1,0) 867,6
(1,0,0) (0,1,2) 884,5 (1,0,0) (2,1,2) 892,5 (0,1,1) (1,1,0) 863,3 (1,1,1) (2,1,0) 867,9
(1,0,2) (1,1,0) 880,6 (1,0,1) (2,1,2) 893 (0,1,2) (1,1,0) 864,5 (0,1,1) (2,1,1) 869,7
(1,0,1) (1,1,0) 881,5 (0,1,1) (0,1,0) 864,4 (1,1,1) (1,1,0) 864,9 (0,1,2) (2,1,1) 871,8
(1,0,1) (1,1,1) 884,1 (0,1,2) (0,1,0) 866,4 (0,1,1) (1,1,1) 865,5 (0,1,1) (2,1,2) 873,7
(1,0,0) (1,1,1) 884,8 (1,1,1) (0,1,0) 866,6 (0,1,2) (1,1,1) 867,7 (0,1,2) (2,1,2) 875,8
(1,0,1) (1,1,2) 888,3 (0,1,1) (0,1,1) 861,6 (1,1,1) (1,1,1) 867,9
Tabela B.6 - Modelos e valores para o BIC da série log{IRmodif2}
Modelo Modelo Modelo Modelo
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(1,0,0) (0,1,0) -27,3 (1,0,1) (1,1,2) -16,7 (0,1,2) (0,1,1) -24,7 (0,1,2) (1,1,2) -16,8
(0,0,1) (0,1,0) -26,7 (1,0,0) (2,1,0) -20,5 (1,1,1) (0,1,1) -24,4 (0,1,1) (2,1,0) -22,9
(1,0,1) (0,1,1) -24,6 (1,0,1) (2,1,0) -19,9 (0,1,1) (0,1,2) -23,1 (1,1,1) (2,1,0) -20,4
(1,0,0) (0,1,1) -23,3 (1,0,0) (2,1,1) -16,6 (0,1,2) (0,1,2) -20,6 (0,1,1) (2,1,1) -18,8
(1,0,1) (0,1,2) -20,9 (1,0,1) (2,1,1) -16,6 (1,1,1) (0,1,2) -20,3 (0,1,2) (2,1,1) -17,9
(1,0,0) (0,1,2) -20,8 (1,0,0) (2,1,2) -13 (0,1,1) (1,1,0) -25,3 (0,1,1) (2,1,2) -14,8
(1,0,0) (1,1,0) -24,7 (1,0,1) (2,1,2) -12,6 (0,1,2) (1,1,0) -24,2 (0,1,2) (2,1,2) -13
(1,0,1) (1,1,0) -23,6 (0,1,1) (0,1,0) -25,5 (1,1,1) (1,1,0) -23,7
(1,0,0) (1,1,1) -20,6 (0,1,2) (0,1,0) -24,3 (0,1,1) (1,1,1) -23
(1,0,1) (1,1,1) -20,6 (1,1,1) (0,1,0) -23,8 (0,1,2) (1,1,1) -20,5
(1,0,0) (1,1,2) -16,7 (0,1,1) (0,1,1) -26,7 (0,1,1) (1,1,2) -19

SUMÁRIO
1 - INTRODUÇÃO 2 - REVISÃO BIBLIOGRÁFICA 2.1 - SÉRIES TEMPORAIS 1 6 6

2.1.1 - Estacionariedade 7 2.1.2 - Função de autocorrelação 8 2.1.3 - Operador de diferença e operador de defasagem 10 2.1.4 - O modelo auto-regressivo (AR) 11 2.1.4.1 - A função de autocorrelação parcial (PACF) 13 2.1.5 - O modelo de médias móveis (MA) 15 2.1.6 - O modelo auto-regressivo de médias móveis (ARMA) 16 2.1.7 - O modelo auto-regressivo integrado de médias móveis (ARIMA) 17 2.1.8 - O modelo sazonal auto-regressivo integrado de médias móveis (SARIMA) 17 2.2- MÉTODOS DE PREVISÃO 19 2.2.1 - Alisamento exponencial 2.2.2 - Método de Box-Jenkins 2.2.2.1 - Identificação 2.2.2.2 - Estimação 2.2.2.3 - Verificação de diagnóstico 2.3 - Métodos de comparação de previsão 2.4 - Softwares estatísticos 2.4.1 - O programa R 2.4.2 - O programa ITSM2000 3 - ANÁLISE DO MÉTODO DE PREVISÃO UTILIZADO PELA SECRETARIA DA RECEITA FEDERAL (SRF) 3.1 - Descrição do método de indicadores 3.2 - Resultados 3.3 - Análise econométrica 4 - ANÁLISE E PREVISÃO DA SÉRIE TEMPORAL DO IMPOSTO SOBRE A RENDA (IR) 4.1 - Considerações gerais 43 43 35 35 37 41 20 24 25 29 30 31 33 33 33

i

4.2 - Análise exploratória 4.3 - Modelagem e previsão 4.3.1 - Alisamento exponencial 4.3.2 - Método Box-Jenkins 5 - DISCUSSÃO DOS RESULTADOS 5.1 - Comparação de resultados 5.2 - Escolha do método de previsão 5.3 - Escolha de um modelo SARIMA 5.4 - Resultados da previsão para outros impostos 5.5 - Previsões com horizonte reduzido 6 - CONCLUSÃO 7 - REFERÊNCIAS BIBLIOGRÁFICAS APÊNDICE A APÊNDICE B

44 50 50 52 71 71 77 79 80 84 88 91 93 95

ii

Dessa maneira. pode-se ter como objetivos básicos da atividade de previsão da arrecadação tributária federal a de constituir-se em um instrumento gerencial aos administradores e a de subsidiar a elaboração da proposta do Orçamento Geral da União. estabelecida em seu Regimento Interno pela Portaria nº 227. a análise e o controle das receitas sob sua administração.1 . a atividade de previsão de receitas públicas é um dos requisitos essenciais da Responsabilidade na Gestão Fiscal. 1 . a previsão da arrecadação dos tributos federais é uma atividade que exerce influência na atividade econômica do país e não pode ser relegada a uma atividade meramente cumpridora de exigências legais. é a “de realizar a previsão. de 04 de maio de 2000. instituída pela denominada Lei de Responsabilidade Fiscal (Lei Complementar nº 101. a atividade de previsão consiste em produzir estimativas da arrecadação de todos os tributos e contribuições administrados pela SRF e demais receitas federais para o exercício seguinte. Por isso. para subsidiar a proposta orçamentária da União”. Dentro desse contexto institucional. a atividade de previsão dos tributos deve possuir características que façam dela uma ferramenta segura de apoio para a tomada de decisões futura dos policymakers. Então. de 03 de março de 1998. assim como a de coordenar e consolidar as previsões das demais receitas federais. artigo 11). Além de expresso no Regimento Interno. o acompanhamento.INTRODUÇÃO Uma das finalidades da Secretaria da Receita Federal (SRF).

o trabalho mostrará que o método de previsão utilizado atualmente no âmbito da Secretaria. sobretudo. o presente trabalho tem por objetivo principal desenvolver um método de previsão baseado em modelos estatísticos e econométricos para a previsão das receitas tributárias federais. denominado método de indicadores. Foram estimadas também as previsões para os Impostos de Renda das Pessoas Físicas e Jurídicas e o Imposto de Renda Retido na Fonte . trata-se de uma prática. com os meses do ano de 2000 servindo como parâmetros de comparação para as previsões geradas.como planos de investimentos governamentais e planejamento de políticas públicas de longo prazo. Assim. Para cumprir os objetivos. as previsões devem caracterizar-se pela precisão ou acurácia de seus resultados. embora intuitiva. econometricamente limitada. analisou-se o poder preditivo do método de indicadores e comparou-o a alguns métodos de previsão existentes. como alisamento exponencial e modelos ARIMA (metodologia Box-Jenkins). pela confiabilidade estatística dos modelos empregados para gerar as previsões. Esta dissertação encontra-se organizada em três partes principais: uma revisão bibliográfica que aborda os conceitos básicos de séries temporais e os 2 . pela simplicidade dos métodos empregados e. A análise detalhada dos procedimentos foi efetuada para a série temporal da arrecadação agregada do Imposto sobre a Renda (IR) de julho de 1994 a junho de 1999. Em vista disso. Secundariamente.Rendimentos do Trabalho.

análise do método dos indicadores. onde os resultados para os três métodos são analisados detidamente e seus desempenhos preditivos colocados à prova. Os resultados são apresentados por meio de gráficos e tabelas. A continuação desta dissertação está organizada em mais 5 capítulos: revisão bibliográfica. Em 3 . No capítulo 2 é realizado um resumo dos principais conceitos sobre séries temporais. a apresentação dos resultados obtidos para a previsão dos valores futuros da série do IR para o ano de 2000 pelos métodos dos indicadores. para que esses conceitos pudessem ser aplicados no embasamento teórico das metodologias de previsão. A revisão bibliográfica compreende o estudo dos conceitos básicos de séries temporais. discussão dos resultados e conclusão. buscando apresentá-los de forma simples e didática. de médias móveis e sua combinação. A comparação dos resultados se dá na parte da discussão.softwares utilizados nos cálculos. modelos auto-regressivos. pelo método de alisamento exponencial e pelo método de Box-Jenkins. Além disso. funções de autocorrelação e autocorrelação parcial. modelos integrados e modelos sazonais. e a discussão sobre os resultados obtidos. uma metodologia de previsão é indicada como satisfatória para gerar as previsões dos tributos federais administrados pela Receita Federal. Nessa parte. análise e previsão do IR. os softwares. que envolvem a caracterização da estacionariedade de uma série. também foram objeto de abordagem detalhada. R para Windows e ITSM2000 para Windows.

faz-se uma apresentação do método de previsão por alisamento exponencial. e da metodologia de Box-Jenkins. Todas as etapas da metodologia de Box-Jenkins são explicadas e possíveis modelos são escolhidos por meio de um critério de seleção de modelos. mostram-se os métodos mais utilizados para a comparação dos resultados de previsão. apresentando-se as três etapas do ciclo iterativo que a compõe. uma análise econométrica é empregada no método para se determinar a confiança estatística das previsões geradas pelo método utilizado pela Receita Federal. o MSE. Em seguida. mostrando-se os algoritmo de Holt-Winters sazonal aditivo e multiplicativo. o R para Windows e o ITSM2000 para Windows. o imposto de renda sobre Pessoas Físicas e Jurídicas e o imposto de Renda Retido na Fonte Rendimentos sobre o Trabalho. Os modelos escolhidos são testados pelos métodos de diagnóstico disponíveis no programa R. é escolhida. os chamados índices de acurácia ou precisão. A seguir. o BIC. e uma medida de acurácia. a apresentação dos resultados das previsões geradas para 12 meses do ano de 2000 para os impostos de Renda agregado. Conclui-se o capítulo com uma apresentação dos programas estatísticos empregados nesta dissertação. No capítulo 4 é efetuada uma análise exploratória da série do IR agregado e possíveis valores outliers são considerados. No capítulo 3 é feita uma análise dos métodos dos indicadores com a descrição do método. são geradas previsões para a série do IR pelos métodos de alisamento exponencial e Box-Jenkins.seguida. 4 . Ressalta-se que por causa dos outliers 6 diferentes séries do IR serão analisadas. A seguir.

A seguir. 5 . com 1 passo e 3 passos à frente. faz-se uma escolha do método com melhores capacidades preditivas que servirá como sugestão para a utilização pela Secretaria da Receita Federal. sugere mudanças na forma de produção de previsões e indica possíveis extensões do trabalho. O capítulo final faz uma conclusão sobre os métodos empregados na dissertação. as séries do IRPF.No capítulo 5 os resultados obtidos nos capítulos 3 e 4 são comparados utilizando os valores do BIC e do MSE. ou seja. Conclui-se apresentando previsões para horizontes reduzidos. de maneira que tal procedimento possa servir como uma espécie de ajuste de previsões já realizadas. são apresentadas as previsões para as séries desagregadadas do IR. IRPJ e IRRF (rendimentos do trabalho) e comparadas com as previsões obtidas pelo método dos indicadores. Em seguida.

a todo instante ao longo do tempo. O momento de primeira ordem é definido como o valor esperado ou média de Xt : 6 . os softwares estatísticos utilizados neste trabalho são analisados e seu funcionamento é apresentado. São necessários para a caracterização da seqüência de variáveis aleatórias somente os momentos de primeira e segunda ordem da distribuição conjunta [Granger & Newbold. isto é. De outra maneira. cuja representação é dada por Xt.REVISÃO BIBLIOGRÁFICA Neste capítulo serão apresentados os conceitos básicos de séries temporais para subsidiar a explicação dos métodos de previsão por alisamento exponencial e metodologia Box-Jenkins. em intervalos fixos de tempo. um modelo de série temporal para dados observados {xt} é uma especificação das distribuições de uma seqüência de variáveis aleatórias {Xt} da qual {xt} é denominada uma realização [Brockwell & Davis. ou seja. uma série temporal discreta é aquela em que as observações são tomadas em um conjunto discreto. 1996]. Contrariamente. cuja representação é X(t). 1986]. 2.1 .2 .SÉRIES TEMPORAIS Uma série temporal caracteriza-se como um conjunto de observações que representa uma variável observada ao longo do tempo. Além disso. diz-se que a série temporal é contínua. Quando as observações são obtidas continuamente. Uma série temporal {xt} é a realização de uma família de variáveis aleatórias {Xt}.

Em vista da condição (iii).5) 7 .1 .µ t = E ( X t ). Então. t = cov( X t . X s ) = E[( X t − µt )( X s − µ s )] .4) e a covariância é usualmente escrita como γ h = cov( X t + h . 2 (ii) γ t .1) O momento de segunda ordem é definido como o produto esperado ou a covariância entre Xt e Xs: γ t . s = γ t − s . s = cov( X t .1. X t ). um processo estacionário apresenta média (condição (i)) e variância (condição (ii)) constantes ao longo do tempo t e a covariância (condição (iii)) entre os dois pontos dependente da distância entre esses pontos e independente do tempo t [Granger & Newbold. 1986]. 2 (1. Define-se também a variância de Xt como γ t .Estacionariedade Uma série temporal {Xt} é dita ser (fracamente) estacionária se (i) E ( X t ) = µ . (iii) γ t .2) [ ] (1. tem-se que 2 σx = γ0 (1. (1.3) 2. t = σ x < ∞ . (1. X t ) = var ( X t ) = E[( X t − µt )( X t − µt )] = E ( X t − µt ) .

As funções de autocovariância e autocorrelação amostrais podem ser 8 .1. O gráfico das autocorrelações amostrais versus h é chamado de correlograma. (1.6) A função de autocorrelação (ACF) de uma série temporal estacionária {Xt} é definida como ρ x (h ) = γ x (h ) = cor ( X t + h . X t ).Função de autocorrelação Define-se a função de autocovariância de uma série temporal estacionária {Xt} como γ x (h ) = cov( X t + h . γ x (0) (1. O que se faz necessário é averiguar alguns modelos plausíveis que provejam correlogramas de formas reconhecidas. Porém. Tal gráfico apresenta valores que serão utilizados para caracterizar as propriedades lineares ou não do mecanismo gerador do processo [Granger & Newbold. 1986].7) As funções de autocovariância e de autocorrelação fornecem uma medida útil do grau de dependência entre os valores de uma série temporal em diferentes períodos. não é simples examinar um correlograma e extrair dele as correspondentes propriedades populacionais. X t ) .2 .2. As autocorrelações medem ainda o tamanho e a força da “memória” do processo.

calculadas para qualquer conjunto de dados e não estão restritas a observações de séries temporais estacionárias [Brockwell & Davis, 1996]. Para dados contendo tendência, a ACF exibirá um decaimento lento na medida que t aumenta, conforme mostra a Figura 1.1. Para dados com um componente periódico determinístico, como sazonalidade, a ACF exibirá um comportamento similar ao período, conforme a Figura 1.2.
1.00 .80 .60 .40 .20 .00 -.20 -.40 -.60 -.80 -1.00 0 5 10 15 20 25 30 35 40 S m leACF ap

Figura 1.1 - Correlograma para um série com tendência

1.00

ACF amostral

.80

.60

.40

.20

.00

-.20

-.40

-.60

-.80

-1.00

0

5

10

15

20

25

30

35

40

9

Figura 1.2 - Correlograma para um série com sazonalidade Assim, o correlograma pode ser utilizado como um indicador de nãoestacionariedade da série temporal [Brockwell & Davis, 1996]. Deve-se notar que as linhas tracejadas nas Figuras 1.1 e 1.2 representam limites de significância estatística, acima dos quais as autocorrelações são consideradas significativamente diferentes de zero.

2.1.3 - Operador de diferença e operador de defasagem

Considere a série temporal {Xt}, com t = 0,..., n. A primeira diferença da série é definida como ∆x t = x t − xt −1 , t = 1,2,3,... (1.8)

O operador ∆ é denominado operador de diferença. Generalizando (1.8), a n-ésima diferença da série é dada por
r n  n  n n! . ∆n xt = ∆n −1xt − ∆n −1xt −1 = ∑ (− 1)   xt − r , onde   = r  r  r !(n − r )! . r =0    

(1.9)

Deve-se notar que n observações são perdidas ao se calcular a n-ésima diferença.

O operador de defasagem B é definido como Bxt = xt −1 . Generalizando (1.10), B n x t = x t − n , n = 0,1,2,... O operador B pode ser utilizado na forma polinomial, de maneira que (1.10)

10

x t + d 1 x t −1 + d 2 x t − 2 + L + d n x t − n = k t pode ser escrito como

(1 + d B + d
1

2

B 2 + L + d n B n xt = k t

)

(1.11)

ou d (B )x t = k t , onde d (B ) = (1 + d1B + L + d n B n ) .

2.1.4 - O modelo auto-regressivo (AR)

Um modelo auto-regressivo é definido de maneira que os valores da série no tempo t dependem dos valores passados. Mais especificamente o modelo autoregressivo de orem p AR(p) é X t = c + φ1 X t −1 + φX t − 21 L + φ p X t − p + ε t = ∑ φ j X t − j + ε t , (1.12)
j =1 p

onde a série {εt} é ruído branco1 com média zero e E[Xtεt+s] = 0, para s>0. Escrevendo a equação (1.12) em termos do polinômio do operador de defasagem B tem-se que φ (B ) X t = c + ε t . O polinômio φ(B) de ordem p é chamado de polinômio AR e tem-se que φ (B ) = 1 − φ1B − φ2 B 2 − L − φ p B p . (1.13)

Para que a condição de estacionariedade para modelos AR(p) seja

11

.12). Para um modelo AR(1). onde ′ ′ ñ = (ρ 1 . h = 1.14) (1 − φ 1 − φ2 − L − φ p ) c . h = 1.µ) e tomando os valores esperados. ρ h = φ1 ρ h −1 + L + φ p ρ h − p . ou ainda. µ = c + φ1µ + φ 2 µ + . 2.satisfeita é necessário que as raízes do polinômio φ(B) estejam foram do círculo unitário (no plano complexo). φ p ) 1 Para definição sobre o processo ruído branco consultar [Granger & Newbold. L . φ 2 . a média do processo AR(p) é obtida tomando os valores esperados em (1.. 2.16) são denominadas de equações de Yule-Walker e podem ser escritas na forma matricial como ñ = Pö . 1986] 12 . µ= (1. a condição de estacionariedade é satisfeita quando |φ |<1. γh = {φφγγ 1 h −1 1 1 + L + φ p γ h − p . Assumindo que a condição de estacionariedade está satisfeita. (1. ρ p ) .16) As p equações obtidas de (1.15) A autocorrelação é obtida dividindo-se a equação (1. + φ p µ . X t = c + φ1 X t −1 + ε t .14) por (Xt-j . L (1. h = 0 . ö = (φ 1 . ρ 2 . L + L + φ pγ p + σ 2 .15) por γ0. L . As autocovariâncias são calculadas multiplicando-se ambos os lados de (1.

1986]. Caso as raízes sejam complexas.e  1  ρ 1 P=  M   ρ p −1  Então. Se as raízes da equação auto-regressiva forem reais.1 . de forma que os parâmetros auto-regressivos podem ser expressos como uma função das p autocorrelações [Mills. Assim. 2. O valor da correlação entre Xt e Xt-2 (i. ö = P −1ñ.e.  1   O comportamento da função de autocorrelação de um processo autoregressivo é uma mistura de decaimento exponencial e/ou decaimento senoidal. então as autocorrelações decairão exponencialmente. 1995]. 1990]. ρ2) é igual à correlação entre Xt e Xt-1 (ρ1) multiplicada pela correlação entre Xt-1 e Xt-2 (ρ1). toda essa correlação “indireta” está presente na ACF de qualquer processo auto-regressivo [Enders.1. Dessa maneira.4. ρ1 1 M ρ p−2 ρ2 ρ1 M ρ p−3 K K K ρ p −1  ρ p−2   . mesmo que Xt-2 não apareça diretamente no modelo.A função de autocorrelação parcial (PACF) Em um processo AR(1). Xt e Xt-2 são correlacionados. de forma que ρ2 = ρ12. o decaimento será na forma senoidal [Granger & Newbold.. define-se a função de autocorrelação parcial 13 .

17). 1990] 1 ρ1 M ρ φkk = k −1 1 ρ1 M ρ k −1 ρ1 1 M ρk − 2 ρ1 1 M ρk − 2 L L L L L L L L ρk −2 ρk −3 M ρ1 ρk −2 ρk −3 M ρ1 ρ1 ρ2 M ρk .16) e. substituindo p = k e φi = φii.17) O coeficiente φkk é obtido das equações de Yule-Walker aplicadas a (1. 1995]. ρ k −1 ρk −2 M 1 Assim. tem-se [Mills. desde que os efeitos de defasagens anteriores sobre Xt permaneçam constantes [Hill. Assim. A PACF é calculada como o valor do coeficiente φkk na equação X t = φk1 X t −1 + φk 2 X t − 2 + L + φkk X t − k + et . todos os valores de φkk para k > p são zero e a PACF para um processo AR(p) puro apresenta um “corte” para zero para defasagens maiores que p [Enders. 1990]. ACF. 1999].(PACF) como a seqüência de correlações entre (Xt e Xt-1). Tais equações são dadas por (1. (1. (Xt e Xt-2). (Xt e Xt-3) e assim por diante. pode-se resumir que um processo AR(p) é descrito por: possuir uma função de autocorrelação. para um processo AR(p) não há correlação entre Xt e Xt-k para k > p [Mills. que é uma combinação de decaimentos exponenciais e senoidais e tamanho 14 . Griffiths & Judge. Então.

seguindo que γ j = (θ 1 + θ j +1θ 1 + L + θ qθ q − j )σ 2 . como os termos envolvendo produtos de ε´s em diferentes instantes de tempo têm valor esperado zero. γ j = 0 . j =0 q (1. j > q. γj = 0. Dessa feita. para um processo MA(q) a ACF apresenta um “corte” para zero para 15 . Alternativamente. Um processo MA(q) é dito ser invertível se as raízes de 1 + θ1 z + θ 2 z 2 + L + θ q z q = 0 se encontrarem fora do círculo unitário. 2. θ 0 ≡ 1. que é zero para defasagens maiores que p.O modelo de médias móveis (MA) O modelo de médias móveis de ordem q. é dado pela forma X t = µ + ε t + θ 1ε t −1 + θ 2 ε t − 2 + L + θ q ε t − q = µ + ∑ θ j ε t − j . j = 1. As autocovariâncias de ordem superior são γ j = E ( X t − µ )(X t − j − µ ) = E (ε t + θ1ε t −1 + L + θ qε t − q )(ε t − j + θ1ε t − j −1 + L + θ qε t − j − q ) e. X t = θ (B )ε t . 2. q.19) onde θ(B) é o polinômio do operador de defasagem B.5 .18) onde {εt} é ruído branco com média zero. e possuir uma função de autocorrelação.infinito. para j > q. PACF.1. θ (B ) = 1 + θ1B + L + θ q B q . MA(q). (1. L .

1990]. A função de autocorrelação parcial de um processo MA(q) possui tamanho infinito [Mills. A série temporal {Xt} é invertível se e somente se as raízes de θ(z) estiverem fora do círculo unitário. como ocorre com os processos AR e MA puros [Mills. Pode-se resumir que um processo MA(q) é descrito por: possuir uma ACF que é zero para defasagens maiores que q.q). seja diretamente ou oscilando ao redor de zero. para um processo ARMA(p.20) A série temporal {Xt} é estacionária se e somente se as raízes de φ(z) estiverem fora do círculo unitário. sendo definido como X t = c + φ1 X t −1 + φ 2 X t − 2 + L + φ p X t − p + ε t + θ 1ε t −1 + θ 2 ε t − 2 + L + θ q ε t − q ou ainda na forma polinomial φ (B )X t = c + θ (B )ε t . 1990]. (1. a ACF decairá. 1990].q) é uma generalização dos modelos AR(p) e MA(q). Assim.1. as funções de autocorrelação (ACF) e autocorrelação parciais (PACF) decaem até o infinito em vez de apresentarem um “corte” em alguma defasagem particular.6 . a partir 16 . Para os modelos ARMA.defasagens maiores que q [Mills. 2.O modelo auto-regressivo de médias móveis (ARMA) Um processo ARMA(p. e possuir uma PACF que é uma combinação de decaimentos exponenciais e senoidais e tamanho infinito.

q). {Xt} deve satisfazer φ (B )[(1 − B ) X t − µ ] = θ (B )ε t . 1996]. d onde {εt} é ruído branco com média zero. µ é a média de ∆dXt e d é a ordem de diferenciação. 1995]. Um processo integrado é utilizado para séries não-estacionárias.q) causal [Brockwell & Davis. respectivamente.7 . então uma série temporal {Xt} é dita ser um processo ARIMA(p.da defasagem q. um modelo ARMA(p.q) é um modelo ARIMA(p.O modelo sazonal auto-regressivo integrado de médias móveis (SARIMA) Suponha uma série temporal sazonal não-estacionária {Xt} observada s 17 .O modelo auto-regressivo integrado de médias móveis (ARIMA) Se d for um número inteiro não-negativo. a partir da defasagem p [Enders.0. Alternativamente. A ordem de diferenciação será 0 ou 1 para a maioria dos processos e raramente d = 2 [Granger & Newbold. φ(B) e θ(B) são polinômios de ordem p e q. a PACF decairá.d.1.21) for um processo ARMA(p. φ(B) é um operador estacionário. 1986]. 2.8 . seja diretamente ou oscilando ao redor de zero.1. Assim. Por sua vez. 2.q) ou um processo integrado de ordem d se Yt = (1 − B ) X t = ∆d X t d (1.

θ (B ) = (1 + θ1B + L + θ q B q ).22) e (1.d. Contudo. d (1. é efetuar uma diferenciação sazonal. nos moldes da diferenciação vista anteriormente. de maneira que s = 4 para séries trimestrais e s = 12 para séries mensais.períodos por ano. então Φ (B s )(1 − B s ) X t = Θ(B s ) Z t .23). em muitos casos é necessário adicionar ao modelo uma modelagem de Zt determinada por seu padrão sazonal. X t − X t − s = (1 − B s )X t = Z t . assim φ (B )(1 − B ) X t = θ (B )ε t . Pela equação (1. 1996]. Θ(B s ) = (1 + Θ1s B s + L + ΘQs B Qs ) . um modelo ARIMA(p. Combinando (1.22) onde Φ (B s ) = (1 − Φ1s B s − L − Φ Ps B Ps ) . D (1.23) onde φ (B ) = (1 − φ1B − L − φ p B p ). Se a sazonalidade da série Zt tiver sido filtrada. Uma forma de remover a sazonalidade da série e transformá-la em uma série estacionária {Zt}. nota-se que o padrão sazonal é aleatório entre os ciclos s [Brockwell & Davis.q) regular pode representar Zt. para que um modelo ARIMA possa ser empregado. e {εt} é ruído branco com média zero. chega-se a classe de modelos sazonais 18 . Assim.22).

O primeiro método.q)x(P.d. o valor para D é raramente maior que um e os valores de P e Q não ultrapassam 2 [Brockwell & Davis.multiplicativos ARIMA(p.Q) ou SARIMA.1. Um modelo particular dessa classe de modelos é o chamado modelo “airline”. que são séries que possuem somente um conjunto de dados. um modelo SARIMA(0. Tais metodologias utilizam conceitos e procedimentos diferentes para produzir prognósticos de séries univariadas. Nota-se que a série diferenciada pode ser representada usando tanto componentes auto-regressivos e de médias móveis regulares quanto sazonais.24) onde {εt} é ruído branco com média zero.2. 1996]. φ (B )Φ (B s )(1 − B ) (1 − B s ) X t = θ ( B )Θ(B s )ε t . para | z | ≤ 1.1).24) é causal se e somente se φ(B) ≠ 0 e Φ (B) ≠ 0. se as raízes do polinômios auto-regressivos se encontrarem fora do círculo unitário [Brockwell & Davis.D. os modelos teóricos apresentados nessa seção serão aplicados nas metodologias de previsão de alisamento exponencial e Box-Jenkins. serão apresentados dois métodos de previsão. Em geral. denominado de alisamento exponencial (exponential smoothing).1. ou seja. 2. A seguir.MÉTODOS DE PREVISÃO Nesta seção. d D (1. é 19 .1)(0. Nessa classe de modelos permite-se tanto a diferenciação regular quanto a diferenciação sazonal. O processo representado por (1. 1996].

e. com h = 1. 2.considerado um método automático de previsão e seu procedimento é bem simples.. 20 . A forma mais simples de alisamento exponencial é aquela para séries temporais que não possuem sazonalidade nem tendência crescente ou decrescente. i. denominado de metodologia Box-Jenkins. é um método de utilização mais complexa que o anterior e emprega a classe de modelos ARIMA/SARIMA em sua concepção. de maneira rápida e barata [Granger & Newbold. h = xn . Para se iniciar o algoritmo é necessário especificar um valor inicial.2. f n . Uma forma mais simples de cálculo é obtida substituindo t por t-1 e multiplicando os dois lados de (1.. o que leva a x t = α x t + (1 − α ) x t −1 . 2 (1. O objetivo é estimar o “nível” (ou a “média”) presente da série e usar esse nível como previsão de valores futuros.25) com 0 < α < 1. 1986]. O nível da série no tempo t é estimado como xt = αxt + α (1 − α )xt −1 + α (1 − α ) xt − 2 + L. que usualmente é [Granger & Newbold. 1986] x1 = x1 . (1. .h).1 ..26) A previsão de todos os valores futuros (fn. .Alisamento exponencial O alisamento exponencial é um procedimento geral para obtenção de algoritmos de previsão automática que produz resultados relativamente acurados.46) por (1-α). 2.26). O segundo método. é obtida utilizando-se a equação (1.

(1. T2 = x 2 − x1 . A escolha dessa constante é feita de maneira que seu valor minimize a soma dos erros quadrados [Janacek. a soma dos erros quadrados é dada por S = ∑ et2 = ∑ (x t − f t −1. por Tt = β ( xt − xt −1 ) + (1 − β )Tt −1 .1 . a constante de suavização.27) com 0 < α < 1 e 0 < β < 1. n. assim. f n.1 ) .. O erro de previsão é definido como et = xt − f t −1. respectivamente. O nível e a inclinação da série são dados. . Então. . de forma que seus valores minimizem a soma dos quadrados dos erros de previsão um 21 . Os possíveis valores iniciais do algoritmo são x 2 = x2 .4. K . 4. h = x n + hTn .. As previsões são obtidas supondo um acréscimo ou decréscimo continuado dado pela última estimativa de inclinação. a equação (1.26) não é capaz de fazer previsões de movimentos crescentes ou decrescentes futuros. xt = αxt + (1 − α )( xt −1 + Tt −1 ). n n 2 t =3 t =3 Caso a série temporal apresente tendência. Os valores para as constantes de suavização são obtidos como anteriormente.O peso de cada termo é determinado pelo valor de α. h = 3. 2001]. O algoritmo de alisamento exponencial de Holt-Winters leva em consideração esses movimentos e permite estimar também a inclinação atual da série. n. constantes de suavização. para t = 3.

Ft. K .1 ) . (1. t = 4 . respectivamente. constantes de suavização. 2 s. considerando que a sazonalidade seja aditiva. 2. Então. h = s + 1. M Considerando a sazonalidade multiplicativa. = x n + hTn + Ft + h − 2 s . as equações para o nível. Assim. n n 2 t=4 t =4 Se a série temporal contiver movimentos sazonais de período s. 5 . xt = α ( xt − Ft − s ) + (1 − α )( xt −1 + Tt −1 ) . h = 1. K .1 = x t − ( x t −1 + T t −1 ) . s.28) com 0 < α < 1 . o algoritmo de Holt-Winters sazonal é definido de modo que para cada período seja necessário estimar um fator de sazonalidade. O erro de previsão é dado por e t = x t − f t −1. n . Tt = β ( xt − xt −1 ) + (1 − β )Tt −1 . As previsões são dadas por f n. h = x n + hTn + Ft + h − s . 22 . No instante t. a última estimativa do fator de sazonalidade para o período é Ft-s (obtido do mesmo período do ano anterior) [Cribari-Neto. s + 2. o algoritmo de Holt-Winters precisa ser modificado para que a sazonalidade seja estimada. a soma dos erros quadrados é S = ∑ et2 = ∑ (x t − f t −1.passo à frente. K . Ft = γ ( xt − xt ) + (1 − γ )(Ft − s ) . 0 < β < 1 e 0 < γ < 1. 2000]. a inclinação e para o fator de sazonalidade são. As equações para o nível. a inclinação e para o fator de sazonalidade são.

K.K.1 = x t − ( x t −1 + T t −1 + Ft − s ) . h = 1. Os possíveis valores iniciais do algoritmo podem ser [Brockwell & Davis. 1996] x s +1 = x s +1 . n . s . Ts +1 = = ( xn + hTn )Ft + h − 2 s . 2s. a soma dos erros quadrados é S= t =14 ∑ et2 = n t =14 ∑ (x n t − ft −1. K . s Fi = x i − ( x i + Ts +1 (i − 1)) . i = 1. 2 As formas aditivas e multiplicativas do algoritmo de Holt-Winters sazonal podem fornecer previsões bem diferentes. s .29) com 0 < α < 1 . os valores das constantes de suavização são calculados de forma a minimizar a soma dos quadrados dos erros de previsão um passo à frente. constantes de suavização. x  xt = α  t  + (1 − α )( xt −1 + Tt −1 ) . 0 < β < 1 e 0 < γ < 1. 2. F   t−s  Tt = β ( xt − xt −1 ) + (1 − β )Tt −1 . (x s+1 − x1 ) Tanto para a sazonalidade aditiva quanto para a sazonalidade multiplicativa. s + 2.1 5 . h = s + 1. x   t (1. M. x  Ft = γ  t  + (1 − γ )(Ft − s ) . h = ( xn + hTn )Ft + h − s . . t = 14 . K . Se a série apresentar oscilações 23 .1 ) . As previsões são dadas por f n . Então. O erro de previsão é e t = x t − f t −1.

θ (B ) = (1 + θ1B + L + θ q B q ) . o modelo multiplicativo é mais indicado.d.2 .Q). φ (B )(1 − B ) X t = θ (B )ε t . 2. 1970] é encontrar um modelo estocástico linear da classe ARIMA que possa ter gerado {Xt} e que esse modelo possa ser utilizado para fornecer previsões de valores futuros da série [Granger & Newbold. A estratégia de modelagem.sazonais aproximadamente constantes. pode-se utilizar os dois procedimentos e escolher aquele que fornece a menor soma dos erros de previsão um passo à frente ao quadrado [Cribari-Neto. Porém.2. tanto para modelos sazonais quanto para não-sazonais. é baseada em um ciclo de três etapas iterativas: 24 .d. se as oscilações sazonais forem proporcionais ao nível da série. conforme a equação (1.D. 2000]. O objetivo da metodologia de Box-Jenkins [Box & Jenkins. d onde φ (B ) = (1 − φ1B − L − φ p B p ) . considere que ela possa ser representada por um modelo da classe ARIMA(p.24).q).Método de Box-Jenkins Dada uma série temporal não-sazonal não-estacionária {Xt}. {Xt} pode ser representada por um modelo da classe SARIMA(p. 1986]. Alternativamente.q) (P. Caso a série temporal {Xt} apresente sazonalidade. o modelo aditivo é mais indicado.

(i) (ii) (iii)

identificação do modelo; estimação do modelo; e verificação de diagnóstico.

A etapa de identificação consiste em selecionar valores para p, d, q e P, D, Q (no caso de modelos sazonais). Essa etapa envolve subjetividade e julgamento pessoal. Na etapa de estimação, os coeficientes identificados na etapa anterior são estimados usando técnicas estatísticas. A última etapa indica se o modelo identificado e estimado descreve adequadamente o comportamento dos dados da série {Xt}. Caso o modelo não seja adequado, o ciclo deve começar novamente [Cribari-Neto, 2000].

Um conceito importante nessa metodologia é o princípio da parcimônia [Enders, 1995]. Tal princípio sugere que modelos mais simples, com poucos parâmetros, produzem melhores previsões que modelos superparametrizados. Um modelo parcimonioso ajusta bem os dados sem incorporar coeficientes inúteis. O objetivo é se aproximar do processo gerador original dos dados e não descrevê-lo exatamente [Enders, 1995].

2.2.2.1 - Identificação

Essa etapa é considerada a mais difícil e delicada, e não há consenso sobre qual a melhor estratégia a ser seguida [Granger & Newbold, 1986]. Dentre as várias estratégias existentes, duas se destacam: a análise das funções de

25

autocorrelação e autocorrelação parcial amostrais, e o uso de um critério de seleção de modelos.

Para utilizar a primeira estratégia é necessário reconhecer modelos AR, MA e ARMA por meio das características da ACF e da PACF. A Tabela 2.1 resume as propriedades da ACF e da PACF para diversos modelos ARIMA [Mills, 1990]. Para modelos sazonais, o comportamento da ACF e da PACF deve ser analisado também próximo da defasagem sazonal, por exemplo, defasagem 12 para dados mensais e defasagem 4 para dados trimestrais. A Tabela 2.2 resume as propriedades da ACF e da PACF para modelos SARIMA [Bowerman & O’Connell, 1987].

Tabela 2.1 - Propriedades da ACF e da PACF para vários modelos ARIMA Modelo ACF PACF Decaimento exponencial ou φkk=0 para k > 1 (1,d,0) oscilatório Decaimento exponencial ou φkk=0 para k > 2 (2,d,0) senoidal (p,d,0) (0,d,1) (0,d,2) (0,d,q) Decaimento exponencial e/ou φkk=0 para k > p senoidal ρk = 0 para k > 1 ρk = 0 para k > 2 ρk = 0 para k > q Dominado por decaimento exponencial Dominado por decaimento exponencial ou senoidal

(1,d,1)

(p,d,q)

Dominado pela combinação linear de decaimento exponencial e/ou senoidal Decaimento exponencial a Dominado por decaimento partir da defasagem 1 exponencial a partir da defasagem 1 Decaimento exponencial e/ou Dominado por decaimento senoidal depois da defasagem exponencial ou senoidal q-p depois da defasagem q-p

26

Tabela 2.2 - Propriedades da ACF e da PACF para modelos SARIMA Modelo ACF PACF (P,D,0) Decaimento Picos nas defasagens s, 2s, ...Ps e corte após Ps (0,D,Q) Picos nas defasagens s, 2s, ...Qs Decaimento e corte após Qs (P,D,0) ou (0,D,Q) (P,D,0) e (0,D,Q) Nenhum operador sazonal Picos nas defasagens s, 2s, ...Qs Picos nas defasagens s, 2s, ...Ps e corte após Qs e corte após Ps Decaimento rápido na defasagem sazonal Valores pequenos em todas as defasagens sazonais (não há picos) Decaimento rápido na defasagem sazonal Valores pequenos em todas as defasagens sazonais (não há picos)

Além de identificar os valores para p e q (e os valores de P e Q para modelos SARIMA), o grau de diferenciação da série (valor d e valor D para modelos sazonais) precisa ser conhecido. Para tanto, utiliza-se também a inspeção da ACF e da PACF amostrais. Para um modelo não-sazonal, um comportamento suave persistente nas autocorrelações amostrais em defasagens altas indica nãoestacionariedade, i.e., necessidade de diferenciação. Assim, deve-se diferenciar a série para sucessivos valores positivos de d e examinar o correlograma de {∆dXt} [Cribari-Neto, 2000].

A segunda estratégia para identificar os valores de p, d, q é utilizar um critério de informação que selecione os modelos por meio de um conjunto de “regras” [Mills, 1990]. Os critérios de seleção para modelos ARIMA mais utilizados são o AIC (Akaike information criterion), o AICC (Akaike information criterion corrected) e o BIC (Bayesian information criterion). Esses critérios incorporam um termo de penalidade para o aumento do número de parâmetros (p e q) no modelo,

27

de forma que ele fornece estimativas de p e q que convergem em probabilidade para os valores verdadeiros à medida que T tende a infinito [Brockwell & Davis. 2( p + q )T ˆ AICC = −2 log L + . As equações para esses critérios. sendo T o número de observações. T − p − q −1 ˆ BIC = −2 log L + ( p + q ) log T .1.1. Já os critérios AIC e AICC não são consistentes. Assim. 1986] apresentando tendência a escolher modelos superparametrizados [Cribari-Neto. o AIC é assintoticamente eficiente para modelos puramente auto-regressivos.q =0. O critério AIC superestima assintoticamente a ordem verdadeira do modelo [Granger & Newbold. O BIC é um critério consistente.4. por exemplo) para todos os modelos ARIMA associados aos valores de p.2. são [Cribari-Neto. seleciona-se o modelo que apresenta o menor valor do BIC e modelos alternativos cuja diferença para o valor 28 . Por outro lado.3.5 e d =0. a seleção de modelos é feita calculando o valor do critério (o BIC. ^ onde L representa a verossimilhança maximizada.de forma que modelos mais “parcimoniosos”. 1996]. com o menor número de parâmetros. O AICC é uma versão corrigida do AIC que incorpora uma correção de viés para amostras finitas. sejam escolhidos. d e q de forma que p. 2000] ˆ AIC = −2 log L + 2( p + q ). possuindo uma penalidade mais forte para modelos de ordem elevada [Brockwell & Davis. 1996]. 2000]. ou seja. Na prática.

2. deve-se incluir ainda os valores para P. consultar [Mills.φp)´. a variância de εt. 29 . utilizando o método de máxima verossimilhança (ML)2.. Desta forma.Estimação Assumindo que um modelo ARIMA da forma (1 − φ B − L − φ B )(1 − B ) p 1 p d X t = (1 + θ1B + L + θ q B q )ε t (1. o objetivo agora é estimar.1.θq)´ e σ2. com a superioridade da estimação por máxima 2 Para uma demonstração da estimativa de ML. os modelos são selecionados pelos mesmos critérios que os utilizados para os modelos ARIMA. existem alternativas que aproximam a função de máxima verossimilhança. A estimação da ML é difícil e geralmente requer muito tempo de processamento computacional.Q = 0.. a quantidade de modelos investigados é maior.. os parâmetros φ = (φ1. Para a modelagem SARIMA.. d e q. pois além dos valores de p.1.2. 1990]. Contudo.2.2 e D = 0. 1996].2 . alguns estudos têm sugerido [Ansley & Newbold. θ = (θ1..mínimo do BIC seja inferior a 2 [Brockwell & Davis.. 1980] que o método de verossimilhança é superior aos demais.30) seja escolhido conforme a etapa anterior.. Porém. Duas dessas alternativas são o MQE (mínimos quadrados exatos) e o MQC (mínimos quadrados condicional).. máxima Para a modelagem SARIMA o procedimento é idêntico ao mostrado para a modelagem ARIMA.

a inferência baseia-se nas estimativas dos erros.½. A autocorrelação amostral dos resíduos de ordem j é calculada como [Granger & Newbold. Então.  30 . pois ele deve constituir um processo ruído branco [Granger & Newbold. pois toda a dinâmica dos dados já foi capturada pelo modelo [Cribari-Neto. os resíduos não devem apresentar correlação serial. se o modelo estiver corretamente especificado. Assim.2. 1986].3 . a verificação da adequabilidade do modelo é efetuada nas autocorrelações amostrais dos erros (εt).Verificação de diagnóstico A correta especificação de um modelo ARIMA ou SARIMA é verificada no termo εt. os valores das autocorrelações residuais devem estar contidos no intervalo de confiança assintótico de 95% que é [Cribari-Neto. 2000]  2 2 . se forem provenientes de um ruído branco. 1980]. Como os erros verdadeiros (εt) não são conhecidos. 2. as quais seguem assintoticamente uma distribuição normal. 1986] ˆ rj (ε ) = t = j +1 T ∑ εˆ εˆ t =1 T t t− j ∑ εˆt2 .2.verossimilhança sendo ainda mais pronunciada para modelos sazonais [Ansley & Newbold. Dessa forma. os resíduos εt. − T T   . 2000]. com média zero e desvio padrão n.

1996].onde T indica o número de observações da série.3 . 2000].q) graus de liberdade e com a rejeição da hipótese nula (de que o modelo é adequado) para valores de Q maiores que o valor crítico assintótico [Granger & Newbold. 2. O valor de m deve ser pelo menos igual a √T [Cribari-Neto. Esses métodos são o desvio absoluto médio (MAD).p . o que caracteriza a acurácia ou a capacidade preditiva do mecanismo utilizado. Em adição ao exame das autocorrelações individuais dos resíduos um teste conjunto das primeiras m autocorrelações pode ser utilizado. os resíduos são definidos como ˆ et = X t − X t . O desvio absoluto médio (MAD) é definido como a média dos valores 31 . Os três métodos mais populares de medição da acurácia utilizam os resíduos em seus cálculos [Kvanli et al. Tal teste “portmanteau” compara o valor de ˆ Q = T (T + 2 )∑ (T − j ) r j2 (ε j ) m −1 j =1 com valores tabulados da distribuição do χ2 (qui-quadrado) com (m .Métodos de comparação de previsão Um dos métodos de escolha do melhor mecanismo de previsão é a ^ comparação dos valores previstos (Xt) com os valores observados da série (Xt). o erro quadrático médio (MSE) e o erro percentual absoluto médio (MAPE). que é conhecido por teste Ljung-Box.. 1986]. Assim.

32 .absolutos de cada resíduo e é representado por MAD = ∑ n et . se erros elevados de previsão são inaceitáveis. o MSE será utilizado como critério de acurácia para as comparações dos métodos de previsão apresentados neste trabalho. o MAD funciona melhor. Então. então o uso do MSE faz-se necessário. Não há consenso entre os estatísticos sobre qual método é preferível. 1996]. MAPE = ∑ n et Xt . Entretanto. O erro relativo em cada período t é definido como et /Xt. et al. O erro quadrático médio (MSE) é a média dos valores quadráticos de cada resíduo. se é possível ignorar alguns erros elevados.. O erro percentual absoluto médio (MAPE) considera o erro relativo de cada previsão. assim MSE = ∑ e2t n . E o MAPE é utilizado para comparar a acurácia (precisão) de duas séries temporais diferentes [Kvanli. Dessa forma. onde n é o número de valores previstos obtidos dos dados passados. Assim.

dentre outras coisas.Softwares estatísticos 2. o ITSM2000 é um programa razoavelmente preciso e 33 .r-project. nem a possibilidade de distribuição gratuita. 2. é um programa proprietário. A primeira é ser um programa gratuito e de livre distribuição. Essa plataforma possui várias qualidades. O programa (versão Windows) acompanha o livro “Introducion to Time Series and Forecasting” de Peter Brockwell & Richard Davis.org e possui versões para os sistemas operacionais Windows. ferramentas gráficas de alto nível. uma linguagem de programação.4 . Inc.2 .4. O R é uma versão gratuita do programa S-PLUS comercializado pela MathSoft.4.1 . Contudo. baseado em escolhas de menu e botões. diferentemente do R.O programa R O programa R é um sistema para computação estatística e gráfica. Ele provê. O R pode ser obtido via Internet no endereço www. A segunda é permitir a criação de novas funções e a possibilidade de modificação das funções internas.2.O programa ITSM2000 O programa ITSM2000. seguindo o padrão dos programas para o sistema operacional Windows. Unix e Macintosh. interface com outras linguagens de programação e ferramentas para depuração. Trata-se de um programa simples e bastante intuitivo. Não há a possibilidade de alteração de suas funções.

Os resultados mostrados neste capítulo restringem-se ao Imposto sobre a Renda e seus componentes mais significativos. 2000]. bem como os resultados obtidos na sua aplicação. 34 . No próximo capítulo. A descrição envolve a formulação teórica do método.completo. o método de previsão utilizado no âmbito da Secretaria da Receita Federal será descrito e detalhado. O critério de seleção de modelos utilizado no programa é o AICC. permitindo estimação de modelos ARIMA por máxima verossimilhança exata [Cribari-Neto.

mostra as previsões geradas por tal método e faz uma análise econométrica. mostrando sua inadequabilidade como instrumento estatisticamente confiável de previsão.3 . 3. um índice de quantidade que represente a variação real desse fato gerador. consiste na multiplicação da arrecadação do período anterior por: um índice de preço que represente a variação inflacionária a que está sujeito o fato econômico gerador da arrecadação.1 .Análise do método de previsão utilizado pela Secretaria da Receita Federal (SRF) Este capítulo descreve sucintamente o método de previsão utilizado pela SRF. Esse método pode ser resumido genericamente na fórmula 35 . um índice que represente o efeito causado na arrecadação por modificações na legislação tributária.Descrição do método de indicadores O método utilizado no âmbito da SRF. denominado de indicadores. outros índices que representem quaisquer influências na arrecadação tributária.

Efeito-Preço. onde Xt = arrecadação prevista para determinado período do ano t.X t = X t −1 (1 + ∆P )(1 + ∆Q )(1 + ∆L )(1 + ∆U ). A qualidade da previsão com a utilização desse método depende da obtenção de bons indicadores de preço e quantidade específicos para cada caso (tributo. Xt-1 = arrecadação efetiva do mesmo período do ano t-1. ∆U = variação percentual de qualquer outro indicador que tenha influência na arrecadação e não possa ser enquadrado nos indicadores básicos (preço. 36 . (1+∆Q) e (1+∆L) são denominados. Os órgãos de pesquisa de preços e acompanhamento da conjuntura econômica (IBGE. respectivamente. ∆Q = variação percentual do indicador de quantidades. ∆P = variação percentual do indicador de preços.1) ∆L = variação percentual decorrente de alterações da legislação. FGV.1 estão relacionados alguns tributos e seus principais indicadores de preço e quantidade. setor econômico ou item de receita). IPEA) são fontes importantes para se identificar quais os índices de preço e quantidade melhor se adequam aos vários tributos. Os termos (1+∆P). (3. Efeito-Quantidade e Efeito-Legislação. O termo (1+∆U) representa o Efeito-Residual. normalmente significa variação de alíquotas. Na Tabela 3. quantidade e legislação).

2 .IRPFJ Imposto de Renda Retido na Variação nominal de salários Nível de emprego Fonte .Automóveis automobilística automóveis ao mercado interno Imposto de Renda Pessoa IGP .Capital financeiras IOF .Índice Geral de Preços Número de contribuintes Física . Tabela 3. PIB.IRRF .Bebidas Índice de preços de bebidas mercado interno Índice de preços da indústria Volume de vendas de IPI .Índice Geral de Preços PIB 3.Resultados Os resultados obtidos pela SRF com a utilização do método dos indicadores para os componentes mais significativos da série do Imposto de Renda estão mostrados na Tabela 3.Índice Geral de Preços PIB Jurídica .A SRF mantém registro de séries históricas dos principais indicadores de preços e algumas séries de quantidade.2.Imposto sobre Variação nominal do volume de credito e prêmios de seguro (em operações financeiras R$) COFINS IGP . a diferença percentual entre a previsão e o valor observado (∆%) e o valor do critério 37 . em dólar Volume de vendas de bebidas ao IPI . juntamente com os valores reais da arrecadação.IRPF Imposto de Renda Pessoa IGP .1 . taxa de câmbio e taxa de juros) que influenciam os diversos indicadores são elaboradas pela Secretaria de Política Econômica do Ministério da Fazenda (SPE). As projeções dos parâmetros macroeconômicos (inflação.Tributos e seus indicadores de preço e quantidade TRIBUTO/CONTRIBUIÇÃO INDICADORES ESPECÍFICOS PREÇO QUANTIDADE Volume de importações Imposto de Importação Taxa de câmbio tributadas.IRRF .Trabalho Imposto de Renda Retido na Volume em R$ de aplicações Taxa de juros Fonte .

17 585.84 -11.370 1.247 4.547 1.11 -36.53 1. 3.35 -13.82 Total 16.13 -10.195 1.486 3.952 4.22 -13.28 ∆% média 3.222 1.777 18.713 -2.206 5.24 -16.180 1.980 18.350 -9.4 mostram o gráfico da série temporal do imposto.072 1.20 1.546 -2.29 -8.156 4.013 1.052 1.619 4.019 871 1.34 -41.82 -21.079 5.09 -33.854 4.592 5.53 -14.37 ∆% -23.30 401 334 20.99 -35.191 -24.723 2.83 -13.519 1.1.718 4.80 -27.3 e 3.Rendimentos do Trabalho Mar Abr Mai Jun Jul Ago Set Out Nov Dez 1.84 -38.09 405 371 9. 38 .46 -10.306 1.825 4. o valor da arrecadação real no ano de 2000 em azul e o valor da previsão para o ano de 2000 em vermelho pontilhado.97 -1.05 383 336 13.333 -8.866 1.246 1.937 16.111 1.07 -22.305 1.19 -23.26 1. 3.IRPF Abr Mai Jun Jul Ago Set Out 819 829 -1.159 1.501 Real -14.462 -6.847 4.937 58.062 MSE 381 138 124 136 334 182 226 194 14.95 Jan Fev Mar Série Imposto de Renda Pessoa Física .34 -19.2.177 854 937 963 1.97 Nov Dez Total 3.338 1.880 -10.Agregado Mai Jun Jul Ago Set Out 4.70 -25.666 3.20 -20.24 -13.236 1.625 1.Previsão gerada pelo método dos indicadores Jan previsão ∆% ∆% média Fev Mar Abr Série Imposto sobre a Renda .de acurácia MSE. em preto.12 -11.652 1.2 .528 1.870 -1.2.755 2.042 3.754 -4.219 1.49 1.557 1. para cada um dos impostos constantes na Tabela 3.88 -16.494 As Figuras 3.33 -28.725 MSE 1.302 1.14 ∆% média 188.705 6.174 -10.154 4.31 MSE 1.578 3. somente para o ano de 1999.820 3.97 -21.04 Jan previsão Fev Mar Série Imposto de Renda Pessoa Jurídica .901 1.113 4.IRPJ Abr Mai Jun Jul Ago Set Out Nov Dez Total 13.06 Real 1.629 2. Tabela 3.32 -10.494 4.261 4.375 4.80 69.14 ∆% -11.12 Jan previsão ∆% ∆% média Fev Série Imposto de Renda Retido na Fonte .20 424 407 4.435 -1. Todos os valores da arrecadação são mostrados a preços constantes de junho de 2000.96 Nov Dez Total 51.014 857 1.619 5.777 3.476 1.70 136 106 124 209 159 173 Real -35.72 Real MSE previsão 5.17 1.14 -30.285 1.09 -26.96 -45.029 2.454 1.641 4.227 -0.

Gráfico do valor real e da previsão gerada 39 .1 .Gráfico do valor real e da previsão gerada Figura 3.2 .Figura 3.

Gráfico do valor real e da previsão gerada Figura 3.4 .3 .Gráfico do valor real e da previsão gerada 40 .Figura 3.

3) Caso ∆P. o método dos indicadores deve ser considerado como uma representação de um modelo auto-regressivo de ordem 1 uma vez que Xt-1 representa a arrecadação efetiva no período anterior. ct pode assumir. (3.Análise econométrica Considere novamente a equação que descreve o método dos indicadores X t = X t −1 (1 + ∆P )(1 + ∆Q )(1 + ∆L )(1 + ∆U ). Assim.3 . ceteris paribus. a menos do termo de erro εt e do fato que em (3. valores maiores ou menores que 1. o valor de ct em (3. A equação (3.3) assemelha-se a uma estrutura AR(1).3. Assim. conforme mostra a equação (1. não ocorram alterações percentuais em nenhum dos índices.3) será igual a 1.3) ct varia com t.3) pode assumir valores maiores ou menores que zero. ou seja.1. 41 . Generalizando. a equação (3. Caso um dos índices apresente variação percentual positiva.12). ∆Q.2) fica X t = ct X t −1 . o valor de ct em (3.3) será igual a 1 e a previsão será igual ao último valor observado.9. por exemplo ∆P = 10%. Caso a variação percentual seja negativa.3) será igual a 0. o valor de ct na equação (3. ceteris paribus. ∆L e ∆U sejam simultaneamente zero.2) Substituindo o resultado da multiplicação dos índices entre parênteses por uma constante ct. caso haja variações positivas e negativas simultâneas em todos os índices. por exemplo ∆P = 10%. o valor de ct em (3. (3. dependendo do sinal da variação percentual.

Tal metodologia pode ser alguma das que serão mostradas no próximo capítulo. Depois. como já foi visto. 42 . além de não conter um termo residual. E. todo processo auto-regressivo de ordem 1 que apresenta o valor absoluto de sua raiz como maior que 1 não pode representar um processo estacionário. Então. 1996]. tal método deveria ser abandonado em prol de alguma outra metodologia mais adequada.Contudo. uma vez que as condições básicas de estacionariedade não são satisfeitas. Por isso. Desta maneira. o método dos indicadores utilizado pela Secretaria da Receita Federal não está reproduzindo um processo auto-regressivo causal. as metodologias de previsão por alisamento exponencial e modelagem SARIMA serão empregadas para essa série e os resultados das previsões obtidas passarão por uma análise detalhada. não há perda alguma em se desconsiderar processos AR(1) com |φ1 | > 1 [Brockwell & Davis. o método dos indicadores falha em reproduzir um AR(1) ao possibilitar que o valor de ct possa assumir qualquer valor diferente de zero. estacionário. Suas previsões não são confiáveis. que inicia-se com uma análise exploratória da série agregada do Imposto sobre a Renda.

43 . Assim. há mais de 180 observações na série temporal. Existem dados mensais da série histórica do Imposto de Renda. por ser esse um período de estabilidade inflacionária persistente. 4. verifica-se que esse imposto correspondeu a mais de 30% tanto das receitas administradas pela SRF quanto do total arrecadado pela União Federal no ano de 2000 (em valores nominais). neste trabalho optou-se por utilizar os dados disponíveis após a implementação do Plano Real. A seguir. Dessa forma.Análise e previsão da série temporal do Imposto sobre a Renda (IR) Este capítulo começa com considerações gerais sobre a série temporal do IR e suas especificidades na utilização desse trabalho.Considerações gerais O Imposto sobre a Renda foi escolhido para a análise nesse trabalho devido a sua importância na arrecadação federal.1 .4 . De acordo com a Tabela 4. são empregadas as metodologias de previsão de Holt-Winters sazonal e Box-Jenkins para a obtenção de valores futuros para a série do IR. desde janeiro de 1986.1. Apesar de ser um número razoável de observações. deve-se considerar as inúmeras mudanças econômicas ocorridas no Brasil desde então para se utilizar todos esses dados em uma análise econométrica. assim como de todos os tributos federais.

Análise exploratória O Imposto de Renda possui a seguinte classificação: IRPF .54 Demais 398. os valores da arrecadação do ano de 2000.75 8.10 100.0 6.Imposto Territorial Rural 267.00 0.04 I. IRPJ .Participação do Imposto sobre a Renda na arrecadação total da SRF .350.6 0.24 0.57 0.7 1.T.6 8.Pessoa Física.1 11.04 5.83 Imposto sobre a Exportação 2.00 22.33 10. os dados analisados foram divididos em duas partes. p/ Plano Seg.23 Receitas Administradas pela SRF 166.5 0. A seguir.3 0.903. será feita uma análise exploratória sobre a série do Imposto de Renda.MF Desta maneira.0 0.27 Contrib.278.Retido na Fonte. .Contribuição Seguridade Social 39.510.O.839.1 . . 4.2 .81 0.26 Cofins .626.Imposto s/ Operações Financeiras 3. O IRRF apresenta ainda quatro subdivisões.4 0.6 33.45 Total da Arrecadação Federal 176.milhões % .043. Esses dados serão utilizados pelos métodos de alisamento exponencial e de Box-Jenkins para prever os dados conhecidos da segunda parte.16 0.Contrib.1 5.77 Receitas de Loterias 951.126.0 5.78 I.71 CSLL .92 32.396.58 5.00 94.21 Outras Receitas Administradas 1. Remessas 44 .R. IRRF .18 2.00 Fonte: Secretaria da Receita Federal .70 Imposto sobre a Renda 56. Social Servidores 3.15 CPMF .7 0.00 Imposto sobre Produtos Industrializados 18.67 Contribuição para o Pis/Pasep 10.544.Tabela 4.2000 Imposto R$ . Movimentação Financeira 14. a saber: Rendimentos do Trabalho.administradas % .020.60 100.F. Rendimentos do Capital.12 4.88 1.Pessoa Jurídica. A medida de acurácia de previsão empregada será o MSE.06 Contribuição para o Fundaf 372.260.Contribuição Social s/ Lucro 9.2 24.6 2.arrecadação Imposto sobre a Importação 8. A primeira parte corresponde aos valores observados a partir de julho de 1994 até o mês de dezembro de 1999.22 0.

A Tabela 4. Assim. com base em junho de 2000. do IRPJ e do IRRF .para o Exterior e Outros Rendimentos Desta maneira.Gráfico da série do IR 45 . somente a série agrupada do imposto será descrita e analisada detalhadamente. Para as séries do IRPF .Rendimentos do Trabalho. Figura 4.1 . oito séries distintas de dados precisam ser analisadas.1 em milhões de reais. Para simplificação e para evitar repetição de procedimentos.2 mostra os valores em milhões de reais das observações da série {IR}. os dados são expressos em reais de junho de 2000 e podem ser interpretados como a preços constantes. A série do imposto de renda {IR} analisada possui 66 observações e seu gráfico é apresentado na Figura 4. Os dados foram ajustados pelo índice de preços IGP-DI divulgado pela Fundação Getúlio Vargas em janeiro de 2000. sem centavos. somente os resultados serão apresentados.

2.245 3.375 3.992 3.206 5. O coeficiente de curtose é 2.1994 1995 1996 1997 1998 1999 2000 Tabela 4.683 5184 4.041 4.295 3. A distribuição de freqüências de {IR} está mostrada no histograma da Figura 4.095 3.883 6.093 4.260 3.890 5. que pode estar sendo causada por movimentos sazonais.834 5.113 4.492 5.2 .507 bilhões de reais.411 3. e o valor mínimo é de 2.Valores do Imposto sobre a Renda agregado em R$-milhões Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez 2. Figura 4.2 .261 4.052 3.550 3467 3.331 4.042 5. com o valor do coeficiente de assimetria de Pearson igual a 0.339 3.458 4.677 2.Histograma da série 46 .654 5.718 4.083 4.127 5.532 2.989 4.713 4.937 4.246 4. referente ao mês de outubro de 1994.210 3.780 3.419 4.629 3.809. O valor máximo das observações é de 6.502 3.366 5.145 3.657 3. Verifica-se que a distribuição é positivamente assimétrica.731 2.546 A série {IR} apresenta uma média amostral de 4.411 3.201 3. Nota-se.156 4.568 3.101 4.375 4.825 4.047 bilhões de reais.511 4.507 2.099 bilhões de reais com um desvio padrão de 1.1.189 3. em milhões de reais.463 3. pela Figura 4.187 4.575 5.574 4.987 6.90 e a distribuição do {IR} é dita platicúrtica relativamente à distribuição normal.345 3.268 4.359 6.102 4.950 3. que há uma flutuação considerável na série.619 4.055 3.952 5. que corresponde ao mês de março de 1996.992 bilhões de reais.869 4.705 6.529 4.309 3.718 6.519 3.397 3.139 5.425 3.546 2.

3 . 47 . que mostra a componente de sazonalidade presente na série.9%. Paulo.4. -49. esse pagamento era estendido até o mês de maio [Folha de S. 1996].5 mostra o histograma da taxa de crescimento da série.Componente sazonal do IR Em relação ao crescimento da arrecadação do IR. Pelo gráfico da Figura 4.4 mostra a taxa de crescimento da série {IR} e a Figura 4.A presença de movimentos sazonais na série {IR} pode ser observada na Figura 4. Anteriormente. com a taxa mediana ficando em 0. Figura 4. O crescimento mínimo foi entre os meses de março e abril de 1996.23% ao mês. nota-se que o crescimento máximo foi entre os meses de fevereiro e março de 1996. a taxa média de crescimento é de 5.3. Nota-se claramente um comportamento sazonal homogêneo e estável em todos os anos da série. 142. O gráfico na Figura 4.5%.43% ao mês. Esse crescimento elevado deveu-se principalmente ao pagamento antecipado do ajuste anual do IRPJ realizado em março daquele ano. o que caracteriza a série como uma série sazonal.

Gráfico da taxa de crescimento do IR Figura 4.Histograma da taxa de crescimento 48 . evidencia a alta variabilidade na arrecadação desse imposto. 32.58%. 1996]. Figura 4.5 .Tal decréscimo deveu-se em parte na decisão da Secretaria da Receita Federal em processar as declarações do IRPF. recolhidas até o dia 31 de abril. O valor elevado do desvio padrão.4 . o que pode ser corrigido mediante o uso da série transformada em logaritmo. apenas no final de maio [Folha de S. Paulo.

A evolução da arrecadação pode ser observada na Figura 4.Componente de tendência da série .6. essa observação é um outlier e pode distorcer todo o comportamento da série. o 2º nível. 6. o 1º nível. Observam-se quatro níveis principais nesse gráfico.6 . que vai até novembro de 1995. apresenta um elevado crescimento da série. que mostra a componente de tendência da série. Figura 4. que compreende o ano de 1999. pelo histograma na Figura 4. mostra um crescimento quase nulo da arrecadação. que compreende os meses de dezembro de 1995 a fevereiro de 1997.4. mostra novamente um crescimento elevado da série e o 4º nível. apresenta um início de diminuição da arrecadação.5 e pela descrição dos valores máximos e mínimos da taxa de crescimento.99 bilhões de reais. ou seja.crescimento da arrecadação 49 . que vai até janeiro de 1999. o 3º nível.Pelo gráfico da Figura 4. verifica-se que claramente o valor de março de 1996. é uma observação que destoa das demais.

β e γ . para cada uma das séries analisadas. A Tabela 4. log{IRmodif} e log{IRmodif2}. não se faz necessário aplicar nenhuma estratégia de modelagem.Devido à elevada variabilidade da série. Desta maneira. outra série utilizando o valor médio dos meses de março {IRmodif2} e as transformações logarítmicas de {IR}.3 . 4.28).3. As Tabelas 4. α. o algoritmo de Holt-Winters sazonal aditivo será empregado para a previsão das séries por meio da utilização do programa ITSM2000.6 mostram as previsões obtidas para cada uma das séries. 50 .5 e 4.3 mostra os valores otimizados das constantes de suavização da equação (1. serão modeladas mais 5 séries: uma série utilizando o valor do mês de março como o menor valor dos meses de março {IRmodif}.1 .Alisamento exponencial Como o método de alisamento exponencial é considerado um procedimento automático de previsão. a transformação de Box-Cox com λ = 0 (transformação logarítmica) será empregada e a série resultante será também modelada. 4. Desta maneira. 1999].4. ele será substituído pelo menor valor para o mês de março na série e também pelo valor médio dos meses de março na série [Venables & Ripley. a diferença percentual entre a previsão e o valor observado (∆%) e o valor do MSE.Modelagem e previsão 4. além da série original do IR. Dado que o valor de março de 1996 é um outlier. a menos para verificar se existem tendências ou sazonalidades. que serão denominadas log{IR}. {IRmodif} e {IRmodif2}.

04 Maio 4.070 -1.806 -2.619 4.163 1.09 4.07 0.879 58.13 0.670 9.67 Fevereiro 4.156 5.135 22.86 Julho 4.09 0.22 Março 5.Séries {IR} log{IR} {IRmodif} log{IRmodif} {IRmodif2} log{IRmodif2} Tabela 4.546 6.04 Fevereiro 4.54 Outubro 4.34 221.994 1.37 Setembro 4.225 10.45 4.01 1.977 5.705 4.350 2.Previsões geradas para as séries {IRmodif} e log{IRmodif} Série {IRmodif} Série log{IRmodif} Arrecadação Real Mês/2000 em R$ milhões previsão ∆% MSE previsão ∆% MSE Janeiro 5.65 Agosto 4.825 4.19 Abril 4.488 30.17 Tabela 4.499 -6.64 Tabela 4.187 18.126 8.619 4.546 6.788 -3.055 15.38 6.376 6.937 4.713 5.180 8.538 -5.718 6.55 0.10 0.65 Outubro 4.261 4.030 14.08 6.07 0.321 3.10 0.68 0.275 3.69 0.140 -12.020 -2.04 -0.622 9.139 -2.221 Diferença percentual média 4.043 -14.825 4.706 10.355 -2.976 -0.092 8.225 -4.309 26.375 5.5 .111 -3.13 0.Previsões geradas para as séries {IR} e log {IR} Série {IR} Série log{IR} Arrecadação Real Mês/2000 MSE Previsão MSE em R$ milhões previsão ∆% ∆% Janeiro 5.69 207.140 7.48 5.10 γ 0.996 18.261 4.Coeficientes otimizados Coeficientes otimizados α β 0.78 Março 5.174 60.16 4.285 -7.22 4.48 0.60 Maio 4.072 6.97 4.78 Total 58.140 -10.07 3.23 4.949 1.56 5.113 4.39 4.038 5.11 Novembro 4.206 5.427 -4.332 -3.937 4.375 5.28 Dezembro 6.14 0.31 Novembro 4.05 Dezembro 6.92 6.903 -17.90 Total 58.289 -11.61 312.845 -18.963 57.841 10.09 4.705 4.52 Julho 4.61 0.86 5.95 4.15 4.289 0.73 5.613 Diferença percentual média 4.05 Junho 4.718 6.27 6.57 51 .206 5.141 -10.113 4.97 5.709 10.66 4.01 3.60 Abril 4.3 .915 -0.26 Junho 4.376 -9.364 -2.174 60.07 0.33 281.156 5.35 Setembro 4.76 4.06 0.02 Agosto 4.10 0.713 5.4 .76 4.

62 Fevereiro 4.81 Maio 4.083 -11.718 6.04 4.6 .183 1.60 Setembro 4.67 6.185 23.40 Abril 4.30 5. para uma aproximação inicial.375 5.29 -0.937 4.705 4. Os picos nas autocorrelações de ordem 1.306 -3.30 Total 58. 52 .475 -7.327 26.80 6.156 5.261 4.3.30 Novembro 4.Previsões geradas para a série {IRmodif2} Série {IRmodif2} Série log{IRmodif2} Arrecadação Real Mês/2000 MSE previsão MSE em R$ milhões previsão ∆% ∆% Janeiro 5.7. talvez d = 1.2 .57 5.70 3.619 4.652 9. e um procedimento de procura dos menores valores do critério de seleção BIC.280 -11.271 0. p = 0 e q = 1 ou 3.Tabela 4.018 -0.107 6.93 260.206 5. os valores das autocorrelações indicam que o valor do termo de médias móveis pode ser de ordem 1 ou 3.921 -0.65 5.027 5.199 -5.815 -18.995 -2.87 Agosto 4.915 12. com o número de defasagens indo de 0 a 36 (36 corresponde a 3 no eixo horizontal).174 59.087 -4. Para a etapa de identificação é utilizado o correlograma da série. O correlograma da série {IR} está mostrado na Figura 4.23 4.900 58.Método Box-Jenkins A estratégia de modelagem de Box-Jenkins consiste de três etapas. conforme explicitado anteriormente.32 4.089 16.87 Junho 4.713 5. a análise recairá sobre as funções de autocorrelação amostral.687 10.27 272.113 4.32 4.309 -6.037 -14.08 Julho 4.34 Outubro 4.034 6.28 Março 5.825 4.20 3.746 -3.71 4.25 4. Inicialmente.674 Diferença percentual média 3.546 6. Além disso. 3 e 9 indicam a não-estacionariedade da série e sugerem a necessidade de diferenciação.164 9.92 Dezembro 6.876 2.

evidencia-se fortemente que o termo de médias móveis pode ser de ordem 1. uma vez que todas as autocorrelações amostrais entre as defasagens 2 e 10 são estatisticamente iguais a zero.8.Figura 4.7 .Função de autocorrelação amostral da primeira diferença de {IR} 53 .8 . mostrado na Figura 4.Função de autocorrelação amostral de {IR} Ao se analisar o correlograma da primeira diferença de {IR}. Figura 4.

confirma a suspeita de nãoestacionariedade e da existência de sazonalidade na série original {IR}.44. D = 1.9 .21 e ρ(36) = 0. 54 . 1986]. O gráfico da diferença sazonal.45. A sazonalidade pode ser evidenciada também no gráfico da primeira diferença da série. D = 1.9. respectivamente. sendo que esse último valor pode ser explicado como erro amostral [Granger & Newbold. indica autocorrelações amostrais estatisticamente iguais a zero em todas as defasagens. menos nas defasagens 12 e 29. cujos valores de ρ(12). além da necessidade de diferenciação sazonal.Já os valores de ρ(12) = 0.19. O resultado.Função de autocorrelação amostral da 12ª diferença de { IR} Esses resultados sugerem o exame da série diferenciada duas vezes. Figura 4.08 na série {IR} indicam a presença de sazonalidade e sugerem que o valor do termo de médias móveis sazonal pode ser de ordem 1. 0. mostrado na Figura 4. ρ(24) = 0. ρ(24) e ρ(36) são 0.32 e 0. P = 0 e Q = 1.

de forma que d = 1 e D = 1 simultaneamente. pode ser uma estimada inicial para a análise da série em questão. O correlograma para essa diferenciação dupla está mostrado na Figura 4. um modelo SARIMA(p = 0. de forma que Q = 1. Notam-se valores estatisticamente diferentes de zero na defasagem 1. representado por (1 − B )(1 − B 12 )X t = (1 + θ 1 B )(1 + Θ1 B 12 )ε t . Essa análise revela-se idêntica para a série do log{IR}.10. o que sugere um termo MA(1).10 . o que comprova o fato que o outlier de março de 1996 distorce a série. Figura 4. q = 1)(P = 0.ACF amostral da 1º e 12º diferenças de { IR} A série {IRmodif} apresenta um comportamento que se aproxima da estacionariedade mais do que a série original {IR}. d = 1. O correlograma da primeira diferença para a série {IRmodif} não apresenta um valor estatisticamente diferente de zero na 55 . Então. D = 1. e nas defasagens 12 e 13.uma diferenciação regular e outra sazonal. o que sugere fortemente a presença de sazonalidades. Q = 1).

0) ou SARIMA(0. A série {IRmodif2} não se aproxima tanto da condição de estacionariedade do quanto a série {IRmodif}.1.defasagem 11.1)(0. O correlograma da 1ª e 12ª diferenças simultâneas apresenta também somente um valor elevado na defasagem 1. o que pode ser indicativo que d = D = 1. o que significa que todo movimento sazonal foi absorvido pela diferenciação. O correlograma da 12ª diferença apresenta somente um valor estatisticamente diferente de zero na defasagem 1.1. Assim. tanto pode ocorrer a diferenciação regular ou não.0.1)(0. caracterizando o termo de média móvel sazonal como zero. mostrando-se bem próxima da série 56 . o que sugere que novamente q = 1 e Q = 0.0) possam representar adequadamente a série log{IRmodif}. mas nas defasagens 1 e 13 o valor da autocorrelação amostral é significativo.1)(0.0) e SARIMA(0. O correlograma da primeira diferença é idêntico ao da série {IRmodif}.1. mas os valores referentes às defasagens 1 e 12 são significativos. tanto a 1ª diferença quanto a 12ª diferença produzem resultados estacionários. Para a série log{IRmodif}.1)(0.1. Já o correlograma da 12ª diferença mostra-se totalmente estacionário. de forma que d = 0 ou d = 1 e espera-se que os modelos SARIMA(0. Q = 0. espera-se que os modelos SARIMA(0. O correlograma para a dupla diferenciação não apresenta pico na defasagem 12.1.1. o comportamento da série se aproxima mais da condição de estacionariedade do que a série {IRmodif}. Dessa maneira. Assim.1) possam representar adequadamente a série {IRmodif}. o que sugere q = 1 e Q = 0.1. representando um processo ruído branco.

a identificação dos modelos a serem estimados utilizará um critério de seleção de modelos. espera-se que um modelo SARIMA(0. O correlograma da 12ª diferença apresenta um valor estatisticamente diferente de zero na defasagem 11. A série log{IRmodif2} apresenta no correlograma da 1ª diferença um comportamento similar ao correlograma de {IR}.1. e por ele ser parcimonioso.1) possa representar adequadamente a série {IRmodif2}. A escolha dos modelos se baseia na minimização do valor do BIC. Esse critério foi utilizado por ser um critério consistente. O correlograma da 12ª diferença apresenta somente um valor estatisticamente diferente de zero na defasagem 12. por tipicamente escolher modelos com poucos parâmetros. caracterizando a necessidade de diferenciação serial.1)(0. mais ele seleciona um modelo que se aproxima do verdadeiro mecanismo gerador de dados. Após a análise feita com os correlogramas.1) possa representar adequadamente a série log{IRmodif2}.1)(0. o que característico de série sazonal. No correlograma da 1ª e 12ª diferenças simultâneas há picos na defasagem 1 e 12.1. Assim. 3 e 12.1. 57 . caracterizando o termo sazonal. ou seja. ou seja.original {IR}. espera-se que um modelo SARIMA(0. Assim. Então. Deve-se destacar que para as 5 séries descritas acima o correlograma da série sem diferenciação é semelhante ao da série original {IR}. com picos nas defasagens 1.1. os correlogramas da 1ª diferença e da 1ª e 12ª diferenças simultâneas possuem um comportamento similar ao correlograma da série {IR}. quanto maior as observações.

Dessa maneira.1]. o valor do BIC para diferentes valores de p e q.2]. calculados como p = i − 1 e q = j − 1. e Q. a Tabela 4. mas sim do AIC. d = [0. P = [0. com 0 ≤ p ≤ 4 e 0 ≤ q ≤ 4. a função arima0. para cada série. e Q conforme definidos acima e a matriz gerada pela função externa é de tamanho 5x5. para a série {IR}. Assim. esses valores do BIC são armazenados em uma matriz. P. Os intervalos possíveis para os valores de d. Tal função calcula. cuja posição (ij) representa os valores p e q. A Tabela 4.2]. ou seja. os modelos escolhidos pelo menor valor do critério BIC e aqueles modelos que diferem em até duas unidades do menor valor do BIC. Os resultados resumidos dos 450 modelos possíveis de cada série estão mostrados no Apêndice B. D. 2000] que se encontra no Apêndice A. Assim. Deve-se notar que a função interna do R. uma vez que há 18 combinações possíveis de modelos com os valores de d.7 traz. D. a função arima0 foi modificada para que o valor do BIC fosse informado. e Q são definidos como D = [1]. D. Assim. não informa o valor do critério BIC. P. para um dado conjunto inicial de d. apresenta 25 elementos ou 25 valores de p e q. para cada série são examinados 450 modelos e seus respectivos valores do BIC. Assim. Q = [0. será utilizada uma função externa ao programa R obtida de [Cribari-Neto. ou seja. P.Aqueles modelos que apresentarem o menor valor para o BIC e os que tiverem valor até duas unidades a mais que o menor valor do BIC serão escolhidos.7 mostra que o modelo que apresenta o menor valor do critério BIC é o modelo airline. um modelo 58 .

para a série log{IR}.1.0) -30.1.1) 861.1.3 (1.1.1 (1.0) 859.5 (1.0.0) 859. a análise efetuada com os correlogramas acertou ao sugerir o modelo airline como um modelo adequado para a série log{IR}.1)(1.Valores do BIC e modelos escolhidos Modelos Série BIC (p.1.3 (0.0).0) (0.1.1) (1.0) 863.1.1) (0.1) -30.1) (0.1) (0.1) (0.1) (0. Os modelos alternativos que também serão estimados são um modelo SARIMA(0.0) -32.3 {IRmodif2} (0.1.0.5 log{IR} (0.1.6 (0. que o modelo que apresenta o menor valor do critério BIC é novamente o modelo airline.1) (1.1) -16.9 {IRmodif} (0.2 (0. um modelo SARIMA(0.1) (0. Outra vez.1)(1.q) (P.0) -27.1.1. Essa conclusão coincide com a oriunda da análise dos correlogramas.1.0) e um modelo SARIMA(1.1) 857.1)(0.1.1.7 log{IRmodif} (0.1) (0.1) (0.1) (0.0.1.4 (0.1.1) (1.1.9 (0.0) -25.3 Nota-se.1)(0.0.d.1) 863.1.0) -32.1)(0.1) (0.1.0) 874.1. 59 .0) (0.0) -16.1.1) -30.1) (0.7 log{IRmodif2} (0.1.1.1.0.1).1.7 (0.1) -26.1.1.1.1.1).1.8 (1.0) -31.0) (1.1.7 .1) (0.1) (1.7 (0.1.1.1.1.1.1.1.1.1) (0.0.1.1) 863.1. ou seja.0. O modelo alternativo que também será estimado é um modelo SARIMA(0.3 (0.0) -26.1) -18.1.5 (0.1.1) 873 {IR} (0.1) (1.D.Q) (0.1.SARIMA(0.2) (0. Tabela 4.1.1) (0.1.9 (1.8 (0.7 (1.1).1.1.0) 857.7 (1.1.1.0.0) -25.1) (0.

1. os modelos SARIMA(1.2)(0. Esses dois modelos se distinguem por causa da diferenciação regular. mas o modelo airline.1. Assim.1)(0.0) possui o valor do BIC muito próximo ao do modelo anterior. é um SARIMA(1. 60 .1.1.1). Para a série {IRmodif2} o modelo que apresenta o menor valor do BIC é novamente um modelo airline.1.1.0)(0.1)(1. os modelos SARIMA(0.Para a série {IRmodif} o modelo com menor valor do BIC é um SARIMA(0.1)(0. O modelo que possui o menor valor do BIC.0).1. SARIMA(0. SARIMA(0.0). pois sugeriu os mesmos dois modelos que também apresentaram o menor valor para o BIC.0.1.1. Além desse modelo. Além desses dois modelos. O exame das autocorrelações amostrais feito anteriormente revelou também que um possível modelo para estimação era o modelo airline.1.1)(0.1.0. SARIMA(0. mas o modelo SARIMA(0.0)(1.0).0.1.1)(0.1)(0. ou seja.0.1).0) serão também estimados.0). apresenta um valor do BIC muito próximo ao daquele modelo.1.1) e SARIMA (1.0). para a série log{IRmodif2}.1.1).0.1)(0.0) também serão estimados.1) e SARIMA(1. o valor de d.1.1.1.1. a análise dos correlogramas está novamente certa. Para essa série.1)(0.1)(0. além desses dois. E tal fato foi previsto corretamente na análise dos correlogramas da série.1.1. SARIMA(1.1). O modelo que possui o menor BIC é um SARIMA(0. A série log{IRmodif} apresentou 6 modelos diferentes para serem estimados.1.1) serão estimados.1.1)(0.1)(1.0).1.1)(0. SARIMA(0.0. SARIMA(0.1. Mais 4 modelos apresentam um valor de BIC próximo ao do menor valor.1.0)(0.1)(0.0) e outro SARIMA(1. um modelo SARIMA(0.1.1.1. SARIMA(0.

96 que corresponde ao nível assintótica da distribuição normal a 95% de significância. Nessa série.1)(1.8.12 e 4. log{IRmodif}. As Figuras 4. que medem a significância estatística dos parâmetros estimados. um gráfico da previsão gerada pelos modelos com o menor valor do BIC. Após a identificação dos prováveis modelos. 4.SARIMA(0. 4.11. para aqueles modelos com o menor valor do BIC. O gráfico é composto da série temporal do imposto de renda somente para o ano de 1999 em preto. que são aqueles com menor valor do BIC e aqueles com uma diferença para o menor BIC não superior a 2 unidades. as previsões. para cada uma das séries {IR}. 4. Φ e Θ e.9.13 mostram os resultados das previsões para as séries {IR}. o valor da arrecadação real no ano de 61 . Assim. 4. respectivamente. conforme mostrados na Tabela 4. a etapa da estimação gerará os valores estimados dos parâmetros φ. para serem comparados com o valor de 1. porém ainda assim o modelo airline foi especificado.10. a análise do correlograma não revelou apropriadamente o modelo principal a ser estimado. {IRmodif}.16 mostram. θ.0).14.11.7. {IRmodif}.14 mostra o cálculo das estatísticas t. a diferença percentual entre o valor previsto e o valor real (∆%) e o valor do MSE. {IRmodif2} e log{IRmodif2}. 4. por conseqüência.1.13. respectivamente. log{IR}.1.15 e 4. 4.1.0) e SARIMA(0.1. {IRmodif2} e log{IRmodif2}. as funções internas do R arima0 e predict serão utilizadas. As Tabelas 4. A Tabela 4. 4. 4. calcula-se para cada série a previsão para 12 meses. Para essa etapa.1)(0.12. log{IRmodif}. de posse dos modelos escolhidos pela etapa anterior. log{IR}.

058 20.708 10.21 62.426 -1.49 4.2000 em azul e o valor da previsão gerada para o ano de 2000 em vermelho pontilhado.825 Out 4.07 9.1.555 32.113 Mai 4.1) Prev.174 ∆% média MSE Figura 4.156 Jan 4.450 9.8 .546 Dez Total 58.491 16.1.01 4.773 -1.232 20.valores em R$ milhões Mês Real (0.439 -5.11 4.375 Set 4.098 16.68 5.51 4.846 (0.63 4.1) 62 .53 4.161 4.718 Mar 4.713 Abr 4.97 5.34 5.365 22.443 12.1.1)(0. Tabela 4.31 4.504 13.51 4.247 -9.681 1.382 9.Gráfico da previsão gerada para o modelo SARIMA(0.Previsões geradas para a série {IR} .1.573 7.619 Ago 4.83 63.937 Jul 4.71 5.560 0.673 5. ∆% 5. ∆% 6.73 6.1.206 Fev 5.704 -2.293 12.32 5.0) Prev.430 3.75 5.45 476.1.65 6.07 6.87 5.54 4.50 7.282 4.750 15.11 .26 6.89 253.705 Nov 6.61 5.08 4.1)(1.832 4.537 7.1)(0.261 Jun 4.

354 -2.113 Mai 4.63 4.1.118 -12.370 6.91 6.937 Jul 4.294 4.34 207.1.1) Prev.619 Ago 4.Previsões geradas para a série log{IR} .57 193.464 29.458 -7.1.561 -5.Tabela 4.322 1.446 -1.401 11.25 4.64 6.valores em R$ milhões Mês Real (0.48 6.62 4.825 Out 4.206 Fev 5.04 4.82 4.590 2.249 -0.93 4.42 5.025 16.378 -5.223 10.016 -14.319 10.1)(0.247 19.9 .93 61.1.636 9.967 18. ∆% 5.912 12.22 5.1.55 5.0) Prev.34 4.718 Mar 4.1.930 17.451 12.53 59.404 5. ∆% 6.85 5.81 397.31 4.21 6.010 14.22 4.713 Abr 4.849 (1.64 5.165 4.44 4.586 8.1.40 4.081 -0.51 4.19 4.174 ∆% média MSE Figura 4.268 5.243 -0.1) 63 .61 4.94 5.1)(0.158 9.0.616 1.43 2.1)(1.07 60.28 4.78 4.51 5.027 1.287 -7.546 Dez Total 58.156 Jan 4.09 6.261 Jun 4.505 -6. ∆% 5.82 5.871 (0.372 13.82 4.43 5.12 .629 4.935 -0.98 4.1)(0.47 4.Gráfico da previsão gerada para o modelo SARIMA(0.705 Nov 6.27 4.1) Prev.000 -14.375 Set 4.98 6.497 -2.

351 584.505 6.668 -22.04 5.25 6.937 Jul 4.53 4.Gráfico da previsão gerada para o modelo SARIMA(0.732 36.547 7.39 6.097 -0.79 4.113 Mai 4.500 16.404 1.966 -8.833 -2.12 517.1.77 4.730 5.283 25.015 43.26 4.1)(0.13 .35 4.968 -15.980 1.65 5. Prev.88 4.1) (0.1.70 4.06 5.64 3.43 4.1)(0.49 4.582 7.0) (1.1.1)(0.79 1.1)(1.860 -1.Tabela 4.1.85 3.1.761 374.705 Nov 6.1.26 264.78 5.546 Dez Total 58.375 Set 4.713 Abr 4.228 -0.396 6.239 -0.29 4.1.48 0.153 -0.401 -8.062 -7.1.18 3.56 4.047 15.1.505 (0.194 -9.817 -2.11 4.67 4.63 6.Previsões geradas para a série {IRmodif} .93 5.718 Mar 4.39 4.24 3.58 4.01 6.892 -0.valores em R$ milhões Mês Real (0.533 -8.141 7.73 6.619 Ago 4.821 -18.36 5.174 ∆% média MSE Figura 4.10 .20 4.0) 64 .39 59.153 17. Prev.52 4.997 -13.47 5.261 Jun 4.61 5.28 6.437 12.201 10.53 61.77 5.118 -10.50 5.58 5.060 -1.224 -12.388 4.156 Jan 4.062 1.922 -16.0) Prev.98 6.697 -19.040 5.0) Prev.81 4.46 3.26 6.1.524 -6.190 8. ∆% 5.215 10.521 31.266 -4.96 5.28 58.40 5.171 -5.86 57.57 5.206 Fev 5.498 25.79 3.282 0.66 6.181 9. ∆% ∆% ∆% 5.330 -10.137 0.1)(0.825 Out 4.198 18.

15 5.034 -1.718 35.84 -0.073 -0.667 -22.15 57.61 4.052 -1.158 9.26 5.73 4.1.147 9.Tabela 4.032 5.238 1.15 5.04 57.713 Abr 4.87 3.546 Dez Total 58.261 Jun 4.91 5.937 Jul 4.16 4.814 -18.235 -0.1) (1.1.07 57.1) (1.58 6.06 4.37 4.87 -0.157 -5.12 4.570 -7.04 5.0.52 -0.100 -1.756 -0.149 9.94 5.207 -12.1.375 Set 4.1.138 -0.79 3.06 3.1)(0.74 5.00 58.1.50 6.184 18.114 16.674 34.948 -9.34 516.174 ∆% média MSE Figura 4.48 4.1.25 5.47 3.92 4.Gráfico da previsão gerada para o modelo SARIMA(0.1.567 -1.768 -18.781 -3.593 -1.206 -12.094 6.34 5.035 -1.113 Mai 4.268 0.74 5.260 -0.40 5.113 6.54 57.0) Prev.353 (0. Prev.430 467.59 5. Prev.97 4.94 3.44 4.69 5.90 5.144 17.12 5.678 -20.026 -2.512 -8.431 5.705 Nov 6.valores em R$ milhões Mês Real (0.33 5.825 Out 4.79 6.0)(1.1.90 4.93 3. Prev.026 278.770 -18.202 -1.43 4.281 -1.156 Jan 4.31 5.09 5.44 4.683 -20.157 -2.75 3.33 6.72 -0.1)(0.29 5.40 3.654 -22.626 -22.06 5.952 -9.206 Fev 5.655 -20.1)(0.217 24.695 35.106 6.519 -8.49 6.1.143 9.34 3.81 4.11 .14 .0) (1.38 4.1. ∆% 5.206 455.243 1.689 512.718 Mar 4.0) (0.15 4.127 7.947 -9.001 14. ∆% ∆% ∆% ∆% ∆% 5.321 -10.61 4.58 5.21 5.0.49 4.651 -22.667 -22.906 -9.049 -12.080 6.570 -7.035 5.78 5.187 10.42 5.208 -12.114 -0.16 4.667 -0.35 5.0)(0.83 4. Prev.947 -9.43 3.89 5.210 -12.484 -9.615 33.172 9.0) Prev.0.0.Previsões geradas para a série log{IRmodif} .26 -0.41 4.583 32.171 0.1)(0.81 5.619 Ago 4.06 57.178 -13.083 -0.95 6.13 518.0) 65 .38 3.02 4.178 18.1)(0.18 4.41 0.45 4.14 6.30 4.132 17.212 -1.

375 Set 4.53 6.534 4.1.174 ∆% média MSE Figura 4.1.Tabela 4.69 62.58 4.49 6.38 5. Prev.33 4.570 -1.236 19.Previsões geradas para a série {IRmodif2} .03 5.1)(0.37 5.729 -1.2)(0.1.523 31.358 -2.12 .512 -0.431 -4.03 6.93 6.461 7.94 4. ∆% 5.1) 66 .01 4.0) (0.1) Prev.15 .184 5.206 Fev 5.70 4.56 5.01 4.214 -5.valores em R$ milhões Mês Real (0.076 (1.1)(0.07 6.98 4.151 7.10 7.261 Jun 4.26 4.061 2.1.94 5.847 13.99 4.01 4.327 13.07 4.139 -12.332 10.47 62.704 10.825 Out 4.428 15.147 0.901 4.546 Dez Total 58.320 10.45 225.38 5.68 5.533 6.624 9.567 -1.106 326.06 4.1.31 5.52 60.156 Jan 4.74 5.1.53 6.31 5.370 2.937 Jul 4.09 4.619 Ago 4.515 -0.06 4.06 5.1)(0.718 Mar 4.13 5.1. ∆% 5.30 7.00 4.84 6.266 (0.264 20.87 60.425 15.23 4.63 5.260 20.183 4.021 1.079 16.285 -8.32 4.360 6.86 6.40 5.75 317.113 Mai 4.728 -2.713 Abr 4.420 -4.11 4.406 28.289 -8.247 11.51 5.1.720 10.1.487 -7.533 6. ∆% ∆% 5.571 -5.503 9.306 1.1)(1.08 5.194 23.83 4.62 5.1.507 9.1) Prev.57 5.Gráfico da previsão gerada para o modelo SARIMA(0.48 4.419 7.17 4.002 -14.83 372.364 5.378 27.1) Prev.705 Nov 6.325 10.

33 5.72 58.024 -2.07 6.37 -0.20 4.546 Dez Total 58.952 -9.0.143 -0.22 5.01 5.27 3.714 10.0)(0.619 Ago 4.45 3.02 5.855 1.519 -8.10 2.208 -8.1.14 5.93 5.083 -0.42 4.1.519 -8.0) 67 .26 4.0)(0.49 4.00 6.12 1.937 Jul 4.261 Jun 4.1.70 6.127 7.213 -12.193 -1.190 -1.0) Prev.1.19 4.58 5.654 -22.1)(0.188 18.156 Jan 4.60 4.66 4.268 0.1) Prev.889 -0.609 2.06 5.71 5.90 3.97 4.686 -20.718 Mar 4.1.770 -0.162 1.502 6. ∆% 5.13 .07 5.251 11. ∆% ∆% ∆% ∆% 5.448 29.16 6.134 8.valores em R$ milhões Mês Real (0.683 -20.672 518.75 3.08 4. Prev.174 ∆% média MSE Figura 4.1)(0.23 4.718 35.758 -0.523 -8.166 -5.160 0.957 -9.210 -12.759 -0.Tabela 4.173 0.49 4.26 5. Prev.281 9.713 Abr 4.944 13.825 Out 4.086 -0.206 Fev 5.359 194.82 5.0.964 (0.683 -20.Previsões geradas para a série log{IRmodif2} .1.191 10.857 -18.132 7.733 359.1)(0.1) (1.723 36.0.07 3.25 5.271 0.16 4.1.71 -0.952 -9.17 57.210 -12.1.85 5.15 6.47 4.657 -22.184 18.187 10.75 4.95 4.369 -9.268 0.67 4.73 4.929 -0.69 59.418 -8.81 5.07 57.654 -22.949 -16.39 4.188 10.80 518.24 6.101 6.16 . Prev.362 -2.47 3.993 18.1)(0.34 3.158 17.16 4.375 Set 4.727 36.90 4.08 5.113 Mai 4.53 6.16 3.44 4.184 18.083 -0.625 5.705 Nov 6.47 -0.16 4.0.222 -8.73 4.131 7.12 520.0) (0.68 4.81 57.Gráfico da previsão gerada para o modelo SARIMA(1.59 5.71 5.0) (1.34 5.

1)(0.96) no gráfico dos Resíduos Normalizados. A função original calcula os valores p para a estatística Box-Pierce e não para a estatística Ljung-Box. como todos os valores p devem estar acima de 0.27 -0. Para essa verificação. Nesse mesmo gráfico.72 log{IRmodif} (0. Como a função original não traça as bandas assintóticas da distribuição normal (1.69 (0.00 -0.78 (0.0) 0.Cálculo das estatísticas t para os modelos com menor BIC Parâmetros estimados estatística t Série Modelo (em valor absoluto) erro-padrão -1. o limite do eixo vertical foi aumentado para que uma linha tracejada fosse traçada justamente no limite de y = 1.1)(0.1) 0. uma vez que a estatística Ljung-Box é tipicamente mais precisa em amostras pequenas.50 {IRmodif} 0.80 2.50 {IRmodif2} (0.1.1)(0.1. tais linhas foram incorporadas.0. e isso também foi modificado.0.1)(0.14 .12 0.33 log{IRmodif2} (0.50 5.87 -0. 68 .1)(0.0) 6.1)(0.57 (0.20 -0.84 -0.12 Após a obtenção das previsões.12 0.1. Por causa da quantidade de modelos selecionados.13 0.1. os títulos e as legendas dos gráficos estão em português.39 8.1) 7. a próxima etapa do método de BoxJenkins é a verificação da qualidade do ajuste.11 -0.05 e abaixo de 1. somente aqueles modelos que apresentaram o menor valor do BIC são verificados.69 2. mas com algumas modificações.1.00 2.1.20 0.1.41 3.0) 0.diag será utilizada.1.96 e -1.1.1.85 log{IR} 0.15 0. a função interna do R arima0.55 {IR} 0.Tabela 4. Além disso.1) 7.

0) da série log{IRmodif}.1.1.1.57 B 12 )ε t .1) da série log{IR}.1.1)(0. 12 t [0. [0.11] t 69 .0) da série {IRmodif}.12] [0.1. [0. Os gráficos de diagnóstico para o modelo SARIMA(0.84 B )(1 − 0.78 B )ε t .0.27] onde os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados.41B )ε .20] onde os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados.1. sugerem a validade do modelo.1) da série {IR}.1)(0. cuja equação estimada é dada por (1 − B )(1 − B 12 )X t = (1 − 0. sugerem a validade do modelo. Os gráficos de diagnóstico para o modelo SARIMA(0.1)(0.1.13] [0. [0. sugerem a validade do modelo. cuja equação estimada é dada por (1 − B )(1 − B12 )X t = (1 − 0.69 B 12 )ε t .12] onde os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados. cuja equação estimada é dada por (1 − B )(1 − B 12 )X t = (1 − B )(1 − 0.1)(0. cuja equação estimada é dada por (1 − B )X = (1 + 0.Os gráficos de diagnóstico para o modelo SARIMA(0. Os gráficos de diagnóstico para o modelo SARIMA(0.

39 B )(1 − B12 )X t [0.50 B12 )ε t . cuja equação estimada é dada por (1 + 0.12] = εt .87 B )(1 − 0. sugerem a validade do modelo.onde os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados. serão geradas previsões para as séries desagregadadas do IR (IRPF. cuja equação estimada é dada por (1 − B )(1 − B12 )X t = (1 − 0.15] [0. Após a apresentação dos resultados obtidos para as previsões oriundas dos diversos métodos. Por fim. sugerem a validade do modelo. sugerem a validade do modelo.1.0) da série log{IRmodif2}. Depois da comparação.1)(0. no próximo capítulo discutir-se-ão as previsões e será feita uma comparação entre os três métodos de previsão apresentados até aqui.1)(0. IRPJ e IRRF-trab) e seus resultados serão comparados com os valores obtidos pelo método dos indicadores. Os gráficos de diagnóstico para o modelo SARIMA(0. [0. serão realizadas previsões com o horizonte reduzido para 1 passo e 3 passos à frente.1) da série {IRmodif2}.1.20] onde os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados. De posse desse método. onde os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados. um dos métodos será recomendado para realizar previsões na SRF.0. Os gráficos de diagnóstico para o modelo SARIMA(0.1. 70 .

1 . A Tabela 5. estatisticamente mais confiáveis. pelo algoritmo de Holt-Winters sazonal e pela modelagem de BoxJenkins para a série {IR} e faz-se a escolha de um método de previsão para representar os dados. deve-se comparar os resultados obtidos pelo método dos indicadores com os oriundos dos métodos de alisamento exponencial e Box-Jenkins. para analisar o melhoramento nos resultados de previsão introduzido pela adoção dessas novas técnicas econométricas. Serão apresentados ainda os resultados para mais três impostos que compõem o Imposto sobre a Renda. Além disso. inicialmente a comparação será feita com os resultados para a série intitulada {IR}. Teoricamente. que coincidentemente também possui o menor valor de MSE. a comparação pode se basear no valor do MSE.2. Como o método dos indicadores utiliza somente a série de dados sem transformação. O modelo SARIMA escolhido foi aquele de menor valor do BIC. 5.1 resume os resultados das Tabelas 3. são obtidas previsões para 1 passo e 3 passos à frente. serão comparados os resultados obtidos pelo método de indicadores.7.3 e 4.5 .Comparação de resultados Apesar de o método utilizado pela SRF não ser estatisticamente confiável. 71 . uma vez que os valores reais estão disponíveis.Discussão dos resultados Neste capítulo. 4.

Comparação de resultados para a série {IR} Índices Método MSE ∆% agregada ∆% média Indicadores -10.1. os modelos de alisamento exponencial e de Box-Jenkins aproximam-se melhor dos valores observados para a série{IR} quando comparados aos valores das diferenças percentuais dos métodos. Além disso.1 .17 585.5 7. Como o método dos indicadores não inclui uma análise exploratória dos dados da série histórica e como o valor de março de 1996 é uma observação outlier.1) 7.1. pois elas apresentam menores valores de MSE. caracterizando novamente a inadequabilidade desse método.04 207. as arrecadações mensais em mais de 10%.247 Holt-Winters sazonal 3.846 Apesar de o valor da diferença percentual ser um índice meramente ilustrativo.9 253. na média. Assim. log{IRmodif}.69 4. e entre as séries {IR}. Verifica-se ainda que as previsões geradas pelo método de indicadores subestimam as receitas anuais totais em mais de 10% e subestimam. A comparação entre os métodos de Holt-Winters e Box-Jenkins será apresentada a seguir. {IRmodif}. A diferença do MSE entre os dois métodos e do métodos de indicadores é maior que 100%. nota-se que as metodologias de alisamento exponencial e BoxJenkins superaram a capacidade preditiva do métodos de indicadores. a comparação agora será feita entre as metodologias alisamento exponencial (HWS) e Box-Jenkins.72 -10. que mostra quão próximo o modelo previu o valor observado.963 SARIMA(0.Tabela 5. {IRmodif2} 72 .1)( 0. o que indica a presença de grandes resíduos gerados pelo método utilizado pela SRF. esse valor pode ser utilizado como comparação didática entre os modelos. log{IR}.

1.1) 4.613 207.12 HWS 1.846 221.221 518.12 MSE 207.1.57 log{IRmodif} SARIMA(0.8.93 3. 4. Para a série log{IR}. Ainda.e log{IRmodif2}. Os 6 modelos SARIMA foram escolhidos pelo critério de menor BIC. a capacidade preditiva do método HWS é melhor que a do método Box-Jenkins em termos do valor do MSE.1. Os dois métodos superestimaram as previsões da arrecadação total e a média da arrecadação mensal.1.0) -0.0) -0. visto que a ∆% agregada é inexpressiva.17 log{IR} SARIMA(0.5.5 7.06 4.1)( 0.1)( 0.0.0.45 HWS -0. Essa comparação utilizará o menor valor do MSE para caracterizar o modelo com a melhor capacidade preditiva.04 log{IRmodif2} SARIMA(0. a modelagem SARIMA possui uma capacidade 73 .34 HWS 3.1. pois os valores das diferenças percentuais são menores para o primeiro método.Comparação de resultados para todas as séries Índices Série Método/Modelo ∆% agregada ∆% média HWS 3. o método de alisamento exponencial forneceu melhores previsões do que o modelo SARIMA.1)( 0.871 312.1) 4.1)( 0.3.1.1. A Tabela 5.879 517.266 272.27 -0. 4.48 -0.2 resume as informações das Tabelas 4.964 Em relação à série {IR}. o método de alisamento exponencial conseguiu aproximar-se com diferenças quase nulas dos valores observados.72 -0.71 -0.9.13 HWS 2.505 281. 4.12.2 .0) -0.4.9 HWS -0.1.1)( 0.33 1.674 520.01 {IRmodif} SARIMA(0.34 -0.1) 7.900 225. 4.7. 4. 4.963 253.69 4.04 {IR} SARIMA(0.1)( 0.11 e 4.61 4.29 {IRmodif2} SARIMA(0. Tabela 5.1.353 260.22 4. 4. Contudo.1.10.

74 . A modelagem HWS subestimou tanto a arrecadação agregada quanto a arrecadação média mensal. visto que a diferença entre os MSE é maior que 80%. Já o método Box-Jenkins superestimou as receitas em aproximadamente 4%. com diferenças percentuais próximas de zero. A transformação da série {IR} em logaritmos produziu efeitos diversos nas duas modelagens. Assim. a transformação fez as diferenças percentuais se reduzirem a quase zero. a transformação logarítmica conseguiu estabilizar a série e apresentar previsões melhores do que a série original. As diferenças percentuais são menores para a modelagem. a capacidade preditiva do método HWS é muito superior à do método Box-Jenkins. nota-se que a modelagem SARIMA aproximouse mais dos valores reais observados. A modelagem SARIMA subestimou as receitas enquanto que HWS superestimou a arrecadação em 4%. Em relação à série {IRmodif}. Em relação à série log{IRmodif}. mas o valor do MSE foi menor para a modelagem HWS. Tal qual na série {IRmodif}. a modelagem SARIMA subestimou as receitas enquanto que HWS superestimou a arrecadação em 2%.preditiva superior. Assim. Em relação ao método Box-Jenkins. para essa série. a transformação diminui tanto as diferenças percentuais quanto o MSE. o método de alisamento exponencial apresenta uma melhor capacidade preditiva. pois o valor do seu MSE é inferior ao valor do MSE para o método HWS. Para o alisamento exponencial. mas o valor do MSE aumentou em aproximadamente 10%.

sendo que o método Box-Jenkins apresentou uma piora maior. A transformação logarítmica fez com que as duas modelagens diminuíssem suas capacidades preditivas. uma vez que suas diferenças percentuais e o valor do MSE mantiveram-se constantes. A substituição do valor outlier de março de 1996. As duas modelagens superestimaram as receitas total e a média mensal entre 3 e 4%.Assim. Nota-se que as diferenças percentuais se mantiveram praticamente constantes nas duas transformações. pois a diferença entre os MSE é de mais de 100%. a transformação da série {IR} em {IRmodif} e em {IRmodif2}. verifica-se que a modelagem SARIMA possui uma capacidade de previsão superior ao método HWS em cerca de 20% e as diferenças percentuais são menores para o método HWS. a metodologia Box-Jenkins não captou muito bem essa transformação. Para o método de alisamento exponencial essas transformações diminuíram a capacidade preditiva do método. Para o método de Box-Jenkins a transformação da série original {IR} em {IRmodif} diminui sensivelmente a capacidade preditiva do método. Nota-se que os logaritmos fizeram as diferenças percentuais serem reduzidas para próximo de zero para os dois métodos. O valor do MSE 75 . produziu efeitos diversos nas duas modelagens. Para a modelagem HWS. Por outro lado. ou seja. Para a série {IRmodif2}. a transformação logarítmica da série {IRmodif} produziu efeitos diversos nas duas modelagens. os logaritmos diminuíram tanto o valor do MSE quanto os valores das diferenças percentuais. O valor do MSE aumentou em cerca de 50% para a transformação {IRmodif} e em cerca de 30% para a transformação {IRmodif2}.

pois o valor do MSE diminuiu 10%. Em relação à significância estatística dos modelos SARIMA constantes da Tabela 4. para todos os 76 . A Tabela 5.871. com o valor do MSE em 207. Assim. Os valores do MSE para a série log{IR} nas duas modelagens são menores do que os mesmos valores para as séries log{IRmodif} e log{IRmodif2}. Nota-se que as diferenças percentuais para a transformação {IRmodif} são bem próximas de zero. A modelagem Box-Jenkins produziu as menores diferenças na série {IRmodif}. com o valor do MSE em 207. produzirem efeitos iguais para as duas modelagens. com 95% de confiança. 0.96.48%. log{IR} em log{IRmodif} e em log{IRmodif2}. a transformação {IRmodif2} aumentou a capacidade de previsão do método. As transformações logarítmicas das séries.aumentou em mais de 100%. deve-se rejeitar a hipótese nula que os parâmetros são individualmente nulos.1 mostra ainda que a modelagem HWS se adapta melhor à série original {IR}. -0. Em termos da diferença percentual agregada. A modelagem Box-Jenkins adapta-se melhor à série log{IR}. enquanto que para a outra transformação essas diferenças são próximas de 4%. Porém. Isso mostra que para os logaritmos a substituição do outlier diminuiu a capacidade preditiva dos métodos de alisamento exponencial e Box-Jenkins. deve-se comparar os valores absolutos calculados para a estatística t com o valor crítico de 1.14 e da tabela 5.27%.963. que corresponde ao nível assintótico da distribuição normal para 5% de significância.2. a modelagem HWS produziu as menores diferenças na série log{IRmodif2}.

modelos constantes da Tabela 4. os dois métodos de previsão. Assim. baseados no algoritmo de Holt-Winters sazonal e de Box-Jenkins. 77 . Por isso. Porém. a capacidade preditiva dos métodos de Box-Jenkins e alisamento exponencial foi comparada utilizando o critério do MSE. 1980]. apresentaram resultados muito parecidos entre si. tanto para valores de MSE quanto para as diferenças percentuais agregadas.3 mostra a percentagem de ocasiões que o método Box-Jenkins (BJ) superou o alisamento exponencial (HW) para previsões até 8 passos a frente. tais testes devem ser tomados com cautela. Em um estudo realizado por Paul Newbold e Clive Granger [Newbold & Granger. os testes de significância estatística não serão considerados. A Tabela 5. incluindo séries macro e microeconômicas sazonais e não-sazonais.2 . a escolha do método poderia ser feita em relação a características de simplicidade. Contudo. Então. nem sempre o método de alisamento exponencial produz previsões iguais ou superiores ao método de Box-Jenkins. a escolha mais óbvia seria o método de alisamento exponencial em detrimento ao método de Box-Jenkins. devido ao fato que o número reduzido de observações pode causar viés nas estimativas das variâncias [Ansley & Newbold. 5.Escolha do método de previsão Pelo explicitado na seção anterior. automaticidade ou praticidade no uso. 1974] com 106 séries econômicas (80 mensais e 26 trimestrais).14.

(b) Para séries com mais de 30 e menos de 50 observações não há muita certeza. e pode-se escolher entre Holt-Winters e modelos ARIMA. Mas isso é devido principalmente à influência das séries não-sazonais e. ao se considerar somente séries sazonais. deve-se utilizar modelos ARIMA. Ao se analisar mais detalhadamente as previsões um passo à frente.3 . nota-se que MSE de previsões ARIMA = 0. 1974]. Os autores sugerem ainda algumas regras que servem de base para decidir qual método de previsão escolher: (a) Para séries com até 30 observações o método de Holt-Winters deve ser utilizado. 78 .Percentagem (%) de vezes que BJ superou HW Passos à frente 1 2 3 4 5 6 7 73 64 60 58 58 57 58 8 58 Nota-se pela Tabela 5. (c) Para séries com mais de 50 observações. Caso o custo de previsão seja importante.3 que a metodologia de Box-Jenkins é claramente superior ao método de alisamento exponencial para previsões poucos passos à frente. se o custo de previsão não for importante. MSE de previsões HW Isso mostra que os erros de previsão do método Box-Jenkins são 20% inferiores aos erros do método de alisamento exponencial. Quando o horizonte de previsão é mais longo. a vantagem do método Box-Jenkins persiste a longo prazo [Newbold & Granger.8. deve-se utilizar Holt-Winters ou modelos AR.BJ:HW Tabela 5. a vantagem comparativa do método ARIMA diminui.

o modelo com menor BIC é um SARIMA(0.1)(0. Para as séries logarítmicas. conforme mostra a Tabela 4. conforme visto na seção 5. o valor do critério BIC deve ser utilizado. para a série {IRmodif}. nota-se que o modelo com o menor valor de BIC é um modelo SARIMA(0.1.1. Assim.10.Escolha de um modelo SARIMA Como na prática não se dispõe dos dados futuros para que o modelo com a melhor capacidade preditiva (menor valor de MSE) seja escolhido. nota-se que esses modelos apresentam valores 79 .7 unidades para um modelo SARIMA(0.0) com uma diferença de 0. para as três séries não transformadas em logaritmo. generalizando.1. o modelo airline não obteve um valor para o BIC competitivo. Assim.0) com uma diferença de 0.1.0). Ainda. o modelo com o menor BIC é o modelo airline.6.1).9 e 4. para todas as previsões dos tributos administrados pela Secretaria da Receita Federal.1.1)(0.1.5 unidades para um modelo SARIMA(0. Os modelos selecionados que possuem o menor valor do BIC são os das séries {IRmodif} e log{IRmodif}. ao se analisar as Tabelas 4. recomenda-se que a modelagem Box-Jenkins seja seguida para se fazer as previsões da série do Imposto de Renda e. Nota-se que. 5.3 .Então.6. para a análise do valor do BIC a transformação do valor do mês de março para o menor valor da série mostrou-se satisfatória. para a série log{IRmodif}.0.1. se em termos do valor do MSE as transformações no valor outlier tiveram pouco sucesso. analisando a Tabela 4.1)(0.1. Para as séries logarítmicas.1)(0.

as previsões para os impostos sobre a renda de Pessoas Físicas (IRPF). Para a série log{IRmodif}. aquele em que modelos mais simples sempre devem ser preferidos.1)(0.4 .0) é escolhido em vez do modelo airline. o modelo escolhido é um SARIMA(0.78B )ε t [0.1)(0.0.1. da série {IRmodif}. produziu uma ∆% agregada de -0.1. o modelo SARIMA(0.12] e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado.1. Desta maneira.0).1% para os modelos SARIMA da série {IRmodif}. A equação do modelo ajustado é dada por (1 − B )(1 − B12 )X t = (1 − 0.Resultados da previsão para outros impostos Com o objetivo de evitar repetições.11] t e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado.0).1.trab) não serão analisadas tão 80 . a escolha do modelo deve ser feita respeitando-se o princípio da parcimônia. produziu uma ∆% agregada de -0.41B )ε 12 t [0.48% e o modelo SARIMA(0. A equação do modelo ajustado é dada por (1 − B )X = (1 + 0.1.1.0). Então. apesar de a diferença em termos de BIC ser menor que 0. 5. Pessoas Jurídicas (IRPJ) e o imposto de renda retido na fonte .1)(0. da série log{IRmodif}.1)(0. respeitando-se o princípio da parcimônia.Rendimentos do Trabalho (IRRF. o modelo SARIMA(0.muito baixos para as diferenças percentuais agregadas.72%.0.

Porém.1.3.0)(0. de acordo com cada método de previsão. serão comparados aos obtidos por modelos SARIMA. que respeitem o princípio da parcimônia. a Tabela 5.961 60.94 -10.1) SARIMA(1. Assim.8 -8.detidamente quanto a previsão para o imposto de renda agregado. possuem o valor do MSE inferior ao obtido pelo método dos indicadores. Tais modelos foram escolhidos conforme os procedimentos apresentados na seção 5.1)(0.28 {IRPF} SARIMA(0.1.1)(0.1) Indicadores SARIMA(0.171 3. cerca de 1%.602 3.1)(0.1. a diferença dos valores do MSE para as duas previsões é desprezível.94 -9.23 -14.631 188.0) Indicadores SARIMA(0.0)(0. ou seja.26 -18.Comparação de resultados para as outras séries Índices Série Método/Modelo ∆% agregada ∆% média Indicadores -4.55 MSE 3.494 59.1.37 -8.1.2. Verifica-se também que os 81 . conforme mostra a Tabela 3.1.0) -2.1.64 -23.0) 0. log{IRPF}.14 -19. modelos com o menor valor do BIC. {IRPJ}. i.06 -9.4 . A única exceção é o modelo SARIMA(0.1.643 69.1)(0.0) da série log{IRPF}.4 que todos os modelos SARIMA possuem capacidade preditiva superior ao método dos indicadores.79 -2.75 -24.e. Os resultados obtidos pelo método dos indicadores.1)(0.418 104.1.0.1) SARIMA(0. Tabela 5.93 -15.70 -11.0.765 Nota-se pela análise da Tabela 5.725 117.1. log{IRPJ} e {IRRF-trab} e log{IRRF-trab}.1. {IRPJ} e {IRRF-trab} foram investigadas também as transformações logarítmicas para as mesmas.50 -5.84 log{IRPF} {IRPJ} log{IRPJ} {IRRF-trab} log{IRRF-trab} SARIMA(0.55 -8.4 mostra as previsões obtidas para as séries {IRPF}.1.. Além das séries do {IRPF}.

1. O modelo SARIMA(0.1. Os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados.1. ou resultado praticamente constante. Os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados. 82 .0) estimado para a série log{IRPF} possui equação de acordo com (1 − B )(1 − B 12 )X t = (1 − 0. As duas outras séries apresentaram ou resultado pior. com diminuição da capacidade preditiva em cerca de 13% para a série {IRPF}. nota-se que a utilização da transformação logarítmica trouxe resultados benéficos.84 B )ε t [0.5% para a série {IRRF-trab}.085] e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado.1.1)(0.081] e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado.valores das diferenças percentuais calculadas para os modelos SARIMA são bem inferiores que para o método dos indicadores.0) estimado para a série {IRPF} possui equação de acordo com (1 − B )(1 − B 12 )X t = (1 − 0.1)(0. O modelo SARIMA(0. em termos do MSE.81B )ε t [0. cujo valor do MSE foi reduzido em torno de 10%. somente para a série {IRPJ}. Além disso. com diminuição em torno 1.

24] e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado.63B 12 )ε t [0.45B 12 )ε t [0.1.1) estimado para a série {IRRF-trab} possui equação de acordo com (1 − B )(1 − B 12 )X t = (1 − 0.0.1.1. O modelo SARIMA(0.1) estimado para a série log{IRPJ} possui equação de acordo com (1 − B )X 12 t = (1 − 0. O modelo SARIMA(1. Os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados.97 B )(1 − B 12 )ε t [0.1. Os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados.11] [0. O modelo SARIMA(0.1) estimado para a série {IRPJ} possui equação de acordo com (1 − B )(1 − B 12 )X t = (1 − 0.17] [0.0)(0.0)(0.1)(0.1)(0.20] e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado.O modelo SARIMA(0.1.1. Os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados.0.62 B )(1 − 0.0) estimado para a série log{IRRF-trab} possui 83 .32] e os gráficos de diagnóstico sugerem a validade do modelo escolhido e ajustado.

o horizonte de previsão será reduzido para que os dois métodos de previsão. 84 . 5. Os métodos de previsão utilizados serão alisamento exponencial e método Box-Jenkins.11] = εt e os gráficos de diagnóstico sugerem a validade do modelo.1). As previsões serão feitas para 1 passo e 3 passos à frente para a série log{IR}. de forma que se utilizará a série com observações até janeiro de 2000 para prever o valor da arrecadação do mês de fevereiro de 2000 e com observações até março de 2000 para fazer previsões para os meses de abril.5 mostra os resultados obtidos para a previsão 1 passo à frente para cada método e a Tabela 5. conforme mostra a Tabela 4.59 B )(1 − B 12 )X t [0. O modelo para o método Box-Jenkins é um SARIMA(0.1. A Tabela 5. alisamento exponencial e Box-Jenkins.Previsões com horizonte reduzido Em conformidade com o estudo realizado por Paul Newbold e Clive Granger [Newbold & Granger.1)(0. que será medido pelo MSE. 1974].1. possam ser comparados em relação ao grau de acurácia.7. maio e junho de 2000.5 . Os valores entre colchetes representam os valores aproximados do erro padrão para os parâmetros estimados. que possui o menor valor para o critério do BIC para a série log{IR}.6 mostra os resultados para a previsão 3 passos à frente para cada método.equação de acordo com (1 − 0.

1.6 .54 21. 85 .Previsões geradas 1 passo à frente .62 0.6.1)(0.873 4. o que está de acordo com o estudo dos autores mencionados.455 4. a capacidade preditiva do modelo SARIMA é superior em cerca de 10% em relação ao método HWS.valores em R$ milhões Mês ∆% MSE Método/Modelo Fevereiro HWS 4.1.860 3.5.621 Valor arrecadado real 4.207 4. nota-se que o modelo SARIMA forneceu melhores previsões do que o método HWS.449 4.Previsões geradas 3 passos à frente . Ainda.481 SARIMA(0.43 477.1.5 . a diferença dos valores do MSE para os dois métodos é superior a 300%.713 Pela Tabela 5.1.Tabela 5. pois os valores da diferença percentual agregada e média são quase nulos para a modelagem BoxJenkins.545 SARIMA(0.28 413. Então.206 Valor arrecadado real Tabela 5.50 76. pois o valor da diferença percentual é menor para o modelo airline.088 0.1)(0. Pela Tabela 5.856 -5.1) 4.673 3.33 -5. em termos do valor do MSE. indicando que. Os dois métodos superestimaram a previsão mensal em torno de 15%. verifica-se que o modelo SARIMA possui características preditivas superiores ao método de alisamento exponencial.113 4.489 15.1) 4. Além disso. evidencia-se pela análise das duas tabelas que o método de Box-Jenkins produziu previsões superiores em relação ao método de alisamento exponencial para horizontes curtos de previsão.valores em R$ milhões Mês ∆% ∆% Método/Modelo MSE Abril Maio Junho agregada média HWS 4.897 16. em termos de precisão segundo o MSE. o modelo SARIMA é mais de 3 vezes preciso.

1) para a série log{IR}.713 86 . na qual a reta azul representa o valor real.54 21. Assim.873 4.957 4. Tabela 5.322 6.valores em R$ milhões Mês Nº de passos à frente do ∆% ∆% MSE modelo Abril Maio Junho agregada média 3 4.370 4. a reta vermelha a previsão com 3 passos à frente e a reta verde a previsão com 12 passos à frente.62 0. pode-se imaginar uma estratégia de revisão a cada bimestre ou trimestre à medida que novas observações vão sendo acrescentadas à série.113 4.33 6.7 mostra os resultados dessa comparação utilizando um modelo SARIMA(0. suponha que ocorra uma revisão em meados do final de 1º trimestre para ajustar as previsões efetuadas para o 2º trimestre. A Tabela 5.1)(0. nota-se uma clara melhoria em relação tanto ao valores das diferenças agregadas e médias quanto em relação ao valor do MSE.1.Além de se comparar os dois métodos de previsão.1 mostra graficamente tal comparação. que foram calculadas com um modelo com horizonte de 12 passos à frente. Ao se comparar os dados de previsão para os meses do 2º trimestre da Tabela 4.207 4.6. A Figura 5.088 0.7 .17 109.1.223 4. a redução do horizonte de previsão pode ser útil para se revisar e ajustar as previsões calculadas anteriormente.621 Valor arrecadado real 4.455 12 5. Por exemplo.9 com os dados da Tabela 5.Comparação entre previsões .

Figura 5.1 .Comparação gráfica da revisão da arrecadação 87 .

as modelagens trabalham com séries temporais univariadas. 1974]. e a metodologia de Box-Jenkins. poderia ser aprimorada econometricamente mediante a utilização da metodologia proposta neste estudo. Apesar de parecer paradoxal que as previsões obtidas com modelos mais simples possam gerar previsões mais precisas. 1972].Conclusão O objetivo principal desse trabalho foi aplicar métodos estatísticos e econométricos na busca de previsões mais confiáveis e mais acuradas para a arrecadação do tributo federal denominado como Imposto sobre a Renda. Existem também comparações entre os vários métodos de previsão com modelos univariados. os autores verificaram que a combinação de métodos de previsão pode gerar resultados tão ou 88 . principalmente a modelagem SARIMA. gerando previsões mais acuradas. Ao mesmo tempo. tal fato está bem estabelecido na literatura [Cooper. Os métodos estatísticos de previsão utilizados ao longo do trabalho foram o alisamento exponencial. ou seja. principalmente o algoritmo de Holt-Winters sazonal aditivo. buscou-se mostrar que o método atualmente utilizado pela Secretaria da Receita Federal. Tais métodos se mostraram superiores ao método de indicadores. conhecido como método de indicadores. sendo o principal estudo realizado por [Newbold & Granger. Nesse mesmo estudo. Os autores mostraram a superioridade da modelagem SARIMA em relação a métodos de modelagem automático. Um fato importante relacionado ao uso dessas modelagens é que sua utilização depende apenas dos dados históricos da série temporal em questão.6 .

Gourieroux & Monfort (1997). estudar os resultados da combinação do método de Box-Jenkins com o alisamento exponencial e verificar a precisão das previsões geradas. Além disso. fica aqui a primeira recomendação para um futuro trabalho. uma vez que a arrecadação de tributos é dependente de muitas variáveis econômicas. Porém. pode surgir a dúvida por que nessa comparação não foram utilizados também os resultados de uma regressão.5 pontos percentuais em relação a modelos de regressão. A comparação entre os métodos efetuada nesta dissertação teve como principal função a escolha de uma metodologia que pudesse ser aplicada para a previsão de todos os tributos federais. o que no caso de arrecadação tributária poderia gerar modelos subparametrizados ou superparametrizados. Tal fato poderia gerar modelos incorretamente especificados. em uma comparação entre a modelagem ARIMA e a modelagem de regressão. Assim. Primeiramente. mostraram que o erro relativo de previsão da modelagem ARIMA foi inferior 2.mais precisos que a utilização dos métodos individualmente. Essa combinação pode ser pensada como uma combinação linear entre os dois métodos. porque a modelagem de uma regressão requer um total conhecimento da relação entre as variáveis do modelo. de forma que os pesos associados ao métodos possam ser estimados. principalmente se o analista possuir pouca experiência com modelos de regressão. Assim. a escolha da metodologia Box-Jenkins foi amplamente amparada na literatura e no estudo de caso aqui exposto. 89 .

Ainda. Por fim. que permitiu reduzir o erro de previsão médio de 10% para 0. 90 . este trabalho mostrou que existem metodologias econometricamente mais apropriadas que fornecem previsões muito superiores e de uma maneira relativamente simples. no modelo ARIMA e estudar a classe de modelos ARMAX. com a metodologia ora proposta. apesar do trabalho de modelagem ser “artesanal” que poderiam complementar o método dos indicadores correntemente utilizado pela Receita Federal. para o período janeiro de 2000 a dezembro de 2000. o consumo de energia elétrica ou o comportamento da taxa de juros. uma vez que o primeiro não precisará de tantas variáveis em seu modelo e o segundo poderá tomar decisões mais realistas e precisas quando utilizar os resultados das previsões como instrumento de planejamento econômico. tais como o PIB. entre outras. cabe destacar que a utilização das técnicas aqui consideradas pode tornar o trabalho tanto do analista de previsões quanto do administrador mais eficaz. Neste sentido. como uma segunda sugestão para um futuro trabalho sugere-se incluir variáveis exógenas. depreende-se do estudo que a Secretaria da Receita Federal poderia aprimorar fortemente sua previsão de arrecadação.Portanto. em particular do Imposto de Renda.17% aproximadamente.

G.Referências bibliográficas [1] Ansley. New York: Academic Press. F.M. New York: John Wiley & Sons. & O’Connell.F..P. W. R. Forecasting and Control. (1986). [4] Brockwell. (1995). [8] Folha de S. Paulo edição de 17/05/1996. Em Hickman. Jornal Folha de S. Editoria Dinheiro.13. & Monfort.T.A. P. Applied Econometric Time Series. 2ª Edição. The predictive performance of quartely econometric models of the United States. P. & Davis. (2000). P. G. New York: Cambridge University Press. Método de Previsão de Arrecadação Tributária. (1972). R. Boston: Duxbury Press. New York: Columbia University Press. [10] Granger. R. San Francisco: Holden Day. Journal of Econometrics.J. Finite sample properties of estimators for autoregressive moving average models. Time Series and Dinamics Models. Introduction to Time Series and Forecasting. & Newbold. C. (1997). & Jenkins.E. (1970). Unified Concepts and Computer Implementation. G.W. (ed. 91 . C.J. A. (1996). páginas 2 a 4. Forecasting Economic Time Series. [5] Cooper. B. MIMEO [7] Enders. Paulo. NewYork: Springer-Verlag. [2] Bowerman.7 . Time Series Analysis.L. [9] Gourieroux.) Econometric Models of Cyclical Behavior. Time Series Forecasting. & Newbold. [3] Box.L. (1980). B. C. [6] Cribari-Neto. (1987). 159183.

G. R. (1974). T. Introduction to Business Statistics. B. R. & Judge. Griffiths. New York: Springer-Verlag.D.N.C. Journal of the Royal Statistics Society A. W. W. [15] Newbold.C. London: Arnold Publishers.[11] Hill. & Ripley... [13] Kvanli. & Pavur. (1999). Experience with forecasting univariate time series and the combination of forecasts. Econometria. [16] Venables.H. (1996).J. P. G. 4ª Edição. 131-146. 92 . G. Guynes.E. (1990). & Granger.W. St. Cambridge: Cambridge University Press. [14] Mills. A. (2001).Paul: West Publishing Company. Time Series Techniques for Economists.S.J. Practical Time Series. [12] Janacek. (1999). C. A Computer Integrated Approach. C. Modern Applied Statistics with SPLUS 3rd Edition. São Paulo: Editora Saraiva. 137.

Apêndice A 93 .

seasonal=list(order=c(P.d. D.arima0(serie.order=c(i.Q) { M<-matrix(0.1]<-NA else M[i+1.P. d.Este apêndice apresenta a função utilizada no R para a seleção de modelos com base nos valores do BIC.5) if(P==0 && Q==0) { for(i in 0:4) { for(j in 0:4) { if(i==0 && j==0) M[1.d.AIC<-M return(M) } 94 . para uma dada configuração inicial de P.D.j+1]<my.arima0(serie.order=c(i.5. uma matriz com o valor do BIC para diversas combinação de valores de p e q.j). Tal função foi adaptada de Cribari-Neto (2000) e calcula.D. Q.seasonal=list(order=c(P.j+1]<my. bic<-function(serie.Q)))$aic } } } M.j).Q)))$aic } } } else { for(i in 0:4) { for(j in 0:4) { M[i+1.D.d.

Apêndice B 95 .

Modelos e valores para o BIC da série log{IR} Modelo Modelo Modelo Modelo BIC BIC BIC (p.0) (1.4 (0.4 (1.2) Modelo (p.0.2) 906 (0.1.0.2) 881.1) (0.1.7 (1.3 (0.d.4 (1.0.1.q) (P.6 879.2) (1.D.1) (0.1 (0.1.0.1.d.1) (0.4 (1.1.D.2) (1.6 (1.9 887.1.2) 904.2 (1.1) (1.0) (0.d.1.1.4 863.1.1) 897.1) (2.6 (0.1.1.1.4 (0.1 874.1.1) 902.1) (1.1.1) (2.2) 879.6 (0.0.0.1.0) (2.0.1.1.0) (1.2) 902.0) (1.0) 859.1.1.1 (0.1) 886.1) (1.d.0.1.Q) (p.4 (0.d.0) (0.0) 881.q) (P.Q) (p.7 875.0.1 881.1) (0.2) 898.0.8 883.0) -10.7 -15 -14.0) (0.1.1) (1.1) (2.d.0) (0.1.0) (0.4 Tabela B.2) 883 (0.1.2) -14.4 Tabela B.1 (1.0) 874.0) (2.7 (1.1) (1.1.1 .1) (2.0.0.1.2 (0.0) 895.0.1) 898.6 (1.5 (1.1) (1.2) 875.9 (0.0.0) 898.0) 877.0) -14.2) (0.5 (0.1) 881.2) -10.D.1.1.0.0) 877 (0.1) (0.0.1.1.0) 896 (0.0.2) (1.1) 879.1.6 (0.Este apêndice apresenta os resultados do valor do critério de seleção de modelos BIC para cada série.1.0.2) (0.1.1) 894.1 BIC 861 861 863.1.q) (P.1) -10.3 881.0) (2.0.1 (0.1.7 (0.1) -16.d.1) 877.0) 859.q) (P.1) -10.0) 875.1.1.1) (0.2) -6.1.0) (1.1.1.0) (1.0) (2.5 (1.1.1.1) (0.1) (0.1.1) (2.0.7 (0.D.1.2 -14.0) (0.2) 900.1) (1.9 BIC -16.5 885.1.1.2 .1.8 (0.1) (2.Q) (p.1) (1.5 -14.0.1.0.1) (0.1) (2.1) -6.1) (2.Modelos e valores para o BIC da série {IR} Modelo Modelo Modelo BIC BIC BIC (p.d.D.0. d e aqueles modelos que possuem uma diferença de até dois para o BIC do modelo com menor BIC.1.Q) (p.1.0.0.1) (0.1.1.0. D.Q) (p.1) (1.0.1) (0.1.9 (0.1.9 (0.1.1) (1.0.0) (2.0) 873.1) (0.0.0.Q) (p.1.1.Q) 897.1) (1.1) (1.1) (2.0) -14.d.1) (1.Q) (1.1) (0.1.0) 859.1 (0.9 (0.1.0) (2.3 (1.2) (1.1) (1.1.0.1) (1.0.1) (2.0) (1.2) (0.1) 896.1) (0.0) (1.q) (P. Tabela B.1) -6.1.2) -5.1) (2.0.5 (1.0.2) -3.0) (0.0) (1.D.1) -12 (1.1) (2.1) (2.1) (1.0.0) -14.6 (0.1.1) (1.0.0.1.1.1.1.0.1) (0.0) 879.0) -9.2) (0.5 (0.q) (P.0.0) 893.0) 894.1 (1.1) (2.3 (0.1) -18.1) 898.q) (P.0.1.1) (2.1.1) 901.0.1 (0.2) -6.1.6 879.5 (1.0) (1.5 (1.0.1.0.0.0) (2.0.D.1.2 (1.9 (0.2 (0.0) (1.1.0.4 (1.D.0) (2.1) (2.5 (0.0) (0.9 (0.1.d.1.q) (P.1.1) (1.2) -2.0.1) (1.0.1.0.1.1.1.1.2) (1. Em cada tabela estão listados os modelos com o menor BIC para uma dada configuração inicial dos valores de P.1.8 96 .1.1) -14 (1.1) 898.D.4 (1.0.1 -2.4 (0.1.d.1.0.1) (1.0.1.1.1.1) (1.1.1.1.D.0) 896.4 (0.0) (0.1.1) (0.1.1.4 (1.0) (2.1) (0.1.0.1.1.1) (2.0) -11.0.0) 879.1 -6.0.0) (1.0) (1.1.0) (1.0) 872 (0.1.0) (0.1.2) (0.1) (2.0.0) (1.1.1.1) (2.1) (1.1) (1.1.3 .0.0.1) (1.0.8 (0.2) 890.1.7 (0.0) 898.4 (1.Q) (p.8 (1.1) (1.2) (0.d.4 (0.1) (2.1.0) -13.1.1.2) (0.1) 880.1.1) 857.0.8 (1.Q) (0.2) 879.1.1.1) (0.1.0) BIC 873 877.0.1.2 (0.Q) (p.0) 881.0.1) (1.0) (0.0) (1.3 (0.0.q) (P.1.2) (1.1) -7.4 -10.3 (1.1.1) (0.1.0) (1.4 (0.1.0.2) 883.1.1) (0.1.D.0) (1.0.1 (1.1.2 (0.Modelos e valores para o BIC da série {IRmodif} Modelo Modelo Modelo Modelo BIC BIC BIC (p.1) 875.1) (0.1.1.1.0) (2.0) -11.0.1) 884.1) 859.1.1) 876.0) 860.1.1.1) (1.1) (1.1) 902.0.1 (1.0.0.1) (1.6 (1.2) 892 (1.1 (0.1.6 (0.1.0) -13.1) (2.1.Q) (1.0.2) 889.1.7 (1.q) (P.1.1.1.1) (0.1.1.0.7 (1.1) 860.1) (1.D.4 (0.0.1) (1.0) (2.0) 857.0.1.1.q) (P.1.1) (1.1.1.0) -14.9 (0.2) (0.1.3 (0. Q.q) (P.3 877.1) (1.2 -10.2) (0.0.1.1) (0.2 (0.0) (2.0.9 (0.1.

0.0.0) -25.1) -29.8 -17.8 (1.1.1.2) (1.1) (1.3 (0.7 (0.1.0.1.6 871.1.1.1) (1.2) (0.0.1.1) -20.D.1.1) (1.1) (0.1) 888.1.0) (1.1.Tabela B.2) (0.1.3 (1.1.7 (0.6 (1.0) -24.0.2) 892.0.q) (P.1.2) (1.1.1.1.1) -16.1) -24.0) (1.Q) (p.2) -19.7 (0.2) (2.2) (1.1.d.1.0) (0.1.2) 884.d.9 865.7 (1.1 -23.1) -21.1.1) (0.1) (1.1.3 -28.6 (0.2) 893 (0.2) -26.1.0.1 (1.1) (2.2) -19 BIC 869.0.1) (1.6 (0.1.1.1.7 871.1.1.1.1.1.2 (0.4 -18.0) 879.q) (P.1) (0.1.q) (P.2 -27.9 869.2) (1.8 (0.1) -20.1.1) 880.0.Modelos e valores para o BIC da série log{IRmodif} Modelo Modelo Modelo Modelo BIC BIC BIC (p.1) 888.1) (1.0.9 -20.0) (1.6 867.2) -16.7 (1.1) (1.0) 881.1) (0.d.0.1) (0.0.1.1.1) (1.1.0) (0.1.1.2) -20.1) (0.1) (0.1.2) 884 (1.2) (1.1.2) (1.1.1.1.1) (2.1) 884.5 .0.9 (1.d.1) (2.0) -23.0) (1.0.1) -28.1) (2.0.2) (1.2) (0.0.0) 863.1.1.1.6 (1.1.1) (1.0.Q) (1.0.1) (2.1) (1.1) -16.1) (1.1.0.0.1) (1.2) -21.8 (1.1.1) (0.1.1) (0.2) -23.1.1) -25.1.1) (0.2) 888.0) -26.D.1) -29 (0.0.1.1) -24.1.0) -30 (0.2) -17.2) (1.3 (0.0) 864.1.2) (0.1.0.1.4 .1.q) (P.1) (0.0.1) (2.1.1.1.0.Q) (p.Q) (p.1.2) (0.0) 879.1) (2.2) (1.1.0.0.7 (1.0.1) (0.1.5 (1.0.1 (0.1.1) (2.1) (0.0.3 (0.1.0) 884.9 (0.1.0.1.1.1.3 (1.0) (0.7 (0.0) (2.0) (0.2) -16.1.1.1.1) (2.1.2) (1.6 (1.1.1.2) -26.6 (0.0) -24.1.1.2) (1.0) (0.1.1) (2.Q) (p.0) 866.0) (0.1) (2.0) (2.1.7 (1.0) (1.1) (0.1) (2.1.5 (1.d.1) 867.0) -23.1) (0.8 (0.1.0.7 (1.1.1) (0.8 (1.1) -30.1) (1.1) -20.1.0) -28.0.2 (0.D.1.1.1) (0.1) (2.6 (0.1.1) (2.0.3 (1.1.1.1.0.2) (0.0.1) (0.1.1.0) -30.8 BIC -16.1) (1.1.1.D.1.1.2) (0.0.2) 865.1) (1.0.1.q) (P.1.1.1) (1.6 .1.1.d.2) 888.D.1) (1.2) (2.1 -22.1.0) -30.0) (0.5 (1.2 (1.1) (0.1.7 867.0) -20.1.D.Q) (p.1) (2.3 (0.0) -26.4 (0.1.D.9 (0.7 875.5 (0.1.1.Q) (1.0.6 (1.2) -24.1.0) (2.8 -22.Q) (p.1) 880.0.2) -12.0) (2.0) (2.5 (1.2) 867.1) (0.1.1.0.9 (0.D.1) (0.1.1) -23.1) (0.1) (1.1) (0.1) (1.0.2 -28.0.1) (2.7 (1.1.0.1.0) (1.0) (1.1.1) -27 (1.1.1.0) -32.1.0.4 (0.d.2) (2.1) -30.0) (1.1.0.0) (0.1.1) (1.6 (0.1) (1.0.9 (0.1.1.0) (1.0.2) (0.1.3 (0.1) -24.D.1.1.1.0) -19.1.1.2) (2.1) 863.1) (1.1) (1.1.0) (2.1.1.1.8 873.1) (1.1) (1.1) (1.1.1.2) -16.1.1) (1.1.0) (2.1) (1.D.0) (0.8 (1.6 (0.0) (1.2) -21.0) -31.1) -23 (1.0) 864.0.0) -24.1.1.7 -25 -24.D.0) (2.q) (P.2) (1.1) -28.0.2) (2.5 (1.2) (0.1.1) -22.0.4 (0.0.1) (1.1) (1.0) 885.1.1.2) BIC -28.D.1) (0.2) -20.d.0.7 (1.1.1.2) 867.1) (1.1 (1.1.1) (0.1.4 (2.6 (1.0) 864.1.7 (0.1 (1.9 (1.8 -13 97 .1) (0.Q) (p.0.1.Q) (1.8 (0.1.8 (1.1.9 (0.1) -26.0.1.1.1) 861.0) (2.0) 866.9 (0.1.1) 884.1.0.1.1.1.1.1 (0.2) -28.0) -29.0) 880.5 (0.1) 863.Modelos e valores para o BIC da série {IRmodif2} Modelo Modelo Modelo Modelo BIC BIC BIC (p.d.1) (2.1) (2.4 (1.1.1.1.1.2 (0.8 (0.1.1.2) -22.1.9 -22.0) -25.1) (2.2) (1.1) (2.1) (1.1.q) (P.1) (0.1.7 (0.1) 867.1.1.1.0) (1.0.1.0) (1.1.Q) (p.0.2) (1.q) (P.2) (1.8 (1.2 (1.2) (0.0) -24.1.1.2) (1.1.1) -20.0) -23.2) -20.1.Modelos e valores para o BIC da série log{IRmodif2} Modelo Modelo Modelo Modelo BIC BIC BIC (p.9 -14.1.d.6 -20 Tabela B.0.q) (P.7 871.8 (0.0.1.1) (1.6 (0.1.1.9 Tabela B.1.2) -13 (0.7 (0.1) (0.q) (P.1.2 (0.0.q) (P.5 (1.5 (0.1) (2.2) (0.4 -22.2 (0.1) (0.q) (P.0.2) (1.0) (1.1.4 (1.3 (0.1) (2.0) -25.0.1) (2.0) -28.1.6 (1.1) (1.1.d.2) (1.1 (0.4 (0.0.0) -32.1.1) (0.1.0.0) -27.1.1.2) (2.5 (0.d.6 (0.1) (0.9 (1.1) 865.2) -20.Q) (p.0.6 (0.9 (0.1.5 (0.1.1.

Sign up to vote on this title
UsefulNot useful