You are on page 1of 13

1 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro

2. Jogos Dinmicos com Informao Completa


1


2.1. Jogos Repetidos
2.2. Jogos Repetidos

Em alguns processos de interao estratgica os jogadores se encontram repetidamente
ao longo do tempo, enfrentando a mesma situao cada vez que se encontram. Tais processos
so analisados como jogos repetidos.
Como se desenrolam no tempo, podemos pensar em tais jogos como um processo que
envolve vrias etapas e constituem assim uma histria. Um fato importante sobre essa
estrutura de jogos que a histria de conhecimento comum dos jogadores.
Embora os jogadores conheam as decises tomadas em etapas anteriores do jogo, suas
decises so tomadas sem o conhecimento sobre o que os demais jogadores esto decidindo
na etapa atual. como se cada etapa se apresentasse como um jogo simultneo.

TEORIA
Pode-se definir que um jogo repetido caracterizado por um jogo base, denotado por G,
que geralmente um jogo na forma normal, e que repetido um nmero T de etapas (podendo
T ser finito ou infinito). Cada etapa = 0, 1, , corresponde a um perodo ou um estgio do
jogo. O jogo resultante denotado por G
T
ou ainda G

, quando se trata de um jogo infinito


(um superjogo).
Uma forma genrica de se descrever o jogo semelhante a forma extensiva, em um
diagrama de rvore como segue abaixo. O n inicial corresponde ao jogo base G e dele partem
ramos para novos estgios do jogo. Cada ramo corresponde um diferente perfil de estratgias
que pertence ao espao de estratgias do jogo base.
Cada escolha de um perfil de estratgias em um jogo base ir constituir uma histria
distinta do jogo no perodo seguinte. A histria do jogo em um determinado perodo dada
pela sequncia de aes

= {
0
, ,
1
} . Tambm deve-se considerar que h tantos
subjogos se iniciando em uma dada etapa do jogo repetido finito quantas forem as possveis
histrias do jogo at aquela etapa [Fiani, 2009].


1
Notas relativas s aulas de Microeconomia III nos cursos de Economia e Finanas no Campus de Sobral da
Universidade Federal do Cear. Trata-se de um texto em desenvolvimento e, portanto, preliminar. Sugestes sero
bem vindas e podero ser enviadas para o autor [vitormiro@gmail.com].

2 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro


Figura 1.

Considere um jogo com estrutura semelhante ao Dilema dos Prisioneiros representado
na seguinte matriz de payoffs:

Jogo base cooperar (C) ou no cooperar (NC).
Jogador 2

Jogador 1
4, 4 0, 5
5, 0 1, 1

Essa matriz representa o jogo base, jogado em um momento = 0 . Como j
conhecemos o Dilema dos Prisioneiros, sabemos que os jogadores escolhem simultaneamente
as aes e , que constitui um equilbrio de Nash (estrito) em estratgias puras para esse
jogo.
Em = 1, a histria do jogo um perfil de estratgias para o jogo, indicando a ao de
cada jogador em = 0. Para esse jogo particular, em = 1 existem quatro histrias:
(, ), (, )(, ) e (, )

3 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro
A partir de cada uma dessas histrias inicia um subjogo em = 1; temos um subjogo
que se inicia a partir de (, ), outro a partir de (, ), etc. Uma estratgia deve descrever a
ao do jogador em = 0, e a ao a ser adotada em cada uma dessas quatro histrias (ento
cinco aes devem ser determinadas).

Uma forma didtica para representar as histrias e os subjogos na seguinte tabela:
Resultado da
primeira etapa
Jogador 1
Jogador 2
Coopera No Coopera
Subjogo a partir de
(, )
Coopera 8, 8 4, 9
No Coopera 9, 4 5, 5
Subjogo a partir de
(, )
Coopera 9, 4 5, 5
No Coopera 10, 0 6, 1
Subjogo a partir de
(, )
Coopera 4, 9 0, 10
No Coopera 5, 5 1, 6
Subjogo a partir de
(, )
Coopera 5, 5 1, 6
No Coopera 6, 1 2, 2

Observe que os resultados especificados nessa tabela so obtidos pela soma dos payoffs
das duas etapas. Em negrito esto sinalizados os equilbrios de Nash em cada subjogo. Isso
nos permite identificar que h somente uma combinao de estratgias que constitui um
equilbrio de Nash em todos os subjogos: (, ). Sendo assim, esse perfil de estratgias
tambm constitui o equilbrio de Nash perfeito em subjogos para o Dilema dos Prisioneiros
em duas etapas.
Uma forma de especificar a estratgia dos jogadores nessa segunda etapa denotada
por:
{ (, ), (, )}
Essa forma de indicar o resultado do jogo explicita a questo de que o jogo depende da
sua histria, que de conhecimento comum.
Vamos considerar o jogo na forma extensiva.
De modo geral, uma estratgia para um jogador atribui uma ao para cada conjunto de informao. De
modo geral, uma estratgia prev uma ao para cada perodo, contingente histria do jogo. Em um
jogo repetido por T perodos e para o qual cada jogador possui s aes em cada etapa do jogo, existe um
conjunto de informao inicial,
2
conjuntos de informao na segunda etapa,
4
conjuntos de
informao na terceira etapa, ..., e
2(1)
conjuntos de informao na etapa T.


4 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro

Figura 2.

Representando dessa forma fica bastante evidente que a partir de cada histria possvel
se inicia um subjogo. E como vimos, h somente um equilbrio de Nash em cada subjogo:
{, }. Por constituir um equilbrio em todos os subjogos, {, } um equilbrio
perfeito em subjogos. Esse resultado tambm facilmente obtido aplicando o princpio de
induo retroativa.
No mera coincidncia que o equilbrio de Nash perfeito em subjogos se fundamenta
na repetio do equilbrio de Nash no jogo-base. Este resultado vlido para qualquer jogo
com estrutura simular ao Dilema dos Prisioneiros, tanto para jogos com duas repeties como
este, como para jogos com uma quantidade maior de repeties, desde que o jogo seja finito,
ou seja, tenha um prazo definido, e este nmero de repeties seja de conhecimento comum
dos jogadores.
Esse resultado representa uma proposio importante na anlise de jogos repetidos
finitos que afirma: se o jogo-base G que repetido em um nmero finito de etapas possui um
nico equilbrio de Nash

, ento o jogo repetido ter um nico equilbrio de Nash perfeito


em subjogos em que

jogado em cada etapa, independente da histria do jogo.


Uma questo inquietante que se coloca em um jogo repetido a possibilidade de
cooperao entre os jogadores. Em um Dilema dos Prisioneiros, o resultado obtido a partir do
equilbrio de Nash no eficiente no sentido de Pareto, ou seja, existe um perfil de estratgias
em que os jogadores poderiam melhorar sua situao.
Uma situao econmica bastante analisada por essa tica a formao de coalises em
mercados oligopolistas. Vamos considerar um exemplo.


5 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro

EXEMPLO: Duoplio de Cournot e coaliso.
Um dilema comum presente em uma situao de oligoplio envolve a cooperao entre as
firmas. As empresas podem estabelecer uma forma de cooperao definindo preos ou
quantidades em nveis monopolistas, elevando conjuntamente os lucros. No entanto, aps o
estabelecimento do contrato, existe um incentivo trapaa. Fiani (2009) retrata bem essa
questo ao falar sobre o problema da tica entre ladres.
Para ter uma ideia melhor dessa situao considere um mercado dominado por duas empresas
que definem, sem conhecimento contemporneo da deciso da concorrente, a quantidade a ser
produzida de um produto homogneo.
A curva de demanda do mercado :
= 80
1

2

As duas empresas possuem custos dados por uma funo

= 20

.
O lucro da Empresa 1 dado por:

1
= (80
1

2
)
1
20
1

E a condio de maximizao do lucro da Empresa 1:
60 2
1

2
= 0
E a funo de reao dessa empresa :

1
= 30
1
2

2

Como o problema da Empresa 2 anlogo, sua funo de reao dada por:

2
= 30
1
2

1

Resolvendo o sistema composto por essas duas equaes:

1
=
2
= 20
A partir dessa informao sobre as estratgias de produo, podemos calcular o preo do
mercado e os lucros obtidos pelas empresas.
= $40

1
=
2
= $400


6 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro
Considere agora que as empresas decidem cooperar. Nesse caso, as elas decidem a quantidade
produzida da mesma forma que um monoplio. O lucro conjunto das empresas dado por:
= (80 ) 20
Tal que
= 30
1
=
2
= 15

O preo do mercado agora de $50. E o lucro obtido pelas empresas :

1
=
2
= $450
Quando uma das empresas trapaa, ele opta por produzir a quantidade de equilbrio de
Cournot-Nash deixando a outra produzindo a quantidade de monoplio. Supondo que a
Empresa 1 se desvie do conluio e a Empresa 2 no, o preo do mercado passa a ser dado por:
= 80 20 15 = $45
Assim, os lucros das empresas so dados por:

1
= (45 20) 20 = $500

2
= (45 20) 15 = $375

Essa situao estratgica representada pelo seguinte jogo na forma normal,
explicitando os lucros das empresas:
Em = 0 Empresa 2
Coopera (N) No coopera (NC)
Empresa 1
Coopera (N) 450, 450 375, 500
No coopera (NC) 500, 375 400, 400

Com esse resultado, fica bastante evidente a existncia de um incentivo ao desvio do
conluio. Da mesma forma que no Dilema dos Prisioneiros, o equilbrio de Nash dado pelo
perfil de estratgias {, }. Se esse jogo repetido mais uma vez, no segundo estgio do
jogo, o equilbrio dado por:
{(, ), (, )}





7 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro
---------------------
Com informao perfeita e completa, e no caso em que o jogo se repete periodicamente,
os jogadores podem vislumbrar uma situao de cooperao. No jogo como apresentado
acima, a cooperao pode resultar em um retorno maior para ambos os jogadores, do que
aquele obtido em equilbrio. No entanto, existe um grande incentivo para burlar uma
eventual cooperao, pois se o outro jogador optar por {cooperar}, a melhor resposta {no
cooperar}.
Como os jogadores so racionais, a cada etapa do jogo cada jogador faz sua escolha
considerando as consequncias que essa escolha ter para o futuro do jogo. Assim, a induo
retroativa se torna a melhor forma de analisar esse tipo de jogo. Considerando o segundo
estgio como o estgio final do jogo, e cada jogador tomando sua deciso simultaneamente, o
equilbrio ser dado por: {, }.
No havendo razo para cooperao na segunda etapa do jogo (etapa final), j que no
h nenhuma interao futura que justifique a cooperao, os jogadores no veem razo para
cooperar no primeiro estgio do jogo (ou nas etapas anteriores).
Esse mesmo resultado se observaria se jogo tivesse > 2 repeties. Em um jogo
finito, do tipo dilema, no temos razo para acreditar que os jogadores iro cooperar.
Se o jogo jogado um nmero finito e definido de vezes, pelo princpio da induo
retroativa (visto anteriormente), no haver cooperao.

A hiptese de que um jogo possui um nmero de repeties definido, e que isso de
conhecimento comum dos jogadores, no adequada para tratar uma srie de interaes
estratgicas na economia. Um modelo mais adequado para esse tipo de anlise o de jogos
infinitamente repetidos [Fiani, 2009].

Jogos repetidos infinitos
Estabelecer que diversos processos estratgicos so repetidos por um prazo finito parece
bastante razovel, afinal, no vivemos para sempre. Mas na maioria dos contextos no
razovel presumir que os jogadores sabem exatamente quando esses encontros vo acabar.
Embora a hiptese de repeties infinitas possa no parecer realista (pois as pessoas no
vivem para sempre), jogos infinitamente repetidos so teis para a modelagem de algumas
situaes em que os jogadores no conhecem o prazo final do processo de interao, o que na
verdade bem mais realista. Em um horizonte indefinido podemos pensar que h sempre uma
chance do jogo continuar.
A aplicao da estrutura de jogos repetidos infinitamente tambm til pois permite a
anlise de uma ampla possibilidade de interaes com diferentes tipos de estratgias.
Lembrando que uma estratgia em um jogo repetido designa uma ao para cada etapa do
jogo.

8 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro
Infelizmente, em um jogo com repeties infinitas, a aplicao do processo de induo
retroativa no vlida, pois no h um subjogo final para iniciar a anlise. Ainda assim,
possvel determinar se algum perfil de estratgia ou no um candidato para tal equilbrio.
Em um jogo infinitamente repetido, no se pode simplesmente somar os payoffs de cada
etapa como fizemos anteriormente, pois com payoffs diferentes de zero a soma torna-se
infinita. A avaliao de jogos infinitamente repetidos bastante facilitada pela considerao
dos valores descontados do fluxo de payoffs futuros, ou seja, o valor presente dos payoffs.
=
1

=1

)
O fator de desconto est associado a uma taxa de desconto da seguinte forma:
=
1
1 +
, 0 < < 1
Tal que, se = 0,05 (= 5%) , o fator de desconto ser dado por:
=
1
1,05
= 0,9524

A considerao de uma taxa de desconto incorpora um fator comportamental ao levar
em conta na anlise as preferncias intertemporais dos jogadores. Uma taxa de desconto muito
elevada significa que os jogadores valorizam muito pouco uma resultado futuro relativo a um
resultado hoje. Nesse caso, comum dizer que os jogadores que preferem uma taxa de
desconto elevada so impacientes. Por outro lado, uma taxa de desconto relativamente baixa
indica que os jogadores valorizam os resultados futuros.
Alternativamente, o fator de desconto pode incorporar a incerteza dos jogadores quanto
a continuidade do jogo. Dessa forma, representa a probabilidade do jogo continuar ou no,
avaliado em cada etapa.
Considere novamente o jogo com uma estrutura similar ao Dilema dos Prisioneiros.

EXEMPLO: Dilema dos Prisioneiros infinitamente repetido.
Jogo base cooperar (C) ou no cooperar (NC).
Jogador 2

Jogador 1
4, 4 0, 5
5, 0 1, 1


9 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro
Considerando que o jogo siga sem cooperao teremos que o valor presente dos payoffs
dos jogadores dado pela soma dos elementos de uma srie geomtrica infinita
2
:
1 + 1 +
2
1 + =
1
1

Considere agora que ambos os jogadores optam por cooperar e que eles mantm a
cooperao indefinidamente
3
. Assim, teremos que o valor presente dos payoffs dos jogadores
ser dado por:
4 + 4 +
2
4 + =
4
1

Como j sabemos, em um jogo repetido, uma histria, em uma determinada etapa
uma sequncia das estratgias e resultados do jogo nas etapas, 0, 1, . . . , 1. Uma histria em
um perodo pode ser denotada como = (

,
1
, ,
1
), em que

o resultado do jogo
na etapa

. Por exemplo, no Dilema dos Prisioneiros com = 2: = ( , ) ( , ).
Uma estratgia em um jogo repetido determina uma ao em cada etapa do jogo para
cada histria e para cada . O ponto importante que a ao a ser tomada em pode variar de
acordo com a histria do jogo at aquela etapa.
Vamos avaliar alguns tipos de estratgias usuais para o Dilema dos Prisioneiros
repetidos. Alm das estratgias simples de cooperar (C) e no-cooperar (NC), podemos pensar
em uma infinidade de combinaes de estratgias. E em cada caso, a avaliao se far de forma
particular.
Duas estratgias bastante relatadas na literatura so: grim trigger e tit-for-tat.

- Grim trigger (estratgia de gatilho)
A estratgia grim trigger uma aplicao da estratgia gatilho. Uma estratgia gatilho
um tipo de estratgia estabelece que, para o jogador que a adota, seguir um curso de ao
enquanto uma determinada condio satisfeita e, caso essa condio em qualquer momento
deixe de ser satisfeita, seguir outro curso de ao pelo resto do jogo [Fiani, 2009].
Esse tipo de estratgia considerado como estratgia severa, em que o jogador que a
adota decide por cooperar desde que o outro coopere, mas se em algum momento esse outro
jogador deixa de cooperar, aquele que adotou a estratgia grim trigger no ir cooperar mais
pelo restante do jogo.
Considere o perfil de estratgias (grim, grim). Existem duas possveis histrias que
devem ser consideradas para esse perfil:

2
Denotando = 1 + +
2
++

+. Em particular, o total a partir do segundo termo = +


2
++

+. A diferena entre as duas somas 1, ou seja: = 1 (1 ) = 1 =


1
(1)
.
3
Conhecida como cooperao ingnua em que o perfil de estratgias (, ) sempre adotado.

10 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro
1. Cooperao: os jogadores cooperam desde o incio do jogo.
2. No-cooperao: em algum momento um dos jogadores optou por no-cooperar e a
cooperao mutua no foi mais praticada.
Considere a histria de cooperao em alguma etapa . Se ambos os jogadores
cooperaram de acordo com a estratgia (grim, grim), em +1 eles vo manter a trajetria de
aes e tambm nos estgios seguintes. O valor presente do fluxo de payoffs em ser dado
por:

= 4 + 4 +
2
4 +
3
4 + =
4
1

Se qualquer jogador optou por no-cooperar em ou em algum perodo anterior, seu
concorrente no ir mais cooperar (por sua estratgia severa), e ambos passo a receber 1 a
partir de +1. Digamos que a ao de no-cooperar foi executada em , o valor presente nesse
estgio ser dado por:
- Para o jogador oportunista que realizou a ao de no-cooperar:

= 5 + +
2
+
3
+ = 5 +

1

- Para o jogador que manteve a ao de cooperar:

= 0 + +
2
+
3
+ =

1


Partindo da histria de cooperao {, }, est ser mantida se:
4
1
> 5 +

1

Resolvendo para o fator de desconto :
>
1
4

Assim, se o fator de desconto for superior a 0,25 no existe um incentivo para algum
jogador agir de forma oportunista. Por outro lado, se o fato de desconto for inferior a este
valor, torna-se mais vantajoso a estratgia de no cooperar quando o outro adota a estratgia
de gatilho.
Considerando o valor presente das possveis sequncias de payoffs a partir do jogo-base,
e a adoo da estratgia grim trigger por ambos os jogadores, podemos organizar a seguinte
matriz:


11 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro
Jogador 2

Jogador 1

4
1
,
4
1

1
, 5 +

1

5 +

1
,

1

1
1
,
1
1


Partindo do perfil de estratgias {, }, possvel verificar que este tambm um
equilbrio de Nash para o jogo.
Considerando as duas possveis histrias, um perfil de estratgias (grim, grim) para um
fator de desconto superior a 0,25 um equilbrio de Nash perfeito em subjogos.

- Tit-for-tat (olho-por-olho)
Um jogador seguindo uma estratgia tit-for-tat cooperar desde que seu oponente
tambm esteja cooperando e mudar para uma estratgia no-cooperativa se seu oponente
mudar de estratgia. Trata-se de uma estratgia mais branda que a grim trigger.
A estratgia tit-for-tat define que a ao em +1 depende apenas da ao tomada em
. Se ambos os jogadores decidiram por essa estratgia e {, } o perfil de estratgia em ,
ento em +1 as aes sero de {, }, tal que o valor presente em dos payoffs ser de

=
4
1

Mas se {, } foi jogado em , ento desde que ambos os jogadores adotaram a
estratgia tit-for-tat, a sequncia de aes a partir de +1 ser:
{, } {, } {, } {, }
Com valor presente em dado por:

= 5 +0 +5
2
+0 +5
4
+ =
5
1
2
, para o Jogador 2 (que no cooperou em ), e

= 0 +5 +0 +5
3
+ 0 + =
5
1
2
, para o para o Jogador 1 (que cooperou em ).
Sintetizando:
{
5
1
2
,
5
1
2
}
Similarmente, se {, } foi jogado em :
{
5
1
2
,
5
1
2
}

12 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro
Se, {, } foi jogado em :
{
1
1
,
1
1
}

Com estes resultados podemos montar a seguinte matriz:
Jogador 2

Jogador 1

4
1
,
4
1

5
1
2
,
5
1
2


5
1
2
,
5
1
2

1
1
,
1
1


Para verificar se o perfil de estratgias (tit-for-tat, tit-for-tat) um equilbrio de Nash
perfeito em subjogos, duas possveis histrias que devem ser consideradas para esse perfil:
1. Cooperao: os jogadores cooperam desde o incio do jogo.
2. No-cooperao: em algum momento um dos jogadores optou por no-cooperar e a
cooperao mutua no foi mais praticada.
Considerando que, em = 0, o perfil de estratgias (tit-for-tat, tit-for-tat) prescreve
{, }. Assim, {, } ser um equilbrio de Nash se:
4
1

5
1
2

Ou seja:

1
4


Considerando que, em = 0, o perfil de estratgias (tit-for-tat, tit-for-tat) prescreve
{, }, devemos ter {, } em = 1. Isso requer que {, } seja um equilbrio de Nash,
o que s ocorre se:
5
1
2

4
1

Ou seja, o oposto da restrio prvia.



13 MICROECONOMIA III (Teoria dos Jogos) Vitor Hugo Miro
Com isso, o perfil de estratgias (tit-for-tat, tit-for-tat) no um equilbrio de Nash
perfeito em subjogos, ao menos que:
4
1
=
5
1
2
ou =
1
4
.

Os perfis de estratgias (grim, grim), (coopera, coopera) e (tit-for-tat, tit-for-tat) podem
conduzir para a mesma sequncia de aes:
{(, ), (, ), (, ), }
No entanto, so perfis de estratgia bastante distintos. De fato, a cooperao ingnua
(coopera, coopera) no , nem mesmo, um equilbrio de Nash. O perfil de estratgias (grim,
grim) um equilbrio de Nash perfeito em subjogos, para valores de relativamente altos. E
por outro lado, o perfil (tit-for-tat, tit-for-tat) um equilbrio de Nash para valores de
relativamente altos, mas no perfeito em subjogos.


Teorema Popular (Fiani)