You are on page 1of 143

Notas em Teoria dos Jogos e Informaçãoy

Guilherme Hamdan
Departamento de Economia, PUC-Minas e EPGE/FGV
Emanuel Ornelas
Departament of Economics, University of Georgia, USA

13 de novembro de 2006

Sumário
1 Introdução 3
1.1 O Que é Um Jogo? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Os Elementos Básicos de Um Jogo . . . . . . . . . . . . . . . . . . . . . 7

2 Jogos Estáticos de Informação Completa 11


2.1 Representação de Jogos Estáticos de Informação Completa: Forma Nor-
mal ou Estratégica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Resolução de Jogos Estáticos de Informação Completa . . . . . . . . . . 17
2.2.1 Estratégias Estritamente Dominantes . . . . . . . . . . . . . . . 18
2.2.2 Estratégias Estritamente Dominadas . . . . . . . . . . . . . . . . 21
2.2.3 Estratégias racionalizáveis (análise de "melhores respostas") . . . 27
2.3 Equilíbrio de Nash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.1 Estabilidade, existência e unicidade do equilíbrio de Nash . . . . 32
2.3.2 Equilíbrio de Nash e Eliminação de Estratégias . . . . . . . . . . 35
2.3.3 Equilíbrio de Nash com três jogadores . . . . . . . . . . . . . . . 38
2.3.4 Discussão do conceito de equilíbrio de Nash . . . . . . . . . . . . 39
2.4 Estratégias Mistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.5.1 Oligopólio de Cournot . . . . . . . . . . . . . . . . . . . . . . . . 56
2.5.2 Oligopólio de Bertrand . . . . . . . . . . . . . . . . . . . . . . . . 67
2.5.3 Oligopólio de Bertrand com bens diferenciados . . . . . . . . . . 69
2.5.4 O problema dos comuns . . . . . . . . . . . . . . . . . . . . . . . 71
Preliminar e incompleto. Gentileza não citar sem a permissão expressa dos autores.
y
Todos os direitos reservados.

1
3 Jogos Dinâmicos de Informação Completa 74
3.1 Forma Extensiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2 Indução Retroativa: jogos de informação completa e perfeita . . . . . . . 77
3.3 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.3.1 O modelo de Stackelberg . . . . . . . . . . . . . . . . . . . . . . 85
3.3.2 Barganha sequencial . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.4 Equilíbrio Perfeito em Subjogos . . . . . . . . . . . . . . . . . . . . . . . 92

4 Jogos Repetidos 101


4.1 Jogos repetidos …nitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.2 Jogos repetidos in…nitamente . . . . . . . . . . . . . . . . . . . . . . . . 107
4.3 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.3.1 Duopólio de Cournot repetido in…nitamente . . . . . . . . . . . . 112
4.3.2 Política Monetária Temporalmente Consistente . . . . . . . . . . 114

5 Jogos bayesianos estáticos e equilíbrio bayesiano de Nash 118


5.1 Cournot sob informação incompleta . . . . . . . . . . . . . . . . . . . . 118

6 Informação assimétrica e teoria dos contratos 123


6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.1.1 Dinâmica do relacionamento . . . . . . . . . . . . . . . . . . . . 124
6.2 Informação simétrica: …rst-best . . . . . . . . . . . . . . . . . . . . . . . 125
6.2.1 Descrição do modelo . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.2.2 O contrato de informação simétrica . . . . . . . . . . . . . . . . . 126
6.3 Trade-o¤ entre incentivos e risk-sharing: moral hazard . . . . . . . . . . 131
6.3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
6.3.2 Moral Hazard: otimalidade em second best . . . . . . . . . . . . 132
6.4 Seleção adversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.4.2 Um modelo discreto de discriminação de preços: Mussa-Rosen
(1978) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.4.3 First-best: discriminação perfeita . . . . . . . . . . . . . . . . . . 139
6.4.4 Informação imperfeita: discriminação de segundo grau (preços
não-lineares) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
6.5 Sinalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

2
1 Introdução
Essas notas pretendem dar uma visão compreensiva da noção de comportamento
estratégico e de como essa noção se relaciona intimamente com as ciências sociais em
geral e com economia em particular. Na verdade, no que podemos caracterizar como
uma de…nição “cotidiana” do que entende-se por um jogo, poderíamos dizer que a
primeira idéia que geralmente nos ocorre é que um jogo é “uma disputa de qualquer
espécie”. No entanto isso apenas não basta: uma noção razoável do que seria um jogo
por certo nos informaria que jogos também são jogados de acordo com algumas regras
particulares associadas à cada jogo ou a um conjunto deles. Isto é, se observamos dois
jovens trocando “sopapos” na rua ou em alguma casa noturna qualquer, não diríamos
que se caracteriza um jogo, mas tão somente um destempero ou uma estupidez. No
entanto, se os levarmos para um ringue, selecionarmos oponentes com características
físicas relativamente próximas às deles, colocarmos luvas e especi…carmos quanto tempo
eles têm para lutar, o que vale e o que não vale, tudo isso sob o julgo de um terceiro que
chamamos juíz ou árbitro, então uma boa parcela das pessoas vai concordar que aquilo
pode ser chamado de um jogo - no caso, um esporte. Posto isso, não é exatamente um
problema pensarmos em exemplos imediatos a partir da caracterização sugerida. Jogos
incluem jogos esportivos, de cartas, de mesa, etc.
A grande maioria dos jogos de…nidos de acordo com essa lógica possuem um el-
emento competitivo e outro interativo. Isto é, um jogador deve levar em conta o
comportamento do(s) outro(s) jogador(res) envolvidos no jogo. Nesse sentido, seu grau
de sucesso nesse jogo dependerá não apenas da forma como ele próprio se comporta,
mas também e efetivamente das ações dos demais jogadores que estão no jogo. Por ex-
emplo, no tênis, não basta meramente tentar devolver a bola para o outro jogador, mas
sim devolvê-la de uma maneira tal que o adversário não consiga retorná-la. Portanto,
notemos, no tênis, a questão “aonde jogar a bola?”dependerá, dentre vários fatores, de
aonde o outro jogador está localizado. Da mesma forma ocorre no “War”, quando não
devemos apenas atacar as regiões em função do nosso objetivo sorteado (e lembre-se, a
vitória de um jogador nesse jogo signi…ca a derrota de todos os demais participantes),
mas também em função do poder de fogo do(s) adversário(s), que pode(m) retaliar um
ataque qualquer. Esse elemento de interação é a principal característica das situações
que estudamos em teoria dos jogos e é o que a distingue das outras áreas cujo elemento
objeto de análise é algum tipo de processo de tomada de decisão por parte de agentes
racionais, em um sentido que …cará claro no decorrer do texto.
Há várias características que são comuns a um grande leque de jogos. Primeiro, os
jogos possuem regras, mas exatamente o quê essas regras irão especi…car? Sabemos
que as regras de uma situação de interação estratégica podem ser as mais diversas
possívies, mais ou menos pormenorizadas e também mais ou menos complexas. No
entanto podemos sugerir algumas características mais gerais que vão estar incorporadas

3
pela quase totalidade dos jogos tais quais a gente os conhece. Primeiro, quais são os
jogadores. Em todo jogo há dois ou mais jogadores1 , cada um deles consciente do que
é melhor para si próprio. Logo, para a gente, um jogador é tão somente um agente
inserido em um processo de tomada de decisão, de escolha, no qual o comportamento
alheio importa. Segundo, as regras especi…cam a ordem nas quais as ações são tomadas,
assim como que ações são essas, que ações que cada jogador pode escolher. Nós vamos
chamar essas ações passíveis de escolha por um jogador de estratégia. E terceiro, as
regras de…nem qual(is) é(são) o(s) resultado(s) do jogo em função das escolhas tomadas
por cada um dos jogadores. Observe então que o resultado que um jogador (ou um
grupo de jogadores com o mesmo objetivo, uma equipe) qualquer obterá depende não
apenas de seu comportamento como também das escolhas (ações) feitas pelos demais
jogadores. Cada jogador sabe disso, e sabe que escolher a sua melhor ação possível
requer uma “previsão” e…ciente do que ele acha que os outros jogadores irão escolher.
Essas características gerais de jogos tipi…cam várias situações do mundo real que não
são jogos no sentido esportivo ou de diversão. Por exemplo, quando um representante
patronal e um líder sindical se engajam em um processo de barganha sobre a formação
de um novo contrato, pode-se caracterizar facilmente uma situação de jogo. As regras,
nesse ambiente, não são tão detalhadas e formais como um “Scotland Yard”, por ex-
emplo, mas há regras: ofertas e contra-ofertas são feitas pelas partes interessadas, que
buscam um acordo …nal o mais favorável possível para o seu lado. E mais, a formulação
da oferta por um dos lados da negociação deve considerar qual será a reação do outro
lado em função dessa oferta que ele recebeu. Outros exemplos de barganha podem
ser extraídos no nosso dia-a-dia, como é o caso quando compramos ou vendemos um
automóvel, fazemos um contrato de aluguel etc. Obviamente cada situação tem suas
especi…cidades, mas há vários elementos comuns em todos esses tipos de negociação.
A moderna teoria dos jogos iniciou sua evolução já há algum tempo. Um primeiro
marco teórico da sua fase moderna constituiu-se na contribuição de Von Neumann e
Morgenstern (1944). Entretanto, seu conceito mais difundido surgiu de um artigo de
John Nash - um dos três2 agraciados com o Prêmio Nobel de economia em 1994, de-
vido aos trabalhos na área de teoria dos jogos -, em 1951. Depois disso, muito já se
fez, embora a teoria dos jogos tenha alcançado a importância que hoje detém apenas
em períodos mais recentes, especialmente a partir da década de 1980. Atualmente,
o arcabouço de jogos ganha valor crescente, à medida em que aumentam suas possi-
bilidades de aplicação. Ele é hoje amplamente utilizado em economia - em análises
de consistências intertemporais de políticas econômicas, em organização industrial,
política antitruste e regulação, em teoria de leilões, em estrutura penal ótima e em
1
Se você estiver pensando em algum jogo no qual não há outros jogadores em “carne e osso” como
você, como é o caso de diversos vídeo-games, lembre-se que você está jogando contra a máquina. Da
mesma forma, alguém que está jogando “paciência” está jogando contra o baralho.
2
Os outros dois foram John Harsany e Reinhard Selten.

4
muitos outros casos -, mas não se restringe a ela: envereda-se também por outras área
das ciências sociais, como a sociologia, ciência política e direito, por exemplo. Um mo-
tivo para não estudá-la não pode ser, portanto, alguma eventual falta de abrangência
e aplicabilidade.
Outro ponto relevante a se ressaltar aqui nessa introdução diz respeito à taxanomia
da disciplina. Podemos dividir o estudo de teoria dos jogos em dois grandes grupos
ditos jogos cooperativos e os não-cooperativos, cuja distinção formal foge do escopo
do nosso estudo. Apenas o segundo grupo será estudado. Essa escolha baseia-se no
fato de que são sobre os jogos não-cooperativos que a teoria é mais desenvolvida e
tem maior aplicabilidade de interesse especí…co à economia. Além disso, pode-se, com
algumas hipóteses adicionais, tratar os jogos cooperativos como se também fossem
não-cooperativos. Por trás desses, a idéia básica é que cada indivíduo é eminentemente
egoísta, ou seja, procura sempre agir de modo a obter o maior benefício possível para
si mesmo, independente do que possa acontecer às outras pessoas. Evidentemente nem
sempre se veri…cam situações como essas. Pode ocorrer de um indivíduo preocupar-se
com o que acontecerá com outros indivíduos, alterando por isso a sua forma de agir em
função de algum tipo deliberado de altruísmo - pense, por exemplo, em situações que
envolvam familiares próximos. Todavia, essas possibilidades podem ser abordadas tam-
bém pela ótica individualista. Para isso, basta supor que todos os aspectos que afetam
(positiva ou negativamente) outras pessoas já estejam considerados nos números refer-
entes aos níveis de ganhos (ou utilidade) relacionados a cada situação (que chamaremos
de “payo¤s”). Essa é a abordagem que utilizaremos em todo o texto: cada jogador
escolherá suas ações de modo a ter o maior benefício para si mesmo em cada situação,
sendo que esse termo “maior benefício” considerará todos os aspectos da realidade
relacionados à própria pessoa e às outras pessoas que o indivíduo leva em consideração
de alguma forma. Agindo assim, esse indivíduo poderá ser chamado de “racional”,
hipótese que adotaremos indiscriminadamente.
Uma vez que esteja claro que trataremos apenas de jogos não-cooperativos, vamos
adotar um taxonomia padrão nos cursos de teoria dos jogos e que decorre basicamente
de duas noções associadas respectivamente à dinâmica (ao “timing”) das escolhas do
jogadores e à idéia de “informação”que adotaremos. Com relação ao “timing”do jogo,
classi…camos os jogos como jogos estáticos e jogos dinâmicos. No primeiro caso as escol-
has dos jogadores são simultâneas (como em um jogo de par ou ímpar) e no segundo são
sequenciais, no sentido de que algum jogador, ao tomar sua decisão, já observou alguma
escolha alheia que é relevante para essa sua escolha. Por outro lado, para cada tipo de
jogo que venhamos a analisar nesse curso, estará associada, explícita ou implicitamente,
alguma caracterização informacional do ambiente. Essa caracterização é fundamental e
para termos uma idéia inicial da explicação de sua relevância basta focarmos mais uma
vez no caráter de interdependência da interação entre os agentes: se é verdade que o

5
comportamento alheio importa para cada jogador em particular, então o processamento
das informações (ou seja, o conhecimento) que cada um tem sobre esse comportamento
alheio é em si um elemento relevante de análise. Jogos não-cooperativos são portanto
classi…cados de acordo com uma série de conceitos associados à cada situação, como in-
formação completa ou incompleta, perfeita ou imperfeita, simétrica ou assimétrica etc.
Para nós aqui nesse curso será de fato importante entender o que signi…ca “conhecer
um fato sequencialmente” e trabalharmos com as idéias de jogos estáticos e dinâmi-
cos de informação completa (e perfeita/imperfeita) e jogos estáticos e dinâmicos de
informação incompleta, nessa ordem. Para cada uma dessas noções especi…caremos um
conceito de equilíbrio segundo o qual faremos previsões sobre o comportamento dos
jogadores envolvidos de forma a inferir alguma coisa sobre o resultado daquele jogo.
Isto posto, tenha em mente que o objetivo deste texto é apresentar os principais de-
senvolvimentos e aplicações da teoria dos jogos. Para tanto seus conceitos mais impor-
tantes são apresentados, no sentido de possibilitar a previsão dos resultados de alguns
jogos, com maior ou menor acuidade. O texto procurará se ater às formalizações apenas
na medida em que as consideramos necessárias para de…nir precisamente o objeto em es-
tudo, mas espera-se que em momento algum o aluno se veja em di…culdades em função
de algum tipo de formalização. Praticamente nenhuma demonstração matemática é
desenvolvida, uma vez que a nossa meta é apresentar um texto de nível introdutório,
acessível àqueles com razoável domínio dos conceitos básicos de (micro)economia. Vale
ressaltar também que não é um objetivo apresentar qualquer inovação teórica, mas
apenas sistematizar alguns dos aspectos mais importantes e já consolidados de teoria
dos jogos, uma vez que ainda não existe nenhum texto satisfatório publicado em por-
tuguês que tenha as características de referência básica e, ao mesmo tempo, trate do
assunto com a profundidade mínima requerida. Obviamente, uma in…nidade de de-
senvolvimentos recentes da teoria não serão incorporados no texto, que, pode-se dizer,
tenta simplesmente cumprir o papel de um “livro-texto”para estudantes de graduação
em economia - e nada mais além disso.

1.1 O Que é Um Jogo?


Seguindo a de…nição de Mas-Collel et.al. (1995, p.219), pode-se de…nir um jogo
como “uma representação formal de uma situação onde um número de indivíduos in-
teragem em um cenário de interdependência estratégica”. Isto é, o bem-estar de cada
um depende não apenas das próprias ações, mas também das ações dos demais en-
volvidos. Assim, a melhor ação que cada jogador pode escolher em geral dependerá da
expectativa sobre o que os demais jogadores irão fazer.
Situações como essa são, claramente, muito distintas daquelas estudadas nos cursos
de microeconomia tradicional: tanto na teoria do consumidor quanto na de mercados
concorrenciais e monopolizados, essa interdependência não é explicitamente incorpo-

6
rada. Sendo assim, naqueles casos os indivíduos, as …rmas ou as instituições (governo,
por exemplo), ao de…nirem suas escolhas ótimas, não se preocupam com o que os out-
ros agentes poderão fazer. Por outro lado, se existe a interdependência, caracteriza-se
então uma situação onde há externalidades nas ações dos agentes, e por isso cada
um, ao fazer suas escolhas, preocupa-se com como os outros irão (ou poderão) agir.
Dessa forma o que estamos buscando em última instância é tão somente emprestar à
anàlise das situações de interesse um elemento a mais de realismo que decorre do fato
de que pessoas, empresas e instituições interagem entre si e que essas interações têm
implicações relevantes do ponto de vista individual e social.
Com essa de…nição, podemos perceber que praticamente todas as situações que
usualmente as pessoas chamam correntemente de “jogo” de fato são aqui também
caracterizadas como tal. Todavia, muitas outras situações, inclusive (mas não apenas)
econômicas e jurídicas, também se enquadram na de…nição.

1.2 Os Elementos Básicos de Um Jogo


Em geral (mas nem sempre), um jogo deve fornecer ao analista algumas informações
elementares, quais sejam:

1. os jogadores (quem são os envolvidos?),

2. as regras (quem move quando? O que se sabe quando for sua vez de jogar? etc.),

3. os resultados (para cada conjunto de ações dos jogadores, quais são os resulta-
dos?),

4. os payo¤s (quais são as preferências - representadas em suas funções de utilidade


- dos jogadores em relação aos resultados possíveis de forma que tenhamos uma
ordenação inequívoca dos resultados?).

Antes de apresentarmos exemplos que ilustrarão os elementos acima, faremos uma


pequena digressão sobre o ponto (4), em relação aos ganhos (payo¤s3 ) que cada agente
tem ao se engajar em um processo de interação estratégica.

Preferências e utilidade: Em quase toda a teoria que abordaremos nesse curso,


fundamentalmente estaremos tratando de processos de escolhas feitas por agentes4
3
A opção por se utilizar na maioria das vezes o termo "payo¤ "e não "ganho"decorre do fato de que
quase a totalidade dos artigos e textos em português que utilizam a linguagem de jogos também faz
isso. Isso é verdade para outros termos corriqueiros na linguagem de jogos, como "players"(jogadores),
por exemplo.
4
A partir daqui utilizaremos os termos agentes e jogadores indiscriminadamente como similares.
Podem ser consumidores, …rmas, governo ou qualquer outra pessoa física ou jurídica (mesmo informal,

7
racionais. Sem perda de generalidade, considere por enquanto que agentes racionais
são aqueles que, tendo que escolher uma opção dentre um conjunto de possibilidades,
escolhe aquela que melhor lher convier - ou dito de outra forma, aquela que lhe dá a
maior utilidade. Vamos rapidamente quali…car esse processo de escolha5 .
Considere um cidadão que está sendo acusado pelo Estado de um delito qualquer.
Em um depoimento à autoridade legal constituída, ele pode contar três estórias que
são igualmente críveis, não importando se alguma delas é ou não verídica. Chamemos
essas opções de escolha de 1; 2; 3. Por algum motivo qualquer, esse cidadão sabe que
sua pena no caso de escolher cada uma das opções é de 3,6 ou 9 meses, respectivamente.
Considerando que no caso dele …car preso lhe confere um custo (crescente no tempo de
prisão, de maneira que esse indivíduo está tanto pior quanto maior for o seu tempo de
prisão), então podemos dizer que a opção 1 é (estritamente) preferível à opção 2, que a
opção 1 é (estritamente) preferível à opção 3 e que a opção 2 é (estritamente) preferível
à opção 36 . Logo, se esse cidadão escolhe a opção 1, dizemos que ele é racional. Se
as penas fossem de 3,3 e 6 meses , respectivamente, então diríamos que a opção 1 é
preferível à opção 2, que a opção 2 é preferível à opção 1 (de modo que as opções 1 e
2 são opções semelhantes do ponto de vista de quem está escolhendo - dizemos que o
agente é indiferente entre 1 e 2), que a opção 1 é (estritamente) preferível à opção 3. e
que a opção 2 é (estritamente) preferível à opção 3. Nesse caso, se o cidadão escolhesse
a opção 1 ou a opção 2 diríamos que ele é racional.
Na verdade o que estamos propondo aqui é tão somente uma forma de organizar
teoricamente o processo de escolha de um agente qualquer. Adotamos a hipótese de
que, no caso em que ele tem que fazer uma escolha dentre um leque de opções, esse
agente é capaz de ordenar todas essas opções de acordo com suas preferências7 . Essas
preferências, por sua vez, são formalmente representadas por funções matemáticas ditas
"funções utilidade". Antes que alguém se assuste com algum argumento formal, vamos
logo dizer que uma função utilidade apenas traduz de maneira numérica o processo
através do qual um agente, um jogador, faz a sua escolha. No exemplo acima, suponha
que essa função fosse dada por
1
u (x) = , onde x 2 f3; 6; 9g .
x
no sentido de não estar inserido em algum sistema legal constituído, como por exemplo uma …rma que
opera no setor informal da economia ou um criminoso) que possa ser representada em alguma situação
de comportamento estratégico.
5
Essa seção é uma inserção muito breve de textos encontrados comumente em livros-textos de
microeconomia. Os alunos interessados devem recorrer a esses livros para uma exposição mais completa
do assunto.
6
Dizemos que as preferências de um agente qualquer são "transitivas"quando, por exemplo, dadas
três opções 1,2 e 3 tais que 1 é prefeível a 2 e 2 é preferível a 3, podemos dizer que 1 é preferível a 3.
7
Nesse caso dizemos que as preferências são "completas": entre um conjunto de duas ou mais opções
no processo de escolha, o agente é sempre capaz de ordenar essas opções de acordo com um índice indica
seu bem-estar, uma função utilidade.

8
Isso é, a utilidade do agente depende das escolhas que ele deve fazer e que, cada uma,
lhe custarão algum tempo de cadeia, x = 3; 6 ou 9 meses. Então
8
> 1
< u (3) = 3
u (6) = 16 tal que, observe, u (3) > u (6) > u (9)
>
: u (9) = 1
9

de maneira que, por esse critério, o agente seria racional8 se escolhesse a opção 1, na
medida em que a sua utilidade seria maior do que se escolhesse qualquer das outras
duas possibilidades. É importante notar que a função acima, u (x) = x1 , não é a única
função que pode representar as preferências do nosso agente - na verdade há inúmeras
possibilidades. Por exemplo, suponha que
a
u (x) = , onde a > 1é uma constante e x 2 f3; 6; 9g .
x
Nesse caso, 8
> a
< u (3) = 3
a
u (6) = 6
tal que, novamente, u (3) > u (6) > u (9)
>
: u (9) = a
9

Segue então que para a gente não importa exatamente o quanto um agente prefere uma
opção à outra, mas tão somente a ordem na qual ele estabelece essas opções. Nesse
sentido, ambas as funções utilidades representam as preferências do mesmo agente
descrito acima. Faça a mesma coisa para o segundo ordedamento proposto acima, 3,3
e 6 meses, e veri…que o que se dá.
Isto posto, uma função de ganho ("payo¤") é tão somente uma representação
numérica das preferências dos jogadores em função de suas possibilidades de escolha.
No entanto, como se trata de situações de interdependência estratégica, essa função
depende também das possibilidades de escolha dos demais jogadores envolvidos. Mas
no …nal o número associado àquelas opções escolhidas na verdade re‡etem um conjunto
de preferências subjacentes que nos permitirão ordenar as opções de escolha de cada
jogador de uma forma clara que …cará expressa nos exemplos abaixo.
8
Nesse ponto do texto, sem considerarmos elementos de interação estratégica, dizemos que um
agente é racional se suas preferências são completas e transitivas.

9
Exemplos: De…nidos os elementos principais e feita essa breve explanação sobre a
representação das preferências dos jogadores, podemos sugerir alguns exemplos simples
para começarmos a pensar em situações passíveis de serem modeladas como jogos.

Exemplo 1 - Casamento de moedas (este é usualmente um dos primeiros exemplos


de jogos que os textos mais didáticos sobre o tema apresentam)

1. há dois jogadores, ditos 1 e 2,

2. cada jogador joga simultaneamente uma moeda para cima,

3. se o resultado das duas moedas for o mesmo, 1 paga R$1,00 para 2; caso contrário,
a ordem do pagamento se inverte,

4. depende da especi…cação da função utilidade, de como cada jogador avalia a im-


portância que tem para si ganhar ou perder R$1,00.

Exemplo 2 - Jogo da Velha

1. novamente há dois jogadores, ditos X e O;

2. como todos quase certamente conhecem o jogo, de…na você mesmo(a) como um
exercício os seus elementos básicos.

Os exemplos acima são situações de claro con‡ito, uma vez que o que um jogador
ganha o outro perde: são exemplos do que chamamos de jogos de soma zero. Essa é
uma possibilidade, mas que não necessariamente sempre ocorrerá. O exemplo abaixo
fornece um caso diferente, onde dois jogadores ou ganham juntos ou perdem juntos.

Exemplo 3 - Encontro em BH

1. dois jogadores: João e Maria;

2. os dois jogadores estão separados e incomunicáveis. Eles marcaram de se encon-


trar em algum lugar no centro às 12:00 hs para almoçar. Mas deixaram o lugar
em aberto, dentre duas opções e então perderam a comunicação. Cada um tem
de decidir aonde ir;

3. se eles se encontrarem, almoçam juntos. Caso contrário, sozinhos;

4. eles teriam payo¤ s iguais a uma unidade (qualquer que seja) almoçando juntos,
e de zero almoçando sozinhos.

Como se percebe nesse último caso, os jogadores têm interesses alinhados - o prob-
lema a se tentar superar é a falta de coordenação entre eles. Claramente, portanto,
esse não é um jogo de soma zero.

10
2 Jogos Estáticos de Informação Completa
A primeira classe de jogos que serão apresentados são chamados jogos estáticos, em
comparação com os sequenciais (ou dinâmicos), que serão vistos mais à frente. Esses
jogos são ditos também jogos simultâneos, uma vez que os jogadores de…nem suas
formas de agir “ao mesmo tempo”. O exemplo imediato é o jogo de “par ou ímpar”,
no qual os dois jogadores revelam suas estratégias ao mesmo tempo. Antes que se faça
alguma restrição sobre a realidade dessa premissa, note que não é necessário que de
fato os jogadores façam suas escolhas literalmente ao mesmo tempo, mas tão somente
que cada um dos jogadores, ao fazer a sua escolha sobre qual estratégia adotar, não
tenha observado as escolhas feitas pelos demais jogadores. Nesse caso poderíamos ter
um jogo de “par ou ímpar”, estático, em que um dos jogadores fez a escolha, digamos,
10 minutos antes do outro. Basta que o outro jogador, ao escolher o seu número, não
saiba qual foi a escolha daquele que jogou primeiro.
Quanto ao caráter de informação completa, refere-se ao fato de que cada um dos
envolvidos conheçam as funções de ganho de todos os outros. Sendo um pouco mais
rigoroso, isso signi…ca que a “função payo¤ de cada jogador é de conhecimento comum
(common knowledge)”. Como exemplo, considere um jogo com dois jogadores, 1 e 2.
Como já sabemos, esses jogadores têm um conjunto de opções dentre as quais cada
um deve escolher uma da melhor forma que lhe convier. Mas sabemos cada par de
escolhas possíveis associa a cada jogador uma utilidade, um número de acordo com o
qual pode-se identi…car se cada um está em melhor ou pior situação do que nas demais
opções. Nesse contexto, dizer que o jogo é de informação completa signi…ca dizer que
cada jogador sabe não apenas a sua utilidade para cada combinação de escolha mas
conhece também a utilidade do outro jogador em cada situação. Mas mais do que
isso: cada jogador sabe também que o outro conhece a sua utilidade associada a essas
opções. E mais ainda: cada jogador sabe que o outro sabe que ele sabe a utilidade do
outro jogador em cada situação. E assim sucessivamente.
Sendo um pouco mais formal, dizemos que um jogo qualquer é de informação com-
pleta quando a função de ganho (payo¤) de cada jogador é de "conhecimento comum".
Para entendermos o que esse termo signi…ca, considere como exemplo uma situação com
apenas dois agentes, 1 e 2. Nós dizemos que um evento X qualquer é de “conhecimento
comum” nesse jogo se

1 sabe que X ocorreu; 2 sabe que X ocorreu.

1 sabe que 2 sabe que X ocorreu; 2 sabe que 1 sabe que X ocorreu.

1 sabe que 2 sabe que 1 sabe que X ocorreu; 2 sabe que 1 sabe que 2 sabe que
X ocorreu

11
e assim in…nitamente. Sendo assim, um jogo estático com dois jogadores, 1 e 2, é
de informação completa se, na de…nição acima

X = função de ganho (payo¤) do outro jogador.

Ou seja,

1 conhece a função payo¤ de 2; 2 conhece a função payo¤ de 1.

1 sabe que 2 conhece a função payo¤ de 1; 2 sabe que 1 conhece a função payo¤
de 2.

1 sabe que 2 sabe que 1 sabe a função payo¤ de 2; 2 sabe que 1 sabe que 2 sabe
a função payo¤ de 1.

e assim sequencialmente.
Nesse jogos estáticos de informação completa (por de…nição, a função de ganho é
de conhecimento comum) assumimos também que a racionalidade9 dos jogadores é de
conhecimento comum. Nesse caso,

1 sabe que 2 é racional; 2 sabe que 1 é racional.

1 sabe que 2 sabe que 1 é racional; 2 sabe que 1 sabe que 2 é racional.

1 sabe que 2 sabe que 1 sabe que 2 é racional; 2 sabe que 1 sabe que 2 sabe que
1 é racional

e assim in…nitamente.
Logo adiante, quando começarmos a analisar a resolução de jogos estáticos de infor-
mação completa, …cará claro porque a noção de conhecimento comum de um determi-
nado evento é relevante. Essa hipótese (informação completa) será utilizada em quase
todo o texto, sendo ‡exibilizada apenas no …nal - isso se houver tempo hábil. O motivo
fundamental dessa restrição é que a sua não utilização di…cultaria signi…cativamente
a análise, fugindo do escopo do texto e do curso - embora a teoria dos jogos de in-
formação incompleta já tenha sido signi…cativamente desenvolvida e consolidada, mas
de…nitivamente está em um patamar de complexidade superior ao aqui pretendido.
Vamos a partir de agora propor uma estrutura que será seguida ao longo dessas
notas: uma vez entendido o conceito mais amplo (aqui, jogos estáticos de informação
completa), vamos fazer uma exposição sobre a forma correta de representar esse tipo
de jogo e posteriormente discutir como solucionar essa classe de jogos, com diversas
nuances especí…cas associadas a cada uma das situações. Disso tratamos agora.
9
A de…nição de racionalidade nesse contexto de interdependência está descrita na próxima seção do
texto.

12
2.1 Representação de Jogos Estáticos de Informação Completa: Forma
Normal ou Estratégica.
A forma que utilizamos para representar jogos estáticos de informação completa é
dita forma normal (ou estratégica). De acordo com a forma normal, devemos ter as
seguintes informações sobre um jogo com n > 1 jogadores:

1. Os jogadores: 1; 2; :::; n.

2. O espaço (ou conjunto) de estratégia de cada jogador. Esse conjunto vai nos dizer
quais são as possibilidade de escolha de cada um dos jogadores. Por exemplo, no
jogo “par ou ímpar” o espaco de cada jogador i = 1; 2 é

Si = fpar, ímparg

Nesse ponto deve estar claro que o que chamamos de estratégia é apenas uma
opção, uma escolha, uma ação possível que cada jogador pode tomar.

3. A função de ganho (payo¤) para cada jogador i = 1; 2; :::; n. Essa função, para
um jogador i qualquer, associa um número em função das possibilidades de escolha
de cada jogador. É ela que caracteriza o elemento de comportamento estratégico
dos jogos na medida em que o ganho de cada jogador é afetado pela sua própria
escolha mas também é afetado em alguma medida pelas estratégias adotadas por
cada cada um dos demais jogadores.

Nos jogos estáticos, o conjunto das estratégias disponíveis a cada jogador são de
fácil visualização, correspondendo às opções de ação que cada jogador pode escolher.
Veremos posteriormente que nem sempre elas serão tão claras, como no caso dos jogos
dinâmicos. Sendo um pouco mais rigoroso, tome a de…nição abaixo:

De…nição: A representação na forma normal de um jogo J com n jogadores


especi…ca para cada jogador i = 1; 2; :::; n um conjunto de estratégias Si e uma
função de ganho ui (s1 ; :::; sn ), onde si 2 Si . Formalmente, escreve-se

J = (Si ; ui (si ; s i ))i=1;2;:::;n

Em suma, a representação na forma normal ou estratégica de…ne quais são os


jogadores envolvidos, quais são as estratégias disponíveis a cada um deles e os
payo¤s para cada jogador referentes a todos os resultados possíveis.

1. os jogadores 1,2,...,n.

13
2. os espaçoes de estratégias,
8
>
> S1 = fs11 ; s12 ; :::; s1k1 g
>
< S = fs ; s ; :::; s g
2 21 22 2k2
>
> :::
>
:
Sn = fsn1 ; sn2 ; :::; snkn g
onde sij 2 Si é a j-ésima opção (estratégia) que o jogador i pode adotar no jogo.

3. a função de ganhos e os payo¤s de cada jogador,


u i : Si S i !R
| {z }
ui (si ;s i )2R

Ou seja, uma função especí…ca a cada jogador que associda um nível de utili-
dade a partir da sua escolha (si 2 Si ) e das escolhas dos demais n 1 jogadores
(s i 2 S i ). Aqui o termo s i denota as escolhas de todos o jogadores que não o
jogador i.
Exemplo 4 - Dilema dos Prisioneiros: este constitui certamente o exemplo mais con-
hecido em teoria dos jogos, em função da sua estrutura simples e do seu resultado
intrigante. Há inúmeras versões do jogo, que pode ser adaptado a situações muito dis-
tintas entre si. Mostraremos aqui primeiro a versão de Dixit e Nalebu¤ (1994), uma
das mais criativas. Depois analisamos a estória padrão.
A idéia é que havia um maestro que viajava de trem na antiga URSS. Com aparência
não convencional, foi interpelado pelos policiais da KGB, que imaginaram poder tratar-
se de um espião. Revistando suas bagagens, os policiais encontraram partituras, que
interpretaram como códigos. Apesar do maestro insistir que eram apenas partituras
de músicas de Tchaikóvski que ele interpretava, acabou sendo preso. Passado algum
tempo na prisão, chegaram os o…ciais ao maestro e disseram-lhe que ele teria um dia
para decidir-se entre confessar ou não, mas que seria melhor confessar, uma vez que
eles já haviam prendido o tal de “Tchaikóvski”. A proposta, feita aos dois prisioneiros,
era a seguinte: se ambos confessassem, cada um …caria preso seis anos; se ninguém
confessasse, como não haveriam provas concretas, …cariam ambos presos por um ano; se
um confessasse e o outro não, o primeiro seria solto imediatamente, como prêmio à sua
colaboração com a KGB, enquanto o outro, que além de culpado não havia colaborado,
…caria detido por nove anos. O jogo é representado abaixo na forma normal em uma
(bi)matriz, que é uma matriz aonde cada entrada possui dois números:

Tchaiskóvski
NC C
Maestro NC 1; 1 9; 0
C 0; 9 6; 6

14
Logo, se está na forma normal, devemos extrair as três informações: (i) os jogadores:
Maestro e Tchaiskóvski; (ii) para cada um dos jogadores, as estratégias possíveis: con-
fessar (C) e não confessar (NC) e (iii) a função de ganho de cada jogador: os payo¤s
do jogador 1 - Maestro - situam-se à esquerda em cada célula. Por sua vez, os payo¤s
do jogador 2 - o que teve o azar de se chamar Tchaikóvski - encontram-se à direita.
Essa será a regra utilizada em todo o texto e que é padrão na representação na forma
estratégica: o jogador 1 e suas estratégias à esquerda, o jogador 2 e suas estratégias
acima e, em cada célula, os payo¤s dos jogadores 1 e 2 à esquerda e à direita, re-
spectivamente. Aqui, portanto, o número de jogadores é igual a dois, o conjunto de
estratégias do Maestro é fC; N Cg, assim como o é o do jogador Tchaikóvski também
é esse. Os resultados possíveis e os payo¤s para cada um deles são os mostrados no
quadro acima: por exemplo, se ambos não confessam, cada jogador ganha ( 1; 1),
que é uma medida do “bem-estar”, da “utilidade (ou desutilidade, no caso)” dos jo-
gadores Maestro e Tchaiskóvski, respectivamente, caso ambos de declaram inocente. A
lógica é que se ambos confessam, …cam cada um 6 anos presos. Se ambos se declaram
inocentes, não há provas su…cientes mas em função do processo cada um …ca 1 ano
preso. E se um jogador confessa e o outro não, então aquele que confessou tem um
prêmio por ter confessado e é imediatamente libertado, enquanto que aquele que não
confessou é punido por sua atitude de suposta não-cooperação e …ca preso por 9 anos.
Essa é tão somente uma primeira representação do Dilema dos Prisioneiros adaptada
para a estória acima. Outra estória, mais simples e recorrente, é tão somente que duas
pessoas foram presas pela polícia e acusadas de cometer um delito qualquer - mas
nós não sabemos (nem ninguém, a não ser os próprios jogadores) se efetivamente eles
(ou um deles) são ou não culpados. Eles estão presos em celas separadas e cada um
tem a opção de confessar ou não a autoria do delito. Sendo um jogo estático de
informação completa, quando cada jogador faz a sua escolha ele não sabe a escolha
do outro jogador (jogo estático). Além disso, a matriz de ganhos é de conhecimento
comum (jogo de informação completa), de modo que ambos os jogadores visualizam sem
nenhuma incerteza a matriz de ganhos, com as estratégias de cada jogador e os payo¤s
de cada um para cada combinação de estratégias possíveis. Note que esses payo¤s são
representações relativas das preferências de cada jogador e de forma alguma é único -
observe que os payo¤s no jogo acima são distintos dos payo¤s no jogo abaixo. O que
importa é que toda representação possível dessa estória preserve o ordenamento dos
ganhos dos jogadores. Por exemplo, a matriz

Jogador 2
Não Confessa (N C) Confessa (C)
Jogador 1 Não Confessa (N C) 5; 5 1; 7
Confessa (C) 7; 1 4; 4

15
também pode ser a forma normal da mesma estória que descreve o Dilema dos Pri-
sioneiros.
Esse jogo, veremos adiante, tem um resultado surpreendente: ainda que ambos
os jogadores.sejam inocentes e que ambos estejam melhor quando ambos jogam não
confessar, N C, o melhor que cada um pode fazer individualmente é se declarar culpado e
jogar C. Esse resultado decorre em função do elemento de interdependência estratégica
que caracteriza o Dilema dos Prisioneiros.

Exemplo 5 - Par ou ímpar. Como exercício, descreva o jogo de par ou ímpar a partir
da matriz abaixo. Quais são os jogadores? E as estratégias de cada um? Quem jogou
par e quem jogou ímpar?

Jogador 2
Par Ímpar
Jogador 1 Par 1; 1 1; 1
Ímpar 1; 1 1; 1
Exemplo 6 - Guerra dos sexos. Um homem e uma mulher (na verdade um casal)
devem decidir o programa que farão hoje à noite. Eles podem ir ao teatro ou ir ao
Mineirão ver um jogo de futebol. A matriz abaixo descreve o jogo:
Mulher
Mineirão Teatro
Homem Mineirão 3; 2 1; 1
Teatro 1; 1 2; 3
Descreva o jogo (jogadores, estratégias e payo¤ s) e note que o homem prefere ir ao
futebol acompanhado da mulher. Mas ele prefere ir ao teatro acompanhado da mulher
do que ir sozinho ao Maracanã. O mesmo acontece com a mulher, só que ela dá
preferência pelo teatro.

Exemplo 7 - O jogo do covarde ("the chicken game"). Nesse jogo dois motoristas,
1 e 2, se encontram em um estrada. Naquele lugar especí…co, há uma ponte estreita,
de modo que apenas um veículo passa de cada vez. Logo, cada um pode avançar ou
esperar o outro passar primeiro. Se algum dos jogadores, 1 por exemplo, avança e o
outro espera, ele segue sua viagem e o outro espera um pouco mais - e vice-versa. Mas
se ele avança e o oponente também, então há uma colisão e ambos perdem. O jogo é
representado na bimatriz abaixo:
Motorista 2
Avança Espera
Motorista 1 Avança 5; 5 5; 0
Espera 0; 5 1; 1

16
Exemplo 8 - Pedra x Papel x Tesoura. Neste jogo (um par ou ímpar mais so…sticado),
cada jogador escolhe simultaneamente um dos três objetos relacionados abaixo (suas
estratégias). Dependendo da combinação …nal, pode-se ganhar 1, -1 ou 0 (a lógica é
que pedra ganha de tesoura, que vence o papel, que se sobrepõe à pedra; se o objeto for
o mesmo, ninguém ganha).

Jogador 2
pedra papel tesoura
pedra 0; 0 1; 1 1; 1
Jogador 1 papel 1; 1 0; 0 1; 1
tesoura 1; 1 1; 1 0; 0
Temos portanto na forma normal (ou estratégica):

1. os jogadores: 1 e 2.

2. os espaços de estratégias. Ou seja, o que cada jogador pode vir a jogar,

S1 = S2 = fpedra, papel, tesourag

3. a função de ganho (payo¤) de cada jogador: qual o ganho que jogador terá para
cada combinação possível de estratégias.

Há inúmeros exemplos de jogos estáticos de informação completa. Alguns deles nós


veremos nesse texto ao discutir uma série de questões associdas às soluções de jogos
estáticos de informação completa. Outros não serão tratados aqui, mas o conteúdo desse
texto é mais do que su…ciente para que você entenda eventuais casos não tratados aqui.

2.2 Resolução de Jogos Estáticos de Informação Completa


Vamos a partir de agora analisar a solução de jogos estáticos de informação com-
pleta. Devemos ter em mente que solucionar um jogo signi…ca buscar determinar quais
estratégias jogadores racionais adotariam em ambientes nos quais a racionalidade dos
jogadores é de conhecimento comum10 . Ou seja, discutir a solução de um jogo signi…ca
analisar métodos de previsão dos seus resultados. Aqui, duas são as características
principais. A primeira é a precisão, que se refere ao fato de que, uma vez que sugeri-
mos (previmos) um resultado, a probabilidade de que ele realmente venha a ocorrer em
uma manifestação real do jogo será tanto maior quanto mais preciso tiver sido o método
10
Nesse ponto já deve estar claro o que signi…ca um evento qualquer ser de conhecimento comum.
Nesse sentido, lembre-se que dizer que a racionalidade dos jogadores é de conhecimento comum em um
jogo com dois jogadores, 1 e 2, signi…ca dizer que 1(2) sabe que 2(1) é racional, que 1(2) sabe que 2(1)
sabe que 1(2) é racional e assim sucessivamente.

17
de previsão utilizado. A outra refere-se à abrangência do método, que diz respeito ao
número de situações onde exista interdependência estratégica entre os envolvidos que
ele consegue oferecer um resultado provável para ele. Infelizmente, em geral os métodos
mais precisos são os menos abrangentes, e vice-versa. Procuraremos apresentá-los em
ordem decrescente de precisão (consequentemente, em ordem crescente de abrangên-
cia). Portanto, o primeiro gerará respostas a muito poucos jogos, com a vantagem
de que, quando a apresentar, essa será altamente con…ável. Por outro lado, o último
propiciará respostas a um número muito superior de situações, embora seus resultados
devam ser compreendidos com algumas ressalvas que nós iremos discutir.

2.2.1 Estratégias Estritamente Dominantes

Considere o Dilema dos Prisioneiros,

Jogador 2
NC C
Jogador 1 NC 5; 5 1; 7
C 7; 1 4; 4

Em um jogo como este (e em todo jogo estático de informação completa), dizemos


que uma estratégia de um jogador qualquer (do jogador 1, por exemplo) é uma es-
tratégia estritamente dominante se, independente da escolha do outro jogador, o
ganho que ele tem jogando esta estratégia é estritamente maior do que o ganho que ele
teria jogando a outra estratégia. Como há duas estratégias, "Não Confessar"e "Con-
fessar", temos que analisar essas duas possibilidades. Para veri…car se há a existência
de estratégias estritamente dominantes, basta olhar, para cada jogador, se existe uma
escolha que gere sempre o maior payo¤ para ele. Em um jogo representado na forma
normal, na forma de matriz, deve-se então supor que o outro jogador escolha cada uma
das suas estratégias possíveis. Se a melhor alternativa for sempre a mesma, então essa
se constitui em uma estratégia estritamente dominante. Indo direto ao ponto, considere
a estratégia "Confessar"do jogador 1. Se o outro jogador, 2, joga "Não Confessar", o
ganho de 1 jogando "Confessar"é maior do que jogando "Não Confessar", 7 > 5. E se
2 joga "Confessar", o ganho de 1 jogando "Confessar"também é maior do que jogando
"Não Confessar", 4 > 1. Logo dizemos que para o jogador 1 a estratégia "Confessar"é
uma estratégia estritamente dominante: independente das escolhas alheias (do jogador
2, no caso), o ganho de 1jogando "Confessar"é estritamente maior do que jogando "Não
Confessar". Dito ainda de outra maneira, a estratégia "Confessar"é uma estratégia
estritamente dominante para o jogador 1 porque ela gera o maior payo¤ para este jo-
gador toda vez que ele a jogar, independente das estratégias dos outros jogadores. Faça
raciocínio análogo para o jogador 2 e veri…que que também para este jogador a estraté-
gia "Confessar"é uma estratégia estritamente dominante. Dizemos então que no Dilema

18
dos Prisioneiros o per…l de estratégias ("Confessar", "Confessar") é um equilíbrio com
estratégias estritamente dominantes.
Ou seja, em um jogo estático de informação completa J com n jogadores, considere
o espaço de estratégias de um jogador i qualquer, dado por Si . E suponha que a
estratégia que esse jogador jogou tenha sido si 2 Si . Nós dizemos que si 2 Si é uma
estratégia estritamente dominante para o jogador i quando, independente das
escolhas alheias, o ganho que o jogador i tem jogando si 2 Si é estritamente maior do
que o ganho que ele teria jogando qualquer outra estratégia disponível no seu espaço de
estratégias, s0i 2 Si . Se para cada jogador i = 1; 2; :::; n há uma estratégia estritamente
dominante s1 2 S1 ; s2 2 S2 ; :::; sn 2 Sn , então (s1 ; s2 ; :::; sn ) é dito um equilíbrio com
estratégias estritamente dominantes. Formalmente,

De…nição: No jogo J = fSi ; ui (si ; s i )gni=i a estratégia si 2 Si é uma estratégia


estritamente dominante para o jogador i se ui (si ; s i ) > ui (s0i ; s i ), 8s0i 2 Si ,
s0i 6= si e 8s i 2 S i .

Dito ainda de outra maneira, a estratégia si é uma estratégia estritamente domi-


nante o jogador i se ela gera o maior payo¤ para ele toda vez que ele a jogar, indepen-
dente das estratégias dos outros jogadores.

De…nição: Primeiro princípio da racionalidade: considere um jogador i qual-


quer. Se existe si 2 Si tal que si é uma estratégia estriamente dominante, então
i a jogará.

– Observação: (si ; s i ) é um equilíbrio com estratégia estritamente domi-


nante no jogo J se si é uma estratégia estritamente dominante para todo
jogador i = 1; 2; :::; n. Na verdade, como veremos abaixo, (si ; s i ) será um
equilíbrio com estratégia estritamente dominante no jogo J se si for uma
estratégia estritamente dominante para pelo menos (n 1) jogadores.

Logo, se um jogador tem uma estratégia que é estritamente dominante, ele, sendo
racional, deve sempre jogá-la, pois, por de…nição, não haverá nada melhor a se fazer. Se
todos os envolvidos em um determinado jogo possuem estratégias estritamente dom-
inantes, seu resultado torna-se portanto facilmente conhecido, dada a racionalidade
dos jogadores. O grau de acuidade dessa previsão é, de fato, extremamente potente.
A…nal, é pouco provável que alguém não escolha fazer algo que seja reconhecidamente
preferível a ele(a) sempre.
Observe também a curiosidade da seguinte nuance no Dilema dos Prisioneiros. Con-
sidere que a polícia permita que os prisioneiros possam se comunicar entre si e, eventual-
mente, estabelecer algum acordo no sentido de nenhum deles confessar, para …carem
detidos por menos tempo. Nesse caso, qualquer acordo que emergisse do contato entre

19
eles não teria credibilidade no sentido de que ambos os jogadores teriam incentivos a
não cumprir o acordo, independentemente do fato de um jogador acreditar ou não que
o outro irá cumprí-lo ou não. Como resultado, ambos acabam obtendo um resultado
que é pior para todos, …cando ambos com um payo¤ de 4. É curioso perceber tam-
bém que esse é o resultado que deverá prevalecer mesmo que ambos fossem inocentes,
como seriam no exemplo dado o Maestro e o que teve a má sorte de possuir pais que
apreciassem o nome Tchaikóvski.
Caso tenhamos uma situação onde todos os jogadores, menos um, tenham estraté-
gias estritamente dominantes, o resultado da interação também pode ser facilmente
previsto. O que ocorrerá é que o jogador que não possui uma estratégia que seja estri-
tamente dominante escolherá a alternativa que lhe dará maior utilidade, tomando como
dado11 que os outros jogadores irão jogar aquelas estratégias que forem dominantes para
eles.

jogador 2
E C D
A 0; 1 4; 0 5; 3
jogador 1 M 4; 0 2; 0 5; 3
B 3; 2 3; 5 6; 6
No jogo acima na forma normal (ou estratégica) temos

1. os jogadores: 1 e 2

2. os espaços de estratégias, S1 = fA; M; Bg e S2 = fE; C; Dg

3. os payo¤s, dados na matriz acima.

Nesse jogo, observe que a estratégia D é estritamente dominante para o jogador.2:


para qualquer escolha que o jogador.1 faça, a sua melhor resposta é jogar D (pois 3 é
maior do que 1 e 0,.3 é maior do que 0 e 0 e 6 é maior do que 5 e 2). Sabendo disso
(pois 1 sabe que 2 é racional), o jogador.1 escolherá a alternativa que mais lhe convém,
dado que o jogador.2 sempre escolherá D. O melhor para ele é portanto jogar B (pois
6 é maior do que 3), o que leva ao resultado (B; D) do jogo como um equilíbrio com
estratégias estritamente dominantes. Desta análise, concluímos que quando todos (ou
pelo menos todos menos um) jogadores possuem estratégias estritamente dominantes,
a previsão é, como referido, extremamente acurada.
O problema é que na grande maioria dos jogos não existe essa facilidade analítica,
e então outras formas de se prever os resultados têm de ser utilizadas. Há um outro
conceito, parecido com o oposto do visto acima, que, embora não de…na o que deverá
ocorrer, determina com muita segurança o que não deverá acontecer.
11
Lembre-se que assumimos que a racionalidade dos jogadores é de conhecimento comum.

20
2.2.2 Estratégias Estritamente Dominadas

Considere novamente o Dilema dos Prisioneiros,

Jogador 2
NC C
Jogador 1 NC 5; 5 1; 7
C 7; 1 4; 4

Em um jogo como este (e em todo jogo estático de informação completa), dizemos que
uma estratégia de um jogador qualquer (do jogador 1, por exemplo) é uma estratégia
estritamente dominada por alguma outra estratégia desse jogador se, independente
da escolha do outro jogador, o ganho que ele tem jogando esta estratégia é estrita-
mente menor do que o ganho que ele teria jogando a outra estratégia. Novamente,
como há duas estratégias, "Não Confessar"e "Confessar", devemos analisar as duas
possibilidades. Para veri…car se há a existência de estratégias estritamente dominadas,
olhamos, para cada jogador, os payo¤s associados às estratégias comparadas duas a
duas. Em um jogo representado na forma normal, na forma de matriz, deve-se então
supor que o outro jogador escolha cada uma das suas estratégias possíveis. Compara-
mos então as duas estratégias (se houvessem mais as compararíamos também), e se o
ganho for sempre estritamente menor, então essa se constitui em uma estratégia estri-
tamente dominada pela outra. Considere as estratégias do jogador 1, "Não Confessar"e
"Confessar". Se o outro jogador, 2, joga "Não Confessar", o ganho de 1 jogando "Não
Confessar"é menor do que jogando "Confessar", 5 < 7. E se 2 joga "Confessar", o
ganho de 1 jogando "Nào Confessar"também é menor do que jogando "Confessar",
1 < 4. Logo dizemos que para o jogador 1 a estratégia "Não Confessar"é uma estraté-
gia estritamente dominada: independente das escolhas alheias, o ganho de 1jogando
"Nào Confessar"é estritamente menor do que jogando "Confessar". Dito ainda de outra
maneira, a estratégia "Não Confessar"é uma estratégia estritamente dominada para o
jogador 1 porque ela gera um payo¤ menor para este jogador relativamente à outra al-
ternativa, "Confessar", toda vez que ele a jogar, independente das estratégias do outro
jogador. Faça raciocínio análogo para o jogador 2 e veri…que que também para este
jogador a estratégia "Não Confessar"é uma estratégia estritamente dominada. Dizemos
então que no Dilema dos Prisioneiros o per…l de estratégias ("Não Confessar", "Não
Confessar") é um equilíbrio com estratégias estritamente dominadas: "Não con fes-
sar"é uma estratégia estritamente dominada por "Confessar"se ela conferir ao jogador
2 um payo¤ sempre inferior ao propiciado pela segunda, independente do que o outro
jogadore possa fazer.
Ou seja, em um jogo estático de informação completa J com n jogadores, considere
o espaço de estratégias de um jogador i qualquer, dado por Si . E suponha que a
estratégia que esse jogador jogou tenha sido si 2 Si . Nós dizemos que si 2 Si é uma

21
estratégia estritamente dominada por outra estratégia s0i 2 Si qualquer no seu
espaço de estratégias para o jogador i quando, independente das escolhas alheias,
o ganho que o jogador i tem jogado si 2 Si é estritamente menor do que o ganho que
ele teria jogando s0i 2 Si . Formalmente,

De…nição: No jogo J = fSi ; ui (si ; s i )gni=i a estratégia si 2 Si é uma estratégia


estritamente dominada pela estratégia s0i 2 Si , s0i 6= si , para o jogador i, se
ui (si ; s i ) < ui (s0i ; s i ), 8s i 2 S i .

Ou seja, si é estratégia estritamente dominada s0i se ela conferir ao seu jogador


um payo¤ sempre inferior ao propiciado pela segunda, independente do que os outros
jogadores possam fazer.

De…nição - Segundo princípio da racionalidade: considere um jogador i qual-


quer. Se existe si ; s0i 2 Si tal que si é uma estratégia estriamente dominada por
s0i , então i nunca jogará si .

Uma regra básica de teoria dos jogos é que indivíduos racionais não jogam estraté-
gias estritamente dominadas, pois fazendo isso eles não estão agindo da melhor forma
possível para eles mesmos. Vejamos agora as implicações deste princípio, em particular
…cará claro aqui a relevância da noção de conhecimento comum, tanto dos payo¤s dos
jogadores envolvidos como também da racionalidade destes12 . Para isso, considere o
jogo abaixo:

jogador 2
C D E
jogador 1 A 2; 2 1; 5 1; 3
B 1; 3 0; 1 1; 2
tal que na forma normal ou estratégica temos

1. os jogadores: 1 e 2

2. os espaços de estratégias, S1 = fA; Bg e S2 = fC; D; Eg

3. os payo¤s, dados na matriz acima.

Verique inicialmente que nesse jogo não há estratégia estritamente dominante para
nenhum jogador, de forma que se buscássemos fazer uma previsão do resultado do
jogo tendo em mente essa noção, nada poderíamos dizer. Note também que no jogo
acima, para o jogador 2, a estratégia E é estritamente dominada pela estratégia D:
12
Obviamente, aqui, um jogador é racional se ele não joga estratégias estritamente dominadas por
alguma outra.

22
comparando-se as duas temos que se o jogador.1 escolhe A, o jogador 2 estará pior
jogando E do que jogando D, pois 3 < 5. Se, por outro lado, o jogador.1 escolhe a
alternativa B, para o jogador.2 a estratégia E continua sendo uma estratégia pior do
que D, na medida em que 2 < 1. Consequentemente, sendo o jogador 2 racional, ele
nunca terá incentivos a jogar E, pois ela sempre gerará payo¤s inferiores à D. Perceba
também que, apesar da dominância de D sobre E, D não é uma estratégia estritamente
dominante, pois para 2 a estratégia C não é estritamente dominada nem por D nem
por E.
Como assumimos, 2 é racional, de modo que não devemos esperar que ele nunca
escolha E Mas mais ainda, essa racionalidade é de conhecimento comum, assim como
a racionalidade de 1. E como se trata de um jogo de informação completa, não apenas
2 não joga E como também 1 também sabe. E 2 sabe que 1 sabe que ele nunca a jogará
e 1 sabe que 2 sabe... e assim sucessivamente. Isso implica que podemos eliminar os
resultados do jogo que consideram essa estratégia. Procedendo assim e eliminando a
coluna E do jogo, o jogo assume a seguinte forma reduzida,

jogador 2
C D
jogador 1 A 2; 2 1; 5
B 1; 3 0; 1

Note atentamente: repetindo o raciocínio acima, nós podemos proceder dessa forma
porque não apenas trata-se de um jogo estático de informação completa mas também a
racionalidade dos jogadores é também de conhecimento comum. Nesse sentido, sendo 2
racional (de acordo com o segundo princípio de racionalidade), ele não jogará E. Mas
(muito!!!) mais do que isso: como 1 sabe que 2 é racional (de acordo com o mesmo
princípio), ele conjectura que 2 nunca a jogará. E como 2 sabe que 1 sabe que ele, 2, é
racional, então 2 sabe que 1 sabe que ele nunca jogará E e assim inde…nidamente, de
modo que a estratégia E torna-se irrelevante para o jogo, pois nenhum jogador levará
em consideração a possibilidade de 2 jogá-la.
Por outro lado, tendo em mente o jogo reduzido apresentado acima, observe que
para o jogador 1 a estratégia B torna-se estritamente dominada13 pela estratégia A,
uma vez essa gera payo¤ de uma unidade a mais para o jogador 1, comparando-se com
o que a B proveria, independente do que o jogador 2 …zer. O jogador 1, portanto, não
deverá jogar B (e 2 sabe disso, e 1 sabe que 2 sabe e...) e podemos da mesma forma
13
Aqui temos um resultado básico interessante que o aluno um pouco mais atento já deve ter perce-
bido: em um jogo 2 2 (dois jogadores, cada uma com duas estratégias em seus espaços de estratégias),
o fato de um jogador qualquer ter uma estratégia estritamente dominada implica que a outra estratégia
é estritamente dominante. No jogo em questão, nesse segundo estágio, A torna-se dominante. Mas
apenas no jogo reduzido!

23
eliminar essa linha, reduzindo ainda mais o jogo,

jogador 2
C D
jogador 1 A 2; 2 1; 5

Com o jogo dessa forma, sabemos que o jogador 1 jogará A. Consciente de tal fato, o
jogador 2 fará o que mais lhe dará utilidade: jogar D (pois 5 > 2). O resultado previsto
para o jogo é, portanto, (A; D).
O processo mostrado no exemplo acima é denominado eliminação iterada de
estratégias estritamente dominadas (EIEED) e o conjunto de estratégias (A; D)
é dito ser um equilíbrio por EIEED. Esse processo de eliminação, como vimos,
depende que os agentes sejam racionais, mas também que cada um deles saiba que os
outros também são racionais, e que saibam que todos sabem que todos eles são racionais
etc. Assumir tais hipóteses é o mesmo que assumir que existe “common knowledge”
(conhecimento comum) de que os jogadores são racionais. No caso acima, dado que
trata-se de um jogo de informação completa, foi necessário que:

o jogador.2 fosse racional e, assim, não jogasse E;

o jogador 1 fosse racional e soubesse que o jogador 2 também era racional, não
jogando, por isso, B;

o jogador 2 soubesse que o jogador 1 era racional e também que o jogador.1


soubesse que ele era racional, e então escolhesse D.

Isto posto, veri…que que no Dilema dos Prisioneiros o per…l de estratégias ("Não
Confessar", "Não Confessar") é um equilíbrio por EIEED.
Observe agora a relação entre estratégias estritamente dominantes e estratégias
estritamente dominadas. Se uma estratégia é uma estratégia estritamente dominante
para um jogador qualquer, então ela “sobrevive” ao processo de EIEED. Por outra
lado, se uma estratégia sobrevive ao processo de EIEED, não necessariamente será
uma estratégia estritamente dominate para aquele jogador. Isso será verdade em jogos
2 x 2, onde cada jogador tem apenas duas possibilidades de escolha (como, por exemplo,
o Dilema dos Prisioneiros), mas saindo dessa classe restrita de jogos, nada nos garante
que tal relação se preserva. Podemos então generalizar e propor a seguinte relação entre
as duas maneiras vistas até aqui de solucionar jogos estáticos de informação completa:

Proposição 9 Se uma estratégia de um jogador qualquer é uma estratégia estritamente


dominante, então ele sobrevive (não é eliminada) ao processo de EIEED. Mas se uma
estratégia de um jogador qualquer sobrevive ao processo de EIEED, não necessariamente
ela é uma estratégia estritamente dominante.

24
Observação 10 Dito de outra maneira, dizemos aqui que o primeiro princípio de
racionalidade implica no segundo mas o segundo princípio não necessariamente implica
no primeiro.

Uma observação importante aqui é que a maior parte dos jogos não são resolvidos
via EIEED. Eventualmente isso ocorre, mas em geral apenas reduz as possibilidades
do jogo. Considere o exemplo abaixo.

Exemplo 11
jogador 2
D E F
A 2; 3 3; 1 3; 2
jogador1 B 4; 1 5; 4 0; 3
C 1; 1 3; 5 6; 3

Depois de descrever as informações desse jogo na forma estratégica, observe que


nesse exemplo não há nenhuma estratégia estritamente dominante e nem estratégia
estritamente dominada para ambos os jogadores. Segue o processo de EIEED nem
mesmo reduz a complexidade do jogo: o equilíbrio do jogo por EIEED é o próprio jogo,
uma informação que não nos ajuda em nada na previsão do resultado do jogo.
Veja também o jogo de Par ou Ímpar. Neste jogo, o jogador chamado Par é o
que pediu par (P), enquanto o de nome Ímpar é, analogamente, o que ganha se o
resultado for ímpar (I). Apenas para simpli…car, suponha que o vencedor tem payo¤
de 1, enquanto o perdedor obtém -1.

Ímpar
P I
Par P 1; 1 1; 1
I 1; 1 1; 1

Nota-se que, também no Par ou Ímpar, EIEED não colabora em nada com a resolução
do jogo.
Podemos relaxar um pouco a noção de estratégia estritamente dominada e tro-
car a desigualdade estrita dessa de…nição por uma relação apenas desiguladade (não
estrita). Emerge portanto a idéia de estratégia fracamente dominada. Generica-
mente, em um jogo estático de informação completa qualquer, dizemos que (para um
jogador qualquer) uma determinada estratégia é uma estratégia fracamente dominada
por outra estratégia qualquer no seu espaço de estratégias para este jogador quando,
independente das escolhas alheias, o ganho que o jogador tem jogado tal estratégia
é menor (mas não necessariamente estritamente menor) do que o ganho que ele teria
jogando a outra estratégia.

25
Considere então um jogo estático de informação completa J com n jogadores e
tome o espaço de estratégias de um jogador i qualquer, dado por Si . E suponha que
a estratégia que esse jogador jogou tenha sido si 2 Si . Nós dizemos que si 2 Si é
uma estratégia fracamente dominada por outra estratégia s0i 2 Si qualquer no seu
espaço de estratégias para o jogador i quando, independente das escolhas alheias,
o ganho que o jogador i tem jogado si 2 Si é menor (não necessariamente estritamente
menor) do que o ganho que ele teria jogando s0i 2 Si :Formalmente,

De…nição: No jogo J = fSi ; ui (si ; s i )gIi=i a estratégia si 2 Si é uma estratégia


fracamente dominada pela estratégia s0i 2 Si para o jogador i se ui (si ; s i )
ui (s0i ; s i ), 8s i 2 S i .

Uma estratégia fracamente dominada por outra é portanto um conceito próximo,


mas distinto, do conceito de estratégias estritamente dominadas. A diferença é que o
primeiro requer que a estratégia dominada nunca seja melhor que a estratégia que a
domina, enquanto o último exige que a dominada seja, sempre, estritamente pior que
a que a domina.
Esse conceito de estratégias fracamente dominadas possibilitaria, em princípio, que
conseguissémos que se reduzisse mais (ou pelo menos da mesma forma) a complexidade
dos jogos. Entretanto, a eliminação iterada deve ser feita apenas com estratégias es-
tritamente dominadas: eliminar iteradamente estratégias que sejam apenas fracamente
dominadas pode levar a resultados distintos do jogo. Não é, portanto, consequência da
racionalidade dos jogadores. Na eliminação iterada de estratégias estritamente dom-
inadas, a ordem de eliminação não afeta o resultado …nal, o que pode não ocorrer
quando utiliza-se esse processo para estratégias fracamente dominadas. O exemplo
abaixo demonstra essa possibilidade.

Exemplo 12
jogador 2
a b
A 3; 4 4; 3
jogador 1 B 5; 3 3; 5
C 5; 3 4; 3
Pode-se perceber no jogo acima que algumas estratégias podem eliminadas ao se
considerar o conceito de dominância fraca:

1. B é fracamente dominada por C (pois nunca gera payo¤s superiores a C): elimina-
se B;

2. no jogo reduzido, b é fracamente dominada por a (pelo mesmo raciocício): elimina-


se b;

26
3. no jogo ainda mais reduzido, o jogador 1 escolhe C e o resultado do jogo é (C; a).

Podemos, todavia, começar de outra forma:

1. A é fracamente dominada por C: elimina-se A;

2. no jogo reduzido, a é fracamente dominada por b: elimina-se a;

3. no jogo ainda mais reduzido, jogador 1 escolhe C e o resultado do jogo é (C; b).

Conclui-se assim o enunciado acima: eliminação iterada de estratégias fracamente


dominadas pode levar a resultados distintos dependendo de onde se começa o processo, e
portanto não é consequência da racionalidade dos jogadores. Deve estar claro portanto
a fraqueza do método, na medida em que ainda que em algumas situações a eliminação
de estratégias fracamente dominadas possa nos ajudar a solucionar ou mesmo reduzir a
complexidade de um jogo qualquer, o fato do processo de interação não ser determinado
pela racionalidade dos jogadores pode implicar em previsões sobre o resultado do jogo
que não sejam boas o su…cente, que não sejam as melhores que o analista possa vir a
fazer.

2.2.3 Estratégias racionalizáveis (análise de "melhores respostas")

Um outro método que pode ser utilizado para se prever resultados de jogos si-
multâneos é o de eliminação de estratégias não racionalizáveis. Em geral, o “common
knowledge”da racionalidade dos jogadores permite eliminar outras estratégias que não
aquelas eliminadas via EIEED (ou pelo menos essas). Para de…nir melhor tal possibil-
idade, é necessário termos em mente alguns outros conceitos, abaixo apresentados.
Em um jogo estático de informação completa, considere o espaço de estratégias
de um jogador qualquer. Uma estratégia especí…ca nesse conjunto é dita a melhor
resposta que ele pode dar às escolha alheias se, dadas as escolhas alheias, o ganho
que ele tem jogando tal estratégia é maior (não necessariamente estritamente maior) do
que jogando alguma outra estratégia qualquer. Nesse caso dizemos que esta estratégia
é uma estratégia racionalizável. Mas se não existe uma combinação de escolhas dos
demais jogadores tal que o ganho desse jogador em escolher tal estratégia seja maior do
que as demais estratégias, dizemos que ela é não-racionalizável. Dizemos portanto
que tal estratégia não é nunca a melhor resposta que este jogador pode dar às
escolhas alheias. Seguem abaixo as de…nições de uma forma mais rigorosa.
Como foi dito, um outro método que pode ser utilizado para se prever resultados
de jogos simultâneos é o de eliminação de estratégias não racionalizáveis. Em geral, o
“common knowledge” da racionalidade dos jogadores permite eliminar outras estraté-
gias que não aquelas eliminadas via EIEED (ou pelo menos essas). Para de…nir melhor
tal possibilidade, é necessário termos em mente alguns outros conceitos.

27
De…nição: Em J = (Si ; ui (si ; s i )) um jogo estático de informação completa.
Uma estratégia si 2 Si , i 2 n, é a melhor resposta que i pode dar às escolhas
dos demais jogadores se existe s i 2 S i tal que

ui (si ; s i ) ui s0i ; s i 8s0i 2 Si

Nesse caso dizemos que si é uma estratégia racionalizável. Se não existe s i 2


S i tal que ui (si ; s i ) ui (s0i ; s i ) 8s0i 2 Si , dizemos que si é uma estratégia
não-racionalizável, o que signi…ca que si não é nunca a melhor resposta que
i pode dar às escolhas alheias.

Note que, em geral, existem várias melhores respostas para cada jogador envolvido,
dependendo do que os outros possam fazer (no caso especí…co onde existe apenas uma
melhor resposta para um determinado jogador, essa seria então uma estratégia estrita-
mente dominante).
Se uma determinada estratégia não for nunca a melhor resposta para um jogador,
em que circunstâncias deverá ele jogá-la? Sendo racional, isso nunca deverá acontecer,
uma vez que, sempre que ele imaginar a possibilidade de escolhe-la, haverá uma alter-
nativa que gera um payo¤ superior, por de…nição. Segue desse raciocínio que estratégia
racionalizáveis são estratégias que sobrevivem à eliminação iterada de estratégias que
nunca são a melhor resposta que um jogador pode dar às escolhas alheias.
Como no caso de estratégias estritamente dominadas, também pode-se fazer elim-
inação iterada de estratégias não racionalizáveis (EIENR)14 . Novamente, a ordem de
eliminação não afeta o resultado …nal. As estratégias que sobrevivem à EIENR são
aquelas que um jogador racional pode justi…car, ou racionalizar, dada alguma conjec-
tura razoável a respeito da escolha dos outros jogadores, onde razoável signi…ca uma
escolha que não contenha estratégias não racionalizáveis.
Comparando com estratégias estritamente dominadas, observamos que uma estraté-
gia que é estritamente dominada nunca é melhor resposta, mas o inverso nem sempre é
correto. Portanto, eliminar iteradamente estratégias que nunca são a melhor resposta
elimina pelo menos tantas estratégias quanto se retiraria ao fazer EIEED, e em geral
elimina-se mais. Em suma, tem-se que

(
Conjunto de estratégias estratégias que sobrevivem à EIEED
estratégias que sobrevivem à EIENR
14
Isso é verdade enquanto não tratamos ainda de estratégias mistas, o que veremos logo a seguir.
Quando isso ocorrer, esse resultado se altera radicalmente. A intenção aqui é tão somente inserir a
noção de estratégias (não) racionalizáveis e "preparar terreno"para inserirmos a noção de equilíbrio de
Nash.

28
Exemplo 13 Considere o jogo abaixo, um jogo estático de informação completa. Na
forma normal (ou estratégica)

1. os jogadores: 1 e 2

2. os espaços de estratégias: S1 = fa; b; c; dg e S2 = fe; f; g; hg

3. os payo¤s, que são os ganhos expostos na bimatriz abaixo.

jogador 2
e f g h
a 2; 6 3; 3 5; 1 0; 0
jogador 1 b 3; 1 6; 4 0; 2 0; 1
c 8; 1 2; 2 0; 5 0; 4
d 4; 1 1; 0 0; 1 5; 1
Nesse jogo, qual é o conjunto de estratégias racionalizáveis?
Uma forma que facilita sensivelmente a visualização das estratégias racionalizáveis
(ou não) é marcar as melhores respostas para cada jogador em todas as circunstâncias
possíveis, sendo essas dadas pelas alternativas que o outro jogador possui. Por exemplo,
quando o jogador 1 escolhe a, o melhor para o jogador 2 será escolher e, pois lhe dará
um payo¤ de 6, e não 3, 1 ou 0, que obteria se …zesse outras escolhas. O mesmo deve
ser feito supondo escolhas de b; c e d pelo jogador 1. Por sua vez, se o jogador 2 utilizar
a estratégia e, o melhor para o jogador 1 será lançar mão da estratégia c (payo¤ de 8
contra outros de 2, 3 e 4). O mesmo também deve ser feito supondo as escolhas de f; g
e h pelo jogador 2. Se uma determinada estratégia não corresponder a uma melhor
resposta em nenhuma circunstância, então ela não será racionalizável, pois signi…cará
que, independente do que o outro jogador …zer, ela nunca gerará o maior payo¤ e
portanto não corresponderá ao melhor a se fazer. Uma vez que alguma estratégia for
eliminada por esse critério, pode-se novamente analisar se, no jogo reduzido, há alguma
outra que nunca será jogada, e assim sucessivamente, até reduzir-se o jogo ao máximo.
No caso acima, temos que:

h pode ser eliminado, pois nunca é melhor resposta para jogador 2;

eliminado h, d também pode ser eliminado, pois não será mais melhor resposta
para o jogador 1 em nenhuma possibilidade do jogo reduzido.

A partir desse ponto, nenhuma outra eliminação poderá ser feita, sendo que todas
as estratégias sobreviventes são racionalizáveis: podem ser justi…cadas por alguma
hipótese a respeito do que o outro jogador poderá fazer. Portanto, nesse jogo não é

29
possível prever um resultado …nal pelo método de EIENR, obtendo apenas a redução
da sua complexidade:

jogador 2
e f g
a 3; 1 6; 4 0; 2
jogador 1 b 8; 1 2; 2 0; 5
c 4; 1 1; 0 0; 1

Em geral, portanto, EIENR (assim como, e ainda mais, EIEED) não gera previsões
bem de…nidas para grande parte dos jogos. O mais comum é que apenas de…na alguns
resultados que não serão jogados, caso de fato exista pleno conhecimento de racionali-
dade dos jogadores por todos eles. Contudo, isso não signi…ca que seja sempre assim.
Vejamos o exemplo 8 dado na seção anterior, onde, via EIEED nada podia ser feito.

jogador 2
D E F
A 2; 3 3; 1 3; 2
jogador 1 B 4; 1 5; 4 0; 3
C 1; 1 3; 5 6; 3

Percebe-se que, mesmo sem possuir estratégias estitamente dominadas, no jogo acima
existem algumas estratégias que nunca são melhores respostas, e portanto não são
racionalizáveis. Esse é o caso da estratégia F para o jogador 2 e da A para o jogador
1. Eliminando-as, o jogo se reduz a

jogador 2
D E
jogador 1 B 4; 1 5; 4
C 1; 1 3; 5

Nesse jogo reduzido, porém, outras estratégias passam a não constituirem-se de mel-
hores respostas: a estratégia D, para o jogador.2, e a estratégia C, para o jogador
1. Eliminando-as, temos então (B; E) como resultado previsto para o jogo, que será
jogado caso exista conhecimento comum de racionalidade entre os jogadores.
Por …m, uma palavra de precaução é necessária aqui. Ainda que tenhamos proposto
e feito nesses exemplos um processo de eliminação de estratégias segundo a noção de
racionalidade de jogadores associada à estratégias racionalizáveis, não é verdade que
esse processo é sempre válido quando permitimos que os jogadores aleatorizem suas
escolhas. Nesse caso podemos ter estratégias não racionalizáveis que serão jogadas com
probabilidades positivas, possibilidade que decorre em função da presença do elemento
de interação estratégica. Por exemplo, no caso acima, pode ser que os jogadores 1 e 2

30
joguem A e F com probabilidade não nula, respectivamente. Nós veremos essa situação
abaixo, quando estudarmos estratégias mistas. Segue portanto que a análise acima tem
perda signi…cativa de generalidade quando incorporamos estratégias mistas na análise.

2.3 Equilíbrio de Nash


Como visto acima, mesmo EIENR não é em geral capaz de nos dar o resultado de
muitos jogos, embora costume simpli…cá-los. Um método de solução mais abrangente
que EIEED e EIENR é o de equilíbrio de Nash: se um conjunto de estratégias é um
equilíbrio de Nash, ele sobrevive às “eliminações ...”, embora o contrário não seja,
em geral, verdade. Nesse contexto um equilíbrio de Nash será determinado por uma
interseção de melhores respostas, uma interserção de estratégias racionalizáveis. Isso
signi…ca que um per…l de estratégias (associando uma estratégia para cada jogador) será
um equilíbrio de Nash se, para cada jogador, a estratégia que ele adotou for a melhor
resposta que ele pode dar às escolhas alheias. Podemos ainda dizer que em um jogo
estático de informação completa, um conjunto de estratégias (uma para cada jogador)
constitui um equilíbrio de Nash se, caso os todos os jogadores, menos um, joguem as
estratégias de…nidas para eles no equilíbrio de Nash, para aquele outro não exista nada
melhor a se fazer a não ser também escolher a estratégia para ele de…nida no equilíbrio
de Nash. E isso deve valer para todos os jogadores tomados individualmente.

De…nição: No jogo J = fSi ; ui (si ; s i )gni=i o per…l de estratégias si ; s i con-


stitui um equilíbrio de Nash se para todo jogador i = 1; 2; :::; n a estratégia
si 2 Si for a melhor resposta que i pode dar às escolhas alheias. Isto é, dado
s i 2 S i , ui si ; s i ui s0i ; s i 8s0i 2 Si , s0i 6= si .

De outra forma, podemos de…nir as estratégias (s1 ; :::; sn ) como um equilíbrio de


Nash caso, para todo jogador i, a estratégia si resolva o problema de

max ui si ; s i
si 2Si

Como usual, tome como exemplo o Dilema dos Prisioneiros,

Jogador 2
NC C
Jogador 1 NC 5; 5 1; 7
C 7; 1 4; 4

e analisemos inicialmente o caso do jogador 1. Se o jogador 2 jogou N C, a melhor


resposta que 1 pode dar é jogar C, pois 7 > 5. E se 2 jogar C, a melhor resposta que
o jogador 1 pode dar é jogar a estratégia C, pois 4 > 1. Analogamente para o jogador
2: se 1 joga N C, a melhor resposta que ele pode dar é jogar C (7 > 5) e se 1 joga

31
C a melhor resposta também é jogar C. Logo (C; C) é uma interseção de melhores
respostas e como tal caracteriza o equilíbrio de Nash no Dilema dos Prisioneiros.
Identi…cado o equilíbrio de Nash, veja que nenhum dos jogadores tem qualquer
incentivo a se desviar. Se algum dos jogadores propõe ao outro que ambos joguem
"Não Confessar", de forma que cada um ganhe 5 (e portanto ambos estejam melhor do
que no equilíbrio de Nash), o melhor que cada um pode fazer é não cumprir o acordo,
pois na conjectura de o oponente cumprí-lo, a melhor resposta é sempre não cumprir e
jogar "Confessar", pois 7 > 5.
Portanto, para encontrar um equilíbrio de Nash, basta ver a(s) melhor(es) re-
sposta(s) de um jogador para cada estratégia do(s) outro(s) jogador(es), procedendo
assim para todos eles. Quando houver coincidência entre as melhores respostas para
todos os envolvidos, esse conjunto de estratégias será um equilíbrio de Nash.

Exemplo 14
jogador 2
D E F
A 2; 3 5; 1 3; 2
jogador 1 B 4; 2 1; 4 0; 3
C 1; 1 0; 5 6; 8

No caso acima, não há estratégia dominante para nenhum dos jogadores nem nen-
huma estratégia pode ser eliminada via EIEED ou EIENR. Mas o conceito de equilíbrio
de Nash nos diz que o resultado do jogo será (C; F ), o único onde há coincidência de
melhores respostas: se o jogador 2 joga F , o melhor para o jogador 1 é escolher C, e
vice-versa. Consequentemente, nenhum dos dois terá incentivos a desviar desse resul-
tado, caso acreditem que ele deva se veri…car.

2.3.1 Estabilidade, existência e unicidade do equilíbrio de Nash

Estabilidade Caso se tenha um determinado conjunto de estratégias, conhecido por


todos e previsto como a solução de um jogo estático, ele deverá constituir-se em um
equilíbrio de Nash. Se isso não ocorrer, então, por de…nição, existirá algum jogador
que poderá obter um payo¤ maior jogando outra estratégia: ele não teria, portanto,
incentivos em jogar a estratégia proposta inicialmente, sendo racional. Assim, se um
determinado conjunto de estratégias é previsto como a solução de um jogo estático de
informação completa, ele deverá ser um equilíbrio de Nash. Nesse sentido dizemos que
o equilíbrio de Nash é um resultado estrategicamente estável (ou "self-enforcing").
Formalmente, suponha que um conjunto de estratégias (s01 ; :::; s0n ) seja a solução
proposta para um determinado jogo estático de informação completa com n jogadores,
mas não seja um equilíbrio de Nash. Então, para ao menos um jogador i, ter-se-ia uma

32
estratégia alternativa (s00i 6= s0i ) tal que o ganho desse jogador seria maior jogando-a,

ui s0i ; s0 i < ui s00i ; s0 i

e o jogador i preferirá jogar s00i , de onde temos que (s01 ; :::; s0n ) não pode ser uma solução,
ao menos um jogador se desviaria.

Existência Com relação à existência do equilíbrio de Nash, sabemos através de um


teorema provado pelo próprio Nash, em 1951, que sempre existirá pelo menos um, desde
que o jogo em análise seja …nito15 .

Teorema 15 Nash (1951). Em todo jogo …nito (com o número de jogadores n, …nito
e espaço de estratégias Si , para todo i, também …nito) existe pelo menos um equilíbrio
de Nash (ainda que envolva apenas estratégias mistas, conceito a ser visto à frente).

Exemplo 16 Par ou ímpar.

jogador 2
P I
jogador 1 P 1; 1 1; 1
I 1; 1 1; 1

O jogo par ou ímpar é um jogo …nito, uma vez que há apenas dois jogadores com
duas estratégias para cada um deles. Pelo Teorema enunciado acima, ele deveria possuir
algum equilíbrio de Nash, o que não se percebe na matriz acima. Obviamente não
estamos mostrando uma contradição ao Teorema de Nash nem sugerindo que o Par
ou Ímpar não tenha solução teórica. Entretanto, ali está sendo mostrado apenas as
possíveis estratégias puras. O par ou ímpar, de fato, possui um equilíbrio de Nash
(a…nal, não consta que o Teorema tenha sido provado de maneira errada), mas em
estratégias mistas, onde cada jogador joga 50% das vezes par e 50% ímpar. Esse
processo será explicado mais adiante.

Exemplo 17 Comsidere um jogo que tenha a seguinte regra: há dois (ou mesmo um
número maior qualquer) jogadores que têm de escrever simultaneamente em um pedaço
de papel um número qualquer. Após terem escrito, ambos revelam seus números. O
que tiver escrito o maior número recebe R$100, enquanto o(s) outro(s) não ganha(m)
nada. Sendo igual, também não ganham nada. Qual é o equilíbrio de Nash?

Pensando um pouco, você notará que não existe nenhum equilíbrio de Nash nesse
jogo. Para concluir isso, veja que o perdedor sempre poderá melhorar sua situação,
15
Para nós aqui nesse curso, um jogo é dito …nito se o número de jogadores for …nito e se o espaço
de estratégias de cada jogador também for …nito.

33
dizendo um número maior que o vencedor; sempre havendo perdedor (ou empate),
sempre alguém poderá melhorar e, assim, nunca se alcançará um resultado que con-
stitua um equilíbrio de Nash. Esse jogo é uma prova contrária ao teorema de Nash?
Certamente não, pois o referido teorema foi provado e não há o que discutí-lo. A
questão é que neste jogo não são satisfeitas todas as hipóteses necessárias à validade
do teorema, uma vez que ele não é …nito: note que o conjunto de estratégias possíveis
a cada jogador possui in…nitos elementos, e é isso que possibilita a não existência do
equilíbrio neste jogo.

Unicidade Com relação à unicidade, nada nos garante em um jogo estático de in-
formação completa o equilíbrio de Nash seja único. Pode existir e é bastante comum
encontrar jogos com mais de um equilíbrioa de Nash.

Exemplo 18 Guerra dos sexos.

Mulher
Futebol Teatro
Homem Futebol 2; 1 0; 0
Teatro 0; 0 1; 2

No jogo acima, percebe-se a existência de dois equilíbrios de Nash: ambos irem


ao futebol e ambos irem ao teatro. O conceito de equilíbrio de Nash, portanto, não
determina nesse caso qual será o resultado do jogo; apenas restringe as possibilidades
elimando algumas combinações de estratégias.

Exemplo 19 Coordenação. Esse é um jogo muito comum em que dois jogadores,1


e 2, combinam um jantar de negócios mas deixam o local em aberto. Posteriormente
ocorre um problema de comunicação e eles perdem contato. Há duas possibilidades, eles
podem ir a um restaurante caro e so…sticado ou a um "pé-sujo". Caso se encontrem
- não importa em qual local - realizam um negócio e têm payo¤ positivo. Caso não se
encontrem, voltam ambos frustrados para casa e não se o negócio entre eles.

jogador 2
Antiquarius O Cantão
jogador 1 Antiquarius 1; 1 0; 0
O Cantão 0; 0 1; 1

Novamente temos dois equilíbrios de Nash, e também não podemos determinar qual
deles será jogado.
Nesses jogos, ainda que haja mais de um equilíbrio de Nash, nós podemos de alguma
forma reduzir as possibilidades dos resultados. Mas em alguns jogos essa redução pode
ser irrelevante e frustante. Considere por exemplo o jogo entre dois jogadores, 1 e 2.

34
Ambos devem escrever em um pedaço de papel um número inteiro entre 0 e 100. Se
a soma de ambos os números (a escolha do jogador 1 mais a escolha do jogador 2) for
menor do que 100, cada um leva o número que escreveu no papel. Se a soma der mais
de 100, cada um perde uma quantia, R$1,00 por exemplo. Inicialmente alguém poderia
dizer que nesse jogo há um único equilíbrio de Nash de jogo, cada um jogar 50. No
entanto esse é apenas um dos equilíbrios de Nash desse jogo, provavelmente decorrente
de algum critério subjetivo de justiça na cabeça do aluno. Mas não é isso que buscamos
e sim caracterizar todos os equilíbrios do jogo - e nesse jogo há 101 equilíbrios de Nash.

s1 s2
0 100
1 99
2 98
::: :::
50 50
::: :::
99 1
100 0

Embora nos exemplos acima não tenhamos especi…cado, a princípio, como apontar
um ou outro equilíbrios de Nash como o mais provável a ser jogado, em alguns casos,
nesses jogos com múltiplos equilíbrios de Nash, existem formas de identi…car qual deles
deverá ser jogado (ao menos com uma “certa” probabilidade).

2.3.2 Equilíbrio de Nash e Eliminação de Estratégias

Para relacionarmos a noção de equilíbrio de Nash com eliminação iterada de es-


tratégias, vamos analisar duas proposições. Como é de se esperar, dada a direção que
estamos tomando, ainda que estejamos perdendo em potência com relação à capacidade
preditiva, lançar mão do conceito de equilíbrio de Nash nos permite atingir um grau
de abrangência signi…cativo que nos permitirá ter alguma informação sobre a resolução
de um determinado jogo de informação estática em quase todas as situações.
As relações que estabeleceremos abaixo dizem respeito à EIEED, mas poderia ser
abordada através de estratégias não-racionalizáveis. Os enunciados e as provas das
proposições são os que se seguem.

Proposição: Se o conjunto de estratégias si ; s i constitui um equilíbrio de


Nash no jogo J = fSi ; ui (si ; s i )gni=i na forma normal, então si ; s i sobrevive
ao processo de EIEED.

– Prova: Por contradição, suponha que não. Isto é, que si ; s i seja um


equilíbrio de Nash de J mas foi eliminada no processo de EIEED em algum

35
estágio do procedimento. Segue que para ao menos um jogador i qualquer,
dadas as escolhas s i 2 S i dos demais jogadores, existiria uma estratégia
si 2 Si , si 6= si , tal que ui si ; s i < ui s0i ; s i . Decorre que si ; s i não
seria um equilíbrio de Nash em J, caracterizando a contradição.

Proposição: No jogo J = fSi ; ui (si ; s i )gni=i na forma normal, …nito, seja


si ; s i o único per…l de estratégias que sobrevive à EIEED. Então si ; s i
é o único equilíbrio de Nash em J.

– Prova: (i) Pelo teorema de Nash, em J existe ao menos um equilíbrio


de Nash. (ii) Pela proposição anterior, se um per…l de estratégias é um
equilíbrio de Nash, então sobrevive ao processo de EIEED.

Segue que se si ; s i é um per…l de estratégias que sobrevive à EIEED, único, em


J, então si ; s i é um equilíbrio de Nash em J.
Podemos informalmente descrever e provar as proposições acima:

Proposição: Em um jogo estático de informação completa, …nito, se um conjunto


de estratégias constitui um equilíbrio de Nash no jogo na forma normal, então
esse conjunto de estratégias sobrevive ao processo de EIEED.

– Prova: Por contradição, suponha que não. Isto é, que esse conjunto seja
um equilíbrio de Nash do jogo mas foi eliminada no processo de EIEED em
algum estágio do procedimento. Segue que para ao menos um jogador qual-
quer, dadas as escolhas dos demais jogadores (que estão jogando o equilíbrio
de Nash), existiria uma outra estratégia tal que o seu ganho jogando o equi-
líbrio de Nash seria menor do jogando esta estratégia alternativa. Decorre
portanto que o conjunto inicial não seria um equilíbrio de Nash nesse jogo,
caracterizando a contradição.

Proposição: Em um jogo estático de informação completa, …nito, seja um per…l


de estratégias qualquer (uma estratégia para cada jogador) o único per…l que
sobrevive à EIEED. Então esse per…l de estratégias é o único equilíbrio de Nash
do jogo.

– Prova: (i) Pelo teorema de Nash, nesse jogo existe ao menos um equilíbrio
de Nash. (ii) Pela proposição anterior, se um per…l de estratégias é um
equilíbrio de Nash, então sobrevive ao processo de EIEED. Segue que se um
conjunto de estratégias é um per…l que sobrevive à EIEED, único, no jogo,
então tal conjunto é o (único) equilíbrio de Nash no jogo.

36
O que as proposições acima mostram é que todo Nash sobrevive à EIEED mas que
nem toda estratégia que sobrevive à EIEED constitui um Nash em um jogo …nito na
forma estratégica. Seguindo na direção que tomamos - e como já foi dito acima - isso
nos sugere que a noção de equilíbrio de Nash é mais tênue do que a idéia de equilíbrio
por EIEED mas no entanto é extremamente mais ampla.
Analisando com relação à estratégias não-racionalizáveis, note que isso ocorre porque
uma estratégia que está em algum equilíbrio de Nash nunca será uma estratégia não
racionalizável, pelo menos pelas estratégias desse equilíbrio de Nash dos outros jo-
gadores - pela própria de…nição de equilíbrio de Nash. Por outro lado, suponha um
resultado (a; b) qualquer, sendo a uma estratégia racionalizável do jogador.1 e b uma
outra, racionalizável para o jogador 2. Nada garante que a justi…cativa para que o
jogador 1 escolha a seja a possibilidade de ocorrência de b, assim como também nada
garante que a justi…cativa para que o jogador 2 escolha b seja a possibilidade de ocor-
rência de a. Portanto, não necessariamente o resultado (a; b) constituirá um equilíbrio
de Nash.
Sendo assim, podemos dizer que toda estratégia que compõe um equilíbrio de Nash
é racionalizável porque pode ser justi…cada pelas estratégias de equilíbrio de Nash dos
demais jogadores, enquanto o inverso em geral não será verdade. Por isso, tem-se que
a capacidade de predição de um jogo é muito superior quando se utiliza o conceito de
equilíbrio de Nash, comparando-se com EIEED e EIENR.
Em suma, pode-se dizer que:

(
Conjunto de estratégias estratégias que sobrevivem à EIEED
estratégias que sobrevivem à EIENR estratégias que são equilíbrio de Nash
Entretanto, o grau de precisão de uma previsão utilizando apenas o conceito de equi-
líbrio de Nash não é tão apurado quanto o dos métodos apresentados anteriormente,
como …ca claro no exemplo acima em que os jogadores devem escrever um número
inteiro de 0 a 100 em um pedaço de papel. Não há nenhuma dúvida da alta probabili-
dade de que um jogador sempre escolha uma estratégia estritamente dominante, caso
a tenha. No entanto, um estratégia que constitua um equilíbrio de Nash será jogada
com alta probabilidade apenas se cada jogador realmente acreditar que o(s) outro(s)
também escolherá(ão) as estratégias de…nidas naquele equilíbrio de Nash.

Exemplo 20 Considere o exemplo (16) acima após a EIENR:


jogador 1
e f g
a 2; 6 3; 3 5; 1
jogador 1 b 3; 1 6; 4 0; 2
c 8; 1 2; 2 0; 5

37
O equilíbrio de Nash no jogo acima é (b; f ), onde existe coincidência de melhores
respostas e portanto nenhum jogador tem incentivos a desviar.
Embora nas de…nições tenhamos sempre utilizado a hipótese de existência de n
jogadores, até agora todos os exemplos dados contavam com apenas dois jogadores
envolvidos. Isso foi feito por também dois motivos. O primeiro é que, de fato, grande
parte das situações reais de interdependência ocorre realmente com apenas dois jo-
gadores. O outro é que a análise de jogos com apenas dois envolvidos é tecnicamente
muito mais simples, embora a lógica da análise permaneça exatamente a mesma. Bus-
cando mostrar os passos para se encontrar equilíbrios de Nash em jogos com mais de
dois jogadores, apresentaremos abaixo um exemplo com três deles.

2.3.3 Equilíbrio de Nash com três jogadores

A representação do jogo na forma normal, via matrizes de payo¤s, não será mais
tão simples como antes. Como seria extremamente complicado desenhar uma “ma-
triz” tridimensional, deve-se construir tantas matrizes (bidimensionais) quantas forem
as estratégias do jogador 3 (por exemplo). No caso abaixo são três: S3 = fnúmeroI,
númeroII, númeroIIIg. Por sua vez, são claros o conjunto de possibilidades dos out-
ros jogadores: o jogador 1 escolhe entre “alto” e “baixo” enquanto o jogador 2 entre
“esquerda” e “direita” Em relação aos payo¤s, os apresentaremos em cada célula na
seguinte ordem: o mais à esquerda refere-se ao do jogador 1, o central ao do jogador
2, e o à direita ao payo¤ do jogador 3. Para encontrar-se as melhores respostas de
cada jogador, procede-se como antes, veri…cando a estratégia que gera o maior payo¤
para cada possibilidade existente. A diferença é que, agora, essas possibilidades são
combinações de escolhas dos outros dois jogadores. Para deixar claro, daremos alguns
exemplos do procedimento, deixando os restantes para o leitor concluir por si mesmo,
segundo as marcações de melhores respostas nas matrizes:

se o jogador 3 escolhe número I e o jogador 2 escolhe direita, então o jogador


1, entre alto e baixo, escolhe a segunda alternativa, que lhe dará payo¤ superior
(1 > 0);

se o jogador.3 escolhe número III e o jogador 1 escolhe alto, então o jogador


2, entre esquerda e direita, escolhe a primeira alternativa, que lhe dará payo¤
superior (6 > 1);

se o jogador 1 escolhe baixo e o jogador 2 escolhe direita, então o jogador 3,


entre número I, número II e número III, escolhe a segunda alternativa, que lhe
dará payo¤ superior (5 > 1) - neste caso, perceba que você deve comparar payo¤s
entre as células posicionadas à direita e na segunda linha de cada uma das três
matrizes.

38
Se jogador 3 escolhe número I:

jogador 2
esquerda direita
jogador 1 alto 0; 0; 0 2; 3; 4
baixo 1; 3; 2 7; 3; 1

Se jogador 3 escolhe número II:

jogador 2
esquerda direita
jogador 1 alto 2; 8; 6 0; 7; 1
baixo 2; 1; 1 3; 2; 5

Se jogador 3 escolhe número III:

jogador 2
esquerda direita
jogador 1 alto 3; 2; 6 1; 3; 1
baixo 2; 4; 0 5; 3; 1

Pode-se notar que existem três equilíbrios de Nash neste jogo: (baixo, esquerda, número
I), (alto, esquerda, número II) e (baixo, direita, número II). Em nenhuma dessas situ-
ações existe algum jogador que queira mudar sua escolha, dada as escolhas dos outros,
uma consequência da própria de…nição de equilíbrio de Nash.

2.3.4 Discussão do conceito de equilíbrio de Nash

É razoável esperarmos que um equilíbrio de Nash será efetivamente jogado? O


equilíbrio de Nash é uma boa técnica em termos de previsibilidade de um jogo? Abaixo
discutimos alguns argumentos a respeito da e…cácia do equilíbrio de Nash, seguindo a
abordagem de Mas-Collel et. al. (1995) e a de Kreps (1990).

1. Equilíbrio de Nash como consequência de inferência racional:

às vezes se diz que, como cada jogador pode pensar através das consider-
ações estratégicas dos outros jogadores, a simples racionalidade implicaria
a correta previsão do que os outros irão fazer. Entretanto, como visto, a
consequência desse “common knowledge”das racionalidades dos jogadores é
apenas que os jogadores devem jogar estratégias que sejam racionalizáveis,
mas nada além disto.

2. Equilíbrio de Nash como condição necessária se existe um único resultado previsto


para o jogo:

39
a idéia é que, se há um único resultado previsto para o jogo, então os jo-
gadores devem entendê-lo. E para que eles não tenham estímulos a desviar,
tal resultado deve ser um Nash. De outra forma: se os jogadores acham
que há um caminho óbvio de se jogar o jogo, então esse caminho deve ser
um equilíbrio de Nash. Este argumento é particularmente relevante quando
há apenas um equilíbrio de Nash no jogo: se supusermos que o equilíbrio
de Nash é esse caminho óbvio, então poderemos trabalhar com a hipótese
de que ele se constituirá realmente no seu resultado. Entretanto, apenas
“common knowledge das racionalidades”dos jogadores não é su…ciente para
isso, como visto. Além disso, o simples fato de que existe um equilíbrio de
Nash não faz com que ele se constitua necessariamente em uma justi…cativa
para que seja jogado, mesmo sendo único. Sendo assim, temos que encontrar
motivos que justi…quem a obviedade de se jogar um conjunto especí…co de
estratégias, especialmente se existem mais de um equilíbrio de Nash no jogo
em questão. Os outros ítens seguintes discutem esse ponto.

3. Pontos focais:

resultados focais podem ser culturalmente determinados, ou determinados


pelos costumes da comunidade/grupo dos agentes em questão. Por exemplo,
suponha o jogo de coordenação acima onde os dois jogadores são dois em-
presários de empresas de grande porte sempre realizam jantar de negócios
em restaurantes so…sticados. Caso eles queiram se encontrar urgentemente
para fechar algum negócio e não possam se comunicar, elas provavelmente
irão para o restaurante mais so…sticado, pois a…nal cada um deles sabe que
é o que o outro usualmente faz quando da necessidade de jantar de negócio.
Esse resultado, portanto, torna-se focal. Uma observação importante é que
todo ponto focal necessariamente é um equilíbrio de Nash, ou então não
poderia se constituir em um ponto focal (pois alguém iria querer desviar).
Obviamente nem todo equilíbrio de Nash é focal.

4. Negociação prévia:

supondo que os jogadores podem ter comunicação prévia, caso eles façam
algum acordo, esse resultado torna-se um caminho óbvio a se jogar. Como
os jogadores não têm obrigação de cumprir seus acordos (no caso de esses
serem apenas informais), para que eles sejam estáveis, as estratégias que os
compõe têm de constituir um equilíbrio de Nash.

5. Equilíbrio de Nash como uma convenção social estável:

40
se uma forma particular de jogar um jogo é jogada muitas vezes, pode emer-
gir um resultado que é uma convenção social estável. Ocorrendo isso, essa
convenção torna-se focal. Um exemplo típico é o lado a se andar de carro.
Em geral, se dirige à direita, e todos fazem isto. Na Inglaterra, por sua
vez, sempre se andou à esquerda, e isto permanece até hoje. Note que aqui
também temos que uma convenção social é estável se é equilíbrio de Nash.
Caso contrário, as pessoas teriam estímulos a desviar.

Exemplo 21
jogador 2
esquerda direita
jogador 1 alto 0; 0 2; 2
baixo 8; 9 2; 1

Nesse caso acima, temos dois equilíbrios de Nash, mas seria razoável imaginar que o
resultado do jogo será (baixo, esquerda), onde ambos os jogadores têm payo¤s superi-
ores aos que obteriam no outro equilíbrio de Nash16 . Isso é particularmente verdade se
os jogadores podem se comunicar antes de jogar, pois então seria bastante provável que
eles …rmassem um acordo (que seria self-enforcing) que gerassem o resultado (baixo,
esquerda).

Exemplo 22
jogador 2
esquerda direita
jogador 1 alto 0; 1 3; 2
baixo 2; 4 1; 0

Nesse jogo, assim como antes, temos dois equilíbrios de Nash. Mas agora não
podemos dizer que há um “caminho óbvio” a se jogar. Isto porque um equilíbrio de
Nash não é preferível ao outro pelos dois jogadores, como tínhamos antes. A previsão
do jogo, principalmente se não há comunicação antes de iniciá-lo, torna-se portanto
tarefa mais difícil.

Coordenação implícita Há outros casos onde pode ocorrer algum tipo de “coorde-
nação implícita” nas próprias regras do jogo. Vejamos o exemplo seguinte.

Exemplo 23 O jogo das listas. Há dois jogadores e nove …guras geométricas. É dado
o nome de uma delas a um jogador e o de uma outra …gura ao outro jogador, com
16
Em uma análise de equilíbrio (parcial), dizemos que o equilíbrio (baixo, esquerda) é Pareto-superior
ao equilíbrio (alto, direita) na medida em que no primeiro equilíbrio todos os jogadores estão pelo menos
tão bem quanto no segundo caso e ao menos um jogador está estritamente melhor - no caso, ambos
estão com maiores payo¤s.

41
o conhecimento de ambos. A proposta é que, sem comunicação, cada um faça em um
pedaço de papel uma lista com o nome de quaisquer das outras sete …guras. Entretanto,
ambos ganham um prêmio qualquer apenas se, unidas as duas listas, todas as …guras
estiverem incluídas, mas sem duplicação. Caso contrário, não ganham nada.

Vejamos uma possibilidade, caso numerarmos as …guras de 1 a 9, dando a de número


1 para o jogador 1 e a de número 9 para o jogador 2. Se a lista do jogador 1 contiver
as …guras 1, 2, 3, 4 e 5, enquanto a do jogador 2 se compuser de 9, 8, 7, 6 e 5, ambos
perdem: embora todas as …guras tenham sido incluídas, a 5 foi duplicada. O número
de possibilidades, como se percebe, é muito grande. Como os jogadores não podem se
comunicar, a probabilidade de a exigência das listas ser cumprida é muito próxima de
zero, caso elas sejam feitas aleatoriamente.
Entretanto, vejamos o que poderia ocorrer se as nove …guras fossem (quadrado,
triângulo, cubo, esfera, retângulo, pirâmide, cone, círculo e paralelepípedo) e a um
jogador fosse dado o quadrado e ao outro a esfera. Se foi você a receber o quadrado, o
que você faria, tendo alguns minutos para pensar? Uma possibilidade bastante provável
seria compor a sua lista com, além do quadrado, triângulo, retângulo e círculo, na
expectativa de que o outro jogador colocasse em sua lista todas as outras …guras, e
apenas elas. Por que isso poderia ser uma atitude razoável? Note que a você foi dada
uma …gura bidimensional, enquanto ao outro jogador foi concedida uma tridimensional.
Incluir na sua lista todas as outras …guras com duas dimensões, esperando que o outro
jogador tenha a mesma idéia e escolha apenas as com três dimensões pode ser uma
atitude racional, desde que se acredite que o outro jogador também possa ter a mesma
idéia.
É claro que outras possibilidades de tentativas de coordenação implícita poderiam
ocorrer. Você poderia, com o quadrado, escolher as …guras que possuem arestas,
supondo que as outras (esfera e círculo) fossem escolhidas pelo outro jogador. Na
verdade, todas as possibilidades que façam com que as listas se completem perfeita-
mente e sem sobreposição constituem equilíbrios de Nash. Portanto, existe um número
muito grande deles, embora o número de resultados possíveis seja muito superior. As-
sim, para se tentar alcançar um dos equilíbrios com uma probabilidade não tão próxima
de zero, isso seria possível apenas caso se encontrasse caminhos com alguma “lógica”,
como a comentado acima17 .

Exemplo 24 Em um exemplo muito parecido com um caso analisado acima, dois jo-
gadores escrevem, simultaneamente, um número natural entre zero e mil. Caso a soma
dos dois números não ultrapasse mil, cada um recebe, em unidades monetárias, um valor
17
Como seria o caso se, ao invés das …guras, tivéssemos uma lista de países? A lista é: Inglaterra,
Argentina, Uruguai, Itália, Brasil, França, Alemanha, Paraguai, Portugal. Você recebe Brasil e o
oponente Portugal. Qual(is) seria(m) o(s) equilíbrio(s) de Nash do jogo?

42
correspondente ao número que escreveu. Caso a soma seja maior que mil, ninguém re-
cebe nada. Qual(is) é(são) o(s) equilíbrio(s) de Nash deste jogo? Algum deles pode ser
considerado focal?

Quanto aos equilíbrios de Nash, neste caso existem simplesmente mil e um deles,
correspondentes a todos as estratégias dos jogadores que, conjuntamente, somem exata-
mente mil: em todos esses casos, nenhum dos jogadores poderá aumentar o seu payo¤.
O conceito de equilíbrio de Nash, portanto, diz muito pouco a respeito do provável
resultado da interação. Todavia, parece razoável imaginar um ponto focal onde cada
um escreva 500 em seus papéis, baseando-se em alguma vaga noção de justiça inerente
a maioria das pessoas. Esse foi, de longe, o resultado mais encontrado quando …zemos
experiências em sala com alunos da PUC-Minas. E isso ocorreu tanto quando foi per-
mitido uma coordenação prévia entre os jogadores, mas também quando isso não foi
permitido.
Em geral, se os jogadores já se interrelacionam há algum tempo, pode-se criar um
modo usual de se jogar. Em situações econômicas, muitas vezes isso ocorre, o que
facilita a análise do jogo, ainda que ele tenha mais de um equilíbrio de Nash.

Ponto focal Como discutimos acima, um “problema”recorrente em teoria dos jogos


diz respeito ao fato de que o equilíbiro de Nash não é único. A questão que emerge
desse fato é com relação à previsão do resultado do jogo: uma vez que há mais de um
Nash em um jogo, será que a probabilidade de se jogar um deles é maior do que os
demais? É a mesma?
Uma forma de abordar essa questão é analisar se há algum ponto focal em um jogo.
Basicamente o que fazemos é re…nar a noção de equilíbrio de Nash, no sentido de buscar
algum tipo de informação exógena ao jogo que nos permita fazer alguma inferência não
sobre os equilíbrios de Nash do mesmo, mas sobre a verossimilhança de se jogar ou
eliminar alguns desses equilíbrios. Um ponto focal portanto é um equilíbrio de Nash
de um jogo que exibe algum tipo de dominância sobre os demais. E essa dominância
decorre de alguma informação exógena ao jogo, informação essa que diz respeito à
hábitos, costumes, tradições, normas (social ou legal) etc e é de conhecimento comum.

Exemplo 25 No jogo de coordenação - já discutido acima - dois empresários mar-


caram um jantar de negócios mas deixaram o lugar desse jantar em aberto e perderam
a comunicação. Vimos que no jogo há dois equilíbrios de Nash e não sabemos qual será
jogado. Mas se temos a seguinte informação, de conhecimento comum aos jogadores,
"os jogadores têm o hábito de frequentar restaurantes so…sticados", então podemos dizer
que o equilíbrio (Antiquarius, Antiquarius) é um ponto focal.

Exemplo 26 No Guerra dos Sexos. O que você diria se nesse jogo houvesse a seguinte
informação: "o jogo será jogado no Irã"?

43
Exemplo 27 Dirigir no Brasil ou em algum país da Comunidade Britânica.

jogador 2
esquerda direita
jogador 1 esquerda 0; 0 100; 100
direita 100; 100 0; 0

Suponha que dois jogadores trafegam em uma estrada em direções opostas. Ao


se encontrarem, devem decidir em que lado da estrada tomar, esquerda ou direita.
Há dois equilíbrios de Nash nesse jogo, ambos jogarem "direita"ou ambos jogarem
"esquerda", caso contrário haveria alguma colisão e os jogadores incorreriam em perdas.
Mas se o jogo fosse jogado no Brasil, podemos dizer que (direita, direita) é um ponto
focal. Mas se houvesse a informação de que o jogo "é jogado na Inglaterra", então
(esquerda, esquerda) seria um ponto focal.

2.4 Estratégias Mistas


Até aqui, estamos supondo que cada jogador escolhe determinada estratégia de
modo determinista, i.e., ele a escolhe ou não para jogar. Nenhuma possibilidade de
randomização (aleatorização) entre suas estratégias possíveis foi aberta. Portanto,
em jogos como o Par ou Ímpar, por exemplo, não encontramos nenhum conjunto de
estratégias que constitua um equilíbrio de Nash. Outro exemplo é o pôquer: se um
jogador nunca blefa, os outros sempre se dirigirão a ele de modo impetuoso e não
aceitarão qualquer aposta caso ele queira apostar. Iisso faz com que blefar passe a ser
uma boa resposta para tal jogador. Entretanto, se ele blefar sempre, os outros passarão
a sempre aceitar suas apostas e blefar não será mais uma resposta ótima. De fato, em
todo jogo onde cada jogador quer “enganar”o(s) outro(s), não existe equilíbrio de Nash
como de…nido antes, considerando apenas estratégias puras, porque a solução do jogo
envolve incerteza a respeito do que o outro irá fazer. Para superar problemas como
esse, insere-se a noção de estratégias mistas18 .

De…nição 28 Iremos referir aos elementos do espaço de estratégias de cada jogador


como as estratégias puras do jogador. Logo, as estratégias puras de um jogador são
as diferentes ações que ele pode tomar.

De…nição 29 Uma estratégia mista para um jogador é uma distribuição de probabili-


dade sobre (algumas ou todas) as estratégias pertencentes ao seu espaço de estratégias.

Ou seja, uma estratégia mista especi…ca probabilidades para estratégias puras, de-
notando que essas serão escolhidas não de modo determinista, mas probabilístico. Ob-
viamente, o somatório das probabilidades é igual a um. Note também que que uma
18
Para uma formalização mais rigorosa dos conceitos associados à estratégias mistas, ver o apêndice.

44
estratégia pura nada mais é que uma estratégia mista degenerada, no sentido de que
ela especi…ca probabilidade um para um elemento do conjunto de estratégias e zero
para todos os outros.

Exemplo 30 (Par ou ímpar): as estratégias puras de cada jogador são jogar par ou
ímpar. Uma estratégia mista é a distribuição de probabilidade (p; 1 p), onde p 2 [0; 1]
é a probabilidade de se jogar par e (1 p) é a probabilidade de se jogar ímpar. A
estratégia mista (0, 1), por exemplo, é simplesmente a estratégia pura de se jogar
ímpar.

Exemplo 31 Em um jogo onde um jogador tenha três estratégias puras possíveis (A; B; C),
uma estratégia mista é a distribuição de probabilidade (p; q; 1 p q), onde p 2 [0; 1],
q 2 [0; 1] e (p + q) 2 [0; 1]. A estratégia pura B, por exemplo, seria representada por
(0; 1; 0). Por sua vez, se esse jogador jogasse cada uma delas com a mesma chance,
teríamos a estratégia mista (1=3; 1=3; 1=3).

De…nição 32 Um jogo pode ser representado na sua forma normal ou estratégica, com
a possibilidade de se adotar estratégias mistas. A diferença agora é que incorporamos
a possibilidade de que o jogador aleatorize ao fazer as suas escolhas.

A possibilidade de se utilizar estratégias mistas não foi, obviamente, apresentada


apenas para so…sticar o texto. Como seria de se esperar, ela nos permite avançar em
nosso objetivo de determinar qual será o resultado de um jogo.

Exemplo 33 Seja o seguinte jogo (onde representamos, para simpli…car, apenas os


payo¤ s do jogador 1):
jogador 2
D E
A 5; 0;
jogador 1 B 0; 5;
C 2; 2;

Aqui, independentemente da estratégia ( D ; E ) = (1 E ; E ), E 2 [0; 1], ado-


tada pelo jogador 2, o jogador 1 não escolhe C. Com a possibilidade de estratégias
mistas, isto signi…ca que a estratégia C é estritamente dominada. Entretanto, note que
ela não é estritamente dominada nem por A e nem por B isoladamente. Mas é, por ex-
emplo, pela estratégia mista que coloca A com 50% e B com 50% (que implica um payo¤
de 2,5 em qualquer hipótese): seja a estratégia mista = ( A ; B ; C ) = (0:5; 0:5; 0).
O payo¤ (esperado) do jogador 1 jogando tal estratégia será

u1 ( ) = ( E 0:5) 5 + ((1 E) 0:5) 5 =


= 2:5 E + 2:5 2:5 E = 2:5

45
Independentemente portanto do valor de E (a probabilidade do jogador 2 escolher E).
Tal estratégia é, portanto, preferível em relação à estratégia pura C.
Antes tínhamos que, se uma estratégia fosse dominada, ela nunca seria jogada e
portanto não seria racionalizável. Agora temos também o reverso dessa proposição: se
ela nunca será jogada, então ela é dominada, ainda que seja por uma estratégia mista,
como visto no exemplo acima19 .
Outra característica a se destacar é que uma estratégia pura pode ser a melhor
resposta a uma estratégia mista, ainda que não seja a melhor resposta a nenhuma
estratégia pura. A veri…cação de estratégias que nunca serão melhores respostas …ca,
portanto, mais sutil, pois torna-se necessário veri…car também as possibilidades de
respostas à estratégias mistas do(s) outro(s) jogador(es).

Exemplo 34
jogador 2
D E
A 5; 0;
jogador 1 B 0; 5;
C 4; 4;

Nesse jogo, para o jogador 1, C não é a melhor resposta para E e nem para D.
Todavia, é a melhor resposta, por exemplo, para a estratégia mista ( D ; 1 D ), D 2
1 4 20
5; 5 .
A caracterização anterior de equilíbrio de Nash considerava apenas estratégias puras
como possibilidades. Contudo, podemos também incorporar o conceito de estratégias
mistas para determinar o equilíbrio de Nash. Nesse sentido, um conjunto de estratégias
mistas = ( 1 ; :::; n ) constitui um equilíbrio de Nash (em estratégias mistas) em um
jogo estático de informação completa se, para cada jogador, a estratégia mista que ele
adotou for a melhor respostas às estratégias mistas jogadas pelos demais jogadores.
Portanto segue que que o conceito de equilíbrio de Nash é exatamente o mesmo de
antes. A diferença é que agora permite-se também a utilização de estratégias mistas.

Observação 35 Um resultado fundamental de equilíbrio de Nash com estratégias mis-


tas é o que diz que um jogador que utiliza uma estratégia mista que compõe um equilíbrio
de Nash pode obter o mesmo payo¤ que obteria jogando-a se utilizar apenas uma (qual-
quer uma delas) das estratégias puras que compõem a estratégia mista (dado que os
19
Entretanto, esse resultado vale apenas para o caso de dois jogadores, que é aquele com que trabal-
haremos na maior parte dos casos.
20
Compare os payo¤s de se jogar isoladamente A, B ou C, supondo que o jogador 2 possa estar
jogando uma estratégia mista. Conclua então que, se tal estratégia mista respeitar o princípio aqui
referido, de não colocar probabilidade maior que 4=5 em nenhuma de suas possíveis ações (faça as
contas!), então de fato B torna-se a melhor resposta a essa estratégia mista.

46
outros jogadores permanecem jogando suas estratégias de equilíbrio). Além disso, todas
elas provêem o mesmo payo¤ , que é maior ou igual ao payo¤ obtido caso se utilizasse
outra estratégia pura que não compõe a estratégia mista do equilíbrio de Nash (também
supondo que os outros jogadores permaneçam jogando suas estratégias de equilíbrio).

O que essa observação nos sugere é uma maneira mais fácil de computar o equi-
líbrio de Nash em estratégias mistas. Se o ganho esperado de um jogador quando é
jogado o equilíbrio em estratégias mistas é igual ao seu ganho esperado se ele adotar
uma estratégia pura e os demais jogadores jogarem o equilíbrio em estratégias mistas,
então basta nos ater ao segundo caso para gerarmos o resultado. Com relação ao se-
gundo ponto, o argumento é trivial. Vamos organizar essas assertativas em forma de
proposições que serão importantes pelos motivos acima sugeridos.

Proposição 36 Sem perda de generalidade21 , considere um jogo 2 2 na forma nor-


mal. Nesse jogo, seja Si = (si1 ; si2 ) o espaço de estratégias do jogador i = 1; 2,
= ( 1 ; 2 ) um equilíbrio de Nash com estratégias mistas do jogo e i = ( i1 ; i2 ) a
escolha de i = 1; 2. O ganho esperado de um jogador i qualquer - por exemplo o jogador
1 - quando todos jogam o equilíbrio de Nash, será

u1 ( )= 11 21 u1 (s11 ; s21 )+ 11 22 u1 (s11 ; s22 )+ 12 21 u1 (s12 ; s21 )+ 12 22 u1 (s12 ; s22 )

é igual ao seu ganho esperado se ele jogasse alguma estratégia pura dado que o oponente
jogou alguma estratégia de equilíbrio,

u1 (s11 ; 2) = 21 u1 (s11 ; s21 ) + 22 u2 (s11 ; s22 ) :

Analogamente isso é verdade relativamente a qualquer estratégia que compõem o equi-


líbrio com estratégias mistas. Nesse caso 2 2,

u1 (s12 ; 2) = 21 u1 (s12 ; s21 ) + 22 u2 (s12 ; s22 )

tal que
u1 (s11 ; 2) = u1 (s12 ; 2) = u1 ( ).
O mesmo é verdade para o jogador 2:

u2 ( 1 ; s21 ) = u2 ( 1 ; s22 ) = u2 ( ).

Prova. (Demonstração informal) Suponha que jogar duas das estratégias puras
que compõem a mista que é equilíbrio de Nash dê payo¤s diferentes. Então o jogador
preferirá jogar apenas a que lhe confere maior utilidade e consequentemente a estratégia
mista não pode ser equilíbrio de Nash, o que contradiz a hipótese original e portanto não
21
A Proposição vale para todo jogo …nito. Esse formato é apenas para facilitar a compreensão.

47
pode ser verdadeiro. Temos então que o payo¤ obtenível utilizando a mista ou qualquer
das puras que ela contém confere o mesmo payo¤ para o jogador, uma vez que os outros
mantêm suas estratégias de equilíbrio de Nash. Isso …cará claro no exemplo abaixo,
quando mostramos que isso é verdade em um jogo de coordenação.

Proposição 37 O payo¤ que se obtém jogando qualquer estratégia (pura ou mista)


que compõe o(s) equilíbrio(s) de Nash de um jogo estático de informação completa é
maior ou igual ao payo¤ que se obteria adotando qualquer estratégia pura que não
pertence ao equilíbrio de Nash, supondo que os demais jogadores jogam suas estratégias
de equilíbrio.

Prova. (Demonstração informal) Suponha que a utilidade de se usar uma estratégia


que não compõe a estratégia mista de equilíbrio de Nash seja maior que o payo¤ de se
utilizar apenas uma das estratégias que compõem a estratégia mista de equilíbrio de
Nash. Então não vale a pena jogar a estratégia mista que contém uma estratégia pior
do que a estratégia pura que não a integra, o que implica que a estratégia mista não
constitui um equilíbrio de Nash, contradizendo a hipótese inicial e não podendo, assim,
ser verdadeiro.
Portanto temos que se um conjunto de estratégias mistas é equilíbrio de Nash
do jogo, para cada jogador, dada as estratégias dos oponentes, é indiferente jogar as
estratégias puras que constituem a estratégia mista ou ela mesma, e é pelo menos tão
bom jogar uma das puras que constituem a mista a jogar qualquer outra estratégia
pura que não faz parte da mista.
Uma consequência importante das proposições acima é que, para testar se um con-
junto de estratégias constitui um equilíbrio de Nash, basta considerar os possíveis
desvios em estratégias puras. Caso nenhum jogador possa aumentar seu payo¤ jo-
gando alguma outra estratégia pura, então é um Nash, facilitando a computação do
equilíbrio em estratégias mistas.

Exemplo 38 Encontre o equilíbrio de Nash com possibilidade de estratégias mistas no


jogo Par X Ímpar:
jogador 2
P I
jogador 1 P 1; 1 1; 1
I 1; 1 1; 1

Como já visto antes, no jogo acima não existe um conjunto de estratégias puras que
formem um equilíbrio de Nash. Todavia, podemos encontrar algum equilíbrio de Nash
se possibilitarmos que se joguem estratégias mistas. Para tanto, devemos proceder da
forma apresentada abaixo.

48
Primeiro calcula-se o payo¤ de um dos jogadores quando ele escolhe apenas estraté-
gias puras, mas possibilitando o outro de escolher mistas. No caso do Par X Ímpar,
as estratégias puras possíveis são apenas duas, par (P ) ou ímpar (I). Começaremos
observando a estratégia do jogador 1 supondo que ele jogou par e depois ímpar:

u1 (P; 2) = 1 2P 1 (1 2P )

u1 (I; 2) = 1 2P +1 (1 2P )

Para que ele queira aleatorizar, 2P deve ser tal que

u1 (P; 2) = u1 (I; 2)

onde 2 = ( 2P ; 2I ) é a distribuição de probabilidade que 1 associa ao comportamento


de 2. Segue que 2P = 2I = 0:5.
Portanto, para que o jogador 1 aleatorize, é necessário que o jogador 2 jogue par (e
ímpar) com probabilidade 0:5. De fato, vemos que se isso ocorre, qualquer coisa que
1 faça lhe dará o mesmo payo¤ esperado, de zero. Por sua vez, a condição para que o
jogador 2 aleatorize ("randomize") é que o outro jogador, 1, faça também 1P = 0:5,
uma vez que o jogo é simétrico. O equilíbrio de Nash deste jogo é, pois,

( 1; 2) = ((0:5; 0:5) ; (0:5; 0:5))

onde ambos escolherem par ou ímpar com probabilidade de 50% cada.

Exemplo 39 Considere mais uma variação do jogo “Encontro no Rio”. Agora, temos
um jovem casal querendo se encontrar para uma “namoradinha”. Eles têm duas opções
para o encontro: botecos do Centro da cidade ou um local do Leblon. Os dois não
podem se comunicar, e como é um namoro recente, nenhum dos dois resultados pode
ainda ser considerado um ponto focal, ou algo a…m (eles não sabem ainda o “estilo”
do outro). A representação do jogo na forma normal é:

garota
Leblon Centro
rapaz Leblon 10; 10 0; 0
Centro 0; 0 4; 4

Procuremos encontrar o conjunto do total de equilíbrio de Nash deste jogo, tanto em


estratégias puras quanto mistas. Os dois de estratégias puras são visíveis, mas vejamos
uma forma mais geral de visualização, grá…ca, que em geral facilita a resolução do
problema (a ser feita).
Nos eixos verticais do desenho acima está representado o payo¤ esperado da garota,
para cada estratégia (pura) que ela porventura resolva utilizar. Os payo¤s obviamente

49
dependerão da estratégia (ou, da mesma forma, da probabilidade escolhida entre ir ao
Centro ou ao Leblon) do outro jogador - o rapaz, representada no eixo horizontal.
O que temos então no caso acima: se a probabilidade do rapaz ir ao Leblon for
menor que r (L), o melhor para garota será ir para o Centro com certeza, o que
pode ser visto pelas linha de payo¤s. Se ela faz isso, o melhor para o rapaz é fazer
r (S) = 0, como se vê na matriz. Então um Nash é, de fato, (C; C), um Nash em
estratégias puras. O mesmo raciocínio aplica-se ao equilíbrio de Nash (L; L). Mas há
também um equilíbrio de Nash em estratégias mistas. Para encontrá-lo, primeiramente
vamos calcular r (L). Ele deve ser tal que iguale o payo¤ da garota em jogar cada
uma das estratégias, dado r (L):

ug (C; r (L)) = ug (L; r (L))


4 (1 r (L)) + 0 = 10 r (L) + 0
2
r (L) =
7
Como o jogo é simétrico, o raciocínio é o mesmo para ambos os jogadores, rapaz e
garota. Portanto, um outro equilíbrio de Nash é cada um ir ao Leblon com probabili-
dade 2/7: ( r (L) = 2=7; g (L) = 2=7).
Para aplicarmos a Proposição (???) acima, note que o ganho esperado de r (como
o jogo é simétrico, o mesmo valerá para g) quando ambos jogam o equilíbrio em es-
tratégias mistas é

2 2 2 5 5 2 5 5 20
ur r; g = 10 + 0+ 0+ 4=
7 7 7 7 7 7 7 7 7

Da mesma forma o seu ganho esperado quando joga cada uma das estratégias puras
que compõe o equilíbrio com estratégias mistas é dado por
(
ur r (L) ; g = 27 10 + 57 0 = 20 7
ur r (C) ; g = 72 0 + 57 4 = 20 7

onde, podemos ver,

ur r; g = ur r (L) ; g = ur ( r (C) ; r)

E analogamente para o outro jogador (veri…que),

ug r; g = ug ( r; g (L)) = ug ( r; g (C))

Exemplo 40 Vejamos agora um exemplo de um jogo não simétrico. Suponha a pos-


sibilidade de um pênalti e, para simpli…car, que os jogadores envolvidos (o cobrador e
o goleiro) tenham apenas duas estratégias puras possíveis: escolher direita ou esquerda

50
(o primeiro para chutar a bola e o segundo para pular na hora da cobrança). Suponha
que seja sabido que o goleiro seja mais ágil para saltar para a direita, enquanto para o
cobrador o lado, em princípio, não faça diferença. A representação na forma normal
é a seguinte:
goleiro
E D
cobrador E 6; 6 3; 3
D 2; 2 9; 9

A idéia é que números maiores para cada um deles denota uma maior probabilidade
de sucesso na cobrança. Assim, o cobrador chutar à direita e o goleiro pular para esse
mesmo canto é o resultado que maximiza o payo¤ do goleiro e minimiza o do jogador,
pois trata-se da situação onde há maiores probabilidades de o goleiro defender o pênalti.
Por outro lado, a melhor situação para o jogador (e pior para o goleiro) seria um chute
à esquerda, com o arqueiro indo para o outro lado. Na representação acima …ca claro
que, em estratégias puras, não existe nenhum equilíbrio de Nash. Pelo teorema de
Nash sabemos então que pelo menos um em estratégias mistas existirá. Para começar
a análise, olhemos o diagrama para o goleiro (fazer!!!).

Podemos concluir também pelo diagrama a ausência de equilíbrio de Nash com


estratégias puras (embora ainda tenhamos que ver a representação para os payo¤s do
cobrador também). Caso a probabilidade do jogador chutar à direita for menor que
c (D), nota-se que o melhor para o goleiro será pular para a esquerda com 100% de
chances. Entretanto, caso ele faça isso, para o jogador o melhor será chutar à direita com
probabilidade 1 ( c (D) = 1), e portanto a hipótese original de c (D) menor que c (D)
não se veri…ca. Raciocínio análogo pode ser feito para o caso onde c (D) > c (D).
Mas procuremos um equilíbrio de Nash em estratégias mistas. Para que o goleiro
…que indiferente entre suas opções possíveis de estratégias, é necessário que o cobrador
chute à direita com a exata probabilidade de c (D). Como pode ser visto no diagrama
acima, essa constitui a única possibilidade que faz com que o payo¤ do arqueiro seja o
mesmo, independente do que ele faça. Então, para calcular o seu valor basta igualar
esses payo¤s: faça e encontre c (D) = 0:4.
Portanto, caso o cobrador cobre a penalidade máxima à direita com probabilidade
de 40%, para o goleiro será indiferente entre pular para esquerda ou direita. Mas essa é
apenas metade da estória. Falta veri…car o que faria com que o jogador utilizasse essa
estratégia mista. Como já mostrado, para que ele utilize uma estratégia mista no equi-
líbrio, será necessário que ele seja indiferente entre utilizar a própria estratégia mista e
as estratégias puras que ela contém. Então temos que saber o que o faria ser indiferente
entre as duas estratégia puras possíveis. Para melhor visualização, apresentaremos o
diagrama de payo¤s para o cobrador (fazer). Calculando g (D) = 0:3.

51
O equilíbrio em estratégias mistas será dado por

c = (0:6; 0:4) ; g = (0:7; 0:3)

Assim, caso o goleiro salte para a direita com probabilidade de 30%, o cobrador …cará
indiferente entre qual lado escolher para chutar a bola. Portanto, temos que o único
equilíbrio de Nash desse jogo é o jogador bater o pênalti à direita com 40% de proba-
bilidade e o goleiro pula para esse lado com 30% de chances. Qualquer desvio dessas
probabilidades de um dos envolvidos fará com que o outro não mais …que indiferente
entre suas estratégias puras, escolhendo uma delas com probabilidade de 100%, o que
fará com que o primeiro também altere sua escolha anterior e assim inde…nidamente,
caracterizando a ausência de outros resultados que caracterizem um equilíbrio de Nash.

Exemplo 41 Vejamos agora um caso um pouco mais complexo, que envolve mais de
duas estratégias puras para um dos jogadores, baseado em exemplo parecido apresentado
em Kreps (1994):

jogador 2
C D E
jogador 1 A 1; 100 100; 1 0; 0
B 100; 1 1; 100 0; 0
Como solucionar esse jogo??? Dê uma olha e veri…que como uma pequena alteração
na estrutura do jogo (agora passamos a ter um jogo onde um dos jogadores, o jogador
2, tem um espaço de estratégias com três elementos, C; D e E) pode complicar de uma
forma signi…cativa a busca do equilíbrio.

Note que no jogo acima não há nenhum Nash em estratégias puras, o que, pelo
teorema da existência do equilíbrio em jogos …nitos, nos garante que haverá pelo menos
um equilíbrio em estratégias mistas. Devemos começar procurando condições que façam
com que os jogadores …quem indiferentes entre estratégias puras, o que torna possível
a utilização de estratégias mistas (em situações de equilíbrio). O processo aqui é mais
trabalhoso porque um dos jogadores possui três alternativas de escolhas de estratégias
puras.
Os payo¤s do jogador 2 em cada situação, dado que o jogador 1 joga A com a
probabilidade genérica 1 (A), são

u2 ( 1 (A) ; C) = 100 1 (A) + 1 (1 1 (A))

u2 ( 1 (A) ; D) = 1 1 (A) 100 (1 1 (A))

u2 ( 1 (A) ; E) = 0

A randomização do jogador 2 poderá ser entre as três estratégias puras possíveis a ele
ou entre um par delas. Todas essas possibilidades têm de ser observadas.

52
o jogador 2 é indiferente entre C e D tal que

100 1 (A) + 1 (1 1 (A)) =1 1 (A) 100 (1 1 (A))


1 (A) = 0:5

A condição para o jogador 2 aleatorizar entre C e D é a citada acima. Todavia,


com 1 (A) = 0:5, é preferível para o jogador 2 jogar E: com C ou D o seu payo¤
é menor que zero, que ele tem com certeza ao jogar E. Portanto, não há equilíbrio
com o jogador 2 randomizando entre C e D22 .

o jogador 2 indiferente entre C e E tal que

100 1 (A) + 1 (1 1 (A)) =0


1
1 (A) = 101

1
Como 1 (A) = 101 , u2 ( 1 (A) ; C) = u2 ( 1 (A) ; E) = 0 > u2 ( 1 (A) ; D) =
1 100
101 100 101 = 1 101
10000
. Portanto, é possível que o jogador 2 randomize entre
C e E.

jogador 2 é indiferente entre D e E. Logo

1 1 (A) 100 (1 1 (A)) =0


100
1 (A) = 101

Como 1 (A) = 100 101 , u2 ( 1 (A) ; D) = u2 ( 1 (A) ; E) = 0 > u2 ( 1 (A) ; C) =


100
100 101 + 1 100101 = 10000
100 + 1
100
101 . Portanto, também é possível que o jogador 2
randomize entre D e E.
Por outro lado, vejamos as condições de randomização para o jogador 1. Os payo¤s
do jogador 1 em cada situação, dado que o jogador 2 joga C com probabilidade 2 (C),
D com probabilidade 2 (D) e E com probabilidade (1 2 (C) 2 (D)), são

u1 (A; 2 (C) ; 2 (D)) = 1 2 (C) 100 2 (D) +0


u1 (B; 2 (C) ; 2 (D)) = 100 2 (C) +1 2 (D) +0
22
Para avaliar a possibilidade de um equilíbrio de Nash com estratégias mistas, devem ser consid-
eradas as duas condições enunciadas e (informalmente) demonstradas no texto: (1) de que o jogador
que utiliza uma mista em um equilíbrio de Nash deve ser indiferente entre as puras que a compõe; e
(2) que elas devem gerar um payo¤ no mínimo igual ao que poderia ser obtido caso ele utilizasse uma
outra estratégia pura disponível. Quando há apenas duas estratégias puras possíveis para um jogador,
veri…car a primeira condição é su…ciente. Contudo, se há mais de duas possíveis, é necessário observar
também a segunda. Como visto neste exemplo, pode ocorrer que um jogador seja indiferente entre
duas estratégias em determinadas circunstâncias, mas que nesses casos exista uma terceira (ou quarta,
quinta etc.) possibilidade mais vantajosa, de modo que a indiferença entre as duas estratégias passa a
não signi…car nada em termos de equilíbrio.

53
O jogador 1 …cará indiferente entre A e B se o payo¤ jogando cada uma dessas
possibilidades for o mesmo:

1 2 (C) 100 2 (D) = 100 2 (C) +1 2 (D)


2 (C) = 2 (D)

O jogador 1 irá randomizar apenas se a probabilidade do jogador 2 jogar D ou C for


a mesma. Analisando essa possibilididade, façamos 2 (C) = 2 (D) = k, onde k 0.
A utilidade do jogador 2 fazendo isto será: dada por

u2 (k; k; 1 2k) = 1 (A) ( 100k + k + 0) + (1 1 (A) (k 100k + 0)) = k 100k

Escolhendo o k possível que maximiza a expressão acima23 temos k = 0, o que


implica que, se o jogador 2 coloca a mesma probabilidade em jogar as estratégias C e
D (a condição para o jogador 1 randomizar), então ele irá jogar E com certeza (uma
vez que 1 2k, com k = 0, é igual a um)24 .
Mas, para o jogador 2 não ter incentivos a desviar da estratégia de jogar E com
certeza, 1 (A) tem que ser tal que E seja a melhor resposta para o jogador 2. Portanto,
o conjunto de estratégias que constituem equilíbrio de Nash é o jogador 2 jogar E e o
1
jogador 1 aleatorizar entre A e B, desde que 1 (A) não seja inferior a 101 e não seja
100
superior a 101 . Note que se 1 (A) não estiver nesse intervalo, não valeria a pena para
o jogador 1 jogar E, e sim C ou D. Sendo assim, temos aqui um caso não com um,
dois ou três, mas in…nitos equilíbrios de Nash, onde em todos eles o jogador 2 escolhe
uma estratégia pura (E) e o jogador 1 escolhe qualquer uma das mistas possíveis desde
1 100
que 1 (A) 2 101 ; 101 . O equilíbrio de Nash portanto é
(
1 100
1 = ( 1 (A) ; 1 1 (A)) tal que 1 (A) 2 101 ; 101

2 = (0; 0; 1)

Vejamos a abordagem grá…ca do problema25 . (Fazer)


No desenho acima, está representado o payo¤ do jogador 2, com ele jogando cada
uma de suas três possibilidades para cada probabilidade possível que o jogador 1 der às
1 100
suas estratégias puras. Note que com 1 (A) 2 101 ; 101 , o melhor para o jogador 2 é
jogar E com probabilidade um. Como isto faz o payo¤ do jogador 1 (assim como o do
jogador 2) igual a zero com certeza, ele pode randomizar entre suas opções e então temos
1
os equilíbrios de Nash encontrados acima. Por sua vez, com 1 (A) < 101 , o jogador
23
A solução do problema do jogador 2, de maxu2 (k; k; 1 2k) = 99k é tal que k = 0.
k
24
O que já era possível de se perceber quando derivamos a condição para o jogador 2 ser indiferente
entre C e D: nesse caso, seria melhor para ele jogar E com certeza, o que acabamos de obter aqui.
25
Note que não é possível (pelo menos bidimensionalmente) apresentar gra…camente o payo¤ do
jogador1 segundo as estratégias possíveis do jogador 2, uma vez que esse último possui três estratégias
puras disponíveis.

54
2 pre…rirá estritamente a opção C, e então o jogador 1 jogará A com probabilidade
um, que corresponde à extrema direita do desenho e portanto não é compatível com a
1
hipótese utilizada de 1 (A) < 101 . Raciocínio análogo aparece no caso de 1 (A) > 100
101 .
Uma nota importante a respeito de estratégias mistas que constituem equilíbrios
de Nash é o fato de que os jogadores, como assinalado acima, não têm preferências
em jogar a estratégia mista ou alguma das estratégias puras que a constitui. Além
disso, o que determina as probabilidades em que os jogadores randomizam é a necessi-
dade do outro(s) jogador(es) …car(em) indiferente(s) entre as estratégias em que ele(s)
coloca(m) probabilidade positiva na(s) sua(s) estratégia(s) mista(s). Isto leva ao fato
de se questionar o porquê de um jogador se preocupar em aleatorizar, dado que isso
não incrementaria seu payo¤ esperado. Se o jogo for jogado várias vezes, torna-se fácil
de se perceber a vantagem do comportamento aleatório, pois não procedendo assim
o(s) outro(s) jogador(es) explorarão em proveito deles essa previsibilidade de compor-
tamento (lembre, por exemplo, o caso do pôquer citado no início da seção). No caso de
um jogo que não irá mais se repetir (ao menos com uma certa probabilidade), a questão
torna-se mais delicada. Uma resposta possível é que, na realidade, as pessoas em geral
não aleatorizam. O que elas fazem é guiarem-se por alguns sinais inconsequentes (para
o jogo em si) e, a partir daí, de…nem suas opções. O importante é que o outro jogador
não perceba o signi…cado de tais sinais e enxergue o primeiro como se ele estivesse
aleatorizando. Voltemos ao exemplo do goleiro à frente de uma penalidade máxima.
Pode ser que o jogador saiba em que lado ele irá chutar. Mas como o goleiro não tem
essa informação, pode acreditar que o jogador irá aleatorizar de alguma forma, e apenas
isso já seria su…ciente para justi…car um comportamento aleatório de sua parte.

2.5 Aplicações
Nessa seção apresentaremos algumas aplicações do conceito de equilíbrio de Nash.
Temos, ao fazer isso, dois objetivos em mente. O primeiro é mostrar o quanto pode
ser útil a utilização da linguagem de teoria dos jogos em situações descritas a partir
do comportamento de agentes econômicos bem de…nidos, como por exemplo as …rmas
que compõem um determinado oligopólio. O segundo obejtivo é apresentar a teoria
de escolha sob interdependência estratégica a partir de espaços de estratégias tão ricos
quanto se queira. Ou seja, vamos trocar as situações descritas nos exemplos apresenta-
dos no texto até aqui, em que cada jogador tem no máximo cinco estratégias disponíveis,
por casos em que há um contínuo de possibilidades de escolha. O nosso foco principal
será a teoria de concorrência imperfeita, quando trataremos de alguns modelos canôni-
cos de oligopólio e cartel. No entanto também discutiremos uma interessante situação
de …nanciamento e provimento de um bem público.

55
2.5.1 Oligopólio de Cournot

Um oligopólio é uma estrutura de mercado intermediária entre os casos limites de


monopólio e de competição perfetia. Nesse sentido a de…nição decorre de imediato: em
um oligopólio há um número de …rmas n > 1 tal que nenhuma das …rmas é capaz,
sozinha, de determinar o preço do produto no mercado (como seria o caso de um
ambiente monopolista) mas no entanto cada uma dessas …rmas é capaz de in‡uenciar
em alguma medida o preço que se estabelecerá.
O modelo de Cournot é um dos mais tradicionais modelos de oligopólios existentes
na literatura. Embora originalmente, no trabalho de Cournot (1897, com a primeira
edição em 1838), não tenha sido utilizado o conceito de equilíbrio de Nash (dado que
esse não havia nem mesmo sido de…nido), a abordagem é necessariamente de teoria
dos jogos - assim como é a maior parte da literatura moderna de organização indus-
trial26 . A hipótese básica do modelo é que os jogadores (as …rmas envolvidas) escolhem
isoladamente a quantidade a se produzir, ignorando a escolha da(s) outra(s) …rma(s).
O preço de mercado torna-se, portanto, endógeno: dada a quantidade total produzida
no mercado, ele é de…nido com base na demanda agregada do setor. Outra hipótese
é que os produtos de cada …rma não são diferenciados27 pelos consumidores, i.e., são
homogêneos. De…niremos as funções de custo de cada …rma e a de demanda do mer-
cado da maneira mais simples possível, assim como faz Gibbons (1992), de modo a
evitar “algebrismos” desnecessários e a destacar o mais importante, que é o processo
de resolução do modelo.
Segue então que o modelo de Cournot diz respeito a um jogo estático onde as …rmas
escolhem simultâneamente o quanto produzir. Ainda que numa primeira aproximação
possa parecer estranho conceber …rmas decidindo simultâneamente, como num jogo
de par ou ímpar, isso tem uma apelo intuitivo imediato: signi…ca apenas que cada
…rma, ao fazer a sua escolha, não sabe qual foi a escolha da rival, situação essa que é
extremamente comum no mundo real. Cada …rma sabe apenas que a rival sabe que ela
também não conhece a sua escolha e que a rival sabe que ela sabe que a rival não conhece
a sua escolha e assim in…nitamente. Como é habitual, o problema da …rma consiste em
fazer suas escolhas de forma a obter o maior lucro possível. No entanto - e distintamente
26
Grosso modo, organização industrial é o ramo da (micro)economia que estuda o comportamento
das …rmas no contexto da estrutura dos mercados em que elas estão inseridas. Em geral, essa estrutura
é descrita pela demanda dos consumidores pelo bem que esse mercado produz, pela tecnologia que as
…rmas utilizam e que caracterizarão a sua e…ciência relativamente às suas concorrentes e pelo grau de
competição que as …rmas enfrentam.
27
Duas …rmas produzem bens homogêneos se os consumidores se preocupam apenas com o preço
quando fazem a escolha de qual …rma comprar. Outros atributos como a qualidade do produto ou
outras características quaisquer se tornam irrelevantes para a análise do processo de decisão de compra
dos consumidores. Segue que uma única curva de demanda agregada para as …rmas representa a
procura dos consumidores pelo bem em questão.

56
do modelo competitivo - a …rma toma sua escolha considerando o fato de que as escolhas
alheias (no caso as decisões de produção de suas competidoras) vão afetar o seu payo¤,
caracterizando um elemento estratégico. Basicamente, ao tomar suas decisões, as …rmas
vão considerar um conjunto de restrições dadas pelas demanda dos consumidores do
bem (especi…cada pela curva de demanda pelo produto), por restrições tecnológicas (que
serão incorporadas na estrutura de custo de cada …rma) e por restrições de competição
dadas pelo número e pelas características dos seus competidores.
Vamos considerar um modelo simples onde duas …rmas, 1 e 2, produzem um bem
homogêneo cuja demanda é dada por

P (Q) = a Q

onde a > 0 e Q = q1 + q2 é a oferta da indústria, dada pela soma do produto das


…rmas que compões essa indústria. Vamos considerar que para ambas as …rmas o custo
…xo é nulo é que o custo marginal (aqui ao custo médio) é constante e idêntico para as
empresas, (
C1 (q1 ) = cq1
C2 (q2 ) = cq2
onde c 2 (0; a] por um motivo que …cará claro adiante. Podemos então representar esse
jogo na forma normal
G = fS1 ; S2 ; u1 ; u2 g
tal que temos

1. os jogadores: as …rmas 1 e 2;

2. os espaços de estratégias dos jogadores, S1 e S2 onde vamos supor que Si = [0; q i ],


i = 1; 2 . Note que nesse caso os conjuntos de escolhas das …rmas é dado pelo
espaço aonde as …rmas podem escolher produzir: no mínimo zero e no máximo
uma quantidade muito grande porém …nita;

3. a função de ganho dos jogadores, u1 e u2 . No caso de …rmas, essas funções de


ganhos são exatamente a função de lucro de cada uma delas, dadas por
(
1 (q1 ; q2 ) = P (Q) q1 cq1
2 (q1 ; q2 ) = P (Q) q2 cq2

que se expressa na diferença entre a receita e o custo da …rma. Note que, como es-
perado, a função de ganho caracteriza o elemento de comportamento estratégico.
O ganho de cada …rma é determinado não só pela sua escolha - pela quantidade
que ela resolveu produzir - como também pela escolha da concorrente.

57
Como dito anteriormente, no modelo de Cournot o problema das …rmas é es-
colher quantidades simultaneamente, procurando maximizar seus respectivos lucros.
Tomemos o caso da …rma 1 inicialmente. O seu problema é
8
>
> max 1 (q1 ; q2 ) = P (Q) q1 cq1 =
> q1 2S
> 01 1
>
>
>
>
>
> B C
>
< = @a QA q1 cq1 =
| {z }
>
> 0 P (Q) 1
>
>
>
>
>
> B C
>
> = @a (q1 + q2 )A q1 cq1
>
: | {z }
Q

de modo que as condições de primeira ordem do problema acima nos mostram que
@ 1
=a 2q1 q2 c=0
@q1
tal que, resolvendo,
a
c q2
q1 (q2 ) =
2
o que nos dá exatamente a melhor resposta que a …rma 1 pode dar para toda conjectura
a respeito da produção da …rma 2. Chamamos essa expressão de “função de reação”
da …rma 1 e colocamos o termo entre aspas pelo fato de se tratar de um jogo de escolha
simultânea: as …rmas não estão reagindo exatamente à uma ação que elas observaram,
mas sim à uma ação esperada da(s) concorrente(s). No entanto essa expectativa não
é tomada aleatoriamente, mas assumindo que a …rma rival está operando também na
sua função de reação correspondente.
Uma outra observação relevante diz respeito à inclinação da “função de reação”.
Observe que
@q1 (q2 ) 1
= >0
@q2 2
o que nos mostra que a melhor reação que uma …rma pode tomar em relação à variações
na oferta da concorrente é seguir na direção contrária.
Procedendo da mesma forma para a …rma 2, decorre (faça as contas) que
a c q1
q2 (q1 ) =
2
será a “função de reação” da …rma 2, a melhor resposta que ela pode dar às escolhas
da rival.
Uma vez que temos em mãos as respectivas melhores respostas das …rmas, …ca
trivial determinar o equilíbrio de Nash desse jogo: como de…nimos anteriormente, esse

58
é dado pela intereseção das melhores respostas. Substituindo q2 (q1 ) em q1 (q2 ), é fácil
veri…car que
1
q1 = (a c)
3
de modo que o equilíbrio de Nash desse jogo é dado por

1 1
(q1 ; q2 ) = (a c) ; (a c)
3 3

Como qi 2 [0; q i ], concluímos que a c. A oferta da indústria é


1 1 2
Q = q1 + q2 = (a c) + (a c) = (a c)
3 3 3
e o preço de mercado
1
P (Q) = a Q= (a + 2c)
3
de modo que o lucro da …rma 1 seria

1 = P (Q) q1 cq1 = q1 (P (Q) c)


1 1
= (a c) (a + 2c) c
3 3
1
= (a c)2
9
Analogamente,
1
(a c)2
2 =
9
Por …m note que as hipóteses utilizadas de que há apenas duas …rmas com es-
truturas de custos idênticos produzindo são apenas para simpli…car a nossa análise.
Nos exercícios essas hipóteses são violadas e são dadas chances a vocês de entender o
que muda com isso. Na verdade, não há problemas algum em relaxá-las. Mostraremos
abaixo o caso onde existem n oligopolistas e manteremos a hipótese de custos marginais
iguais entre as …rmas, apenas para obter um resultado de comparação mais fácil com o
caso inicial, com duas …rmas. Resolva como exercício o duopólio de Cournot onde, por
exemplo, o custo marginal das duas …rmas se diferem, comparando os resultados com
os obtidos acima.
Utilizando a mesma estrutura anterior, teremos certamente quantidades produzidas
idênticas para todas as n …rmas, uma vez que suas estruturas de custos são as mesmas,
o que de resto vai caracterizar um equilíbrio simétrico. Segue o problema de uma …rma

59
i qualquer é

max i = fP (Q) qi cqi g


qi
= f(a Q) qi cqi g
= f(a q1 q2 ::: qi ::: qn ) qi cqi g
80 1 9
< n
X =
= @a qj A qi cqi
: ;
j=1

de modo que as CPO’s nos mostram que


n
X
a 2qi qj c = 0.
j=1
j6=i

A “função de reação” do jogador i é dada por


0 1
n
X
1B C
qi (q i ) = B a c qj C
2@ A
j=1
j6=i

onde, notemos, @qi@q (q i )


j
< 0 8j 6= i; a função de reação, como usual em Cournot,
tem inclinação negativa. Nesse ambiente, com bens homogêneos e tecnologias similares
(função custo), a implicação imediata de um equilíbrio simétrico é que, em equilíbrio,
Pn
q1 = q2 = ::: = qn , de modo que qj = (n 1) qi . Segue que a expressão acima …ca
j=1
j6=i

n
X
a 2qi qj c=a (2 + (n 1)) qi c=0
j=1
j6=i

Logo, em equilíbrio,
1
qi = (a c) > 0 para a > c.
n+1
1
O equilíbrio de Nash28 desse jogo é portanto cada …rma produzir n+1 (a c). A oferta
da indústria e o preço do produto serão, respectivamente,
8
< Q = P qj = n (a c)
n
n+1
j=1 .
: a+nc
P (Q) = a Q = n+1
28
Note que obtemos um resultado genérico. Veja o que ocorre quando n = 2 e compare o equilíbrio
desse jogo. Faça o mesmo para a oferta da indústria, o preço de mercado e o lucro de cada …rma.

60
Segue que o lucro da i-ésima …rma em equilíbrio será

i = P (Q) qi cqi = (P (Q) c) qi


a + nc 1
= c (a c)
n+1 n+1
| {z }| {z }
P (Q) c qi
1
= (a c)2 , i = 1; 2; :::; n
(n + 1)2

Se n ! 1, então podemos veri…car (L’Hopital) que a oferta da indústria e o preço


serão, respectivamente, (
Q=a c
P (Q) = c
e o lucro de equilíbrio
i = 0, i = 1; 2; :::; n
caracterizando um equilíbrio em competição perfeita (veri…que). Se n = 1, então
8
> 1
< Q = 2 (a c)
P (Q) = 21 (a c)
>
: 1
i = 4 (a c)2

como esperaríamos em um monopólio.


Dito de outra menira, quanto maior for o número de …rmas do mercado, n, menor
será a produção de cada …rma. Particularmente, se existirem apenas duas …rmas,
voltaríamos ao caso anterior, como mostramos. Por outro lado, se n tende a in…nito, a
produção tende a zero, denotando o reduzido espaço que cada uma teria no mercado.
Note por …m que o resultado acima nos dá outra interpretação genérica para esse
ambiente: se a estrutura da indústria for um duopólio, o mercado corresponderá a
apenas 2/3 do mercado de concorrência perfeita. Para uma indústria com 3 …rmas,
n
seria 3/4. Para 4 …rmas, 4/5 e assim sucessivamente dado pelo termo n+1 .

Estabilidade do equilíbrio de Nash: cartel no modelo de Cournot Uma das


propriedades dos resultados de equilíbrio (de Nash) em jogos estáticos de informação
completa diz respeito à estabilidade desse resultado. Nesse sentido dizemos que o
equilíbrio de Nash é um resultado “estrategicamente estável”, o que signi…ca que, uma
vez que os jogadores tenham identi…cado o equilíbrio de Nash do jogo, nenhum deles
tem qualquer incentivo para se desviar e jogar uma outra estratégia fora do equilíbrio.
Na verdade esse tipo de questão é totalmente pertinente quando consideramos jogos
como Dilema dos Prisioneiro, abaixo representado na sua forma estratégica.

61
2
não confessa confessa
1 não confessa 1; 1 9; 0
confessa 0; 9 6; 6
Como sabemos, o único equilíbrio de Nash desse jogo é (C; C), ainda que não seja
um resultado e…ciente. É fácil ver que (N C; N C) é um resultado em que ambos os
jogadores estão melhores do que no equilíbrio. A questão que surge é se há algum tipo
de arranjo que pode ser feito entre os jogadores de forma a dar suporte a (N C; N C)
como resultado do jogo. Por exemplo, podemos permitir que haja comunicação entre os
jogadores, de modo que eles estabeleçam um compromisso mútuo sobre as suas escolhas.
Ainda que isso seja possível (a comunicação e o compromisso) restaria questionar se
esse acordo seria merecedor de credibilidade. Isso é, deveríamos acreditar que algum
do jogadores de fato iria cumprir a sua promessa e adotar a estratégia acordada com o
outro jogador? A resposta a essa pergunta é um estrondoso não! Se foi feito o acordo
e ambos prometram “não confessar”, ainda assim devemos esperar que o resultado do
jogo seja o equilíbrio de Nash, (C; C). É fácil ver porque: uma vez que o acordo foi feito,
cada jogador se questionaria sobre a sua escolha. Se ele acredita que o outro jogador irá
cumprir o compromisso, a melhor resposta que ele pode dar a essa posição ainda assim
é “confessar”. Nesse caso seu ganho seria de 0 e o do oponente seria 9. Em uma outra
conjectura, se ele por algum motivo crê que o outro jogador não cumprirá o acordo,
“confessa”continua sendo a melhor resposta. Se …zermos um raciocínio análogo para o
outro jogador a resposta seria a mesma. Concluímos portanto que o compromisso não
é crível e que o resultado do jodo de fato será o equilíbrio de Nash.
Para ilustrarmos o que foi dito acima, considere o oligopólio de Cournot acima
descrito. Nesse mesmo ambiente, considere agora o que seria a escolha ótima de um
monopolista. Ou seja, considerando que haja apenas uma …rma nesse mercado - a sua
oferta é igual à oferta da indústria, Qm = qm - o problema dessa …rma é

max m = P (qm ) qm cqm = (a qm ) qm cqm


qm 2Sm

de modo que
1
qm = (a c) = Qm
2
menor do que a oferta da indústria em duopólio, como esperado. O preço em monopólio
será maior
1
P (qm ) = (a + c)
2

62
e o lucro do monopolista será também maior do que o lucro dos duopolistas em Cournot,
1 1
m = (P (qm ) c) qm = (a + c) c (a c)
2 2
1
= (a c)2
4
Mas mais do que maior do que o lucro dos duopolistas em Cournot, podemos
veri…car que o lucro de monopólio é mais do que duas vezes maior que o lucro das
…rmas em competição,

m 1 1
= (a c)2 > i = (a c)2
2 8 9
Emerge então uma questão natural natural: talvez devêssemos esperar que os duopolis-
tas de Cournot se coordenassem e constituíssem um cartel de forma a aumentar o seu
poder de determinação do preço de mercado. Nesse acordo, cada …rma produziria a
metade da quantidade de monopólio, qi = q2m = 14 (a c), tal que a oferta da indústria
seja aquela de monopólio, Q = q1 + q2 = qm , o preço seria o mesmo de monopólio,
P (Q) = P (qm ) = 21 (a + c), e o lucro da INDÚSTRIA seria o lucro de monopólio,
1
4 (a c)2 . Como cada …rma produziu a mesma quantidade, elas dividiriam o lucro da
indústria igualmente, de modo que os lucros seriam
1
i = (a c)2 , i = 1; 2
8
que seriam os lucros das …rmas em cartel. Como ambas as …rmas estão melhor se co-
ordenando em cartel do que competindo em Cournot, podemos imaginar num primeiro
momento que essa arranjo de fato seria a estratégia ótima a ser adotada pelas …rmas.
No entanto, pelo argumento desenvolvido no começo dessa seção, restaria analisar se
o cartel é um equilíbrio, no sentido de, uma vez que ele seja constituído, nenhum dos
jogadores, das …rmas, venha a ter incentivos para desviar do compromisso de produzir
exatamente a quantidade acordada, 41 (a c).
Considere então uma situação em que o cartel foi constituído e que as …rmas con-
cordaram sobre o plano de produção acima descrito. Vejamos o caso da …rma 1 - o
caso da …rma decorre por analogia de imediato. Há duas conjecturas que a …rma 1
pode fazer sobre o comportamento da …rma 2, quais sejam (i) a …rma 2 vai cumprir o
acorddo e (ii) a …rma 2 não vai cumprir o acordo. No caso (ii) a melhor resposta que a
…rma 1 pode dar é não cumprir o acordo também e se estabeleecer uma competição de
Cournot, com os payo¤s dados pelos valores acima descritos. Esse resultado está rep-
resentado no jogo abaixo. Vejamos qual é problema da …rma 1 quando ela conjectura
que a …rma 2 vai cumprir o acordo feito na constituição do cartel.
Nessa hipótese de o cartel ter sido constituído e 2 respeitá-lo, o problema de otimiza-
ção da …rma é escolher a sua oferta de forma a maximizar o seu lucro, dado que a …rma

63
2 está cumprindo o acordo e produzindo q2 = 14 (a c). Ou seja, como era de se es-
perar, a …rma 1 vai incorporar no seu processo de decisão a informação de que a outra
…rma estaria respeitando o acordo. Isto é, o seu problema seria
1
max 1 =q2 = (a c)
q1 2S1 4
1
= max P (Q) q1 cq1 =q2 =
(a c)
q1 2S1 4
1
= max (a Q) q1 cq1 =q2 = (a c)
q1 2S1 4
1
= max (a q1 q2 ) q1 cq1 =q2 = (a c)
q1 2S1 4
1
= max a q1 (a c) q1 cq1
q1 2S1 4
de modo que as condições de primeira ordem nos mostram que
(
a 2q1 41 (a c) c = 0
q1 = 38 (a c) > 41 (a c)
Concluímos portanto que seria ótimo para …rma 1 não cumprir o acordo e produzir
uma quantidade maior do que aquela estabelecida no cartel. Essa otimalidade …ca
claro quando notamos que a oferta da indústria será
5
Q = (a c)
8
e o preço
3a + 5c
P (Q) =
8
de onde segue que o lucro da …rma 1 seria

1 = (P (Q) c) q1
3a + 5c 3
= c (a c)
8 8
9 1
= (a c)2 > (a c)2
64 8
Note que o lucro da …rma 1 seria superior ao lucro de cartel, o que nos permite concluir
que a …rma teria incentivos a não respeitar o acordo com a …rma 2 e produzir uma
quantidade maior do que aquela acordada. Já o lucro da …rma 2 seria

2 = (P (Q) c) q2
3a + 5c 1
= c (a c)
8 4
3 1
= (a c)2 < (a c)2
32 9

64
auferindo ganhos menores do que aqueles que ela teria se engajasse em uma competição
com a …rma 1. Podemos desenvolver um raciocínio análogo para a …rma 2 e gerar, por
simetria, resultados semelhantes. Segue que na forma normal esse jogo seria exatamente
um Dilema dos Prisioneiros, como abaixo descrito,

…rma 2
cartel compete
…rma 1 cartel 1
8 (a c)2 ; 18 (a c)2 3
32 (a c)2 ; 649
(a c)2
compete 9
64 (a c)2 ; 323
(a c)2 1
9 (a c)2 ; 19 (a c)2

onde o único equilíbrio de Nash é competir em Cournot. Podemos ver que o payo¤
associado ao cartel é estritamente maior do que o ganho de equilíbrio para ambas as
…rmas, de modo que o equilíbrio não é e…ciente. No entanto o acordo não é crível na
medida em que nenhuma das …rmas tem incentivos a jogar nenhuma estratégia que
não aquela(s) que compõem o equilíbrio de Nash do jogo: o equilíbrio de Nash é um
resultado (estrategicamente) estável.
Antes de discutirmos o resultado acima a partir de um exemplo no mundo real,
considere uma palavra de precaução. O que a análise mostrou não foi que cartéis não
existem ou mesmo que não devemos esperar que venham a existir. O que mostramos
foi que nessa estrutura, analisando um jogo estático de informação completa NÃO
REPETIDO, o cartel não é um resultado crível. Não obstante, podemos adiantar que
mesmo em situações em que o cartel possa ser caracterizado como uma estratégia de
equilíbrio, haverá um componente de instabilidade signi…cativo. O ponto é que em
relacionamenteos repetidos, onde os jogadores usam suas respectivas reputações (o que
eles …zeram no passado) para suportar esse resultado de cartel, a constituição de um
sistema penal entre os jogadores que dê lastro ao compromisso pode ser extremamente
complexa e via de regra vai estar sujeita a choques que irão comprometer essa credi-
bilidade ao longo do tempo.

O Cartel da OPEP Um dos exemplos clássicos de comportamento colusivo para


a determinação do preço de uma mercadoria diz respeito ao mercado internacional de
petróleo. O cartel da OPEP (Organização dos Países Exportadores de Petróleo) foi
formado em 1960 pela Arábia Saudita, Venezuela, Kuwait, Iraque e Irã como resposta
aos esforços de re…narias americanas (lideradas pela Standard Oil) para reduzir os
preços dos que elas estavam pagando pelo óleo importado dessas regiões29 . Até o
29
Nesse sentido o cartel da Opep - que busca manter o preço do petróleo em um nível acima daquele
que vigoraria em caso de competição - surge com uma resposta ao comportamento de um cartel de
compradores no sentido de reduzir o preço do produto.

65
boicote de 1972, a OPEP tinha pouco impacto sobre o mercado mundial e apenas no
começo dos anos 80 a organização tentou explicitamente aumentar o preço do óleo30 .
A estratégia adotada para manter altos preços foi similar à descrita acima nessa
nota. Os países membros deveriam restringir a sua produção; ou eles acabariam pro-
duzindo uma quantidade maior do que a demanda mundial, convergindo para uma
situação de competição perfeita. Nesse sentido cada país acordou em respeitar uma
quota de produção, de modo que em 1982 a OPEP determinou um produto limite
diário de 18 milhões de barris de petróleo - em 1979 havia sido de 31 milhões barris -
e o preço chegou a US$ 34,00 por barril. No arranjo …rmado entre os membros, cada
país tinha uma quota individual de produção, exceto a Arábia Saudita, que era o maior
produtor e que …cou responsável em ajustar a sua oferta como necessário para manter
os preços.
Como argumentamos no modelo apresentado acima, o estabelecimento e a manutenção
de um cartel não é algo trivial de se conseguir. No caso da OPEP não foi diferente.
Não obstante o baixo número de membros e a natureza pública das informações com
relação ao cumprimento ou não das quotas estabelecidas, via de regra o acordo era
quebrado. Em algumas situações a Arábia Saudita colocou no mercado um volume de
petróleo que fazia com que o preço do barril estivesse abaixo daquele estabelecido no
acordo, auferindo dessa forma lucros acima daqueles que obteria se cumprisse o acordo
e provocando perdas aos outros países que respeitaram as suas quotas. Outro exem-
plo interessante de violação do cartel ocorreu durante o período da guerra Irã-Iraque
(1980-1985), quando não raramente o volume total ofertado de óleo excedia aquele
acordado entre os países. Esse tipo de comportamento acabou abarrotando o mercado
de petróleo e, a despeito dos esforços da Arábia Saudita para controlar a ofeta global,
os preços despencaram. Além de todas essas questões relacionadas à instabilidade do
arranjo arquitetado entre os países, ocorreram várias disputas envolvendo empresas que
não pertenciam ao cartel, como a British National Oil Company que estabeleceu um
preço de US$ 3,00 em 1983, provocando uma guerra de preços com alguns dos países
membros da Opep. Hoje em dia a produção da Opep ocupa pouco menos do que 30%
do mercado mundial de petróleo. Com o preço do barril estando abaixo dos US$ 20,00,
o efeito do cartel sobre a determinação desse preço é em certa medida negligível.
Em vários outros mercados de commodities tem havido esforços para cartelização,
como café, chá etc. Alguns destes têm experimentado algum sucesso no curto prazo,
como foi o caso dos produtores de bauxita e urânio, mas não se sustentaram ao longo
do tempo - uma excessão digna de crédito diz respeito à produção de diamantes. Em
geral, a maioria dos cartéis internacionais têm se mostrado ine…cazes em afetar de uma
30
Um ponto relevante nesse ambiente diz respeito aos aspectos legais desse tipo de comportamento
colusivo. Na medida em que a OPEP é controlada por países, as leis antitrustes das demais a nações
não têm alcance sobre as medidas de…nidas pela organização.

66
maneira substancial os preços por um longo período de tempo.

2.5.2 Oligopólio de Bertrand

Betrand (1883): como Cournot, trata-se de um jogo de escolha simultânea e de


informação completa, mas aqui as …rmas competem entre si via escolha de preço,
não de quantidade.

Hipóteses:

– duas …rmas, 1 e 2, que produzem um bem homogêneo.


– custo …xo é nulo e o custo marginal é contante e idêntico para ambas as
…rmas, c > 0.
– assuma uma curva de demanda linear (para compararmos com Cournot) no
produto total
Q=a p
onde p é o preço de mercado.

as …rmas declaram simultaneamente os preços e se dispõem a ofertar tudo o que


for demandado àqueles preços.

– os consumidores compram da …rma que cobra mais barato: segue que a …rma
anuncia o menor preço detém todo o mercado enquanto a outra …rma …ca
forma do mercado.
– se ambas as …rmas declaram o mesmo preço, então elas dividem o mercado
igualmente, cada uma uma com metade.

o lucro de cada …rma, como habitual, depende não apenas de sua própria escolha
mas também é afetado pela escolha da rival. Tome o caso da …rma 1, por exemplo,
seu lucro será
8
>
< (p1 c) (a p1 ) se c < p1 < p2
1
1 (p ;
1 2p ) = 2 (p1 c) (a p1 ) se c < p1 = p2
>
: 0 caso contrário

– note que o lucro de 1 é positivo se p1 > c. Além disso, ele será tanto maior
se seu preço for menor do que o da rival e apenas a metade se for igual.
Por …m o lucro nunca será negativo na medida em que cada …rma tem a
prerrogativa de cobrar um preço igual ao custo marginal e assegurar lucro 0
na pior das hipóteses.

67
– como a situação é a mesma para a …rma 2, vamos restringir nossa atenção
para preços tais que
pi c, i = 1; 2

qual o equilíbrio de Nash desse mercado?

– paradoxo de Bertrand: o único equilíbrio de Nash será ambas as …rmas


cobrarem um preço igual ao custo marginal e ambas terem lucro zero.
– como a função lucro é descontínua, nós não podemos mostrar esse resul-
tado pelos argumentos padrões, diferenciando e resolvendo as condições de
primeira ordem.
– então, o que fazer???

observe que a …rma com o menor preço detém todo o mercado. Segue que cada
…rma tem um incentivo a anunciar um preço menor do que o da rival. Em última
instância, isso direcionará o preço de equilíbrio para baixo, até o custo marginal.
Vejamos agora o argumento formal para isso.

1. note que um equilíbrio de Nash do jogo é cada …rma cobrar o custo marginal:
nesse caso cada …rma tem metade do mercado e aufere lucro zero porque
cada unidade é vendida ao seu custo de produção.
– porque é um equilíbrio? Se ela elevar seu preço, ela perderá toda a
demanda que tinha posto que o preço da rival será estritamente menor!
nenhuma …rma tem incentivos a desviar.
– segue que não é possível que nenhuma …rma tenha lucro maior do que
zero, de modo que a escolha de preço de cada …rma é ótima dada a
escolha alheia (melhor resposta).
2. agora vamos mostrar que não há outro equilíbrio de Nash. Como cada …rma
i = 1; 2 escolhe pi c, é su…ciente mostrar que não há equilíbrio para pi > c.
Então, deixe (p1 ; p2 ) ser um equilíbrio.
– se p1 > c, então porque p2 maximiza o lucro de 2 dada a escolha de 1,
teremos p2 2 (c; p1 ], de modo a ter um lucro estritamente positivo - fora
desse intervalo seria nulo.
– além disso, p1 6= p2 , pois se …rma 2 pode ter lucro positivo escolhendo
p2 = p1 e dividindo o mercado com 1, ela pode ter um lucro maior
ainda cobrando um preço um pouco abaixo de p1 e desfrutando de todo
o mercado quase ao mesmo preço. Logo

p1 > c ! p2 > c e p2 < p1

68
– mas para uma estória similar para as …rmas com os papéis trocados

p2 > c ! p1 > c e p1 < p2

de modo que se o preço de uma …rma está acima do custo marginal,


ambos os preço devem estar acima do custo marginal e cada …rma deve
anunciar um preço um pouco menor do que a rival, o que é impossível.

no modelo de Bertrand, o preço será igual ao custo marginal com apenas duas
…rmas. Isso está em forte contraste com o que ocorre em Cournot, onde a diferença
entre o preço e o custo marginal cai apenas na medida em que o número de …rmas
no mercado aumenta.

2.5.3 Oligopólio de Bertrand com bens diferenciados

Os modelos de Cournot e Bertrand que apresentamos acima são modelos que tomas
como hipótese que as …rmas produzirão um bem homogêneo e nesse sentido a ínica
variável que vai distinguir esse bem aos olhos dos consumidores é o preço. Na ver-
dade, essa hipótese poderia ser relexada naquele ambiente, mas vamos tomar isso como
motivação para abordarmos o modelo de Bertrand (Joseph Louis François Bertrand,
1822-1900), que toma um modelo que em certa medida se assemelha com Cournot - por
se tratar de um jogo simultâneo - e no entanto tem uma característica que o distingue,
qual seja o fato de que a variável de escolha das …rmas é o preço.
Nesse sentido trataremos novamente de um duopólio onde duas …rmas, 1 e 2, pro-
duzem bens difereciados31 onde a demanda por cada um dos bens é dada por
(
q1 (p1 ; p2 ) = a p1 + bp2
q2 (p1 ; p2 ) = a p2 + bp1

onde a > 0 e b > 0. O fato de que b > 0 re‡ete o grau em que o produto de uma das
…rmas é substituto do produto da outra. Como no modelo anterior, e sem perda de
generalidade, vamos assumir que não há custo …xo para as …rmas produzirem e que o
custo marginal é constante e igual a c > 0.
Na forma normal temos (i) os jogadores, que são as …rmas 1 e 2, (ii) o espaço de
estratégia de cada …rma, que em Bertrand é dado pelo conjunto no qual as …rmas
podem estabelecer seu preço, pi 2 (0; p] ; i = 1; 2 e que supomos ser tal que a …rma
cobra no mínimo um preço muito baixo mas positivo pelo bem e no máximo um preço
muito alto porém de…nido tal que o conjunto (0; p] seja compacto e (iii) a função de
ganho de cada jogador que, no caso de …rmas, é dada pela função lucro, i (p1 ; p2 ),
31
Aqui, diferente do caso de bens homogêneos, os produtos se distinguem aos olhos dos consumidores
potenciais não mais apenas em função de preços, mas também em função de outras características, físi-
cas ou não, tais que torna-se necessário especi…car para cada produtor uma curva de demana particular.

69
i = 1; 2 e que caracteriza a interação estratégica entre as partes na medida em que os
payo¤s de cada jogador são afetados pelas escolhas alheias. O problema de uma …rma
qualquer, por exemplo da …rma 1, é portanto

max 1 = p1 q1 (p1 ; p2 ) c1 (q1 )


p1 2(0;p]
= p1 [a p1 + bp2 ] c [a p1 + bp2 ]
= (p1 c) [a p1 + bp2 ]

tal que as condições de primeira ordem nos mostram que

a 2p1 + bp2 + c = 0

tal que
a + c + bp2
p1 (p2 ) =
2
é a “função de reação” da …rma 1 e nesse sentido nos diz qual é a melhor resposta
que a …rma 1 pode dar às eventuais escolhas da …rma 2. Note agora que @p@p 1 (p2 )
2
=
b
2 > 0 tal que, ao contrário de de Cournot, em Bertrand a função de reação das …rmas
tem inclinação positiva, o que nos diz que a melhor resposta que uma …rma pode
dar à variações nos preços das concorrentes é seguir na direção oposta, reduzindo ou
aumentando seus preços de forma a maximizar os seus ganhos.
Fazendo raciocínio análogo para a …rma 2, temos
a + c + bp1
p2 (p1 ) =
2
tal que torna-se trivial encontrar o equilíbrio de Nash na medida em que tenhamos
entendido o conceito como uma interseção de melhores respostas dos jogadores. Susti-
tuindo p2 (p1 ) em p1 (p2 ) obtemos

a+c b a + c + bp1
p1 = +
2 2 2
4p1 = 2 (a + c) + b (a + c) + b2 p1
4 b2 p1 = (2 + b) (a + c)
a+c
p1 =
2 b
Analogamente para a …rma 2,
a+c
p2 =
2 b
tal que o equilíbrio de Nash é cada …rma cobrar o preço
a+c
p1 = p 2 =
2 b

70
Para pi 2 (0; p] e (a; b; c) 0 temos que b 2 (0; 2). Com isso em mãos, a oferta da
…rma i = 1; 2 será

a+c a+c
qi (p1 ; p2 ) = a +b ; i = 1; 2
2 b 2 b
a c + bc
qi (p1 ; p2 ) = , i = 1; 2
2 b
e o lucro de cada …rma será dado por
2
a c + bc
i = ; i = 1; 2.
2 b

de modo que as …rmas têm lucro positivo.

2.5.4 O problema dos comuns

Nesta seção apresentaremos um exemplo de aplicação de teoria dos jogos - especi-


…camente de jogos estáticos de informação completa, que é o nosso objeto de análise
até aqui - que não seja um oligopólio. Novamente tratamos de uma situação em que
o espaço de estratégias dos jogadores é tão rico quanto se queira e em que a presença
de interação estratégica tem implicações diretas sobre o comportamento dos agentes
econômicos envolvidos na situação.
Pelo menos desde David Hume (1739), …lósofos e economistas compreendem que
se os cidadãos respondem apenas a incentivos privados, haverá uma subprovisão de
bens públicos e os recursos públicos serão sobre-utilizados. Hoje em dia, mesmo uma
análise casual do meio-ambiente da terra revela a força dessa idéia. Vamos analisar
essa situação através de um exemplo bucólico.
Considere uma vila povoada por n > 1 famílias de fazendeiros cuja atividade prin-
cipal seja a criação de bodes. Em cada verão, todos os fazendeiros levam seus animais
para se alimentar em um pasto da vila que pertence a todas as famílias da vila - ou seja,
esse pasto é um bem público32 . Denote o número de bodes que o i-ésimo fazendeiro
tem por gi , de modo que o número total de bodes da vila é
P
n
G= gi = g1 + g2 + ::: + gn
i=1

O custo de comprar e criar um bode é dado por c > 0, independente do número de


bodes que o fazendeiro possui. O valor para um fazendeiro de levar um bode para
pastar na área pública quando há G bodes pastando é v (G) por bode. Como um bode
32
Relembre a de…nição de bem público em algum manual de micro. Aqui estamos supondo que o
pasto é um bem não-excludente e não-rival. Mas... o que isso signi…ca mesmo?

71
precisa de no mínimo de um certo montante de grama para sobreviver, há um número
máximo de bodes que pode pastar no gramado, de modo que
(
v (G) > 0 para G < Gmax
v (G) = 0 para G Gmax

Além disso, como os primeiros bodes a pastar encontram grama em abundância, adi-
cionar um animal a mais na área comum implica em um pequeno dano para aqueles
que já estão se alimentanto, mas quando muitos bodes já estão pastando (um número
tão grande que eles se alimentam apenas para sobreviver), então a adição de um bode
a mais no gramado provoca um dano dramático dos demais animais. Formalmente,
para G < Gmax
v 0 (G) < 0 e v 00 (G) < 0
como na …gura abaixo
…gura - aqui
Durante a primavera, os fazendeiros escolhem simultaneamente o tamanho de seu
rebanho. Assuma que os animais sejam continuamente divisíveis. Uma estratégia para
um fazendeiro i 2 n qualquer é a escolha do número de bodes ele levará para pastar
no campo da vila, gi 2 [0; Gmax ]. O payo¤ desse fazendeiro quando leva gi bodes para
pastar e o número de bodes pastando dos demais fazendeiros é g1 + g2 + ::: + gi 1 +
gi+1 + ::: + gn é dado por

ui (gi ; g i ) = gi v (G) cgi


= gi v (g1 + ::: + gi + ::: + gn ) cgi

Logo, se gi ; g i é um equilíbrio de Nash do jogo, então, para cada jogador i 2 n,


gi deve maximizar ui (gi ; g i ) dado que os demais fazendeiros escolhem g i . As cpo’s
desse problema implicam que

@ui (gi ; g i )
= v gi + g i + gi v 0 gi + g i c=0
@gi
ou ainda,
v (G ) + gi v 0 (G ) c=0
condição que é verdade para todo fazendeiro i = 1; 2; :::; n. Somando para esses n
fazendeiros, temos
nv (G ) + G v 0 (G ) nc = 0
ou melhor,
1
v (G ) + G v 0 (G ) c=0
n

72
P
n
onde G = gi = g1 + g2 + ::: + gn . Por outro lado, o ótimo social, denotado por G ,
i=1
decorre do problema de
max Gv (G) cG
0 G<

tal que as cpo’s nos mostram que

@ [Gv (G) cG]


= v (G ) + G v 0 (G ) c=0
@G
Proposição 42 Comparando as duas expressões, podemos mostrar que G > G .

Prova. Suponha que não, que G G . Nesse caso, como v 0 < 0, então v (G )
v (G ). Do mesmo modo, como v 00 < 0, então 0 < v 0 (G ) v 0 (G ). Por …m,
G
n < G . Logo, o lado esquerdo do problema de Nash excede o lado esquerdo do
problema social, o que é impossível na medida em que ambos são iguais a zero.
O fato de que G > G implica que há muitos bodes pastando no campo público
quando comparado com a quantidade que seria desejável do ponto de vista social. As
cpo’s do problema de Nash re‡etem os incentivos que têm um fazendeiro que já tem gi
bodes pastando mas que está considerando adicionar um animal a mais no pasto (ou,
falando corretamente, um fração de um bode). O valor do bode adicional é v gi + g i
e seu custo é c. O dano aos fazendeiros cujos bodes que já estão pastando é v 0 gi + g i
por bode, ou gi v 0 gi + g i no total. O recurso comum é sobre-utilizado porque cada
fazendeiro considera apenas os seus próprios incentivos, não os efeitos de suas ações
0
sobre os demais fazendeiros, como mostra a presença de G vn(G ) no problema de Nash
ao invés de G v 0 (G ) do ótimo social.

73
3 Jogos Dinâmicos de Informação Completa
Essa seção inicialmente abordará jogos de informação completa que tenham também
informação perfeita. Isto é, quando escolhem suas estratégias, os jogadores sabem qual
foi toda a história pregressa do jogo até então, o que não ocorria nos jogos vistos até
aqui, onde cada jogador não sabia, não observava, o que demais jogadores tinham feito.
De outra forma, antes o jogo ocorria como se fosse simultâneo (estático) - agora iremos
trabalhar com jogos em que as escolhas dos jogadores se dão sequencialmente. Esses
jogos são ditos jogos dinâmicos. No …nal da seção, analisaremos também situações que
sejam parcialmente dinâmicas e parcialmente estáticas. Ou seja, trabalharemos com
jogos dinâmicos ditos jogos de informação imperfeita, que são jogos com movimentos
sequenciais dos jogadores, mas que não seja necessário que todos os jogadores saibam
toda a história pregressa do jogo. O que caracteriza a informação completa é que
os payo¤s dos jogadores para cada combinação de movimentos são de conhecimento
comum (“common knowledge”).
A questão central nos jogos dinâmicos diz respeito à credibilidade das ameaças e
promessas dos agentes. Às vezes, por exemplo, pode ser ótimo saber que o outro jogador
observa sua atitude antes de tomar suas decisões. Essas questões serão detalhadas
durante esta seção e na próxima.

Exemplo 43 Sequestro com granada33 .

Suponha que um sequestrador possa fazer apenas uma ameaça a seu sequestrado:
caso esse último não lhe dê um cheque de R$1.000.000,00 , ele irá explodir uma granada
no esconderijo em que estão, que certamente matará ambos. A vítima pode lhe dar
o cheque ou não. O que você faria? Supondo que o sequestrador é racional, como
usualmente se faz, você não deveria fazer o cheque. É claro que o sequestrador não
gostará disso, mas, uma vez que você resolveu não dar o cheque, o melhor que ele pode
fazer é não explodir a granada, pois isso pioraria muito o seu bem-estar. Portanto,
o equilíbrio (como iremos de…nir abaixo) neste jogo será você não fazer o cheque e o
sequestrador, ainda que “malvado”, não explodir a granada. O ponto fundamental é
que a ameaça do sequestrador não é crível, pois se ele a cumprir ele se prejudicará mais
que se não a cumprisse. O sequestrado, estando ciente disso, não deve deixar se levar
por uma ameaça que não será cumprida34 .
33
Baseado em Gibbons (1992).
34
Estamos supondo aqui que o sequestrador é racional (faz o melhor para ele mesmo) e que morrer
é a pior coisa que pode ocorrer a ele. Obviamente, se ele aparentar sinais de pouca lucidez ou, mesmo
em sã consciência, não estiver aparentando dar muito valor à vida ou pertencer a seitas radicais ou
qualquer coisa que o valha, então é claro que será preferível ao sequestrado fazer o cheque, preservando
sua própria vida.

74
3.1 Forma Extensiva
Nós representamos os jogos até agora apenas pela forma normal (ou estratégica).
Veremos, entretanto, que há uma outra forma de representação: a forma extensiva, uma
forma mais detalhada do que a forma normal. Segue daí que um jogo na forma extensiva
em geral sofre perdas de informação quando o passamos para a forma normal, enquanto
o inverso nem sempre é possível de se fazer. Nos jogos estáticos, não há problemas em
tratá-lo apenas na forma estratégica, sendo inclusive mais conveniente. Todavia, isso
com certeza ocorreria nos jogos dinâmicos. Por isso, os abordaremos utilizando a forma
extensiva.
Um jogo (de informação completa e perfeita) na forma extensiva nos dá as seguintes
informações:

quais são os jogadores participantes,

quais são as ações possíveis para cada jogador em cada vez em que ele for chamado
a decidir,

a ordenação do jogo: quem age e quando,

toda a história pregressa do jogo quando cada jogador tem de tomar uma decisão,

os payo¤s dos jogadores para cada conjunto possível de ações que tenham sido
tomadas, até o …nal do jogo.

Exemplo 44

Na …gura acima temos a representação de um jogo na forma extensiva. Por con-


venção (mas, novamente, nem sempre) o jogador 1 (j.1) é o primeiro a jogar. Esse ponto
é dito "nó inicial"e é único, no sentido a …car claro ao longo do texto. Esse jogador
pode jogar duas estratégias, ou e ou d. Diferentemente de jogos estáticos, agora o
jogador 2 observa a escolha de 1 e só então faz a sua escolha. Ele também ou joga e ou
joga d. No entanto é fundamental dizer que em jogos dinâmicos a noção de estratégia
(e de conjunto de estratégias) de um jogador é mais complexa do que a mesma noção

75
em jogos de escolha simultânea. Aqui uma estratégia deve ser vista como "um plano
completo de ação", deve especi…car para o jogador em questão as suas possibilidades
de ação contingentes à todas as ações possíveis dos jogadores que jogaram antes35 dele.
No jogo acima, por exemplo, o espaço de estratégias do jogador 2 é
8 9
>
> (jogar e dado que o jogador 1 jogou e, jogar e dado que o jogador 1 jogou d), >
>
>
< (jogar e dado que o jogador 1 jogou e, jogar d dado que o jogador 1 jogou d), >
=
S2 =
>
> (jogar d dado que o jogador 1 jogou e, jogar e dado que o jogador 1 jogou d), >
>
>
: >
;
(jogar d dado que o jogador 1 jogou e, jogar d dado que o jogador 1 jogou d)

Uma vez que os jogadores 1 e 2 …zeram as suas escolhas, o payo¤s são dados pelos
números situados após os últimos nós de decisão, ditos nós terminais. Por convenção, o
primeiro número se refere ao payo¤ do jogador que jogou primeiro, o segundo número
ao payo¤ do jogador que jogou em segundo lugar e assim sucessivamente no caso de
jogos com mais de dois jogadores. Logo, lendo o jogo acima na forma extensiva, temos

1. os jogadores: 1 e 2,

2. os espaços de estratégias, S1 = fe; dg e S2 como acima exposto,

3. a ordenação: 1 joga primeiro, 2 observa a escolha de 1 e então faz a sua escolha,

4. a história pregressa do jogo36 : quando 2 é chamado a jogar ele sabe inequivo-


cadamente qual foi a escolha de 1,

5. os payo¤s: os ganhos dos jogadores para toda combinação possível de escolhas


dos jogadores.

Note então que a representação na forma extensiva apresenta todas as características


destacadas acima. Ela possui em geral (mas nem sempre, como veremos em exemplos
abaixo) o formato de “árvores crescendo para baixo”. E a título de curiosidade -
discutiremos isso logo abaixo - o resultado desse jogo será "o jogador 1 jogar d e o
jogador 2 jogar e se 1 jogou e, jogar d se 1 jogou jogou d". Os payo¤s serão (4; 1).
35
Como o jogador 1 foi o primeiro a jogar, então o seu conjunto de estratégias é similar àquele que
especi…caríamos na forma normal.
36
Uma hipótese que sempre adotaremos é que os jogadores têm “perfect recall”, memória perfeita:
eles não esquecem as suas jogadas anteriores e as informações que eles detinham em um determinado
ponto do jogo também não são esquecidas posteriormente, ainda que o jogo se prolongue por um número
arbitrariamente grande de rodadas. Além disso essa hipótese é de conhecimento comum.

76
Podemos veri…car se no jogo abaixo há memória perfeita dos jogadores envolvidos.

Será explicado mais detalhadamente à frente o signi…cado da linha pontilhada


mostrada acima. Em suma, ela signi…ca que o jogador, quando tem que agir, não
sabe em qual dos pontos ligados pela linha tracejada ele está. Essa é uma possibilidade
que encontraremos em vários jogos a serem vistos adiante. No caso acima, todavia,
quando o jogador 1 é chamado a jogar novamente, caso ele possuísse “memória per-
feita” não teria dúvidas sobre estar na posição que se segue à estratégia d do jogador
2 ou na posterior à e. Isso porque, dependendo do que ele tiver feito na sua primeira
escolha, uma das duas possibilidades não mais será factível ao jogador 2. Portanto,
para ter dúvidas entre essas duas possibilidades, o jogador 1 tem de ter se esquecido
da sua ação inicial. Possibilidades como essa serão ignoradas nestas notas, uma vez
que a hipótese de “perfect recall” será sempre utilizada. Para comentários adicionais
a respeito da hipótese, ver Kreps (1990).

3.2 Indução Retroativa: jogos de informação completa e perfeita


Os jogos de informação completa e perfeita podem ser sintetizados da seguinte
forma (para o caso de dois jogadores; com mais de dois, não há mudança signi…cativa):

1. o jogador 1 escolhe uma ação entre as suas possibilidades delimitadas pelo con-
junto de possibilidades de estratégias,

2. o jogador 2 observa a escolha do jogador 1 e então escolhe uma ação no seu


conjunto de estratégias factíveis, que agora depende da ação que o jogador 1
tomou,

3. o jogo termina e os payo¤s cada jogador são determinados em função da sua es-
colha e também do elemento de interação estratégica, a escolha do outro jogador.

Essa de…nição simples segue a apresentação de Gibbons (1992), mas pode ser muito
ampliada. Além da possibilidade de existência de mais de dois jogadores, poderia
ocorrer que dentro de um mesmo jogo um ou mais jogadores pudessem vir a jogar

77
mais de uma vez. Além de diversas situações mais relevantes, inclusive de natureza
econômica, mesmo outras mais simples se adaptariam claramente a esses casos. Pense,
por exemplo, na maior parte dos jogos de cartas ou de tabuleiros: em geral, jogam de
duas a seis pessoas, uma após a outra, com ações tomadas um grande número de vezes
durante o jogo. Normalmente, pelo menos a maioria deles pode ser analisada como
jogos dinâmicos de informação perfeita e completa.
A forma de se resolver situações dessa natureza é a descrita a seguir. Assim como
em jogos estáticos, solucionar jogos dinâmicos é também um exercício de previsão
em que o analista busca antever o comportamento dos jogadores envolvidos tendo em
mente algumas premissas sobre a postura geral dos jogadores. Mas se antes os jogadores
consideravam estratégias que fossem racionalizáveis apenas, agora eles têm de trabalhar
com estratégias que sejam sequencialmente racionais. Isto é, aquelas que não envolvam
promessas/ameaças não críveis (como a do sequestrador que ameaça explodir a granada
e se matar).

De…nição 45 Uma estratégia que seja sequencialmente racional deve prescrever for-
mas de agir que sejam racionais em cada ponto de decisão que o jogador possa estar.
Ou seja, o jogador não joga apenas estratégias racionalizáveis, ele jogará estratégias
racionalizáveis sempre que for chamado a jogar.

Ou seja, caso o jogador esteja em determinado ponto na árvore de decisão, ele deve
ter estratégias que são ótimas a partir daí, dadas as possíveis estratégias e escolhas
futuras dos outros jogadores.
Trabalhando inicialmente apenas com o exemplo mais simples de jogos de infor-
mação perfeita e completa dado acima (com apenas dois jogadores fazendo uma escolha
cada um durante o desenrolar do jogo), o procedimento que adotamos para resolvê-
lo é dito indução retroativa ("backward induction") e é descrito da seguinte forma.
Começamos sempre pelo …nal do jogo, analisando o jogador que joga por último37 , no
caso o jogador 2. Esse jogador já observou a escolha do jogador 1 e deve escolher uma
estratégia tal que, condicional à escolha de 1, lhe dê o maior payo¤ possível. O jogador
2 faz então a sua escolha. Passamos a seguir para a análise do problema de escolha do
jogador 1. O fundamental aqui é entender que, como se trata de um ambiente de infor-
mação completa, o jogador 1 também sabe qual será a melhor atitude38 que o jogador
2 pode tomar para cada escolha que ele, jogador 1, venha a fazer. O jogador 1, por
isso, não escolherá aleatoriamente sua estratégia …cando, depois, “torcendo” para que
o outro jogador faça algo que também seja favorável a ele. Na verdade, no momento
37
Daí o termo "retroativa". Para uma descrição formal do método, veja o apêndice.
38
Dito de outra maneira, o jagador 1 consegue antecipar perfeitamente qual será a reação do jogador
2 para cada ação que ele tomar. Segue daí que o problema de 1 pode ser posto como o problema de
tomar uma ação tal que induza o jogador 2 a uma reação que seria ótima do ponto de vista do jogador
1.

78
de fazer a opção da melhor estratégia a se tomar ele já considerará que, dependendo
do que ele escolher, isso afetará a escolha do jogador 2 e esse pensará apenas no seu
próprio bem-estar no momento de de…nir sua estratégia. Procedendo assim, e dado
que a forma de resposta do jogador 2 é dada pela sua escolha condicional à decisão de
1, o seu problema é o problema de escolher uma estratégia que lhe dê o maior payo¤
possível dado que o jogador 2 reagirá de forma ótima à sua tomada de decisão. Da
solução desse conjunto de tomadas de decisão, do jogador 1 e do jogador 2, teremos
um (ou mais) par de estratégias que caracterizará o resultado de indução retroativa
desse jogo. Esse resultado elimina qualquer tipo de ameaça ou promessa que não sejam
críveis, pois o jogador 1 antecipa o que o jogador 2 fará em cada uma das situações pos-
síveis, buscando o seu próprio bem-estar. Assim, jogador 1 não acredita em eventuais
ameaças que possam ser feitas pelo jogador 2 e que incorporem atitudes desse último
que não sejam ótimas para ele mesmo, uma vez que o jogador 1 já fez a sua ação.

Exemplo 46 Considere o Exemplo 43, no início dessa dessa seção. Por indução
retroativa, analisemos incialmente o problema do jogador 2. Se o jogador 1 jogou
e, será ótimo para ele jogar e também39 , pois o ganho que ele teria nesse caso seria
4, maior do que 2, o ganho que ele teria se jogasse d. Por outro lado, conjecturando
que o jogador 1 jogou d, será ótimo para 2 jogar d também40 , pois o ganho que ele
teria seria 1, maior do que 0, o ganho que ele teria se jogasse e. Porém o jogador 1
consegue antecipar os possíveis movimentos do oponente: como se trata de um jogo de
informação completa onde a racionalidade sequencial dos jogadores é de conhecimento
comum, então ele sabe quais serão as reações de 2 para cada ação que ele tomar. Tendo
isso em mente, o melhor que ele pode fazer é jogar d, pois nesse caso 2 jogaria também
d e seu ganho seria 4, maior do que o ganho que ele teria se jogasse e, pois nesse caso
o jogador 2 também escolheria e e seu ganho seria 1. Logo o resultado do jogo por
indução retroativa é "o jogador 1 jogar a estratégia d e o jogador 2 jogar a estratégia
jogar d dado que 1 jogou d". O payo¤ s de equilíbrio serão (4; 1).

Exemplo 47

39
Na verdade seria jogar a estratégia "jogar e dado que o jogador 1 jogou e".
40
Ou mehor, jogar a estratégia "jogar d dado que o jogador 1 jogou d".

79
Qual o resultado de indução retroativa do jogo acima? Vejamos o que o jogador 2
deve fazer em cada uma das situações possíveis:

se o jogador 1 joga e, o jogador 2 deve jogar e também e obter payo¤ de 3 unidades


(dando 1 para o jogador 1), pois a alternativa seria obter apenas 2 unidades, caso
escolhesse d.

se o jogador 1 joga d, o jogador 2 deve também jogar d e obter payo¤ de 1 unidade


(gerando 2 para o jogador 1), preferível a zero, que é o que seria obtido se nesse
caso ele escolhesse e.

Como o jogador 1 antecipa isso perfeitamente, ele sabe que as opções efetivamente
alcançáveis são apenas (e; e) e (d; d). Diante disso, irá jogar d e assim garantirá utilidade
de 2 unidades. O resultado de indução retroativa é, portanto, (d; jogar d dado que 1 jogou d).
Note, por outro lado, que esse resultado está longe de constituir algo próximo do
que se poderia denominar “socialmente ótimo”, e…ciente ou a…m. Se ele fosse, por
exemplo, (e; d), ambos os jogadores estariam melhor. Sendo assim, por que não sugerir
um acordo entre os jogadores que possa levar a esse resultado? Porque o jogador 1 sabe
que, uma vez que ele cumprisse sua parte no acordo, o jogador 2 não teria incentivos em
mantê-lo, pois poderia obter um payo¤ superior. Ciente disso, o jogador 1 não se deixa
levar por promessas como essas, por não serem críveis. Da mesma forma, mesmo que
o jogador 2 ameace jogar e, caso o jogador 1 jogue d, esse último sabe que tal ameaça
também não é crível, e portanto não a aceita. Tudo isso é simples consequência do
pleno conhecimento de racionalidade (sequencial) entre os jogadores. Nesse caso, não
se requer muito, bastando que ambos os indivíduos sejam racionais e que o jogador 1
saiba que o jogador 2 também o seja.
É importante lembrar também que não é necessário que cada jogador jogue apenas
uma vez durante o jogo, como já comentamos antes. Cada um deles pode ser chamado
a escolher mais de uma vez, sendo que a lógica de resolução não se altera. Sempre
se olhará inicialmente para o …m do jogo, destacando as respostas ótimas em cada
situação, e se encontrará o resultado de indução retroativa tomando como base tais
possibilidades.

Exemplo 48 Encontrar o resultado de indução retroativa do jogo da …gura abaixo,

80
conhecido como “mini-centopéia”.

Na forma extensiva, temos:

1. os jogadores: 1 e 2,

2. os espaços ou conjuntos de estratégias,


8 9
>
> a, jogar e dado que jogou b e 2 jogou d; >
>
>
< a, jogar f dado que jogou b e 2 jogou d; >
=
S1 =
> b; jogar e dado que jogou b e 2 jogou d;
> >
>
>
: >
;
b, jogar f dado que jogou b e 2 jogou d;
S2 = fjogar c dado que 1 jogou b; jogar d dado que 1 jogou bg

3. a ordenação: 1 joga primeiro, 2 observa a escolha de 1 e então joga, 1 oberva a


sua própria escolha, a escolha de 2 e então joga novamente e os payo¤ são dados.

4. a história pregressa do jogo: 2, ao jogar, sabe qual foi o movimento de 1. E 1, ao


jogar pela segunda vez, sabe qual foi seu movimento inicial e qual foi a escolha
de 2.

5. os payo¤s: se 1 joga a o jogo termina no primeiro estágio e os ganhos são (2; 0).
Se 1 joga b e o jogador 2 joga c,o jogo termina no segundo estágio e os ganhos
são (1; 1). Se 1 joga b e 2 joga d, o jogo vai para o terceiro estágio. Ali, se 1 joga
e o jogo termina e os ganhos são (3; 0) e se 1 joga f o jogo também termina e os
ganhos são (0; 2).

Por indução retroativa, primeiramente vejamos qual seria a opção escolhida pelo
jogador 1 (o jogador que joga por último nesse caso) se o jogo alcançar o terceiro estágio.
Nessa possibilidade, o melhor para ele será escolher a opção e e obter payo¤ de 3 > 0.
Sabendo disso, o jogador 2, caso jogue, preferirá escolher c e terminar o jogo sem que
esse alcance o terceiro estágio, pois assim obteria payo¤ de uma unidade, e não de zero

81
- o que ocorreria se o jogador 1 voltasse a jogar. Por sua vez, o jogador 1, ao fazer a sua
primeira opção, já sabe dessa estratégia do jogador 2. Para ele é preferível, portanto,
terminar o jogo (jogando a) logo na primeira rodada, obtendo payo¤ de 2, e não de 1,
que ele teria caso o jogo continuasse - com o jogador 2 …nalizando-o em seguida. Sendo
assim, o resultado de indução retroativa é o jogador 1 jogar a na primeira rodada e
terminar o jogo. Podemos escrever as estratégias que levam a isso da seguinte forma:

jogador 1: joga a na primeira vez que joga e na segunda vez joga e se ele jogou b
e 2 jogou d

jogador 2: joga c se o jogador 1 jogou b.

Em palavras:

jogador 1: escolhe a; caso o jogo alcançasse a segunda rodada e o jogador 2


escolhesse d, jogaria e.

jogador 2: caso o jogador 1 escolha inicialmente b, utiliza sua opção c.

No jogo anterior - assim como em qualquer outro -, perceba que, apesar do jogo ter-
minar no seu primeiro estágio, saber o que ocorreria caso ele continuasse é fundamental
para determinarmos o resultado por indução retroativa. Deve-se portanto sempre con-
siderar o que ocorreria caso o jogo continuasse. Eventualmente poderá valer a pena
para os jogadores continuar o jogo. No jogo acima, esse não foi o caso, mas essa é
apenas uma possibilidade. O fundamental é ver que, mesmo para saber que ele seria
terminado na primeira rodada, foi necessário analisar toda a estrutura do jogo.
Pense, por outro lado, o que estaria ocorrendo caso o jogador 1 não terminasse o
jogo na primeira rodada. A conclusão é que, nesse caso, a racionalidade dos indivíduos
não seria de conhecimento comum (“common knowledge”). Poder-se-ia pensar, como
uma hipótese, que o jogador 1 não seria racional. Entretanto, poderia ser o caso
também de o jogador 1 acreditar que o jogador 2 não fosse racional e esperar que ele
não termine o jogo. Assim ele poderia tentar obter payo¤ de 3 unidades, uma vez que
o jogo atingisse a terceira rodada. Uma outra possibilidade é o jogador 1 saber que o
jogador 2 é racional, ser ele mesmo racional mas achar que o jogador 2 possa não ter tal
informação. Assim, ele poderia continuar o jogo esperando que o jogador 2 também o
…zesse, na expectativa de incrementar para 2 o seu payo¤ - o que ocorreria caso o jogador
1 jogasse d na terceira rodada. Portanto, não se pode determinar precisamente onde
está o desvio de racionalidade. Sabe-se apenas que ele existe, i.e., que a racionalidade
não é de pleno conhecimento entre os jogadores. Nesse caso, a indução retroativa perde
o seu poder em determinar o resultado do jogo. A idéia, contudo, é trabalhar sempre
supondo a existência de “common knowledge” da racionalidade entre os jogadores, de
modo a viabilizar as previsões das situações onde exista interdependência estratégica.

82
Uma observação pertinente é notar a fraqueza do conceito de equilíbrio de Nash em
jogos dinâmicos. Nesses casos, sua utilização pode levar a resultados que incorporem
ameaças/promessas não críveis. É por esse motivo que trabalhamos acima com um con-
ceito diferente para se prever os resultados desses jogos. Equilíbrio de Nash é, de fato,
uma forma adequada de se prever os resultados em muitos jogos, mas desde que esses
tenham caráter estático. No caso dinâmico, é necessário que se re…ne esse conceito no
sentido de se eliminar as possibilidades de que as tais ameaças e promessas enão críveis
sejam consideradas - e é exatamente daí que segue a necessidade de representarmos
jogos dinâmicos na forma extensiva, pois a forma normal poderia viesar a análise do
resultado do jogo.

Exemplo 49 Considere o tradicional jogo onde uma …rma está instalada (I) em um
mercado enquanto monopolista e uma outra …rma (E) está considerando entrar nesse
mercado. Ela escolhe entre entrar ou não. Caso entre, a antiga monopolista escolhe
entre lutar (fazer uma guerra de preços, por exemplo) ou acomodar-se (constituir um
duopólio, um mercado onde apenas duas …rmas produzem). Vejamos a forma extensiva
deste jogo :

Na forma extensiva teríamos

1. os jogadores: as …rmas E e I,

2. os espaços de estratégia,

SE = ffora, entrag
SI = fluta se a …rma E entra, acomoda se a …rma E entrag

3. ordenação: a …rma E decide se entra ou não, a …rma I observa a decisão de E e


então decide se reage ou se acomoda,

4. a história pregressa: I, ao fazer sua escolha, sabe o que E jogou,

5. os payo¤s.

O resultado por indução retroativa (faça) será a a …rma E entrar no mercado e a


…rma I acomodar-se. Isto porque, se E entra, o payo¤ de I é maior caso ela acomode.

83
Como E sabe disso, ela irá entrar, apesar de uma eventual ameaça da …rma I de lutar
caso ela faça isso.
Podemos representar o jogo acima também na forma normal:

…rma I
luta se …rma E entra acomoda se …rma E entra
…rma E fora 0; 2 0; 2
entra 3; 1 2; 1

Nota-se, portanto, que há dois equilíbrios de Nash no jogo acima: o resultado por in-
dução retroativa e o conjunto de estratégias onde E não entra e I luta se E entra. A
questão central aqui é que essa última ameaça não é crível e portanto não deveria ser
considerada. Temos, portanto, que o conceito de equilíbrio de Nash não elimina tais
possibilidades, pois ele não incorpora a idéia de que as estratégias devem ser sequen-
cialmente racionais. Apenas um equilíbrio de Nash no jogo acima pode ser obtido via
indução retroativa e, portanto, apenas esse equilíbrio é um resultado sequencialmente
racional.
Um outro resultado muito importante na teoria de jogos dinâmicos é o chamado
Teorema de Zermelo. Ele nos diz que todo jogo …nito de informação perfeita possui um
equilíbrio de Nash em estratégias puras que pode ser obtido via indução retroativa (e
que será, portanto, sequencialmente racional). Além disso, se nenhum jogador possui
payo¤s iguais em pontos terminais distintos, então existe apenas um equilíbrio de Nash
que pode ser derivado dessa forma.

Exemplo 50 Encontre o(s) resultado(s) de indução retroativa do seguinte jogo:

Se o jogador 1 joga à esquerda (e), jogador 2 também o faz. Se o jogador 1 joga


à direita (d), o jogador 2 também o faz. Em ambos os casos, o jogador 1 obtém
payo¤ de 2 e por isso não prefere estritamente nenhum deles ao outro. Portanto, temos
dois resultados de indução retroativa: (e; e) e (d; d). Como o teorema de Zermelo
a…rma, a unicidade do resultado de indução retroativa depende da inexistência de
payo¤s iguais nos pontos terminais para cada um dos jogadores, o que não é o caso
acima. Sendo assim, tornou-se possível encontrar mais de um equilíbrio. Todavia, note
que a existência de payo¤s iguais em pontos terminais para algum jogador não implica
que o resultado de indução retroativa não será único, e sim que, em princípio, haverá
essa possibilidade, que poderá ou não se veri…car dependendo do caso.

84
3.3 Aplicações
3.3.1 O modelo de Stackelberg

semelhante a Cournot, porém é um jogo dinâmico.

tome um modelo onde duas …rmas, 1 e 2, produzem um bem homogêneo cuja


demanda é
P (Q) = a Q

– a > 0 e Q = q1 + q2 é a oferta da indústria.


– o custo …xo é nulo é que o custo marginal é constante e idêntico para as
empresas, (
C1 (q1 ) = cq1
C2 (q2 ) = cq2

Na forma extensiva temos

1. os jogadores: as …rmas 1 e 2;
2. os espaços de estratégias dos jogadores, S1 e S2 , tais que
(
S1 = [0; q 1 ]
S2 = f[0; q 2 ] =s1 2 S1 g

3. ordenação: 1 joga, 2 observa e então joga. Vamos chamar 1 de …rma “líder”


e 2 de …rma “seguidora”.
4. história: quando 2 escolhe, a escolha de 1 é de conhecimento comum.

a função de ganho de cada jogador, u1 e u2 . No caso de …rmas,


(
1 (q1 ; q2 ) = P (Q) q1 cq1
(q
2 1 2 ; q ) = P (Q) q 2 cq2

solução: por IR, o problema da seguidora, 2, é


8
< qmax
>
2 2S2
2 (q1 ; q2 ) = P (Q) q2 cq2 =

> = (a Q) q2 cq2 =
:
= (a q1 q2 ) q2 cq2

CPO:
@ 2
=a 2q2 q1 c=0
@q2
a c q1
q2 (q1 ) =
2

85
– função de reação da …rma 2 (sem aspas)! jogo dinâmico.

Já o problema da líder é determinar o quanto produzir de forma a induzir na


seguidora uma reação que seja ótima sob o seu prisma. Como essa reação é de
conhecimento comum, a líder
max f 1 (q1 ; q2 ) =q2 (q1 )g =
q1 2S1
= (P (Q) q1 cq1 ) =q2 (q1 ) =
= ((a Q) q1 cq1 ) =q2 (q1 ) =
=0((a q1 q2 ) q1 cq1 ) =q1 2 (q1 ) =

B a c q1 C
B C
= Ba q1 C q1 cq1 =
@ 2 A
| {z }
q2 (q1 )
a c q1
= 2 q1

CPO:
@ 1 a c
= q1 = 0
@q1 2
a c
q1 =
2
– substituindo na reação de 2,
a c
q2 (q1 ) =
4
– o ENPS (e por IR também) é portanto
a c a c
q1 = ; q2 (q1 ) =
2 4
a oferta da indústria é
1 1 3
Q = q1 + q2 = (a c) + (a c) = (a c)
2 4 4
– e o preço de mercado
1
P (Q) = a Q= (a + 3c)
4
– tal que o lucro da líder será

1 = P (Q) q1 cq1 = q1 (P (Q) c)


1 1
= (a c) (a + 3c) c
2 4
1
= (a c)2
8

86
– e o lucro da seguidora

2 = P (Q) q2 cq2 = q2 (P (Q) c)


1 1
= (a c) (a + 3c) c
4 4
1
= (a c)2
16
Como esperado a …rma líder leva vantagem sobre a seguidora, 1 > 2.

Stackelberg X Cournot.

3 2
1. Qs = 4 (a c) > 3 (a c) = Qc , e portanto
1
2. ps = 4 (a + 3c) < 13 (a + 2c) = pc
3. note que o lucro da líder em Stackelberg é maior do que o lucro dos duopolis-
tas em Cournot mas que esse é maior do que o lucro da seguidora em Stack-
elberg.

– no entanto nada podemos dizer com relação ao bem-estar social: ainda que
a soma dos ganhos das …rmas em Cournot seja maior do que em Stackelberg
3 2
16 < 9 , o fato de o preço do bem ser menor em Stackelberg faz com que
o excedente do consumidor seja maior nesse caso.

3.3.2 Barganha sequencial

Barganha é algum tipo de situação que encontramos corriqueiramente no dia-a-dia.


Observamos desde situações muito simples, quando um …lho adolescente barganha com
o pai o horário que ele pode chegar em casa nas noites de sexta-feira e sábado, em que
ele propõe chegar mais tarde em troca de algum tempo a mais de estudo diário, até
situações complexas, em que presidiários barganham com os representantes do Estado
o …m de uma rebelião, ou países que barganham tarifas comerciais sobre o conjunto de
produtos que eles comercializam. Na verdade, exemplos de situações de barganha são
extremamente fáceis de encontrar e nós de fato nos deparamos com tais situações em
todos os momentos - ainda que não tenhamos em mente que tal caso especí…co possa
ser analisado teoricamente como um jogo dinâmico de informação completa.
O processo de barganha é geralmente interpretado como o processo de construção
de um acordo mútuo sobre a provisão de um contrato. No mundo real, o protótipo
básico é a negociação entre um vendedor e um comprador sobre um bem em troca
de dinheiro: o contrato especi…ca o preço a ser pago pelo ítem. Em uma negociação
salarial, por exemplo, o sindicato é o vendedor, a …rma o comprador e o preço é o
salário-base.

87
Tanto em contextos econômicos quanto legais, um acordo pode ser retardado na
medida em que as partes prolonguem a negociação. Eventualmente pode acontecer
de as partes interessadas nunca chegarem a um acordo. Via de regra esse atraso im-
plica em algum tipo de custo às partes interessadas: um custo de oportunidade da
negociação, ou seja, dos ganhos que cada parte poderia estar obtendo se o acordo já
tivesse sido fechado, e um custo pecuniário inerentes à negociação, como por exemplo
custos processuais. Esses custos de oportunidade podem ser representados pela pro-
dução que não se realizou e os custos pecuniários pelos gastos com a intermediação do
acordo. Tais custos podem ser signi…cativos em casos importantes, como aquisições
corporativas, greves patrocinadas por sindicatos de trabalhadores e em diversos litígios
civis.
Se não se chega a um acordo, então em algum período de tempo as partes param de
barganhar, como no caso em que comprador e vendedor buscam parceiros alternativos
para fazer seus negócios. Nesse caso, se pensarmos no contexto legal, uma corte impõe
alguma regra que as partes devem seguir. Nesse sentido, essas cortes legais são um
exemplo de resolução judicial de impasses.
No que se segue vamos analisar o modelo teórico de barganha tendo como pano de
fundo um processo de negociação entre um sindicato de trabalhadores e uma entidade
patronal, representante das empresas na quais esses trabalhadores são funcionários.
Não custa uma palavra de precaução aqui: como em todo modelo teórico, essa rep-
resentação é uma simpli…cação das negociações que de fato ocorrem no mundo real e
nesse sentido não buscamos generalizar os resultados que obtivermos para enriquecer
a nossa compreensão de negociações como um todo, mas tão somente entender esses
processos de negociações como jogos dinâmicos de informação completa4142 .
O jogo se dá como se segue. Há, dois jogadores, 1 e 2, onde vamos considerar que 1
representa uma associação patronal e que 2 representa um sindicato de trabalhadores.
Eles estão negociar sobre a divisão dos benefícios da produção de um determinado
período, um ano por exemplo. Esse benefício é de conhecimento comum e, obviamente,
sua totalidade soma 100%. A negociação se dá entre as partes de forma a decidir o
41
Existe uma literatura consolidada de barganha em ambientes de informação incompleta. De…n-
itivamente essa literatura foge do escopo deste curso. O aluno curioso e interessado pode achar em
Rubinstein (19??) uma exposição do tema, mas não há nenhuma exposição do assunto que não demande
um conhecimento mais pormenorizado tanto de teoria dos jogos quanto da parte formal.
42
Como dito acima, uma transação, contrato ou disputa legal qualquer requer algum tipo de barganha
entre as partes, seja sobre o preço seja sobre outros aspectos do acordo. Via de regra esse processo
parece ser ine…ciente em função de atrasos (por exemplo uma greve que prejudica tanto os salários
dos trabalhadores quanto a produção da …rma) e de gastos diretos que poderiam ter sido evitados
concluindo um acordo similar antes. Os estudos do papel de informação privada (jogos de informação
incompleta) em negociações indicam, entretanto, que esses custos são consequências dos incentivos das
partes em se comportarem estrategicamente e da necessidade de comunicação para estabelecer uma
base comum de forma a montar o acordo.

88
percentual que cada um dos interessados tem direito sobre essa totalidade43 . Ambas
as associações desejam obter o máximo possível para os seus associados e a dinâmica
da negociação se dá do seguinte modo:

1. a associação patronal propõe uma divisão;

2. o sindicato pode aceitar ou rejeitar a proposta: se o sindicato aceita, o jogo


termina e cada jogador obtém o acordado. Caso contrário, ele não aceita, o jogo
continua;

3. o sindicato propõe uma divisão;

4. a associação patronal pode aceitar ou rejeitar a proposta: se aceita o jogo termina


e cada parte recebe o combinado. Se rejeita a proposta, então a Justiça do
Trabalho impõem uma divisão de 50% para cada uma das partes e o jogo também
termina.

É necessário algum tempo para preparar cada proposta e contraproposta. Por


isso, se o acordo for fechado em 2, então os jogadores têm 1 (100%) para repartir.
Se terminar com a associação patronal aceitando a proposta no quaem 4, os benefícios
serão apenas de 2 (0; 1); e se a barganha terminar com a intervenção da Justiça, então
os benefícios são apenas de 2 . Esse termo é dito taxa de desconto intertemporal e
re‡ete o fato de que as pessoas (e instituições) avaliam de maneira distinta uma mesma
quantia monetária em diferentes períodos de tempo, captando portanto o custo de
oportunidade acima discutido. Ou seja, re‡ete o custo de oportunidade de não receber
o valor imediatamente. Em geral essa taxa de desconto é determinada pela taxa de
juros da seguinte forma,
1
=
1+r
onde r é a taxa de juros de mercado. Observe que quanto maior r, menor a taxa de
desconto, de forma que os agentes estariam descontando com peso maior o tempo. Ob-
serve ainda que essa taxa pode re‡etir caracterísitcas especí…cas das partes engajadas
na barganha. Imagine por exemplo o custo de uma greve seja maior para uma das
partes. Ou que um trabalhador especí…co assumiu compromissos tais com sua renda
43
Pense por exemplo que a divisão desses benefícios se dá através de uma campanha salarial. Ou
mais ainda, não só uma campanha salarial onde os trabalhadores gostariam de ver incorporados nas
suas remunerações os benefícios da produção, mas também a inclusão de diversos outros ítens que
indiretamente afetam essa remuneração, como por exemplo assistência médico-odontológica para cada
trabalhador e sua família, a criação de uma creche na empresa para atender pais e mães com …lhos
pequenos, a melhoria no refeitório da …rma, questões de transporte dos funcionários etc. Para quem
acha que essas nunaces são por demais abrangentes, considere que é comum uma pauta de negociação
com mais de 100 ítens em alguns setores maiores e mais organizados, como metalúrgicos no ABC ou
sindicatos de bancários.

89
que uma paralisação no seu ‡uxo de renda nesse período especí…co pode lhe ser partic-
ularmente custosa44 . Para facilitar a nossa análise e sem perda de generalidade, vamos
considerar que ambas as partes têm a mesma taxa de desconto.
Na forma extensiva o jogo é representado como especi…cado pela árvore abaixo

…gura: o jogo na forma extensiva

Logo há dois jogadores (1 e 2), as estratégias são as descritas na árvore, assim como
a ordenação e os payo¤s. Como trata-se de um ambiente de memória perfeita, os
movimentos dos jogadores em cada nó de decisão é de conhecimento comum em cada
um desses nós.
Sendo mais especí…co, observe o que acontece no primeiro movimento: o jogador 1
diz ao jogador 2 que do total que eles estão barganhando, ele quer x 2 [0; 1], ou x%,
de forma que ele está oferecendo a 2 (1 x) %. Como dito, 2 pode ou não aceitar. Se
aceita a barganha termina e os ganhos são dados. Caso contrário 2 faz a contraproposta
ao jogador 1: do total a ser dividido, ele que (1 y) %, de modo que oferece a 1 y%.
Da mesma forma o jogador 1 pode aceitar ou rejeitar. Se 1 aceita o jogo termina e os
ganhos são dados. Note porém que agora já estamos no segundo estágio do jogo, de
forma que as partes já incorreram em algum custo decorrente do fato de que elas não
chegaram a um acordo no primeiro período.
De

Pede-se:

1. Taxa de desconto intertemporal (já está feita em jogos repetidos, mas ter em
mente a questão da in‡ação, taxa de juros, reputação e o exemplo do sorvete
derretendo).

2. Represente o jogo na sua forma extensiva.

Os payo¤s são (x; 1 x) no primeiro estágio, ( y; (1 y)) no segundo estágio e


2 2
2; 2 caso seja necessária a intervenção da Justiça do Trabalho.

2. Quanto cada jogador vai obter em equilíbrio perfeito.


44
O exemplo clássico que ilustra a taxa de desconto é dado pelo caso em que dois irmãos ganham
da mãe um pote de sorvete. Eles barganham sobre quanto cada parte tem direito sobre o total (100%)
do produto. Se eles discutem e não chegam a um acordo em um determinado tempo, então o sorvete
derrete um pouco e o montante que eles têm para dividir passa a ser menor do que o inicial. No …nal,
se eles não chegam ao acordo, então a mão intercede e decide ela mesma o quanto cada um tem direito
(pode mesmo ser “perdi a paciência!!! Ninguém vai ganhar sorvete hoje!”).

90
Por indução retroativa, no segundo (e último) estágio da barganha, o sindicato
oferece (y) aos empresários, que aceitam se e somente se
2
y
2
Logo a proposta será
y=
2
2 2
e os ganhos nesse estágio seriam Up = y = 2 e Ut = (1 y) = 2 . No
primeiro estágio do jogo os empresários ofertam (1 x) aos trabalhadores que
aceitam se e somente se
2
1 x
2
de modo que a oferta ótima será
2
1 x=
2
2 2
e os ganhos seriam Up = x = 1 + 2 e Ut = 1 x = 2 . Logo o equilíbrio
de Nash perfeito em subjogos (o que nesse jogo equivale ao resultado por indução
2
retroativa) será a associação patronal ofertar (1 x) = 2 aos trabalhadores
no primeiro estágio, os trabalhadores aceitarem a proposta feita, o jogo terminar
2 2
e os ganhos serão dados por Up = 1 + 2 e Ut = 2.

3. Se você representasse os trabalhadores, você preferiria fazer a proposta em primeiro


lugar ou ouvir primeiro a oferta dos empresários?

A primeira coisa a ser feita é representar o jogo na forma extensiva supondo


que o sindicato de trabalhadores faça a oferta em primeiro lugar, no primeiro
estágio. Nesse caso os payo¤s seriam (1 x; x) no primeiro estágio, ( (1 y) ; y)
2 2
no segundo estágio e 2 ; 2 caso fosse necessária a intervenção da Justiça do
Trabalho. Resolvemos o jogo da mesma maneira, de modo que no segundo estágio
da barganha, os empresários oferecem (1 y) aos trabalhadores, que aceitam se
e somente se
2
(1 y)
2
Logo a proposta será
1 y=
2
2 2
e os ganhos nesse estágio seriam Up = y = 2 e Ut = (1 y) = 2 .
No primeiro estágio do jogo os trabalhadores ofertam x aos empresários. Estes
aceitam se e somente se
2
x
2

91
de modo que a oferta ótima será
2
x=
2
2 2
e os ganhos seriam Up = x = 2 e Ut = 1 x= 1 + 2 . Segue que o
equilíbrio de Nash perfeito em subjogos será o sindicato dos trabalhadores ofertar
2
x= 2 aos patrões no primeiro estágio, os empresários aceitarem essa proposta
2 2
e o jogo terminar ali. Os ganhos seriam dados por Up = 2 e Ut = 1 + 2.
Note que os trabalhadores estarão melhor fazendo a oferta no primeiro estágio se
2 2
1 +
2 2
ou seja, se
2
2 +1 0
o que é sempre verdade para todo 2 [0; 1].

3.4 Equilíbrio Perfeito em Subjogos


Até agora estudamos separadamente jogos dinâmicos e jogos estáticos. Entretanto,
é bastante usual trabalharmos com jogos que tenham partes simultâneas e outras não
simultâneas, i.e., que tenham informação imperfeita em pelo menos algum de seus
estágios. A forma de resolução segue a mesma lógica anterior: começar de trás para
diante até chegarmos no início do jogo. Entretanto, sempre quando nos depararmos com
um “mini-jogo” com lances simultâneos (ou, no mesmo sentido, que tenha informação
imperfeita), devemos resolvê-lo como visto na seção anterior e então tomarmos seu
resultado (o equilíbrio de Nash encontrado) como os payo¤s a serem distribuídos caso
o jogo atinja essa parte simultânea. Um exemplo facilitará a compreensão.
Exemplo 51 Considere o jogo visto acima onde uma …rma cogita em entrar no mer-
cado onde há uma outra que é monopolista. Façamos, no entanto, uma modi…cação: a
…rma que pensa em entrar (E) tem agora a opção de, caso entre, lutar ou acomodar-se
após a entrada. A representação na forma extensiva …caria assim:

92
O signi…cado da linha tracejada entre dois pontos de decisão signi…ca que essa parte
do jogo é simultânea, i.e., quando o segundo joga ele não sabe o que o primeiro fez.
Note que, sendo assim, não faz diferença se, nessa parte do jogo, trocássemos a ordem
dos jogadores na árvore de decisão. De qualquer forma, nenhum dos dois sabe o que o
outro está fazendo nesse instante.
Antes de analisar o jogo com informação imperfeita, vamos ignorar a linha tracejada
e analisar o jogo no caso em que não uma parte dele que seja simultânea. Tomando o
jogo na forma extensiva, observe que o espaço de estratégias dos jogadores (entendido,
como sempre, como um plano completo de ação) será

SE = f(F; l) ; (F; a) ; (E; l) ; (E; a)g


( )
(l se el e l se ea) ; (l se el e a se ea) ;
SI =
(a se el e l se ea) ; (a se el e a se ea)

onde, por exemplo, (F; a) para o entrante signi…ca que ele joga “fora, acomodar se ele
entra” e (a se el e l se ea) para o incumbente signi…ca que ele “acomoda se o entrante
entra e luta e luta se o entrante entra e acomoda”. Podemos representar o jogo 4 4
na forma normal e veri…car o(s) equilíbrio(s) de Nash - faça isso como exercício. Por
indução retroativa, veri…que que o resultado será

f(E; a) ; (l se el e a se ea)g

Vamos incorporar informação imperfeita (considerar a linha tracejada) e ver o que


muda. Tomando o espaço de estratégias dos jogadores como um plano de ação para
cada contigência do jogo, o fato de o jogador E não mais observar qual foi o segundo
movimento de I (o primeiro movimento ele sabe, pois se ele não joga pode concluir que
I jogou “fora”no primeiro estágio e se ele é chamado a jogar infere que I jogou “entra”
- e isso é de conhecimento comum) altera o seu espaço de estratégias, que passa a ser
apenas
SI = fl se E entra; a se E entrag
O procedimento para solucionar esse jogo será resolver primeiro o chamado subjogo
(a ser de…nido abaixo) simultâneo, pois ele é a parte …nal do jogo como um todo. Para
tanto, podemos representá-lo na forma normal, como usualmente se faz com os jogos
estáticos.
…rma I
acomoda luta
…rma E acomoda 3; 1 2; 1
luta 1; 2 3; 1
O equilíbrio de Nash do jogo acima é, portanto, ambos acomodarem. Sabendo disso,
podemos substituir na árvore do jogo original o jogo simultâneo acima pelo resultado
do seu equilíbrio de Nash.

93
No jogo reduzido acima, apenas a …rma E escolhe. Ela preferirá claramente entrar e
obter payo¤ de 3 unidades, ao invés de zero, que obteria caso não entrasse. Isto porque
ela acredita que, entrando, o resultado do jogo simultâneo será o seu equilíbrio de Nash,
onde ambas as …rmas resolvem se acomodar. O resultado será

f(E; a) ; (a se E entra)g

Observe a diferença com indução retroativa nesse caso: as payo¤s serão os mesmos e
o jogo no …m seguirá na mesma direção nos dois casos (nem sempre isso será verdade,
nesse exemplo foi). Porém observe a diferença nas estratégias dos jogadores dada pela
presença ou não de informação imperfeita, de uma parte do jogo que se assemelha a
um jogo simultâneo.
Podemos também representar todo o jogo inicial na forma normal, especi…cando
cada estratégia (de…nida, como visto na seção II, como um plano completo de ações45 )
possível para os jogadores.

…rma I
acomoda se E entra luta se E entra
fora, acomoda se entra 0; 2 0; 2
…rma E fora, luta se entra 0; 2 0; 2
entra, acomoda se entra 3; 1 2; 1
entra, luta se entra 1; 2 2; 1

Podemos notar que existem três equilíbrios de Nash no jogo acima. Um deles é o
resultado que havia sido encontrado via indução retroativa tomando o equilíbrio de
Nash da parte simultânea do jogo como dado. Os outros dois, embora constituam
equilíbrio de Nash, não são sequencialmente racionais. O problema deles é admitir
que a …rma E considere a ameaça da …rma I de lutar caso ela entre. Tal ameaça, no
45
Nos jogos simultâneos, a percepção do que é uma estratégia é extremamente simples, constituindo-
se simplesmente em uma ação possível a um determinado jogador. Nos jogos sequenciais, essa de…nição
é bem mais sutil. Nesse tipo de jogo, uma estratégia tem que de…nir qual seria a escolha do jogador em
cada uma das possibilidades que ele pudesse vir a ser chamado a jogar. Isso signi…ca que, mesmo que,
quando o jogo vier a ser efetivamente jogado, o jogador não tenha que fazer uma escolha em um ponto
especí…co dele, porque esse não ter sido alcançado, uma estratégia terá que de…nir o que ele faria caso
fosse necessário escolher naquela circunstância. A idéia é que, se o jogador especi…casse uma estratégia
e a dissesse a um procurador, esse saberia o que fazer em qualquer hipótese que porventura viesse a se
veri…car quando o jogo fosse efetivamente jogado.

94
entanto, não é crível: uma vez que a …rma E resolveu entrar e o fez, é pouco razoável
que a …rma I lute, pois essa estratégia não compõe nenhum equilíbrio de Nash no
jogo simultâneo que se inicia após a entrada de E. Con…rma-se então, novamente, a
fragilidade do conceito de equilíbrio de Nash quando trabalhamos com jogos dinâmicos.
O conceito que utilizaremos para resolver jogos dinâmicos que tenham informação
imperfeita é um re…namento de equilíbrio de Nash, chamado Equilíbrio de Nash Perfeito
em Subjogos (ENPS). O resultado encontrado no exemplo anterior (onde a …rma E entra
no mercado e, em seguida, ambas acomodam) é um caso de um resultado caracterizado
por um Equilíbrio de Nash Perfeito em Subjogos. Entretanto, para de…nir o conceito
mais precisamente, é necessário de…nir previamente a noção do que vem a ser um
subjogo.

De…nição 52 Um subjogo de um jogo J na forma extensiva é um subconjunto do jogo


que tem as seguintes propriedades:

inicia-se em um ponto de decisão único (não ligado a nenhum outro por “linhas
tracejadas”)

contém todos os pontos de decisão que o sucedem, e apenas esses pontos;

não divide nenhum subjogo, no sentido de que se um determinado ponto de decisão


pertence a um subjogo, então todo ponto ligado a ele por alguma “linha tracejada”
também pertence, i.e., os subjogos não cortam tais linhas46 .

Exemplo 53 No exemplo anterior, há dois subjogos: um que se inicia após a …rma E


resolver entrar até o …m do jogo e outro que é o próprio jogo.

Exemplo 54 Em jogos de informação perfeita, todos os pontos de decisão iniciam


subjogos. Portanto, nesse tipo de jogo, haverá tantos subjogos quantos forem os pontos
de decisão.

De…nição 55 (Selten, 1965) Um conjunto de estratégias ' = ('1 ; :::; 'I ) em um jogo
J dinâmico com I jogadores é um Equilíbrio de Nash Perfeito em Subjogos (ENPS) se
ele induz a um equilíbrio de Nash em cada um dos subjogos de J.

Em outras palavras, as estratégias serão um ENPS se de…nirem um equilíbrio de


Nash em todos os subjogos do jogo.
Note que todo ENPS é um equilíbrio de Nash (uma vez que o jogo como um todo
também é um subjogo, como se depreende da de…nição de subjogo), mas nem todo
46
Denomina-se “conjunto de informação” todos os pontos de decisão únicos e todos os conjuntos
de pontos de decisão que não sejam únicos, e sim ligados por uma “linha tracejada”. Pode-se dizer,
portanto, que um subjogo não divide nenhum conjunto de informação.

95
equilíbrio de Nash é perfeito em subjogo. Esse último não permite que os jogadores
considerem ameaças não críveis, como o equilíbrio de Nash permite. Por exemplo, o
primeiro resultado que encontramos no jogo do exemplo 1 desta seção consatitui um
ENPS, mas não os outros dois EN encontrados.
Em jogos com informação perfeita, o resultado de indução retroativa coincide com o
conjunto de estratégias que constituem ENPS. Como consequência imediata do teorema
de Zermelo, temos que todo jogo …nito de informação perfeita possui um ENPS em
estratégia puras. Além disso, se nenhum jogador tem os mesmos payo¤s em dois dos
postos terminais dos jogos, pode-se garantir também que existe um ENPS que é único.

Exemplo 56 Encontre o ENPS do jogo abaixo:

Antes de mais nada é importante identi…car o espaço de estratégias dos jogadores,

S1 = f(e1 ; e4 ) ; (e1 ; d4 ) ; (d1 ; e4 ) ; (d1 ; d4 )g


S2 = f(e3 ; e2 ) ; (e3 ; d2 ) ; (d3 ; e2 ) ; (d3 ; d2 )g

onde, por exemplo, para o jogador 1 a estratégia (e1 ; d4 ) signi…ca “jogar e1 , jogar d4 se
1 jogou d1 e 2 jogou e2 ou d2 ”e para o jogador 2 a estratégia (e3 ; d2 ) signi…ca “jogar e3
se 1 jogou e1 e jogar d2 se 1 jogou d1 ”. Em seguida identi…camos os subjogos do jogo.
Nesse jogo acima há três, identi…que-os.
Feito isso, resolvemos o subjogo com informação imperfeita:

jogador 2
e2 d2
jogador 1 d4 2; 2 0; 0
e4 1; 4 3; 1

onde, observe, o (único) equilíbrio de Nash no subjogo acima é (d4 ; e2 ). Substituindo


o subjogo pelos payo¤s associados ao seu equilíbrio de Nash na árvore original, o jogo

96
se reduz a

Podemos agora resolver o subjogo em que o jogador 2 começa jogando: uma vez
alcançado aquele ponto de decisão, o jogador 2 escolherá d3 , que lhe dará utilidade de
3 (>1). Substituindo esse resultado no jogo, teremos a árvore reduzida abaixo, onde
apenas o jogador 1 tem de escolher:

Obviamente, o jogador 1 escolherá d1 . O resultado previsto do jogo é, portanto,


(d1 ; d4 ; e2 ). O ENPS que o caracteriza, por sua vez, é um pouco mais detalhado,
sendo composto pelas estratégias:

jogador 1: (d1 ; d4 ), “jogar d1 , jogar d4 se 1 jogou d1 e 2 jogou e2 ou d2 ”

jogador 2: (d3 ; e2 ), “joga d3 se 1 jogou e1 e jogar e2 se 1 jogou d1 ”.

Simpli…cadamente, escreveremos

ENPS = f(d1 ; d4 ) ; (d3 ; e2 )g .


O exemplo acima, como visto, possui apenas um ENPS. Seria possível a existência
de mais de um ENPS em um jogo? Sem dúvida, e voltaríamos então para o problema
de multiplicidade de equilíbrios, di…cultando também aqui previsões mais precisas ac-
erca dos possíveis resultados. A discussão anterior sobre múltiplos equilíbrios de Nash
aplicaria-se portanto também aqui.

Exemplo 57 Encontrar o(s) ENPS no jogo abaixo:

97
Inicialmente, iden…quemos as estratégias dos jogadores,
( )
(a; h) ; (a; i) ; (a; j) ;
S1 =
(b; h) ; (b; i) ; (b; j)
( )
(c; e) ; (c; f ) ; (c; g) ;
S2 =
(d; e) ; (d; f ) ; (d; g)

onde, por exemplo, para o jogador 1 a estratégia (b; i) signi…ca “jogar b e jogar i se 1
jogou b e 2 jogou e; f ou g” e para o jogador a estratégia (c; f ) signi…ca “jogar c se 1
jogou a e jogar f se 1 jogou b”. Novamente há três subjogos no jogo e você deve ser
capaz de identi…cá-los.
Vamos agora solucionar o subjogo que se inicia no nó de decisão de 2 condicional
ao jogador 1 ter adotado a ação “b”. Teremos o seguinte subjogo simultâneo:

jogador 2
e f g
h 1; 1 3; 0 4; 0
jogador 1 i 2; 0 5; 2 0; 1
j 3; 4 0; 0 1; 0

Neste subjogo há dois equilíbrios de Nash. Para encontrar-se o(s) ENPS, o procedi-
mento é o mesmo de antes, com a diferença de que se deve fazê-lo utilizando os dois
equilíbrios de Nash encontrados no subjogo.
Substituindo inicialmente o resultado (j; e), a decisão inicial do jogador 1 será entre
escolher a e obter payo¤ de 4 unidades (pois nesse caso o jogador.2 irá preferir d) e
optar por b e alcançar apenas 3, …cando, logicamente, com a primeira opção. Por outro
lado, substituindo o equilíbrios de Nash (i; f ) na árvore de decisão, o jogador 1 preferirá
optar por b em sua primeira escolha, pois nesse caso obterá payo¤ de 5 unidades. Os
ENPS do jogo são, portanto, dois, assim de…nidos:

ENPS 1:

– jogador 1 escolhe a; se optasse por b, jogaria posteriormente j;


– jogador 2 escolhe d se o jogador 1 jogou a; e opta por e se o jogador 1 jogou
b.

ENPS 2:

– jogador 1 escolhe b; em seguida, joga i;


– jogador 2 escolhe d se o jogador 1 jogou a; e opta por f se o jogador 1 jogou
b.

98
Exemplo 58 O jogo da “centopéia”. Este conhecido jogo, popularizado por Rosenthal
(1981), é representado na Figura 13 abaixo, onde cada vez que um jogador tem a vez de
jogar, ele tem a opção de parar o jogo ou continuá-lo, passando a vez ao outro jogador.
Os payo¤ s, no entanto, têm uma lógica especial: em cada estágio, sempre que um
jogador resolve não terminar o jogo, no ponto terminal seguinte (que seria alcançado
se o outro jogador terminasse o jogo logo em seguida) ele terá uma unidade a menos,
enquanto o outro jogador obterá duas unidades de payo¤ s a mais.

O resultado do jogo acima, como de praxe, deve começar a ser pesquisado analisando-
se o seu …nal. Caso se alcance a última rodada, o jogador 2 preferirá jogar para baixo e
obter payo¤ de 101 (>100). Sabendo disso, o jogador 1 prefere terminar o jogo antes de
o jogador 2 fazer sua última jogada, pois assim ele ganharia 99 (>98). Mas o jogador
2 , sabendo disso, preferiria terminar o jogo uma rodada antes para obter 100 (>99).
E assim sucessivamente, até se chegar no início do jogo, onde o jogador 1 o termina
sem dar chances do jogador 2 jogar. Cada um deles ganha, portanto, uma unidade
de payo¤. Tal resultado parece paradoxal, mas é apenas consequência do “common
knowledge” da racionalidade sequencial dos jogadores.
Pense o que ocorreria se o jogador 1 não terminasse a partida na primeira rodada.
Talvez ele não fosse racional, ou achasse que o outro jogador não fosse racional, ou
que o jogador 2 não soubesse que ele era racional e quisesse “…ngir” que era irra-
cional, ou ainda outras possibilidades. Nesse caso não haveria “common knowledge”
da racionalidade dos jogadores e o jogo poderia se prolongar por mais algum tempo.
Não poderíamos, no entanto, determinar até quando isso iria ocorrer.
Sendo jogado algumas vezes com alunos do curso de Teoria dos Jogos da PUC-MG
(com uma versão simpli…cada da “centopéia”, correspondente a 90% inferior ao jogo
mostrado acima), em nenhuma delas o jogo terminou na primeira rodada. Isso ocorria
apenas quando se estava faltando duas ou três rodadas para que o jogo terminasse de
qualquer forma (no …m da centopéia). Tais resultados indicam que nesse caso a hipótese
de pleno conhecimento da racionalidade pode ser forte demais. O que veri…camos
nas experiências em sala de aula foi que, na verdade, apenas após várias escolhas
fazendo o jogo continuar, vendo esse caminhar para o seu …nal automático (a última
rodada possível), é que os jogadores envolvidos paravam realmente para pensar no
melhor a se fazer. Isso leva a uma outra possibilidade de explicação: como os payo¤s
eram apenas imaginários e os alunos, com pouco tempo para se decidirem sobre o que
fazer, encaravam a experiência como uma brincadeira, não faziam grandes esforços para
pensar na sua melhor etratégia, pelo menos no início do jogo, quando esse se apresentava

99
relativamente ainda muito complexo. Eventualmente, com payo¤s reais e signi…cativos
para os jogadores, e com um tempo superior para a análise do jogo, poderia ser que o
resultado fosse de fato o de indução retroativa (que também é ENPS).
Outra forma de explicação para o resultado improvável de indução retroativa no
jogo da centopéia é que a exigência de “racionalidade” é exagerada. O problema é
que as iterações necessárias do tipo “todos são racionais; todos sabem que todos são
racionais; todos sabem que todos sabem que todos são racionais etc.” para se chegar
ao resultado de indução retroativa nesse caso são muito numerosas. Quando se exigem
apenas duas ou três, nenhuma contestação é feita ao mecanismo e o resultado previsto
parece con…ável. Entretanto, quando esse número cresce, a credibilidade das previsões
derivadas desse método se reduz. No jogo da centopéia, exige-se 200 iterações! Uma
alternativa é tentar modelar a “irracionalidade” emergente em casos como esses. Não
é nosso objetivo entrar nessa discussão, mas apenas introduzir a questão e alertar para
as de…ciências da teoria. No entanto, o leitor interessado pode consultar Kreps (1990)
para avançar no tema.
Além disso, hoje estuda-se uma outra linha de pesquisa chamada de “racionalidade
limitada”, que também procura dar respostas a questões como essas. Ou seja, jogos
onde as previsões dadas pela teoria dos jogos convencional são “pouco razoáveis”, não
sendo assim muito úteis. Uma das idéias básicas da “racionalidade limitada” é que os
agentes aprendem com o tempo. Além disso, ela tenta explicar as falhas da teoria con-
vencional em jogos que sejam muito complexos para os jogadores resolverem utilizando
os conceitos de equilíbrio usuais. Um exemplo claro é o jogo de xadrez: é um jogo de
informação completa e perfeita; entretanto, nem mesmo o melhor computador da IBM,
o Deep Blue, construído essencialmente para jogar xadrez, obteve êxito de decifrar
todas as possibilidades do jogo - uma vez que perdeu uma partida para o campeão
Gary Kasparov. Os novos desenvolvimentos que incorporam a idéia de “racionalidade
limitada”, contudo, ainda não se consolidaram e também ultrapassam o escopo dessas
notas. Para uma didática introdução ao tema, ver Kreps (1994).

Exemplo 59 Pode ocorrer também que em um determinado jogo não exista nenhum
ENPS. Esse é o caso deste jogo, baseado em Kreps (1994). No primeiro estágio, dois
jogadores escolhem, simultaneamente, entre duas opções, X e Y. Caso ambos escolham
Y, cada um recebe $5. Se um escolher Y e o outro X, ninguém recebe nada. Se
ambos escolherem X, passa-se ao segundo estágio, onde eles, também simultaneamente,
escolhem um número inteiro qualquer. O que escolher o maior, recebe o correspondente
em unidades monetárias, enquanto o outro …ca com metade daquele valor.

O subjogo …nal, similar a outro já apresentado na seção anterior, não possui nenhum
equilíbrio de Nash. Sendo assim, não pode existir um resultado que induza a um
equilíbrio de Nash em todos os subjogos, constituindo um ENPS. O que há nesse

100
jogo é um equilíbrio de Nash, no jogo como um todo. Esse corresponde a ambos os
jogadores escolherem inicialmente a opção Y. Nenhum teria, pois, incentivo a desviar.
Obviamente, o conceito de equilíbrio de Nash em jogos sequenciais é falho, por motivos
já comentados. Nesse caso, mais uma vez, ele terá muito pouca relação com a realidade,
uma vez que é muito pouco provável que algum jogador escolha inicialmente Y. Note
que o teorema de Zermelo não se aplica aqui, uma vez que o jogo não é de informação
perfeita. Por isso foi possível a não existência de um ENPS.

4 Jogos Repetidos
Nesse tópico analisaremos novamente se ameaças e promessas em relação ao futuro
podem in‡uenciar o comportamento atual dos agentes. Ao fazer isso, buscamos mostrar
o que muda em uma análise de previsão do resultado de jogos quando esses são jogados
mais de uma vez. Uma das principais idéias é a de cooperação: será possível obtê-la caso
o jogo se repita? Intuitivamente, poderíamos pensar que sim, pois um jogador poderia
cooperar “hoje” para que os outros cooprerem com ele “amanhã”, e isso poderia valer
para todos os envolvidos. Deve-se, portanto, veri…car quando e sob que condições essa
intuição de fato poderá se manifestar na realidade.
Os jogos repetidos são divididos em dois grupos: aqueles repetidos um número …nito
de vezes e aqueles repetidos “in…nitamente”. Em relação ao primeiro grupo, a intuição
fundamental pode ser apreendida apenas analisando-se o caso de jogos repetidos duas
vezes, o que iremos fazer a seguir. Aqueles repetidos in…nitamente exigem alguns
conceitos adicionais, apresentados na seção dois.

4.1 Jogos repetidos …nitos


A característica fundamental dos jogos repetidos …nitos é que todos os jogadores
envolvidos sabem, antecipadamente, quantas vezes aquele jogo se repetirá. Pense, por
exemplo, em um Congresso X de três dias que ocorrerá em um determinado hotel. Ex-
istindo dois vendedores de pipoca naquela região, eles sabem que esse jogo (o mercado
que vende pipocas na porta do hotel naqueles dias com demanda especialmente am-
pliada) durará exatamente três dias, e com base nessa informação é que de…nem suas
estratégias. A questão a se veri…car é o que muda no caso onde o jogo é jogado apenas
uma vez, como visto até agora, e quando se repete um número especí…co de vezes.
Como sempre, vamos iniciar a exposição através do um exemplo do “dilema dos
prisioneiros”. Suponha então que o jogo fosse jogado duas vezes, sendo que, quando se
reinicia o jogo, o resultado do primeiro estágio já é conhecimento comum. Os payo¤s
dos jogadores serão tidos como simplesmente a soma dos payo¤s nas duas vezes em que
se joga.

101
A forma de resolução de jogos de tal natureza é similar àquela vista para se encontrar
ENPS, i.e., deve-se analisar de trás para frente. No caso especí…co citado acima, os
jogadores, uma vez que se iniciará a segunda rodada do “dilema dos prisioneiros”,
sabem que o resultado do primeiro estágio já foi consolidado e, portanto, não têm mais
como mudá-lo. Sendo assim, eles se preocupam apenas com o que virá, ou seja, a
segunda rodada do jogo em questão. Pensando dessa forma, o que eles irão fazer no
segundo estágio do jogo? Irão proceder como fariam se o jogo fosse jogado apenas uma
vez (pois, a…nal, o que ocorreu na primeira rodada não poderá mais ser mudado): como
ambos têm uma estratégia dominante, que é confessar, a jogarão na segunda vez.
jogador 2
NC C
jogador 1 NC 1; 1 9; 0
C 0; 9 6; 6
Como dito acima, a idéia por trás dos jogos repetidos é que, como ele será jogado
mais de uma vez, pode ser que valha a pena cooperar no início para que o outro também
coopere com você nos estágios subsequentes. Todavia, perceba que uma vez que se saiba
que se alcançou o último estágio do jogo, ninguém mais irá cooperar, pois não mais
se necessitará que o outro também coopere no futuro, uma vez que o futuro, para tal
jogo, não existirá - pois aquela é a última rodada. Portanto, podemos concluir que:

Observação 60 Em um jogo repetido um número …nito de vezes, onde os payo¤ s dos


jogadores são a soma dos payo¤ s obtidos em cada vez que o jogo é repetido, na última
rodada será jogado um Nash do jogo não repetido em questão, ainda que exista uma
combinação de estratégias que dê payo¤ s maiores para todos os jogadores mas que não
seja em equilíbrio de Nash. Esta seria atingível apenas via cooperação, mas essa não
existirá na última vez em que o jogo é repetido.

No dilema dos prisioneiros jogado duas vezes, no primeiro estágio, os jogadores,


portanto, sabem que na rodada seguinte ambos irão confessar e, assim, obter um payo¤
de 6 cada. Eles podem então pensar o jogo repetido duas vezes apenas como o jogo
em seu primeiro estágio acrescido de 6 para ambos nos payo¤s referentes a todos os
resultados possíveis, uma vez que eles antecipam que esse será o ganho de cada um na
última rodada. O jogo original é, portanto, encarado como se fosse o seguinte:
jogador 2
NC C
jogador 1 NC 7; 7 15; 6
C 6; 15 12; 12
O que se fez acima foi simplesmente adicionar “ 6” em todos os payo¤s possíveis de
todos os jogadores. Visualizando esse jogo, eles devem então novamente confessar,

102
dado que essa permanece sendo uma estratégia dominante para ambos. Conclui-se
que o resultado do “dilema dos prisioneiros”repetido duas vezes será os dois jogadores
confessarem em todas elas. A cooperação não pode, portanto, ser atingida em nenhum
estágio, ainda que houvesse a promessa de um deles de que iria cooperar na primeira
vez, por exemplo. Ainda assim o outro não cooperaria, porque ele saberia que, agindo
assim, uma vez que o resultado do primeiro estágio emergisse, no segundo ninguém
iria cooperar. E então não cooperar no primeiro daria um payo¤ total superior a ele,
independente do que o outro …zesse, sendo, pois, uma estratégia dominante.
Essas conclusões permanecem inalteradas mesmo se mudássemos apenas o número
de vezes em que o jogo é repetido. Isto é, o resultado é válido mesmo para o “dilema”
- ou qualquer outro jogo de informação completa - jogado n vezes, sendo n um número
…nito. Imagine que ele fosse repetido quatro vezes. Na última ninguém cooperaria,
pois não haveria um “futuro” para o jogo que justi…casse essa atitude. Na penúltima
rodada, também ninguém cooperaria, porque todos saberiam que na última não haveria
cooperação. O mesmo ocorreria na segunda rodada: cooperar para quê, dado que na
terceira e na quarta ninguém o fará? Na primeira, o mesmo raciocínio se manteria. O
resultado geral pode ser apresentado da seguinte maneira:

Observação 61 De…nindo um jogo repetido T vezes como J (T ), sendo J o jogo si-


multâneo de informação completa que é repetido e tendo que, quando se reinicia um es-
tágio de J (T ), todos sabem quais são os resultados dos estágios anteriores; e de…nindo-
se os payo¤ s dos jogadores como simplesmente a soma dos payo¤ s obtidos nos T está-
gios de J (T ), se cada um dos estágios (J) de J (T ) possui um equilíbrio de Nash único,
J (T ) possui um único ENPS, qual seja, o equilíbrio de Nash de J em todo estágio de
J (T ). Se o jogo J é dinâmico (mas também com informação completa) e possui um
único ENPS, o ENPS do jogo repetido, J (T )47 , será também o ENPS de J em cada
estágio.

Em suma, se um jogo com apenas um Nash - ou ENPS - (e com informação completa,


como todos os que vimos até agora) for repetido um número …nito de vezes, o ENPS
do jogo repetido será o equilíbrio de Nash - ou ENPS - sendo jogado em todos os seus
estágios - desde que os payo¤s do jogo repetido seja apenas a soma dos payo¤s obtidos
em cada estágio.
Apesar do resultado “desanimador”visto acima, de que mesmo se o jogo for repetido
n vezes a cooperação não será atingida em nenhum estágio - dadas nossas hipóteses
47
Note que em um jogo estático e repetido T vezes, J (T ), haverá um número de subjogos igual a
P
T
ri 1
, onde r é o número de resultados possíveis de J (1), ou, da mesma forma, o número de pontos
i=1
terminais do jogo estático. Se J (1) conter alguma dinâmica, possuindo portanto mais de um subjogo,
P
T
digamos n, o total de subjogos de J (T ) será então n ri 1 .
i=1

103
adicionais -, um caso diferente emerge se existem mais de um Nash no jogo que será
jogado mais de uma vez. Um exemplo deixa claro tal possibilidade:

Exemplo 62
jogador 2
D E F
A 1; 1 5; 0 0; 0
jogador 1 B 0; 5 4; 4 0; 0
C 0; 0 0; 0 3; 3

No jogo acima, temos dois Nash: (A; D) e (C; F ). Vamos supor que ele será jogado
duas vezes. Pela lógica vista acima, sabemos que, no segundo estágio, será jogado um
Nash. Mas não sabemos qual!!! Os jogadores podem fazer então o seguinte acordo:

se no primeiro estágio o resultado for (B; E), no segundo eles jogam (C; F ). Caso
contrário, jogam (A; D) na segunda vez em que o jogo é jogado. Essa poderá ser
uma forma de se conseguir um resultado de cooperação, no caso caracterizado
por (B; E) - onde ambos ganham mais que em qualquer dos equilíbrios de Nash
do jogo não repetido -, pelo menos no primeiro estágio do jogo repetido, uma
vez que se sabe que no último isso não será possível. Se não há possibilidade de
renegociação após efetivada a primeira rodada, o jogo que os jogadores visualizam
no momento de começar, segundo o acordo, é o jogo estático apresentado acima
somados os payo¤s que eles terão no segundo estágio em cada possibilidade que
possa vir a ocorrer. Portanto, soma-se os payo¤s (1; 1) em todas as células, com
exceção de (B; E), onde deve se somar (3; 3), que gera a seguinte matriz:

jogador 2
D E F
A 2; 2 6; 1 1; 1
jogador 1 B 1; 6 7; 7 1; 1
C 1; 1 1; 1 4; 4
Há, no jogo visualizado no primeiro estágio, três equilíbrios de Nash. Todos eles con-
stituem ENPS, quando consideramos o jogo completo, em seus dois estágios. Contudo,
um deles confere payo¤s maiores para ambos os jogadores, sendo assim um caminho
óbvio a se jogar. Uma observação interessante é que podemos encontrar um ENPS
que compreenda no primeiro estágio um resultado que não seja um Nash do jogo jo-
gado apenas uma vez, neste caso o resultado (B; E). Essa possibilidade é obtenível
em função da multiplicidade (dois, neste caso) de equilíbrios de Nash no jogo que será
repetido e do arranjo que foi feito antes do jogo começar. Fundamental aqui foi também
a hipótese de que não poderia ocorrer renegociação após o primeiro estágio.

104
O resultado obtido no exemplo acima é uma prova de que promessas/ameaças críveis
a respeito de comportamentos futuros podem ser consideradas e, de fato, in‡uenciar
o comportamento corrente dos agentes. A cooperação pode então ser obtida em es-
tágios anteriores aos últimos, em tais casos. Note, porém, que a existência de tais
ameaças/promessas críveis requer que no jogo não repetido existam pelo menos dois
EN, pois, se elas considerarem a hipótese de se jogar ao …nal estratégias que não con-
stituem EN, não deverão ser consideradas como possibilidades concretas .
Uma outra questão é a possibilidade de renegociação: caso ela exista, então não
poderíamos ter o resultado cooperativo descrito acima. Por que? Ora, caso se possa
renegociar, porque não, antes do segundo estágio se iniciar, os jogadores - mesmo se um
deles tiver ”traído”o pacto inicial - não se reúnem e combinam de jogar o equilíbrio de
Nash que dê maior payo¤ para ambos? Mesmo com algum dos jogadores se sentindo
”traído”pelo seu “companheiro”, ele deveria aceitar a renegociação, pois assim ganharia
mais do que não agindo assim. A…nal, as perdas passadas são irrecuperáveis e ele
deve preocupar-se em maximizar seu payo¤ daquele momento em diante. Portanto,
caso se saiba que a renegociação seja possível, não há porque cooperar no primeiro
estágio, e então o resultado desse também tem de ser um equilíbrio de Nash no jogo
não repetido. No exemplo anterior, isso corresponderia a simplesmente adicionar aos
payo¤s do primeiro estágio os payo¤s do resultado do jogo em sua segunda rodada,
(3; 3). Os ENPS restantes seriam então apenas (A; D) ou (C; F )) no primeiro estágio, e
(C; F ) no segundo. O arranjo proposto anteriormente, portanto, pode ser considerado
um ENPS no jogo repetido duas vezes, mas não é um ENPS a prova de renegociação.
O conceito de ENPS em jogos de informação completa não é, pois, uma panacéia, não
eliminando os resultados sensíveis a renegociações nos jogos repetidos …nitos.
O problema destacado acima emerge porque o “traído”, ao punir o “traidor”, jo-
gando o equilíbrio de Nash que é pior para ambos no segundo estágio, está ao mesmo
tempo punindo a ele mesmo. Por isso, uma renegociação destituiria de sentido prático
tal possibilidade. Todavia, em alguns jogos é possível encontrarmos ameaças/promessas
que induzam à cooperação nos seus estágios iniciais e que sejam também resistente a
renegociações.

Exemplo 63 O exemplo anterior com mais duas estratégias possíveis para cada jo-
gador:
jogador 2
D E F G H
A 1; 1 5; 0 0; 0 0; 0 0; 0
B 0; 5 4; 4 0; 0 0; 0 0; 0
jogador 1 C 0; 0 0; 0 3; 3 0; 0 0; 0
Y 0; 0 0; 0 0; 0 4; 0:5 0; 0
Z 0; 0 0; 0 0; 0 0; 0 0:5; 4

105
Existem no jogo não repetido acima quatro equilíbrios de Nash, como se percebe.
Suponha que os jogadores combinem antes do primeiro estágio o seguinte acordo:

se o resultado desse for (B; E), na segunda vez ambos jogam (C; F );

caso apenas o jogador 1 desvie inicialmente dessa estratégia, na segunda rodada


eles jogam (Z; H), correspondendo a uma punição ao jogador1;

caso o jogador 2 isoladamente desvie, no segundo estágio joga-se (Y; G), punindo-
se esse último;

se ambos desviarem de (B; E), eles jogam (C; F ) na segunda vez.

Dessa forma, eles terão incentivos a cooperar no primeiro estágio do jogo repetido
e, mesmo que ocorresse alguma “traição”, nenhum deles gostaria de deixar de aplicar
a punição ao que desviou, pois, ao aplicá-la, ele está fazendo algo que é melhor para
ele mesmo, e então não aceitará renegociar. Como ambos sabem disso, nenhum irá
querer deixar de cooperar no primeiro estágio, e teremos então entre os ENPS, um
com (B; E) no primeiro estágio e (C; F ) no segundo, que incorpora um resultado que
não é um equilíbrio de Nash no jogo não repetido e, além disso, é também fechado
para renegociações. Para que essas conclusões …quem mais claras, vejamos o jogo que
é visualizado por ambos os jogadores caso as estratégias de…nidas pelo acordo citado
acima se veri…cassem. Para tanto, basta adicionar os payo¤s (0:5; 4) em todas as células
onde o jogador 2 escolhe E e o jogador 1 não escolhe B; (4; 0:5) em todas as células
onde o jogador 1 joga B mas o jogador 1 não joga E; e (3; 3) em todas as outras:

jogador 2
D E F G H
A 4; 4 5:5; 4 3; 3 3; 3 3; 3
B 4; 5:5 7; 7 4; 0:5 4; 0:5 4; 0:5
jogador 1 C 3; 3 0:5; 4 6; 6 3; 3 3; 3
Y 3; 3 0:5; 4 3; 3 7; 3:5 3; 3
Z 3; 3 0:5; 4 3; 3 3; 3 3:5; 7
Portanto, temos nesse jogo repetido duas vezes também três ENPS, com um deles
tornando-se focal segundo as estratégias sugeridas, pelo fato de gerar payo¤s superiores
a todos os jogadores. Como comentado, esse incorpora na sua primeira rodada um
resultado que não é Nah no jogo estático jogado apenas uma vez, correspondendo a
um autêntico resultado de “cooperação”, obtenível apenas porque existem mais de um
Nash no jogo sem repetição. Além disso, é à prova de renegociação, uma vez que é
possível penalizar um eventual “traidor” sem que se puna a si mesmo.
Novamente, vale lembrar que resultados como esse último poderiam ser alcançáveis
também se o jogo se repetisse mais de duas vezes, com a cooperação sendo possível

106
até o penúltimo estágio. Bastaria que a mesma estrutura se mantivesse, com o número
de repetições determinado e por todos conhecido, sendo também os payo¤s no jogo
repetido a simples soma dos ganhos em todos os estágios.

4.2 Jogos repetidos in…nitamente


Mais uma vez o nosso objetivo aqui será avaliar se ameaças/promessas em relação
ao comportamento futuro podem afetar o comportamento presente. No caso …nito
veri…camos que resultados que não são equilíbrios de Nash em cada estágio podem ser
alcançáveis antes do último estágio sob certas condições, particularmente de que exista
mais de um equilíbrio de Nash no jogo não repetido. Para o caso de repetição in…nita
- termo de…nido de modo mais preciso abaixo -, mostraremos a possibilidade de algo
ainda mais forte: será possível encontrar um ENPS que não seja equilíbrio de Nash em
nenhum dos estágios do jogo tomados isoladamente, e mesmo que exista apenas um
equilíbrio de NashEN no jogo jogado apenas uma vez, como no Dilema dos Prisioneiros.
Vamos assumir a hipótese de que, ao iniciar-se um novo estágio do jogo, todos
os jogadores sabem os resultados dos estágios anteriores. Entretanto, suponha que
mantivéssemos aqui a hipótese de que os payo¤s dos jogadores fossem de…nidos como
antes, i.e., como sendo simplesmente o somatório do payo¤ de cada estágio. Dessa
forma, não haveria diferença entre, por exemplo, alcançar um payo¤ de uma unidade
em cada rodada ou de dez unidades (ou de qualquer quantidade positiva) em cada
uma delas. Em qualquer das hipóteses, o payo¤ do jogo in…nitamente repetido seria
um número in…nito, e não se poderia fazer comparações precisas entre eles. De outra
forma:
1
X X1 X1
1= 10 = n = 1 8n > 0.
Segue portanto que a nossa de…nição dos payo¤s do jogo repetido in…nitas vezes
deve ser diferente. O que se faz em geral é utilizar da mesma idéia inserida a respeito de
fatos futuros existente na aplicação de barganha sequencial, vista anteriormente. Isto
é, supõem-se que os indivíduos valorizem mais o presente que o futuro. Essa hipótese
é extremamente razoável. Senão vejamos. Pergunte a você mesmo - ou a qualquer
pessoa “normal” - o que seria preferível: receber agora cem reais ou receber, daqui a
dez anos, os mesmos cem reais? Não há dúvidas de que todas as pessoas (ou pelo menos
quase todas) preferiria receber o dinheiro agora. Poder-se-ia argumentar que isso seria
devido à in‡ação, mas pode-se refazer a mesma pergunta supondo o valor corrigido por
um índice “razoável’qualquer (que corrija a in‡ação e os juros reais do período) que
a resposta não deverá alterar-se. A idéia é que, recebendo os reais agora, você poderá
fazer tudo o que poderia fazer caso os recebesse após algum tempo e mais alguma coisa
- gastá-los entre hoje e o período seguinte quando você também poderia recebê-los.
Portanto, generalizasse que o mesmo payo¤ hoje é preferível (ou, pelo menos, não é

107
pior) a ele mesmo daqui a algum tempo futuro qualquer; e quanto mais distante for o
período de recebimento, menos valor ele terá para você hoje (imagine o valor de mil
reais a se receber, por exemplo, daqui a setenta e cinco anos...).
O que fazemos é utilizar uma taxa de desconto (d) para os payo¤s futuros, que
será tanto maior quanto mais distante o período. O payo¤ de um jogador em um jogo
repetido in…nitamente será então o somatório do que ele irá ganhar em cada estágio,
mas com esses valores descontados para o presente. Isto é o mesmo que dizer que
trabalharemos com o “valor presente”do ‡uxo dos payo¤s que os jogadores irão obter,
ou seja, quanto vale hoje para o jogador um determinado payo¤ que deverá receber
apenas em um período seguinte. Isso é equivalente a se perguntar, por exemplo, qual
seria o valor que faria com que um determinado jogador …casse indiferente entre recebê-
lo hoje e receber cem reais (corrigidos pela taxa de juros nominal) daqui a um ano. Se
ele dissesse que seria 93 reais, seria um indicador de que a sua taxa de desconto anual
seria algo em torno de 7:5%48 .
Ao invés de trabalhar com a taxa de desconto, utilizaremos um indicador similar -
de manuseio mais simples -, que denominaremos fator de desconto e representaremos
pelo símbolo , com 2 (0; 1). Em relação à taxa, ele signi…ca
1
= ,
1+d
de modo que, quanto maior d, menor será . Um fator de desconto quase igual a
um, por exemplo, corresponde a um caso onde payo¤s futuros valem quase o mesmo
que os presentes. Por outro lado, se for muito próximo de zero, representará uma
situação onde o relevante será fundamentalmente o presente, com pouco valor para
acontecimentos futuros. Em suma, quanto maior for o valor do fator de desconto, mais
se valorizará o futuro, e vice-versa.
Entretanto, o fator de desconto pode signi…car, além da redução do valor que o
indivíduo confere hoje a um valor futuro, também a probabilidade do jogo terminar
no próximo período. Nesta interpretação, um jogo repetido in…nitamente é entendido
como um jogo que a cada período tem uma probabilidade (menor que um) de terminar.
Ainda que o indivíduo valorizasse igualmente presente e futuro, ele preferiria um payo¤
no estágio atual do jogo a esse mesmo valor no próximo período, pois existe determinada
probabilidade de tal estágio não ocorrer. Pense, por exemplo, na briga de mercado para
refrigerantes sabor cola entre Coca-Cola e Pepsi. É provável que tal jogo se repita um
número muito grande de vezes. Mas existe, em cada período - seja qual for a sua
de…nição de período -, uma chance de o jogo acabar - com uma das …rmas fechando,
48
Não seria exatamente 7%, como se poderia imaginar, porque a de…nição de uma taxa de desconto
VF
é um valor d que faz com que V P = 1+d , onde V P é o valor presente e V F é o valor futuro. No
exemplo dado, V F é 100 e V P é 93. O valor de d, portanto, é dado por d = V FV PV P , que nesse caso é
aproximadamente 0:075.

108
por exemplo -, ainda que pequena49 . Portanto, o fator de desconto re‡ete os dois fatos:
a menor valorização de payo¤s futuros em relação a presentes e a probabilidade do jogo
terminar sem alcançar o próximo estágio.
Quanto às diferenças entre os jogos repetidos …nita e in…nitamente, a principal
delas é que nesses últimos não existe um último estágio - pelo menos ele não existe
com certeza. Esse era o fato que levava à não cooperação nos jogos …nitos com apenas
um Nash em cada estágio. Como nos jogos repetidos in…nitamente isso não existe, a
cooperação é possível - como veremos abaixo - mesmo se houver apenas um Nash no
jogo não repetido.
O que iremos utilizar nesta seção são as chamadas “estratégias de gatilho (trigger)”.
Elas possuem esse nome por se referirem a estratégias que de…nem para o jogador que a
utiliza uma posição de cooperação50 com os demais, que é mantida enquanto os outros
também cooperam. Caso algum deles cesse o “acordo”, o jogador “dispara o gatilho”,
i.e., pára de cooperar daí em diante, enquanto durar o jogo. Deve-se ter em vista que
essa é uma possibilidade, embora seja uma das mais estudadas em teoria dos jogos
repetidos in…nitamente - provavelmente pela sua facilidade analítica.
Nos jogos repetidos, dinâmicos por de…nição, o conceito-chave para se fazer pre-
visões a respeito de possíveis resultados de jogos é também o de ENPS. Como visto,
para um conjunto de estratégias constituir em um ENPS, ela deve induzir um equilíbrio
de Nash em todos os subjogos do jogo em questão. Mas, no caso de repetição in…nita,
o que seria um subjogo? Dada a de…nição mostrada anteriormente, é fácil perceber
que nesses casos haverá um número in…nito de subjogos. Sendo o jogo repetido in…ni-
tamente simultâneo - como no dilema dos prisioneiros -, existirão subjogos se iniciando
em cada vez que um novo estágio se iniciar. Raciocínio análogo aplica-se se o jogo sem
repetição for dinâmico. Note que um estágio do jogo visto isoladamente não constitui
um subjogo! Eles apenas se iniciam nesse ponto (recorde a de…nição de subjogo, se
necessário). Veja, por outro lado, que quando se inicia um estágio do jogo, cada sub-
jogo é exatamente idêntico ao que havia começado anteriormente, uma vez que o jogo
é in…nito! Por exemplo, um subjogo que se inicia no primeiro estágio é exatamente o
mesmo que se inicia no quarto, oitavo ou n ésimo (para um n …nito) estágio.
Sabendo disso, o que se poderá concluir a respeito de um resultado que seja um
equilíbrio de Nash no jogo como um todo? Que ele deve ser também um equilíbrio de
Nash em todos os outros subjogos, e, portanto, um ENPS! Assim, basta encontrar os
49
Se não fosse assim, estaríamos supondo que Coca e Pepsi interagir-se-iam no mercado de refriger-
antes sabor cola durante muito mais que, por exemplo, um trilhão de séculos, o que não seria razoável
- nem para esse e nem para nenhuma outra situação de interdependência estratégica.
50
Por “cooperação”, tanto aqui como nos jogos …nitos, entende-se uma escolha que, tendo em vista
apenas o estágio do jogo isoladamente, não seria uma opção ótima para o jogador. Entretanto, pode
constituir-se em uma desde que ela induza os outros jogadores a também cooperarem em estágios
futuros.

109
equilíbrios de Nash do jogo inteiro (que de…ne um subjogo que será igual a todos os
demais) para termos também os ENPS.

Exemplo 64 Dilema dos prisioneiros repetido in…nitamente. Tome o jogo abaixo jo-
gado in…nitas vezes, de…nindo-se o payo¤ dos jogadores como o valor presente dos
payo¤ s obtidos em cada estágio do jogo, e sendo o fator de desconto entre dois períodos
consecutivos chamado de 2 (0; 1).

jogador 2
NC C
jogador 1 NC 1; 1 9; 0
C 0; 9 6; 6
Vamos propor uma ”estratégia de gatilho” para ambos os jogadores:

cooperar (não confessar) no primeiro estágio; em qualquer estágio subsequente,


coopera se o resultado do período anterior tiver sido (N C; N C), i.e., se tiver
ocorrido cooperação; caso contrário, o jogador não coopera mais e confessa daí
em diante”.

Se ambos os prisioneiros/jogadores jogam com essa estratégia, sempre haverá coop-


eração, pois ambos começarão cooperando; no estágio seguinte, virão que terá ocorrido
(N C; N C) no anterior e permanecerão cooperando, ocorrendo o mesmo no terceiro,
quarto etc. estágios. Mas isso, em si mesmo, não diz nada: o que se requer é que
ambos tenham incentivos em de fato utilizar aquela estratégia. Tem-se então que se
testar se ela, de fato, constitui um ENPS, o que ocorrerá se nenhum jogador quiser
desviar em nenhum subjogo.
Vejamos inicialmente se a estratégia de gatilho pode ser um equilíbrio de Nash no
jogo como um todo. Caso um dos jogadores a estiver jogando, será o melhor para o
outro também jogá-la? Suponha que ele desvie na primeira rodada: obterá então payo¤
igual a zero, ao invés de 1. Entretanto, ele sabe que, fazendo isso, o outro jogador
nunca mais irá cooperar. O resultado após o primeiro estágio será então sempre ambos
confessarem. O payo¤ do jogador que desviou será, pois, o valor presente dos seus
payo¤s obtidos em cada rodada do jogo, i.e.:

2 3
0 + ( 6) + ( 6) + ( 6) + ::: = ( 6)
1
Mas, para saber se o desvio proposto acima é uma boa alternativa, temos que
comparar o payo¤ que ele confere ante o payo¤ que seria obtido caso o jogador resolvesse
não desviar, e portanto também jogasse a estratégia de gatilho acima descrita. Como o
outro, por hipótese, também a está seguindo, o payo¤ que ele receberá em cada estágio

110
será aquele emergente de quando ambos cooperam. No caso do dilema dos prisioneiros
apresentado acima, seria obter sempre 1. O valor presente do ‡uxo total dos payo¤s
seria então
1 + ( 1) + ( 1) 2 + ( 1) 3 + ::: = ( 1)
1
Portanto desviar no primeiro estágio vale a pena apenas se
1
( 6) ( 1) $ .
1 1 6
Ou seja, para valores relativamente pequenos de - o que signi…ca que o jogador
valoriza pouco o futuro -, vale a pena para ele desviar, pois o fato de ganhar menos
no futuro é menos signi…cativo para ele que a vantagem de obter um payo¤ superior
no primeiro período. De outra forma, caso o fator de desconto não seja tão pequeno
(não seja menor que 1=6), então será preferível ao jogador também utilizar a estratégia
de gatilho inicialmente proposta, dado que o outro também a está utilizando. Como o
jogo, neste exemplo, é simétrico, a mesma condição obtida para um jogador vale para o
outro: se > 1=6 , nenhum dos jogadores terá incentivo a desviar no primeiro estágio
da estratégia de gatilho proposta.
Vimos acima, portanto, qual a condição necessária para que a estratégia de gatilho
seja um equilíbrio de Nash no dilema dos prisioneiros repetido in…nitamente. Entre-
tanto, requer-se que ela seja também ENPS, i.e., que seja um equilíbrio de Nash em
cada subjogo. Como sabe-se que os subjogos nesse caso são idênticos, temos então que
o requerimento para que se obtenha um equilíbrio de Nash no jogo inteiro é exatamente
o mesmo para que ela seja ENPS. Nesse caso, a estratégia de gatilho proposta para os
dois prisioneiros/jogadores serão ENPS também caso o fator de desconto seja maior do
que ou igual a 1=6.
Após concluirmos para um exemplo especí…co, somos levados a mostrar um resul-
tado mais geral, conhecido como Teorema de Friedman, ou, mais usualmente, como
Folk theorem (“teorema popular”)51 . Vamos de…ní-lo de uma maneira informal:

Teorema 65 - “Folk Theorem”: Seja um jogo J, estático, …nito e de informação


completa. Caso exista um conjunto de estratégias (mesmo que elas não sejam um
equilíbrio de Nash de J) dos jogadores que con…ram payo¤ s f(p1 ; :::; pn )g a todos eles,
superiores aos que obteriam jogando um equilíbrio de Nash de J, se o fator de desconto
for su…cientemente próximo de um (i.e., se se descontar su…cientemente pouco os
valores futuros), então existe um ENPS no jogo J repetido in…nitas vezes onde se
alcança, em cada estágio, os payo¤ s f(p1 ; :::; pn )g para os n jogadores.
51
O teorema tem esse nome porque, antes de publicado, já era conhecido pela maior parte dos
teóricos de jogos. Na verdade, como aponta Gibbons (1992), o teorema aqui referido não é exatamente
o “folk”inicial, mais conhecido. De fato, é parecido, mas com algumas mudanças que o incrementaram,
elaboradas por James Friedman em 1971.

111
Podemos então concluir esta seção a…rmando que, sob determinadas condições (um
“grande”, basicamente), resultados inalcançáveis em jogos não repetidos ou repetidos
tendo-se em vista um horizonte …nito são atingíveis se o jogo se repete inde…nidamente
(com uma probabilidade entre zero e um), acarretando payo¤s (considerando-se o jogo
inteiro) superiores ao que poderiam ser obtidos de outra forma.
Algumas observações …nais devem ser feitas. A primeira refere-se ao fato de que
trabalhamos apenas com as chamadas ”estratégias de gatilho”. Na realidade, muitas
outras podem ser construídas, como já comentado, levando a uma maior ou menor
e…ciência no cumprimento de acordos e a penalizações maiores ou menores caso esses
não sejam cumpridos. Contudo, vamos deixá-las de lado por acreditar que a idéia
básica já …ca su…cientemente clara apenas pela análise das “estratégias de gatilho”.
Assim como várias estratégias podem ser elaboradas, há um outro problema com
jogos repetidos que diz respeito à multiplicidade de “equilíbrios” que podem ser en-
contrados. Inclusive para se gerar um mesmo resultado, várias estratégias podem ser
utilizadas pelos jogadores. Esse fato enfraquece o poder de previsão da teoria em jogos
com essas características, especialmente se não for possível algum tipo de coordenação
prévia e caso não exista qualquer indício da existência de pontos focais.
Um último ponto diz respeito ao fator de desconto. Durante toda a seção, foi suposta
a existência, conhecida pelos jogadores, de um fator para cada jogo. Na verdade, essa
é uma simpli…cação, pois é razoável que se tenha não apenas um em cada jogo, mas,
em cada um deles, também um para cada jogador. Ou seja, o futuro pode ter valor
diferente para jogadores distintos, assim como eles podem vislumbrar a possibilidade de
continuação de um jogo com probabilidades também distintas. Em termos de resolução,
nada se altera signi…cativamente com essa modi…cação. A diferença é que os valores
críticos dos fatores de desconto (para gerar cooperação sob determinada estratégia, por
exemplo) terão de ser calculados para cada jogador.

4.3 Aplicações
4.3.1 Duopólio de Cournot repetido in…nitamente

Vejamos o que se altera no modelo (duopólio) de Cournot visto anteriormente caso o


jogo se repita in…nitamente, com um fator de desconto entre dois períodos consecutivos
igual a , como de praxe. As especi…cações do modelo são as mesmas do jogo sem
repetição.Antes obtivemos a existência de apenas um equilíbrio de Nash, onde ambas
as …rmas produziam
1
qi = (a c) ; i = 1; 2
3
e lucravam cada uma
1
i = (a c)2 ; i = 1; 2.
9

112
Quando supomos que elas tinham a possibilidade de formar um cartel, produzindo
cada uma a metade do que um monopolista produziria, incrementariam assim o lucro
agregado do mercado e, também, o de cada uma delas isoladamente. A produção e o
lucro nesse caso seriam (resolvendo o problema do monopolista):
(
qi = q2m = 14 (a c) ; i = 1; 2
1
i = 2 = 8 (a
m
c)2 ; i = 1; 2

Entretanto, veri…camos também que tal conluio não era estável, pois ambas iriam
ter incentivos em desviar da estratégia proposta. O jogo que resultava dessa análise é o
que está descrito abaixo, um Dilema dos Prisoneiros onde o (único) equilíbrio de Nash
era as …rmas não constituirem o cartel e competirem em Cournot:

…rma 2
cartel compete
…rma 1 cartel 1
8 (a c)2 ; 18 (a c)2 3
32 (a c)2 ; 64
9
(a c)2
compete 9
64 (a c)2 ; 323
(a c)2 1
9 (a c) ; 9 (a c)2
2 1

Como antes, é fácil ver que o payo¤s associado ao cartel é estritamente maior do que o
ganho de equilíbrio para ambas as …rmas, de modo que o equilíbrio não é e…ciente. No
entanto o acordo não é crível na medida em que nenhuma das …rmas tem incentivos
a jogar nenhuma estratégia que não aquela(s) que compõem o equilíbrio de Nash do
jogo: o equilíbrio de Nash é um resultado (estrategicamente) estável.
Mas vejamos o que poderia se alterar caso o jogo fosse repetido com horizonte
in…nito. Primeiramente, veri…quemos a condição, no jogo repetido in…nitamente, para
que constitua um equilíbrio de Nash a seguinte estratégia de gatilho:

produzir q2m no primeiro período; manter q2m em cada período se a outra …rma
também tiver produzido essa quantidade no período anterior; senão, produzir a
quantidade do equilíbrio de Nash de Cournot não repetido para sempre.

Para testar se essa estratégia constitui um equilíbrio de Nash, basta veri…car se o


payo¤ obtido a seguindo será maior ou igual ao que se obteria desviando no primeiro
período, supondo que o outro jogador esteja jogando a estratégia proposta. Assim, os
jogadores não irão desviar - e a estratégia proposta jogada por ambos será um equilíbrio
de Nash - se: (
(a c)2 9(a c)2 2

8 1
1
64 + (a 9c) 1 $
9
17
Pela lógica vista anteriormente, sabemos que se não é menor que 9=17, então
ambos os jogadores jogarem a estratégia de gatilho acima será um Nash e um ENPS
no jogo repetido in…nitamente. Nesse caso, o cartel, para esse dado problema, torna-se
estável.

113
Todavia, essa não é uma regra para todos os conluios de mercado possíveis. Intuiti-
vamente, caso existissem mais jogadores no oligopólio e se houvesse di…culdades de se
veri…car quem “furou” o acordo, por exemplo, a coordenação seria muito di…cultada e
a estabilidade poderia não ser alcançada. Questões como essas podem ser respondidas,
portanto, apenas a partir de uma perspectiva especí…ca para cada caso.

4.3.2 Política Monetária Temporalmente Consistente

Considere um jogo sequencial no qual patrões e empregados negociam salários nom-


inais e posteriormente a autoridade monetária escolhe a oferta de moeda, o que, por sua
vez, determinará a taxa de in‡ação do período. Se os contratos salariais não puderem
ser perfeitamente indexados, os trabalhadores e os empregadores tentarão antecipar a
in‡ação para determinar o salário que vigorará. Entretanto, uma vez que o salário nom-
inal, indexado imperfeitamente, foi determinado, a realização de uma in‡ação acima da
in‡ação antecipada vai corroer o salário real, fazendo com que as …rmas expandam os
empregos e o produto. Posto isso, a autoridade monetária enfrenta um trade-o¤ entre
os custos da in‡ação e os benefícios de redução do desemprego e aumento do produto
que decorrem da in‡ação não antecipada.
Como em Barro e Gordon (1983), nós analizamos uma forma reduzida desse modelo
no seguinte stage-game (o jogo não repetido). Primeiro, os empregadores formam uma
expectativa de in‡ação, e . Segundo, a autoridade monetária observa essa expectativa
e escolhe um nível de in‡ação que de fato se realizará, . O payo¤ das …rmas é dado
por
e 2
( )
Ou seja, as …rmas desejam antecipar corretamente a taxa de in‡ação na medida em
que o payo¤ máximo que elas podem atingir é zero, o que ocorre quando = e.
A autoridade monetária, por sua vez, gostaria de in‡ação zero e que o produto (y)
estivesse no seu nível e…ciente (y ). Nesse sentido o payo¤ da autoridade monetária é
dado por
U ( ; y) = c 2 (y y )2
onde o parâmetro c > 0 re‡ete o trade-o¤ da autoridade monetária entre os dois
objetivos. Suponha que o produto seja função do produto-alvo (o nível e…ciente) e da
in‡ação não-antecipada de acordo com a expressão abaixo,
e
y = by + d ( )

onde b 2 (0; 1) re‡ete a presença de poder de monopólio no mercado de produtos,


de modo que se não houver in‡ação não-antecipada então o produto será menor do
que o produto e…ciente, e d > 0 mede o efeito da in‡ação não-antecipada sobre o

114
produto através da compressão dos salários reais, como descrito acima. Podemos então
reescrever o payo¤ da autoridade monetária como
e 2 e 2
W( ; )= c [(b 1) y + d ( )]

Para resolver o resultado perfeito em subjogos desse jogo não-repetido, nós primeiro
computamos a escolha ótima da autoridade monetária de , dada a expectativa dos
empregadores, e . Ou seja, a autoridade monetária vai
e
maxW ( ; )

de modo que as CPO´s implicam que

@W ( ; e)
e
= 2c 2d [(b 1) y + d ( )] = 0
@
tal que, resolvendo para a variável de escolha,

e d e
( )= [(1 b) y + d ]
c + d2
Como (por indução retroativa) as …rmas antecipam perfeitamente a escolha da autori-
dade monetária, o problema das empresas torna-se escolher uma previsão de in‡ação
que maximiza seu payo¤ dado que a função de reação da autoridade monetária, ( e ),
é de conhecimento comum. Isto é,
e 2 e
max
e
( ) = ( )
2
d e e
= [(1 b) y + d ]
c + d2
2
d d2 e
= (1 b) y + 1
c + d2 c + d2
2
d c e
= (1 b) y
c + d2 c + d2

As CPO´s implicam que

d c e c
2 (1 b) y =0
c + d2 c + d2 c + d2
tal que
e d (1 b)
= y
c

115
Substituindo em ( e) temos

e d d2 (1 b)
( ) = (1 b) y + y
c + d2 c
d (1 b) d2
= 1 + y
c + d2 c
d (1 b)
= y
c
onde, observe, = e.
Outra forma de analizar a questão (mais simples, inteligente e que, obviamente,
deve gerar o mesmo resultado) é lembrar que decorre do problema das …rmas que no
ótimo
e
=
tal que temos
e e d e
( )= = [(1 b) y + d ]
c + d2
ou seja,

e d2 d
1 = (1 b) y
c + d2 c + d2
e c d
= (1 b) y
c + d2 c + d2
tal que
e b) d (1
=y = s>0
c
onde o subscrito s denota o stage-game. De uma maneira equivalente, poderíamos dizer
que a expectativa racional para as …rmas formarem é aquela que subsequentemente
seja con…rmada pela autoridade monetária, tal que ( e ) = e e portanto e = s .
Quando as empresas formam a expectativa de in‡ação e = s , o custo marginal para
a autoridade monetária em determinar a in‡ação um pouco acima de s equivale
exatamente ao benefício marginal da in‡ação não-esperada. Nesse resultado perfeito
em subjogos, espera-se que a autoridade monetária gere in‡ação positiva e de fato ele
assim fará, mas seria ainda melhor se ela pudesse se comprometer a não gerar in‡ação.
Logo, se as …rmas têm expectativas racionais ( = e ), então in‡ação zero maximiza o
payo¤ da autoridade monetária, pois
e 2 2
W( ; )= c (b 1) y

tal que = 0 é ótimo.


Considere agora esse jogo repetido in…nitamente e que ambos os jogadores tenham
a mesma taxa de desconto intertemporal . Vamos derivar as condições sob as quais

116
= e = 0 em todo período seja um equilíbrio perfeito de acordo com as seguintes
estratégias: no primeiro período, as empresas …xam uma expectativa in‡acionária e =
0, nos períodos subsequentes …xam e = 0 se todas expectativas anteriores foram e = 0
e se todas as in‡ações realizadas até então tenham sido = 0; caso contrário …xam
e =
s - a expectativa racional do jogo não repetido. Similarmente, a autoridade
monetária escolhe = 0 se a expectativa corrente for e = 0, todas as expectativas
passadas tiverem sido e = 0 e toda in‡ação realizada até então tiver sido = 0; caso
contrário escolhe = ( e ), a melhor resposta que ela pode dar às expectativas das
…rmas.
Suponha que as …rmas formem a expectativa e = 0 no primeiro período. Dada a es-
tratégia das …rmas (isto é, a forma que elas determinam suas expectativas in‡acionárias
após realizar a in‡ação de fato), a autoridade monetária pode restringir sua atenção
para duas possibilidades de escolha: (1) = 0, o que leva a e = 0 no próximo período
e daí à mesma decisão da autoridade monetária no próximo período e (2) = (0),
e d e e
de ( ) = c+d2 [(1 b) y + d ], o que leva a = s daí em diante, caso no qual
seria ótimo para a autoridade monetária …xar = s daí em diante. Fixando = 0
nesse período resultará em um payo¤ de W (0; 0) em cada período e …xando = (0)
nesse período resultará em um payo¤ de W ( (0) ; 0) no período corrente mas em um
payo¤ de W ( s ; s ) daí em diante. Logo a estratégia da autoridade monetária será a
melhor resposta à regra adotada pelas …rmas se
1
W (0; 0) W( (0) ; 0) + W( s; s)
1 1
Simpli…cando a expressão acima teremos que in‡ação zero será crível, será um
equilíbrio perfeito no jogo repetido in…nito, se
c
2c + d2
onde cada um dos parâmetros, c e d, tem dois efeitos. Um aumento em d torna a
in‡ação não antecipada pelo mercado mais efetiva ao afetar o produto e o desemprego,
de modo que torna-se mais tentador para a autoridade monetária gerar in‡ação acima
daquela esperada, mas pelo mesmo motivo um aumento em d também aumenta s , a
in‡ação do jogo não repetido, o que torna a punição mais custosa para a autoridade
monetária. Da mesma forma, um aumento em c torna a in‡ação mais custosa, o que faz
com que gerar in‡ação não antecipada seja menos atraente, mas também reduz s . Em
ambos os casos, o último efeito domina o primeiro, tal que o valor crítico do fator de
c
desconto necessário para sustentar esse equilíbrio é 2c+d 2 , crescente em c e decrescente

em d, 8 c
> @ 2 2c
< 2c+d2 d2
@c = 2c+d
(2c+d2 )2
= (2c+d 2 )2
>0
>
: @ c
2c+d2 2dc
@d = (2c+d2 )2
<0

117
Nós mostramos até aqui que a estratégia da autoridade monetária é a melhor re-
d
sposta à estratégia das …rmas se ( e ) = c+d 2 [(1 b) y + d e ] vale. Para mostrar
que essa estratégia é um equilíbrio de Nash, resta mostrar que ela é a melhor resposta
às …rmas, o que decorre da observação de que as …rmas obtêm seus maiores payo¤s pos-
síveis (zero) em cada período. Mostrar que tais estratégias são perfeitas em subjogos
segue os mesmos argumentos utilizados na seção anterior.

5 Jogos bayesianos estáticos e equilíbrio bayesiano de Nash


Vamos começar aqui a estudar jogos de informação incompleta, também ditos jogos
bayesianos. Lembre-se que em jogos, estáticos e dinâmicos, de informação completa, por
de…nição, a função de ganho dos jogadores era de conhecimento comum. Em contraste,
nos jogos de informação incompleta, a função payo¤ de pelo menos um dos jogadores
não será de conhecimento comum, o que denota um elemento de incerteza na medida em
que pelo menos um jogador estará incerto sobre a função payo¤ dos outros jogadores.
Manteremos o formato que estamos seguindo desde o começo e apresentaremos primeiro
jogos bayesianos estáticos e posteriormente trataremos de jogos dinâmicos.
Um exemplo padrão de jogos estáticos de informação incompleta são leilões fecha-
dos. Cada participante (“bidder”) sabe a sua própria avaliação do bem leiloado mas não
conhece as avaliações dos demais participantes. O lances (“bids”) são submetidos em
envelopes fechados, de modo que os movimentos dos jogadores podem ser considerados
simultâneos. No entanto, a maioria dos jogos bayesianos interessantes economicamente
são dinâmicos. Como nós veremos na próxima seção, a existência de informação pri-
vada leva naturalmente à tentativas da parte informada de se comunicar (ou enganar)
e à tentativas da parte não informada de aprender e responder. Essas questões são
inerentemente dinâmicas.
Na próxima seção vamos de…nir a forma de representar de um jogo bayesiano es-
tático e a noção de equilíbrio correspondente, qual seja equilíbrio bayesiano de Nash.
Como tais noções são mais complexas e abstratas do que as vistas até aqui, faremos
isso através de um exemplo, um oligopólio de Cournot sob informação incompleta.

5.1 Cournot sob informação incompleta


Considere um duopólio de Cournot padrão em que as …rmas escolhem simultanea-
mente o quanto produzir. A curva de demanda inversa é

P (Q) = a Q e Q = q1 + q2

A função custo da …rma 1 é dada por

C1 (q1 ) = cq1

118
e isso é de conhecimento comum. Já a função custo da …rma 2 não. Ela é dada por
(
cH q2 com probabilidade
C2 (q2 ) = , onde 0 < cL < cH
cL q2 com probabilidade 1

A …rma 1 não sabe ao certo qual é a função custo da …rma 2 (essa …rma pode ser
uma …rma nova no mercado ou pode ter inventado uma nova tecnologia): o que é
de conhecimento comum aqui é a distribuição de probabilidades sobre a e…ciência da
…rma 2 e a própria estrutura de informação, no sentido de que a …rma 1 sabe que 2 tem
informação superior, a …rma 2 sabe que a …rma 1 sabe isso e assim sucessivamente.
Como resolver esse jogo? Considere primeiro o caso da …rma 2, a …rma que tem
mais informação. Caso ela seja ine…ciente, o seu problema será

max 2 (cH ) = P (Q) q2 cH q2


q2
= (a q1 q2 cH ) q2

E analogamente, caso ela seja mais e…ciente, vai

max 2 (cL ) = P (Q) q2 cL q2


q2
= (a q1 q2 cL ) q2

Decorre das CPO´s dos problemas acima que


a cH q1 a cL q1
q2 (cH ) = e que q2 (cL ) =
2 2
que são as melhores respostas que a …rma 2 pode dar às escolhas de 1 caso ela seja de
custo alto ou de custo baixo.
Já o problema da …rma 1, a …rma não informada, é maximizar o seu ganho esperado
em função da chance de 2 ser ou não e…ciente. Ou seja, a …rma 1

max 1 = [P (q1 + q2 (cH )) q1 cq1 ] + (1 ) [P (q1 + q2 (cL )) q1 cq1 ]


q1
= [(a q1 q2 (cH )) q1 cq1 ] + (1 ) [(a q1 q2 (cL )) q1 cq1 ]
= [(a c q1 q2 (cH )) q1 ] + (1 ) [(a c q1 q2 (cL )) q1 ]

tal que as CPO´s implicam que


@ 1
= [(a c 2q1 q2 (cH ))] + (1 ) [(a c 2q1 q2 (cL ))] = 0
@q1
tal que
[(a c q2 (cH ))] + (1 ) [(a c q2 (cL ))]
q1 (q2 (cH ) ; q2 (cL )) =
2
a c [ q2 (cH ) + (1 ) q2 (cL )]
=
2

119
será a melhor resposta (esperada) que a …rma 1 pode dar às escolhas de 2. Da interseção
dessas 3 equações de melhores respostas segue que
a cH q 1 a cL q 1
a c 2 + (1 ) 2
q1 =
2
ou seja,
4q1 = 2a 2c a + cH + q1 + (1 ) cL + (1 ) q1
ou ainda,
a
2c + cH + (1 ) cL
q1 =
3
Como curiosidade, veja o que ocorre quando cH = cL = c e compare com o equilíbrio
de Nash em Cournot com informação completa.
Substituindo essa expressão acima em q2 (cH ) e em q2 (cL ), teremos as demais ex-
pressões de equilíbrio,
a cH 1
q2 (cH ) = [a 2c + cH + (1 ) cL ]
2 6
tal que

6q2 (cH ) = 3a 3cH a + 2c cH (1 ) cL + [(1 ) cH (1 ) cH ]

ou seja,
2cH + c (1
a )
q2 (cH ) = + (cH cL )
3 6
Analogamente (faça as contas como exercício), a …rma 2 de custo baixo produzirá
a 2cL + c
q2 (cL ) = (cH cL )
3 6
Logo em equilíbrio as …rmas produzirão
8
>
< q1 = a 2c+ cH3+(1 )cL
q2 (cH ) = a 2c3H +c + (1 6 ) (cH cL )
>
:
q2 (cL ) = a 2c3L +c 6 (cH cL )
A oferta esperada da indústria será

Q = q1 + q2 = q1 + q2 (cH ) + (1 ) q2 (cL )

Ou seja,
a 2c + cH + (1 ) cL
Q = +
3
a 2cH + c (1 )
+ + (cH cL ) +
3 6
a 2cL + c
+ (1 ) (cH cL )
3 6

120
Logo

3Q = a 2c + cH + (1 ) cL + (a 2cH + c) + (1 ) (a 2cL + c)

ou ainda,
3Q = 2a c cH (1 ) cL
tal que
2a c cH (1 ) cL
Q=
3
O preço esperado por sua vez será
2a c cH (1 ) cL
P (Q) = a Q=a
3
a + c + cH + (1 ) cL
=
3
Já com relação aos lucros das …rmas em equilíbrio, observe que o lucro da …rma 1
será

1 = [P (Q) q1 cq1 ] + (1 ) [P (Q) q1 cq1 ]


= (P (Q) c) q1 + (1 ) (P (Q) c) q1
= (P (Q) c) q1
a + c + cH + (1 ) cL a 2c + cH + (1 ) cL
= c
3 3
(a 2c + cH + (1 ) cL )2
=
9
Para mostrarmos que o raciocínio acima está correto, tome a função lucro da …rma um
um pouco mais “aberta”,

1 = [P (q1 + q2 (cH )) q1 cq1 ] + (1 ) [P (q1 + q2 (cL )) q1 cq1 ]


= [(a q1 q2 (cH )) q1 cq1 ] + (1 ) [(a q1 q2 (cL )) q1 cq1 ]
= (a c q1 ) q1 q2 (cH ) q1 (1 ) q2 (cL ) q1
= [a c q1 q2 (cH ) (1 ) q2 (cL )] q1

Ou seja,
2 a 2c+ cH +(1 )cL 3
a c 3
6 a 2cH +c (1 ) 7 a 2c + cH + (1 ) cL
1 = 4 3 + 6 (cH cL ) 5
3
a 2cL +c
(1 ) 3 6 (cH cL )
" #
a c a 2c+ cH3+(1 )cL a 2c + cH + (1 ) cL
= a 2cH +c
3 (1 ) a 2c3L +c 3

121
tal que
" #
3a 3c a + 2c cH (1 ) cL a 2c + cH + (1 ) cL
3 1 =
(a 2cH + c) (1 ) (a 2cL + c) 3
" #
2a c + cH + (1 ) cL a 2c + cH + (1 ) cL
3 1 =
a c a c+ a+ c 3
a 2c + cH + (1 ) cL
3 1 = [a 2c + cH + (1 ) cL ]
3
e portanto
(a
2c + cH + (1 ) cL )2
1 =
9
exatamente a mesma expressão inicial. Como é comum em Cournot, repare que 1 = q12 .
O lucro da …rma 2 ine…ciente, de custo alto, será por sua vez

2 (cH ) = (P (Q) cH ) q2
a + c + cH + (1 ) cL a 2cH + c (1 )
= cH + (cH cL )
3 3 6
a 3cH + c + cH + (1 ) cL a 2cH + c (1 )
= + (cH cL )
3 3 6
a 2cH + c cH cH + (1 ) cL a 2cH + c (1 )
= + + (cH cL )
3 3 3 6
a 2cH + c (1 ) 1 1 a 2cH + c (1 )
= + (cL cH ) = + (cH cL )
3 3 2 2 3 6
a 2cH + c (1 ) a 2cH + c (1 )
= + (cH cL ) ( 2) + (cH cL )
3 6 3 6
e portanto agora teremos 2 (cH ) 6= (q2 (cH ))2 , o que é bastante comum em Cournot.
Para podermos ter uma interpretação mais direta do lucro da …rma 2 de custo alto,
considere a expressão abaixo
a + c + cH + (1 ) cL a + c ( cH + (1 ) cL )
2 (cH ) = cH cH
3 3
a + c 3cH + cH + (1 ) cL a + c 3cH ( cH + (1 ) cL )
=
3 3
9 2 (cH ) = (a + c 3cH + cH + (1 ) cL ) (a + c 3cH ( cH + (1 ) cL ))
= (a + c 3cH )2 (a + c 3cH ) ( cH + (1 ) cL ) +
+ (a + c 3cH ) ( cH + (1 ) cL ) ( cH + (1 ) cL )2
= (a + c 3cH )2 ( cH + (1 ) cL )2
tal que
(a + c 3cH )2 ( cH + (1 ) cL )2
2 (cH ) =
9

122
Logo
2 (cH ) 0 () a + c 3cH > cH + (1 ) cL
ou seja, se
(1 a+c
) cL
cH
3+
Analogamente para a …rma 2 de custo baixo, teremos

(a + c 3cL )2 ( cH + (1 ) cL )2
2 (cH ) =
9
de modo que o lucro dessa …rma não será negativo se e somente se

2 (cL ) > 0 () a + c 3cL > cH + (1 ) cL

isto é, se
a+c cH
cL
3 + (1 )

6 Informação assimétrica e teoria dos contratos


6.1 Introdução
O objeto de análise em ambientes de informação assimétrica é de…nido a partir das
propriedades dos contratos nesse tipo de ambiente vis-à-vis situações de simetria. Nesse
sentido, vamos considerar casos onde a assimetria surge quando (i) o contrato já foi
…rmado e o tipo do agente é determinado endogenamente (moral hazard), (ii) antes de
o contrato ser feito e com o tipo determinado exogenamente (seleção adversa) e (iii) a
parte informada revela alguma informação privada sobre o seu tipo via comportamento
individual antes de o contrato ser estabelecido (sinalização). Em todos esses ambientes
invariavelmente vamos considerar que todo o poder de barganha pertence ao principal.
Um “agreement” será ofertado apenas àqueles que satis…zerem determinadas car-
acterísticas e o pagamento ofertado varia de acordo com essas características. Em um
ambiente sem informação assimétrica caracterizamos então os contratos ótimos e as var-
iáveis que in‡uenciam essas caracteísticas em função do comportamento dos agentes
envolvidos.No setup que nós vamos analisar a característica central está relacionada à
noção de incentivos que surgem quando da presença de informação assimétrica.
Tome então um relacionamento onde um principal P deseja contratar um agente
A e para isso estabelece um contrato de modo a monitorar o agente. O P oferta o
contrato ao A que o aceita ou não. O A aceita se e somente se a utilidade esperada de
aceitá-lo for maior do que a utilidade de não aceitá-lo; uma utilidade de reserva que

123
re‡ete o custo de oportunidade de aceitar o contrato. Como o A não pode fazer uma
contraproposta ao P , segue que todo poder de barganha pertence ao P .
Se o A aceita o contrato, ele deve decidir uma ação a tomar. No nosso “benchmark”
essa ação se refere a quanto se dedicar ao trabalho, o quanto se esforçar, o que vai afetar
o resultado do relacionamento e que tem um custo para o A. Notemos que os interesses
das partes são claramente con‡itantes: o custo de um (o quanto o P paga ao A) é a
remuneração de outro e o esforço do A, que lhe gera desutilidade, favorece ao P .

De…nição 66 Um contrato é um compromisso entre as partes onde as obrigações de


cada um estão especi…cadas para toda contingência possível. Um contrato só pode ser
estabelecido a partir de variáveis veri…cáveis, que são passivas de serem checadas por
um árbitro exógeno.

Na presença de variáveis não veri…cáveis é difícil recorrer a uma instância legal,


de modo que nesse caso as partes têm incentivos para quebrar os termos do contrato.
Dado isso, as partes não assinariam o contrato, pois esse não seria respeitado e não
haveria punição para a quebra.

De…nição 67 Informação diz respeito à variáveis veri…cáveis no contrato.

Notemos então que um contrato não pode ser estabelecido sob uma variável não
veri…cável (por exemplo, o esforço de um funcionário qualquer) de modo que o A tem
uma vantagem informacional sobre o P . Nesse ambiente o objetivo é analisar situações
nas quais uma parte sabe coisas relevantes que a outra parte não sabe.

6.1.1 Dinâmica do relacionamento

Como “benchmark”, tome uma situação onde o P e o A têm a mesma informação


sobre o objeto de troca e a escolha do A, o seu esforço, é veri…cável. Ainda que não
haja informação assimétrica no setup acima, esta pode ser imperfeita no sentido de que
algum elemento aleatório ao comportamento do A pode vir a afetar o relacionamento.
Para incorporar essa possibilidade, considere que a natureza N decide sobre alguma
coisa, determinando o estado de natureza. Dado isso, o resultado do relacionamento se
realiza e os ganhos dos participantes são dados. A …gura abaixo mostra a essa dinâmica

…gura1 (aqui)
A solução desse jogo é determinada através do(s) equilíbrio(s) de Nash perfeito(s)
em subjogo(s). Disso decorre que em cada ponto do tempo a estratégia adotada pelos
jogadores é ótima sobre todas as possibilidades: o A escolhe a sua ação (esforço) que
maximiza a sua utilidade esperada dado que ele aceitou o contrato. Como o P antecipa
o comportamento do A, então para cada estado factível ele oferece um formato de
contrato que maximiza a sua utlidade esperada.

124
6.2 Informação simétrica: …rst-best
Como dito acima, ainda que não haja assimetria de informação, há um resultado
aleatório aos participantes. Essa aleatoriedade não é perfeita na medida em que o
resultado é afetado parcialmente pelo comportamento do A e que caracteriza o risco
do ambiente. Iremos mostrar que o solução do problema acima nos dará os ganhos
do A e do P como função da distribuição ótima do risco entre eles, o que de resto vai
depender do grau de aversão ao risco dos participantes em cada ambiente.

6.2.1 Descrição do modelo

Considere um setup aonde um P propõe um contrato a um A que pode aceitá-lo


ou não. Se o A aceita, um resultado decorre desse relacionamento e assume um valor
x 2 X, onde
X = fx1 ; x2 ; :::; xn g
é conjunto de resultados factíveis, cada um associado a um estado de natureza. x 2 X
depende de e -a ação (esforço) escolhido pelo A- e da distribuição de X, que assumimos
ser de conhecimento comum. Note então que X é uma variável aleatória.
Tome X …nito e seja pi (e) = p [x = xi =e] a probabilidade condicionada ao esforço
P
n
exercido pelo agente de ocorrer xi 2 X. Além disso, pi (e) > 0 8i = 1; :::; n e pi (e) =
i=1
1. Devemos sempre ter em mente que como a disctribuição de X é de conhecimento
comum, então ambos, P e A, têm a mesma distribuição a priori sobre X.
Considerando a utilidade von Neumann-Morgenstern para o P e o A, as preferências
do P são descritas por
UP = B (x w (x))
0 00
onde x 2 X e w (x) é a remuneração paga ao A. Assumimos B > 0 e B 0, de modo
que a concavidade de B indica um principal neutro ou avesso ao risco. É relevante
observar que a utilidade do principal não depende diretamente da ação e tomada pelo
agente, mas tão somente do resultado do relacionamento e do pagamento acordado
associdado àquele resultado.
As preferências do agentes são tais que

UA = u (w (x)) v (e) :

O fato de tais preferências serem aditivamente separáveis em w e e garante que o grau


0 00 0
de aversão ao risco não é afetado pelo esforço. Assumimos u > 0, u 0, v > 0 e
00
v 0. Essa última condição nos informa que a desutilidade marginal da ação, do
esforço, não é decrescente.
De UP e UA acima podemos estabelecer os con‡itos que emergem no relacionamento,
w; e; x: o contrato torna tais con‡itos compatíveis.

125
6.2.2 O contrato de informação simétrica

Com todo informação relevante veri…cável, buscamos o ENPS do jogo acima. Daí
o P desenha um contrato que o A aceita nas melhores condições ao P ; semelhante
à indução retroativa. Nesse ambiente o P escolhe a ação e que ele deseja que o A
exerça e o salário que ele pagará, fw (xi )gni=1 condicional à realização de X. Para
isso ele considera os contratos aceitáveis (que satisfazem a restrição de participação)
para o A e escolhe o mais barato. É uma situação e…ciente (veremos isso adiante) e a
questão central torna-se achar qual o risk-sharing ótimo entre os participantes emerge
do relacionamento. Formalmente, o problema do P é
P
n
max pi (e) B (xi w (xi ))
fe;[w(xi )]ni=1 g i=1
Pn
s. a pi (e) u (w (xi )) v (e) U :
i=1

Ou seja, o principal maximiza o excedente que ele obtém do relacionamento sob a


restrição imposta pela presença do custo de oportunidade de o agente aceitar o contrato,
Pn
pi (e) u (w (xi )) v (e) U . Essa restrição já foi discutida acima e em geral é de…nida
i=1
como restrição de racionalidade individual (IR).
O contrato tem dois componentes,

fe; [w (xi )]ni=1 g

quais sejam a ação e a remuneração condicionada aos resultados. Decorre então que o
contrato inclui uma penalização su…cientemente grande para que o A tome o esforço
combinado.
O Lagrangeano associado ao problema acima é tal que
n
" n #
X X
L= pi (e) B (xi w (xi )) + pi (e) u (w (xi )) v (e) U
i=1 i=1

onde as condições de primeira ordem nos mostram que

@L 0 0
= pi (eo ) B (xi wo (xi )) + o
pi (e) u (wo (xi )) = 0
@w (xi )
de modo que
0
o B (xi wo (xi ))
= ; 8i = 1; :::; n:
u0 (wo (xi ))
Observe que eo é o esforço e…ciente e (wo (xi ))ni=1 a remuneração associada a ele. Além
disso, as condições de Kuhn-Tucker implicam que
( n
)
X
min ; pi (e) u (w (xi )) v (e) U = 0
i=1

126
Proposição 68 > 0:
P
n
Prova. Suponha que não, de modo que pi (e) u (w (xi )) v (e) U > 0. Então
i=1
o P poderia extrair mais renda ao diminuir w (xi ) em todo o espaço de resultados
possíveis sem afetar a restrição de participação do A. Para um P racional, segue que
Pn
pi (e) u (w (xi )) v (e) U = 0 e que > 0.
i=1

O mecanismo ótimo de pagamentos Das CPO’s temos que a distribuição ótima


de riscos implica que a equação
0
o B (xi wo (xi ))
= = cte > 0
u0 (wo (xi ))
é satisfeita. Logo as TMS se igulam entre os estados, caracterizando uma alocação
e…ciente de risco. Para vermos esse resultado na Caixa de Edgeworth, tome X =
fx1 ; x2 g. Segue então que o Lagangeano associado à esse problema seria

L = p1 (e) B (x1 w (x1 ))+p2 (e) B (x2 w (x2 ))+ [p1 (e) u (w (x1 )) + p2 (e) u (w (x2 )) v (e) U]

de modo que as CPO’s implicariam que


0 0
B (x1 w (x1 )) B (x2 w (x2 ))
0 =
u (w (x1 )) u0 (w (x2 ))
p1 (e) u (w (x1 )) + p2 (e) u (w (x2 )) = v (e) U

Figura2 (aqui)

Observação 69 a restrição de participação elimina contratos abaixo de U . Como isso


é de conhecimento comum, o contrato ótimo vai estar em U .

Observação 70 as retas de 450 representam “coisas certas” para o P e para o A: ali


o resultado é w1 = w2 para o A e w1 x1 = w2 x2 para o P , portanto invariante ao
resultado, ao componente aleatório.

P e A avessos ao risco O contrato ótimo estará entre as linhas de 450 e portanto


o risco será dividido de acordo com o grau de aversão ao risco de cada um. Para vermos
isso, lembre que, das CPO’s,
0 0
pi (e) B (xi wo (xi )) + pi (e) u (w (xi )) = 0; > 0:

Derivando em relação a xi obtemos


00 0 00 0
B (:) 1 w (xi ) + u (:) w (xi ) = 0:

127
0
B (:)
Como = 0
u (:)
, segue que
0 00
00 0 B (:) u (:) 0
B (:) 1 w (xi ) + w (xi ) = 0
u0 (:)
00
B (:)
de modo que, de…nindo o grau de aversão ao risco absoluta do principal como RP = B 0 (:)
00
u (:)
e o do agente como RA = u0 (:)
, obtemos
00
B (:)
0 B 0 (:) RP
w (xi ) = = 2 [0; 1] :
B 00 (:) u00 (:) RP + RA
B 0 (:)
+ u0 (:)

Ou seja, o A recebe apenas uma parte, em salário, de um aumento eventual no produto.


Note por …m que quanto mais avesso o A maior RA e portanto menos indexado à
incerteza ele está.

o
P neutro e A avesso ao risco Nesse caso, para a condição de otimalidade =
0
B (xi wo (x i )) 0 0
= cte > 0, o fato de que B (:) = cte implica que u
u0 (wo (xi ))
= 1; :::; n (wo (xi )) ; i
também é constante. Com o A avesso ao risco, a única possibilidade que emerge do
0 0
fato de que u (w (xi )) = u (w (xj )) ; 8xi ; xj 2 X é que
w (xi ) = w (xj ) = wo 8xi ; xj 2 X:
Logo, no ponto ótimo o payo¤ do A é invariante ao resultado e todo o risco está com
o P.

Figura3 (aqui)

Observação 71 o contrato ótimo está no ponto em que as curvas de indiferença rela-


cionadas às preferências do P tangenciam U , na reta de 450 do A. Note então que
w (x1 ) = w (x2 ) = wo
implica em nenhum risco associado ao A. Por outro lado,
x1 w (x1 ) 6= x2 w (x2 ) 8 x1 6= x2
de modo que o P segura totalmente o A, assumindo integralmente o risco.
P
n
Como no ótimo > 0, então pi (eo ) u (wo (xi )) v (eo ) U = 0 equivale a
i=1

u (wo ) = v (eo ) + U
de modo que o salário oferecido pelo P é
wo = u 1
(v (eo ) + U )

128
P avesso e A neutro ao risco: franchise Pelo mesmo motivo argumentado
0 o
acima, o = B u(x0 (w
i w (xi )) 0 0
o (x )) = cte > 0, o fato de que u (:) = cte implica que B (xi wo (xi )) ; i =
i
1; :::; n também é constante. Com o P avesso ao risco, segue que
0 0
B (xi w (xi )) = B (xj w (xj )) ; 8xi ; xj 2 X de maneira que

xi wo (xi ) = xj wo (xj ) = k, cte:

Temos portanto que o payo¤ do P é invariante ao estado da natureza e todo o risco


é alocado para o A.

Observação 72 o contrato ótimo vai estar na linha de 450 do P , quando U tangencia


as preferências do P . Como

x1 w (x1 ) = x2 w (x2 ) = k

segue que
wo (xi ) = xi k
de modo que
w (x1 ) 6= w (x2 ) 8 x1 6= x2
Nesse caso o P não incorre em nenhum risco, que será totalmente alocado para o A.

Observação 73 Do modelo acima, temos que wo (xi ) = xi k será a oferta do P ao


A, que aceita. Note que o resultado é semelhante à uma franquia : o A …ca com o
resultado e paga um montante …xo (k) ao P , invariante à realização dos estados.

P
n
Da restrição de participação do A, temos que pi e0 u w0 (xi ) v e0 = U .
i=1
Para um A avesso ao risco, podemos fazer
n
X
pi e0 w0 (xi ) = U + v e0
i=1
n
X
pi e0 (xi k) = U + v e0
i=1

e segue daí que a oferta ótima de remuneração será

wo (xi ) = xi k
Xn
wo (xi ) = xi pi e0 xi + U + v e0
i=1

129
O nível ótimo de esforço

P
n
P neutro e A avesso ao risco Como vimos, pi (eo ) u (wo (xi )) = v (eo ) +
i=1
U ; w = cte, tal que
u (wo ) = v (eo ) + U
wo = u 1
(v (eo ) + U )
O P portanto
n
X
max pi (eo ) B xi u 1
(v (eo ) + U )
e
i=1
ou ainda, para um P neutro ao risco,
Xn
1
max pi (e) xi u (v (eo ) + U )
e | {z }
i=1
w0
As CPO’s desse problema implicam que
Xn 0 0
0 v (eo ) v (eo )
pi (eo ) xi = 0 o = 0 :
u (w ) u (v (eo ) + U )
i=1
Exercício 74 Mostre que para que a CPO acima seja uma condição su…ciente para o
nível ótimo da ação (esforço) temos que
n
X 00
pi (eo ) xi 0:
i=1

P avesso e A neutro ao risco Acima mostramos que nesse caso wo (xi ) =


P
n
xi pi e0 xi + U + v e0 . A decisão da ação ótima (e) decorre do problema do A
i=1
de
n
X n
X
max pi (e) w (xi ) v (e) = max pi (e) (xi k) v (e)
e e
i=1 i=1
n
X
max pi (e) xi k v (e)
e
i=1
e desse problema decorre as CPO’s:
Xn
0 0
pi (eo ) xi = v (eo )
i=1
Isto é, o ganho marginal esperado do esforço iguala o custo marginal do esforço.
P
n 00
Exercício 75 Mostre que pi (eo ) xi 0 é uma condição su…ciente para que a CPO
i=1
acima seja um máximo global.

130
6.3 Trade-o¤ entre incentivos e risk-sharing: moral hazard
Moral hazard ocorre em um relacionamento quando a ação do A não é veri…cável
pelo P ou quando o A recebe algum tipo de informação privada após o estabelecimento
do contrato. Nesse caso o P não pode controlar diretamente a ação do A. No nosso
setup o esforço e do A não é veri…cável e portanto não pode ser explicitamente incluído
no contrato; o ganho do A não depende diretamente da ação que ele toma. A dinâmica
do jogo é tal que

…gura4 (aqui)
Pode também ocorrer que antes de tomar a sua ação o A observe o estado de
natureza e o P não. Daí

…gura5 (aqui)
e a dinâmica do jogo é a mesma.
O fato de ação escolhida pelo A não ser veri…cável pelo P vai implicar em perda
de e…ciência no relacionamento especi…cado, alterando o tipo de contrato ofertado e as
escolhas ótimas em relação à situações de simetria. Além disso disso, o contrato ótimo
agora será determinado pelo trede-o¤ entre dois objetivos con‡itantes: e…ciência (no
risk-sharing, seguro, ótimo) e incentivos ao A (risco adicional). Segue dessa estrutura
que para o contrato ter o poder de in‡uenciar o comportamento do A, o P deve pagar
mais por um ”bom sinal” (resultado) que informa sobre o tipo de A.

6.3.1 Introdução

O modelo que nós iremos analisar é semelhante ao modelo da seção anterior exceto
pelo fato de que o esforço e não é veri…cável pelo P , ainda que o resultado desse esforço
o seja ao …m do período. Para entendermos a natureza exata do problema, suponha que
o P ofereça um contrato de …rst-best ao A quando a ação e não é observável. Tome um
P neutro e um A avesso ao risco. Como vimos, nesse caso o A teria uma remuneração
constante w (xi ) = w (xj ) = wo 8xi ; xj 2 X de modo que, substituindo na restrição
de participação, u (wo ) = v (eo ) + U , com todo o risco sendo alocado ao P .
Como a ação e não é veri…cável, se o contrato acima for ofertado a melhor resposta
0
que o A pode dar é aceitá-lo e exercer o menor esforço possível (pois v (e) > 0), de
maneira que o retorno esperado do P seria menor do que o correspondente no caso
simétrico, já que em{n é menor do que o e…ciente, eo . Essa reação seria antecipada pelo
P , que proporia a remuneração
h i
wo = wm{n = u 1 U + v em{n .

131
Segue que, como
(eo ; wo ) 6= em{n ; wm{n
caracteriza-se ine…ciência. Para lidar com essa situação o P irá tomar o ganho do A
como dependente do estado, de modo que a remuneração não seja mais constante como
em …st best, ainda que tenhamos um P neutro e um A avesso ao risco.

6.3.2 Moral Hazard: otimalidade em second best

Com e não observável, ao propor o contrato (w; e), o P deve estar certo que a ação
requerida seja aceita pelo A. Isso signi…ca que
( n )
X
e 2 arg max pi (e) u (w (xi )) v (e) .
e
i=1

Essa restrição é dita restição de compatibilidade de incentivos (IC).e re‡ete, nesse setup,
a presença de moral hazard: dado que o contrato foi aceito e a ação e não é observável,
o A escolhe e que maximiza o seu ganho esperado.
Disso decorre que o problema do P passa a ser
P
n
max pi (e) B (xi w (xi ))
fe;[w(xi )]ni=1 g i=1
P n
st pi (e) u (w (xi )) v (e) U
i=1
P
n
e 2 arg max pi (e) u (w (xi )) v (e)
e i=1

Escolha com e 2 eH ; eL Considere que o espaço de ações do A seja eH ; eL tal


que v eH L
> v e . Para um P neutro e um A avesso ao risco, qualquer desvio da
forma contratual padrão se deve a presença de moral hazard. Seja então

X = fx1 ; x2 ; :::; xn g ; x1 < x2 < ::: < xn


X
H H
pi e = p x = xi =e ; pi eH > 0 8x 2 X e pi eH = 1
i
X
L L L
pi e = p x = xi =e , pi e > 0 8x 2 X e pi eL = 1
i

Se o P prefere e = eL , basta ofertar um salário …xo, independente do resultado.


Nesse caso o A escolheria e = em{n = eL de modo que

w = wm{n = u 1
U + v eL

onde
u wL v eL u wH v eH
| {z }
IC

132
é naturalmente satisfeita na medida em que a remuneração é constante.
Por outro lado, se o P preferir eH , o seu problema seria

P
n
max pi eH B (xi w (xi ))
fe;[w(xi )]ni=1 g i=1
Pn
st pi eH u (w (xi )) v eH U
i=1
P
n P
n
pi eH u (w (xi )) v eH pi eL u (w (xi )) v eL
i=1 i=1

onde, notemos,
n
X n
X
pi eH < pi eL 8k = 1; 2; :::; n 1
i=1 i=1

que mostra que maus resultados ocorrem com mais frequência quando o A trabalha sem
muito do esforço do que quando trabalha duro, caracterizado dominânica estocástica
de primeira ordem,

p x > xk =e = eH > p x > xk =e = eL

Com o P neutro ao risco, o problema seria


P
n
max pi eH (xi w (xi ))
fe;[w(xi )]n
i=1 g i=1
P
n
st pi eH u (w (xi )) v eH U
i=1
P
n
pi eH pi eL u (w (xi )) v eH v eL
i=1

de maneira que as condições necessárias implicariam que, 8i = 1; :::; n,

pi eH
= pi eH + pi eH pi eL
u0 (w (xi ))

onde é o multiplicador de Lagrange associado à IC. Somando as restrições obtemos


n
( ) n
" n n
#
X pi eH X X X
= pi eH + pi eH pi eL
u0 (w (xi ))
i=1 i=1 i=1 i=1

Segue que na divisão ótima de risco (second best),


n
( )
X pi eH
=
u0 (w (xi ))
i=1

P
n
onde, como já vimos, > 0, pois pi eH u (w (xi )) v eH = U .
i=1

133
Proposição 76 > 0.

Prova. Por contradição, suponha que não, que = 0. Nesse caso a restrição de
incentivos não estaria ativa (voltaríamos ao caso sem assimetria, com e veri…cável) e
daí w = wm{n ; e = em{n . Logo > 0 tal que
n
X n
X
pi eH u (w (xi )) v eH = pi eL u (w (xi )) v eL
i=1 i=1

Segue da proposição acima que há um custo incidindo sobre o P decorrente da não


observalidade de e (moral hazard).
Analisando a CPO, façamos
" #
1 pi eL
= + 1
u0 (w (xi )) pi (eH )

tal que 8 9
0
< 1 =
1 h i
w (xi ) = u
: + 1 pi (eL ) ;
pi (eH )

pi (eL )
Ou seja, quanto maior a razão p (eH ) menor será a remuneração w, caracterizando
i
antes de mais nada o fato de que nesse setup o salário não é …xo, ainda que o P seja
neutro e o A avesso ao risco. Note que isso decorre do fato de que > 0 (se = 0
então a remuneração seria constante entre os estados de natureza), oque caracteriza o
custo que incide sobre o P em função da presença de moral hazard; os ganhos do P na
presença de moral hazard são estritamente menores do que os seus ganhos em situação
de simetria.
Seguindo a análise acima, podemos genericamente fazer
!
pi eL 0
w (xi ) = f H
; f <0
pi (e )

pi (eL )
onde pi (eH )
é dita razão de verossimilhança e nos informa a precisão na qual o resultado
realizado xi sinaliza que o esforço exercido foi eH - uma redução na razão de verossim-
ilhança é um aumento na probabilidade de que o esforço exercido foi eH quando o
resultado observado foi xi . É portanto uma estatística do esforço do A, não tão infor-
mativa quanto o esforço em si mas o su…ciente para que o P pague (dê incentivos) ao
A por resultados melhores.

Observação 77 No caso onde a ação e era veri…cável, se ambos P e o A são avessos


ao risco, vimos que é efeciente distribuir o risco de acordo com o grau de aversão ao

134
risco de cada um. Essa proposição continua sendo verdadeira na presença de moral
hazard, porém com uma razão adicional, os incentivos que o P fornece ao A para
realização de uma dada ação.

Um ponto particularmente
8 relevante
9 que decorre da análise acima é que
0 1
< =
1
w (xi ) = u não implica que sempre será ótimo pagar salários
: + 1 pi (eHL ) ;
p i (e )
maiores para resultados melhores (salários monótonos no resultado). Por exemplo, em
situações onde a probabilidade de resultados ruins e de resultados muito bons são altas
e a probabilidade de resultados intermediários é baixa, é preferível indexar salários
maiores à resultados ruins do que intermediários.
0
Uma condição necessária para que w (xi ) > 0 é que a razão de verossimilhança,
pi (eL )
pi (eH )
, seja decrescente em xi . Nesse caso dizemos que vale a “propriedade de monotoni-
cidade da razão de verossimilhança, MLRP”. Segue que se a MLRP é satisfeita, então
pi eL pj eL
< 8 xj > xi ,
pi (eH ) pj (eH )
o que mostra que a razão é tanto mais informativa sobre o a ação e do A quanto maior
for o resultado. 8 9
0 1
< =
1
Como no ótimo w (xi ) = u L , então
: + 1 pi (eH) ;
p i (e )
0
1- se pi eL = pi eH , então w (xi ) = u 1 1 = cte, de modo que w (xi ) =
w (xj ) = w 8 xi ; xj 2 X. Tomando w como referência, podemos facilmente ver então
que
2- se pi eL > pi eH , w (xi ) < w e se
3- se pi eL > pi eH , w (xi ) > w.
@w(xi )
Proposição 78 A MLRP não é su…ciente para que @xi > 0.

Prova. Exercício.
Quando temos um principal neutro ao risco, note que se ele paga ao agente de
acordo com o resultado é tão somente para lhe dar incentivos. Decorre daí que o P
deve buscar um equilíbrio entre os benefícios de segurar o A - como no …rst best- e os
benefícos de estabelecer os incentivos corretos. Para atingir esse objetivo, no contrato
ele usa a única variável veri…cável como uma fonte de informação do comportamento do
agente; o P usa o resultado nesse caso com um objetivo similar ao de um problema de
inferência estatística. Segue então que o benefíco de introduzir o resultado no contrato
é a informação que tal resultado fornece sobre o esforço do A.
Por …m devemos notar que em última instância o P não se preocupa de fato com esse
problema de inferência estatística na medida em que é ele quem efetivamente escolhe o

135
nível de esforço do A ao resolver o problema de otimização acima especi…cado; ele sabe
com certeza como o A se comportará. O salário do A depende do resultado porque
essa é a única maneira de in‡uenciar o seu esforço e não porque a escolha que ele faz
sobre o esforço uma vez que o contrato foi estabelecido não seja previsível.

Continuum de ações: a abordagem de primeira ordem Stole.

6.4 Seleção adversa


Vamos tratar agora de situações de informação assimétrica onde a assimetria surge
antes da confecção do contrato. Nessa estrutura a parte que estabelece as condições
do contrato, o P , tem menos informação do que a outra parte, o A, sobre alguma
característica importante que afeta o valor do contrato.
Nós abordaremos uma estrutura bastante simples com apenas um principal e um
agente negociando um contrato sobre dois estados de natureza factíveis e os principais
resultados que nós mostraremos é que (i) é ótimo para o principal oferecer um menu de
contratos para cada tipo possível de agente, incorporando termos que façam com que
cada agente escolha o contrato que foi desenhado para o seu tipo, (ii) no menu ótimo
de contratos, o agente de tipo mais baixo (ou mais alto, dependendo do problema) vai
obter exatamente a sua utilidade de reserva, enquanto todos os demais agentes vão
obter alguma renda informacional que será crescente (decrescente) no tipo do agente.
Note então que a existência dessa renda informacional vai caracterizar a ine…ciência de
cada contrato associado ao tipo do agente. Por …m, (iii) o único contrato e…ciente será
aquele desenhado e assinado pelo agente de tipo mais alto (baixo).

6.4.1 Introdução

Em relacionamentos contratuais o principal problema que surge decorre do fato de


que via de regra as partes que compõem o contrato não têm toda a informação relevante
sobre as outras partes52 . Nós usamos o termo seleção adversa quando a característica
de um A é observada de uma forma imperfeita pelo P . O termo vem do exemplo de
mercado de seguro: se uma companhia seguradora oferece o seu produto a um único
preço baseado no risco médio da população, tal tarifa iria atrair apenas as pessoas de
maior risco e portanto incorreria em perda de dinheiro pela …rma. Esse tipo de situação
pode induzir a seguradora a transeferir algum risco para o segurado, mesmo quando
esse é avesso ao risco e a …rma caracterize um P neutro ao risco. Se o agente tenta,
como seria razoável supor, obter algum ganho de informação mantendo-a privada, o
52
Devemos notar que não apenas quando a vantagem informacional se dá em função de características
“pessoais”nós caracterizamos a presença de seleção adversa. Quando há assimetria de informação com
respeito a qualquer variável relevante no relacionamento contratual nós teremos exatamente o mesmo
problema.

136
problema do principal passa a ser encontrar uma forma de reduzir a sua desvantagem
informacional. Segue que essa dinâmica vai gerar uma situação claramente distinta do
…rst-best no equilíbrio de mercado, caracterizando portanto ine…ciência.
Considere então um P que é um vendedor de vinhos e um A que é um comprador.
O A é um amador na degustação de vinhos e tanto pode ser um apreciador de bons
vinhos quando ter gostos mais modestos. Nós vamos dizer que há dois “tipos”: um A
so…sticado (que está disposto a pagar um quantia maior por um bom vinho) e outro
cujas preferências são menos esmeradas. Assumiremos que o P não pode observar
o tipo do A ou que a lei o proíba de descriminar perfeitamente preços entre os dois
tipos. A chave para a solução do problema de seleção adversa é a seguinte: se o agente
so…sticado está disposto a pagar mais do que o outro por um aumento na qualidade
do vinho, então o P pode segmentar o mercado ofertando duas garrafas diferentes de
vinho:
(
um vinho de alta qualidade por um alto preço
um vinho de baixa qualidade por um baixo preço
Veremos abaixo como essas qualidade e os preços serão determinados otimamente.
Se todos se comportam de acordo o esquema acima, o tipo so…sticado ecolheria o
vinho de alta qualidade e de alto preço enquanto o agente de outro tipo selecionaria o
vinho mais barato, de qualidade pior. Ou seja, os dois tipos de A “se revelam”através
das suas escolhas. Nós veremos logo adiante que o consumidor de tipo baixo escolherá
um vinho que será de qualidade inferior do que aquela que seria socialmente ótima. O
ponto central nos problemas de seleção adversa é fazer com que os agentes revelem os
seus tipos sem incorrer em distorções sociais muito signi…cativas.
Antes de solucionar o problema acima, vamos ver alguns exemplos de seleção adversa
que encontramos com alguma facilidade em diversas situações.

no contexto de seguro de vida, o segurado sabe o seu próprio estado de saúde (e


portanto qual o seu risco de morrer mais cedo ou mais tarde) melhor do que a
…rma seguradora, ainda que ele tenha que fazer alguns tipos de exames médicos.
Isso nos sugere que a seguradora deve oferecer vários pacotes de seguro, cada um
desenhado especi…camente para uma classe de risco dos consumidores.

os bancos costumeiramente encontram clientes cujo risco de default não podem ser
monitorarados perfeitamente. Por exemplo, considere empresários que desejam
…nanciamento para algum projeto arriscado. Uma idéia natural é usar a taxa
de juros para discriminar entre os empresários; no entanto isso pode induzir um
racionamento de crédito, a não ser que os bancos também variem os níveis de
colateral.

137
no mercado de trabalho, empregadores se deparam com empregados em potencial
que têm vantagem no que eles sabem sobre suas habilidades melhor do que as
…rmas. Essa então pode discriminar os trabalhadores de modo a selecionar aqueles
que ela deseja e descartar os demais.

várias …rmas (estatais ou não) são reguladas pelo governo ou por agências regu-
ladoras especializadas na área. Claramente a …rma regulada tem mais imformação
sobre os custos e sua produtividade do que o regulador. Isso implica que a …rma
muito provavelmente tentaria manipular a forma na qual ela informa o governo
de modo a aumentar os seus lucros.

6.4.2 Um modelo discreto de discriminação de preços: Mussa-Rosen (1978)

Considere todas as informações acima sobre o relaciomento entre um consumidor e


um vendedor de vinhos onde o vendedor oferta vinhos de qualidade distintas à preços
distintos na tentativa de segmentar um mercado no qual as preferências dos consumi-
dores são distintas - é portanto um modelo com diferenciação vertical e discriminação
de preços de segunda ordem.

O consumidor (agente) Seja um agente apreciador moderado de vinho que planeja


comprar no máximo uma garrafa de vinho no período no qual nós estamos analisando.
Suas preferências são descritas pela função utilidade

U ( ; q; t) = u ( ; q) t= q t

onde q é a qualidade do vinho que ele compra, é um parâmetro positivo que indexa
as suas preferências por qualidade e t é o preço do vinho. Se ele decide não comprar o
vinho a sua utilidade é zero.
Com essa especi…cação,
0
8 > ; u (q; ) u (q; ) é crescente em q.

Observação 79 A especi…cação acima é a forma discreta da condição de Spence-


Mirlees, ou “single-crossing property”: em um determinado nível de qualidade, os con-
sumidores mais so…sticados (maior ) estão dispostos a pagar mais do que os consum-
idores de baixa qualidade pelo mesmo aumento na qualidade. A conidição de Spence-
Mirlees implica que as curvas de indiferença de agentes de tipos distintos se cruzam,
duas a duas, em um único ponto. Na verdade é essa propriedade que nos permitirá
segmentar o mercado pela qualidade.
2 U (q; )
No caso contínuo, essa condição seria @ @q@ = 1 > 0, de modo que a utilidade
marginal da qualidade é crescente no tipo do agente: um aumento na qualidade do

138
vinho tem um impacto maior na satisfação de um consumidor de tipo alto do que no
consumidor de tipo baixo.

Há dois valores possíveis para : L < H , o que nos permite identi…car o tipo do
consumidor (baixa ou alta qualidade). Esse tipo é de informação privada de cada agente
mas a sua distribuição é conhecimento público e de conhecimento comum. Temos então
que a distribuição de tipos é dada por ( L ; H ) v ( ; 1 ).

O vendedor (principal) O P é um monopolista local no mercado de vinho. Ele


pode produzir vinhos de qualquer qualidade q 2 (0; 1) e produzir uma garrafa de
0 0
vinho de qualidade q custa c (q) para ele. Note que c (0) = 0; c (1) = 1, c (q) > 0 e
00
c (q) > 0. Suas preferências são descritas pela função abaixo

V =t c (q)

exatamente a diferença entre sua receita e o seu custo.

6.4.3 First-best: discriminação perfeita

Se o produtor pode observar o tipo i (i = H; L) do agente, o seu problema será


(
max [ti c (qi )]
qi ;ti
st i qi ti 0; i = L; H
Como todo poder de barganha é do principal, então i qi ti = 0, de modo que o P

max [ i qi c (qi )]
qi

As condições de primeira ordem do problema acima nos mostram que no …rst-best


0
i = c (qi )
0 1
ti = i qi 7 ! ti = ic ( i)

Segue então que


0 1
ti = i qi e qi = c ( i)
i=L;H

é o contrato ótimo ofertado para um consunidor de tipo i , que por construção leva
a um resultado e…ciente: o P extrai todo o excedente e o consumidor A …ca com sua
utilidade de reserva, 0 no caso.
…gura 6 (aqui)

139
Na …gura acima …ca claro que (qL ; qH ) são as qualidades e…cientes. Note então que
0 00
como qi = c 1 ( i ) e c > 0, então o fato de que H > L implica que53 qH > qL , de
modo que tH > tL .
Esse tipo de discriminação, chamada de discriminação de preços de primeiro grau
(ou discriminação perfeita), geralmente não é permitida por lei - a venda dever ser
anônima e não se pode negar a um indivíduo qualquer um contrato que está sendo
ofertado para outro. Entretanto nós vamos abordar o caso em que o vendedor não
pode observar diretamente o tipo do agente, de modo que torna-se impossível praticar
discriminação perfeita, independente do arcabouço legal.

6.4.4 Informação imperfeita: discriminação de segundo grau (preços não-


lineares)

Suponha gora que nós estamos em uma situação de second-best no qual a informação
é assimétrica: o tipo do A não é observável e o P sabe apenas a distribuição ( L ; H ) v
( ;1 ) dos tipos dos agentes.
Proposição 80 se o P oferta o contrato de …rst-best (tL ; qL ), (tH ; qH ), mesmo H
escolhe (tL ; qL ), caracterizando seleção adversa.
(
U ( H ; t L ; q L ) = H q L tL
Prova. Como , então podemos ver que
U ( H ; t H ; q H ) = H q H tH

H qL tL = H qL L qL =( H L ) qL >0
H qH tH = H qH H qH =0
de maneira que U ( H ; tL ; qL ) > U ( H ; tH ; qH ). Segue que o agente de tipo alto, H ,
prefere mentir e não se auto-seleciona.
Concluímos portanto que o contrato (ti ; qi )i=L;H não é implementável54 para
i desconhecido. Nesse caso há um equilíbrio com pooling, com ambos os tipos se-
lecionando o mesmo contrato. Segue que o P pode aumentar seus lucros dando os
incentivos corretos aos agentes para que estes revelem os seus tipos. Nesse sentido o
programa do principal passa a ser
max [ (tL c (qL )) + (1 ) (tH c (qH ))]
qi ;ti
st L qL tL 0
H qH tH 0
L qL tL L qH tH
H qH tH H qL tL
00 0 0
53
Isso é verdade na medida em que, como c > 0, o fato de que c (qH ) > c (qL ) implica que qH > qL .
| {z } | {z }
H L
54
Para a nossa compreensão, vamos dizer que um contrato é implementável se ele satisfaz as restrições
de compatibilidade de incentivos subjacente ao relacionamento.

140
de modo a garantir a implementalção do contrato ótimo sobre (IR) e (IC).

as duas primeiras restrições acima são restrições de participação (ou restrição de


racionalidade individual, IR) dos agentes e garantem que cada tipo de consumidor
aceita o contrato desenhado para ele.

as duas últimas restrições são as restrições de compatibilidade de incentivos, (IC),


e nos mostram que cada consumidor, cada tipo, prefere o seu contrato do que o
contrato de algum outro tipo qualquer.

Vamos resolver o problema acima a partir de algumas digressões sobre as restrições


especi…cadas.

Proposição 81 L qL tL 0 está ativa e H qH tH 0 não está, de modo que


tL = L q L .

Prova. Sabemos que H qH tH H qL tL L qL tL 0. Logo L qL tL


0 implica que H qH tH 0 de modo que H qH tH 0 é redundante. Como
L qL tL 0 está ativa no ótimo e todo poder de barganha é do principal, então
q
L L t L = 0 tal que
tL = L q L

Proposição 82 H qH tH H qL tL está ativa e L qL tL L qH tH não está.


Segue que tH tL = H (qH qL ).

Prova. Por contradição, suponha que não, que H qH tH H qL tL não está


ativa. Segue então que H qH tH H qL tL L qL tL = 0 de maneira que seria
possível aumentar tH sem violar H qH tH 0 ou qualquer restrição de incentivos.
No ótimo

tH tL = H (qH qL )
tH = L qL + H (qH qL )

Proposição 83 qH qL

Prova. Como L qL tL L q H t H e H q H tH H qL tL , então H (qH qL )


tH tL L (qH qL ). Como H > L , então temos que qH qL .
Dessa análise segue que o problema do principal pode ser posto como o problema
de

141
max [ (tL c (qL )) + (1 ) (tH c (qH ))]
qi ;ti
st L qL tL 0
H q tH tL
ou melhor55 ,

max [ ( L qL c (qL )) + (1 )( H qH qL c (qH ))]


qi

0
de modo que as condições de primeira ordem implicam que L c (qL ) = (1 )
tal que
0 (1 )
L = c (qL ) +

0
e (1 ) H c (qH ) = 0 e daí
0
H = c (qH ) 7 ! qH = qH .

Como tL = L qL e tH = tL + H q, então o contrato ótimo (em second best) será


tal que
8
>
> qH = qH
>
>
< tH = L qL + H (q q L ) < tH , pois H qH (1 L ) qL < tH
H
0 1 (1 )
>
> qL = c L < qL
>
>
: tL = L qL < tL

Observação 84 Substituindo o resultado na função objetivo do principal, temos que

max [ ( L qL c (qL )) + (1 )( H qH qL c (qH ))]


qi
max [ ( L qL c (qL )) (1 ) qL + (1 )( H qH c (qH ))]
qi
2 3
6 (1 ) (1 ) 7
max 6
4 ( L qL c (qL )) qL + ( H qH c (qH ))7
5
qi
| {z }
custo informacional, ponderado por ( ;1 )

Considerações …nais Da análise feita acima, os principais resultados são que

o agente de tipo mais alto …ca com a alocação e…ciente, de …rst-best, qH = qH ,


0
H = c (qH ).

todo tipo de agente - exceto o de tipo mais baixo - é indiferente entre o seu
contrato e o contrato do tipo imediatamente inferior.
55
Tome q = qH qL . Fazemos então tH = L qL + H (qH qL ) = H qH qL , onde = H L.

142
todo tipo de agente - exceto o de tipo mais baixo - tem um excedente (quase-renda
informacional) que é crescente no tipo do agente: Ff (( )) ( i ) q ( ).

todo tipo de agente - exceto o de tipo mais alto - tem alocação sube…ciente. Daí
qi = qi 8i 6= H.
0 1
F( ) B C
o agente de tipo mais baixo tem excedente zero: f( ) @|{z}
i A q ( ) = 0.

6.5 Sinalização
essa parte (Salanié e notas do Felli).

143

You might also like