Professional Documents
Culture Documents
Teoría de Juegos - Resumen Completo CC
Teoría de Juegos - Resumen Completo CC
ÍNDICE
INTRODUCCIÓN A
LA TEORÍA DE JUEGOS
Estrategias
Puras
Información
completa
Estrategias
Estáticos mixtas
Información
incompleta
No
cooperativos
Repetidos
Juegos
Información
completa
Dinámicos
Cooperativos Información
incompleta
REPRESENTACIÓN DE
LOS JUEGOS
𝐽 = {0,1,2, … , 𝑛}
𝑋
o 𝑜
o 𝜎: 𝑋 → 𝑋 𝜎(𝑥) 𝑥
o 𝑠: 𝑋 → 𝑋 𝑠(𝑥) = 𝜎 −1 (𝑥) 𝑥
o 𝑇(𝑋) = {𝑥 ∈ 𝑋: 𝑠(𝑥) = 𝜃}
o 𝐷(𝑋) = {𝑥 ∈ 𝑋: 𝑠(𝑥) ≠ 𝜃} = 𝑋 − 𝑇(𝑋)
𝐴
o 𝛼: 𝑋 − {𝑜} 𝛼(𝑥) 𝑥
′
o 𝐴(𝑥) = {𝑎 ∈ 𝐴: ∃𝑥 ∈ 𝑠(𝑥) 𝑐𝑜𝑛 𝑎 = 𝛼(𝑥´)}
o ℎ: 𝑋 → 𝐻 𝑥 ℎ(𝑥)
𝐷(𝑋)
o 𝐴(ℎ) = {𝑎 ∈ 𝐴: 𝑎 ∈ 𝐴(𝑥) 𝑝𝑎𝑟𝑎 𝑥 ∈ ℎ} ℎ
o 𝐻 = ⋃𝑖∈𝐽 ℎ𝑖 𝑖
𝐻0 × 𝐴 → [0,1]
𝜌:
(ℎ, 𝑎) → 𝑝(ℎ, 𝑎)
𝑝(ℎ, 𝑎) = 0 𝑎 ∉ 𝐴(ℎ) ∑𝑎∈𝐴(ℎ) 𝑝(ℎ, 𝑎) = 1
𝑟: 𝑇(𝑋) → 𝑅 𝑛 𝑥 𝑟(𝑥) =
(𝑟1 (𝑥), … , 𝑟𝑛 (𝑥))
𝛤 = {𝐽, (𝑥, 𝜎), (𝐴, 𝛼), {𝑋𝑖 }𝑖∈𝐽 , {𝐻𝑖 }𝑖∈𝐽 , 𝐴(ℎ)ℎ∈𝐻 , 𝜌, 𝑟}
𝑆𝑖 𝑖 𝑠𝑖 ∈ 𝑆𝑖
𝑖
𝑠 = (𝑠1 , 𝑠2 , … , 𝑠𝑛 ) ∈ 𝑆1 × 𝑆2 × … × 𝑆𝑛 = 𝑆
𝑛=2
JUEGOS ESTÁTICOS DE INFORMACIÓN
COMPLETA, ESTRATEGIAS PURAS
𝐺 = {𝑆1 , … 𝑆𝑛 ; 𝑢1 , … 𝑢𝑛 } 𝑠𝑖′ 𝑠𝑖′′ 𝑖 𝑠𝑖′
𝑠𝑖′′ 𝑠−𝑖
𝑢𝑖 (𝑠1 , … , 𝑠𝑖−1 , 𝑠𝑖′ , 𝑠𝑖+1 , … , 𝑠𝑛 ) < 𝑢𝑖 (𝑠1 , … , 𝑠𝑖−1 , 𝑠𝑖′′ , 𝑠𝑖+1 , … , 𝑠𝑛 ) ∀𝑠−𝑖
𝑠𝑖′
𝑖
𝑠𝑖 𝑠−𝑖
𝑠𝑖 ≠ 𝑠𝑖′
𝑠𝑖
𝐺 = {𝑆1 , … 𝑆𝑛 ; 𝑢1 , … 𝑢𝑛 }
𝐺
𝐺1
𝐺1
𝐺2
𝑆𝑖𝑆
𝑆 𝐸𝐼𝐸
𝐺 = {𝑆1 , … 𝑆𝑛 ; 𝑢1 , … 𝑢𝑛 }
𝑆𝑖𝑆
𝑆 𝐸𝐼𝐷
𝐺 = {𝑆1 , … 𝑆𝑛 ; 𝑢1 , … 𝑢𝑛 } 𝐺
𝑆1𝑆 ⊂ 𝑆1 , … 𝑆𝑛
𝐺 𝑠𝑆 ∈
𝑆1𝑆 × … × 𝑆𝑠𝑆
𝑠∗
𝑠∗
𝐺 = {𝑆1 , … 𝑆𝑛 ; 𝑢1 , … 𝑢𝑛 } (𝑠1∗ , … , 𝑠𝑖∗ , … , 𝑠𝑛∗ )
𝑖
𝑖 𝑠𝑖∗ ∗
𝑠−𝑖
𝑆 𝐸𝑁
𝐺 = {𝑆1 , … 𝑆𝑛 ; 𝑢1 , … 𝑢𝑛 } 𝑖
𝑥
𝑦 𝑥+𝑦 ≤
1
𝐺 𝑠∗ 𝑠∗
𝐺 𝑠∗ 𝑠∗
𝑠∗
𝐺 = {𝑆1 , … 𝑆𝑛 ; 𝑢1 , … 𝑢𝑛 } 𝑠
′
𝑠
𝐸1 𝐸2
𝑞1 𝑞2 𝑄
𝐸1 𝐸2 𝑆1 = 𝑆2 =
[0, 𝑎/𝑏 ]
𝐸1 𝑞2 𝐸2
𝑅1 (𝑞2 ) 𝑅2 (𝑞1 )
𝑞𝑖∗
𝑎 − 𝑐 − 𝑏𝑞2 𝑎 − 𝑐 − 𝑏𝑞1
𝑅1 (𝑞2 ) = , 𝑅2 (𝑞1 ) =
2𝑏 2𝑏
𝑎 − 𝑐 − 𝑏𝑞2
𝑎−𝑐−𝑏 𝑎−𝑐
𝑞2∗ = 2𝑏 =
2𝑏 3𝑏
𝑎−𝑐
𝑞2∗ = 𝑞1∗ =
3𝑏
𝑎−𝑐 𝑎−𝑐
𝑆 𝐸𝑁 = {(𝑞1∗ = , 𝑞2∗ = )}
3𝑏 3𝑏
∗ 𝑎−𝑐
𝑄 =2 3𝑏
𝑃 ∗ = 𝑎 − 𝑏𝑄 ∗ =
𝑎+2𝑐 (𝑎−𝑐)2
𝑢1∗ = 𝑢2∗ =
3 9𝑏
𝐷∗
𝑀1∗ 𝑀2∗
𝑛
ESTRATEGIAS MIXTAS Y EXISTENCIA
DE EQUILIBRIO DE NASH
𝑆𝑖 = {𝑠𝑖1 , … 𝑠𝑖𝑘 } 𝑖
𝑖 𝜎𝑖 = (𝜎𝑖1 , … , 𝜎𝑖𝑘 )
𝜎𝑖 𝑠𝑖1
𝜎𝑖1 𝑠𝑖2 𝜎𝑖2
Δ(𝑆𝑖 ) 𝑆𝑖
𝑘
𝑗 𝑗
Δ(𝑆𝑖 ) = {𝜎𝑖 = (𝜎𝑖1 , … , 𝜎𝑖𝑘 ): 𝜎𝑖 ≥ 0 ∧ ∑ 𝜎𝑖 = 1}
𝑗=1
𝑗
𝑠𝑖
(0, … , 1, … , 0)
𝑆𝑖 = {𝑠𝑖1 , … 𝑠𝑖𝑘 }
𝑖 𝜎𝑖
𝑗 𝑗
𝑆𝑂𝑃(𝜎𝑖 ⊂ 𝑆𝑖 ) 𝑠𝑖 𝜎𝑖 > 0
𝑗 𝑗
𝑆𝑂𝑃(𝜎𝑖 ) = {𝑠𝑖 ∈ 𝑆: 𝜎𝑖 > 0}
𝑆𝑂𝑃(𝜎𝑖 ) = 𝑆𝑖
𝑆𝑖
𝐺 𝑆1 = {𝑠11 , … 𝑠1𝑚 } 𝑆2 = {𝑠21 , … 𝑠2𝑚 } 𝜎2 =
(𝜎21 , … , 𝜎2𝑛 )
𝑠1𝑖 𝜎2
𝑛 𝑛
𝑗 𝑗
𝑈1 (𝑠1𝑖 , 𝜎2 ) = ∑ 𝜎2 𝑢1 (𝑠1𝑖 , 𝑠2𝑖 ) , 𝑈2 (𝑠1𝑖 , 𝜎2 ) = ∑ 𝜎2 𝑢1 (𝑠1𝑖 , 𝑠2𝑖 )
𝑗=1 𝑗=1
𝜎1 = (𝜎11 , … , 𝜎1𝑚 ) 𝜎2
𝑚 𝑛 𝑚 𝑛
𝑗 𝑗
𝑈1 (𝜎1 , 𝜎2 ) = ∑ ∑ 𝜎1𝑖 𝜎2 𝑢1 (𝑠1𝑖 , 𝑠2𝑖 ) , 𝑈2 (𝜎1 , 𝜎2 ) = ∑ ∑ 𝜎1𝑖 𝜎2 𝑢2 (𝑠1𝑖 , 𝑠2𝑖 )
𝑖=1 𝑗=1 𝑖=1 𝑗=1
𝐴1 𝐴2
𝜎1 𝜎2
𝑆1 = {𝐴, 𝐵, 𝐶}
(𝑝, 𝑞, 1 − 𝑝 − 𝑞) 𝑝𝐴 + 𝑞𝐶 +
(1 − 𝑝 − 𝑞)𝐵 𝜎2
𝐺 = {𝑆1 , … 𝑆𝑛 ; 𝑢1 , … 𝑢𝑛 } 𝜎∗ =
(𝜎1∗ , … , 𝜎𝑖∗ , … , 𝜎𝑛∗ )
∗
𝑈𝑖 (𝜎1∗ , … 𝜎𝑖−1 , 𝜎𝑖∗ , 𝜎𝑖+1
∗ ∗
, … , 𝜎𝑛∗ ) ≥ 𝑈𝑖 (𝜎1∗ , … 𝜎𝑖−1 ∗
, 𝜎𝑖 , 𝜎𝑖+1 , … , 𝜎𝑛∗ ) ∀𝜎𝑖 ∈ Δ(𝑆𝑖 )
𝑖 𝜎𝑖∗ ∗
𝜎−𝑖
2×2
2×2
(𝑝, 1 − 𝑝) (𝑞, 1 − 𝑞)
(𝑞, 1 − 𝑞) 𝑅1 (𝑞)
(𝑝, 1 − 𝑝) 𝑅2 (𝑝)
𝑝−𝑞 𝑅1 (𝑞) 𝑅2 (𝑝)
2×2
𝐺 = {𝑆1 , … 𝑆𝑛 ; 𝑢1 , … 𝑢𝑛 } 𝑖
𝑆𝑖 𝑅𝑘
𝑢𝑖 𝑆 = 𝑆1 × 𝑆2 × … × 𝑆𝑛 𝑠𝑖
𝐺 = {𝑆1 , … 𝑆𝑛 ; 𝑢1 , … 𝑢𝑛 }
𝑆1 = 𝑆2 = ⋯ = 𝑆𝑛
𝑖 𝑗
𝐺 𝑆𝑖 = 𝐴
𝐴
𝑢𝑖 𝑆 = 𝑆1 × 𝑆2 × … × 𝑆𝑛 𝑠𝑖
𝐺 = {𝑆1 , 𝑆2 , 𝑢1 , 𝑢2 }
𝐴1 𝑚 𝑛 𝐴1
𝑚) 𝐴1 𝐴1
𝑗
𝑚 = max
𝑖
{ min
𝑗
𝑢1 (𝑠1𝑖 , 𝑠2 ) }
𝑠1 ∈𝑆1 𝑠2 ∈𝑆2
𝑚 𝐴1 𝐴1
𝑗
𝑚 = min
𝑗
{ max
𝑖
𝑢1 (𝑠1𝑖 , 𝑠2 ) }
𝑠2 ∈𝑆2 𝑠1 ∈𝑆1
𝑗𝑜
𝑢1 (𝑠1𝑖𝑜 , 𝑠2 ) 𝑖𝑜 𝑗𝑜
𝐴1
𝑗𝑜 𝑗𝑜 𝑗𝑜
𝑢1 (𝑠1𝑖𝑜 , 𝑠2 ) = max
𝑖
𝑢1 (𝑠1𝑖𝑜 , 𝑠2 ) = min
𝑗
𝑢1 (𝑠1𝑖𝑜 , 𝑠2 )
𝑠1 ∈𝑆1 𝑠2 ∈𝑆2
𝑠1𝑖
𝐴1
𝑣1 )
𝑚 𝑣2
𝐺 = {𝑆1 , 𝑆2 , 𝑢1 , 𝑢2 } 𝐴1 𝐴2 = −𝐴1 𝜎1 𝑚 𝜎2 𝑛
𝑣1 ) 𝐺
𝜎1 𝜎2
𝑣2 ) 𝐺
𝑣
𝜎1∗ 𝜎2∗
𝜎1∗
𝜎2∗ 𝜎1∗
𝜎2∗
𝐺
𝑣∈ℝ 𝑣1 = 𝑣2 = 𝑣
𝜎𝑖′ 𝜎𝑖′′
𝑈𝑖 (𝑠1 , … , 𝑠𝑖−1 , 𝜎𝑖′ , 𝑠𝑖+1 , … , 𝑠𝑛 ) < 𝑈𝑖 (𝑠1 , … , 𝑠𝑖−1 , 𝜎𝑖′′ , 𝑠𝑖+1 , … , 𝑠𝑛 ) ∀𝑠−𝑖
𝜎𝑖′
𝑖
𝐺 𝜎 ∗ = (𝜎1∗ , … , 𝜎𝑛∗ )
𝜎𝑖∗
𝐺 𝜎 ∗ = (𝜎1∗ , … , 𝜎𝑛∗ )
𝜎∗
∗
𝜎−𝑖
𝑈𝑖 (𝜎𝑖∗ , 𝜎−𝑖
∗ ∗
) > 𝑈𝑖 (𝜎𝑖 , 𝜎−𝑖 ) ∀𝜎1 ∈ Δ(𝑆𝑖 ) ∧ ∀𝑖
JUEGOS DINÁMICOS CON
INFORMACIÓN COMPLETA
𝐺
𝐺
𝐺 𝑥 𝐺
′ ′
𝐺 𝐺 𝑥 𝐺 𝐺
𝑥 𝑥
𝑦 𝐺′ 𝐺′
𝑦 𝐺′
𝐺 𝐺
𝐺 𝐺
𝐺
𝑠 𝐺 𝑠
𝐺 𝑠 𝐺
𝑟 𝐺 𝑟
𝐺 𝑟 𝑠
𝐺
𝐺
𝐺
𝑠
𝑇
JUEGOS
REPETIDOS
𝛼
𝐶𝑡 /(1 + 𝛼) = 𝐶𝑡+1
𝛽
𝛽<1
𝛽𝐶𝑡 𝐶𝑡+1 .
𝛿
𝛿 = 𝛽/(1 + 𝛼)
𝛿𝐶𝑡 𝐶𝑡+1
𝛿=0 𝛿=0
1
𝑟 𝑟 =𝛿−1
1
𝛿 = 1+𝑟
𝐶
∑𝑡 𝐶𝑡 𝛿 𝑡−1 = ∑𝑡 (1+𝑟)𝑡 𝑡−1
𝐶∗ 𝐶∗ {𝐶 ∗ }𝑡
𝐶 ∗ = (1 − 𝛿)𝑉𝑃
1−𝛿 𝑇
o ∑𝑇𝑡=1 𝛿 𝑡−1 = 1−𝛿
1
o ∑∞
𝑡=1 𝛿
𝑡−1
= 1−𝛿
𝐺
(𝑥1 , 𝑥2 , … , 𝑥𝑛 )
𝐺
𝐺 𝛿
𝐺 𝑇 (𝛿)
o 𝑖 𝛿𝑖
o 𝐺 𝑇
o
𝐺 𝐺 𝑇 (𝛿)
𝑡 ℎ𝑡 𝑛
𝑡−1
𝐺 𝑇 (𝛿)
𝑇
𝐻=⋃ 𝐻𝑡
𝑡=2
𝜎𝑖
𝐺 𝐺 𝑇 (𝛿) 𝑇
𝐺 𝐺 𝑇 (𝛿)
𝐺 ∞ (𝛿)
o 𝑖 𝛿𝑖
o 𝑘
o
𝛿
JUEGOS BAYESIANOS Y EQUILIBRIO
BAYESIANO
𝑡
𝑝(𝑤/𝑡).
𝑎(𝑡) 𝑡
𝑡𝑖
𝑖 𝐴𝑖
𝑡𝑖 𝑢𝑖 (𝑎𝑖 , 𝑡𝑖 ) 𝑝𝑖
𝑡𝑖 𝑝𝑖
𝑝𝑖 (𝑡−𝑖 /𝑡𝑖 )
𝑡 𝑝(𝑡)
𝑖 𝑡𝑖
𝑝𝑖 (𝑡−𝑖 /𝑡𝑖 )
𝑖 𝑎𝑖
𝑖 𝑢𝑖 (𝑎𝑖 , 𝑡𝑖 )
𝑖
𝑇𝑖
𝑝𝑖 (𝑡−𝑖 ∩ 𝑡𝑖 ) 𝑝𝑖 (𝑡−𝑖 ∩ 𝑡𝑖 )
𝑝𝑖 (𝑡−𝑖 /𝑡𝑖 ) = =
𝑝(𝑡𝑖 ) ∑ 𝑝𝑖 (𝑡−𝑖 ∩ 𝑡𝑖 )
𝑖 𝐴𝑖
𝑇𝑖 𝑠𝑖 𝑡𝑖 𝑠𝑖 (𝑡𝑖 ).
∗ ∗
max ∑ 𝑝𝑖 (𝑡−𝑖 /𝑡𝑖 ) 𝑢(𝑠1∗ (𝑡1 ), … , 𝑠𝑖−1 (𝑡𝑖−1 ), 𝑎𝑖 , 𝑠𝑖+1 (𝑡𝑖+1 ), … , 𝑠𝑛∗ (𝑡𝑛 ); 𝑡1 , … , 𝑡𝑛 )
𝑎∈𝐴
𝑡−𝑖 ∈𝑇−𝑖
𝐺𝐵
𝑚(𝑡𝑖 )
𝑎(𝑚𝑗 )
𝑚𝑗
𝑚𝑗
𝜇(𝑡𝑖 |𝑚𝑗 ) 𝜇(𝑡𝑖 |𝑚𝑗 ) > 0 ∑𝜇(𝑡𝑖 |𝑚𝑗 ) = 1 𝑚𝑗 𝜇(𝑡𝑖 |𝑚𝑗 )
𝑚𝑗 𝑎∗ (𝑚𝑗 )
𝜇(𝑡𝑖 |𝑚𝑗 )
𝑡𝑖 𝑚∗ (𝑡𝑖 )
𝑎∗ (𝑚𝑗 )
𝑚𝑗 𝑡𝑖 𝑚∗ (𝑡𝑖 ) = 𝑚𝑗
𝑚𝑗
𝑝(𝑡𝑖 )
𝜇(𝑡𝑖 |𝑚𝑗 ) =
∑𝑡𝑖 ∈ 𝑇𝑖 𝑝(𝑡𝑖 )