You are on page 1of 16

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412)

ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΜΕ ΠΛΗΡΗ ΠΛΗΡΟΦΟΡΗΣΗ


ΜΕΡΟΣ Γ

1
ΜΙΚΤΕΣ ΣΤΡΑΤΗΓΙΚΕΣ

o Η μέχρι τώρα ανάλυση βασίστηκε στην υπόθεση ότι οι παίκτες επιλέγουν τις όποιες
στρατηγικές τους κατά ντετερμινιστικό τρόπο. Υπό αυτή την έννοια, το σύνολο των
στρατηγικών ενός παίκτη 𝑖 ονομάζεται σύνολο καθαρών (ή αμιγών) στρατηγικών.

o Στην παρούσα ενότητα επεκτείνουμε την έννοια της στρατηγικής επιτρέποντας στους
παίκτες να επιλέγουν στρατηγικές με τυχαίο ή πιθανοτικό τρόπο. Με βάση αυτή την
προσέγγιση, μια μικτή στρατηγική ενός παίκτη 𝑖 είναι μια κατανομή πιθανότητας που
ορίζεται στο σύνολο των καθαρών στρατηγικών.

π.χ. έστω ότι ο παίκτης 1 έχει διαθέτει δυο καθαρές στρατηγικές, Α και Β. Μια μικτή
στρατηγική του παίκτη 1 είναι ένα διάνυσμα [𝑥, 1 − 𝑥], όπου 𝑥 είναι η πιθανότητα
επιλογής της καθαρής στρατηγικής Α και 1 − 𝑥 είναι η πιθανότητα επιλογής της
καθαρής στρατηγικής Β.

2
o Ας ξαναθυμηθούμε το παίγνιο κορώνα-γράμματα.

«Δυο άτομα ανακοινώνουν ταυτόχρονα την όψη ενός νομίσματος. Δηλαδή, το


κάθε άτομο ανακοινώνει είτε κορώνα είτε γράμματα. Αν οι ανακοινώσεις είναι
ίδιες, το άτομο 1 πληρώνει 1€ στο άτομο 2. Εάν οι ανακοινώσεις διαφέρουν,
το άτομο 2 πληρώνει 1€ ευρώ στο άτομο 1.»

o Οι καθαρές στρατηγικές κάθε ατόμου είναι γράμματα (Γ) και κορώνα (Κ)

o To παίγνιο δεν έχει ισορροπία Nash σε καθαρές στρατηγικές…

1/2 Κ Γ
Κ -1, 1 1, -1
Γ 1, -1 -1, 1

… έχει όμως ισορροπία Nash σε μικτές στρατηγικές!

3
ΙΣΟΡΡΟΠΙΑ NASH ΣΕ ΜΙΚΤΕΣ ΣΤΡΑΤΗΓΙΚΕΣ (ΙΝΜΣ)

o Μέχρι στιγμής έχουμε δει τον τρόπο να βρίσκουμε ισορροπία/ες Nash μόνο για την
περίπτωση καθαρών στρατηγικών. Τώρα θα δούμε πως βρίσκουμε ισορροπία Nash
σε μικτές στρατηγικές.

o Το παίγνιο κορώνα-γράμματα ξανά

𝑝 1−𝑝
1/2 Κ Γ
𝑟 Κ −1, 1 1, −1
1−𝑟 Γ 1, −1 −1, 1

o Παίκτης 1: θεωρούμε ότι 𝑟 είναι η πιθανότητα να παίξει Κ και 1 − 𝑟 να παίξει Γ.

o Παίκτης 2: θεωρούμε ότι 𝑝 είναι η πιθανότητα να παίξει Κ και 1 − 𝑝 να παίξει Γ.


4
o Ξεκινάμε με τις αναμενόμενες αποδόσεις του παίκτη 1

- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Κ είναι

𝑬𝑼𝟏 (𝑲) = (−1) ∗ 𝑝 + 1 ∗ (1 − 𝑝) = 𝟏 − 𝟐𝒑

- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Γ είναι

𝑬𝑼𝟏 (𝜞) = 1 ∗ 𝑝 + (−1) ∗ (1 − 𝑝) = 𝟐𝒑 − 𝟏

- 𝑬𝑼𝟏 (𝑲) = 𝑬𝑼𝟏 (𝜞) όταν 𝒑 = 𝟏⁄𝟐 οπότε:

Ο παίκτης 1 είναι αδιάφορος μεταξύ του να επιλέξει Κ ή Γ,


όταν ο παίκτης 2 παίζει την μικτή στρατηγική [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2].

5
o Συνεχίζουμε με τις αναμενόμενες αποδόσεις του παίκτη 2

- Η αναμενόμενη απόδοση του 2 όταν παίζει την στρατηγική Κ είναι

𝑬𝑼𝟐 (𝑲) = 1 ∗ 𝑟 + (−1) ∗ (1 − 𝑟) = 𝟐𝒓 − 𝟏

- Η αναμενόμενη απόδοση του 2 όταν παίζει την στρατηγική Γ είναι

𝑬𝑼𝟐 (𝜞) = (−1) ∗ 𝑟 + 1 ∗ (1 − 𝑟) = 𝟏 − 𝟐𝒓

- 𝑬𝑼𝟐 (𝑲) = 𝑬𝑼𝟐 (𝜞) όταν 𝒓 = 𝟏⁄𝟐 οπότε:

Ο παίκτης 2 είναι αδιάφορος μεταξύ του να επιλέξει Κ ή Γ,


όταν ο παίκτης 1 παίζει την μικτή στρατηγική [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2].

6
o Ισορροπία Nash σε μικτές στρατηγικές (ΙΝΜΣ):

- ο παίκτης 1 παίζει Κ και Γ με πιθανότητες [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2]

- ο παίκτης 2 παίζει Κ και Γ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2]

1/2 1/2
1/2 Κ Γ
1/2 Κ −1, 1 1, −1
1/2 Γ 1, −1 −1, 1

o Το κάθε ένα από τα τέσσερα αποτελέσματα του παιγνίου, {𝜥, 𝜥}, {𝜥, 𝜞}, {𝜞, 𝜥}, {𝜞, 𝜞},
λαμβάνει χώρα με πιθανότητα
1 1 1
∗ = = 𝟐𝟓%
2 2 4

o Η αναμενόμενη συνολική απόδοση του κάθε παίκτη είναι 0!

7
o Η αναμενόμενη συνολική απόδοση του παίκτη 1 είναι

1 1 1 1
𝑉1 = ∗ (−1) + ∗ 1 + ∗ 1 + ∗ (−1) = 𝟎
4 4 4 4

o Η αναμενόμενη συνολική απόδοση του παίκτη 2 είναι

1 1 1 1
𝑉2 = ∗ 1 + ∗ (−1) + ∗ (−1) + ∗ 1 = 𝟎
4 4 4 4

o Ας δούμε ένα δεύτερο παράδειγμα. Έστω το παρακάτω παίγνιο.

1/2 Γ Δ
Α 0, 0 0, −1
Β 1, 0 −1, 3

Παίγνιο 4.1
8
o Το παίγνιο αυτό δεν έχει ισορροπία Nash σε καθαρές στρατηγικές…

1/2 Γ Δ
Α 0, 0 0, -1
Β 1, 0 -1, 3

… έχει όμως ισορροπία Nash σε μικτές στρατηγικές!

𝑝 1−𝑝
1/2 Γ Δ
𝑟 Α 0, 0 0, −1
1−𝑟 Β 1, 0 −1, 3

o Παίκτης 1: θεωρούμε ότι 𝑟 είναι η πιθανότητα να παίξει A και 1 − 𝑟 να παίξει B.

o Παίκτης 2: θεωρούμε ότι 𝑝 είναι η πιθανότητα να παίξει Γ και 1 − 𝑝 να παίξει Δ.

9
o Ξεκινάμε με τις αναμενόμενες αποδόσεις του παίκτη 1

- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Α είναι

𝑬𝑼𝟏 (𝜜) = 0 ∗ 𝑝 + 0 ∗ (1 − 𝑝) = 𝟎

- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Β είναι

𝑬𝑼𝟏 (𝜝) = 1 ∗ 𝑝 + (−1) ∗ (1 − 𝑝) = 𝟐𝒑 − 𝟏

- 𝑬𝑼𝟏 (𝜜) = 𝑬𝑼𝟏 (𝜝) όταν 𝒑 = 𝟏⁄𝟐 οπότε:

Ο παίκτης 1 είναι αδιάφορος μεταξύ του να επιλέξει Α ή Β,


όταν ο παίκτης 2 παίζει την μικτή στρατηγική [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2].

10
o Συνεχίζουμε με τις αναμενόμενες αποδόσεις του παίκτη 2

- Η αναμενόμενη απόδοση του 2 όταν παίζει την στρατηγική Γ είναι

𝑬𝑼𝟐 (𝜞) = 0 ∗ 𝑟 + 0 ∗ (1 − 𝑟) = 𝟎

- Η αναμενόμενη απόδοση του 2 όταν παίζει την στρατηγική Δ είναι

𝑬𝑼𝟐 (𝜟) = (−1) ∗ 𝑟 + 3 ∗ (1 − 𝑟) = 𝟑 − 𝟒𝒓

- 𝑬𝑼𝟐 (𝜞) = 𝑬𝑼𝟐 (𝜟) όταν 𝒓 = 𝟑⁄𝟒 οπότε:

Ο παίκτης 2 είναι αδιάφορος μεταξύ του να επιλέξει Γ ή Δ,


όταν ο παίκτης 1 παίζει την μικτή στρατηγική [𝑟, 1 − 𝑟] = [3⁄4 , 1⁄4].

11
o Ισορροπία Nash σε μικτές στρατηγικές (ΙΝΜΣ):

- ο παίκτης 1 παίζει Α και Β με πιθανότητες [𝑟, 1 − 𝑟] = [3⁄4 , 1⁄4]

- ο παίκτης 2 παίζει Γ και Δ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2]

1/2 1/2
1/2 Γ Δ
3/4 Α 0, 0 0, −1
1/4 Β 1, 0 −1, 3

- το αποτέλεσμα {𝜜, 𝜞} εμφανίζεται με πιθανότητα (3⁄4) ∗ (1⁄2) = 𝟑/𝟖

- το αποτέλεσμα {𝜜, 𝜟} εμφανίζεται με πιθανότητα (3⁄4) ∗ (1⁄2) = 𝟑/𝟖

- το αποτέλεσμα {𝜝, 𝜞} εμφανίζεται με πιθανότητα (1⁄4) ∗ (1⁄2) = 𝟏/𝟖

- το αποτέλεσμα {𝜝, 𝜟} εμφανίζεται με πιθανότητα (1⁄4) ∗ (1⁄2) = 𝟏/𝟖


12
o Η αναμενόμενη συνολική απόδοση του παίκτη 1 είναι

3 3 1 1
𝑉1 = ∗ 0 + ∗ 0 + ∗ 1 + ∗ (−1) = 𝟎
8 8 8 8

o Η αναμενόμενη συνολική απόδοση του παίκτη 2 είναι

3 3 1 1
𝑉2 = ∗ 0 + ∗ (−1) + ∗ 0 + ∗ 3 = 𝟎
8 8 8 8

13
ΘΕΩΡΗΜΑ NASH

«Κάθε παίγνιο με πεπερασμένο πλήθος παικτών και στρατηγικών, έχει τουλάχιστον


μια ισορροπία Nash (σε καθαρές ή μικτές στρατηγικές).»

Μια πολύ βασική παρατήρηση

o Θυμηθείτε πως βρήκαμε την ισορροπία Nash σε μικτές στρατηγικές:

«Βρίσκουμε τις πιθανότητες του παίκτη 1 έτσι ώστε ο παίκτης 2 να είναι


αδιάφορος μεταξύ των καθαρών στρατηγικών του και αντίστοιχα βρίσκουμε
τις πιθανότητες του παίκτη 2 ώστε ο παίκτης 1 να είναι αδιάφορος μεταξύ
των καθαρών στρατηγικών του.»

ΝΑΙ ΑΛΛΑ…

14
Αφού ο κάθε παίκτης είναι αδιάφορος μεταξύ
μιας στρατηγικής ισορροπίας και μιας στρατηγικής
μη-ισορροπίας, γιατί να επιλέξει την στρατηγική ισορροπίας?

o Θυμηθείτε το παίγνιο κορώνα-γράμματα. Ισορροπία Nash σε μικτές στρατηγικές:

- ο παίκτης 1 παίζει Κ και Γ με πιθανότητες [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2]

- ο παίκτης 2 παίζει Κ και Γ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2]

Ναι αλλά… ο παίκτης 2 είναι αδιάφορος μεταξύ του να επιλέξει Κ ή Γ, όταν ο παίκτης
1 παίζει την μικτή στρατηγική [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2]. Εφόσον είναι αδιάφορος, γιατί
να παίζει Κ και Γ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2] (στρατηγική ισορροπίας) και
όχι την καθαρή στρατηγική Κ ή Γ με βεβαιότητα (στρατηγική μη-ισορροπίας)?

15
ΟΡΟΛΟΓΙΑ

καθαρή στρατηγική pure strategy


μικτή στρατηγική mixed strategy
ισορροπία Nash σε μικτές στρατηγικές Nash equilibrium in mixed strategies
(ΙΝΜΣ) (NEMS)

ΒΙΒΛΙΟΓΡΑΦΙΑ

• Βαρουφάκης Γιάνης. Θεωρία Παιγνίων.


Κεφάλαιο 2, υποενότητα 1.1 (2.1.1) και υποενότητα 6.1 (2.6.1)

• Σταματόπουλος Γεώργιος. Θεωρία Παιγνίων.


Κεφάλαιο 2, ενότητα 4 (2.4)

• Hal Varian. Μικροοικονομική.


Κεφάλαιο 30, ενότητα 2 (30.2)
16

You might also like