4. ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ - ΜΕΡΟΣ Γ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412)
ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΜΕ ΠΛΗΡΗ ΠΛΗΡΟΦΟΡΗΣΗ

ΜΕΡΟΣ Γ
1
ΜΙΚΤΕΣ ΣΤΡΑΤΗΓΙΚΕΣ
o Η μέχρι τώρα ανάλυση βασίστηκε στην υπόθεση ότι οι παίκτες επιλέγουν τις όποιες
στρατηγικές τους κατά ντετερμινιστικό τρόπο. Υπό αυτή την έννοια, το σύνολο των
στρατηγικών ενός παίκτη 𝑖 ονομάζεται σύνολο καθαρών (ή αμιγών) στρατηγικών.
o Στην παρούσα ενότητα επεκτείνουμε την έννοια της στρατηγικής επιτρέποντας στους
παίκτες να επιλέγουν στρατηγικές με τυχαίο ή πιθανοτικό τρόπο. Με βάση αυτή την
προσέγγιση, μια μικτή στρατηγική ενός παίκτη 𝑖 είναι μια κατανομή πιθανότητας που
ορίζεται στο σύνολο των καθαρών στρατηγικών.
π.χ. έστω ότι ο παίκτης 1 έχει διαθέτει δυο καθαρές στρατηγικές, Α και Β. Μια μικτή
στρατηγική του παίκτη 1 είναι ένα διάνυσμα [𝑥, 1 − 𝑥], όπου 𝑥 είναι η πιθανότητα
επιλογής της καθαρής στρατηγικής Α και 1 − 𝑥 είναι η πιθανότητα επιλογής της
καθαρής στρατηγικής Β.
2
o Ας ξαναθυμηθούμε το παίγνιο κορώνα-γράμματα.
«Δυο άτομα ανακοινώνουν ταυτόχρονα την όψη ενός νομίσματος. Δηλαδή, το

κάθε άτομο ανακοινώνει είτε κορώνα είτε γράμματα. Αν οι ανακοινώσεις είναι
ίδιες, το άτομο 1 πληρώνει 1€ στο άτομο 2. Εάν οι ανακοινώσεις διαφέρουν,
το άτομο 2 πληρώνει 1€ ευρώ στο άτομο 1.»
o Οι καθαρές στρατηγικές κάθε ατόμου είναι γράμματα (Γ) και κορώνα (Κ)
o To παίγνιο δεν έχει ισορροπία Nash σε καθαρές στρατηγικές…
1/2 Κ Γ
Κ -1, 1 1, -1
Γ 1, -1 -1, 1
… έχει όμως ισορροπία Nash σε μικτές στρατηγικές!
3
ΙΣΟΡΡΟΠΙΑ NASH ΣΕ ΜΙΚΤΕΣ ΣΤΡΑΤΗΓΙΚΕΣ (ΙΝΜΣ)
o Μέχρι στιγμής έχουμε δει τον τρόπο να βρίσκουμε ισορροπία/ες Nash μόνο για την
περίπτωση καθαρών στρατηγικών. Τώρα θα δούμε πως βρίσκουμε ισορροπία Nash
σε μικτές στρατηγικές.
o Το παίγνιο κορώνα-γράμματα ξανά
𝑝 1−𝑝
1/2 Κ Γ
𝑟 Κ −1, 1 1, −1
1−𝑟 Γ 1, −1 −1, 1
o Παίκτης 1: θεωρούμε ότι 𝑟 είναι η πιθανότητα να παίξει Κ και 1 − 𝑟 να παίξει Γ.
o Παίκτης 2: θεωρούμε ότι 𝑝 είναι η πιθανότητα να παίξει Κ και 1 − 𝑝 να παίξει Γ.

4
o Ξεκινάμε με τις αναμενόμενες αποδόσεις του παίκτη 1
- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Κ είναι
𝑬𝑼𝟏 (𝑲) = (−1) ∗ 𝑝 + 1 ∗ (1 − 𝑝) = 𝟏 − 𝟐𝒑
- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Γ είναι
𝑬𝑼𝟏 (𝜞) = 1 ∗ 𝑝 + (−1) ∗ (1 − 𝑝) = 𝟐𝒑 − 𝟏
- 𝑬𝑼𝟏 (𝑲) = 𝑬𝑼𝟏 (𝜞) όταν 𝒑 = 𝟏⁄𝟐 οπότε:
Ο παίκτης 1 είναι αδιάφορος μεταξύ του να επιλέξει Κ ή Γ,

όταν ο παίκτης 2 παίζει την μικτή στρατηγική [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2].
5
o Συνεχίζουμε με τις αναμενόμενες αποδόσεις του παίκτη 2
- Η αναμενόμενη απόδοση του 2 όταν παίζει την στρατηγική Κ είναι
𝑬𝑼𝟐 (𝑲) = 1 ∗ 𝑟 + (−1) ∗ (1 − 𝑟) = 𝟐𝒓 − 𝟏
𝑬𝑼𝟐 (𝜞) = (−1) ∗ 𝑟 + 1 ∗ (1 − 𝑟) = 𝟏 − 𝟐𝒓
- 𝑬𝑼𝟐 (𝑲) = 𝑬𝑼𝟐 (𝜞) όταν 𝒓 = 𝟏⁄𝟐 οπότε:
Ο παίκτης 2 είναι αδιάφορος μεταξύ του να επιλέξει Κ ή Γ,

όταν ο παίκτης 1 παίζει την μικτή στρατηγική [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2].
6
o Ισορροπία Nash σε μικτές στρατηγικές (ΙΝΜΣ):
- ο παίκτης 1 παίζει Κ και Γ με πιθανότητες [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2]
- ο παίκτης 2 παίζει Κ και Γ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2]
1/2 1/2
1/2 Κ Γ
1/2 Κ −1, 1 1, −1
1/2 Γ 1, −1 −1, 1
o Το κάθε ένα από τα τέσσερα αποτελέσματα του παιγνίου, {𝜥, 𝜥}, {𝜥, 𝜞}, {𝜞, 𝜥}, {𝜞, 𝜞},
λαμβάνει χώρα με πιθανότητα
1 1 1
∗ = = 𝟐𝟓%
2 2 4
o Η αναμενόμενη συνολική απόδοση του κάθε παίκτη είναι 0!
7
o Η αναμενόμενη συνολική απόδοση του παίκτη 1 είναι
1 1 1 1
𝑉1 = ∗ (−1) + ∗ 1 + ∗ 1 + ∗ (−1) = 𝟎
4 4 4 4
1 1 1 1
𝑉2 = ∗ 1 + ∗ (−1) + ∗ (−1) + ∗ 1 = 𝟎
4 4 4 4
o Ας δούμε ένα δεύτερο παράδειγμα. Έστω το παρακάτω παίγνιο.
1/2 Γ Δ
Α 0, 0 0, −1
Β 1, 0 −1, 3
Παίγνιο 4.1
8
o Το παίγνιο αυτό δεν έχει ισορροπία Nash σε καθαρές στρατηγικές…
1/2 Γ Δ
Α 0, 0 0, -1
Β 1, 0 -1, 3
… έχει όμως ισορροπία Nash σε μικτές στρατηγικές!
𝑝 1−𝑝
1/2 Γ Δ
𝑟 Α 0, 0 0, −1
1−𝑟 Β 1, 0 −1, 3
o Παίκτης 1: θεωρούμε ότι 𝑟 είναι η πιθανότητα να παίξει A και 1 − 𝑟 να παίξει B.
o Παίκτης 2: θεωρούμε ότι 𝑝 είναι η πιθανότητα να παίξει Γ και 1 − 𝑝 να παίξει Δ.
9
o Ξεκινάμε με τις αναμενόμενες αποδόσεις του παίκτη 1
- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Α είναι
𝑬𝑼𝟏 (𝜜) = 0 ∗ 𝑝 + 0 ∗ (1 − 𝑝) = 𝟎
- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Β είναι
𝑬𝑼𝟏 (𝜝) = 1 ∗ 𝑝 + (−1) ∗ (1 − 𝑝) = 𝟐𝒑 − 𝟏
- 𝑬𝑼𝟏 (𝜜) = 𝑬𝑼𝟏 (𝜝) όταν 𝒑 = 𝟏⁄𝟐 οπότε:
Ο παίκτης 1 είναι αδιάφορος μεταξύ του να επιλέξει Α ή Β,

όταν ο παίκτης 2 παίζει την μικτή στρατηγική [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2].
10
o Συνεχίζουμε με τις αναμενόμενες αποδόσεις του παίκτη 2
𝑬𝑼𝟐 (𝜞) = 0 ∗ 𝑟 + 0 ∗ (1 − 𝑟) = 𝟎
- Η αναμενόμενη απόδοση του 2 όταν παίζει την στρατηγική Δ είναι
𝑬𝑼𝟐 (𝜟) = (−1) ∗ 𝑟 + 3 ∗ (1 − 𝑟) = 𝟑 − 𝟒𝒓
- 𝑬𝑼𝟐 (𝜞) = 𝑬𝑼𝟐 (𝜟) όταν 𝒓 = 𝟑⁄𝟒 οπότε:
Ο παίκτης 2 είναι αδιάφορος μεταξύ του να επιλέξει Γ ή Δ,

όταν ο παίκτης 1 παίζει την μικτή στρατηγική [𝑟, 1 − 𝑟] = [3⁄4 , 1⁄4].
11
o Ισορροπία Nash σε μικτές στρατηγικές (ΙΝΜΣ):
- ο παίκτης 1 παίζει Α και Β με πιθανότητες [𝑟, 1 − 𝑟] = [3⁄4 , 1⁄4]
- ο παίκτης 2 παίζει Γ και Δ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2]
1/2 1/2
1/2 Γ Δ
3/4 Α 0, 0 0, −1
1/4 Β 1, 0 −1, 3
- το αποτέλεσμα {𝜜, 𝜞} εμφανίζεται με πιθανότητα (3⁄4) ∗ (1⁄2) = 𝟑/𝟖
- το αποτέλεσμα {𝜜, 𝜟} εμφανίζεται με πιθανότητα (3⁄4) ∗ (1⁄2) = 𝟑/𝟖
- το αποτέλεσμα {𝜝, 𝜞} εμφανίζεται με πιθανότητα (1⁄4) ∗ (1⁄2) = 𝟏/𝟖
- το αποτέλεσμα {𝜝, 𝜟} εμφανίζεται με πιθανότητα (1⁄4) ∗ (1⁄2) = 𝟏/𝟖

12
3 3 1 1
𝑉1 = ∗ 0 + ∗ 0 + ∗ 1 + ∗ (−1) = 𝟎
8 8 8 8
3 3 1 1
𝑉2 = ∗ 0 + ∗ (−1) + ∗ 0 + ∗ 3 = 𝟎
8 8 8 8
13
ΘΕΩΡΗΜΑ NASH
«Κάθε παίγνιο με πεπερασμένο πλήθος παικτών και στρατηγικών, έχει τουλάχιστον

μια ισορροπία Nash (σε καθαρές ή μικτές στρατηγικές).»
Μια πολύ βασική παρατήρηση
o Θυμηθείτε πως βρήκαμε την ισορροπία Nash σε μικτές στρατηγικές:
«Βρίσκουμε τις πιθανότητες του παίκτη 1 έτσι ώστε ο παίκτης 2 να είναι

αδιάφορος μεταξύ των καθαρών στρατηγικών του και αντίστοιχα βρίσκουμε
τις πιθανότητες του παίκτη 2 ώστε ο παίκτης 1 να είναι αδιάφορος μεταξύ
των καθαρών στρατηγικών του.»
ΝΑΙ ΑΛΛΑ…
14
Αφού ο κάθε παίκτης είναι αδιάφορος μεταξύ
μιας στρατηγικής ισορροπίας και μιας στρατηγικής
μη-ισορροπίας, γιατί να επιλέξει την στρατηγική ισορροπίας?
o Θυμηθείτε το παίγνιο κορώνα-γράμματα. Ισορροπία Nash σε μικτές στρατηγικές:
- ο παίκτης 1 παίζει Κ και Γ με πιθανότητες [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2]
- ο παίκτης 2 παίζει Κ και Γ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2]
Ναι αλλά… ο παίκτης 2 είναι αδιάφορος μεταξύ του να επιλέξει Κ ή Γ, όταν ο παίκτης
1 παίζει την μικτή στρατηγική [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2]. Εφόσον είναι αδιάφορος, γιατί
να παίζει Κ και Γ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2] (στρατηγική ισορροπίας) και
όχι την καθαρή στρατηγική Κ ή Γ με βεβαιότητα (στρατηγική μη-ισορροπίας)?
15
ΟΡΟΛΟΓΙΑ
καθαρή στρατηγική pure strategy

μικτή στρατηγική mixed strategy
ισορροπία Nash σε μικτές στρατηγικές Nash equilibrium in mixed strategies
(ΙΝΜΣ) (NEMS)
ΒΙΒΛΙΟΓΡΑΦΙΑ
• Βαρουφάκης Γιάνης. Θεωρία Παιγνίων.

Κεφάλαιο 2, υποενότητα 1.1 (2.1.1) και υποενότητα 6.1 (2.6.1)
• Σταματόπουλος Γεώργιος. Θεωρία Παιγνίων.

Κεφάλαιο 2, ενότητα 4 (2.4)
• Hal Varian. Μικροοικονομική.

Κεφάλαιο 30, ενότητα 2 (30.2)
16

4. ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ - ΜΕΡΟΣ Γ

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

4. ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ - ΜΕΡΟΣ Γ

Uploaded by

Copyright:

Available Formats

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ (ECΟ412)

ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΜΕ ΠΛΗΡΗ ΠΛΗΡΟΦΟΡΗΣΗ

«Δυο άτομα ανακοινώνουν ταυτόχρονα την όψη ενός νομίσματος. Δηλαδή, το

o To παίγνιο δεν έχει ισορροπία Nash σε καθαρές στρατηγικές…

… έχει όμως ισορροπία Nash σε μικτές στρατηγικές!

o Το παίγνιο κορώνα-γράμματα ξανά

o Παίκτης 1: θεωρούμε ότι 𝑟 είναι η πιθανότητα να παίξει Κ και 1 − 𝑟 να παίξει Γ.

o Παίκτης 2: θεωρούμε ότι 𝑝 είναι η πιθανότητα να παίξει Κ και 1 − 𝑝 να παίξει Γ.

- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Κ είναι

𝑬𝑼𝟏 (𝑲) = (−1) ∗ 𝑝 + 1 ∗ (1 − 𝑝) = 𝟏 − 𝟐𝒑

- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Γ είναι

𝑬𝑼𝟏 (𝜞) = 1 ∗ 𝑝 + (−1) ∗ (1 − 𝑝) = 𝟐𝒑 − 𝟏

- 𝑬𝑼𝟏 (𝑲) = 𝑬𝑼𝟏 (𝜞) όταν 𝒑 = 𝟏⁄𝟐 οπότε:

Ο παίκτης 1 είναι αδιάφορος μεταξύ του να επιλέξει Κ ή Γ,

- Η αναμενόμενη απόδοση του 2 όταν παίζει την στρατηγική Κ είναι

𝑬𝑼𝟐 (𝑲) = 1 ∗ 𝑟 + (−1) ∗ (1 − 𝑟) = 𝟐𝒓 − 𝟏

- Η αναμενόμενη απόδοση του 2 όταν παίζει την στρατηγική Γ είναι

𝑬𝑼𝟐 (𝜞) = (−1) ∗ 𝑟 + 1 ∗ (1 − 𝑟) = 𝟏 − 𝟐𝒓

- 𝑬𝑼𝟐 (𝑲) = 𝑬𝑼𝟐 (𝜞) όταν 𝒓 = 𝟏⁄𝟐 οπότε:

Ο παίκτης 2 είναι αδιάφορος μεταξύ του να επιλέξει Κ ή Γ,

- ο παίκτης 1 παίζει Κ και Γ με πιθανότητες [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2]

- ο παίκτης 2 παίζει Κ και Γ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2]

o Η αναμενόμενη συνολική απόδοση του κάθε παίκτη είναι 0!

o Η αναμενόμενη συνολική απόδοση του παίκτη 2 είναι

o Ας δούμε ένα δεύτερο παράδειγμα. Έστω το παρακάτω παίγνιο.

… έχει όμως ισορροπία Nash σε μικτές στρατηγικές!

o Παίκτης 1: θεωρούμε ότι 𝑟 είναι η πιθανότητα να παίξει A και 1 − 𝑟 να παίξει B.

o Παίκτης 2: θεωρούμε ότι 𝑝 είναι η πιθανότητα να παίξει Γ και 1 − 𝑝 να παίξει Δ.

- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Α είναι

- Η αναμενόμενη απόδοση του 1 όταν παίζει την στρατηγική Β είναι

𝑬𝑼𝟏 (𝜝) = 1 ∗ 𝑝 + (−1) ∗ (1 − 𝑝) = 𝟐𝒑 − 𝟏

- 𝑬𝑼𝟏 (𝜜) = 𝑬𝑼𝟏 (𝜝) όταν 𝒑 = 𝟏⁄𝟐 οπότε:

Ο παίκτης 1 είναι αδιάφορος μεταξύ του να επιλέξει Α ή Β,

- Η αναμενόμενη απόδοση του 2 όταν παίζει την στρατηγική Γ είναι

- Η αναμενόμενη απόδοση του 2 όταν παίζει την στρατηγική Δ είναι

𝑬𝑼𝟐 (𝜟) = (−1) ∗ 𝑟 + 3 ∗ (1 − 𝑟) = 𝟑 − 𝟒𝒓

- 𝑬𝑼𝟐 (𝜞) = 𝑬𝑼𝟐 (𝜟) όταν 𝒓 = 𝟑⁄𝟒 οπότε:

Ο παίκτης 2 είναι αδιάφορος μεταξύ του να επιλέξει Γ ή Δ,

- ο παίκτης 1 παίζει Α και Β με πιθανότητες [𝑟, 1 − 𝑟] = [3⁄4 , 1⁄4]

- ο παίκτης 2 παίζει Γ και Δ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2]

- το αποτέλεσμα {𝜜, 𝜞} εμφανίζεται με πιθανότητα (3⁄4) ∗ (1⁄2) = 𝟑/𝟖

- το αποτέλεσμα {𝜜, 𝜟} εμφανίζεται με πιθανότητα (3⁄4) ∗ (1⁄2) = 𝟑/𝟖

- το αποτέλεσμα {𝜝, 𝜞} εμφανίζεται με πιθανότητα (1⁄4) ∗ (1⁄2) = 𝟏/𝟖

- το αποτέλεσμα {𝜝, 𝜟} εμφανίζεται με πιθανότητα (1⁄4) ∗ (1⁄2) = 𝟏/𝟖

o Η αναμενόμενη συνολική απόδοση του παίκτη 2 είναι

«Κάθε παίγνιο με πεπερασμένο πλήθος παικτών και στρατηγικών, έχει τουλάχιστον

Μια πολύ βασική παρατήρηση

o Θυμηθείτε πως βρήκαμε την ισορροπία Nash σε μικτές στρατηγικές:

«Βρίσκουμε τις πιθανότητες του παίκτη 1 έτσι ώστε ο παίκτης 2 να είναι

o Θυμηθείτε το παίγνιο κορώνα-γράμματα. Ισορροπία Nash σε μικτές στρατηγικές:

- ο παίκτης 1 παίζει Κ και Γ με πιθανότητες [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2]

- ο παίκτης 2 παίζει Κ και Γ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2]

καθαρή στρατηγική pure strategy

• Βαρουφάκης Γιάνης. Θεωρία Παιγνίων.

• Σταματόπουλος Γεώργιος. Θεωρία Παιγνίων.

• Hal Varian. Μικροοικονομική.

You might also like