Professional Documents
Culture Documents
GameTheory DanRomik
GameTheory DanRomik
יובל קפלן
3
משחקי סכום אפס 1
תורת המשחקי íמנסה לנתח מצבי קונפליקט בין גורמים שונים בעלי אינטגרס ,בהם כל אחד 6.11.2008
משחק הוא מודל למצב קונפליקט בין שני גורמים בעלי אינטרס )להלן" :שחקני .("íלכל אחד
מהשחקנים ,יש מספר פעולות שהוא יכול לבצע )להלן" :אסטרטגיות"( .כל שחקן בוחר אסטרטגיה
מבין אוסף נתון )עלÎפי רוב סופי( של אסטרטגיות .הבחירה מתבצעת בוÎזמנית .בהינתן בחירת
אסטרטגיות ,תוצאת המשחק היא זוג מדדים לשביעות הרצון של שני השחקנים כתוצאה מבחירת
האסטרטגיות .שביעות רצון זו נמדדת כמספר ממשי )להלן" :תועלת" ,utility ,או "תשלו,"í
.(payoff
משחק סכו íאפס הוא משחק שבו האינטרסים של שני השחקנים מנוגדים באופן מקסימלי;
1
פורמלית ,התועלת של שחקן 2היא מינוס התועלת של שחקן .1
משחק סכום אפס בשני שחקנים הגדרה .משחק סכו íאפס בשני שחקני) íבאסטרטגיות טהורות( הוא אוסף } Σ1 = {1, . . . , s1
של אסטרטגיות שחקן ,1אוסף } Σ2 = {1, . . . , s2של אסטרטגיות שחקן ,2וזוג פונקציות תועלת
u1 , u2 : Σ1 × Σ2 → Rכאשר uiפונקציית התועלת של שחקן iומתקיים .u2 ≡ −u1
בדרך כלל ,נתאר רק את .u1נוכל לתאר את התשלומים במטריצה ,כאשר השורות מתארות
את בחירת האסטרטגיה של שחקן ,1והעמודות מתארות את בחירת האסטרטגיה של שחקן .2
שליטה הגדרה .אסטרטגיה aשל שחקן 1שולטת חזק על אסטרטגיה bאם ) u1 (a, j) > u1 (b, jלכל
אסטרטגיה jשל שחקן ) .2כנ"ל ,באופן אנלוגי ,לשחקן ;2שליטה חלשה מוגדרת עם איÎשוויון
חלש(.
רמת ביטחון מקסימלית הגדרה .אסטרטגיה i0של שחקן 1היא אסטרטגיית רמת ביטחו ïמקסימלית אם לכל אסטרטגיה
iשל שחקן 1מתקיים ) minj ai0 ,j ≥ minj ai,jכלומר ,(minj ai0 ,j = maxi minj ai,jכאשר
ai,jהתשלום בבחירת זוג אסטרטגיות ).(i, j
1הגדרה זו שרירותית ,כמובן ,ובאותה מידה ניתן להגדיר "משחק סכום עשר".
5
משחקי סכום אפס 1 בשני שחקנים 1.1
באופן אנלוגי ,אסטרטגיה j0של שחקן 2היא אסטרטגיית רמת ביטחו ïמקסימלית אם לכל
אסטרטגיה jמתקיים ) maxi ai,j0 ≤ maxi ai,jכלומר .(maxi ai,j0 = minj maxi ai,j
למה :1בכל מטריצה ) (ai,jמתקיים .A = minj maxi ai,j ≥ maxi minj ai,j = B
הוכחה ) A .(1הוא רמת הביטחון המקסימלית של שחקן 2ו BÎהוא רמת הביטחון המקסימלית
של שחקן .1אז 2לא ישלם יותר מ AÎו 1Îלא יקבל יותר מ ,BÎלכן ברור ש.A ≥ BÎ
הוכחה ) .(2לכל שורה iבמטריצה ,מתקיים לכל jש .ai,j ≥ minj 0 ai,j 0 Îלכן גם לכל iו,jÎ
.maxi0 ai0 ,j ≥ ai,j ≥ minj 0 ai,j 0זה נכון לכל ,iלכן .maxi0 ai0 ,j ≥ maxi minj 0 ai,j 0זה
נכון לכל ,jלכן .minj 0 maxi0 ai0 ,j 0 ≥ maxi minj 0 ai,j 0
13.11.2008 הגדרה .זוג אסטרטגיות ) (i0 , j0הוא שיווי משקל )באסטרטגיות טהורות( אם מתקיים שלכל שיווי משקל
2
אסטרטגיה jשל שחקן ,ai0 ,j0 ≤ ai0 ,j ,2ולכל אסטרטגיה iשל שחקן .ai0 ,j0 ≥ ai,j0 ,1
משפט :2קיים למשחק שיווי משקל אם ורק אם מתקיים ,maxi minj ai,j = minj maxi ai,j
ובמקרה זה ,אוסף שיוויי המשקל הוא אוסף זוגות האסטרטגיות ) (i0 , j0כך ש i0 Îהיא אסטרטגיית
רמת הביטחון המקסימלית של שחקן 1ו j0 Îהיא אסטרטגיית רמת הביטחון המקסימלית של שחקן
.2לכל זוג כזה מתקיים .ai0 ,j0 = maxi minj ai,jמספר זה נקרא ער êהמשחק. ערך משחק
הוכחה .נניח שמתקיים v = maxi minj ai,j = minj maxi ai,jויהי ) (i0 , j0זוג אסטרטגיות
רמת ביטחון מקסימלית של שחקנים 1,2בהתאמה .נראה שזהו שיווי משקל :מהגדרת אסטרטגיות
רמת ביטחון מקסימלית,
ai0 ,j0 ≥ min ai0 ,j = max min ai,j = v = min max ai,j = max ai,j0 ≥ ai0 ,j0
j i j j i i
0 0
אז .v = ai0 ,j0כעת ,לכל jמתקיים ,ai0 ,j 0 ≥ minj ai0 ,j = vובאופן דומה ,לכל iמתקיים
) ai0 ,j0 ≤ maxi ai,j0 = vכלומר ai0 ,j0 ,הכי קטן בשורה שלו והכי גדול בעמודה שלו(; לכן
) (i0 , j0שיווי משקל.
בכיוון השני :נניח שמתקיים .v2 = minj maxi ai,j > maxi minj ai,j = v1יהי ) (i0 , j0
זוג אסטרטגיות; נראה שהן אינן שיווי משקל .מהגדרת v1ו ,v2 Îבכל עמודה של המטריצה קיים
איבר גדול מ Îאו שווה ל ,v2 Îובכל שורה של המטריצה קיים איבר קטן מ Îאו שווה ל .v1 Îכעת ,אם
ai0 ,j0 < v2אז יש אסטרטגיה i0כך ש ,ai0 ,j0 ≥ v2 > ai0 ,j0 Îכלומר לשחקן 1כדאי לסטות.
2כלומר ,אם שני השחקנים מכריזים מראש על בחירת אסטרטגיות זו ,לאף אחד מהם אין סיבה לשנות את בחירתו.
6
בשני שחקנים 1.1 משחקי סכום אפס 1
באופן דומה ,אם ,ai0 ,j0 > v1אז יש אסטרטגיה j 0כך ש ,ai0 ,j 0 ≤ v1 < ai0 ,j0 Îכלומר לשחקן
2כדאי לסטות .לכן ) (i0 , j0איננו שיווי משקל.
הראינו שכל זוג אסטרטגיות רמת ביטחון מקסימלית הוא שיווי משקל .בכיוון השני ,נניח
ש (i0 , j0 )Îזוג אסטרטגיות שלפחות אחת מהן ,ובלי הגבלת הכלליות ,i0איננה אסטרטגיית רמת
ביטחון מקסימלית .נסמן .v = maxi minj aijאם ,ai0 ,j0 < vאז לשחקן כדאי לשנות את
בחירתו לאסטרטגיה i00שהיא אסטרטגיית רמת ביטחון מקסימלית ותבטיח לו תשלום של .vלכן
) (i0 , j0איננו שיווי משקל .מצד שני ,אם ,ai0 ,j0 ≥ vמכיוון ש i0 Îאיננה אסטרטגיית רמת ביטחון
מקסימלית ,קיימת אסטרטגיה j00של שחקן 2כך ש ,ai0 ,j0 ≥ v > ai0 ,j00 Îלכן לשחקן 2כדאי
לשנות את בחירתו ,ושוב זה אינו שיווי משקל.
בהינתן מטריצת תשלומים ,A = (aij ) i=1,...,s1נרחיב את אוסף האסטרטגיות לכל שחקן עלÎידי
j=1,...,s2
שנאפשר לשחקנים לבצע הגרלה כדי להחליט איזו פעולה )"אסטרטגיה טהורה"( לבצע .כלומר,
במשחק המורחב ,אוסף האסטרטגיות של שחקן iיהיה ,Δsiכאשר Δkהסימפלקס הk −Î
Pk
סימפלקס }Δk = {(p1 , p2 , . . . , pk ) : p1 , . . . , pk > 0, i=1 pi = 1 Î1מימדי,
)} R2 ⊇ Δ2 ,R ⊇ Δ1 = {1הישר x + y = 1ברביע הראשון R3 ⊇ Δ3 ,חלק המישור
x + y + z = 1ברביע הראשון – משולש(.
בדרך כלל ,נסמן ב (p1 , . . . , ps1 )Îאת אסטרטגיית שחקן 1וב (q1 , . . . , qs2 )Îאת אסטרטגיית
שחקן .2
נרחיב את הגדרת פונקציית התועלת עלÎידי שנגדיר ,עבור וקטורי עמודות ,p = (pi )i=1,...,s1
s2
s1 X ,q = (qj )j=1,...,s2
X
= u1 = −u2 pi qj aij = pt Aq
i=1 j=1
3
)תוחלת התועלת(.
קיבלנו ,אם כן ,משחק עם רצף של אסטרטגיות .המושגים שהגדרנו לגבי משחק עם אסטרטגיות
טהורות תקפים גם כאן.
למה .minq∈Δs2 maxp∈Δs1 pt Aq ≥ maxp∈Δs1 minq∈Δs2 pt Aq :3
הוכחה .בדיוק כמו קודם) .ל maxÎול minÎיש משמעות כאן ,כי פונקציה רציפה מקבלת מינימום
ומקסימום על קבוצה קומפקטית(.
הגדרה .אסטרטגיה מעורבת p0 ∈ Δs1תיקרא אסטרטגיית רמת ביטחו ïמקסימלית של שחקן 1
אם לכל ,minq pt0 Aq ≥ minq pt Aq ,p ∈ Δs1כלומר אם .minq pt0 Aq = maxp minq pt Aq
באופן דומה q0 ∈ Δs2 ,תיקרא אסטרטגיית רמת ביטחון מקסימלית של שחקן 2אם מתקיים
.maxp pt Aq0 = minq maxp pt Aq
1 1
אלו שני 2
ו 150Îבהסתברות 2
3כלל לא ברור שזו ההרחבה הנכונה :עבור בני אדם ,לקבל 100או לקבל 50בהסתברות
דברים שונים.
7
משחקי סכום אפס 1 בשני שחקנים 1.1
תרגיל p0 = (p1 , . . . , ps1 ) :היא אסטרטגיית רמת ביטחון מקסימלית אם ≥ minq∈Δs2 pt0 Aq
4
minq∈Δs2 pt Aqלכל ,p ∈ Δs1וזה קורה אם"ם .min1≤j≤s2 pt0 Aej ≥ min1≤j≤s2 pt Aej
הגדרה .זוג אסטרטגיות מעורבות ) (p0 , q0הן שיווי משקל באסטרטגיות מעורבות אם מתקיים
.pt0 Aq0 = maxp pt Aq0 = minq pt0 Aq
משפט :4קיים למשחק שיווי משקל באסטרטגיות מעורבות אם ורק אם = minq maxp pt Aq
,v = maxp minq pt Aqובמקרה זה ,אוסף שיווי המשקל הוא אוסף הזוגות של אסטרטגיות
שהן אסטרטגיות רמת ביטחון מקסימלית של שחקנים 1ו ,2Îבהתאמה .עבור כל זוג כזה מתקיים
.pt0 Aq0 = vמספר זה נקרא ער êהמשחק.
לכל משחק סכום אפס בשני שחקנים קיים שיווי משקל באסטרטגיות מעורבות.
20.11.2008 הגדרה .קבוצה A ⊆ Rdנקראת קמורה אם היא מכילה את הקטע המחבר בין כל שתי נקודות
בה ,כלומר אם לכל x, y ∈ Aולכל 0 ≤ t ≤ 1מתקיים .tx + (1 − t)y ∈ A
Pn
הגדרה .צירו óקמור של נקודות x1 , x2 , . . . , xn ∈ Rdהוא נקודה מהצורה , i=1 pi xiכאשר
Pn
) i=1 pi = 1 ,p1 , . . . , pn ≥ 0דהיינו .((p1 , . . . , pn ) ∈ Δn
הגדרה .הקמור ) (convex hullשל נקודות x1 , . . . , xn ∈ Rdהוא אוסף הצירופים הקמורים של
Pn
.x1 , . . . , xnמסמנים } .conv(x1 , . . . , xn ) = { i=1 pi xi : (p1 , . . . , pn ) ∈ Δn
הגדרה .נקודת קיצו ïשל קבוצה A ⊆ Rdהיא נקודה x ∈ Aשאינה ניתנת להצגה בצורה = x
y+z
עבור .y 6= z ,y, z ∈ A 2
תרגיל :חיתוך קבוצות קמורות הוא קבוצה קמורה .סכום קבוצות קמורות הוא קבוצה קמורה.
∞) ,xn ∈ A ,(xnאם קיים d
תזכורת :קבוצה A ⊆ Rנקראת סגורה אם לכל סדרת נקודות n=1
הגבול x = limn→∞ xnאזי .x ∈ A
קבוצה A ⊆ Rdנקראת קומפקטית אם היא סגורה וחסומה .ידוע כי בקבוצה קומפקטית,
∞) (xnיש תתÎסדרה מתכנסת .xnk → x ∈ A
לכל סדרה n=1 ⊆ A
8
בשני שחקנים 1.1 משחקי סכום אפס 1
1
הוכחה .הפונקציה y 7→ kyk = hy, yi 2מקבלת מינימום על הפונקציה המוקרה )K ∩ B(0, R
עבור Rגדול מספיק 5 .לכן היא גם מקבלת מינימום על Kעצמה )מחוץ לכדור ,הנורמה גדולה מ.(RÎ
hx,xi
= .cאם 2 תהא x ∈ Rnנקודה בה המינימום מתקבל ,ונראה שהיא מקיימת את הטענה עם
,y ∈ Kלכל 0 ≤ t ≤ 1מתקיים ,ty + (1 − t)x ∈ Kולכן לפי הגדרת ,xמתקיים
hty + (1 − t)x, ty + (1 − t)xi ≥ hx, xi
כלומר
2 2
t hy, yi + (1 − t) hx, xi + 2t(1 − t)hx, yi ≥ hx, xi
ובמילים אחרות,
2thy, xi ) ≥ 2thx, xi + O(t2
נחלק ב tÎונשאיף את tל .0Îנקבל ש.hy, xi ≥ hx, xi = 2c > cÎ
9
משחקי סכום אפס 1 בשני שחקנים 1.1
3 1
0 3
נמצא שיווי משקל באסטרטגיות מעורבות .שיווי משקל )) ((p0 , 1 − p0 ), (q0 , 1 − q0צריך
לקיים
= )) min(3p0 , p0 +3(1−p0 min pt0 Aq t
))= max min p Aq = max min(3p, p+3(1−p
q p q 0≤p≤1
3
= .p0הערך של המשחק הוא 5 p0הוא הפתרון של המשוואה ,3p0 = 3 − 2p0כלומר
9
= .v = 3p0 = 3 − 2p0באופן דומה q0 ,מקיים 5
))max(3q0 +(1−q0 ), 3(1−q0 )) = max pt Aq0 = min max pt Aq = min max(3q+(1−q), 3(1−q
p q p 0≤q≤1
9 2
= .v = 1 + 2q0 ו5 Î = ,q0 5 q0הוא הפתרון של מהשוואה ,3 − 3q0 = 1 + 2q0כלומר
K = conv{A }+Rs+1עמודות פתרו ïאלטרנטיבי :בהוכחת משפט המינימקס ,הגדרנו קבוצה
והראינו שערך המשחק הוא } .v = min{u ∈ R : (u, . . . , u) ∈ Kבמקרה שלנו ,נקבל
9 5
= .v 5 = vולכן 2 ]גרף[ נחשב את הערך− 32 v :
הראינו גם שמכיוון ש ,(v, . . . , v) ∈ KÎהוא ניתן להצגה כ q0 ;Aq0 = (v, . . . , v)t Îהוא
אסטרטגיית רמת הביטחון המקסימלית של שחקן .2לגבי שחקן ,1יש לטעון טיעון גבולי.
כפי שראינו ,מהוכחת משפט המינימקס מקבלים אלגוריתם לחישוב שיווי משקל .זה שקול
לבעיית תכנון לינארי ,שניתן לפתור בזמן פולינומיאלי )שיטת הסימפלקס(.
6זה ,כמובן ,לא מקרי :משפט המינימקס מבטיח זאת.
10
בשני שחקנים 1.1 משחקי סכום אפס 1
סיכונים 1.1.3
ניתן לפרש את העובדה שעבור שחקן 1הפונקציה קעורה כאהבת סיכון :השחקן יעדיף לבחור
אסטרטגיה שהיא ממוצע מאשר את ממוצע התשלומים )כי הוא נהנה מההגרלה עצמה ולא רק
מהתשלום עצמו – ההנאה מגבירה את התועלת( .קמירות ,באופן דומה ,ניתנת לפירוש כשנאת סיכון.
ממשפט זה אפשר להסיק את משפט המינימקס.
11
משחקים לא שיתופיים בצורה אסטרטגית 2
הגדרות 2.1
4.12.2008 הגדרה .משחק nשחקני íבצורה אסטרטגית עם מספר סופי של אסטרטגיות )טהורות( מורכב משחק בצורה אסטרטגית
מ (1)Îאוסף של nשחקנים } (2) ;[n] = {1, 2, . . . , nאוסף סופי של פעולות )אסטרטגיות טהורות(
Qn
לכל שחקן (3) ;Si = [si ] ,פונקציית תועלת )תשלום( ui : i=1 Si → Rלכל שחקן ].i ∈ [n
אסטרטגיה מעורבת לשחקן iהיא וקטור הסתברות .pi ∈ Δsiבהינתן אסטרטגיות מעורבות ההרחבה המעורבת
דוגמה .משחקים על ריבוע היחידה :האסטרטגיות לשחקנים 2,1הן ] .[0, 1פונקציות התועלת:
למשחק
i (x, y) = Ai xy + Bi x(1
.uזה שקול )− y) + Ci (1 − x)y + Di (1 − x)(1 − y
A1 ,A2 B1 ,B2 A i Bi
באסטרטגיות מעורבות עם מטריצות תשלומים ) Ui = Ci Diמסמנים .( C1 ,C2 D1 ,D2
הגדרה .במשחק nשחקנים ,אוסף אסטרטגיות מעורבות p1 , . . . , pnייקרא שיווי משקל נאש שיווי משקל נאש
.ui (p1 , . . . , pn ) = max p0i ∈Δsi ) ui (p1 , . . . , pi−1 , p0i , pi+1 , . . . , pn אם לכל ,1 ≤ i ≤ n
C ¬C
C 1, 1 5, 0
¬C 0, 5 4, 4
) – Cהאסיר מודה( .לכל אחד משני אסירים נאמר שאם הוא וחברו יודו ,עונשם יופחת ,ואם רק
הוא יודה ,יקבל הטבות .במקרה זה שיווי המשקל היחיד הוא כאשר שניהם מודים ,אף שאם
שניהם מודים ,מצבם טוב יותר כי לא יורשעו .מאפיה היתה דואגת לשנות את המצב )"אנחנו
נדאג שהתועלת שלך תקטן אם תלשין!"(.
Θ W
Θ 1, 2 −1, −1
W −1, −1 2, 1
הבעל והאישה מפיקים תועלת מללכת יחד לבילוי בתיאטרון ) (Θאו בתחרות איגרוף ) ,(Wאבל
מחליטים באופן בלתי תלוי לאן ללכת .במקרה זה ,שיוויי המשקל הם ) (Θ, Θו) (W, W )Îוכן
)) .((( 12 , 12 ), ( 12 , 12
12
משפט נאש 2.2 משחקים לא שיתופיים בצורה אסטרטגית 2
משפט ) 8נאש( :בכל משחק nשחקנים קיים שיווי משקל נאש באסטרטגיות מעורבות.
משפט ) 9נקודת השבת של בראוור( :יהי } Dn = {x ∈ Rn : kxk ≤ 1כדור היחידה ב.Rn Î
8
לכל פונקציה רציפה f : Dn → Dnיש נקודת שבת ,כלומר x ∈ Dnכך ש.f (x) = xÎ
עבור ,n = 1הטענה היא שלכל פונקציה רציפה ] f : [0, 1] → [0, 1יש נקודת שבת ,וזה
נכון כי הפונקציה g(x) = f (x) − xמקיימת g(1) ≤ 0 ,g(0) ≥ 0ולכן קיים ] x ∈ [0, 1כך
ש) g(x) = 0Îמשפט ערך הביניים(.
2
עבור ,n = 2ניתן הוכחה קומבינטורית של שפרנר .נשים לב שבמקום לעבוד עם ,Dניתן
להוכיח לכל מרחב הומיאומורפי )"שקול טופולוגית"( ל ,D2 Îכלומר ,בפרט ,קבוצה A ⊆ Rnכך
שקיימת פונקציה רציפה ,חדÎחד ערכית ועל h : D2 → Aכך שגם h−1 : A → D2רציפה .אנו
נוכיח זאת עבור ;A = Δ3קל לראות שהוא הומיאומורפי ל.D2 Î
למה ) 10שפרנר( :בהינתן טריאנגולציה 9של המשולש למשולשים יותר קטנים ובהינתן צביעה של
קדקודי הטריאנגולציה בצבעים } {1, 2, 3המקיימת ) (1אם מסמנים את קדקודי המשולש הגדול
ב ,v1 , v2 , v3 Îאז עבור ,i = 1, 2, 3הקדקוד viצבוע בצבע (2) ;iהקדקודים על הצלע של המשולש
הגדול בין viל vj Îצבועים בצבעים } .{i, jאז קיים משולש קטן ’צבעוני’ ,כלומר – קדקודיו צבועים
בשלושת הצבעים }.{1, 2, 3
הוכחה .נסמן ב kÎאת מספר המשולשים הקטנים הצבעוניים .נוכיח ש kÎאיÎזוגי ,ובפרט אינו .0
נסתכל באוסף המשולשים הקטנים T1 , T2 , . . . , Tnהכולל גם את "המשולש באינסוף" )המשלים
של המשולש הגדול כאשר פורשים אותו על ספירה; קדקודיו הם .(v1 , v2 , v3
נגיד ששני משולשים מתוך אוסף זה חברי íאם הם שכנים )יש להם צלע – במקרה של המשולש
באינסוף ,חלק מצלע – משותפת( וקצוות הצלע צבועים בצבעים }.{1, 2
8המשפט שקול לטענה שלא ניתן לכווץ את הספירה } S n−1 = {x ∈ Rn : kxk = 1באופן רציף בלי לעבור דרך
הראשית ,כפי שראינו במבוא לטופולוגיה.
9טריאנגולציה :הצגה של המשולש כאיחוד משולשים קטנים שכל שניים מהם זרים או נחתכים בצלע משותפת לשניהם
או בקדקוד משותף.
13
משחקים לא שיתופיים בצורה אסטרטגית 2 משפט נאש 2.2
למשולשים צבעוניים )מלבד המשולש באינסוף( יש חבר אחד; למשולשים שקדקודיהם צבועים
בצבעים } {1, 2שני חברים; לכל שאר המשולשים ,פרט ,אולי ,למשולש באינסוף ,אין חברים .בפרט,
מבין המשולשים הקטנים ,רק למשולשים הצבעוניים יש מספר איÎזוגי של חברים .לסיום ,נשים לב
כי
.1למשולש באינסוף יש מספר איÎזוגי של חברים ,כי לאורך הצלע בין v1ל v2 Îהצבע מתחלף
1 ↔ 2מספר איÎזוגי של פעמים ,וכל פעם כזו נותנת חבר;
.2סכום מספר החברים על כל המשולשים T1 , . . . , Tnהוא זוגי ,כי כל יחס חברות נספר
פעמיים.
14
המקרה הכללי 2.3 משחקים לא שיתופיים בצורה אסטרטגית 2
הגדרה .סימפלקס Îkמימדי ב Rn Îהוא הקמור של k + 1נקודות בלתיÎתלויות אפינית ב.Rn Î
הסימפלקס הסטנדרטי ב Rn Îהוא הקמור של וקטורי הבסיס הסטנדרטי; סימנו אותו .Δn
11בצירוף קמור ,דורשים גם .ai ≥ 0
15
משחקים לא שיתופיים בצורה אסטרטגית 2 הוכחה אלטרנטיבית 2.4
למה ) 11שפרנר ,מימד כללי( :בהינתן טריאנגולציה של סימפלקס Înמימדי Δוצביעת שפרנר של
קדקודי הטריאנגולציה בצבעים } – {1, 2, . . . , n + 1כלומר ,לקדקודים x1 , . . . , xn+1של Δ
מתקיים שהצבע של xiהוא iלכל ,iולכל פאה Îmמימדית של Δשקדקודיה xi1 , . . . , xim+1כל
הקדקודים על הפאה צבועים בצבעים } – {i1 , i2 , . . . , im+1אז קיים סימפלקס בטריאנגולציה
שקדקודיו צבועים בכל הצבעים }’) {1, 2, . . . , n + 1צבעוני’(.
הוכחה .למעשה ,נוכיח באינדוקציה על המימד שמספר הסימפלקסים הצבעוניים הוא איÎזוגי.
מגדירים יחס חברות בין סימפלקסי הטריאנגולציה והסימפלקס באינסוף a :חבר של bאם יש
להם פאה משותפת ממימד n − 1שקדקודיה צבועים בכל הצבעים } .{1, 2, . . . , nלסימפלקס
באינסוף יש מספר איÎזוגי של חברים ,לפי הנחת האינדוקציה; לסימפלקס צבעוני יש מספר איÎזוגי
של חברים )תרגיל(; לאחרים יש מספר זוגי של חברים .סך כל מספר יחסי החברות זוגי ,כי זה יחס
סימטרי .לכן מספר הסימפלקסים הצבעוניים איÎזוגי.
משפט ) 12נקודת השבת של בראוור ,מחוזק( :אם K ⊆ Rnקמורה וקומפקטית ,לכל פונקציה
f : K → Kרציפה יש נקודת שבת.
הוכחה .ניעזר בלמה:
למה :1.12אם C ⊆ Rnקבוצה קמורה וקומפקטית אז קיימת פונקציה רציפה → y : Rn
Cהמתאימה לכל x ∈ Rnאת הנקודה )היחידה( הקרובה לה ביותר ב ,CÎכלומר מתקיים
.kx − y(x)k = inf z∈C kx − zk
שיווי משקל נאש :וקטור ) (p1 , . . . , pnכך שכל piהוא תגובה טובה ביותר לאחרים.
16
הוכחה אלטרנטיבית 2.4 משחקים לא שיתופיים בצורה אסטרטגית 2
Qn Qn
BR :עלÎידי i=1 → Δ si i=1 נגדיר "פונקציה" Δsi
נקודת שבת של BRהיא שיווי משקל נאש .אבל זו לא באמת פונקציה ,כי יש הרבה תגובות טובות
ביותר ,ומה עם רציפות?
הגדרה .פונקציה קבוצתית ) (set-valued functionמקבוצה Aל BÎהיא העתקה המתאימה לכל
a ∈ AתתÎקבוצה .f (a) ⊆ Bבאופן שקול ,זהו יחס חלקי ל .A × BÎהגרף של פונקציה קבוצתית
12
הוא האוסף }).{(x, y) : y ∈ f (x
משפט ) 13נקודת השבת של קקוטאני( :אם K ⊆ Rnקבוצה קמורה ,קומפקטית ולא ריקה
ו f : K → P (K)Îפונקציה קבוצתית המקיימת ) (1לכל f (x) ,xלא ריקה; ) f (x) (2קמורה
לכל (3) ;xהגרף של fהוא קבוצה סגורה .אז ל f Îיש נקודת שבת מוכללת ,כלומר x ∈ Kכך
ש.x ∈ f (x)Î
דוגמה )מימד .(1גרף ) (1מקיים את התנאים ,ואכן מתקבלת נקודת שבת; בגרף ) ,(2יש xכך
ש f (x)Îאינה קמורה; גרף ) (3אינו סגור:
אפשר להסיק את משפט קקוטאני ממשפט בראוור )ראה בספר של סולן ,משלר וזמיר(.
אפשר להוכיח את משפט נאש עלÎידי משפט קקוטאני:
Qn
מקיימת את ההנחות. i=1 הוכחה .נראה שהפונקציה הקבוצתית BRמהקבוצה הקמורה Δsi
קל לראות ש BR(x)Îקמורה )ממוצע תגובות טובות ביותר הוא גם תגובה טובה ביותר( ולא ריקה.
נראה שהגרף סגור .נניח שיש סדרה ) (pn , q nשל זוגות וקטורי אסטרטגיות,pn → p ∈ Δ ,
.q n ∈ BR(pn ) ,q n → q ∈ Δנראה ש .q ∈ BR(p)Îנניח בשלילה ש ;q 6∈ BR(p)Îאז
יש 1 ≤ i ≤ nכך ש .qi 6∈ BRi (p1 , . . . , p^i , . . . , pn )Îלכן קיים ε > 0ו qi0 ∈ Δsi Îכך
ש.ui (qi0 , p1 , . . . , p^i , . . . , pn ) > ui (qi , p1 , . . . , p^i , . . . , pn ) + εÎ
מכיוון ש ui Îרציפה ,נקבל שעבור nמספיק גדול מתקיים
ε
ui (qi0n , pn1 , . . . , p^ni , . . . , pnn ) > ui (qin , pn1 , . . . , p^ni , . . . , pnn ) +
2
בסתירה לעובדה ש.qin ∈ BRi (pn1 , . . . p^ni , . . . , pnn )Î
17
תורת התועלת 3
1.1.2009 נתור אחר ניסוח אקסיומטי שמצדיק את קיומה של פונקציית תועלת )לינארית(.
אקסיומה )העדפות( .על מרחב ההגרלות ,קיים יחס סדר "עדיף או אדיש" ,שיסומן ,כך שÎ
13
א .היחס טרנזיטיבי :אם L1 L2וגם L2 L3אז ;L1 L3
ב .היחס מלא :לכל שתי הגרלות L1ו L1 L2 ,L2 Îאו ) L2 L1ואם שניהם מתקיימים,
נסמן .(L1 ∼ L2
בפרט ,קיים יחס העדפות על הפרסים ;A1 , A2 , . . . , Arבלי הגבלת הכלליות ,נסדרם בסדר
עדיפויות יורד.A1 A2 . . . Ar :
אקסיומה )רדוקציית הגרלות מורכבות( .יהיו L1 , . . . , Lsהגרלות על קבוצת הפרסים כך שLi Î
)(i )(i )(i
הגרלה הנותנת בסיכוי pjאת הפרס ) Ajסימון .(Li = p1 A1 +̇ . . . +̇pr Ar :תהא Mהגרלה
)(1 )(s
= (1 ≤ k ≤ r) pk q 1 pk + ... + q s pk על ההגרלות .M = qi L1 +̇ . . . +̇qs Ls :Liנגדיר
14
ונגדיר הגרלה .L = p1 A1 +̇ . . . +̇pr Arאז .L ∼ M
אקסיומה )רציפות( .לכל פרס Aiקיים מספר 0 ≤ ui ≤ 1כך שAi ∼ ui A1 +̇(1 − ui )Ar Î
15
)סימון.(Ãi = ui A1 +̇(1 − ui )Ar :
אקסיומה )שקילות ההצבה( .בכל הגרלה אפשר להציב את Ãiבמקום Aiולקבל הגרלה שהפרט
אדיש בינה ובין ההגרלה המקורית.
למה :16בהנחת אקסיומות ,5–1לכל פרס קיים מספר 0 ≤ ui ≤ 1כך שאם ,L = ˙ pi Ai
P
משפט :17אם ,A1 Arאזי קיימת פונקציית תועלת לינארית יחידה המקיימת ,u(A1 ) = 1
.u(Ar ) = 0
18
משפט הנישואים היציבים של גיילÎשאפלי 4
יהיו nגברים ו nÎנשים כך שלכל גבר יש העדפות על הנשים ולכל אישה יש העדפות על הגברים.
שידו êהוא התאמה חדÎחד ערכית בין אוסף הגברים לנשים .שידוך נקרא יציב אם אין גבר xואישה
yשמעדיפים זה את זה עלÎפני בןÎזוגם הנוכחי )עלÎפי השידוך(.
משפט ) 18הנישואי íהיציבי :(íתמיד קיים שידוך יציב.
הוכחה .נראה אלגוריתם שמוצא שידוך יציב.
שלב 1א' :כל גבר הולך לביתה של האישה המועדפת עליו.
שלב 1ב' :כל אישה דוחה את כל הגברים שמחזרים אחריה ,פרט למועדף עליה מביניהם.
שלב 2א' :כל גבר הולך לביתה של האישה המועדפת עליו מבין אלו שלא דחו אותו.
שלב 2ב' :כל אישה דוחה את כל הגברים שמחזרים אחריה ,פרט למועדף עליה מביניהם.
..
.
שלב m
mא' :כל גבר הולך לביתה של האישה המועדפת עליו מבין אלו שלא דחו אותו.
שלב m
mב' :כל אישה דוחה את כל הגברים שמחזרים אחריה ,פרט למועדף עליה מביניהם.
האלגוריתם נעצר :תכונותיו – הגברים מחזרים אחר הנשים המועדפות עליהם בסדר יורד;
הנשים מחוזרות עלÎידי הגברים המועדפים עליהן בסדר עולה; אישה שחיזרו אחריה תפוסה מאותו
רגע )תמיד מחוזרת (.מהתכונה האחרונה ,אין גבר שנדחה עלÎידי כולן ,ולכן האלגוריתם מסתיים
בשידוך.
זמ ïהריצה :גבר שנדחה עלÎידי אישה לא חוזר אליה :כלומר ,כל אישה דוחה לכל היותר n − 1
גברים .לכן יש לכל היותר ) n(n − 1דחיות ,ולכן לאחר לכל היותר n(n − 1) + 1שלבים יגיע שלב
בו אף גבר לא נדחה.
משפט :19מבין כל השידוכים היציבים ,השידוך שמיוצר עלÎידי האלגוריתם אופטימלי לגברים
והכי פחות טוב לנשים.
הוכחה .באינדוקציה.
19
בעיות מיקוח 5
הגדרה 5.1
8.1.2009 בעיית המיקוח של נאש :שני ) (nצדדים מתמקחים על משאב שאותו הם צריכים לחלק ביניהם.
הסטטוסÎקוו הוא המצב הנוכחי ,בו לאף אחד אין כלום .התועלת יכולה להיות פונקציה לא לינארית
של כמות המשאב שהם קיבלו.
קבוצת המיקוח ) .K :(bargaining setקבוצת הנקודות ברות ההשגה ) :(feasible setהנקודות
במישור התועלות ששני השחקנים במשותף יכולים להשיג .לדוגמה ,בחלוקה של 1,000שקלים בין
שני שותפים,
המשחק :כל שחקן מציב דרישה )מספר ממשי( – כמה תועלת הא רוצה .אם זוג הדרישות )(x, y
ברÎהשגה ,הם מקבלים מה שדרשו – אחרת ,מקבלים .0
מניחים שקבוצת המיקוח קומפקטית וקמורה .16
מהם שיווי המשקל )נאש( במשחק? קל לראות שנקודה ) (x, yהיא שיווי משקל אם ורק אם
היא על "השפה היעילה" ,כלומר (x, y) ∈ Kאבל (x, y + ε) 6∈ K ,(x + ε, y) 6∈ Kעבור ε > 0
קטנים.
הגדרה .מושג פתרו ïלבעיית המיקוח הוא התאמה שלכל קבוצת מיקוח מתאימה את אחת הנקודות מושג פתרון
שלה) .אינטואיטיבית ,זהו ניסיון למצוא נקודה ברת השגה שהיא "הוגנת" במובן מסוים(.
משפט :20קיים מושג פתרון יחיד המקיים אקסיומות אלה ,והיא הנקודה היחידה ∈ ) s = (x0 , y0
17
Kהממקסמת את מכפלת הקואורדינטות.s = SNash (K) = arg max{xy : (x, y) ∈ K} :
16ללא קמירות ,אין דברים מעניינים לומר על המשחק ,ואם מאפשרים אסטרטגיות מעורבות ,קבוצת המיקוח בהכרח
קמורה.
17יש נקודה יחידה מכיוון שמכפלת הקואורדינטות היא פונקציה קעורה ,ולכן מקבלת מקסימום יחיד על קבוצה
x+x0 y+y 0
2
· 2
קומפקטית :אם ,c = xy = x0 y 0 ,(x, y) 6= (x0 , y 0 ) ∈ Kאז = ) = 14 (xy + x0 y 0 + xy 0 + x0 y 0
0 0
2c + xy +xוזה גדול מ cÎאם"ם ,xy 0 + x0 y > 2cאבל ) xy + x0 y = xy( xx0 + x0 x) = c(a + a1אם נסמן
0
4
y
20
הגירסה המוחלקת 5.3 בעיות מיקוח 5
הוכחה .קל לראות שפתרון נאש ) SNash (Kהוא אכן מושג פתרון שמקיים את .4–1יהי Sמושג
פתרון כלשהו המקיים את אקסיומות 4–1ונראה שהוא מתלכד עם .SNash
ראשית ,אם נסמן ) ,(x0 , y0 ) = SNash (KעלÎידי שינוי הסקלה של הקואורדינטות אפשר
להניח ש .(x0 , y0 ) = (1, 1)Îמכאן בהכרח נובע ש ,K ⊆ T Îכאשר Tהוא המשולש שקדקודיו
) :(2, 0) ,(0, 2) ,(0, 0אם לא K ,מכילה נקודה ) (x, yכך ש ,x + y > 2Îואם מחברים את )(x, y
ל ,(x0 , y0 ) = (1, 1)Îנקבל נקודה שמכפלת קואורדינטותיה גדולה מ) 1Îתרגיל(.
כעת ,בגלל אקסיומת הסימטרייה ובגלל אקסיומה ,1מתקיים ,S(T ) = 1, 1כי Tשווה
לשיקוף שלה )בהחלפת שמות השחקנים( .אבל K ⊆ Tומכיל את ) ,(1, 1לכן לפי אקסיומה 4
מקבלים ).S(K) = S(T ) = (1, 1) = SNash (K
מניחים שבבעיית המיקוח יש עמימות מסוימת ,כלומר האינפורמציה לגבי קבוצת המיקוח לא
נתונה במלואה .ממדלים זאת עלÎידי החלפת פונקציות התועלת הלאÎרציפות u1 (x, y) = x
ל u1 (x, y) = 0 ,(x, y) ∈ KÎאחרת )וכך גם (u2בגירסאות מוחלקות שלהןu1 (x, y) = ,
) u2 (x, y) = yp(x, y) ,xp(x, yכאשר pשווה ל 1Îעל 0 ,Kבמרחק גדול מ εÎמ ,KÎובתחום
הביניים דועכת מ 1Îל) .0Îבמשחק הלאÎמוחלק(.p = χK ,
משפט :21כאשר ,ε → 0אוסף שיוויי המשקל הÎεÎמוחלק שואף לפתרון נאש.
הוכחה .נגדיר פונקציה ) .f (x, y) = xyp(x, yנשים לב שנקודה ) (x0 , y0היא שיווי משקל 22.1.2009
במשחק המקורב אם ורק אם ) f (x0 , y0 ) = maxy f (x0 , yו,f (x0 , y0 ) = maxx f (x, y0 )Î
וזה קורה אם ורק אם ) y0 p(x0 , y0 ) = maxy yp(x0 , yו.x0 p(x0 , y0 ) = maxx xp(x, y0 )Î
בפרט ,נקודת המקסימום הגלובלית של fהיא שיווי משקל והיא מקיימת .x0 y0 ≥ xNash yNash
לכן קל לראות שכש.(x0 , y0 ) → SNash (K) ,ε → 0Î
מצד שני ,אם ) (x0 , y0היא שיווי משקל ,ממה שהראינו נובע fx (x0 , y0 ) = 0 = y0 (p(x0 , y0 )+
)) x0 px (x0 , y0ו .fy (x0 , y0 ) = 0 = x0 (p(x0 , y0 ) + y0 py (x0 , y0 ))Îבפרטx0 px (x0 , y0 ) = ,
18
לכן נובע ש (x0 , y0 )Îממקסמת את xyתחת האילוץ ) p(x, y) = cלc =Î ) ,y0 py (x0 , y0
19
תהא ) sε = (xε , yεהנקודה הממקסמת את xyתחת האילוץ .p = 1ברור ) .(p(x0 , y0
ε→0
ש .sε → sNash (K)Îמצד שני ,x0 y0 ≥ xε yε ,ולכן גם ).(x0 , y0 ) −→ sNash (K
א .קלעי ומ .סמורודינסקי הציעו פתרון אחר ,שמקיים את האקסיומות 3–1ואת האקסיומה
הבאה :אם מגדילים את קבוצת המיקוח באופן שלא מגדיל את התועלת המקסימלית של כל אחד
מהשחקנים ,הפתרון בקבוצה המוגדלת נותן לכל אחד מהשחקנים לפחות מה שקיבל קודם .הם
הוכיחו משפט :הפתרון היחיד שמקיים את מערכת אקסיומות זו הוא = )SKS (K
21
בעיות מיקוח 5 משחק האיומים של נאש 5.4
בהינתן משחק לא שיתופי בשני שחקנים בצורה אסטרטגית עם מטריצות תועלות ,Bs1 ×s2 ,As1 ×s2
נגדיר קבוצה K ⊆ R2המתארת את זוגות התועלות בריÎההשגה עלÎידי שיתוף פעולה של שני
20
השחקנים:
n
X
{ = } K = conv{(aij , bij ) : 1 ≤ i ≤ s1 , 1 ≤ j ≤ s2 } pij (aij , bij ) : (pij ) 1≤i≤s1 ∈ Δs1 ×s2
i,j=1 1≤j≤s2
Kקמורה וקומפקטית.
משחק האיומי íשנגזר מהמשחק הנתון – A, Bשני שלבים:
בשלב הראשון ,כל אחד מהשחקנים iמצהיר על אסטרטגיה מעורבת ) pi ∈ Δsiה"איום"(.
זוג האיומים ) (p1 , p2קובע זוג תשלומים ) (u1 , u2עלÎידי .u2 = pt1 Bp2 ,u1 = pt1 Ap2
בשלב השני ,השחקנים משחקים משחק מיקוח עם קבוצת המיקוח Kועם נקודת סטטוסÎקוו
)נקודת איÎהסכמה /נקודת איום( ) .(u1 , u2השחקנים מסכימים מראש שהתשלום הסופי יהיה
פתרון נאש.SNash (K; u1 , u2 ) = arg max(x,y)∈K (x − u1 )(y − u2 ) ,
29.1.2009 פתרון נאש הוא נקודה על השפה היעילה שבה התומך ל KÎבעל שיפוע נגדי לקו lהמחבר נקודה
זו עם נקודת האיÎהסכמה .נשים לב שפתרון נאש לכל הנקודות על lהוא אותו פתרון .בדוגמה,
השפה של Kלינארית למקוטעין ומורכבת משני ישרים; לכן יש שתי משפחות של קווים מקבילים
המגדירות את פתרון נאש עבור כל נקודת איום אפשרית ב.KÎ
ניתוח משחק האיומים מתבצע עלÎידי ניתוח משחק סכום אפס לכל אחד מהאזורים בציור:
איזור א' :תחילה נכתוב את פתרון נאש(v1 , v2 ) = SNash (u1 , u2 ) = (au1 + bu2 + c, 90 − :
)).(au1 + bu2 + c
מהתנאים ) SN (30, 60) = (30, 60) ,SN (0, 90) = (0, 90) ,SN (0, 60) = (15, 75מקבלים
= .c = 45 ,b = − 12 ,a 1
2
u1 −u2 u1 −u2
.SNash (u1 , u2 ) = (45 +לכן נפתור את משחק 2 , 45 − 2 ) כלומר ,באיזור א’,
סכום אפס
∗ ∗
נסמן ב (p , q )Îאת שיווי המשקל.
אם נחזור למשחק המקורי ,נקודת האיום עבור האסטרטגיה ) ∗ (p∗ , qתהיה u1 = 0 · 61 · 12 +
5 1 1 1 5 1
· .u2 = 32.5 ,0 6 · 2 · + 60 6 · 2 · + 30 6 · 2 = 17.5
לסיכום ,כמסקנה ממה שהראינו ,שחקן 1יכול לכפות על נקודת האיום להימצא מחוץ לאיזור
א’ .הוא ירצה לעשות זאת ,כמובן; לכן הפתרון אינו באיזור א’ ,ויש לבחון את האיזורים האחרים.
איזור ג' :קל לראות ששחקן 1יכול לכפות על נקודת האיום להימצא באיזור ג’ עלÎידי משחק
האסטרטגיה הטהורה .Bמצד שני ,שחקן 2יכול לכפות על נקודת האיום להימצא על השפה של
איזור ג’ )הישר (y = 2xעלÎידי משחק .Rלכן קיבלנו שהפתרון במצב שיווי משקל יהיה ).(30, 60
20במקום לבחור שורה ועמודה ,השחקנים בוחרים יחד תא במטריצת התשלומים.
22
משחק האיומים של נאש 5.4 בעיות מיקוח 5
משפט :22במשחק האיומים קיים שיווי משקל .יתר על כן ,למשחק יש ערך מקס’Îמינ’ ,כלומר
כל שני שיווי משקל מבטיחים אותה תועלת בדיוק לכל אחד מהשחקנים ,וכל שיווי משקל הוא זוג
אסטרטגיות רמת ביטחון מקסימליות.
הוכחה .הטענה השנייה נובעת מהעובדה שפונקציית התועלת של השחקן השני היא פונקציה מונוטונית
יורדת בתועלת של השחקן הראשון ,ולכן כל ההוכחות שהראינו עבור משחקי סכום אפס תקפות.
קיום נובע ממשפט נקודות השבת של קקוטאני – צריך לבדוק שהפונקציה הקבוצתית →(p, q) 7
) BR(q) × BR(pמקיימת את הנחות המשפט.
23
משחקים שיתופיים והערך של שאפלי 6
הגדרה 6.1
ליבה 6.2
הגדרה .בהינתן משחק שיתופי ) ,(N, vהליבה ) (coreשל המשחק היא אוסף כל הווקטורים ) (x1 , x2 , . . . , xn
כך שמתקיים
)) x1 + x2 + . . . + xn = v(N ) (1יעילות /פארטו(;
P
) (2לכל . i∈S xi ≥ v(S) ,∅ 6= S ⊆ N
הליבה נותנת דרכים לחלוקת התשלום בהם לאף קואליציה לא כדאי לערוק – אך לא בהכרח
דרך יחידה ,ולפעמים היא אף ריקה.
בהינתן משחק ) ,(N, vנרצה לנסח אקסיומות סבירות לחלוקת התשלומים.
P P
( ) v(S))v(N ( v(S)) 21
= .xi Pni∈SP = P i∈S איילת: פתרוï
( i=1 ))i∈S v(S |S⊆N v(S)|S
בהינתן קבוצת שחקנים Nופונקציית תשלום ,vהערך ) ϕi (N, vאומר כמה יקבל שחקן .i
נרצה
Pn
. i=1 ϕi (N, v) = v(N ) .1
.2שחקנים iו jÎייקראו סימטריי íאם לכל קואליציה Sכך ש i 6∈ SÎוv(S∪{i}) = ,j 6∈ SÎ
)} .v(S ∪ {jאז אם iו jÎסימטריים.ϕi (N, v) = ϕj (N, v) ,
P
.3נניח ) .b(S) = i∈S bi ,w(S) = av(S) + b(S) ,b = (b1 , . . . , bnאז = )ϕi (N, w
) .aϕi (N, v) + biניתן לקבל תנאי זה כמסקנה מהשאר(.
24
6.2ליבה משחקים שיתופיים והערך של שאפלי 6
.4שחקן iייקרא גול íאם ) v(S ∪ {i}) = v(Sלכל .i 6∈ S ,S ⊆ Nעיקרו ïהגול :íאם
i ∈ Nגולם ,אז .ϕi (N, v) = 0
.5עיקרו ïהחיבוריות :אם ) (N, vו (N, w)Îשני משחקים ,אז ϕi (N, v +w) = ϕi (N, v)+
).ϕi (N, w
25
משחקים בצורה אקסטנסיבית 7
הגדרה 7.1
5.2.2009 ’משחקי תורות’ – הכללה של שחמט ,למשל .נניח שיש שני שחקנים .יש אינפורמציה מלאה ,מרשים
אלמנט של מזל ומניחים שהמשחק יסתיים לאחר זמן סופי ,בתוצאה של ניצחון ,הפסד או תיקו.
תיאור המשחק – עלÎידי עץ.
דוגמה .משחק עם שני שחקנים ומזל )תיאור חלקי(:
אסטרטגיה היא פונקציה שאומרת איזה מהלך השחקן ישחק בכל אחד מצמתי ההחלטה שלו.
אסטרטגיה מנצחת היא אסטרטגיה שמבטיחה ניצחון ללא תלות בדרך המשחק של השחקן השני.
אסטרטגיה אופטימלית היא אסטרטגיית מקס’Îמינ’ :מבטיחה את "הרע במיעוטו" )המקרה הגרוע
ביותר הכי טוב(.
משפט ) 24פוÎïנוימ :(ïבמשחקי תורות עם אינפורמציה מלאה יש לשחקן 1אסטרטגיה שמבטיחה
לו ניצחון או אסטרטגיה שמבטיחה לו תיקו ,או שלשחקן 2יש אסטרטגיה שמביאה לו ניצחון.
)במקרה של משחק עם מזל ,למשחק יש ערך(.
הוכחה .באינדוקציה הפוכה ).(backtracking
צ’ומפ 7.2
במשחק צ’ומפ ) ,(Chompנתונה טבלת שוקולד בגודל n × mמשבצות .שני השחקנים לוקחים
"ביסים" בתורות; כל ביס מורכב מכל המשבצות ) (i, jכך ש i ≥ i0 Îוגם j ≥ j0עבור ) (i0 , j0
כלשהם .השחקן שאוכל את ) (1, 1מפסיד.
בצ’ומפ ,לשחקן 1יש אסטרטגיה מנצחת )אם"ם ) :((m, n) 6= (1, 1הוכחה עלÎידי "גניבת
אסטרטגיות" – אם לשחקן 2אסטרטגיה מנצחת ,שחקן 1יכול "לגנוב" אותה עלÎידי משחק )(n, m
בצעד הראשון.
עם זאת ,לא ידוע מהי האסטרטגיה המנצחת במקרה הכללי )במקרה n × nזה קל(.
26
הקס 7.3 משחקים בצורה אקסטנסיבית 7
הקס 7.3
המשחק הקס ) (Hexהומצא באופן בלתיÎתלוי עלÎידי Piet Heinב 1942ÎועלÎידי נאש ב.1948Î
מתוך )} .P ({1, . . . , nיתר על כן ,כל אסטרטגיה אופטימלית של שחקן 1היא גם אסטרטגיה
אופטימלית של שחקן .2
הוכחה .בעזרת האבחנה שאם שני השחקנים משחקים את אותה אסטרטגיה ,קבוצת השחקנים
שמצטרפים ל AÎתהיה בדיוק תתÎקבוצה אקראית }.T ⊆ {1, . . . , n
27