You are on page 1of 27

‫תורת המשחקים‬

‫יובל קפלן‬

‫סיכום הרצאות ד"ר דן רומיק בקורס "תורת המשחקים" )‪(80428‬‬


‫באוניברסיטה העברית‪.2008–9 ,‬‬
‫תוכן מחברת זו הוקלד ונערך על‪Î‬ידי יובל קפלן‪ .‬אין המרצה אחראי לכל‬
‫טעות שנפלה בו‪ .‬סודר באמצעות ‪ LATEX 2ε‬ב‪ 22Î‬בפברואר ‪.2009‬‬
‫עדכונים ותיקונים יופיעו ב‪ .http://www.limsoup.net/Î‬לתגובות‪,‬‬
‫לתיקונים ובכל עניין אחר‪ ,‬אנא כתבו ל‪.yuvak@gmx.netÎ‬‬
‫סיכומים נוספים בסדרה‪:‬‬
‫אלגברה לינארית ‪1‬‬ ‫חשבון אינפיניטסימלי ‪1‬‬ ‫‪2006–7‬‬
‫אלגברה לינארית ‪2‬‬ ‫חשבון אינפיניטסימלי ‪2‬‬
‫תורת הקבוצות‬
‫מבנים אלגבריים ‪1‬‬ ‫חשבון אינפי’ מתקדם ‪1‬‬ ‫‪2007–8‬‬
‫מבנים אלגבריים ‪2‬‬ ‫חשבון אינפי’ מתקדם ‪2‬‬
‫מבוא לטופולוגיה‬ ‫תורת ההסתברות ‪1‬‬
‫תולדות המתמטיקה‬ ‫תורת המספרים וקריפטו’‬
‫פונקציות מרוכבות‬ ‫לוגיקה של מבנים מת’‬ ‫‪2008–9‬‬
‫תורת המידה‬ ‫משוואות דיפ’ רגילות‬
‫תורת המשחקים ‪1‬‬
‫תוכן עניינים‬

‫‪5‬‬ ‫משחקי סכום אפס ‪. . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪1‬‬


‫‪5‬‬ ‫בשני שחקנים ‪. . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪1.1‬‬
‫‪12‬‬ ‫משחקים לא שיתופיים בצורה אסטרטגית ‪. . . . . . . . . . . . . . . . . .‬‬ ‫‪2‬‬
‫הגדרות ‪12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪2.1‬‬
‫משפט נאש ‪13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪2.2‬‬
‫המקרה הכללי ‪15 . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪2.3‬‬
‫הוכחה אלטרנטיבית ‪16 . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪2.4‬‬
‫‪18‬‬ ‫תורת התועלת ‪. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪3‬‬
‫‪19‬‬ ‫משפט הנישואים היציבים של גייל‪Î‬שאפלי ‪. . . . . . . . . . . . . . . . . .‬‬ ‫‪4‬‬
‫‪20‬‬ ‫בעיות מיקוח ‪. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪5‬‬
‫הגדרה ‪20 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪5.1‬‬
‫פתרון נאש ‪20 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪5.2‬‬
‫הגירסה המוחלקת ‪21 . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪5.3‬‬
‫משחק האיומים של נאש ‪22 . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪5.4‬‬
‫‪24‬‬ ‫משחקים שיתופיים והערך של שאפלי ‪. . . . . . . . . . . . . . . . . . . .‬‬ ‫‪6‬‬
‫הגדרה ‪24 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪6.1‬‬
‫ליבה ‪24 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪6.2‬‬
‫‪26‬‬ ‫משחקים בצורה אקסטנסיבית ‪. . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪7‬‬
‫הגדרה ‪26 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪7.1‬‬
‫צ’ומפ ‪26 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪7.2‬‬
‫הקס ‪27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .‬‬ ‫‪7.3‬‬

‫‪3‬‬
‫משחקי סכום אפס‬ ‫‪1‬‬

‫תורת המשחקי‪ í‬מנסה לנתח מצבי קונפליקט בין גורמים שונים בעלי אינטגרס‪ ,‬בהם כל אחד‬ ‫‪6.11.2008‬‬

‫מהגורמים מקבל החלטה‪ ,‬ומכלול ההחלטות שהתקבלו קובע את התוצאה‪.‬‬


‫לתורת המשחקים חשיבות ויישומים בתחומים רבים‪ ,‬ביניהם כלכלה‪ ,‬מדע המדינה וביולוגיה‪.‬‬
‫במאות ה‪ 18Î‬וה‪ ,19Î‬היו רסיסי תובנות; תורת המשחקים המודרנית התפתחה מסוף שנות ה‪20Î‬‬
‫של המאה ה‪ 20Î‬עם הישגיהם של ג’ון פון‪Î‬נוימן )הגדרת משחק‪ ,‬שיווי משקל‪ ,‬משפט המינימקס(‬
‫וג’ון נאש )שיווי המשקל הקרוי על שמו(‪ .‬תוצאותיו של נאש היוו דחיפה משמעותית לתחום‪ ,‬לצד‬
‫המלחמה הקרה שהובילה להשקעה אמריקנית במחקר‪.‬‬

‫משחקי סכום אפס‬ ‫‪1‬‬

‫בשני שחקנים‬ ‫‪1.1‬‬

‫באסטרטגיות טהורות‬ ‫‪1.1.1‬‬

‫משחק הוא מודל למצב קונפליקט בין שני גורמים בעלי אינטרס )להלן‪" :‬שחקני‪ .("í‬לכל אחד‬
‫מהשחקנים‪ ,‬יש מספר פעולות שהוא יכול לבצע )להלן‪" :‬אסטרטגיות"(‪ .‬כל שחקן בוחר אסטרטגיה‬
‫מבין אוסף נתון )על‪Î‬פי רוב סופי( של אסטרטגיות‪ .‬הבחירה מתבצעת בו‪Î‬זמנית‪ .‬בהינתן בחירת‬
‫אסטרטגיות‪ ,‬תוצאת המשחק היא זוג מדדים לשביעות הרצון של שני השחקנים כתוצאה מבחירת‬
‫האסטרטגיות‪ .‬שביעות רצון זו נמדדת כמספר ממשי )להלן‪" :‬תועלת"‪ ,utility ,‬או "תשלו‪,"í‬‬
‫‪.(payoff‬‬
‫משחק סכו‪ í‬אפס הוא משחק שבו האינטרסים של שני השחקנים מנוגדים באופן מקסימלי;‬
‫‪1‬‬
‫פורמלית‪ ,‬התועלת של שחקן ‪ 2‬היא מינוס התועלת של שחקן ‪.1‬‬
‫משחק סכום אפס בשני שחקנים‬ ‫הגדרה‪ .‬משחק סכו‪ í‬אפס בשני שחקני‪) í‬באסטרטגיות טהורות( הוא אוסף } ‪Σ1 = {1, . . . , s1‬‬
‫של אסטרטגיות שחקן ‪ ,1‬אוסף } ‪ Σ2 = {1, . . . , s2‬של אסטרטגיות שחקן ‪ ,2‬וזוג פונקציות תועלת‬
‫‪ u1 , u2 : Σ1 × Σ2 → R‬כאשר ‪ ui‬פונקציית התועלת של שחקן ‪ i‬ומתקיים ‪.u2 ≡ −u1‬‬

‫בדרך כלל‪ ,‬נתאר רק את ‪ .u1‬נוכל לתאר את התשלומים במטריצה‪ ,‬כאשר השורות מתארות‬
‫את בחירת האסטרטגיה של שחקן ‪ ,1‬והעמודות מתארות את בחירת האסטרטגיה של שחקן ‪.2‬‬
‫שליטה‬ ‫הגדרה‪ .‬אסטרטגיה ‪ a‬של שחקן ‪ 1‬שולטת חזק על אסטרטגיה ‪ b‬אם )‪ u1 (a, j) > u1 (b, j‬לכל‬
‫אסטרטגיה ‪ j‬של שחקן ‪) .2‬כנ"ל‪ ,‬באופן אנלוגי‪ ,‬לשחקן ‪ ;2‬שליטה חלשה מוגדרת עם אי‪Î‬שוויון‬
‫חלש‪(.‬‬

‫רמת ביטחון מקסימלית‬ ‫הגדרה‪ .‬אסטרטגיה ‪ i0‬של שחקן ‪ 1‬היא אסטרטגיית רמת ביטחו‪ ï‬מקסימלית אם לכל אסטרטגיה‬
‫‪ i‬של שחקן ‪ 1‬מתקיים ‪) minj ai0 ,j ≥ minj ai,j‬כלומר ‪ ,(minj ai0 ,j = maxi minj ai,j‬כאשר‬
‫‪ ai,j‬התשלום בבחירת זוג אסטרטגיות )‪.(i, j‬‬

‫‪1‬הגדרה זו שרירותית‪ ,‬כמובן‪ ,‬ובאותה מידה ניתן להגדיר "משחק סכום עשר"‪.‬‬

‫‪5‬‬
‫משחקי סכום אפס‬ ‫‪1‬‬ ‫בשני שחקנים‬ ‫‪1.1‬‬

‫באופן אנלוגי‪ ,‬אסטרטגיה ‪ j0‬של שחקן ‪ 2‬היא אסטרטגיית רמת ביטחו‪ ï‬מקסימלית אם לכל‬
‫אסטרטגיה ‪ j‬מתקיים ‪) maxi ai,j0 ≤ maxi ai,j‬כלומר ‪.(maxi ai,j0 = minj maxi ai,j‬‬

‫למה ‪ :1‬בכל מטריצה ) ‪ (ai,j‬מתקיים ‪.A = minj maxi ai,j ≥ maxi minj ai,j = B‬‬
‫הוכחה )‪ A .(1‬הוא רמת הביטחון המקסימלית של שחקן ‪ 2‬ו‪ BÎ‬הוא רמת הביטחון המקסימלית‬
‫של שחקן ‪ .1‬אז ‪ 2‬לא ישלם יותר מ‪ AÎ‬ו‪ 1Î‬לא יקבל יותר מ‪ ,BÎ‬לכן ברור ש‪.A ≥ BÎ‬‬

‫הוכחה )‪ .(2‬לכל שורה ‪ i‬במטריצה‪ ,‬מתקיים לכל ‪ j‬ש‪ .ai,j ≥ minj 0 ai,j 0 Î‬לכן גם לכל ‪ i‬ו‪,jÎ‬‬
‫‪ .maxi0 ai0 ,j ≥ ai,j ≥ minj 0 ai,j 0‬זה נכון לכל ‪ ,i‬לכן ‪ .maxi0 ai0 ,j ≥ maxi minj 0 ai,j 0‬זה‬
‫נכון לכל ‪ ,j‬לכן ‪.minj 0 maxi0 ai0 ,j 0 ≥ maxi minj 0 ai,j 0‬‬

‫‪13.11.2008‬‬ ‫הגדרה‪ .‬זוג אסטרטגיות ) ‪ (i0 , j0‬הוא שיווי משקל )באסטרטגיות טהורות( אם מתקיים שלכל‬ ‫שיווי משקל‬
‫‪2‬‬
‫אסטרטגיה ‪ j‬של שחקן ‪ ,ai0 ,j0 ≤ ai0 ,j ,2‬ולכל אסטרטגיה ‪ i‬של שחקן ‪.ai0 ,j0 ≥ ai,j0 ,1‬‬

‫משפט ‪ :2‬קיים למשחק שיווי משקל אם ורק אם מתקיים ‪,maxi minj ai,j = minj maxi ai,j‬‬
‫ובמקרה זה‪ ,‬אוסף שיוויי המשקל הוא אוסף זוגות האסטרטגיות ) ‪ (i0 , j0‬כך ש‪ i0 Î‬היא אסטרטגיית‬
‫רמת הביטחון המקסימלית של שחקן ‪ 1‬ו‪ j0 Î‬היא אסטרטגיית רמת הביטחון המקסימלית של שחקן‬
‫‪ .2‬לכל זוג כזה מתקיים ‪ .ai0 ,j0 = maxi minj ai,j‬מספר זה נקרא ער‪ ê‬המשחק‪.‬‬ ‫ערך משחק‬

‫דוגמה‪ .‬משחקים פשוטים ללא שיווי משקל‪:‬‬

‫אבן‬ ‫נייר‬ ‫מספריים‬

‫אבן‬ ‫‪0‬‬ ‫‪−1‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪0‬‬


‫אבן‪ ,‬נייר ומספריים –‬ ‫זוג או פרט –‬
‫נייר‬ ‫‪1‬‬ ‫‪0‬‬ ‫‪−1‬‬ ‫‪0‬‬ ‫‪1‬‬
‫מספריים‬ ‫‪−1‬‬ ‫‪1‬‬ ‫‪0‬‬

‫הוכחה‪ .‬נניח שמתקיים ‪ v = maxi minj ai,j = minj maxi ai,j‬ויהי ) ‪ (i0 , j0‬זוג אסטרטגיות‬
‫רמת ביטחון מקסימלית של שחקנים ‪ 1,2‬בהתאמה‪ .‬נראה שזהו שיווי משקל‪ :‬מהגדרת אסטרטגיות‬
‫רמת ביטחון מקסימלית‪,‬‬

‫‪ai0 ,j0 ≥ min ai0 ,j = max min ai,j = v = min max ai,j = max ai,j0 ≥ ai0 ,j0‬‬
‫‪j‬‬ ‫‪i‬‬ ‫‪j‬‬ ‫‪j‬‬ ‫‪i‬‬ ‫‪i‬‬
‫‪0‬‬ ‫‪0‬‬
‫אז ‪ .v = ai0 ,j0‬כעת‪ ,‬לכל ‪ j‬מתקיים ‪ ,ai0 ,j 0 ≥ minj ai0 ,j = v‬ובאופן דומה‪ ,‬לכל ‪ i‬מתקיים‬
‫‪) ai0 ,j0 ≤ maxi ai,j0 = v‬כלומר‪ ai0 ,j0 ,‬הכי קטן בשורה שלו והכי גדול בעמודה שלו(; לכן‬
‫) ‪ (i0 , j0‬שיווי משקל‪.‬‬
‫בכיוון השני‪ :‬נניח שמתקיים ‪ .v2 = minj maxi ai,j > maxi minj ai,j = v1‬יהי ) ‪(i0 , j0‬‬
‫זוג אסטרטגיות; נראה שהן אינן שיווי משקל‪ .‬מהגדרת ‪ v1‬ו‪ ,v2 Î‬בכל עמודה של המטריצה קיים‬
‫איבר גדול מ‪ Î‬או שווה ל‪ ,v2 Î‬ובכל שורה של המטריצה קיים איבר קטן מ‪ Î‬או שווה ל‪ .v1 Î‬כעת‪ ,‬אם‬
‫‪ ai0 ,j0 < v2‬אז יש אסטרטגיה ‪ i0‬כך ש‪ ,ai0 ,j0 ≥ v2 > ai0 ,j0 Î‬כלומר לשחקן ‪ 1‬כדאי לסטות‪.‬‬
‫‪2‬כלומר‪ ,‬אם שני השחקנים מכריזים מראש על בחירת אסטרטגיות זו‪ ,‬לאף אחד מהם אין סיבה לשנות את בחירתו‪.‬‬

‫‪6‬‬
‫בשני שחקנים‬ ‫‪1.1‬‬ ‫משחקי סכום אפס‬ ‫‪1‬‬

‫באופן דומה‪ ,‬אם ‪ ,ai0 ,j0 > v1‬אז יש אסטרטגיה ‪ j 0‬כך ש‪ ,ai0 ,j 0 ≤ v1 < ai0 ,j0 Î‬כלומר לשחקן‬
‫‪ 2‬כדאי לסטות‪ .‬לכן ) ‪ (i0 , j0‬איננו שיווי משקל‪.‬‬
‫הראינו שכל זוג אסטרטגיות רמת ביטחון מקסימלית הוא שיווי משקל‪ .‬בכיוון השני‪ ,‬נניח‬
‫ש‪ (i0 , j0 )Î‬זוג אסטרטגיות שלפחות אחת מהן‪ ,‬ובלי הגבלת הכלליות ‪ ,i0‬איננה אסטרטגיית רמת‬
‫ביטחון מקסימלית‪ .‬נסמן ‪ .v = maxi minj aij‬אם ‪ ,ai0 ,j0 < v‬אז לשחקן כדאי לשנות את‬
‫בחירתו לאסטרטגיה ‪ i00‬שהיא אסטרטגיית רמת ביטחון מקסימלית ותבטיח לו תשלום של ‪ .v‬לכן‬
‫) ‪ (i0 , j0‬איננו שיווי משקל‪ .‬מצד שני‪ ,‬אם ‪ ,ai0 ,j0 ≥ v‬מכיוון ש‪ i0 Î‬איננה אסטרטגיית רמת ביטחון‬
‫מקסימלית‪ ,‬קיימת אסטרטגיה ‪ j00‬של שחקן ‪ 2‬כך ש‪ ,ai0 ,j0 ≥ v > ai0 ,j00 Î‬לכן לשחקן ‪ 2‬כדאי‬
‫לשנות את בחירתו‪ ,‬ושוב זה אינו שיווי משקל‪.‬‬

‫באסטרטגיות מעורבות‬ ‫‪1.1.2‬‬

‫בהינתן מטריצת תשלומים ‪ ,A = (aij ) i=1,...,s1‬נרחיב את אוסף האסטרטגיות לכל שחקן על‪Î‬ידי‬
‫‪j=1,...,s2‬‬
‫שנאפשר לשחקנים לבצע הגרלה כדי להחליט איזו פעולה )"אסטרטגיה טהורה"( לבצע‪ .‬כלומר‪,‬‬
‫במשחק המורחב‪ ,‬אוסף האסטרטגיות של שחקן ‪ i‬יהיה ‪ ,Δsi‬כאשר ‪ Δk‬הסימפלקס ה‪k −Î‬‬
‫‪Pk‬‬
‫סימפלקס‬ ‫}‪Δk = {(p1 , p2 , . . . , pk ) : p1 , . . . , pk > 0, i=1 pi = 1‬‬ ‫‪Î1‬מימדי‪,‬‬
‫)}‪ R2 ⊇ Δ2 ,R ⊇ Δ1 = {1‬הישר ‪ x + y = 1‬ברביע הראשון‪ R3 ⊇ Δ3 ,‬חלק המישור‬
‫‪ x + y + z = 1‬ברביע הראשון – משולש‪(.‬‬
‫בדרך כלל‪ ,‬נסמן ב‪ (p1 , . . . , ps1 )Î‬את אסטרטגיית שחקן ‪ 1‬וב‪ (q1 , . . . , qs2 )Î‬את אסטרטגיית‬
‫שחקן ‪.2‬‬
‫נרחיב את הגדרת פונקציית התועלת על‪Î‬ידי שנגדיר‪ ,‬עבור וקטורי עמודות ‪,p = (pi )i=1,...,s1‬‬
‫‪s2‬‬
‫‪s1 X‬‬ ‫‪,q = (qj )j=1,...,s2‬‬
‫‪X‬‬
‫= ‪u1 = −u2‬‬ ‫‪pi qj aij = pt Aq‬‬
‫‪i=1 j=1‬‬
‫‪3‬‬
‫)תוחלת התועלת(‪.‬‬
‫קיבלנו‪ ,‬אם כן‪ ,‬משחק עם רצף של אסטרטגיות‪ .‬המושגים שהגדרנו לגבי משחק עם אסטרטגיות‬
‫טהורות תקפים גם כאן‪.‬‬
‫למה ‪.minq∈Δs2 maxp∈Δs1 pt Aq ≥ maxp∈Δs1 minq∈Δs2 pt Aq :3‬‬
‫הוכחה‪ .‬בדיוק כמו קודם‪) .‬ל‪ maxÎ‬ול‪ minÎ‬יש משמעות כאן‪ ,‬כי פונקציה רציפה מקבלת מינימום‬
‫ומקסימום על קבוצה קומפקטית‪(.‬‬

‫הגדרה‪ .‬אסטרטגיה מעורבת ‪ p0 ∈ Δs1‬תיקרא אסטרטגיית רמת ביטחו‪ ï‬מקסימלית של שחקן ‪1‬‬
‫אם לכל ‪ ,minq pt0 Aq ≥ minq pt Aq ,p ∈ Δs1‬כלומר אם ‪.minq pt0 Aq = maxp minq pt Aq‬‬
‫באופן דומה‪ q0 ∈ Δs2 ,‬תיקרא אסטרטגיית רמת ביטחון מקסימלית של שחקן ‪ 2‬אם מתקיים‬
‫‪.maxp pt Aq0 = minq maxp pt Aq‬‬
‫‪1‬‬ ‫‪1‬‬
‫אלו שני‬ ‫‪2‬‬
‫ו‪ 150Î‬בהסתברות‬ ‫‪2‬‬
‫‪3‬כלל לא ברור שזו ההרחבה הנכונה‪ :‬עבור בני אדם‪ ,‬לקבל ‪ 100‬או לקבל ‪ 50‬בהסתברות‬
‫דברים שונים‪.‬‬

‫‪7‬‬
‫משחקי סכום אפס‬ ‫‪1‬‬ ‫בשני שחקנים‬ ‫‪1.1‬‬

‫תרגיל‪ p0 = (p1 , . . . , ps1 ) :‬היא אסטרטגיית רמת ביטחון מקסימלית אם ≥ ‪minq∈Δs2 pt0 Aq‬‬
‫‪4‬‬
‫‪ minq∈Δs2 pt Aq‬לכל ‪ ,p ∈ Δs1‬וזה קורה אם"ם ‪.min1≤j≤s2 pt0 Aej ≥ min1≤j≤s2 pt Aej‬‬
‫הגדרה‪ .‬זוג אסטרטגיות מעורבות ) ‪ (p0 , q0‬הן שיווי משקל באסטרטגיות מעורבות אם מתקיים‬
‫‪.pt0 Aq0 = maxp pt Aq0 = minq pt0 Aq‬‬

‫משפט ‪ :4‬קיים למשחק שיווי משקל באסטרטגיות מעורבות אם ורק אם = ‪minq maxp pt Aq‬‬
‫‪ ,v = maxp minq pt Aq‬ובמקרה זה‪ ,‬אוסף שיווי המשקל הוא אוסף הזוגות של אסטרטגיות‬
‫שהן אסטרטגיות רמת ביטחון מקסימלית של שחקנים ‪ 1‬ו‪ ,2Î‬בהתאמה‪ .‬עבור כל זוג כזה מתקיים‬
‫‪ .pt0 Aq0 = v‬מספר זה נקרא ער‪ ê‬המשחק‪.‬‬

‫משפט ‪) 5‬המינימקס(‪ .maxp∈Δs1 minq∈Δs2 pt Aq = minq∈Δs2 maxp∈Δs1 pt Aq :‬כלומר‪,‬‬ ‫משפט המינימקס‬

‫לכל משחק סכום אפס בשני שחקנים קיים שיווי משקל באסטרטגיות מעורבות‪.‬‬

‫‪20.11.2008‬‬ ‫הגדרה‪ .‬קבוצה ‪ A ⊆ Rd‬נקראת קמורה אם היא מכילה את הקטע המחבר בין כל שתי נקודות‬
‫בה‪ ,‬כלומר אם לכל ‪ x, y ∈ A‬ולכל ‪ 0 ≤ t ≤ 1‬מתקיים ‪.tx + (1 − t)y ∈ A‬‬
‫‪Pn‬‬
‫הגדרה‪ .‬צירו‪ ó‬קמור של נקודות ‪ x1 , x2 , . . . , xn ∈ Rd‬הוא נקודה מהצורה ‪ , i=1 pi xi‬כאשר‬
‫‪Pn‬‬
‫‪) i=1 pi = 1 ,p1 , . . . , pn ≥ 0‬דהיינו ‪.((p1 , . . . , pn ) ∈ Δn‬‬

‫הגדרה‪ .‬הקמור )‪ (convex hull‬של נקודות ‪ x1 , . . . , xn ∈ Rd‬הוא אוסף הצירופים הקמורים של‬
‫‪Pn‬‬
‫‪ .x1 , . . . , xn‬מסמנים } ‪.conv(x1 , . . . , xn ) = { i=1 pi xi : (p1 , . . . , pn ) ∈ Δn‬‬

‫הגדרה‪ .‬נקודת קיצו‪ ï‬של קבוצה ‪ A ⊆ Rd‬היא נקודה ‪ x ∈ A‬שאינה ניתנת להצגה בצורה = ‪x‬‬
‫‪y+z‬‬
‫עבור ‪.y 6= z ,y, z ∈ A‬‬ ‫‪2‬‬

‫הגדרה‪ .‬סכו‪ í‬מינקובסקי של קבוצות ‪ A, B ⊆ Rd‬הוא הקבוצה ∈ ‪A + B = {a + b : a‬‬


‫}‪.A, b ∈ B‬‬

‫תרגיל‪ :‬חיתוך קבוצות קמורות הוא קבוצה קמורה‪ .‬סכום קבוצות קמורות הוא קבוצה קמורה‪.‬‬
‫∞) ‪ ,xn ∈ A ,(xn‬אם קיים‬ ‫‪d‬‬
‫תזכורת‪ :‬קבוצה ‪ A ⊆ R‬נקראת סגורה אם לכל סדרת נקודות ‪n=1‬‬
‫הגבול ‪ x = limn→∞ xn‬אזי ‪.x ∈ A‬‬
‫קבוצה ‪ A ⊆ Rd‬נקראת קומפקטית אם היא סגורה וחסומה‪ .‬ידוע כי בקבוצה קומפקטית‪,‬‬
‫∞) ‪ (xn‬יש תת‪Î‬סדרה מתכנסת ‪.xnk → x ∈ A‬‬
‫לכל סדרה ‪n=1 ⊆ A‬‬

‫משפט ‪) 6‬ההפרדה לקבוצות קמורות(‪ :‬תהא ‪ ∅ 6= K ⊆ Rn‬קמורה וסגורה כך ש‪ .0 6∈ KÎ‬אזי‬


‫קיים קבוע ‪ c > 0‬ווקטור ‪ x ∈ Rn‬כך שלכל ‪ y ∈ K‬מתקיים ‪.hx, yi > c‬‬
‫‪4‬זה כך כיוון שפונקציה לינארית על קבוצה קמורה וקומפקטית מקבלת מינימום ומקסימום על אחת מנקודות הקיצון‬
‫של הקבוצה‪.‬‬

‫‪8‬‬
‫בשני שחקנים‬ ‫‪1.1‬‬ ‫משחקי סכום אפס‬ ‫‪1‬‬

‫‪1‬‬
‫הוכחה‪ .‬הפונקציה ‪ y 7→ kyk = hy, yi 2‬מקבלת מינימום על הפונקציה המוקרה )‪K ∩ B(0, R‬‬
‫עבור ‪ R‬גדול מספיק‪ 5 .‬לכן היא גם מקבלת מינימום על ‪ K‬עצמה )מחוץ לכדור‪ ,‬הנורמה גדולה מ‪.(RÎ‬‬
‫‪hx,xi‬‬
‫= ‪ .c‬אם‬ ‫‪2‬‬ ‫תהא ‪ x ∈ Rn‬נקודה בה המינימום מתקבל‪ ,‬ונראה שהיא מקיימת את הטענה עם‬
‫‪ ,y ∈ K‬לכל ‪ 0 ≤ t ≤ 1‬מתקיים ‪ ,ty + (1 − t)x ∈ K‬ולכן לפי הגדרת ‪ ,x‬מתקיים‬
‫‪hty + (1 − t)x, ty + (1 − t)xi‬‬ ‫≥‬ ‫‪hx, xi‬‬
‫כלומר‬
‫‪2‬‬ ‫‪2‬‬
‫‪t hy, yi + (1 − t) hx, xi + 2t(1 − t)hx, yi‬‬ ‫≥‬ ‫‪hx, xi‬‬
‫ובמילים אחרות‪,‬‬
‫‪2thy, xi‬‬ ‫) ‪≥ 2thx, xi + O(t2‬‬
‫נחלק ב‪ tÎ‬ונשאיף את ‪ t‬ל‪ .0Î‬נקבל ש‪.hy, xi ≥ hx, xi = 2c > cÎ‬‬

‫כעת נוכל להוכיח את משפט המינימקס‪:‬‬


‫הוכחה‪ .‬נראה שקיים מספר ממשי ‪ v‬ווקטורים ‪ q0 ∈ Δs2 ,p0 ∈ Δs1‬כך שלכל ‪1 ≤ j ≤ s2‬‬
‫‪Ps1‬‬
‫‪) i=1‬דהיינו‪ ,‬שחקן ‪ 1‬יכול להבטיח תשלום ‪ v‬על‪Î‬ידי האסטרטגיה‬ ‫מתקיים ‪pi aij = pt0 Aej ≥ v‬‬
‫‪Ps2‬‬
‫‪ (p0‬ולכל ‪ 1 ≤ i ≤ s1‬מתקיים ‪) j=1 qj aij = eti Aq0 ≤ v‬דהיינו‪ ,‬שחקן ‪ 2‬יכול להבטיח לא‬
‫לשלם יותר מ‪ .(vÎ‬יהיו ‪ a1 , a2 , . . . , as2‬וקטורי העמודות של ‪ .aj = (aij )i=1,...,s1 ,A‬נגדיר‬
‫קבוצה קמורה וסגורה על‪Î‬ידי ‪ – (R+ = [0, ∞)) K = conv(a1 , a2 , . . . , as2 ) + Rs+1‬כלומר‪,‬‬
‫כל הווקטורים ששולטים על איזשהו צירוף קמור של עמודות ‪ .A‬יהי ‪ u‬מספר ממשי‪.‬‬
‫אם ‪ ,(u, . . . , u) ∈ K‬אז הווקטור )‪ (u, . . . , u‬שולט על צירוף קמור של עמודות ‪ ,A‬כלומר‬
‫קיים וקטור ‪ q = qu ∈ Δs2‬כך ש‪) Aq ≤ (u, . . . , u)t Î‬אי‪Î‬שוויון בכל קואורדינטה(‪.‬‬
‫אם ‪ ,(u, . . . , u) 6∈ K‬אז ממשפט ההפרדה לקבוצות קמורות קיים וקטור ‪ xu = x ∈ Rs1‬כך‬
‫‪Ps1‬‬
‫‪ .hy, xi > h(u, . . . , u)t , xi = u i=1‬בפרט‪ ,‬זה אומר ש‪ xi ≥ 0Î‬לכל ‪ ,i‬כי‬ ‫שלכל ‪xi ,y ∈ K‬‬
‫אפשר להשאיף את ‪ yi‬ל‪ ∞Î‬ואם ‪ xi < 0‬היינו מקבלים סתירה‪ .‬כמו כן‪ ,x 6= 0 ,‬לכן ניתן להחליף‬
‫את ‪ x‬בווקטור ‪ p = pu = Ps1x x ∈ Δs1‬שגם עבורו מתקיים = ‪hy, pi > h(u, . . . , u)t , pi‬‬
‫‪Ps1‬‬ ‫‪i=1 i‬‬ ‫‪Ps1‬‬
‫‪. i=1‬‬ ‫‪ .u i=1‬זה נכון לכל ‪ ,y ∈ K‬ובפרט ל‪ .y = aj Î‬כלומר‪pi aij = haj , pi > u ,‬‬ ‫‪pi = u‬‬
‫כעת נגדיר }‪ .v = inf{u : (u, . . . , u) ∈ K‬בפרט‪ (v, . . . , v) ∈ K ,‬כי ‪ K‬קבוצה סגורה‪,‬‬
‫ולכן עבור הווקטור ‪ q = qv‬שהגדרנו קודם מתקיים ‪ ,Aq ≤ (v, . . . , v)t‬כלומר ‪ v‬רמת ביטחון של‬
‫שחקן ‪ 2‬המושגת על‪Î‬ידי האסטרטגיה ‪ .qv‬מהכיוון השני‪ ,‬לכל ‪ n ≥ 1‬הווקטור ) ‪(v − n1 , . . . , v − n1‬‬
‫‪1‬‬
‫‪ v −‬הוא רמת ביטחון של שחקן ‪ 1‬המושגת על‪Î‬ידי האסטרטגיה ‪ pv− n1‬שהוגדרה‬ ‫‪n‬‬ ‫אינו ב‪ ,KÎ‬לכן‬
‫קודם‪ .‬כעת נשאיף את ‪ n‬ל‪ .∞Î‬מכיוון ש‪ Δs1 Î‬קבוצה קומפקטית‪ ,‬קיימת תת‪Î‬סדרה מתכנסת‬
‫‪Ps1‬‬
‫‪ , i=1‬כלומר ‪ v‬רמת ביטחון של שחקן ‪1‬‬ ‫‪ ,pv− n1 → pv ∈ Δs1‬ועבור ‪ pv‬מתקיים ‪pi aij ≥ v‬‬
‫‪k‬‬
‫המושגת על‪Î‬ידי האסטרטגיה ‪.pv‬‬

‫דוגמה‪ .‬במשחק הבא אין שיווי משקל באסטרטגיות טהורות‪:‬‬ ‫‪27.11.2008‬‬

‫‪ B(0, R) = {z : kzk ≤ R}5‬הכדור ברדיוס ‪ R‬סביב ‪.0‬‬

‫‪9‬‬
‫משחקי סכום אפס‬ ‫‪1‬‬ ‫בשני שחקנים‬ ‫‪1.1‬‬

‫‪3‬‬ ‫‪1‬‬
‫‪0‬‬ ‫‪3‬‬
‫נמצא שיווי משקל באסטרטגיות מעורבות‪ .‬שיווי משקל )) ‪ ((p0 , 1 − p0 ), (q0 , 1 − q0‬צריך‬
‫לקיים‬
‫= )) ‪min(3p0 , p0 +3(1−p0‬‬ ‫‪min pt0 Aq‬‬ ‫‪t‬‬
‫))‪= max min p Aq = max min(3p, p+3(1−p‬‬
‫‪q‬‬ ‫‪p‬‬ ‫‪q‬‬ ‫‪0≤p≤1‬‬
‫‪3‬‬
‫= ‪ .p0‬הערך של המשחק הוא‬ ‫‪5‬‬ ‫‪ p0‬הוא הפתרון של המשוואה ‪ ,3p0 = 3 − 2p0‬כלומר‬
‫‪9‬‬
‫= ‪ .v = 3p0 = 3 − 2p0‬באופן דומה‪ q0 ,‬מקיים‬ ‫‪5‬‬

‫))‪max(3q0 +(1−q0 ), 3(1−q0 )) = max pt Aq0 = min max pt Aq = min max(3q+(1−q), 3(1−q‬‬
‫‪p‬‬ ‫‪q‬‬ ‫‪p‬‬ ‫‪0≤q≤1‬‬
‫‪9‬‬ ‫‪2‬‬
‫= ‪.v = 1 + 2q0‬‬ ‫ו‪5 Î‬‬ ‫= ‪,q0‬‬ ‫‪5‬‬ ‫‪ q0‬הוא הפתרון של מהשוואה ‪ ,3 − 3q0 = 1 + 2q0‬כלומר‬
‫‪K = conv{A‬‬ ‫‪}+Rs+1‬עמודות‬ ‫פתרו‪ ï‬אלטרנטיבי‪ :‬בהוכחת משפט המינימקס‪ ,‬הגדרנו קבוצה‬
‫והראינו שערך המשחק הוא }‪ .v = min{u ∈ R : (u, . . . , u) ∈ K‬במקרה שלנו‪ ,‬נקבל‬
‫‪9‬‬ ‫‪5‬‬
‫= ‪.v‬‬ ‫‪5‬‬ ‫= ‪ v‬ולכן‬ ‫‪2‬‬ ‫]גרף[ נחשב את הערך‪− 32 v :‬‬
‫הראינו גם שמכיוון ש‪ ,(v, . . . , v) ∈ KÎ‬הוא ניתן להצגה כ‪ q0 ;Aq0 = (v, . . . , v)t Î‬הוא‬
‫אסטרטגיית רמת הביטחון המקסימלית של שחקן ‪ .2‬לגבי שחקן ‪ ,1‬יש לטעון טיעון גבולי‪.‬‬

‫דוגמה‪ .‬נתבונן במשחק‬

‫‪2‬‬ ‫‪5‬‬ ‫‪−1‬‬


‫‪1‬‬ ‫‪−2‬‬ ‫‪5‬‬
‫נסמן )‪.q = (a, b, c) ,p = (x, 1 − x‬‬
‫)‪f (x0 ) = min(2x0 +(1−x0 ), 5x0 −2(1−x0 ), −x0 +5(1−x0 )) = min pt0 Aq = max min pt Aq = max f (x‬‬
‫‪q‬‬ ‫‪p‬‬ ‫‪q‬‬ ‫‪0≤x<1‬‬
‫‪11‬‬ ‫‪4‬‬
‫= ‪.v = 1 + 7x0‬‬ ‫‪7‬‬ ‫= ‪,x0‬‬ ‫‪7‬‬ ‫‪ x0‬הוא הפתרון של המשוואה ‪ ,1 + x = 5 − 6x‬לכן‬
‫אם שחקן ‪ 2‬משחק )‪ q = (a, b, c‬מול אסטרטגיית רמת הביטחון המקסימלית ‪ p0‬של‬
‫שחקן ‪ ,1‬התשלום שלו יהיה‬
‫‪4 3‬‬ ‫‪4‬‬ ‫‪3‬‬ ‫‪4‬‬ ‫‪3‬‬ ‫‪11‬‬ ‫‪11‬‬
‫= ) · ‪a(2 · + ) + b(5 · − 2 · ) + c(− + 5‬‬ ‫‪a + 2b + b‬‬
‫‪7 7‬‬ ‫‪7‬‬ ‫‪7‬‬ ‫‪7‬‬ ‫‪7‬‬ ‫‪7‬‬ ‫‪7‬‬
‫‪ ,v = 11‬נובע שבאסטרטגיית רמת ביטחון מקסימלית ) ‪q0 = (a0 , b0 , c0‬‬
‫‪7‬‬ ‫<‬ ‫ש‪2Î‬‬ ‫מכיוון‬
‫מתקיים ‪ .b0 = 0‬כדי לקבוע את ) ‪ ,q0 = (a0 , 0, 1 − a0‬נשתמש בעובדה שלשחקן ‪ 1‬לא כדאי‬
‫לשנות את בחירתו במצב זה‪ :‬בפרט‪ ,‬אם ישחק את השורה הראשונה יקבל = ) ‪2a0 − (1 − a0‬‬
‫‪6‬‬ ‫‪11‬‬
‫≤ ‪ ,a0‬ואם ישחק את השורה השנייה‪ ,‬יקבל ‪a0 + 5(1 − a0 ) = 5 −‬‬ ‫‪7‬‬ ‫≤ ‪ ,3a0 − 1‬ולכן‬ ‫‪7‬‬
‫= ‪ .a0‬שיווי המשקל הוא ) ‪,q0 = ( 76 , 0, 17 ) ,p0 = ( 47 , 37‬‬ ‫‪6‬‬
‫‪7‬‬ ‫≥ ‪ 6 .a0‬לכן‬ ‫‪6‬‬
‫‪7‬‬ ‫≤ ‪ ,4a0‬ולכן‬ ‫‪11‬‬
‫‪7‬‬
‫‪11‬‬
‫= ‪.v‬‬ ‫‪7‬‬

‫כפי שראינו‪ ,‬מהוכחת משפט המינימקס מקבלים אלגוריתם לחישוב שיווי משקל‪ .‬זה שקול‬
‫לבעיית תכנון לינארי‪ ,‬שניתן לפתור בזמן פולינומיאלי )שיטת הסימפלקס(‪.‬‬
‫‪6‬זה‪ ,‬כמובן‪ ,‬לא מקרי‪ :‬משפט המינימקס מבטיח זאת‪.‬‬

‫‪10‬‬
‫בשני שחקנים‬ ‫‪1.1‬‬ ‫משחקי סכום אפס‬ ‫‪1‬‬

‫סיכונים‬ ‫‪1.1.3‬‬

‫הגדרה‪ .‬תהא ‪ K ⊆ Rn‬קבוצה קמורה‪ .‬פונקציה ‪ f : K → R‬נקראת פונקציה קמורה אם לכל‬


‫‪ x, y ∈ K‬ומספר ‪ 0 ≤ t ≤ 1‬מתקיים )‪ f .f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y‬נקראת‬
‫פונקציה קעורה אם ‪ −f‬קמורה‪.‬‬

‫משפט ‪ :7‬יהיו ‪ Y ⊆ Rs2 ,X ⊆ Rs1‬קבוצות קומפקטיות קמורות‪ 7 .‬תהא ‪f : X × Y → R‬‬


‫פונקציה רציפה כך שמתקיים )‪ (1‬לכל ‪ ,x0 ∈ X‬הפונקציה )‪ y 7→ f (x0 , y‬קמורה על ‪ (2) ;Y‬לכל‬
‫‪ ,y0 ∈ Y‬הפונקציה ) ‪ x 7→ f (x, y0‬קעורה על ‪ .X‬אז מתקיים = )‪maxx∈X miny∈Y f (x, y‬‬
‫)‪.miny∈Y maxx∈X f (x, y‬‬

‫ניתן לפרש את העובדה שעבור שחקן ‪ 1‬הפונקציה קעורה כאהבת סיכון‪ :‬השחקן יעדיף לבחור‬
‫אסטרטגיה שהיא ממוצע מאשר את ממוצע התשלומים )כי הוא נהנה מההגרלה עצמה ולא רק‬
‫מהתשלום עצמו – ההנאה מגבירה את התועלת(‪ .‬קמירות‪ ,‬באופן דומה‪ ,‬ניתנת לפירוש כשנאת סיכון‪.‬‬
‫ממשפט זה אפשר להסיק את משפט המינימקס‪.‬‬

‫‪7‬במקרה של משחקים‪ ,‬ניקח ‪.Y = Δs2 ,X = Δs1‬‬

‫‪11‬‬
‫משחקים לא שיתופיים בצורה אסטרטגית‬ ‫‪2‬‬

‫משחקים לא שיתופיים בצורה אסטרטגית‬ ‫‪2‬‬

‫הגדרות‬ ‫‪2.1‬‬

‫‪4.12.2008‬‬ ‫הגדרה‪ .‬משחק ‪ n‬שחקני‪ í‬בצורה אסטרטגית עם מספר סופי של אסטרטגיות )טהורות( מורכב‬ ‫משחק בצורה אסטרטגית‬

‫מ‪ (1)Î‬אוסף של ‪ n‬שחקנים }‪ (2) ;[n] = {1, 2, . . . , n‬אוסף סופי של פעולות )אסטרטגיות טהורות(‬
‫‪Qn‬‬
‫לכל שחקן‪ (3) ;Si = [si ] ,‬פונקציית תועלת )תשלום( ‪ ui : i=1 Si → R‬לכל שחקן ]‪.i ∈ [n‬‬
‫אסטרטגיה מעורבת לשחקן ‪ i‬היא וקטור הסתברות ‪ .pi ∈ Δsi‬בהינתן אסטרטגיות מעורבות‬ ‫ההרחבה המעורבת‬

‫‪ ,i = 1, . . . , n ,pi ∈ Δsi‬מרחיבים את פונקציית התשלום על‪Î‬ידי שמגדירים‬


‫‪P‬‬ ‫‪Qn‬‬
‫) ‪ui (p1 , . . . , pn ) = (j1 ,...,jk )∈Qn Sk k=1 pk (jk )ui (j1 , . . . , jn‬‬
‫‪k=1‬‬

‫)תוחלת התשלום לשחקן ‪.(i‬‬

‫דוגמה‪ .‬משחקים על ריבוע היחידה‪ :‬האסטרטגיות לשחקנים ‪ 2,1‬הן ]‪ .[0, 1‬פונקציות התועלת‪:‬‬
‫למשחק‬
‫‬ ‫‪ i (x, y) = Ai xy + Bi x(1‬‬
‫‪ .u‬זה שקול‬ ‫)‪− y) + Ci (1 − x)y + Di (1 − x)(1 − y‬‬
‫‪A1 ,A2 B1 ,B2‬‬ ‫‪A i Bi‬‬
‫‬
‫באסטרטגיות מעורבות עם מטריצות תשלומים ‪) Ui = Ci Di‬מסמנים ‪.( C1 ,C2 D1 ,D2‬‬

‫הגדרה‪ .‬במשחק ‪ n‬שחקנים‪ ,‬אוסף אסטרטגיות מעורבות ‪ p1 , . . . , pn‬ייקרא שיווי משקל נאש‬ ‫שיווי משקל נאש‬

‫‪.ui (p1 , . . . , pn ) = max‬‬ ‫‪p0i ∈Δsi‬‬ ‫) ‪ui (p1 , . . . , pi−1 , p0i , pi+1 , . . . , pn‬‬ ‫אם לכל ‪,1 ≤ i ≤ n‬‬

‫דוגמה‪ .‬דילמת האסירים‪:‬‬

‫‪C‬‬ ‫‪¬C‬‬
‫‪C‬‬ ‫‪1, 1‬‬ ‫‪5, 0‬‬
‫‪¬C‬‬ ‫‪0, 5‬‬ ‫‪4, 4‬‬

‫)‪ – C‬האסיר מודה(‪ .‬לכל אחד משני אסירים נאמר שאם הוא וחברו יודו‪ ,‬עונשם יופחת‪ ,‬ואם רק‬
‫הוא יודה‪ ,‬יקבל הטבות‪ .‬במקרה זה שיווי המשקל היחיד הוא כאשר שניהם מודים‪ ,‬אף שאם‬
‫שניהם מודים‪ ,‬מצבם טוב יותר כי לא יורשעו‪ .‬מאפיה היתה דואגת לשנות את המצב )"אנחנו‬
‫נדאג שהתועלת שלך תקטן אם תלשין!"(‪.‬‬

‫דוגמה‪ .‬מלחמת המינים‪:‬‬

‫‪Θ‬‬ ‫‪W‬‬
‫‪Θ‬‬ ‫‪1, 2‬‬ ‫‪−1, −1‬‬
‫‪W‬‬ ‫‪−1, −1‬‬ ‫‪2, 1‬‬

‫הבעל והאישה מפיקים תועלת מללכת יחד לבילוי בתיאטרון )‪ (Θ‬או בתחרות איגרוף ) ‪ ,(W‬אבל‬
‫מחליטים באופן בלתי תלוי לאן ללכת‪ .‬במקרה זה‪ ,‬שיוויי המשקל הם )‪ (Θ, Θ‬ו‪) (W, W )Î‬וכן‬
‫)) ‪.((( 12 , 12 ), ( 12 , 12‬‬

‫‪12‬‬
‫משפט נאש‬ ‫‪2.2‬‬ ‫משחקים לא שיתופיים בצורה אסטרטגית‬ ‫‪2‬‬

‫משפט נאש‬ ‫‪2.2‬‬

‫משפט ‪) 8‬נאש(‪ :‬בכל משחק ‪ n‬שחקנים קיים שיווי משקל נאש באסטרטגיות מעורבות‪.‬‬

‫משפט ‪) 9‬נקודת השבת של בראוור(‪ :‬יהי }‪ Dn = {x ∈ Rn : kxk ≤ 1‬כדור היחידה ב‪.Rn Î‬‬
‫‪8‬‬
‫לכל פונקציה רציפה ‪ f : Dn → Dn‬יש נקודת שבת‪ ,‬כלומר ‪ x ∈ Dn‬כך ש‪.f (x) = xÎ‬‬

‫עבור ‪ ,n = 1‬הטענה היא שלכל פונקציה רציפה ]‪ f : [0, 1] → [0, 1‬יש נקודת שבת‪ ,‬וזה‬
‫נכון כי הפונקציה ‪ g(x) = f (x) − x‬מקיימת ‪ g(1) ≤ 0 ,g(0) ≥ 0‬ולכן קיים ]‪ x ∈ [0, 1‬כך‬
‫ש‪) g(x) = 0Î‬משפט ערך הביניים(‪.‬‬
‫‪2‬‬
‫עבור ‪ ,n = 2‬ניתן הוכחה קומבינטורית של שפרנר‪ .‬נשים לב שבמקום לעבוד עם ‪ ,D‬ניתן‬
‫להוכיח לכל מרחב הומיאומורפי )"שקול טופולוגית"( ל‪ ,D2 Î‬כלומר‪ ,‬בפרט‪ ,‬קבוצה ‪ A ⊆ Rn‬כך‬
‫שקיימת פונקציה רציפה‪ ,‬חד‪Î‬חד ערכית ועל ‪ h : D2 → A‬כך שגם ‪ h−1 : A → D2‬רציפה‪ .‬אנו‬
‫נוכיח זאת עבור ‪ ;A = Δ3‬קל לראות שהוא הומיאומורפי ל‪.D2 Î‬‬
‫למה ‪) 10‬שפרנר(‪ :‬בהינתן טריאנגולציה ‪ 9‬של המשולש למשולשים יותר קטנים ובהינתן צביעה של‬
‫קדקודי הטריאנגולציה בצבעים }‪ {1, 2, 3‬המקיימת )‪ (1‬אם מסמנים את קדקודי המשולש הגדול‬
‫ב‪ ,v1 , v2 , v3 Î‬אז עבור ‪ ,i = 1, 2, 3‬הקדקוד ‪ vi‬צבוע בצבע ‪ (2) ;i‬הקדקודים על הצלע של המשולש‬
‫הגדול בין ‪ vi‬ל‪ vj Î‬צבועים בצבעים }‪ .{i, j‬אז קיים משולש קטן ’צבעוני’‪ ,‬כלומר – קדקודיו צבועים‬
‫בשלושת הצבעים }‪.{1, 2, 3‬‬
‫הוכחה‪ .‬נסמן ב‪ kÎ‬את מספר המשולשים הקטנים הצבעוניים‪ .‬נוכיח ש‪ kÎ‬אי‪Î‬זוגי‪ ,‬ובפרט אינו ‪.0‬‬
‫נסתכל באוסף המשולשים הקטנים ‪ T1 , T2 , . . . , Tn‬הכולל גם את "המשולש באינסוף" )המשלים‬
‫של המשולש הגדול כאשר פורשים אותו על ספירה; קדקודיו הם ‪.(v1 , v2 , v3‬‬
‫נגיד ששני משולשים מתוך אוסף זה חברי‪ í‬אם הם שכנים )יש להם צלע – במקרה של המשולש‬
‫באינסוף‪ ,‬חלק מצלע – משותפת( וקצוות הצלע צבועים בצבעים }‪.{1, 2‬‬

‫משולשים חברים מחוברים בקשת‪.‬‬

‫‪8‬המשפט שקול לטענה שלא ניתן לכווץ את הספירה }‪ S n−1 = {x ∈ Rn : kxk = 1‬באופן רציף בלי לעבור דרך‬
‫הראשית‪ ,‬כפי שראינו במבוא לטופולוגיה‪.‬‬
‫‪9‬טריאנגולציה‪ :‬הצגה של המשולש כאיחוד משולשים קטנים שכל שניים מהם זרים או נחתכים בצלע משותפת לשניהם‬
‫או בקדקוד משותף‪.‬‬

‫‪13‬‬
‫משחקים לא שיתופיים בצורה אסטרטגית‬ ‫‪2‬‬ ‫משפט נאש‬ ‫‪2.2‬‬

‫למשולשים צבעוניים )מלבד המשולש באינסוף( יש חבר אחד; למשולשים שקדקודיהם צבועים‬
‫בצבעים }‪ {1, 2‬שני חברים; לכל שאר המשולשים‪ ,‬פרט‪ ,‬אולי‪ ,‬למשולש באינסוף‪ ,‬אין חברים‪ .‬בפרט‪,‬‬
‫מבין המשולשים הקטנים‪ ,‬רק למשולשים הצבעוניים יש מספר אי‪Î‬זוגי של חברים‪ .‬לסיום‪ ,‬נשים לב‬
‫כי‬
‫‪ .1‬למשולש באינסוף יש מספר אי‪Î‬זוגי של חברים‪ ,‬כי לאורך הצלע בין ‪ v1‬ל‪ v2 Î‬הצבע מתחלף‬
‫‪ 1 ↔ 2‬מספר אי‪Î‬זוגי של פעמים‪ ,‬וכל פעם כזו נותנת חבר;‬
‫‪ .2‬סכום מספר החברים על כל המשולשים ‪ T1 , . . . , Tn‬הוא זוגי‪ ,‬כי כל יחס חברות נספר‬
‫פעמיים‪.‬‬

‫לפיכך‪ – k ,‬מספר המשולשים הקטנים הצבעוניים – אי‪Î‬זוגי‪.‬‬

‫‪11.12.2008‬‬ ‫כעת נוכל להוכיח את משפט נקודת השבת של בראוור‪:‬‬


‫∞) ‪(Tn‬‬
‫הוכחה )‪ .(n = 2‬נתונה פונקציה רציפה ‪ .f : Δ3 → Δ3‬ניקח סדרת טריאנגולציות ‪n=1‬‬
‫של ‪ Δ3‬כך ש‪ ,δ(Tn ) → 0Î‬כאשר ) ‪ δ(T‬הוא קוטר ‪ 10‬המשולש הגדול ביותר בטריאנגולציה‪) .‬הוכחת‬
‫קיום סדרה כזו – תרגיל‪ (.‬נניח בשלילה שאין נקודת שבת‪ .‬לכל טריאנגולציה ‪ Tn‬נגדיר צביעה של‬
‫הקדקודים בשלושה צבעים באופן הבא‪) λ(v) = min{1 ≤ i ≤ 3 : f (v)i < vi } :‬קיים ‪ i‬כזה‬
‫כי ‪ v1 + v2 + v3 = 1‬ו‪ ,f (v)1 + f (v)2 + f (v)3 = 1Î‬ואם לא קיים כזה – קיבלנו נקודת שבת(‪.‬‬
‫הצביעה מקיימת את הנחות הלמה של שפרנר‪ :‬לפי הגדרה‪ .λ(ej ) = j ,‬אם ‪ v‬על הצלע המנוגדת‬
‫ל‪ ,ej Î‬אזי ‪ vj = 0‬ולכן ‪.λ(v) 6= j‬‬
‫‪n,i‬‬ ‫‪n,1‬‬ ‫‪n,2‬‬ ‫‪n,3‬‬
‫‪ .λ(v‬מקומפקטיות‬ ‫‪ tn = (v‬כך ש‪) = iÎ‬‬ ‫‪,v‬‬ ‫‪,v‬‬ ‫לכן לכל ‪ n‬קיים משולש צבעוני )‬
‫‪nk ,2‬‬ ‫‪nk ,1‬‬
‫‪v‬‬ ‫‪ .v‬היות ש‪ ,δ(Tn ) → 0Î‬גם ‪→ u‬‬ ‫‪ ,Δ3‬קיימת תת‪Î‬סדרה מתכנסת ‪→ u ∈ Δ3‬‬
‫ו‪.v nk ,3 → uÎ‬‬
‫‪ ,f (v‬ומכאן גם ‪ .f (u)1 ≤ u1‬באופן דומה‪f (u)2 ≤ u2 ,‬‬ ‫‪nk ,1‬‬
‫< ‪)1‬‬ ‫‪v1nk ,1‬‬ ‫‪ ,λ(v‬לכן‬ ‫‪nk ,1‬‬
‫‪)=1‬‬
‫ו‪ .f (u)3 ≤ u3 Î‬לכן בהכרח ‪.f (u) = u‬‬

‫כעת נוכל להוכיח את משפט נאש‪:‬‬


‫הוכחה‪ .‬נניח חיזוק קל של משפט בראוור‪ :‬אם ‪ K ⊆ Rn‬קמורה וקומפקטית ו‪f : K → KÎ‬‬
‫פונקציה רציפה‪ ,‬אזי יש ל‪ f Î‬נקודת שבת‪.‬‬
‫נתון משחק ב‪ nÎ‬שחקנים‪ :‬לשחקן ‪ i‬קבוצת אסטרטגיות טהורות } ‪ .Si = {1, 2, . . . , si‬נבנה‬
‫‪Qn‬‬
‫פונקציה ‪ K = i=1 Δsi ,f : K → K‬שנקודת שבת שלה היא שיווי משקל נאש‪.‬‬
‫עבור וקטור אסטרטגיות מעורבות ) ‪,(pi = (pi (1), . . . , pi (si )) ∈ Δsi ) p = (p1 , . . . , pn‬‬
‫נסמן ב‪ p−i Î‬את הווקטור ‪ p‬ללא הרכיב ‪ .pi‬נגדיר פונקציית עזר‬
‫)) ‪gain i (p, a) = max(0, ui (ea , p−i ) − ui (pi , p−i‬‬
‫ל‪ – a ∈ Si ,p ∈ K ,1 ≤ i ≤ nÎ‬מודדת את הרווח האפשרי לשחקן ‪ i‬מהחלפת האסטרטגיה מ‪pi Î‬‬
‫‪Qn‬‬
‫ל‪ .aÎ‬נגדיר פונקציה ‪ g = (g1 , . . . , gn ) : K → i=1 Rsi‬על‪Î‬ידי‬
‫‪10‬קוטר קבוצה‪ :‬המרחק המקסימלי בין נקודות בה‪.‬‬

‫‪14‬‬
‫המקרה הכללי‬ ‫‪2.3‬‬ ‫משחקים לא שיתופיים בצורה אסטרטגית‬ ‫‪2‬‬

‫‪(gi (p))(a) = pi (a) + gain i (p, a) ≥ 0‬‬

‫ל‪ .a ∈ Si ,1 ≤ i ≤ nÎ‬מקבלים ש‪Î‬‬


‫‪P‬‬ ‫‪P‬‬ ‫‪P‬‬
‫)‪a∈Si (gi (p))(a‬‬ ‫=‬ ‫‪a∈Si (pi (a) + gain i (p, a)) = 1 +‬‬ ‫‪a∈Si gain i (p, a) ≥ 1 > 0‬‬

‫= )‪.(fi (p))(a‬‬ ‫)‪P (gi (p))(a‬‬ ‫כעת נגדיר ‪ f = (f1 , . . . , fn ) : K → K‬על‪Î‬ידי‬


‫)‪b∈S (gi (p))(b‬‬
‫‪i‬‬
‫מההגדרה‪ f ,‬היא פונקציה רציפה מהקבוצה הקמורה והקומפקטית ‪ K‬לעצמה‪ ,‬לכן יש לה‬
‫נקודת שבת ) ‪ .p∗ = (p∗1 , . . . , p∗n‬נראה ש‪ p∗ Î‬שיווי משקל נאש‪ :‬לשם כך‪ ,‬מספיק להראות כי‬
‫‪ gain i (p∗ , a) = 0‬לכל ‪.a ∈ Si ,1 ≤ i ≤ n‬‬
‫נניח בשלילה שזה לא מתקיים‪ ,‬כלומר קיים ‪ 1 ≤ i ≤ n‬ו‪ a ∈ Si Î‬כך ש‪.gain i (p∗ , a) > 0Î‬‬
‫נגדיר ‪ .C = b∈Si gi (p∗ , b) = 1+ b∈Si gain (p∗ , b) > 1‬ידוע כי ∗‪ ,f (p∗ ) = p‬כלומר‬
‫‪P‬‬ ‫‪P‬‬
‫∗‬ ‫∗‪p‬‬ ‫∗‬
‫)·‪j +gain j (p ,‬‬
‫= ‪ .p∗j‬אז‬ ‫)‪P (gj (p ))(a‬‬
‫∗‬ ‫=‬ ‫‪ fj (p∗ ) = p∗j‬לכל ‪ .1 ≤ j ≤ n‬במילים אחרות‪,‬‬
‫)‪b∈S (gj (p ))(b‬‬
‫‪j‬‬
‫‪C‬‬

‫‪.p∗j = C−1‬‬ ‫‪1‬‬


‫)· ‪ Cp∗j = p∗j + gain j (p∗ ,‬ומכאן )· ‪gain j (p∗ ,‬‬
‫אז‬ ‫בפרט‪ ,‬לכל ‪ p∗j (a) > 0 ,a ∈ Si‬אם"ם ‪ .gain i (p∗ , a) > 0‬אבל‬
‫∗‬
‫) ‪ui (p∗i , p∗−i‬‬ ‫∗‬ ‫∗‬
‫‪P‬‬
‫= ) ‪ui (p‬‬ ‫=‬ ‫) ‪b∈S pi (b)ui (eb , p−i‬‬
‫‪P i‬‬ ‫∗‬ ‫∗‬
‫=‬ ‫) ‪b∈Si pi (b)ui (eb , p−i‬‬
‫∗‪p‬‬
‫‪i (b)>0‬‬

‫) ‪p∗i (b)ui (eb , p∗−i‬‬


‫‪P‬‬
‫=‬ ‫‪b∈Si‬‬
‫‪gain i (p∗ ,b)>0‬‬
‫))‪p∗i (b)(ui (p∗i , p∗−i ) + gain i (p∗ , b‬‬
‫‪P‬‬
‫=‬ ‫‪b∈Si‬‬
‫∗‬
‫‪gain i (p ,b)>0‬‬
‫]משהו חיובי[ ‪= ui (p∗i , p∗−i ) +‬‬
‫) ‪> ui (p∗i‬‬
‫בסתירה‪.‬‬

‫המקרה הכללי‬ ‫‪2.3‬‬

‫ניתן להכליל את ההוכחה למקרה של מימד כללי‪.‬‬ ‫‪25.12.2008‬‬


‫‪Pk‬‬ ‫‪n‬‬
‫‪i=1‬‬ ‫הגדרה‪ .‬צירו‪ ó‬אפיני של נקודות ‪ x1 , x2 , . . . , xk ∈ R‬הוא צירוף לינארי מהצורה ‪ai xi‬‬
‫‪11‬‬
‫‪Pk‬‬
‫כך ש‪. i=1 ai = 1Î‬‬
‫נקודות ‪ x1 , x2 , . . . , xk ∈ Rn‬נקראות בלתי‪Î‬תלויות אפינית אם אין אחת מה‪ xi Î‬שניתנת‬
‫להצגה כצירוף אפיני של האחרות‪ ,‬או באופן שקול‪ ,‬אם ‪ x2 − x1 , . . . , xk − x1‬בלתי‪Î‬תלויות‬
‫‪Pk‬‬ ‫‪Pk‬‬
‫לינארית‪ ,‬או באופן שקול‪ ,‬אם כאשר ‪ i=1 ai xi = 0‬וגם ‪ i=1 ai = 0‬אז נובע ש‪ ai = 0Î‬לכל‬
‫‪.1 ≤ i ≤ k‬‬
‫‪Pk‬‬
‫תת‪Î‬מרחב אפיני הוא אוסף כל הווקטורים מהצורה }‪.{ i=1 ai xi + v : a1 , . . . , ak ∈ R‬‬

‫הגדרה‪ .‬סימפלקס ‪Îk‬מימדי ב‪ Rn Î‬הוא הקמור של ‪ k + 1‬נקודות בלתי‪Î‬תלויות אפינית ב‪.Rn Î‬‬
‫הסימפלקס הסטנדרטי ב‪ Rn Î‬הוא הקמור של וקטורי הבסיס הסטנדרטי; סימנו אותו ‪.Δn‬‬
‫‪11‬בצירוף קמור‪ ,‬דורשים גם ‪.ai ≥ 0‬‬

‫‪15‬‬
‫משחקים לא שיתופיים בצורה אסטרטגית‬ ‫‪2‬‬ ‫הוכחה אלטרנטיבית‬ ‫‪2.4‬‬

‫פאה ‪Îm‬מימדית של סימפלקס ‪Îk‬מימדי היא הקמור של ‪ m + 1‬מקדקודיו )זהו סימפלקס‬


‫ממימד ‪.(m‬‬
‫טריאנגולציה של סימפלקס ‪În‬מימדי היא הצגה שלו כאיחוד של סימפלקסים ‪În‬מימדיים כך‬
‫שהחיתוך של כל שניים הוא ריק או שהוא אחת הפאות ממימד יותר נמוך של שניהם‪.‬‬

‫למה ‪) 11‬שפרנר‪ ,‬מימד כללי(‪ :‬בהינתן טריאנגולציה של סימפלקס ‪În‬מימדי ‪ Δ‬וצביעת שפרנר של‬
‫קדקודי הטריאנגולציה בצבעים }‪ – {1, 2, . . . , n + 1‬כלומר‪ ,‬לקדקודים ‪ x1 , . . . , xn+1‬של ‪Δ‬‬
‫מתקיים שהצבע של ‪ xi‬הוא ‪ i‬לכל ‪ ,i‬ולכל פאה ‪Îm‬מימדית של ‪ Δ‬שקדקודיה ‪ xi1 , . . . , xim+1‬כל‬
‫הקדקודים על הפאה צבועים בצבעים } ‪ – {i1 , i2 , . . . , im+1‬אז קיים סימפלקס בטריאנגולציה‬
‫שקדקודיו צבועים בכל הצבעים }‪’) {1, 2, . . . , n + 1‬צבעוני’(‪.‬‬
‫הוכחה‪ .‬למעשה‪ ,‬נוכיח באינדוקציה על המימד שמספר הסימפלקסים הצבעוניים הוא אי‪Î‬זוגי‪.‬‬
‫מגדירים יחס חברות בין סימפלקסי הטריאנגולציה והסימפלקס באינסוף‪ a :‬חבר של ‪ b‬אם יש‬
‫להם פאה משותפת ממימד ‪ n − 1‬שקדקודיה צבועים בכל הצבעים }‪ .{1, 2, . . . , n‬לסימפלקס‬
‫באינסוף יש מספר אי‪Î‬זוגי של חברים‪ ,‬לפי הנחת האינדוקציה; לסימפלקס צבעוני יש מספר אי‪Î‬זוגי‬
‫של חברים )תרגיל(; לאחרים יש מספר זוגי של חברים‪ .‬סך כל מספר יחסי החברות זוגי‪ ,‬כי זה יחס‬
‫סימטרי‪ .‬לכן מספר הסימפלקסים הצבעוניים אי‪Î‬זוגי‪.‬‬

‫משפט ‪) 12‬נקודת השבת של בראוור‪ ,‬מחוזק(‪ :‬אם ‪ K ⊆ Rn‬קמורה וקומפקטית‪ ,‬לכל פונקציה‬
‫‪ f : K → K‬רציפה יש נקודת שבת‪.‬‬
‫הוכחה‪ .‬ניעזר בלמה‪:‬‬
‫למה ‪ :1.12‬אם ‪ C ⊆ Rn‬קבוצה קמורה וקומפקטית אז קיימת פונקציה רציפה → ‪y : Rn‬‬
‫‪ C‬המתאימה לכל ‪ x ∈ Rn‬את הנקודה )היחידה( הקרובה לה ביותר ב‪ ,CÎ‬כלומר מתקיים‬
‫‪.kx − y(x)k = inf z∈C kx − zk‬‬

‫יהי ‪ B = tDn‬כדור ברדיוס גדול כך ש‪ .K ⊆ BÎ‬נגדיר פונקציה ‪ g : B → B‬על‪Î‬ידי‬


‫))‪ .g(x) = f (y(x‬אז ‪ g‬רציפה‪ ,‬לכן לפי בראוור יש לה נקודת שבת ‪ x ∈ B‬כך ש‪ .g(x) = xÎ‬אבל‬
‫‪ ,x = g(x) ∈ K‬לכן )‪ ,x = g(x) = f (y(x)) = f (x‬כלומר ‪ x‬נקודת שבת של ‪.f‬‬

‫הוכחה אלטרנטיבית‬ ‫‪2.4‬‬

‫נתון משחק ב‪ nÎ‬שחקנים‪ .‬רוצים למצוא שיווי משקל‪.‬‬


‫הגדרה‪ .‬בהינתן ‪ 1 ≤ i ≤ n‬ואסטרטגיות מעורבות ‪ ,j 6= i ,pj ∈ Δsj‬אסטרטגיה ‪ pi‬תיקרא‬
‫תגובה טובה ביותר )‪ (best response‬אם‬

‫) ‪ui (p1 , . . . , pn ) = max ui (p1 , . . . , pi−1 , q, pi+1 , . . . , pn‬‬


‫‪q∈Δsi‬‬

‫שיווי משקל נאש‪ :‬וקטור ) ‪ (p1 , . . . , pn‬כך שכל ‪ pi‬הוא תגובה טובה ביותר לאחרים‪.‬‬

‫‪16‬‬
‫הוכחה אלטרנטיבית‬ ‫‪2.4‬‬ ‫משחקים לא שיתופיים בצורה אסטרטגית‬ ‫‪2‬‬

‫‪Qn‬‬ ‫‪Qn‬‬
‫‪ BR :‬על‪Î‬ידי‬ ‫‪i=1‬‬ ‫→ ‪Δ si‬‬ ‫‪i=1‬‬ ‫נגדיר "פונקציה" ‪Δsi‬‬

‫‪BR(p1 , . . . , pn ) = (BRi (p1 , . . . , pi−1 , pi+1 , . . . , pn ))1≤i≤n‬‬

‫נקודת שבת של ‪ BR‬היא שיווי משקל נאש‪ .‬אבל זו לא באמת פונקציה‪ ,‬כי יש הרבה תגובות טובות‬
‫ביותר‪ ,‬ומה עם רציפות?‬
‫הגדרה‪ .‬פונקציה קבוצתית )‪ (set-valued function‬מקבוצה ‪ A‬ל‪ BÎ‬היא העתקה המתאימה לכל‬
‫‪ a ∈ A‬תת‪Î‬קבוצה ‪ .f (a) ⊆ B‬באופן שקול‪ ,‬זהו יחס חלקי ל‪ .A × BÎ‬הגרף של פונקציה קבוצתית‬
‫‪12‬‬
‫הוא האוסף })‪.{(x, y) : y ∈ f (x‬‬

‫משפט ‪) 13‬נקודת השבת של קקוטאני(‪ :‬אם ‪ K ⊆ Rn‬קבוצה קמורה‪ ,‬קומפקטית ולא ריקה‬
‫ו‪ f : K → P (K)Î‬פונקציה קבוצתית המקיימת )‪ (1‬לכל ‪ f (x) ,x‬לא ריקה; )‪ f (x) (2‬קמורה‬
‫לכל ‪ (3) ;x‬הגרף של ‪ f‬הוא קבוצה סגורה‪ .‬אז ל‪ f Î‬יש נקודת שבת מוכללת‪ ,‬כלומר ‪ x ∈ K‬כך‬
‫ש‪.x ∈ f (x)Î‬‬

‫דוגמה )מימד ‪ .(1‬גרף )‪ (1‬מקיים את התנאים‪ ,‬ואכן מתקבלת נקודת שבת; בגרף )‪ ,(2‬יש ‪ x‬כך‬
‫ש‪ f (x)Î‬אינה קמורה; גרף )‪ (3‬אינו סגור‪:‬‬

‫)‪(3‬‬ ‫)‪(2‬‬ ‫)‪(1‬‬

‫אפשר להסיק את משפט קקוטאני ממשפט בראוור )ראה בספר של סולן‪ ,‬משלר וזמיר(‪.‬‬
‫אפשר להוכיח את משפט נאש על‪Î‬ידי משפט קקוטאני‪:‬‬
‫‪Qn‬‬
‫מקיימת את ההנחות‪.‬‬ ‫‪i=1‬‬ ‫הוכחה‪ .‬נראה שהפונקציה הקבוצתית ‪ BR‬מהקבוצה הקמורה ‪Δsi‬‬
‫קל לראות ש‪ BR(x)Î‬קמורה )ממוצע תגובות טובות ביותר הוא גם תגובה טובה ביותר( ולא ריקה‪.‬‬
‫נראה שהגרף סגור‪ .‬נניח שיש סדרה ) ‪ (pn , q n‬של זוגות וקטורי אסטרטגיות‪,pn → p ∈ Δ ,‬‬
‫‪ .q n ∈ BR(pn ) ,q n → q ∈ Δ‬נראה ש‪ .q ∈ BR(p)Î‬נניח בשלילה ש‪ ;q 6∈ BR(p)Î‬אז‬
‫יש ‪ 1 ≤ i ≤ n‬כך ש‪ .qi 6∈ BRi (p1 , . . . , p^i , . . . , pn )Î‬לכן קיים ‪ ε > 0‬ו‪ qi0 ∈ Δsi Î‬כך‬
‫ש‪.ui (qi0 , p1 , . . . , p^i , . . . , pn ) > ui (qi , p1 , . . . , p^i , . . . , pn ) + εÎ‬‬
‫מכיוון ש‪ ui Î‬רציפה‪ ,‬נקבל שעבור ‪ n‬מספיק גדול מתקיים‬
‫‪ε‬‬
‫‪ui (qi0n , pn1 , . . . , p^ni , . . . , pnn ) > ui (qin , pn1 , . . . , p^ni , . . . , pnn ) +‬‬
‫‪2‬‬
‫בסתירה לעובדה ש‪.qin ∈ BRi (pn1 , . . . p^ni , . . . , pnn )Î‬‬

‫‪12‬זה‪ ,‬בעצם‪ ,‬היחס‪.‬‬

‫‪17‬‬
‫תורת התועלת‬ ‫‪3‬‬

‫תורת התועלת‬ ‫‪3‬‬

‫‪1.1.2009‬‬ ‫נתור אחר ניסוח אקסיומטי שמצדיק את קיומה של פונקציית תועלת )לינארית(‪.‬‬
‫אקסיומה )העדפות(‪ .‬על מרחב ההגרלות‪ ,‬קיים יחס סדר "עדיף או אדיש"‪ ,‬שיסומן ‪ ,‬כך ש‪Î‬‬
‫‪13‬‬
‫א‪ .‬היחס טרנזיטיבי‪ :‬אם ‪ L1  L2‬וגם ‪ L2  L3‬אז ‪;L1  L3‬‬
‫ב‪ .‬היחס מלא‪ :‬לכל שתי הגרלות ‪ L1‬ו‪ L1  L2 ,L2 Î‬או ‪) L2  L1‬ואם שניהם מתקיימים‪,‬‬
‫נסמן ‪.(L1 ∼ L2‬‬
‫בפרט‪ ,‬קיים יחס העדפות על הפרסים ‪ ;A1 , A2 , . . . , Ar‬בלי הגבלת הכלליות‪ ,‬נסדרם בסדר‬
‫עדיפויות יורד‪.A1  A2  . . .  Ar :‬‬

‫אקסיומה )רדוקציית הגרלות מורכבות(‪ .‬יהיו ‪ L1 , . . . , Ls‬הגרלות על קבוצת הפרסים כך ש‪Li Î‬‬
‫)‪(i‬‬ ‫)‪(i‬‬ ‫)‪(i‬‬
‫הגרלה הנותנת בסיכוי ‪ pj‬את הפרס ‪) Aj‬סימון‪ .(Li = p1 A1 +̇ . . . +̇pr Ar :‬תהא ‪ M‬הגרלה‬
‫)‪(1‬‬ ‫)‪(s‬‬
‫= ‪(1 ≤ k ≤ r) pk‬‬ ‫‪q 1 pk‬‬ ‫‪+ ... +‬‬ ‫‪q s pk‬‬ ‫על ההגרלות ‪ .M = qi L1 +̇ . . . +̇qs Ls :Li‬נגדיר‬
‫‪14‬‬
‫ונגדיר הגרלה ‪ .L = p1 A1 +̇ . . . +̇pr Ar‬אז ‪.L ∼ M‬‬

‫אקסיומה )רציפות(‪ .‬לכל פרס ‪ Ai‬קיים מספר ‪ 0 ≤ ui ≤ 1‬כך ש‪Ai ∼ ui A1 +̇(1 − ui )Ar Î‬‬
‫‪15‬‬
‫)סימון‪.(Ãi = ui A1 +̇(1 − ui )Ar :‬‬

‫אקסיומה )שקילות ההצבה(‪ .‬בכל הגרלה אפשר להציב את ‪ Ãi‬במקום ‪ Ai‬ולקבל הגרלה שהפרט‬
‫אדיש בינה ובין ההגרלה המקורית‪.‬‬

‫מסקנה ‪ :14‬ההגרלה ‪ p1 A1 +̇ . . . +̇pr Ar = ˙ pi Ai‬שקולה להגרלה ‪ ,pA1 +̇(1 − p)Ar‬כאשר‬


‫‪P‬‬
‫‪Pr‬‬
‫‪.p = i=1 pi ui‬‬

‫אקסיומה )מונוטוניות(‪ A1  Ar .‬אז ‪ p ≥ p0‬אם"ם ‪.pA1 +̇(1 − p)Ar  p0 A1 +̇(1 − p0 )Ar‬‬


‫אם ‪ A1 ∼ Ar‬אז לכל ‪.pA1 +̇(1 − p)Ar ∼ A1 ,0 ≤ p ≤ 1‬‬

‫מסקנה ‪ :15‬ה‪Îui Î‬ים באקסיומת הרציפות נקבעים ביחידות אם ‪.A1  Ar‬‬

‫למה ‪ :16‬בהנחת אקסיומות ‪ ,5–1‬לכל פרס קיים מספר ‪ 0 ≤ ui ≤ 1‬כך שאם ‪,L = ˙ pi Ai‬‬
‫‪P‬‬

‫‪ ,L0 = ˙ p0i Ai‬אז ) ‪ u(L) ≥ u(L0‬אם"ם ‪ ,L  L0‬כאשר ‪.u(L) = i=1 pi ui‬‬


‫‪Pr‬‬ ‫‪P‬‬

‫הגדרה‪ .‬פונקציה ‪ u‬על הגרלות המקיימת ‪ L  L0‬אם"ם ) ‪ u(L) ≥ u(L0‬נקראת פונקציית‬


‫תועלת‪ .‬אם היא מקיימת ) ‪ ,u( ˙ pi Ai ) = pi u(Ai‬נגיד שהיא תועלת לינארית‪.‬‬
‫‪P‬‬ ‫‪P‬‬

‫משפט ‪ :17‬אם ‪ ,A1  Ar‬אזי קיימת פונקציית תועלת לינארית יחידה המקיימת ‪,u(A1 ) = 1‬‬
‫‪.u(Ar ) = 0‬‬

‫‪13‬זה טבעי וסביר‪ ,‬אך לא תמיד מתנהגים כך‪.‬‬


‫‪14‬גם זה נראה הגיוני‪ ,‬אבל זה לא תמיד תואם את התנהגותנו‪.‬‬
‫‪15‬לא חייב להיות כזה‪.‬‬

‫‪18‬‬
‫משפט הנישואים היציבים של גייל‪Î‬שאפלי‬ ‫‪4‬‬

‫משפט הנישואים היציבים של גייל‪Î‬שאפלי‬ ‫‪4‬‬

‫יהיו ‪ n‬גברים ו‪ nÎ‬נשים כך שלכל גבר יש העדפות על הנשים ולכל אישה יש העדפות על הגברים‪.‬‬
‫שידו‪ ê‬הוא התאמה חד‪Î‬חד ערכית בין אוסף הגברים לנשים‪ .‬שידוך נקרא יציב אם אין גבר ‪ x‬ואישה‬
‫‪ y‬שמעדיפים זה את זה על‪Î‬פני בן‪Î‬זוגם הנוכחי )על‪Î‬פי השידוך(‪.‬‬
‫משפט ‪) 18‬הנישואי‪ í‬היציבי‪ :(í‬תמיד קיים שידוך יציב‪.‬‬
‫הוכחה‪ .‬נראה אלגוריתם שמוצא שידוך יציב‪.‬‬
‫שלב ‪1‬א'‪ :‬כל גבר הולך לביתה של האישה המועדפת עליו‪.‬‬
‫שלב ‪1‬ב'‪ :‬כל אישה דוחה את כל הגברים שמחזרים אחריה‪ ,‬פרט למועדף עליה מביניהם‪.‬‬
‫שלב ‪2‬א'‪ :‬כל גבר הולך לביתה של האישה המועדפת עליו מבין אלו שלא דחו אותו‪.‬‬
‫שלב ‪2‬ב'‪ :‬כל אישה דוחה את כל הגברים שמחזרים אחריה‪ ,‬פרט למועדף עליה מביניהם‪.‬‬
‫‪..‬‬
‫‪.‬‬
‫שלב ‪m‬‬
‫‪m‬א'‪ :‬כל גבר הולך לביתה של האישה המועדפת עליו מבין אלו שלא דחו אותו‪.‬‬
‫שלב ‪m‬‬
‫‪m‬ב'‪ :‬כל אישה דוחה את כל הגברים שמחזרים אחריה‪ ,‬פרט למועדף עליה מביניהם‪.‬‬
‫האלגוריתם נעצר‪ :‬תכונותיו – הגברים מחזרים אחר הנשים המועדפות עליהם בסדר יורד;‬
‫הנשים מחוזרות על‪Î‬ידי הגברים המועדפים עליהן בסדר עולה; אישה שחיזרו אחריה תפוסה מאותו‬
‫רגע )תמיד מחוזרת‪ (.‬מהתכונה האחרונה‪ ,‬אין גבר שנדחה על‪Î‬ידי כולן‪ ,‬ולכן האלגוריתם מסתיים‬
‫בשידוך‪.‬‬

‫זמ‪ ï‬הריצה‪ :‬גבר שנדחה על‪Î‬ידי אישה לא חוזר אליה‪ :‬כלומר‪ ,‬כל אישה דוחה לכל היותר ‪n − 1‬‬
‫גברים‪ .‬לכן יש לכל היותר )‪ n(n − 1‬דחיות‪ ,‬ולכן לאחר לכל היותר ‪ n(n − 1) + 1‬שלבים יגיע שלב‬
‫בו אף גבר לא נדחה‪.‬‬
‫משפט ‪ :19‬מבין כל השידוכים היציבים‪ ,‬השידוך שמיוצר על‪Î‬ידי האלגוריתם אופטימלי לגברים‬
‫והכי פחות טוב לנשים‪.‬‬
‫הוכחה‪ .‬באינדוקציה‪.‬‬

‫‪19‬‬
‫בעיות מיקוח‬ ‫‪5‬‬

‫בעיות מיקוח‬ ‫‪5‬‬

‫הגדרה‬ ‫‪5.1‬‬

‫‪8.1.2009‬‬ ‫בעיית המיקוח של נאש‪ :‬שני )‪ (n‬צדדים מתמקחים על משאב שאותו הם צריכים לחלק ביניהם‪.‬‬
‫הסטטוס‪Î‬קוו הוא המצב הנוכחי‪ ,‬בו לאף אחד אין כלום‪ .‬התועלת יכולה להיות פונקציה לא לינארית‬
‫של כמות המשאב שהם קיבלו‪.‬‬
‫קבוצת המיקוח )‪ .K :(bargaining set‬קבוצת הנקודות ברות ההשגה )‪ :(feasible set‬הנקודות‬
‫במישור התועלות ששני השחקנים במשותף יכולים להשיג‪ .‬לדוגמה‪ ,‬בחלוקה של ‪ 1,000‬שקלים בין‬
‫שני שותפים‪,‬‬
‫המשחק‪ :‬כל שחקן מציב דרישה )מספר ממשי( – כמה תועלת הא רוצה‪ .‬אם זוג הדרישות )‪(x, y‬‬
‫בר‪Î‬השגה‪ ,‬הם מקבלים מה שדרשו – אחרת‪ ,‬מקבלים ‪.0‬‬
‫מניחים שקבוצת המיקוח קומפקטית וקמורה ‪.16‬‬
‫מהם שיווי המשקל )נאש( במשחק? קל לראות שנקודה )‪ (x, y‬היא שיווי משקל אם ורק אם‬
‫היא על "השפה היעילה"‪ ,‬כלומר ‪ (x, y) ∈ K‬אבל ‪ (x, y + ε) 6∈ K ,(x + ε, y) 6∈ K‬עבור ‪ε > 0‬‬
‫קטנים‪.‬‬
‫הגדרה‪ .‬מושג פתרו‪ ï‬לבעיית המיקוח הוא התאמה שלכל קבוצת מיקוח מתאימה את אחת הנקודות‬ ‫מושג פתרון‬

‫שלה‪) .‬אינטואיטיבית‪ ,‬זהו ניסיון למצוא נקודה ברת השגה שהיא "הוגנת" במובן מסוים‪(.‬‬

‫פתרון נאש‬ ‫‪5.2‬‬

‫אקסיומות נאש למושג פתרון‪:‬‬


‫א‪ .‬הפתרון הוא נקודת שיווי משקל )יעילות‪/‬פארטו‪Î‬אופטימליות(;‬
‫ב‪ .‬אם מחליפים את שמות השחקנים‪ ,‬הפתרון יהיה אותו פתרון אחרי החלפת השמות )סימטרייה(;‬
‫ג‪ .‬אם משנים את הסקאלה של אחד הצירים בפקטור קבוע‪ ,‬הפתרון יהיה אותו פתרון אחרי‬
‫שינוי הסקלה )אינווריאנטיות לשינוי סקלה לינארי(;‬
‫ד‪ .‬אם ) ‪ S(K) = (x0 , y0‬ו‪ K 0 ⊆ KÎ‬קבוצת מיקוח שמכילה את ) ‪ ,(x0 , y0‬אז = ) ‪S(K‬‬
‫‪0‬‬

‫)‪) S(K‬אי‪Î‬תלות באלטרנטיבות לא רלוונטיות(‪.‬‬

‫משפט ‪ :20‬קיים מושג פתרון יחיד המקיים אקסיומות אלה‪ ,‬והיא הנקודה היחידה ∈ ) ‪s = (x0 , y0‬‬
‫‪17‬‬
‫‪ K‬הממקסמת את מכפלת הקואורדינטות‪.s = SNash (K) = arg max{xy : (x, y) ∈ K} :‬‬
‫‪16‬ללא קמירות‪ ,‬אין דברים מעניינים לומר על המשחק‪ ,‬ואם מאפשרים אסטרטגיות מעורבות‪ ,‬קבוצת המיקוח בהכרח‬
‫קמורה‪.‬‬
‫‪17‬יש נקודה יחידה מכיוון שמכפלת הקואורדינטות היא פונקציה קעורה‪ ,‬ולכן מקבלת מקסימום יחיד על קבוצה‬
‫‪x+x0‬‬ ‫‪y+y 0‬‬
‫‪2‬‬
‫·‬ ‫‪2‬‬
‫קומפקטית‪ :‬אם ‪ ,c = xy = x0 y 0 ,(x, y) 6= (x0 , y 0 ) ∈ K‬אז = ) ‪= 14 (xy + x0 y 0 + xy 0 + x0 y 0‬‬
‫‪0‬‬ ‫‪0‬‬
‫‪ 2c + xy +x‬וזה גדול מ‪ cÎ‬אם"ם ‪ ,xy 0 + x0 y > 2c‬אבל ) ‪ xy + x0 y = xy( xx0 + x0 x) = c(a + a1‬אם נסמן‬
‫‪0‬‬
‫‪4‬‬
‫‪y‬‬

‫‪x+x0 y+y 0‬‬ ‫‪1‬‬ ‫‪x‬‬


‫‪ a = x0‬ואם ‪ .a + a > 2 ,a 6= 1‬אז מכפלת הקואורדינטות של נקודת הביניים ) ‪ ( 2 , 2‬גדולה מ‪ ,cÎ‬בסתירה‪.‬‬
‫גיאומטרית‪ ,‬פתרון נאש הוא הנקודה בה פרבולה מהמשפחה ‪ xy = c‬משיקה לשפה היעילה‪.‬‬

‫‪20‬‬
‫הגירסה המוחלקת‬ ‫‪5.3‬‬ ‫בעיות מיקוח‬ ‫‪5‬‬

‫הוכחה‪ .‬קל לראות שפתרון נאש )‪ SNash (K‬הוא אכן מושג פתרון שמקיים את ‪ .4–1‬יהי ‪ S‬מושג‬
‫פתרון כלשהו המקיים את אקסיומות ‪ 4–1‬ונראה שהוא מתלכד עם ‪.SNash‬‬
‫ראשית‪ ,‬אם נסמן )‪ ,(x0 , y0 ) = SNash (K‬על‪Î‬ידי שינוי הסקלה של הקואורדינטות אפשר‬
‫להניח ש‪ .(x0 , y0 ) = (1, 1)Î‬מכאן בהכרח נובע ש‪ ,K ⊆ T Î‬כאשר ‪ T‬הוא המשולש שקדקודיו‬
‫)‪ :(2, 0) ,(0, 2) ,(0, 0‬אם לא‪ K ,‬מכילה נקודה )‪ (x, y‬כך ש‪ ,x + y > 2Î‬ואם מחברים את )‪(x, y‬‬
‫ל‪ ,(x0 , y0 ) = (1, 1)Î‬נקבל נקודה שמכפלת קואורדינטותיה גדולה מ‪) 1Î‬תרגיל(‪.‬‬
‫כעת‪ ,‬בגלל אקסיומת הסימטרייה ובגלל אקסיומה ‪ ,1‬מתקיים ‪ ,S(T ) = 1, 1‬כי ‪ T‬שווה‬
‫לשיקוף שלה )בהחלפת שמות השחקנים(‪ .‬אבל ‪ K ⊆ T‬ומכיל את )‪ ,(1, 1‬לכן לפי אקסיומה ‪4‬‬
‫מקבלים )‪.S(K) = S(T ) = (1, 1) = SNash (K‬‬

‫הגירסה המוחלקת‬ ‫‪5.3‬‬

‫מניחים שבבעיית המיקוח יש עמימות מסוימת‪ ,‬כלומר האינפורמציה לגבי קבוצת המיקוח לא‬
‫נתונה במלואה‪ .‬ממדלים זאת על‪Î‬ידי החלפת פונקציות התועלת הלא‪Î‬רציפות ‪u1 (x, y) = x‬‬
‫ל‪ u1 (x, y) = 0 ,(x, y) ∈ KÎ‬אחרת )וכך גם ‪ (u2‬בגירסאות מוחלקות שלהן‪u1 (x, y) = ,‬‬
‫)‪ u2 (x, y) = yp(x, y) ,xp(x, y‬כאשר ‪ p‬שווה ל‪ 1Î‬על ‪ 0 ,K‬במרחק גדול מ‪ εÎ‬מ‪ ,KÎ‬ובתחום‬
‫הביניים דועכת מ‪ 1Î‬ל‪) .0Î‬במשחק הלא‪Î‬מוחלק‪(.p = χK ,‬‬
‫משפט ‪ :21‬כאשר ‪ ,ε → 0‬אוסף שיוויי המשקל ה‪ÎεÎ‬מוחלק שואף לפתרון נאש‪.‬‬
‫הוכחה‪ .‬נגדיר פונקציה )‪ .f (x, y) = xyp(x, y‬נשים לב שנקודה ) ‪ (x0 , y0‬היא שיווי משקל‬ ‫‪22.1.2009‬‬

‫במשחק המקורב אם ורק אם )‪ f (x0 , y0 ) = maxy f (x0 , y‬ו‪,f (x0 , y0 ) = maxx f (x, y0 )Î‬‬
‫וזה קורה אם ורק אם )‪ y0 p(x0 , y0 ) = maxy yp(x0 , y‬ו‪.x0 p(x0 , y0 ) = maxx xp(x, y0 )Î‬‬
‫בפרט‪ ,‬נקודת המקסימום הגלובלית של ‪ f‬היא שיווי משקל והיא מקיימת ‪.x0 y0 ≥ xNash yNash‬‬
‫לכן קל לראות שכש‪.(x0 , y0 ) → SNash (K) ,ε → 0Î‬‬
‫מצד שני‪ ,‬אם ) ‪ (x0 , y0‬היא שיווי משקל‪ ,‬ממה שהראינו נובע ‪fx (x0 , y0 ) = 0 = y0 (p(x0 , y0 )+‬‬
‫)) ‪ x0 px (x0 , y0‬ו‪ .fy (x0 , y0 ) = 0 = x0 (p(x0 , y0 ) + y0 py (x0 , y0 ))Î‬בפרט‪x0 px (x0 , y0 ) = ,‬‬
‫‪18‬‬
‫לכן נובע ש‪ (x0 , y0 )Î‬ממקסמת את ‪ xy‬תחת האילוץ ‪) p(x, y) = c‬ל‪c =Î‬‬ ‫) ‪,y0 py (x0 , y0‬‬
‫‪19‬‬
‫תהא ) ‪ sε = (xε , yε‬הנקודה הממקסמת את ‪ xy‬תחת האילוץ ‪ .p = 1‬ברור‬ ‫) ‪.(p(x0 , y0‬‬
‫‪ε→0‬‬
‫ש‪ .sε → sNash (K)Î‬מצד שני‪ ,x0 y0 ≥ xε yε ,‬ולכן גם )‪.(x0 , y0 ) −→ sNash (K‬‬

‫א‪ .‬קלעי ומ‪ .‬סמורודינסקי הציעו פתרון אחר‪ ,‬שמקיים את האקסיומות ‪ 3–1‬ואת האקסיומה‬
‫הבאה‪ :‬אם מגדילים את קבוצת המיקוח באופן שלא מגדיל את התועלת המקסימלית של כל אחד‬
‫מהשחקנים‪ ,‬הפתרון בקבוצה המוגדלת נותן לכל אחד מהשחקנים לפחות מה שקיבל קודם‪ .‬הם‬
‫הוכיחו משפט‪ :‬הפתרון היחיד שמקיים את מערכת אקסיומות זו הוא = )‪SKS (K‬‬

‫‪18‬וברור ש‪ ,x0 , y0 6= 0Î‬כי אף אחד מהשחקנים לא מסתפק בכך‪.‬‬


‫‪19‬זהו כופל לגראנז'‪ :‬כדי למצוא מקסימום של )‪ G(x, y‬תחת האילוץ ‪ Q(x, y) = c‬פותרים את מערכת המשוואות‬
‫‪ ;Q = c ,∇G = λ∇Q‬הפתרון ‪ λ‬הוא כופל לגראנז’‪.‬‬

‫‪21‬‬
‫בעיות מיקוח‬ ‫‪5‬‬ ‫משחק האיומים של נאש‬ ‫‪5.4‬‬

‫משחק האיומים של נאש‬ ‫‪5.4‬‬

‫בהינתן משחק לא שיתופי בשני שחקנים בצורה אסטרטגית עם מטריצות תועלות ‪,Bs1 ×s2 ,As1 ×s2‬‬
‫נגדיר קבוצה ‪ K ⊆ R2‬המתארת את זוגות התועלות ברי‪Î‬ההשגה על‪Î‬ידי שיתוף פעולה של שני‬
‫‪20‬‬
‫השחקנים‪:‬‬
‫‪n‬‬
‫‪X‬‬
‫{ = } ‪K = conv{(aij , bij ) : 1 ≤ i ≤ s1 , 1 ≤ j ≤ s2‬‬ ‫} ‪pij (aij , bij ) : (pij ) 1≤i≤s1 ∈ Δs1 ×s2‬‬
‫‪i,j=1‬‬ ‫‪1≤j≤s2‬‬

‫‪ K‬קמורה וקומפקטית‪.‬‬
‫משחק האיומי‪ í‬שנגזר מהמשחק הנתון ‪ – A, B‬שני שלבים‪:‬‬
‫בשלב הראשון‪ ,‬כל אחד מהשחקנים ‪ i‬מצהיר על אסטרטגיה מעורבת ‪) pi ∈ Δsi‬ה"איום"(‪.‬‬
‫זוג האיומים ) ‪ (p1 , p2‬קובע זוג תשלומים ) ‪ (u1 , u2‬על‪Î‬ידי ‪.u2 = pt1 Bp2 ,u1 = pt1 Ap2‬‬
‫בשלב השני‪ ,‬השחקנים משחקים משחק מיקוח עם קבוצת המיקוח ‪ K‬ועם נקודת סטטוס‪Î‬קוו‬
‫)נקודת אי‪Î‬הסכמה ‪ /‬נקודת איום( ) ‪ .(u1 , u2‬השחקנים מסכימים מראש שהתשלום הסופי יהיה‬
‫פתרון נאש‪.SNash (K; u1 , u2 ) = arg max(x,y)∈K (x − u1 )(y − u2 ) ,‬‬

‫איפיון גיאומטרי של פתרון נאש‬

‫‪29.1.2009‬‬ ‫פתרון נאש הוא נקודה על השפה היעילה שבה התומך ל‪ KÎ‬בעל שיפוע נגדי לקו ‪ l‬המחבר נקודה‬
‫זו עם נקודת האי‪Î‬הסכמה‪ .‬נשים לב שפתרון נאש לכל הנקודות על ‪ l‬הוא אותו פתרון‪ .‬בדוגמה‪,‬‬
‫השפה של ‪ K‬לינארית למקוטעין ומורכבת משני ישרים; לכן יש שתי משפחות של קווים מקבילים‬
‫המגדירות את פתרון נאש עבור כל נקודת איום אפשרית ב‪.KÎ‬‬
‫ניתוח משחק האיומים מתבצע על‪Î‬ידי ניתוח משחק סכום אפס לכל אחד מהאזורים בציור‪:‬‬
‫איזור א'‪ :‬תחילה נכתוב את פתרון נאש‪(v1 , v2 ) = SNash (u1 , u2 ) = (au1 + bu2 + c, 90 − :‬‬
‫))‪.(au1 + bu2 + c‬‬
‫מהתנאים )‪ SN (30, 60) = (30, 60) ,SN (0, 90) = (0, 90) ,SN (0, 60) = (15, 75‬מקבלים‬
‫= ‪.c = 45 ,b = − 12 ,a‬‬ ‫‪1‬‬
‫‪2‬‬
‫‪u1 −u2‬‬ ‫‪u1 −u2‬‬
‫‪ .SNash (u1 , u2 ) = (45 +‬לכן נפתור את משחק‬ ‫‪2‬‬ ‫‪, 45‬‬ ‫‪−‬‬ ‫‪2‬‬ ‫)‬ ‫כלומר‪ ,‬באיזור א’‪,‬‬
‫סכום אפס‬
‫∗‬ ‫∗‬
‫נסמן ב‪ (p , q )Î‬את שיווי המשקל‪.‬‬
‫אם נחזור למשחק המקורי‪ ,‬נקודת האיום עבור האסטרטגיה ) ∗ ‪ (p∗ , q‬תהיה ‪u1 = 0 · 61 · 12 +‬‬
‫‪5‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪5‬‬ ‫‪1‬‬
‫· ‪.u2 = 32.5 ,0‬‬ ‫‪6‬‬ ‫·‬ ‫‪2‬‬ ‫· ‪+ 60‬‬ ‫‪6‬‬ ‫·‬ ‫‪2‬‬ ‫· ‪+ 30‬‬ ‫‪6‬‬ ‫·‬ ‫‪2‬‬ ‫‪= 17.5‬‬
‫לסיכום‪ ,‬כמסקנה ממה שהראינו‪ ,‬שחקן ‪ 1‬יכול לכפות על נקודת האיום להימצא מחוץ לאיזור‬
‫א’‪ .‬הוא ירצה לעשות זאת‪ ,‬כמובן; לכן הפתרון אינו באיזור א’‪ ,‬ויש לבחון את האיזורים האחרים‪.‬‬
‫איזור ג'‪ :‬קל לראות ששחקן ‪ 1‬יכול לכפות על נקודת האיום להימצא באיזור ג’ על‪Î‬ידי משחק‬
‫האסטרטגיה הטהורה ‪ .B‬מצד שני‪ ,‬שחקן ‪ 2‬יכול לכפות על נקודת האיום להימצא על השפה של‬
‫איזור ג’ )הישר ‪ (y = 2x‬על‪Î‬ידי משחק ‪ .R‬לכן קיבלנו שהפתרון במצב שיווי משקל יהיה )‪.(30, 60‬‬
‫‪20‬במקום לבחור שורה ועמודה‪ ,‬השחקנים בוחרים יחד תא במטריצת התשלומים‪.‬‬

‫‪22‬‬
‫משחק האיומים של נאש‬ ‫‪5.4‬‬ ‫בעיות מיקוח‬ ‫‪5‬‬

‫משפט ‪ :22‬במשחק האיומים קיים שיווי משקל‪ .‬יתר על כן‪ ,‬למשחק יש ערך מקס’‪Î‬מינ’‪ ,‬כלומר‬
‫כל שני שיווי משקל מבטיחים אותה תועלת בדיוק לכל אחד מהשחקנים‪ ,‬וכל שיווי משקל הוא זוג‬
‫אסטרטגיות רמת ביטחון מקסימליות‪.‬‬
‫הוכחה‪ .‬הטענה השנייה נובעת מהעובדה שפונקציית התועלת של השחקן השני היא פונקציה מונוטונית‬
‫יורדת בתועלת של השחקן הראשון‪ ,‬ולכן כל ההוכחות שהראינו עבור משחקי סכום אפס תקפות‪.‬‬
‫קיום נובע ממשפט נקודות השבת של קקוטאני – צריך לבדוק שהפונקציה הקבוצתית →‪(p, q) 7‬‬
‫)‪ BR(q) × BR(p‬מקיימת את הנחות המשפט‪.‬‬

‫‪23‬‬
‫משחקים שיתופיים והערך של שאפלי‬ ‫‪6‬‬

‫משחקים שיתופיים והערך של שאפלי‬ ‫‪6‬‬

‫הגדרה‬ ‫‪6.1‬‬

‫‪15.1.2009‬‬ ‫קבוצת שחקנים }‪ .N = {1, 2, . . . , n‬תת‪Î‬קבוצה ‪ S ⊆ N‬נקראת קואליציה‪ ,‬ולכל קואליציה‬


‫יש פונקציית תשלום )הפונקציה הקואליציונית( )‪ v(S) .v(∅) = 0 ,v(S‬אינו תלוי בהתנהגות‬
‫השחקנים האחרים‪ .‬שחקני ‪ S‬יכולים לחלק את )‪ v(S‬ביניהם כרצונם‪.‬‬
‫דוגמה‪ .‬פרופ’ משלר היה מתאר משחק ‪ 3‬שחקנים שיתופי‪,v(1) = v(2) = v(3) = 0 ,‬‬
‫‪ ,v(123) = 100 ,v(23) = 40 ,v(13) = 50 ,v(12) = 15‬כך‪:‬‬

‫משחק פשוט‪ v(S) = 0 :‬או ‪ v(S) = 1‬לכל ‪.S‬‬


‫לפעמים דורשים מונוטוניות ))‪ v(S) ≥ v(R‬אם ‪ (R ⊆ S‬ו‪/‬או סופר‪Î‬אדיטיביות ≥ ) ‪v(T‬‬
‫)‪ v(S) + v(R‬אם ‪.R ∩ S = ∅ ,R ∪ S = T‬‬
‫משחק פשוט וסופר‪Î‬אדיטיבי מקיים שאם ‪ S‬ו‪ RÎ‬זרות ו‪ v(S) = 1Î‬אזי ‪.v(R) = 0‬‬
‫משחק בחירות‪ :‬משחק פשוט נומוטוני וסופר‪Î‬אדיטיבי‪.‬‬
‫שאפלי גילה שני מושגי פתרון חשובים‪:‬‬

‫ליבה‬ ‫‪6.2‬‬

‫הגדרה‪ .‬בהינתן משחק שיתופי )‪ ,(N, v‬הליבה )‪ (core‬של המשחק היא אוסף כל הווקטורים ) ‪(x1 , x2 , . . . , xn‬‬
‫כך שמתקיים‬
‫)‪) x1 + x2 + . . . + xn = v(N ) (1‬יעילות ‪ /‬פארטו(;‬
‫‪P‬‬
‫)‪ (2‬לכל ‪. i∈S xi ≥ v(S) ,∅ 6= S ⊆ N‬‬

‫הליבה נותנת דרכים לחלוקת התשלום בהם לאף קואליציה לא כדאי לערוק – אך לא בהכרח‬
‫דרך יחידה‪ ,‬ולפעמים היא אף ריקה‪.‬‬
‫בהינתן משחק )‪ ,(N, v‬נרצה לנסח אקסיומות סבירות לחלוקת התשלומים‪.‬‬
‫‪P‬‬ ‫‪P‬‬
‫(‬ ‫) ‪v(S))v(N‬‬ ‫(‬ ‫‪v(S)) 21‬‬
‫= ‪.xi‬‬ ‫‪Pni∈SP‬‬ ‫=‬ ‫‪P i∈S‬‬ ‫איילת‪:‬‬ ‫פתרו‪ï‬‬
‫( ‪i=1‬‬ ‫))‪i∈S v(S‬‬ ‫|‪S⊆N v(S)|S‬‬

‫בהינתן קבוצת שחקנים ‪ N‬ופונקציית תשלום ‪ ,v‬הערך )‪ ϕi (N, v‬אומר כמה יקבל שחקן ‪.i‬‬
‫נרצה‬
‫‪Pn‬‬
‫‪.‬‬ ‫‪i=1‬‬ ‫‪ϕi (N, v) = v(N ) .1‬‬
‫‪ .2‬שחקנים ‪ i‬ו‪ jÎ‬ייקראו סימטריי‪ í‬אם לכל קואליציה ‪ S‬כך ש‪ i 6∈ SÎ‬ו‪v(S∪{i}) = ,j 6∈ SÎ‬‬
‫)}‪ .v(S ∪ {j‬אז אם ‪ i‬ו‪ jÎ‬סימטריים‪.ϕi (N, v) = ϕj (N, v) ,‬‬
‫‪P‬‬
‫‪ .3‬נניח ) ‪ .b(S) = i∈S bi ,w(S) = av(S) + b(S) ,b = (b1 , . . . , bn‬אז = )‪ϕi (N, w‬‬
‫‪) .aϕi (N, v) + bi‬ניתן לקבל תנאי זה כמסקנה מהשאר‪(.‬‬

‫‪21‬לעתים מופיע בספרות כפתרו‪ ï‬בנז‪ ó‬המנורמל‪.‬‬

‫‪24‬‬
‫‪ 6.2‬ליבה‬ ‫משחקים שיתופיים והערך של שאפלי‬ ‫‪6‬‬

‫‪ .4‬שחקן ‪ i‬ייקרא גול‪ í‬אם )‪ v(S ∪ {i}) = v(S‬לכל ‪ .i 6∈ S ,S ⊆ N‬עיקרו‪ ï‬הגול‪ :í‬אם‬
‫‪ i ∈ N‬גולם‪ ,‬אז ‪.ϕi (N, v) = 0‬‬
‫‪ .5‬עיקרו‪ ï‬החיבוריות‪ :‬אם )‪ (N, v‬ו‪ (N, w)Î‬שני משחקים‪ ,‬אז ‪ϕi (N, v +w) = ϕi (N, v)+‬‬
‫)‪.ϕi (N, w‬‬

‫משפט ‪ :23‬קיים פתרון יחיד שמקיים את אקסיומות ‪.5–1‬‬


‫הוכחה‪ .‬תהא ‪ π‬תמורה על קבוצת השחקנים‪ .‬יהי ‪ i‬שחקן ותהא ‪ S‬קבוצת השחקנים שקדמו ל‪iÎ‬‬
‫)כאשר מסתכלים על התמורה כסדר על השחקנים‪ ,‬כלומר })‪ S = {π(1), . . . , π(k − 1‬אם‬
‫‪.(π(k) = i‬‬
‫הערך המוסף של שחקן ‪ i‬ביחס לתמורה ‪.π‬‬ ‫‪:Ψπi‬‬ ‫נגדיר )‪= v(S ∪ {i}) − v(S‬‬
‫‪1‬‬
‫‪P π‬‬
‫הרעך של שאפלי‬ ‫= )‪ .SHi (N, v‬נראה ש‪ SHi Î‬מקיימת את האקסיומות‪,‬‬ ‫!‪n‬‬ ‫הער‪ ê‬של שאפלי‪π Ψi :‬‬
‫ושהיא היחידה שמקיימת אותן‪.‬‬
‫‪Pn‬‬ ‫‪π‬‬
‫יעילות מתקיימת כי לכל תמורה ‪ , i=1 Ψi = v(N ) ,π‬ולכן זה נכון בממוצע על !‪ n‬התמורות‪.‬‬
‫שחקנים סימטריים יקבלו אותה תמורה‪ ,‬כי נוכל לחלק את התמונות לזוגות בהן מחליפים ‪i‬‬
‫ו‪.jÎ‬‬
‫)‪ ,(3‬עיקרון הגולם ועיקרון החיבוריות מתקיימים לכל תמורה ולכן גם בממוצע‪.‬‬
‫ויראה קואליציה ‪ S‬הוא !)‪.|S|!(n−|S|−1‬‬
‫‪P‬‬
‫נשים לב שמספר התמורות בהן שחקן ‪ i‬ייכנס לחדר‬
‫‪22‬‬ ‫!)|‪i6inS (v(S∪{i})−v(S))|S|!(n−1−|S‬‬
‫= )‪.SHi (N, v‬‬ ‫!‪n‬‬ ‫לכן ניתן לכתוב גם‬
‫רעיון הוכחת היחידות‪ :‬נתבונן במשחק המוגדר ל‪ vT (S) = 1 ,∅ 6= T ⊆ N Î‬אם ‪,T ⊆ S‬‬
‫‪ vT (S) = 0‬אחרת‪ .‬יש ‪ 2n −1‬משחקים כאלה – כמות התת‪Î‬קבוצות הלא‪Î‬ריקות של ‪ .N‬משחקים‬
‫אלה פורשים לינארית את מרחב כל המשחקים‪ ,‬לכן בעזרת הלינאריות נוכל לקבל את הערך לכל‬
‫המשחקים‪ .‬שחקן שלא ב‪ T Î‬הוא גולם‪ ,‬לכן מקבל ‪ .0‬כל השחקנים ב‪ T Î‬סימטריים‪ .‬לכן מאקסיומות‬
‫הגולם והסימטרייה‪ ,‬כל שחקן שלא ב‪ T Î‬מקבל ‪ ,0‬וכל שחקן ב‪ T Î‬יקבל | ‪. |T1‬‬

‫‪ ; n‬כאן‪ ,‬המשקל מאוזן יותר לפי הגודל‪.‬‬


‫‪2‬‬
‫‪22‬הערך של בנזף נקבע על‪Î‬ידי קבוצות בגודל‬

‫‪25‬‬
‫משחקים בצורה אקסטנסיבית‬ ‫‪7‬‬

‫‪ 7‬משחקים בצורה אקסטנסיבית‬

‫הגדרה‬ ‫‪7.1‬‬

‫‪5.2.2009‬‬ ‫’משחקי תורות’ – הכללה של שחמט‪ ,‬למשל‪ .‬נניח שיש שני שחקנים‪ .‬יש אינפורמציה מלאה‪ ,‬מרשים‬
‫אלמנט של מזל ומניחים שהמשחק יסתיים לאחר זמן סופי‪ ,‬בתוצאה של ניצחון‪ ,‬הפסד או תיקו‪.‬‬
‫תיאור המשחק – על‪Î‬ידי עץ‪.‬‬
‫דוגמה‪ .‬משחק עם שני שחקנים ומזל )תיאור חלקי(‪:‬‬

‫אסטרטגיה היא פונקציה שאומרת איזה מהלך השחקן ישחק בכל אחד מצמתי ההחלטה שלו‪.‬‬
‫אסטרטגיה מנצחת היא אסטרטגיה שמבטיחה ניצחון ללא תלות בדרך המשחק של השחקן השני‪.‬‬
‫אסטרטגיה אופטימלית היא אסטרטגיית מקס’‪Î‬מינ’‪ :‬מבטיחה את "הרע במיעוטו" )המקרה הגרוע‬
‫ביותר הכי טוב(‪.‬‬
‫משפט ‪) 24‬פו‪Îï‬נוימ‪ :(ï‬במשחקי תורות עם אינפורמציה מלאה יש לשחקן ‪ 1‬אסטרטגיה שמבטיחה‬
‫לו ניצחון או אסטרטגיה שמבטיחה לו תיקו‪ ,‬או שלשחקן ‪ 2‬יש אסטרטגיה שמביאה לו ניצחון‪.‬‬
‫)במקרה של משחק עם מזל‪ ,‬למשחק יש ערך‪(.‬‬
‫הוכחה‪ .‬באינדוקציה הפוכה )‪.(backtracking‬‬

‫צ’ומפ‬ ‫‪7.2‬‬

‫במשחק צ’ומפ )‪ ,(Chomp‬נתונה טבלת שוקולד בגודל ‪ n × m‬משבצות‪ .‬שני השחקנים לוקחים‬
‫"ביסים" בתורות; כל ביס מורכב מכל המשבצות )‪ (i, j‬כך ש‪ i ≥ i0 Î‬וגם ‪ j ≥ j0‬עבור ) ‪(i0 , j0‬‬
‫כלשהם‪ .‬השחקן שאוכל את )‪ (1, 1‬מפסיד‪.‬‬
‫בצ’ומפ‪ ,‬לשחקן ‪ 1‬יש אסטרטגיה מנצחת )אם"ם )‪ :((m, n) 6= (1, 1‬הוכחה על‪Î‬ידי "גניבת‬
‫אסטרטגיות" – אם לשחקן ‪ 2‬אסטרטגיה מנצחת‪ ,‬שחקן ‪ 1‬יכול "לגנוב" אותה על‪Î‬ידי משחק )‪(n, m‬‬
‫בצעד הראשון‪.‬‬
‫עם זאת‪ ,‬לא ידוע מהי האסטרטגיה המנצחת במקרה הכללי )במקרה ‪ n × n‬זה קל(‪.‬‬

‫‪26‬‬
‫הקס‬ ‫‪7.3‬‬ ‫משחקים בצורה אקסטנסיבית‬ ‫‪7‬‬

‫הקס‬ ‫‪7.3‬‬

‫המשחק הקס )‪ (Hex‬הומצא באופן בלתי‪Î‬תלוי על‪Î‬ידי ‪ Piet Hein‬ב‪ 1942Î‬ועל‪Î‬ידי נאש ב‪.1948Î‬‬

‫לוח המשחק )‪(n = 9 ,n × n‬‬


‫כל שחקן בוחר בתורו משושה שאינו צבוע וצובע אותו בצבע שלו‪ .‬הלבן מנסה לחצות את הלוח‬
‫מדרום‪Î‬מזרח לצפון‪Î‬מערב‪ ,‬והשחור – מדרום‪Î‬מערב לצפון‪Î‬מזרח‪.‬‬
‫בהקס‪ ,‬לשחקן ‪ 1‬יש אסטרטגיה מנצחת‪ :‬גם כאן‪ ,‬על‪Î‬ידי גניבת אסטרטגיות‪ .‬עבור ‪,n ≤ 9‬‬
‫האסטרטגיה המנצחת ידועה‪ .‬בגירסה הרשמית של המשחק‪ ,‬גודל הלוח הוא ‪.n = 11‬‬
‫הקס הוא מקרה פרטי של "משחק סלקציה"‪ :‬שני מאמנים של קבוצת כדורגל בוחרים שחקנים‬
‫לסירוגין מתוך מאגר של ‪ n‬שחקנים‪ .‬בסיום התהליך‪ ,‬שתי הקבוצות ‪ A‬ו‪ BÎ‬שנבחרו מתחרות‪,‬‬
‫והתוצאה היא ניצחון ל‪ AÎ‬בסיכוי )‪.f (A, B‬‬
‫לא ידועה האסטרטגיה האופטימלית בהקס ולכן גם במשחק סלקציה כללי‪ ,‬אבל אם נשנה מעט‬
‫את המשחק למשחק תורות אקראיים )‪ ,(random-turn selection game‬בו בכל תור מטילים‬
‫מטבע )הוגן‪ ,‬בדרך‪Î‬כלל( כדי להחליט מי יבצע מהלך‪ ,‬הכול נהיה פשוט יותר‪:‬‬
‫משפט ‪) 25‬פרס‪ ,‬שרא‪ ,í‬שפילד‪ ,‬וילסו‪ :(2006 ;ï‬במשחק סלקציה בתורות אקראיים‪ ,‬ערך המשחק‬
‫)תוחלת התשלום ששחקן ‪ 1‬יכול להבטיח לעצמו לקבל על‪Î‬ידי משחק אסטרטגיה אופטימלית( הוא‬
‫) ‪ :Ef (T ) = 21n T ⊆{1,...,n} f (T‬כלומר‪ ,‬התוחלת כאשר ‪ T‬נבחרת באקראי ובאופן אחיד‬
‫‪P‬‬

‫מתוך )}‪ .P ({1, . . . , n‬יתר על כן‪ ,‬כל אסטרטגיה אופטימלית של שחקן ‪ 1‬היא גם אסטרטגיה‬
‫אופטימלית של שחקן ‪.2‬‬
‫הוכחה‪ .‬בעזרת האבחנה שאם שני השחקנים משחקים את אותה אסטרטגיה‪ ,‬קבוצת השחקנים‬
‫שמצטרפים ל‪ AÎ‬תהיה בדיוק תת‪Î‬קבוצה אקראית }‪.T ⊆ {1, . . . , n‬‬

‫‪27‬‬

You might also like