מהי אינדוקציה לאחור?
אינדוקציה לאחור בתורת המשחקים היא תהליך איטרטיבי של הנמקה לאחור בזמן, מסוף בעיה או סיטואציה, לפתור סופי צורה רחבה ומשחקים רציפים, ולהסיק רצף של פעולות מיטביות.
אינדוקציה לאחור מוסברת
אינדוקציה לאחור שימשה לפיתרון משחקים מאז שג'ון פון נוימן ואוסקר מורגנשטרן הקימו את תורת המשחקים כנושא אקדמי כשפרסמו את ספרם, תיאוריית המשחקים והתנהגות כלכלית בשנת 1944.
בכל שלב שלב המשחק אינדוקציה לאחור קובעת את האסטרטגיה האופטימלית של השחקן שעושה את הצעד האחרון במשחק. לאחר מכן, נקבעת הפעולה האופטימלית של השחקן המוביל אחרון אחרון, תוך נקיטת הפעולה של השחקן האחרון כפי שניתן. תהליך זה ממשיך לאחור עד שנקבעה הפעולה הטובה ביותר לכל נקודת זמן. באופן יעיל, אחד הוא לקבוע את שיווי המשקל של נאש של כל תת-משחק של המשחק המקורי.
עם זאת, התוצאות הנגזרות מאינדוקציה לאחור לא מצליחות לחזות משחק אנושי בפועל. מחקרים ניסיוניים הראו כי התנהגות "רציונלית" (כפי שחזה על ידי תורת המשחקים) מוצגת לעיתים רחוקות בחיים האמיתיים. שחקנים לא הגיוניים עשויים בסופו של דבר להשיג תגמולים גבוהים יותר ממה שחזה על ידי אינדוקציה לאחור, כפי שמודגם במשחק מרבה רגליים.
במשחק מרבה רגליים שני שחקנים מקבלים לסירוגין סיכוי לקחת נתח גדול יותר מהסכום ההולך וגובר, או להעביר את הקופה לשחקן האחר. התשלומים מסודרים כך שאם הקופה מועברת ליריבו של היריב והיריב לוקח את הקופה בסיבוב הבא, אחד מקבל מעט פחות מאשר אם היה לוקח את הקופה בסיבוב הזה. המשחק מסתיים ברגע שהשחקן מקבל את המעמד, כאשר השחקן הזה מקבל את החלק הגדול יותר והשחקן השני מקבל את החלק הקטן יותר.
דוגמה לאינדוקציה לאחור
כדוגמה, נניח ששחקן A יתחיל ראשונה ועליו להחליט אם עליו "לקחת" או "לעבור" את הסטאש, שכרגע מסתכם ב -2 $. אם הוא לוקח, A ו- B מקבלים $ 1 כל אחד, אבל אם A עובר, ההחלטה לקחת או לעבור עכשיו צריכה להיעשות על ידי שחקן B. אם B לוקח, היא מקבלת 3 $ (כלומר, הסטש הקודם של $ 2 + $ 1) ו- A מקבל 0 $. אבל אם ב 'עובר, A עכשיו צריך להחליט אם לקחת או לעבור, וכן הלאה. אם שני השחקנים בוחרים תמיד לעבור, הם כל אחד מקבל תגמול של $ 100 בסוף המשחק.
הנקודה במשחק היא אם A ו- B שניהם משתפים פעולה וממשיכים לעבור עד סוף המשחק, הם מקבלים את התשלום המקסימלי של 100 $ לכל אחד. אבל אם הם לא מאמינים בשחקן השני ומצפים שהוא "ייקח" בהזדמנות הראשונה, שיווי המשקל של נאש מנבא שהשחקנים ייקחו את התביעה הנמוכה ביותר האפשרית ($ 1 במקרה זה).
שיווי המשקל של נאש במשחק זה, בו אין לשחקן שום תמריץ לסטות מהאסטרטגיה שנבחרה לאחר ששקל את בחירת היריב, מציע שהשחקן הראשון היה לוקח את הקופה בסיבוב הראשון של המשחק. עם זאת, במציאות, מעטים יחסית השחקנים עושים זאת. כתוצאה מכך הם מקבלים שכר גבוה יותר מאשר התשלום שחזה ניתוח האיזון.
פיתרון משחקי רצף באמצעות אינדוקציה לאחור
להלן משחק רצף פשוט בין שני שחקנים. התוויות עם נגן 1 ונגן 2 בתוכם הן ערכות המידע לשחקנים אחד או שניים, בהתאמה. המספרים בסוגריים בתחתית העץ הם התשלומים בכל נקודה בהתאמה. המשחק הוא גם רצף, כך שנגן 1 מקבל את ההחלטה הראשונה (שמאל או ימין) ונגן 2 מקבל את ההחלטה שלו אחרי שחקן 1 (למעלה או למטה).
איור 1
אינדוקציה לאחור, כמו כל תורת המשחקים, משתמשת בהנחות הרציונליות והמקסום, כלומר שחקן 2 ימקסם את התשלום שלו בכל מצב נתון. בשני מערכות המידע יש לנו שתי אפשרויות, ארבע בסך הכל. על ידי ביטול הבחירות שנגן 2 לא יבחר, אנו יכולים לצמצם את העץ שלנו. בדרך זו אנו נועזים את השורות שממקסמות את השכר של השחקן במערך המידע הנתון.
איור 2
לאחר הפחתה זו, שחקן 1 יכול למקסם את התשלומים שלו כעת לאחר היוודע הבחירות של Player 2. התוצאה היא שיווי משקל שנמצא על ידי אינדוקציה לאחור של שחקן 1 בבחירת "נכון" ונגן 2 שבחר "למעלה". להלן הפיתרון למשחק עם נתיב שיווי המשקל מודגש.
איור 3
לדוגמה, ניתן בקלות להקים משחק דומה לזה שלמעלה באמצעות חברות כשחקנים. משחק זה עשוי לכלול תרחישים של שחרור מוצרים. אם חברה 1 רצתה לשחרר מוצר, מה יכולה החברה 2 לעשות בתגובה? האם חברת 2 תשחרר מוצר מתחרה דומה? על ידי חיזוי מכירות של מוצר חדש זה בתרחישים שונים, אנו יכולים להגדיר משחק כדי לחזות כיצד אירועים עשויים להתפתח. להלן דוגמה כיצד ניתן לדגמן משחק כזה.
איור 4
