Mi a visszafelé történő indukció?
A játék elméletben a visszafelé történő indukció egy időbeli visszatekintés iteratív folyamata, egy probléma vagy helyzet végétől kezdve, a véges kiterjedt formájú és egymást követő játékok megoldására, valamint az optimális műveletek sorozatának következtetésére.
A hátsó indukció magyarázata
A visszafelé mutató indukciót a játékok megoldására használják, mióta John von Neumann és Oskar Morgenstern a játékelméletet akadémiai tantárgyként létrehozta, amikor 1944-ben kiadták a Játékelmélet és a gazdasági magatartás elméletét .
A játék minden szakaszában a visszafelé történő indukció határozza meg annak a játékosnak az optimális stratégiáját, aki a játék utolsó mozog. Ezután meghatározzák a legközelebb az utolsóhoz mozgó játékos optimális működését, az utolsó játékos által megadott módon cselekedve. Ez a folyamat visszafelé folytatódik, amíg az egyes időpontokban nem sikerül meghatározni a legjobb műveletet. Valójában az egyik meghatározza az eredeti játék minden aljátékának Nash-egyensúlyát.
Ugyanakkor a visszafelé történő indukcióból levont eredmények gyakran nem tudják megjósolni az ember tényleges játékát. Kísérleti tanulmányok kimutatták, hogy a „racionális” viselkedés (amint azt a játékelmélet megjósolja) ritkán mutatkozik meg a való életben. Az irracionális játékosok valószínűleg magasabb nyereségeket kapnak, mint amit a visszafelé történő indukció előrejelzett, amint azt a százlábú játék is szemlélteti.
A százlábú játékban két játékos felváltva kap egy esélyt, hogy nagyobb részt vegyen egyre növekvő pénzből, vagy átadja a bankot a másik játékosnak. A kifizetések úgy vannak elrendezve, hogy ha a potot az ellenfélnek adják át, és az ellenfél a következő fordulóban veszi a potot, akkor az kissé kevesebbet kap, mint ha a potot ezen a körön vették volna fel. A játék befejeződik, amint egy játékos elfoglalja a pénzt, azzal a játékossal, aki megkapja a nagyobb részét, a másik játékos pedig a kisebb részét.
Példa a hátravezető indukcióra
Például, tegyük fel, hogy az A játékos megy először, és el kell döntenie, hogy kell-e „átvennie” vagy „átadnia” a nyereményjátékot, amely jelenleg 2 dollár. Ha vesz, akkor A és B egyenként 1 dollárt kap, de ha A átadja, akkor a döntést úgy kell meghoznia vagy átadnia, hogy a B játékos meghozza. Ha B vesz, akkor 3 dollárt kap (azaz az előző $ 2 + 1 $ ostrom). és A 0 dollárt kap. De ha B áthalad, A most eldönti, hogy átveszi vagy átadja, és így tovább. Ha mindkét játékos mindig úgy dönt, hogy átadja a játékot, akkor a játék végén mindegyik 100 dollár kifizetést kap.
A játék lényege az, hogy ha A és B együtt működnek és tovább folytatódnak a játék végéig, akkor a maximális kifizetésük 100 dollár. De ha nem bíznak a másik játékosnál, és azt várják el tőlük, hogy az első alkalommal „megvegyék”, Nash egyensúlyi előrejelzése szerint a játékosok a lehető legalacsonyabb igényt állítják elő (ebben az esetben 1 dollár).
Ennek a játéknak a Nash-egyensúlya, amikor egy játékosnak nincs ösztönzése az ellenfél választása megfontolása alapján eltérni a választott stratégiától, azt sugallja, hogy az első játékos a játék első fordulójában veszi a bankot. A valóságban viszont viszonylag kevés játékos teszi ezt. Ennek eredményeként nagyobb nyereséget kapnak, mint az egyensúlyi elemzés előrejelzése alapján.
Szekvenciális játékok megoldása visszamenő indukcióval
Az alábbiakban egy egyszerű, egymást követő játék két játékos között. Az azokban az 1-es és a 2-es lejátszó címkéi az egy vagy kettő játékosának információs halmazai. A fa alján található zárójelben szereplő számok az egyes pontok kifizetései. A játék szintén szekvenciális, tehát az 1. játékos dönt az első döntésről (balra vagy jobbra), és a 2. játékos dönt az 1. játékos után (fel vagy le).
1.ábra
A visszafelé történő indukció, mint az összes játékelmélet, a racionalitás és a maximalizálás feltételezéseit használja, ami azt jelenti, hogy a 2. játékos maximalizálja kifizetését bármely adott helyzetben. Mindkét információkészletnél két lehetőség van, mindegyikük négy. Azáltal, hogy kizárjuk azokat a lehetőségeket, amelyeket a 2. játékos nem választ, szűkítjük a fánkat. Ily módon meghúzzuk azokat a vonalakat, amelyek maximalizálják a játékos kifizetését az adott információkészletnél.
2. ábra
Ez a csökkentés után az 1-es játékos maximalizálhatja kifizetéseit, miután a 2-es játékos választása ismertté vált. Az eredmény egy egyensúly, amelyet az 1. játékos „jobb” választása és a 2. játékos „fel” kiválasztása visszafelé történő indukciója eredményez. Az alábbiakban bemutatjuk a játék megoldását, kiemelve az egyensúlyi pályát.
3. ábra
Például könnyen beállíthat egy hasonló játékot, mint a fenti, és társaságokat használnak játékosként. Ez a játék tartalmazhat termékkibocsátási forgatókönyveket. Ha az 1. vállalat egy terméket szeretne kiadni, akkor mit tehet a 2. vállalat válaszul? Kiadja a 2. társaság hasonló versengő terméket? Az új termék értékesítésének előrejelzésével különböző forgatókönyvekben felállíthatunk egy játékot annak előrejelzésére, hogy az események miként alakulhatnak ki. Az alábbiakban bemutatunk egy példát egy ilyen játék modellezésére.
4. ábra