Главни » посао » Индукција уназад

Индукција уназад

посао : Индукција уназад
Шта је повратна индукција?

Индукција уназад у теорији игара је итеративни процес расуђивања уназад у времену, од краја проблема или ситуације, решавања коначне опсежне форме и секвенцијалних игара, те закључивања низа оптималних радњи.

Објашњена уназад индукција

Повратна индукција користи се за решавање игара откад су Јохн вон Неуманн и Оскар Моргенстерн успоставили теорију игара као академски предмет када су 1944. године објавили своју књигу „ Тхеори оф Гамес анд Ецономиц Бехавиор“ .

У свакој фази игре уназад индукција одређује оптималну стратегију играча који направи последњи потез у игри. Тада се одређује оптимална акција следећег играча који се креће, узимајући последњу акцију играча као задану. Овај процес се наставља уназад све док се не утврди најбоља акција за сваки тренутак у времену. Ефективно, једно је одређивање Насх-ове равнотеже сваког подгаме у оригиналној игри.

Међутим, резултати изведени из назадне индукције често не могу предвидјети стварну људску игру. Експерименталне студије су показале да се „рационално“ понашање (као што је предвиђено теоријом игара) ретко излаже у стварном животу. Ирационални играчи могу заправо добити веће исплате од предвиђених уназад индукцијом, као што је приказано у игри с центипедом.

У игри стогодишњака, два играча наизменично добијају шансу да заузму већи удио у растућем лонцу новца или да га пренесу другом играчу. Исплате су распоређене тако да ако се лонац преда нечијем противнику, а противник га узме у следећем кругу, један ће добити нешто мање него ако би га узео у овом кругу. Игра се закључује чим играч преузме застој, при чему тај играч добија већи део, а други играч мањи део.

Пример индукције уназад

Као пример, претпоставимо да је играч А на првом месту и да мора да одлучи да ли би требало да "узме" или "прође" улог, а тренутно износи 2 долара. Ако узме, тада А и Б добијају по 1 УСД, али ако А прође, играч Б. треба да донесе одлуку о преносу или пролазу. Ако Б узме, она добија 3 УСД (тј. Претходни улог од $ 2 + $ 1) и А добија 0 УСД. Али ако Б прође, А сада треба да одлучи да ли ће узети или проћи, и тако даље. Ако оба играча увек одлуче да прођу, на крају игре добијају исплату у износу од 100 УСД.

Смисао игре је ако А и Б обоје сарађују и наставе до краја игре, добијају максималну исплату од 100 УСД сваки. Али ако не верују другом играчу и очекују да ће их "примити" у првој прилици, Неш равнотежа предвиђа да ће играчи поднети најмањи могући захтев (у овом случају 1 УСД).

Насх-ова равнотежа ове игре, где ниједан играч нема подстицаја да одступи од своје одабране стратегије након разматрања избора противника, сугерише да би први играч узео пот у првој рунди игре. Међутим, у стварности, релативно мало играча то чини. Као резултат, они добијају већу исплату од оне која је предвиђена анализом равнотеже.

Решавање секвенцијалних игара користећи уназад индукцију

Испод је једноставна секвенцијална игра између два играча. Ознаке са Плаиер 1 и Плаиер 2 унутар њих су сетови информација за играче један или два, респективно. Бројеви у заградама на дну стабла представљају исплату у свакој тачки. Игра је такође секвенцијална, па играч 1 доноси прву одлуку (лево или десно), а играч 2 доноси одлуку након играча 1 (горе или доле).

Слика 1

Повратна индукција, као и свака теорија игара, користи претпоставке рационалности и максимизације, што значи да ће Плаиер 2 у свакој датој ситуацији максимизирати свој добитак. У оба скупа информација имамо два избора, четири укупно. Елиминацијом избора које Плаиер 2 неће изабрати, можемо сузити своје дрво. На овај начин ћемо подебљати линије које повећавају исплату играча у датом скупу информација.

Слика 2

Након овог смањења, Плаиер 1 може максимизирати своје исплате сада када су избори за играча 2 познати. Резултат је равнотежа пронађена повратном индукцијом играча 1 који бира "исправно" и играча 2 бира "горе". Испод је решење игре са подешеном равнотежном стазом.

Слика 3

На пример, лако би се могла поставити игра слична оној горе користећи компаније као играче. Ова игра може укључивати сценарије издања производа. Ако је компанија 1 желела да објави производ, шта би компанија 2 могла да реагује "> предвиђајући продају овог новог производа у различитим сценаријима, можемо да поставимо игру која би предвиђала како ће се догађаји одвијати. Испод је пример како се може моделирати таква игра.

Слика 4

Упоредите инвестиционе рачуне Име добављача Опис Откривање оглашивача × Понуде које се појављују у овој табели су од партнерстава од којих Инвестопедиа прима накнаду.

Сродни услови

Дефиниција игре са центипедом Теорија центипеда у теорији игара укључује два играча који наизменично добивају прилику да заузму већи удио у све већој залог новца. више Како функционира теорија игара Теорија игара је оквир за моделирање сценарија у којима постоји сукоб интереса међу играчима. више Игра са нултом сумом Ситуација у којој је добит једне особе једнака губитку друге, тако да је нето промена богатства или користи једнака нули. Игра са нултом сумом може имати само два играча или милионе учесника. више Насх Екуилибриум Насх Екуилибриум је концепт унутар теорије игара где је оптималан исход игре тамо где нема подстицаја да се одступи од њихове почетне стратегије. више Путничка дилема Дефиниција Путника дилема показује парадокс рационалности - да нелогично доношење одлука често доноси бољи исплативост у теорији игара. више Дефиниција новчаних подударности Усклађивање пенија основни је пример теорије игара који показује како рационални доносиоци одлука желе да максимизирају своје отплате. више партнерских веза
Рецоммендед
Оставите Коментар