OqPoWah.com

Nashovo ravnotežje. Teorija iger za ekonomiste (John Nash)

V tridesetih letih, John von Neumann

Oscar Morgenstern pa je postal ustanovitelj novega zanimivega področja matematike, ki se je imenoval »teorija iger«. V petdesetih letih 20. stoletja se je v tej smeri zanimal mladi matematik John Nash. Teorija ravnovesja je postala tema svoje teze, ki jo je napisal, ko je bil star 21 let. Tako se je rodila nova strategija za igre, imenovane "Nash Equilibrium", ki je leta 1994 dobila Nobelovo nagrado - leta 1994.

Nashovo ravnotežje

Dolga vrzel med pisanjem disertacije in univerzalnim priznanjem je postala test matematike. Genius brez priznanja je povzročil resne duševne kršitve, vendar to nalogo John Nash bi se lahko rešil zaradi lepega logičnega uma. Njegova teorija "ravnotežja Nasha" je dobila Nobelovo nagrado in njegovo življenje v filmski adaptaciji "Beautiful Mind".

Na kratko o teoriji iger

Ker Nashova teorija ravnovesja razlaga vedenje ljudi pod pogoji interakcije, zato je vredno razmisliti o osnovnih pojmih teorije iger.

Teorija iger raziskuje vedenje udeležencev (agentov) v razmerah medsebojne interakcije po vrsti igre, kjer je rezultat odvisen od odločitve in vedenja več ljudi. Udeleženec odloča na podlagi njegovih napovedi o vedenju počitka, ki se imenuje strategija igre.

Obstaja tudi prevladujoča strategija, v kateri udeleženec dobi optimalen rezultat za vsako vedenje drugih udeležencev. To je najboljša strategija win-win za igralca.

Zapornikova dilema in znanstveni preboj

Dilema zapornika je primer igre, ko so udeleženci prisiljeni odločati in dosegati skupni cilj v konfliktnem stanju alternativ. Vprašanje je, katere od teh možnosti je izbral, zavedajoč se njegovega osebnega in splošnega interesa ter nezmožnosti, da bi dobili oboje. Zdi se, da so igralci zapleteni v težkih igralnih pogojih, ki jih včasih naredijo zelo produktivno.

Nashovi ravnotežni primeri

To dilemo je raziskal ameriški matematik John Nash. Ravnotežje, ki ga je ustvaril, je postalo revolucionarno na svoj način. Močna novo misel vplivala na mnenja ekonomistov o tem, kako narediti različne akterjev na trgu, pri čemer se upoštevajo interese drugih, z gosto interakcije in križišče interesov.

Najbolje je preučiti teorijo iger na konkretnih primerih, saj ta sama matematična disciplina ni suha teoretična.

Primer zaporne dilemo

Na primer, dve osebi sta storili rop, padli v roke policije in jih zaslišali v ločenih celicah. Hkrati policisti nudijo vsaki stranki ugodne pogoje, pod katerimi bodo izpustili v primeru pričanja proti njegovemu partnerju. Vsak od kriminalcev ima naslednje vrste strategij, ki jih bo upošteval:

  1. Obe hkrati pričata in prejemata 2,5 leta zapora.
  2. Oba sta tiho istočasno in prejmeta 1 leto, saj bo v tem primeru dokazna baza njihove krivde majhna.
  3. Eden daje pričanje in dobi svobodo, drugi pa molče in prejme 5 let zapora.

Očitno je, da je izid primera odvisen od odločitve obeh udeležencev, vendar se ne morejo strinjati, ker sedijo v različnih celicah. Prav tako je jasno viden konflikt njihovih osebnih interesov v boju za skupni interes. Vsak zapornik ima dve možnosti za ukrepanje in 4 možnosti za izide.

Veriga logičnih dedukcij

Torej, kazensko A upošteva naslednje možnosti:

  1. Jaz tiho in moj partner je tiho - oba bomo prejeli 1 leto zapora.
  2. Jaz predam partnerja in se mi preda - oba dobiva 2,5 leta zapora.
  3. Jaz tiho, in moj partner me je dal - bom dobil 5 let v zaporu in je brezplačen.
  4. Jaz predal partnerja in je tiho - dobim svobodo in je pet let zapora.

Podajamo matrico možnih rešitev in rezultatov za jasnost.

Tabela verjetnih rezultatov dileme zapornika.

Nashova teorija ravnotežja

Vprašanje je, kaj bo izbral vsak udeleženec?

"Tišina, ne moreš govoriti" ali "ne moreš molčati, ne moreš govoriti"

Če želite razumeti izbiro udeleženca, morate iti skozi verigo svojih razmišljanj. Po obrazložitvi zločinca In če rečem nič in niti ne govorimo moj partner, bomo dobili minimalno obdobje (1 leto), vendar ne vidim, kako se bo obnašal. Če bo pričal proti meni, potem je tudi bolje, da pričam, sicer lahko sedim 5 let. Bolje je, da sedim 2,5 leta, kot za 5 let. Če ne pove ničesar, potem moram še več pričevati, ker bom brezplačen. Tudi udeleženec B trdi tudi.

John Nash Equilibrium

Ni težko razumeti, da je prevladujoča strategija za vsakega kriminala dokazovanje. Najboljša točka te igre je, ko oba kriminalca predložita dokaze in prejmejo svojo "nagrado" - 2,5 leta zapora. Nashova teorija igre pravi, da je ravnovesje.

Optimalna Optimalna Nashova rešitev

Revolucionarna narava Nashevovega pogleda je, kaj je ravnovesje Ni optimalno, če upoštevamo posameznega udeleženca in njegovega osebnega interesa. Konec koncev, najboljša možnost je, da molčite in brezplačno.




Nashovo ravnotežje je skupna točka zanimanja, kjer vsak udeleženec izbere možnost, ki je zanj optimalna le, če drugi udeleženci izberejo določeno strategijo.

Če upoštevamo možnost, če oba kriminalca molčata in prejmeta le eno leto, jo lahko imenujemo Pareto-optimalna možnost. Vendar pa je to mogoče le, če bi se lahko kriminalci dogovorili vnaprej. Toda tudi to ne bi zagotovilo tega rezultata, saj se skušnjava umika iz prepričanja in izogibanja kazni odlična. Odsotnost popolnega zaupanja drug drugemu in nevarnost pridobivanja 5 let zahteva, da se izbere varianta s priznanjem. Če razmišljamo o dejstvu, da se bodo udeleženci držali možnosti z molkom, se bodo z delom uskladili preprosto nerazumni. Takšen zaključek lahko naredimo, če preučimo ravnovesje Nasha. Primeri dokazujejo le resnico.

Sebičnost ali racionalnost

Nashova teorija ravnovesja je prinesla neverjetne sklepe, ki so nasprotovali že obstoječim načelom. Adam Smith je na primer vedel, da je vsak udeleženec popolnoma seksi, kar je sistem prineslo ravnovesje. Ta teorija je bila imenovana "nevidna roka trga".

John Nash teorija ravnovesja

John Nash je ugotovil, da če vsi udeleženci delujejo in si prizadevajo samo za lastne interese, potem to nikoli ne bo vodilo do optimalnega rezultata skupine. Glede na to, da je racionalno razmišljanje značilno za vsakega udeleženca, je verjetnost izbire, ki jo nudi strategija ravnotežja Nash, večja.

Preprosto moški eksperiment

Živahen primer je igra "paradoksne plavuše", ki je čeprav se zdi neprimerna, živahna ilustracija, ki prikazuje, kako deluje Nashova teorija iger.

V tej igri morate zamisliti, da je družba prostih fantov prišla v bar. V bližini je družina deklet, od katerih je ena bolje za druge, pravijo blondinka. Kako se fantje vodijo, da bi dobili najboljšo punco zase?

stanje je uravnoteženo

Torej, obrazložitev fantov: če se vsi začnejo spoznavati z blondinko, potem najverjetneje ne bodo nikogar prišli, potem se njeni prijatelji ne želijo srečati. Nihče ne želi biti druga možnost za varnostno kopiranje. Ampak, če se fantje odločijo, da bi se izognili blondinji, je verjetnost, da vsak fant najde dobro dekle med dekleti, velik.

Položaj ravnovesja Nash ni optimalen za fantje, ker bi si prizadevali samo za svoje lastne sebične interese, vsakdo bi izbral blondinko. Vidimo lahko, da bo uresničevanje samo sebičnih interesov enakovredno propadu skupinskih interesov. Ravnotežje po Nashu bo pomenilo, da vsak človek deluje v svojem lastnem interesu, ki pride v stik z interesi celotne skupine. To je ne-optimalna možnost za vsakogar osebno, vendar optimalno za vse, ki temelji na splošni strategiji uspeha.

Vse naše življenje je igra

Odločanje v realnih razmerah je zelo podobno igri, ko pričakujete določeno racionalno vedenje drugih udeležencev. V podjetju, pri delu, v skupini, v podjetju in celo v odnosih z nasprotnim polom. Od velikih transakcij do običajnih življenjskih razmer se vse ukvarja z enim ali drugim zakonom.

Nashova teorija igre

Seveda so razmere, ki so v igri, povezane s kriminalci in bar, odlične ilustracije, ki kažejo ravnotežje Nasha. Primeri takšnih dilem pogosto nastajajo na pravem trgu, še posebej pa deluje v primerih, ko dva monopolista nadzorujejo trg.

Mešane strategije

Pogosto smo vključeni ne v eno, temveč v več iger. Izberete eno od možnosti za eno igro, vodeno z racionalno strategijo, vendar boste prišli v drugo igro. Po več racionalnih odločitvah boste morda ugotovili, da vaš rezultat ne ustreza. Kaj naj storim?

Razmislite o dveh vrstah strategije:

  • Čista strategija je vedenje udeleženca, ki izhaja iz razmišljanja o možnem vedenju drugih udeležencev.
  • Mešana strategija ali naključna strategija naključno izmenjuje čiste strategije ali izbira čisto strategijo z določeno verjetnostjo. Ta strategija se imenuje tudi Randomized.

Nashovo ravnotežje v mešanih strategijah

Glede na to vedenje dobimo nov pogled na ravnovesje nad Neshu. Če ste že rekli, da igralec enkrat izbere strategijo, si lahko predstavljate drugo vedenje. Lahko pustite možnost, da igralci izberejo strategijo naključno z določeno verjetnostjo. Igre, v katerih je Nashovo ravnotežje v čistih strategijah nemogoče najti, jih vedno mešati.

Nash Equilibrium v ​​mešanih strategij imenovanih mešanih ravnovesiem.Eto kot stanje, kjer je vsak udeleženec izbere svoje strategije za izbiro optimalne frekvence pod pogojem, da drugi udeleženci izberejo svoje strategije z vnaprej določeno frekvenco.

Kazen in mešana strategija

Primer mešane strategije je mogoče navesti v igri nogometa. Najboljša ilustracija mešane strategije je morda kazenska streljanja. Torej, imamo vratarja, ki lahko skoči samo v enem kotu, in igralec, ki bo udaril kazen.

Torej, če prvič igralec izbere strategijo za zadetek v levem kotu, in vratar pade tudi v ta kot in ujame žogo, kako se lahko drugi dogodki razvijejo? Če igralec zadene nasprotni vogal, je to verjetno preveč očitno, vendar udarec v isti kot ni nič manj očiten. Zato tako vratar kot napadalec nimata druge izbire, kot da se zanesejo na naključno izbiro.

Torej, izmenično naključno izbiro z določeno čisto strategijo, igralec in vratar poskušajo doseči največji rezultat.

Zdieľať na sociálnych sieťach:

Príbuzný