Noong 1930s, sina John von Neumann at Oscar Morgenstern ang naging tagapagtatag ng bago at kawili-wiling sangay ng matematika na tinatawag na "teorya ng laro". Noong 1950s, naging interesado ang batang matematiko na si John Nash sa direksyong ito. Ang teorya ng ekwilibriyo ay naging paksa ng kanyang disertasyon, na isinulat niya sa edad na 21. Sa gayon ay ipinanganak ang isang bagong diskarte sa laro na tinatawag na "Nash Equilibrium", na nanalo ng Nobel Prize pagkalipas ng maraming taon - noong 1994.
Ang mahabang agwat sa pagitan ng pagsulat ng disertasyon at pangkalahatang pagkilala ay naging pagsubok para sa isang mathematician. Ang henyo na walang pagkilala ay nagresulta sa malubhang sakit sa pag-iisip, ngunit nagawa ni John Nash na lutasin ang problemang ito salamat sa kanyang mahusay na lohikal na pag-iisip. Ang kanyang Nash Equilibrium theory ay nanalo ng Nobel Prize at ang kanyang buhay ay kinunan sa Beautiful mind.
Maikling tungkol sa teorya ng laro
Dahil ipinapaliwanag ng teorya ng Nash equilibrium ang pag-uugali ng mga tao sa mga kondisyon ng pakikipag-ugnayan, nararapat na isaalang-alang ang mga pangunahing konsepto ng teorya ng laro.
Ang teorya ng laro ay pinag-aaralan ang pag-uugali ng mga kalahok (mga ahente) sa mga tuntunin ng pakikipag-ugnayan sa isa't isa tulad ng isang laro, kapag ang kinalabasan ay nakasalalay sa desisyon at pag-uugali ng ilang tao. Ang kalahok ay gumagawa ng mga desisyon batay sa kanyang mga hula tungkol sa pag-uugali ng iba, na tinatawag na diskarte sa laro.
Mayroon ding nangingibabaw na diskarte kung saan nakukuha ng kalahok ang pinakamahusay na resulta para sa anumang pag-uugali ng ibang mga kalahok. Ito ang pinakamahusay na diskarte sa panalo-panalo ng manlalaro.
Prisoner's dilemma and scientific breakthrough
Ang Prisoner's dilemma ay isang kaso ng isang laro kung saan ang mga kalahok ay napipilitang gumawa ng mga makatwirang desisyon, na nakakamit ang isang karaniwang layunin sa harap ng isang salungatan ng mga alternatibo. Ang tanong ay kung alin sa mga pagpipiliang ito ang pipiliin niya, na napagtatanto ang personal at pangkalahatang interes, pati na rin ang imposibilidad na makuha ang pareho. Ang mga manlalaro ay tila nakakulong sa isang mahirap na kapaligiran ng laro, na kung minsan ay nagpapaisip sa kanila nang napakaproduktibo.
Ang dilemma na ito ay ginalugad ng American mathematician na si John Nash. Ang balanseng naabot niya ay rebolusyonaryo sa sarili nitong paraan. Lalong maliwanag na naiimpluwensyahan ng bagong kaisipang ito ang opinyon ng mga ekonomista tungkol sa kung paano gumagawa ng mga pagpipilian ang mga manlalaro sa merkado, na isinasaalang-alang ang mga interes ng iba, na may malapit na pakikipag-ugnayan at intersection ng mga interes.
Pinakamainam na pag-aralan ang teorya ng laro sa pamamagitan ng mga konkretong halimbawa, dahil ang disiplinang ito sa matematika mismo ay hindi dryly theoretical.
Halimbawa ng dilemma ng bilanggo
Halimbawa, dalawang tao ang nagnakaw, nahulog sa mga kamay ng pulis at ini-interrogate sa magkahiwalay na selda. Kasabay nito, ang mga opisyal ng pulisya ay nag-aalok sa bawat kalahok ng mga paborableng kondisyon kung saan siya ay palayain kung siya ay tumestigo laban sa kanyang kapareha. Ang bawat isa saang mga kriminal ay may mga sumusunod na hanay ng mga diskarte na isasaalang-alang niya:
- Parehong nagpapatotoo nang sabay at nakulong ng 2.5 taon.
- Parehong tahimik ang dalawa at tumatanggap ng 1 taon bawat isa, dahil sa kasong ito ay magiging maliit ang ebidensyang basehan ng kanilang pagkakasala.
- Ang isa ay tumestigo at pinalaya, habang ang isa ay tahimik at nakulong ng 5 taon.
Malinaw, ang kinalabasan ng kaso ay nakasalalay sa desisyon ng parehong kalahok, ngunit hindi sila maaaring sumang-ayon, dahil sila ay nakaupo sa magkaibang mga selda. Kitang-kita rin ang salungatan ng kanilang mga personal na interes sa pakikibaka para sa iisang interes. Ang bawat isa sa mga bilanggo ay may dalawang opsyon para sa pagkilos at 4 na opsyon para sa mga resulta.
Chain of logical inferences
Kaya, isinasaalang-alang ng nagkasala A ang mga sumusunod na opsyon:
- Tahimik ako at tahimik ang partner ko - pareho tayong makukulong ng 1 taon.
- Ibinigay ko ang aking kapareha at ibinalik niya ako - pareho kaming nakulong ng 2.5 taon.
- Tahimik ako, at pinagtaksilan ako ng partner ko - Makulong ako ng 5 taon, at makakalaya na siya.
- Ibinigay ko ang aking kapareha, ngunit siya ay tahimik - Nagkakaroon ako ng kalayaan, at siya ay nakulong ng 5 taon.
Magbigay tayo ng matrix ng mga posibleng solusyon at resulta para sa kalinawan.
Talahanayan ng mga posibleng resulta ng dilemma ng bilanggo.
Ang tanong, ano ang pipiliin ng bawat kalahok?
"Tumahimik ka, hindi ka makapagsalita" o "Hindi ka maaaring manahimik, hindi ka makapagsalita"
Upang maunawaan ang pinili ng kalahok, kailangan mong dumaan sa tanikala ng kanyang mga iniisip. Kasunod ng pangangatwiran ng kriminal A: kung mananatiling tahimik ako at ang aking kapareha ay mananatiling tahimik, makakatanggap kami ng isang minimum na termino (1 taon), ngunit akoHindi ko alam kung paano siya mag-aasal. Kung tumestigo siya laban sa akin, mas mabuti na akong tumestigo, kung hindi, maaari akong umupo ng 5 taon. Mas gugustuhin kong maupo ng 2.5 taon kaysa 5 taon. Kung siya ay tumahimik, kung gayon mas kailangan kong tumestigo, dahil sa ganoong paraan ay makukuha ko ang aking kalayaan. Kalahok B.
Hindi mahirap makita na ang nangingibabaw na diskarte para sa bawat isa sa mga salarin ay ang tumestigo. Ang pinakamainam na punto ng larong ito ay dumating kapag ang parehong mga kriminal ay tumestigo at tumanggap ng kanilang "premyo" - 2.5 taon sa bilangguan. Ang teorya ng larong Nash ay tinatawag itong equilibrium.
Hindi pinakamainam na solusyon sa Nash
Ang rebolusyonaryong katangian ng pananaw ng Nashian ay ang gayong ekwilibriyo ay hindi pinakamainam kapag isinasaalang-alang ang indibidwal na kalahok at ang kanyang pansariling interes. Pagkatapos ng lahat, ang pinakamagandang opsyon ay ang manatiling tahimik at umalis nang libre.
Ang Nash equilibrium ay isang punto ng convergence ng mga interes, kung saan pipiliin ng bawat kalahok ang opsyon na pinakamainam para sa kanya lamang kung ang ibang kalahok ay pumili ng isang partikular na diskarte.
Isinasaalang-alang ang opsyon kapag ang parehong kriminal ay tahimik at nakatanggap lamang ng 1 taon, matatawag namin itong isang Pareto-optimal na opsyon. Gayunpaman, ito ay posible lamang kung ang mga kriminal ay maaaring sumang-ayon nang maaga. Ngunit kahit na ito ay hindi magagarantiyahan ang kahihinatnan na ito, dahil ang tuksong umatras sa kasunduan at maiwasan ang parusa ay malaki. Ang kakulangan ng kumpletong tiwala sa isa't isa at ang panganib ng pagkuha ng 5 taon ay pinilit na piliin ang opsyon na may pagkilala. Pag-isipan kung ano ang susundin ng mga kalahokopsyon na may katahimikan, kumikilos sa konsyerto, ay hindi makatwiran. Ang ganitong konklusyon ay maaaring makuha kung pag-aaralan natin ang Nash equilibrium. Ang mga halimbawa ay nagpapatunay lamang na tama ka.
Makasarili o makatuwiran
Ang Nash Equilibrium Theory ay nagbunga ng mga nakagugulat na konklusyon na pinabulaanan ang mga prinsipyong umiral noon. Halimbawa, itinuring ni Adam Smith ang pag-uugali ng bawat isa sa mga kalahok bilang ganap na makasarili, na nagdala ng sistema sa balanse. Ang teoryang ito ay tinawag na “invisible hand of the market.”
Nakita ni John Nash na kung kumilos ang lahat ng kalahok sa kanilang sariling mga interes, hinding-hindi ito hahantong sa pinakamainam na resulta ng grupo. Dahil likas sa bawat kalahok ang makatuwirang pag-iisip, mas malamang ang pagpipiliang inaalok ng diskarte ng Nash equilibrium.
Prely male experiment
Ang pangunahing halimbawa ay ang blonde na paradox na laro, na, bagama't tila wala sa lugar, ay isang malinaw na paglalarawan kung paano gumagana ang teorya ng laro ni Nash.
Sa larong ito kailangan mong isipin na isang kumpanya ng mga libreng lalaki ang dumating sa isang bar. Sa malapit ay isang kumpanya ng mga batang babae, na ang isa ay mas kanais-nais kaysa sa iba, sabi ng isang blonde. Paano kumilos ang mga lalaki para makuha ang pinakamahusay na kasintahan para sa kanilang sarili?
Kaya, ang pangangatwiran ng mga lalaki: kung ang lahat ay nagsimulang makilala ang blonde, kung gayon, malamang, walang makakakuha nito, kung gayon ang kanyang mga kaibigan ay hindi nais na makilala. Walang gustong maging pangalawang fallback. Pero kung pipiliin ng mga lalaki na umiwasblonde, kung gayon ang posibilidad para sa bawat isa sa mga lalaki na makahanap ng magandang kasintahan sa mga babae ay mataas.
Ang sitwasyon ng Nash equilibrium ay hindi pinakamainam para sa mga lalaki, dahil, na hinahabol lamang ang kanilang mga pansariling interes, pipiliin ng lahat ang blonde. Makikita na ang paghahangad ng mga pansariling interes lamang ay katumbas ng pagbagsak ng mga interes ng grupo. Ang equilibrium ng Nash ay nangangahulugan na ang bawat tao ay kumikilos sa kanyang sariling mga interes, na nakikipag-ugnayan sa mga interes ng buong grupo. Hindi ito ang pinakamahusay na opsyon para sa lahat nang personal, ngunit ang pinakamahusay para sa lahat, batay sa pangkalahatang diskarte para sa tagumpay.
Buong buhay natin ay isang laro
Paggawa ng desisyon sa totoong mundo ay parang isang laro kung saan inaasahan mo rin ang ilang makatwirang pag-uugali mula sa ibang mga kalahok. Sa negosyo, sa trabaho, sa isang team, sa isang kumpanya, at maging sa mga relasyon sa opposite sex. Mula sa malalaking deal hanggang sa ordinaryong sitwasyon sa buhay, lahat ay sumusunod sa isang batas o iba pa.
Siyempre, ang mga sitwasyon sa laro sa itaas na may mga kriminal at isang bar ay mga mahuhusay na paglalarawan lamang na nagpapakita ng balanse ng Nash. Ang mga halimbawa ng gayong mga dilemma ay madalas na lumitaw sa tunay na merkado, at ito ay gumagana lalo na sa mga kaso kung saan dalawang monopolist ang kumokontrol sa merkado.
Mga Pinaghalong Istratehiya
Kadalasan hindi kami kasali sa isa, ngunit ilang laro nang sabay-sabay. Ang pagpili ng isa sa mga opsyon sa isang laro, na ginagabayan ng isang makatwirang diskarte, ngunit napupunta ka sa isa pang laro. Pagkatapos ng ilang makatwirang desisyon, maaari mong makita na ang iyong resulta ay hindi mo gusto. Anokunin?
Pag-isipan natin ang dalawang uri ng diskarte:
- Ang dalisay na diskarte ay ang pag-uugali ng kalahok, na nagmumula sa pag-iisip tungkol sa posibleng pag-uugali ng ibang mga kalahok.
- Ang Mixed strategy o random na diskarte ay ang paghahalili ng mga purong diskarte nang random o ang pagpili ng purong diskarte na may tiyak na posibilidad. Ang diskarteng ito ay tinatawag ding randomized.
Isinasaalang-alang ang gawi na ito, nagkakaroon tayo ng bagong pagtingin sa Nash equilibrium. Kung mas maaga ay sinabi na ang manlalaro ay pipili ng isang diskarte nang isang beses, kung gayon ang isa pang pag-uugali ay maiisip. Maaaring ipagpalagay na ang mga manlalaro ay pipili ng isang diskarte nang random na may tiyak na posibilidad. Ang mga larong hindi mahanap ang Nash equilibria sa mga purong diskarte ay palaging may mga ito sa magkahalong diskarte.
Ang Nash equilibrium sa magkahalong diskarte ay tinatawag na mixed equilibrium. Ito ay isang equilibrium kung saan pinipili ng bawat kalahok ang pinakamainam na dalas ng pagpili ng kanyang mga diskarte, sa kondisyon na ang ibang mga kalahok ay pumili ng kanilang mga diskarte na may ibinigay na dalas.
Mga parusa at pinaghalong diskarte
Makikita ang isang halimbawa ng pinaghalong diskarte sa laro ng football. Ang pinakamahusay na paglalarawan ng isang pinaghalong diskarte ay marahil isang pen alty shootout. Kaya, mayroon kaming goalkeeper na maaari lamang tumalon sa isang sulok, at isang manlalaro na kukuha ng pen alty.
Kaya, kung sa unang pagkakataon na pipiliin ng manlalaro ang diskarte sa pag-shoot sa kaliwang sulok, at ang goalkeeper ay nahuhulog din sa sulok na ito at nasalo ang bola, paano mabubuo ang mga bagay sa pangalawang pagkakataon? Kung ang manlalaroay tatama sa kabaligtaran na sulok, ito ay malamang na masyadong halata, ngunit ang pagpindot sa parehong sulok ay hindi gaanong halata. Samakatuwid, pareho ang goalkeeper at ang kicker ay walang pagpipilian kundi ang umasa sa random na pagpili.
Kaya, sa pamamagitan ng pagpapalit ng random na pagpili sa isang tiyak na purong diskarte, sinusubukan ng manlalaro at ng goalkeeper na makuha ang pinakamataas na resulta.