Prisoner ‘ s Dilemma: welk spel speel je?

geplaatst in: Articles | 0

In dit klassieke speltheorie-experiment moet u beslissen: een ander voor persoonlijk voordeel verraden, of meewerken? Het antwoord kan ingewikkelder zijn dan je denkt.

***

Wat is er nodig om mensen met elkaar samen te laten werken wanneer de prikkels om voornamelijk uit eigenbelang te handelen vaak zo sterk zijn?

Het dilemma van de gevangene is een gedachte-experiment dat voortkomt uit de speltheorie., Ontworpen om de manieren waarop we samenwerken te analyseren, verwijdert het de variaties tussen specifieke situaties waarin mensen worden opgeroepen om de drang om egoïstisch te zijn te overwinnen. Politicoloog Robert Axelrod legt de basis voor de ontwikkeling van de samenwerking:

onder welke voorwaarden zal samenwerking ontstaan in een wereld van egoïsten zonder centrale autoriteit? Deze vraag heeft mensen lange tijd geïntrigeerd. En met een goede reden. We weten allemaal dat mensen geen engelen zijn en dat ze de neiging hebben om eerst voor zichzelf en voor zichzelf te zorgen., Toch weten we ook dat samenwerking plaatsvindt en dat onze beschaving daarop is gebaseerd. Maar in situaties waar elk individu een stimulans heeft om zelfzuchtig te zijn, hoe kan samenwerking zich ooit ontwikkelen?

… om vooruitgang te boeken in het begrijpen van de grote verscheidenheid aan specifieke situaties die deze eigenschap hebben, is een manier nodig om te vertegenwoordigen wat gemeenschappelijk is aan deze situaties zonder vast te zitten in de details die uniek zijn voor elk…het beroemde Prisoner ‘ s Dilemma spel.,

Het gedachte-experiment gaat als volgt: twee criminelen zitten in aparte cellen, niet in staat om te communiceren, beschuldigd van een misdrijf waaraan ze beiden deelnamen. De politie heeft niet genoeg bewijs om beide zonder verder bewijs te veroordelen, hoewel ze zeker genoeg zijn om ervoor te zorgen dat ze beiden tijd in de gevangenis doorbrengen. Dus bieden ze de gevangenen een deal aan. Ze kunnen elkaar beschuldigen van het misdrijf, onder de volgende voorwaarden:

  • als beide gevangenen zeggen dat de ander het gedaan heeft, zal elk twee jaar in de gevangenis zitten.,als de ene gevangene zegt dat de andere het gedaan heeft en de andere zwijgt, zal de verdachte drie jaar zitten en de aanklager nul.
  • als beide gevangenen zwijgen, zal elk een jaar in de gevangenis zitten.

in de speltheorie wordt het altruïstische gedrag (zwijgen) “samenwerken” genoemd, terwijl het beschuldigen van de ander “overlopen” wordt genoemd.”

Wat moeten ze doen?

als ze in staat waren om te communiceren en ze vertrouwden elkaar, de rationele keuze is om te zwijgen; op die manier hebben ze minder tijd in de gevangenis dan ze anders zouden doen., Maar hoe kunnen ze weten dat de ander ze niet zal beschuldigen? Immers, mensen hebben de neiging om te handelen uit eigenbelang. De kosten om te zwijgen zijn te hoog. De verwachte uitkomst wanneer het spel wordt gespeeld is dat beide beschuldigen de ander en dienen twee jaar. (In de echte wereld, we betwijfelen het. Nadat ze hun tijd hebben uitgezeten, is het niet moeilijk voor te stellen dat ze nog steeds boos zijn. Twee jaar is veel tijd voor een veer om op een negatieve manier te spoelen. Misschien brengen ze de rest van hun leven met elkaar door.,)

het Iterated Prisoner ’s Dilemma

een complexere vorm van het gedachte-experiment is het iterated Prisoner’ s Dilemma, waarbij we ons voorstellen dat dezelfde twee gevangenen zich meerdere keren in dezelfde situatie bevinden. In deze versie van het experiment, ze zijn in staat om hun strategie aan te passen op basis van de vorige uitkomst.

als we het scenario herhalen, kan het lijken alsof de gevangenen zullen beginnen samen te werken. Maar dit is niet logisch in termen van speltheorie., Wanneer ze weten hoe vaak het spel zal herhalen, hebben beide een stimulans om te beschuldigen op de laatste ronde, aangezien er geen vergelding kan zijn. Wetende dat de ander zeker zal beschuldigen op de laatste ronde, beide hebben een stimulans om te beschuldigen op de voorlaatste ronde—en zo verder, terug naar het begin.

Gregory Mankiw vat als volgt samen hoe moeilijk het is om samenwerking in bedrijfseconomie te modelleren:

om te zien hoe moeilijk het is om samenwerking in stand te houden, stel je voor dat, voordat de politie gevangen werd genomen . . . de twee criminelen hadden een pact gesloten om niet te bekennen., Het is duidelijk dat deze overeenkomst hen beiden beter af zou maken als ze zich daaraan zouden houden, omdat ze elk slechts één jaar in de gevangenis zouden doorbrengen. Maar zouden de twee misdadigers in feite zwijgen, gewoon omdat ze hadden ingestemd? Zodra ze afzonderlijk worden ondervraagd, neemt de logica van eigenbelang het over en leidt hen tot bekennen. Samenwerking tussen de twee gevangenen is moeilijk te handhaven omdat samenwerking individueel irrationeel is.

coöperatieve strategieën kunnen echter evolueren als we het spel modelleren als willekeurige of oneindige iteraties., Als elke gevangene weet dat ze waarschijnlijk in de toekomst met elkaar zullen communiceren, zonder kennis of verwachting zal hun relatie een definitief einde hebben, wordt de samenwerking aanzienlijk waarschijnlijker. Als we ons voorstellen dat de gevangenen naar dezelfde gevangenis zullen gaan of in dezelfde kringen zullen lopen als ze eenmaal zijn vrijgelaten, kunnen we begrijpen hoe de prikkel voor samenwerking zou kunnen toenemen. Als je een overloper bent, is het lastig om de persoon tegen te komen die je overliep, en laat je slapen met de vissen in het slechtste geval.,

dilemma ‘ s van gevangenen in de echte wereld

We kunnen het dilemma van de gevangene gebruiken als een middel om veel situaties in de echte wereld te begrijpen op basis van samenwerking en vertrouwen. Als individuen heeft egoïsme de neiging om ons te helpen, althans op korte termijn. Maar als iedereen egoïstisch is, lijdt iedereen.In The Prisoner ‘ s Dilemma vraagt Martin Peterson de lezers zich twee autofabrikanten voor te stellen, Row Cars en Col Motors. Als de enige twee spelers in hun markt, de prijs elk verkoopt auto ’s op heeft een directe verbinding met de prijs de andere verkoopt auto’ s op., Als de ene ervoor kiest om te verkopen tegen een hogere prijs dan de andere, zullen ze minder auto ‘ s verkopen als klanten overdragen. Als een verkoopt tegen een lagere prijs, zullen ze meer auto ‘ s verkopen tegen een lagere winstmarge, het verkrijgen van klanten van de andere. In Peterson ‘ s voorbeeld, als beide stellen hun prijzen hoog, beiden zullen maken $ 100 miljoen per jaar. Als een besluit om hun prijzen lager, ze zullen maken $ 150 miljoen, terwijl de andere maakt niets. Als beide lage prijzen, beide verdienen $ 20 miljoen. Peterson schrijft:

stel je voor dat je dienst doet op het bord van rijauto ‘ s., In een bestuursvergadering wijst u erop dat ongeacht wat Col Motors besluit te doen, het voor uw bedrijf beter is om te kiezen voor lage prijzen. Dit komt omdat als Col Motors zijn prijs laag stelt, dan is een winst van $20 miljoen beter dan $0, en als Col Motors zijn prijs hoog stelt, dan is een winst van $150 miljoen beter dan $100 miljoen.

Gregory Mankiw geeft een ander real-world voorbeeld in de micro-economie, hier gedetailleerd beschreven:

beschouw een oligopolie met twee leden, Iran en Saudi-Arabië. Beide landen verkopen Ruwe olie., Na langdurige onderhandelingen komen de landen overeen de olieproductie laag te houden om de wereldprijs van olie hoog te houden. Nadat zij overeenstemming hebben bereikt over de productieniveaus, moet elk land beslissen of het meewerkt en zich aan deze overeenkomst houdt of dat het deze negeert en op een hoger niveau produceert. De volgende afbeelding laat zien hoe de winsten van de twee landen afhangen van de strategieën die ze kiezen.

stel dat u de leider van Saoedi-Arabië bent. U zou als volgt kunnen redeneren:

Ik zou de productie laag kunnen houden zoals afgesproken, of ik zou mijn productie kunnen verhogen en meer olie op de wereldmarkten kunnen verkopen., Als Iran zich aan de overeenkomst houdt en zijn productie laag houdt, dan maken mijn land oren winst van $ 60 miljard met een hoge productie en $ 50 miljard met een lage productie. In dit geval is Saoedi-Arabië beter af met een hoge productie. Als Iran de Overeenkomst niet nakomt en op een hoog niveau produceert, verdient mijn land 40 miljard dollar met een hoge productie en 30 miljard dollar met een lage productie. Opnieuw is Saoedi-Arabië beter af met een hoge productie. Ongeacht wat Iran wil doen, is mijn land dus beter af van onze overeenkomst en op hoog niveau te produceren.,

produceren op hoog niveau is een dominante strategie voor Saoedi-Arabië. Natuurlijk redeneert Iran op precies dezelfde manier, en dus produceren beide landen op een hoog niveau. Het resultaat is de inferieure uitkomst (vanuit zowel Iran als Saoedi-Arabië standpunt) met lage winsten in elk land. Dit voorbeeld illustreert waarom oligopolies moeite hebben met het handhaven van monopoliewinsten. De monopolistische uitkomst is gezamenlijk rationeel voor het oligopolie, maar elke oligopolist heeft een prikkel om vals te spelen., Net zoals eigenbelang de gevangenen in het dilemma van de gevangenen drijft om te bekennen, maakt eigenbelang het moeilijk voor de oligopolie om de coöperatieve uitkomst te handhaven met lage productie, hoge prijzen en monopolieprijzen.

andere voorbeelden van dilemma’ s van gevangenen zijn onder meer wapenwedloop, reclame en common resources (zie The Tragedy of The Commons). Het begrijpen van het dilemma van de gevangene is een belangrijk onderdeel van de dynamiek van samenwerking, een uiterst nuttig mentaal model.

denken aan het leven als een iteratief spel verandert hoe je speelt., Positioneren voor de toekomst heeft meer gewicht dan “winnen” in het moment.

Tagged: Economie, speltheorie, mentale modellen, micro-economie, gevangenen Dilemma

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *