Het gevangenendilemma en tit-for-tat

Samenvatting

Het gevangenendilemma (twee rechercheurs spelen twee gesnapte inbrekers tegen elkaar uit) is een uit de praktijk getrokken voorbeeld ter illustratie van een "geformaliseerd spel" of kortweg "spel" waarin twee of meer spelers volgens vaststaande regels met elkaar in interactie gaan, in wat heet "speltheorie" (game theory).

Voorwaarde is dat beide of alle partijen gelijkwaardig zijn, zie Gezag en macht

.

De soorten transactie reduceert men tot "coöperatief" ("Denk aan de wederzijdse belangen") en "non-coöperatief" ("Denk alleen aan je eigen belang").

Als theorie voert men het spel uit met computers en de opbrengst in punten, maar veel situaties in groepen en maatschappijen zijn te reduceren tot transacties in goederen of diensten tussen twee individuen, met name op economisch terrein.

Het spel-theoretisch onderzoek bestaat uit het tegen elkaar laten spelen van de diverse mogelijke vormen van aanpak, strategieën. Daarbij bleek het bestaan van een strategie met optimale opbrengst voor beide partijen:

1:		Speel een coöperatieve zet.
2:		Speelt de andere partij een non-coöperatieve zet, beantwoordt dan met een non-coöperatieve zet.
3:		Ga terug naar 1.

Deze strategie heet in het Engels tit-for-tat, ruwweg: oog-om-oog. Minder (sterk-) goede strategieën bleken onder andere:

Speel altijd een niet-coöperatieve zet ("Ga voor maximaal eigenbelang").

En:

Speel altijd een coöperatieve zet ("Keer altijd de andere wang toe").

Beide zijn één-zets-strategieën, dat wil zeggen: strategieën zonder terugkoppeling

- in de argumentatie-logica ook bekend als "projectie-operatoren"

, staande voor "processen of handelingen met verlies van informatie"

.

In de mensenmaatschappij zijn deze twee strategieën zeer populair. De eerste heet "neoliberalisme"

of eufemistisch "de vrije economie". De tweede is de sociale hoofdleerstelling van het christendom, historisch ontstaan als reactie op het eerste, zie ook Gezag en macht

. De theoretische eigenschappen betekenen dat evolutionair gezien beide leiden tot uitsterven.

Het gevangenendilemma en tit-for-tat zijn zaken horende bij het begrip sociale empathie

en het aanverwante en bekendere vertrouwen

, en erbij horende sociologische interacties in het algemeen, en zijn daarvan twee aspecten die ruimte bieden voor zowel meer praktische als theoretische uitwerking.

Gevangenendilemma

Het gevangenendilemma gaat als volgt: twee inbrekers zijn, verdacht van een kraak, opgepakt door de politie, maar die heeft geen echt harde bewijzen, en hoopt door onderhandelingen een van de twee inbrekers tot een bekentenis te dwingen. De inbrekers worden ieder apart gehouden en verhoord, en aan beiden wordt gezegd: “Oké, we weten dat jullie het gedaan hebben, en jullie krijgen allebei drie jaar cel. Maar we willen het jou makkelijk maken: als je bekent, en dat jullie het alle twee gedaan hebben, krijg jij maar een jaartje. Maar je moet wel snel wezen, want op dit moment zit je maat al te praten.” De inbrekers staan nu voor een dilemma: als ze erop vertrouwen dat de ander niets zal zeggen, weten ze dat ze een goede kans hebben om vrij te komen, want de politie sluit dat soort dealtjes alleen als ze weinig bewijs hebben. Maar je kunt ook het zekere voor het onzekere nemen, en er met een jaartje vanaf komen. Maar als ze dat alletwee doen, zitten beiden in de boot. Een echt dilemma dus.

Van dat dilemma kan je een schema maken: Jantje praat wel/ niet, en Pietje praat wel/niet - met een op het internet veel gebruikte illustratie (van hier

Waarna je verhandelingen kan houden over wat Jantje en Pietje nu het best kunnen doen, gezien vanuit Jantje en Pietje. Een situatie die ook lijkt op onderhandelingen tussen de twee partijen in een koop annex verkoop als beide partijen niet precies alles weten over het te verkopen product. Vandaar dat er onderzoek gedaan is naar dit soort situaties. In wat is gaan heten "geformaliseerd spel" of speltheorie. Dit is geen spel in de zin van kinderspel, maar spel in de algemene zin van een situatie waarin mensen met elkaar in interactie zijn waarbij ook goederen (of andere zaken die ze belangrijk vinden) uitgewisseld worden, als in de titel van het grondleggende boek erover: Theory of Games and Economic Behaviour

(Wikipedia). In het kader waarvan veel theoretisch onderzoek is gedaan, met nadere analyse als het bestaan van zero-sum en non-zero-sum games. In het eerste geval betekent de winst van de ene partij het verlies van de andere. Bij non-zero-sum hoeft dat dus niet te zijn. Een enkelvoudige koop is een zero-sum game: meer opbrengst voor de verkoper is meer kosten voor de koper. De natuur is een non-zero-sum game: ze begint met het opgaan van de zon, een opbrengst, en die kost niets.

Veel van dat getheoretiseer bleek overbodig, met de komst van de computer, dat wil zeggen: de mogelijkheid om het geformaliseerde spel echt te spelen. Dat leidde tot tit-for-tat.

Tit-for-tat

Game theory was een "spel" voor wiskundigen en econometristen, tot met de computer de mogelijkheid kwam om de theorieën uit te proberen. Alles met regels kan in een computerprogramma's omgeschreven worden, want een computerprogramma is niets anders dan een stel "regels" van voornamelijk de soort "als dit, dan dat".

Ten behoeve van de computer werd de inzet veranderd van jaren straf in punten. De meting naar de effectiviteit is gedaan door Robert Axelrod

(Wikipedia), die een competitie organiseerde voor computerprogramma's die het coöperatieve versus niet-coöperatieve spel moesten gaan spelen, en experts in het veld van de speltheorie uitnodigde om zo'n programma te schrijven.
Tot zijn grote verbazing won het simpelste programma, genaamd Tit-for-tat, of Oog-om-oog (vanwege de bijbetekenis in het Nederlands wordt hier verder de Engelse term aangehouden), ontworpen door Anatol Rapoport

(Wikipedia). Tit-for-tat start als eerste zet met samenwerking en doet daarna hetzelfde als de tegenstander: oftewel: medewerking is de norm, maar tegenwerking wordt eenmalig beantwoord met tegenwerking (voor de techneuten: het programma heeft vier regels, iets als Windows heeft er miljoenen). Het kan samengevat worden in een simpele afbeelding, met links het coöperatieve verloop en rechts het non-coöperatieve:

Als controle van deze uitkomst heeft Axelrod de uitslag gepubliceerd, tezamen met de code van Tit-for-tat, met de uitdaging aan de deelnemers om het beter te doen dan Tit-for-tat in een volgende ronde. Dit keer waren er 62 inzendingen, en weer won Tit-for-tat. Ook de variant die start met medewerking en tegenwerking beantwoordt met twee tegenwerkende zetten bleek minder effectief.

Zijn verbazing heeft Axelrod omgezet in een boek over deze ervaringen, The Evolution of Cooperation

, en hierin ziet hij in tit-for-tat een mogelijkheid voor het ontstaan van samenwerking binnen natuurlijke samenlevingsvormen waarvan de individuen aanvankelijk puur en alleen voor het directe eigenbelang gaan. De afwijking die het tit-for-tat individu daar in vormt, is op de lange termijn beter af, en de tit-for-tat methode zal op den duur dus prevaleren. Wel is waarschijnlijk dat in de praktijk voor die uitkomst een zekere minimum omvang aan tit-for-tat individuen nodig is om dit resultaat te bereiken.

Een tweede voorwaarde is dat de individuen meerdere malen met elkaar in contact komen, omdat de tit-for-tat uitkomst bepaald wordt over vele zetten. In de praktijk lijkt dit de toepasbaarheid van de tit-for-tat strategie te beperken. Iemand kan voorzien dat hij slechts eenmalig met een ander te maken heeft, en daarom besluiten dat gaan voor eigenbelang geen bezwaren heeft. Dit bezwaar wordt ondervangen als het gedrag van dit individu wel bekend wordt aan andere individuen, en die anderen dan hun gedrag volgens tit-for-tat aanpassen. Dit werkt natuurlijk minder direct, en het duurt langer voor men de uitkomsten ziet, maar het is waarschijnlijk dat dit slechts vertragend effect heeft, die de uiteindelijke uitkomst niet veranderen, zodat tit-for-tat weer de effectiefste strategie is.

Axelrod wijst in zijn boek ook op mogelijke voorbeelden uit het dierenrijk. Daar is inmiddels meer onderzoek naar gedaan, met name bij primaten, zie hier

. Dit bevestigt dat tit-for-tat niet zo maar een gedragsvorm is, maar een gedragsvorm die van nature voortvloeit uit het onderhouden van sociale samenwerkingsvormen binnen een groep. Tit-for-tat is de natuurlijke correctievorm om sociaal gedrag af te dwingen, in die situatie waarbij dit sociale gedrag niet vanzelfsprekend genoeg is. Is dat sociale gedrag wel vanzelfsprekend genoeg, is het mogelijk dat andere omgangsvormen effectiever zijn.

Toepassingen, psychologisch

De maatschappij kent allerlei variaties op dit thema, waarbij het uiteindelijk draait om afwegingen wat betreft de opbrengst en het vertrouwen in de ander, en waarbij de handeling als uitkomst van de overweging gekenmerkt kan worden als "meewerking" of "tegenwerking", of in de termen van het formele spel: de coöperatieve of de non-coöperatieve zet - houden we met zijn allen een afstandje zodat iedereen een overzicht heeft, of gaan we net zijn allen staan dringen zodat niemand iets meer ziet

.

De vraag is: wat doe je met degenen die het eerst van de coöperatieve strategie afwijken?

In het begin is dat makkelijker. De jonge mens moet, net als alle andere zaken, ook getraind worden in het sociale gedrag - wat in de psychologie én de gewone mensenwereld heet "opvoeden". Nu weet iedereen met gezond verstand hoe dat moet. Maar gezond verstand

is, in tegenstelling tot wat men denkt, een vrij zeldzaam goedje en met name naarmate men hoger op de maatschappelijk-"intellectuele" ladder komt, dat wil zeggen: de beroepsopvoeders, pedagogen en dergelijke. Dat soort mensen heeft last van allerlei vooropgezette ideeën

, zoals de gedachte dat ieder mens gelijk is, inclusief kinderen. "Kinderen hebben Gelijke Rechten", roept de speciaal voor deze ideologie in het leven groepen Ombudspersoon.
    In dat kader is er ergens in de jaren 1970 een opvoedkundige school ontstaan die vindt dat je met kinderen redelijk moet praten, net als met volwassenen.
    Iedereen gelijk, toch ...
    En weg was tit-for-tat, want kinderen klieren (ook), en met klieren kan je slechts tot een bepaalde hoogte omgaan in redelijkheid. Daarna moet je terugklieren - wat in voor hen begrijpelijke taal (ze kennen natuurlijk ook slechts in beperkte mate de redelijke taal) heet "straf".
    Niet voor de ideologen.
    En daar was het verwende en later narcistische gedrag ...

In de jaren 2000 en 2010 in ruime mate in de maatschappij waar te nemen.

Voor iedereen die erkent dat de mensheid een sociale diersoort is met daarnaast een aantal extra eigenschappen, is het vanzelfsprekend de varianten uit het dierenrijk ook hier toe te passen, met name natuurlijk op de meer basale intermenselijke processen, bijvoorbeeld bij de opvoeding van jonge kinderen - Supernanny zet de kinderen die zich echt niet willen gedragen (tat) op de naughty stool

(tit). Oftewel: alles dat gebruikt maakt van beloning en/of straf als correctiemethode is een vorm van "spel" in de hier besproken zin.

Toepassingen, sociologisch

In feite is het zo dat de maatschappij, en groepssamenwerking in het algemeen, een netto-winst spel is. Als iedereen het spel meespeelt, is de opbrengst het grootst. Dat wil niet zeggen dat er geen individuen zijn die af en toe verlies leiden, zoals het enkele dier dat afdwaalt van de kudde en opgegeten wordt door de leeuwen, maar over het geheel genomen is er winst - om te beginnen de winst van de bescherming door de groep.

In de daadwerkelijke mensenmaatschappij is toepassing van tit-fot-tat niet vanzelfsprekend. Er zijn zelfs denkstoornissen die van het afwijken ervan tot een basisprincipe, een ideologie, hebben gemaakt.

Als eerste is daar natuurlijk de "Ieder voor zich en God voor ons allen"-houding die alhier bekend is uit het Midden-Oosten, beginnend met het Oude Testament zo'n 8000 jaar geleden (de Joodse cultuur

). In modernere tijden kent men het met uitingsvormen als "Het recht van de sterkste", "Ikke, ikke, ikke en de rest kan stikke", "Winner takes all", "There is no such thing as society"

, "Nationale staten zijn fascisme", "Grenzen zijn neonazisme"

, enzovoort, de laatste decennia ook wel bekend onder de verzamelterm "neoliberalisme"

. Voor de definitieve beschrijving ervan, zie hier

.

Dit zijn allemaal vormen van de strategie van "Speel altijd een non-coöperatieve zet".

De anti-sociaalheid als principe.

Als reactie daarop is in hetzelfde Midden-Oosten een alternatieve strategie ontstaan: "Speel altijd een coöperatieve zet" - het christendom

. Dit is destijds, zo'n 2000 jaar geleden, gepubliceerd in wat nu heet het Nieuwe Testament.

Het meest duidelijk wat het effect van deze strategieën is wanneer ze direct vergeleken worden. Het model wordt daartoe aangepast met het volgende als basis:

De uitgebeelde basisaannames zijn:
- de mate waarin de mannetjes zwart zijn, staat voor hun score in het spel;
- een coöperatieve zet van de ene partij wordt uitgebeeld als een score-overdracht aan de andere partij;
- de afname van de gever is kleiner dan de toename van de ontvanger, zoals bijna altijd in de maatschappelijke praktijk, wat voor het gemak (en de snelheid) is afgebeeld als een gelijkblijvende score voor de gever.
Met dit als aannames ziet het spel voor twee coöperatieve partijen er als volgt uit:

En hier wat er gebeurt als dit spel een aantal keren gespeeld wordt met een non-coöperatieve tweede partij, die dus zijn winst neemt ten koste van de eerste partij:

Waarbij het laatste symbool in het linker rijtje in werking treedt als wat er rondgaat geen "score" is in cijfers, maar een levensbehoefte zoals voedsel - de altijd-gevende partij overleeft het niet.

De samenvattende conclusie: de christelijke ideologie is Dwaasheid

, en de Joodse ideologie is het Kwaad

.

Wat uitgebreider: alle christelijke en soortgelijke gebruik van termen als "medemenselijkheid", "empathie"

, "altruïsme"

, en hun hogere vormen als "mensenrechten" zijn waanzin, zodra ze als principes worden gehanteerd in plaats van richtlijnen voor bepaalde omstandigheden.

En de neoliberale Joodse ideologie, als hun tegenbeeld, dus minstens evenzeer, maar eigenlijk nog veel meer, want een wereld met alleen mensen met de "christelijke" aanpak zou blijven bestaan, en voortleven (hoe, is anders), maar de neoliberale leidt tot de zekere ondergang. Zoals dat bij de Joden inderdaad in het geloof verweven is.

En waar in de getekende voorbeelden de meest extreme gevallen zijn gecombineerd, om het geheel binnen de omvang van een plaatje af te laten lopen, is het volkomen duidelijk dat de afloop dezelfde is ook als je alleen de christelijke ideologie neemt en een neutrale speler rechts, of een neoliberale rechts en een neutrale links. Of diverse andere mengvormen. Het duurt alleen langer.

Een concrete maatschappelijke toepassing: er bestaat geen "sociaal(er) neoliberalisme". Of "neoliberalisme met een menselijk gezicht". Of "gematigd neoliberalisme". Of "De derde weg". Het eindigt allemaal met de dood, alleen op andere tijdstippen.

Waarop de in het kader van tit-for-tat niet relevant lijkende vraag opkomt dat, als dit zo'n sterke misstand is, hoe deze heeft kunnen ontstaan ondanks het bestaan van een op andere niveaus van de natuur werkende en effectief gebleken methodiek?

Het antwoord daarop staat in de inleiding: voorwaarde voor het functioneren van tit-for-tat is de gelijkwaardigheid van de betrokken partijen. Dat is niet het geval voor de maatschappelijke discussie, het veld waar de strijd rond neoliberalisme en alternatieve opvattingen zich afspeelt.
Die strijd is voornamelijk een verbale strijd, en op het vlak van verbale begaafdheden is niet voldaan aan de voorwaarde van gelijkwaardigheid: tot de aanhangers van het neoliberalisme behoren het overgrote deel van de besturende en intellectuele elite. Omdat die voor hun levensonderhoud afhankelijk zijn van de boeren- en fabrieksarbeid van minder-intellectuelen en verbaal minder-begaafden.

Dus in de verbale strijd rond de maatschappelijke discussie is er geen tit-for-tat. En aanhangers van het neoliberalisme overheersen verbaal dusdanig dat ze het speelveld de facto voor zichzelf hebben, en iedere nieuwe ronde van het spel weer de non-coöperatieve zet kunnen doen.
Wat in termen van de maatschappelijke discussie heet "de groeiende tweedeling"

.
Waar "men" dus wel over praat, als rookgordijn, maar nooit iets aan doet. "Men" verhoogt de indirecte belastingen dus de kosten van levensonderhoud, en zegt doodgemoedereerd "Dat is niet nadelig voor de lagere inkomensgroepen"

. Een botte leugen, en een dieprode pijl in het spel, die nergens aangekaart en weerlegd wordt. Die nergens zijn "tat" krijgt.

Conclusies

Waar dit dus allemaal in feite over gaat is terugkoppeling

: is het voor beide partijen mogelijk elkaar te corrigeren? Aan de andere terug te koppelen wat hij de vorige keer heeft gedaan ... ?

Zodra er sprake is van een vorm van machtsverhoudingen

tussen de twee (of meer) betrokken partijen, is die terugkoppeling nauwelijks of meestal niet mogelijk. En kan er geen tit-for-tat ontstaan.

Eigenlijk bekend genoeg, maar men wil het niet weten.

Want macht is lekker.

Macht is verslavend.

En omdat er ergens toch een einde moet komen aan de dingen die onbeperkt groeien want onbeperkt is uiteindelijk niets in een eindig heelal, komt dat einde dan met een hele grote knal. Een knal ongeveer ter grootte van de optelsom van alle eerdere "tats" die uitgedeeld hadden moeten worden, maar wat niet kon vanwege machtsverhouding.

Wilt u werken aan uw mogelijkheden om weerwoord te bieden tegen de dominantie van de elite in het verbale tit-for-tat-spelletje, dan zijn hier een paar bronnen die deels gebaseerd zijn op tit-for-tat: herken "retorische trucs"

. Gebruik spiegeling

. En gebruik de Informatieregels

Vervolg

Het originele tit-fot-tat is tweewaardig, omdat er slechts twee zetten zijn: meewerking en tegenwerking. Een meervoudig systeem kent keuzen in de mate van mee- en tegenwerking. In het geval van het gevangenendilemma lijkt dat niet goed mogelijk: je kan je maat niet half verraden. Maar bijvoorbeeld voor toepassing in de verbale context van debat, discussie enzovoort, is dat prima mogelijk: je kan op een lelijke opmerking van je opponent op talloze manieren reageren, met verschillende mate van lelijkheid. Dit kan geformaliseerd worden in regels op dezelfde manier waarop het tweewaardige systeem dat kon, met dien verstande dat er dan natuurlijk meteen veel meer regels zijn. Dat gaat dan in vormen als: als je de eerste keer lelijk toegesproken wordt, doe dan de eerste keer half zo lelijk terug. Gebeurt het een tweede keer, doe dan even lelijk terug. En bij de derde keer, doe dan twee keer zo lelijk terug. Enzovoort. Een voorbeeld hiervan is gegeven in de Informatieregels

voor enkelzijdige communicatie van meningen en opvattingen.

De tweede uitbreiding aan het tit-for-tat-model, die alleen zinvol is in de meerwaardige variant, is het toevoegen van de mogelijkheid van positieve reactie, dat wil zeggen: door op een "zet" van de andere partij te reageren met een zet die positiever is dan de oorspronkelijke zet - in tit-for-tat zit zelfs al de naamgeving de automatische suggestie dat het alleen over de "straf"-vorm van reacties gaat. De variant met positieve reactie bestaat al in de dagelijkse praktijk van de menselijke sociale omgang, vooral in omgevingen die gericht zijn op sociale contacten, zoals cafés. Het is gebruikelijk om een eerste kennismaking neutraal te houden, en bij de eerste de beste wat meer positieve versterking zelf met extra positieve versterking te komen.

Naar Competitie en samenwerking

, of site home

·.

1 mei 2004; 17 nov.2013; 27 nov.2017; 18 sep.2022