WERELD & DENKEN
 
 

Het gevangenendilemma en tit-for-tat

 

Samenvatting

Veel situaties in groepen en maatschappijen zijn te reduceren tot transacties in goederen of diensten tussen twee individuen. De beschrijving hiervan heet "speltheorie" (game theory; merk op: voorwaarde is dat beide partijen gelijkwaardig zijn, zie Gezag en macht ). De soorten transactie reduceert men tot "coöperatief" ("Denk aan de wederzijdse belangen") en "non-coöperatief" ("Denk alleen aan je eigen belang"). Als theorie voert men het spel uit met computers en de opbrengst in punten. Het onderzoek bestaat uit het tegen elkaar laten spelen van de diverse mogelijke vormen van aanpak, strategieën. De strategie met de meeste opbrengst voor beide partijen bleek de volgende:
1: Speel een coöperatieve zet.
2: Speelt de andere partij een non-coöperatieve zet, beantwoordt dan met een non-coöperatieve zet.
3: Ga terug naar 1.

Deze strategie heet in het Engels tit-for-tat, ruwweg: oog-om-oog. Minder (sterk-) goede strategieën bleken onder andere:
1: Speel altijd een niet-coöperatieve zet ("Ga voor maximaal eigenbelang").

En:
1: Speel altijd een coöperatieve zet ("Keer altijd de andere wang toe").

Beide zijn één-zets-strategieën, dat wil zeggen: strategieën zonder terugkoppeling uitleg of detail - in de argumentatie-logica ook bekend als "projectie-operatoren" uitleg of detail , staande voor "processen of handelingen met verlies van informatie" uitleg of detail .
    In de mensenmaatschappij zijn deze twee strategieën zeer populair. De eerste heet "neoliberalisme" uitleg of detail of eufemistisch "de vrije economie". De tweede is de sociale hoofdleerstelling van het christendom, historisch ontstaan als reactie op het eerste, zie ook Gezag en macht . De theoretische eigenschappen betekenen dat evolutionair gezien beide leiden tot uitsterven.
    Het gevangendilemma is een uit de praktijk getrokken voorbeeld ter illustratie van het soort spel.


Inhoud

Het gevangenendilemma en tit-for-tat zijn zaken horende bij het meer bekende begrip vertrouwen en erbij horende sociologische interacties in het algemeen, en zijn daarvan twee aspecten die ruimte bieden voor zowel meer praktische als theoretische uitwerking.
    Het gevangenendilemma is het bekendste voorbeeld van wat officieel een "geformaliseerd spel" of speltheorie heet. Dit is geen spel in de zin van kinderspel, maar spel in de algemene zin van een situatie waarin mensen met elkaar in interactie zijn waarbij ook goederen (of andere zaken die ze belangrijk vinden) uitgewisseld worden, als in de titel van het grondleggende boek erover: Theory of Games and Economic Behaviour uitleg of detail (Wikipedia). Maar het gevangenendilemma is ook iets dat gewoon in de praktijk speelt. Tit-for-tat is een van de mogelijke oplossingen voor het spelen van dit soort spellen en dus ook voor het omgaan met de bijbehorende praktische omstandigheden.

Het gevangenendilemma gaat als volgt: twee inbrekers zijn, verdacht van een kraak, opgepakt door de politie, maar die heeft geen echt harde bewijzen, en hoopt door onderhandelingen een van de twee inbrekers tot een bekentenis te dwingen. De inbrekers worden ieder apart gehouden en verhoord, en aan beiden wordt gezegd: “Oké, we weten dat jullie het gedaan hebben, en jullie krijgen allebei drie jaar cel. Maar we willen het jou makkelijk maken: als je bekent, en dat jullie het alle twee gedaan hebben, krijg jij maar een jaartje. Maar je moet wel snel wezen, want op dit moment zit je maat al te praten.” De inbrekers staan nu voor een dilemma: als ze erop vertrouwen dat de ander niets zal zeggen, weten ze dat ze een goede kans hebben om vrij te komen, want de politie sluit dat soort dealtjes alleen als ze weinig bewijs hebben. Maar je kunt ook het zekere voor het onzekere nemen, en er met een jaartje vanaf komen. Maar als ze dat alletwee doen, zitten beiden in de boot. Een echt dilemma dus.

De maatschappij kent allerlei variaties op dit thema, waarbij het uiteindelijk draait om afwegingen wat betreft de opbrengst en het vertrouwen in de ander, en waarbij de handeling als uitkomst van de overweging gekenmerkt kan worden als "meewerking" of "tegenwerking", of in de termen van het formele spel: de coöperatieve of de non-coöperatieve zet uitleg of detail . Er zijn allerlei variaties, bijvoorbeeld wat betreft de totale uitkomst: "zero-sum"of "netto-nul" is de variant waarbij de totale opbrengst voor beide spelers nul is, dat wil zeggen: de winst van de een is het verlies van de ander. Het gevangenendilemma is een spel met een netto mogelijke positieve opbrengst: er is een situatie waarin beiden er positief vanaf komen (niet gestraft worden, dus wegkomen met een misdaad).

In feite is het zo dat de maatschappij, en groepssamenwerking in het algemeen, een netto-winst spel is. Als iedereen het spel meespeelt, is de opbrengst het grootst. Dat wil niet zeggen dat er geen individuen zijn die af en toe verlies leiden, zoals het enkele dier dat afdwaalt van de kudde en opgegeten wordt door de leeuwen, maar over het geheel genomen is er winst - de winst van de bescherming door de groep.

Het spel van de gevangenen kan ook gebruikt worden om de effectiviteit van verschillende keuzes te meten en de neigingen naar die keuzes. Daartoe wordt de inzet veranderd van jaren straf in punten, of als men het spel met mensen speelt en ze echt wilt motiveren, om geld. De meting naar de effectiviteit is gedaan door Robert Axelrod uitleg of detail (Wikipedia), die een competitie organiseerde voor computer-programma's die het coöperatieve versus niet-coöperatieve spel moesten gaan spelen, en experts in het veld van de speltheorie uitnodigde om zo'n programma te schrijven. Tot zijn grote verbazing won het simpelste programma, genaamd Tit-for-tat, of Oog-om-oog (vanwege de bijbetekenis in het Nederlands wordt hier verder de Engelse term aangehouden), ontworpen door Anatol Rapoport uitleg of detail (Wikipedia). Tit-for-tat start als eerste zet met samenwerking en doet daarna hetzelfde als de tegenstander: oftewel: medewerking is de norm, maar tegenwerking wordt eenmalig beantwoord met tegenwerking (voor de techneuten: het programma heeft vier regels, iets als Windows heeft er miljoenen). Het kan samengevat worden in een simpele afbeelding, met links het coöperatieve verloop en rechts dhet non-coöperatieve:


Als controle van deze uitkomst heeft Axelrod de uitslag gepubliceerd, tezamen met de code van Tit-for-tat, met de uitdaging aan de deelnemers om het beter te doen dan Tit-for-tat in een volgende ronde. Dit keer waren er 62 inzendingen, en weer won Tit-for-tat. Ook de variant die start met medewerking en tegenwerking beantwoordt met twee tegenwerkende zetten bleek minder effectief.

Axelrod heeft hierover een boek geschreven, The Evolution of Cooperation uitleg of detail , en hierin ziet hij in tit-for-tat een mogelijkheid voor het ontstaan van samenwerking binnen natuurlijke samenlevingsvormen waarvan de individuen aanvankelijk puur en alleen voor het directe eigenbelang gaan. De afwijking die het tit-for-tat individu daar in vormt, is op de lange termijn beter af, en de tit-for-tat methode zal op den duur dus prevaleren. Wel is waarschijnlijk dat in de praktijk voor die uitkomst een zekere minimum omvang aan tit-for-tat individuen nodig is om dit resultaat te bereiken.

Een tweede voorwaarde is dat de individuen meerdere malen met elkaar in contact komen, omdat de tit-for-tat uitkomst bepaald wordt over vele zetten. In de praktijk lijkt dit de toepasbaarheid van de tit-for-tat strategie te beperken. Iemand kan voorzien dat hij slechts eenmalig met een ander te maken heeft, en daarom besluiten dat gaan voor eigenbelang geen bezwaren heeft. Dit bezwaar wordt ondervangen als het gedrag van dit individu wel bekend wordt aan andere individuen, en die anderen dan hun gedrag volgens tit-for-tat aanpassen. Dit werkt natuurlijk minder direct, en het duurt langer voor men de uitkomsten ziet, maar het is waarschijnlijk dat dit slechts vetragend effect heeft, die de uiteindelijke uitkomst niet veranderen, zodat tit-for-tat weer de effectiefste strategie is.

Axelrod wijst in zijn boek ook op mogelijke voorbeelden uit het dierenrijk. Daar is inmiddels meer onderzoek naar gedaan, met name bij primaten, zie hier . Dit bevestigt dat tit-for-tat niet zo maar een gedragsvorm is, maar een gedragsvorm die van nature voortvloeit uit het onderhouden van sociale samenwerkingsvormen binnen een groep. Tit-for-tat is de natuurlijke correctievorm om sociaal gedrag af te dwingen, in die situatie waarbij dit sociale gedrag niet vanzelfsprekend genoeg is. Is dat sociale gedrag wel vanzelfsprekend genoeg, is het mogelijk dat andere omgangsvormen effectiever zijn.

Voor iedereen die erkent dat de mensheid een sociale diervorm is met daarnaast een aantal extra eigenschappen, is het vanzelfsprekend de varianten uit het dierenrijk ook hier toe te passen, met name natuurlijk op de meer basale intermenselijke processen, bijvoorbeeld bij de opvoeding van jonge kinderen - Supernanny zet de kinderen die zich echt niet willen gedragen (tat) op de naughty stool (tit). Oftewel: alles dat gebruikt maakt van beloning en/of straf als correctiemethode is een vorm van "spel' in de hier besproken zin.

Vermoedelijk het meest uitgebreide toepassingsterrein van en voor tit-for-tat is de verbale interactie, en met name die interactie waarbij gedachten en/of ideeën worden uitgewisseld, dat wil zeggen: die interacties die vallen onder termen als "debat" en "discussie". Dit is terrein waarop een zeer groot aantal tactieken wordt ingezet die ingedeeld kunnen worden onder de algemene noemer "non-coöperatief". Dat loopt van "ouderwetse" leugens tot de meest subtiele vormen van suggestie, met een breed spectrum daar tussen in, vele ervan bekend als "retorische trucs" . Van  nature wordt daar al vaak tactieken tegenovergesteld die lijken op of vallen onder tit-for-tat, zoals spiegeling . Dit kan uitgebreid worden tot één-richtingscommunicatie, zoals die vanuit de media, door te letten op non-coöperatieve uitingen zoals retorische trucs, en de boodschappen vanuit de betreffende bron bijpassend af te waarderen, zoals hier voorgesteld in de Informatieregels .

De effectiviteit van het toepassen van tit-fot-tat in dit terrein kan afgemeten worden aan de reacties erop. Zo zijn mensen die bekend staan onder de noemer "politiek-correct" er meesters in om anderen te voorzien van algemene labels met een sterk negatieve connotatie, zoals "xenofoob", "racist" of "antisemiet". Noem de je betreffende mensen "politiek-correct", dat zijn ze uitermate op hun teentjes getrapt. Andere voorbeelden zijn voorstanders van Europa (noemen iedere criticus een "nationalist", "rechts-extremist", of "voorstander van een Derde Wereldoorlog", en zijn uiterst beledigd over het "eurofiel" genoemd worden), voorstanders van globalisering, voorstanders van (im)imigratie, enzovoort. De tit-for-tat-aanpak van dit soort mensen is vermoedelijk nog effectiever. voorstanders van Europa met hun "nationalisme" kunnen afgedaan worden met "Europa-Imperialisten", voorstanders van globalisering en kosmopolitisme, met hun "xenofobie" en "achter de dijken", kunnen aangepakt worden met "nomadisten" en "parasieten", en voorstanders van neoliberalisme die aanvallen met termen als "verzorgingsstaat', "socialistische heilstaat" of "communist" kunnen van repliek gediend worden met "graaiers", "Dickensianen" , of "ploerten" .

Dit voor zover het originele begrip. Dat begrip kan op twee manieren uitgebreid worden. De eerst is die van tweewaardig naar meerwaardig. 

Het originele tit-fot-tat is tweewaardig, omdat er slechts twee zetten zijn: meewerking en tegenwerking. Een meervoudig systeem kent keuzen in de mate van mee- en tegenwerking. In het geval van het gevangenendilemma lijkt dat niet goed mogelijk: je kan je maat niet half verraden. Maar bijvoorbeeld voor toepassing in de verbale contexten van debat, discussie enzovoort, is dat prima mogelijk: je kan op een lelijke opmerking van je opponent op talloze manieren reageren, met verschillende mate van lelijkheid. Dit kan geformaliseerd worden in regels op dezelfde manier waarop het tweewaardige systeem dat kon, met dien verstande dat er dan natuurlijk meteen veel meer regels zijn. Dat gaat dan in vormen als: als je de eerste keer lelijk toegesproken wordt, doe dan de eerste keer half zo lelijk terug. Gebeurt het een tweede keer, doe dan even lelijk terug. En bij de derde keer, doe dan twee keer zo lelijk terug. Enzovoort. Een voorbeeld hiervan is gegeven in de Informatieregels voor enkelzijdige communicatie van meningen en opvattingen.

De tweede uitbreiding aan het tit-for-tat-model, die alleen zinvol is in de meerwaardige variant, is het toevoegen van de mogelijkheid van positieve reactie, dat wil zeggen: door op een "zet" van de andere partij te reageren met een zet die positiever is dan de oorspronkelijke zet - in tit-for-tat zit zelfs al de naamgeving de automatische suggestie dat het alleen over de "straf"-vorm van reacties gaat. De variant met positieve reactie bestaat al in de dagelijkse praktijk van de menselijke sociale omgang, vooral in omgevingen die gericht zijn op sociale contacten, zoals cafés. Het is gebruikelijk om een eerste kennismaking neutraal te houden, en bij de eerste de beste wat meer positieve versterking zelf met extra positieve versterking te komen.

Bij het tweewaardige model is het nog niet helemaal duidelijk, maar de voorbeelden van het meervoudige tit-for-tat laten overduidelijk zien dat tit-for-tat een vorm van het algemene proces van Terugkoppeling terugkoppeling is. Bij Terugkoppeling is getoond dat de meeste stabiele situaties in de natuur stabiel zijn omdat ze vormen terugkoppeling bevatten. De menselijke interactie ziende als een natuurlijk proces, lijkt tit-for-tat in zijn vele variaties in aanmerking te komen als de methode van voorkeur om met elkaar om te gaan. Hetgeen zeer nadrukkelijk verschilt van de tot nu toe gebruikelijke methodes, zijnde het "Ikke ikke ikke en de rest kan stikke" en "Ieder voor zich en God voor ons allen" van het Eerste Testament van de Bijbel (de Joodse cultuur Joodse cultuur ) en het neoliberalisme neoliberalisme , en het "Wordt je geslagen, keer dan de andere wang toe" van het Christendom christendom . De eerste is in speltheoretische terminologie de "Altijd tegenwerken"-strategie, de tweede die van "Altijd meewerken". In deze context geformuleerd, is duidelijk dat beide volkomen absurd zijn. Tezamen zijn beide methoden absoluut dominant over vrijwel de gehele wereld, met uitzondering van een aantal sociologische deelgebieden op een paar kleine sociologische eilandjes ergens in Noordwest-Europa christendom .


Naar Competitie en samenwerking , Allochtonendebat oktober 2005 , Sociologie lijst , Sociologie overzicht  , of site home .


1 mei 2004; 17 nov.2013