De enveloppenparadox Mats Vermeeren Berlin Mathematical School) 6 april 013 1 Inleiding Een spel gaat als volgt. Je krijgt twee identiek uitziende enveloppen aangeboden, waarvan je er één moet kiezen. Je weet dat er in één envelop dubbel zo veel geld zit als in de andere, maar je weet niet welke bedragen dat zijn. Nadat je een envelop gekozen hebt mag je hem openmaken. Daarna krijg je de mogelijkheid om nog van gedachten te veranderen. Je mag de andere envelop nemen, maar je mag ook gewoon het geld dat je in de eerste envelop gevonden hebt mee naar huis nemen. Wat is de beste keuze? De naïve aanpak gaat als volgt. Noem het bedrag dat je in de eerste envelop gevonden hebt x. In de andere envelop zit ofwel x, ofwel x. Omdat er geen verschil te zien is tussen de twee enveloppen, is het even waarschijnlijk dat we de vette genomen hebben als dat we de magere gekozen hebben. In andere woorden: de kans dat de andere envelop x bevat is 1, net zoals de kans dat de andere envelop x bevat. De verwachtingswaarde als we van envelop wisselen is dus 1 x + 1 x x + x 4 5x 4, en dat is groter dan x. Gemiddeld gezien is het dus beter om te wisselen, ongeacht de waarde van x. Probleem opgelost? Niet echt. Als je deze redenering volgt zal je keuze niet afhangen van wat je in de eerste envelop vind. Dus je had even goed van het begin af de andere envelop kunnen nemen. En dan zou je met dezelfde redenering besluiten dat het beter is om te wisselen, dus dat toch de eerste envelop beter is! Het gras is altijd groener bij de buren, zegt men, maar in de wiskunde zou het niet mogelijk mogen zijn dat A beter is dan B én B beter dan A. Wat is er misgelopen? 1
De jacht op de paradox Noem de envelop die je in eerste instantie kiest A en de andere B. Het probleem is dat de kans dat envelop B het bedrag x respectievelijk x ) bevat een voorwaardelijke kans is. Het is namelijk dat kans dat B de vette respectievelijk magere) envelop is gegeven het feit dat A het bedrag x bevat. De correcte verwachtingswaarde is PB is vet A bevat x) x + PB is mager A bevat x) x. Deze voorwaardelijke kansen hangen af van de kansverdeling van de hoeveelheid geld die in de enveloppen zit. De kansen zijn enkel gelijk aan 1 voor elke waarde van x als die verdeling uniform is. Maar alle positieve reële getallen zijn mogelijke bedragen, en er bestaat geen uniforme verdeling op al deze getallen. Om het probleem toegankelijk te houden is het beter om de mogelijke waarden ietwat te beperken, namelijk tot machten van twee. De mogelijke waarden zijn dan dus, 1, 4, 3 8,... maar ook 0 1, 1 1, 1 4,... Verder gaan we ervan uit dat elk van deze waarden met een kans verschillend van nul optreedt. Deze aannamen maken het rekenwerk veel gemakkelijker, maar veranderen niets essentieels aan het probleem. 1 Het enveloppenspel kunnen we met twee toevalsvariabelen modelleren: X is het bedrag dat in de magere envelop zit. Y is 1 als we de magere envelop kiezen en als we de vette envelop kiezen. Er geldt dus dat PY 1) PY ) 1. Het bedrag dat we in de gekozen envelop vinden wordt dan gemodelleerd door de toevalsvariabele XY. We geven de geobserveerde waarde van dit bedrag de naam a. Het bedrag dat we krijgen als we van envelop wisselen is X 3 Y ): als Y 1 vinden we na het wisselen de vette envelop met bedrag X X 3 1); als Y vinden we na het wisselen de magere envelop met bedrag X X 3 ). De voorwaardelijke) verwachtingswaarde als we wisselen is dan EX 3 Y ) XY a) E3X XY XY a) E3X XY a) EXY XY a) 3 EX XY a) a. 1 In het bijzonder bestaat er ook op deze verzameling van getallen geen uniforme verdeling.
We weten niet wat EX XY a) is, dat hangt van de verdeling van X af. Wat we willen weten is welke verdelingen tot een paradox leiden, dus voor welke verdelingen de voorwaardelijke verwachtingswaarde bij wisselen groter is dan a, het bedrag dat we krijgen als we niet wisselen. Dit feit wordt beschreven door de ongelijkheid 3 EX XY a) a > a, of equivalent, EX XY a) > a. 1) 3 Ik kan het belang van deze ongelijkheid niet genoeg benadrukken: de kern van de enveloppenparadox is dat wisselen voordeel biedt ongeacht van wat we in de eerste envelop vinden, dus dat deze ongelijkheid voor alle waarden van a voldaan is. Stelling. Als ongelijkheid 1) geldt voor alle mogelijke waarden van a, dan is EX). Met andere woorden: als er een paradox is, dan is het verwachte bedrag in de enveloppen oneindig. Opmerking. De verwachting in de stelling is geen voorwaardelijke verwachting, we spreken dus over het bedrag dat we verwachten voordat we de eerste envelop geopend hebben. Bewijs. We willen informatie over de verdeling van X, maar ongelijkheid 1) zegt enkel iets over de voorwaardelijke verdeling van X gegeven XY a. Een verband tussen die twee vinden we door in de formule EX XY a) a PX a XY a)+ a P X a XY a het rechterlid te herschrijven. Hiervoor maken we ervan gebruik dat X en Y onafhankelijk zijn en dat P Y 1) P Y ): PX a en XY a) PX a XY a) PXY a) PX a en Y 1) PX a en Y 1) + P X a en Y ) PX a)py 1) PX a)py 1) + P X a ) P Y ) PX a) PX a) + P X a ) ) ) 3
en P X a ) XY a P X a en XY a) P XY a) P X a en Y ) P X a en Y 1) + P X a P X a ) P X a) + P X a ). en Y ) Dus vergelijking ) kan geschreven worden als E X XY ) a P X a) + a P X a P X a) + P X a ). Hiermee kunnen we ongelijkheid 1) zonder voorwaardelijke verachting herschrijven: a P X a) + a P X a ) P X a) + P X a ) > 3 a. Dit is equivalent met P X a) + 1 P X a ) > 3 P X a) + P X a )), en dus met P X a) > P X a ). Uit deze ongelijkheid volgt dat voor elk natuurlijk getal n n P X n ) > n 1 P X n 1) >... > P X 1). 3) Dit heeft grote gevolgen als we de verwachte waarde van X berekenen. Deze verwachting is namelijk gelijk aan E X) n Z n P X n )... + 1 P X 1 ) + P X 1) + P X ) +... Al deze termen zijn positief, dus door termen te schrappen volgt hieruit dat E X) n N n P X n ) P X 1) + P X ) +... ) 4
Door op al deze termen ongelijkheid 3) toe te passen, volgt tenslotte dat EX) n N P X 1) PX 1) + PX 1) +..., want per aanname is PX 1) > 0. 3 Interpretatie Als het verwachte bedrag oneindig is, is het niet meer paradoxaal dat wisselen een betere verwachte waarde geeft. Je verwacht dan oneindig veel geld, dus elk mogelijk eindig bedrag is een teleurstelling. Daarom kan je altijd verwachten dat er in de andere envelop meer geld zit. Als je het niet eens bent met deze interpretatie, dan ben ik er waarschijnlijk in geslaagd om een andere moraal mee te geven: verdelingen met een oneindige verwachting zijn vreemd! In de praktijk zijn zulke verdelingen dan ook heel zeldzaam. In de context van het enveloppenprobleem zou een oneindige verwachting impliceren dat de organisator van het spel over oneindig veel geld beschikt. Dat is natuurlijk een compleet onrealistische aanname. Dus als je het enveloppenprobleem nog steeds paradoxaal vindt, besef dan tenminste dat de paradox zijn wortels in deze absurde aanname heeft, niet in de wiskunde. 5