Utrecht, 20 jun 2012 Modellen en Smulate Speltheore Program Optmaleren Nul-om matrx pel Spel tratege Gemengde trategën Gerard Slejpen Department of Mathematc Mnmax tellng Het vnden van de optmale tratege Verdere ontwkkelngen Bewj van de mnmax tellng http://www.taff.cence.uu.nl/ lej101/ Proner dlemma [Wkpeda] Er een erntg mdrjf gepleegd. Twee gewapende mannen worden gepakt en het taat wel vat dat het de dader zjn, maar het bewj ontbreekt. Ze worden apart n de cel gezet en kunnen net met elkaar communceren. De rechter doet elke verdachte het volgende voortel: 1. Al julle allebe bljven zwjgen, kan k julle net veel maken. Je krjgt dan alleen een lchte traf wegen wapenbezt zonder vergunnng. 2. Al er een bekent, de zaak rond. Degene de bekende zal k vrjpreken omdat hj zo goed heeft meegewerkt. Degene de net bekende kan mnten ten jaar verwachten. 3. Al julle allebe bekennen, krjgen julle allebe vjf jaar. De vraag : wat kan een gevangene het bete doen? De eente van het dlemma dat het voor bede verdachten (voor peroon x en peroon ) amen beter te zwjgen, maar elke verdachte denkt alleen aan zjn egen voordeel. Ongeacht wat de ander doet, het voor elke verdachte beter te bekennen. In de tabel taat alleen wat de peroon x krjgt: zwjgt bekent x zwjgt Geldboete Ten jaar x bekent vrj Vjf jaar Vervoer [Wkpeda] In deze tuate gaan menen op hetzelfde moment naar hun werk. Je kunt de bu nemen of de auto, maar de bu duurt ten mnuten langer doordat je naar de buhalte moet lopen. Al meer menen de auto nemen onttaat er een fle, en daar heeft de bu ook lat van. In de tabel taat het effect voor de k-peroon : Iedereen neemt de bu Iedereen neemt de auto Ik neem de bu Duurt 20 mnuten Duurt 130 mnuten Ik neem de auto Duurt 10 mnuten Duurt 120 mnuten 20 130 10 120 Adverteren [Wkpeda] Een dorp heeft twee bakker. Elke bakker heeft de helft van het dorp al klant. Een bakker kan meer klandze krjgen door te adverteren. Dat kot geld, maar daar taat de klandze tegenover. 5 2 4
Twee peroon matrx pellen Speler x kan ut m trategën kezen, peler kan ut n trategën kezen. Een m n matrx A bechrjft de verdente bj gekozen trategën: al peler x tratege ket en peler ket tratege j dan A(, j) een getal dat de verdente van peler x repreenteert. A de paoff matrx voor peler x. De peler weten wat de dvere trategën opleveren (zowel voor zchzelf, al voor de concurrent; A bekend), maar weten net welke tratege de ander peler ket. Nul-om matrx pel In een nul-om matrx pel tellen wnt en verle van bede peler bj edere tratege op tot nul. De theore de wj her behandelen betreft: twee peroon nul-om matrx pellen. De paoff matrx A bekend. Wat de bete tratege? In een twee peroon matrx pel een (bekende) matrx A bechkbaar en ket peler x een rj en peler ket een kolom. De keuze worden onafhankeljk van elkaar gemaakt. Voorbeeld 1. Speler X (Rood) ket de rjen, en peler Y (Groen) ket de kolommen 1 +25 +15 +20 2 +30 +10 20 Bete (mnte rco ) tratege voor X: rj 1 Bete (mnte rco ) tratege voor Y: kolom 2. Stratege (1,2) optmaal: al alleen Y van tratege verandert, verlet hj meer, al alleen X verandert, verdent hj mnder: tratege (1,2) her een Nah evenwcht. 15 de waarde van het pel. (1,2) een zadelpunt van A. X: 15 = maxmna(, j); j 1 = argmax mn j A(, j) Y: 15 = mnmaxa(, j); j 2 = argmn j max A(, j). Voorbeeld 2. X ket rjen, Y ket kolommen. 1 +30 10 +20 2 +10 +20 20 Bete (mnte rco ) tratege voor X: rj 1. Bete (mnte rco ) tratege voor Y: kolom 3. Al Y verandert, kan hj verdenen, Stratege (1,3) her geen Nah evenwcht. A heeft geen zadelpunt. John von Neumann [1928]: al je het pel vaak peelt dan bedt een gemengde tratege (edere zet ke je met een zekere kan) een oplong.
Voorbeeld 2. X ket rjen, Y ket kolommen. Gemengde trategën 1 +30 10 +20 2 +10 +20 20 Stratege voor X: ke rj 1 met kan 4 en rj 2 met kan 3. Stratege voor Y: ke kolom 1 met kan 0, kolom 2 met kan 4, kolom 3 met kan 3. x 4 3 0 4 3 Al de m n matrx A de paoff matrx van X. X ket voor een gemengde tratege x = (x 1,..., x m ) T al x een kanvector (x en x 1 + x 2 +... + x m = 1) en X de zuvere tratege (d.w.z., de -de rj van A) ket met kan x. Al X de gemengde tratege x ket en Y ket, dan de verwachte utbetalng (gemddeld per keer bj vaak pelen) voor X geljk aan x T A en voor Y geljk aan x T A. 10 = max mn j A(, j) < 20 < mn j maxa(, j) = 20 Strak zullen we zen dat deze pecfeke trategën optmaal zjn: al één van de peler afwjkt van deze tratege dan gaat hj er net op voorut: (x,) een Nah evenwcht. Al X tratege x peelt dan krjgt X mnmaal mn x T A utbetaalt (gemddeld per keer, bj vaak pelen). Gemengde trategën Een mnmax tellng Al de m n matrx A de paoff matrx van X. X ket voor een gemengde tratege x = (x 1,..., x m ) T al x een kanvector (x en x 1 + x 2 +... + x m = 1) en X de zuvere tratege (d.w.z., de -de rj van A) ket met kan x. Speler X zal proberen zjn gegarandeerde utbetalng te maxmaleren: De optmale (mnte rco ) gemengde tratege x 0 voor X ( rj-electe-tratege ) x 0 = argmaxx mn x T A A een m n matrx. Heronder zjn x m-kanvectoren en n-kanvector. Stellng. w max x mn xt A = mnmax x xt A w de waarde van het pel. Hoe vnden we de optmale trategën, dwz, de kanvectoren x 0 en 0 de de maxmn, rep. mnmax realeren? Mddel de mplexmethode. waarbj het mnmum en maxmum genomen over alle kanvectoren, repecteveljk x.
Optmale rj-electe Bechouw een m-kanvector x 0 = (x 1,..., x m ) T. Optmale rj-electe Bechouw een m-kanvector x 0 = (x 1,..., x m ) T. Stellng. 0A = mn j x T 0 Ae j = mn j x a j Stellng. 0A = mn j x T 0 Ae j = mn j x a j Bewj. Met c T x T 0A, hebben we dat 0A = max ct en het mnmalerngprobleem zet er ut al: maxc T 1 T = 1, Dt een LP n tandaardvorm! :-) Maxmmum n hoekpunt Max. n = e j zekere j. Conclue. Een optmale tratege x 0 = (x 1,..., x m ) T maxmaleert Equvalente formulerng: mn j a j x 1 T x = 1 en x. zodat maxmaleer z zodat a j x z voor j = 1,..., n, 1 T mx = 1 en x maxmaleer z zodat T m 0 T ] n 0 x 1 A T =, I n 1 n z 0 n Voorbeeld. A = 30 10 20 10 20 20 10 20 0 1 0 1 0 20 20 0 0 1 1 0 0 0 0 0 0 1 M x x Geen potvtet retrcte op z: elmneer z. 10 20 0 1 0 1 0 20 20 0 0 1 1 0 0 0 0 0 0 1 M 40 10 1 1 0 0 0 10 30 1 0 1 0 0 30 10 1 0 0 0 M x h 0 = (1,0,40,0,30) T een hoekpunt Vereenvoudg kolom 1,3 en 5 1 1 0 0 0 1 0 50 1 1 0 40 0 0 0 1 1 30 0 30 0 1 0 M 30 Geen potvtet retrcte op z: elmneer z. 1 1 0 0 0 1 40 10 1 1 0 0 10 30 1 0 1 0 30 10 1 0 0 M 1 4 1 0 0 0 0 0 0 1 2 5 130 0 1 0 1 1 3 0 0 0 0 0 4 1 0 klaar: x 1 = 4, x 2 = 3 (met lack x 3 = 130, x 4 = 0). Invullen n magenta levert z = 20.
Optmale kolom-electe We hebben gezen hoe we een optmale rj-electe-tratege x 0 (de mn x T 0A maxmaleert) kunnen utrekenen. Een optmale kolom-electe-tratege 0 maxmaleert mn x T A x 0 = mn T x 0 ( AT )x en kan du op exact dezelfde maner utgerekend worden al x 0 : we hoeven lecht A te vervangen door A T (en de dmene aan te paen): maxmaleer z zodat T n 0 T ] m 0 1 =, A I m 1 m z 0 m Optmale kolom electe, II Al we de waarde w van het pel kennen (omdat we x 0 utgerekend hebben), dan geldt voor 0 ook dat max x xt A 0 = max e T A 0 = w. Du A 0 w1, 1 T n 0 = 1, 0 : we zjn op zoek naar een acceptabel (feable) punt. In tandaard vorm, n ( T, T ) T zodat T n 0 T ] m 1 =, A I m w1 m.