14. Beslissingsanalyse en speltheorie

14. Beslissingsanalyse en speltheorie 14.1. Beslissingsomgeving Beslissingsanalyse of besliskunde: Gebruik van rationele processen om het beste alternatief uit meerdere alternatieven te selecteren. Hoe goed is een geselecteerd alternatief? Dit hangt af van de kwaliteit van de gegevens. Drie categorieën: 1. Beslissing onder zekerheid: gegevens zijn deterministisch 2. Beslissing onder risico: gegevens beschreven door waarschijnlijkheidsdichtheden 3. Beslissing onder onzekerheid: gegevens kunnen geen relatieve gewichten toegekend worden die hun graad van belangrijkheid in het beslissingsproces weergeven 14.2. Beslissingen onder zekerheid vb: Lineaire programmering enkel bruikbaar als alles kwantitatief is beslissingsvariabelen verbonden door een wel gedefinieerde wiskundige lineaire functie Typeset by FoilTEX 6

Hier anders: ideeën, gevoelens, emoties worden gekwantificeerd om een numerieke schaal te bekomen waarop de alternatieven kunnen gerangschikt worden. 14.3 Beslissingen onder risico payoffs van de beslissingsalternatieven beschreven door waarschijnlijkheidsdistributie gebaseerd op verwachte criteriumwaarde beperkingen 14.3.1. Verwachte criteriumwaarde maximalisatie van verwachte winst of minimalisatie van verwachte kost gegevens zodanig dat payoff van beslissingsalternatief probabilistisch is 14.3.1.1. Beslissingsboom : beslissingsknoop : kansknoop alternatieven+ toestanden gevolgen Typeset by FoilTEX 7

p j (> 0): probabiliteit van toestand j a ij : payoff van alternatief i gegeven toestand j verwachte payoff van alternatief i EV i = a i1 p 1 + a i2 p 2 + + a in p n met p 1 + + p n = 1 beste alternatief is alternatief i waarvoor: EVi EVi = max{ev i } i.g.v. winst i = min{ev i } i.g.v. kosten i i = 1,..., m 14.3.1.2. Meer complexe beslissingssituaties payoff is een wiskundige functie van de beslissingsalternatieven beslissingsbomen niet zo bruikbaar Voorbeeld 14.3 2 14.3.2. Variaties op de verwachte criteriumwaarde posteriori probabiliteiten nut versus actuele geldwaarde aanpassing zodat ook geldig voor beslissingsproblemen op korte termijn Typeset by FoilTEX 8

14.3.2.1. Posteriori (Bayes) probabiliteiten probabiliteiten meestal afgeleid uit historische gegevens probabiliteiten aanpassen aan recente informatie informatie bekomen uit steekproeven of experimenten posteriori (Bayes) prior voorbeeld 14.3 3 14.3.2.2 Nutsfuncties payoff of actuele/werkelijke geld- tot nu toe: waarde gevallen waar nut belangrijker dan de werkelijke waarde Voorbeeld: twee visies: (1) investering heeft 50% kans om 40.000 winst op te leveren (2) investering heeft 50% kans om 20.000 verlies te lijden verschillende houdingen tov risico maw verschillend nut m.b.t. risico SUBJECTIEF Typeset by FoilTEX 9

Hoe houding t.o.v. risico kwantificeren? via nutsfunctie Voorbeeld: (vervolg) bepaal U(x) met 20.000 < x < 40.000 om de vorm van U te bepalen (1) onverschillig t.o.v. risico of risiconeutraal rechte die (0, 20 000) en (100, 40 000) verbindt actuele geldwaarde en haar nut leveren consistente beslissingen (2) risico-avers of gevoeliger voor verlies dan voor winst ( voorzichtig ) (3) risico-minnend of gevoeliger voor winst dan voor verlies (4) combinatie risico-avers en risico-minnend nutsfunctie heeft S-vorm Kwantificeren van houding t.o.v. risico binnen de voorziene intervallen d.m.v. weddenschappen. Stel: U(x) = pu( 20 000) + (1 p)u(40 000) = p 0 + (1 p)100 = 100 100p Typeset by FoilTEX 10

(1) weddenschap of loterij verlies van 20 000 met kans p winst van 40 000 met kans 1 p (2) gegarandeerde geldhoeveelheid x Beslissingsnemer bepaalt p zodat hij indifferent of onverschillig is tussen deze twee keuzes Bijvoorbeeld: als x = 20 000 kiest beslissingsnemer p = 0.8 U(20000) = 100 80 = 20 herhalen voor voldoende x ]0, 100[ vorm van nutsfunctie nutsfunctie zelf via regressie of lineaire interpolatie tussen de punten onderstelling: beslissingsnemer is rationeel verwachte nutswaarde EUV i = j p j U(a ij ) alternatief i toestand j payoff a ij Typeset by FoilTEX 11

14.4. Beslissing onder onzekerheid alternatieven/acties + toestanden gevolgen/payoffs a i + s j v(a i, s j ) verschil met beslissing onder risico: hier waarschijnlijkheidsdistributie van s j niet gekend of niet mogelijk te bepalen nieuwe criteria Laplace Minimax Savage Hurwicz verschillend in graad van conservatisme van de beslissingsnemer ten aanzien van onzekerheid 14.4.1. Laplace-criterium principe van onvoldoende redenen: P (s j ) onbekend geen redenen om aan te nemen dat ze verschillend zijn optimistische onderstelling: P (s 1 ) = P (s 2 ) =... = P (s n ) = 1 n Typeset by FoilTEX 12

beste alternatief in geval van winst 1 n max v(a a i i, s j ) n j=1 beste alternatief i.g.v. verlies: minimum 14.4.2. Maximin of minimax criterium het beste halen uit de meest slechte condities i.g.v. winst: maximin criterium max{min v(a i, s j )} a i s j i.g.v. verlies: minimax criterium verliezen beperken min{max v(a i, s j )} a i s j 14.4.3. Savage regret criterium afzwakken van vorige criteria Typeset by FoilTEX 13

(winst of verlies) payoff matrix v(a i, s j ) vervangen door een verlies- (of spijt-) matrix r(a i, s j ): max v(a i, sj) v(a i, s j ) v is winst a r(a i, s j ) = i v(a i, s j ) min v(ai, s j ) v is verlies a i Voorbeeld 14.4.4. Criterium van Hurwicz ganse range van houdingen: meest pessimistisch meest optimistisch stel 0 α 1 en onderstel v(a i, s j ) is winst dan geselecteerde actie volgt uit max{α max v(a i, s j ) + (1 α) min v(a i, s j )} a i s j s j parameter α: index van optimisme α = 0 : minimax criterium α = 1 : het beste van het beste -criterium α = 0.5 : in afwezigheid van sterke voorkeur voor optimisme of pessimisme i.g.v. v(a i, s j ) is verlies min{α min v(a i, s j ) + (1 α) max v(a i, s j )} a i s j s j Typeset by FoilTEX 14