Statistische paradoxen in de rechtszaal - opdrachten

Vergelijkbare documenten
Statistische paradoxen in de rechtszaal - theorie, voorbeelden en antwoorden

Statistiek in de rechtszaal Het proces van Lucia de B

TEST (foutmarge 1%) FOUT (10-5 )TOCH NIET-ZIEK. VALS ZIEK (99x10-5 ) : B. JUIST 0.99x0.999= (±1) RAAR MAAR WAAR

Verdieping: DNA alleen onvoldoende bewijs

Forensische Statistiek

Kansloos: van Willem Ruis tot Lucia de B.

Evaluatie van een methode voor het modelleren van rechtzaken in een Bayesiaans netwerk (Bachelorproject)

De niet gevonden vlekken

Werkstuk Maatschappijleer putterse moordzaak

Onderzoek: 23 augustus 2018 Auteur: Lisette van Vliet. DNA afstaan verplichten?

Figuur 1. Foto van de gevonden jas.

Statistiek voor A.I. College 7. Dinsdag 2 Oktober

Kansrekening en Statistiek. Overzicht Kansrekening

Voorbereidend Wetenschappelijk Onderwijs Tijdvak 1 Woensdag 25 mei totale examentijd 3 uur

Statistische fouten in een logisch dialoogsysteem

DNA Profile. DNA profielen. DNA profielen. DNA profielen. DNA profielen

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Uitwerkingen Mei Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

In Beeld: Misdaadcijfers

Tweede Kamer der Staten-Generaal

Combinatoriek groep 1 & 2: Recursie

filosofie vwo 2016-I Opgave 1 Twijfel in de rechtbank

Tweede huiswerkopdracht Lineaire algebra 1 Uitwerking en opmerkingen

Formeel Denken 2014 Uitwerkingen Tentamen

Naar wettig en overtuigend bewijs

DE MOORD OP LOS DE MOORD OP VOOR ER NOG MEER SLACHTOFFERS VALLEN!

WIE ZIT WAAR IN DE RECHTBANK?

Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid

Examen VWO. wiskunde B1. tijdvak 2 woensdag 24 juni uur

DE MOORD OP LOS DE MOORD OP VOOR ER NOG MEER SLACHTOFFERS VALLEN!

3p 1 Onderzoek of de relatieve toename van het aandeel van armen en handen groter is dan de relatieve toename van het aandeel van benen en voeten.

Examen VWO. wiskunde C (pilot) tijdvak 1 woensdag 22 mei uur. Bij dit examen hoort een uitwerkbijlage.

van Willem Ruis tot Lucia de B.

Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid

Examen HAVO. Wiskunde A (oude stijl)

Statistiek ( ) eindtentamen

Puzzel: Wie is wie in de kinderrechtszaal?

Misdrijven en opsporing

Probeer de vragen bij Verkennen zo goed mogelijk te beantwoorden.

FLIPIT 5. (a i,j + a j,i )d i d j = d j + 0 = e d. i<j

Leerlingenhandleiding

Redeneren met Onzekerheid II. Manipulatie van Onzekerheid. Kansverdeling. if E 2 then H y2 fi. if E 1 and E 2 then H z fi.

Kansrekening en Statistiek

Activiteitendagen V3. Thema: Sporenonderzoek. Activiteit: bloedspattenproef

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

8. Analyseren van samenhang tussen categorische variabelen

Rijksrecherche onderzoek schrijfproeven Deventer moordzaak: Geen aanwijzingen voor valsheid in geschrifte

Bayesian Belief Networks voor redeneren over juridische bewijsvoering

Module E: Van wie zijn de haren op het dode lichaam?

5,4. Werkstuk door een scholier 1585 woorden 8 september keer beoordeeld. Handel en administratie. Inhoudsopgave

Statistische aspecten van de vaststelling van fraude na opsporing via datamining. Marjan Sjerps - KdVI (Uva) - NFI

Lief Dagboek, 11 augustus Harry kwam opeens opdagen en ik liet hem het eiland zien. Hij is zo lief en begripvol. Ik kon het niet helpen en

Statistiek in een rechtzaak

Puzzel: De rechtszaal

e ronde Klas 3 4

Herkansing eindtoets statistiek voor HBO

Paragraaf 14.0 : Eenheidscirkel

DE MOORD OP LOS DE MOORD OP VOOR ER NOG MEER SLACHTOFFERS VALLEN!

Les 1 Kwadraat afsplitsen en Verzamelingen

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Ook de volledige spiraal van de stroken van lengte 1, 3, 5,, 99 past precies in een rechthoek.

VIERHOEKEN IN PERSPECTIEF

Paragraaf 11.1 : Grafieken en Gebieden

FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

o Geef bij de beantwoording van de vragen ALTIJD JE BEREKENINGEN. Als je alleen een antwoord geeft worden er GEEN PUNTEN toegekend!

Tentamen Inleiding Kansrekening 9 juni 2016, 10:00 13:00 Docent: Prof. dr. F. den Hollander

Combinatoriek en rekenregels

Uitwerkingen Sum of Us

De partitieformule van Euler

Hoofdstuk 8 : Complexe getallen

Leerlinghandleiding. Afsluitende module. Wie van de drie?

DE MOORD OP LOS DE MOORD OP VOOR ER NOG MEER SLACHTOFFERS VALLEN!

Opgave 1 Heeft het vrijwilligerswerk toekomst?

IMO-selectietoets I donderdag 2 juni 2016

Opgaven Kunstmatige intelligentie 4 mei 2012

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Deel C. Breuken. vermenigvuldigen en delen

3 Kansen vermenigvuldigen

Extra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van

Bayesiaanse analyses van complexe strafzaken door deskundigen. Betrouwbaar en zo ja: nuttig? 1

Statistiek voor A.I. College 3. Dinsdag 18 September 2012

Empirische kansen = op ervaring gegrond; bereken je door relatieve frequenties te gebruiken. Wet van de grote aantallen.

S0A17D: Examen Sociale Statistiek (deel 2)

Magidoku s en verborgen symmetrieën

In de handel is het gebruikelijk om korting te geven als een klant veel exemplaren van een bepaald product bestelt.

Eindexamen maatschappijwetenschappen havo II

Practicum hoogtemeting 3 e klas havo/vwo

ProefToelatingstoets Wiskunde B

3 Bijzondere functies

Werkblad 1 Normale dichtheidsfunctie als benadering voor een klokvormig histogram

Opgaven voor Kansrekening

Opgave 2 ( = 12 ptn.)

Kansrekening en Statistiek

Machten, exponenten en logaritmen

De huwelijksstelling van Hall

VU University Amsterdam 2018, Maart 27

Kansrekening en Statistiek

Bij het oplossen van een telprobleem zijn de volgende 2 dingen belangrijk: Is de volgorde van de gekozen dingen van belang?

Tentamen Voortgezette Kansrekening (WB006C)

Transcriptie:

Statistische paradoxen in de rechtszaal - opdrachten Charlotte Vlek www.charlottevlek.nl c.s.vlek@rug.nl 1 februari, 2014 Opdracht 1: de regel van Bayes De regel van Bayes is P (H E) = P (E H)P (H) P (E) Leid de regel van Bayes af uit de definitie van voorwaardelijke kansen P (A B) = P (A,B) P (B) (tip: P (A, B) = P (B, A)). Opdracht 2: groene en blauwe taxi s Een voetganger werd aangereden door een taxi. De taxi reed vervolgens door. In het stadje waar dit plaatsvond zijn slechts twee taxicentrales: een waar alle taxi s blauw zijn, en een waar alle taxi s groen zijn. De verdeling is als volgt: 85 taxi s zijn groen 15 taxi s zijn blauw 1. Hoe groot is de a priori kans P (H) dat een blauwe taxi verantwoordelijk is voor de aanrijding? Er heeft zich inmiddels een getuige gemeld. Deze getuige zegt dat hij een blauwe taxi weg zag rijden. De politie deed een aantal tests met deze getuige onder dezelfde omstandigheden, om te bepalen hoe betrouwbaar dit bewijs was. Daaruit bleek dat de getuige in 80% van de gevallen een blauwe taxi correct identificeerde als blauw, en een groene correct als groen. In 20% van de gevallen ging het mis. We hebben dus de volgende tabel (met H: de taxi verantwoordelijk voor de aanrijding was blauw, H: de taxi verantwoordelijk voor de aanrijding was groen en E: de getuige zegt een blauwe taxi te hebben gezien). H H E 0,8 0,2 E 0,2 0,8 2. De kans dat de hypothese H en het bewijs E zich tegelijk voordoen, wordt gegeven door P (E, H). Dit is dus geen voorwaardelijke kans, maar het kan wel berekend worden op basis van de voorwaardelijke kans P (E H). Gebruik de definitie van voorwaardelijke kansen om P (E, H) uit te drukken in de voorwaardelijke kans P (E H) en de a priori kans P (H). Bereken P (E, H). 3. Bereken ook P (E, H). 4. De kans P (E) is gelijk aan de kans dat E en H tegelijk voorkomen, plus de kans dat E en H tegelijk voorkomen. Oftewel: P (E) = P (E, H) + P (E, H). Dit geldt omdat H en H samen alle gevallen beschrijven. Bereken de kans P (E). 1

5. Bereken de kans P (H E) dat een blauwe taxi verantwoordelijk is voor de aanrijding gegeven de getuigenis. Gebruik de regel van Bayes: P (H E) = P (E H) P (H). P (E) 6. Bereken ook de kans P ( H E). Welk taxibedrijf moet een boete krijgen? Opdracht 3: de Adams-zaak In 1991 vond in Hemel Hempstead een verkrachting plaats. In 1993 werd Denis John Adams gearresteerd voor een ander misdrijf en bij een routine-check bleek zijn DNA te matchen met DNA in sperma gevonden bij het slachtoffer van de verkrachting in 1991. Deze zaak lijkt op de Vaatstra-zaak in de zin dat de verdachte voorafgaand aan de DNA-test geen bijzonder geval was. We definiëren H en E als volgt: H is de hypothese dat Adams schuldig is E is het DNA-bewijs We hebben de volgende gegevens: De kans dat het DNA-bewijs gevonden zou zijn terwijl Adams onschuldig is (de random match probability), is 1 op 2 miljoen. De kans dat het DNA-bewijs er is op voorwaarde dat Adams schuldig is, is 1. Er wonen 300.000 mannelijke volwassenen in Hemel Hempstead, en er zouden nog eens 100.000 andere volwassen mannen op het moment van de verkrachting in de omgeving kunnen zijn geweest. Adams is dus een van de 400.000 potentile verkrachters. Beantwoord de volgende vragen: 1. Een rechter concludeert: de kans dat Adams onschuldig is, is 1 op 2 miljoen. Wat gaat hier mis? 2. Wat is de a priori kans P (H), dat Adams schuldig is? 3. Neem onderstaande tabel over en vul die in met de juiste kansen. H H E...... E...... 4. Bereken de kans P (E) op het vinden van bewijsstuk E. Gebruik P (E) = P (E, H) + P (E, H). 5. Bereken de a posteriori kans P (H E) dat Adams schuldig is gegeven het DNA-bewijs. Gebruik de regel van Bayes. 6. Is het DNA-bewijs voldoende om overtuigend te concluderen dat Adams schuldig is? Opdracht 4: de Adams-zaak in een Bayesiaans netwerk We kijken nog eens naar de Adams-zaak, ditmaal met meerdere variabelen. De (on)afhankelijkheden zijn gemodelleerd in Figuur 1. De tabellen in 1 geven de bijbehorende conditionele kansen. 1. Bekijk de conditionele kanstabellen van het Bayesiaanse netwerk. Leg uit welke kans de 0 in de onderste tabel (voor de knoop Getuigenis) voorstelt. 2. Waarom is deze kans op 0 geschat? 2

Verkrachter Vriendin liegt Match Herkend Getuigenis Figure 1: Een Bayesiaans netwerk voor de Adams-zaak Verkrachter = waar 0, 0000025 Vriendin liegt = waar 0, 4 Verkrachter = onwaar 0, 9999975 Vriendin liegt = onwaar 0, 6 Match = waar 1 0, 0000005 Match = onwaar 0 0, 9999995 Herkend = waar 0,9 0,1 Herkend = onwaar 0,1 0,9 Vr l = waar Vr l = onwaar Vr l = waar Vr l = onwaar Getuigenis = waar 0,99 0 0,1 0,9 Getuigenis = onwaar 0,01 1 0,9 0,1 Table 1: Tabellen bij het netwerk voor Adams 3. Hoe groot is de kans op de getuigenis (de vriendin getuigt: Adams was bij haar die avond) als Adams de verkrachter was, en de vriendin liegt? Berekeningen binnen een Bayesiaans netwerk kunnen gebruik maken van onafhankelijkheden in het netwerk. Daartoe kijken we naar de collectie ouders van een knoop X. De ouders (genoteerd als pa(x)) zijn alle knopen Y die met een pijl verbonden zijn met X in de richting Y X. Kortom: pa(x) = {Y Y X}. Om de kans op X te berekenen hoeven we alleen te kijken naar alle voorouders van X: dit zijn de ouders van ouders van ouders (etc) van X. Voor een netwerk met knopen A 1,..., A n (over het domein U = {A 1,..., A n })vinden we de gezamelijke kansverdeling als volgt: P (U) = Π n i=1p (A i pa(a i )) Voor de kans P (Getuigenis = waar, Verkrachter = waar, Vriendin liegt = waar) vermenigvuldigen we de (conditionele) kansen van deze knopen, maar hoeven we de knopen Herkend en Match niet mee te nemen, omdat het geen ouders zijn van Getuigenis, Verkrachter of Vriendin liegt: P (Getuigenis = waar, Verkrachter = waar, Vriendin liegt = waar) = P (Getuigenis = waar Verkrachter = waar, Vriendin liegt = waar) P (Verkrachter = waar) P (Vriendin liegt = waar) 3

Als we niets weten over de waarde van Verkrachter en Vriendin liegt, dan tellen we de kansen voor alle mogelijke waarden van die twee variabelen bij elkaar op: P (Getuigenis = waar) = P (Getuigenis = waar, Verkrachter = waar, Vriendin liegt = waar) + P (Getuigenis = waar, Verkrachter = waar, Vriendin liegt = onwaar) + P (Getuigenis = waar, Verkrachter = onwaar, Vriendin liegt = waar) + P (Getuigenis = waar, Verkrachter = onwaar, Vriendin liegt = onwaar) 4. Hoe groot is de kans op de getuigenis als Adams de verkrachter was (zonder verdere informatie over de vriendin)? 5. Uiteindelijk zijn we natuurlijk geïnteresseerd in de kans dat Adams de verkrachter was, gegeven het bewijs. In opdracht 3 hebben we de kans P (Verkrachter = waar Match = waar) 0, 84 berekend. Wat gebeurt er met deze kans nu we een Bayesiaans netwerk hebben met meer variabelen? 6. Behalve de DNA match zijn er nog twee andere bewijsstukken: Adams is niet herkend door het slachtoffer (Herkend = onwaar) en de vriendin van Adams getuigde dat hij bij haar was die avond (Getuigenis = waar). De regel van Bayes kunnen we als volgt generaliseren voor meerdere bewijsstukken: P (H E 1, E 2, E 3 ) = P (E 1, E 2, E 3 H) P (H) P (E 1, E 2, E 3 ) Schrijf uit hoe we hiermee de kans kunnen berekenen dat Adams de verkrachter was gegeven de drie bewijsstukken. Optioneel (voor liefhebbers met een rekenmachine bij de hand): bereken deze kans. Opdracht 5: De verklaring van een verdachte In de Anjumer moordzaak werden twee lijken gevonden op het terrein van een pension in het Friese Anjum. Eigenaresse van het pension, Marjan van der E. is veroordeeld voor beide moorden. Het politieonderzoek begon nadat Beekman, de buurman van Marjan, een verklaring aflegde dat Marjan tegen hem had gezegd dat ze iemand had vermoord: Leo de Jager, om precies te zijn. In deze opgave houden we ons alleen bezig met deze ene moord op Leo. Gedurende het politieonderzoek kwam er allerlei informatie boven water waaruit vrij duidelijk bleek dat Leo was gedood in het pension, doordat hij met een hamer op zijn hoofd was geslagen. Er was echter weinig bewijs dat duidelijk een verdachte aanwees. De verklaring van Beekman was een van de weinige bewijsstukken dat direct Marjan aanwees als verdachte. Er was echter nog een andere aanwijzing: het lijk van Leo lag buiten, terwijl er allerlei bloedsporen werden gevonden in de gang. Als Marjan Leo had gedood in de gang en helemaal alleen naar buiten had gemanouvreerd, dan zou er vrijwel zeker een bloederig sleepspoor in de gang te vinden zijn. Als zij niet degene was die Leo gedood had, dan was er misschien geen sleepspoor geweest (bijvoorbeeld omdat de aanvaller sterk genoeg was om Leo te tillen in plaats van te slepen). Deze informatie kunnen we modelleren in een Bayesiaans netwerk met knopen voor Marjan als aanvaller ( Marjan ), het sleepspoor en de verklaring van Beekman, zie Figuur 2a. Echter, wanneer het Beekman zelf was die Leo heeft gedood, zou dit ook kunnen verklaren waarom hij Marjan beschuldigt: hij wil de aandacht op haar vestigen zodat hij hopelijk zelf niet verdacht wordt. Daarom nemen we de mogelijkheid dat Beekman het gedaan heeft mee in het netwerk (een extra knoop Beekman ), zie Figuur 2b. In deze vraag zullen we zien dat het sleepspoor een cruciale rol speelt. De kanstabellen bij het netwerk in Figuur 2b staan in Tabel??. 1. Het politieonderzoek begon met de verklaring van Beekman dat Marjan hem had verteld dat ze Leo had vermoord. Hoe groot is de kans dat Marjan het gedaan heeft, gegeven deze verklaring van Beekman? 2. Hoe groot is de kans dat Beekman het gedaan heeft, gegeven zijn eigen verklaring? 4

Marjan Marjan Beekman Sleepspoor Verklaring Sleepspoor Verklaring (a) Alleen Marjan is verdachte (b) Beekman is ook verdachte Figure 2: Netwerken voor de Anjumer moordzaak Marjan = waar 0, 0001 Beekman = waar 0, 0001 Marjan = onwaar 0, 9999 Beekman = onwaar 0, 9999 Marjan = waar Marjan = onwaar Sleepspoor = waar 0,99 0,5 Sleepspoor = onwaar 0,01 0,5 Beekman = waar Beekman = onwaar Marjan = waar Marjan = onwaar Marjan = waar Marjan = onwaar Verklaring = waar 0,1 0,6 0,99 0,001 Verklaring = onwaar 0,9 0,4 0,01 0,999 Table 2: Kanstabellen bij de Anjumer moordzaak 3. Met alleen de verklaring van Beekman, wie is dus de meest voor de hand liggende verdachte? 4. Er wordt geen sleepspoor gevonden in het pension. Overige sporen zijn overduidelijk, dus we kunnen concluderen dat het sleepspoor er echt niet is geweest. Hoe groot is nu de kans dat Marjan het heeft gedaan? En Beekman? 5