Inleidend College HOVO Gebruik en Misbruik Statistiek



Vergelijkbare documenten
Is Bewijsrecht Kans-Loos?

Valkuilen bij Nulhypothese Toetsen inleiding tot het gastcollege van Dr. Eric-Jan Wagenmakers. Peter Grünwald HOVO

Over Het Bedrijven van Statistiek in Kansloze Situaties

P-waardes deugen niet!

Statistiek in de rechtszaal Het proces van Lucia de B

Statistische paradoxen in de rechtszaal - theorie, voorbeelden en antwoorden

Statistische aspecten van de vaststelling van fraude na opsporing via datamining. Marjan Sjerps - KdVI (Uva) - NFI

Kansloos: van Willem Ruis tot Lucia de B.

DNA Profile. DNA profielen. DNA profielen. DNA profielen. DNA profielen

Kansrekening en Statistiek

Kansrekenen: Beliefs & Bayes

Kansloos: van Willem Ruis tot Lucia de B.

Bayes Factor voor samengestelde hypothesen

Kansrekening en Statistiek

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

van Willem Ruis tot Lucia de B.

HOVO statistiek November

Kansrekening en Statistiek

Berekening en toepassing van forensische bewijswaarde: frequentistisch of Bayesiaans?

Kansrekening en Statistiek

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Kansrekening en Statistiek

WAARSCHIJNLIJKHEID (EN) MODELLEREN

Kansrekening en Statistiek. Overzicht Kansrekening

Statistische paradoxen in de rechtszaal - opdrachten

Statistisch Priesterschap

Technische Universiteit Delft Faculteit Elektrotechniek, Wiskunde en Informatica Delft Institute of Applied Mathematics

Laplace Experimenteel Intuïtie Axiomatisch. Het kansbegrip. W. Oele. 27 januari W. Oele Het kansbegrip

Toetsen van hypothesen

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

TEST (foutmarge 1%) FOUT (10-5 )TOCH NIET-ZIEK. VALS ZIEK (99x10-5 ) : B. JUIST 0.99x0.999= (±1) RAAR MAAR WAAR

Statistiek voor A.I. College 7. Dinsdag 2 Oktober

Forensische Statistiek

Uitleg significantieniveau en toetsen van hypothesen

Populaties beschrijven met kansmodellen

Berekening en toepassing van forensische bewijswaarde: frequentistisch of Bayesiaans?

Overzicht. Help! Statistiek! Stelling van Bayes. Hoe goed is leverscan ( test T ) voor het diagnostiseren van leverpathologie ( ziekte Z )?

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

van Willem Ruis tot Lucia de B.

Kansrekening en Statistiek

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Overzicht. Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen. Voorwaardelijke kans. Voorbeeld: Probabilistisch redeneren

De rekenende rechter

HOVO statistiek

Opdrachten Toeval Opdrachten Toeval Opdracht 1.1 (Bestaat toeval) Opdracht 1.2(toeval in de natuur)

Lesbrief hypothesetoetsen

Kansrekening en Statistiek

Bayesiaanse analyses van complexe strafzaken door deskundigen. Betrouwbaar en zo ja: nuttig? 1

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

Vakbijlage - De reeks waarschijnlijkheidstermen van het NFI en het Bayesiaanse model voor interpretatie van bewijs

Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid

Kansrekening en Statistiek

Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid

Statistiek en Rechtspraak prima combinatie of riskant?

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Reactie op Alkemades weerwoord

Voorbereidend materiaal Wiskundetoernooi 2010: Antwoorden op de opgaven

Tentamenset A. 2. Welke van de volgende beweringen is waar? c. N R N d. R Z R

Meer weten, minder kansen

Psychologische diagnostiek : Proces, Betrouwbaarheid, validiteit (h 5 en 6)

Criminalistiek is terugredeneren

Is statistiek wel betrouwbaar?

Kansrekening en Statistiek

Registratie-eisen en toetsingsprocedure Humane DNA-analyse en -interpretatie Versie 1.1 (Juli 2010)

HBO statistiek Oefening

Kansrekening en Statistiek

Value based healthcare door een quality improvement bril

Kun je met statistiek werkelijk alles bewijzen?

Bij het oplossen van een telprobleem zijn de volgende 2 dingen belangrijk: Is de volgorde van de gekozen dingen van belang?

Creatief onderzoekend leren

De Verborgen Boodschap van Buitenzintuiglijke Waarneming. Eric-Jan Wagenmakers

Paragraaf 7.1 : Het Vaasmodel

Logisch denken over kansen

Statistiek voor A.I. College 5. Dinsdag 25 September 2012

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015

1. Degodsdienstoorlog der statistici.

Forensische Statistiek

Bij gebrek aan bewijs

Formulier voor het beoordelen van de kwaliteit van een artikel over een diagnostische test of screeningsinstrument.

Voorwaardelijke kansen, de Regel van Bayes en onafhankelijkheid

Hoofdstuk 3 Statistiek: het toetsen

Praktische opdracht Wiskunde A Patience

Taxanomie van Bloom en de kunst van het vragen stellen. Anouk Mulder verschil in talent

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

De Taxonomie van Bloom Toelichting

Veiligheid en methodologie of Waarom voortijdig stoppen? Job van der Palen METC Twente

werkcollege 6 - D&P10: Hypothesis testing using a single sample

Rekenen aan de zaak Lucy de B.

Good science, bad science: Questioning research practices in psychological research Bakker, M.

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

15.1 Beslissen op grond van een steekproef

Volkert Siersma. Statistiek in de Deense gezondheidszorg

Naar wettig en overtuigend bewijs

Statistische fouten in een logisch dialoogsysteem

onderdeel van

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Laag Vaardigheden Leerdoelen Formulering van vragen /opdrachten

o Geef bij de beantwoording van de vragen ALTIJD JE BEREKENINGEN. Als je alleen een antwoord geeft worden er GEEN PUNTEN toegekend!

Wat zeggen al die getallen eigenlijk?

Transcriptie:

Inleidend College HOVO Gebruik en Misbruik Statistiek Deze slides worden op de website gezet! Docenten: Richard Gill, Willem van Zwet, Peter Grünwald Web: http://www.math.leidenuniv.nl/~gill/hovo 17-10: dopingcontrole in de sport (prosecutor s fallacy) 24-10: psychologisch onderzoek (frequentie-statistiek, smokkelen met protocol ) 31-10: klimaatverandering, de hockeystick grafiek (gerommel met data en methodes, publicatiebias) 7-11: Lucia de Berk: prosecutor s fallacy (o.a.) Geneeskunde, epidemiologie, 12-12: forensisch DNA: goed gebruik van statistiek Menu 1e Uur Een van de meest gemaakte fouten 1. Een van de Meest Gemaakte Fouten 2. Sally Clark: Moordenaar of Pechvogel? 3. Analyse van de Fout via Frequentistische statistiek Achterafstatistiek Publicatie bias 4. Analyse van de Fout via Bayesiaans redeneren Wat is een kans? Wat is een voorwaardelijke kans? Prosecutor s Fallacy 5. Begrippenkader Stel, er is iets heel onverwachts gebeurd; iets met een hele kleine kans. Men redeneert vaak als volgt:...er is iets gebeurd met een kleine kans, dus het is vast geen toeval geweest er moet haast wel iets achter zitten 1e Coll. HOVO Gebruik/Misbruik Statistiek 1

Een van de meest gemaakte fouten Take Home Message Nr 1 Stel, er is iets heel onverwachts gebeurd; iets met een hele kleine kans. Men redeneert vaak als volgt:...er is iets gebeurd met een kleine kans, dus het is vast geen toeval geweest er moet haast wel iets achter zitten Ook hoogopgeleiden, inclusief wetenschappers zijn geneigd zo te redeneren Gebeurtenissen met een astronomisch kleine kans gebeuren voortdurend. Meestal is dat gewoon toeval! Maar deze redenering is verkeerd! Dingen met hele kleine kans gebeuren gewoon! Take Home Message Nr 1 Gebeurtenissen met een astronomisch kleine kans gebeuren voortdurend. Meestal is dat gewoon toeval! Als je statistiek correct toepast, komt er uit heel veel analyses dit zou best wel eens toeval kunnen zijn...maar het is heel heel gemakkelijk kleine foutjes te maken die het vaak veel intuitievere of gewenstere resultaat opleveren: geen toeval Veel misbruik van statistiek in rechtzaal, geneeskunde, sport, psychologie,... is hierop terug te voeren Voorbeeld 1: Sally Clark (1964-2007) Sally Clark s eerste kind stierf drie maanden na de geboorte SIDS (wiegendood), dacht men Sally s tweede kind stierf ook kort na de geboorte Op het lijkje werden een aantal plekken gevonden die op fysiek geweld konden wijzen 1e Coll. HOVO Gebruik/Misbruik Statistiek 2

Voorbeeld 1: Sally Clark (1964-2007) Sally Clark s eerste kind stierf drie maanden na de geboorte SIDS (wiegendood), dacht men Sally s tweede kind stierf ook kort na de geboorte Op het lijkje werden een aantal plekken gevonden die op fysiek geweld konden wijzen Sir Roy Meadow, beroemd specialist op het gebied van SIDS, betoogde (1) de kans dat twee kinderen in dezelfde familie aan SIDS overlijden is 1 op 73 miljoen (2) DUS de zaak is uitermate verdacht. "one sudden infant death in a family is a tragedy, two is suspicious and three is murder unless proven otherwise" Sir Roy betoogde (1) de kans dat twee kinderen in dezelfde familie aan SIDS overlijden is 1 op 73 miljoen (2) DUS de zaak is uitermate verdacht. "one sudden infant death in a family is a tragedy, two is suspicious and three is murder unless proven otherwise" Kritiek richtte zich vooral op getal 1/73 miljoen (was inderdaad incorrect), maar het woordje DUS is minstens zo verkeerd Sir Roy betoogde (1) de kans dat twee kinderen in dezelfde familie aan SIDS overlijden is 1 op 73 miljoen (2) DUS de zaak is uitermate verdacht. "one sudden infant death in a family is a tragedy, two is suspicious and three is murder unless proven otherwise" Sir Roy betoogde (1) de kans dat twee kinderen in dezelfde familie aan SIDS overlijden is 1 op 73 miljoen (2) DUS de zaak is uitermate verdacht. Betere analyse: er zijn twee hypothesen. SCHULD: Een moeder doodde haar 2 kinderen ONSCHULD: 2 kinderen in 1 gezin sterven aan SIDS Beide hypothesen hebben extreem kleine kans Je mag dus niet concluderen: de kans dat Sally schuldig is, is heel groot 1e Coll. HOVO Gebruik/Misbruik Statistiek 3

Take-Home Message Nr 2 Verdediging haalde er een vermaard statisticus bij om uit te leggen dat de aanwijzing voor moord niet sterk was, maar de rechter vond het niet nodig de statisticus ter zitting te vragen, want hij vond: this is not rocket science Maar: het is wel rocket science De Essentie van de Fout Stel, Jantje wint de loterij. Ik zeg: de kans dat Jantje zou winnen is zo klein (< 1 op 1 miljoen), dat het geen toeval kan zijn. Hij zal wel gefraudeerd hebben! De Essentie van de Fout Dingen met een kleine kans gebeuren gewoon Stel, Jantje wint de loterij. Ik zeg: de kans dat Jantje zou winnen is zo klein (< 1 op 1 miljoen), dat het geen toeval kan zijn. Hij zal wel gefraudeerd hebben! Maar iemand moet de loterij winnen. Als Pietje had gewonnen, hadden we gezegd dat dat geen toeval was. Dat kan niet goed zijn! Richard Feynman, een van de grootste natuurkundigen van de 20e eeuw: You know, the most amazing thing happened to me tonight. I was coming here, on the way to the lecture, and I came in through the parking lot. And you won't believe what happened. I saw a car with the license plate ARW 357. Can you imagine? Of all the millions of license plates in the state, what was the chance that I would see that particular one tonight? Amazing! 1e Coll. HOVO Gebruik/Misbruik Statistiek 4

Hoe dan wel statistiek bedrijven? Hoe dan wel statistiek bedrijven? Maar hoe kun je ooit valide statistische conclusies (bijv. dit geneesmiddel is effectief ) trekken als dingen met een hele kleine kans gewoon gebeuren? Statistici hebben twee methoden bedacht waarmee het toch kan: 1. Frequentistische methode 2. Bayesiaanse methode Maar hoe kun je ooit valide statistische conclusies (bijv. dit geneesmiddel is effectief ) trekken als dingen met een hele kleine kans gewoon gebeuren? Statistici hebben twee methoden bedacht waarmee het toch kan: 1. Frequentistische methode 2. Bayesiaanse methode (Er is een nog steeds niet geheel uitgewoede richtingenstrijd over welke methode nu beter is. Dat is voorlopig niet van belang voor ons...het probleem zit m niet in welke methode men gebruikt, maar dat men methodes verkeerd gebruikt) De Fout, Frequentistisch Bekeken De Fout, Frequentistisch Bekeken Stel, Jantje wint de loterij. Ik toets vervolgens twee hypotheses: Hypothese H0: Er is niets aan de hand met Jantje vs. Hypothese H1: Het is geen toeval (bijv. Jantje fraudeert) Ik zeg: de kans dat Jantje zou winnen is zo klein (< 1 op 1 miljoen), dat het geen toeval kan zijn Stel, Jantje wint de loterij. Ik toets vervolgens twee hypotheses: Hypothese H0: Er is niets aan de hand met Jantje vs. Hypothese H1: Het is geen toeval (bijv. Jantje fraudeert) Ik zeg: de kans dat Jantje zou winnen is zo klein (< 1 op 1 miljoen), dat het geen toeval kan zijn Maar iemand moet de loterij winnen. Als Pietje had gewonnen, hadden we gezegd dat dat geen toeval was. Dat kan niet goed zijn! 1e Coll. HOVO Gebruik/Misbruik Statistiek 5

Correcte Frequentistische Statistiek Correcte Frequentistische Statistiek Jantje heeft de loterij gewonnen. Ik weet dat het best toeval kan zijn, maar ik vertrouw Jantje niet helemaal, want hij hing en hangt nog steeds met een verrekijker rond bij het gebouw van de staatsloterij. Daarom toets ik Hypothese H0: Er is niets aan de hand met Jantje vs. Hypothese H1: Jantje fraudeert met de toets Jantje wint de eerstvolgende loterij Jantje heeft de loterij gewonnen. Ik weet dat het best toeval kan zijn, maar ik vertrouw Jantje niet helemaal, want hij hing en hangt nog steeds met een verrekijker rond bij het gebouw van de staatsloterij. Daarom toets ik Hypothese H0: Er is niets aan de hand met Jantje vs. Hypothese H1: Jantje fraudeert met de toets Jantje wint de eerstvolgende loterij Als Jantje nu weer wint, dan zegt het wel degelijk wat, omdat we het van te voren voorspeld hebben! Take Home Message Nr 3: geen achteraf-frequentistische statistiek! Frequentistische statistiek mag nooit gebruikt worden om een hypothese te toetsen op de data die de hypothese suggereerde. In plaats daarvan moet men nieuwe data verkrijgen, bijvoorbeeld door een experiment op te zetten Statistiek in rechtzaken (Lucia de Berk, Sally Clarke) is echter vrijwel altijd achteraf statistiek. Het is onethisch en soms zelfs onmogelijk om een experiment op te zetten om te kijken of het gevonden effect herhaalbaar is! Frequentistisch toetsen is dus meestal niet toepasbaar in dat soort zaken. Frequentistisch Toetsen Vrijwel alle wetenschappelijke onderzoeken waarover u in de krant leest zijn gebaseerd op nulhypothese toetsen, de standaard frequentistische methode aspirine helpt tegen hartinfarct, met 3 koppen koffie op kun je beter opletten, vleeseters gedragen zich onbeschoft, enz. enz. Wanneer goed uitgevoerd (dus bijv. niet achteraf ) zijn resultaten in principe betrouwbaar: in slechts maximaal 5% van de onderzoeken zal de uitkomst zijn er is iets aan de hand terwijl er niets aan de hand is. Toch kan er van alles misgaan, bijvoorbeeld... 1e Coll. HOVO Gebruik/Misbruik Statistiek 6

Publication Bias J. Ioannidis, PLoS Medicine 2005: minstens 30% van alle veelgeciteerde onderzoeksresultaten in de geneeskunde kloppen niet, d.w.z. ze zijn niet reproduceerbaar minstens 30% van alle veelgeciteerde onderzoeksresultaten in de geneeskunde kloppen niet, d.w.z. ze zijn niet reproduceerbaar Xkcd.org 1e Coll. HOVO Gebruik/Misbruik Statistiek 7

Take Home Message Nr 4 De resultaten waar wij over lezen/horen in het nieuws bijv. zout is slecht voor u, rode wijn is goed voor u, Zuidafrikaanse honden zijn racistisch, linkshandigen leven 8 jaar korter, enz. enz. zijn een hele vreemde selectie Opvallende/politiek gewenste resultaten halen het nieuws, saaie resultaten doen dat niet: publication bias Gemiddeld over alle goed uitgevoerde onderzoeken wordt er slechts 5% een fout gemaakt; maar gemiddeld over goed uitgevoerde maar opvallende resultaten worden er vermoedelijk veel meer fouten gemaakt! Enige oplossing: belangwekkende resultaten moeten gerepliceerd worden. In bijv psychologie gebeurt dat bijna nooit! Beperking van Frequentistisch Toetsen Statistiek in rechtzaken (Lucia de Berk, Sally Clarke) vrijwel altijd achteraf statistiek. Frequentistisch toetsen is dus meestal niet toepasbaar in dat soort zaken. Bayesiaans redeneren is wel enigszins bruikbaar in achteraf gevallen, maar heeft zo zijn eigen probleempjes...(het blijft rocket science ) Menu Wat is een Kans? Er is iets bijzonders, met hele kleine kans gebeurd Redenen voor foutieve conclusie er moet wel iets aan de hand zijn Onderbuikstatistiek van de krantenlezer/rechter/... ( waar rook is, is vuur ) Verkeerd toegepaste frequentie-statistiek 1. Achteraf Statistiek 2. Publicatie-Bias Prosecutor s Fallacy 1. Wat is een (voorwaardelijke) kans? 2. Regel van Bayes Het wiskundig symbool voor een kans is P of Pr Kansen zijn gedefinieerd op uitkomsten van een experiment. De som van de kansen op alle uitkomsten is altijd 1. Voorbeeld: een eerlijke dobbelsteen: de uitkomstenruimte is {1,2,3,4,5,6} De kansen zijn: Pr(X=1)= 1 6 ; Pr(X=2)=1 6... Pr(X=6)=1 6 1e Coll. HOVO Gebruik/Misbruik Statistiek 8

Het Aanpassen van Kansen Het Aanpassen van Kansen 1. Ik gooi een eerlijke dobbelsteen; ik zie de uitkomst (een getal tussen 1 en 6) maar u niet 2. Ik vertel u ofwel de uitkomst is even ofwel de uitkomst is oneven 3. Stel dat ik u vertel de uitkomst is even. Wat is volgens u dan de kans dat er 4 is gegooid? 1. Ik gooi een eerlijke dobbelsteen; ik zie de uitkomst (een getal tussen 1 en 6) maar u niet 2. Ik vertel u ofwel de uitkomst is even ofwel de uitkomst is oneven 3. Stel dat ik u vertel de uitkomst is even. Wat is volgens u dan de kans dat er 4 is gegooid? U zegt: er zijn nog drie mogelijkheden over. Die hebben allemaal gelijke kans, dus: de kans op 4 is nu 1/3 Voorwaardelijke Kansen Voorwaardelijke Kansen Eerst was de kans 1/6 U past deze kans aan omdat u nieuwe informatie heeft; dit heet conditioneren De kans is nu 1/3 geworden We zeggen: de conditionele (of voorwaardelijke ) kans op X=4, gegeven dat X is even, is 1/3 Eerst was de kans 1/6 U past deze kans aan omdat u nieuwe informatie heeft; dit heet conditioneren De kans is nu 1/3 geworden We zeggen: de conditionele kans op X=4, gegeven dat X is even, is 1/3 streep betekent: gegeven dat 1e Coll. HOVO Gebruik/Misbruik Statistiek 9

The Prosecutor s Fallacy, vb. 1 The Prosecutor s Fallacy, vb. 1 Wat is de kans dat een man langer dan 1m90 is, als gegeven is dat hij professioneel basketballer is? vrij groot Wat is de kans dat een man langer dan 1m90 is, als gegeven is dat hij professioneel basketballer is? vrij groot Wat is de kans dat een man professioneel basketballer is, als gegeven is dat hij langer dan 1m90 is? erg klein The Prosecutor s Fallacy, vb. 1 Wat is de kans dat een man langer dan 1m90 is, als gegeven is dat hij professioneel basketballer is? vrij groot Wat is de kans dat een man professioneel basketballer is, als gegeven is dat hij langer dan 1m90 is? erg klein Als wiskundige formule: Pr(B A) The Prosecutor s Fallacy, vb. 2 De ELIZA aids test wordt in de VS gebruikt om bloeddonaties te screenen. Als een donor aids heeft, is de testuitslag in 98% van de gevallen positief. Als een donor geen aids heeft, is de testuitslag in 93% van de gevallen negatief. Ans is bloeddonor en test positief. Wat is de kans dat ze aids heeft? De kans op A gegeven B is niet hetzelfde als de kans op B gegeven A A en B zijn gebeurtenissen 1e Coll. HOVO Gebruik/Misbruik Statistiek 10

The Prosecutor s Fallacy, vb. 2 The Prosecutor s Fallacy, vb. 2 De ELIZA aids test wordt in de VS gebruikt om bloeddonaties te screenen. Als een donor aids heeft, is de testuitslag in 98% van de gevallen positief. Als een donor geen aids heeft, is de testuitslag in 93% van de gevallen negatief. Ans is bloeddonor en test positief. Wat is de kans dat ze aids heeft? Antwoord: ongeveer 3% (!!!) De ELIZA aids test wordt in de VS gebruikt om bloeddonaties te screenen. Als een donor aids heeft, is de testuitslag in 98% van de gevallen positief. Als een donor geen aids heeft, is de testuitslag in 93% van de gevallen negatief. Ans is bloeddonor en test positief. Wat is de kans dat ze aids heeft? Antwoord: ongeveer 3% (!!!) Reden: slechts 0.23% van Amerikaanse vrouwen heeft aids The Prosecutor s Fallacy, vb. 2 The Prosecutor s Fallacy De ELIZA aids test wordt in de VS gebruikt om bloeddonaties te screenen. Als een donor aids heeft, is de testuitslag in 98% van de gevallen positief. Als een donor geen aids heeft, is de testuitslag in 93% van de gevallen negatief. Ans is bloeddonor en test positief. Wat is de kans dat ze aids heeft? De Prosecutor s Fallacy is het verwisselen van de kans op de hypothese gegeven de evidence met de kans op de evidence gegeven de hypothese De juiste manier om deze twee aan elkaar te relateren is de formule van Bayes 3% Pr(Ans heeft aids test zegt aids ) 98% Pr(test zegt aids Ans heeft aids) 1e Coll. HOVO Gebruik/Misbruik Statistiek 11

De Stelling van Bayes De Stelling van Bayes Posterior odds = likelihood ratio * prior odds A posteriori kans op A A priori kans op A Pr(Ā B) =Pr(B A) Pr(B Ā) Pr(A) Pr(Ā) Pr(Ā B) =Pr(B A) Pr(B Ā) Pr(A) Pr(Ā) A afkorting van A gebeurt ; Ā afkorting van A gebeurt niet Altijd geldt: Pr(Ā)=1 Pr(A) A afkorting van A gebeurt ; Ā afkorting van A gebeurt niet Altijd geldt: Pr(Ā)=1 Pr(A) De Stelling van Bayes, basketbal De Stelling van Bayes, basketbal A: Jan is prof. basketballer B: Jan > 1m 90 groot heel klein A: Jan is prof. basketballer B: Jan > 1m 90 groot heel klein Pr(Ā B) =Pr(B A) Pr(B Ā) Pr(A) Pr(Ā) Pr(Ā B) =Pr(B A) Pr(B Ā) Pr(A) Pr(Ā) vrij klein A afkorting van A gebeurt ; Ā afkorting van A gebeurt niet bijna 1 vrij klein bijna 1 vrij klein = groot * heel klein 1e Coll. HOVO Gebruik/Misbruik Statistiek 12

De Stelling van Bayes, aidstest De Stelling van Bayes, aidstest A: Ans heeft aids B:test zegt Ans heeft aids 0.0023: HEEL klein 0.98: bijna 1 A: Ans heeft aids B:test zegt Ans heeft aids bijna 1 HEEL klein Pr(Ā B) =Pr(B A) Pr(B Ā) Pr(A) Pr(Ā) Pr(Ā B) =Pr(B A) Pr(B Ā) Pr(A) Pr(Ā) 0.07: vrij klein A afkorting van A gebeurt ; Ā afkorting van A gebeurt niet Pr(Ā)=1 Pr(A) bijna 1 vrij klein bijna 1 vrij klein = groot * heel klein De Stelling van Bayes, Sally Clark A: Sally schuldig B: Sally s 2 babies sterven Pr(Ā B) =Pr(B A) Pr(B Ā) Pr(A) Pr(Ā) 1 heel klein HEEL klein Vrijwel 1 Conclusie Prosecutor s Fallacy De prosecutor s fallacy is een redeneerfout die in sommige contexten evident is (basketbal), maar in andere contexten regelmatig gemaakt wordt (aidstest) en niet gespot wordt (Claudia Pechstein) In natuurlijke taal is het verschil tussen en Pr(B A) vaak niet goed uit te drukken De redeneerfout als iets met kleine kans gebeurt, is het geen toeval is in feite dezelfde redeneerfout als the prosecutor s fallacy. 1e Coll. HOVO Gebruik/Misbruik Statistiek 13

Take Home Message Nr 5: Prosecutor s Fallacy In natuurlijke taal is het verschil tussen en Pr(B A) vaak niet goed uit te drukken Dat gaat vaak mis in rechtzaken maar ook in de manier waarop journalisten en krantenlezers statistische resultaten interpreteren! Menu Er is iets bijzonders, met hele kleine kans gebeurd Redenen voor foutieve conclusie er moet wel iets aan de hand zijn De onderbuikstatistiek van de krantenlezer ( waar rook is, is vuur ) Verkeerd toegepaste frequentie-statistiek 1. Achteraf Statistiek 2. Publicatie-Bias Prosecutor s Fallacy 1. Wat is een (voorwaardelijke) kans? 2. Regel van Bayes Conclusie 1e Uur Theorie Frequentistische en Bayesiaanse methoden Kansen Voorwaardelijke Kansen (aanpassen van kansen bij nieuwe informatie) Regel van Bayes Misbruik van Statistiek: Kleine kans betekent niet het was geen toeval Prosecutor s Fallacy Achteraf Statistiek Publication Bias Goed, Nuttig gebruik van Statistiek: 2e Uur! 1e Coll. HOVO Gebruik/Misbruik Statistiek 14