college 4: Kansrekening Deelgebied van de statistiek Doel: Kansen berekenen voor het waarnemen van bepaalde uitkomsten
Kansrekening 1. Volgordeproblemen Permutaties Variaties Combinaties 2. Kans 3. Voorwaardelijke Kans 4. Medische Diagnostiek
1. Volgordeproblemen Permutaties of In hoeveel geordende rijtjes (permutaties) kunnen we n (verschillende) objecten plaatsen? n = 2 n = 3 n = 4 observaties AB ABC ABCD BACD CABD DABC BA ACB ABDC BADC CADB DACB BAC ACBD BCAD CBAD DBAC BCA ACDB BCDA CBDA DBCA CAB ADBC BDAC CDAB DCAB CBA ADCB BDCA CDBA DCBA 2 6 24 permutaties
Permutaties In hoeveel geordende rijtjes kunnen we n verschillende objecten plaatsen? (= Hoeveel permutaties van n objecten bestaan er.) In n! = n x (n-1) x (n-2) x (n-3) x... x 2 x 1 permutaties n! wordt uitgesproken als n faculteit afspraak: 0! = 1 1! = 1, 2! = 2, 3! = 6, 4! = 24,...
Variaties Uit een verzameling van n objecten stel je een geordend rijtje van lengte k samen. Hoeveel verschillende keuzes of variaties heb je? n = 4: A B C D k 1 A, B, C of D Aantal mogelijkheden 4 2 3 AB (als eerste A dan B), AC, AD, BA, BC, BD, CA, CB, CD, DA, DB, DC 12 24
Variaties Uit een verzameling van n objecten stel je een geordend rijtje van lengte k samen. Hoeveel verschillende keuzes of variaties heb je? Het aantal variaties van k objecten uit n objecten is n x (n-1) x... x (n-k+1) of n! (n k)! n x (n-1) x... x (n-k+1) x (n-k) x (n-k-1) x... x 2 x 1 n n-k
Combinaties Uit een reeks van n objecten kies je deelverzamelingen van k objecten. Hun volgorde doet er niet toe. Hoeveel combinaties kan je samenstellen? k = 2, n = 4 12 variaties AB AC AD BC BD CD BA CA DA CB DB DC k = 2, n = 4 6 combinaties Alle variaties die dezelfde combinatie van objecten bevatten tellen nu niet meer apart mee. Elk zo n groepje van k objecten kan in k! volgordes voorkomen
Combinaties Uit een reeks van n objecten kies je deelverzamelingen van k objecten. Hun volgorde doet er niet toe. Hoeveel combinaties kan je samenstellen? Het aantal combinaties van k uit n is het aantal variaties van k uit n gedeeld door het aantal permutaties van k objecten. n over k n! k!(n k)! = n k verkorte notatie
Teruglegging Tot nu toe kon een gekozen object niet meer dan een keer in een reeks verschijnen Als dat wel kan spreken we van loten met teruglegging Het aantal volgordes van k objecten uit een totaal van n dat je dan kan krijgen is n k n = 4: A B C D k = 2: AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD
2. Kansrekening Kansmodel van een verschijnsel Kansen berekenen van de mogelijke uitkomsten Kansdefinitie van Laplace Hoe definieer je het begrip kans? Experimentele Kansdefinitie Axiomatische Kansdefinitie Subjectief Kansbegrip (met extra voorkennis, waardeoordeel)
Kansdefinitie van Laplace: Alle uitkomsten zijn gelijkwaardig = treden op met dezelfde kans P(gebeurtenis) = aantal gunstige uitkomsten totaal aantal mogelijke uitkomsten P(even worp) = Experimentele Kansdefinitie: Experimentele wet v/d grote aantallen: als het aantal pogingen n toeneemt, stabiliseert de frequentie van elk type gebeurtenis zich: P(gebeurtenis) = lim n aantal gebeurtenissen uit n pogingen n
Axiomatische Kansdefinitie (Kolmogorov) De verzameling van alle mogelijke uitkomsten heet S (Uitkomstenruimte) Deelverzamelingen van S heten gebeurtenissen De elementen van S zijn elementaire gebeurtenissen Deelverzamelingen van meer dan een element heten samengestelde gebeurtenissen 1. P(S) = 1 experiment:1 worp S ={ } A: even aantal ogen A = { } doorsnee 2. 0 P(A) 1 voor elke gebeurtenis A 3. Als A, B, C lege doorsnedes hebben (= losliggend of disjunct zijn), dan is P(A B C...) = P(A) + P(B) + P(C) +... vereniging
Rekenregels voor Kansen P( ) = 0 Complementregel: onmogelijke gebeurtenis (ook lege gebeurtenis genoemd) P(A) = P(niet-A) = 1 - P(A) A niet -A Algemene Optelregel: en = doorsnee De kans op A of B = P(A B) = P(A) + P(B) - P(A B) de kans op A, plus de kans op B, min de kans op A en B P( ) = 1-P( ) P( U ) = P( )
3. Voorwaardelijke Kansen Wat is de kans op een even uitkomst als we al weten dat de worp kleiner dan vijf is? = gebeurtenissen die zowel aan de extra als aan de a priori voorwaarde voldoen gebeurtenissen die aan de a priori voorwaarde voldoen De kans op gebeurtenis A, gegeven gebeurtenis B (onder voorwaarde B) is P(A B) = P(A B) P(B)
Wat is de kans op een uitkomst groter dan vier als we al weten dat de worp kleiner dan drie is? P(A B) = 0 P(A B) = 0 Wat is de kans op een uitkomst groter dan vier als we al weten dat de dobbelsteen in warenhuis V&D is gekocht? Als P(A B) = P(A) zijn gebeurtenissen A en B onafhankelijk Het voorkomen van voorwaarde B zegt niets over de kans op het observeren van gebeurtenis A
Algemene Productregel P(A B) = P(A) P(B A) De kans op een gebeurtenis die voldoet aan twee voorwaarden is de kans dat aan de ene voorwaarde is voldaan de kans dat ook aan de tweede is voldaan, gegeven de eerste Speciale Productregel A en B onafhankelijk P(A B) = P(A) P(B)
Experimenten met en zonder teruglegging 1 Toepassing Productregel Loten: Is de kans op een gebeurtenis in de tweede trekking afhankelijk van de gebeurtenis in de eerste trekking? Met teruglegging: nee Trekkingen zijn onafhankelijke experimenten Alle uitkomsten kunnen in elke trekking met dezelfde kans optreden P(twee keer wit) = P(wit in trekking 1 )P(wit in trekking 2)=(2/3)(2/3) Zonder teruglegging: Ja P(twee keer wit) = P(wit in 1) P(wit in 2 wit in 1) = (2/3)(1/2) 2
Kansbomen Voor een opeenvolging van gebeurtenissen wordt de kans berekend door de kansen langs de takken te vermenigvuldigen Opstaan Ontbijten Pendelen rechterbeen (0.9) wel koffie (0.8) geen koffie (0.2) trein gehaald (0.9) trein gemist (0.1) trein gehaald (0.9) trein gemist (0.1) P(l-,k+,t+)=0.648 P(l-,k+,t-)=0.072 P(l-,k-,t+)=0.162 P(l-,k-,t-)=0.018 linkerbeen (0.1) wel koffie (0.8) trein gehaald (0.3) P(l+,k+,t+)=0.024 trein gemist (0.7) P(l+,k+,t-)=0.056 geen koffie (0.2) trein gemist (1) P(l+,k-,t-)=0.02
P(A B) P(A B) = P(B) De Regel van Bayes bereken voorwaardelijke kans, mits overige kansen gegeven We combineren en tot P(A B) P(B A) = P(A) P( A B) = P(B A) P(A) De Regel van Bayes P(A B) = P(B A) P(A) P(B)
4. Medische Diagnostiek Sensitiviteit: P(test-uitslag positief patient positief) Specificiteit: P(test-uitslag negatief patient negatief) Prevalentie: relative frequentie van positieven in de populatie Ideale test: Sensitiviteit 1, specificiteit 1 In de praktijk: als een nieuwe test de sensitiviteit vergroot, neemt meestal de specificiteit af Positief voorspellende waarde van een test in een gegeven populatie: kans dat iemand met een positieve uitslag ook positief is
Bevolkingsonderzoek naar baarmoederhalskanker (C) prevalentie (tussen 30 en 55 jaar): P(C) = 0.005 Sensitiviteit P(+ C) = 0.95 Specificiteit P(- C) = 0.98 Wat is de kans op een positieve uitslag (+)? P(+) = P(+ C)P(C) + P(+ C)P(C) = 0.95 0.005 + 0.02 0.995 = 0.025
Bevolkingsonderzoek naar baarmoederhalskanker Wat is de kans dat een vrouw met een positieve uitslag (+) werkelijk een cervixcarcinoom (C) heeft? = P(+ C)P(C) P(+ C)P(C) + P(+ C)P(C) positief voorspellende waarde = 0.95 0.005 0.95 0.005 + 0.02 0.995 = 0.19