Kansrekening en Statistiek voor informatici



Vergelijkbare documenten
Combinatoriek en rekenregels

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Medische Statistiek Kansrekening

is, dat de zijde met cijfer boven te liggen komt, evenzo als de kans voor de koningin 1 2

college 4: Kansrekening

Binomiale verdelingen

Statistiek voor A.I. College 3. Dinsdag 18 September 2012

Samenvatting Statistiek

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert

Overzicht. Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen. Voorwaardelijke kans. Voorbeeld: Probabilistisch redeneren

VERZAMELINGEN EN AFBEELDINGEN

11.1 Kansberekeningen [1]

Zomercursus Wiskunde. Katholieke Universiteit Leuven Groep Wetenschap & Technologie. September 2008

Machten, exponenten en logaritmen

Statistiek I Samenvatting. Prof. dr. Carette

Statistiek voor A.I. College 4. Donderdag 20 September 2012

Verzamelingen. Hoofdstuk 5

Statistiek voor A.I. College 6. Donderdag 27 September

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Opgaven voor Kansrekening

Kansrekening en Statistiek

Uitwerkingen Rekenen met cijfers en letters

Kansrekening en Statistiek

Tentamen Inleiding Kansrekening wi juni 2010, uur

Kansrekening en Statistiek

Zomercursus Wiskunde. Module 1 Algebraïsch rekenen (versie 22 augustus 2011)

Opgaven voor Kansrekening

Hoofdstuk 4 Kansen. 4.1 Randomheid

5.0 Voorkennis. Voorbeeld 1: In een vaas zitten 10 rode, 5 witte en 6 blauwe knikkers. Er worden 9 knikkers uit de vaas gepakt.

Bij het oplossen van een telprobleem zijn de volgende 2 dingen belangrijk: Is de volgorde van de gekozen dingen van belang?

1.0 Voorkennis. Getallenverzameling = Verzameling van getallen met een bepaalde eigenschap

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Rekenen aan wortels Werkblad =

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur

Kansrekening en Statistiek

Inleiding Kansrekening en Statistiek

Kansrekening en Statistiek

Faculteit, Binomium van Newton en Driehoek van Pascal

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

WISKUNDE 5 PERIODEN. DATUM : 4 juni Formuleboekje voor de Europese scholen Niet-programmeerbare, niet-grafische rekenmachine

Populaties beschrijven met kansmodellen

1.1 Rekenen met letters [1]

Statistiek voor A.I. College 5. Dinsdag 25 September 2012

Durft u het risico aan?

1 Delers 1. 3 Grootste gemene deler en kleinste gemene veelvoud 12

Ruimtemeetkunde deel 1

1 Beginselen kansrekening

Opgaven voor Kansrekening - Oplossingen

Hoofdstuk 1. Afspraken en notaties

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Breuken met letters WISNET-HBO. update juli 2013

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode

Inleiding Applicatie Software - Statgraphics

Rekenen met cijfers en letters

Tentamen Inleiding Kansrekening 25 juni 2009, uur Docent: F. den Hollander

1BA PSYCH Statistiek 1 Oefeningenreeks 3 1

werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions

8.1 Herleiden [1] Herleiden bij vermenigvuldigen: -5 3a 6b 8c = -720abc 1) Vermenigvuldigen cijfers (let op teken) 2) Letters op alfabetische volgorde

Kansrekening en Statistiek

In Katern 2 hebben we de volgende rekenregel bewezen, als onderdeel van rekenregel 4:

Kansrekening en Statistiek

Voorbereidend materiaal Wiskundetoernooi 2010: Antwoorden op de opgaven

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Voorwaardelijke kansen, de Regel van Bayes en onafhankelijkheid

Kansrekening en Statistiek

Tentamen Inleiding Kansrekening 12 augustus 2010, uur Docent: F. den Hollander

Determinanten. , dan is det A =

Onderzoek of de rijen rekenkundig, meetkundig of geen van beide zijn. Geef bij de rekenkundige rijen v en t 7 en bij de meetkundige rijen q en t 7.

Kansrekening en Statistiek

. Dan geldt P(B) = a d. 3 8

36, P (5) = 4 36, P (12) = 1

V.2 Limieten van functies

3 Kansen vermenigvuldigen

inhoudsopgave juni 2005 handleiding haakjes 2

In de Theorie worden de begrippen toevalsvariabele, kansverdeling en verwachtingswaarde toegelicht.

Inleiding Kansrekening en Statistiek

Gezamenlijke kansverdeling van twee stochasten

Notatie van verzamelingen. Lidmaatschap. Opgave. Verzamelingen specificeren

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 3 Statistiek: het toetsen

Verzamelingenleer. Inhoud leereenheid 5. Introductie 9

1.3 Rekenen met pijlen

8.1 Herleiden [1] Herleiden bij vermenigvuldigen: -5 3a 6b 8c = -720abc 1) Vermenigvuldigen cijfers (let op teken) 2) Letters op alfabetische volgorde

Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid

is, dat de zijde met cijfer boven te liggen komt, evenzo als de kans voor de koningin 1 2

3.0 Voorkennis. Het complement van de verzameling V is de verzameling Dit zijn alle elementen van de uitkomstenverzameling U die niet in V zitten.

Elementaire rekenvaardigheden

Examen Statistiek I Januari 2010 Feedback

Forensische Statistiek

Diophantische vergelijkingen

De verstrooide professor

Lesbrief Hypergeometrische verdeling

FLIPIT 5. (a i,j + a j,i )d i d j = d j + 0 = e d. i<j

6. Op tafel liggen 10 verschillende boeken. Op hoeveel verschillende manieren kunnen 3 jongens daar ieder 1 boek uit kiezen?

WISKUNDE-ESTAFETTE RU 2006 Antwoorden

Transcriptie:

Leidraad bij het college Kansrekening en Statistiek voor informatici Esdert Edens februari 2006

Edens 060214-1610 i Kansrekening en statistiek (Inf.) 1. Inleiding...................................................................... 1 2. Kansrekening en statistiek.................................................. 2 2.1 Algemene kansrekening..................................................... 2 2.2 Afgeleide kansrekening..................................................... 2 2.3 Statistiek.................................................................. 2 3. Verzamelingen................................................................ 3 3.1 Notatie.................................................................... 3 3.2 Inclusie.................................................................... 3 3.3 Doorsnede..................................................................3 3.4 Vereniging................................................................. 4 3.5 Complement............................................................... 5 3.6 Partitie.................................................................... 5 4. Algemene kansrekening...................................................... 7 4.1 Uitkomstenruimte, gebeurtenis............................................. 7 4.2 Kansbegrip.................................................................8 4.3 Voorbeelden (munt, dobbelsteen, n-aselector)............................... 9 5. Meervoudige experimenten. Trekkingen met en zonder teruglegging.. 11 5.1 Cartesisch product........................................................ 11 5.2 Twee worpen met een munt............................................... 11 5.3 Padenproductregel........................................................ 12 5.4 Voorbeeld (vazen, ballen)..................................................12 5.5 Ingewikkelde experimenten................................................ 12 6. Onafhankelijke gebeurtenissen. Voorwaardelijke kansen................13 6.1 Onafhankelijke gebeurtenissen............................................. 13 6.2 Definitie.................................................................. 13 6.3 Vooruitlopen op voorwaardelijke kans......................................13 6.4 Voorwaardelijke kansen....................................................13 6.5 Productregel voor voorwaardelijke kansen..................................14 6.6 Regel van de totale kans...................................................14 6.7 Regel van Bayes...........................................................14 6.8 Voorwaardelijke kansen geven een,,kansrekening.......................... 14 6.9 Voorbeeld (knooppunten in circuit)........................................ 15 6.10 Raden van een getal onder de tien......................................... 15 6.11 Eerste zes bij dobbelsteen................................................. 15 6.12 Onweer, brug open, melkboer..............................................16 6.13 Brand in bedrijf........................................................... 17 7. Vraagstukken over algemene kansrekening............................... 19 8. Stochastische variabelen....................................................21 8.1 Uitkomstenruimte verbleekt............................................... 21 8.2 Definitie.................................................................. 21 8.3 Discrete stochasten........................................................21 8.4 Grafische voorstelling van een discrete verdeling........................... 22 8.5 Sprongen in de verdelingsgrafiek........................................... 22 8.6 Voorbeelden van discrete kansverdelingen, wiskundige voorbereiding........22 8.7 Faculteiten................................................................ 23 8.8 Binomiaalcoëfficiënten..................................................... 23

Edens 060214-1610 ii Kansrekening en statistiek (Inf.) 8.9 De binomiale verdeling.................................................... 24 8.10 De hypergeometrische verdeling........................................... 25 8.11 Hypergeometrische versus binomiale verdeling............................. 25 8.12 De Poissonverdeling....................................................... 26 8.13 Verband tussen binomiale en Poissonverdeling............................. 26 8.14 Deegmachine.............................................................. 26 8.15 Poissonproces, ongevallen..................................................27 9. Verwachting, variantie en standaardafwijking........................... 329 9.1 Verwachting van een discrete stochast..................................... 29 9.2 Verwachtingen van enkele bekende verdelingen............................. 29 9.3 Variantie en standaardafwijking van een discrete stochast................. 30 9.4 Varianties van enkele bekende discrete verdelingen......................... 30 10. Continu-verdeelde stochasten.............................................. 31 10.1 Definities................................................................. 31 10.2 Verwachting en variantie van continue verdelingen......................... 31 10.3 De (negatief)-exponentiële verdeling....................................... 32 10.4 Onafhankelijkheid van stochasten..........................................33 10.5 Voorbeeld (ongevallen).................................................... 33 10.6 Voorwaardelijke kansen bij stochasten..................................... 34 10.7 De normale verdeling......................................................35 10.8 De standaardnormale verdeling............................................ 35 10.9 De tabellen............................................................... 36 10.10 Het werken met de tabel.................................................. 36 10.11 Voorbeelden (normale verdeling)...........................................37 10.12 Berekening aan een algemene normale verdeling............................37 10.13 De,,terugzoektabel.......................................................37 10.14 De Erlangverdeling........................................................ 37 10.15 Verband tussen de Erlangverdeling en de Poissonverdeling.................38 11. Normale benadering........................................................ 39 11.1 Normale benadering van enige kansverdelingen.............................39 11.2 Verwachting en variantie van een som van stochasten...................... 39 11.3 Normale benadering van de Poissonverdeling...............................39 11.4 Normale benadering van de Erlangverdeling............................... 41 11.5 Normale benadering van de binomiale verdeling............................ 41 12. Vraagstukken over kansverdelingen....................................... 43 13. Statistiek.................................................................... 45 13.1 Inleiding.................................................................. 45 13.2 Schatten van de verwachting.............................................. 45 13.3 Kwaliteit van de schatter x................................................ 45 13.4 Schatten van de standaardafwijking....................................... 46 13.5 Schatten van de mediaan.................................................. 46 13.6 Ongevallen................................................................ 47 13.7 Toetsen................................................................... 48 13.8 Vormen van toetsen....................................................... 49 13.9 Aanvaarden van de nulhypothese.......................................... 49 13.10 Samengestelde nulhypothese............................................... 50

Edens 060214-1610 iii Kansrekening en statistiek (Inf.) 14. Enige statistische toetsen.................................................. 51 14.1 De normale toets.......................................................... 51 14.2 De Studenttoets...........................................................52 14.3 Het Poisson-verdeeld zijn van aantallen ongevallen (dispersietoets)......... 53 14.4 De mediaantoets (tekentoets)..............................................53 14.5 Directe toets betreffende de tussentijden met de Poissonverdeling.......... 54 14.6 Directe toets betreffende de tussentijden met de Erlangverdeling.......... 55 14.7 Een toets betreffende de parameter van een exponentiële verdeling......... 55 14.8 Twee-steekproeventoets (F -toets voor ongevallen)......................... 56 14.9 Mann-Whitneytoets (Wilcoxontoets)...................................... 57 14.10 Andere berekenwijze van W xy............................................. 58 14.11 Normale benadering van de Mann-Whitneytoets........................... 59 14.12 Chi-kwadraattoets voor aanpassing aan een kansverdeling (Goodness of fit test)......................................................59 14.13 Aanpassing aan een Poissonverdeling...................................... 60 14.14 Aanpassing aan een exponentiële verdeling.................................61 15. Betrouwbaarheidsintervallen............................................... 63 15.1 Betekenis van het betrouwbaarheidsinterval................................ 63 15.2 Betrouwbaarheidsinterval voor λ uit één Poisson(λ)-verdeelde waarneming met grote λ............................................................... 63 15.3 Betrouwbaarheidsinterval voor λ uit n onafhankelijke Poisson(λ)-verdeelde tellingen (n groot).........................................................63 15.4 Betrouwbaarheidsinterval voor λ uit n onafhankelijke exp(λ)-verdeelde waarnemingen.............................................................64 16. Enige termen uit bedrijfszekerheidstheorie (reliability engineering)... 65 17. Vraagstukken over statistiek............................................... 67 Tabellen Rechteroverschrijdingskansen van de standaardnormale verdeling............... 71 Rechter kritieke waarden van de standaardnormale verdeling................... 72 Rechter kritieke waarden van de Studentverdeling.............................. 73 Rechter kritieke waarden van de χ 2 -verdeling...................................74 Linker kritieke waarden Wilcoxon-Mann-Whitney.............................. 76 Betrouwbaarheidsintervallen voor de mediaan.................................. 78 Rechter kritieke waarden van de F -verdeling................................... 80 Poissonverdeling (cumulatief).................................................. 81

Edens 060214-1610 1 Kansrekening en statistiek (Inf.) 1. Inleiding. In zeer veel vakken, vooral moderne, is enige kennis vereist omtrent kansrekening en statistiek; vooral voor toepassingen van kwantitatieve aard. Men wil voorspellingen doen, die zo betrouwbaar mogelijk moeten zijn. Anderzijds wil men uitspraken doen over voorvallen, die al hebben plaatsgevonden: stel dat op een bepaalde plek gemiddeld één ongeval per week plaats vindt. Laat daar nu vorige week drie ongevallen zijn geweest. Is dat,,toeval? Onze kansrekening dient dus rekenachtig, zeg wiskundig van aard te zijn. De wiskunde wordt gerekend tot de exacte wetenschappen; men gaat er uit van axiomastelsels. Dat maakt de wiskunde op zichzelf veilig; zolang niet te snel wordt overgegaan op een practisch model. Zo kan worden bewezen, dat de zwaartelijnen van een vlakke driehoek door één punt gaan. In de praktijk blijkt het zelfs met een scherp potlood nog aardig te kloppen, hoewel een zwaartepunt niet is te zien: de zwaartestrepen hebben een berg koolstof zo ongeveer gemeenschappelijk. Sterker: wat is in de praktijk een werkelijk vlakke driehoek? Toch... men rekent er mee en het komt vaak aardig uit. Met kansrekening en statistiek ligt de zaak ingewikkelder. Het kansgevoel is sterk subjectief. We geven enige voorbeelden. Het weer: Wanneer het weerbericht 20% regenkans vermeldt, wordt de paraplu nog al eens thuis gelaten. Russische roulette (moderne versie): Stel iemand in de gelegenheid aan de volgende loterij mee te doen: laat de persoon zes door hemzelf te bedenken cijfers opschrijven. Trek vervolgens zelf zes volkomen willekeurige cijfers, bijvoorbeeld met behulp van een computer. Indien beide zo ontstane getallen niet geheel overeenkomen, wordt de persoon f 10.000, uitgekeerd. Indien de getallen wèl geheel overeenkomen, wordt overgegaan tot onthoofding van de persoon. Hoewel de kans op geld groot is, zullen niet veel mensen ingaan op de uitnodiging tot dit spel. Verkeersveiligheid: een kruispunt is altijd gevaarlijk. Iemand kan uit de bocht vliegen, of geen voorrang geven enz. Geef nu alvorens het kruispunt te naderen, vol gas. Indien het kruispunt op topsnelheid wordt overgestoken, is de kans op een ongeval klein: men is er immers een zeer korte tijd aanwezig. Verkeerde kansinterpretatie: neem wanneer je gaat vliegen een bom mee. Vrijwel zeker zal dan niets gebeuren, want de kans op twee bommen is toch wel erg klein. Een kansbegrip of kansgevoel waarin velen zich blijken te kunnen vinden is dat, wat in de praktijk stoelt op de zogenoemde experimentele wet der grote aantallen. Dat een mooi gemaakte munt zuiver is, betekent dan dat in een groot aantal worpen de aantallen keren kruis en munt ongeveer aan elkaar gelijk zijn. In sommige literatuur leest men wel een kansdefinitie die op dit principe berust: de kans op een bepaalde gebeurtenis wordt dan gedefinieerd als de limiet van de fractie van het aantal keren dat deze gebeurtenis optreedt; betrokken op het totaal aantal keren dat het experiment wordt uitgevoerd. Voor de limietovergang laat men dat het totale aantal naar oneindig gaan. Dit is geen juiste gang van zaken. Begrippen als limiet en oneindig behoren tot de wiskunde, die abstract is (d.w.z. afgetrokken van de werkelijkheid). In de praktijk bestaat geen oneindige rij experimenten. We volgen daarom een andere weg. Kansrekening zal een onderdeel van de (zuivere) wiskunde zijn. Het begrip,,kans wordt dus zuiver wiskundig gedefinieerd. Dat betekent, dat in te gebruiken wiskundige modellen de kansen aanvankelijk worden geponeerd. Dan kan (later) aan de hand van praktijkgegevens worden vastgesteld of de keuze van de kansen gelukkig was geweest of niet.

Edens 060214-1610 2 Kansrekening en statistiek (Inf.) 2. Kansrekening en statistiek. De kansrekening die wij behandelen is op te splitsen in twee delen, te weten een,,algemene en een,,afgeleide kansrekening. (2.1) Algemene kansrekening. Dit is een onderdeel van de zuivere wiskunde geworden. Sinds de veertiger jaren beschikt de kansrekening over een eigen axiomastelsel (opgesteld door de Russische wiskundige A.N. Kolmogorov). Twee belangrijke begrippen komen hier aan de orde: gebeurtenis en kans. Opdat de kansrekening wiskundig zal zijn, is het wenselijk deze begrippen wiskundig te funderen. De huidige wiskunde stoelt op de verzamelingenleer, nu gemeengoed op middelbare scholen (brugklas). Een gebeurtenis wordt nu beschreven als een verzameling. We moeten verder spreken over de kans op een gebeurtenis. De kans(waarde) is een getal; bij elke gebeurtenis moet dus een bepaald getal worden gevonden. De wiskunde heeft voor een dergelijke procedure een pasklare jas: het functiebegrip. Een kans is dus een functie(waarde), gedefinieerd bij elke gebeurtenis. Het is voor praktijkgevallen natuurlijk de kunst een goed passende kansfunctie te vinden; anders kloppen de resultaten niet met de werkelijkheid. Het rekenwerk zelf strekt zich uit over het werken met gebeurtenissen (al of niet gelijktijdig optreden, ontkennen, samen nemen) en het berekenen van de kanswaarden die daarvan het gevolg zijn. Het werken met gebeurtenissen is hetzelfde als het werken met verzamelingen. In de wiskunde is hierover een gigantische theorie opgebouwd. Wij hebben maar heel weinig ervan nodig; er is geen sprake van enige diepgang. De grootste moeilijkheid is nog (eventueel) de notatie. (2.2) Afgeleide kansrekening. Hier worden niet allerlei gebeurtenissen ten tonele gevoerd, maar alleen getalwaarden (die op hun beurt zijn terug te voeren tot getallen, behorend bij gebeurtenissen). De procedures worden hierdoor sterk vereenvoudigd! We beschikken uiteindelijk slechts over getallen en de kansen daarop, zoals bij het werpen met een dobbelsteen sprake is van getalsmatige uitkomsten. Bewerkingen met verzamelingen komen dan niet of practisch niet voor. De kernbegrippen in deze kansrekening zijn de stochastische variabele of kortweg stochast en de kansverdeling. Bovenstaande twee,,soorten kansrekening zijn in de literatuur meestal niet sterk gescheiden. In ons bestek is de scheiding wel vrij sterk door te voeren, omdat bewijzen en diepgaande redeneringen over de grondslagen toch niet aan de orde komen. Tenslotte: de hier gehanteerde termen algemene en afgeleide kansrekening zijn niet gangbaar; ze worden hier alleen gebruikt omdat ze in onze toepassingen vrij sterk zijn gescheiden: de eerste voor het rekenen met fouten en gebeurtenissenbomen; de tweede voor het rekenen met o.a. levensduren, ongevalsstatistiek e.d. (2.3) Statistiek. Hier wordt mathematische statistiek bedoeld; niet de zogenoemde beschrijvende statistiek, die zich wel bezig houdt met de presentatie van reeksen waarnemingen, maar daarbij niet op mathematische gronden kwantitatieve uitspraken beoogt te doen betreffende de betrouwbaarheid van resultaten en voorspellingen. De mathematische statistiek wordt wel gezien als een toepassing van de kansrekening. In de huidige statistiek overheerst sterk het rekenen met stochasten (hier afgeleide kansrekening genoemd); hoewel in de laatste jaren het uitgebreid werken met algemene gebeurtenissen steeds belangrijker wordt. Wij houden ons alleen bezig met stochasten (aantallen en levensduren) en bijbehorende kansverdelingen.

Edens 060214-1610 3 Kansrekening en statistiek (Inf.) 3. Verzamelingen. (3.1) Notatie. We noteren verzamelingen met hoofdletters: bijvoorbeeld A, B, C,.... De dingen die in een verzameling zitten, heten de elementen van die verzameling. Notatie vaak met kleine letters, zoals a, b, x, y,... of in een opsomming a 1, a 2,.... Een verzameling kan vaak worden aangegeven door de elementen op te sommen. Dit doen we dan door die elementen op te schrijven, gescheiden door komma s en het geheel tussen accoladen te plaatsen. Laat bijvoorbeeld A de verzameling kleuren in een kaartspel zijn. Dan is A = {,,, }. (1) Deze verzameling heeft vier elementen. Als eenzelfde element meermalen wordt opgeschreven, blijft het aantal elementen vier: ook {,,,,,, } heeft vier elementen. De verzameling der natuurlijke getallen is aan te duiden met N = {1, 2, 3,...}. (Van oorsprong is 0 geen natuurlijk getal. Dat is het wel sind de zestiger jaren in Delft. Met de opkomst van de computer echter is in veel Nederlandse schoolboekjes 0 een natuurlijk getal geworden. Het getal 0 is echter zeer laat ontstaan, en is zeker niet,,natuurlijk.) Vaak wordt een verzameling aangeduid door een,,samenbindende eigenschap aan te geven. Als we bijvoorbeeld steeds over natuurlijke getallen spreken, is {n n 6} de verzameling natuurlijke getallen 1,2,3,4,5,6. In plaats van het teken wordt in de literatuur wel : gebruikt: {n : n 6} betekent hetzelfde. Als x een element is van verzameling A (,,x zit in A ), schrijven we x A. Als we het tegendeel willen aangeven, dus x behoort niet tot A, noteren we dit met x A. Er is één speciale verzameling, dat is de lege verzameling. Daar zit niets in. We geven de lege verzameling aan met. Deze is handig bij de rekenregels; waarover direct meer. (3.2) Inclusie. Als elk element van A ook tot B behoort, schrijven we A B en zeggen: A is een deelverzameling van B. We schrijven ook wel B A; dat is hetzelfde. In woorden: B omvat A. Zo is {, } {,,, } en {2, 5, 6} {1, 2, 3, 4, 5, 6}, maar ook {1, 2} {1, 2}. Elke verzameling is dus deelverzameling van zichzelf (mathematisch spraakgebruik). Dit in tegenstelling met de ordening van getallen: het symbool < is niet hetzelfde als. Soms echter komt men wel de notaties en tegen. Die betekenen dus wèl hetzelfde als respectievelijk. De verzamelingstheoretische notaties zijn nog niet zo uitgekristalliseerd als die in de wiskundige analyse. Per definitie is A voor elke willekeurige verzameling A. (3.3) Doorsnede. Alle elementen (zo die er zijn), die zowel in A als in B zitten, vormen een nieuwe verzameling; de doorsnede van A en B. We noteren die met A B of liever kortweg met AB (dat doen niet alle boeken) en spreken wel van,,a doorsnede B of,,a door B. Als A en B geen elementen gemeen hebben, heten A en B disjunct. Kortweg AB =. Zie de figuur. Zo n figuur wordt wel Venndiagram genoemd. Rechts zien we het geval A B. Dat is hetzelfde als AB = A. (We hebben inderdaad de equivalentie (A B) (AB = A). Dit is een voorbeeld van een (kleine) verzamelingstheoretische stelling. Dit soort formaliseringen is voor ons echter niet zo belangrijk.)

Edens 060214-1610 4 Kansrekening en statistiek (Inf.) A AB B A B A B A,B niet disjunct A,B disjunct A B ; AB = A De doorsnede is eenvoudig voor meer verzamelingen op te schrijven. Voor drie dus A B C ofwel ABC. Een eenvoudige regel is (AB)C = A(BC); zo ontstaat al een begin van een,,verzamelingen-algebra. In onderstaande figuur is ABC aanschouwelijk voorgesteld. A C B (3.4) Vereniging. Alle elementen, die òf tot A, òf tot B, òf tot beide behoren, vormen een nieuwe verzameling, de vereniging van A en B, notatie A B. Zo is {2, 5} {1, 2, 4, 6} = {1, 2, 4, 5, 6}. We zeggen wel,,a verenigd (met) B. In onderstaande figuur is deze vereniging steeds beschaduwd aangegeven. A A A B B B Voor de geïnteresseerde lezer vermelden we nog twee andere kleine,,stellingen, de zogenoemde distributieve wetten: A(B C) = AB AC en A (BC) = (A B)(A C).

Edens 060214-1610 5 Kansrekening en statistiek (Inf.) In een figuurtje (Venndiagram) is dit eenvoudig te zien. We vermelden dit soort dingen alleen ter leesoefening (notaties!). (3.5) Complement. In zowat ieder praktijkprobleem wordt uitgegaan van een gegeven,,universum. Als we met een dobbelsteen werpen, krijgen we een der getallen 1,2,3,4,5,6. Ons onderhavige wereldje is dan de verzameling {1, 2, 3, 4, 5, 6}. Vaak wordt (in de kansrekening) een universum aangeduid met de letter Ω. Dus hier is Ω = {1, 2, 3, 4, 5, 6}. Laat A een deelverzameling van Ω zijn. Alle elementen van Ω, die niet in A zitten, vormen het complement van A. We noteren dit met Ā. In de verzamelingenleer bestaat nog een ander soort,,complement : als A en B twee verzamelingen zijn, vormen alle elementen van A, die niet in B zitten, het complement van B in A. De notatie is A \ B, ook wel gewoon A B. We spreken dan ook wel van het verschil van A en B (keer die volgorde niet om!). Het gewone complement van B, dus alles uit het universum dat niet tot B behoort, is dus te schrijven als Ω \ B ofwel B = Ω \ B. B B A AB B Ω B = Ω B AB =A B Belangrijk zijn de zogenoemde wetten van De Morgan: A B C = Ā B C en A B C = Ā B C. (2) In woorden, links: alles wat niet tegelijk in A, B, C,... zit, zit in tenminste één ervan niet, dus wel in één van de complementen. (Ga dit na voor bv. twee; alleen A en B.) Rechts: alles wat niet zit in de vereniging, zit dus in geen enkele van A, B,.... Voor ieder dus in het complement, dus in de doorsnede van de complementen. Tot slot van deze paragraaf nog een voorbeeld: laat A en B twee verzamelingen zijn. De vereniging van A en B bestaat uit: 1) de elementen van A, die niet in B zitten, verenigd met 2) de elementen van A die wel in B zitten, verenigd met 3) de elementen van B die niet in A zitten. Dus: A B = (A \ B) (A B) (B \ A); de drie laatstgenoemde verzamelingen zijn disjunct. Zie onderstaande figuur. A A B AB B A B (3.6) Partitie. Laat A een gegeven verzameling zijn. Veronderstel dat A de vereniging is van de disjuncte, niet-lege verzamelingen B 1, B 2,..., B n. Dan heet B 1, B 2,..., B n een partitie (opsplitsing) van A. In onderstaande figuur is dit voor n = 5 aangegeven.

Edens 060214-1610 6 Kansrekening en statistiek (Inf.) A B 1 B 2 B 3 B 4 B 5 Voorbeelden: De drie verzamelingen {2, 5}, {1} en {3, 4, 6} vormen een partitie van {1, 2, 3, 4, 5, 6}; {n n even} en {n n oneven} vormen een partitie van de verzameling der natuurlijke getallen. Vaak wordt een partitie van het universum Ω genomen. We komen dat in de kansrekening herhaaldelijk tegen, zij het dat deze nogal gezwollen naamgeving meestal achterwege blijft.

Edens 060214-1610 7 Kansrekening en statistiek (Inf.) 4. Algemene kansrekening. (4.1) Uitkomstenruimte; gebeurtenis. We trekken ter inleiding éénmaal een kaart uit een spel van 52 kaarten en letten daarbij alleen op de kleur (kleur: hier bedoeld als kaartterm). De mogelijke uitkomsten van dit experiment zijn,, en ; iets anders is niet mogelijk. Ons universum is dus Ω = {,,, }. In de kansrekening heet zo n universum uitkomstenruimte (Engels: sample space). Een ander woord is steekproefruimte. (In ons kleine voorbeeld trekken we een steekproef van één exemplaar; nl één kaart uit het pak.) We komen zo tot de Definitie: Alle mogelijke uitkomsten van een experiment vormen een verzameling, die uitkomstenruimte of steekproefruimte heet (Engels: sample space). Notatie meestal Ω. Elk element van Ω heet een elementaire gebeurtenis. Onze beperkte uitkomstenruimte staat niet toe dit te verfijnen: het is niet mogelijk onderscheid te maken tussen het trekken van, zeg vóór of na tienen. Als we dat wél willen, hadden we Ω groter moeten maken: door elke kleur dubbel te noteren, één met vermelding voor en één met vermelding na tienen. Vandaar de term,,elementaire gebeurtenis. Wat is dan een,,gewone gebeurtenis? Stel dat iemand zegt:,,als je een rode kaart trekt, krijg je een tientje van me. Dat slaat op de gewone, practische gebeurtenis:,,trek een rode kaart. In onze mathematische context komt dit overeen met de verzameling {, }; een deelverzameling dus van Ω. We komen zo tot de volgende Definitie: De deelverzamelingen van een uitkomstenruimte heten gebeurtenissen. Een ander woord voor gebeurtenis in de kansrekening is de ietwat verouderde, maar wellicht veel betere benaming eventualiteit. Het optreden van een gebeurtenis betekent, dat het experiment een uitkomst geeft, die in die gebeurtenis zit. Elke verzameling is deelverzameling van zichzelf, dus ook Ω Ω. De gebeurtenis Ω kan in spreektaal als volgt worden weergegeven:,,het geeft niet wat het resultaat van het experiment is. De lege verzameling is ook een gebeurtenis. Deze treedt op, als het experiment geen enkele uitkomst geeft. Dat wordt in elk kanstheoretisch model onmogelijk geacht: er is altijd een uitkomst. De lege verzameling heet dan ook de onmogelijke gebeurtenis. De verzameling Ω heet de zekere gebeurtenis. Gebeurtenissen die, als verzameling opgevat, disjunct zijn (dus geen element gemeen hebben), heten elkaar uitsluitend. Dat is logisch: laat A en B disjuncte gebeurtenissen zijn. Als bv. A optreedt, betekent dat, dat een uitkomst is verkregen die element is van A. Dit kan blijkens het gegeven niet tegelijk in B zitten. Dan treedt B dus niet op. Ook in wiskundige notatie is dit duidelijk te zien: Het disjunct zijn van A en B betekent AB =. In woorden: het tegelijk optreden van A en B is een onmogelijke gebeurtenis. Van gebeurtenissen A en B die een inclusierelatie hebben, zeg A B, kan ook iets in gewone spreektaal worden gezegd. Als A optreedt, betekent dat, dat een uitkomst in A is verkregen. Als nu A B, zit die uitkomst ook in B, want A is een deel van B. Dan treedt B dus op! Dus A B betekent: B is een gevolg van A; ook wel: A impliceert B.

Edens 060214-1610 8 Kansrekening en statistiek (Inf.) We schrijven dergelijke zegswijzen bij elkaar: Ā is de gebeurtenis : A treedt niet op; A B is de gebeurtenis : A en B treden beide op; A B is de gebeurtenis : A of B of beide treden op; A \ B is de gebeurtenis : A treedt op, maar B niet. (1) (4.2) Kansbegrip. We gaan onze gebeurtenissen nu kansen geven. In plaats van de uitdrukking,,totale kans 100% nemen we de in de kansrekening algemeen aanvaarde uitdrukking,,totale kans 1. Die kanswaarde staat voor zekerheid. (Soms wordt, ook in de kansrekening, in eindpresentaties wel een procentuele kans vermeld.) In het voorbeeld van de trekking van een kaart zijn alle vier mogelijkheden op intuïtieve gronden even waarschijnlijk. We definiëren daarom in dit geval de kans op elke elementaire gebeurtenis gelijk aan 1 4. In een groot aantal herhalingen van de trekking (steeds de kaart terugleggen; dan het spel weer goed schudden!) verwachten we een fractie van ongeveer 1 4 voor elk der vier kleuren. Wat zal de kans op een rode kaart moeten zijn? Blijkbaar 1 4 + 1 4, d.i. 1 2. (Tel de verwachte fracties op.) We definiëren daarom de kans op de gebeurtenis {, } gelijk aan 1 2. De zojuist geschetste gang van zaken leert ons, dat we moeten stellen: Definitie: Een kans is een functie, die gedefinieerd is op de gebeurtenissen. De kans op een gebeurtenis A is de som van de kansen van alle elementaire gebeurtenissen, die in A zitten. De kans op een elementaire gebeurtenis ω Ω moet streng gesproken genoteerd worden als P ( {ω} ). Vaak wordt kortheidshalve p(ω) geschreven; ook wel p ω. Dat laatste meestal indien de elementaire gebeurtenissen gehele getallen zijn : bv. kans p 4 of p(4) als kans dat met een dobbelsteen een 4 wordt geworpen. Het begrip,,kans lijkt op de begrippen,,oppervlakte of,,inhoud. De kansfunctie wordt met P aangeduid. Dus P ( A ) is de kans op gebeurtenis A. We zien onmiddellijk, dat dient te gelden: P ( Ω ) = 1. Immers, het is zeker dat het experiment een uitkomst in Ω heeft. (In het kaartspel: we trekken geen joker.) Omdat,,geen uitkomst onmogelijk is, moet de lege gebeurtenis kans 0 hebben: P ( ) = 0. Een heel arsenaal uitspraken kan nu worden geformuleerd: 0 P ( A ) 1; P ( Ω ) = 1; (2) A 1, A 2, A 3... disjunct = P ( A 1 A 2 A 3 ) = P ( A 1 ) + P ( A 2 ) + P ( A 3 ) + (3). Dit is het axiomastelsel. Enkele gevolgen zijn: P ( ) = 0; P ( Ā ) = 1 P ( A ) ; A B = P ( A ) P ( B ) ; (4) P ( A B ) = P ( A ) + P ( B ) P ( A B ). (5) De regel (5) heeft een belangrijke uitbreiding. We kijken eerst naar de regel zelf. Indien we P ( A B ) willen berekenen, en daarvoor P ( A )+P ( B ) zouden nemen, dan tellen we de elementaire gebeurtenissen die zowel in A als in B zitten, dubbel. Dus P ( A B ) moet worden afgetrokken. Laat nu drie gebeurtenissen gegeven zijn; A, B en C (alle natuurlijk deel van eenzelfde uitkomstenruimte Ω). In onderstaande figuur zijn de beschaduwde verzamelingen in formulevorm aangegeven.

Edens 060214-1610 9 Kansrekening en statistiek (Inf.) B B B A C A C A C A B C AB AC BC ABC Vrij eenvoudig is in te zien (denk aan oppervlakte!), dat moet gelden: P ( A B C ) = [P ( A ) + P ( B ) + P ( C )]+ [P ( AB ) + P ( AC ) + P ( BC )]+ + P ( ABC ). (6) In woorden; tevens uitgebreid voor willekeurig veel gebeurtenissen: de kans op een vereniging van gebeurtenissen is de som van de kansen der afzonderlijke gebeurtenissen (de enkele); verminderd met de som van de kansen der doorsneden van steeds twee (de tweetallen); vermeerderd met de som van de kansen der drietallen, enz. Het wordt alleen maar ingewikkeld; niet moeilijk. Adem diep in: voor vier gebeurtenissen is P ( A B C D ) = [P ( A ) + P ( B ) + P ( C ) + P ( D )]+ [P ( AB ) + P ( AC ) + P ( AD ) + P ( BC ) + P ( BD ) + P ( CD )]+ + [P ( ABC ) + P ( ABD ) + P ( ACD ) + P ( BCD )]+ P ( ABCD ). (7) Met opzet hebben we de regel voor vier stuks ook vermeld. In sommige praktijkgevallen kan zo n regel handig zijn! We komen er nog op terug. We benadrukken nog even de betekenis van vereniging en doorsnede van gebeurtenissen:,,de gebeurtenis A B C D treedt op betekent:,,tenminste één uit A, B, C, D treedt op ;,,de gebeurtenis ABCD treedt op betekent:,,a, B, C en D treden tegelijk op. (4.3) Voorbeelden. 1. Worp met een zuivere munt. Neem Ω = {K, S}. De kansfunctie is gegeven door P ( K ) = P ( S ) = 1 2. Onnodig te vermelden, dat P ( ) = 0 en P ( {K, S} ) = P ( Ω ) = 1. 2. Worp met een zuivere dobbelsteen. We kunnen Ω schrijven als Ω = {.,..,...,..,...,.. }. We zien dat de elementen van Ω hier geen getallen zijn. Vaak schrijven we Ω = {1, 2, 3, 4, 5, 6}; de elementen van Ω zijn dan wèl getallen. Als kansverdeling nemen we hierbij p(i) = 1 6 ; i = 1,..., 6. Zo is bijvoorbeeld P ( {2, 4, 5, 6} ) = 4 6 = 2 3.

Edens 060214-1610 10 Kansrekening en statistiek (Inf.) 3. Onzuivere dobbelsteen. Uit de vaas in onderstaande figuur wordt aselect een bal getrokken. Het nummer van de getrokken bal is de uitkomst van het experiment. 1 4 5 2 1 3 2 1 2 6 1 3 Fig. 4.3.1 Neem Ω = {1, 2, 3, 4, 5, 6} en kansen p 1 = 1 3, p 2 = 1 4, p 3 = 1 6, p 4 = p 5 = p 6 = 1 12. Ga na, dat P ( {2, 4, 5, 6} ) = 1 P ( {1, 3} ) = 1 p 1 p 3 = 1 2. 4. n-aselector. Deze trekt aselect een getal uit {1, 2,..., n}. Hier is Ω = {1,..., n} en p i = 1/n voor i = 1,..., n. Voor A Ω is hier P ( A ) = een zogenoemde Laplacekans: kans = Let wel: alle mogelijke gevallen zijn hier gelijkwaardig! aantal elementen van A aantal elementen van Ω ; (8) aantal gunstige gevallen aantal mogelijke gevallen. (9)

Edens 060214-1610 11 Kansrekening en statistiek (Inf.) 5. Meervoudige experimenten. Trekkingen met en zonder teruglegging. (5.1) Tot nu toe hebben we een kansruimte bij één experiment (trekking) bekeken: de kans op een bepaalde gebeurtenis (uitkomstenverzameling) A Ω was P ( A ). Indien we nu twee trekkingen verrichten, de eerste uit Ω 1, de tweede uit Ω 2, dan beschouwen we de samengestelde trekking: deze is dan op te vatten als één bepaalde trekking uit een verzameling, die we noteren met Ω 1 Ω 2 en die bestaat uit alle tweetallen (ω 1, ω 2 ) waarbij ω 1 uit Ω 1 wordt gekozen en ω 2 uit Ω 2. Denk bv. aan het platte vlak: het is tweedimensionaal; elk punt heeft een eerste en een tweede coördinaat. Onze uitkomst van het experiment bestaat uit een eerste en een tweede trekking. De eerste trekking is nu de eerste coördinaat van de uitkomst; de tweede trekking is de tweede coördinaat. (Het platte vlak met coördinaatassen heet wel het cartesische vlak. Een notatie als Ω 1 Ω 2 heet een cartesisch product. Wij zullen deze benamingen maar zelden gebruiken.) We doen dit analoog voor n trekkingen: deze kunnen worden opgevat als één trekking uit Ω 1 Ω 2 Ω n. Hier is meteen de benaming steekproef duidelijk als betiteling van een elementaire gebeurtenis. (5.2) We beginnen met het tweemaal werpen met een zuivere munt. Deze worpen worden fysisch onafhankelijk van elkaar uitgevoerd. Met fysisch onafhankelijk wordt bedoeld, dat geen redenen zijn aan te wijzen waarom het resultaat van de ene worp van invloed zou zijn op dat van de andere worp. We schrijven Ω 1 = Ω 2 = {K, S}; Ω 1 Ω 2 = {KK, KS, SK, SS}; zie figuur 5.2.1. Worp 1 Worp 2 1/2 1/2 K S 1/2 1/2 1/2 1/2 K S K S Fig. 5.2.1 Vanwege de vermeende fysische onafhankelijkheid zullen alle vier eindpunten (paden) van deze boom in een groot aantal herhalingen van deze twee worpen ongeveer even vaak voorkomen. Wij definiëren daarom de kansen in Ω 1 Ω 2 elk 1 4. Indien de munt niet zuiver is, maar kans p op kop heeft en kans q op staart (pq > 0; p + q = 1), krijgen we de boom Worp 1 Worp 2 p p q K q p S q K S K S Fig. 5.2.2

Edens 060214-1610 12 Kansrekening en statistiek (Inf.) Bij een groot aantal n herhalingen van de twee worpen denken we dat we bij de eerste worp ongeveer np keer K hebben en dan ook bij de tweede worp ongeveer npp keer K en ongeveer npq keer S. Voor ons mathematisch model hanteren we daarom de regel: (5.3) Padenproductregel: Bij fysisch onafhankelijke experimenten is de kans op een pad gelijk aan het product van de kansen der afzonderlijke stappen langs dat pad. We lezen zo uit figuur 5.2.2 af: de kans op S in de tweede worp is gelijk aan p q (linker pad naar S) + q q (rechter pad naar S) = (p + q)q = q. Dit is niet zo verwonderlijk: het zal ons, gegeven de fysische onafhankelijkheid der worpen, een zorg zijn wat de uitkomst van de eerste worp was! De kans op S in de tweede worp moet q zijn. (5.4) Voorbeeld. We hebben drie vazen met ballen. Vaas 1 bevat vijf witte en één zwarte; vaas 2 bevat vier witte en twee zwarte en vaas 3 bevat drie witte en drie zwarte ballen. Men kiest aselect een vaas en daaruit aselect een bal. Wat is de kans dat deze wit is? Beschouw figuur 5.4.1. Vaas Bal 1/3 1/3 1/3 1 2 3 5/6 1/6 2/3 1/3 1/2 1/2 W Z W Z W Z Fig. 5.4.1 In de boom staan de kansen; we lezen af: P {wit} = 1 3 5 6 + 1 3 2 3 + 1 3 1 2 = 2 3. (5.5) Het ligt voor de hand direct wat ingewikkelder zaken te beschouwen. Zo kunnen we een vaas kiezen, daaruit een bal trekken en als deze wit is, uit dezelfde vaas nog één keer trekken (genoemde witte bal wordt niet teruggelegd). Die tweede trekking kan op zich beschouwd worden met een Ω, die van de eerste trekking afhangt. De procedure echter, het trekken zelf, geschiedt wèl onafhankelijk van de voorgeschiedenis: de trekking blijft aselect. De kansen berekenen we dan ook met de padenproductregel (5.3). Als steekproefruimte nemen we de verzameling (boom) van alle paden.

Edens 060214-1610 13 Kansrekening en statistiek (Inf.) 6. Onafhankelijke gebeurtenissen. Voorwaardelijke kansen. (6.1) Onafhankelijke gebeurtenissen. Laat twee steekproefruimten Ω 1 en Ω 2 gegeven zijn met kansfuncties P 1 resp. P 2. Als nu A en B gebeurtenissen zijn bij Ω 1 resp. Ω 2, dan geeft de padenproductregel, dat bij fysisch onafhankelijke trekkingen uit Ω 1 respectievelijk Ω 2 de kans, dat de eerste trekking in A zit en de tweede trekking in B, gelijk is aan P 1 (A)P 2 (B). Het is onhandig om met verschillende kansfuncties te werken. In de kansrekening wordt een constructie (met cartesische producten) aangegeven, waarbij tenslotte met één,,overkoepelende uitkomstenruimte en één,,overkoepelende kansfunctie P wordt gewerkt. (Het voert veel te ver hierop in te gaan.) Dan kunnen we zeggen: P (AB) = P (A)P (B); (1) een gelijkheid die voor dié gebeurtenissen A en B geldt, waarbij A uitsluitend op de eerste trekking slaat en B uitsluitend op de tweede. We komen algemeen tot de (6.2) Definitie: Twee gebeurtenissen A en B heten stochastisch onafhankelijk of ook wel kortweg onafhankelijk als (1) geldt. Wij korten dit wel af tot s.o. Een stel gebeurtenissen A 1,..., A n heet onafhankelijk als de productuitdrukking voor elk deelstelsel geldt; dus niet alleen voor de tweetallen. Voor onafhankelijkheid van A, B en C moeten we dus eisen: P ( AB ) = P ( A ) P ( B ); P ( AC ) = P ( A ) P ( C ); P ( BC ) = P ( B ) P ( C ) en P ( ABC ) = P ( A ) P ( B ) P ( C ). Voor onafhankelijkheid moet de kansfactorisering dus voor elke greep van twee, drie,... gebeurtenissen gelden. Bij de padenproductregel komen ook producten van kansen voor. Dat is daar niet hetzelfde als onafhankelijkheid. In feite is de padenproductregel een voorbode van het rekenen met zogenoemde voorwaardelijke kansen; waarover nu een korte inleiding volgt. (6.3) We gaan uit van het,,getrapte experiment uit (5.4) en vormen een steekproefruimte Ω = {(1, W), (1, Z), (2, W), (2, Z), (3, W), (3, Z)} (2) en kansen } p(1, W) = 5 18, p(2, W) = 4 18, p(3, W) = 3 18 ; p(1, Z) = 1 18, p(2, Z) = 2 18, p(3, Z) = 3 18. We kunnen de kans 5 6 uit figuur 5.4.1 terugkrijgen door p(1, W) te delen door de kans op vaas 1; laatstgenoemde kans is hier (3) De kans 5 6 P {vaas1} = P ( {(1, W), (1, Z)} ) = 5 18 + 1 18 = 1 3. (4) is dan te schrijven als P {een witte bal èn vaas 1}. (5) P {vaas 1} (6.4) Voorwaardelijke kansen. Een systeem met aaneengeschakelde experimenten kan altijd beschouwd worden als één uitkomstenruimteruimte met één kansfunctie. We zullen

Edens 060214-1610 14 Kansrekening en statistiek (Inf.) dit zeker niet bewijzen. Bovenstaande enigszins aanschouwelijke overweging met de vazen en de ballen leidt ons tot de volgende Definitie: Laat B een gebeurtenis zijn met P ( B ) > 0. We definiëren nu de voorwaardelijke kans op A gegeven B (d.i. gegeven dat B optreedt) door P ( A B ) def = P ( AB ) P ( B ). (6) De padenproductregel kan nu geformuleerd worden in termen van voorwaardelijke kansen. We geven niet de precieze verbanden aan, maar volstaan hier met een definitie en drie stellingen. We merken eerst nog op, dat geldt: A, B s.o., P ( A ) > 0, P ( B ) > 0 } = P ( A B ) = P ( A ), P ( B A ) = P ( B ). (7) (6.5) Productregel voor voorwaardelijke kansen. Laat A 1,..., A n gebeurtenissen zijn. Dan is P ( A 1 A 2 A n ) = P ( A 1 ) P ( A 2 A 1 ) P ( A 3 A 1 A 2 ) P ( A n A 1 A 2 A n 1 ) ; (8) mits P ( A 1 A 2 A n ) > 0. Deze regel strookt met de padenproductregel voor de berekening van de kans op één gegeven pad. (6.6) Regel van de totale kans. Laat B 1, B 2... een partitie van Ω zijn met P ( B i ) > 0 voor alle i. Dan is voor elke gebeurtenis A: P ( A ) = P ( A B 1 ) P ( B 1 ) + P ( A B 2 ) P ( B 2 ) +. (9) Deze regel strookt met de padenproductregel voor de berekening van de kans op een resultaat, dat bereikt wordt via verschillende paden. (6.7) Regel van Bayes. Laat B 1, B 2... een partitie van Ω zijn met P ( B i ) > 0 voor alle i. Dan is voor elke gebeurtenis A met P ( A ) > 0: P ( B k A ) = P ( A B k ) P ( B k ) P ( A B 1 ) P ( B 1 ) + P ( A B 2 ) P ( B 2 ) +. (10) De regel van Bayes geeft een zogenoemde a posteriori kans:,,gegeven het eindresultaat; wat is de kans dat dit resultaat langs een bepaalde weg is bereikt? (nakaartkans). Het geeft de kans dat één bepaald pad is gevolgd van alle mogelijke paden die tot dit eindresultaat leiden. In feite is hier sprake van de omkering P ( B A ) = P ( A B ) P ( B ) P ( A ) (P ( A ) > 0; P ( B ) > 0). (11) (6.8) Onder voorwaarde B met P ( B ) > 0 is een gehele kansrekening bepaald. Zo is P ( A B ) = 1 P ( A B ) ; P ( A 1 A 2 B ) = P ( A 1 B ) + P ( A 2 B ) P ( A 1 A 2 B ) (12)

Edens 060214-1610 15 Kansrekening en statistiek (Inf.) enz.; kortom, vervang de kansfunctie P ( ) door P ( B ) bij vaste B. (6.9) Voorbeeld: We beschouwen de punten X, Y, en Z (knooppunten). Tussen verschillende punten worden schakelaars (S i ) aangebracht en wel X, Y : S 1 ; X, Z: S 2 ; Z, Y : S 3 ; Z, Y : S 4 (S 3 en S 4 staan dus parallel). De schakelaar S i geleidt met kans p i ; i = 1, 2, 3, 4. De standen zijn onafhankelijk van elkaar. Bereken de kans dat tussen X en Y sprake is van geleiding. 1 X 2 Z 3 4 Y Oplossing: Zie bovenstaande figuur. Ga uit van de mogelijke geleidingswegen 1, 23 en 24. Noem A, B resp. C de gebeurtenissen dat deze wegen geleiden. Dan is bijvoorbeeld P ( BC ) =kans dat 2 en 3 èn 2 en 4 geleiden; dus gewoon dat 2, 3 en 4 geleiden. De kans P ( BC ) is vanwege de onafhankelijke standen dus gelijk aan p 2 p 3 p 4. De verenigingsregel 7 in (4.2) geeft nu direct kans [p 1 + p 2 p 3 + p 2 p 4 ] [p 1 p 2 p 3 + p 1 p 2 p 4 + p 2 p 3 p 4 ] + [p 1 p 2 p 3 p 4 ]. (6.10) Voorbeeld: Raden van een getal onder de tien. Stel dat een appel onder twee kindertjes moet worden verloot. Het jongste kind begint; om beurten wordt aselect gekozen uit de nog niet eerder genoemde getallen uit 1, 2,..., 10. De kans dat het jongste kind de appel krijgt is gelijk aan de som van de kansen dat het getal de eerste, derde, vijfde, zevende en negende beurt wordt geraden (hier,,beurt zonder aanzien des persoons bedoeld); dat is door steeds de padenproductregel toe te passen 1 10 + 9 10 8 9 1 8 + 9 10 8 9 7 8 6 7 1 6 + 9 10 8 9 7 8 6 7 5 6 4 5 1 4 + 9 10 8 9 7 8 6 7 5 6 4 5 3 4 2 3 1 2 = 1 2. Elk product is gelijk aan 1 10. We zien dan ook, dat een dergelijke verloting onder drie kindertjes niet eerlijk is. Degene die mag beginnen, krijgt de appel met kans 4 10 (beurten 1,4,7,10); de andere twee hebben ieder gelijke kans 3 10 op de appel! (De,,tweede moet in beurt 2, 5 of 8 raden; de,,derde in beurt 3, 6 of 9.) (6.11) Voorbeeld: A en B werpen om beurten met een zuivere dobbelsteen; A begint. Wat is de kans dat B de eerste zes gooit? Oplossing: De eerste zes moet vallen in de tweede, vierde, zesde,... worp. De kans hierop is 5 5 6 1 6 + ( 5 6 )3 1 6 + ( 5 6 )5 1 6 + = 6 1 6 1 ( 5 = 5 6 )2 11 ; zoals met een meetkundige reeks volgt (a + ar + ar 2 + = a/(1 r) voor 1 < r < 1). Een andere, aardige manier is de volgende: Stel dat B moet winnen. Dat kan alleen als A

Edens 060214-1610 16 Kansrekening en statistiek (Inf.) in de eerste beurt geen zes gooit; de kans hierop is 5 6. Als we vanuit die situatie opnieuw gaan tellen, moet B in de nù eerste, derde,... beurt de eerste zes gooien. De kans daarop is de aanvankelijke winstkans voor A. Noem de winstkansen p A en p B. Dan is blijkbaar p B = 5 6 p A. Tevens is p A + p B = 1. Hieruit volgt p A = 6 11 en p B = 5 11. (6.12) Voorbeeld: De brug is open met kans 1 6 ; het onweert met kans 1 3 en als het onweert is de brug dicht. Als de brug open is, komt de melkboer vóór tien uur met kans 2 5 ; als het onweert komt hij vóór tien uur met kans 1 5. In alle andere gevallen komt hij vóór tien uur met kans 4 5. a) Bereken de kans dat de melkboer vóór tien uur komt. b) De melkboer is zojuist vóór tien uur gekomen. Bereken de kans dat de brug open was. c) De melkboer is zojuist na tien uur gekomen. Bereken de kans dat de brug dicht was. Oplossing: Eerst een moeilijke manier. Schrijf B = {de brug is open}, O = {het onweert}, M = {de melkboer komt vóór tien uur}. Dan is in volgorde van de gegevens: P ( B ) = 1 6, P ( O ) = 1 3, O B, P ( M B ) = 2 5, P ( M O ) = 1 5, P ( M B O ) = 4 5. Schrijf Z = B O. Omdat O B, is {B, O, Z} een partitie van Ω (zie het Venndiagram in fig. 6.12.1) en P ( Z ) = 1 P ( B ) P ( O ) = 1 1 6 1 3 = 1 2. De gevraagde kans in a is P ( M ) = P ( M B ) P ( B ) + P ( M O ) P ( O ) + P ( M Z ) P ( Z ) = = 2 5 1 6 + 1 5 1 3 + 4 5 1 2 = = 8 15. Nu iets eenvoudiger en doorzichtiger: zie de bomen in figuur 6.12.1. 1/6 1/3 1/2 B O Z 1/6 1/3 1/2 B O Z B 2/5 1/5 4/5 3/5 4/5 1/5 O Z M M Fig. 6.12.1

Edens 060214-1610 17 Kansrekening en statistiek (Inf.) De kansen in de tweede boom volgen eenvoudig uit die in de eerste! Uit de eerste boom lezen we direct P ( M ) = 2 5 1 6 + 1 5 1 3 + 4 5 1 2 = 8 15 af. We zien daarna tevens in dezelfde boom, dat P ( B M ) = 1 6 2 5 / 8 15 = 1 8. Dit is de kans op pad BM gedeeld door de kans op alle paden naar M. In de tweede boom zien we eveneens direct: P ( B M ) = 1 3 4 5 + 1 2 1 5 1 6 3 5 + 1 3 4 5 + 1 2 1 5 = 11 14. Dit is de kans op alle paden naar M, niet via B gedeeld door de kans op alle paden naar M. We konden ook direct berekenen: P ( B M ) = 1 P ( B M ) = 1 1 6 3 5 1 6 3 5 + 1 3 4 5 + 1 2 1 5 = 1 3 14 = 11 14. (6.13) Voorbeeld: In een bepaald bedrijf is s nachts de kans op brand gelijk aan 0,5%. Het bedrijf schaft een goedkoop brandalarm aan. Statistisch onderzoek heeft het volgende uitgewezen: 1) Als er brand is, gaat het alarm af met kans 97%. 2) Als er geen brand is, zwijgt het alarm met kans 95%. In zekere nacht gaat het alarm af. De nachtwaker draait zich echter nog eens om in zijn sponde. Wat is de kans dat er geen brand is? Oplossing: In dit vraagstuk wordt een a-posteriori-kans gevraagd. Dit gaat met de regel van Bayes. Zie de boom in onderstaande figuur. De gevraagde kans is de kans op het dik aangegeven pad naar alarm, gedeeld door de kans op alle paden naar alarm. Het antwoord is dus 0, 995 0, 05 = 0, 91. 0, 005 0, 97 + 0, 995 0, 05

Edens 060214-1610 18 Kansrekening en statistiek (Inf.) Start 0,005 0,995=1-0,005 Brand Geen brand 0,97 0,05=1-0,95 Alarm Opm.: Toepassing van de regel van Bayes,,in formulevorm geeft P (geen brand alarm) P (alarm geen brand) P (geen brand) = P (alarm geen brand) P (geen brand) + P (alarm brand) P (brand) 0, 05 0, 995 = 0, 05 0, 995 + 0, 97 0, 005 = 0, 91.

Edens 060214-1610 19 Kansrekening en statistiek (Inf.) 7. Vraagstukken over algemene kansrekening. 1. Gegeven zijn A, B Ω met P ( A ) = 0.5, P ( B ) = 0, 7 en P ( A B ) = 0, 8. Bereken P ( A B ), P ( A B ) en P ( B A ). 2. De gebeurtenissen A en B zijn stochastisch onafhankelijk (s.o.). Bewijs dat Ā en B s.o. zijn. Zijn A en B, en ook Ā en B s.o.? 3. Laat een bepaald driemotorig vliegtuig alleen kunnen vliegen als òf tenminste de middenmotor, òf alleen beide zijmotoren werken. De kans dat de middenmotor uitvalt is 0,5%. Elk der andere motoren valt uit met kans 10%. Het uitvallen der motoren geschiedt onafhankelijk van elkaar. Bereken de kans dat het vliegtuig blijft vliegen. 4. In onderstaande figuur stelt elk vierkantje een schakelaar voor. De schakelaars zijn genummerd. Elke schakelaar is geleidend met kans 1 3 en gesperd met kans 2 3. De standen van de schakelaars zijn onafhankelijk van elkaar. 1 2 X 5 Y 3 4 Bereken de kans dat tussen de punten X en Y sprake is van geleiding. 5. We hebben drie vazen met elk zes ballen. Vaas 1 bevat één zwarte bal; vaas 2 bevat twee zwarte ballen en vaas 3 bevat drie zwarte ballen. Alle overige ballen zijn wit. Aselect wordt een vaas gekozen en daaruit aselect een bal getrokken. a) Bereken de kans dat de getrokken bal wit is. b) Bij welke verdeling van de ballen over de vazen is de kans op trekking van een witte bal zo groot mogelijk? 6. De niet-transitieve dobbelstenen van Bradley Efron. We hebben vier dobbelstenen: Dobbelsteen a heeft twee zijden met een 0 en vier met een 4; Dobbelsteen b heeft zes zijden met een 3; Dobbelsteen c heeft vier zijden met een 2 en twee met een 6; Dobbelsteen d heeft drie zijden met een 1 en drie met een 5. Speler A kiest een dobbelsteen uit deze vier. Daarna kiest speler B een dobbelsteen uit de overige drie. Ieder werpt nu zijn gekozen dobbelsteen. Wie het hoogste aantal ogen gooit, wint. Bewijs dat speler B door een geschikte keus van zijn dobbelsteen wint met kans 2 3. 7. Een verzameling mensen bestaat uit 30% vrouwen, 20% mannen en 50% kinderen. Van de vrouwen draagt 40% een bril; van de mannen 60% en van de kinderen 20%. Men kiest aselect een persoon uit de verzameling. Deze blijkt een bril te dragen. Bereken de kans dat de gekozen persoon een kind is.

Edens 060214-1610 20 Kansrekening en statistiek (Inf.) 8. Een serie van een miljoen zuivere munten bevat één munt met twee koppen. Alle andere munten zijn,,goed : deze hebben elk één kop en één staart. Aselect wordt een munt getrokken en deze wordt twintig maal geworpen. Al deze worpen resulteren in,,kop. Bereken de kans dat de munt goed is. 9. Van tien getallen zijn vijf positief en vijf negatief. Aselect en zonder teruglegging worden twee getallen gekozen en met elkaar vermenigvuldigd. Bereken de kans op een negatief product. 10. Een vaas bevat drie zwarte en vijf witte ballen. Achtereenvolgens worden twee ballen zonder teruglegging getrokken. Bereken de kans dat de tweede bal zwart is. 11. Als het op een dag droog is, is het de volgende dag nat met kans 1 5. Als het op een dag nat is, is het de volgende dag droog met kans 2 5. Het is vandaag nat. Bereken de kans dat het a) overmorgen; b) overovermorgen droog is. 12. Arend, Berend en Celestien spelen Mens-erger-je-niet; ze werpen in volgorde als genoemd. Wie de eerste zes werpt begint. Bereken voor elke speler de kans hierop.