Combinatoriek en kansrekening



Vergelijkbare documenten
college 4: Kansrekening

Combinatoriek en rekenregels

Binomiale verdelingen

Laplace Experimenteel Intuïtie Axiomatisch. Het kansbegrip. W. Oele. 27 januari W. Oele Het kansbegrip

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

Statistiek voor A.I. College 6. Donderdag 27 September

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Medische Statistiek Kansrekening

Statistiek voor A.I. College 3. Dinsdag 18 September 2012

Faculteit, Binomium van Newton en Driehoek van Pascal

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Gezamenlijke kansverdeling van twee stochasten

Kansrekening en Statistiek

Overzicht. Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen. Voorwaardelijke kans. Voorbeeld: Probabilistisch redeneren

5.0 Voorkennis. Voorbeeld 1: In een vaas zitten 10 rode, 5 witte en 6 blauwe knikkers. Er worden 9 knikkers uit de vaas gepakt.

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur

Statistiek voor A.I. College 4. Donderdag 20 September 2012

Statistiek voor A.I. College 5. Dinsdag 25 September 2012

Samenvatting Statistiek

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert

11.1 Kansberekeningen [1]

Kansrekening en stochastische processen 2DE18

Kansrekening en Statistiek

Uitwerking Tentamen Inleiding Kansrekening 11 juni 2015, uur Docent: Prof. dr. F. den Hollander

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

HOOFDSTUK I - INLEIDENDE BEGRIPPEN

Combinatoriek en rekenregels

Kansrekening en Statistiek

Schrijf boven elk vel je naam, studentnummer en studierichting (W, N of I). Het is toegestaan een (grafische) rekenmachine te gebruiken.

is, dat de zijde met cijfer boven te liggen komt, evenzo als de kans voor de koningin 1 2

Kansrekening en Statistiek

Combinatoriek en rekenregels

Examen Statistiek I Feedback

5,1. Samenvatting door een scholier 1647 woorden 18 oktober keer beoordeeld. Wiskunde A

Tentamen Kansrekening (NB004B)

Opgaven voor Kansrekening - Oplossingen

Kansrekening en Statistiek. Overzicht Kansrekening

Bij het oplossen van een telprobleem zijn de volgende 2 dingen belangrijk: Is de volgorde van de gekozen dingen van belang?

Kansrekening en Statistiek

HOOFDSTUK I - INLEIDENDE BEGRIPPEN

7,7. Samenvatting door Manon 1834 woorden 3 mei keer beoordeeld. Wiskunde C theorie CE.

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel.

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Rekenen aan wortels Werkblad =

werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions

Tentamen Inleiding Kansrekening 25 juni 2009, uur Docent: F. den Hollander

Inleiding Kansrekening en Statistiek

Tentamen Inleiding Kansrekening wi juni 2010, uur

1. De wereld van de kansmodellen.

Tentamen Voortgezette Kansrekening (WB006C)

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

Permutaties Combinaties Binomiaalcoëfficiënt Variaties. Combinatoriek. W. Oele. 27 januari W. Oele Combinatoriek

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Lesbrief Hypergeometrische verdeling

Examenprogramma wiskunde A vwo

6.1 Kwadraten [1] HERHALING: Volgorde bij berekeningen:

Kansrekening en Statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

36, P (5) = 4 36, P (12) = 1

1BA PSYCH Statistiek 1 Oefeningenreeks 3 1

In de Theorie worden de begrippen toevalsvariabele, kansverdeling en verwachtingswaarde toegelicht.

In het vervolg gaan we steeds uit van een verzameling A bestaande uit n verschillende objecten. We geven de elementen van A een naam door ze te

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Kansrekening en Statistiek

Ruimtemeetkunde deel 1

Statistiek voor A.I. College 10. Dinsdag 16 Oktober

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling

2.0 Voorkennis. Rekenregels machten: 5) a 0 = 1. p p q p q a p q q. p q pq p p p. Willem-Jan van der Zanden

1.1 Rekenen met letters [1]

Verwachtingswaarde, Variantie en Standaarddeviatie

Opgaven voor Kansrekening

Tentamen Kansrekening en Statistiek (2WS04), woensdag 30 juni 2010, van uur.

6.1 Kwadraten [1] HERHALING: Volgorde bij berekeningen:

Zomercursus Wiskunde. Katholieke Universiteit Leuven Groep Wetenschap & Technologie. September 2008

Kansrekening en Statistiek

Statistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2

Voorbeeld 1. Statistiek voor Informatica Hoofdstuk 3: Stochastische Variabelen en Verdelingen. Voorbeeld 2A. Voorbeeld 1 (vervolg)

VOOR HET SECUNDAIR ONDERWIJS

Tentamenset A. 2. Welke van de volgende beweringen is waar? c. N R N d. R Z R

1 Limiet van een rij Het begrip rij Bepaling van een rij Expliciet voorschrift Recursief voorschrift 3

De wissel-eigenschap voor vermenigvuldigen Vermenigvuldigen kan in omgekeerde volgorde gebeuren, want voor ieder paar getallen a enbgeldt: a b=b a.

Inleiding Applicatie Software - Statgraphics

Hoofdstuk 4 Kansrekening

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Radboud Universiteit Nijmegen Heyendaalse weg 135

Economie en maatschappij(a/b)

Opgaven voor Kansrekening

Samenvatting Wiskunde A

Zomercursus Wiskunde. Module 1 Algebraïsch rekenen (versie 22 augustus 2011)

14.1 Kansberekeningen [1]

Tentamen Inleiding Kansrekening 12 augustus 2010, uur Docent: F. den Hollander

Hertentamen Inleiding Kansrekening 5 juli 2017, 14:00 17:00 Docent: Prof. dr. F. den Hollander

3.1 Het herhalen van kansexperimenten [1]

13.1 Kansberekeningen [1]

Populaties beschrijven met kansmodellen

Kansrekening en Statistiek

Uitwerkingen Mei Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

begin van document Eindtermen havo wiskunde A (CE) gekoppeld aan delen en hoofdstukken uit Moderne wiskunde 9e editie

Transcriptie:

Combinatoriek en kansrekening (SV 2.1) P.J. den Brok MA 26 september 2013

Inhoudsopgave 1 De kansrekening 4 1.1 Belangrijke combinatorische functies.................... 4 1.2 Rangschikkingen.............................. 6 1.3 Overzicht combinatoriek.......................... 12 2 Het kansbegrip 14 2.1 Het intuïtieve kansbegrip.......................... 15 2.2 De axiomatische kansrekening....................... 16 2.3 Voorwaardelijke kansen........................... 19 2.4 Onafhankelijke gebeurtenissen....................... 20 2.5 De steekproef................................ 21 2.6 Steekproeven met- en zonder volgorde................... 21 2.7 De algemene produktregel......................... 26 2.8 De omkeerregels van Bayes......................... 26 3 Kansvariabelen 28 3.1 Discrete kansvariabelen........................... 29 3.2 Continue kansvariabelen.......................... 34 3.3 De E algebra................................ 38 3.4 Onafhankelijke variabelen......................... 41 3.5 Afhankelijke variabelen........................... 42 3.6 De covariantie................................ 44 3.7 Rekenregels voor onafhankelijke variabelen................ 46 3.8 Rekenregels voor afhankelijke variabelen................. 47 3.9 De correlatiecoëfficiënt........................... 47 1

4 Belangrijke kansverdelingen 50 4.1 De binomiale verdeling........................... 51 4.2 De Poisson-verdeling............................ 52 4.3 De N-verdeling............................... 55 4.4 De benadering van de binomiaalverdeling met de N-verdeling...... 60 4.5 De benadering van de binomiale verdeling met de Poisson-verdeling... 61 4.6 De benadering van de Poisson-verdeling met de N-verdeling....... 61 4.7 De exponentiële verdeling......................... 62 4.8 De uniforme kansverdeling......................... 63 5 Kansmodellen en enkele minder bekende kansverdelingen 65 5.1 Relatie tussen exponentiële- en Poisson-verdeling............. 65 5.2 Simulatie van stochasten met diverse verdelingen............. 67 5.3 Het tijdgedrag grafisch weergeven..................... 71 5.4 De Weibullverdeling............................ 75 5.5 De lognormaal-verdeling.......................... 77 5.6 De gamma-verdeling............................ 78 A Literatuur 81 A Groepsopdrachten 82 2

Voorwoord bij de reader Combinatoriek en kansrekening Combinatoriek en kansrekening zijn een belangrijk deel van de basiskennis van een aantal TI-vakken zoals informatica, informatieheorie, simulatietechniek, signaalverwerking, bedrijfszekerheid en bedrijfskunde. De hoofdstukken 1 t/m 4 vormen de verplichte leerstof. Daarentegen is hoofdstuk 5 (kansmodellen en enkele minder bekende kansverdelingen) alleen bedoeld voor de studenten die dit nodig hebben tijdens hun projecten of simulatie-opdrachten. 3

Hoofdstuk 1 De kansrekening In de kansrekening worden modellen geconstrueerd waarmee men het gedrag van de variabelen kan voorspellen en verklaren. De kansrekening maakt gebruik van de combinatoriek, een tak van de wiskunde die zich bezig houdt met het rangschikken en het tellen. 1.1 Belangrijke combinatorische functies Faculteiten De faculteit wordt recursief gedefinieerd als een afbeelding van een willekeurig natuurlijk getal n op een ander natuurlijk getal n!: 0! = 1 n! = n (n 1)! (1.1) Indien deze recursieve definitie wordt uitgewerkt dan komt men op de volgende formule voor n!: n! = n factoren { }} { 1 2 3 n (1.2) Hieruit volgt dat 1! = 1 en: 2! = 1 2 = 2 3! = 1 2 3 = 6 4! = 1 2 3 4 = 24 5! = 1 2 3 4 5 = 120.. 69! 1,7 10 98 4

Deze laatste waarde is vaak de grootste faculteitswaarde van de meeste rekenmachines. Voor grotere waarden dan 69! moet men gebruik maken van de benaderingsformule van James Stirling (1692-1770): of in logaritmische vorm: n! n n e n 2πn (1.3) n! 10 (n+ 1 / 2 ) log 10 n n log 10 e+ 1 / 2 log 10 2π (1.4) Binomiale coëfficiënten Als (p + q) n moet worden uitgeschreven tot een reeks dan kan men gebruik maken van het binomium van Newton, genoemd naar Isaac Newton (1642-1727): (p + q) n = n k=0 waarbij de binomiale coëfficiënten ( n k) als volgt zijn gedefinieerd: ( ) n p k q n k (1.5) k ( ) n n! = k k!(n k)! (1.6) Daaruit volgt voor n = 2: (p + q) 2 = ( ) 2 p 2 + 0 ( ) 2 pq + 1 ( ) 2 q 2 = p 2 + 2pq + q 2 2 Men kan de binomiale coëfficiënten uitzetten in de driehoek van Blaise Pascal (1623-1662): ( 3 0 ( 0 ) ( 0 = 1 1 ) ( 0 = 1 1 ) ( 1 = 1 2 ) ( 0 = 1 2 ) ( 1 = 2 2 ) ) ( 2 = 1 = 1 3 ) ( 1 = 3 3 ) ( 2 = 3 3 ) 3 = 1 Als men alle binomiale coëfficiënten waarvoor n < 0 of n < k de waarde 0 toekent, dan geldt dat elke binomiale coëfficiënt de som is van zijn twee bovenburen : 5

( ) n = k ( ) n 1 + k 1 ( ) n 1 k (1.7) Als men alle binomiale coëfficiënten in de rij n van de driehoek van Pascal optelt, dan geldt: n k=0 Bewijs (gebruik formule 1.5 waarin p = 1 en q = 1): (1 + 1) n = ( ) n 1 + 0 ( ) n = 2 n (1.8) k ( ) n 1 +... + 1 Opmerking: Men zegt voor ( n k) k uit n of n over k. ( ) n 1 = 2 n n 1.2 Rangschikkingen Bij het bepalen van het aantal rangschikkingen van een aantal voorwerpen in een aantal posities of kasten moet men de aard van de identiteit van de voorwerpen en posities binnen de groep kennen 1. Als men de voorwerpen zonder probleem mag verwisselen of terugleggen en opnieuw plaatsen dan heeft men te maken met niet-unieke voorwerpen voorwerpen. In dat geval spreekt men over teruglegging. Unieke voorwerpen zijn niet-onderscheidbare voorwerpen en niet-verwisselbaar. Met andere woorden, unieke voorwerpen zijn zelfstandige objecten, niet-unieke voorwerpen zijn types klassenvertegenwoordigers; Men kan het onderscheid tussen uniek en niet-uniek ook betrekken op de kasten waar de voorwerpen geplaatst worden. Niet-unieke kasten zijn zonder probleem te verwisselen of niet van elkaar te onderscheiden. Als de kasten uniek, dus nietverwisselbaar of onderscheidbaar, zijn dan spreekt men over volgorde. Bijvoorbeeld bij het bepalen van het aantal rangschikkingen met volgorde van de letters van het woord KOK, is identiteit van de letters belangrijk. Indien men vindt dat er sprake is van twee zelfstandig letters K 1 en K 2, dan blijken 6 rangschikkingen mogelijk. 1 Dit kunnen verzamelingen-, families- of rijen van voorwerpen en posities zijn. 6

Indien men geen onderscheid maakt tussen de twee K s, dan zijn er maar 3 rangschikkingen. Zou men alle letters K en O niet als zelfstandige objecten maar als vertegenwoordigers van een groep beschouwen, dan zijn er zelfs 8 mogelijke rangschikkingen. In dit laatste geval lijkt het er op of de letters K en O uit een onuitputtelijke voorraad K s en O s komen of dat een letter na plaatsing, teruggelegd wordt en opnieuw geplaatst kan worden. Permutaties, rangschikkingen met volgorde Op hoeveel manieren kan men 3 verschillende unieke voorwerpen A, B en C in 3 unieke kasten plaatsen, zodanig dat in elke kast één voorwerp wordt geplaatst? Hoeveel verschillende rangschikkingen met volgorde krijgt men met 3 unieke voorwerpen A, B en C? Indien men alle mogelijkheden beschouwt, dan krijgt men de volgende 6 rangschikkingen: ABC ACB CAB CBA BCA BAC 1. Plaats een voorwerp in de 1 ste kast, men kan kiezen uit 3 voorwerpen, er zijn totaal 3 rangschikkingen ontstaan; 2. Plaats een voorwerp in de 2 de kast, men kan kiezen uit 2 voorwerpen. er zijn totaal 2 3 = 6 rangschikkingen ontstaan: 3. Plaats een voorwerp in de 3 de kast, men kan kiezen uit 1 voorwerp. er zijn totaal 1 2 3 = 6 rangschikkingen ontstaan. Om n verschillende voorwerpen in n verschillende kasten te plaatsen zijn er n! mogelijkheden. Anders gesteld, n verschillende voorwerpen zijn op n! verschillende manieren te permuteren. Permutaties vormen de basis van de combinatoriek. Permutatieproblemen kunnen in verschillende vormen optreden: 1. Hoeveel permutaties bestaan er van de letters van het woord ROB?. Dit is een helder permutatieprobleem. Er zijn 3 unieke letters en 3 unieke plaatsen. Het aantal permutaties perm is: perm(rob) = 3! = 6 2. Hoeveel rangschikkingen bestaan er van het woord OORROB?. Dit is een iets complexer permutatieprobleem. Er zijn 6 letters: 3 O s, 2 R s en 1 B en 6 unieke plaatsen. Men kan alle letters als uniek beschouwen. Het aantal rangschikkingen is in dit geval gelijk aan: perm(o 1 O 2 R 1 R 2 O 3 B) = 6! = 720. 7

Laten men het onderscheid tussen de zelfde type letters los, dan moet men de totale uitkomst corrigeren voor twee groepen met equivalente oplossingen. De eerste groep equivalente oplossingen wordt gevormd door de deelpermutaties van de unieke letters O 1, O 2, O 3. Deze groep draagt 3! extra permutaties bij aan het totaal resultaat. Ook zijn alle deelpermutaties met R 1, R 2 equivalent, deze groep draagt bij tot nog zo n 2! extra oplossingen. Beide groepen oplossingen moeten uit het totaal aantal oplossingen verwijderd worden. Het totaal aantal oplossingen wordt nu: 6! / 3! 2! = 60. In het algemeen is het aantal rangschikkingen p m van een woord met n posities en een aantal gelijke letters gelijk aan: n { }} { n! perm( aaa...a } {{ } bbb...b } {{ }...zzz...z } {{ } ) = n a! n b!...n z! n a n b n z (1.9) 3. Op hoeveel manieren kunnen 5 unieke personen om een ronde tafel met 5 stoelen gaan zitten? Indien men dit probleem voorstelt als een lange tafel met unieke stoelen, dan ligt oplossing voor de hand. Er zijn 5! = 120 mogelijke rangschikkingen. Bij een ronde tafel zijn de stoelen wel in vaste volgorde te plaatsen, maar elke stoel zou als eerste genomen kunnen worden. Er zijn groepen met 5 equivalente oplossingen aanwezig. De totale oplossing is: 5! / 5 = 4! = 24 rangschikkingen. De algemene regel is dat als n unieke personen om een ronde tafel met n stoelen gaan zitten, er (n 1)! rangschikkingen zijn. Dit is een voorbeeld van een cyclische permutatie. Variaties, rangschikkingen met volgorde zonder teruglegging Op hoeveel manieren kan men 3 unieke voorwerpen A, B en C in 2 unieke kasten plaatsen, zodanig dat in elke kast één voorwerp wordt geplaatst? Of op hoeveel verschillende volgorden kan men 2 uit 3 verschillende voorwerpen A, B en C plaatsen? Indien men alle mogelijkheden beschouwt, dan krijgt men de volgende rij met 6 mogelijkheden: [AB, AC,CA,CB, BC, BA]: 1. Plaats in de 1 ste kast een voorwerp, men kan kiezen uit 3 voorwerpen, er zijn 3 mogelijkheden; 2. Plaats in de 2 de kast een voorwerp, men kan kiezen uit 2 voorwerpen. er zijn 2 3 = 6 mogelijkheden. Op hoeveel manieren n k kan men n unieke voorwerpen in k unieke kasten plaatsen, zodanig dat er in elke kast één voorwerp wordt geplaatst? Dit is het aantal variaties n v van n voorwerpen in k kasten: 8

n v = n (n 1) (n 2) (n k + 1) = n! (n k)! (1.10) Het probleem is gelijkwaardig met het aantal rangschikkingen van een woord met n letters dat bestaat uit k unieke letters G i (Gekozen voor plaatsing in kast i ) en n k niet-unieke letters N (Niet gekozen): n { }} { n v = perm( G 1 G 2 G 3...G } {{ } k NNN } {{...N }) = n! (n k)! k n k Combinaties, rangschikkingen zonder volgorde zonder teruglegging Op hoeveel manieren kan men 3 unieke voorwerpen A, B en C in twee niet-unieke kasten plaatsen, zodanig dat er in elke kast één voorwerp wordt geplaatst? Of op hoeveel verschillende manieren zonder op volgorde te letten kan men 2 uit 3 verschillende voorwerpen A, B en C combineren? Er zijn blijkbaar 6 variaties om 3 verschillende voorwerpen ieder in 2 verschillende kasten te plaatsen. Men mag nu echter geen onderscheid maken tussen verschillende volgordes: AB = BA BC = CB AC = CA In de 6 variaties kan men voor elke oplossing een andere oplossing vinden die equivalent is. Er zijn uiteindelijk 6 / 2 = 3 combinaties te maken. Op hoeveel manieren n c kan men n unieke voorwerpen in k niet-unieke kasten plaatsen, zodanig dat er in elke kast één voorwerp wordt geplaatst? De k kasten kunnen op k! verschillende manieren geplaatst zijn. Er zijn dus n v variaties, verdeeld in groepen met k! equivalente oplossingen: n c = n v k! = n! (n k)!k! = ( ) n k (1.11) Er zijn dus ( n c) combinaties te maken. Het combinatieprobleem is gelijkwaardig met het aantal rangschikkingen van een woord met n letters dat bestaat uit k niet-unieke letters G ( Gekozen ) en n k niet-unieke letters N ( Niet gekozen ): { }} { n c = perm( } GGG...G {{ } NNN } {{...N }) = k n k n 9 n! k! (n k)! = ( ) n k

Rangschikkingen met volgorde met teruglegging Bij het rangschikken van k uit n voorwerpen, werd stilzwijgend aangenomen dat een voorwerp niet meer teruggelegd werd. Met andere woorden, een voorwerp kan maar één keer in een combinatie aanwezig zijn. Men kan ook een combinatie van voorwerpen bedenken waarvan elk voorwerp een onbeperkt aantal keren aanwezig mag zijn, of wat identiek is, waar elk voorwerp weer gekozen kan worden omdat het teruggelegd is. Voorbeeld 1.1 Hoeveel verschillende 3-tallen met volgorde en teruglegging kan men maken? Antwoord: 3 3 = 27 AAA ABA ACA BAA BBA BCA CAA CBA CCA AAB ABB ACB BAB BBB BCB CAB CBB CCB AAC ABC ACC BAC BBC BCC CAC CBC CCC Voorbeeld 1.2 Hoeveel verschillende 2-tallen met volgorde kan men maken uit 3 voorwerpen met teruglegging? Antwoord: 3 3 = 9. Voorbeeld 1.3 Hoeveel verschillende k-tallen met volgorde kan men maken uit n voorwerpen met teruglegging? Antwoord: k { }} { n n n n = n k Voorbeeld 1.4 Hoeveel rangschikkingen met eventuele herhalingen kan men maken met 2 letters uit het alfabet? Antwoord: 26 2 = 676 rangschikkingen. 10

Rangschikkingen zonder volgorde met teruglegging Men kiest uit drie typen A,B en C (met teruglegging) twee voorwerpen, zonder te letten op de volgorde. Hoeveel rangschikkingen n r zonder volgorde met teruglegging zijn er? AA A A B BB B C CC C Bovenstaande tabel heeft 6 oplossingen. Men kan zonder gevaar de tabel op een andere manier aangeven. De letters A, B en C worden vervangen door de letter X. Het aantal onderscheidbare rangschikkingen n r blijft gelijk aan 6: XX X X X XX X X XX X Het probleem is herleidbaar tot het aantal rangschikkingen van twee letters X en twee scheidingstekens. Als dit resultaat wordt veralgemeniseerd, dan blijkt dat de n 1 scheidingstekens (voorgesteld door de letter S) en de k letters X een woord vormen: n 1+k { }} { ( ) (n 1 + k)! n 1 + k perm( SSS...S } {{ } XXX } {{...X }) = k! (n 1)! = k n 1 k De algemene oplossing van dit probleem wordt nu: ( ) (n 1 + k)! n 1 + k n r = k! (n 1)! = k (1.12) Het probleem van het aantal rangschikkingen zonder volgorde met teruglegging is ook voor te stellen als het probleem van het aantal geheeltallige oplossingen van de geheeltallige vergelijking : x 1 + x 2 +... + x n = k 11

x i : 0 x i k (i = 1,2,3...n) Het aantal rangschikkingen van 3 niet-unieke voorwerpen of soorten A, B en C in 2 nietonderscheidbare groepen komt overeen met het aantal geheeltallige oplossingen van de volgende geheeltallige vergelijking: x 1 + x 2 + x 3 = 2 x i : 0 x i 2 (i = 1,2) De variabele x 1 komt overeen met het aantal A s, de variabele x 2 komt overeen met het aantal B s en de variabele x 3 komt overeen met het aantal C s. Tussen deze 3 variabelen zitten 3 1 = 2 plustekens: het lijkt erop of het aantal oplossingen gelijk is met het aantal combinaties van 2 uit 4. Voorbeeld 1.5 Op hoeveel manieren kan een klant 3 gebakjes kiezen uit een 6 soorten gebak? Het probleem is vergelijkbaar met het aantal geheeltallige oplossingen van de geheeltallige vergelijking: x 1 + x 2 + x 3 + x 4 + x 5 + x 6 = 3 x i : 0 x i 3 (i = 1,2,...,6) Het gevraagde aantal manieren is: n r = ( ) 8 = 56 3 1.3 Overzicht combinatoriek De formules van de rangschikkingen zijn in het volgende schema geplaatst: geen teruglegging wel teruglegging geen volgorde ( n ( n 1+k ) k) k wel volgorde n! (n k)! n k 12

Opgemerkt moet worden dat de volgende formule de belangrijkste formule is van de behandelde combinatoriek. Het aantal permutaties van een woord met een aantal nietunieke letters is gelijk aan: n { }} { n! perm( aaa...a } {{ } bbb...b } {{ }...zzz...z } {{ } ) = n a! n b!...n z! n a n b n z 13

Hoofdstuk 2 Het kansbegrip In de loop van de geschiedenis zijn er enkele invloedrijke kanstheorieën ontstaan. Naast de intuïtieve- of de subjectieve bepaling van een kans maakt men nog steeds gebruik van de volgende kanstheorieën: De kanstheorie van Pierre Simon Laplace (1749-1827): De kans op een gebeurtenis wordt vooraf theoretisch bepaald, gebaseerd op de symmetrie die ideale munten en ideale dobbelstenen bezitten. De kans op de gebeurtenis A is het theoretisch aantal gebeurtenissen A, gedeeld door het theoretisch totaal aantal gebeurtenissen: P(A) = n(a) n tot (2.1) Bij een ideale dobbelsteen is de kans op 6 ogen op theoretische gronden gelijk aan 1 / 6. De combinatoriek speelt een belangrijke rol bij het vooraf bepalen van een kans; De experimentele kanstheorie: In deze theorie wordt de kans achteraf bepaald als de relatieve frequentie van een gebeurtenis A. P(A) = de frequentie van A de totale frequentie = f (A) (2.2) f tot Bijvoorbeeld, een paard dat 6 van de 10 wedstrijden heeft gewonnen, wordt een kans van 60% gegeven om de volgende wedstrijd te winnen; De axiomatische kanstheorie: De axiomatische kanstheorie gaat uit van de uitkomstenruimte, de verzameling elementaire gebeurtenissen. In de axiomatische kanstheorie is de kans op een elementaire gebeurtenis een ongedefinieerd begrip, te vergelijken 14

met een punt of lijn in de meetkunde. Hoewel men in de axiomatische kanstheorie aanneemt dat de kans op een elementaire gebeurtenis bestaat, zal zij via een andere kanstheorie bepaald moeten worden. Het is met de axiomatische kanstheorie mogelijk de kansen van samengestelde gebeurtenissen uit te drukken in kansen van elementaire gebeurtenissen. Voorbeeld 2.1 Tijdens een experiment waarin 5000 keer met een munt wordt geworpen, nadert de relatieve frequentie van het werpen van de kop de waarde 1 / 2 : 0.5 1000 2000 3000 4000 5000 Figuur 2.1: De relatieve frequentie van kop bij het werpen van een munt. Naast de gebruikelijke methode om een kanswaarde als een getal 0...1 of als 0%...100% te schrijven, is het in de gokwereld de gewoonte om kanswaarden als odds aan te geven. Als de kans op een gebeurtenis p = 20% is, dan wordt de odds van het optreden van deze gebeurtenis aangegeven met p : (1 p) = 20% : 80% = 1 : 4 (één op vier). De odds van het niet-optreden van de gebeurtenis is dan 4 : 1 (vier op één). 2.1 Het intuïtieve kansbegrip Het intuïtief kansbegrip of subjectief kansbegrip speelt een rol bij onze verwachtingen van de toekomst. Het intuïtieve kansbegrip wordt vaak bewust of onbewust gemanipuleerd. Enkele voorbeelden: 15

1. Hoe wordt iemand sportprofeet? Stel dat iemand een blad over boxen wil beginnen. Enkele weken voor een bepaalde wedstrijd stuurt hij 2000 boxliefhebbers een brief. De de helft van het aantal brieven bevat de voorspelling waarin boxer A de wedstrijd wint, de andere helft bevat de voorspelling dat boxer B de wedstrijd zal winnen. Na de wedstrijd, die gewonnen is door bijvoorbeeld boxer A, krijgen alleen de 1000 ontvangers van de uitgekomen voorspelling een tweede brief. Ook hierin wordt weer een voorspelling gegeven voor een volgende wedstrijd, echter de helft van de brieven bevat een andere voorspelling dan de andere helft. Het principe wordt herhaald, 500 ontvangers van twee uitgekomen voorspellingen, krijgen weer een brief etc. Na 4 brieven krijgen de 250 boxliefhebbers die alleen goede voorspellingen hebben gekregen een aanbod op een abonnement van 1000,- euro per jaar op een blad met 100% goede boxwedstrijd voorspellingen. Bovenstaande methode is ook bekend bij beleggingsadviseurs. 2. Bij een dobbelspel wordt met een dobbelsteen 5 keer achter elkaar een 6 gegooid. Iemand voorspelt de volgende worp met Het wordt weer een 6 omdat er al 5 keer een 6 geworpen is.. Een ander persoon voorspelt Er is te vaak een 6 geworpen, de volgende worp is geen 6. Wie heeft er gelijk? Aan de hand van dit laatste voorbeeld kan men de volgende praktische regel concluderen: Het toeval kent geen geheugen. 2.2 De axiomatische kansrekening Deze kansrekening gaat uit van een aantal axioma s: 1. De uitkomstenruimte U (het universum ) is volledig. Dit betekent dat er altijd een elementaire gebeurtenis is: P(U) = 1 (2.3) 2. Elke samenstelling van elementaire gebeurtenissen is een deelverzameling van de uitkomstenruimte U. Voor elke samengestelde gebeurtenis A geldt voor de kans: A U 0 P(A) 1 (2.4) 16

3. Voor de samengestelde samengestelde gebeurtenissen A, B die geen gemeenschappelijke elementen bezitten ze zijn disjunct geldt: A B = /0 P(A B) = P(A) + P(B) (2.5) Rekenregels voor kansen 1. Dat er tijdens een kansexperiment geen uitkomst plaats vindt, is onmogelijk: Bewijs: P(/0) = 0 (2.6) P(A /0) = P(A) + P(/0) = P(A) 2. De kans dat een complementaire gebeurtenis A optreedt, is: Bewijs: P(A) = 1 P(A) (2.7) P(U) = P(A A) = P(A) + P(A) = 1 P(A) = 1 P(A) 3. De kans dat gebeurtenis A of B of allebei optreden is: Bewijs: P(A B) = P(A) + P(B) P(A B) (2.8) P(A) = P(A B) + P(A B) P(A B) = P(A) P(A B) 17

P(B) = P(A B) + P(A B) P(A B) = P(B) P(A B) Worden P(A B) en P(A B) in bovenstaande gelijkheden gesubstitueerd, dan: P(A B) = P((A B) (A B) (A B)) P(A B) = P(A B) + P(A B) + P(A B) P(A B) = P(A B) + P(A) P(A B) + P(B) P(A B) Uiteindelijk is bewezen dat: P(A B) = P(A) + P(B) P(A B) Voorbeeld 2.2 Uit een kaartspel trekt men blindelings een kaart. Wat is de kans op: 1. een aas: P(A) 2. een klaverenaas: P(K A) 3. een ruiten- of hartenkaart: P(R H) 4. iets dat geen aas is: P(A) 5. een klaverenkaart of aas: P(K A) Antwoord: 1. De kans op een aas is: 2. De kans op een klaverenaas is P(A) = n(a) n tot = 4 / 52 = 1 / 13 P(K A) = 3. De kans op een ruiten- of hartenkaart is: 4. De kans op iets dat geen aas is: n(k A) n tot = 1 / 52 P(R H) = P(R) + P(H) = 13 / 52 + 13 / 52 = 1 / 2 5. De kans op klaverenkaart of een aas is: P(A) = 1 P(A) = 1 1 / 13 = 12 / 13 P(K A) = P(K) + P(A) P(K A) = 1 / 4 + 1 / 13 1 / 52 = 4 / 13 18

2.3 Voorwaardelijke kansen Als A en B twee gebeurtenissen zijn dan wordt de kans op A, indien B bekend is, de conditionele kans genoemd. Men schrijft: P(A B) en men zegt de kans op A indien B bekend is. Waarin verschilt de kans P(A B) met de kans P(A B)? De kans P(A B) is de kans op de gebeurtenissen A en B nog voordat een van beide bekend is. Voorbeeld 2.3 Een bedrijf heeft 500 computers: 200 van het type A en 300 van het type B; 150 computers van type A en 100 computers van type B hebben een netwerkaansluiting N. Er is een willekeurige computer geselecteerd. Wat is de kans dat: deze computer van het type A is? Antwoord: P(A) = 200 / 500 = 2 / 5 ; deze computer een netwerkaansluiting heeft? Antwoord: P(N) = 250 / 500 = 1 / 2 ; deze computer van het type A en een netwerkaansluiting heeft? Antwoord: P(A N) = 150 / 500 = 3 / 10 ; deze computer een netwerkaansluiting heeft en van type A is? Antwoord: P(N A) = 150 / 500 = 3 / 10. Dit resultaat ligt de voor de hand: P(N A) = P(N A). Indien P(N) de kans op gebeurtenis N is in de totale uitkomstenruimte U (bijvoorbeeld het universum van alle 500 computers) dan is P(N A) de kans van N in de gereduceerde uitkomstenruimte A. Men noemt P(N) ookwel de absolute kans op N en P(N A) de de conditionele kans op N, gegeven A. Als bekend is dat de computer een netwerkaansluiting heeft. Wat is dan de kans dat dit een computer van het type A is? Antwoord: P(A N) = 150 / 250 = 3 / 5 ; Als bekend is dat de geselecteerd computer van het type A is. Wat is dan de kans dat deze een netwerkaansluiting heeft? Antwoord: P(N A) = 150 / 200 = 3 / 4. Uit de antwoorden blijkt dat P(A N) P(A N) en P(N A) P(A N). De formele definitie van Thomas Bayes (1702-1761) voor de conditionele kans luidt: P(A B) = P(A B) P(B) (2.9) 19

Voorbeeld 2.4 De kans op een computer van het type A indien gegeven is dat deze computer een netwerkaansluiting heeft: P(A N) = P(A N) P(N) = 3 / 10 1 / 2 = 3 / 5 Of de kans op een computer met een netwerkaansluiting indien gegeven is dat deze computer van het type A is: P(N A) = P(N A) P(A) = 3 / 10 2 / 5 = 3 / 4 Uit de definitie van de voorwaardelijke kans volgt de algemene produktregel van twee gebeurtenissen A en B: P(A B) = P(A B) P(B) (2.10) Deze regel is een aanvulling op de eerder behandelde axioma s en rekenregels voor kansen in paragraaf 2.2. 2.4 Onafhankelijke gebeurtenissen Een gebeurtenis A noemt men onafhankelijk van gebeurtenis B indien: P(A B) = P(A) (2.11) Indien twee gebeurtenissen onafhankelijk van elkaar zijn dan geldt: P(A B) = P(A) P(B) (2.12) Indien twee gebeurtenissen afhankelijk van elkaar zijn dan geldt alleen formule 2.10. Bij een ideale munt moet het scoren van een kop of munt onafhankelijk van elkaar zijn. Bij twee worpen van een zuivere munt moet gelden: P(K M) = P(K M)P(M) = P(K) P(M) = 1 / 4 P(K K) = P(K K)P(K) = P(K) P(K) = 1 / 4 P(M K) = P(M K)P(K) = P(M) P(K) = 1 / 4 P(M M) = P(M M)P(M) = P(M) P(M) = 1 / 4 20

Een munt waarbij de kans op kop ongelijk is aan de kans op munt noemt men onzuiver. Een munt waarbij de kans op kop beïnvloedt wordt door de een andere worp is een beïnloedbare munt. Men kan zich een munt of dobbelsteen indenken met een geheugen waarbij een worp beïnvloed wordt door een vorige worp. Zo n munt of dobbelsteen kan toch zuiver zijn. 2.5 De steekproef Bij een steekproef, moeten de geselecteerde elementen willekeurig en representatief zijn. Daarom is het goed om de elementen op een eerlijke manier door loting te selecteren. Zo n eerlijke steekproef noemt men een aselecte steekproef. Afhankelijk van de omvang van de steekproef en populatie kiest men voor een van de volgende methoden: 1. Elk element mag meer dan één keer geselecteerd worden. Dit noemt men een steekproef met teruglegging; 2. Elk element mag maar ten hoogste één keer geselecteerd worden. Dit noemt men een steekproef zonder teruglegging. Indien de populatie-omvang zeer groot is ten opzichte van de steekproefomvang, beschouwt men deze steekproef zonder teruglegging eigenlijk als een steekproef met teruglegging. 2.6 Steekproeven met- en zonder volgorde Om iets over dit onderwerp te vertellen zijn er twee nieuwe notatiewijzen nodig: 1. De notatie P(AB) betekent: De kans op gebeurtenis A gevolgd door gebeurtenis B. Deze kans is niet altijd het zelfde als de kans zonder volgorde op de gebeurtenis A en B wat symbolisch geschreven wordt als P(A B). Bijvoorbeeld bij het werpen van twee munten geldt: P(K M) = P(KM) + P(MK) P(MK) en P(KM) zijn de kansen op de gebeurtenissen MK en KM alsof één munt twee keer wordt geworpen; P(K M) is de kans op de combinatie munt en kop alsof twee munten gelijktijdig worden geworpen. Deze kans is natuurlijk gelijk aan de kans P(M K). 2. De notatie P(a = n,b = n) betekent de kans op n keer de gebeurtenis A en m keer de gebeurtenis B, zonder te letten op de volgorde van de gebeurtenissen. Men introduceert met een kleine onderstreepte letter een nieuw type variabele. Deze numerieke variabele, wordt een stochastische variabele of kansvariabele genoemd. 21

Voorbeeld 2.5 Gegeven een vaas met 4 rode en 6 witte ballen. Bereken de kans op 2 rode ballen gevolgd door 1 witte bal bij 3 aselecte trekkingen. Met teruglegging wordt deze kans: P(RRW) = P(R) P(R R) P(W RR) P(RRW) = P(R) P(R R) P(W RR) = 4 / 10 4/ 10 6/ 10 = 12 / 125 Bij de trekkingen met teruglegging zijn de kansen onafhankelijk van de voorgeschiedenis: P(R...) = P(R) Daarentegen zijn de kansen bij trekkingen zonder teruglegging: P(RRW) = P(R) P(R R) P(W RR) = 4 / 10 3/ 9 6/ 8 = 1 / 10 wel afhankelijk van de voorgeschiedenis: P(R...) P(R) Men kan zich afvragen of de kansen afhankelijk zijn van de volgorde. Als voorbeeld trekt men 2 rode ballen en 1 witte bal uit de vaas met 4 rode- en 6 witte ballen: Toon aan dat met teruglegging geldt: P(RRW) = P(RW R) = P(W RR) 4 / 10 4/ 10 6/ 10 = 4 / 10 6/ 10 4/ 10 = 6 / 10 4/ 10 4/ 10 = 12 / 125 Toon aan dat zonder teruglegging geldt: P(RRW) = P(RW R) = P(W RR) Antwoord: 4 / 10 3/ 9 6/ 8 = 4 / 10 6/ 9 3/ 8 = 6 / 10 4/ 9 3/ 8 = 1 / 10 Hieruit blijkt dat de kansen P(RRW), P(RWR) en P(WRR) onafhankelijk zijn van de volgorde. De kansen zijn wel afhankelijk van het feit of er met- of zonder teruglegging getrokken wordt. Indien de kans op 2 rode en 1 witte bal ongeacht volgorde wordt berekend, dan moet men de kans P(RRW) vermenigvuldigen met het aantal permutaties van het woord RRW: P(r = 2,w = 1) = perm(rrw) P(RRW) = 3! / 2! P(RRW) 22

Voorbeeld 2.6 Gegeven een vaas met 4 rode en 6 witte ballen. Men neemt een aselecte steekproef van 5 ballen. De kans op: 3 rode ballen gevolgd door 2 witte ballen, met teruglegging, is: P(RRRWW) = 4 / 10 4 / 10 4 / 10 6 / 10 6 / 10 = 72 / 3125 3 rode ballen en 2 witte ballen, zonder volgorde maar met teruglegging is: P(r = 3,w = 2) = perm(rrrww) P(RRRWW) = 5! / 3!2! 72 / 3125 = 144 / 625 3 rode ballen gevolgd door 2 witte ballen, zonder teruglegging: P(RRRWW) = 4 / 10 3 / 9 2 / 8 6 / 7 5 / 6 = 1 / 42 3 rode en 2 witte ballen, zonder te letten op volgorde en zonder teruglegging: P(r = 3,w = 2) = perm(rrrww)p(rrrww) = 5! 1 / 42 = 5 / 21 3!2! Men is nu in staat de algemene formule voor steekproeven, ongeacht de methode van teruglegging, te formuleren: P(a = a,...,z = z) = perm(a...a } {{ }...Z}...Z {{ }) P(A...A } {{ }...Z}...Z {{ }) (2.13) a z a z De hypergeometrische verdeling Gegeven een verzameling met R rode elementen, W witte en B blauwe elementen. Deze verzameling bestaat dus uit N = R + W + B elementen. Uit deze eindige verzameling wordt een steekproef genomen zonder teruglegging. De steekproefomvang is relatief groot ten opzichte van de populatie-omvang. Wat is de kans P(r = r,w = w,b = b)? Antwoord: P(r = r,w = w,b = b) = ( R )( W )( B r w ( b) N ) w+r+b In zijn algemene vorm is deze verdeling geschikt voor een steekproef zonder teruglegging uit een eindige populatie met N = A + B + + Z elementen: 23

P(a = a,b = b,...z = z) = ( A )( B ) ( Z a b ( z) N ) (2.14) a+b+ +b Formule 2.14 wordt de algemene hypergeometrische verdeling genoemd. Zij is alleen geldig bij steekproeven zonder teruglegging. Het is lastig maar niet onmogelijk om formule 2.14 voor de algemene hypergeometrische verdeling uit formule 2.13 af te leiden. Voorbeeld 2.7 Gegeven een vaas met 6 witte, 4 rode en 2 blauwe ballen. Wat is de kans op 2 rode, 1 witte en 1 blauwe bal als men blindelings 4 ballen zonder teruglegging trekt? Antwoord: P(r = r,w = w,b = b) = ( 4 )( 6 )( 2 2 1 ( 1) 12 ) 4 Uit een vaas met totaal N ballen waarvan K ballen met de kleur K en N K ballen met andere kleuren, wordt een steekproef met teruglegging genomen van n ballen. Wat is de kans dat k ballen van de n getrokken ballen de kleur K hebben? Antwoord: Als k van de n ballen de kleur K hebben, dan hebben automatisch de andere n k ballen een andere kleur K. ( K N K ) P(k = k) = k)( n k ( N (2.15) n) Formule 2.15 is bijzonder geval van formule 2.14, zij wordt de hypergeometrische verdeling genoemd. De Multinomiale verdeling Gegeven een verzameling met R rode, W witte en B blauwe elementen. De totale verzameling bestaat dus uit: N = R +W + B elementen. Wat is de kans P(r = r,w = w,b = b) bij een steekproef met teruglegging? Antwoord: P(r = r,w = w,b = b) = perm(r...r } {{ } W }...W {{ } B...B } {{ }) P(R...R } {{ } W }...W {{ } B...B } {{ }) r w b r w b 24

Bij een steekproef met teruglegging uit een verzameling met A elementen, B elementen B,... en Z elementen Z, is de kans: P(a = a,b = b,...,z = z) = (a + b +... + z)! a! b! z! Dit wordt de multinomiale verdeling genoemd. ( ) A a ( ) B b ( ) Z z (2.16) N N N Voorbeeld 2.8 Gegeven een vaas met 6 witte, 4 rode en 2 blauwe ballen. Wat is de kans op 2 rode, 1 witte en 1 blauwe bal als men blindelings 4 ballen met teruglegging trekt? Antwoord: P(r = 2,w = 1,b = 1) = De Binomiale verdeling (1 + 2 + 1)! 1! 2! 1! ( 4 / 12 ) 2 6 / 12 2 / 12 = 12 / 36 Uit een vaas met totaal N ballen waarvan K ballen met de kleur K en N K ballen met andere kleuren, wordt een steekproef met teruglegging genomen van n ballen. Wat is de kans dat k ballen van de n getrokken ballen de kleur K hebben? Antwoord: Als k van de n ballen de kleur K hebben, dan hebben automatisch de andere n k ballen een andere kleur K. Als P(K) = K / N = p en P( K) = N K / N = 1 p dan volgt: P(k = k) = ( ) n p k (1 p) n k (2.17) k Formule 2.17, de kans op een bepaalde kleur waarbij alle andere kleuren op één hoop gegooid worden, wordt de binomiale verdeling genoemd. De binomiale verdeling is een bijzonder geval van de multinomiale verdeling. Voorbeeld 2.9 Van een magnetische schijf zijn 80% van de sectoren onbezet. Een willekeurige groep van 20 sectoren wordt geselecteerd voor opslag de opslag van een bestand. Wat is de kans dat 15 van de 20 geselecteerde sectoren onbezet zijn? Men mag aannemen dat de populatie-omvang zeer groot is ten opzichte van de steekproefomvang. Antwoord: P(k = 15) = ( ) 20 0,8 15 0,2 5 = 0,175 15 Wat is de kans dat er 16 of meer van de 20 geselecteerde sectoren onbezet zijn? 25

Antwoord: P(k 16) = P(k = 16) + P(k = 17) + + P(k = 20) = 0,5886 Wat is de kans dat er minder dan 16 van de 20 geselecteerde sectoren onbezet zijn? Antwoord: P(k < 16) = P(k = 0) + P(k = 1) + + P(k = 15) = 1 P(k 16) = 0,4114 2.7 De algemene produktregel Indien informatie over de uitkomstenruimte beschikbaar komt, verandert de kans op een gebeurtenis: Voorbeeld 2.10 Bij een zuivere dobbelsteen heeft elk vlak een even grote kans P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1 / 6. Als bekend wordt gemaakt een worp een even aantal ogen heeft dan veranderen kansen van de even ogen P(1 even), P(3 even) en P(5 even) in 0 en P(2 even), P(4 even) en P(6 even) in 1 / 3. Omdat de uitkomstenruimte door het gegeven van een even worp met de helft gereduceerd is, worden de kansen op een 2, 4 of 6 twee keer zo groot. Als P(A B) en P(B) bekend zijn, kan men P(A B) berekenen: P(A B) = Hieruit volgt de algemene produktregel: P(A B) P(B) P(A B) = P(A B) P(B) (2.18) 2.8 De omkeerregels van Bayes Uit de algemene produktregel: volgt: P(A B) = P(A B) P(B) 26

daaruit volgt de omkeerregel van Bayes: P(A B)P(B) = P(A B) = P(B A)P(A) P(A B) = P(B A) P(A) P(B) (2.19) Als de verzamelingen A i (i = 1,2,...,n) disjunct en volledig zijn, er treden alleen en geen andere gebeurtenissen dan het type A i op, dan noemt men deze verzamelingen een partitie van de uitkomstenruimte. De omkeerformule van Bayes krijgt bij een partitionering van de uitkomstenruimte zijn algemene vorm voor de kans A k k {1,2,...,n}: P(A k B) = P(B A k) P(A k ) P(B A i ) P(A i ) i=1...n (2.20) Voorbeeld 2.11 Een productieproces levert artikelen met 90% goede kwaliteit en 10% foute kwaliteit: P(G) = 0, 9 en P(F) = 0, 1. Deze artikelen worden op kwaliteit bewaakt door een controlesysteem dat de artikelen accepteert A of ongeschikt verklaart O. Dit controlesysteem heeft volgende eigenschappen: A: acceptabel O: ongeschikt G: goed 95% 5% F: slecht 8% 92% Uit de bovenstaande tabel kan men het volgende vaststellen: P(A G) = 0,95 P(O G) = 0,05 P(A F) = 0,08 P(O F) = 0,92 Wat is de kans dat een ongeschikt verklaard artikel echt fout is? Antwoord: P(F O) = P(O F) P(F) P(O F) P(F) + P(O G) P(G) = 0,92 0,1 0,92 0,1 + 0,05 0,9 = 0,67 27

Hoofdstuk 3 Kansvariabelen Definitie: Een kansvariabele, ookwel variabele of stochast genoemd, is een functie die de uitkomsten van een kansexperiment afbeeldt op numerieke waarden met een interval- of ratioschaal. Als men bijvoorbeeld bij een kansexperiment van het trekken van 4 kaarten uit een spel met 52 kaarten, de kans op het aantal wil aangeven, dan kan men geen gebruik maken van tekentjes zoals of. Men kan met dit soort symbolen moeilijk rekenen. Men introduceert daarom voor het trekken van het aantal in een steekproef van vier kaarten de discrete kansvariabele k. Natuurlijk mag voor de onderstreepte letter k elke andere letter gekozen worden. Er zijn twee belangrijke soorten kansvariabelen, de discrete variabelen en de continue variabelen. In het algemeen geldt dat een discrete waarde geteld en continue waarde gemeten wordt. Continue variabelen kunnen met een oneindig hoge nauwkeurigheid opgegeven worden. Het onderscheid tussen een discrete en continue variabele vervaagt echter als de discrete variabele met een relatief hoge nauwkeurigheid wordt aangeven. Als het jaarinkomen in centen nauwkeurig wordt opgegeven, dan is er sprake van een discrete variabele. Door de hoge nauwkeurigheid mag deze variabele bijna als continue variabele beschouwd worden. De correctie die men moet toepassen op de klassegrenzen (± 1 / 2 cent) is verwaarloosbaar. Daarentegen, als het jaarinkomen in aantallen van duizend euro wordt opgegeven, dan mag men de correctie van de klassegrenzen (±500 euro) niet verwaarlozen. Het is gebruikelijk om discrete kansvariabelen aan te geven met vette letters, hoofdletters of onderstreepte kleine letters k, l, m of K, L en M of k, l, m. Continue kansvariabelen worden vaak aangegeven met vette letters, hoofdletters of onderstreepte kleine letters x, y, z of X, Y en Z of x, y, z. De continue kansvariabele t wordt vaak gereserveerd voor een kansvariabele met een tijdswaarde zoals de levensduur of de intervaltijd. 28

3.1 Discrete kansvariabelen Als een variabele maar een beperkt aantal waarden aan kan nemen zoals het aantal kinderen per gezin dan kan men voor zo n discrete variabele een kansfunctie f k (k) = P(k = k) en een verdelingsfunctie F k (k) = P(k k) definiëren. Als er geen verwarring ontstaat, mag men voor f k (k) en F k (k) ook respectievelijk f (k) en F(k) schrijven. De kansfunctie Definitie van de kansfunctie f (k) van de discrete kansvariabele k is de kans P(k = k), de kans dat een kansvariabele k gelijk is aan een bepaalde waarde k: f (k) = P(k = k) (3.1) Voorbeeld: Men gooit met twee muntstukken. Men definieert de kansvariabele k als het aantal koppen per worp. De volgende tabel geeft de gebeurtenis, de bijbehorende elementaire waarschijnlijkheden en de waarden van de kansvariabele k aan: Gebeurtenis waarschijnlijkheid k MM 1 / 4 0 MK 1 / 4 1 KM 1 / 4 1 KK 1 / 4 2 Uit deze tabel volgt het domein K van k: {0,1,2}. Men kan een tabel maken voor k: De grafiek van f (k): k f (k) 0 1 / 4 1 1 / 2 2 1 / 4 29

0,60 f (k) 0,50 0,40 0,30 0,20 0,10 3 2 1 2 2 1 1 2 1 1 2 0 1 2 1 1 1 2 2 2 1 2 3 Eigenschappen van f (k): De kansfunctie van de discrete variabele k k / K f (k) = 0 De som van alle kansen is: f (k) = f (k) = 1 k k K De verdelingsfunctie Definitie van de verdelingsfunctie F(k) van de discrete kansvariabele k is de kans P(k k), de kans dat de kansvariabele k kleiner of gelijk is aan een bepaalde waarde k: F(k) = P(k k) = P(k = i) = f (i) (3.2) i k i k Voorbeeld 3.1 Men gooit met twee muntstukken. Men definieert de kansvariabele k als het aantal koppen per worp. De waarden van de discrete verdelingsfunctie F(k) staan in de volgende tabel: k f (k) F(k) 0 1 / 4 1 / 4 1 1 / 2 3 / 4 2 1 / 4 1 30

De grafiek van F(k) 1,00 F(k) 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 3 2 1 2 2 1 1 2 1 1 2 0 1 2 1 1 1 2 2 2 1 2 3 De discrete verdelingsfunctie F(k) Eigenschappen van de verdelingsfunctie F(k): k 1 < k 2 F(k 1 ) F(k 2 ) (monotoon stijgend) lim k F(k) = 0 lim k F(k) = 1 De overschrijdingskans De overschrijdingskans R(k) = P(k > k) is de kans dat een kansvariabele k groter wordt dan een bepaalde waarde k. 31

Men kan R(k) ook uitdrukken in F(k): R(k) = P(k > k) = P(k = i) = f (i) (3.3) i>k i>k R(k) = P(k > k) = 1 P(k k) = 1 F(k) (3.4) De overschrijdingskans R(k) wordt veel gebruikt in de bedrijfszekerheidstheorie. Bovendien bevatten statistiekboeken vaak tabellen waarin de overschrijdingskansen zijn aangegeven. Eigenschappen van R(k): k 1 < k 2 R(k 1 ) R(k 2 ) (monotoon dalend) lim k R(k) = 1 lim k R(k) = 0 De verwachtingswaarde Als voorbeeld neemt men de uitkomsten van een bepaald kansexperiment: [2,3,2,5,3,2] Het gemiddelde 17 / 6 is de som gedeeld door het aantal. Het gemiddelde is ook op een andere manier te vinden. In de eerste kolom van een tabel plaatst men gesorteerd het getal k = k, vervolgens de absolute frequentie, de relatieve frequentie f k (k) en het product tussen de waarde k van de kansvariabele k en zijn relatieve frequentie: k f k (k). k = k aantal f k (k) k f k (k) 2 3 3 / 6 6 / 6 3 2 2 / 6 6 / 6 5 1 1 / 6 5 / 6 17 / 6 Op deze omslachtige manier wordt het verband tussen k f k (k) en het rekenkundig gemiddelde aangegeven. 32

De verwachtingswaarde van een discrete kansvariabele k is de som van alle mogelijke uitkomsten maal de kans op de betreffende uitkomst: E(k) = (k P(k = k)) = k f (k) (3.5) k k Voorbeeld 3.2 Men gooit met twee muntstukken. Men definieert de kansvariabele k als het aantal koppen per worp. Wat is de verwachtingswaarde van het aantal koppen? Antwoord: k f (k) k f (k) 0 1 / 4 0 1 1 / 2 1 / 2 2 1 / 4 1 / 2 1 De verwachtingswaarde van het aantal koppen is E(k) = k f (k) = 1. Het rekenkundige gemiddelde van een kansvariabele k wordt gedefinieerd als de verwachtingswaarde van de kansvariabele k: µ k = E(k) (3.6) Later zal blijken dat het begrip verwachtingswaarde meer omvattend is dan het begrip rekenkundig gemiddelde. Men moet de verwachtingswaarde meer zien als een parameter dat afhankelijk is van een functie f () en een functie g(): De variantie E(g(k)) = g(k) f (k) (3.7) k De variantie van een variabele k is de verwachtingswaarde van de kwadratische afwijkingen. Men neemt de verwachtingswaarde van de kwadratische afwijkingen in plaats van de verwachtingswaarde van de normale afwijkingen omdat de negatieve afwijkingen de positieve afwijkingen kunnen compenseren. Er lijkt dan geen variantie te bestaan die er wel degelijk is. Var(k) = E((k E(k)) 2 ) = k 33 f (k) (k E(k)) 2 (3.8)

Voorbeeld 3.3 Men gooit met twee muntstukken. Men definieert de kansvariabele k als het aantal koppen per worp. Wat is de variantie van het aantal koppen? Antwoord: E(k) = 1 k f (k) f (k) (k E(k)) 2 0 1 / 4 1 / 4 1 1 / 2 0 2 1 / 4 1 / 4 1 / 2 De variantie Var(k) van het aantal koppen k is: f (k)(k E(k) 2 = 1 / 2. 3.2 Continue kansvariabelen De kans dat iemand een lengte heeft van exact 175,6712 cm niet waarschijnlijk omdat de gevraagde klasse een zeer smal interval heeft. Dit interval loopt van 175, 67115 175, 67125 cm. Bij continue kansvariabelen kan men geen kansfunctie definiëren omdat de kans P(x = x) altijd 0 is. Men moet gebruik maken van de kansdichtheidsfunctie f x (x). Dit is een functie die de kansen op uitkomsten binnen intervallen vastlegt. De integraalrekening geeft een elegante koppeling tussen de kansdichtheidsfunctie f x (x) en de verdelingsfunctie F x (x). Als er geen verwarring ontstaat, mag men voor f x (x) en F x (x) respectievelijk f (x) en F(x) schrijven. De kansdichtheidsfunctie Bij continue kansvariabelen kan men de kans op een uitkomst in een willekeurig smal interval bepalen. Men maakt daarom bij continue kansvariabelen gebruik van een kansdichtheidsfunctie f (x), de van de kans op een uitkomst in een zeer klein interval [x,x + x]: f (x) P(x x + x) P(x x) x (3.9) Als men de kans wil bepalen op een uitkomst in het interval [a,b] dan neemt men de integraal over de kansdichtheidsfunctie: P(a x b) = Z b a f (x)dx (3.10) Dit is het niet-gearceerde oppervlakte tussen de grenzen x = a en x = b: 34

x = a x = b In tegenstelling tot de kansfunctie, maken de inclusieve grens of de exclusieve grens geen verschil uit bij de kansdichtheidsfunctie: P(a x b) = P(a x < b) = P(a < x b) = P(a < x < b) = b R a f (x)dx (3.11) Enkele belangrijke eigenschappen van de kansdichtheidsfunctie f (x) zijn: 0 f (x) R f (x)dx = 1 De verdelingsfunctie De definitie van de verdelingsfunctie F(k) van de continue kansvariabele x is de kans dat een kansvariabele x kleiner of gelijk is aan een bepaalde waarde x: F(x) = P(x x) (3.12) De kans F(x) = P(x x) is de bepaalde integraal over de kansdichtheidsfunctie: F(x) = P(x x) = P( x x) = Z x f (τ)dτ (3.13) 35

(τ is een willekeurige integratievariabele). Hieruit volgt dat: P(a < x b) = Z b a Men kan zeggen dat f (x) de afgeleide is van F(x): f (x)dx = F(b) F(a) (3.14) In de grafiek zijn f(x) en F(x) aangegeven: f (x) = df(x) dx (3.15) 1,0 F(x) 0,5 f (x) x De eigenschappen van de verdelingsfunctie F(x) zijn hetzelfde als die van de discrete verdelingsfunctie F(k): x 1 < x 2 F(x 1 ) F(x 2 ) (monotoon stijgend) lim k F(x) = 0 lim k F(x) = 1 36

Een belangrijke formule voor het berekenen van x p = p de percentiel (de waarnemingswaarde waar p% waarnemingswaarden gelijk of kleiner aan zijn) is de percentielvergelijking. Uit deze vergelijking moet de p de percentielwaarde x p opgelost worden: F(x p ) = p 100 (3.16) Deze vergelijking is geldig voor discrete- en continue kansvariabelen. De overschrijdingskans De overschrijdingskans P(x > x) is gedefinieerd als R(x), de kans dat de kansvariabele x groter wordt dan een bepaalde waarde x. Dit begrip speelt een belangrijke rol in de bedrijfszekerheidtheorie. Soms wordt alleen de overschrijdingskanstabel gegeven. Uit de kans P(x > x) = 1 P(x x) volgt dat R(x) = 1 F(x). Hieruit volgt: P(a x b) = Z b a f (x)dx = R(a) R(b) (3.17) De eigenschappen van de verdelingsfunctie R(x) zijn hetzelfde als die van de discrete verdelingsfunctie R(k): x 1 < x 2 R(x 1 ) R(x 2 ) (monotoon dalend) lim k R(x) = 1 lim k R(x) = 0 De verwachtingswaarde De verwachtingswaarde van een continue kansvariabele heeft de volgende definitie: E(x) = Z x f (x)dx (3.18) 37

De variantie De variantie van een continue kansvariabele heeft de volgende definitie: 3.3 De E algebra Var(x) = Z (x E(x)) 2 f (x)dx (3.19) De E algebra is een verzameling rekenregels met de operatoren E en Var. Deze algebra kan gebruikt worden voor discrete- en continue kansvariabelen. Deze gemeenschappelijke toepassing van de E algebra is een erfenis van de twee formules voor de verwachtingswaarde: 1. De formule voor de discrete verwachtingswaarde: E(k) = k f (k) k 2. De formule voor de continue verwachtingswaarde: E(x) = Z x f (x)dx De volgende eigenschappen zijn gemeenschappelijk voor de discrete- als de continue verwachtingswaarde: 1. De verwachtingswaarde van een constante waarde: E(α) Discreet: Continue: E(α) = α f (v) = α f (v) = α v v E(α) = Z α f (v)dv = α Z f (v)dv = α 38

2. De verwachtingswaarde van een kansvariabele vermenigvuldigd met een constante: E(α v) Discreet: Continue: E(α v) = v E(α v) = Z α v f (v) = α v f (v) = α E(v) v Z α v f (v)dv = α v f (v)dv = α E(v) Met bovenstaande resultaten kan men een verzameling rekenregels voor de E-operator opstellen: 1. E(α) = α (dit volgt uit de definitie); 2. E(α v) = α E(v) (dit volgt uit de definitie); 3. E(α v + β v) = α E(v) + β E(v) (dit volgt uit regel 2); 4. E(v + α) = E(v) + α (dit volgt uit regel 3). De variantie Var(v) kan men met de E-operator definiëren voor discrete- en continue kansvariabelen: Var(v) = E((v E(v)) 2 ) Met behulp van de E algebra kan men voor de variantie Var(v) de volgende regels opstellen: 1. Var(v) = E(v 2 ) E(v) 2 2. Var(α v) = α 2 Var(v) 3. Var(v + α) = Var(v) 1. Bewijs voor regel 1: Var(v) = E((v E(v)) 2 ) = E(v 2 2.v.E(v) + E(v) 2 ) = E(v 2 ) E(2.v.E(v)) + E(E(v) 2 ) = E(v 2 ) 2.E(v).E(v) + E(v) 2 = E(v 2 ) 2.E(v) 2 + E(v) 2 = E(v 2 ) E(v) 2 39

2. Bewijs voor regel 2: Var(α.v) = E(α 2.v 2 ) E(α.v) 2 = α 2.E(v 2 ) α 2.E(v) 2 = α 2 (E(v 2 ) E(v) 2 ) = α 2.Var(v) 3. Bewijs voor regel 3: Var(v + α) = E((v + α) 2 ) E(v + α) 2 = E(v 2 + α.v + α 2 ) (E(v) + α) 2 = E(v 2 ) + α.e(v) + α 2 E(v) 2 α.e(v) α 2 = E(v 2 ) E(v) 2 = Var(v) Een bijzondere vorm van verwachting is de verwachtingswaarde van een functie h : R (, ) over de kansvariabele v: of in continue vorm: E(h(v)) = h(v) P(v = v) (3.20) v E(h(v)) = Z h(v). f (v).dv (3.21) Voorbeeld 3.4 Jan betaalt aan Piet 3 1 / 3 euro om mee te mogen doen aan een spel dat Piet verzonnen heeft. Jan mag twee muntstukken werpen. Piet betaalt een bedrag in euros uit aan Jan dat gelijk is aan twee maal het aantal koppen in het kwadraat h(k) = 2k 2. Is het regelmatig spelen van dit spel voor Jan winstgevend? k f (k) 2 k 2 f (k) 0 1 / 4 0 1 1 / 2 2 / 2 2 1 / 4 8 / 4 3 De verwachtingswaarde van een worp met twee munten is 3 euro. Jan heeft 3,5 euro ingezet in een spel met een verwachtingswaarde van 3 euro. Dit is een ongunstige investering voor Jan. 40

3.4 Onafhankelijke variabelen Treden twee gebeurtenissen op dan is de kans op de samengestelde gebeurtenis A B als volgt gedefinieerd: P(A B) = P(A B) P(B) of in de notatie met kansvariabelen: P(k = k m = m) = P(k = k m = m) P(m = m) of in de notatie van de samengestelde kansfunctie: f (k,m) = f (k m) f m (m) (3.22) Indien de twee kansvariabelen onafhankelijk zijn dan geldt per definitie: P(k = k m = m) = P(k = k) P(m = m) (3.23) of anders geschreven: f (k,m) = f k (k) f m (m) (3.24) Voorbeeld 3.5 Het gelijktijdig werpen van 2 munten waarbij k het aantal keer kop per worp is en m het aantal munten per worp. De volgenden tabel geeft de combinatie P(k = k m = m): m = 0 m = 1 k = 0 P(k = 0 m = 0) = 1 / 4 P(k = 0 m = 1) = 1 / 4 P(k = 0) = 1 / 2 k = 1 P(k = 1 m = 0) = 1 / 4 P(k = 1 m = 1) = 1 / 4 P(k = 1) = 1 / 2 P(m = 0) = 1 / 2 P(m = 1) = 1 / 2 = 1 Gebruikt men de samengestelde kansfunctie f (k,m) dan wordt de tabel: f (k,m) m = 0 m = 1 f k (k) k = 0 1 / 4 1 / 4 1 / 2 k = 1 1 / 4 1 / 4 1 / 2 f m (m) 1 / 2 1 / 2 1 41

Indien kansen onafhankelijk van elkaar zijn, geldt: f (k,m) = P(k = k,m = m) = 1 / 4 Opmerkingen: De som van alle kansen: f (k,m) = 1 k m De som van een rij (k = j): f ( j,m) = f k ( j) m De som van een kolom (m = i): f (k,i) = f m (i) k De som van alle kansen: f k (k) = 1 k De som van alle kansen: f m (m) = 1 m Men noemt f k (k) en f m (m) de marginale kans van de samengestelde kansfunctie f (k,m) 3.5 Afhankelijke variabelen Als twee kansvariabelen afhankelijk van elkaar zijn, geldt: Deze formule geldt ook voor continue variabelen: f (k,m) = f k (k) f m (m) (3.25) f (x,y) = f x (x) f y (y) (3.26) f (x,y) f y (y) y f x (x) x 42

De samengestelde kansdichtheidsfunctie f (x, y) van twee onafhankelijke variabelen x en y is het product van de twee marginale kansdichtheidsfuncties f x (x) en f y (y). Het tekenen van een samengestelde kansdichtheidsfunctie van twee variabele in een grafiek is erg lastig. Daarom wordt zo n kansdichtheidsfunctie soms weergegeven in een scatterdiagram. Het aantal punten per oppervlakte-eenheid in een scatterdiagram is evenredig met de waarde van f (x,y) voor dat gebied: y x Voorbeeld 3.6 De dagelijks geconsumeerde hoeveelheid calorieën k en het lichaamsgewicht m is uitgezet in de volgende tabel: f (k,m) k = 1500 k = 2000 k = 2500 f m (m m = 60 0,105 0,14 0,105 0,35 m = 70 0,105 0,14 0,105 0,35 m = 80 0,09 0,12 0,09 0,30 f k (k) 0,30 0,40 0,30 1,00 In de vorige tabel zijn de variabelen onafhankelijk van elkaar: f (k,m) = f k (k) f m (m) f (k,m) k = 1500 k = 2000 k = 2500 f m (m m = 60 0,20 0,10 0,05 0,35 m = 70 0,05 0,20 0,10 0,35 m = 80 0,05 0,10 0,15 0,30 f k (k) 0,30 0,40 0,30 1,00 In de laatste tabel zijn de variabelen afhankelijk van elkaar: f (k,m) f k (k) f m (m). 43