Overzicht Theorie Kansrekening

Maat: px
Weergave met pagina beginnen:

Download "Overzicht Theorie Kansrekening"

Transcriptie

1 Overzicht Theorie Kansrekening 7N5p 2013 GGHM

2 Inhoud 1 Kansrekening Uitkomst en uitkomstenruimte Complement Doorsnede Vereniging Kans en kansexperiment Kansdefinitie Kansexperimenten Kansvariabelen Intuïtieve kansmodel Frequentistisch kansmodel Kansregels Somregel Complementaire kansen Algemene somregel Productregels Voorwaardelijke kans Simultane en voorwaardelijke kansen Algemene productregel Productregel voor onafhankelijke... 9 gebeurtenissen Onafhankelijkheid Regel van Bayes Afleiding van de regel van Bayes Betekenis van Bayes regel Kansverdelingen Empirische kansverdelingen Theoretische kansverdelingen Kansverdeling als model Overschrijdingskansen Verwachtingswaarden Discrete kansverdelingen Overschrijdingskansen van discrete verdelingen Binomiale verdeling Binomiaalcoëfficiënt Overschrijdingskansen v/d binomiale verdeling van de binomiale verdeling Parameters van de binomiale verdeling Verwachtingen v/d binomiale verdeling Hypergeometrische verdeling Overschrijdingskansen v/d hypergeometrische verdeling Verwachtingen v/d hypergeometrische verdeling Poisson verdeling Overschrijdingskansen v/d Poissonverdeling v/d Poisson verdeling Parameters v/d Poisson verdeling Verwachtingen v/d Poisson verdeling Continue kansverdelingen Kansdichtheid Overschrijdingskansen van continue verdelingen Normale verdeling Overschrijdingskansen v/d normale verdeling Standaard normale verdeling Normale benadering van discrete verdelingen Continuïteitscorrectie

3 1 KANSREKENING De theorie van de kansrekening definieert een aantal begrippen, zoals uitkomst, uitkomstenruimte, kans en kansexperiment, en leidt regels af die voorschrijven hoe met kansen kan worden gerekend. De kansrekening is net als de Euclidische meetkunde een wiskundige theorie en heeft evenals deze belangrijke praktische toepassingen. Uitgangspunt is het concept van het kansexperiment. Een kansexperiment is een experiment, waarvan de uitkomst niet exact voorspelbaar is, maar waarbij de verschillende mogelijke uitkomsten met een bepaalde waarschijnlijkheid of kans optreden. Veel reële, maar gecompliceerde situaties worden beter begrepen en meer beheersbaar als we ze met modellen uit de kansrekening analyseren. Een 'meltdown' van een kernreactor is het gevolg van de samenloop van een groot aantal onwaarschijnlijke, maar niet uit te sluiten gebeurtenissen. Door van die gebeurtenissen de onderlinge samenhang en de kans dat zij optreden in kaart te brengen, kunnen we niet alleen de uiteindelijke kans op een 'meltdown' uitrekenen, maar vooral ook beïnvloeden door bijvoorbeeld de meest kritische van de gebeurtenissen te manipuleren. Deze zg. risico-analyse is daarom een onmisbaar beleidsinstrument voor overheid en bedrijfsleven. 1.1 Uitkomst en uitkomstenruimte De verzameling van alle mogelijke uitkomsten van een kansexperiment wordt uitkomstenruimte genoemd. De uitkomstenruimte wordt aangeduid met de Griekse hoofdletter omega, Ω. Een deelverzameling van de uitkomstenruimte wordt aangeduid met gebeurtenis. Het werpen van een dobbelsteen is een voorbeeld van een kansexperiment. De uitkomstenruimte van dit experiment bestaat uit de verzameling van alle mogelijke uitkomsten, dus Ω = {1, 2, 3, 4, 5, 6}. Een voorbeeld van een gebeurtenis is het gooien van 5 of meer ogen, dus de deelverzameling {5, 6}. Het complement van een gebeurtenis, evenals de doorsnede en de vereniging van twee gebeurtenissen, kunnen gedefinieerd worden met behulp van begrippen uit de verzamelingenleer Complement Het complement van een gebeurtenis is de deelverzameling van de uitkomsten, die niet tot die gebeurtenis behoren. Het complement van A (notatie: A ) bevat juist die elementen die niet to A behoren. A wordt ook wel als "niet A" uitgesproken. Twee complementaire gebeurtenissen vormen samen de gehele uitkomstenruimte van het kansexperiment: Ω = A A Het complement van de gebeurtenis 'het gooien van 5 of meer ogen' is dus 'het gooien van 4 of minder ogen'. Dit is de deelverzameling {1, 2, 3, 4}. Hier is A = {5, 6} en A = {1, 2, 3, 4}. 3

4 1.1.2 Doorsnede De doorsnede van twee gebeurtenissen bevat die uitkomsten, die tot beide gebeurtenissen behoren. De doorsnede van de gebeurtenissen A en B wordt aangeduid met A B, uitgesproken als A én B. De doorsnede van de gebeurtenissen 'het gooien van 5 of meer ogen' en 'het gooien van 5 of minder ogen' is '5 ogen'. Als twee gebeurtenissen elkaar uitsluiten, dat wil zeggen geen enkele uitkomst gemeenschappelijk hebben, worden zij disjunct genoemd. We zeggen, dat hun doorsnede leeg is en geven dat aan met: A B =. Het symbool duidt een lege verzameling aan. Complementaire gebeurtenissen zijn per definitie disjunct. De doorsnede van de gebeurtenissen 'het gooien van 5 of meer ogen' en 'het gooien van minder dan 5 ogen' is leeg. De gebeurtenissen zijn dus disjunct. A ={5, 6} en B = {1, 2, 3, 4} zijn disjunct, omdat A B =. Dat wil zeggen, dat geen enkele uitkomst tot zowel A als B behoort Vereniging De vereniging van twee gebeurtenissen, bevat alle uitkomsten, die tot één van beide gebeurtenissen of tot beide behoren. De vereniging van de gebeurtenissen A en B wordt aangeduid met A B, uitgesproken als A of B. Als de gebeurtenissen disjunct zijn, dus als de doorsnede van A en B leeg is, wordt de vereniging A B verkregen door de uitkomsten van A aan die van B toe te voegen. De vereniging van de gebeurtenissen 'het gooien van 5 ogen' en 'het gooien van 6 ogen' met een dobbelsteen is 'het gooien van 5 of 6 ogen'. De gebeurtenissen zijn disjunct (sluiten elkaar uit), want je kunt niet tegelijk een 5 en een 6 gooien. Veelal zijn de gebeurtenissen niet disjunct, en is dus de doorsnede van A en B niet leeg. In dat geval wordt A B verkregen door uitkomsten van A toe te voegen aan die van B en de (dubbel getelde) uitkomsten in de doorsnede A B één keer te verwijderen. De vereniging van de gebeurtenissen 'het gooien van 5 of meer ogen' en 'het gooien van een oneven aantal ogen' is 1, 3, 5 of 6 ogen. De eerste gebeurtenis is A = {5, 6}, de tweede is B = {1, 3, 5} en A B = {5, 6} plus {1, 3, 5} minus éénmaal de doorsnede {5} is {1, 3, 5, 6}. De doorsnede van beide gebeurtenissen, 5 ogen, mag dus slechts eenmaal in de vereniging vóórkomen. 4

5 1.2 Kans en kansexperiment De kans op een bepaalde gebeurtenis wordt uitgedrukt in een getal tussen 0 en 1. Een waarde dicht bij 0 geeft aan dat de gebeurtenis onwaarschijnlijk is; een waarde dicht bij 1 geeft een hoge waarschijnlijkheid aan. Kans wordt formeel als een wiskundig axioma gedefinieerd. Er bestaan verschillende verklaringen van het concept 'kans'. We behandelen het frequentistische kansmodelen het intuitieve kansmodel. Een kansexperiment is een experiment, waarvan de uitkomst niet voorspelbaar is, maar waarbij de verschillende mogelijke uitkomsten met een bepaalde waarschijnlijkheid of kans optreden. De verzameling van alle mogelijke uitkomsten van het kansexperiment wordt de uitkomstenruimte (notatie: Ω) genoemd. Een kansexperiment wordt mathematisch voorgesteld door een kansvariabele, die verschillende waarden kan aannemen. Ieder van de mogelijke waarden van de kansvariabele heeft een bepaalde kans om op te treden Kansdefinitie De kans op een bepaalde gebeurtenis (eng. probability of event, notatie P) wordt uitgedrukt in een getal tussen 0 en 1, inclusief 0 en 1. De notatie voor de kans op de gebeurtenis x is P(X = x), waarbij 0 P(X = x) 1. Met de hoofdletter X wordt de kansvariabele aangeduid en met de kleine letter x de realisatie of waarde van de kansvariabele. Kortheidshalve schrijven we vaak P(x) in plaats van P(X = x). Een waarde dicht bij 0 betekent dat de gebeurtenis onwaarschijnlijk is; een waarde dicht bij 1 betekent een hoge waarschijnlijkheid. De kans P(x) = 0 geeft aan dat het optreden van de gebeurtenis x uitgesloten is, de kans P(x) = 1 geeft aan dat de gebeurtenis x in ieder geval optreedt. De kans op een willekeurige uitkomst uit de uitkomstenruimte is dus P(Ω) = 1. Op deze manier gedefinieerd is het begrip kans een abstract mathematisch concept. Er bestaan verschillende kansmodellen, die nader proberen te verklaren wat de praktische en filosofische betekenis van dit concept is. Wij behandelen het intuïtieve kansmodel en het frequentistische kansmodel. De grootte van een kans is soms theoretisch af te leiden, maar moet meestal worden geschat uit experimentele of historische gegevens. De kans op het gooien van 6 ogen met een (ideale) dobbelsteen is theoretisch 1/6, omdat de uitkomstenruimte van het kansexperiment uit 6 even waarschijnlijke uitkomsten bestaat en gevraagd wordt naar de kans op het optreden van één van die uitkomsten. De kans op de geboorte van een meisje kunnen we niet theoretisch afleiden, maar uit gegevens van de burgerlijke stand weten we, dat er ongeveer 45 meisjes tegen 55 jongens worden geboren. De kans op de geboorte van een meisje is dus 45/(45+55) = Kansexperimenten Voor de kansrekening belangrijke theoretische kansexperimenten zijn bijvoorbeeld het werpen met een dobbelsteen of een muntstuk. Daarbij gaat het niet om de praktische uitvoering, maar om het gedachteexperiment van het werpen met een (ideale) dobbelsteen of munt. In de werkelijkheid hebben we te maken met praktische kansexperimenten als het geboren worden van een jongen of een meisje, het aantal verkeersongelukken per maand op een bepaald weggedeelte, de meting van het IQ bij kinderen in groep 4, of het optreden van onweer op 21 juni in De Bilt. Merk op dat bij één kansexperiment meerdere uitkomstenruimtes kunnen horen. Dit hangt af van de kansvariabele, waarin we geïnteresseerd zijn, en van wat er is gemeten. 5

6 1.2.3 Kansvariabelen Een kansexperiment wordt mathematisch voorgesteld door een kansvariabele (stochast genoemd), die verschillende mogelijke waarden kan hebben. Die mogelijke waarden worden realisaties genoemd. Ieder van de realisaties heeft een bepaalde kans om op te treden. De kansvariabele wordt met een hoofdletter aangeduid, bijvoorbeeld X, een mogelijke realisatie met een kleine letter, bijvoorbeeld x. De realisatie x is dus een concrete waarde. De kans zelf wordt met een hoofdletter P aangeduid. De kans op (het optreden van) de realisatie x van (de kansvariabele) X wordt dan genoteerd als P(X = x). De kans dat bij het werpen van een muntstuk de uitkomst 'kruis' wordt verkregen stellen we voor door P(X = 'kruis'). De kansvariabele X = 'het werpen van en muntstuk' en de realisatie x = 'kruis' Intuitieve kansmodel Wat is de kans op het gooien van een 5 of hoger met een dobbelsteen? We kunnen de volgende redenering opzetten. Als de dobbelsteen zuiver symmetrisch is met het zwaartepunt precies in het midden, zijn alle zes de uitkomsten {1, 2, 3, 4, 5, 6} even waarschijnlijk. Geven we nu de kans op het optreden van ieder van de uitkomsten de waarde 1/6, dan is de som van alle kansen gelijk aan één. De kans op het optreden van ofwel een 5, dan wel een 6 is dan gelijk aan P(X 5) = 2 x 1/6 = 1/3. De betekenis, die we aan het concept kans hechten is volgens dit model louter intuïtief. Het kansexperiment met de dobbelsteen is eigenlijk geen echt experiment, maar een model, dat onze intuïtie ondersteunt. De definitie van kans is bovendien tautologisch: we hebben immers eerst alle uitkomsten 'even waarschijnlijk' genoemd en hebben daarvan gebruik gemaakt om 'kans' te definiëren. Het intuïtieve kansmodel, hoe onlogisch ook, sluit goed aan bij het omgaan met kansen in de dagelijkse praktijk. Kansen op winst en risico's op ongevallen zijn belangrijke overwegingen, die ons handelen bepalen, terwijl het in de meeste gevallen onmogelijk is die kansen en risico's empirisch te bepalen of te verifiëren Frequentistische kansmodel Wat is de kans op het gooien van een 5 of hoger met een dobbelsteen? Als we het experiment daadwerkelijk uitvoeren, dan weten we uit ondervinding, dat we, na een aantal worpen met de dobbelsteen, in ongeveer 1/3 van de gevallen een 5 of 6 hebben gegooid. Als de dobbelsteen zuiver symmetrisch is met het zwaartepunt precies in het midden zullen we weliswaar aanvankelijk een toevallige afwijking van deze proportie van 1/3 vinden, maar naarmate het aantal pogingen toeneemt wordt de proportie 1/3 steeds dichter benaderd. De redenering is nu, dat als we het aantal worpen onbegrensd laten toenemen, de proportie 1/3 onbegrensd dicht wordt benaderd. De limiet 1/3 noemen we de kans op het optreden van de uitkomsten 5 of 6. Dit model wordt het frequentistische kansmodel genoemd. Kans is daarin de limiet van de relatieve frequentie van de uitkomst in een gedachte-experiment, dat we 'oneindig' vaak herhalen. Daardoor is het mogelijk veel concreter te formuleren wat we met een kans bedoelen. Het nadeel is, dat het in veel praktische situaties niet goed mogelijk is een empirisch kansmodel te bedenken, zodat we weer terugvallen op het intuïtieve kansmodel.. De kans, dat een kind bij de geboorte een meisje is, is ongeveer We kunnen dit verifiëren door in de gegevens van de burgerlijke stand de aantallen aangegeven jongens en meisjes te turven. We vinden dan inderdaad ongeveer 45% meisjes en 55% jongens. De kans, dat de VVD de volgende verkiezingen wint of de toename van het risico op leukemie bij kinderen, die in de buurt van een kerncentrale wonen is daarentegen niet in een empirisch kansexperiment te verifiëren. 6

7 1.3 Kansregels Bij het rekenen met kansen gaan we uit van de definitie van kans (zie kansdefinitie). De regels van de kansrekening zijn hieruit afgeleid met behulp van de verzamelingenleer. De belangrijkste kansregels zijn de somregel, de algemene somregel en de productregel Somregel De kans op de vereniging van twee gebeurtenissen is gelijk aan de som van de kansen op ieder van de gebeurtenissen, mits de gebeurtenissen disjunct zijn. De notatie van deze somregel is: P(A B) = P(A) + P(B) De kans op het gooien van een 5 of een 6 met een (ideale) dobbelsteen is P( 5 6) = P(5) + P(6) = 1/6 + 1/6 = 1/3. Het gooien van een 5 en het gooien van een 6 zijn elkaar uitsluitende gebeurtenissen, want je kunt niet tegelijk een 5 en een 6 gooien Complementaire kansen Voor twee gebeurtenissen, die elkaars complement zijn, A en A, geldt dat P( A ) = 1 P(A) Deze regel kan uit de somregel worden afgeleid. Immers een gebeurtenis A is het complement van een gebeurtenis A als A A = Ω. Volgens de somregel is P(A) + P( A ) = P(A A ) = P(Ω) = 1. Dus is P( A ) = 1 - P(A). De kans op een willekeurige uitkomst uit de uitkomstenruimte Ω is P(Ω) = 1, omdat dat een zekere gebeurtenis is. De kans op de geboorte van een jongen is 1 minus de kans op de geboorte van een meisje: P(X = jongen) = 1 P(X = meisje) = = Algemene somregel Als twee gebeurtenissen A en B elkaar niet uitsluiten is de kans op de gebeurtenis A B gelijk aan de som van de kansen op A en B minus de kans op de doorsnede van A en B. De notatie van deze algemene somregel is: P(A B) = P(A) + P(B) - P(A B) De kans op het optreden van de doorsnede van A en B, P(A B), kan empirisch worden bepaald of met behulp van een van de productregels worden berekend. De kans op het 'gooien van 5 of meer ogen' of het 'gooien van een oneven aantal ogen' met een (ideale) dobbelsteen kan met de algemene somregel worden berekend. A = {5,6} en B = {1,3,5}. De doorsnede A B = {5} i.e. de enige uitkomst, die A en B gemeenschappelijk hebben. Dus is: P(A B = P(A) + P(B) P(A B) = 2/6 + 3/6-1/6 = 2/3 Als A en B disjunct zijn, dus elkaar uitsluiten is de doorsnede van A en B leeg en is dus de kans P(A B) per definitie gelijk aan 0. De somregel is dus een speciaal geval van de algemene somregel. 7

8 1.3.4 Productregels Voor de berekening van de kans op de doorsnede van twee gebeurtenissen A en B, P(A B), gebruiken we de productregels. Als de gebeurtenissen A en B afhankelijk zijn, geldt de algemene productregel, als ze echter onafhankelijk zijn geldt de simpeler productregel voor onafhankelijke gebeurtenissen. Om te kunnen begrijpen wat (on)afhankelijkheid van gebeurtenissen inhoudt, definiëren we eerst het begrip voorwaardelijke kans en vergelijken deze kans met de kans op de doorsnede, die ook wel simultane kans wordt genoemd Voorwaardelijke kans De kans op de gebeurtenis A, onder de voorwaarde dat de gebeurtenis B is opgetreden, wordt de voorwaardelijke kans op A gegeven B genoemd. De notatie voor deze voorwaardelijke kans is P(A B). Achter de verticale streep staat de voorwaarde (de gebeurtenis B) voor de kans dat de gebeurtenis A zal optreden. In de praktijk is de kans op een gebeurtenis vaak afhankelijk van het optreden van een andere gebeurtenis. Anders gezegd: het optreden van de tweede gebeurtenis, B, geeft informatie over (verandert) de kans op de eerste gebeurtenis, A. De kans dat je fiets wordt gestolen hangt af van de plaats waar je je fiets hebt neergezet, de kans dat een baby een aangeboren ziekte heeft hangt soms af van het geslacht van de baby, de kans dat iemand een hogere opleiding heeft gevolgd wordt (mede) bepaald door het opleidingsniveau van de ouders enzovoort. Als de voorwaardelijke kans op A gegeven B gelijk is aan de onvoorwaardelijke kans op A, dus als P(A B) = P(A), dan zijn de gebeurtenissen A en B onafhankelijk Simultane en voorwaardelijke kansen De kans op de doorsnede van A en B, P(A B), wordt ook wel de simultane kans op A en B genoemd. De simultane kans op A en B moet goed worden onderscheiden van de voorwaardelijke kans op A gegeven B, P(A B). Bij de simultane kans gaat om het samen optreden van twee gebeurtenissen, terwijl het bij de voorwaardelijke kans om het optreden van een gebeurtenis gaat, nadat of terwijl aan de voorwaarde is voldaan, dat de andere gebeurtenis heeft plaatsgevonden. Het onderscheid is in de praktijk niet altijd gemakkelijk te maken. De kans, dat iemand een hogere opleiding gaat volgen, wordt (mede) bepaald door het opleidingsniveau van de ouders. Stel dat B is gedefinieerd als 'een hoger-opgeleid kind' en A als 'een hoger-opgeleide vader', dan is de simultane kans P(A B) de kans, dat we door willekeurige mensen te vragen naar hun eigen opleiding en naar die van hun vader, iemand aantreffen, die zowel zelf hoger-opgeleid is als een hoger-opgeleide vader heeft. Stel dat we in 4% van de gevallen zulke personen aantreffen, dan is naar schatting P(A B) = De voorwaardelijke kans is de kans, dat we door uitsluitend hogeropgeleide kinderen te vragen naar het opleidingsniveau van hun vader, een kind aantreffen met een hoger-opgeleide vader. Waarschijnlijk vinden we iets als P(A B) = 0.6, want hoger-opgeleide kinderen hebben inderdaad vaker hoger-opgeleide vaders dan willekeurig gekozen kinderen. 8

9 Algemene productregel De simultane kans op twee gebeurtenissen A en B wordt berekend met de algemene productregel: P(A B) = P(A B) P(B) In deze vergelijking is P(A B) de voorwaardelijke kans op de gebeurtenis A, gegeven dat B zich heeft voorgedaan. Bij een enquête onder studenten blijkt 1 op de 3 meisjes een eigen PC te hebben. Er studeren evenveel meisjes als jongens. Hoe groot is de kans, dat een willekeurig gekozen student een meisje met PC is? Definiëren we PC-bezit met A en geen PC-bezit met A, meisjes-student zijn met D en jongens-student zijn met D, dan is gegeven, dat P(A D) = 1/3 en verder dat P(D) = 0.5. De kans, dat een willekeurige student een meisje is met een eigen PC, is dan P(A D) = P(A D) P(D) = (1/3) x (1/2) = 1/ Productregel voor onafhankelijke gebeurtenissen Als de voorwaardelijke kans P(A B) gelijk is aan de onvoorwaardelijke kans P(A) gaat de algemene productregel P(A B) = P(A B) P(B) over in de productregel voor onafhankelijke gebeurtenissen: P(A B) = P(A) P(B) De gebeurtenissen A en B zijn in dat geval onafhankelijk. De productregel voor onafhankelijke gebeurtenissen is dus een speciaal geval van de algemene productregel. De primaire acties bij allerlei kansspelen zijn meestal onafhankelijk. Twee afzonderlijke worpen met een dobbelsteen leveren onafhankelijke gebeurtenissen. Een dobbelsteen heeft geen geheugen. De kans dat we eerst zes ogen gooien en daarna één oog is P(X=6) P(X=1) = (1/6) (1/6) = 1/ Onafhankelijkheid Twee gebeurtenissen A en B zijn onafhankelijk, als de voorwaardelijke kans op A gegeven B gelijk is aan de onvoorwaardelijke kans op A, dus als P(A B) = P(A). In dat geval is ook het omgekeerde waar: P(B A) = P(B). Voor onafhankelijke gebeurtenissen gaat de algemene productregel over in de productregel voor onafhankelijke gebeurtenissen: P(A B) = P(A B) P(B) = P(A) P(B) Afhankelijkheid van twee gebeurtenissen is een formele eigenschap en vormt geen bewijs van het bestaan van een causale relatie tussen de beide gebeurtenissen. Afhankelijkheid van A en B wil alleen zeggen: het optreden van de ene gebeurtenis, B, geeft informatie over (verandert) de kans op de andere gebeurtenis, A. We contrasteren daarom wel stochastische (on)afhankelijkheid (vanuit het gezichtspunt van de kansrekening) met causale (on)afhankelijkheid (vanuit het gezichtspunt van oorzaak en gevolg). Het sterfterisico door longkanker op de leeftijd van 50 jaar bedraagt in de gehele bevolking 0.1%, hetzelfde risico voor mannen bedraagt 0.3%. Er is hier dus geen sprake van stochastische onafhankelijkheid. Mogen we nu concluderen, dat er een causale relatie is tussen longkanker en geslacht? Niet op grond van deze gegevens. Weliswaar is de voorwaardelijke kans P(longkankersterfte man) = groter dan de onvoorwaardelijke kans P(longkankersterfte) = 0.001, maar de belangrijkste risicofactor, roken, in beide subpopulaties verschilt. Vrouwen hebben (in de afgelopen decennia) minder gerookt dan mannen. 9

10 1.4 Regel van Bayes De regel van Bayes is zonder twijfel de belangrijkste stelling uit de kansrekening. Hij kan worden afgeleid uit de algemene productregel en legt een relatie tussen de voorwaardelijke en onvoorwaardelijke kansen op de gebeurtenissen A en B. De eenvoudige vorm van de regel is: P(B A) P(A) P(A B) = P(B A) P(A) + P(B A) P(A) De theoretische betekenis van Bayes' regel is, dat hij inzichtelijk maakt hoe onze inschatting van de kans op een onzekere gebeurtenis A, wordt beïnvloed door het optreden van een andere onzekere gebeurtenis B. De regel van Bayes wordt toegepast, als optimale beslissingen en procedures noodzakelijk zijn, zoals in de medische en genetische diagnostiek, artificiële intelligentie, organisatie van het dataverkeer en in ieder wetenschappelijk onderzoek, als het erom gaat te bewijzen, dat de waarschijnlijkheid van de juistheid van een hypothese door het onderzoek is toegenomen. Ook in het dagelijks leven komen situaties voor, waarin de toepassing van de regel van Bayes essentieel is voor een juiste beslissing. Bij een aanrijding was volgens een getuige een blauwe taxi betrokken en doorgereden. Dat het een taxi was, is wel zeker, maar over de kleur twijfelt de politie nog. Bij navraag blijkt, dat in de stad 85% van de taxi's geel is en slechts 15% blauw. Zonder de extra informatie van de getuige moet de politie ervan uitgaan, dat de kans 15% is, dat de taxi blauw was. De betrouwbaarheid van de getuige wordt op 80% geschat, dat wil zeggen, dat hij in 80 van de 100 gevallen een juiste verklaring pleegt af te leggen. Die extra informatie maakt, dat de kans dat de taxi blauw was aanzienlijk toeneemt, maar niet tot 80%. De regel van Bayes maakt het mogelijk die kans uit te rekenen, zie Betekenis van Bayes' regel Afleiding van Bayes regel De afleiding van de regel van Bayes is voor de toepassingen van beperkt belang, maar voor een goed inzicht is hier toch de afleiding, met een voorbeeld van een eenvoudige toepassing. Vanwege de symmetrie van de simultane kans P(A B) = P(B A) kan de algemene productregel op twee manieren worden geschreven: P(A B) = P(A B) P(B) = P(B A) P(A) Dus is P(B A) P(A) P(A B) = P(B) Dit is de regel van Bayes in zijn eenvoudigste vorm. De noemer kan nu als volgt worden herleid: P(B) = P(A B) + P( A B) en door tweemaal toepassen van de algemene productregel tot: P(B) = P(B A).P(A) + P(B A ) P( A ) waarmee de regel van Bayes is bewezen: P(B A) P(A) P(A B) = P(B A) P(A) + P(B A) P(A) Een marktonderzoeker vraagt aan de klanten van een supermarkt of zij aan een enquête willen meewerken. De helft van hen stemt toe en aan hen wordt gevraagd of zij een bepaald product hebben gekocht. 4 op de 10 heeft het product inderdaad gekocht. De onderzoeker vindt dit aan de hoge kant en bedenkt, dat kopers van het product misschien eerder geneigd zijn om aan een enquête mee te werken dan niet-kopers. Om die stelling te onderbouwen vraagt hij aan een steekproef van kopers of zij aan een enquête willen meewerken. 80% zegt daar ja op en niemand weigert te antwoorden. Welk deel van de populatie is (potentiële) koper? Dergelijke problemen zijn goed op te lossen met de eenvoudige vorm van de regel van Bayes, zoals hierboven afgeleid. Als A staat voor 'koper' en B voor 'ja, ik doe mee aan de enquête', dan is P(B) de kans dat een willekeurig iemand uit de populatie meedoet aan het onderzoek en is P(B A) de (voorwaardelijke) kans dat iemand uit de subpopulatie van kopers een meedoener is. Verder is P(A) de 10

11 kans dat een willekeurig iemand uit de populatie een koper is, terwijl P(A B) de (voorwaardelijke) kans is dat iemand uit de subpopulatie van meedoeners een koper een is. In het voorbeeld is P(B) = 0.5, P(A B) = 0.4 en P(B A) = 0.8, zodat de proportie kopers in de gehele populatie is: P(A) = 0.4 x 0.5 / 0.8 = 0.25 In onderstaande tabel vatten we dat nog eens samen: Betekenis van Bayes regel Bayes' regel luidt: P(B A) P(A) P(A B) = P(B A) P(A) + P(B A) P(A) en geeft aan, dat P(A B), d.i. de kans op A gegeven de zekerheid dat B waar is, afhangt van de kansen op B als A waar is en als A niet waar is, dus P(B A) en P(B A ), en bovendien van de onvoorwaardelijke kansen P(A) en P( A ). De onvoorwaardelijke kans P(A) wordt wel de a priori kans genoemd en de voorwaardelijke kans P(A B) de a posteriori kans, dat wil zeggen de kans op A, nadat we de extra informatie B hebben gekregen. Bij een aanrijding was volgens een getuige een blauwe taxi betrokken en doorgereden. Dat het een taxi was, is wel zeker, maar over de kleur twijfelt de politie nog. Bij navraag blijkt, dat in de stad 85% van de taxi's geel is en slechts 15% blauw. Zonder de extra informatie van de getuige moet de politie ervan uitgaan, dat de de kans 15% is, dat de taxi blauw was. De betrouwbaarheid van de getuige wordt op 80% geschat, dat wil zeggen, dat hij in 80 van de 100 gevallen een juiste verklaring pleegt af te leggen. Die extra informatie maakt, dat de kans dat de taxi blauw was aanzienlijk toeneemt, maar niet tot 80%. Als A = "de taxi was blauw" en B = "de getuige zegt dat de taxi blauw was", dan is de a priori kans, dat de taxi blauw was P(A) = 0.15 en dus P( A ) = De a posteriori kans, dat de getuige zegt, dat de taxi blauw is, als hij dat ook werkelijk is, is P(B A) = 0.8 en de kans, dat hij dat zegt, als de taxi geel is, is P(B A ) = 0.2. De kans, dat de taxi blauw is, is nadat de politie de informatie van de getuige heeft verkregen: 0,8 0,15 P(A B) = 0,41 0,8 0,15 + 0,2 0,85 De praktische betekenis van de regel van Bayes is, dat beslissingen in onzekere situaties beter kunnen worden onderbouwd, omdat we kunnen uitrekenen, welke kennis we nodig hebben om de kans op een juiste beslissing zo groot mogelijk te maken. Bayes' regel is het fundament van de besliskunde en wordt overal toegepast waar beslissingen moeten worden genomen en processen moeten worden geoptimaliseerd, waarin onzekere factoren een rol spelen. 11

12 2 Kansverdelingen De verzameling van alle mogelijke waarden, die een kansvariabele kan aannemen plus de kansen, dat die waarden worden gerealiseerd, wordt kansverdeling genoemd. In de praktijk heeft een kansverdeling meestal de vorm van een tabel, grafiek of formule. Omdat de kansverdeling alle mogelijke realisaties van de kansvariabele omvat, is de som van alle kansen van een kansverdeling per definitie gelijk aan één: ΣP(x) = 1 waarin de som is genomen over de gehele uitkomstenruimte Ω. Sommige kansverdelingen zijn gebaseerd op een door empirisch onderzoek verkregen frequentieverdeling. Meestal worden in de statistiek echter kansverdelingen toegepast, die uit denkbeeldige kansexperimenten zijn afgeleid. Dergelijke theoretische kansverdelingen staan in de statistiek model voor de verdeling van kansen in een reële situatie. Naar gelang het type van de kansvariabele worden kansverdelingen ingedeeld in discrete kansverdelingen en continue kansverdelingen. 2.1 Empirische kansverdelingen Kansverdelingen zijn vaak gebaseerd op een door empirisch onderzoek verkregen frequentieverdeling. Uit een door een enquête verkregen frequentietabel van de inkomens(klassen) in Nederland kunnen we de kansen schatten om een willekeurig persoon aan te treffen met een inkomen van , of hoger dan Op vergelijkbare wijze kunnen we uit een sterftetabel de kansen schatten, dat een willekeurige persoon op een bepaalde leeftijd zal overlijden. De kansen, dat Ajax nummer 1, 2,..., laatste wordt in de eerstvolgende voetbalcompetitie, kunnen we op grond van de huidige prestaties en van allerlei andere factoren inschatten. In al deze gevallen is de som van de kansen gelijk één (1), want iedereen heeft een inkomen tussen 0 en meer dan , gaat op enige leeftijd dood en Ajax eindigt altijd op een of andere plaats. 2.2 Theoretische kansverdelingen De meeste kansverdelingen, die in de statistiek worden toegepast, zijn uit kansexperimenten theoretisch afgeleid. Theoretische kansverdelingen worden beschreven door een wiskundige formule of procedure en (meestal) gekenmerkt door een klein aantal constanten of parameters. Door 4 maal met een munt te gooien en het aantal keren 'kruis' als uitkomst te beschouwen krijgen we de volgende theoretische kansverdeling. Dit is een voorbeeld van een theoretische verdeling, de binomiale verdeling. In de praktijk staat deze verdeling model voor, bijvoorbeeld, de verdeling van de kansen op een gezinssamenstelling van 0, 1, 2, 3 of 4 jongens in een gezin van 4 kinderen, als de kans op een jongen per keer steeds precies 0.5 is. Het aantal muntworpen is in dit geval equivalent met de grootte van het gezin. Het aantal keren 'kruis' is equivalent met het aantal jongens in het gezin. 12

13 2.3 Kansverdeling als model Waarom gebruiken we theoretische kansverdelingen als model voorempirische kansverdelingen of reële frequentieverdelingen? Statistisch onderzoek beoogt uitspraken te doen over de kansverdeling van een kenmerk op basis van steekproefgegevens. Om de kansverdeling precies te leren kennen zouden grote steekproeven nodig zijn, waardoor het onderzoek tijdrovend en kostbaar zou worden. Als we nu theoretische of praktische redenen hebben om aan te nemen, dat de gezochte kansverdeling benadert kan worden met een theoretische kansverdeling met bekende eigenschappen, kunnen we soms met een kleinere steekproef volstaan. Tellingen, bijvoorbeeld van ongevallen, hebben een theoretische kansverdeling, die de Poissonverdeling wordt genoemd. De standaardafwijking van de Poisson-verdeling is gelijk aan de wortel van het gemiddelde van de tellingen. In Nederland is het aantal dodelijke verkeersslachtoffers gemiddeld over een aantal jaren De standaardafwijking kan dus geschat worden op Als in een bepaald jaar het aantal verkeersslachtoffers 1235 bedraagt, valt dat binnen de normale toevallige spreiding en is er geen reden om van een opvallende toename te spreken. Als het aantal slachtoffers in een jaar echter 1300 is, is dat wel reden om te spreken van een niet-toevallige toename of misschien zelfs van een trend. Theoretische kansverdelingen worden gekenmerkt door een wiskundige formule of procedure en door een klein aantal parameters. Door aan te nemen, dat een empirische kansverdeling gemodelleerd kan worden door een theoretische verdeling met bekende mathematische eigenschappen, kunnen we met één enkele of een paar waarnemingen de hele verdeling schatten. 2.4 Overschrijdingskansen De kans op het optreden van een uitkomst gelijk aan of groter dan een waarde x, P(X x), wordt (rechter)overschrijdingskans genoemd. De kans P(X x), wordt cumulatieve kans of ook wel linkeroverschrijdingskans genoemd. Overschrijdingskansen zijn interessante grootheden: zij geven aan hoe zeldzaam een bepaalde uitkomst of een nog grotere (of een nog kleinere) uitkomst is. De overschrijdingskansen van belangrijke theoretische kansverdelingen kunnen in statistische tabellen worden opgezocht. De kansverdeling van de in een loterij te winnen prijzen is in de tabel weergegeven. De kans om 1000 of meer euro te winnen is de overschrijdingskans P(X 1000) = P(X = 1000) + P(X = 5000) + P(X = 10000) = 0, , ,00003 = 0,

14 2.5 Verwachtingswaarden Als van een kansvariabele X de kansverdeling bekend is, dus als P(X = x) = P(x) bekend is voor alle waarden x, dan kunnen we de verwachtingswaarde E(X) van X uitrekenen. Deze is voor discrete kansverdelingen gedefinieerd als de som van alle waarden x, ieder vermenigvuldigd met de kans dat hij optreedt: E(X) = ΣxP(x) Voor continue kansverdelingen geldt de overeenkomstige uitdrukking: E(X) = xf(x)dx De verwachting(swaarde) van X, E(X), wordt populatiegemiddelde genoemd en is bij een kansverdeling, wat het rekenkundig gemiddelde is bij een frequentieverdeling. E(X) wordt vaak met de Griekse letter μ aangeduid, dus E(X) = μ. E(X) is bij een kansspel de gemiddelde opbrengst aan prijzen, vandaar de naam 'verwachting'. We spelen met een gewone dobbelsteen en spreken af, dat ik jou het aantal geworpen ogen in euro's uitbetaal, terwijl jij mij voor iedere worp 31/2 euro betaalt. Is dat een 'fair deal'? Jouw winst is gemiddeld per worp: E(X) = ΣxP(x) = 1x1/6 + 2x1/6 + 3x1/6+ 4x1/6+ 5x1/6+ 6x1/6 = 31/2 euro en dat is precies wat je betaalt, dus er is niets mis met de deal. De verwachting van de deviaties X - μ is altijd gelijk aan 0, want E(X - μ) = E(X) - E(μ) = μ - μ = 0. Een belangrijker grootheid is de verwachting van het kwadraat van de deviaties, gedefinieerd als: E(X - μ)² = Σ(x - μ)²p(x) Voor continue kansverdelingen geldt de overeenkomstige uitdrukking: E(X - μ)² = (x - μ)²f(x)dx Deze grootheid wordt populatievariantie genoemd en is equivalent met de variantie bij een frequentieverdeling. De populatievariantie wordt met σ² aangeduid, dus E(X - μ)² = σ². 2.6 Discrete kansverdelingen Naar gelang het type van de kansvariabele worden kansverdelingen ingedeeld in discrete en continue kansverdelingen. Als het type van de kansvariabele discreet is, dat wil zeggen, als de kansvariabele een aftelbaar aantal mogelijke uitkomsten of realisaties heeft, is de bijbehorende kansverdeling een discrete kansverdeling. De drie belangrijkste discrete verdelingen zijn de binomiale verdeling, de hypergeometrische verdeling en de Poisson-verdeling. Een telling in een steekproef van beperkte omvang heeft meestal de binomiale verdeling. Standaard kansexperiment is het werpen van een munt met als uitkomst het aantal keren, dat 'kruis' wordt gegooid. Als de omvang van de steekproef (het aantal muntworpen) n is en de kansvariabele X, als mogelijke waarden x = 0, 1, 2,..., n (het aantal keren 'kruis') heeft, dan is X binomiaal verdeeld. Een telling in een steekproef afkomstig uit een populatie van beperkte omvang heeft meestal de hypergeometrische verdeling. Het verschil met de binomiale verdeling is dat bij de binomiale verdeling de populatie onbeperkt groot ('oneindig') is. Het aantal vrouwen in steekproeven van 10, door loting gekozen uit een personeelsbestand van 200 personen (kleine populatie), heeft de hypergeometrische verdeling. Een telling, waarbij de uitkomst in principe onbeperkt (bij benadering oneindig) is, heeft meestal de Poissonverdeling. Het aantal bladluizen op een plant, het aantal ongelukken per jaar op een bepaalde weg, het aantal drukfouten per bladzijde en het aantal versprekingen van Philip Freriks per uitzending van het NOS-journaal hebben alle de Poisson-verdeling. De kansvariabele X, heeft de mogelijke waarden x = 0, 1, 2,..., en er is geen vaste steekproefgrootte, alleen een tijdsinterval of ruimte waarin wordt geteld. Onder bepaalde voorwaarden kunnen de binomiale, de hypergeometrische en de Poisson-verdeling worden benaderd met de normale verdeling, zie normale benadering van discrete verdelingen. 14

15 2.6.1 Overschrijdingskansen van discrete verdelingen De overschrijdingskansen van discrete kansverdelingen verschillen in één opzicht van de overschrijdingskansen van continue verdelingen. Bij discrete kansverdelingen geldt, dat P(X x) P(X>x). Daarom is bij discrete kansverdelingen de rechteroverschrijdingskans niet gelijk aan één minus de linkeroverschrijdingskans, maar geldt P(X x) = 1 - P(X<x) Bij continue kansverdelingen is het onderscheid tussen X x en X>x niet van belang en geldt dus: P(X x) = 1 - P(X x) = 1 - P(X<x) De discrete kansverdeling van de in een loterij te winnen prijzen is in de tabel weergegeven. De kans om 500 of meer euro te winnen is de overschrijdingskans P(X 500) = 0, , , ,00003 = 0, De kans om 500 of minder euro te winnen is niet gelijk aan 1 0,00143 maar is P(X 500) = 0, , ,01 + 0,03 + 0,95557 = 0, Binomiale verdeling Onafhankelijke tellingen in steekproeven van vaste omvang volgen meestal de binomiale verdeling. Standaard kansexperiment is het werpen van een munt met als uitkomst het aantal keren, dat 'kruis' wordt gegooid. Dergelijke experimenten zijn onafhankelijk, dat wil zeggen de kans op de uitkomst 'kruis' is steeds dezelfde. Als de omvang van de steekproef (het aantal muntworpen) n is en de kansvariabele X, de mogelijke waarden x = 0, 1, 2,..., n (het aantal keren 'kruis') heeft, dan heeft X de binomiale verdeling. Als bij één worp de kans op 'kruis' gelijk is aan p, dan is de kans dat bij n worpen de kansvariabele X, een van de mogelijke n k n k waarden k aanneemt: PX ( = k) = p(1 p) k n In deze vergelijking voor de binomiale kansverdeling is de binomiaalcoëfficiënt. k Het kansexperiment, waarop de binomiale verdeling is gebaseerd, heeft slechts twee uitkomsten: 'kruis' en 'munt'. In de statistiek spreken we meer algemeen van 'succes' en 'mislukking'. Een dergelijk experiment met slechts twee uitkomsten wordt Bernoulli experiment genoemd, de variabele X is een dichotome kansvariabele. De kans op succes p, kan alle waarden tussen nul en één hebben. Andere voorbeelden van dichotome uitkomsten zijn geslacht (man of vrouw), overleving (dood of levend) of examenuitslag (geslaagd of gezakt) Binomiaalcoëfficiënt Het aantal verschillende volgordes, waarin een serie dichotome uitkomsten kan worden verkregen, wordt het aantal combinaties genoemd. Als we 4 keer een munt werpen, dan zijn de mogelijke uitkomsten x = 0, 1, 2, 3, 4 keer 'kruis'. De uitkomst x = 0 wordt gerealiseerd, als we 4 keer achtereenvolgens 'munt' en nul keer 'kruis' werpen. Er is slechts één enkele volgorde waarin deze uitkomst kan vóórkomen, het aantal combinaties is dus gelijk aan 1. De uitkomst x = 1 wordt gerealiseerd, als we 1 keer 'kruis' werpen en 3 keer 'munt'. Er zijn 4 combinaties (4 verschillende volgordes), waarmee deze uitkomst kan worden verkregen. Zie afbeelding hiernaast. Het aantal combinaties kan sneller worden berekend met de binomiaalcoëfficiënt. Als n het aantal experimenten is en k is de uitkomst, dan is de berekeningsformule van de binomiaalcoëfficiënt: n n! = k k!(n-k)! 15

16 n De notatie voor de binomiaalcoëfficiënt wordt uitgesproken als 'n boven k'. De notatie n! (uitgesproken als k 'n faculteit') staat voor n(n-1) (n-2) , bijvoorbeeld 4! = = 24 De uitkomst één 'kruis' en drie 'munt' (k = 1) kan in 4 verschillende volgordes voorkomen: 4 4! 4321 = = = 4 1 1!(4 1)! 1 (3 2 1) Overschrijdingskansen van de binomiale verdeling Overschrijdingskansen van de binomiale verdeling, dus de kansen P(X x) voor verschillende waarden van x, kunnen met behulp van de formules van de binomiale verdeling worden berekend. Als de steekproefomvang groter is dan 3 of 4 worden die berekeningen al gauw tijdrovend. In statistische handboeken staan tabellen, waarin voor een beperkt aantal waarden van n en p de overschrijdingskansen voor alle waarden van x tussen 0 en n kunnen worden opgezocht. Met de grafische rekenmachine kunnen binomiale (overschrijdings)kansen eenvoudig worden berekend. Een erfelijke eigenschap heeft in de populatie een frequentie van 27%, dus p = 0,27. De kans dat in een steekproef van n = 20 de erfelijke eigenschap bij tenminste 10 personen aanwezig is, is P(X 10) 0,024 De afbeeldingen hiernaast geven aan hoe dit met de grafische rekenmachine (gebruikmakend van de wizard) berekend kan worden. syntax van de TI-nspire: P(X = k) = binompdf(n,p,k) en P( o X b) = binomcdf(n,p,o,b) met n = grootte van de steekproef p = kans op succes o = ondergrens b = bovengrens van de binomiale verdeling Een multiple choice tentamen bevat 10 vragen, ieder met 4 alternatieve antwoorden, waarvan er steeds slechts één goed is. Wat is de kans om door louter gokken 6 of meer punten te halen? De kansen op x = 6, 7,.., 10 successen in steekproeven van n = 10, berekend uit de binomiale verdeling met populatieproportie p = 0.25, zijn: Uit de tabel volgt, dat de kans op 6 of meer punten P(X 6) = 0,0197 De individuele kansen voor x = 6, 7,.., 10 kunnen met de GRM d.m.v. binompdf berekend worden. Het is echter eenvoudiger de optie binomcdf te gebruiken en P(X 6) in één keer te berekenen. 16

17 Parameters van de binomiale verdeling Een binomiaal verdeelde kansvariabele, X, met steekproefomvang, n, en kans op 'succes' p, duiden we aan met: X ~ B(n, p) De constanten n en p worden de parameters van de betreffende binomiale verdeling genoemd. De kansen en andere eigenschappen van de binomiale verdeling worden uitsluitend door deze parameters bepaald. Bij een experiment met 6 muntworpen is dus n = 6 en p = 0,5 (voor een 'ideale' munt), bij een multiple choice tentamen met 10 vragen en 4 alternatieven per vraag is n = 10 en p = 0,25 en bij de kansverdeling van de aantallen jongens in gezinnen van 4 is n = 4 en p = 0,55, etc Verwachtingen van de binomiale verdeling De verwachtingswaarde van de binomiaal verdeelde kansvariabele X is: E(X) = μ = np en de variantie van de kansverdeling is: E(X - μ)² = σ² = n p (1 p) Een multiple choice tentamen bevat 10 vragen, ieder met 4 alternatieve antwoorden, waarvan er steeds slechts één goed is. Als het tentamen door zuiver te gokken wordt gemaakt, wat is dan de verwachting van het aantal gescoorde punten en wat is de standaardafwijking van de scores? De verwachting is E(X) = μ = n p = 10 0,25 = 2,5 punten, de variantie is E(X - μ)² = σ² = n p(1 - p) = 10 0,25 0,75 = 1,88 en de standaardafwijking is σ = 1, 88 1, Hypergeometrische verdeling In steekproeven uit een dichotome populatie van onbeperkte omvang hebben de aantallen successen de binomiale verdeling. Als de populatie waaruit de steekproeven worden getrokken slechts beperkt van omvang is, hebben de aantallen successen echter de hypergeometrische verdeling. Steekproeven kunnen met of zonder teruglegging worden getrokken: de eenheden worden één voor één getrokken en teruggelegd in de populatie (binomiale verdeling) of niet teruggelegd (hypergeometrische verdeling). In het eerste geval verandert de samenstelling van de populatie na iedere trekking niet, in het laatste geval wel. Bij niet terugleggen zijn de achtereenvolgende trekkingen niet onafhankelijk: de kans op een succes hangt af van het resultaat (succes of niet) van de voorgaande trekking. De waarde van de proportie successen in de populatie, p, verandert na iedere trekking. In een onbeperkt grote (of zeer grote) populatie maakt teruglegging niet uit en gaat de hypergeometrische verdeling over in de binomiale verdeling. De kans op x successen in een steekproef van n observaties uit een populatie met omvang N, waarin Np N-Np x n-x zich N p succesen bevinden is: P(x) = N n. In deze vergelijking voor de hypergeometrische kansverdeling staat de notatie voor de binomiaalcoëfficiënt.. In een ziekenhuisapotheek worden 50 ampullen van een weinig toegepaste steriele injectievloeistof bereid. Als er in deze charge precies één niet-steriel exemplaar zit, hoe groot is dan de kans, dat die ene ampul in een steekproef van 10 ampullen wordt gevonden? De omvang van de populatie is N = 50, de steekproefomvang is n = 10 en de proportie niet-steriele exemplaren in de populatie is π = De gevraagde kans is dus: P(x = 1) = = We zien in dit voorbeeld, dat steekproefsgewijze controle op deze wijze uitgevoerd weinig zekerheid biedt over de kwaliteit van de populatie. 17

18 Overschrijdingskansen van de hypergeometrische verdeling Overschrijdingskansen van de hypergeometrische verdeling, dus de kansen P(X x) voor verschillende waarden van x, kunnen met behulp van de formules van de hypergeometrische verdeling worden berekend. De (rechter)overschrijdingskans wordt term voor term berekend en opgeteld uit: P(X x) = P(x) + P(x+1) + P(x+2)..., P(n) Als de steekproefomvang groter is dan 3 of 4 worden die berekeningen al gauw tijdrovend.. In een ziekenhuisapotheek worden 100 ampullen van een injectievloeistof bereid. Als bij de sterilisatie van deze charge van 100 ampullen er 5 niet-steriel zijn gebleven, hoe groot is dan de kans, dat in een steekproef van 20 ampullen 0, 1, 2,..., 5 niet-steriele ampullen worden gevonden? De omvang van de populatie is N = 100, de steekproefomvang is n = 20 en het deel niet-steriele exemplaren in de populatie is p = De hypergeometrische kansverdeling is in de tabel en in de figuur weergegeven en vergeleken met de (binomiale) kansverdeling, die zou ontstaan als de charge veel groter dan N = 100 zou zijn Verwachtingen van de hypergeometrische verdeling De hypergeometrische verdeling is een kansverdeling met 3 parameters:n, de omvang van de populatie, n de omvang van de steekproef en p, de kans op 'succes' bij een enkele waarneming (Bernoulli experiment). De kansen op een bepaalde samenstelling van een steekproef en andere eigenschappen van de hypergeometrische verdeling worden uitsluitend door deze parameters bepaald. De verwachtingswaarden van de hypergeometrisch verdeling zijn voor het gemiddelde: E(X) = μ = np en voor de variantie van de kansverdeling: E(X - μ)² = σ² = np(1 - p)(n - n)/(n - 1) 18

19 2.6.4 Poisson verdeling Onafhankelijke tellingen in steekproeven van onbeperkte omvang volgen meestal de Poisson-verdeling. Het aantal bladluizen op een plant, het aantal ongelukken per jaar op een bepaalde weg, het aantal drukfouten per bladzijde en het aantal Coli-bacteriën in 0,1 ml zwemwater hebben alle de Poisson-verdeling. Kenmerkend voor de Poisson-verdeling is, dat er geen vaste steekproefgrootte is, alleen een tijdsinterval of ruimte, waarin wordt geteld. In de voorbeelden zijn dat respectievelijk: een plant, de tijdseenheid 'jaar', een bladzijde en 0,1 ml water. De kansvariabele X, heeft de mogelijke waarden x = 0, 1, 2,...,. De kans op een van de waarden x, P(x), wordt gegeven door: In deze formule is μ = E(X), de verwachting van X en e 2,718 P(x) = x -μ μ e x! Overschrijdingskansen van de Poisson-verdeling Overschrijdingskansen van de Poisson-verdeling, dus de kansen P(X x) voor verschillende waarden van x, kunnen met behulp van de formule van de Poisson-verdeling worden berekend. Omdat het aantal waarden groter dan x oneindig groot is, berekenen we de (rechter)overschrijdingskans van x uit de cumulatieve kans van x-1 volgens: P(X x) = 1 - P(X x-1) Als de x groter is dan 3 of 4 worden die berekeningen al gauw tijdrovend. Hier komt de grafische rekenmachine weer van pas! De TI-nspire heeft 2 opties om de overschrijdingskans van de Poissonverdeling uit te rekenen: P(X=k) = poisspdf(μ,k) en P(o X b) = poisspdf(μ,o,b) Het aantal verkeersdoden in Nederland is ongeveer 1200 per jaar, dus μ = 1200/365 3,3 per dag. De kans, dat er op een willekeurige dag meer dan 6 doden (x = 7) vallen is, is P(X 7) 0,051. Met de TI zijn er twee manieren om dit te berekenen: P(X 7) = 1 poisscdf(3.3,0,6) 0,051 en P(X 7) = poisscdf(3.3,7,1000) 0, van de Poisson-verdeling Zwemwater wordt gecontroleerd op de aanwezigheid van Coli-bacteriën, die indicator zijn voor fecale verontreiniging. In 0,1 ml water bevinden zich in een bepaald geval gemiddeld 3,4 bacteriën. De kansen, dat we in een kweekmonster van 0,1 ml 0, 1, 2,..., 9 bacteriën aantreffen, kunnen met de Poissonverdeling met μ = 3.4 worden berekend en staan in de tabel. Reken zelf enkele kansen na met de grafische rekenmachine! Uit de tabel volgt, dat de kans om bijvoorbeeld geen bacteriën aan te treffen gelijk is aan P(0) = De kans om 4 of meer bacteriën te vinden is de overschrijdingskans P(X 4) = 0,19 + 0,13 + 0,07 + 0,03 + 0,01 + 0,01 = 0,44 De som van alle kansen in de rechterkolom zou 1,00 moeten zijn, maar is 0,99 door afronding en doordat de (zeer kleine) kansen P(X 10) in de tabel zijn weggelaten. De kansverdeling is ook in de grafiek te zien. De Poisson-verdeling is een rechtsscheve verdeling, zoals ook uit de vorm van de kansverdeling in de grafiek blijkt. 19

20 Parameters van de Poisson-verdeling Een Poisson-verdeelde kansvariabele X, met verwachting μ, duiden we aan met: X ~ P(μ) De constante μ is de enige parameter van de betreffende Poisson-verdeling. De kansen en andere eigenschappen van de Poisson-verdeling worden uitsluitend door deze parameter bepaald. Als we dus het gemiddelde van een (groot) aantal tellingen kennen, kunnen we de verdeling van de kansen op allerlei waarden uitrekenen. Het aantal dodelijke verkeersslachtoffers is in Nederland ongeveer 1200 per jaar, dat is 3,3 per dag. De kans op meer dan een verdubbeling (7 doden of meer) van dat aantal op een bepaalde dag is dus P(X 7) = 0,051. Let op: we gaan er daarbij waarschijnlijk ten onrechte vanuit, dat het aantal verkeersdoden per dag louter door het toeval wordt bepaald en niet (ook) door bijvoorbeeld extra drukke dagen in het weekend of de vakantie Verwachtingen van de Poisson-verdeling De verwachtingswaarde van de Poisson-verdeelde kansvariabele X is: E(X) = μ en de variantie van de kansverdeling is: E(X - μ)² = σ² = μ Karakteristiek voor de Poisson-verdeling is dat μ = σ², dus dat het gemiddelde gelijk is aan de variantie (of dat de standaarafwijking gelijk is aan de wortel uit het gemiddelde). 20

Statistiek I Samenvatting. Prof. dr. Carette

Statistiek I Samenvatting. Prof. dr. Carette Statistiek I Samenvatting Prof. dr. Carette Opleiding: bachelor of science in de Handelswetenschappen Academiejaar 2016 2017 Inhoudsopgave Hoofdstuk 1: Statistiek, gegevens en statistisch denken... 3 De

Nadere informatie

5.0 Voorkennis. Voorbeeld 1: In een vaas zitten 10 rode, 5 witte en 6 blauwe knikkers. Er worden 9 knikkers uit de vaas gepakt.

5.0 Voorkennis. Voorbeeld 1: In een vaas zitten 10 rode, 5 witte en 6 blauwe knikkers. Er worden 9 knikkers uit de vaas gepakt. 5.0 Voorkennis Voorbeeld 1: In een vaas zitten 10 rode, 5 witte en 6 blauwe knikkers. Er worden 9 knikkers uit de vaas gepakt. a) Bereken de kans op minstens 7 rode knikkers: P(minstens 7 rood) = P(7 rood)

Nadere informatie

11.1 Kansberekeningen [1]

11.1 Kansberekeningen [1] 11.1 Kansberekeningen [1] Kansdefinitie van Laplace: P(gebeurtenis) = Aantal gunstige uitkomsten/aantal mogelijke uitkomsten Voorbeeld 1: Wat is de kans om minstens 16 te gooien, als je met 3 dobbelstenen

Nadere informatie

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel.

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel. 9.0 Voorkennis Bij samengestelde kansexperimenten maak je gebruik van de productregel. Productregel: Voor de gebeurtenis G 1 bij het ene kansexperiment en de gebeurtenis G 2 bij het andere kansexperiment

Nadere informatie

Samenvatting Statistiek

Samenvatting Statistiek Samenvatting Statistiek De hoofdstukken 1 t/m 3 gaan over kansrekening: het uitrekenen van kansen in een volledig gespecifeerd model, waarin de parameters bekend zijn en de kans op een gebeurtenis gevraagd

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert VOOR HET SECUNDAIR ONDERWIJS Kansmodellen. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg . Populatie: een intuïtieve definitie.... Een

Nadere informatie

Medische Statistiek Kansrekening

Medische Statistiek Kansrekening Medische Statistiek Kansrekening Medisch statistiek- kansrekening Hoorcollege 1 Uitkomstenruimte vaststellen Ook wel S of E. Bij dobbelsteen: E= {1,2,3,4,5,6} Een eindige uitkomstenreeks Bij het gooien

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 7 Dinsdag 11 Oktober 1 / 33 2 Statistiek Vandaag: Populatie en steekproef Maten Standaardscores Normale verdeling Stochast en populatie Experimenten herhalen 2 / 33 3

Nadere informatie

3.1 Het herhalen van kansexperimenten [1]

3.1 Het herhalen van kansexperimenten [1] 3.1 Het herhalen van kansexperimenten [1] Voorbeeld: Op een schijf staan een zestal afbeeldingen in even grote vakjes: 3 keer appel, 2 keer banaan, 1 keer peer. Sandra draait zes keer aan de schijf. a)

Nadere informatie

Statistiek voor A.I. College 6. Donderdag 27 September

Statistiek voor A.I. College 6. Donderdag 27 September Statistiek voor A.I. College 6 Donderdag 27 September 1 / 1 2 Deductieve statistiek Kansrekening 2 / 1 Vraag: Afghanistan In het leger wordt uit een groep van 6 vrouwelijke en 14 mannelijke soldaten een

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 4 Donderdag 22 September 1 / 31 1 Kansrekening Vandaag : Vragen Bernouilli verdelingen Binomiale verdelingen Voorwaardelijke kansen 2 / 31 Vragen: multiple choice Bij

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 6 Donderdag 30 September 1 / 25 1 Kansrekening Indeling: Voorwaardelijke kansen Onafhankelijkheid Stelling van Bayes 2 / 25 Vraag: Afghanistan Vb. In het leger wordt

Nadere informatie

Binomiale verdelingen

Binomiale verdelingen Binomiale verdelingen Les 1: Kans en combinatoriek (Deze les sluit aan bij paragraaf 1 van Hoofdstuk 2 Binomiale en normale verdelingen van de Wageningse Methode, http://www.wageningsemethode.nl/methode/het-lesmateriaal/?s=y456v-d)

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS

VOOR HET SECUNDAIR ONDERWIJS VOOR HET SECUNDAIR ONDERWIJS Steekproefmodellen en normaal verdeelde steekproefgrootheden 5. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg

Nadere informatie

Statistiek voor A.I. College 7. Dinsdag 2 Oktober

Statistiek voor A.I. College 7. Dinsdag 2 Oktober Statistiek voor A.I. College 7 Dinsdag 2 Oktober 1 / 30 2 Deductieve statistiek Kansrekening 2 / 30 Vraag: test Een test op HIV is 90% betrouwbaar: als een persoon HIV heeft is de kans op een positieve

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions

werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions cursus 4 mei 2012 werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions Huiswerk P&D, opgaven Chapter 6: 9, 19, 25, 33 P&D, opgaven Appendix A: 1, 9 doen

Nadere informatie

Statistiek voor A.I. College 3. Dinsdag 18 September 2012

Statistiek voor A.I. College 3. Dinsdag 18 September 2012 Statistiek voor A.I. College 3 Dinsdag 18 September 2012 1 / 45 2 Deductieve statistiek Kansrekening 2 / 45 Uitkomstenruimte 3 / 45 Vragen: voorspellen Een charlatan zegt te kunnen voorspellen of een ongeboren

Nadere informatie

Hoofdstuk 4 Kansen. 4.1 Randomheid

Hoofdstuk 4 Kansen. 4.1 Randomheid Hoofdstuk 4 Kansen 4.1 Randomheid Herhalingen en kansen Als je een munt opgooit (of zelfs als je een SRS trekt) kunnen de resultaten van tevoren voorspeld worden, omdat de uitkomsten zullen variëren wanneer

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Inleveren: 12 januari 2011, VOOR het college Afspraken Serie 1 mag gemaakt en ingeleverd worden in tweetallen. Schrijf duidelijk je naam, e-mail

Nadere informatie

Oefeningen statistiek

Oefeningen statistiek Oefeningen statistiek Hoofdstuk De wereld van de kansmodellen.. Tabel A en tabel B zijn de kansverdelingen van model X en van model Y. In beide tabellen is een getal verloren gegaan. Kan jij dat verloren

Nadere informatie

Uitwerkingen Mei 2012. Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

Uitwerkingen Mei 2012. Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek Uitwerkingen Mei 2012 Eindexamen VWO Wiskunde C Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek I Tjing Opgave 1. Het aantal hoofdstukken in de I Tjing correspondeert met het totale aantal

Nadere informatie

Statistiek voor A.I. College 4. Donderdag 20 September 2012

Statistiek voor A.I. College 4. Donderdag 20 September 2012 Statistiek voor A.I. College 4 Donderdag 20 September 2012 1 / 30 2 Deductieve statistiek Kansrekening 2 / 30 Cycle 3 / 30 Context 4 / 30 2 Deductieve statistiek Vandaag: Eigenschappen kansen Oneindige

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert VOOR HET SECUNDAIR ONDERWIJS Kansmodellen 4. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg . Een concreet voorbeeld.... Een kansmodel

Nadere informatie

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 5: Steekproevendistributies Hoofdstuk 5: Steekproevendistributies Inleiding Statistische gevolgtrekkingen worden gebruikt om conclusies over een populatie of proces te trekken op basis van data. Deze data wordt samengevat door middel

Nadere informatie

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een klein kapitaaltje

Nadere informatie

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling 12.0 Voorkennis Voorbeeld 1: Yvette pakt vier knikkers uit een vaas waar er 20 inzitten. 9 van de knikkers zijn rood en 11 van de knikkers zijn blauw. X = het aantal rode knikkers dat Yvette pakt. Er zijn

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 2 Donderdag 15 September 1 / 42 1 Kansrekening Vandaag: Vragen Eigenschappen van kansen Oneindige discrete uitkomstenruimtes Continue uitkomstenruimtes Continue stochasten

Nadere informatie

In de Theorie worden de begrippen toevalsvariabele, kansverdeling en verwachtingswaarde toegelicht.

In de Theorie worden de begrippen toevalsvariabele, kansverdeling en verwachtingswaarde toegelicht. Toevalsvariabelen Verkennen www.mathall.nl MAThADORE-basic HAVO/VWO /5/6 VWO wi-a Kansrekening Toevalsvariabelen Inleiding Verkennen Beantwoord de vragen bij Verkennen. Uitleg www.mathall.nl MAThADORE-basic

Nadere informatie

Laplace Experimenteel Intuïtie Axiomatisch. Het kansbegrip. W. Oele. 27 januari 2014. W. Oele Het kansbegrip

Laplace Experimenteel Intuïtie Axiomatisch. Het kansbegrip. W. Oele. 27 januari 2014. W. Oele Het kansbegrip 27 januari 2014 Deze les Kanstheorie volgens Laplace Experimentele kanstheorie Axiomatische kanstheorie Intuïtie Kanstheorie volgens Laplace (1749-1827) De kans op een gebeurtenis wordt verkregen door

Nadere informatie

Lesbrief hypothesetoetsen

Lesbrief hypothesetoetsen Lesbrief hypothesetoetsen 00 "Je gaat het pas zien als je het door hebt" Johan Cruijff Willem van Ravenstein Inhoudsopgave Inhoudsopgave... Hoofdstuk - voorkennis... Hoofdstuk - mens erger je niet... 3

Nadere informatie

Inleiding Applicatie Software - Statgraphics

Inleiding Applicatie Software - Statgraphics Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 8 Donderdag 13 Oktober 1 / 23 2 Statistiek Vandaag: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 23 Stochast en populatie

Nadere informatie

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur Kansrekening en statistiek wi20in deel I 29 januari 200, 400 700 uur Bij dit examen is het gebruik van een (evt grafische rekenmachine toegestaan Tevens krijgt u een formuleblad uitgereikt na afloop inleveren

Nadere informatie

3.0 Voorkennis. Het complement van de verzameling V is de verzameling Dit zijn alle elementen van de uitkomstenverzameling U die niet in V zitten.

3.0 Voorkennis. Het complement van de verzameling V is de verzameling Dit zijn alle elementen van de uitkomstenverzameling U die niet in V zitten. 3.0 Voorkennis De vereniging van de verzamelingen V en is gelijk aan de uitkomstenverzameling U in het plaatje hiernaast. De doorsnede van de verzamelingen V en V is een lege verzameling. Het complement

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 2 Donderdag 16 September 1 / 31 1 Kansrekening Indeling: Eigenschappen van kansen Continue uitkomstenruimtes Continue stochasten 2 / 31 Vragen: cirkels Een computer genereert

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 5 Dinsdag 27 September 1 / 30 1 Kansrekening Vandaag: Voorwaardelijke kansen Onafhankelijkheid Stelling van Bayes 2 / 30 Vraag: test Een test op HIV is 90% betrouwbaar:

Nadere informatie

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (2WS4, dinsdag 17 juni 28, van 9. 12. uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur Kansrekening en statistiek WI05IN deel I 4 november 0, 4.00 7.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad wordt uitgereikt. Meerkeuzevragen Toelichting:

Nadere informatie

13.1 Kansberekeningen [1]

13.1 Kansberekeningen [1] 13.1 Kansberekeningen [1] Herhaling kansberekeningen: Somregel: Als de gebeurtenissen G 1 en G 2 geen gemeenschappelijke uitkomsten hebben geldt: P(G 1 of G 2 ) = P(G 1 ) + P(G 2 ) B.v. P(3 of 4 gooien

Nadere informatie

14.1 Kansberekeningen [1]

14.1 Kansberekeningen [1] 14.1 Kansberekeningen [1] Herhaling kansberekeningen: Somregel: Als de gebeurtenissen G 1 en G 2 geen gemeenschappelijke uitkomsten hebben geldt: P(G 1 of G 2 ) = P(G 1 ) + P(G 2 ) B.v. P(3 of 4 gooien

Nadere informatie

college 4: Kansrekening

college 4: Kansrekening college 4: Kansrekening Deelgebied van de statistiek Doel: Kansen berekenen voor het waarnemen van bepaalde uitkomsten Kansrekening 1. Volgordeproblemen Permutaties Variaties Combinaties 2. Kans 3. Voorwaardelijke

Nadere informatie

HOOFDSTUK I - INLEIDENDE BEGRIPPEN

HOOFDSTUK I - INLEIDENDE BEGRIPPEN HOOFDSTUK I - INLEIDENDE BEGRIPPEN 1.1 Waarschijnlijkheidsrekening 1 Beschouw een toevallig experiment (de resultaten zijn aan het toeval te danken) Noem V de verzameling van alle mogelijke uitkomsten

Nadere informatie

Opgaven voor Kansrekening

Opgaven voor Kansrekening Wiskunde 1 voor kunstmatige intelligentie Opgaven voor Kansrekening Opgave 1. Een oneerlijke dobbelsteen is zo gemaakt dat 3 drie keer zo vaak valt als 4 en 2 twee keer zo vaak als 5. Verder vallen 1,

Nadere informatie

Overzicht. Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen. Voorwaardelijke kans. Voorbeeld: Probabilistisch redeneren

Overzicht. Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen. Voorwaardelijke kans. Voorbeeld: Probabilistisch redeneren Overzicht Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen Cursusjaar 2009 Peter de Waal Departement Informatica Voorwaardelijke kans Rekenregels Onafhankelijkheid Voorwaardelijke Onafhankelijkheid

Nadere informatie

Hoofdstuk 6 Discrete distributies

Hoofdstuk 6 Discrete distributies Hoofdstuk 6 Discrete distributies Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Discrete distributies p 1/33 Discrete distributies binomiale verdeling

Nadere informatie

Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid

Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid Les 4 Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid Sommige vragen uit de kanstheorie hebben een antwoord dat niet met de intuïtie van iedereen klopt. Een voorbeeld hiervoor is het Monty-Hall

Nadere informatie

Faculteit, Binomium van Newton en Driehoek van Pascal

Faculteit, Binomium van Newton en Driehoek van Pascal Faculteit, Binomium van Newton en Driehoek van Pascal 1 Faculteit Definitie van de faculteit Wisnet-hbo update aug. 2007 (spreek uit k-faculteit) is: k Dit geldt voor elk geheel getal k groter dan 0 en

Nadere informatie

Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid

Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid Les 2 Voorwaardelijke kansen, de Bayes regel en onafhankelijkheid Sommige vragen uit de kanstheorie hebben een antwoord die intuïtief niet verwacht zou worden. Een voorbeeld hiervoor is het Monty-Hall

Nadere informatie

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Moore, McCabe & Craig: 3.3 Toward Statistical Inference From Probability to Inference 5.1 Sampling Distributions for

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening (2WS2, Vrijdag 23 januari 25, om 9:-2:. Dit is een tentamen met gesloten boek. De uitwerkingen van de opgaven dienen

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 5 Dinsdag 28 September 1 / 25 1 Kansrekening Indeling: Bernouilli verdelingen Binomiale verdelingen Voorwaardelijke kansen Voor software R: van http://sourceforge.net

Nadere informatie

Statistiek, gegevens en een kritische houding

Statistiek, gegevens en een kritische houding Statistiek Hoofdstuk 1. Statistiek, gegevens en een kritische houding 1.1. Statistiek 1.2. De wetenschap statistiek de wetenschap van gegevens verzamelen evalueren (classificeren, samenvatten, organiseren,

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen

Nadere informatie

1. De wereld van de kansmodellen.

1. De wereld van de kansmodellen. STATISTIEK 3 DE GRAAD.. De wereld van de kansmodellen... Kansmodellen X kansmodel Discreet model Continu model Kansverdeling Vaas Staafdiagram Dichtheidsfunctie f(x) GraJiek van f Definitie: Een kansmodel

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

. Dan geldt P(B) = a. 1 4. d. 3 8

. Dan geldt P(B) = a. 1 4. d. 3 8 Tentamen Statistische methoden 4052STAMEY juli 203, 9:00 2:00 Studienummers: Vult u alstublieft op het meerkeuzevragenformulier uw Delftse studienummer in (tbv automatische verwerking); en op het open

Nadere informatie

Uitwerkingen Mei Eindexamen VWO Wiskunde A. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

Uitwerkingen Mei Eindexamen VWO Wiskunde A. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek Uitwerkingen Mei 2012 Eindexamen VWO Wiskunde A Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek Schroefas Opgave 1. In de figuur trekken we een lijn tussen 2600 tpm op de linkerschaal en

Nadere informatie

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6 CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE Tentamen Wiskunde A Datum: 19 december 2018 Tijd: 13.30 16.30 uur Aantal opgaven: 6 Lees onderstaande aanwijzingen s.v.p. goed door voordat u met het tentamen begint.

Nadere informatie

Examenprogramma wiskunde A vwo

Examenprogramma wiskunde A vwo Examenprogramma wiskunde A vwo Het eindexamen Het eindexamen bestaat uit het centraal examen en het schoolexamen. Het examenprogramma bestaat uit de volgende domeinen: Domein A Vaardigheden Domein Bg Functies

Nadere informatie

VB: De hoeveelheid neemt nu met 12% af. Hoeveel was de oorspronkelijke hoeveelheid? = 1655 oud = 1655 nieuw = 0,88 x 1655 = 1456

VB: De hoeveelheid neemt nu met 12% af. Hoeveel was de oorspronkelijke hoeveelheid? = 1655 oud = 1655 nieuw = 0,88 x 1655 = 1456 Formules, grafieken en tabellen Procenten - altijd afronden op 1 decimaal tenzij anders vermeld VB: Een hoeveelheid neemt met 12% toe to 1456. Hoeveel was de oorspronkelijke hoeveelheid? Oud =? Nieuw =

Nadere informatie

Opgaven voor Kansrekening - Oplossingen

Opgaven voor Kansrekening - Oplossingen Wiskunde voor kunstmatige intelligentie Opgaven voor Kansrekening - Opgave. Een oneerlijke dobbelsteen is zo gemaakt dat drie keer zo vaak valt als 4 en twee keer zo vaak als 5. Verder vallen,, en even

Nadere informatie

Kansrekening en Statistiek. Overzicht Kansrekening

Kansrekening en Statistiek. Overzicht Kansrekening Kansrekening en Statistiek Overzicht Kansrekening 1 / 30 Overzicht: stochasten Discrete stochasten X - distributiefuncties f P(X A) = i A f (x) = i A P(X = i). 2 / 30 Overzicht: stochasten Discrete stochasten

Nadere informatie

Feedback proefexamen Statistiek I 2009 2010

Feedback proefexamen Statistiek I 2009 2010 Feedback proefexamen Statistiek I 2009 2010 Het correcte antwoord wordt aangeduid door een sterretje. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Een derde van de mannen is

Nadere informatie

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99 Inhoud 1 Inleiding tot de beschrijvende statistiek 13 1.1 Een eerste verkenning 14 1.2 Frequentieverdelingen 22 1.3 Grafische voorstellingen 30 1.4 Diverse diagrammen 35 1.5 Stamdiagram, histogram en frequentiepolygoon

Nadere informatie

5,1. Samenvatting door een scholier 1647 woorden 18 oktober keer beoordeeld. Wiskunde A

5,1. Samenvatting door een scholier 1647 woorden 18 oktober keer beoordeeld. Wiskunde A Samenvatting door een scholier 1647 woorden 18 oktober 2010 5,1 4 keer beoordeeld Vak Wiskunde A Samenvatting A2 Recht evenredig Bij een stapgrootte van y hoort een constante eerste augmentatie van x Omgekeerd

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 1 Dinsdag 14 September 1 / 34 Literatuur http://www.phil.uu.nl/ iemhoff Applied Statistics for the Behavioral Sciences - 5th edition, Dennis E. Hinkle, William Wiersma,

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door

Nadere informatie

Combinatoriek en rekenregels

Combinatoriek en rekenregels Combinatoriek en rekenregels Les 4: Rekenregels (deze les sluit aan bij de paragraaf 8 van Hoofdstuk 1 Combinatoriek en Rekenregels van de Wageningse Methode, http://www.wageningsemethode.nl/methode/het-lesmateriaal/?s=y456v-d)

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie

Nadere informatie

Economie en maatschappij(a/b)

Economie en maatschappij(a/b) Natuur en gezondheid(a/b) Economie en maatschappij(a/b) Cultuur en maatschappij(a/c) http://profielkeuze.qompas.nl/ Economische studies Talen Recht Gedrag en maatschappij http://www.connectcollege.nl/download/decanaat/vwo%20doorstroomeisen%20universiteit.pdf

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 1 Woensdag 9 September 1 / 39 Site: http://www.phil.uu.nl/ iemhoff Literatuur: Applied Statistics for the Behavioral Sciences - 5th edition, Dennis E. Hinkle, William

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening (2WS2), Vrijdag 24 januari 24, om 9:-2:. Dit is een tentamen met gesloten boek. De uitwerkingen van de opgaven

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Populatie: De gehele groep elementen waarover informatie wordt gewenst. Statistiek I Werkcollege 1 Populatie: De gehele groep elementen waarover informatie wordt gewenst. Steekproef: Gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te vergaren. Eenheden:

Nadere informatie

Opgaven voor Kansrekening

Opgaven voor Kansrekening Opgaven voor Kansrekening Opgave 1. Je hebt 4 verschillende wiskunde boeken, 6 psychologie boeken en 2 letterkundige boeken. Hoeveel manieren zijn er om deze twaalf boeken op een boord te plaatsen als:

Nadere informatie

LANDSEXAMEN VWO Het examenprogramma Het examenprogramma voor het commissie-examen Wiskunde D bestaat uit de volgende (sub)domeinen:

LANDSEXAMEN VWO Het examenprogramma Het examenprogramma voor het commissie-examen Wiskunde D bestaat uit de volgende (sub)domeinen: LANDSEXAMEN VWO 2017-2018 Examenprogramma WISKUNDE D (V.W.O. ) (nieuw programma) 1 Het eindexamen Wiskunde D kent slechts het commissie-examen. Er is voor wiskunde D dus geen centraal schriftelijk examen.

Nadere informatie

Voorbeelden van gebruik van 5 VUSTAT-apps

Voorbeelden van gebruik van 5 VUSTAT-apps Voorbeelden van gebruik van 5 VUSTAT-apps Piet van Blokland Begrijpen van statistiek door simulaties en visualisaties Hoe kun je deze apps gebruiken bij het statistiek onderwijs? De apps van VUSTAT zijn

Nadere informatie

Tentamen Inleiding Kansrekening wi juni 2010, uur

Tentamen Inleiding Kansrekening wi juni 2010, uur Technische Universiteit Delft Mekelweg Faculteit Electrotechniek, Wiskunde en Informatica 8 CD Delft Tentamen Inleiding Kansrekening wi juni, 9.. uur Bij dit examen is het gebruik van een (evt. grafische

Nadere informatie

36, P (5) = 4 36, P (12) = 1

36, P (5) = 4 36, P (12) = 1 Les 2 Kansverdelingen We hebben in het begin gesteld dat we de kans voor een zekere gunstige uitkomst berekenen als het aantal gunstige uitkomsten gedeelt door het totale aantal mogelijke uitkomsten. Maar

Nadere informatie

Tentamen Kansrekening en Statistiek (2WS04), woensdag 30 juni 2010, van 9.00 12.00 uur.

Tentamen Kansrekening en Statistiek (2WS04), woensdag 30 juni 2010, van 9.00 12.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (WS4), woensdag 3 juni, van 9.. uur. Dit is een tentamen met gesloten boek. De uitwerkingen van de

Nadere informatie

7.0 Voorkennis , ,

7.0 Voorkennis , , 7.0 Voorkennis Een gokkast bestaat uit een drietal schijven die ronddraaien. Op schijf 1 staan: 5 bananen, 4 appels, 3 citroenen en 3 kersen; Op schijf 2 staan: 7 bananen, 3 appels, 2 citroenen en 3 kersen;

Nadere informatie

2.1 Kansen [1] Er geldt nu dat de kans op som is 6 gelijk is aan: P(som is 6) =

2.1 Kansen [1] Er geldt nu dat de kans op som is 6 gelijk is aan: P(som is 6) = 2.1 Kansen [1] Voorbeeld 1: Als je gooit met twee dobbelstenen zijn er in totaal 6 6 = 36 mogelijke uitkomsten. Deze staan in het rooster hiernaast. De gebeurtenis som is 6 komt vijf keer voor. Het aantal

Nadere informatie

Statistiek voor A.I. College 5. Dinsdag 25 September 2012

Statistiek voor A.I. College 5. Dinsdag 25 September 2012 Statistiek voor A.I. College 5 Dinsdag 25 September 2012 1 / 34 2 Deductieve statistiek Kansrekening 2 / 34 Percentages 3 / 34 Vragen: blikkie Kinderen worden slanker als ze anderhalf jaar lang limonade

Nadere informatie

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE Tentamen Wiskunde A Datum: 29 juli 2013 Tijd: 14.00-17.00 uur Aantal opgaven: 7 Zet uw naam op alle in te leveren blaadjes. Laat bij elke opgave door middel van

Nadere informatie

Kern 1 Rekenen met binomiale kansen

Kern 1 Rekenen met binomiale kansen Netwerk e editie havo A Hoofdstuk De binomiale verdeling uitwerkingen Hoofdstuk De binomiale verdeling uitwerkingen Kern Rekenen met binomiale kansen a Omdat er steeds twee mogelijkheden zijn: zwart óf

Nadere informatie

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE DEEL 3 INDUCTIEVE STATISTIEK INHOUD H 10: INLEIDING TOT DE INDUCTIEVE STATISTIEK H 11: PUNTSCHATTING 11.1 ALGEMEEN 11.1.1 Definities 11.1.2 Eigenschappen 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE 11.3

Nadere informatie

Hoe bereken je een kans? Voorbeeld. aantal gunstige uitkomsten aantal mogelijke uitkomsten P(G) =

Hoe bereken je een kans? Voorbeeld. aantal gunstige uitkomsten aantal mogelijke uitkomsten P(G) = Hoe bereken je een kans? P(G) = aantal gunstige uitkomsten aantal mogelijke uitkomsten Voorbeeld Je gooit met twee dobbelstenen. Hoe groot is de kans dat de som van de ogen 7 is? Regels Een kans is een

Nadere informatie

introductie kansen pauze meer kansen random variabelen transformaties ten slotte

introductie kansen pauze meer kansen random variabelen transformaties ten slotte toetsende statistiek week 1: kansen en random variabelen Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter 4: Probability: The Study of Randomness 4.1: Randomness 4.2: Probability

Nadere informatie

SOCIALE STATISTIEK (deel 2)

SOCIALE STATISTIEK (deel 2) SOCIALE STATISTIEK (deel 2) D. Vanpaemel KU Leuven D. Vanpaemel (KU Leuven) SOCIALE STATISTIEK (deel 2) 1 / 57 Hoofdstuk 5: Schatters en hun verdeling 5.1 Steekproefgemiddelde als toevalsvariabele D. Vanpaemel

Nadere informatie

Tentamenset A. 2. Welke van de volgende beweringen is waar? c. N R N d. R Z R

Tentamenset A. 2. Welke van de volgende beweringen is waar? c. N R N d. R Z R Tentamenset A. Gegeven de volgende verzamelingen A en B. A is de verzameling van alle gehele getallen tussen de 0 en 0 die deelbaar zijn door, en B is de verzameling gehele positieve getallen deelbaar

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 10 Donderdag 14 Oktober 1 / 71 1 Kansrekening Indeling: Bayesiaans leren 2 / 71 Bayesiaans leren 3 / 71 Bayesiaans leren: spelletje Vb. Twee enveloppen met kralen, waarvan

Nadere informatie

Toetsen van Hypothesen. Het vaststellen van de hypothese

Toetsen van Hypothesen. Het vaststellen van de hypothese Toetsen van Hypothesen Wisnet-hbo update maart 2008 1. en Het vaststellen van de hypothese De nulhypothese en de Alternatieve hypothese. Het gaat in deze paragraaf puur alleen om de formulering. Er wordt

Nadere informatie

1BA PSYCH Statistiek 1 Oefeningenreeks 3 1

1BA PSYCH Statistiek 1 Oefeningenreeks 3 1 Juno KOEKELKOREN D.1.3. OEFENINGENREEKS 3 OEFENING 1 In onderstaande tabel vind je zes waarnemingen van twee variabelen (ratio meetniveau). Eén van de waarden van y is onbekend. Waarde x y 1 1 2 2 9 2

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

4.0 Voorkennis. Bereken het aantal manieren om de functies te verdelen:

4.0 Voorkennis. Bereken het aantal manieren om de functies te verdelen: 4.0 Voorkennis Voorbeeld 1: Een bestuur bestaat uit 6 personen. Uit deze 6 personen wordt eerst een voorzitter, dan een secretaris en tot slot een penningmeester gekozen. Bereken het aantal manieren om

Nadere informatie

Statistiek voor A.I. College 10. Dinsdag 16 Oktober

Statistiek voor A.I. College 10. Dinsdag 16 Oktober Statistiek voor A.I. College 10 Dinsdag 16 Oktober 1 / 30 Jullie - onderzoek Geert-Jan, Joris, Brechje Horizontaal: lengte Verticaal: lengte tussen topjes middelvingers met gestrekte armen. DIII 170 175

Nadere informatie