Kansrekening en Statistiek College 9 Woensdag 7 Oktober 1 / 51
Kansrekening en Statistiek? Bevordert luieren de fantasie? Psychologie 2 / 51
Kansrekening en Statistiek? Bevordert luieren de fantasie? Psychologie Werkt paracetamol? Geneeskunde 2 / 51
Kansrekening en Statistiek? Bevordert luieren de fantasie? Psychologie Werkt paracetamol? Geneeskunde Wat is de te verwachtte winst bij roulette? Kansspelen 2 / 51
Kansrekening en Statistiek? Bevordert luieren de fantasie? Psychologie Werkt paracetamol? Geneeskunde Wat is de te verwachtte winst bij roulette? Kansspelen Wat is een representatieve steekproef? 2 / 51
Kansrekening en Statistiek? Bevordert luieren de fantasie? Psychologie Werkt paracetamol? Geneeskunde Wat is de te verwachtte winst bij roulette? Kansspelen Wat is een representatieve steekproef? Wat is de waarschijnlijkheid van een conclusie? 2 / 51
Indeling college 1 Kansrekening. 2 Statistiek. Onderweg Toepassingen en Filosofie. 3 / 51
Kansrekening en Statistiek? Inductief redeneren: de mate waarin iets volgt uit iets anders. 4 / 51
Statistiek Over het algemeen verwerpt de orthodoxe statistiek de methode van Bayesiaans leren. 5 / 51
Statistiek Over het algemeen verwerpt de orthodoxe statistiek de methode van Bayesiaans leren. Beschrijvende statistiek Inductieve statistiek 5 / 51
2 Statistiek Indeling vandaag: Typische vragen Het classificeren en weergeven van data. 6 / 51
Typische vragen: referendum Ierland 7 / 51
Typische vragen: referendum Ierland Wat is de kans dat de uitkomst overeenkomt met de polls? 7 / 51
Typische vragen: lengte Van 1000 Nederlanders wordt de lengte opgemeten. Het gemiddelde is 1.70m. 8 / 51
Typische vragen: lengte Van 1000 Nederlanders wordt de lengte opgemeten. Het gemiddelde is 1.70m. Wat is de kans dat de gemiddelde lengte van Nederlanders 1.70m is? 8 / 51
Typische vragen: opleiding jongeren in de EU Aandeel jongeren (18-25) zonder startkwalificaties: 9 / 51
Typische vragen: opleiding jongeren in de EU - vervolg Aandeel jongeren (0-25) naar land: 10 / 51
Typische vragen: verwachtingswaarde Wat is de te verwachtte winst bij het vier maal op rood inzetten bij roulette? 11 / 51
Typische vragen: emigratie Personen met emigratieplannen naar herkomst (2008): 12 / 51
Typische vragen: suggestie Zelfde informatie? y y 4 4 3 3 2 2 1 1 0 1 2 3 4 x 0 2 4 6 8 x 13 / 51
Typische vragen: steekproef Op initiatief van onderzoeksbureau Trendbox, Miss Etam en communicatiebureau BSUR werd er onderzoek gedaan naar de Nederlandse vrouw en haar zelfbeeld. Zij vindt zichzelf (in %): Betrouwbaar 62 Eerlijk 50 Sociaal 46 Vriendelijk 46 Trouw 46 Vrolijk 32 Serieus 25 Onzeker 15 Impulsief 14 Sterk 12 14 / 51
Typische vragen: steekproef Op initiatief van onderzoeksbureau Trendbox, Miss Etam en communicatiebureau BSUR werd er onderzoek gedaan naar de Nederlandse vrouw en haar zelfbeeld. Zij vindt zichzelf (in %): Betrouwbaar 62 Eerlijk 50 Sociaal 46 Vriendelijk 46 Trouw 46 Vrolijk 32 Serieus 25 Onzeker 15 Impulsief 14 Sterk 12 Wat voor steekproef? 14 / 51
Populatie en steekproef: definitie Def. Een populatie bevat alle elementen van een bepaalde groep. 15 / 51
Populatie en steekproef: definitie Def. Een populatie bevat alle elementen van een bepaalde groep. Een parameter is een eigenschap van de populatie. 15 / 51
Populatie en steekproef: definitie Def. Een populatie bevat alle elementen van een bepaalde groep. Een parameter is een eigenschap van de populatie. Een steekproef is een deelverzameling van de groep. 15 / 51
Populatie en steekproef: definitie Def. Een populatie bevat alle elementen van een bepaalde groep. Een parameter is een eigenschap van de populatie. Een steekproef is een deelverzameling van de groep. Een statistiek is een eigenschap van de steekproef. 15 / 51
Populatie en steekproef: definitie Def. Een populatie bevat alle elementen van een bepaalde groep. Een parameter is een eigenschap van de populatie. Een steekproef is een deelverzameling van de groep. Een statistiek is een eigenschap van de steekproef. Een constante is een eigenschap die hetzelfde is voor alle elementen van de populatie. 15 / 51
Populatie en steekproef: definitie Def. Een populatie bevat alle elementen van een bepaalde groep. Een parameter is een eigenschap van de populatie. Een steekproef is een deelverzameling van de groep. Een statistiek is een eigenschap van de steekproef. Een constante is een eigenschap die hetzelfde is voor alle elementen van de populatie. Een variabele is een eigenschap die verschillende waarden kan aannemen voor verschillende elementen van de populatie. 15 / 51
Populatie en steekproef: voorbeelden Vb. De vezameling van alle Nederlanders is een populatie. Elke groep Nederlanders is een steekproef van deze populatie. De gemiddelde lengte van alle Nederlanders is een parameter. De gemiddelde lengte van een groep Nederlanders is een statistiek. De eigenschap Nederlander is een constante voor de populatie. De eigenschap vrouw is een variabele voor de populatie. 16 / 51
Populatie en steekproef: voorbeelden Vb. De vezameling van alle Nederlanders is een populatie. Elke groep Nederlanders is een steekproef van deze populatie. De gemiddelde lengte van alle Nederlanders is een parameter. De gemiddelde lengte van een groep Nederlanders is een statistiek. De eigenschap Nederlander is een constante voor de populatie. De eigenschap vrouw is een variabele voor de populatie. Vb. De vezameling van alle moleculen is een gegeven glas water is een populatie. De verzameling van alle moleculen in een slok water die iemand uit dat glas neemt, is een steekproef. Het aantal waterstofmoleculen in het glas is een parameter. Het aantal waterstofmoleculen in de slok is een statistiek. De eigenschap molecuul is een constante voor de populatie. De eigenschap grootte is een variabele voor de populatie. 16 / 51
Statistiek Beschrijvende statistiek is het classificeren en samenvatten van data. 17 / 51
Statistiek Beschrijvende statistiek is het classificeren en samenvatten van data. Inductieve statistiek is het trekken van conclusies over een populatie uit gegevens over een steekproef. 17 / 51
Statistiek Beschrijvende statistiek is het classificeren en samenvatten van data. Inductieve statistiek is het trekken van conclusies over een populatie uit gegevens over een steekproef. Vaak heeft dit de vorm: de waarschijnlijkheid dat de populatie deze eigenschap heeft is op grond van de steekproef zo en zo groot. 17 / 51
Beschrijvende statistiek 18 / 51
Nominale schaal: voorbeeld Vb. Het aantal verkochte ijsjes in een ijskraam per smaak per dag: vanille pistache straciatelle 100 180 110 19 / 51
Nominale schaal: voorbeeld Vb. Het aantal verkochte ijsjes in een ijskraam per smaak per dag: vanille pistache straciatelle 100 180 110 De categorieën zijn ongeordend. 19 / 51
Ordinaal schaal: voorbeeld Vb. De indeling van ziekenhuizen in de provincie Utrecht naar hygiëne: onvoldoende voldoende goed zeer goed 3 6 7 4 20 / 51
Ordinaal schaal: voorbeeld Vb. De indeling van ziekenhuizen in de provincie Utrecht naar hygiëne: onvoldoende voldoende goed zeer goed 3 6 7 4 De categorieën zijn geordend: onvoldoende < voldoende < goed < zeer goed. 20 / 51
Interval schaal: voorbeeld Vb. De verdeling van de cijfers bij een wiskundetentamen zijn: cijfer 1 2 3 4 5 6 7 8 9 10 aantal 0 1 2 7 1 5 8 4 2 2 21 / 51
Interval schaal: voorbeeld Vb. De verdeling van de cijfers bij een wiskundetentamen zijn: cijfer 1 2 3 4 5 6 7 8 9 10 aantal 0 1 2 7 1 5 8 4 2 2 De categorieën zijn geordend en bestaan elk uit evenveel eenheden. 21 / 51
Ratio schaal: voorbeeld Vb. De aanwezigheid van een giftige stof (in mg) in laboranten: # mg gif 0 1 2 3 4 5 6 # laboranten 5 10 8 4 3 2 0 22 / 51
Ratio schaal: voorbeeld Vb. De aanwezigheid van een giftige stof (in mg) in laboranten: # mg gif 0 1 2 3 4 5 6 # laboranten 5 10 8 4 3 2 0 De categorieën zijn geordend, bestaan elk uit evenveel eenheden en er is een werkelijk nulpunt (een laborant uit categorie 2 bevat half zoveel gif als een laborant uit categorie 4). 22 / 51
Schaal Def. Data kunnen op de volgende wijze geclassificeerd worden: nominale schaal: classiferen zonder ordening 23 / 51
Schaal Def. Data kunnen op de volgende wijze geclassificeerd worden: nominale schaal: classiferen zonder ordening ordinaal schaal: classiferen in geordende categoriën 23 / 51
Schaal Def. Data kunnen op de volgende wijze geclassificeerd worden: nominale schaal: classiferen zonder ordening ordinaal schaal: classiferen in geordende categoriën interval schaal: een ordinaal schaal waarbij elke schaal uit evenveel eenheden bestaat 23 / 51
Schaal Def. Data kunnen op de volgende wijze geclassificeerd worden: nominale schaal: classiferen zonder ordening ordinaal schaal: classiferen in geordende categoriën interval schaal: een ordinaal schaal waarbij elke schaal uit evenveel eenheden bestaat ratio schaal: een interval schaal waarbij er een werkelijk nulpunt is. 23 / 51
Scores Def. De scores zijn de waardes van een waarneming. 24 / 51
Scores Def. De scores zijn de waardes van een waarneming. Vb. Het aantal kinderen per persoon van 5 personen A, B, C, D, E: A B C D E 0 2 1 0 3 24 / 51
Scores Def. De scores zijn de waardes van een waarneming. Vb. Het aantal kinderen per persoon van 5 personen A, B, C, D, E: De scores zijn 0, 1, 2, 3. A B C D E 0 2 1 0 3 24 / 51
Scores Def. De scores zijn de waardes van een waarneming. Vb. Het aantal kinderen per persoon van 5 personen A, B, C, D, E: De scores zijn 0, 1, 2, 3. A B C D E 0 2 1 0 3 Vb. Het aantal biertjes getapt per avond in cafe s X, Y, Z: X Y Z 100 70 180 24 / 51
Scores Def. De scores zijn de waardes van een waarneming. Vb. Het aantal kinderen per persoon van 5 personen A, B, C, D, E: De scores zijn 0, 1, 2, 3. A B C D E 0 2 1 0 3 Vb. Het aantal biertjes getapt per avond in cafe s X, Y, Z: De scores zijn 100, 70, 180. X Y Z 100 70 180 24 / 51
Frequentie distributie Def. Een frequentie distributie geeft per categorie het aantal voorkomens (in de steekproef) in die categorie weer. 25 / 51
Frequentie distributie Def. Een frequentie distributie geeft per categorie het aantal voorkomens (in de steekproef) in die categorie weer. Vb. Het aantal computers per gezin in een bepaald dorp: # computers 0 1 2 3 4 5 6 7 8 9 10 11 # gezinnen 4 3 7 10 15 20 11 9 10 6 4 1 25 / 51
Frequentie versus score Merk op: de representatie van data kan op twee manieren: 26 / 51
Frequentie versus score Merk op: de representatie van data kan op twee manieren: de categorieën zijn de elementen waaraan waargenomen wordt, en elk bevat de waarde van die waarneming (de score). 26 / 51
Frequentie versus score Merk op: de representatie van data kan op twee manieren: de categorieën zijn de elementen waaraan waargenomen wordt, en elk bevat de waarde van die waarneming (de score). de categorieën zijn de waardes van de waarnemingen (de scores), en elk bevat het aantal voorkomens van die score (de frequentie). 26 / 51
Frequentie versus score: voorbeeld Het aantal computers per huis in een straat met 9 huizen, waarbij de categorieën de scores bevatten: huizen H1 H2 H3 H4 H5 H6 H7 H8 H9 # computers 2 3 0 2 5 2 3 1 7 27 / 51
Frequentie versus score: voorbeeld Het aantal computers per huis in een straat met 9 huizen, waarbij de categorieën de scores bevatten: huizen H1 H2 H3 H4 H5 H6 H7 H8 H9 # computers 2 3 0 2 5 2 3 1 7 Het aantal computers per huis in dezelfde straat, waarbij de categorieën de scores zijn en hun inhoud de frequentie van het voorkomen van die score: # computers 0 1 2 3 4 5 6 7 # huizen 1 1 3 2 0 1 0 1 27 / 51
Klassenintervallen Def. Verschillende categorieën kunnen samen een klasse vormen en de frequentie distributie geeft dan het aantal voorkomens in de klassen weer. Het aantal categorieën in een klasse is de klassenbreedte van de klasse. 28 / 51
Klassenintervallen Def. Verschillende categorieën kunnen samen een klasse vormen en de frequentie distributie geeft dan het aantal voorkomens in de klassen weer. Het aantal categorieën in een klasse is de klassenbreedte van de klasse. Vb. Het aantal computers per gezin in een bepaald dorp geclassificeerd met klassenbreedte 3: # computers 0-2 3-5 6-8 9-11 # gezinnen 14 45 30 11 28 / 51
Exacte klassengrenzen Def. Wanneer de categorieën als continu beschouwd kunnen worden vallen de elementen van een categorie eigenlijk alleen binnen zekere grenzen, de exacte klassengrenzen. 29 / 51
Exacte klassengrenzen Def. Wanneer de categorieën als continu beschouwd kunnen worden vallen de elementen van een categorie eigenlijk alleen binnen zekere grenzen, de exacte klassengrenzen. Meestal zijn de exacte klassengrenzen een halve eenheid onder en boven de klassengrenzen. 29 / 51
Exacte klassengrenzen Def. Wanneer de categorieën als continu beschouwd kunnen worden vallen de elementen van een categorie eigenlijk alleen binnen zekere grenzen, de exacte klassengrenzen. Meestal zijn de exacte klassengrenzen een halve eenheid onder en boven de klassengrenzen. Aanname: Er wordt aangenomen dat de scores in een klasseninterval uniform verdeeld zijn over het interval en adequaat gerepresenteerd worden door het middelpunt. 29 / 51
Exacte klassengrenzen Def. Wanneer de categorieën als continu beschouwd kunnen worden vallen de elementen van een categorie eigenlijk alleen binnen zekere grenzen, de exacte klassengrenzen. Meestal zijn de exacte klassengrenzen een halve eenheid onder en boven de klassengrenzen. Aanname: Er wordt aangenomen dat de scores in een klasseninterval uniform verdeeld zijn over het interval en adequaat gerepresenteerd worden door het middelpunt. Vb. De lengtes van een groep studenten in centimers: klassenintervallen frequentie exacte grenzen 151-160 4 150.5-160.5 161-170 10 160.5-170.5 171-180 9 170.5-180.5 181-190 8 180.5-190.5 191-200 2 190.5-200.5 29 / 51
Data ordenen Def. De meest gebruikte maten om distributies (kort) te beschrijven zijn: vorm (grafisch) 30 / 51
Data ordenen Def. De meest gebruikte maten om distributies (kort) te beschrijven zijn: vorm (grafisch) gemiddelde (rekenkundig gemiddelde, modus, mediaan, percentiel) 30 / 51
Data ordenen Def. De meest gebruikte maten om distributies (kort) te beschrijven zijn: vorm (grafisch) gemiddelde (rekenkundig gemiddelde, modus, mediaan, percentiel) variantie (de spreiding van de scores) 30 / 51
Percentiel Def. De x percentiel van een distributie is dat punt in de distributie waarop of beneden x procent van de scores valt. Notatie: P x. 31 / 51
Percentiel Def. De x percentiel van een distributie is dat punt in de distributie waarop of beneden x procent van de scores valt. Notatie: P x. Vb. Het 50e percentiel is dat punt waar beneden de helft van de scores valt. Het 100e percentiel is het hoogste punt van de distributie. 31 / 51
Percentiel Def. De x percentiel van een distributie is dat punt in de distributie waarop of beneden x procent van de scores valt. Notatie: P x. Vb. Het 50e percentiel is dat punt waar beneden de helft van de scores valt. Het 100e percentiel is het hoogste punt van de distributie. Vb. Het aantal glazen bier gedronken per bezoeker: # glazen 0 1 2 3 4 5 6 7 # frequentie 12 1 20 17 11 8 1 6 cummulatief 12 13 33 50 61 69 70 76 31 / 51
Percentiel Def. De x percentiel van een distributie is dat punt in de distributie waarop of beneden x procent van de scores valt. Notatie: P x. Vb. Het 50e percentiel is dat punt waar beneden de helft van de scores valt. Het 100e percentiel is het hoogste punt van de distributie. Vb. Het aantal glazen bier gedronken per bezoeker: # glazen 0 1 2 3 4 5 6 7 # frequentie 12 1 20 17 11 8 1 6 cummulatief 12 13 33 50 61 69 70 76 Het 17e percentiel is de categorie waar 76 10017 = 13 scores in of beneden vallen: P 17 = 1. 31 / 51
Percentiel Def. De x percentiel van een distributie is dat punt in de distributie waarop of beneden x procent van de scores valt. Notatie: P x. Vb. Het 50e percentiel is dat punt waar beneden de helft van de scores valt. Het 100e percentiel is het hoogste punt van de distributie. Vb. Het aantal glazen bier gedronken per bezoeker: # glazen 0 1 2 3 4 5 6 7 # frequentie 12 1 20 17 11 8 1 6 cummulatief 12 13 33 50 61 69 70 76 Het 17e percentiel is de categorie waar 76 10017 = 13 scores in of beneden vallen: P 17 = 1. Het 92e percentiel is de categorie waar 76 100 92 = 70 scores in of beneden vallen: 31 / 51
Percentiel Def. De x percentiel van een distributie is dat punt in de distributie waarop of beneden x procent van de scores valt. Notatie: P x. Vb. Het 50e percentiel is dat punt waar beneden de helft van de scores valt. Het 100e percentiel is het hoogste punt van de distributie. Vb. Het aantal glazen bier gedronken per bezoeker: # glazen 0 1 2 3 4 5 6 7 # frequentie 12 1 20 17 11 8 1 6 cummulatief 12 13 33 50 61 69 70 76 Het 17e percentiel is de categorie waar 76 10017 = 13 scores in of beneden vallen: P 17 = 1. Het 92e percentiel is de categorie waar 76 100 92 = 70 scores in of beneden vallen: P 92 = 6. 31 / 51
Percentiel: voorbeeld Vb. De lengtes van een groep studenten in centimers: klasse f cf exacte grenzen middelpunt 151-160 4 4 150.5-160.5 155 161-170 10 14 160.5-170.5 165 171-180 9 23 170.5-180.5 175 181-190 8 31 180.5-190.5 185 191-200 2 33 190.5-200.5 195 Het 52e percentiel ligt in het interval waar 33 10052 = 17 scores in of beneden vallen, het interval 171 180. P 52 wordt als volgt berekend. 32 / 51
Percentiel: voorbeeld Vb. De lengtes van een groep studenten in centimers: klasse f cf exacte grenzen middelpunt 151-160 4 4 150.5-160.5 155 161-170 10 14 160.5-170.5 165 171-180 9 23 170.5-180.5 175 181-190 8 31 180.5-190.5 185 191-200 2 33 190.5-200.5 195 Het 52e percentiel ligt in het interval waar 33 10052 = 17 scores in of beneden vallen, het interval 171 180. P 52 wordt als volgt berekend. De exacte klassengrezen van 171-180 zijn 170.5-180.5. Er zijn 9 scores in het interval 171-180. Daarvan vallen 17-14 = 3 op of beneden 17. De scores zijn (per aanname) uniform verdeeld over het interval, dat breedte 10 heeft. Dus P 52 = 170.5 + 3 10 9 = 173.8. 32 / 51
Percentiel: voorbeeld Vb. De lengtes van een groep studenten in centimers: klasse f cf exacte grenzen middelpunt 151-160 4 4 150.5-160.5 155 161-170 10 14 160.5-170.5 165 171-180 9 23 170.5-180.5 175 181-190 8 31 180.5-190.5 185 191-200 2 33 190.5-200.5 195 Het 52e percentiel ligt in het interval waar 33 10052 = 17 scores in of beneden vallen, het interval 171 180. P 52 wordt als volgt berekend. De exacte klassengrezen van 171-180 zijn 170.5-180.5. Er zijn 9 scores in het interval 171-180. Daarvan vallen 17-14 = 3 op of beneden 17. De scores zijn (per aanname) uniform verdeeld over het interval, dat breedte 10 heeft. Dus P 52 = 170.5 + 3 10 9 = 173.8. Het 58e percentiel ligt in het interval waar 33 10058 = 19 scores in of beneden vallen: 32 / 51
Percentiel: voorbeeld Vb. De lengtes van een groep studenten in centimers: klasse f cf exacte grenzen middelpunt 151-160 4 4 150.5-160.5 155 161-170 10 14 160.5-170.5 165 171-180 9 23 170.5-180.5 175 181-190 8 31 180.5-190.5 185 191-200 2 33 190.5-200.5 195 Het 52e percentiel ligt in het interval waar 33 10052 = 17 scores in of beneden vallen, het interval 171 180. P 52 wordt als volgt berekend. De exacte klassengrezen van 171-180 zijn 170.5-180.5. Er zijn 9 scores in het interval 171-180. Daarvan vallen 17-14 = 3 op of beneden 17. De scores zijn (per aanname) uniform verdeeld over het interval, dat breedte 10 heeft. Dus P 52 = 170.5 + 3 10 9 = 173.8. Het 58e percentiel ligt in het interval waar 33 10058 = 19 scores in of beneden vallen: P 19 = 170.5 + (19 14) 10 9 = 175.7. 32 / 51
Percentiel berekening Def. Het x percentiel P x van een distributie gegeven door exacte klassengrenzen wordt zo berekend: P x = ll + (np cf ) w f i, waarbij, als k x het klasseninterval is waarin het x percentiel ligt: ll = exacte ondergrens van k x n = het totaal aantal scores p = proportie die met het x percentiel correspondeert ( x 100 ) cf = cumm. freq. van scores in het klasseninterval beneden k x f i = frequentie van scores in k x w = klassenbreedte van k x 33 / 51
Percentiele rang Def. De percentiele rang van een score X is het percentage scores gelijk aan of kleiner dan die score. Notatie: PR X. 34 / 51
Percentiele rang Def. De percentiele rang van een score X is het percentage scores gelijk aan of kleiner dan die score. Notatie: PR X. Vb. Het aantal glazen bier gedronken per bezoeker: # glazen 0 1 2 3 4 5 6 7 frequentie 12 1 20 17 11 8 1 6 cummulatief 12 13 33 50 61 69 70 76 34 / 51
Percentiele rang Def. De percentiele rang van een score X is het percentage scores gelijk aan of kleiner dan die score. Notatie: PR X. Vb. Het aantal glazen bier gedronken per bezoeker: # glazen 0 1 2 3 4 5 6 7 frequentie 12 1 20 17 11 8 1 6 cummulatief 12 13 33 50 61 69 70 76 De percentiele rang van 1 is 100 13 en de percentiele rang van 6 is 100 76 70. 76 34 / 51
Percentiele rang: voorbeeld Vb. De lengtes van een groep studenten in centimers: klasse f cf exacte grenzen middelpunt 151-160 4 4 150.5-160.5 155 161-170 10 14 160.5-170.5 165 171-180 9 23 170.5-180.5 175 181-190 8 31 180.5-190.5 185 191-200 2 33 190.5-200.5 195 De percentiele rang van score 182 wordt als volgt berekend. 35 / 51
Percentiele rang: voorbeeld Vb. De lengtes van een groep studenten in centimers: klasse f cf exacte grenzen middelpunt 151-160 4 4 150.5-160.5 155 161-170 10 14 160.5-170.5 165 171-180 9 23 170.5-180.5 175 181-190 8 31 180.5-190.5 185 191-200 2 33 190.5-200.5 195 De percentiele rang van score 182 wordt als volgt berekend. 182 valt in het klasseninterval 180.5 190.5. 23 scores zijn beneden de exacte ondergrens van dit interval. De 8 scores in het interval zijn (per aanname) uniform verdeeld in het interval, dat breedte 10 heeft. De n e score in 180.5 190.5 is dus 180.5 + n 10 8. Het aantal scores op of beneden 182 in het interval is daarmee (182 180.5) 8 10 = 1.2. Dat geeft PR 182 = (23 + 1.2) 100 33 = 73%. 35 / 51
Percentiele rang berekening Def. De percentiele rang PR X van een score X in een distributie gegeven door exacte klassengrenzen wordt zo berekend: PR X = ( cf + (X ll) f i ) 100 w n, waarbij, als k X het klasseninterval is dat score X bevat: ll = exacte ondergrens van k X n = het totaal aantal scores cf = cumm. freq. van scores in het klasseninterval beneden k X f i = frequentie van scores in k X w = klassenbreedte van k X 36 / 51
Modus en mediaan Def. De modus is de score met de hoogste frequentie. 37 / 51
Modus en mediaan Def. De modus is de score met de hoogste frequentie. Def. De mediaan is het 50e percentiel. 37 / 51
Modus: voorbeeld Vb. Het aantal verkochte ijsjes in een ijskraam per smaak per dag: vanille pistache straciatelle framboos 180 110 110 110 38 / 51
Modus: voorbeeld Vb. Het aantal verkochte ijsjes in een ijskraam per smaak per dag: vanille pistache straciatelle framboos 180 110 110 110 De modus (de score met de hoogste frequentie) is pistache en framboos. De modus hoeft niet uniek te zijn. 38 / 51
Modus: voorbeeld Vb. Het aantal verkochte ijsjes in een ijskraam per smaak per dag: vanille pistache straciatelle framboos 180 110 110 110 De modus (de score met de hoogste frequentie) is pistache en framboos. De modus hoeft niet uniek te zijn. De modus is een van de weinige maten die toepasbaar is op nominale distributies. 38 / 51
Gemiddelde Def. Het gemiddelde is het rekenkundig gemiddelde van de scores in de categorieën: de som van de scores gedeeld door het aantal categorieën: n i=1 X = X i, n waarbij X i de scores zijn en n het aantal waarnemingen is. 39 / 51
Gemiddelde Def. Het gemiddelde is het rekenkundig gemiddelde van de scores in de categorieën: de som van de scores gedeeld door het aantal categorieën: n i=1 X = X i, n waarbij X i de scores zijn en n het aantal waarnemingen is. Merk op: Het gemiddelde wordt gebruikt als elke categorie één score bevat, en geen frequenties. 39 / 51
Gemiddelde: voorbeeld Het aantal kinderen per persoon van 5 personen A, B, C, D, E: A B C D E 0 2 1 0 3 40 / 51
Gemiddelde: voorbeeld Het aantal kinderen per persoon van 5 personen A, B, C, D, E: Het gemiddelde is A B C D E 0 2 1 0 3 0 + 2 + 1 + 0 + 3 5 = 6 5. 40 / 51
Gewogen gemiddelde Def. Het gewogen gemiddelde is de som van waardes (scores) van de klassen maal hun frequentie, gedeeld door het aantal waarnemingen: n i=1 X = X if i, n waarbij X i de klasse (score) is, f i de frequentie van waarnemingen in die klasse, en n het totaal aantal waarnemingen. 41 / 51
Gewogen gemiddelde Def. Het gewogen gemiddelde is de som van waardes (scores) van de klassen maal hun frequentie, gedeeld door het aantal waarnemingen: n i=1 X = X if i, n waarbij X i de klasse (score) is, f i de frequentie van waarnemingen in die klasse, en n het totaal aantal waarnemingen. Merk op: Het gewogen gemiddelde wordt gebruikt als de categorieën scores zijn en hun inhoud frequenties. 41 / 51
Gewogen gemiddelde: voorbeeld Vb. Het aantal glazen bier per bezoeker: # glazen 0 1 2 3 frequentie 12 1 20 17 42 / 51
Gewogen gemiddelde: voorbeeld Vb. Het aantal glazen bier per bezoeker: Het gewogen gemiddelde is # glazen 0 1 2 3 frequentie 12 1 20 17 0 12 + 1 1 + 2 20 + 3 17 51 = 92 51. 42 / 51
Gewogen gemiddelde: voorbeeld Vb. Het aantal glazen bier per bezoeker: Het gewogen gemiddelde is # glazen 0 1 2 3 frequentie 12 1 20 17 0 12 + 1 1 + 2 20 + 3 17 51 = 92 51. Vb. Van een klas met 80 meisjes en 90 jongens is het gemiddelde cijfer van de meisjes 7.2 en van de jongens 6.9. Het gewogen gemiddelde van de cijfers voor deze klas is 80 7.2 + 90 6.9. 170 42 / 51
Afwijking Def. Voor elke score (waarde) X i is de afwijking (van het gemiddelde) x i, het verschil met het gemiddelde: x i = (X i X ). 43 / 51
Afwijking Def. Voor elke score (waarde) X i is de afwijking (van het gemiddelde) x i, het verschil met het gemiddelde: x i = (X i X ). Vb. Het aantal kinderen per persoon van 5 personen A, B, C, D: A B C D 0 2 1 2 43 / 51
Afwijking Def. Voor elke score (waarde) X i is de afwijking (van het gemiddelde) x i, het verschil met het gemiddelde: x i = (X i X ). Vb. Het aantal kinderen per persoon van 5 personen A, B, C, D: Het gemiddelde is 5 4. A B C D 0 2 1 2 43 / 51
Afwijking Def. Voor elke score (waarde) X i is de afwijking (van het gemiddelde) x i, het verschil met het gemiddelde: x i = (X i X ). Vb. Het aantal kinderen per persoon van 5 personen A, B, C, D: Het gemiddelde is 5 4. De afwijkingen zijn A B C D 0 2 1 2 x A = 5 4 x B = 3 4 x C = 1 4 x D = 3 4. 43 / 51
Eigenschappen van het gemiddelde St. De som van de afwijkingen van het gemiddelde is 0. 44 / 51
Eigenschappen van het gemiddelde St. De som van de afwijkingen van het gemiddelde is 0. Bew. n n n n i=1 (X i X ) = X i n X = X i n X n i = X i n i=1 i=1 i=1 i=1 n X i. i=1 44 / 51
Eigenschappen van het gemiddelde St. De som van de afwijkingen van het gemiddelde is 0. Bew. n n n n i=1 (X i X ) = X i n X = X i n X n i = X i n i=1 i=1 i=1 St. De som van de gekwadrateerde afwijkingen van het gemiddelde is minimaal. i=1 n X i. i=1 44 / 51
Eigenschappen van het gemiddelde St. De som van de afwijkingen van het gemiddelde is 0. Bew. n n n n i=1 (X i X ) = X i n X = X i n X n i = X i n i=1 i=1 i=1 St. De som van de gekwadrateerde afwijkingen van het gemiddelde is minimaal. Bew. Laat f (y) = n (X i y) 2 = i=1 n i=1 (X 2 i 2X i y + y 2 ) = n i=1 i=1 n X i. i=1 (X 2 i 2X i y) + ny 2. 44 / 51
Eigenschappen van het gemiddelde St. De som van de afwijkingen van het gemiddelde is 0. Bew. n n n n i=1 (X i X ) = X i n X = X i n X n i = X i n i=1 i=1 i=1 St. De som van de gekwadrateerde afwijkingen van het gemiddelde is minimaal. Bew. Laat f (y) = n (X i y) 2 = i=1 n i=1 (X 2 i 2X i y + y 2 ) = n i=1 i=1 n X i. i=1 (X 2 i 2X i y) + ny 2. f (y) = n n ( 2X i ) + 2ny = 2( X i + ny) f ( X ) = 0. i=1 i=1 44 / 51
Eigenschappen van het gemiddelde St. De som van de afwijkingen van het gemiddelde is 0. Bew. n n n n i=1 (X i X ) = X i n X = X i n X n i = X i n i=1 i=1 i=1 St. De som van de gekwadrateerde afwijkingen van het gemiddelde is minimaal. Bew. Laat f (y) = n (X i y) 2 = i=1 n i=1 (X 2 i 2X i y + y 2 ) = n i=1 i=1 n X i. i=1 (X 2 i 2X i y) + ny 2. n n f (y) = ( 2X i ) + 2ny = 2( X i + ny) f ( X ) = 0. i=1 i=1 Dus f is minimaal bij X. 44 / 51
Gemiddelde afwijking Def. De gemiddelde afwijking is het gemiddelde van de absolute waardes van de afwijkingen van het gemiddelde: n i=1 X i X n. 45 / 51
Gemiddelde afwijking Def. De gemiddelde afwijking is het gemiddelde van de absolute waardes van de afwijkingen van het gemiddelde: n i=1 X i X Vb. Het aantal kinderen per persoon van 4 personen A, B, C, D: De afwijkingen zijn n A B C D 0 2 1 2 x A = 5 4 x B = 3 4 x C = 1 4 x D = 3 4.. 45 / 51
Gemiddelde afwijking Def. De gemiddelde afwijking is het gemiddelde van de absolute waardes van de afwijkingen van het gemiddelde: n i=1 X i X Vb. Het aantal kinderen per persoon van 4 personen A, B, C, D: De afwijkingen zijn De gemiddelde afwijking is n A B C D 0 2 1 2 x A = 5 4 x B = 3 4 x C = 1 4 x D = 3 4.. 5 4 + 3 4 + 1 4 + 3 4 4 = 12 4 4 = 3 4. 45 / 51
Variantie populatie Def. De variantie van een populatie ter grootte N is het gemiddelde van de gekwadrateerde afwijkingen van het gemiddelde µ: n σ 2 i=1 = (X i µ) 2. N Def. De standaard afwijking van een populatie is de wortel uit de variantie: n i=1 σ = (X i µ) 2. N 46 / 51
Variantie populatie Def. De variantie van een populatie ter grootte N is het gemiddelde van de gekwadrateerde afwijkingen van het gemiddelde µ: n σ 2 i=1 = (X i µ) 2. N Def. De standaard afwijking van een populatie is de wortel uit de variantie: n i=1 σ = (X i µ) 2. N Vb. Het aantal kinderen per persoon van 4 personen A, B, C, D die de hele populatie vormen: A B C D 0 2 1 2 De afwijkingen zijn x A = 5 4 x B = 3 4 x C = 1 4 x D = 3 4. 46 / 51
Variantie populatie Def. De variantie van een populatie ter grootte N is het gemiddelde van de gekwadrateerde afwijkingen van het gemiddelde µ: n σ 2 i=1 = (X i µ) 2. N Def. De standaard afwijking van een populatie is de wortel uit de variantie: n i=1 σ = (X i µ) 2. N Vb. Het aantal kinderen per persoon van 4 personen A, B, C, D die de hele populatie vormen: A B C D 0 2 1 2 De afwijkingen zijn x A = 5 4 x B = 3 4 x C = 1 4 x D = 3 4. De variantie en standaard afwijking zijn: σ 2 25 16 = + 9 16 + 1 16 + 9 44 16 16 = 4 4 = 11 11 σ = 16 4. 46 / 51
Variantie steekproef Def. De variantie van een steekproef ter grootte n is n s 2 i=1 = (X i X ) 2. n 1 Def. De standaard afwijking van een steekproef is de wortel uit de variantie: s = n i=1 (X i X ) 2. n 1 47 / 51
Variantie steekproef Def. De variantie van een steekproef ter grootte n is n s 2 i=1 = (X i X ) 2. n 1 Def. De standaard afwijking van een steekproef is de wortel uit de variantie: s = n i=1 (X i X ) 2. n 1 Vb. Het aantal kinderen per persoon van 4 personen A, B, C, D die een steekproef uit een populatie van 12 personen vormen: A B C D 0 2 1 2 De afwijkingen zijn x A = 5 4 x B = 3 4 x C = 1 4 x D = 3 4. 47 / 51
Variantie steekproef Def. De variantie van een steekproef ter grootte n is n s 2 i=1 = (X i X ) 2. n 1 Def. De standaard afwijking van een steekproef is de wortel uit de variantie: s = n i=1 (X i X ) 2. n 1 Vb. Het aantal kinderen per persoon van 4 personen A, B, C, D die een steekproef uit een populatie van 12 personen vormen: A B C D 0 2 1 2 De afwijkingen zijn x A = 5 4 x B = 3 4 x C = 1 4 x D = 3 4. De variantie en standaard afwijking zijn: s 2 25 16 = + 9 16 + 1 16 + 9 44 16 16 = 3 3 = 11 11 s = 12 12. 47 / 51
Populatie en steekproef Def. Notatie: populatie steekproef aantal = N n gemiddelde = µ X variantie = σ 2 s 2 standaard afwijking = σ s 48 / 51
Het drie gevangenen probleem Er zijn drie gevangen, 1,2 en 3, waarvan twee, die willekeurig gekozen worden, zullen worden terechtgesteld, en de gevangenen weten dit. Dus de kans voor elke gevangene om te overleven is 1 3. Rita, de cipier komt langs en 1 vraagt haar of zij kan zeggen of 1 of 2 wordt terechtgesteld. Rita zegt: 2. Wat is nu de nieuwe kans dat 1 overleeft? 49 / 51
Het drie gevangenen probleem Er zijn drie gevangen, 1,2 en 3, waarvan twee, die willekeurig gekozen worden, zullen worden terechtgesteld, en de gevangenen weten dit. Dus de kans voor elke gevangene om te overleven is 1 3. Rita, de cipier komt langs en 1 vraagt haar of zij kan zeggen of 1 of 2 wordt terechtgesteld. Rita zegt: 2. Wat is nu de nieuwe kans dat 1 overleeft? Er lijken twee antwoorden mogelijk: 1 krijgt geen nieuwe informatie, hij wist toch al dat 2 of 3 terechtgesteld zou worden, dus zijn overlevingskans blijft 1 3. Eerst waren er drie mogelijkheden: 1 of 2 of 3 overleeft. Nu zijn er twee mogelijkheden: 1 of 3 overleeft. De kans dat 1 overleeft is 1 2. Wat is de kans dat 1 overleeft? 49 / 51
Monty Hall Achter één van drie gesloten deuren staat een auto, achter de andere twee een geit. Jij gaat voor een deur staan. Bijv: geit geit jij auto 50 / 51
Monty Hall Achter één van drie gesloten deuren staat een auto, achter de andere twee een geit. Jij gaat voor een deur staan. Bijv: geit geit jij auto De quizmaster Monty Hall opent een van de twee deuren waar jij niet voor staat en waarachter een geit staat. In dit voorbeeld: geit geit jij auto 50 / 51
Monty Hall Achter één van drie gesloten deuren staat een auto, achter de andere twee een geit. Jij gaat voor een deur staan. Bijv: geit geit jij auto De quizmaster Monty Hall opent een van de twee deuren waar jij niet voor staat en waarachter een geit staat. In dit voorbeeld: geit geit jij auto Jij mag blijven staan of voor de andere gesloten deur gaan staan. Vervolgens win je dat wat achter jouw deur staat. Is het beter altijd van deur te veranderen (indien je geen geit wilt)? 50 / 51
Finis 51 / 51