Kansrekening en Statistiek
|
|
- Erna Eilander
- 8 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Kansrekening en Statistiek College 10 Donderdag 14 Oktober 1 / 71
2 1 Kansrekening Indeling: Bayesiaans leren 2 / 71
3 Bayesiaans leren 3 / 71
4 Bayesiaans leren: spelletje Vb. Twee enveloppen met kralen, waarvan 1 tevens e100 bevat: e100 Iemand kiest willekeurig een envelop en biedt die te koop aan. Hoeveel zou je moeten betalen? e50. Stel dat je eerst een willekeurige kraal uit de gekozen envelop mag nemen. Als die kraal rose is, hoevel zou je dan moeten betalen? e60. Als die kraal grijs is, hoevel zou je dan moeten betalen? e De kans dat het de i e envelop is gegeven dat de kraal rose (r) is: P(i r) = P(r i) P(r 1) + P(r 2). 4 / 71
5 Bayesiaans leren Def. Bayesiaans leren heeft (in essentie) de volgende vorm: Er zijn een aantal hypotheses H 1,..., H n die samen de uitkomstenruimte vormen. De hypotheses zijn meer of minder waarschijnlijk: de (initiële) bijbehorende verdeling is de a-priori verdeling, de kansen P(H i ) zijn de a-priori kansen. Na het verkrijgen van nieuwe informatie/data/gebeurtenis E worden de kansen van de hypotheses aangepast volgens de stelling van Bayes: P(H i E) = P(E H i )P(H i ) P n j=1 P(E H j )P(H j ). De kansen P(H i E) zijn de a-posteriori kansen. De kansen P(E H i ) zijn de likelihoods van E. Leren: Op grond van telkens nieuwe data E 1, E 2,... wordt de verdeling van de hypotheses voortdurend aangepast, P 0, P 1, P 2,... : P 0 is de a-priori verdeling, waarbij P 0 (H i ) = P(H i ). Na het verkrijgen van data E 1 wordt de nieuwe verdeling P 1, waarbij P 1 (H i ) = P 0 (H i E 1 ). Na het verkrijgen van data E 2 wordt de nieuwe verdeling P 2, waarbij P 2 (H i ) = P 1 (H i E 2 ). Etc. 5 / 71
6 Bayesiaans leren: bias Om de a-posteriori kansen P(H i E) te berekenen moeten de a-priori kansen P(H i ) en de likelihoods P(E H i ) bekend zijn. Def. De a-priori kansen geven de bias bij aanvang weer: Bij P(H i ) > P(H j ) wordt H i waarschijnlijker geacht dan H j. Bij P(H i ) = P(H j ) worden beide hypotheses even waarschijnlijk geacht. Na een update op grond van informatie E is de werkhypothese doorgaans een hypothese die op dat moment de hoogste waarschijnlijkheid heeft, dat wil zeggen een hypothese H i waarvoor P(H i E) het grootste is. Een hypothese wordt verworpen als de a-posteriori kans op de hypothese 0 is. 6 / 71
7 Bayesiaans leren Vb. Een vaas bevat 3 ballen: 1 rode en 1 witte en van de derde bal is alleen bekend dat die wit of rood is. X is het aantal rode ballen. Beide waardes van X worden even waarschijnlijk geacht: P(X = 1) = P(X = 2) = 1 2. Er wordt een bal uit de vaas getrokken, die rood blijkt te zijn. Wat is de waarschijnlijkheid dat X = 2? En dat X = 1? In de notatie van de Stelling van Bayes: Gebeurtenis E: de getrokken bal is rood. Gebeurtenis H: X = 1. Gebeurtenis H: X = 2. Omdat P(X = 1) = P(X = 2): P(X = 2 E) = Dus P(X = 1 E) = = 1 3. P(E X = 2)P(X = 2) P(E X = 2)P(X = 2) + P(E X = 1)P(X = 1) = 2 P(E X = 2) P(E X = 2) + P(E X = 1) = = Op grond van gebeurtenis E is X = 2 dus waarschijnlijker. 7 / 71
8 Bayesiaans leren Vb. Gegeven is een valse munt waarvan bekend is dat de kans p op K 0.42 of 0.43 is. Beide mogelijkheden worden even waarschijnlijk geacht: P(p = 0.42) = P(p = 0.43) = 0.5. De munt wordt 7 maal geworpen, X is het aantal maal K. Stel dat X = 3. Welke hypothese is op grond van deze informatie het waarschijnlijkste? P(X = 3 p = 0.42) P(p = 0.42 X = 3) = P(X = 3 p = 0.42) + P(X = 3 p = 0.43) = `7 (0.42) 3 3 (0.58) 4 `7 (0.42) 3 3 (0.58) 4 + `7 (0.43) 3 3 (0.57) = Dus P(p = 0.43 X = 3) = = > , en daarmee is p = 0.43 de meest waarschijnlijke hypothese op grond van de data 3 maal K bij 7 worpen. 8 / 71
9 Bayesiaans leren Vb. Gegeven is een valse munt waarvan bekend is dat de kans p op K 0.42 of 0.43 is. Op grond van de verkregen informatie dat er bij het 7 maal werpen van de munt 3 maal K is gegooid (zie vorige slide), is de (nieuwe) verdeling van p: P(p = 0.42) = en P(p = 0.43) = De munt wordt nog eens 11 maal gegooid, Y is het aantal maal K. Stel dat Y = 4. Welke hypothese is op grond van deze informatie het waarschijnlijkste? P(p = 0.42 Y = 4) = = P(Y = 4 p = 0.42)P(p = 0.42) P(Y = 4 p = 0.42)P(p = 0.42) + P(Y = 4 p = 0.43)P(p = 0.43) `11 (0.42) 4 4 (0.58) 7 (0.4997) `11 (0.42) 4 4 (0.58) 7 (0.4997) + `11 (0.43) 4 4 (0.57) 7 (0.5003) = Dus P(p = 0.43 X = 3) = = 0.49 < 0.51, en daarmee is p = 0.42 de meest waarschijnlijke hypothese op grond van de laatste data 4 maal K bij 11 worpen. Merk op: Hoewel de bias voor p = 0.42 (P(p = 0.42) = ) lager is dan die voor p = 0.43 (P(p = 0.43) = ) is de nieuwe informatie 4 maal K bij 11 worpen zodanig dat daarna p = 0.42 toch het meest waarschijnijk is. 9 / 71
10 Bayesiaans leren Vb. Voor een spamfilter is c het percentage spam van alle s die het woord VIAGRA bevatten. Stel dat het filter aanneemt dat c 80% of 90% is, en aanvankelijk beide waardes voor even waarschijnlijk houdt: P(c = 80%) = P(C = 90%) = 0.5. Hierbij wordt aangenomen dat de verdeling van spam/niet-spam binomiaal is: als de kans op spam p is, dan is de kans dat van n s er k spam zijn `n k pk (1 p) n k. Jij bent het spamfilter aan het trainen en van de 100 s die het woord VIAGRA bevatten geef je aan dat er 98 spam zijn. Noem deze data/gebeurtenis E. Welke hypothese, c = 80% of c = 90%, is op grond van deze data de waarschijnlijkste? P(E c = 90%) P(c = 90% E) = P(E c = 90%) + P(E c = 80%) = `100 (0.9) (0.1) 2 `100 (0.8) (0.2) 2 + `100 (0.9) (0.1) = Daarmee is P(c = 80% E) = < P(c = 90% E), en zoals verwacht is P(c = 90% E) de meest waarschijnlijke hypothese. 10 / 71
11 Bayesiaans leren St. Als H 1,..., H n een partitie van de uitkomstenruimte is en de a-priori kansen van de hypotheses zijn uniform verdeld, dan geldt voor elke gebeurtenis E: P(H i E) P(H j E) = P(E H i ) P(E H j ). Bew. Bij een uniforme verdeling van de a-priori kansen (P(H i ) = P(H j ) voor alle i, j n) wordt de Stelling van Bayes (zie College 9): P(H i E) = P(E H i ) P n h=1 P(E H h). Dus P(H i E) P(H j E) = P(E H i ) P nh=1 P(E H h ) P(E H j ) P nh=1 P(E H h ) = P(E H i ) P(E H j ). 11 / 71
12 2 Statistiek 12 / 71
13 Statistiek? Bevordert luieren de fantasie? Psychologie Werkt paracetamol? Geneeskunde Welk van de twee betekenissen van bank komt het meeste voor? Linguïstiek 13 / 71
14 Statistiek Doel: Op grond van data verkregen uit een steekproef een uitspraak doen over de populatie. Beschrijvende statistiek: data verkrijgen en classificeren. Deductieve statistiek: uit data conclusies trekken. 14 / 71
15 Vragen: peilingen In hoeverre komt de verkiezingsuitslag overeen met de peilingen? 15 / 71
16 Vragen: lengte Van 1000 Nederlanders wordt de lengte opgemeten. Het gemiddelde is 1.70m. Wat is de kans dat de gemiddelde lengte van Nederlanders 1.70m is? 16 / 71
17 Vragen: meten Uit: Hoe kan het vermoeden dat makelaars voor hun klanten niet altijd de beste prijs voor hun huis krijgen gemeten worden? Door de prijzen waarvoor makelaars hun eigen huis verkopen te vergelijken met die waarvoor ze de huizen van klanten verkopen: 3% hoger. 17 / 71
18 Vragen: suggestie Zelfde informatie? y y x x 18 / 71
19 Zelfde informatie? Vragen:suggestie 19 / 71
20 Vragen: steekproef Op initiatief van onderzoeksbureau Trendbox, Miss Etam en communicatiebureau BSUR werd er onderzoek gedaan naar de Nederlandse vrouw en haar zelfbeeld. Zij vindt zichzelf (in %): Betrouwbaar 62 Eerlijk 50 Sociaal 46 Vriendelijk 46 Trouw 46 Vrolijk 32 Serieus 25 Onzeker 15 Impulsief 14 Sterk 12 Wat voor steekproef werd voor dit onderzoek gebruikt? 20 / 71
21 2 Statistiek Vandaag: Populatie en steekproef Schaal Score en frequentie Grafieken 21 / 71
22 Populatie en steekproef 22 / 71
23 Populatie en steekproef Def. Een populatie bevat alle elementen van een bepaalde groep. Een parameter is een eigenschap van de populatie. Een steekproef is een deelverzameling van de groep. Een statistiek is een eigenschap van de steekproef. Een constante is een eigenschap die hetzelfde is voor alle elementen van de populatie. Een variabele is een eigenschap die verschillende waardes kan aannemen voor verschillende elementen van de populatie. 23 / 71
24 Populatie en steekproef Vb. Populatie: Nederlanders. Steekproef: een groep Nederlanders. Parameter: de gemiddelde lengte van alle Nederlanders. Statistiek: de gemiddelde lengte van een groep Nederlanders. Constante: de eigenschap Nederlander. Variabele: de eigenschap vrouw. Populatie: alle moleculen is een gegeven glas water. Steekproef: alle moleculen in een slok water uit dat glas. Parameter: het gemiddelde aantal waterstofmoleculen in het glas. Statistiek: het gemiddelde aantal waterstofmoleculen in de slok. Constante: de eigenschap molecuul. Variabele: de eigenschap zuurstofmolecuul. 24 / 71
25 Schaal 25 / 71
26 Schaal Def. Data kunnen op de volgende wijze geclassificeerd worden: nominale schaal: classiferen zonder ordening. ordinale schaal: classiferen in geordende categoriën. intervalschaal: een ordinale schaal waarbij elke schaal uit evenveel eenheden bestaat. ratioschaal: een intervalschaal waarbij er een werkelijk nulpunt is. 26 / 71
27 Nominale schaal Vb. Het aantal verkochte ijsjes in een ijskraam per smaak per dag: vanille pistache straciatelle De categorieën zijn ongeordend. 27 / 71
28 Ordinale schaal Vb. De indeling van ziekenhuizen in de provincie Utrecht naar hygiëne: onvoldoende voldoende goed zeer goed De categorieën zijn geordend: onvoldoende < voldoende < goed < zeer goed. 28 / 71
29 Intervalschaal Vb. De verdeling van de cijfers bij een wiskunde tentamen zijn: De categorieën zijn geordend en bestaan elk uit evenveel eenheden. Bijvoorbeeld, het verschil tussen een categorie en de eerstvolgende categorie is voor elke categorie / 71
30 Ratioschaal Vb. De aanwezigheid van een giftige stof (in mg.) in laboranten: De categorieën zijn geordend, bestaan elk uit evenveel eenheden en er is een werkelijk nulpunt. Dit is de enige schaal waarin de ratio van twee categorieën bestaat. Bijvoorbeeld, een laborant uit categorie 2 bevat half zoveel gif als een laborant uit categorie 4: mg. gif in categorie 2 mg. gif in categorie 4 = / 71
31 Score en frequentie 31 / 71
32 Score en frequentie Def. De score of waarde is de waarde van een waarneming. Vb. Het aantal biertjes dat verkocht wordt per avond in de cafe s X, Y, Z: De scores zijn 70, 100 en 180. X Y Z Vb. Het aantal kinderen per persoon van 5 personen A, B, C, D, E: De scores zijn 0, 0, 1, 2 en 3. A B C D E / 71
33 Score en frequentie Vb. Armoede in Zuid-Afrika: Er zijn 9 scores: 2%, 4%, 4%, 9%, 9%, 11%, 16%, 22%, 23%. De frequentie van score 4 is 2, van score 9 ook, en de frequentie van de overige scores is / 71
34 Score en frequentie Def. Een frequentie distributie geeft per categorie het aantal scores in die categorie weer. Def. Een cumulatieve frequentie distributie geeft per categorie het aantal scores in die categorie en in de categorieën beneden die categorie weer. 34 / 71
35 Score en frequentie Vb. Het aantal computers per gezin in een bepaald dorp: aantal computers frequentie / 71
36 Score en frequentie De representatie van data kan op twee manieren: De categorieën zijn de elementen waaraan waargenomen wordt, en elk bevat de waarde van die waarneming (de score). De categorieën zijn de waardes van de waarnemingen (de scores), en elk bevat het aantal voorkomens van die score (de frequentie). Uit de eerste representatie kan de tweede afgelezen worden, maar niet vice versa. 36 / 71
37 Score en frequentie Vb. Het aantal computers per huis in een dorp met 9 huizen, waarbij de categorieën de scores bevatten: huizen H1 H2 H3 H4 H5 H6 H7 H8 H9 aantal computers Het aantal computers per huis in hetzelfde dorp, waarbij de categorieën de scores zijn en hun inhoud de frequentie van het voorkomen van die score: aantal computers aantal huizen / 71
38 Score en frequentie: klassenintervallen Def. Verschillende categorieën kunnen samen een klasse vormen en de frequentie distributie geeft dan het aantal voorkomens in de verschillende klassen weer. Het aantal categorieën in een klasse is de klassenbreedte van een groep. Het is het beste om de klassenbreedte oneven te kiezen, zodat het middelpunt geen breuk is. 38 / 71
39 Score en frequentie: klassenintervallen Vb. Het aantal computers per gezin in een bepaald dorp geclassificeerd met klassenbreedte 3: aantal computers frequentie / 71
40 Score en frequentie: klassenintervallen Def. Wanneer de categorieën als continu beschouwd kunnen worden vallen de elementen van een categorie eigenlijk alleen binnen zekere grenzen, de exacte klassengrenzen. Meestal zijn de exacte klassengrenzen een halve eenheid onder en boven de klassengrenzen. Er wordt aangenomen dat de scores in een klasseninterval uniform verdeeld zijn over het interval en adequaat gerepresenteerd worden door het middelpunt. 40 / 71
41 Score en frequentie: klassenintervallen Vb. De lengtes van een groep studenten in centimers: klassenintervallen frequentie exacte grenzen middelpunt / 71
42 Grafieken Huiswerk: pagina s / 71
43 Finis 43 / 71
Kansrekening en Statistiek
Kansrekening en Statistiek College 9 Woensdag 7 Oktober 1 / 51 Kansrekening en Statistiek? Bevordert luieren de fantasie? Psychologie 2 / 51 Kansrekening en Statistiek? Bevordert luieren de fantasie? Psychologie
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 9 Dinsdag 12 Oktober 1 / 21 1 Kansrekening Indeling: Stelling van Bayes Bayesiaans leren 2 / 21 Vraag: test Een test op HIV is 90% betrouwbaar: als een persoon HIV heeft
Nadere informatieStatistiek voor A.I. College 1. Dinsdag 11 September 2012
Statistiek voor A.I. College 1 Dinsdag 11 September 2012 1 / 39 Literatuur Website: http://phil.uu.nl/statistiek/ Applied Statistics for the Behavioral Sciences - 5th edition, Dennis E. Hinkle, William
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 7 Dinsdag 11 Oktober 1 / 33 2 Statistiek Vandaag: Populatie en steekproef Maten Standaardscores Normale verdeling Stochast en populatie Experimenten herhalen 2 / 33 3
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 5 Dinsdag 27 September 1 / 30 1 Kansrekening Vandaag: Voorwaardelijke kansen Onafhankelijkheid Stelling van Bayes 2 / 30 Vraag: test Een test op HIV is 90% betrouwbaar:
Nadere informatieKansrekening en Statistiek. Overzicht Kansrekening
Kansrekening en Statistiek Overzicht Kansrekening 1 / 30 Overzicht: stochasten Discrete stochasten X - distributiefuncties f P(X A) = i A f (x) = i A P(X = i). 2 / 30 Overzicht: stochasten Discrete stochasten
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 6 Donderdag 6 Oktober 1 / 1 1 Kansrekening Vandaag: Poisson verdeling Hypergeometrische verdeling Stelling van Bayes Bayesiaans leren 2 / 1 Poisson verdeling 3 / 1 Poisson
Nadere informatieStatistiek voor A.I. College 7. Dinsdag 2 Oktober
Statistiek voor A.I. College 7 Dinsdag 2 Oktober 1 / 30 2 Deductieve statistiek Kansrekening 2 / 30 Vraag: test Een test op HIV is 90% betrouwbaar: als een persoon HIV heeft is de kans op een positieve
Nadere informatieStatistiek voor A.I. College 6. Donderdag 27 September
Statistiek voor A.I. College 6 Donderdag 27 September 1 / 1 2 Deductieve statistiek Kansrekening 2 / 1 Vraag: Afghanistan In het leger wordt uit een groep van 6 vrouwelijke en 14 mannelijke soldaten een
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 6 Donderdag 30 September 1 / 25 1 Kansrekening Indeling: Voorwaardelijke kansen Onafhankelijkheid Stelling van Bayes 2 / 25 Vraag: Afghanistan Vb. In het leger wordt
Nadere informatieStatistiek voor A.I. College 9. Donderdag 11 Oktober
Statistiek voor A.I. College 9 Donderdag 11 Oktober 1 / 48 2 Deductieve statistiek Bayesiaanse statistiek 2 / 48 Reistijd naar college (minuten). Jullie - onderzoek Tim Histogram of CI Frequency 0 1 2
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 16 Donderdag 4 November 1 / 25 2 Statistiek Indeling: Schatten Correlatie 2 / 25 Schatten 3 / 25 Schatters: maximum likelihood schatters Def. Zij Ω de verzameling van
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 8 Donderdag 13 Oktober 1 / 23 2 Statistiek Vandaag: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 23 Stochast en populatie
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 1 Dinsdag 14 September 1 / 34 Literatuur http://www.phil.uu.nl/ iemhoff Applied Statistics for the Behavioral Sciences - 5th edition, Dennis E. Hinkle, William Wiersma,
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 4 Donderdag 22 September 1 / 31 1 Kansrekening Vandaag : Vragen Bernouilli verdelingen Binomiale verdelingen Voorwaardelijke kansen 2 / 31 Vragen: multiple choice Bij
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 5 Dinsdag 28 September 1 / 25 1 Kansrekening Indeling: Bernouilli verdelingen Binomiale verdelingen Voorwaardelijke kansen Voor software R: van http://sourceforge.net
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 2 Donderdag 16 September 1 / 31 1 Kansrekening Indeling: Eigenschappen van kansen Continue uitkomstenruimtes Continue stochasten 2 / 31 Vragen: cirkels Een computer genereert
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 2 Donderdag 15 September 1 / 42 1 Kansrekening Vandaag: Vragen Eigenschappen van kansen Oneindige discrete uitkomstenruimtes Continue uitkomstenruimtes Continue stochasten
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 1 Woensdag 9 September 1 / 39 Site: http://www.phil.uu.nl/ iemhoff Literatuur: Applied Statistics for the Behavioral Sciences - 5th edition, Dennis E. Hinkle, William
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 3 Dinsdag 21 September 1 / 21 1 Kansrekening Indeling: Uniforme verdelingen Cumulatieve distributiefuncties 2 / 21 Vragen: lengte Een lineaal wordt op een willekeurig
Nadere informatieStatistiek voor A.I. College 4. Donderdag 20 September 2012
Statistiek voor A.I. College 4 Donderdag 20 September 2012 1 / 30 2 Deductieve statistiek Kansrekening 2 / 30 Cycle 3 / 30 Context 4 / 30 2 Deductieve statistiek Vandaag: Eigenschappen kansen Oneindige
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 9 Dinsdag 18 Oktober 1 / 1 2 Statistiek Vandaag: Centrale Limietstelling Correlatie Regressie 2 / 1 Centrale Limietstelling 3 / 1 Centrale Limietstelling St. (Centrale
Nadere informatieStatistiek voor A.I. College 3. Dinsdag 18 September 2012
Statistiek voor A.I. College 3 Dinsdag 18 September 2012 1 / 45 2 Deductieve statistiek Kansrekening 2 / 45 Uitkomstenruimte 3 / 45 Vragen: voorspellen Een charlatan zegt te kunnen voorspellen of een ongeboren
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 3 Dinsdag 20 September 1 / 29 1 Kansrekening Indeling: Cumulatieve distributiefuncties Permutaties en combinaties 2 / 29 Vragen: verjaardag Wat is de kans dat minstens
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 8 Vrijdag 2 Oktober 1 / 17 1 Kansrekening Geschiedenis en filosofie 2 / 17 De Kolmogorov Axioma s De kansrekening kan uit deze axioma s worden opgebouwd: 3 / 17 De Kolmogorov
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38 2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen
Nadere informatieStatistiek voor A.I. College 10. Dinsdag 16 Oktober
Statistiek voor A.I. College 10 Dinsdag 16 Oktober 1 / 30 Jullie - onderzoek Geert-Jan, Joris, Brechje Horizontaal: lengte Verticaal: lengte tussen topjes middelvingers met gestrekte armen. DIII 170 175
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd
Nadere informatieOverzicht. Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen. Voorwaardelijke kans. Voorbeeld: Probabilistisch redeneren
Overzicht Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen Cursusjaar 2009 Peter de Waal Departement Informatica Voorwaardelijke kans Rekenregels Onafhankelijkheid Voorwaardelijke Onafhankelijkheid
Nadere informatieStatistiek voor A.I. College 5. Dinsdag 25 September 2012
Statistiek voor A.I. College 5 Dinsdag 25 September 2012 1 / 34 2 Deductieve statistiek Kansrekening 2 / 34 Percentages 3 / 34 Vragen: blikkie Kinderen worden slanker als ze anderhalf jaar lang limonade
Nadere informatieStatistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2
INHOUDSOPGAVE Leswijzer...3 Beschrijvende Statistiek...3 Kansberekening...3 Inductieve statistiek, inferentiele statistiek...3 Hoofdstuk...3. Drie deelgebieden...3. Frequentieverdeling....3. Frequentieverdeling....4.5
Nadere informatieA. Week 1: Introductie in de statistiek.
A. Week 1: Introductie in de statistiek. Populatie en steekproef. In dit vak leren we de basis van de statistiek. In de statistiek probeert men erachter te komen hoe we de populatie het beste kunnen observeren.
Nadere informatieCombinatoriek en rekenregels
Combinatoriek en rekenregels Les 4: Rekenregels (deze les sluit aan bij de paragraaf 8 van Hoofdstuk 1 Combinatoriek en Rekenregels van de Wageningse Methode, http://www.wageningsemethode.nl/methode/het-lesmateriaal/?s=y456v-d)
Nadere informatieStatistiek I Samenvatting. Prof. dr. Carette
Statistiek I Samenvatting Prof. dr. Carette Opleiding: bachelor of science in de Handelswetenschappen Academiejaar 2016 2017 Inhoudsopgave Hoofdstuk 1: Statistiek, gegevens en statistisch denken... 3 De
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 13 Dinsdag 26 Oktober 1 / 24 2 Statistiek Indeling: Hypothese toetsen Filosofie 2 / 24 Hypothese toetsen 3 / 24 Hypothese toetsen: toepassingen Vb. Een medicijn wordt
Nadere informatieStatistiek voor A.I. College 2. Donderdag 13 September 2012
Statistiek voor A.I. College 2 Donderdag 13 September 2012 1 / 42 1 Beschrijvende statistiek 2 / 42 Extrapolatie 3 / 42 Verkiezingen 2012 4 / 42 Verkiezingen 2012 5 / 42 1 Beschrijvende statistiek Vandaag:
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 10 Donderdag 20 Oktober 1 / 1 2 Statistiek Vandaag: Hypothese toetsen 2 / 1 3 / 1 Terzijde NU.nl 19 oktober 2011: Veel Facebookvrienden wijst op grotere hersenen. (http://www.nu.nl/wetenschap/2645008/veel-facebookvrienden-wijst-groterehersenen-.html)
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 10 Dinsdag 19 Oktober 1 / 39 2 Statistiek Indeling: Maten Standaardscores Normale verdeling 2 / 39 Grapje http://abstrusegoose.com/54: 3 / 39 Vragen: Simpson paradox
Nadere informatieStatistiek voor A.I. College 12. Dinsdag 23 Oktober
Statistiek voor A.I. College 12 Dinsdag 23 Oktober 1 / 20 2 Deductieve statistiek Orthodoxe statistiek 2 / 20 3 / 20 Jullie - onderzoek Wivine Tijd waarop je opstaat (uu:mm wordt weergeven als uumm). Histogram
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 15 Dinsdag 2 November 1 / 16 2 Statistiek Indeling: Filosofie Schatten Centraal Bureau voor Statistiek 2 / 16 Schatten Vb. Het aantal tenen plus vingers in jullie huishoudens:
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 1 Dinsdag 13 September 1 / 47 Literatuur http://www.phil.uu.nl/ iemhoff Applied Statistics for the Behavioral Sciences - 5th edition, Dennis E. Hinkle, William Wiersma,
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 13 Dinsdag 1 November 1 / 26 2 Statistiek Vandaag: Power Grootte steekproef Filosofie 2 / 26 Power 3 / 26 Power Def. De power (kracht) van een hypothese toets is (1 β),
Nadere informatieStatistiek voor A.I.
Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden
Nadere informatieTentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.
Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (2WS4, dinsdag 17 juni 28, van 9. 12. uur. Dit is een tentamen met gesloten boek. De uitwerkingen
Nadere informatieFeedback proefexamen Statistiek I 2009 2010
Feedback proefexamen Statistiek I 2009 2010 Het correcte antwoord wordt aangeduid door een sterretje. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Een derde van de mannen is
Nadere informatie5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:
5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van
Nadere informatieTentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.
Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen
Nadere informatiePopulaties beschrijven met kansmodellen
Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 4 Donderdag 23 September 1 / 22 1 Kansrekening Indeling: Permutaties en combinaties 2 / 22 Vragen: verjaardag Wat is de kans dat minstens twee van jullie op dezelfde
Nadere informatie3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625.
3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625. Absolute verandering = Aantal 2004 Aantal 1994 = 1625 3070 = -1445 Relatieve verandering = Nieuw Oud Aantal
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening (2WS2), Vrijdag 24 januari 24, om 9:-2:. Dit is een tentamen met gesloten boek. De uitwerkingen van de opgaven
Nadere informatieLesbrief hypothesetoetsen
Lesbrief hypothesetoetsen 00 "Je gaat het pas zien als je het door hebt" Johan Cruijff Willem van Ravenstein Inhoudsopgave Inhoudsopgave... Hoofdstuk - voorkennis... Hoofdstuk - mens erger je niet... 3
Nadere informatiePopulatie: De gehele groep elementen waarover informatie wordt gewenst.
Statistiek I Werkcollege 1 Populatie: De gehele groep elementen waarover informatie wordt gewenst. Steekproef: Gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te vergaren. Eenheden:
Nadere informatieInleiding tot de meettheorie
Inleiding tot de meettheorie Meten is het toekennen van cijfers aan voorwerpen. Koeien Koeien in een kudde, studenten in een auditorium, mensen met een bepaalde stoornis, leerlingen met meer dan 15 in
Nadere informatieIn de Theorie worden de begrippen toevalsvariabele, kansverdeling en verwachtingswaarde toegelicht.
Toevalsvariabelen Verkennen www.mathall.nl MAThADORE-basic HAVO/VWO /5/6 VWO wi-a Kansrekening Toevalsvariabelen Inleiding Verkennen Beantwoord de vragen bij Verkennen. Uitleg www.mathall.nl MAThADORE-basic
Nadere informatieTentamen Kansrekening en Statistiek (2WS04), woensdag 30 juni 2010, van 9.00 12.00 uur.
Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (WS4), woensdag 3 juni, van 9.. uur. Dit is een tentamen met gesloten boek. De uitwerkingen van de
Nadere informatieBinomiale verdelingen
Binomiale verdelingen Les 1: Kans en combinatoriek (Deze les sluit aan bij paragraaf 1 van Hoofdstuk 2 Binomiale en normale verdelingen van de Wageningse Methode, http://www.wageningsemethode.nl/methode/het-lesmateriaal/?s=y456v-d)
Nadere informatieExamen Statistiek I Feedback
Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).
Nadere informatieLes 1: Waarschijnlijkheidrekening
Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het
Nadere informatieKansrekening en statistiek WI2105IN deel I 4 november 2011, uur
Kansrekening en statistiek WI05IN deel I 4 november 0, 4.00 7.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad wordt uitgereikt. Meerkeuzevragen Toelichting:
Nadere informatieSamenvatting Statistiek
Samenvatting Statistiek De hoofdstukken 1 t/m 3 gaan over kansrekening: het uitrekenen van kansen in een volledig gespecifeerd model, waarin de parameters bekend zijn en de kans op een gebeurtenis gevraagd
Nadere informatieWiskundige Analyse II
Hoofdstuk 1 Wiskundige Analyse II Vraag 1.1 Als de partiële afgeleiden van de functie f : R n R niet bestaan in het punt a, dan kan f in a geen lokaal extremum bereiken. Vraag 1.2 Als de functie f : R
Nadere informatielengte aantal sportende broers/zussen
Oefening 1 Alvorens opgenomen te worden in een speciaal begeleidingsprogramma s voor jonge talentvolle lopers, worden jonge atleten eerst onderworpen aan een aantal vragenlijsten en onderzoeken. Uit het
Nadere informatie2 Data en datasets verwerken
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 1 Data presenteren 1.4 Oefenen In opdracht van: Commissie Toekomst Wiskunde Onderwijs 1.4 Oefenen Opgave 9 Bekijk de genoemde dataset
Nadere informatieWiskundige Analyse II
Hoofdstuk 1 Wiskundige Analyse II Vraag 1.1 Als de partiële afgeleiden van de functie f : R n R niet bestaan in het punt a, dan kan f in a geen lokaal extremum bereiken. vals Vraag 1.2 Als de functie f
Nadere informatie6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.
Opgaven hoofdstuk 6 I Basistechnieken 6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling. x 0 2 4 6 p(x) ¼ ¼ ¼ ¼ a. Schrijf alle mogelijke verschillende steekproeven van n =
Nadere informatieStatistische variabelen. formuleblad
Statistische variabelen formuleblad 0. voorkennis Soorten variabelen Discreet of continu Bij kwantitatieve gegevens gaat het om meetbare gegeven, zoals temperatuur, snelheid of gewicht. Bij een discrete
Nadere informatieDEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE
DEEL 3 INDUCTIEVE STATISTIEK INHOUD H 10: INLEIDING TOT DE INDUCTIEVE STATISTIEK H 11: PUNTSCHATTING 11.1 ALGEMEEN 11.1.1 Definities 11.1.2 Eigenschappen 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE 11.3
Nadere informatieOnderzoeksmethodiek LE: 2
Onderzoeksmethodiek LE: 2 3 Parameters en grootheden 3.1 Parameters Wat is een parameter? Een karakteristieke grootheid van een populatie Gem. gewicht van een 34-jarige man 3.2 Steekproefgrootheden Wat
Nadere informatieStatistiek. Beschrijvend statistiek
Statistiek Beschrijvend statistiek Verzameling van gegevens en beschrijvingen Populatie, steekproef Populatie = o de gehele groep ondervragen o parameter is een kerngetal Steekproef = o een onderdeel van
Nadere informatieHoofdstuk 6 Discrete distributies
Hoofdstuk 6 Discrete distributies Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Discrete distributies p 1/33 Discrete distributies binomiale verdeling
Nadere informatieExamen HAVO. Wiskunde A1,2
Wiskunde A1,2 Examen HAVO Hoger Algemeen Voortgezet Onderwijs Tijdvak 1 Donderdag 25 mei 13.30 16.30 uur 20 00 Dit examen bestaat uit 19 vragen. Voor elk vraagnummer is aangegeven hoeveel punten met een
Nadere informatie1. De wereld van de kansmodellen.
STATISTIEK 3 DE GRAAD.. De wereld van de kansmodellen... Kansmodellen X kansmodel Discreet model Continu model Kansverdeling Vaas Staafdiagram Dichtheidsfunctie f(x) GraJiek van f Definitie: Een kansmodel
Nadere informatie6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.
Opgaven hoofdstuk 6 I Learning the Mechanics 6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. De random variabele x wordt tweemaal waargenomen. Ga na dat, indien de waarnemingen
Nadere informatieOpgaven voor Kansrekening
Wiskunde 1 voor kunstmatige intelligentie Opgaven voor Kansrekening Opgave 1. Een oneerlijke dobbelsteen is zo gemaakt dat 3 drie keer zo vaak valt als 4 en 2 twee keer zo vaak als 5. Verder vallen 1,
Nadere informatieToegepaste Statistiek, Week 6 1
Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën
Nadere informatieKlantonderzoek: vraagstelling!
Klantonderzoek: vraagstelling! Vraagstelling bij klantonderzoek Om de juiste resultaten uit een klanttevredenheidsonderzoek te halen is het belangrijk dat de juiste vragen gesteld worden. Bij een klanttevredenheidsonderzoek
Nadere informatieKlantonderzoek: statistiek!
Klantonderzoek: statistiek! Statistiek bij klantonderzoek Om de resultaten van klantonderzoek juist te interpreteren is het belangrijk de juiste analyses uit te voeren. Vaak worden de mogelijkheden van
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen
Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen
Nadere informatieDEZE PAGINA NIET vóór 8.30u OMSLAAN!
STTISTIEK 1 VERSIE MT15303 1308 1 WGENINGEN UNIVERSITEIT LEERSTOELGROEP MT Tentamen Statistiek 1 (MT-15303) 5 augustus 2013, 8.30-10.30 uur EZE PGIN NIET vóór 8.30u OMSLN! STRT MET INVULLEN VN NM, REGISTRTIENUMMER,
Nadere informatieHoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1
Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch
Nadere informatieStatistiek voor A.I. College 10. Donderdag 18 Oktober
Statistiek voor A.I. College 10 Donderdag 18 Oktober 1 / 28 Huffington Post poll verkiezingen VS - 12 Oktober 2012 2 / 28 Gallup poll verkiezingen VS - 15 Oktober 2012 3 / 28 Jullie - onderzoek Kimberly,
Nadere informatieLaplace Experimenteel Intuïtie Axiomatisch. Het kansbegrip. W. Oele. 27 januari 2014. W. Oele Het kansbegrip
27 januari 2014 Deze les Kanstheorie volgens Laplace Experimentele kanstheorie Axiomatische kanstheorie Intuïtie Kanstheorie volgens Laplace (1749-1827) De kans op een gebeurtenis wordt verkregen door
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses
Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling
Nadere informatieStatistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn
Statistiek: Spreiding en dispersie 6/12/2013 dr. Brenda Casteleyn dr. Brenda Casteleyn www.keu6.be Page 2 1. Theorie Met spreiding willen we in één getal uitdrukken hoe verspreid de gegevens zijn: in hoeveel
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (2S27), dinsdag 14 juni 25, 9. - 12. uur. Dit is een tentamen met gesloten boek. De uitwerkingen
Nadere informatie5,1. Samenvatting door een scholier 1647 woorden 18 oktober keer beoordeeld. Wiskunde A
Samenvatting door een scholier 1647 woorden 18 oktober 2010 5,1 4 keer beoordeeld Vak Wiskunde A Samenvatting A2 Recht evenredig Bij een stapgrootte van y hoort een constante eerste augmentatie van x Omgekeerd
Nadere informatie5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:
5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van
Nadere informatieIJkingstoets burgerlijk ingenieur-architect september 2018: feedback deel wiskunde
IJkingstoets burgerlijk ingenieur-architect september 8: feedback deel wiskunde Positionering ten opzichte van andere deelnemers In totaal namen 5 studenten deel aan de ijkingstoets burgerlijk ingenieur-architect
Nadere informatieIJkingstoets burgerlijk ingenieur-architect september 2018: feedback deel wiskunde
IJkingstoets burgerlijk ingenieur-architect september 8: feedback deel wiskunde Positionering ten opzichte van andere deelnemers In totaal namen 5 studenten deel aan de ijkingstoets burgerlijk ingenieur-architect
Nadere informatieCursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)
Cursus Statistiek Hoofdstuk 4 Statistiek voor Informatica Hoofdstuk 4: Verwachtingen Cursusjaar 29 Peter de Waal Departement Informatica Inhoud Verwachtingen Variantie Momenten en Momentengenererende functie
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Uitwerking tentamen Kansrekening en Stochastische Processen (2S61) op woensdag 27 april 25, 14. 17. uur. 1. Gegeven zijn twee onafhankelijke
Nadere informatievoorbeeldexamenopgaven statistiek wiskunde A havo
voorbeeldexamenopgaven statistiek wiskunde A havo FORMULEBLAD Vuistregels voor de grootte van het verschil van twee groepen 2 2 kruistabel a c b d, met phi = ad bc ( a+ b)( a+ c)( b+ d)( c+ d) als phi
Nadere informatie2.1.4 Oefenen. d. Je ziet hier twee weegschalen. Wat is het verschil tussen beide als het gaat om het aflezen van een gewicht?
2.1.4 Oefenen Opgave 9 Bekijk de genoemde dataset GEGEVENS154LEERLINGEN. a. Hoe lang is het grootste meisje? En de grootste jongen? b. Welke lengtes komen het meeste voor? c. Is het berekenen van gemiddelden
Nadere informatieOccasions bij Ben de Beun
8 Noordhoff Uitgevers bv Occasions bij Ben de Beun Een medewerker van een autotijdschrift doet een onderzoek naar de prijzen en eigenschappen van gebruikte auto s. Voor acht bekende modellen werd het aanbod
Nadere informatieWISKUNDE 5 PERIODEN. DATUM : 5 juni 2008 ( s morgens) Niet-programmeerbare, niet-grafische rekenmachine
EUROPEES BACCALAUREAAT 2008 WISKUNDE 5 PERIODEN DATUM : 5 juni 2008 ( s morgens) DUUR VAN HET EXAMEN : 4 uur (240 minuten) TOEGESTANE HULPMIDDELEN Formuleboekje voor de Europese scholen Niet-programmeerbare,
Nadere informatieOefeningen statistiek
Oefeningen statistiek Hoofdstuk De wereld van de kansmodellen.. Tabel A en tabel B zijn de kansverdelingen van model X en van model Y. In beide tabellen is een getal verloren gegaan. Kan jij dat verloren
Nadere informatie