OEFENTOETS chapters 1 t/m 9 en interleafs 2 t/m 5. antwoorden en toelichting

Vergelijkbare documenten
Vraag 1: Vraag 2: Vraag 3:

Vraag 1. Welke uitspraak is juist voor de variabele geslacht? Vraag 2. Welke uitspraak is juist voor de variabele fosfaatgehalte?

vragen 1-7 gaan over de door Dylan Molenaar behandelde stof: chapter 1, interleafs 2, 4 en 5

Hoofdstuk 3 Statistiek: het toetsen

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Voorbeeldtentamen Statistiek voor Psychologie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Data analyse Inleiding statistiek

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Oefenvragen bij Statistics for Business and Economics van Newbold

Hoofdstuk 5 Een populatie: parametrische toetsen

Data analyse Inleiding statistiek

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

herkansing Methoden van Onderzoek en Statistiek, 6 juli 2012 versie 1

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 5: Steekproevendistributies

werkcollege 6 - D&P9: Estimation Using a Single Sample

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Toegepaste Statistiek, Week 3 1

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Statistiek voor A.I. College 12. Dinsdag 23 Oktober


Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Kansrekening en Statistiek

Lesbrief hypothesetoetsen

Antwoordvel Versie A

Inleiding Applicatie Software - Statgraphics

Les 1: Waarschijnlijkheidrekening

Gegevensverwerving en verwerking

Kansrekening en Statistiek

Kansrekening en Statistiek

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Populaties beschrijven met kansmodellen

Statistiek voor A.I.

Toegepaste Statistiek, Week 6 1

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Kansrekening en Statistiek

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Examen Statistiek I Feedback

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Kansrekening en Statistiek

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Sheets K&S voor INF HC 10: Hoofdstuk 12

Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)?

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

9. Lineaire Regressie en Correlatie

Les 1: Waarschijnlijkheidrekening

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

8. Analyseren van samenhang tussen categorische variabelen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Examen Statistiek I Januari 2010 Feedback

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Kansrekening en Statistiek

Beschrijvende statistiek

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

11. Multipele Regressie en Correlatie

Hoofdstuk 10: Regressie

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Analyse van kruistabellen

Hoofdstuk 6 Twee populaties: parametrische toetsen

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Opgave 1: (zowel 2DM40 als 2S390)

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

1 Basisbegrippen, W / O voor waar/onwaar

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

introductie kansen pauze meer kansen random variabelen transformaties ten slotte

Statistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2

Herkansing eindtoets statistiek voor HBO

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Feedback examen Statistiek II Juni 2011

Statistiek voor A.I. College 10. Donderdag 18 Oktober

14.1 Kansberekeningen [1]

Beschrijvend statistiek

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Open en Gepersonaliseerd Statistiekonderwijs (OGS) Deliverable 1.1 Requirements

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Kansrekening en Statistiek

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Transcriptie:

OEFENTOETS chapters 1 t/m 9 en interleafs 2 t/m 5 antwoorden en toelichting

Vraag 1: Hoe noem je het toevallige verschil tussen de schatting van een populatieparameter en de werkelijke waarde van die populatieparameter? Pseudoreplicatie Bias Confounding Steekproeffluctuatie ( sampling error ) H1 (p.13 en p. 15) In de statistiek ben je geïnteresseerd in de waarde van een populatieparameter (bijv: een gemiddelde). Omdat je vaak niet de hele populatie onderzoekt schat je de betreffende parameter in een random steekproef uit de populatie. Deze schatting kan iets afwijken van de populatiewaarde door het toevalsproces achter de steekproeftrekking. Er zitten bijv. relatief iets meer mensen met een hoge waarde op de variabele in de steekproef. Dit toevallige verschil heet steekproeffluctuatie ( sampling error ). Vraag 2: Een onderzoeker bekijkt in een steekproef of er een verschil is op de variabele massa van de amygdala tussen mannen en vrouwen. (NB. De amygdala is een specifiek gedeelte van de hersenen). Welk van de volgende bewering is juist? H1 (p.13 en p. 15) Dit is een experimenteel onderzoek. De verklarende variabele is massa van de amygdala en de respons variabele is geslacht. Dit is een observationeel onderzoek. De verklarende variabele is massa van de amygdala en de respons variabele is geslacht. Dit is een experimenteel onderzoek. De verklarende variabele ( explanatory variable ) is geslacht en de respons variabele is massa van de amygdala. Dit is een observationeel onderzoek. De verklarende variabele is geslacht en de respons variabele is massa van de amygdala. In dit onderzoek gaat het om de invloed van geslacht op massa van de amygdala. Geslacht is dus de verklarende variabele en massa van de amygdala de response variabele. Als het onderzoek een experiment zou zijn, dan zou de verklarende variabele gemanipuleerd moeten worden. Dit is in dit onderzoek niet het geval. Er wordt gekeken naar natuurlijke variatie. Het betreft dus een observationeel onderzoek.

Vraag 3: Een onderzoekster wijst een groep proefpersonen toe aan twee groepen. Ze manipuleert bij deze groepen de variabele zelfvertrouwen. Vervolgens kijkt ze hoeveel alcoholische consumpties de proefpersonen drinken (1, 2, 3, etc.). Wat voor variabele is alcoholconsumptie? Dit is een categorische nominale variabele. Dit is een categorische ordinale variabele. Dit is een numerieke continue variabele. Dit is een numerieke discrete variabele. H1 (p. 12) Aantal alcoholische consumpties is een telling. Tellingen zijn discrete variabelen. Vraag 4: Matthijs meet van 10 proefpersonen het vetpercentage in relatie tot het cholesterolgehalte. Bij iedere proefpersoon herhaalt hij de meting 5 keer, met steeds een jaar tussenruimte. In totaal heeft hij op deze manier 50 metingen verkregen en op grond hiervan bepaalt hij de aanwezigheid van een verband tussen cholesterolgehalte en vetpercentage. Welke fout heeft hij gemaakt in de opzet van zijn onderzoek? I2 Sampling error. Pseudoreplicatie De manipulatie is onnatuurlijk. Omkeerbaar verband ( Reverse causation ). Matthijs behandelt zijn waarnemingen alsof hij 50 onafhankelijke metingen heeft verricht. In andere woorden: hij doet alsof hij zijn meting 50 keer heeft gerepliceerd. Echter, alle metingen bij dezelfde persoon zijn afhankelijk van elkaar. De 50 metingen zijn dus geen zuivere replicaties maar pseudoreplicaties.

Vraag 5: De variabele haarlengte en tentamencijfer voor statistiek hangen positief samen. Een docent vindt dit vreemd en bekijkt de volgende tabel met gemiddelden op beide variabelen voor geslacht, studie, en leeftijd. Hij concludeert dat het verband tussen haarlengte en tentamencijfer voor statistiek vertekend is ( confounded ). Tabel over haarlengte en tentamencijfer Haarlengte (cm) Tentamencijfer Geslacht Jongen 6 7 Meisje 20 8 Studie Biologie 16 7.5 Psychobiologie 13 7.5 Biomedische wetenschap 10 7.5 Leeftijd 17 en 18 jarigen 13 7 19 en 20 jarigen 13 8 Welke variabele is de confounding variable? (je hoeft niet op significantie te toetsen) I4 Geslacht Leeftijd Geslacht en leeftijd Studie Doordat het tentamen gemiddeld iets beter is gemaakt door de meisjes, en meisjes gemiddeld langer haar hebben ontstaat er een verband tussen tentamencijfer en haarlengte. Geslacht is dus de confounding variabele (het hangt zowel met tentamencijfer samen als met haarlengte ). Studie en leeftijd kunnen beide geen confounding variabele zijn: Studie hangt wel samen met haarlengte maar niet met tentamencijfer, en leeftijd hangt wel samen met tentamencijfer maar niet met haarlengte.

Vraag 6: Proefpersonen worden random toegewezen aan twee groepen. Groep A krijgt een enge film te zien, groep B krijgt een neutrale film te zien. Bij de start van de films verschilt de gemiddelde bloeddruk niet tussen beide groepen. Na afloop van de film blijkt de gemiddelde bloeddruk in groep A significant verhoogd te zijn, terwijl de gemiddelde bloeddruk in groep B gelijk is gebleven. Er wordt geconcludeerd dat het kijken naar enge films de bloeddruk kan verhogen. Wat is een mogelijke alternatieve verklaring voor de gevonden resultaten? Er is geen verklarende variabele ( explanatory variable ) in dit onderzoek. De onderzoeker verwart de 'response variable' met de 'explanatory variable' De films verschillen niet alleen in hoe eng ze zijn, maar ook op andere aspecten, bijv. de acteurs die meespelen. Er is niet genoeg statistische power om aan te tonen dat de films niet verschillen. I2 en I4 D is correct, bijv. een aantrekkelijke acteur zou mogelijk voor bloeddruk effecten kunnen zorgen. Vraag 7: In een basisschoolklas vraagt een onderzoekster aan elk kind hoeveel tijd hij/zij besteedt aan het spelen van gewelddadige computerspelletjes. De onderzoekster merkt dat kinderen die langer gewelddadige computerspelletjes spelen, meer gewelddadig gedrag vertonen. Zij concludeert dat het spelen van gewelddadige computerspelletjes leidt tot gewelddadig gedrag. Wat kan er als kritiek op deze conclusie worden gegeven? Kritiek I Er kan sprake zijn van confounding variables Kritiek II De causaliteit zou ook omgekeerd kunnen zijn ('reverse causation') I4 Alleen kritiek I is juist Alleen kritiek II is juist Kritiek I en kritiek II zijn beide juist Kritiek I en kritiek II zijn beide onjuist Kritiek I is valide want er kan een derde variabele zijn die zowel samenhangt met het aantal uren dat een kind gewelddadige spelletjes speelt en met het vertonen van gewelddadig gedrag (bijv: het wel of niet beoefenen van een vechtsport zoals karate) Kritiek II is ook valide omdat het een observationeel onderzoek is. Het spelen van gewelddadige spelletjes kan leiden tot het vertonen van meer gewelddadig gedrag, maar het kan ook zijn dat het vertonen van gewelddadig gedrag leidt tot een verhoogde interesse in het spelen van gewelddadige spelletjes.

Vraag 8: Een onderzoeker wil bij twee groepen mensen de ijzerconcentratie in het bloed meten en kijken of de groepen verschillen op deze variabele. Eric en Rachella doen beide een uitspraak over het begrip statistische power met betrekking tot dit onderzoek. Eric: Statistische power is de kans dat er een significant verschil wordt gevonden tussen de groepen, gegeven dat er in de populatie ook een verschil is tussen deze twee groepen. Rachella: Statistische power is de kans dat er in dit onderzoek een significant verschil wordt gevonden tussen de twee groepen, gegeven dat er voldoende proefpersonen gemeten worden. Wie heeft gelijk? H6 (p. 138) Geen van beiden. Alleen Rachella. Alleen Eric. Zowel Eric als Rachella. De uitspraak van Eric komt overeen met de definitie in het boek (blz. 138 The power of a test is the probability that a random sample will lead to rejection of a false null hypotheses. Bij de uitspraak van Rachella mist de informatie dat de nul-hypothese niet correct is. In dat geval worden kunnen ook Type I fouten gemaakt worden. Vraag 9: De power om een effect te detecteren in een steekproef is niet afhankelijk van: H6 (p. 138) Het aantal personen in de steekproef Het aantal personen in de populatie De spreiding in de populatie De grootte van het effect in de populatie Power is afhankelijk van - De grootte van het effect in de populatie - De spreiding in de populatie - Het aantal proefpersonen in de steekproef - Het significantie niveau Het aantal personen in de populatie dus niet.

Vraag 10: In figuur 2 staat de relatieve cumulatieve frequentie weergegeven van het aantal alcoholische consumpties dat tijdens een Congo-borrel per student gekocht wordt. De barcommissie doet op grond van de grafiek de volgende constateringen: I. De helft van de studenten koopt 3 of minder alcoholische consumpties. II. Een kwart van de studenten koopt 1 of 2 alcoholische consumpties. Figuur 2. Cumulatieve relatieve frequentie van het aantal gekochte alcoholische consumpties per student op een Congo-borrel (fictieve dataset). Welke constateringen zijn waar? I en II zijn beide waar Alleen bewering I is waar Alleen bewering II is waar I en II zijn beide niet waar Bewering I kan rechtstreeks uit de grafiek afgelezen worden. Bewering II is waar omdat 10% van de studenten geen consumpties koopt terwijl 35% 3 of minder consumpties koopt. 35%- 10%=25% koopt dus 1 of 2 consumpties.

Vraag 11: In figuur 3 is een mosaic plot te zien van de ziekte Alzheimer in bejaardentehuis Avondzicht. Op grond van deze figuur worden twee beweringen gedaan: I. In het bejaardentehuis is het aantal mannen met Alzheimer groter dan het aantal vrouwen met Alzheimer II. In het bejaardentehuis lijkt het vóórkomen van Alzheimer afhankelijk te zijn van de sekse. B A Figuur 3. Mosaic plot van de prevalentie (het vóórkomen) van Alzheimer in bejaardentehuis Avondzicht, uitgesplitst naar sekse. Welke beweringen zijn waar? I en II zijn beide waar Alleen bewering I is waar Alleen bewering II is waar I en II zijn beide niet waar Het aantal mannen met Alzheimer kan vergeleken worden met het aantal vrouwen met Alzheimer door de oppervlaktes van rechthoeken A en B in figuur 3 te vergelijken. Hieruit blijkt dat er (in absolute aantallen) meer vrouwen zijn met Alzheimer. Bewering I is dus onjuist. Uit de grafiek blijkt dat ongeveer 30% van de mannen Alzheimer heeft, terwijl maar ongeveer 18% van de vrouwen Alzheimer heeft. Er lijkt dus een effect van sexe te zijn; bewering II is dus waar.

Vraag 12: Een onderzoeker meet gedurende zes dagen elke 6 uur het hemoglobinegehalte van een patiënt na inname van een ijzertablet. Op welke manier kunnen deze metingen het best weergegeven worden? Door middel van een scatter plot (puntgrafiek). Door middel van een lijngrafiek. Door middel van een cumulatieve frequentieverdeling. Door middel van een histogram. Deze data kunnen het best door een lijngrafiek weergegeven worden. Het gaat om meetpunten in de tijd, waarbij de trend beter zichtbaar gemaakt kan worden door de punten met een lijn te verbinden. Vraag 13: Wat is waar voor de steekproef in onderstaande tabel? tabel. Steekproefresultaat waarde frequentie 0 1 1 1 2 3 3 2 4 1 6 2 Het gemiddelde is 2.90 en de mediaan is 2 Het gemiddelde is 2.90 en de mediaan is 2.5 Het gemiddelde is 2.67 en de mediaan is 2 Het gemiddelde is 2.67 en de mediaan is 2.5 Er zijn 10 meetwaarden en de totale som van alle waarden is 29. De mediaan ligt tussen de vijfde en de zesde meetwaarde. Omdat deze meetwaarden verschillen (2 en 3) moet het gemiddelde van deze twee waarden genomen worden (zie bladzijde 67 onderaan)

Vraag 14: De volgende beweringen worden gedaan over de data in figuur 1: I. 50% van de waarnemingen ligt tussen 3 en 6 II. Het gemiddelde van alle waarnemingen is 4 Welke beweringen zijn waar? I en II zijn beide waar Alleen bewering I is waar Alleen bewering II is waar I en II zijn beide niet waar De vertikale randen van de box (de rechthoek) worden gevormd door het eerste kwartiel en het derde kwartiel Hiertussen ligt precies 50% van de meetwaarden. Bewering I is dus correct. De lijn bij 4 geeft de mediaan van de data en dus niet het gemiddelde. Bewering II is dus niet correct. Vraag 15: Het weglaten van een zogenaamde outlier uit een dataset heeft het sterkste effect op de ligging van: De mediaan. De modus. Het gemiddelde. Dat hangt af van de lokatie van de outlier. De modus is de meest voorkomende waarde en deze wordt niet beïnvloed door een outlier. De mediaan is de middelste waarneming; deze wordt nauwelijks beïnvloedt door het weglaten van een outlier. In het gemiddelde tellen outliers relatief zwaar mee, omdat deze sterk de som van alle waarnemingen beïnvloeden.

Vraag 16: Van 4 gezonde, volwassen vrouwen wordt het hemoglobine-gehalte in het bloed gemeten. Het gemiddelde van deze metingen is 9.0 mmol/l en de standaarddeviatie is 1.1 mmol/l. Wat is, gebaseerd op deze metingen, de standaardfout van het gemiddelde hemoglobine-gehalte van gezonde, volwassen vrouwen? 0.55 0.95 1.1 2 SE = S/ n = 1.1/ 4 = 1.1/2 = 0.55, chapter 4, p. 90 Vraag 17: Het steekproefgemiddelde is een zuivere schatter voor het populatiegemiddelde. Wat betekent dat? zie o.a. chapter 4, p. 88 Dat het steekproefgemiddelde op dezelfde manier berekend moet worden als het populatiegemiddelde. Dat het gemiddelde steekproefgemiddelde van ontelbaar veel steekproeven gelijk is aan het populatiegemiddelde. Dat het steekproefgemiddelde altijd in de buurt van het populatiegemiddelde ligt. Dat het steekproefgemiddelde altijd gelijk is aan het populatiegemiddelde. Vraag 18: Waaraan is de standard error of the mean gelijk? Aan de standaardafwijking van Y Aan de standaardafwijking van Aan de standaardafwijking van µ Y Aan de standaardafwijking van de standard error van een schatter (estimate) is de benaming voor de standaardafwijking van de verdeling van die schatter (sampling distribution) zie chapter 4, pag. 89

Vraag 19: Hoe groot is de kans om met 5 normale (=zesvlaks) dobbelstenen full house (3 dezelfden en 2 dezelfden) te gooien? Die kans ligt tussen 0.0000 en 0.0080. Die kans ligt tussen 0.0080 en 0.0380. P(full house) = Die kans ligt tussen 0.0380 en 0.1180. Die kans ligt tussen 0.1180 en 0.1980. " 1% $ ' # 6& 5 ( 5! 3!2! ( 6 ( 5 = 0.0386 aantal oogmogelijkheden voor het trio, nl. 111 of 222 of 333 of 444 of 555 of 666 aantal resterende oogmogelijkheden voor het duo kans op een full house naar keuze bv. 11133 aantal volgordes voor die gekozen full house: 11133 11313 13113 31113 11331 13131 31131 13311 31311 33111

Vraag 20: Iemand die lijdt aan deuteranopia ziet weinig verschil tussen diverse groentinten. De proportie mannen met deuteranopia is 0.05 (5%), de proportie vrouwen met deuteranopia is 0.001 (0.1%). Beschouw een groep van 60 vrouwen en 40 mannen. Er wordt een willekeurige persoon uit deze groep aangewezen. Wat is de kans dat deze persoon GEEN deuteranopia heeft? 0.4897 0.9491 0.9745 0.9794 P(geen d.) = P(man en geen d.) + P(vrouw en geen d.) = 0.4 0.95 + 0.6 0.999 = 0.9794 of: P(geen d.) = 1 P(wel d.) = 1 [ P(man en d.) + P(vrouw en d.) ] = 1 [ 0.4 0.05 + 0.6 0.001 ] = 1 0.0206 = 0.9794 Vraag 21: Iemand bezit een normale dobbelsteen (= zesvlaks dobbelsteen) die onzuiver is. De kansen om met deze dobbelsteen 1,2,3,4 of 5 te gooien zijn aan elkaar gelijk, maar de kans om 6 te gooien wijkt af en deze kans is 1/4. Wat is de kans om met de valse steen en twee zuivere stenen samen 17 te gooien? 0.0111 0.0181 0.0208 0.0333 voor de valse steen geldt P(6) = 1/4 en P(1)=P(2)=P(3)=P(4)=P(5)=3/20 om 17 te gooien moet je een 5 en twee 6- en gooien de kans om de 5 met de valse steen te gooien en de 6- en met de zuivere stenen, is 3/20 1/6 1/6 de kans om met de valse steen een 6 te gooien, en met de zuivere stenen een 5 en een 6, is 1/4 1/6 1/6 en deze kans moet 2 omdat de 5 en de 6 met beide zuivere stenen gegooid kunnen worden de totale kans wordt dus 3/20 1/6 1/6 + (1/4 1/6 1/6) 2 = 0.0181

Vraag 22: Waaraan is 1-P(H 0 wordt verworpen H 0 is onwaar) gelijk? Geen van onderstaande kansen P(H 0 wordt niet verworpen H 0 is waar) P(H 0 wordt verworpen H 0 is onwaar) P(H 0 wordt verworpen H 0 is waar) de rode uitdrukking is gelijk aan P(H0 wordt niet verworpen H0 is onwaar) (=P(type II fout) en deze kans staat er niet tussen theorie over kansen op type I en II fouten en hun inversen staat in chapter 6, zie bv. p. 137 Vraag 23: Laboratoriummuizen die van jongsafaan een calorie-rijk dieet krijgen, hebben een gemiddelde leeftijd van 33 maanden met een standaarddeviatie van 2.7 maanden. Een dierfysioloog vermoedt dat wanneer muizen op een calorie-arm dieet worden gezet, dit tot een andere gemiddelde leeftijd zal leiden. Hij zet 40 muizen van jongsafaan op een calorie-arm dieet en stelt vast dat deze muizen gemiddeld 31 maanden in leven blijven. Hoe luiden de statistische hypothesen bij dit onderzoek? H0: µ =33, HA: µ >33 H0: µ =33, HA: µ 33 H0: µ =33, HA: µ <33 H0: µ =33, HA: µ =31 De eerste zin uit dit vraagstuk geeft informatie over een muizenpopulatie die calorie- rijk voedsel eet (µ=33, σ=2.7). De fysioloog vermoedt dat de µ anders zal zijn voor een muizenpopulatie die calorie- arm voedsel eet (µ 33). De laatste zin uit het vraagstuk vertelt iets over de steekproef die de fysioloog trekt, maar die informatie is niet relevant voor de op te stelllen hypothesen, omdat hypothesen NOOIT worden opgesteld op grond van de steekproef, maar ALTIJD op grond van redenaties vooraf (die dan door de steekproef moeten worden bevestigd).

Vraag 24: Welk van onderstaande kansen is gelijk aan de power van een toets? P(H 0 wordt niet verworpen H 0 is niet waar) P(H 0 wordt niet verworpen H 0 is waar) P(H 0 wordt verworpen H 0 is niet waar) P(H 0 wordt verworpen H 0 is waar) chapter 6, p. 138 Vraag 25: Circa 15% van de mannen tussen 30 en 40 jaar snurkt. Wat is de kans dat er in een willekeurige steekproef van 9 mannen met een leeftijd tussen 30 en 40 jaar minimaal 1 snurkt? Ongeveer 25%. Ongeveer 35%. Ongeveer 60%. Ongeveer 75%. X: aantal snurkers in een groep van 9 mannen (tussen 30 en 40 jaar) X is binomiaalverdeeld met n=9 en p=0.15 (waarom is X binomiaal verdeeld? omdat X een variabele is van het type aantal objecten- met- een- bepaald- kenmerk in een groep objecten, zie chapter 7) P(X 1) = 1- P(X=0) =1- binompdf(9,0.15,0) = 0.7684 NB als je niet in staat bent om de binomale kansfunctie van je rekenmachine te gebruiken, dan kom je ook op het goede antwoord met behulp van de binomiaalformule uit het boek: P(X 1) = 1 P(X=0) " = 1! 9 % $ '0.15 0 0.85 9 = 0.7684 # 0 &

Vraag 26: Er zijn vermoedens dat er in China niet evenveel jongens als meisjes worden geboren. Uit een onderzoek blijkt dat er in China op een bepaalde dag 14200 meisjes werden geboren en 14600 jongens. Uit deze gegevens kan worden berekend dat, van de kinderen die dagelijks in de Chinese populatie geboren worden, de estimated proportion jongens gelijk is aan. Kan er met een betrouwbaarheid van 99% worden gesteld dat de geboorteverhouding van jongens en meisjes in China afwijkt van 0.5? NB. Gebruik naar keuze de Wald methode of de Agresti-Coull methode Ja, het interval luidt [0.499, 0.515]. Ja, het interval luidt [0.501, 0.513]. Nee, het interval luidt [0.499, 0.515]. Nee, het interval luidt [0.501, 0.513]. gewoon de formulekaart gebruiken: Wald: ^ ^ ^ ^ p 2.58 SE(p) < p < p + 2.58 SE(p) ^ SE(p) = (p(1 p)) ^ ^ / (n 1) jongens 14600 meisjes 14200 pdakje 0.50694444 SE-pdakje 0.00294605 Z 2.58 1.96 WALD onder 0.499 0.501 boven 0.515 0.513 AGRESTI-COULL p' 0.50694348 onder 0.499 0.501 boven 0.515 0.513 groene waarden zijn juist, rode zijn onjuist

Vraag 27: Als je aan ziekte Z lijdt, en je gebruikt medicijn M, dan word je in 9 van de 10 gevallen binnen een week beter. De fabrikant probeert medicijn M nog effectiever te maken en experimenteert met diverse kleine wijzigingen in de samenstelling. Een bepaalde wijziging lijkt veelbelovend: alle 45 proefpersonen die de gewijzigde versie gebruiken, worden binnen een week beter. Met welke toets moet je nagaan of dit resultaat een significante verbetering is, en wat vind je dan? Met een binomiaaltoets, en je vindt dat de resultaten niet wijzen op een significante verbetering Met een binomiaaltoets, en je vindt dat de resultaten wijzen op een significante verbetering Met een Poissontoets, en je vindt dat de resultaten niet wijzen op een significante verbetering Met een Poissontoets, en je vindt dat de resultaten wijzen op een significante verbetering De eerste zin van het vraagstuk geeft je de proportie mensen die beter wordt bij gebruik van medicijn M (p=0.9). De laatste zin van het vraagstuk vertelt je dat in de steekproef een p- dakje werd gevonden van 45/45 = 1. De nulhypothese H0: p=0.9 kun je toetsen met een binomiaaltoets (chapter 7). De test statistic is X: aantal mensen in een groep van 45 dat beter wordt bij gebruik van het verbeterde middel en is binomiaal verdeeld. De P- value is dan P(X=45 X is binomiaalverdeeld met n=45 en p=0.9) = binompdf(45,0.9,45) = 0.0087. Dat betekent dus een significante verbetering. Vraag 28: In augustus 2004 trok de meteorietenzwerm Perseiden door de dampkring. Het aantal vallende sterren dat er toen te zien was aan de nachtelijke hemel, was gemiddeld 30 per uur. Wat is de kans dat als iemand die nacht een kwartier naar de hemel heeft gekeken, hij/zij precies 5 vallende sterren heeft gezien? 0.0134 0.0916 0.1094 2/3 vallende sterren zijn random gebeurtenissen, dus X: aantal vallende sterren per uur is Poisson verdeeld gegeven is dat µ=30 / uur de kans die gevvraagd wordt betreft echter de tijdsduur van een kwartier daarom moet eerst het gemiddelde per kwartier bepaald worden, dat is µ=7.5 / kwartier dus P(X=5 X is Poissonverdeeld met µ=7.5) = Poissonpdf(7.5,5) = 0.1094 zie chapter 8 voor theorie over de Poissonverdeling

Vraag 29: Stel dat je een -toets voor onafhankelijkheid uitvoert terwijl enkele verwachte frequenties een waarde kleiner dan 1 hebben. Wat is daarvan het gevolg? De verdeling van de toetsingsgrootheid krijgt daardoor een verkeerd aantal vrijheidsgraden. De kans op een type II fout neemt dan toe. De waarde van de toetsingsgrootheid gaat dan te klein uitvallen. De toetsingsgrootheid volgt dan niet meer bij benadering een 2 -verdeling. a. het aantal vrijheidsgraden an sich wordt niet beinvloed door de waardes die de E s hebben (dat gebeurt pas als je (op grond van lage E s) categorieën gaat samennemen b. de kans op een type I fout neemt toe c. de waarde van de TG gaat juist te groot uitvallen d. juist

Vraag 30: Bij het werpen met een zuivere viervlaksdobbelsteen verwacht je dat 1, 2, 3 en 4 even vaak gegooid worden. Jan kan zich echter voorstellen dat de viervlaksdobbelsteen die hij zelf heeft gemaakt van een stuk hout, niet zuiver is. Hij werpt 24 maal met deze steen, met de volgende resultaten: ogen Frequentie 1 4 2 6 3 10 4 4 Als je met een χ 2 -toets voor passendheid (χ 2 -test for goodness of fit) nagaat of de dobbelsteen (toch) zuiver is, hoe groot is dan de P-waarde? 0.00 < P 0.10 0.25 < P 0.35 0.35 < P 0.45 0.70 < P 0.80 groene waarden in de tabel hieronder zijn juist, rode zijn onjuist ogen obs exp (O-E)2/E 1 4 6 0.66666667 2 6 6 0 3 10 6 2.66666667 4 4 6 0.66666667 24 24 TG: 4 P: 0.26146411 0.40600588 df: 3 4 1,2 10 12 0.33333333 3,4 14 12 0.33333333 24 24 TG: 0.66666667 P: 0.41421618 0.71653131 0.88101484 df: 1 2 3 de expected frequencies moeten niet worden samengenomen (zoals in het onderste deel van de tabel) want ze zijn allemaal >5

Vraag 31: Iemand doet onderzoek naar het verband tussen geslacht en hoofdpijn. Hij vraagt 100 vrouwen en 120 mannen of ze de afgelopen maand hoofdpijn hebben gehad. De resultaten zijn: hoofdpijn Geen hoofdpijn Vrouw 90 10 man 40 80 Als je het verband wilt onderzoeken tussen geslacht en hoofdpijn, kun je dat doen met de -test voor onafhankelijkheid ( -contingency test). Daarvoor moeten er eerst expected frequencies worden berekend. Wat is de expected frequency voor vrouwen die geen hoofdpijn hebben gehad? 18.6 40.9 45 55 E(vrouwen zonder hoofdpijn) ^ ^ = P(geen hoofdpijn) * P(vrouw) * n = 90/220 * 100/220 * 220 = 9000/220 = 40.9

Vraag 32: Is er onder vrouwelijke studenten verband tussen roken en het doen aan sport? Hieronder staan de resultaten van een enquête onder 112 vrouwelijke studenten. sporten ja nee roken ja 6 5 nee 61 40 Om na te gaan of er onder vrouwelijke studenten verband bestaat tussen roken en het doen aan sport, moet je een chikwadraat-toets voor onafhankelijkheid uitvoeren. Wat is dan de nulhypothese, en wat is de conclusie ten aanzien van vrouwelijke studenten? H 0 : sporten en roken zijn afhankelijk; conclusie: er is geen reden om aan te nemen dat roken en het doen aan sport afhankelijke variabelen zijn H 0 : sporten en roken zijn afhankelijk; conclusie: er is reden om aan te nemen dat roken en het doen aan sport afhankelijke variabelen zijn H 0 : sporten en roken zijn onafhankelijk; conclusie: er is geen reden om aan te nemen dat roken en het doen aan sport afhankelijke variabelen zijn H 0 : sporten en roken zijn onafhankelijk; conclusie: er is reden om aan te nemen dat roken en het doen aan sport afhankelijke variabelen zijn De nulhypothese bij een chikwadraat toets voor onafhankelijkheid (chisquare test for independence of chisquare contingency test) is ALTIJD dat de twee variabelen ONafhankelijk zijn. Dat moet wel, want als je afhankelijkheid als nulhypothese neemt, kun je geen expected frequencies berekenen. Zie boek chapter 9, p. 215. De conclusie volgt uit de P- waarde. Je moet de toets dus helemaal uitvoeren. OBSERVED ja nee ja 6 5 11 nee 61 40 101 67 45 112 EXPECTED 6.5803571 4.4196429 60.419643 40.580357 TG termen 0.0511848 0.0762085 0.0055746 0.0082999 TG 0.1412679 volgt!2 verdeling met df=1 P 0.7070238 P>0.05 dus H0 kan niet verworpen dus geen reden om aan te nemen dat de twee variabelen afhankelijk zijn

Vraag 33: Erven bij erwten de genen rimpeligheid en kleur onafhankelijk over? Hieronder staan de waarnemingen aan 80 erwten. Glad Gerimpeld Lichtgroen 20 30 50 Donkergroen 10 20 30 30 50 80 Je kunt met een chikwadraattoets voor onafhankelijkheid nagaan of genoemde genen onafhankelijk overerven. Wat is dan de P-waarde die je vindt? 0.0000 < P 0.0500 0.0500 < P 0.5000 0.5000 < P 0.7500 0.7500 < P 1.0000 OBSERVED ja nee ja 20 30 50 nee 10 20 30 30 50 80 EXPECTED 18.75 31.25 11.25 18.75 TG termen 0.0833333 0.05 0.1388889 0.0833333 TG 0.3555556 volgt!2 verdeling met df=1 P 0.550985