Vraag 1. Welk design bevat geen random assignment:

Vergelijkbare documenten
Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)?

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 3 Statistiek: het toetsen

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

Hoofdstuk 6 Twee populaties: parametrische toetsen

Voorbeeldtentamen Statistiek voor Psychologie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Wiskunde B - Tentamen 2

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Hoofdstuk 10: Regressie

College 2 Enkelvoudige Lineaire Regressie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Antwoordvel Versie A

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Inhoudsopgave. Deel I Schatters en toetsen 1

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

Wiskunde B - Tentamen 1

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

mlw stroom 2.1: Statistisch modelleren

Kansrekening en Statistiek

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Les 1: Waarschijnlijkheidrekening

herkansing Methoden van Onderzoek en Statistiek, 6 juli 2012 versie 1

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

toetskeuze schema verschillen in gemiddelden

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

Oefenvragen bij Statistics for Business and Economics van Newbold

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Kansrekening en Statistiek

Hoofdstuk 5: Steekproevendistributies

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Toetsen van hypothesen

College 6 Eenweg Variantie-Analyse

Feedback examen Statistiek II Juni 2011

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

1. Reductie van error variantie en dus verhogen van power op F-test

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

ONBETWIST ONderwijs verbeteren met WISkunde Toetsen. Voorbeeldtoetsen VWO-wiskunde. Deliverable 3.8. Henk van der Kooij. ONBETWIST Deliverable 3.

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

College 3 Meervoudige Lineaire Regressie

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Data analyse Inleiding statistiek

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

werkcollege 6 - D&P9: Estimation Using a Single Sample

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

11. Meerdere gemiddelden vergelijken, ANOVA

Vraag 1: Vraag 2: Vraag 3:

Lesbrief hypothesetoetsen

Statistiek voor A.I.

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

11. Multipele Regressie en Correlatie

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Vraag 1. Welke uitspraak is juist voor de variabele geslacht? Vraag 2. Welke uitspraak is juist voor de variabele fosfaatgehalte?

HOOFDSTUK VII REGRESSIE ANALYSE

Formules Excel Bedrijfsstatistiek

Opgave 1: (zowel 2DM40 als 2S390)

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

Statistiek ( ) eindtentamen

Toegepaste Statistiek, Week 6 1

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Statistiek II. Sessie 5. Feedback Deel 5

College 7 Tweeweg Variantie-Analyse

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

9. Lineaire Regressie en Correlatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 27 oktober 2010, uur

WISKUNDE HAVO EM klas 12 PROEFTENTAMEN

STATISTIEK 2 VERSIE A MAT Tentamen Statistiek 2 (MAT-15403) Maandag 5 augustus 2013, uur

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

. Dan geldt P(B) = a d. 3 8

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

Les 2: Toetsen van één gemiddelde

Transcriptie:

Vraag 1. Welk design bevat geen random assignment: a) Een design gebaseerd op matching b) Een design gebaseerd op blocking c) Een factorial design d) Elk van de hierboven genoemde designs ch14 p.375

Vraag 2. In een experiment met 3 between- subject factoren heb ik de volgende situatie: Factor A heeft 4 niveaus, Factor B heeft 2 niveaus en factor C heeft 3 niveaus. Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)? a) 3 b) 9 c) 11 d) 24 ch14 p.372-374

Vraag 3. De Bonferroni correctie op het significantie niveau (α) is gegeven door de volgende formule: * α = α aantal toetsen Waarvoor wordt een Bonferroni correctie gebruikt? a) Bij het gebruik van meerdere statistische toetsen vergroot de variantie van α. b) Bij het gebruik van meerdere statistische toetsen verkleint de variantie van α. c) Bij het gebruik van meerdere statistische toetsen vergroot de kans op een Type I fout. d) Bij het gebruik van meerdere statistische toetsen verkleint de kans op een Type I fout. interleaf 9

Vraag 4. Bekijk de volgende definitie: Het verschil tussen het ware effect en het gemiddelde effect zoals dat is gepubliceerd in de literatuur. Welk begrip wordt hier bedoeld? a) Confounding b) Observer bias c) Publication bias d) Experimental artifacts interleaf 10

Vraag 5. Bij een groep proefpersonen manipuleert een onderzoekster 2 variabelen. Variabele A krijgt 3 niveaus, variabele B krijgt 6 niveaus. Ze wil de invloed van haar manipulaties onderzoeken in een between- subject design dat fully crossed is. Hoeveel condities moet de onderzoekster gebruiken? a) 2 condities b) 4 condities c) 9 condities d) 18 condities ch14

Vraag 6. Wanneer is er sprake van een balanced design? a) Wanneer de varianties binnen de condities van het experiment gelijk zijn. b) Wanneer elke factor in het design evenveel niveaus heeft. c) Wanneer er evenveel meetwaarden in elke conditie van het experiment zitten. d) Wanneer het design 2 factoren heeft (in plaats van 1). ch14 4

Vraag 7. In het boek wordt het gebruik van data dredging besproken. Dit houdt in dat er meerdere statistische tests worden uitgevoerd in de hoop dat er tenminste één een significant resultaat oplevert. Wat is het gevolg van data dredging? a) Door meerdere toetsen uit te proberen wordt de aanname van normaliteit geschonden. b) Door meerdere toetsen uit te proberen vergroot de kans op een Type I fout. c) Door meerdere toetsen uit te proberen is er sprake van pseudoreplicatie. d) Door meerdere toetsen uit te proberen wordt de steekproefgrootte kunstmatig verhoogd. De daadwerkelijke steekproef is kleiner. interleaf 8

Vraag 8. Waar wordt een funnel plot voor gebruikt? a) Om een indicatie te krijgen van de groepsverschillen op een gegeven afhankelijke variabele. b) Om een indicatie te krijgen van de mate waarin er sprake is van publication bias. c) Om een indicatie te krijgen van de spreiding binnen één individu op een herhaalde meting. d) Om een indicatie te krijgen van de precisie van een bepaalde schatter. interleaf 9

Vraag 9 Lichaamstemperatuur van gezonde mensen is normaalverdeeld met gemiddelde van 36.8 C en een standaarddeviatie van 0.35 C. Wat is de kans op een lichaamstemperatuur die lager is dan 36.0 C? a) P < 0.01 b) 0.01 < P < 0.02 c) 0.02 < P < 0.05 d) P > 0.05 ch10 gevraagd wordt een kans uit de verdeling van lichaamstemperatuur P = normalcdf(- e9,36,36.8,0.35) = 0.0111

Vraag 10 Geboortegewicht is normaalverdeeld met gemiddelde 3339 gram en standaardafwijking 573 gram. Een baby moet uit voorzorg in de couveuse als ze tot de 1% lichtste baby s behoort. Onder welk grensgewicht moet een baby in de couveuse? a) Minder dan 1.7 kg. b) Minder dan 1.8 kg. c) Minder dan 1.9 kg. d) Minder dan 2.0 kg. ch10 gevraagd wordt een waarde uit de verdeling van geboortegewicht invnorm(0.01,3339,573) = 2006 g

Vraag 11 IQ is normaal verdeeld met gemiddelde 100 en standaarddeviatie 15. Welk deel van de populatie zal een IQ hebben van 119 of hoger? a) Ongeveer 5 procent b) Ongeveer 10 procent c) Ongeveer 15 procent d) Ongeveer 20 procent ch10 gevraagd wordt een fractie=oppervlak=kans uit de verdeling van IQ fractie = normalcdf(119,e9,100,15) = 0.103 10%

Vraag 12 De lengte van kinderen bij de geboorte is normaalverdeeld met een gemiddelde van 52 cm en een variantie van 1.5 cm 2. Hoe groot is de kans dat de gemiddelde lengte van (een willekeurig samengestelde groep van) 6 pasgeboren baby s ligt tussen de 51 en 53 cm? a) 0.4950 b) 0.5858 c) 0.8975 d) 0.9545 ch10 5 gevraagd wordt een kans uit de verdeling van gemiddelde lengte P = normalcdf(51,53,52, 1.5/ 6) = 0.9545

Vraag 13 Een onderzoeker wil testen of de lengte van vrouwen uit België afwijkt van de lengte van vrouwen uit Nederland. De gemiddelde lengte van vrouwen uit Nederland is 169.6 cm. De onderzoeker bepaalt de lengte van 100 (aselect gekozen) Belgische vrouwen en vindt een gemiddelde lengte van 168.9 cm met een standaardafwijking van 3.4 cm. Lichaamslengte is een normaalverdeelde variabele. Wat is de juiste conclusie op grond van deze van deze steekproef? a) P=0.021; de nulhypothese dat Belgische vrouwen dezelfde lengte hebben als Nederlandse vrouwen wordt verworpen (P < 0.05). b) P=0.042; de nulhypothese dat Belgische vrouwen dezelfde lengte hebben als Nederlandse vrouwen wordt verworpen (P < 0.05). c) P=0.42; de nulhypothese dat Belgische vrouwen dezelfde lengte hebben als Nederlandse vrouwen wordt niet verworpen (P > 0.05). d) P=0.84; de nulhypothese dat Belgische vrouwen dezelfde lengte hebben als Nederlandse vrouwen wordt niet verworpen (P > 0.05). one- sample t- test ch11 1 H0: µ=169.6, HA: µ 169.6 TG = (168.9-169.6) / (3.4/ 100) = - 2.06; P = 2*tcdf(- e9,- 2.06,99)=0.042

Vraag 14 Beschouw de volgende twee beweringen: I. De Student s t- verdeling gaat bij een toenemend aantal vrijheidsgraden steeds meer lijken op de standaardnormale verdeling. II. Bij een klein aantal vrijheidsgraden is de Student s t- verdeling asymmetrisch. Welke beweringen zijn waar? a) Alleen bewering I is waar. b) Alleen bewering II is waar. c) Bewering I en II zijn beide waar. d) Bewering I en II zijn beide NIET waar. ch11 bew. 1: p. 260 bew. 2: p. 261

Vraag 15 Staartlengte van zwarte ratten (Rattus rattus) is normaal verdeeld. Een onderzoeker bepaalt bij een steekproef van 9 ratten de staartlengte en vindt een gemiddelde van 15.20 cm met een standdaardeviatie van 2.19 cm. Wat is op grond van deze data het 99% betrouwbaarheidsinterval voor het populatiegemiddelde µ? a) 9.56 < µ < 20.84 b) 12.75 < µ < 17.65 c) 12.83 < µ < 17.57 d) 13.32 < µ < 17.08 ch11 p.265 besef dat 15.20 het steekproefgemiddelde is en 2.19 de steekproefstandaardafwijking gebruik de formule voor een betr. intv. zoals op p.265 of op de formulekaart; t lees je af in Table C bij df=8 en α(2)=0.01 en dat is 3.36, of je vindt t mbv invt(0.005,8) = - 3.36

Vraag 16 Wat is de juiste interpretatie van het betrouwbaarheidsinterval bij de voorgaande vraag? a) Er is 99% kans dat het populatiegemiddelde tussen beide grenswaarden ligt. b) In 99% van de steekproeven zal het gevonden betrouwbaarheidsinterval het populatiegemiddelde bevatten. c) Er is 99% kans om een steekproefgemiddelde tussen beide grenswaarden te vinden. d) Geen van bovengenoemde interpretaties is juist. ch11 p.264

Vraag 17 Het enzym lactaatdehydrogenase (LDG) komt voor in spiercellen, bloedcellen en huidcellen en zet koolhydraten om in melkzuur (lactaat). Hieronder staan de resultaten van een studie naar de LDG- concentratie in de rode bloedcellen van mannen en vrouwen (met Y: lactaatdehydrogenase- concentratie ). Mannen Vrouwen n 270 264 Y- streep 60 57 S 11 10 Met een t- toets kun je nagaan of er verschil is tussen de LDG- concentratie van mannen en vrouwen. Als je die toets uitvoert, wat is dan de waarde van de toetsingsgrootheid (TG- waarde) en wat is de conclusie? a) TG=3.30; er is geen reden om aan te nemen dat de LDG- concentratie van mannen en vrouwen verschilt. b) TG=3.30; het lijkt erop dat de LDG- concentratie van mannen en vrouwen verschilt. c) TG=10.70; er is geen reden om aan te nemen dat de LDG- concentratie van mannen en vrouwen verschilt. d) TG=10.70; het lijkt erop dat de LDG- concentratie van mannen en vrouwen verschilt. ch12 p.291

2 sample t- test omdat s(man) s(vrouw) is het zeer waarschijnlijk dat de populatievarianties gelijk zijn (als je het niet gelooft, moet je maar even een F- tetst doen), dus kunnen we verder met Student s t test S 2 pooled is (269*11 2 +263*10 2 )/(269+263)= 110.62 SE= 110.62*((1/269)+(1/263))= 0.91205 TG=(60-57)/0.91205=3.289 dit is een waarde uit een t 532 verdeling P=2*tcdf(3.289,E9,532)=0.0011 dus P<0.05, dus H0 (LDG concentratie van mannen en vrouwen is gelijk) kan verworpen

Vraag 18 Wat stelt de pooled variance voor? a) Het gemiddelde van de steekproefvarianties. b) De variantie van de steekproefgemiddeldes. c) Het gewogen gemiddelde van de steekproefvarianties. d) De gewogen variantie van de steekproefgemiddeldes. ch12 p.289

Vraag 19 Op een groep van 25 proefpersonen wordt een nieuw medicijn getest. Een controlegroep van 19 proefpersonen krijgt een placebo. Een onderzoeker vermoedt dat het medicijn de spreiding van een bepaalde bloedwaarde beïnvloedt. dus tweezijdig toetsen De variantie van deze bloedwaarde is 0.9 in de groep die het medicijn slikt en 1.8 in de groep die de placebo slikt. De onderzoeker voert een F- test uit voor gelijke varianties. Welk van onderstaande kansen correspondeert met de P- waarde? a) P = P(F(24,18) 0.5) b) P = P(F(24,18) 2) c) P = 2 * P(F(18,24) 0.5) d) P = 2 * P(F(18,24) 2) ch12 p.300 F- test voor twee varianties groep medicijn : n=25, s 2 =0.9 groep placebo : n=19, s 2 =1.8 de P- waarde kan op twee manieren berekend manier 1: TG = 1.8/0.9 = 2 dan is P = 2* Fcdf(2,e9,18,24) = 0.1131 manier 2: TG = 0.9/1.8 = 0.5 dan is P = 2* Fcdf(0,0.5,24,18) = 0.1131 alleen manier 1 is terug te vinden bij de antwoorden

Vraag 20 Iemand wil de nulhypothese H 0 : σ A 2 = σ B 2 toetsen tegen de alternatieve hypothese H A : σ A 2 σ B 2 A en B zijn normaalverdeelde variabelen. Zowel uit A als uit B wordt een steekproef getrokken. Voor de steekproef uit A geldt: A- streep is 14.949, S A is 4.995 en n A is 10. Voor de steekproef uit B geldt: B- streep is 14.146, S B is 6.26 en n B is 12. Bereken de waarde die de bij deze nulhypothese te gebruiken toetsingsgrootheid (TG) aanneemt, en bepaal de bijbehorende P- waarde. a) P = 0.2535 b) P = 0.3733 c) P = 0.5071 d) P = 0.7465 ch12 7 F- test voor twee varianties groep A: n=10, s 2 =4.995 2 groep B: n=12, s 2 =6.26 2 tweezijdige toets TG = 4.995 2 /6.26 2 = 0.637, P = 2*Fcdf(0,0.636,9,11) = 0.5071 of TG = 6.26 2 /4.995 2 = 1.57, P = 2*Fcdf(1.57,e9,11,9) = 0.5071

Vraag 21 Beschouw de volgende twee uitspraken: I. De power van een non- parameterische toets is over het algemeen lager dan de power van een vergelijkbare parametrische toets II. Bij gepaarde data waarbij de verschillen tussen de meetwaardes niet normaal verdeeld zijn kan een tekentoets (sign test) toegepast worden Welke uitspraken zijn waar? a) Alleen bewering I is waar. b) Alleen bewering II is waar. c) Bewering I en II zijn beide waar. d) Bewering I en II zijn beide NIET waar. ch13 bew. 1 p. 343 bew. 2 p. 333

Vraag 22 Bij de Mann- Whitney U- test krijgt elke variabele uit de steekproeven een rang toegewezen. Per steekproef worden de rangen vervolgens opgeteld tot rangsom R. Hieronder staan de samenstellingen van twee steekproeven. A: 11 19 10 5 11 12 B: 18 5 11 3 18 10 Welke rangsom verwacht je theoretisch voor steekproef A als de steekproeven uit populaties komen met dezelfde mediaan? a) R A = 24 ch13 5 b) R A = 39 c) R A = 42 d) R A = R B, meer kun je er niet over zeggen als beide populaties dezelfde mediaan hebben en de steekproeven uit deze populaties even groot zijn, dan verwacht je in theorie dat de rangsommen ook even groot zijn het uitrekenen van wat R A in dit geval is heeft dus geen zin, het gaat om wat je theoretisch verwacht als er in totaal 12 rangen te vergeven zijn, is de totale rangsom dus 1+2+3+ +11+12 = 78, dus verwacht je R A =R B =78/2=39 (in werkelijkheid zul je meestal vinden R A R B, zoals ook hier)

Vraag 23 Aan vier groepen van elk 15 personen wordt variabele Y gemeten. Het blijkt dat Y in de vier groepen niet normaalverdeeld is, maar Y wel. Welke toets heeft de voorkeur als je wilt nagaan of de ligging van deze vier groepen gelijk is? Neem aan dat er aan de voorwaarde voor gelijke variantie (ANOVA) of gelijke verdelingsvorm (Kruskall- Wallis) is voldaan, zowel voor Y als voor Y. a) ANOVA op de getransformeerde metingen. b) ANOVA op de oorspronkelijke metingen. c) Kruskall- Wallis op de getransformeerde metingen. d) Kruskall- Wallis op de oorspronkelijke metingen. ch13 een parametrische toets heeft altijd de voorkeur (zelfs als de data daarvoor getransformeerd moeten) omdat de power van een parametrische toets groter is dan van een non- parametrische toets (die immers de absolute metingen omzet in rangen waardoor je informatie verliest)

Vraag 24 Drie groepen muizen worden elk onder een verschillende stressvolle situatie geplaatst. Van elk muis wordt daarna het cortisol- gehalte in het bloed bepaald (cortisol is een stress- hormoon). Elke groep bestaat uit 5 muizen. De nulhypothese dat de groepen niet verschillen in het gemiddelde cortisolgehalte wordt met een ANOVA getoetst. Daarbij blijkt SS error = 10 en SS groups = 7. In welk interval valt de P- waarde? a) P < 0.025 b) 0.025 < P < 0.050 c) 0.050 < P < 0.100 d) 0.100 < P ch15 p. 399 bepaal de df s van beide SS- en en bereken dan beide MS- en MS groups /MS error is de TG en volgt een F(df groups,df error )- verdeling de P- waarde bereken je dan met een Fcdf (bij een anova nooit *2)

Vraag 25 In een onderzoek naar het effect van elektromagnetische velden op de menselijke gezondheid, werden 7 groepen mensen elk gedurende een week blootgesteld aan een elektromagnetisch veld van een andere sterkte. Elke groep bestond uit 45 personen. Na afloop werd bij elk groepslid de serumconcentratie adrenaline vastgesteld. De metingen werden met een één- factor model variantieanalyse geanalyseerd. Welke verdeling volgde de toetsingsgrootheid? a) F(6,314) b) F(6,308) c) F(6,44) d) F(6,38) ch15 p. 399 df1 = df groups = k- 1 = 7-1 = 6 df2 = df error = N- k = (7*45)- 7 = 308

Vraag 26 Uit populatie X1 wordt de volgende steekproef getrokken: 3.8 5.2 5.1 5.1 3.4 Uit populatie X2 wordt de volgende steekproef getrokken: 6.1 7.4 9.0 6.7 6.8 Beide populaties zijn normaalverdeeld en hebben dezelfde variantie. Wat is de zuiverste schatter van deze (populatie)variantie? a) MS groups b) MS error c) SS error d) S 2 X1 + S 2 X2 ch15 alleen MS- en zijn variantieschattingen, SS- en niet MS error is de zuiverste van de genoemde MS- en, omdat MS error een soort van gewogen gemiddelde steekproefvariantie is en dus een directe schatter van de populatievariantie MS groups geeft een onjuist beeld van de populatievariantie wanneer de populaties een verschillende ligging hebben (maw als de behandelingen effect hebben) antw. d) zou goed zijn als de som nog gedeeld werd door 2

Vraag 27 In een onderzoek naar het effect van suikerconsumptie (factor A) op bloedsuikergehalte (variabele Y) worden 40 personen in 2 even grote groepen ingedeeld. Elke groep krijgt een andere hoeveelheid suiker te consumeren. Van elke groep wordt vervolgens het gemiddelde bloedsuikergehalte bepaald. Om de nulhypothese te toetsen dat suikerconsumptie geen effect heeft op bloedsuikergehalte, wordt een één- factor model variantieanalyse uitgevoerd. De resultaten daarvan zijn: SS error = 100.0 SS groups = 6.5 In welk interval ligt de waarde die de toetsingsgrootheid aanneemt? a) 0.00 tot <1.00 b) 1.00 tot <2.00 c) 2.00 tot <2.50 d) 2.50 tot <3.00 ch15 bepaal df error en df groups en bereken MS groups /MS error als toetsingsgrootheid

Vraag 28 Een onderzoeker bepaalt in een experimentele proef of er bij papegaaien samenhang bestaat tussen omgevingstemperatuur en de hoeveelheid dagelijks genuttigd voedsel. Hij vindt een lineaire correlatiecoëfficiënt tussen de variabelen ter grootte r = 0.36 op basis van 60 waarnemingen. Welke conclusie kan hieruit worden getrokken? a) Het lijkt erop dat papagaaien minder eten als ze zich in een warmere omgeving bevinden (P<0.05). b) Het lijkt erop dat papagaaien meer eten als ze zich in een warmere omgeving bevinden (P<0.05). c) Er lijkt bij papegaaien geen samenhang te zijn tussen omgevingstemperatuur en de hoeveelheid dagelijks genuttigd voedsel (P>0.05). d) De spreiding in de hoeveelheid voedsel die papegaaien dagelijks eten is voor 36% te verklaren uit de samenhang die er bestaat met de omgevingstemperatuur. toetsing van H0: ρ=0 TG = r/se r en is t n- 2 verdeeld SEr = (1- r 2 / n- 2) zie formulekaart je vindt een P>0.05 ch16 p. 439, 440 dat a) wel goed is en b) niet,volgt uit het feit dat de gevonden r<0

Vraag 29 Hoe moet de correlatiecoëfficiënt van een eindige populatie (omvang n) worden berekend? = ( X µ X )( Y µ Y ) ρ a) ( n 1 ) sx sy X µ X Y µ Y ρ = ( )( ) b) ( n 1 ) σ X σ Y ( X µ X )( Y µ Y ) ρ = c) n sx sy ( X µ X )( Y µ Y ) ρ = d) n σ X σ Y ch16 het is dezelfde formule als voor r maar dan met enkel populatieparameters erin (en geen vrijheidsgraden)

Vraag 30 Als je hasj rookt, komen er allerlei stofjes (cannabinoïden) in je lichaam die het zenuwstelsel beïnvloeden. Het is niet ondenkbaar dat hierdoor bepaalde hersenfuncties worden aangetast en dat dit uiteindelijk kan leiden tot verlaging van het IQ. Hieronder staan van 6 personen de gegevens omtrent langdurig dagelijks hasj gebruik en IQ. persoon A B C D E F hasj gebruik (g/dag) 0.2 0.4 0.8 1.4 1.8 2.6 IQ 116 108 102 110 95 93 Wat is de lineaire correlatiecoëfficiënt voor hasj gebruik en IQ in deze steekproef? rekenhulp: X=7.2; X 2 =12.8; SX=0.912 (X: hasj gebruik ) Y=624; Y 2 =65298; SY=8.967 (Y: IQ ) XY=714.8 a) r = 0.69 b) r = 0.76 c) r = 0.83 d) r = 0.90 ch16 p. 449 e.v. formulekaart bereken de r zoals op de formulekaart staat (en gebruik de rekenhulp )

Vraag 31 Bij lineaire regressie van Y op X is het een voorwaarde dat de populatievariantie van Y hetzelfde is voor elke waarde van X. Welke mean square is een schatter van deze populatievariantie? a) MS residual b) MS regression c) MS total d) MS error ch17 p. 470 e.v. MS residual is de gemiddelde kwadratische verticale afwijking van de punten tot de regressielijn en daarmee een schatting van de populatievariantie zie college over ch17 slide 45

Vraag 32 Hieronder staat een scatter plot uit het boek (hoofdstuk 17). Het betreft gegevens van leeuwen. Op de horizontale (X) as staat de proportie zwarte pigment op de neus van de leeuw, op de verticale (Y) as staat de leeftijd van de leeuw. Zowel de lijn Y = Y als de regressielijn zijn aangegeven. ^ Y=0.88+10.65X Y=Y Wanneer de nulhypothese H0: β=0 getoetst wordt tegen HA: β 0 vindt men een P- waarde van P=0.0000. Wat kun je daaruit opmaken over de regressie van leeftijd (Y) op proportie pigment (X) in werkelijkheid? a) In werkelijkheid is er geen regressie (β =0). b) In werkelijkheid is er regressie met β >0. c) In werkelijkheid is er regressie met β =0.88. d) In werkelijkheid is er regressie met β =10.65. ch17 p. 477

je toetst tweezijdig maar je conclusie is eenzijdig omdat je in je steekproef ziet dat het verband blijkbaar positief is d is onjuist omdat je nooit de waarde van β kunt weten

Vraag 33 Bij lineaire regressie van Y op X gelden onder andere de volgende voorwaarden (boek, 17.5, p. 482): At each value of X, the distribution of possible Y-values is normal. The variance of Y-values is the same for all values of X. Om normaliteit en gelijkheid van varianties te onderzoeken, is het gebruikelijk om een residual plot te maken. Hieronder staat zo n plot. dit is geen optimaal plaatje, want of er sprake is van normaliteit is discutabel, zie daarom de vernieuwde versie hierna X Bewering I. De oriëntatie van de punten in het residual plot laat zien dat er waarschijnlijk geen sprake is van normaliteit zoals bedoeld in de voorwaarden. Bewering II. De orientatie van de punten in het residual plot laat zien dat er waarschijnlijk geen sprake is van gelijke varianties zoals bedoeld in de voorwaarden. Welke bewering is waar?

a) Alleen bewering I. b) Alleen bewering II. c) Bewering I en II zijn beide waar. d) Bewering I en II zijn beide NIET waar.

Vraag 33 (met betere figuur) Bij lineaire regressie van Y op X gelden onder andere de volgende voorwaarden (boek, 17.5, p. 482): At each value of X, the distribution of possible Y-values is normal. The variance of Y-values is the same for all values of X. Om normaliteit en gelijkheid van varianties te onderzoeken, is het gebruikelijk om een residual plot te maken. Hieronder staat zo n plot. X Bewering I. De oriëntatie van de punten in het residual plot laat zien dat er waarschijnlijk geen sprake is van normaliteit zoals bedoeld in de voorwaarden. Bewering II. De orientatie van de punten in het residual plot laat zien dat er waarschijnlijk geen sprake is van gelijke varianties zoals bedoeld in de voorwaarden.

Welke bewering is waar? a) Alleen bewering I. b) Alleen bewering II. c) Bewering I en II zijn beide waar. d) Bewering I en II zijn beide NIET waar. zie boek p. 484 hoe je normaliteit en (on)gelijkheid van varianties kunt afleiden uit een residual plot; zie ook college over ch17 slides 64 en 66

ongelijke varianties wel normaal verdeeld

zaal C0.110 (hier) vragen stellen over alles zaal C1.112 aftekenen ch 17

zaal C0.110 (hier) + B0.201 vragen stellen over alles zaal C1.112 aftekenen ch 17 zaal B0.201 is nu ook open

zaal C0.110 (hier) vragen stellen over alles zaal C1.112 + B0.201 aftekenen ch 17 zaal B0.201 is nu ook open