Examen G0N34 Statistiek

Vergelijkbare documenten
Examen G0N34 Statistiek

S0A17D: Examen Sociale Statistiek (deel 2)

G0N11C Statistiek & data-analyse Project tweede zittijd

Voorbehouden voor de correctoren Vraag 1 Vraag 2 Vraag 3 Vraag 4 Vraag 5 Totaal. Toets Kansrekenen I. 28 maart 2014

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Hoofdstuk 5 Een populatie: parametrische toetsen

Statistiek in HBO scripties

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Examen Statistiek I Feedback

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Data analyse Inleiding statistiek

11. Multipele Regressie en Correlatie

Data analyse Inleiding statistiek

Hoofdvraag. Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ?

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

Kansrekening en Statistiek

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Extra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van

9. Lineaire Regressie en Correlatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Data analyse Inleiding statistiek

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Statistiek II. Sessie 5. Feedback Deel 5

Oefenvragen bij Statistics for Business and Economics van Newbold

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Statistiek II. Sessie 4. Feedback Deel 4

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Toetsen van Hypothesen. Het vaststellen van de hypothese

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Antwoordvel Versie A

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

TECHNISCHE UNIVERSITEIT EINDHOVEN

Voorbeeldtentamen Statistiek voor Psychologie

Beschrijvende statistiek

CVO PANTA RHEI - Schoonmeersstraat GENT Soorten stochastische variabelen (discrete versus continue)

Opgave 1: (zowel 2DM40 als 2S390)

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Feedback examen Statistiek II Juni 2011

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Examen Kansrekening en Wiskundige Statistiek: oplossingen

TECHNISCHE UNIVERSITEIT EINDHOVEN

Toegepaste Statistiek, Week 6 1

Cursus Statistiek Parametrische en non-parametrische testen. Fellowonderwijs Intensive Care UMC St Radboud

gemiddelde politieke interesse van hoger opgeleide mensen)

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

College 2 Enkelvoudige Lineaire Regressie

4 Domein STATISTIEK - versie 1.2

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

Kansrekening en Statistiek

Gebruik van Correlatiecoëfficiënt in onderzoek

Examen Data Analyse II - Deel 2

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Kansrekening en Statistiek

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Uitwerkingen Mei Eindexamen VWO Wiskunde A. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

Kansrekening en Statistiek

Zin en onzin van normale benaderingen van binomiale verdelingen

Tentamen Voortgezette Kansrekening (WB006C)

Niet-Parametrische Statistiek

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

Kansrekening en Statistiek

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

Eindtoets Toegepaste Biostatistiek

Meetkunde en Lineaire Algebra

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

Wiskunde B - Tentamen 2

Hoofdstuk 10: Regressie

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

TI83-werkblad. Vergelijkingen bij de normale verdeling

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Hoofdstuk 3 Statistiek: het toetsen

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

toetskeuze schema verschillen in gemiddelden

Kansrekening en Statistiek

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Statistiek voor A.I.

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

. Dan geldt P(B) = a d. 3 8

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

Feedback proefexamen Statistiek I

Transcriptie:

Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium en statistische tabellen om dit examen op te lossen. Op het formularium en de tabellen mag niets geschreven worden! Berekeningen moeten altijd schriftelijk uitgevoerd worden tot het moment dat je de waarde zou kunnen opzoeken in een statistische tabel. Bijvoorbeeld: het uitrekenen van een kans onder een normale verdeling moet herleid worden tot een kans onder een standaardnormale verdeling. Een binomiale kans moet herleid worden tot een kans onder een normale verdeling (indien de CLS van toepassing is). Elk type rekentoestel is toegelaten, maar het geheugen moet gewist zijn. Alle communicatieapparatuur is strikt verboden. Gebruik de voorziene ruimte om te antwoorden op de vragen. Tenzij anders vermeld, kan je telkens vóór- en achterkant van een blad gebruiken. Je hebt 3.5 uur tijd om het examen op te lossen. Schrijf op elk blad je naam! Bij het indienen van je examen, geef je ook kladpapier, formularium en tabellen af. VEEL SUCCES! 1

Naam: 2 Vraag 1 Beoordeel de volgende uitspraken. Als een uitspraak niet juist is of onvolledig, leg dan uit waarom en verbeter de uitspraak. 1. Stel dat X en Y twee toevalsvariabelen zijn die normaal verdeeld zijn. We nemen een steekproef (x i, y i ) van omvang 100 en berekenen de Pearson correlatiecoëfficiënt. Deze is gelijk aan 0.02. Omdat dit kleiner is dan 0.05, mogen we besluiten dat op het 5% significantieniveau X en Y ongecorreleerd zijn. 2. We beschikken over twee steekproeven. Beiden bevatten 120 metingen van het lichaamsgewicht van volwassen vrouwen. Omdat de steekproefgroottes dezelfde zijn, zijn deze gegevens gepaard. 3. Wanneer we een lineaire regressie willen uitvoeren, moeten we nagaan of de verklarende variabele X en de responsvariabele Y normaal verdeeld zijn.

Naam: 3 Vraag 2 Gegeven een reële toevalsvariabele X en een niet-lineaire afleidbare reële functie g. Toon volledig aan hoe je de verwachtingswaarde en de variantie van g(x) kan benaderen a.d.h.v. de verwachtingswaarde en de variantie van X.

Naam: 4 Vraag 3 Een onderzoekscentrum in de US wil onderzoeken of er een afhankelijkheid bestaat tussen het niveau van opleiding en religieuse overtuiging. Ze nemen een willekeurige steekproef van de Amerikaanse bevolking en bekomen de volgende aantallen: Religieuse Overtuiging Fundamentalist Gematigd Vrijdenker Totaal Lager dan middelbaar 178 138 108 424 Opleiding Middelbaar 570 648 442 1660 Universitair 138 252 252 642 Totaal 886 1038 802 2726 1. Mag je op basis van deze gegevens besluiten dat de Amerikaanse bevolking uit meer Fundamentalisten bestaat dan uit Vrijdenkers?

Naam: 5 2. Mag je op basis van deze gegevens besluiten dat er een afhankelijkheid bestaat tussen het niveau van opleiding en religieuse overtuiging?

Naam: 6 Vraag 4 Gegeven Y i (i = 1,..., n) n onafhankelijke variabelen die lognormaal verdeeld zijn met parameters µ i en σi 2 (voor i = 1,..., n). 1. Bepaal de verdeling van n i=1 Y i = Y 1 Y 2 Y n. 2. Toon aan dat de dichtheid van Y i wordt gegeven door f Yi (y) = 1 e yσ i 2π ( 1 ln(y) µi 2 σ i ) 2 voor y > 0 3. Veronderstel dat σ i = σ en µ i = µ voor alle i. Bereken de maximum likelihoodschatters voor µ en σ 2.

Naam: 7

Naam: 8 Vraag 5 Gegeven een toevalsvariabele X met continue cumulatieve verdelingsfunctie F X. 1. Toon aan dat U = F X (X) een uniforme verdeling heeft op [0, 1]. (hint: bereken de cumulatieve verdelingsfunctie van U) 2. Stel Z = F 1 X (U), met U Uniform[0, 1]. Toon aan dat de cumulatieve verdelingsfunctie van Z gelijk is aan de cumulatieve verdelingsfunctie van X.

Naam: 9 Vraag 6 Toon aan dat in enkelvoudige regressie R 2 = r 2, met R 2 de determinatiecoëfficiënt, en r de Pearson correlatie tussen de onafhankelijke en de afhankelijke variabele.

Naam: 10 Vraag 7 Men wil onderzoeken of het gemiddeld aantal wittebloedcellen in het plasma van rokende donoren significant lager is dan bij niet rokende donoren. Men meet daarom het aantal witte bloedcellen in het plasma van 15 rokers en 12 niet-rokers. De resulterende data set bevat twee variabelen: witte blcellen : het aantal witte bloedcellen in plasma (decimaal getal 10 9 ). groep : Roker of Geen Roker. We analyseren de gegevens m.b.v. R. Maak gebruik van de bijgevoegde output om de volgende vragen te beantwoorden. 1. Formuleer de nulhypothese en de alternatieve hypothese van de gestelde onderzoeksvraag. 2. Welke teststatistiek ga je gebruiken? Ga na of alle veronderstellingen die je hiervoor aanneemt ook voldaan zijn. 3. Welke waarde neemt de teststatistiek aan? Wat is de p-waarde? 4. Maak een schets waarop je de p-waarde aanduidt.

Naam: 11 5. Wat is de betekenis van deze p-waarde? 6. Formuleer je besluit. 7. Wat is de betekenis van een type II fout bij deze hypothesetest? > summary(witte_blcellen[groep=="roker"]) Min. 1st Qu. Median Mean 3rd Qu. Max. 3.500 4.300 4.900 5.007 5.700 6.700 > summary(witte_blcellen[groep=="geen Roker"]) Min. 1st Qu. Median Mean 3rd Qu. Max. 4.400 5.550 6.950 7.008 8.650 9.700 > shapiro.test(witte_blcellen[groep=="roker"]) Shapiro-Wilk normality test data: witte_blcellen[groep == "Roker"] W = 0.9556, p-value = 0.617 > shapiro.test(witte_blcellen[groep=="geen Roker"]) Shapiro-Wilk normality test data: witte_blcellen[groep == "Geen Roker"] W = 0.9332, p-value = 0.4157

Naam: 12 > var.test(witte_blcellen[groep=="roker"], witte_blcellen[groep=="geen Roker"]) F test to compare two variances data: witte_blcellen[groep == "Roker"] and witte_blcellen[groep == "Geen Roker"] F = 0.2466, num df = 14, denom df = 11, p-value = 0.01616 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.07340476 0.76297929 sample estimates: ratio of variances 0.2465526 > t.test(witte_blcellen[groep=="roker"], witte_blcellen[groep=="geen Roker"], var.equal=true) Two Sample t-test data: witte_blcellen[groep == "Roker"] and witte_blcellen[groep == "Geen Roker"] t = -3.713, df = 25, p-value = 0.001031 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -3.1119681-0.8913652 sample estimates: mean of x mean of y 5.006667 7.008333

Naam: 13 > t.test(witte_blcellen[groep=="roker"], witte_blcellen[groep=="geen Roker"], var.equal=false) Welch Two Sample t-test data: witte_blcellen[groep == "Roker"] and witte_blcellen[groep == "Geen Roker"] t = -3.4614, df = 15.3, p-value = 0.003402 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -3.232135-0.771198 sample estimates: mean of x mean of y 5.006667 7.008333 > wilcox.test(witte_blcellen[groep=="roker"], witte_blcellen[groep=="geen Roker"]) Wilcoxon rank sum test with continuity correction data: witte_blcellen[groep == "Roker"] and witte_blcellen[groep == "Geen Roker"] W = 31.5, p-value = 0.004634 alternative hypothesis: true location shift is not equal to 0