Statistiek ( ) eindtentamen

Vergelijkbare documenten
Statistiek ( ) ANTWOORDEN eerste tentamen

ANTWOORDEN Statistiek

antwoorden bij tentamen Statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Herkansing eindtoets statistiek voor HBO

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 10: Regressie

9. Lineaire Regressie en Correlatie

College 2 Enkelvoudige Lineaire Regressie

11. Multipele Regressie en Correlatie

Voorbeeldtentamen Statistiek voor Psychologie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

College 6 Eenweg Variantie-Analyse

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

mlw stroom 2.1: Statistisch modelleren

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Hoofdstuk 6 Twee populaties: parametrische toetsen

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Statistiek II. Sessie 5. Feedback Deel 5

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 3 Statistiek: het toetsen

Data analyse Inleiding statistiek

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018

1. Reductie van error variantie en dus verhogen van power op F-test

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Feedback examen Statistiek II Juni 2011

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Antwoordvel Versie A

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april uur

Kansrekening en Statistiek

2.9 Het adolescentieonderzoek Opgaven 72

Wiskunde B - Tentamen 1

College 7 Tweeweg Variantie-Analyse

11. Meerdere gemiddelden vergelijken, ANOVA

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

werkcollege 6 - D&P9: Estimation Using a Single Sample

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Oefenvragen bij Statistics for Business and Economics van Newbold

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Wiskunde B - Tentamen 2

WISKUNDETOETS FGB. Instructies

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april uur

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

WISKUNDETOETS FPP. Instructies

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Examen G0N34 Statistiek

8. Analyseren van samenhang tussen categorische variabelen

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april uur

College 3 Meervoudige Lineaire Regressie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

toetskeuze schema verschillen in gemiddelden

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

TECHNISCHE UNIVERSITEIT EINDHOVEN. Tentamen OGO Fysisch Experimenteren voor minor AP (3MN10)

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6

Feedback proefexamen Statistiek I

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Transcriptie:

Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op elk vel papier dat je inlevert. Dit tentamen bestaat uit 5 vragen op 4 pagina s. Je mag deze door elkaar beantwoorden. Er is nog een extra vraag 6, die telt niet mee in de beoordeling. Vermeld bij ieder antwoord het nummer van de corresponderende vraag. Dit is een open-boek-tentamen, waarbij je gebruik mag maken van: het boek van Peck & Devore, Statistics etc, het boek van De Vocht, Basishandboek SPSS 16 etc, je aantekeningen, een (grafische) rekenmachine, de practicum-handleiding. Je mag niet gebruik maken van een mobiele telefoon, smartphone, ipod, tablet-computer, laptop e.d. In dit tentamen wordt als decimaal symbool een punt gebruikt: 1.010 liter is gelijk aan 1 liter plus 10 milliliter. Geef vooral beknopte en kernachtige antwoorden. Goed geformuleerde, bondige antwoorden leveren meer punten op dan breedsprakige. Dit tentamen weegt mee voor 4 van de 10 punten van je eindcijfer. Alle vragen van dit tentamen wegen elk even veel. Vraag 6 weegt niet mee. Veel succes! 1. a. Leg kort uit wat er gebeurt met de correlatie r tussen twee variabelen x en y, als je elke waarde van y vermenigvuldigt 10. Zie Ch.5.1, p.213: de gestandaardiseerde Z-scores van y blijven gelijk, dus r blijft ook gelijk. b. Leg kort uit wat er gebeurt met de helling b van de lineaire regressie van y, als je elke waarde van y vermenigvuldigt 10. De helling wordt ook 10 zo groot, zie formule voor b op p.225. 1

2. Geef van elk van onderstaande beweringen aan of deze waar of onwaar is. a. De p-waarde geeft de kans aan dat H 0 waar is. onwaar, de p-waarde geeft de kans aan op de gevonden data als H 0 waar is. b. De p-waarde geeft de kans aan dat de gevonden waarde van de toetsingsgrootheid het gevolg is van toevalsvariatie rond de door H 0 voorspelde waarde. waar c. Als de p-waarde kleiner is dan α dan wordt dat een significant resultaat genoemd. waar d. De kans (1 p) is de kans op een Type-II-fout. onwaar, de kans op een Type-II-fout is (1 β). e. Het significantie-niveau is de maximale kans om H 0 te verwerpen. onwaar: Het significantie-niveau is de maximale kans om H0 te verwerpen als H0 waar is. f. Onderzoekers streven in het algemeen naar een zo hoog mogelijke β. onwaar: Onderzoekers streven doorgaans naar een zo klein mogelijke β. g. Een eenzijdige toets heeft een grotere power dan een tweezijdige toets. waar: Een eenzijdige toets is gevoeliger, heeft een kleinere kritieke waarde voor de toetsingsgrootheid, dan een tweezijdige toets. 3. We verwachten dat niet-moedertaalsprekers een taal minder vloeiend spreken dan moedertaalsprekers. Om deze verwachting te toetsen, hebben 50 sprekers uit elke groep een spreektaak uitgevoerd. Uit deze opnames werd willekeurig een fragment van 20 seconden geselecteerd voor iedere spreker. De afhankelijke variabele is het aantal niet-vloeiendheden in dat spraakfragment (aarzelingen, pauzes, haperingen, enz). De verdeling van die aantallen zie je hieronder. Verschillen de twee groepen sprekers in hun aantallen van niet-vloeiendheden? Gebruik α =.05. 2

groep aantal niet-vloeiendheden 0 1 2 3 of meer totaal moedertaal 25 (15) 12 (13.5) 8 (14) 5 (7.5) 50 niet-moedertaal 5 (15) 15 (13.5) 20 (14) 10 (7.5) 50 totaal 30 27 28 15 100 Hier doen we een toets voor homogeniteit, Ch.12.2. Expected cell counts staan hierboven tussen haakjes vermeld. De beide groepen hebben even veel deelnemers, dus de eerste en de tweede regel van de tabel leveren beide een even grote bijdrage aan X 2 : 10 2 /15 + 1.5 2 /13.5 + 6 2 /14 + 2.5 2 /7.5 = 10.23810 X 2 = 10.2381 + 10.2381 = 20.47 met df = (4 1)(2 1) = 3. Appendix Table 8 voor df = 3 laat zien dat als X 2 > 16.26 zoals hier, dan p <.001. De twee groepen sprekers verschillen dus significant in hun aantallen niet-vloeiendheden. 4. Bij een recent tentamen werd studenten gevraagd een schatting te geven van hun verwachte cijfer voor dat tentamen. De bijgaande boxplots voor N = 53 studenten illustreren dat de schattingen lager waren dan de werkelijk behaalde cijfers (onderschatting). Het verschil tussen het zelf geschatte minus het behaalde cijfer van een student was gemiddeld x d = 0.88 (s d = 1.34). a. Is er een significant verschil tussen het zelf geschatte en het werkelijk behaalde cijfer voor dit tentamen? Gebruik α =.05. Gebruik t test for paired samples, Ch.11.2. H 0 : µ d = 0, H a : µ d 0. t = 0.88/(1.34/ 53) = 4.781 met df = (53 1) = 52. Gebruik conservatieve afronding van df, naar beneden (zoals besproken op college), naar df = 40 in Appendix Table 4 (of bereken exacte p op je rekenmachine). Als t > 4.00, zoals hier, dan p <.001. Het zelf geschatte en werkelijk behaalde cijfer verschillen dus significant van elkaar. 3

b. Bepaal het bijbehorende betrouwbaarheidsinterval voor het verschil tussen het zelf geschatte en het werkelijk behaalde cijfer. Gebruik formule op p.543, voor 95% betrouwbaarheidsinterval van verschil. Bepaal kritieke waarde voor t uit tabel in voorkaft met df=40 (naar beneden afgerond, besproken tijdens college), dus t = 2.02 (of gebruik exacte waarde t = 2.0067 2.01 voor df=52). CI is 0.88±2.01 (1.34/ 53) is ( 1.250, 0.510). Dit interval omvat niet nul, dus de kans dat het werkelijke verschil toch wel nul is, is kleiner dan (1 95%) =.05. c. Trek een heldere conclusie van maximaal 50 woorden. De beoordeling is afhankelijk van je formulering. 4

5. In een onderzoek werden kinderen met ADHD behandeld met medicatie om hun concentratie en leergedrag te verbeteren. De medicatie werd aangeboden in een hoge (H) en in een lage (L) dosering. Bovendien was er een controle-groep zonder medicatie (C). De afhankelijke variabele is het aantal storende interrupties per schooldag; de resultaten zie je hieronder. Je mag aannemen dat voldaan is aan alle assumpties voor variantie-analyse, en dat het gemiddelde x = 12.2777. conditie x s n behandeling H 10.833 2.6 7 behandeling L 10.833 3.6 7 controle C 15.167 2.8 7 a. Verschaffen deze gegevens overtuigende evidentie tegen de H 0 dat het aantal interrupties hetzelfde is in alle condities? Toets deze H 0 door middel van een variantie-analyse met α =.05. SSTr: 7 (10.833 12.2777) 2 + 7 (10.833 12.2777) 2 + 7 (15.167 12.2777) 2 = 87.6566 SSE: 6 2.6 2 + 6 3.6 2 + 6 2.8 2 = 165.36 source SS df MS F p behandeling 87.66 2 43.83 4.77 <.05 error 165.36 18 9.19 total 20 b. Bereken de Tukey-Kramer intervallen, en geef aan welke condities significant van elkaar verschillen. Tip: Omdat de aantallen n per cel gelijk zijn, zijn alle intervallen ook even breed, en dus hoef je die intervalbreedte slechts eenmaal te berekenen. Bereken eerst de intervalbreedte, dat hoeft voor deze opgave slechts eenmaal. Zoek daarvoor in Table 8 naar kritieke q met k = 3 treatments en dferror = 18, q = 3.61 (voor α =.05), en gebruik df en MSE uit de ANOVA berekeningen: 3.61 (9.19/2 (2/7)) = 4.136 5

Deze intervalbreedte wordt ook wel yardstick genoemd. Bij gelijke n (zoals hier) kan je concluderen dat twee condities significant verschillen als het verschil groter is dan deze yardstick. Het verschil µ H µ L is niet significant, de verschillen µ H µ C en µ L µ C zijn wel significant. Hier eindigt het tentamen. Beantwoord a.u.b. ook onderstaande vraag over jouw inschatting van je prestaties. Deze vraag telt niet mee in de beoordeling. 6. a. Wat is jouw schatting van je cijfer voor dit tentamen? b. Wat is jouw schatting van je eindcijfer voor de gehele cursus? Bij voorbaat dank voor je moeite! 6