Statistiek ( ) eindtentamen

Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op elk vel papier dat je inlevert. Dit tentamen bestaat uit 5 vragen op 4 pagina s. Je mag deze door elkaar beantwoorden. Er is nog een extra vraag 6, die telt niet mee in de beoordeling. Vermeld bij ieder antwoord het nummer van de corresponderende vraag. Dit is een open-boek-tentamen, waarbij je gebruik mag maken van: het boek van Peck & Devore, Statistics etc, het boek van De Vocht, Basishandboek SPSS 16 etc, je aantekeningen, een (grafische) rekenmachine, de practicum-handleiding. Je mag niet gebruik maken van een mobiele telefoon, smartphone, ipod, tablet-computer, laptop e.d. In dit tentamen wordt als decimaal symbool een punt gebruikt: 1.010 liter is gelijk aan 1 liter plus 10 milliliter. Geef vooral beknopte en kernachtige antwoorden. Goed geformuleerde, bondige antwoorden leveren meer punten op dan breedsprakige. Dit tentamen weegt mee voor 4 van de 10 punten van je eindcijfer. Alle vragen van dit tentamen wegen elk even veel. Vraag 6 weegt niet mee. Veel succes! 1. a. Leg kort uit wat er gebeurt met de correlatie r tussen twee variabelen x en y, als je elke waarde van y vermenigvuldigt 10. Zie Ch.5.1, p.213: de gestandaardiseerde Z-scores van y blijven gelijk, dus r blijft ook gelijk. b. Leg kort uit wat er gebeurt met de helling b van de lineaire regressie van y, als je elke waarde van y vermenigvuldigt 10. De helling wordt ook 10 zo groot, zie formule voor b op p.225. 1

2. Geef van elk van onderstaande beweringen aan of deze waar of onwaar is. a. De p-waarde geeft de kans aan dat H 0 waar is. onwaar, de p-waarde geeft de kans aan op de gevonden data als H 0 waar is. b. De p-waarde geeft de kans aan dat de gevonden waarde van de toetsingsgrootheid het gevolg is van toevalsvariatie rond de door H 0 voorspelde waarde. waar c. Als de p-waarde kleiner is dan α dan wordt dat een significant resultaat genoemd. waar d. De kans (1 p) is de kans op een Type-II-fout. onwaar, de kans op een Type-II-fout is (1 β). e. Het significantie-niveau is de maximale kans om H 0 te verwerpen. onwaar: Het significantie-niveau is de maximale kans om H0 te verwerpen als H0 waar is. f. Onderzoekers streven in het algemeen naar een zo hoog mogelijke β. onwaar: Onderzoekers streven doorgaans naar een zo klein mogelijke β. g. Een eenzijdige toets heeft een grotere power dan een tweezijdige toets. waar: Een eenzijdige toets is gevoeliger, heeft een kleinere kritieke waarde voor de toetsingsgrootheid, dan een tweezijdige toets. 3. We verwachten dat niet-moedertaalsprekers een taal minder vloeiend spreken dan moedertaalsprekers. Om deze verwachting te toetsen, hebben 50 sprekers uit elke groep een spreektaak uitgevoerd. Uit deze opnames werd willekeurig een fragment van 20 seconden geselecteerd voor iedere spreker. De afhankelijke variabele is het aantal niet-vloeiendheden in dat spraakfragment (aarzelingen, pauzes, haperingen, enz). De verdeling van die aantallen zie je hieronder. Verschillen de twee groepen sprekers in hun aantallen van niet-vloeiendheden? Gebruik α =.05. 2

groep aantal niet-vloeiendheden 0 1 2 3 of meer totaal moedertaal 25 (15) 12 (13.5) 8 (14) 5 (7.5) 50 niet-moedertaal 5 (15) 15 (13.5) 20 (14) 10 (7.5) 50 totaal 30 27 28 15 100 Hier doen we een toets voor homogeniteit, Ch.12.2. Expected cell counts staan hierboven tussen haakjes vermeld. De beide groepen hebben even veel deelnemers, dus de eerste en de tweede regel van de tabel leveren beide een even grote bijdrage aan X 2 : 10 2 /15 + 1.5 2 /13.5 + 6 2 /14 + 2.5 2 /7.5 = 10.23810 X 2 = 10.2381 + 10.2381 = 20.47 met df = (4 1)(2 1) = 3. Appendix Table 8 voor df = 3 laat zien dat als X 2 > 16.26 zoals hier, dan p <.001. De twee groepen sprekers verschillen dus significant in hun aantallen niet-vloeiendheden. 4. Bij een recent tentamen werd studenten gevraagd een schatting te geven van hun verwachte cijfer voor dat tentamen. De bijgaande boxplots voor N = 53 studenten illustreren dat de schattingen lager waren dan de werkelijk behaalde cijfers (onderschatting). Het verschil tussen het zelf geschatte minus het behaalde cijfer van een student was gemiddeld x d = 0.88 (s d = 1.34). a. Is er een significant verschil tussen het zelf geschatte en het werkelijk behaalde cijfer voor dit tentamen? Gebruik α =.05. Gebruik t test for paired samples, Ch.11.2. H 0 : µ d = 0, H a : µ d 0. t = 0.88/(1.34/ 53) = 4.781 met df = (53 1) = 52. Gebruik conservatieve afronding van df, naar beneden (zoals besproken op college), naar df = 40 in Appendix Table 4 (of bereken exacte p op je rekenmachine). Als t > 4.00, zoals hier, dan p <.001. Het zelf geschatte en werkelijk behaalde cijfer verschillen dus significant van elkaar. 3

b. Bepaal het bijbehorende betrouwbaarheidsinterval voor het verschil tussen het zelf geschatte en het werkelijk behaalde cijfer. Gebruik formule op p.543, voor 95% betrouwbaarheidsinterval van verschil. Bepaal kritieke waarde voor t uit tabel in voorkaft met df=40 (naar beneden afgerond, besproken tijdens college), dus t = 2.02 (of gebruik exacte waarde t = 2.0067 2.01 voor df=52). CI is 0.88±2.01 (1.34/ 53) is ( 1.250, 0.510). Dit interval omvat niet nul, dus de kans dat het werkelijke verschil toch wel nul is, is kleiner dan (1 95%) =.05. c. Trek een heldere conclusie van maximaal 50 woorden. De beoordeling is afhankelijk van je formulering. 4

5. In een onderzoek werden kinderen met ADHD behandeld met medicatie om hun concentratie en leergedrag te verbeteren. De medicatie werd aangeboden in een hoge (H) en in een lage (L) dosering. Bovendien was er een controle-groep zonder medicatie (C). De afhankelijke variabele is het aantal storende interrupties per schooldag; de resultaten zie je hieronder. Je mag aannemen dat voldaan is aan alle assumpties voor variantie-analyse, en dat het gemiddelde x = 12.2777. conditie x s n behandeling H 10.833 2.6 7 behandeling L 10.833 3.6 7 controle C 15.167 2.8 7 a. Verschaffen deze gegevens overtuigende evidentie tegen de H 0 dat het aantal interrupties hetzelfde is in alle condities? Toets deze H 0 door middel van een variantie-analyse met α =.05. SSTr: 7 (10.833 12.2777) 2 + 7 (10.833 12.2777) 2 + 7 (15.167 12.2777) 2 = 87.6566 SSE: 6 2.6 2 + 6 3.6 2 + 6 2.8 2 = 165.36 source SS df MS F p behandeling 87.66 2 43.83 4.77 <.05 error 165.36 18 9.19 total 20 b. Bereken de Tukey-Kramer intervallen, en geef aan welke condities significant van elkaar verschillen. Tip: Omdat de aantallen n per cel gelijk zijn, zijn alle intervallen ook even breed, en dus hoef je die intervalbreedte slechts eenmaal te berekenen. Bereken eerst de intervalbreedte, dat hoeft voor deze opgave slechts eenmaal. Zoek daarvoor in Table 8 naar kritieke q met k = 3 treatments en dferror = 18, q = 3.61 (voor α =.05), en gebruik df en MSE uit de ANOVA berekeningen: 3.61 (9.19/2 (2/7)) = 4.136 5

Deze intervalbreedte wordt ook wel yardstick genoemd. Bij gelijke n (zoals hier) kan je concluderen dat twee condities significant verschillen als het verschil groter is dan deze yardstick. Het verschil µ H µ L is niet significant, de verschillen µ H µ C en µ L µ C zijn wel significant. Hier eindigt het tentamen. Beantwoord a.u.b. ook onderstaande vraag over jouw inschatting van je prestaties. Deze vraag telt niet mee in de beoordeling. 6. a. Wat is jouw schatting van je cijfer voor dit tentamen? b. Wat is jouw schatting van je eindcijfer voor de gehele cursus? Bij voorbaat dank voor je moeite! 6