Simulaties een revolutie in Simulaties de didactiek van de statistiek een revolutie in de didactiek van de statistiek Carel van de Giessen NVvWL november 2015 Van Althuis
German Tank problem 1?
German Tank problem 1? max Schatten productie 2x gemiddelde 2x mediaan met intervallen: max + (max 1)/n Simulatie
German Tank problem Estimates for some specific months are given as: Month Statistical estimate Intelligence estimate German records June 1940 169 1,000 122 June 1941 244 1,550 271 August 1942 327 1,550 342
Overzicht Statistiek Historische ontwikkelingen Simulaties en Statistische concepten Toekomstig curriculum?
Statistiek Tellen, turven en beschrijven Data analyseren / exploratieve statistiek Statistische uitspraken/hypothese toetsen Inferentiële statistiek
Historische ontwikkelingen Tijdlijn van de statistiek 1600 2100 Simulatie
POPULATIE info STEEKPROEF
POPULATIE S T E E K P R O E V E N Steekproeven verdeling van... Simulatie
Normaal verdeelde POPULATIE STEEKPROEF gemiddelde normaal verdeeld
Simulaties en stat. concepten Gewoon maar wel anders - met steekproevenverdeling Resampling Permutatie-, randomisatietoets Bootstrap methode
Geboortegolf jongens Afgelopen kwartaal zijn in het vroeger zo rustige dorp V. veel meer jongens dan meisjes geboren. In beide verloskundige praktijken was het percentage geboren jongens 60%, waar zo n 50% normaal is. Bij Praktijk A betrof het 30 geboorten en bij Praktijk B 150. Onze verslaggever vroeg aan de plaatselijke statisticus, docent aan het CLV, of dit percentage statistisch gezien opmerkelijk te noemen is. steekproevenverdeling
Klassiek gereedschap Binomiale kansverdeling Procedure Cumulatief Voorwaarden n > 30 np > 5 n(1-p) > 5 Normale verdeling voor benadering Formules µ=np σ= (p(1-p)/n) Continuïteitscorrectie Rekenmachine simulatie
Modern gereedschap n=30 Steekproevenverdelingen Redeneren 95% voorspellingsinterval n=150
Outdoor activiteit Outdoor activisten gebruiken gemiddelde 2 liter water met een sd = 0,7 liter. Er zijn 50 deelnemers aan de activiteit en daarvoor staat 110 liter water klaar. Is dat genoeg? steekproevenverdeling simulatie
Resampling Randomisatie methoden zonder terugleggen (permutatie) Bootstrap methoden met terugleggen Procedure
Leestest (DRP scores) Test groep Controle groep 24 61 59 46 42 33 46 37 43 44 52 43 43 41 10 42 58 67 62 57 55 19 17 55 71 49 54 57 26 54 60 28 43 53 49 56 62 20 53 48 33 37 85 42 randomisatie simulatie
Batterijentest Twee merken batterijen A 40 39,5 41 41 40 39 40,5 39 40 40 41 41,5 B 41 39 40 40 39,5 39 40,5 39,5 40 38,5 40 39 randomisatie simulatie
Populatie N = 21600 Gemid. = 164,0 St. dev. = 8,85
lengtes Steekproef van 50 Gemiddelde. Stand. afw.. bootstrap simulatie
Steekproevenverdeling Bron: Bootstrap Methods and Permutation Tests
Theoretisch model Bron: Bootstrap Methods and Permutation Tests
Bootstrap Bron: Bootstrap Methods and Permutation Tests
Hoe nauwkeurig is het? Bootstrap verdeling zelfde vorm en spreiding als steekproevenverdeling Centrum bootstrap bij steekproef gemiddelde Bij redelijk grote steekproef heel nauwkeurig Bij 1000 resamples al goed resultaat
Waarvoor te gebruiken? Kleine en grote steekproeven Ook als populatie niet normaal Schatten gemiddelde, betrouwbaarheidsinterval Vergelijken van groepen, verschil gemiddelden, puntenwolk Significantie test; p-waarde
Voordelen resampling Minder aannamen en beperkingen Geen normaliteit nodig Meer nauwkeurige antwoorden Algemeen toepasbare inferentie Geen formules, ook niet voor andersoortige problemen Conceptbegrip intuïtief Visueel (p-waarde, betrouwbaarheidsinterval) Meer typen problemen op school, bv. verschillen Didactisch erg aantrekkelijk Statistisch redeneren i.p.v. trucjes
Toekomstig curriculum? Onderbouw Data Data analyse Informele inferentie Havo Data analyse Inferentie Onderzoek Vwo Keuzeonderwerp: inferentie simulatie
Bronnen Literatuur Hesterberg, T. cs (2003) Bootstrap Methods and Permutation Tests Hesterberg, T. cs (2014) Bootstrapping for learning Statistics I COTS9 Cobb, G.W. (2007) The introductory Statistics Course: A ptolemaic Curriculum? Ernst, M. (2004) Permutation Methods: A basis for exact inference Hald, A. (1998) A History of Mathematical Statistics form 1750 to 1930 Rao, C. Statistics: Learning from numbers to generate new knowledge Tintle, N. cs (2015) Introduction to Statistical Investigations Johnson, R. Estimating the Size of a Population Simulation-based Statistical Inference http://www.causeweb.org/sbi A blog about teaching introductory statistics with simulation-based inference Software www.vusoft.be www.vusoft.eu/apps