Is STATISTIEK een exacte wetenschap? (Of een verzameling nauwkeurig geformuleerde onnauwkeurigheden)

Maat: px
Weergave met pagina beginnen:

Download "Is STATISTIEK een exacte wetenschap? (Of een verzameling nauwkeurig geformuleerde onnauwkeurigheden)"

Transcriptie

1 STATISTIEK Is STATISTIEK een exacte wetenschap? (Of een verzameling nauwkeurig geformuleerde onnauwkeurigheden) De statistiek is een betrekkelijk jong vakgebied. Voorheen genoten statistici weinig aanzien. Het ordenen van vaak duizenden gegevens in tabellen was een buitengewoon eentonig en arbeidsintensief werk, een noodzakelijk kwaad bij (verzekerings)banken en bevolkingsonderzoek en dergelijke. En zijdelings toch ook bij wetenschappelijke experimenten, zoals het erfelijkheidsonderzoek van de Oostenrijkse monnik Gregor Mendel, halverwege de negentiende eeuw. Deze beschrijvende statistiek of statistische analyse was wat je noemt monnikenwerk. Sinds de opmars van de computer die saai rekenwerk met liefde en grote precisie uitvoert, is dat alles ingrijpend veranderd. Niet alleen het elektronische rekenwerk, maar vooral ook de conclusies die er uit getrokken kunnen worden (de verklarende of inductieve statistiek) hebben de statistiek tot een veelzijdige hulpwetenschap gemaakt. Thans is er nauwelijks meer een vakgebied te vinden waar statistische technieken geen rol spelen. Het vak is geen typisch exact vak, eerder een soort kookboek vol met recepten. Maar toch hebben vooral studenten met weinig feeling voor het exacte (te vinden in de bedrijfskundige, economische, juridische, psychologische en sociaal/communicatieve sectoren) het angstzweet vaak in de handen als ze zich voorbereiden op een tentamen statistiek. We kunnen er niet omheen. In dit boek hoort een hoofdstuk statistiek. De grafische rekenmachine kan het leed aanzienlijk verzachten. Voordat de programmaatjes over het onderwerp worden aangeboden, volgt eerst een kleine samenvatting van de te gebruiken terminologie en formules. De totale verzameling waaruit de waarnemingen (data) gehaald worden noemt men de populatie. De deelverzameling van waarnemingsgetallen is de steekproef (Eng. sample). Beschrijvende statistiek. De waarnemingsgetallen krijgen de letter X, de populatiegrootte de letter N. De Griekse letter m (mu) wordt gebruikt voor het gemiddelde: voor de standaardafwijking en s 2 voor de variantie. Een streep boven de letters geeft aan dat we het gemiddelde ervan bedoelen: s 2 å ( X - m) = = ( X - m) N 2 2 = X 2 - ( X ) 2 N å X i m = i= 1 ; de Griekse letter s (sigma) N De TI-83 heeft o.a. de lijsten L1 t/m L6 beschikbaar voor data. Hebben we maar één lijst met gegevens dan komt die in L1. Je kunt dan de mediaan en de kwartielen uit STAT<CALC>1-Var Stats aflezen en de boxplot tekenen met [2nd]STATPLOT. Wanneer de waarnemingsgetallen al zodanig geordend zijn dat we ook over de frequenties ervan beschikken, zetten we die frequenties meestal in L2. De statistische analyse wordt dan bereikt via 1-Var Stats L1,L2. Vaak zijn er zoveel gegevens, dat men ze in klassen indeelt. Het door Ton van Amsterdam geïnspireerde programma STATKLAS kan daarbij helpen. De broncode ervan laten we weg, die kun je desgewenst met een link-kabeltje downloaden van Hier volgt de statistische analyse van gefingeerde examencijfers, ingedeeld in de klassen [1;2> [2;3> enzovoorts. STATISTIEK - 1 -

2 Verklarende statistiek Voor steekproeven zijn de volgende notaties gebruikt. De grootte van de steekproef is n (of N), het steekproefgemiddelde is þ of m, de standaardafwijking s of S en de variantie: s 2 å ( x - x) = n -1 2 Als n groot is (groter dan 30) kan dit benaderd worden door: Toetsen 2 2 ) å( x - x s = n Het hiernaast staande plaatje illustreert het vuistregeltje, dat 95% van de waarnemingen in het algemeen niet meer dan twee standaarddeviaties afwijkt van het gemiddelde. In het binnengebied staan de "gewone", veel voorkomende waarnemingen. De waarnemingen aan de buitenkant zou men buitenstaanders, of significant afwijkende waarnemingen kunnen noemen. low (van lower) staat voor de ondergrens; up (upper) voor de bovengrens van de gewone waarnemingsgetallen. Bij het toetsen van een hypothese gebeurt er het volgende. Men wil een uitspraak over wat als "gewoon", en wat als significant afwijkend moet worden verstaan. Dergelijke uitspraken kunnen nooit met 100% zekerheid gedaan worden. Men doet ze met een waarschijnlijkheid P. De nulhypothese (H0) geeft aan welke waarnemingen als normaal zullen worden beschouwd; de alternatieve hypothese (H1) geeft de afwijkende waarnemingsgetallen aan. De oppervlakte onder de klokvormige kromme (of: het histogram) is in het getekende plaatje 0.95 (of 95%) van de totale oppervlakte die 1 is (of 100%). Aan beide uiteinden is de overschrijdingskans P=0.025 in zo'n tweezijdige toetsing. In mijn boekenkast staat een prachtig standaardwerk uit 1974 van David Freedman onder de onwaarschijnlijke naam Statistics. Daarin wordt het werk van Gregor Mendel ( ) nader bekeken. Mendels experimenten werden uitgevoerd met de plantjes van een erwtensoort. De zaadjes ervan waren geel of groen en na kruising van de oudergeneraties ontstond een tweede generatie waarin de verdeling geel-groen ongeveer 75%-25% leek te zijn. Mendels levenswerk heeft een grote invloed gehad. Maar de wiskundige Fisher heeft aangetoond dat zijn data naar alle waarschijnlijkheid (een rechter zou zeggen met aan zekerheid grenzende waarschijnlijkheid) mooier gemaakt zijn. STATISTIEK - 2 -

3 In een van zijn experimenten bijvoorbeeld kreeg Mendel 8023 tweedegeneratie zaadjes waarvan er 2001 groen waren. Dat komt neer op 8023 keer trekken met terugleg uit de verzameling {0,0,0,1} als we 0 gebruiken voor geel en 1 voor groen. De verwachting van het gemiddelde is 8023/4» 2006 en de kans dat een gemeten aantal hier maximaal 5 van afwijkt is normalcdf(2000.5,2011.5,8023*.25,ö(8023*.25*.75))=.113 Dat wil zeggen dat van elke negen experimenten er maar één (ongeveer) zo dicht bij de verwachtingswaarde komt. Dat is nog net niet te mooi om waar te zijn. Maar het probleem met Mendels andere (zeer grote aantallen) experimenten is dat in alle andere gevallen de uitkomsten eveneens "bijna te mooi zijn om waar te zijn". Fisher paste de zogenaamde chi-kwadraat toets toe (daar komen we nog op terug) op het totaal aan waarnemingen van Mendel en vond dat het smalle strookje binnengebied met "normale" uitkomsten zo smal is (4 op de oftewel ) dat men moet constateren dat er geknoeid is met de waarnemingen (onwelgevallige zaadjes werden simpel niet meegeteld). Mendels gedrag is niet uitzonderlijk en zeer vergeeflijk, omdat zijn theorie wel juist was. Maar wees er op bedacht dat nog steeds -onderzoekers zijn ook maar mensen- de wens de vader van de gedachte is. Fisher formuleert het heel mild: There are two possibilities: - either Mendel's data were massaged - or he was pretty lucky The first possibility is easier to believe. HYPOTHESE TOETSEN De binomiale toets Een voorbeeld van rechts toetsen. Men wil onderzoeken of er geknoeid is met een dobbelsteen en doet daartoe een experiment met 600 worpen. De verdenking bestaat dat er vaker dan normaal een zes geworpen wordt. Maar wat is "vaker dan normaal"? Laten we maar eens 600 keer het werpen van een zuivere dobbelsteen simuleren: randint(1,6,600). De nulhypothese H0 geeft het voordeel van de twijfel: p = 1/6; de alternatieve hypothese H1 veronderstelt dat de kans op een zes groter is dan 1/6: p>1/6. We willen een uitspraak doen die voor 95% geloofwaardig is oftewel voor 5% onbetrouwbaar is. Men zegt dat in dat geval de onbetrouwbaarheidsdrempel (of het significantieniveau) a=0.05 is. Als X het aantal zessen is van de 600, moeten we dus zoeken naar uitkomsten X die groter dan een bepaalde grenswaarde zijn. Wat voor conclusie zullen we trekken als van de 600 worpen er bijvoorbeeld 115 keer een zes bovenligt (X=115)? De kans op X³115 wordt genoteerd als P(X³115 N=600, p=1/6) en uit een tabel afgelezen via Y1=1-binomcdf(600,1/6,114). De kans op X³115 is en dus iets groter dan 0.05; met die uitkomst zullen we de nulhypothese nog net accepteren. Uitkomsten ³ 116 echter zullen tot de conclusie leiden dat de nulhypothese verworpen wordt, want: P(X³116)=1-binomcdf(600,1/6,115)= ligt net iets onder de onbetrouwbaarheidsdrempel. De verzameling uitkomsten ³ 116 noemt men het Kritieke Gebied; het complement daarvan, de verzameling van uitkomsten 115, noemt men het Betrouwbaarheidsinterval. In het Kritieke Gebied liggen dus alle waarnemingen die tot verwerping van H0 leiden; het betrouwbaarheidsinterval bevat alle waarnemingen waarvoor de H0 geaccepteerd wordt. STATISTIEK - 3 -

4 Tweezijdig toetsen. Stel dat men niet per se een te groot aantal zessen vermoedt, maar dat men ook rekening wil houden met een extreem (te) laag aantal zessen. Een toets met dezelfde onbetrouwbaarheid a=0.05 moet nu tweezijdig geschieden, men neemt dan links en rechts de halve drempel (½ a), zodat er voor het Kritieke Gebied twee grenswaarden komen, links (L) en rechts (R) met de voorwaarden: P(X³R N=600, p=1/6) < ½a = en P(X L N=600, p=1/6) < ½a = dus zoeken we naar binomcdf(600,1/6,l)<0.025 en 1-binomcdf(600,1/6,R-1)<0.025 met de oplossingen X 81 en X³119 die weer uit een tabel af te lezen zijn. Het volgende programma geeft dezelfde uitkomsten. Gelukkig maar. Toetsen met de Normale Verdeling Neem het vorige voorbeeld, de tweezijdige toetsing. Echter gaan we ditmaal een normale benadering geven. Dat doen we om de antwoorden te vergelijken, niet omdat de normale benadering in dit geval nodig zou zijn. Het gaat er dus om uit te zoeken wat het Kritieke Gebied is in het geval: H0: p=1/6 H1: p¹1/6 N=600 a=0.05 Voor de normale benadering moet dit omgezet worden in m =Np=100 en s =Önpq= Voor welk aantal zessen zullen we de nulhypothese tweezijdig verwerpen? Het antwoord volgt uit: X X invnorm(0.025)= dus = geeft X=82.1 en = geeft X=117.9 Rekening houdend met de continuïteitscorrectie voor zulke discrete verdelingen bevat het Kritieke Gebied dus alle uitkomsten X³119 en X 81. Een opmerking. Je kunt bij de bepaling van het Kritieke Gebied beter spreken van een discreetheidscorrectie: rechts 0.5 erbij en afronden naar boven; links 0.5 eraf en afronden naar beneden. De rekenmachines met een ingebouwde binomiale tabel hebben de continuïteitscorrectie eigenlijk overbodig gemaakt. Bij de TI-83 kun je voor grote waarden van N ongecorrigeerd de binomiale kansen aflezen en is de Normale Benadering niet nodig. Boven de 1000 is een continuïteitscorrectie ook zinloos. Een half staafje meer of minder op de 1000 mist men niet bij statistische overwegingen. De continuïteitscorrectie behoort dus tot de historie, in de eenentwintigste eeuw. STATISTIEK - 4 -

5 Correlatieberekeningen We bekijken het eventuele verband tussen de rapportcijfers wiskunde en natuurkunde van een groepje van zeven leerlingen. De wiskundecijfers staan in L1, de natuurkundecijfers in L2. Vooraf stellen we het scherm in op rapportcijfers, want er komt een grafiekje bij. Conclusie. De natuurkundecijfers zijn (licht significant, p=0.9) gemiddeld 0,5 punt hoger. Er is een matige correlatie (r=0.56) tussen de cijfers. Als je een voorspelling zou willen doen (maar daar is het groepje natuurlijk veel te klein voor) kun je het natuurkundecijfer N uit het wiskundecijfer W afleiden met de formule N = 0.7W+2.3 Een 6 voor wiskunde zou dan een = 6.5 voor natuurkunde moeten opleveren. Een laatste opmerking. In plaats van de normale verdeling wordt de t-verdeling DISTR <tcdf> gebruikt bij kleine steekproeven (N<30) uit een populatie met onbekende standaarddeviatie. De chi-kwadraat test Waarnemingsgetallen X schommelen rond hun verwachtingswaarde ü. De variantie is een maat voor de spreiding van waarnemingen rond hun gemiddelde, zoals de definitie van s 2 aangeeft. Wil men toetsen of de waarnemingen min of meer normaal volgens de verwachting zijn gespreid, dan kan men de chi-kwadraat toets hanteren. De Griekse letter c spreekt men uit als "chi"; de definitie van c 2 is te vergelijken met die van s 2 : STATISTIEK - 5 -

6 2 2 2 å( X - x) å( O - E) c = = (O = Observed, E = Expected) x E De (theoretische) verwachtingswaarden E (of ü) doen we meestal in L2, de waarnemingen in L1. De c 2 -test gebruikt men om te kijken of de waarnemingen op een geloofwaardige manier afwijken van de verwachting. Waarnemingen die te dicht op hun verwachtingswaarde zitten zijn te "mooi", waarnemingen die extreem veel afwijken van hun verwachting hebben misschien een verkeerde verwachting gehad. De c 2 -test vind men op de TI-83 onder de menuknop STAT<TESTS>; de c 2 verdelingsfunctie staat onder de knop DISTR. Bij deze verdeling wordt meestal gekeken naar de "oppervlakte rechts van", en dat levert dan de kans op extreme uitkomsten (de P-waarde). Het aantal vrijheidsgraden (df = degrees of freedom) van c 2 is 1 minder dan de grootte van de steekproef: df = n - 1. De gemiddelde verwachtingswaarde van c 2 is, in normale gevallen, gelijk aan df. In het volgende programma zijn bij de eerste menukeuze drie gevallen van frequenties na 600 dobbelsteenworpen bedacht. De verwachte frequentie is dan 100 en df = 6-1 = 5. Bij het eerste gedachtenexperiment liggen de frequenties erg dicht bij 100. De berekende c 2 is dan ook erg veel lager dan df en de P-waarde duidt erop dat de verwachte afwijkingen veel en veel groter zijn. Conclusie: de frequenties zijn te mooi om geloofwaardig te zijn. Het tweede gedachtenexperiment is random gemaakt en verloopt dus min of meer normaal. Het derde experiment vertoont zeer grote schommelingen. De kans op zo'n uitkomst is minder dan 5% (P=0.0498). Er is waarschijnlijk iets mis met de dobbelsteen. Bij de tweede menukeuze zijn de verwachte uitkomsten in L2 niet allemaal gelijk, zoals in het vorige experiment. De gefingeerde waarnemingen in L1 wijken er in het eerste geval helemaal niet van af (gevolg: P=1) en in het derde geval veel te veel van af (P=0.0007). Merk op dat in het laatste geval alle waarnemingen 3 hoger liggen dan de verwachting; je zou kunnen veronderstellen dat de verwachting 3 punten te laag was. Het tweede geval ligt zo'n beetje tussen de andere twee in (zie pag 12). STATISTIEK - 6 -

7 OPGAVE 1. Bij een experiment naar het voorkomen van series nullen en enen, leverde een simulatie van 512 worpen met een muntje de hiernaast weergegeven series op. Serielengte 1 kwam 141 keer voor, enzovoorts. Serielengte 8 kwam 1 keer voor; neem dus L2(8)=1. De verwachtingen (in L3) waren 512 (½) L+1. Onderzoek of deze verwachtingswaarden kloppen met de simulaties. Zijn de afwijkingen een beetje "normaal" gespreid? STATISTIEK - 7 -

8 Toetsen en schatten: dertien voorbeelden 1 en 2. BINTGEMZ en TESTGEMZ Uitspraken met z-waarden: Zinterval en Z-test Uit een representatief onderzoek onder een groot aantal directiesecretaressen in Nederland blijkt het gemiddeld maandsalaris 2340 te zijn met een standaarddeviatie van ) Bepaal het 95% z-betrouwbaarheidsinterval 2a) Bij een groot verzekeringsbedrijf werken 30 directiesecretaressen met een gemiddeld maandloon van Moeten we dat als een significant lager gemiddeld maandloon beschouwen? (a=0.05) 2b) Een van de secretaresses van dat bedrijf verdient per maand De personeelschef vindt dat zij extreem veel meer dan het landelijk gemiddelde van 2340 verdient. De secretaresse is dat niet met hem eens en toetst zijn bewering met een onbetrouwbaarheidsdrempel van Ga na wie gelijk krijgt. BINTGEMZ Input "GEM.Ë=",G Input "STDEV=",S Input "AANTL n=",n Input "BETRBH B=?",B If B>1:.01BüB :ZInterval S,G,N,B TESTGEMZ Disp "INVOER POPLATIE:" Input "GEM. MU0=",M Disp "INVOER STEEKPR:" Input "GEMIDD Ë=",G Input "STDEV Sx=",S Input "AANTAL n=",n Menu("TOETS ALTERN H1:","LINKS MU<MU0",M1,"RECHTS MU>MU0",M2,"2úZYDIG MUøMU0",M3) Lbl M1 ú1ük:goto U Lbl M2 1üK:Goto U Lbl M3 0üK Lbl U Z-Test(M,S,G,N,K,0) STATISTIEK - 8 -

9 1) Invoer: 95%-Betrbh Interval: 2a) 2b) OPGAVE 2. Een machine produceert schroefjes met een gemiddelde lengte van 35,00 mm en een standaarddeviatie van 0,10 mm. Elke dag neem men een steekproef van 40 schroefjes om te controleren of de machine bijgesteld moet worden. a) Geef het 99%-Betrouwbaarheidsinterval van het gemiddelde van zo'n steekproef. b) Hoe groot is de kans dat het gemiddelde groter dan 35,03 mm is? STATISTIEK - 9 -

10 3 en 4. BINTGEMT en TESTGEMT Uitspraken met t-waarden: Tinterval en T-test t-waarden gebruikt men (in plaats van z-waarden) bij kleine steekproeven (n 30), als de standaarddeviatie van de populatie onbekend is. Landelijk onderzoek wees uit dat peuters op hun derde verjaardag gemiddeld 95 cm lang zijn. Een kinderarts denk dat dit een verouderd gegeven is. Hij meet de lengte van 23 peuters en vindt een gemiddelde van 98 cm met een standaarddeviatie van 6 cm. 3) Bepaal het 95%-Betrouwbaarheidsinterval rond 98 cm 4) Is de conclusie gerechtvaardigd dat de huidige driejarige peuters gemiddeld langer zijn dan 95 cm? Toetsen met a = BINTGEMT Disp "INVOER POPLATIE:" Disp "INVOER STEEKPR:" Input "GEMIDD Ë=",G Input "SD Sx=",S Input "AANTAL n=",n Input "BETRBH B=",B If B>1:.01BüB :TInterval G,S,N,B TESTGEMT :Disp "INVOER POPLATIE:" Input "GEM. MU0=",M Disp "INVOER STEEKPR:" Input "GEMIDD Ë=",G Input "STDEV Sx=",S Input "AANTAL n=",n Input "ALFA =",A Menu("TOETS ALTERN H1:","LINKS Ë<MU0",M1,"RECHTS Ë>MU0",M2,"2úZYDIG ËøMU0",M3) Lbl M1 ú1ük:goto U Lbl M2 1üK:Goto U Lbl M3 0üK:.5AüA Lbl U :T-Test (M,G,S,N,K,0) STATISTIEK

11 3) 4) OPGAVE 3. Dr. Jansen heeft de bovenwaarde van de bloeddruk gemeten van enkele van zijn manlijke patiënten (ouder dan 60 jaar). De data zijn: a) Laat zien, bijv met STAT CALC 1-VarStats, dat ü=158 en s=17. b) Geef het 95%-Betrouwbaarheidsinterval rond ü. c) Is de gemiddelde bloeddruk van deze patiënten essentieel lager dan het landelijk gemiddelde voor oudere mensen (m=165)? STATISTIEK

12 5 en 6. BINT1PRO en TEST1PRO Uitspraken over proporties (percentages): 1-PropZInt en 1-PropZTest 5) Na een telefonische enquête onder 1060 personen bleken 321 daarvan een adres te hebben. Maak een schatting van het landelijk percentage bezitters met het daarbij behorende 95%- Betrouwbaarheidsinterval. 6) Vorig jaar voelde 36% van de mensen zich onveilig op straat. Uit een telefonische enquête dit jaar onder 400 personen blijkt dat 132 daarvan zich onveilig voelen op straat. Toets de hypothese dat de mensen zich nu veiliger voelen op straat dan vorig jaar, met een onbetrouwbaarheidsdrempel van BINT1PRO Disp "AANTAL SUCCES=X" Input "X=?",X:round(X,0)üX Disp "GROOTTE STKPR=N" Input "N=?",N Input "BETRBH B=?",B If B>1:.01BüB 1-PropZInt(X,N,B) TEST1PRO Disp "INVOER POPLATIE:" Disp "VERWACHTE" Input "FRACTIE p0=",p Disp "INVOER STEEKPR:" Input "SUCCSSN X=",X Input "AANTAL n=",n Input "ALFA =",A Menu("TOETS ALTERN H1:","LINKS P<p0",M1,"RECHTS P>p0",M2,"2úZYDIG Pøp0",M3) Lbl M1 ú1ük:goto U Lbl M2 1üK:Goto U Lbl M3 0üK:.5AüA Lbl U 1-PropZTest(P,X,N,K,0) STATISTIEK

13 5) 6) OPGAVE 4. In een enquête onder 743 personen verklaarde 22.48% hiervan, niet te gaan stemmen; 21% verklaarde op de PvhGG (Partij van het Grote Geld) te gaan stemmen. Tussen welke grenzen zal, met een waarschijnlijkheid van 95%, het werkelijke percentage stemmers op die partij uitkomen? STATISTIEK

14 7 en 8. BINT2GMZ en TEST2GMZ Uitspraken over het verschil van gemiddelden: 2-SampZInt en 2-SampZTest 7) Blijkens een onderzoek onder 320 radiologen en 410 neurologen blijkt hun gemiddelde jaarsalaris respectievelijk (s = ) en (s = ) te zijn. Geef het 95%-Betrouwbaarheidsinterval rond het gemiddeld verschil in jaarsalaris. 8) Zie de vorige gegevens. Bereken de standaarddeviatie van het verschil en toets de bewering dat radiologen sterk significant (a = 0.01) meer verdienen dan neurologen. BINT2GMZ :Disp "INVOER:" Input "SD1=",S Input "SD2=",T Disp "STEEKPROEF:" Input "GEM Ë1=",G Input "AANTL n1=",n Input "GEM Ë =",H Input "AANTL n =",M Input "BETRBH B=",B If B>1:.01BüB 2-SampZInt(S,T,G,N,H,M,B) TEST2GMZ :Disp "INVOER:" Input "SD1=",S Input "SD2=",T Disp "STEEKPROEF:" Input "GEM. Ë1=",G Input "AANTL n1=",n Input "GEM. Ë =",H Input "AANTL n =",M Input "ALFA =",A Menu("TOETS ALTERN H1:","LINKS MU1øMU2",M3) MU1<MU2",M1,"RECHTS MU1>MU2",M2,"2ZYDIG Lbl M1 ú1ük:goto U Lbl M2 1üK:Goto U Lbl M3 0üK:.5AüA STATISTIEK

15 Lbl U 2-SampZTest(S,T,G,N,H,M,K,0) ð(sü/n1+tü/n )üu:round(u,3)üu Output(1,1,"z="):Output(1,3,round(z,5)) Output(2,1,"p="):Output(2,3,round(p,5)) Output(3,1,"SD="):Output(3,4,U) Output(5,1,"CONCLUSIE:") If p<a Then Output(6,1,"SIGNIFICANT") Output(7,1,"WANT p<") Output(7,8,A) Else Output(6,1,"NIET SIGNIFICANT") Output(7,1,"WANT pù") Output(7,8,A) End Pause 7) 8) OPGAVE 5. Op school A (met 125 kandidaten) lag het gemiddeld examencijfer VWO op 6.4 (de standaarddeviatie was 2.0); op school B scoorden de 83 examenkandidaten gemiddeld 6.8 (standaarddeviatie 1.4). a) Bereken de standaarddeviatie van het verschil in de gemiddelden. b) De rector van school B verklaart snoevend, dat zijn leerlingen beter zijn dan die van school A. Hoe groot is de kans dat dit hogere gemiddelde op statistisch toeval berust? Geef je de rector van school B gelijk (a=0.05)? STATISTIEK

16 9 en 10. BINT2GMT en TEST2GMT Uitspraken over het verschil van gemiddelden: 2-SampTInt en 2-SampTTest bij kleine steekproeven (n 30). Bij kleine steekproeven gebruikt men de t-verdeling. Een wiskundeleraar heeft van zijn twee examenklassen de eindcijfers geanalyseerd. Groep 1 heeft: gem. ü1=6.7; s.d. s1=0.55 en aantal n1=20 Groep 2 heeft: gem. ü2=6.4; s.d. s2=0.45 en aantal n2=14 9) Bepaal het 95%-Betrouwbaarheidsinterval rond het verschil ü1-ü2 10) Ga na of groep 1 gemiddeld significant (a=0.05) hoger scoorde dan groep 2. BINT2GMT : Disp "INVOER STEEKPR:" Input "GEM Ë1=",G Input "SD Sx =",S Input "AANTL n1=",n Input "GEM Ë =",H Input "SD Sx =",T Input "AANTL n =",M Input "BETRBH B=",B If B>1:.01BüC 2-SampTInt G,S,N,H,T,M,B,1 TEST2GMT Disp "INVOER STEEKPRF:" Input "GEM Ë1=",G Input "SD Sx =",S Input "AANTL n1=",n Input "GEM Ë =",H Input "SD Sx =",T Input "AANTL n =",M Input "ALFA =",A Menu("TOETS ALTERN H1:", "LINKS MU1øMU2",M3) Lbl M1:ú1üK:Goto U Lbl M2:1üK:Goto U Lbl M3:0üK:.5AüA Lbl U 2-SampTTest G,S,N,H,T,M,K,1,0 MU1<MU2",M1,"RECHTS MU1>MU2",M2,"2ZYDIG STATISTIEK

17 9) 10) OPGAVE 6. Een bedrijf vergelijkt de levensduur van twee soorten lampen. In uren: A: B: De vraag is, of de gemiddelde levensduur van lamp B korter is. Neem a=0.05 Opmerking: bij zulke kleine steekproeven kun je beter s x dan s x nemen. STATISTIEK

18 11 en 12. BINT2PRO en TEST2PRO Uitspraken over het verschil van proporties: 2-PropZInt en 2-PropZTest Een onderzoek onder 1200 vrouwen en 900 mannen leerde dat 77% van de vrouwen en 73% van de mannen zegt, regelmatig een horoscoop te lezen. 11) Bepaal het 95%-Betrouwbaarheidsinterval t.a.v. het verschil in proporties 12) Test met een significantieniveau van 2% of vrouwen gemiddeld vaker een horoscoop lezen dan mannen. BINT2PRO Disp "AANTL SUCCESSEN:" Input "x =?",X Input "x =?",Y Disp "GROOTTE STKPRN:" Input "n1=?",n Input "n =?",M Input "BETRBH B=?",B If B>1:.01BüB 2-PropZInt(X,N,Y,M,B) TEST2PRO Disp "INVOER SUCCESSN:" Input "x =?",X Input "x =?",Y Disp "INVOER STEEKPRN:" Input "n1=?",n Input "n =?",M Input "ALFA=?",A If K=0:.5AüA 2-PropZTest(X,N,Y,M,K,0) Output(1,1,"z=") Output(1,3,round(z,5)) Output(2,1,"p=") Output(2,3,round(p,5)) Output(4,1,"CONCLUSIE:") If p<a Then Output(5,1,"SIGNIFICANT") Output(6,1,"WANT p<") Output(6,8,A) Else Output(5,1,"NIET SIGNIFICANT") Output(6,1,"WANT pù") Output(6,8,A) End Pause STATISTIEK

19 11) 12) OPGAVE 7. In 2002 wees een onderzoek onder 1506 scholieren uit dat 13% daarvan zich wel eens onveilig voelde op school. In 2003 was dat percentage gestegen naar 16%, in een onderzoek onder 977 scholieren. Toets met a=0.02 of deze stijging significant is. STATISTIEK

20 Variantie analyse 13. TSTANOVA Variantie analyse gaat via: STAT<TESTS> ANOVA(L1,L2,L3,.) Bij variantie analyse gaat het om verschillende groepen waarnemingsgetallen. De variaties (varianties) tussen de groepen worden daarbij vergeleken met de varianties binnen de verschillende groepen. De toetsingsgrootheid is F, de verhouding tussen deze twee varianties. De data moeten vooraf in de lijsten L1 t/m L6 worden gezet. Als F groot is, zijn de verschillen tussen de groepen groot. Is F klein dan zijn de verschillen in gemiddelde tussen de groepen minder duidelijk. TSTANOVA Disp "ZIJN DE" Disp "GEGEVENSLIJSTEN" Disp "IN L1,L,Lƒ,..." Disp "INGEVOERD?" Disp "":Disp "":Disp "" Input "1=JA 2=NEE ",I If Iø1:Goto Z Menu(" AANTAL LIJSTEN"," - ",Z," 2",2," 3",3," 4",4," 5",5," 6",6) Lbl 2::ANOVA(L1,L ):Goto 8 Lbl 3::ANOVA(L1,L,Lƒ):Goto 8 Lbl 4::ANOVA(L1,L,Lƒ,L ):Goto 8 Lbl 5::ANOVA(L1,L,Lƒ,L,L ):Goto 8 Lbl 6::ANOVA(L1,L,Lƒ,L,L,L ) Lbl 8 Output(2,1,"ã= ") Output(1,3,"TUSNNVARIANTIE") Output(3,3,"BINNNVARIANTIE") Output(5,6,"= ") Output(4,8,"FACTOR MS") Output(6,8,"ERROR MS") Output(7,1,"ã=") Output(7,3,round(ã,2)) Output(8,1,"p=") Output(8,3,round(p,4)) Pause Lbl Z Output(1,1,"DOE STAT TESTS:") Output(2,1,"ANOVA(L1,L,...)" Disp "":Disp "" STATISTIEK

21 OPGAVE 8. Een bank wil in vier filialen de productiviteit van de baliemedewerkers toetsen. Als maat voor die productiviteit wordt het per uur behandelde aantal klanten genoteerd, door de vijf of zes medewerkers ter plaatse: filiaal A filiaal B filiaal C filiaal D Toets, op een 5% significantieniveau, de nulhypothese dat het gemiddeld aantal per uur behandelde klanten in alle vier de filialen even groot is. Neem aan dat aan alle voorwaarden voor een variantie analyse is voldaan. ANTWOORDEN 1. c 2 klopt ongeveer met de verwachting. Een P-waarde van 0.77 duidt op een een geloofwaardige voorspelling (verwachting) van serielengtes. 2. a) [34.96; 35.04] b) p=0.029 z= a) ü= Sx=17.38 b) Gebruik t-waarden voor kleine steekproeven [147.2; 168.8] c) z= p=0.09 niet significant (voor a=0.05) 4. tussen 17.7% en 24.3% 5. a) SD=0.236 b) p=0.045<0.05 significant; rector krijgt gelijk 6. p= >0.05 niet significant 7. p=0.0197<0.02 significant 8. De productiviteit is sterk significant (p=0.0005) verschillend in de filialen. F=9.69: de variantie tussen de filialen is (veel) groter dan de variantie erbinnen. STATISTIEK

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16 modulus strepen: uitkomst > 0 Hiermee rekenen we de testwaarde van t uit: n 10 ttest ( x ) 105 101 3,16 n-1 4 t test > t kritisch want 3,16 >,6, dus 105 valt buiten het BI. De cola bevat niet significant

Nadere informatie

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k) 11.0 Voorkennis Let op: Cumulatieve binomiale verdeling: P(X k) = binomcdf(n,p,k) Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k) Voorbeeld 1: Binomiaal kanseperiment

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

Lesbrief hypothesetoetsen

Lesbrief hypothesetoetsen Lesbrief hypothesetoetsen 00 "Je gaat het pas zien als je het door hebt" Johan Cruijff Willem van Ravenstein Inhoudsopgave Inhoudsopgave... Hoofdstuk - voorkennis... Hoofdstuk - mens erger je niet... 3

Nadere informatie

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 1. Iemand kiest geblinddoekt 4 paaseitjes uit een mand met oneindig veel paaseitjes. De helft is melkchocolade, de andere

Nadere informatie

Toetsen van Hypothesen. Het vaststellen van de hypothese

Toetsen van Hypothesen. Het vaststellen van de hypothese Toetsen van Hypothesen Wisnet-hbo update maart 2008 1. en Het vaststellen van de hypothese De nulhypothese en de Alternatieve hypothese. Het gaat in deze paragraaf puur alleen om de formulering. Er wordt

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek 2 deel A 30 minuten over statistisch toetsen Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014 Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie +

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages. MARGES EN SIGNIFICANTIE BIJ STEEKPROEFRESULTATEN. De marges van percentages Metingen via een steekproef leveren een schatting van de werkelijkheid. Het toevalskarakter van de steekproef heeft als consequentie,

Nadere informatie

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan. Afdeling Wiskunde Volledig tentamen Statistics Deeltentamen 2 Statistics Vrije Universiteit 28 mei 2015 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen: opgaven 1,2,3,4. Cijfer=

Nadere informatie

15.1 Beslissen op grond van een steekproef [1]

15.1 Beslissen op grond van een steekproef [1] 15.1 Beslissen op grond van een steekproef [1] Voorbeeld 1: Een vulmachine vult flessen met een inhoud van X ml. X is normaal verdeeld met μ = 400 en σ = 4 Er wordt een steekproef genomen van 40 flessen.

Nadere informatie

8.1 Centrum- en spreidingsmaten [1]

8.1 Centrum- en spreidingsmaten [1] 8.1 Centrum- en spreidingsmaten [1] Gegeven zijn de volgende 10 waarnemingsgetallen: 1, 3, 3, 3, 4, 5, 6, 8, 8, 9 Het gemiddelde is: De mediaan is het middelste waarnemingsgetal als de getallen naar grootte

Nadere informatie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van

Nadere informatie

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Afdeling Wiskunde Volledig tentamen Algemene Statistiek Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen:

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

Uitleg significantieniveau en toetsen van hypothesen

Uitleg significantieniveau en toetsen van hypothesen Uitleg significantieniveau en toetsen van hypothesen Het significantieniveau (meestal aangegeven met de letter α) stelt de kans voor, dat H 0 gelijk heeft, maar H 1 gelijk krijgt. Je trekt dus een foute

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4.1 PARAMETERTOESTEN 1 A. Toetsen van het gemiddelde Beschouw een steekproef X 1, X,, X n van n onafhankelijke N(µ, σ) verdeelde kansveranderlijken Men

Nadere informatie

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Populatie: De gehele groep elementen waarover informatie wordt gewenst. Statistiek I Werkcollege 1 Populatie: De gehele groep elementen waarover informatie wordt gewenst. Steekproef: Gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te vergaren. Eenheden:

Nadere informatie

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Statistiek voor A.I. College 12. Dinsdag 23 Oktober Statistiek voor A.I. College 12 Dinsdag 23 Oktober 1 / 20 2 Deductieve statistiek Orthodoxe statistiek 2 / 20 3 / 20 Jullie - onderzoek Wivine Tijd waarop je opstaat (uu:mm wordt weergeven als uumm). Histogram

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

Wiskunde B - Tentamen 1

Wiskunde B - Tentamen 1 Wiskunde B - Tentamen Tentamen 57 Wiskunde B voor CiT vrijdag januari 5 van 9. tot. uur Dit tentamen bestaat uit 6 opgaven, formulebladen en tabellen. Vermeld ook uw studentnummer op uw werk en tentamenbriefje.

Nadere informatie

Het werken met TI-83-programma s in de klas

Het werken met TI-83-programma s in de klas Het werken met TI-83-programma s in de klas Ton Van Amsterdam Inleiding. Met de komst van de wetenschappelijke rekenmachine verdween de behoefte aan een logaritmetafel en tafels voor goniometrische verhoudingen.

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

DEZE PAGINA NIET vóór 8.30u OMSLAAN! STTISTIEK 1 VERSIE MT15303 1308 1 WGENINGEN UNIVERSITEIT LEERSTOELGROEP MT Tentamen Statistiek 1 (MT-15303) 5 augustus 2013, 8.30-10.30 uur EZE PGIN NIET vóór 8.30u OMSLN! STRT MET INVULLEN VN NM, REGISTRTIENUMMER,

Nadere informatie

Examen Statistiek I Januari 2010 Feedback

Examen Statistiek I Januari 2010 Feedback Examen Statistiek I Januari 2010 Feedback Correcte alternatieven worden door een sterretje aangeduid. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Twee derden van de mannen

Nadere informatie

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing Bijlage 3 Statistische toetsing: werkwijze, toetsen, formules, toepassing In dit boek wordt kennis van statistiek en statistische ( hypothese)toetsing in principe bekend verondersteld. Niettemin geven

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38 2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen

Nadere informatie

Toetsen van hypothesen

Toetsen van hypothesen Les 4 Toetsen van hypothesen We hebben tot nu toe enigszins algemeen naar grootheden van populaties gekeken en bediscussieerd hoe we deze grootheden uit steekproeven kunnen schatten. Vaak hebben we echter

Nadere informatie

Toegepaste Statistiek, Week 3 1

Toegepaste Statistiek, Week 3 1 Toegepaste Statistiek, Week 3 1 In Week 2 hebben we toetsingstheorie besproken mbt een kwantitatieve (ordinale) variabele G, en met name over zijn populatiegemiddelde E(G). Er waren twee gevallen: Er is

Nadere informatie

o Geef bij de beantwoording van de vragen ALTIJD JE BEREKENINGEN. Als je alleen een antwoord geeft worden er GEEN PUNTEN toegekend!

o Geef bij de beantwoording van de vragen ALTIJD JE BEREKENINGEN. Als je alleen een antwoord geeft worden er GEEN PUNTEN toegekend! Examentoets 2 6VWO-A Statistiek woensdag 20 januari 2010 o Geef bij de beantwoording van de vragen ALTIJD JE BEREKENINGEN. Als je alleen een antwoord geeft worden er GEEN PUNTEN toegekend! o Geef bij gebruik

Nadere informatie

7.1 Toets voor het gemiddelde van een normale verdeling

7.1 Toets voor het gemiddelde van een normale verdeling Hoofdstuk 7 Toetsen van hypothesen Toetsen van hypothesen is, o.a. in de medische en chemische wereld, een veel gebruikte statistische techniek. Het wordt vaak gebruikt om een gevestigde norm eventueel

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

4.1 Eigenschappen van de normale verdeling [1]

4.1 Eigenschappen van de normale verdeling [1] 4.1 Eigenschappen van de normale verdeling [1] Relatief frequentiepolygoon van de lengte van mannen in 1968 1 4.1 Eigenschappen van de normale verdeling [1] In dit plaatje is een frequentiepolygoon getekend.

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

. Dan geldt P(B) = a. 1 4. d. 3 8

. Dan geldt P(B) = a. 1 4. d. 3 8 Tentamen Statistische methoden 4052STAMEY juli 203, 9:00 2:00 Studienummers: Vult u alstublieft op het meerkeuzevragenformulier uw Delftse studienummer in (tbv automatische verwerking); en op het open

Nadere informatie

Lesbrief de normale verdeling

Lesbrief de normale verdeling Lesbrief de normale verdeling 2010 Willem van Ravenstein Inhoudsopgave Inhoudsopgave... 1 Hoofdstuk 1 de normale verdeling... 2 Hoofdstuk 2 meer over de normale verdeling... 11 Hoofdstuk 3 de n-wet...

Nadere informatie

Antwoordvel Versie A

Antwoordvel Versie A Antwoordvel Versie A Interimtoets Toegepaste Biostatistiek 13 december 013 Naam:... Studentnummer:...... Antwoorden: Vraag Antwoord Antwoord Antwoord Vraag Vraag A B C D A B C D A B C D 1 10 19 11 0 3

Nadere informatie

Samenvatting Statistiek

Samenvatting Statistiek Samenvatting Statistiek De hoofdstukken 1 t/m 3 gaan over kansrekening: het uitrekenen van kansen in een volledig gespecifeerd model, waarin de parameters bekend zijn en de kans op een gebeurtenis gevraagd

Nadere informatie

Toegepaste Statistiek, Week 6 1

Toegepaste Statistiek, Week 6 1 Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Hoofdstuk 6 Hypothesen toetsen

Hoofdstuk 6 Hypothesen toetsen Hoofdstuk 6 Hypothesen toetsen ladzijde 144 1a X is aantal autokopers die merk A aanschaffen. X is Bin(100; 0,30) verdeeld. 0,30 3 100 = 30, naar verwachting zullen dus 30 autokopers merk A aanschaffen.

Nadere informatie

Hoe verwerk je gegevens met de Grafische Rekenmachine?

Hoe verwerk je gegevens met de Grafische Rekenmachine? Hoe verwerk je gegevens met de Grafische Rekenmachine? Heb je een tabel met alleen gegevens? Kies STAT EDIT Vul L 1 met je gegevens (als de lijst niet leeg is, ga je met de pijltjes helemaal naar boven,

Nadere informatie

Herkansing eindtoets statistiek voor HBO

Herkansing eindtoets statistiek voor HBO Herkansing 1A 1 Herkansing eindtoets statistiek voor HBO Schrijf de antwoorden op de vragen alleen op deze pagina s. Antwoorden geschreven op andere vellen papier worden niet meegenomen in de beoordeling.

Nadere informatie

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Kruis per vraag slechts één vakje aan op het antwoordformulier. Toets Stroom 1.2 Methoden en Statistiek tul, MLW 7 april 2006 Deze toets bestaat uit 25 vierkeuzevragen. Kruis per vraag slechts één vakje aan op het antwoordformulier. Vraag goed beantwoord dan punt voor

Nadere informatie

werkcollege 6 - D&P9: Estimation Using a Single Sample

werkcollege 6 - D&P9: Estimation Using a Single Sample cursus 9 mei 2012 werkcollege 6 - D&P9: Estimation Using a Single Sample van frequentie naar dichtheid we bepalen frequenties van meetwaarden plot in histogram delen door totaal aantal meetwaarden > fracties

Nadere informatie

Werkblad 1 Normale dichtheidsfunctie als benadering voor een klokvormig histogram

Werkblad 1 Normale dichtheidsfunctie als benadering voor een klokvormig histogram Werkblad 1 Normale dichtheidsfunctie als benadering voor een klokvormig histogram Probeer zeker de opdrachten 1, 4 en 6 te maken. 1. In de tabel hieronder vind je gegevens over de borstomtrek van 5732

Nadere informatie

Wiskunde De Normale en Binomiale Verdeling. Geschreven door P.F.Lammertsma voor mijn lieve Avigail

Wiskunde De Normale en Binomiale Verdeling. Geschreven door P.F.Lammertsma voor mijn lieve Avigail Wiskunde De Normale en Binomiale Verdeling Geschreven door P.F.Lammertsma voor mijn lieve Avigail Opmerkingen vooraf Wiskunde Pagina 2 uit 20 Opmerkingen vooraf Pak je rekenmachine, de TI-83, erbij en

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden

Nadere informatie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel.

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel. 9.0 Voorkennis Bij samengestelde kansexperimenten maak je gebruik van de productregel. Productregel: Voor de gebeurtenis G 1 bij het ene kansexperiment en de gebeurtenis G 2 bij het andere kansexperiment

Nadere informatie

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995 Schriftelijk examen statistiek, data-analyse en informatica Maandag 29 mei 1995 Tweede jaar kandidaat arts + Tweede jaar kandidaat in de biomedische wetenschappen Naam: Voornaam: Vraa Kengetal g Blad 1

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

Antwoorden bij 4 - De normale verdeling vwo A/C (aug 2012)

Antwoorden bij 4 - De normale verdeling vwo A/C (aug 2012) Antwoorden bij - De normale verdeling vwo A/C (aug 0) Opg. a Aflezen bij de 5,3 o C grafiek:,3% en bij de,9 o C grafiek: 33,3% b Het tweede percentage is 33,3 /,3 = 5, maal zo groot. c Bij de 5,3 o C grafiek

Nadere informatie

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99 Inhoud 1 Inleiding tot de beschrijvende statistiek 13 1.1 Een eerste verkenning 14 1.2 Frequentieverdelingen 22 1.3 Grafische voorstellingen 30 1.4 Diverse diagrammen 35 1.5 Stamdiagram, histogram en frequentiepolygoon

Nadere informatie

1 Basisbegrippen, W / O voor waar/onwaar

1 Basisbegrippen, W / O voor waar/onwaar Naam - Toetsende Statistiek Rijksuniversiteit Groningen Lente Docent: John Nerbonne Tentamen di. 22 juni om 14 uur tentamenhal Belangrijke instructies 1. Schrijf uw naam & studentnummer hierboven, schrijf

Nadere informatie

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 5: Steekproevendistributies Hoofdstuk 5: Steekproevendistributies Inleiding Statistische gevolgtrekkingen worden gebruikt om conclusies over een populatie of proces te trekken op basis van data. Deze data wordt samengevat door middel

Nadere informatie

Zin en onzin van normale benaderingen van binomiale verdelingen

Zin en onzin van normale benaderingen van binomiale verdelingen Zin en onzin van normale benaderingen van binomiale verdelingen Johan Walrave, docent EHSAL 0. Inleiding Voordat het grafisch rekentoestel in onze school ingevoerd werd, was er onder de statistiekdocenten

Nadere informatie

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK 1 1. INLEIDING Parametrische statistiek: Normale Verdeling Niet-parametrische statistiek: Verdelingsvrij Keuze tussen de twee benaderingen I.

Nadere informatie

Les 1: Waarschijnlijkheidrekening

Les 1: Waarschijnlijkheidrekening Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS

VOOR HET SECUNDAIR ONDERWIJS VOOR HET SECUNDAIR ONDERWIJS Steekproefmodellen en normaal verdeelde steekproefgrootheden 5. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

wordt niet verworpen, dus het beïnvloedt de levensduur niet significant

wordt niet verworpen, dus het beïnvloedt de levensduur niet significant Hoofdstuk : Kansen en beslissingen. Beslissen op grond van een steekproef. Opgave : a. normalcdf,,8,), 78 b. a invnorm.,8,) 7, c. normalcdf,.,.8, ), 7 y normalcdf,.,.8, X ) kijk in de tabel voor welke

Nadere informatie

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. Opgaven hoofdstuk 6 I Learning the Mechanics 6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. De random variabele x wordt tweemaal waargenomen. Ga na dat, indien de waarnemingen

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Inleveren: 12 januari 2011, VOOR het college Afspraken Serie 1 mag gemaakt en ingeleverd worden in tweetallen. Schrijf duidelijk je naam, e-mail

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 10 Donderdag 20 Oktober 1 / 1 2 Statistiek Vandaag: Hypothese toetsen 2 / 1 3 / 1 Terzijde NU.nl 19 oktober 2011: Veel Facebookvrienden wijst op grotere hersenen. (http://www.nu.nl/wetenschap/2645008/veel-facebookvrienden-wijst-groterehersenen-.html)

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven

Nadere informatie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: 5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van

Nadere informatie

Uitwerkingen Mei 2012. Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

Uitwerkingen Mei 2012. Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek Uitwerkingen Mei 2012 Eindexamen VWO Wiskunde C Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek I Tjing Opgave 1. Het aantal hoofdstukken in de I Tjing correspondeert met het totale aantal

Nadere informatie

Statistische toetsen

Statistische toetsen Statistische toetsen Een handleiding voor elke leerling die worstelt met het toetsen van zijn gegevens bij het PWS Hanna Bodde en Annalie Koerts Karla Thie Inhoudsopgave 1. Inleiding 3 2. Criteria voor

Nadere informatie

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet? Verklarende Statistiek: Toetsen Zat ik nou in dat kritische gebied of niet? Toetsen, Overzicht Nulhypothese - Alternatieve hypothese (voorbeeld: toets voor p = p o in binomiale steekproef) Betrouwbaarheid

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

Klantonderzoek: statistiek!

Klantonderzoek: statistiek! Klantonderzoek: statistiek! Statistiek bij klantonderzoek Om de resultaten van klantonderzoek juist te interpreteren is het belangrijk de juiste analyses uit te voeren. Vaak worden de mogelijkheden van

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

Feedback proefexamen Statistiek I 2009 2010

Feedback proefexamen Statistiek I 2009 2010 Feedback proefexamen Statistiek I 2009 2010 Het correcte antwoord wordt aangeduid door een sterretje. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Een derde van de mannen is

Nadere informatie

Statistiek: Herhaling en aanvulling

Statistiek: Herhaling en aanvulling Statistiek: Herhaling en aanvulling 11 mei 2009 1 Algemeen Statistiek is de wetenschap die beschrijft hoe we gegevens kunnen verzamelen, verwerken en analyseren om een beter inzicht te krijgen in de aard,

Nadere informatie

Beschrijvend statistiek

Beschrijvend statistiek 1 Beschrijvend statistiek 1. In een school werd het intelligentiequotiënt gemeten van de leerlingen van het zesde jaar (zie tabel). De getallen werden afgerond tot op de eenheid. De berekeningen mogen

Nadere informatie

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur Kansrekening en statistiek WI22TI / WI25IN deel 2 2 februari 22, 4. 6. uur VOOR WI22TI: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad is niet toegestaan.

Nadere informatie

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling. Opgaven hoofdstuk 6 I Basistechnieken 6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling. x 0 2 4 6 p(x) ¼ ¼ ¼ ¼ a. Schrijf alle mogelijke verschillende steekproeven van n =

Nadere informatie

Samenvatting Wiskunde A

Samenvatting Wiskunde A Bereken: Bereken algebraisch: Bereken exact: De opgave mag berekend worden met de hand of met de GR. Geef bij GR gebruik de ingevoerde formules en gebruikte opties. Kies op een examen in dit geval voor

Nadere informatie

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6 MATERIALEN BIJ STATISTIEK (1991) JANUARI 010 Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 1 Antwoorden uitgewerkte opgaven week 1 11 15 Power-point sheets hoorcollege (over paragraaf

Nadere informatie

Statistiek ( ) eindtentamen

Statistiek ( ) eindtentamen Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op

Nadere informatie

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Moore, McCabe & Craig: 3.3 Toward Statistical Inference From Probability to Inference 5.1 Sampling Distributions for

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie