Is STATISTIEK een exacte wetenschap? (Of een verzameling nauwkeurig geformuleerde onnauwkeurigheden)



Vergelijkbare documenten
Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Voorbeeldtentamen Statistiek voor Psychologie

Lesbrief hypothesetoetsen

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Toetsen van Hypothesen. Het vaststellen van de hypothese

Hoofdstuk 6 Twee populaties: parametrische toetsen

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

15.1 Beslissen op grond van een steekproef [1]

8.1 Centrum- en spreidingsmaten [1]

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

Kansrekening en Statistiek

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Uitleg significantieniveau en toetsen van hypothesen

Kansrekening en Statistiek

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Data analyse Inleiding statistiek

Hoofdstuk 12: Eenweg ANOVA

Wiskunde B - Tentamen 1

Het werken met TI-83-programma s in de klas

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Examen Statistiek I Januari 2010 Feedback

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

Kansrekening en Statistiek

Toetsen van hypothesen

Toegepaste Statistiek, Week 3 1

o Geef bij de beantwoording van de vragen ALTIJD JE BEREKENINGEN. Als je alleen een antwoord geeft worden er GEEN PUNTEN toegekend!

7.1 Toets voor het gemiddelde van een normale verdeling

Oefenvragen bij Statistics for Business and Economics van Newbold

4.1 Eigenschappen van de normale verdeling [1]

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

. Dan geldt P(B) = a d. 3 8

Lesbrief de normale verdeling

Antwoordvel Versie A

Samenvatting Statistiek

Toegepaste Statistiek, Week 6 1

Statistiek voor A.I.

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 6 Hypothesen toetsen

Hoe verwerk je gegevens met de Grafische Rekenmachine?

Herkansing eindtoets statistiek voor HBO

Kruis per vraag slechts één vakje aan op het antwoordformulier.

werkcollege 6 - D&P9: Estimation Using a Single Sample

Werkblad 1 Normale dichtheidsfunctie als benadering voor een klokvormig histogram

Wiskunde De Normale en Binomiale Verdeling. Geschreven door P.F.Lammertsma voor mijn lieve Avigail

Kansrekening en Statistiek

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel.

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Antwoorden bij 4 - De normale verdeling vwo A/C (aug 2012)

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

1 Basisbegrippen, W / O voor waar/onwaar

Hoofdstuk 5: Steekproevendistributies

Zin en onzin van normale benaderingen van binomiale verdelingen

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

Les 1: Waarschijnlijkheidrekening

VOOR HET SECUNDAIR ONDERWIJS

Wiskunde B - Tentamen 2

Hoofdstuk 10: Regressie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

wordt niet verworpen, dus het beïnvloedt de levensduur niet significant

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Kansrekening en Statistiek

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Uitwerkingen Mei Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

Statistische toetsen

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Klantonderzoek: statistiek!

Populaties beschrijven met kansmodellen

Feedback proefexamen Statistiek I

Statistiek: Herhaling en aanvulling

Beschrijvend statistiek

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Samenvatting Wiskunde A

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Statistiek ( ) eindtentamen

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Transcriptie:

STATISTIEK Is STATISTIEK een exacte wetenschap? (Of een verzameling nauwkeurig geformuleerde onnauwkeurigheden) De statistiek is een betrekkelijk jong vakgebied. Voorheen genoten statistici weinig aanzien. Het ordenen van vaak duizenden gegevens in tabellen was een buitengewoon eentonig en arbeidsintensief werk, een noodzakelijk kwaad bij (verzekerings)banken en bevolkingsonderzoek en dergelijke. En zijdelings toch ook bij wetenschappelijke experimenten, zoals het erfelijkheidsonderzoek van de Oostenrijkse monnik Gregor Mendel, halverwege de negentiende eeuw. Deze beschrijvende statistiek of statistische analyse was wat je noemt monnikenwerk. Sinds de opmars van de computer die saai rekenwerk met liefde en grote precisie uitvoert, is dat alles ingrijpend veranderd. Niet alleen het elektronische rekenwerk, maar vooral ook de conclusies die er uit getrokken kunnen worden (de verklarende of inductieve statistiek) hebben de statistiek tot een veelzijdige hulpwetenschap gemaakt. Thans is er nauwelijks meer een vakgebied te vinden waar statistische technieken geen rol spelen. Het vak is geen typisch exact vak, eerder een soort kookboek vol met recepten. Maar toch hebben vooral studenten met weinig feeling voor het exacte (te vinden in de bedrijfskundige, economische, juridische, psychologische en sociaal/communicatieve sectoren) het angstzweet vaak in de handen als ze zich voorbereiden op een tentamen statistiek. We kunnen er niet omheen. In dit boek hoort een hoofdstuk statistiek. De grafische rekenmachine kan het leed aanzienlijk verzachten. Voordat de programmaatjes over het onderwerp worden aangeboden, volgt eerst een kleine samenvatting van de te gebruiken terminologie en formules. De totale verzameling waaruit de waarnemingen (data) gehaald worden noemt men de populatie. De deelverzameling van waarnemingsgetallen is de steekproef (Eng. sample). Beschrijvende statistiek. De waarnemingsgetallen krijgen de letter X, de populatiegrootte de letter N. De Griekse letter m (mu) wordt gebruikt voor het gemiddelde: voor de standaardafwijking en s 2 voor de variantie. Een streep boven de letters geeft aan dat we het gemiddelde ervan bedoelen: s 2 å ( X - m) = = ( X - m) N 2 2 = X 2 - ( X ) 2 N å X i m = i= 1 ; de Griekse letter s (sigma) N De TI-83 heeft o.a. de lijsten L1 t/m L6 beschikbaar voor data. Hebben we maar één lijst met gegevens dan komt die in L1. Je kunt dan de mediaan en de kwartielen uit STAT<CALC>1-Var Stats aflezen en de boxplot tekenen met [2nd]STATPLOT. Wanneer de waarnemingsgetallen al zodanig geordend zijn dat we ook over de frequenties ervan beschikken, zetten we die frequenties meestal in L2. De statistische analyse wordt dan bereikt via 1-Var Stats L1,L2. Vaak zijn er zoveel gegevens, dat men ze in klassen indeelt. Het door Ton van Amsterdam geïnspireerde programma STATKLAS kan daarbij helpen. De broncode ervan laten we weg, die kun je desgewenst met een link-kabeltje downloaden van www.henkshoekje.com. Hier volgt de statistische analyse van gefingeerde examencijfers, ingedeeld in de klassen [1;2> [2;3> enzovoorts. STATISTIEK - 1 -

Verklarende statistiek Voor steekproeven zijn de volgende notaties gebruikt. De grootte van de steekproef is n (of N), het steekproefgemiddelde is þ of m, de standaardafwijking s of S en de variantie: s 2 å ( x - x) = n -1 2 Als n groot is (groter dan 30) kan dit benaderd worden door: Toetsen 2 2 ) å( x - x s = n Het hiernaast staande plaatje illustreert het vuistregeltje, dat 95% van de waarnemingen in het algemeen niet meer dan twee standaarddeviaties afwijkt van het gemiddelde. In het binnengebied staan de "gewone", veel voorkomende waarnemingen. De waarnemingen aan de buitenkant zou men buitenstaanders, of significant afwijkende waarnemingen kunnen noemen. low (van lower) staat voor de ondergrens; up (upper) voor de bovengrens van de gewone waarnemingsgetallen. Bij het toetsen van een hypothese gebeurt er het volgende. Men wil een uitspraak over wat als "gewoon", en wat als significant afwijkend moet worden verstaan. Dergelijke uitspraken kunnen nooit met 100% zekerheid gedaan worden. Men doet ze met een waarschijnlijkheid P. De nulhypothese (H0) geeft aan welke waarnemingen als normaal zullen worden beschouwd; de alternatieve hypothese (H1) geeft de afwijkende waarnemingsgetallen aan. De oppervlakte onder de klokvormige kromme (of: het histogram) is in het getekende plaatje 0.95 (of 95%) van de totale oppervlakte die 1 is (of 100%). Aan beide uiteinden is de overschrijdingskans P=0.025 in zo'n tweezijdige toetsing. In mijn boekenkast staat een prachtig standaardwerk uit 1974 van David Freedman onder de onwaarschijnlijke naam Statistics. Daarin wordt het werk van Gregor Mendel (1822-1884) nader bekeken. Mendels experimenten werden uitgevoerd met de plantjes van een erwtensoort. De zaadjes ervan waren geel of groen en na kruising van de oudergeneraties ontstond een tweede generatie waarin de verdeling geel-groen ongeveer 75%-25% leek te zijn. Mendels levenswerk heeft een grote invloed gehad. Maar de wiskundige Fisher heeft aangetoond dat zijn data naar alle waarschijnlijkheid (een rechter zou zeggen met aan zekerheid grenzende waarschijnlijkheid) mooier gemaakt zijn. STATISTIEK - 2 -

In een van zijn experimenten bijvoorbeeld kreeg Mendel 8023 tweedegeneratie zaadjes waarvan er 2001 groen waren. Dat komt neer op 8023 keer trekken met terugleg uit de verzameling {0,0,0,1} als we 0 gebruiken voor geel en 1 voor groen. De verwachting van het gemiddelde is 8023/4» 2006 en de kans dat een gemeten aantal hier maximaal 5 van afwijkt is normalcdf(2000.5,2011.5,8023*.25,ö(8023*.25*.75))=.113 Dat wil zeggen dat van elke negen experimenten er maar één (ongeveer) zo dicht bij de verwachtingswaarde komt. Dat is nog net niet te mooi om waar te zijn. Maar het probleem met Mendels andere (zeer grote aantallen) experimenten is dat in alle andere gevallen de uitkomsten eveneens "bijna te mooi zijn om waar te zijn". Fisher paste de zogenaamde chi-kwadraat toets toe (daar komen we nog op terug) op het totaal aan waarnemingen van Mendel en vond dat het smalle strookje binnengebied met "normale" uitkomsten zo smal is (4 op de 100 000 oftewel 0.00004) dat men moet constateren dat er geknoeid is met de waarnemingen (onwelgevallige zaadjes werden simpel niet meegeteld). Mendels gedrag is niet uitzonderlijk en zeer vergeeflijk, omdat zijn theorie wel juist was. Maar wees er op bedacht dat nog steeds -onderzoekers zijn ook maar mensen- de wens de vader van de gedachte is. Fisher formuleert het heel mild: There are two possibilities: - either Mendel's data were massaged - or he was pretty lucky The first possibility is easier to believe. HYPOTHESE TOETSEN De binomiale toets Een voorbeeld van rechts toetsen. Men wil onderzoeken of er geknoeid is met een dobbelsteen en doet daartoe een experiment met 600 worpen. De verdenking bestaat dat er vaker dan normaal een zes geworpen wordt. Maar wat is "vaker dan normaal"? Laten we maar eens 600 keer het werpen van een zuivere dobbelsteen simuleren: randint(1,6,600). De nulhypothese H0 geeft het voordeel van de twijfel: p = 1/6; de alternatieve hypothese H1 veronderstelt dat de kans op een zes groter is dan 1/6: p>1/6. We willen een uitspraak doen die voor 95% geloofwaardig is oftewel voor 5% onbetrouwbaar is. Men zegt dat in dat geval de onbetrouwbaarheidsdrempel (of het significantieniveau) a=0.05 is. Als X het aantal zessen is van de 600, moeten we dus zoeken naar uitkomsten X die groter dan een bepaalde grenswaarde zijn. Wat voor conclusie zullen we trekken als van de 600 worpen er bijvoorbeeld 115 keer een zes bovenligt (X=115)? De kans op X³115 wordt genoteerd als P(X³115 N=600, p=1/6) en uit een tabel afgelezen via Y1=1-binomcdf(600,1/6,114). De kans op X³115 is 0.05805 en dus iets groter dan 0.05; met die uitkomst zullen we de nulhypothese nog net accepteren. Uitkomsten ³ 116 echter zullen tot de conclusie leiden dat de nulhypothese verworpen wordt, want: P(X³116)=1-binomcdf(600,1/6,115)=0.04678 ligt net iets onder de onbetrouwbaarheidsdrempel. De verzameling uitkomsten ³ 116 noemt men het Kritieke Gebied; het complement daarvan, de verzameling van uitkomsten 115, noemt men het Betrouwbaarheidsinterval. In het Kritieke Gebied liggen dus alle waarnemingen die tot verwerping van H0 leiden; het betrouwbaarheidsinterval bevat alle waarnemingen waarvoor de H0 geaccepteerd wordt. STATISTIEK - 3 -

Tweezijdig toetsen. Stel dat men niet per se een te groot aantal zessen vermoedt, maar dat men ook rekening wil houden met een extreem (te) laag aantal zessen. Een toets met dezelfde onbetrouwbaarheid a=0.05 moet nu tweezijdig geschieden, men neemt dan links en rechts de halve drempel (½ a), zodat er voor het Kritieke Gebied twee grenswaarden komen, links (L) en rechts (R) met de voorwaarden: P(X³R N=600, p=1/6) < ½a = 0.025 en P(X L N=600, p=1/6) < ½a = 0.025 dus zoeken we naar binomcdf(600,1/6,l)<0.025 en 1-binomcdf(600,1/6,R-1)<0.025 met de oplossingen X 81 en X³119 die weer uit een tabel af te lezen zijn. Het volgende programma geeft dezelfde uitkomsten. Gelukkig maar. Toetsen met de Normale Verdeling Neem het vorige voorbeeld, de tweezijdige toetsing. Echter gaan we ditmaal een normale benadering geven. Dat doen we om de antwoorden te vergelijken, niet omdat de normale benadering in dit geval nodig zou zijn. Het gaat er dus om uit te zoeken wat het Kritieke Gebied is in het geval: H0: p=1/6 H1: p¹1/6 N=600 a=0.05 Voor de normale benadering moet dit omgezet worden in m =Np=100 en s =Önpq=9.1287 Voor welk aantal zessen zullen we de nulhypothese tweezijdig verwerpen? Het antwoord volgt uit: X - 100 X - 100 invnorm(0.025)= -1.95996 dus = -1. 95996 geeft X=82.1 en = 1. 95996 9.1287 9.1287 geeft X=117.9 Rekening houdend met de continuïteitscorrectie voor zulke discrete verdelingen bevat het Kritieke Gebied dus alle uitkomsten X³119 en X 81. Een opmerking. Je kunt bij de bepaling van het Kritieke Gebied beter spreken van een discreetheidscorrectie: rechts 0.5 erbij en afronden naar boven; links 0.5 eraf en afronden naar beneden. De rekenmachines met een ingebouwde binomiale tabel hebben de continuïteitscorrectie eigenlijk overbodig gemaakt. Bij de TI-83 kun je voor grote waarden van N ongecorrigeerd de binomiale kansen aflezen en is de Normale Benadering niet nodig. Boven de 1000 is een continuïteitscorrectie ook zinloos. Een half staafje meer of minder op de 1000 mist men niet bij statistische overwegingen. De continuïteitscorrectie behoort dus tot de historie, in de eenentwintigste eeuw. STATISTIEK - 4 -

Correlatieberekeningen We bekijken het eventuele verband tussen de rapportcijfers wiskunde en natuurkunde van een groepje van zeven leerlingen. De wiskundecijfers staan in L1, de natuurkundecijfers in L2. Vooraf stellen we het scherm in op rapportcijfers, want er komt een grafiekje bij. Conclusie. De natuurkundecijfers zijn (licht significant, p=0.9) gemiddeld 0,5 punt hoger. Er is een matige correlatie (r=0.56) tussen de cijfers. Als je een voorspelling zou willen doen (maar daar is het groepje natuurlijk veel te klein voor) kun je het natuurkundecijfer N uit het wiskundecijfer W afleiden met de formule N = 0.7W+2.3 Een 6 voor wiskunde zou dan een 0.7 6+2.3 = 6.5 voor natuurkunde moeten opleveren. Een laatste opmerking. In plaats van de normale verdeling wordt de t-verdeling DISTR <tcdf> gebruikt bij kleine steekproeven (N<30) uit een populatie met onbekende standaarddeviatie. De chi-kwadraat test Waarnemingsgetallen X schommelen rond hun verwachtingswaarde ü. De variantie is een maat voor de spreiding van waarnemingen rond hun gemiddelde, zoals de definitie van s 2 aangeeft. Wil men toetsen of de waarnemingen min of meer normaal volgens de verwachting zijn gespreid, dan kan men de chi-kwadraat toets hanteren. De Griekse letter c spreekt men uit als "chi"; de definitie van c 2 is te vergelijken met die van s 2 : STATISTIEK - 5 -

2 2 2 å( X - x) å( O - E) c = = (O = Observed, E = Expected) x E De (theoretische) verwachtingswaarden E (of ü) doen we meestal in L2, de waarnemingen in L1. De c 2 -test gebruikt men om te kijken of de waarnemingen op een geloofwaardige manier afwijken van de verwachting. Waarnemingen die te dicht op hun verwachtingswaarde zitten zijn te "mooi", waarnemingen die extreem veel afwijken van hun verwachting hebben misschien een verkeerde verwachting gehad. De c 2 -test vind men op de TI-83 onder de menuknop STAT<TESTS>; de c 2 verdelingsfunctie staat onder de knop DISTR. Bij deze verdeling wordt meestal gekeken naar de "oppervlakte rechts van", en dat levert dan de kans op extreme uitkomsten (de P-waarde). Het aantal vrijheidsgraden (df = degrees of freedom) van c 2 is 1 minder dan de grootte van de steekproef: df = n - 1. De gemiddelde verwachtingswaarde van c 2 is, in normale gevallen, gelijk aan df. In het volgende programma zijn bij de eerste menukeuze drie gevallen van frequenties na 600 dobbelsteenworpen bedacht. De verwachte frequentie is dan 100 en df = 6-1 = 5. Bij het eerste gedachtenexperiment liggen de frequenties erg dicht bij 100. De berekende c 2 is dan ook erg veel lager dan df en de P-waarde 0.9986 duidt erop dat de verwachte afwijkingen veel en veel groter zijn. Conclusie: de frequenties zijn te mooi om geloofwaardig te zijn. Het tweede gedachtenexperiment is random gemaakt en verloopt dus min of meer normaal. Het derde experiment vertoont zeer grote schommelingen. De kans op zo'n uitkomst is minder dan 5% (P=0.0498). Er is waarschijnlijk iets mis met de dobbelsteen. Bij de tweede menukeuze zijn de verwachte uitkomsten in L2 niet allemaal gelijk, zoals in het vorige experiment. De gefingeerde waarnemingen in L1 wijken er in het eerste geval helemaal niet van af (gevolg: P=1) en in het derde geval veel te veel van af (P=0.0007). Merk op dat in het laatste geval alle waarnemingen 3 hoger liggen dan de verwachting; je zou kunnen veronderstellen dat de verwachting 3 punten te laag was. Het tweede geval ligt zo'n beetje tussen de andere twee in (zie pag 12). STATISTIEK - 6 -

OPGAVE 1. Bij een experiment naar het voorkomen van series nullen en enen, leverde een simulatie van 512 worpen met een muntje de hiernaast weergegeven series op. Serielengte 1 kwam 141 keer voor, enzovoorts. Serielengte 8 kwam 1 keer voor; neem dus L2(8)=1. De verwachtingen (in L3) waren 512 (½) L+1. Onderzoek of deze verwachtingswaarden kloppen met de simulaties. Zijn de afwijkingen een beetje "normaal" gespreid? STATISTIEK - 7 -

Toetsen en schatten: dertien voorbeelden 1 en 2. BINTGEMZ en TESTGEMZ Uitspraken met z-waarden: Zinterval en Z-test Uit een representatief onderzoek onder een groot aantal directiesecretaressen in Nederland blijkt het gemiddeld maandsalaris 2340 te zijn met een standaarddeviatie van 120. 1) Bepaal het 95% z-betrouwbaarheidsinterval 2a) Bij een groot verzekeringsbedrijf werken 30 directiesecretaressen met een gemiddeld maandloon van 2300. Moeten we dat als een significant lager gemiddeld maandloon beschouwen? (a=0.05) 2b) Een van de secretaresses van dat bedrijf verdient per maand 2600. De personeelschef vindt dat zij extreem veel meer dan het landelijk gemiddelde van 2340 verdient. De secretaresse is dat niet met hem eens en toetst zijn bewering met een onbetrouwbaarheidsdrempel van 0.01. Ga na wie gelijk krijgt. BINTGEMZ Input "GEM.Ë=",G Input "STDEV=",S Input "AANTL n=",n Input "BETRBH B=?",B If B>1:.01BüB :ZInterval S,G,N,B TESTGEMZ Disp "INVOER POPLATIE:" Input "GEM. MU0=",M Disp "INVOER STEEKPR:" Input "GEMIDD Ë=",G Input "STDEV Sx=",S Input "AANTAL n=",n Menu("TOETS ALTERN H1:","LINKS MU<MU0",M1,"RECHTS MU>MU0",M2,"2úZYDIG MUøMU0",M3) Lbl M1 ú1ük:goto U Lbl M2 1üK:Goto U Lbl M3 0üK Lbl U Z-Test(M,S,G,N,K,0) STATISTIEK - 8 -

1) Invoer: 95%-Betrbh Interval: 2a) 2b) OPGAVE 2. Een machine produceert schroefjes met een gemiddelde lengte van 35,00 mm en een standaarddeviatie van 0,10 mm. Elke dag neem men een steekproef van 40 schroefjes om te controleren of de machine bijgesteld moet worden. a) Geef het 99%-Betrouwbaarheidsinterval van het gemiddelde van zo'n steekproef. b) Hoe groot is de kans dat het gemiddelde groter dan 35,03 mm is? STATISTIEK - 9 -

3 en 4. BINTGEMT en TESTGEMT Uitspraken met t-waarden: Tinterval en T-test t-waarden gebruikt men (in plaats van z-waarden) bij kleine steekproeven (n 30), als de standaarddeviatie van de populatie onbekend is. Landelijk onderzoek wees uit dat peuters op hun derde verjaardag gemiddeld 95 cm lang zijn. Een kinderarts denk dat dit een verouderd gegeven is. Hij meet de lengte van 23 peuters en vindt een gemiddelde van 98 cm met een standaarddeviatie van 6 cm. 3) Bepaal het 95%-Betrouwbaarheidsinterval rond 98 cm 4) Is de conclusie gerechtvaardigd dat de huidige driejarige peuters gemiddeld langer zijn dan 95 cm? Toetsen met a = 0.01. BINTGEMT Disp "INVOER POPLATIE:" Disp "INVOER STEEKPR:" Input "GEMIDD Ë=",G Input "SD Sx=",S Input "AANTAL n=",n Input "BETRBH B=",B If B>1:.01BüB :TInterval G,S,N,B TESTGEMT :Disp "INVOER POPLATIE:" Input "GEM. MU0=",M Disp "INVOER STEEKPR:" Input "GEMIDD Ë=",G Input "STDEV Sx=",S Input "AANTAL n=",n Input "ALFA =",A Menu("TOETS ALTERN H1:","LINKS Ë<MU0",M1,"RECHTS Ë>MU0",M2,"2úZYDIG ËøMU0",M3) Lbl M1 ú1ük:goto U Lbl M2 1üK:Goto U Lbl M3 0üK:.5AüA Lbl U :T-Test (M,G,S,N,K,0) STATISTIEK - 10 -

3) 4) OPGAVE 3. Dr. Jansen heeft de bovenwaarde van de bloeddruk gemeten van enkele van zijn manlijke patiënten (ouder dan 60 jaar). De data zijn: 140 160 160 130 135 175 170 190 150 155 160 170 a) Laat zien, bijv met STAT CALC 1-VarStats, dat ü=158 en s=17. b) Geef het 95%-Betrouwbaarheidsinterval rond ü. c) Is de gemiddelde bloeddruk van deze patiënten essentieel lager dan het landelijk gemiddelde voor oudere mensen (m=165)? STATISTIEK - 11 -

5 en 6. BINT1PRO en TEST1PRO Uitspraken over proporties (percentages): 1-PropZInt en 1-PropZTest 5) Na een telefonische enquête onder 1060 personen bleken 321 daarvan een e-mail adres te hebben. Maak een schatting van het landelijk percentage e-mail bezitters met het daarbij behorende 95%- Betrouwbaarheidsinterval. 6) Vorig jaar voelde 36% van de mensen zich onveilig op straat. Uit een telefonische enquête dit jaar onder 400 personen blijkt dat 132 daarvan zich onveilig voelen op straat. Toets de hypothese dat de mensen zich nu veiliger voelen op straat dan vorig jaar, met een onbetrouwbaarheidsdrempel van 0.01. BINT1PRO Disp "AANTAL SUCCES=X" Input "X=?",X:round(X,0)üX Disp "GROOTTE STKPR=N" Input "N=?",N Input "BETRBH B=?",B If B>1:.01BüB 1-PropZInt(X,N,B) TEST1PRO Disp "INVOER POPLATIE:" Disp "VERWACHTE" Input "FRACTIE p0=",p Disp "INVOER STEEKPR:" Input "SUCCSSN X=",X Input "AANTAL n=",n Input "ALFA =",A Menu("TOETS ALTERN H1:","LINKS P<p0",M1,"RECHTS P>p0",M2,"2úZYDIG Pøp0",M3) Lbl M1 ú1ük:goto U Lbl M2 1üK:Goto U Lbl M3 0üK:.5AüA Lbl U 1-PropZTest(P,X,N,K,0) STATISTIEK - 12 -

5) 6) OPGAVE 4. In een enquête onder 743 personen verklaarde 22.48% hiervan, niet te gaan stemmen; 21% verklaarde op de PvhGG (Partij van het Grote Geld) te gaan stemmen. Tussen welke grenzen zal, met een waarschijnlijkheid van 95%, het werkelijke percentage stemmers op die partij uitkomen? STATISTIEK - 13 -

7 en 8. BINT2GMZ en TEST2GMZ Uitspraken over het verschil van gemiddelden: 2-SampZInt en 2-SampZTest 7) Blijkens een onderzoek onder 320 radiologen en 410 neurologen blijkt hun gemiddelde jaarsalaris respectievelijk 230 000 (s = 25 000) en 225 000 (s = 30 000) te zijn. Geef het 95%-Betrouwbaarheidsinterval rond het gemiddeld verschil in jaarsalaris. 8) Zie de vorige gegevens. Bereken de standaarddeviatie van het verschil en toets de bewering dat radiologen sterk significant (a = 0.01) meer verdienen dan neurologen. BINT2GMZ :Disp "INVOER:" Input "SD1=",S Input "SD2=",T Disp "STEEKPROEF:" Input "GEM Ë1=",G Input "AANTL n1=",n Input "GEM Ë =",H Input "AANTL n =",M Input "BETRBH B=",B If B>1:.01BüB 2-SampZInt(S,T,G,N,H,M,B) TEST2GMZ :Disp "INVOER:" Input "SD1=",S Input "SD2=",T Disp "STEEKPROEF:" Input "GEM. Ë1=",G Input "AANTL n1=",n Input "GEM. Ë =",H Input "AANTL n =",M Input "ALFA =",A Menu("TOETS ALTERN H1:","LINKS MU1øMU2",M3) MU1<MU2",M1,"RECHTS MU1>MU2",M2,"2ZYDIG Lbl M1 ú1ük:goto U Lbl M2 1üK:Goto U Lbl M3 0üK:.5AüA STATISTIEK - 14 -

Lbl U 2-SampZTest(S,T,G,N,H,M,K,0) ð(sü/n1+tü/n )üu:round(u,3)üu Output(1,1,"z="):Output(1,3,round(z,5)) Output(2,1,"p="):Output(2,3,round(p,5)) Output(3,1,"SD="):Output(3,4,U) Output(5,1,"CONCLUSIE:") If p<a Then Output(6,1,"SIGNIFICANT") Output(7,1,"WANT p<") Output(7,8,A) Else Output(6,1,"NIET SIGNIFICANT") Output(7,1,"WANT pù") Output(7,8,A) End Pause 7) 8) OPGAVE 5. Op school A (met 125 kandidaten) lag het gemiddeld examencijfer VWO op 6.4 (de standaarddeviatie was 2.0); op school B scoorden de 83 examenkandidaten gemiddeld 6.8 (standaarddeviatie 1.4). a) Bereken de standaarddeviatie van het verschil in de gemiddelden. b) De rector van school B verklaart snoevend, dat zijn leerlingen beter zijn dan die van school A. Hoe groot is de kans dat dit hogere gemiddelde op statistisch toeval berust? Geef je de rector van school B gelijk (a=0.05)? STATISTIEK - 15 -

9 en 10. BINT2GMT en TEST2GMT Uitspraken over het verschil van gemiddelden: 2-SampTInt en 2-SampTTest bij kleine steekproeven (n 30). Bij kleine steekproeven gebruikt men de t-verdeling. Een wiskundeleraar heeft van zijn twee examenklassen de eindcijfers geanalyseerd. Groep 1 heeft: gem. ü1=6.7; s.d. s1=0.55 en aantal n1=20 Groep 2 heeft: gem. ü2=6.4; s.d. s2=0.45 en aantal n2=14 9) Bepaal het 95%-Betrouwbaarheidsinterval rond het verschil ü1-ü2 10) Ga na of groep 1 gemiddeld significant (a=0.05) hoger scoorde dan groep 2. BINT2GMT : Disp "INVOER STEEKPR:" Input "GEM Ë1=",G Input "SD Sx =",S Input "AANTL n1=",n Input "GEM Ë =",H Input "SD Sx =",T Input "AANTL n =",M Input "BETRBH B=",B If B>1:.01BüC 2-SampTInt G,S,N,H,T,M,B,1 TEST2GMT Disp "INVOER STEEKPRF:" Input "GEM Ë1=",G Input "SD Sx =",S Input "AANTL n1=",n Input "GEM Ë =",H Input "SD Sx =",T Input "AANTL n =",M Input "ALFA =",A Menu("TOETS ALTERN H1:", "LINKS MU1øMU2",M3) Lbl M1:ú1üK:Goto U Lbl M2:1üK:Goto U Lbl M3:0üK:.5AüA Lbl U 2-SampTTest G,S,N,H,T,M,K,1,0 MU1<MU2",M1,"RECHTS MU1>MU2",M2,"2ZYDIG STATISTIEK - 16 -

9) 10) OPGAVE 6. Een bedrijf vergelijkt de levensduur van twee soorten lampen. In uren: A: 1213 1285 1103 1199 1325 1255 B: 1188 1180 1225 1169 1195 1225 1198 1196 De vraag is, of de gemiddelde levensduur van lamp B korter is. Neem a=0.05 Opmerking: bij zulke kleine steekproeven kun je beter s x dan s x nemen. STATISTIEK - 17 -

11 en 12. BINT2PRO en TEST2PRO Uitspraken over het verschil van proporties: 2-PropZInt en 2-PropZTest Een onderzoek onder 1200 vrouwen en 900 mannen leerde dat 77% van de vrouwen en 73% van de mannen zegt, regelmatig een horoscoop te lezen. 11) Bepaal het 95%-Betrouwbaarheidsinterval t.a.v. het verschil in proporties 12) Test met een significantieniveau van 2% of vrouwen gemiddeld vaker een horoscoop lezen dan mannen. BINT2PRO Disp "AANTL SUCCESSEN:" Input "x =?",X Input "x =?",Y Disp "GROOTTE STKPRN:" Input "n1=?",n Input "n =?",M Input "BETRBH B=?",B If B>1:.01BüB 2-PropZInt(X,N,Y,M,B) TEST2PRO Disp "INVOER SUCCESSN:" Input "x =?",X Input "x =?",Y Disp "INVOER STEEKPRN:" Input "n1=?",n Input "n =?",M Input "ALFA=?",A If K=0:.5AüA 2-PropZTest(X,N,Y,M,K,0) Output(1,1,"z=") Output(1,3,round(z,5)) Output(2,1,"p=") Output(2,3,round(p,5)) Output(4,1,"CONCLUSIE:") If p<a Then Output(5,1,"SIGNIFICANT") Output(6,1,"WANT p<") Output(6,8,A) Else Output(5,1,"NIET SIGNIFICANT") Output(6,1,"WANT pù") Output(6,8,A) End Pause STATISTIEK - 18 -

11) 12) OPGAVE 7. In 2002 wees een onderzoek onder 1506 scholieren uit dat 13% daarvan zich wel eens onveilig voelde op school. In 2003 was dat percentage gestegen naar 16%, in een onderzoek onder 977 scholieren. Toets met a=0.02 of deze stijging significant is. STATISTIEK - 19 -

Variantie analyse 13. TSTANOVA Variantie analyse gaat via: STAT<TESTS> ANOVA(L1,L2,L3,.) Bij variantie analyse gaat het om verschillende groepen waarnemingsgetallen. De variaties (varianties) tussen de groepen worden daarbij vergeleken met de varianties binnen de verschillende groepen. De toetsingsgrootheid is F, de verhouding tussen deze twee varianties. De data moeten vooraf in de lijsten L1 t/m L6 worden gezet. Als F groot is, zijn de verschillen tussen de groepen groot. Is F klein dan zijn de verschillen in gemiddelde tussen de groepen minder duidelijk. TSTANOVA Disp "ZIJN DE" Disp "GEGEVENSLIJSTEN" Disp "IN L1,L,Lƒ,..." Disp "INGEVOERD?" Disp "":Disp "":Disp "" Input "1=JA 2=NEE ",I If Iø1:Goto Z Menu(" AANTAL LIJSTEN"," - ",Z," 2",2," 3",3," 4",4," 5",5," 6",6) Lbl 2::ANOVA(L1,L ):Goto 8 Lbl 3::ANOVA(L1,L,Lƒ):Goto 8 Lbl 4::ANOVA(L1,L,Lƒ,L ):Goto 8 Lbl 5::ANOVA(L1,L,Lƒ,L,L ):Goto 8 Lbl 6::ANOVA(L1,L,Lƒ,L,L,L ) Lbl 8 Output(2,1,"ã=--------------") Output(1,3,"TUSNNVARIANTIE") Output(3,3,"BINNNVARIANTIE") Output(5,6,"= ---------") Output(4,8,"FACTOR MS") Output(6,8,"ERROR MS") Output(7,1,"ã=") Output(7,3,round(ã,2)) Output(8,1,"p=") Output(8,3,round(p,4)) Pause Lbl Z Output(1,1,"DOE STAT TESTS:") Output(2,1,"ANOVA(L1,L,...)" Disp "":Disp "" STATISTIEK - 20 -

OPGAVE 8. Een bank wil in vier filialen de productiviteit van de baliemedewerkers toetsen. Als maat voor die productiviteit wordt het per uur behandelde aantal klanten genoteerd, door de vijf of zes medewerkers ter plaatse: filiaal A filiaal B filiaal C filiaal D 19 14 11 24 21 16 14 19 26 14 21 21 24 13 13 26 18 17 16 20 13 18 Toets, op een 5% significantieniveau, de nulhypothese dat het gemiddeld aantal per uur behandelde klanten in alle vier de filialen even groot is. Neem aan dat aan alle voorwaarden voor een variantie analyse is voldaan. ANTWOORDEN 1. c 2 klopt ongeveer met de verwachting. Een P-waarde van 0.77 duidt op een een geloofwaardige voorspelling (verwachting) van serielengtes. 2. a) [34.96; 35.04] b) p=0.029 z=1.897 3. a) ü=157.917 Sx=17.38 b) Gebruik t-waarden voor kleine steekproeven [147.2; 168.8] c) z=-1.426 p=0.09 niet significant (voor a=0.05) 4. tussen 17.7% en 24.3% 5. a) SD=0.236 b) p=0.045<0.05 significant; rector krijgt gelijk 6. p=0.13254>0.05 niet significant 7. p=0.0197<0.02 significant 8. De productiviteit is sterk significant (p=0.0005) verschillend in de filialen. F=9.69: de variantie tussen de filialen is (veel) groter dan de variantie erbinnen. STATISTIEK - 21 -