Statistiek = leuk + zinvol

Vergelijkbare documenten
Toetsen van Hypothesen. Het vaststellen van de hypothese

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Hoofdstuk 5 Een populatie: parametrische toetsen

Lesbrief hypothesetoetsen

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Exact Periode 6.1. Juist & Precies Testen

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Kansrekening en Statistiek

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Les 1: Waarschijnlijkheidrekening

Kansrekening en Statistiek

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Voorbeeldtentamen Statistiek voor Psychologie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 1

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Hoofdstuk 6 Hypothesen toetsen

Kansrekening en Statistiek

15.1 Beslissen op grond van een steekproef [1]

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Combinatoriek en rekenregels

Data analyse Inleiding statistiek

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Kansrekening en Statistiek

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Les 7-8: Parameter- en Vergelijkingstoetsen

Hoofdstuk 3 Toetsen uitwerkingen

Kansrekening en Statistiek

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Sheets K&S voor INF HC 10: Hoofdstuk 12

Kansrekenen en statistiek. Daniël Slenders Faculteit Ingenieurswetenschappen Katholieke Universiteit Leuven

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Hoofdstuk 12: Eenweg ANOVA

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Statistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2

Kansrekening en Statistiek

c P( X 1249 of X 1751 µ = 1500 en σ = 100) = 1 P(1249 X 1751)

Statistiek ( ) eindtentamen

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6

Hoofdstuk 10: Regressie

college 4: Kansrekening

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

TI83-werkblad. Vergelijkingen bij de normale verdeling

Exact Periode Juist & Precies Testen

TECHNISCHE UNIVERSITEIT EINDHOVEN

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Examen Statistiek I Januari 2010 Feedback

. Dan geldt P(B) = a d. 3 8

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Kansrekening en Statistiek

Beschrijvend statistiek

Uitwerkingen voortoets/oefentoets E3 maart/april 2009 MLN

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Examen Kansrekening en Wiskundige Statistiek: oplossingen

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Examen G0N34 Statistiek

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

wiskunde A vwo 2015-II

Toegepaste Statistiek, Week 3 1

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Introductie periode 2b. Onderdeel Foutenleer 1

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Statistiek voor A.I.

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Oefenvragen bij Statistics for Business and Economics van Newbold

Beschrijvende statistiek

Tentamen Inleiding Kansrekening wi juni 2010, uur

Les 1: Waarschijnlijkheidrekening

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Toetsen van hypothesen

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

Transcriptie:

Statistiek = leuk + zinvol Doel 1: Doel : Doel 3: zie titel een statistisch onderzoek kunnen beoordelen een statistisch onderzoek kunnen opzetten een probleem vertalen in standaardmethoden gegevens verzamelen, verwerken via de standaardmethode en de oplossing verkopen Toekomst: gevoeligheid voor parameters bepalen (variantie-analyse) minder proeven doen en/of meer gegevens uit proeven halen (proefopzet) Bij elke les is de lesstof aangegeven, de doelstelling van de les en de opgaven die gemaakt kunnen worden als oefening van de lesstof (opgaven tussen haakjes zijn meer van hetzelfde). modulewijzer van stab Les 1: kansrekening De kans op een gekombineerde gebeurtenis is het produkt van de kansen op de afzonderlijke gebeurtenissen mits de gebeurtenissen onafhankelijk zijn. Hoofdstuk 3: permutaties: paragraaf 1 rekenen met kansen: paragraaf Hoofdstuk 3: A: M1-3, M8-1 B: 14, 13, 1, 1 Het bepalen van het aantal groepen gaat eenvoudiger met onderstaand algoritme. Dit schema is niet volledig, maar dekt wel de bovenstaande lesstof. # groepen bepalen n = grootte van de verzameling er staan k elementen achter elkaar in een groep staat elk element maximaal 1 keer in een groep? JA is de volgorde van belang? NEE # groepen na teruglegging = n^k de volgorde is wel van belang (AB <> BA) JA (AB <> BA) worden alle elementen precies 1 keer gebruikt? NEE (AB = BA) # kombinaties = n!/(k!(n-k)!) JA # permutaties = n! NEE # variaties = n!/(n-k)! De wet van Bayes wordt hier heel summier en in een bijzondere situatie behandeld (onafhankelijke kansen). Aan het eind van sta3b, wanneer de kennis van statistiek op een hoger nivo ligt, zal de wet van Bayes uitgebreider worden behandeld. Ook zal dan duidelijk gemaakt worden waarom deze wet belangrijk is. modulewijzer stab.doc versie 1-01-00 bladzijde 1

Les : kansen binnen een normaalverdeling Een schets maken van het probleem kans normaalverdeling (µ, σ). Een kans berekenen uit een normaalverdeling en omgekeerd. paragraaf 1 en A: M1-9 B: 1, 8, 7, 6, 17, 19 Les 3: rekenen met normaalverdelingen Gegeven de normaalverdeling van 1 meting, het bepalen van de normaalverdeling van: de som van een aantal metingen het gemiddelde van een aantal metingen het verschil van onafhankelijke metingen paragrafen 3, 4 en paragrafen 1, en A: M10-1 B: 14, 1, A: M, M, M8 B: 1, 3-6, 11 Een samenvatting maakt het kiezen van een methode eenvoudiger (zie doel): i som: E(x som ) = ( ) E µ som = n µ i x i Var(x som ) = ( ) gemiddelde: E( x ) = µ x = µ verschil: Var( x ) = σ /n v = x - y E(v) = µ x - µ y Var(v) = σ + x σ y Var σ som = σ n x i σ x = σ n Les 4: Schatten Gegeven een aantal meetwaarden een betrouwbaarheidsinterval van µ bepalen. Gegeven een betrouwbaarheidsinterval de steekproefomvang bepalen. modulewijzer stab.doc versie 1-01-00 bladzijde

paragrafen 7 en 8 A: M1, M4, M9-1 B:, 17, 18, 19 Les : Toetsen Een hypothese formuleren uit een onderzoeksvraag, toetsen en een konklusie in begrijpelijk Nederlands formuleren. Hoofdstuk 9: paragraaf 1 (niet 9.1., van voorbeeld 9.1 alleen c), paragraaf (van de voorbeelden alleen 9.6) paragraaf 4 pas als je paragraaf 1.3 begrijpt paragraaf (niet voorbeeld 9.13) paragraaf plus wordt niet in deze periode getentamineerd, maar is wel nodig voor de volgende periode Hoofdstuk 9: A: M B: -4, 6-8, 11-14, 16, 18,, 3 Bij het opstellen van de nulhypothese van een eenzijdig toetsingsprobleem wordt vaak van het =-teken gebruik gemaakt. Bijvoorbeeld moet getoetst worden of pakken melk minimaal 1 liter bevatten: H 0 : µ = 1 liter H 1 : µ < 1 liter Dit vind is een onduidelijke formulering. Veel beter is: H 0 : µ > 1 liter H 1 : µ < 1 liter De eerste formulering wordt veel gebruikt door statistici (zoals Buijs in de uitwerkingen). Het verdient de voorkeur om de laatste formulering te gebruiken. Beide worden overigens goedgekeurd op het tentamen. Er zijn 3 methoden om een toetsingsprobleem op te lossen: met een kritiek gebied (paragraaf 1.3) met een overschrijdingskans (paragraaf 3., voorbeelden 9.8 en 9.9) met een kritieke waarde (paragraaf 3. voorbeeld 9.10 en paragraaf 4) De eerste methode is goed te kombineren met een schets van de situatie, waardoor er een goed overzicht is van het probleem. Het verdient de voorkeur om ook de t-toets met deze methode uit te voeren. De laatste methode wordt door veel technici gebruikt, zeker voor de t-toets, maar dat is dan ook het enige voordeel. Het is een echte truukjes-methode die tot veel fouten en weinig inzicht leidt en daarom beter niet gebruikt kan worden. Bij de tweede methode krijg je ook geen goed overzicht van het probleem, maar het is een methode die statistische computerpakketten veelal gebruike. Het lijkt me verstandig om deze methode pas te bestuderen las je zo n statistisch pakket gebruikt. Gebruik dus een schets met een kritiek gebied! De konklusie moet in normaal Nederlands worden gegeven. Kreten als H 0 wordt verworpen en µ > 1 liter worden niet goedgekeurd. Een goede formulering voor het aksepteren van H 0 is bijvoorbeeld: met meer dan 9% zekerheid is de hoeveelheid melk in de pakken meer dan 1 liter. In de uitwerkingen van Buijs is deze formulering meestal van de vorm waarschijnlijk zit er meer dan 1 liter melk in de pakken, maar je weet de betrouwbaarheid ook, dus meldt die ook. Een goede formulering voor het niet-verwerpen van H 0 (het grijze gebied tussen verwerpen en aksepteren) is: op grond van dit onderzoek kan er geen uitspraak over gedaan worden of er minimaal 1 liter melk in de pakken zit. modulewijzer stab.doc versie 1-01-00 bladzijde 3

Nu is er duidelijk dat dit onderzoek geen uitsluitsel geeft. Uiteraard mag je een eigen formulering geven, het gaat om de boodschap. Toetsing stab Het tentamen is van het type open boek, je mag meenemen wat je wil (op kommunikatiemiddelen na - zie examenreglement). Proeftentamen Denk aan de schetsen! 1. Bij een borstkankeronderzoek is de kans op een positieve uitslag (wellicht ziek) bij een gezonde patient gelijk aan 18%. Dit heet een fout van de tweede soort. Hoe groot is de kans dat verschillende patienten een positieve uitslag krijgen?. Op een lab werken laboranten. Van een bepaalde test bestaan varianten (verschillende meetmethoden). Op een dag komen er 3 monsters binnen op het lab. Er bestaat een vermoeden dat zowel de laborant als de meetmethode invloed heeft op het meetresultaat. Hoeveel metingen moeten er worden gedaan als alle laboranten beide meetmethoden toepassen op alle monsters? 3. Schroeven moeten een lengte hebben van 4 cm. Stel een hypothese op (H 0 en H 1 ) waarmee dit getoetst kan worden. 4. Een pak melk moet 1 liter melk bevatten. a. De fabrikant is er bij gebaat om zo weinig mogelijk melk in de pakken te doen. Stel een toetshypothese op waarmee de fabrikant kan aantonen dat er niet minder dan 1 liter melk in de pakken zit. b. De konsument is er bij gebaat dat er zo veel mogelijk melk in de pakken zit. Stel een toetshypothese op waarmee een konsumentenorganisatie kan aantonen of er voldoende melk in de pakken zit.. De massa van appels is normaal verdeeld met µ = 100 g en σ = 0 g. Willekeurig worden appels in zakken van 10 stuks gedaan (kilozakken) en verkocht voor ƒ,0. a. Hoe groot is de kans dat een zak minder dan 90 g weegt? b. Hoe kan het probleem opgelost worden dat een groot deel van de klanten nu te veel dan wel te weinig betaalt? 6. Een jamfabrikant heeft een vulapparaat dat jam in lege potten deponeert. De potten jam worden verkocht met de mededeling dat er 00 ml jam in zit. De hoeveelheid jam in de pot is niet altijd gelijk als gevolg van variaties in de viskositeit van de jam (een natuurprodukt). De hoeveelheid jam is normaal verdeeld met een gemiddelde van µ = 0 ml en een standaarddeviatie van σ = ml. Ook de potten zijn niet altijd even groot, het volume is normaal verdeeld met een gemiddelde van µ = 10 ml en een standaarddeviatie van σ = 1 ml. a. Toets of er gemiddeld voldoende jam in de potten zit (α = %) b. Hoe groot is de kans dat de jam niet in de potten past? c. Eigenlijk moet er een leeg volume in de pot zijn van ml omdat de dop er anders nooit meer af wil. Hoe groot is de kans dat er een leeg volume van minder dan ml in de pot is? d. Geef een - bij voorkeur snelle en goedkope - oplossing van dit probleem. 7. In een laboratorium wordt het zuurgetal (fraktie ph, ph = 14 geeft waarde 1) van een verf gemeten met behulp van een (IR) spektrofotometer. Dit is een indirekte meting, waarbij uit de koncentratie van een aantal komponenten (te meten met de IR) wordt berekend wat het zuurgetal is. Van één van de monsters worden opeenvolgende metingen uitgevoerd met dezelfde meetcel. De volgende waarden worden gevonden: 0,38 0,40 0,4 0,39 0,40 a. Geef het 9%-betrouwbaarheidsinterval voor het werkelijke gemiddelde µ van het zuurgetal b. Het zuurgetal moet volgens de keuring gelijk zijn aan 0,41. Toets of het monster goedgekeurd moet worden (zuurgetal gelijk aan 0,41 met 9% betrouwbaarheid). modulewijzer stab.doc versie 1-01-00 bladzijde 4

c. Hoe groot is in het bovenstaande geval de kans dat een monster ten onrechte wordt goedgekeurd? Uit een omvangrijk onderzoek is gebleken, dat voor de keuring van een zuurgetal met een waarde van ongeveer 0, geldt dat de standaarddeviatie (van een enkele meting) gelijk is aan 0,0. Het is de bedoeling dat het zuurgetal in 9% van de gevallen binnen een grens van ±0,01 bepaald wordt. d. Hoeveel metingen moeten er in dat geval per monster gedaan worden? Uitwerking proeftentamen 1. De gebeurtenissen zijn onafhankelijk: 0,18 0,18 = 3%. 3 = 30 metingen 3. H 0 : µ = 4 cm en H 1 : µ 4 cm 4a. H 0 : µ < 1 liter en H 1 : µ > 1 liter 4b. H 0 : µ > 1 liter en H 1 : µ < 1 liter a. µ = 100 = 1000 g σ = 0 = 44,7 g z = (90-1000)/44,7 = -1,1 z = 1,1 geeft een kans van 13%. b. Weeg de zakken en verkoop ze voor ƒ,0 per kilo in plaats van per zak 6a. α = % geeft z = 1,6 zodat g r = 00+1,6 = 0,3 ml. aangezien µ = 0 > 0,3 ml zit er in meer dan 9% van de gevallen genoeg jam in de pot. 6b. v = volume lucht in de pot = volume pot - volume jam µ v = 10-0 = ml σ v = + 1 =,4 ml z = (0-)/,4 = -,4 z =,4 geeft een kans van 1% 6c. 0%. Dat kan je berekenen, maar je ziet het ook zo. 6d. Uiteraard kan je grotere potten nemen (redelijk goedkoop en snel) of een betere volmachine aanschaffen (duur en langzaam). Een andere optie is om minder jam in de potten te doen. Uit a blijkt dat er nog marge is. Als er gemiddeld 0,3 ml (rond af op 03 ml) jam in de potten wordt gestopt, dan voldoe je nog steeds aan de eis bij a. In dat geval wordt µ v = 7 ml. Bij c wordt het antwoord dan z = (7-)/,4 = 0,89 en dit geeft een kans van 19%. Dat is nog geen oplossing van alle problemen, maar wel goedkoop en snel. 7 7a. x = 0,398 en s = 0,01. n = en α = % zodat t =,776. 0,38 µ 0,4.,776 0,01,776 0,01 0,398 µ 0,398 + 0,41 7b. 0,41 zit in het grijze tussengebied, zodat de officiele konklusie luidt: op grond van dit onderzoek kan niet worden gezegd of het 0,380 0,398 0,416 monster afgekeurd moet worden. Uiteraard houdt dit in de praktijk in dat het monster goedgekeurd is. 7c. Dat is α: %. 90 1000 1 00 0 g r 7d. z σ 1,96 0,0 n = = 1,4. n = 16. a 0,01 modulewijzer stab.doc versie 1-01-00 bladzijde