2 Meetwaarden verschillen. Hoe komt dat? 3 Spreiding van data (meetresultaten)



Vergelijkbare documenten
Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Exact competentiegericht

Exact competentiegericht Statistiek voor het laboratorium Uitwerkingen versie juli-2014

Exact competentiegericht Statistiek voor het laboratorium Uitwerkingen

Statistiek 2 deel A 30 minuten over statistisch toetsen

Exact Periode 6.1. Juist & Precies Testen

Meten is weten, dat geldt ook voor het vakgebied natuurkunde. Om te meten gebruik je hulpmiddelen, zoals timers, thermometers, linialen en sensoren.

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoofdstuk 5 Een populatie: parametrische toetsen

Data analyse Inleiding statistiek

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

Exact Periode Juist & Precies Testen

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Hoofdstuk 10: Regressie

Foutenleer 1. dr. P.S. Peijzel

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Samenvattingen 5HAVO Wiskunde A.

Data analyse Inleiding statistiek

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Introductie periode 2b. Onderdeel Foutenleer 1

Samenvatting Wiskunde Samenvatting en stappenplan van hfst. 7 en 8

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

9. Lineaire Regressie en Correlatie

Overzicht statistiek 5N4p

Significante cijfers en meetonzekerheid

Kerstvakantiecursus. wiskunde A. Rekenregels voor vereenvoudigen. Voorbereidende opgaven HAVO kan niet korter

Data analyse Inleiding statistiek

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO

Paragraaf 5.1 : Frequentieverdelingen

Statistische variabelen. formuleblad

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Hoofdstuk 5: Steekproevendistributies

Statistiek = leuk + zinvol

2. In de klassen 2A en 2B is een proefwerk gemaakt. Je ziet de resultaten in de frequentietabel. 2A 2B

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen

4 HAVO wiskunde A HOOFDSTUK voorkennis 1. soorten verdelingen 2. de normale verdeling 3. betrouwbaarheidsintervallen 4. groepen en kenmerken

Inleiding Applicatie Software - Statgraphics

EXACT PERIODE Q-test (herhaling) F-test t-test (hethaling) gepaarde t-test t-test voor gemiddelden. foutenberekening

Oefenvragen bij Statistics for Business and Economics van Newbold

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Kansrekening en Statistiek

Voorbeeldtentamen Statistiek voor Psychologie

DOEN! - Praktische Opdracht Statistiek 4 Havo Wiskunde A

Exact Periode 5.1. Rekenvaardigheid Controlekaarten

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

Hoofdstuk 3 Statistiek: het toetsen

Klantonderzoek: statistiek!

Inleiding tot de natuurkunde

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

Populaties beschrijven met kansmodellen

Extra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van

Kruis per vraag slechts één vakje aan op het antwoordformulier.

bijspijkercursus wiskunde voor psychologiestudenten bijeenkomst 6 statistiek/gegevensverwerking los materiaal, niet uit boek [PW]

9. Testen van meetresultaten.

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Exact Periode 9.1. Rekenvaardigheid Controlekaarten

Exact periode 4.2. Tweedegraads vergelijkingen Destilleren t-test boxplot

8. Analyseren van samenhang tussen categorische variabelen

Theorie: Het maken van een verslag (Herhaling klas 2)

Statistiek is zo saai nog niet! Een integratie van theorie en praktijk Manfred te Grotenhuis

OEFENPROEFWERK HAVO A DEEL 2

College 4 Inspecteren van Data: Verdelingen

Statistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14

8.1 Centrum- en spreidingsmaten [1]

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Meten en experimenteren

Examen HAVO. Wiskunde A1,2

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf

Beschrijvend statistiek

WISKUNDE A HAVO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0

Hoofdstuk 6 Twee populaties: parametrische toetsen

Kansrekening en Statistiek

vwo: Het maken van een natuurkunde-verslag vs

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Les 1 Kwaliteitsbeheersing. Les 2 Kwaliteitsgegevens. Les 3 Introductie Statistiek. Les 4 Normale verdeling. Kwaliteit

Statistiek basisbegrippen

Statistiek. Statistiek in het laboratorium van de ziekenhuisapotheek; deel 1.

SPSS. Statistiek : SPSS

Les 1: Waarschijnlijkheidrekening

Meetkundige Dienst

Examen Statistiek I Januari 2010 Feedback

Figuur 1: Normale verdeling. Bij een normale verdeling geldt dat ongeveer:

Feedback proefexamen Statistiek I

VOOR HET SECUNDAIR ONDERWIJS

Significante cijfers en meetonzekerheid

Les 2 / 3: Meetschalen en Parameters

Meten en experimenteren

Inleidende begrippen over foutentheorie

mlw stroom 2.1: Statistisch modelleren

f. Wat is de halveringstijd van deze uitstervende diersoort uitgaande van de formule: N ,88 t, t in jaren t=0 betekent ?

Statistiek voor A.I.

Transcriptie:

Info Statistiek 1 Precisie en juistheid Precisie en juistheid van metingen 1.1 t/m 1.2 Absolute en relatieve onnauwkeurigheid 1.3 Nauwkeurigheid verbeteren door duplo en triplo 1.4 Notatie van onnauwkeurigheden 1.5 t/m 1.7 Juistheid m.b.v. een controlemonster 1.8 Betekenis van het -teken 1.9 2 Meetwaarden verschillen. Hoe komt dat? Toevallige meetfouten door de waarnemer: afleesonnauwkeurigheid 2.1 t/m 2.5 Systematische meetfouten 2.6 t/m 276 Instrumentonnauwkeurigheid 2.8 Meer onnauwkeurigheden tegelijk 2.9 t/m 2.11 Combinatie van afleesonnauwkeurigheid en instrumentonnauwkeurigheid 2.12 Gebruik van manual 2.13 t/m 2.14 De maatkolf 2.15 Parallax 2.16 3 Spreiding van data (meetresultaten) Steekproef en populatie 3.1 Centrummaten: gemiddelde, mediaan en modus 3.2 t/m 3.4 Boxplot, kwartielen en percentielen 3.5 t/m 3.7 Histogram 3.8 Standaarddeviatie 3.9 t/m 3.11 Herhaalbaarheid en reproduceerbaarheid 3.12 t/m 3.13 Gebruik van Excel 3.14 1 info Statistiek 2015 Vervoort Boeken

4 Uitschieters bepalen en afronden Uitschieters met de Dixon s test 4.1 t/m 4.3 Uitschieters met de boxplot 4.4 Gebruik van SPSS 4.5 Afrondingsregels 4.6 t/m 4.7 5 Normaalverdeling Normaalverdeling 5.1 t/m 5.4 Kansberekening en normaalverdeling 5.5 t/m 5.6 Standaard normaalverdeling 5.7 t/m 5.11 Kwaliteitscontrole bij de bakker en de chipsfrabriek 5.12 t/m 5.13 6 Van steekproef naar populatie Steekproeven en de standaardfout 6.1 t/m 6.4 Betrouwbaarheidsinterval 6.5 Schatting van het populatie gemiddelde bij een kleine steekproef 6.6 Schatting van het populatiegemiddelde bij een grote steekproef 6.7 Toepassingen 6.8 t/m 6.9 Significant verschil? 6.10 t/m 6.11 7 Kwaliteitszorg (controlekaarten) Toevallige en speciale variaties 7.1 t/m 7.2 Controlekaarten van losse (enkele) meetwaarden 7.3 Controle van apparatuur of meetmethode 7.4 t/m 7.5 Westgard regels 7.6 t/m 7.7 Controleregels in chemie en microbiologie 7.8 Speciale kaarten: de runchart 7.9 2 info Statistiek 2015 Vervoort Boeken

8 Correlatie en regressie Wel of geen verband tussen de grootheden? 8.1 Berekenen van de correlatiecoëfficiënt 8.2 Bepalen van een lineaire regressielijn 8.3 Oefenen met lineaire regressie 8.4 Lineaire regressie met Casio ZRM 8.5 Lineaire regressie met Excel 8.6 9 Testen van meetresultaten Testen van het uit de steekproef geschatte gemiddelde t.o.v. µ 9.1 t/m 9.3 Vergelijken van twee meetseries 9.4 t/m 9.5 T-test van gemiddelde uit twee steekproeven 9.6 F-test van standaarddeviaties uit twee steekproeven 9.7 Afvalwateronderzoek 9.8 T-test van gemiddelde uit twee steekproeven met gepaarde waarnemingen 9.9 t/m 9.10 Hypotheses oefenen 9.11 Grafische vergelijking van meetmethoden 9.12 Grafische vergelijking van meetmethoden - Uitschieters 9.13 Grafische vergelijking van meetmethoden - Valkuilen 9.14 Vergelijking van meetmethoden volgens Passing en Bablok 9.15 Vergelijking van meetmethoden volgens Deming 9.16 De analyse volgens Bland en Altman 9.17 10 Extra oefeningen Statistische Oefeningen 10.1 t/m 10.11 Antwoorden 132 Bijlagen Bijlage 1 Dixons-test of Q-test 133 Bijlage 2 Z-tabel 134 Bijlage 3 Student t-tabel 135 Bijlage 4 F - tabel 136 Bijlage 5 SPSS 137 Bijlage 6 Statistiek met Excel 140 Bijlage 7 Mindmap Nauwkeurigheid van meetresultaten 144 Index 145 3 info Statistiek 2015 Vervoort Boeken

Verantwoording Dit onderdeel van de methode is bedoeld voor iedereen die zijn vaardigheden en basiskennis van de statistiek wil verbeteren. Voor bedrijven en instellingen is het leveren van kwaliteit aan de klanten van levensbelang. Daarom is de laatste jaren het vak kwaliteitszorg sterk ontwikkeld. Omdat kwaliteitszorg sterk op statistiek leunt, is het van belang dat je daar als moderne werknemer iets van weet en kunt gebruiken tijdens je werk. Ook in dit deel worden reflectievragen gebruikt om meer inzicht en overzicht te krijgen. Je maakt ook hier weer je eigen toolboek dat je kunt inzetten bij de diagnostische toetsen en beroepsopdrachten. De vele interactieve oefeningen op internet en het gebruik van Excel en SPSS zijn bijzonder geschikt om de rekenvaardigheid onder de knie te krijgen. De site www.vervoortboeken.nl is een belangrijke ondersteuning. Hier zijn hulpmiddelen te vinden zoals voorbeeldtoetsen, links naar internetsites, filmpjes, afbeeldingen voor je toolboek, powerpointtools, Excel-tools en extra uitleg. De links naar internet verwijzen door naar sites met simulaties of oefenmogelijkheden. De afbeeldingen zijn te gebruiken voor het toolboek. Sommige schema s of didactische tips hoef je niet zelf te bedenken. Speciale dank gaat uit naar de collega s Claartje Eggermont, Nazli Evlek, Franca van de Loo en Jos Vervoort voor hun opbouwende ondersteuning. Heel veel succes! Gebruikte iconen 1.1 Reflectievragen 3.2 Samenvatting voor toolboek 1.1 Verwijzing naar internetsite 2.3 Leergesprek op de site http://www.vervoortboeken.nl 01 Excel-tool op de site http://www.vervoortboeken.nl 4 info Statistiek 2015 Vervoort Boeken

Opgave 1.1 Precisie en juistheid bij het schieten Een voorbeeld van precies en juist vinden we bij schieten op een schietschijf. Vier schutters hebben schoten afgevuurd. Zie volgende pagina. A B Blz. 10 C D Welke kwalificatie hoort bij welk plaatje? 1. precies en juist 2. niet precies en onjuist 3. precies en onjuist 4. niet precies en juist Opgave 1.3 Geef in het antwoord aan welk cijfer bij welke letter hoort. Hoe precies is een meting bij een bepaalde meetmethode? Bij een apparaat of methode is de precisie bekend. Voorbeeld De politie heeft mijn snelheid gecontroleerd en 74 km/h gemeten. De meetmethode heeft een nauwkeurigheid van 3 km/h. Dat betekent dat de meetresultaten maximaal 3 km/h kunnen afwijken. Het resultaat noteer je als: v = 74 ± 3 km/h. In plaats van nauwkeurigheid kun je beter spreken van onnauwkeurigheid.de meting met onnauwkeurigheid kun je tekenen als een interval op een getallenlijn: 71 74 77 3 3 De meting heeft dan een absolute onnauwkeurigheid van 3 km/h. Je kunt dit ook relatief weergeven dus in procenten, die noem je dan de relatieve onnauwkeurigheid. 5 info Statistiek 2015 Vervoort Boeken

relatieve onnauwkeurigheid Blz. 11 twee notaties van onnauwkeurigheid absolute onnauwkeurigheid relatieve onnauwkeurigheid = gemeten waarde 3 relatieve onnauwkeurigheid= 100% = 4,1% 74 met absolute onnauwkeurigheid v = 74 ± 3 km/h met relatieve onnauwkeurigheid v = 74 km/h ± 4,1 % Van een andere wegmisbruiker wordt de snelheid bepaald op 135 km/h. a Geef de juiste notatie van deze meting met absolute en relatieve onnauwkeurigheid. b Maak ook een tekening van het interval. Opgave 2.13 Verschilmeting Met een buret heb je twee volumes afgelezen Blz. 24 Buretaflezing V begin (ml) 35,18 V eind (ml) 11,56 afleesonnauwkeurigheid (ml) 0,02 instrumentonnauwkeurigheid (ml) 0,05 a b c d e Bereken het toegevoegde volume vloeistof. De instrumentonnauwkeurigheid van 0,05 is een systematische onnauwkeurigheid. Wat betekent dat? Stel dat de instrumentonnauwkeurigheid +0,04 ml is, wat betekent dat dan voor het toegevoegde volume vloeistof? Bereken de onnauwkeurigheid in het resultaat. Noteer de volgende regel: verschilmeting en onnauwkeurigheid Bij een verschilmeting met één instrument hoef je alleen rekening te houden met de afleesonnauwkeurigheid 6 info Statistiek 2015 Vervoort Boeken

Opgave 3.5 Blz. 32 3.1 Boxplot Een boxplot is een eenvoudige manier om de verdeling van data (waarnemingen, meetwaarden) weer te geven. Een voorbeeld (zie tabel rechts): sorteer de 14 gegevens van laag naar hoog 8, 9, 9, 11, 11, 12, 12, 13, 15, 16, 17, 17, 20, 21 bepaal de mediaan; in dit geval 12,5 bepaal de mediaan van de onderste helft: 11 bepaal de mediaan van de bovenste helft 17 maak met deze waarden een tekening zoals in het voorbeeld gemaakt met: http://nlvm.usu.edu/en/nav/frames_asid_200_g_3_t _5.html laagste mediaan onderste helft mediaan mediaan bovenste helft hoogste 25 % 25 % 25 % 25 % De mediaan van de onderste helft wordt ook wel het eerste (of onderste) kwartiel K 1 genoemd. De mediaan van de bovenste helft is dan het derde (bovenste) kwartiel K 3. a Maak nu zelf een boxplot (met de hand of met de applicatie op de website) van de examenscores uit de vorige. b Is hier sprake van een scheve verdeling? Zoals we later zullen zien kun je een boxplot ook gebruiken om uitschieters te bepalen. 7 info Statistiek 2015 Vervoort Boeken

bij een steekproef delen we niet door n maar door n-1 Blz. 39 06 bereken het gemiddelde van de kwadraten: 2 ( xi x) 418 = = 52,25 n 1 8 Het getal dat we nu gevonden hebben wordt variantie genoemd. 2 ( x ) variantie = i x n 1 neem nu hier de wortel uit: 2 ( x i x) σ n = = 52,25 n 1 1 = 7,23 dit getal is een maat voor de gemiddelde afwijking van de waarnemingen t.o.v. het gemiddelde en heet de standaarddeviatie of standaardafwijking (het symbool σ heet ook sigma), het is een goede maat voor de precisie van de meting. De standaarddeviatie is, net zoals de eerder gebruikte spreiding, een absolute onnauwkeurigheid en dus een maat voor de precisie Als we ook de relatieve onnauwkeurigheid willen weten, rekenen we de variatiecoëfficiënt uit: variatiecoëfficiënt = σ n 1 x 100 % c Bereken de variatiecoëfficiënt van meting A. Waarom geeft deze waarde een goed beeld van de precisie van de meting? d Maak eenzelfde tabel voor meting B en bereken de standaarddeviatie en variatiecoëfficiënt van deze meetserie. e Vergelijk de precisie van meting A en meting B. Samenvattend, bij een steekproef geldt dus: variantie van een steekproef gram standaarddeviatie van een steekproef ( x ) variantie = i x n 1 σ n 1 ( x i x) = n 1 2 2 variatiecoëfficiënt van een steekproef σ 1 variatiecoëfficiënt = n 100% x 8 info Statistiek 2015 Vervoort Boeken

Opgave 4.1 Uitschieters: de Dixons-test of Q-test Van afvalwater is 10 maal het loodgehalte bepaald: Loodgehalte in afvalwater (mg/l) 2,4 2,1 2,3 1,7 2,2 2,5 2,4 3,7 2,4 2,3 Blz. 47 a b Zijn hier mogelijk uitschieters aanwezig, denk je? Zet de waarden op een getallenlijn.. Helpt dit om een uitschieter aan te wijzen? Ons gevoel kan ons bedriegen bij statistiek, daarom zijn er regels afgesproken. Een uitschieter is een minimum of maximum meetwaarde die opvallend ver van de naastliggende af ligt, zie tekening MIN spreidingsbreedte w MAX A B verdachte waarneming 2 naastliggende waarneming verdachte waarneming 1 De Dixons-test maakt het mogelijk om een enkele uitschieter op te sporen. Als er uitschieters in groepjes voorkomen moeten we een boxplot inzetten. Bij de Dixons-test kijkje naar de verhouding tussen twee lijnstukken: AB en de spreidingsbreedte w. De meest verdachte waarneming is 3,7 c Bereken de lengte van AB, dus: AB = verdachte waarneming 1 naastliggende waarneming d Bereken w. e Bereken: testwaarde Dixons-test of Q-test Q test = verdachte waarneming naastliggende waarneming w de rechte strepen in A-B betekenen dat de uitkomst altijd positief 9 info Statistiek 2015 Vervoort Boeken

Opgave 5.2 Vuistregels normaalverdeling In onderstaande figuur zijn alle percentages aangegeven die bij een normaalverdeling horen bij de gebieden die 1, 2 of 3 standaarddeviaties van het gemiddelde liggen. Blz. 57 34 % 34 % 0, 2 % 2,2 % 1 3,6 % 1 3,6 % 2, 2 % 0, 2 % a b c d µ-3 σ µ-2σ µ-1σ µ µ+1 σ µ+2 σ µ+3 σ Hoeveel % ligt tussen µ 1σ en µ+1σ? Hoeveel % ligt tussen µ 2σ en µ+2σ? Hoeveel % ligt tussen µ 3σ en µ+3σ? Neem de figuur over en zet deze getallen er ook bij. De getallen krijgen meer betekenis met een voorbeeld. Het gemiddelde gewicht van de Nederlandse man is 82,4 kg. Van de mannen weegt 2,4 % minder dan 54,0 kg. e Bereken de standaarddeviatie van het gewicht. Maak als hulpmiddel een schets van de normaalverdeling met getallen. f Teken een normaalverdeling zoals in de figuur met alle juiste gewichten. g Vul in: 2,4 % van alle Nederlandse mannen weegt meer dan. kg (tip: kijk goed in de figuur). h Hoeveel % van de mannen heeft een gewicht tussen 96,6 kg en 110,8 kg? Opgave 5.10 Standaard normaalverdeling en microbiologische metingen De uitslagen van microbiologische meetmethoden zijn niet normaal verdeeld maar kennen een zogeheten Poissonverdeling. Dat komt door de enorme onzekerheid die optreedt bij dit soort metingen, met name bij zeer lage waarden, dus bij grote verdunningen. Het is niet nodig om hier verder op in te gaan, want het blijkt dat de logaritmische waarde ( 10 logwaarde) van de uitslagen wel normaal verdeeld is, zie figuur links. Van een monster is een aantal van 100 KVE geteld bij een verdunning van 10 2. a Bereken het gehalte KVE in het monster. 10 info Statistiek 2015 Vervoort Boeken

Opgave 6.3 Blz. 74 250 keer? vette shit!! De onnauwkeurigheid (standaarddeviatie) van de meetmethode is 0,15 (uitgedrukt in logwaarde) b Bereken de 2σ grenzen van het gehalte in 10 log (KVE). c Bereken de 2σ grenzen van het gehalte in KVE. d Hoe zie je aan de uitkomst van c dat de metingen in KVE niet normaal verdeeld zijn? Kan het niet met wat minder steekproeven? Het hoofdstuk begon met het probleem van het zoutgehalte van een oplossing dat in triplo bepaald was met als uitslag x = 15,1 mg/l en σ n-1 = 0,2 mg/l. Kunnen we daar ook de standaardfout bij gebruiken? Het is weinig aantrekkelijk om deze steekproef 10 keer te herhalen, laat staan om per steekproef 25 samples te gebruiken. Dat zou neerkomen op 250 analyses voor één uitslag. De chef lab zou niet blij zijn. Gelukkig hebben statistici overal een oplossing voor. Je kunt de formule σn SE= n ook gebruiken om de standaardfout te berekenen als de standaarddeviatie van de populatie bekend is. Dan moeten we wel eerst bedenken van de populatie van het meten van een monster voorstelt. Vergelijk: lengtemeting triplo x = 181,2 cm en σ n-1 = 7,1 cm meting zoutgehalte x = 15,1 mg/l en σ n-1 = 0,2 mg/l 6.1 R1 R2 R3 Waardoor wordt de spreiding in de resultaten van de lengtemeting bepaald? Uit de onnauwkeurigheid van de meetmethode of de verdeling van de lengte over de populatie van Nederlandse mannen? Of allebei? Waardoor wordt de spreiding in de resultaten van de zoutmeting bepaald? Uit de onnauwkeurigheid van mijn meetmethode of de verdeling van het zoutgehalte over de populatie (het monster)? Of allebei? Wat stelt de populatie eigenlijk voor bij zo n gehaltebepaling? 11 info Statistiek 2015 Vervoort Boeken

Theorie Shewhart van Bell Telephone Laboratories heeft in 1924 gezegd dat er twee soorten variaties zijn met verschillende oorzaken: toevallige en aanwijsbare oorzaken Blz. 86 out of control onbeheerste kwaliteit Toevallige oorzaken (Engels: random causes), aanwezig in ieder proces en niet te vermijden. Bijvoorbeeld: het trekken van rode ballen; we verwachten een normaalverdeling, ook in de toekomst: figuur rechts. Als er alleen toevallige oorzaken zijn is het proces onder controle (Eng. in control ). Aanwijsbare, speciale oorzaken (Engels: special causes), die niet gewenst zijn en vermeden kunnen worden. Als er zich speciale oorzaken voordoen is het proces niet onder controle (Eng. out of control ) en moet er ingegrepen worden. Men spreekt ook wel van onbeheerste kwaliteit. Een proces is onder controle als we op basis van ervaringen in het verleden, binnen zekere grenzen kunnen voorspellen hoe het zich in de toekomst zal gedragen. Walter A. Shewhart, 1931 Hoe stellen we nu vast of de kwaliteit onbeheerst is of onbeheerst dreigt te raken? Het hulpmiddel hierbij vormen zogenoemde (proces)controlekaarten. In het Engels SPC charts: Statistical Process Control charts. Hierin worden de eigenschappen (variabelen) van het proces weergegeven, die gemeten worden als functie van de tijd. 12 info Statistiek 2015 Vervoort Boeken

Opgave 8.1 Blz. 98 Wel of geen verband tussen de grootheden? Bekijk de volgende voorbeelden: Hebben grote vaders ook grote zonen of grote dochters? Of is er helemaal geen verband? grootte dochters 2,15 2,05 1,95 1,85 1,75 Figuur 1 1,65 Is er een verband tussen het aantal personen dat in een huis woont en de schoenmaat van de jongste bewoner? Soms heb je ook een verband waarbij de ene grootheid groter wordt en de andere grootheid kleiner. Bijvoorbeeld: het aantal droge dagen (in een jaar) en het aantal verkochte paraplu s in een winkelketen. 1,55 1,55 1,65 1,75 1,85 1,95 2,05 2,15 grootte vader Figuur 2 48 Schoenmaat Paraplu's 46 44 42 40 38 36 34 32 300 275 250 225 200 175 150 125 100 75 50 1 2 3 4 5 6 7 8 Aantal personen 100 150 200 250 300 350 400 Aantal droge dagen a b In twee gevallen is sprake van correlatie (afhankelijkheid) tussen de grootheden. Welke zijn dat? Bij één van de twee is de correlatie positief, bij de andere is de correlatie negatief. Welke zijn dat volgens jou? Correlatie kan in een getal worden uitgedrukt: de correlatiecoëfficiënt symbool r. Dat is een getal tussen 1 en +1. 13 info Statistiek 2015 Vervoort Boeken

Opgave 9.1 Testen van het uit de steekproef geschatte gemiddelde t.o.v. µ Je gebruikt deze test in een lab bijvoorbeeld: als je iets wil vergelijken met een bekende of gewenste waarde; om de juistheid van een analysetechniek te beoordelen. Hier nemen we als voorbeeld een zak cement waar 25 kg op staat. Bij kwaliteitscontrole in de fabriek wordt een steekproef genomen: Gewicht van zakken cement (kg) 23,5 24,8 23,9 25,8 24,6 a Bereken het gemiddelde en de standaarddeviatie. Blz. 111 t- test van het uit de steekproef geschatte gemiddelde t.o.v. µ 14 Voldoet de fabrikant hiermee aan de specificatie? Op het eerste gezicht lijkt dit van niet. Maar het kan toeval zijn dat er vier waarden onder 25 kg liggen. Bij herhaling van de steekproef zouden dan best alle 5 waarden boven de 25 kg kunnen liggen. Een test zal dit moeten uitwijzen. We volgen het stappenplan. 1 De nulhypothese stellen: H O : het gemiddeld gewicht verschilt niet significant van 25 (dit is beter dan: het gewicht voldoet aan de specificatie ) H 0 : µ = 25 2 Alternatieve hypothese H 1 : het gemiddeld gewicht verschilt significant van 25 H 1 : µ 25 (geen voorkeur voor groter of kleiner). 3 Dus tweezijdig testen. 4 De testwaarde is: t = ( µ x) n σ b Bereken deze t waarde. 5 We willen een betrouwbaarheid van 95 %. c Wat betekent dat bij tweezijdig toetsen? Hoeveel % links en rechts? 6 Zoek de kritische waarde op en vergelijk die met de testwaarde. d Hoeveel vrijheidsgraden zijn er? Zoek de kritische waarde t kritisch op in de t tabel. e Vergelijk die met de testwaarde: is t berekend > t kritisch? Zo ja, dan wordt de nulhypothese aangenomen. Zo nee, dan is hij verworpen en moet de alternatieve hypothese dus waar zijn. f Wordt de nulhypothese verworpen? 7 Conclusie trekken. g Welke conclusie kunnen we trekken uit de test? In woorden graag!! n-1 modulus strepen: uitkomst > 0 14 info Statistiek 2015 Vervoort Boeken

19 10.1 Met Excel kun je geen Passing en Bablok regressie doen. Een aanvulling op Excel waarmee dat wel kan is Analyse-it, maar dat moet gekocht worden. Er is wel een demoversie te downloaden. Op de Duitse website: www.acomed-statistik.de kun je een Excel werkblad downloaden waarmee je Passing en Bablok regressie kunt uitvoeren. Het resultaat van bovenstaand probleem zie je onder: Blz. 126 Zonder uitschieter y = 0,984 x + 0,313 Met uitschieter y = 0,984 x + 0,313 a Waar zit het verschil nu in de uitslag? Kijk in de grafiek! De software geeft ook de betrouwbaarheidsintervallen: Zonder uitschieter Met uitschieter b Zijn de methoden vergelijkbaar? Dus: liggen de ideale waarden in de gevonden betrouwbaarheidsintervallen? 15 info Statistiek 2015 Vervoort Boeken