2 Data en datasets verwerken
|
|
|
- Stijn Bakker
- 10 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken Inhoud 2.0 Data voor onderzoek 2.1 Data presenteren 2.2 Centrum en spreiding 2.3 Verdelingen typeren 2.4 Relaties 2.5 Overzicht In opdracht van: Commissie Toekomst Wiskunde Onderwijs
2 ctwo Utrecht 2009 Dit lesmateriaal is ontwikkeld in het kader van de nieuwe examenprogramma s zoals voorgesteld door de Commissie Toekomst Wiskunde Onderwijs. De gebruiker mag het werk kopiëren, verspreiden en doorgeven en remixen (afgeleide werken maken) onder de volgende voorwaarden: Naamsvermelding. De gebruiker dient bij het werk de door de maker of de licentiegever aangegeven naam te vermelden (maar niet zodanig dat de indruk gewekt wordt dat zij daarmee instemmen met uw werk of uw gebruik van het werk). Niet-commercieel. De gebruiker mag het werk niet voor commerciële doeleinden gebruiken. Gelijk delen. Indien de gebruiker het werk bewerkt kan het daaruit ontstane werk uitsluitend krachtens dezelfde licentie als de onderhavige licentie of een gelijksoortige licentie worden verspreid. Licht gewijzigde testversie: december 2010 Overzicht lesmateriaal in het domein Statistiek en kansrekening 1 Kijken naar data 1.1 Wat is statistiek? 1.2 Data 1.3 Diagrammen 1.4 Interpretaties 1.5 Overzicht 2 Data en datasets verwerken 2.0 Data voor onderzoek 2.1 Data presenteren 2.2 Centrum en spreiding 2.3 Verdelingen typeren 2.4 Relaties 2.5 Overzicht 3 Data verwerven 3.0 Statistisch onderzoek 3.1 Experimenteren en simuleren 3.2 Toeval 3.3 Kansen berekenen 3.4 Steekproeven 3.5 Enquêtes 3.6 Overzicht 4 Normale verdeling 4.0 Een bijzondere verdeling 4.1 Gemiddelde en standaardafwijking 4.2 Normale verdeling 4.3 Rekenen met normale verdelingen 4.4 Steekproef en simulatie 4.5 Schatten van een proportie 4.6 Overzicht 5 Conclusies trekken uit data 5.0 Wat is een betrouwbare conclusie? 5.1 Kwalitatieve variabelen vergelijken 5.2 Boxplots vergelijken 5.3 Tellingen vergelijken 5.4 Meetwaarden vergelijken 5.5 Statistische procescontrole 5.6 Data analyse CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 2
3 2.0 Data voor onderzoek In het hoofdstuk Kijken naar data heb je vooral gekeken naar manieren waarop je gegevens tegenkomt in kranten, op internet, e.d. Meestal ontstaan dergelijke statistieken doordat op grond van een bepaalde vraag gericht gegevens zijn verzameld. Stel je bijvoorbeeld voor dat je wilt weten hoe de lengtes en de gewichten van de 154 leerlingen in HAVO 4 op een bepaalde school zijn verdeeld. Je onderzoeksvragen zouden kunnen zijn:! Welke conclusies kun je trekken als je de gewichten van de jongens en de meisjes met elkaar vergelijkt? Dit is een voorbeeld van een vraag waarbij je de eigenschappen van twee groepen vergelijkt.! Bestaat er een relatie tussen lengte en gewicht? En zo ja, welk? In dit hoofdstuk ga je leren hoe je dit soort vragen met behulp van verzamelde data kunt beantwoorden. In paragraaf 2.1 tot en met 2.3 werk je vooral aan technieken voor het vergelijken van twee groepen. In paragraaf 2.4 komt het zoeken naar een relatie tussen twee variabelen aan de orde. Van de genoemde HAVO 4 leerlingen zijn behalve hun lengte en hun gewicht nog enkele gegevens opgevraagd. Dat heeft een tabel opgeleverd waarin per leerling de gegevens zijn terug te vinden, zie!gegevens154leerlingen. Die verzameling gegevens noem je een dataset.! Opgave 1 Bekijk de genoemde dataset. a) Welke statistische variabelen zijn onderzocht? b) Om de jongens en de meisjes te kunnen vergelijken maak je twee deelgroepen. Je gebruikt dan één van de statistische variabelen als kenmerk om de deelgroepen te onderscheiden. Welke? c) Heb je al een vermoeden omtrent de antwoorden op de vragen? Zo ja, formuleer die vermoedens.! Practicum: Eigen dataset maken Het is leuker om met eigen gegevens onderzoek te doen. Die moet je dan wel eerst zelf verzamelen, bijvoorbeeld door zelf alle leerlingen van een bepaald leerjaar of een bepaalde groep te meten, te wegen en/of enkele vragen te stellen. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 3
4 2.1 Data presenteren! Practicum Bij deze paragraaf horen de VUStat-practica DATASETS, DOTPLOTS, STAAFDIAGRAMMEN, FREQUENTIETABELLEN en BIJZONDERE DIAGRAMMEN. Verkennen! Opgave 2 Bekijk de genoemde dataset!gegevens154leerlingen. a) Hoe lang is het grootste meisje? En de grootste jongen? b) Welke lengtes komen het meeste voor? c) Is het berekenen van gemiddelden een goede manier om de lengtes van de meisjes en de jongens met elkaar te vergelijken? Licht je antwoord toe.! Opgave 3 Hier zie je een manier om deze gegevens overzichtelijker in beeld te brengen. Je kunt nu de vragen van opgave 1 gemakkelijker beantwoorden. a) Waarom is dat zo? b) Beantwoord nu de vragen a en b van opgave 2 met behulp van deze figuur. Opgave 4 Je hebt al kennis gemaakt met kwalitatieve en kwantitatieve statistische variabelen. a) Noem van beide soorten variabelen een voorbeeld. b) Aan de variabele geslacht worden soms twee waarden toegekend: 0 = vrouw en 1 = man. Wordt de variabele daarmee kwantitatief? c) De lengten bij een bevolkingsonderzoek worden gemeten in centimeters. Kun je daarvoor redenen aangeven? d) Je ziet hier twee weegschalen. Wat is het verschil tussen beide als het gaat om het aflezen van een gewicht? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 4
5 e) Bij een grafiek van het temperatuurverloop van een dag kun je een vloeiende lijn tekenen. Waarom kan dat niet bij een grafiek van de gemiddelde maandtemperatuur in 2009? Uitleg De verzameling gegevens van 154 leerlingen in HAVO 4 heet een dataset. Omdat deze data niet bewerkt zijn heten ze ruwe data. De data zijn geordend per leerling, op één regel vind je de gegevens van één leerling: geslacht, profiel, lengte, gewicht, enzovoorts. Dit zijn de statistische variabelen. De gegevens van één leerling noem je een record. Het is belangrijk dat je de verschillende soorten variabelen leert onderscheiden. Het soort variabele dat je onderzoekt bepaalt namelijk welke statistische onderzoekstechnieken je zinvol kunt inzetten. Denk bijvoorbeeld aan het bekende voorbeeld dat je geen gemiddelde hobby kunt berekenen. Kwantitatieve variabelen kun je onderscheiden in:! Continue variabelen: alle waarden binnen een interval kunnen worden aangenomen.! Discrete variabelen: alleen bepaalde waarden kunnen worden aangenomen. Bij statistisch onderzoek wil je uitspraken kunnen doen, antwoorden op je vragen formuleren. Je moet dan vaak de gegevens overzichtelijker maken, beter ordenen. Dat doe je bijvoorbeeld met behulp van tabellen of diagrammen waarin je de frequenties uitzet tegen de waarden die de statistische variabele kan aannemen. Zo krijg je een frequentieverdeling van de gegevens. In de figuur bij opgave 3 zie je meteen dat er 6 leerlingen zijn met een lengte van 190 cm en dat dit allemaal jongens zijn. Zo n figuur noem je een dotplot. Hij brengt de frequentieverdeling van de lengtes goed in beeld. Ook valt je waarschijnlijk op dat de verdelingen van de lengtes van de jongens en de meisjes van elkaar verschillen: de jongens zijn over het algemeen wat langer dan de meisjes zou je kunnen zeggen. Dat wordt nog duidelijker als je de deelgroepen jongens en meisjes afzonderlijk bekijkt. Je gebruikt dan de variabele geslacht als kenmerk om de deelgroepen te herkennen. De bijbehorende dotplots zie je op de volgende pagina. De lengtes van de jongens lopen vanaf 161 cm tot en met 200 cm, de meest voorkomende lengte is 180 cm. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 5
6 Opgave 5 Iemand wil een onderzoek doen bij examenklassen havo met de volgende variabelen: geslacht, geboortejaar, geboortemaand, gewicht, lengte, cijfergemiddelde, cijfer voor wiskunde, huiswerk, wiskundegroep, profiel, plezier. Geef bij elk van deze variabelen aan of deze kwalitatief of kwantitatief is en welke waarden deze kan aannemen. Opgave 6 In de dotplots hierboven zijn de lengtes van de meisjes en die van de jongens afzonderlijk weergegeven. Ze laten de frequentieverdeling van de lengtes van de meisjes en de jongens afzonderlijk goed zien. a) Welke lengte komt bij de meisjes het meeste voor? Welke frequentie hoort daar bij? b) Wat is de minimale lengte bij de meisjes? En wat is hun maximale lengte? c) Bij de meisjes zit een uitschieter. Licht dit toe. d) Kun je op grond van wat je nu hebt gevonden de lengtes van meisjes en jongens vergelijken? En wat valt je op? Opgave 7 Je kunt de lengtes van de jongens en de meisjes ook in een staafdiagram zetten. Om beter te kunnen vergelijken is het nuttig om alle frequenties om te zetten naar relatieve frequenties. a) Waarom is dat zo? b) Bereken vanuit het dotplot van de vorige pagina of het staafdiagram hierboven het percentage dat hoort bij de lengte 175 cm bij de jongens. Doe dit ook voor de meisjes. c) Ga na of je uitkomsten overeen komen met deze staafdiagrammen. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 6
7 d) Hoeveel procent van de jongens is langer dan 180 cm? En hoeveel procent van de meisjes? e) Bekijk de 50% kleinste meisjes. Tussen welke waarden zit hun lengte? En hoe zit dat bij de jongens? f) Bekijk de 25% grootste meisjes. Tussen welke waarden zit hun lengte? En hoe zit dat bij de jongens?! Opgave 8 Bij het maken van frequentietabellen en staafdiagrammen bij de lengtes en de gewichten van de 154 leerlingen speelt de volgorde waarin je de gemeten waarden zet een grote rol. a) Bekijk de variabele profielkeuze. Kun je daarbij een zinvol staafdiagram maken? En is de volgorde van de staven dan van belang? Mag er tussenruimte tussen de staven zitten? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 7
8 b) Bekijk de variabele huiswerk. Kun je daarbij een zinvol staafdiagram maken? En is de volgorde van de staven dan van belang? Mag er tussenruimte tussen de staven zitten? c) Bekijk de variabele geboortemaand. Waarom is het bij deze dataset nauwelijks zinvol om bij geboortejaar een frequentietabel te maken? d) Bekijk de variabele plezier. Kun je daarbij een zinvol staafdiagram maken? En is de volgorde van de staven dan van belang? Mag er tussenruimte tussen de staven zitten? e) Hier worden een aantal andere statistische variabelen genoemd. Beschrijf bij elk van deze variabelen van welke soort hij is, of volgorde er belangrijk is, of en hoe er wordt afgerond en of een staafdiagram zinvol is. - de dagelijkse reistijd naar school (in minuten); - het aantal lesuren per week; - de muziekvoorkeur (bedenk zelf de categorieën); - het belang van bewegingsonderwijs voor iedereen (vijfpuntsschaal: totaal onbelangrijk, niet erg belangrijk, neutraal, belangrijk, heel belangrijk). Opgave 9 Om de lengtes van de jongens en de meisjes goed te kunnen vergelijken kun je de lengtes groeperen: je maakt dan klassen. Hier zie je dat in twee staafdiagrammen: a) De eerste klasse loopt vanaf 155 tot aan 160. Hoeveel procent van de meisjes valt er in die klasse? Reken dat percentage na met behulp van de staafdiagrammen in opgave 7. b) Kun je op grond van deze staafdiagrammen gemakkelijk de vraag beantwoorden hoeveel procent van de jongens langer is dan 182 cm? Licht je antwoord toe. c) Welke voordelen heeft het groeperen van de metingen in klassen? d) Welke nadelen heeft het groeperen van de metingen in klassen? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 8
9 e) Je zou ook klassen kunnen maken die lopen vanaf 150 tot 160 en dan vanaf 160 tot 170, enzovoort. Welke klassenmiddens krijg je dan? f) Welk nadeel heeft het vergroten van de breedte van de klassen? Theorie *************************************** Een verzameling waarden van één of meer statistische variabelen noem je een dataset. Als de data niet bewerkt zijn spreek je van ruwe data. Bij het representeren van zo n dataset kun je frequentieverdelingen van de data op een statistische variabele gebruiken. Die laten zien hoeveel keer elke waarde van een variabele voor komt. Zo n frequentieverdeling heeft de vorm van een tabel, de frequentietabel, of een diagram zoals! een dotplot waarin het aantal punten bij elke waarde de frequentie aangeeft;! een staafdiagram waarin de lengte van de staaf de absolute of de relatieve frequentie weergeeft. Kwantitatieve variabelen kun je verdelen in:! Discrete variabelen nemen alleen bepaalde waarden aan.! Continue variabelen kunnen alle waarden binnen een interval aannemen. Door de ruwe data in klassen te groeperen kun je een beter overzicht krijgen, maar dan zijn de ruwe data zelf niet meer te zien. Met indelen in klassen kun je gegevens groeperen. De lengtes kun je bijvoorbeeld groeperen in klassen als 160!<165, enzovoorts. De klassen hebben dan een klassenbreedte van 5 cm. Het klassenmidden is 162,5 en de getallen 160 en 165 zijn de klassengrenzen. Bij continue variabelen zet je de staven van het bijbehorende staafdiagram tegen elkaar aan. Dat noem je een histogram. Er bestaan andere manieren om klassen weer te geven. Bijvoorbeeld bij lengten wordt met de notatie 5! 9 de klasse 4,5!< 9,5 bedoeld. Het klassenmidden is dan 7. Gaat het daarentegen over leeftijden in jaren dan betekent 5! 9 de klasse 5!< 10. Die klasse bevat de leeftijden 5, 6, 7, 8, 9. Het klassenmidden is 7,5. ********************************************* Voorbeeld Je ziet op de volgende pagina histogrammen van de frequentieverdelingen van de gewichten van de meisjes en de jongens van de 154 leerlingen in havo 4. Bereken bij de klasse met klassenmidden 57,5 zowel de jongens als de meisjes de bijbehorende relatieve frequenties in procenten. Waarom is het omrekenen naar procenten nodig? Uitwerking Het totaal aantal meisjes is = 84. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 9
10 Het percentage meisjes bij de klasse met klassenmidden 57,5 is daarom: x 100 " 29,8% Het totaal aantal jongens is = 68. Het percentage jongens bij de klasse met klassenmidden 57,5 is daarom: x 100 " 14,7% Omrekenen naar procenten is nodig om beide frequentieverdelingen te kunnen vergelijken, omdat de aantallen jongens en meisjes verschillen. " Opgave 10 Ga van de volgende statistische variabelen na van welke soort ze zijn en welke waarden ze kunnen aannemen. a) geboortejaar (van nog levende personen) b) temperatuur op de noordpool in graden Celsius c) een enquête met een driepuntsschaal d) gewicht van muizen in grammen e) toetscijfer f) profiel in bovenbouw HAVO g) kwaliteit van een hotel: aantal sterren Opgave 11 Voor een practicum biologie zijn op twee velden regenwormen gevangen. Vervolgens werden de lengtes van die wormen gemeten. Hier zie je de resultaten. a) Om wat voor soort statistische variabele gaat het hier? b) Hoe lang was de grootste gevonden regenworm hoogstens? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 10
11 c) Wanneer is het verstandig om beide frequentietabellen om te werken naar relatieve frequenties? d) Maak van beide velden relatieve frequentietabellen van de lengtes en teken er histogrammen bij. e) Vergelijk beide histogrammen. Wat valt je daarbij op? Opgave 12 Voor een bepaalde toets kun je maximaal 100 punten scoren. Hier zie je hoe een groep van 40 personen de toets heeft gemaakt a) Om wat voor soort statistische variabele gaat het hier? b) Deel deze scores in klassen in, neem als laagste klasse 25!< 35. Maak een frequentietabel. c) Maak bij deze tabel een histogram van relatieve frequenties. Personen die 55 of meer punten hebben behaald, scoren voldoende. d) Hoeveel procent van deze groep scoorde voldoende? e) Je had ook als eerste klasse 30!< 40 kunnen nemen. Wat is daarvan het nadeel?! Opgave 13 Je kunt een klassenindeling op verschillende manieren noteren. a) Lengtes van de bladeren van een bepaald soort boom (in cm) worden ingedeeld in de klassen 6,5!< 7,5; 7,5!< 8,5; enz. Bepaal de klassenbreedte en de klassenmiddens. b) De leeftijden van de werknemers van een bepaald bedrijf worden in de volgende klassen ingedeeld 20! 24, 25! 29,, 60! 64. Bepaal de klassenbreedte en de klassenmiddens. c) Een theater houdt bij hoeveel kaartjes er voor een voorstelling worden verkocht. De klasse geeft het aantal voorstellingen weer waarvoor 200 tot en met 249 kaartjes verkocht zijn. Bepaal de klassenbreedte en het klassenmidden van deze klasse. d) Bij welke variabele uit de dataset met gegevens van 154 leerlingen is het zinvol/mogelijk een klassenindeling te maken? Licht je antwoorden toe. Verwerken! Practicum Hierbij hoort het practicum FREQUENTIETABELLEN EN DIAGRAMMEN MAKEN. In opgave 16 (of op je eigen dataset met gegevens) kun je dit toepassen. Opgave 14 Lichaamsafmetingen van 5001 vrouwen In 1947 hielden de wiskundigen Freudenthal en Sittig een statistisch onderzoek ten behoeve van een nieuw maatsysteem voor vrouwenkleding in opdracht van het warenhuis De Bijenkorf. Onder andere maten zij de mouwlengte van 5001 vrouwen in cm nauwkeurig. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 11
12 Hier zie je een frequentietabel met hun data. a) Met wat voor soort variabele heb je hier te maken? b) Maak een klassenindeling: 45! 49, 50! 54, enz. Maak bij die klassenindeling een histogram van relatieve frequenties. c) Vergelijk deze klassenindeling met de gegeven frequentietabel en beschrijf voordelen en nadelen ervan. d) Hoeveel procent van deze vrouwen heeft een mouwlengte van 65 cm of meer? e) Hoeveel procent van deze vrouwen heeft een mouwlengte van meer dan 65 cm?! Opgave 15 Leeftijdsdiagrammen Op de volgende pagina zie je het leeftijdsdiagram voor Nederland in het jaar Verder zijn er vier verschillende prognoses voor 2050 gedaan. a) Bepaal de klassenbreedte en het klassenmidden van de eerste klasse. b) Hebben alle klassen dezelfde breedte? c) Waarom staan in dit leeftijdsdiagram absolute frequenties en geen relatieve frequenties? d) Je kunt dit leeftijdsdiagram omzetten naar relatieve frequenties door percentages van het totaal aantal Nederlanders te nemen of door percentages van de aantallen mannen en vrouwen afzonderlijk te nemen. Noem van elke mogelijkheid een voordeel en licht je antwoord toe. e) Hoe kun je zien dat vrouwen gemiddeld langer leven dan mannen? f) De vier prognoses zijn gebaseerd op vier economische scenario s. Bij welk scenario is het vergrijzingsprobleem het sterkst in Nederland?! Opgave 16 Sportprestaties Gebruik het bestand!sportprestaties. Je vindt er gegevens van brugklassers op sportgebied. a) Welke vijf statistische variabelen tref je in deze dataset aan? Meld bij elke variabele om welke soort het gaat. b) Bij het vergooien gaat het om de geworpen afstand in meter met een kogel van 200 gram. Kies hierbij een geschikte klassenindeling en maak frequentietabellen en histogrammen voor de jongens en de meisjes afzonderlijk. c) Wat valt je op wat het vergooien betreft. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 12
13 CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 13
14 2.2 Centrum en spreiding! Practicum Bij deze paragraaf hoort het VUStat practicum CENTRUM en SPREIDING. Verkennen Opgave 17 Bekijk de dotplots. a) Waar zou je bij beide deelgroepen het midden van de frequentieverdeling plaatsen? Licht je antwoord toe. b) De mediaan is de lengte die op de helft van de verdeling zit, dus waar 50% van de lengtes onder zit (en dus ook 50% er boven). Bepaal de mediaan van de lengtes van de meisjes. Doe dat ook van de jongens. c) Bij welke deelgroep zijn de gegevens het meest verspreid? Licht je antwoord toe d) Laat bij de dotplot van de meisjes de twee grootste scores weg. Maakt dat veel verschil voor de mediaan? En voor de spreiding van de verdeling? e) Beantwoord dezelfde vragen als bij d) voor de jongens. f) De lengte met de grootste frequentie heet de modale lengte. Bepaal de modale lengte van de meisjes. En van de jongens. g) Bij de meisjes wordt één waarneming van 165 cm verplaatst naar de waarde 168 cm. Wat is nu de modale lengte? h) Bij de jongens worden vier waarnemingen verplaatst van 180 cm naar 181 cm. Wat is nu de modale lengte bij de jongens? Opgave 18 In een dorp wonen 10 mensen. Daarvan verdienen 9 inwoners maandelijks 1200 euro en één rijke inwoner euro per maand. a) Teken de dotplot van de inkomens. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 14
15 b) Schat het gemiddelde op het oog. c) Bereken het gemiddelde en geef die met een verticale lijn in je dotplot aan. Komt het gemiddelde overeen met de schatting uit opgave b? d) Waarom wordt wel gezegd dat het gemiddelde het evenwichtspunt van een verdeling is? e) Hoe groot is de mediaan van de inkomens? Vallen mediaan en gemiddelde enigszins samen? f) De rijke inwoner verhuist naar een stad. g) Ga na wat dat voor het dorp betekent voor het gemiddelde, de mediaan en het modale inkomen. Opgave 19 Bekijk opnieuw de dotplots. Het verschil tussen de grootste en de kleinste lengte heet de spreidingsbreedte. a) Bereken voor de lengte van de jongens de spreidingsbreedte. En voor de meisjes. b) De beide spreidingsbreedten verschillen nauwelijks. Vind je dat de spreiding van de lengten van de jongens en de meisjes vrijwel even groot is? Opgave 20 Je kunt een dataset in groepen van 25% verdelen, dus vier kwarten met evenveel data. Deze groepen hebben de vijf volgende grenzen: het minimum, het eerste kwartiel Q 1, de mediaan, het derde kwartiel Q 3 en het maximum. De boxplots hieronder maken dat goed zichtbaar. De beide middelste kwarten vormen de box. a) Welke lengtes hebben de 25% kleinste jongens? b) Laat met een berekening zien dat 25% van de langste meisjes inderdaad de lengten 173 tot en met 197 cm hebben. c) Bepaal nu zowel voor de jongens als de meisjes uit de dotplots de grenzen van de vier kwarten. Ga na dat deze grenzen de volgende boxplots opleveren. d) Hoeveel procent van de vrouwen is langer dan 165 cm? e) Hoeveel procent van de vrouwen is langer dan het derde kwartiel? En hoeveel procent heeft een lengte tussen de mediaan en het derde kwartiel? f) Waaraan kun je zien dat meer dan 75% van de vrouwen kleiner is dan de langste van de 25% kleinste mannen? g) Kun je aan de boxplot zien hoe de data binnen de box verspreid zijn? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 15
16 Opgave 21 Hieronder zie je een boxplot en een aantal dotplots, die erg van vorm verschillen. a) Verander bij elke dotplot één waarneming van plaats zodat de boxplot de verdeling goed weergeeft. b) Verzin zelf een dotplot die goed weergegeven wordt door deze boxplot. Uitleg Je kunt datasets samenvatten door:! getallen die aangeven waar de waarden omheen zijn gegroepeerd, waar het centrum van de waarden van een variabele zit, de centrummaten;! getallen die aangeven hoe ver de waarden van een variabele gespreid liggen, de spreidingsmaten. Het eerste kwartiel is de rechtergrens van de eerste 25% waarin je een dataset kunt verdelen. Het derde kwartiel is de rechtergrens van het derde kwart. Als centrummaten gebruik je de mediaan, het gemiddelde of de modus. Bekijk je de frequentieverdeling van de lengtes van de meisjes, dan is de spreidingsbreedte 197! 156 = 41 cm een voorbeeld van een spreidingsmaat. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 16
17 De kwartielafstand 173! 165 = 8 cm is ook zo n spreidingsmaat. Je kunt een combinatie van een centrum- en een bijpassende spreidingsmaat gebruiken om een frequentieverdeling te beschrijven. Een enkele centrummaat of spreidingsmaat zegt te weinig. Centrum- en spreidingsmaten kunnen echt onzinnig gebruikt worden: Wat te denken van het gemiddeld geboortejaar of de gemiddelde geboortemaand? En welke spreidingsmaat zou je voor de variabele profiel willen gebruiken? Je kijkt eerst naar de dataset om te zien wat zinnig is. Opgave 22 Bekijk de dotplots van de lengtes van de jongens en de meisjes nog eens. a) Maak van de lengten van de jongens een overzicht van de drie centrummaten en de twee spreidingsmaten. Welke centrummaat en welke spreidingsmaat geeft de dataset het beste weer? Onder een uitschieter versta je een waarde die meer dan 1,5 keer de kwartielafstand onder het eerste kwartiel of boven het derde kwartiel zit. b) Laat zien dat bij de jongens de waarden 161 en 200 cm uitschieters zijn. c) Laat deze data weg en maak een nieuw overzicht van de drie centrummaten en de twee spreidingsmaten. d) Welke spreidingsmaat wordt door deze uitschieters sterk beïnvloed en welke niet? e) Welke centrummaat wordt door deze uitschieters sterk beïnvloed? f) Vind je het verantwoord om uitschieters weg te laten bij het samenvatten van een frequentieverdeling? Geef argumenten voor en tegen. Opgave 23 Een bedrijf heeft 25 werknemers in vaste dienst met een volledige werkweek. De netto weeklonen van deze werknemers zijn verwerkt in deze frequentietabel. De weeklonen zijn verdeeld in klassen met een breedte van 50. De ruwe data zijn niet bekend. a) Waarom kun je vanuit deze frequentietabel de gemiddelde lengte niet meer precies uitrekenen, maar alleen nog schatten? b) Bepaal de klassenmiddens en bereken hiermee dit geschatte gemiddelde. c) Waarom kun je vanuit een klassenindeling zoals deze niet meer een nauwkeurige boxplot maken? Opgave 24 Dit is een staafdiagram van de profielkeuzes van de groep van 154 leerlingen in havo 4. a) Waarom kun je nu geen spreidingsmaten vaststellen? b) Je kunt wel vaststellen welk profiel de meeste jongens of de meeste meisjes heeft. Waarom kun je dat toch geen centrummaat noemen? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 17
18 c) Vergelijk nu de profielkeuzes van de meisjes en de jongens. Wat valt je op? d) Het staafdiagram van de profielkeuzes van de jongens is veel schever dan dat van de meisjes. Waarom kun je hier zo n uitspraak niet doen? Theorie *************************************** Een frequentieverdeling kun je karakteriseren door:! centrummaten, dus getallen die het centrum van de verdeling aangeven;! spreidingsmaten, dus getallen die de spreiding van de verdeling weergeven. De vier opeenvolgende kwarten waarin je een dataset kunt verdelen worden begrensd door:! het minimum, de laagste waarde;! het eerste kwartiel Q 1, de bovengrens van het kleinste kwart;! de mediaan, de bovengrens van het tweede kwart (dus precies op de helft);! het derde kwartiel Q 3, de bovengrens van het derde kwart;! het maximum, de hoogste waarde. De Q is afkomstig van het Engels woord quartile. Een boxplot maakt de kwarten zichtbaar. De box is het gebied tussen Q 1 en Q 3. Centrummaten zijn:! het gemiddelde, het evenwichtspunt van de verdeling;! de mediaan, de middelste waarde van de verdeling;! de modus, de meest voorkomende waarde. Spreidingsmaten zijn:! de kwartielafstand, Q 3! Q 1, (Engels: Inter Quartile Range IQR)! de spreidingsbreedte, maximum - minimum Vanuit klassenindelingen zijn deze centrum- en spreidingsmaten alleen nog te schatten omdat de ruwe data in een klassenindeling niet meer terug zijn te vinden. In plaats van modus wordt dan van modale klasse gesproken. Het is ook van belang na te gaan welke maten zinnig zijn. Om een frequentieverdeling goed samen te vatten is een centrummaat en een bijpassende spreidingsmaat nodig. Een uitschieter is een waarde die meer dan 1,5 keer de kwartielafstand onder het eerste kwartiel of boven het derde kwartiel zit. ********************************************* CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 18
19 Voorbeeld Je ziet hier een staafdiagram met de gewichten van de meisjes. Bereken de mediaan en het gemiddelde van de gewichten in één decimaal nauwkeurig. Bereken ook de spreidingsbreedte en de kwartielafstand. Ga na welke van deze centrum- en spreidingsmaten het meest zinvol is. Uitwerking: De mediaan verdeelt de gewichten in twee gelijke delen (ze staan al op volgorde). Omdat er 84 meisjes zijn die hun gewicht hebben opgegeven neem je hiervoor het gemiddelde van het 42 e en het 43 e gewicht. Het 42 e gewicht is 56 kg en het 43 e ook, dus de mediaan is 56 kg. Het gemiddelde gewicht bereken je met behulp van een frequentietabel. Je maakt dan een extra kolom met gewicht x frequentie. Het gemiddelde wordt 4771 " 56,8 kg. 84 De spreidinsgbreedte is hier 76! 40 = 36 kg. Voor de kwartielafstand moet je beide kwartielen Q 1 en Q 3 bepalen. Q 1 verdeelt de eerste helft van de gewichten weer in twee gelijke delen en is dus het gemiddelde van het 21 e en het 22 e gewicht. Dus Q 1 = 52 kg. En op dezelfde manier is Q 3 = 60 kg. De kwartielafstand is daarom 60! 52 = 8 kg. Maar goed dat je deze getallen in het vervolg meestal door de computer laat berekenen. Hoe zinvol zijn nu al die maten? De modale lengte zegt niet veel over de verdeling, in dit geval zit die lengte nog redelijk in het midden, maar dat is CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 19
20 toeval. Juist de waarden die meer in het midden zitten komen weinig voor. De mediaan is een zinvolle maat, 50% van de lengtes zit er onder en 50% zit er boven. Ook het gemiddelde is hier een zinvolle maat: in dit geval met die gewichten is het letterlijk het evenwichtspunt van de verdeling. De kwartielafstand is als maat voor de spreiding ook geschikter dan de spreidingsbreedte: die laatste maat wordt nogal bepaald door de uitschieters bij deze verdeling. Dat geldt voor de kwartielsfafstand niet. " Opgave 25 Bekijk het staafdiagram voor de gewichten van de jongens. a) Bereken de mediaan en het gemiddelde van de gewichten van de jongens. b) Waarom is nu de modus niet eens vast te stellen? c) Bepaal de spreidingsbreedte en de kwartielafstand. d) Er is bij de jongens één uitschieter. Welke centrummaat en/of spreidingsmaat verandert het sterkst als je deze uitschieter weg laat? e) Veranderen de centrum- en/of de spreidingsmaten als je alle absolute frequenties omrekent naar relatieve frequenties? f) Hoeveel wegen de 25% lichtste jongens? g) Hoeveel procent van de jongens weegt meer dan 78 kg? Opgave 26 Op de volgende bladzijde zie je opnieuw frequentieverdelingen van de gewichten van de jongens en de meisjes. Ze zijn nu elk gegroepeerd in klassen. De vraag is of je de centrummaten dan nog kunt berekenen. a) Waarom kun je vanuit deze frequentieverdelingen de mediaan niet meer vaststellen? In welke klasse zit de mediaan bij de meisjes? En bij de jongens? b) Maak bij deze klassenindeling frequentietabellen voor de gewichten van de jongens en de meisjes en voeg daaraan de klassenmiddens toe. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 20
21 c) Waarom kun je met deze klassen het gemiddelde alleen nog maar schatten? Geef een schatting van het gemiddelde met behulp van de klassenmiddens zowel voor de jongens als voor de meisjes. d) Wijken je antwoorden af van die in het voorbeeld en vorige opgave? Opgave 27 In een bedrijf met 120 medewerkers is het modale salaris ongeveer! 1600,- per maand. Het gemiddelde salaris is! 1800,- per maand. Het hoogste salaris is dat van de algemeen directeur. Deze boxplot vat de verdeling van de salarissen samen. Bereken in de volgende gevallen telkens weer het modale salaris en het gemiddelde salaris en teken het nieuwe boxplot. a) Alle medewerkers krijgen een loonsverhoging van 3%. b) Alle medewerkers krijgen een maandelijkse toeslag van! 200,-. c) Het salaris van de algemeen directeur wordt met! 800,- per maand verhoogd. Opgave 28 Als je in de sportzaal een tijdje een bepaalde oefening hebt gedaan, gaat je polsslag omhoog. In dit tweezijdige steelblad diagram vind je wat data. Van elke sporter werd één keer voor en één keer na de oefening de polsslag gemeten. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 21
22 a) Waarom zegt de modale polsslag hier weinig over het centrum van de verdeling? Is de modale polsslag een zinvol getal? b) Bereken de gemiddelde polsslag voor en ook na de oefening. Is dit hier een bruikbare centrummaat? c) Bepaal de mediaan en de kwartielen. Zijn hier twee boxplot s een geschikt middel om beide datasets te vergelijken? d) Is het wel handig om de polsslag voor en na de oefening apart in beeld te brengen? Verwerken! Practicum Hierbij hoort het practicum CENTRUM- EN SPREIDING. In opgave 31 (of op je eigen dataset) kun je dit toepassen. Opgave 29 Voor een bepaalde toets kun je maximaal 100 punten scoren. Hier zie je hoe een groep van 40 personen de toets heeft gemaakt a) Hoeveel bedraagt de gemiddelde score in één decimaal nauwkeurig? b) Teken de boxplot bij deze scores. c) Welke centrummaat vat de data het beste samen? d) Leg uit dat de schatting van het gemiddelde steeds onnauwkeuriger wordt als je de klassenbreedte vergroot. Opgave 30 Je ziet op de volgende pagina boxplots van het aantal geboorten in ziekenhuizen per dag voor de verschillende dagen van de week. a) Op welke dag van de week is de spreidingsbreedte van het aantal geboortes in ziekenhuizen het grootst? Waarom kun je de dagen niet goed vergelijken met behulp van de spreidingsbreedten? b) Op welke dag van de week is de kwartielafstand van het aantal geboortes in ziekenhuizen het grootst? c) Hoeveel procent van de zondagen zijn er minder dan 400 geboortes in ziekenhuizen? d) Vergelijk de maandag en de vrijdag. Van beide dagen zijn er 52 per jaar. Op welk van deze dagen zijn er in één jaar de meeste bevallingen? Licht je antwoord toe. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 22
23 e) Leg uit waarom het mogelijk is dat het modale aantal bevallingen per dag voor elk van deze dagen hetzelfde is. f) Is het ook mogelijk dat het gemiddelde aantal bevallingen per dag voor elk van deze dagen gelijk is? Licht je antwoord toe.! Opgave 31 Sportprestaties Gebruik het bestand!sportprestaties. Je vindt er gegevens van brugklassers op sportgebied. a) Bereken voor het vergooien alle centrummaten en alle spreidingsmaten vanuit de ruwe data. b) Waarom kun je dit altijd beter vanuit de ruwe data doen dan vanuit een klassenindeling? c) In opgave 16 heb je het vergooien geanalyseerd. Probeer opnieuw conclusies te trekken over het vergooien. Gebruik daarbij de centrum- en de spreidingsmaten. Vermeld ook vooral welke centrum- en welke spreidingsmaten hier zinvol zijn. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 23
24 2.3 Verdelingen typeren! Practicum Bij deze paragraaf hoort het VUStat practicum VERDELINGEN. Verkennen De volgende diagrammen komen uit de dataset!gegevens154leerlingen. Je zou je kunnen afvragen of bij het kiezen voor een bepaald profiel het cijfer voor wiskunde een rol heeft gespeeld. Je kunt daarom bijvoorbeeld per profiel eens kijken naar de verdeling van de cijfers voor wiskunde in 3 havo. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 24
25 Opgave 32 Je ziet hier histogrammen van de wiskundecijfers in 3 havo voor de leerlingen in de verschillende profielen. a) Beschrijf de verschillen in vorm van deze frequentieverdelingen. Wat valt je daarbij op? b) Vergelijk deze frequentieverdelingen. Probeer conclusies te trekken. c) Bepaal van de vier verdelingen de mediaan en het gemiddelde. d) Bij welke van deze vier verdelingen liggen mediaan en gemiddelde het dichtst bij elkaar? Kun je dit ook aan het histogram zien? e) Waarom zou je de verdeling van de wiskundecijfers in 3 havo voor het NTprofiel een scheve verdeling noemen? f) Welke verdeling is het meest symmetrisch? Opgave 33 Bekijk de verdeling van het profiel NG nog eens. Ga er van uit dat alle frequenties gehele percentages zijn. a) Hoeveel procent van de NG-leerlingen had in 3 havo een wiskundecijfer kleiner of gelijk aan 7? b) Hoeveel procent van die leerlingen had in 3 havo een wiskundecijfer kleiner of gelijk aan 8? Je noemt de frequenties die je bij a en b hebt berekend wel somfrequenties. Bij somfrequenties tel je bij de frequentie van bijvoorbeeld het cijfer 7 ook de frequenties van alle voorgaande cijfers op: je stapelt de frequenties als het ware op elkaar. In dit geval stapel je relatieve frequenties op elkaar. c) Maak een tabel waarin bij elk cijfer de relatieve somfrequentie staat. d) Welk percentage had een cijfer kleiner of gelijk 5? e) Maak van je tabel een lijndiagram. f) Maak ook voor de andere drie profielen zo n lijndiagram van de relatieve somfrequenties. Teken ze allemaal in één figuur. Uitleg Je ziet dat bij een statistische variabele als wiskundecijfer 3 havo nog veel verschillende verdelingen mogelijk zijn. Bij elke deelgroep waarbij je deze variabele bekijkt ontstaat weer een nieuwe verdeling. Bovendien is bij kwantitatieve variabelen de wijze waarop je ze indeelt in klassen van invloed op de vorm van de verdeling. Bij de vorm van een frequentieverdeling let je op:! de symmetrie;! de scheefheid;! het aantal toppen;! een staart waarin een verdeling uitloopt;! de uitschieters;! de gelijkmatigheid (vrijwel gelijke frequenties). Een andere manier om een verdeling in beeld te krijgen is met behulp van somfrequenties: dat is de totale frequentie voor een waarde en kleiner dan die waarde. Je stapelt dan als het ware de frequenties op elkaar: bij elke frequentie tel je die van de voorgaande waarden (klassen) op. Daarom spreek je ook wel van cumulatieve frequenties ( cumuleren betekent opstapelen ). CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 25
26 Zo worden de somfrequenties bij het cijfer 7 verkregen door de frequenties van de cijfers 5, 6 en 7 op te tellen. Je hebt lijndiagrammen van die somfrequenties getekend. Zo n lijndiagram noem je een somfrequentiepolygoon of cumulatief frequentiepolygoon. Opgave 34 Hieronder zie je dotplots van een aantal datasets. Beschrijf van elke dataset de vorm van de verdeling. Ga daarbij elk van de genoemde vormkenmerken na. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 26
27 CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 27
28 Opgave 35 Hieronder staan histogrammen van de lengteverdeling van sporters. Eén ervan gaat over basketballers, één over hardlopers en één over gewichtheffers. I II III a) Bij welke van deze histogrammen is duidelijk sprake van een scheve verdeling? b) Welke van deze histogrammen is het meest symmetrisch? c) Welke van deze histogrammen is het meest gelijkmatig? d) Welke van deze histogrammen is duidelijk tweetoppig? Over welke soort sporters gaat dit histogram? Kun je de tweetoppigheid verklaren? e) Welke van deze drie histogrammen gaat over gewichtheffers? Waarom? f) Bij welke van deze histogrammen zitten de mediaan en het gemiddelde beide ongeveer in het midden van de verdeling? g) Bij welke van deze histogrammen is de mediaan het grootst? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 28
29 Opgave 36 Je kunt de lengteverdelingen in de vorige opgave ook vergelijken met behulp van somfrequentiepolygonen. a) Welke klassenindeling is er bij de histogrammen gebruikt? b) Neem histogram I. Hoeveel procent van de sporters is daarin kleiner dan 170 cm? c) Maak een tabel van de klassen bij histogram I met de cumulatieve frequenties. d) Waarom moet je bij klassen de somfrequenties boven de rechterklassengrenzen uitzetten? e) Teken een somfrequentiepolygoon bij histogram I. f) Teken in dezelfde figuur de cumulatieve frequentiepolygonen bij de andere twee histogrammen. g) Vergelijk de lengteverdelingen van de sporters. Wat valt op? Theorie *************************************** Bij de vorm van een frequentieverdeling let je op:! de symmetrie;! de scheefheid;! het aantal toppen;! een staart;! de uitschieters;! de gelijkmatigheid. Bij een symmetrische verdeling vallen mediaan en gemiddelde vrijwel samen. De somfrequentie, ook wel cumulatieve frequentie genoemd, is de totale frequentie van een bepaalde waarde en die van alle kleinere waarden samen. Je stapelt dan als het ware de frequenties op elkaar: bij elke frequentie tel je de voorgaande frequenties op. Een lijndiagram van de somfrequenties van een bepaalde verdeling noem je een somfrequentiepolygoon of cumulatief frequentiepolygoon. Bij een klassenindeling worden de somfrequenties bepaald door de frequenties van een bepaalde klasse en alle voorgaande klassen op te tellen. Deze somfrequenties worden dan uitgezet boven de rechter klassengrenzen. ********************************************* Voorbeeld Je wilt nagaan of leerlingen die wiskunde B kiezen beter waren in wiskunde in de onderbouw dan leerlingen die wiskunde A kiezen. Daartoe bekijk je de variabele cijfwis (het eindcijfer voor wiskunde in 3 havo) voor elk van deze deelgroepen. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 29
30 Het linker diagram lijkt redelijk symmetrisch met als top het cijfer 8. De mediaan van deze gegevens is 8 en het gemiddelde is 7,7. Het rechterdiagram is in het midden meer gelijkmatig en er is geen echte top. De mediaan van deze gegevens is 7 en het gemiddelde 6,9. Het cijfer 10 wijkt behoorlijk veel af van de andere cijfers, maar is nog net geen uitschieter. Hier zie je de somfrequentiepolygonen van beide verdelingen cum.rel.freq wis A wis B wiskundecijfer havo 3 Nu zie je dat de wiskunde B leerlingen stelselmatig hogere cijfers hebben (op de uitschieter na). Bijvoorbeeld had ongeveer 40% van de A-leerlingen een wiskundecijfer van 6 of lager, tegen nog geen 10% van de B-leerlingen. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 30
31 " Opgave 37 Bekijk het voorbeeld. Alle percentages zijn gehele getallen. a) Waarom kun je geen van beide verdelingen scheef noemen? b) Reken de gemiddelden en de medianen van beide verdelingen na. c) De somfrequenties zijn uitgezet tegen de gehele cijfers 5, 6, 7, Is dat hier correct? d) Ongeveer 70% van de leerlingen met wi A hebben een cijfer van 7 of lager. Hoeveel % van de leerlingen met wi B hebben zo n cijfer? Opgave 38 Je ziet hier de frequenties (in procenten) van de lengtes van de meisjes en de jongens uit de dataset!gegevens154leerlingen. Lengteklassen Rel. freq. jongens Rel. freq. meisjes 155!< !< !< !< !< !< !< !< !< !< a) Maak zelf cumulatieve relatieve frequentiepolygonen bij de lengtes van de meisjes en de jongens bij deze klassenindeling. Denk er om dat nu de somfrequenties bij de rechter klassengrenzen horen! b) Vanuit deze somfrequentiepolygonen kun je de medianen en de kwartielen schatten. Bij welk percentage vind je de mediaan? En de kwartielen?! Opgave 39 Je ziet op de volgende pagina s een drietal afbeeldingen van een animatie die is te vinden op de site van het CBS. Het zijn staafdiagrammen die de inkomensverdeling in Nederland in 2007 in kaart brengen. a) Beschrijf de vormen van al deze verdelingen. b) Bepaal voor elke verdeling de spreidingsbreedte. c) Ga voor elke verdeling na hoe het modale inkomen, de mediaan en het gemiddelde ten opzichte van elkaar liggen. d) Vergelijk de inkomensverdelingen van de deelgroepen Paar met kinderen en Paar zonder kinderen en Alleenstaanden. Probeer ook een verklaring van de verschillen te geven. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 31
32 CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 32
33 Verwerken! Practicum Hierbij hoort het practicum CUMULATIEVE FREQUENTIES. Je kunt dit weer toepassen bij de opgaven 41 en 42 en op eigen gegevens. Opgave 40 Hier zie je de leeftijdsopbouw van leraren in het primair onderwijs (po) en het voortgezet onderwijs (vo) in de jaren 1995 en a) Teken histogrammen van de verdeling van de leeftijdsopbouw voor 1995 en 2005 in het po. b) Beschrijf de verschillen tussen beide verdelingen. Leg met name uit waar je de nieuwe instroom van leraren in het po aan herkent. c) Bepaal de klassenmiddens en geef daarmee een schatting van de gemiddelde leeftijden in het po in 1995 en in d) Teken histogrammen van de verdeling van de leeftijdsopbouw voor 1995 en 2005 in het vo. e) Beschrijf de verschillen tussen beide verdelingen. Leg met name uit waaraan je de uitstroom van leraren in het vo kunt zien. f) Teken de cumulatieve relatieve frequentiepolygonen voor het vo in één figuur. Teken er boxplots bij. g) Vergelijk beide verdelingen nog eens. Welke conclusie trek je voor het vo? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 33
34 ! Opgave 41 Sportprestaties a) Vergelijk de verdelingen voor de prestaties van de jongens en de meisjes bij het vergooien. Gebruik daarbij de verschillen in vorm, de verschillen tussen de centrummaten en de spreiding van de verdelingen. b) Maak cumulatieve relatieve frequentieverdelingen. Probeer ook daaruit conclusies te trekken.! Opgave 42 Reactiesnelheden Verzin een manier om iemand s reactiesnelheid te meten. Maak vervolgens een histogram van de verdeling van zijn reactiesnelheden. Doe dit voor meerdere personen en zet de gegevens in de computer. a) Maak voor een aantal personen een histogram van de reactiesnelheden. b) Beschrijf de vorm van deze histogrammen. c) Bereken de centrummaten en spreidingsmaten die zinvol zijn en leg uit waarom ze dat zijn. d) Vergelijk de prestaties van deze personen en gebruik daarbij het voorgaande. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 34
35 2.4 Relaties! Practicum Bij deze paragraaf hoort het VUStat-practicum RELATIES: KRUISTABELLEN. Verkennen Je werkt weer met de dataset!gegevens154leerlingen. Je zou je kunnen afvragen of bij het kiezen voor wiskunde A dan wel wiskunde B het geslacht een rol speelt: bestaat er een relatie tussen het geslacht en de keuze voor de soort wiskunde? Opgave 43 Hier zie je hoe je in een kruistabel de variabelen geslacht (j = jongen, m = meisje) en wiskundegroep met elkaar kunt combineren. a) Hoeveel meisjes kozen wiskunde B? b) Vul in beide boomdiagrammen de aantallen in. c) Welk percentage van de meisjes koos wiskunde B? Rond af op één decimaal nauwkeurig. d) Hoeveel jongens kozen wiskunde B? Welke percentage van de jongens is dat? e) Bereken het percentage van de wiskunde B leerlingen jongen is. Welk diagram kun je daarvoor het beste gebruiken? Opgave 44 In het boomdiagram hiernaast zijn de meisjes en de jongens elk op 100% gesteld. a) Vul het boomdiagram verder in. b) Maak een nieuwe kruistabel met de hiervoor berekende percentages. c) Hoeveel verschillen de percentages bij de meisjes? Wat valt je daarbij op? d) Wat valt je op in vergelijking met de percentages van de jongens? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 35
36 Opgave 45 Je kunt in de kruistabel van de vorige opgave ook kijken naar het percentage wiskunde B leerlingen dat meisje dan wel jongen is. a) Hoeveel procent van de leerlingen bij wiskunde B is een meisje? b) Waarom ziet het bijpassende boomdiagram er nu zo uit als dit hiernaast? c) Maak weer de bijpassende kruistabel met percentages. d) Hoeveel verschillen de percentages jongens en meisjes bij de wiskunde B leerlingen? Opgave 46 Hier zie je een kruistabel waarin de variabele geslacht is uitgezet tegen plezier (met plezier naar school gaan). De variabele plezier is een vijfpuntsschaal: 1=nee, 2=weinig, 3=neutraal, 4=behoorlijk, 5=veel. a) Heb je hier met kwalitatieve of kwantitatieve variabelen te maken? b) Is bij de variabele geslacht de volgorde van belang? En hoe zit dat bij de variabele plezier? Uitleg Je hebt nu kruistabellen gebruikt om iets te kunnen zeggen over de relatie tussen de soort wiskunde (A of B) en het geslacht (j = jongen, m = meisje). Zo n kruistabel werkt zowel voor kwalitatieve als kwantitatieve variabelen. In de situaties hierboven zijn beide variabelen kwalitatief. Om eerlijk te kunnen vergelijken gebruik je percentages. Daarbij moet je goed afspreken waar je naar kijkt:! de verdeling van de variabele geslacht over de soort wiskunde, of! de verdeling van de variabele wiskundegroep over het geslacht. Kijk je naar de verdeling van de variabele wiskundegroep over het geslacht, dan worden de totalen per wiskundegroep op 100% gesteld. In de kruistabel die je hiervoor tegenkwam betekent dit verticaal percenteren: het totaal van elke kolom wordt 100%. Kijk je naar de verdeling van de variabele geslacht over de soort wiskunde, dan worden de totalen per geslachtsgroep op 100% gesteld. In de kruistabel die je hiervoor tegenkwam betekent dit horizontaal percenteren: het totaal van elke rij wordt 100%. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 36
37 In opgave 46 heb je ontdekt dat je kwalitatieve variabelen kunt verdelen in! nominale variabelen waarbij je geen volgorde kunt vaststellen, de waarden hebben slechts een naam;! ordinale variabelen waarbij je wel een volgorde kunt bepalen. Opgave 47 Hier zie je de kruistabel die je kunt maken van de variabelen cijfwis (wiskundecijfer eind 3 havo) en profiel. a) Welke van beide variabelen is kwalitatief? Is die variabele ordinaal of nominaal? b) Wat betekent de rij (leeg)? Waarom is er geen kolom met opschrift (leeg)? c) Je wilt nu de frequentieverdeling van de variabele cijfwis over de profielen bestuderen. Hoe ga je dan percenteren: horizontaal of verticaal? Licht je antwoord toe. d) Maak nu de bij c passende kruistabel met percentages. e) Kun je door de percentages te vergelijken een conclusie trekken over de verdeling van cijfwis over de profielen? Opgave 48 Bekijk de kruistabel van de voorgaande opgave nog eens. Je wilt de verdeling van de variabele profiel over de wiskundecijfers eind 3 havo bekijken. Maak een bijpassende kruistabel met percentages en probeer ook nu conclusies te trekken.! Practicum Bij deze paragraaf hoort het VUStat-practicum RELATIES: SPREIDINGSDIAGRAMMEN. Verkennen Opgave 49 Wanneer beide variabelen kwantitatief zijn, dan kun je ook naar een onderlinge samenhang kijken door een spreidingsdiagram te maken. Op de volgende bladzijde zie je zo n spreidingsdiagram voor de variabelen lengte (cm) en gewicht (kg) bij de deelgroep meisjes. a) Minstens hoeveel meisjes hebben een lengte van 170 cm? Waarom weet je dit aantal niet zeker? b) Kun je zeggen dat bij deze groep de kleinere meisjes ook minder zwaar zijn? c) Zou er een relatie tussen lengte en gewicht bij deze groep meisjes bestaan? Zo ja, beschrijf die relatie. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 37
38 Opgave 50 In een provincie neemt het aantal ooievaars en het aantal geboorten af. Het spreidingsdiagram geeft een statistisch verband te zien. Bestaat er wel een verband tussen aantal ooievaars en het aantal geboorten? Uitleg Bij kwantitatieve variabelen wordt meestal gebruikt gemaakt van een spreidingsdiagram zoals dat in de opgave hierboven, waarin je op de éne as de variabele lengte (cm) en op de andere as de variabele gewicht (kg) uitzet. Het spreidingsdiagram is een wolk van punten (een puntenwolk dus) die in meerdere of mindere mate een patroon vertonen. Die puntenwolken kunnen verschillende vormen hebben. Die vorm bepaalt dan of er sprake is van een statistisch verband tussen beide variabelen. Hier zie je een paar situaties getekend. Spreidingsdiagram met een statistisch verband tussen x en y. Spreidingsdiagram met een statistisch verband tussen x en y. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 38
39 Spreidingsdiagram met een sterk statistisch verband tussen x en y. Spreidingsdiagram zonder duidelijk statistisch verband tussen x en y. Spreidingsdiagram met een sterk statistisch verband tussen x en y. Spreidingsdiagram met een sterk statistisch verband tussen x en y. Een verband waarbij de toename (of afname) van de éne variabele een gevolg is van een toename (of afname) van de andere heet causaal: er is dan sprake van oorzaak en gevolg. Een statistisch verband tussen twee variabelen hoeft niet causaal te zijn, zoals opgave 50 laat zien. Andere variabelen kunnen de oorzaak zijn dat er bij twee variabelen een statistisch verband optreedt. Het is zeker niet zo, dat een grotere lengte veroorzaakt dat je daardoor automatisch ook een groter gewicht hebt. Een statistisch verband is een kenmerk van een hele dataset en niet een kenmerk van elke persoon. Je kunt wel met een zekere waarschijnlijkheid een voorspelling doen met het statistische verband. Opgave 51 Op de volgende pagina zie je een spreidingsdiagram voor de variabelen lengte (cm) en gewicht (kg) van de jongens in onze dataset van 154 leerlingen. a) Tussen welke waarden liggen de gewichten van jongens met een lengte van 170 cm in dit diagram? b) Bij welke lengte is de spreiding van de gewichten het grootst? c) Is er sprake van een statistisch verband tussen lengte en gewicht bij deze jongens? d) Jan hoort eigenlijk ook bij deze groep leerlingen, maar heeft niet meegedaan aan het onderzoek. Hij is 198 cm lang. Kun je voorspellen tussen welke waarden zijn gewicht ligt? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 39
40 Opgave 52 Neem aan dat er in de volgende situaties sprake is van een statistisch verband. Ga na of het verband ook causaal is. a) Bij toename van ijsverkoop neemt het aantal beten van badgasten door haaien toe. b) Bij kinderen geldt dat toename van de taalvaardigheid komt door toename in hun gewicht. c) Als het aantal ambtenaren toeneemt neemt ook de inflatie toe. d) Als de bevolking afneemt worden de prijzen van etenswaren hoger. Opgave 53 Op verschillende hoogten boven de zeespiegel en op verschillende plaatsen in de Amerikaanse staat Nevada is de temperatuur gemeten in graden Celsius. Daarna is per hoogte de gemiddelde jaartemperatuur berekend. In de puntenwolk zijn deze data weergegeven. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 40
41 a) Is er sprake van een statistisch verband tussen beide variabelen? En wat voor soort verband lijkt er dan bij aan te sluiten? b) Probeer op grond van je antwoord bij a) te voorspellen tussen welke waarden van de temperatuur op 0 m hoogte zal liggen. c) Geef ook zo n schatting van de hoogte waarop de temperatuur onder 0 C komt. d) Voor wie is dergelijke informatie nuttig? Theorie *************************************** Wanneer je binnen een dataset zoekt naar relaties tussen twee statistische variabelen gebruik je! een kruistabel;! een puntenwolk of spreidingsdiagram (Engels: scatter plot). Bij een kruistabel kun je het beste variabelen vergelijken als je de aantallen hebt omgerekend naar percentages. Je kunt dan kijken naar verschillen tussen de kolommen als je de kolomtotalen op 100% hebt gesteld (verticaal percenteren). Je kunt kijken naar verschillen tussen de rijen als je de rijtotalen op 100% hebt gesteld (horizontaal percenteren). Afhankelijk van de vorm van een puntenwolk kun je vastellen of er een statistisch verband tussen beide variabelen is en zo ja of dat verband sterk is. Let wel: je stelt dan alleen vast dat er een statistisch verband tussen beide variabelen is. Het is de vraag of dat verband ook causaal is. Je kunt wel een voorspelling doen met behulp van een statistisch verband. ********************************************* Verwerken! Practicum: Hierbij hoort het practicum KRUISTABELLEN EN SPREIDINGSDIAGRAMMEN. Dit kun je toepassen in opgave 57 en op eigen gegevens. Opgave 54 Kleurenblindheid Bij een onderzoek over kleurenblindheid is 1000 mensen gevraagd of ze een vorm van kleurenblindheid hebben of niet. In totaal werden er 600 mannen bevraagd, waarvan er 65 aangaven kleurenblind te zijn. Van de vrouwen bleken er maar 7 kleurenblind te zijn. a) Maak met deze gegevens een kruistabel van de variabelen kleurenblindheid en geslacht. b) Welke deel van de kleurenblinden in deze groep is van het mannelijk geslacht? c) Welk deel van de mannen in deze groep is kleurenblind? CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 41
42 d) Zou er een relatie bestaan tussen beide variabelen? Zo ja, beschrijf dan die relatie. Opgave 55 Zomer Leg uit waarom er wel een statistisch verband is tusen ijsverkoop en verkoop van zonnebrillen in de zomer maar geen causaal verband. Opgave 56 Golf Een groep Amerikaanse golfers heeft bij het putten (het slaan van de golfbal met als doel dat hij in de hole terecht komt en niet dat hij alleen maar in de buurt van de hole komt) hun percentage successen berekend afhankelijk naar de afstand tot de hole (de length in m). Hier zie je de resultaten. a) Schat het succespercentage bij een afstand van 15 m tot de hole. b) Hoe groot is het succespercentage bij 0 m? c) Er lijkt een statistisch verband te bestaan tussen de variabelen succes en length. Wat kun je zeggen van het succespercentage bij een length van 30 m? d) En wat gebeurt er met het succespercentage als de afstand tot de hole steeds groter wordt?! Opgave 57 Sportprestaties a) Vergelijk de voor de prestaties van de jongens en de meisjes bij het verspringen met behulp van kruistabellen. Deel daartoe eerst de gesprongen afstanden in 5 klassen in. Percenteer zowel horizontaal als verticaal en bekijk of je dan iets opvalt. b) Maak een puntenwolk bij de variabelen sprint en verspringen. Onderzoek of je een statistisch verband aantreft tussen beide variabelen en zo ja, beschrijf dan dit verband. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 42
43 Overzicht Je hebt nu alle theorie van het onderwerp Data en datasets verwerken doorgewerkt. Het is nu tijd om een overzicht over het geheel te krijgen. Begrippen 21: dataset frequentieverdeling frequentietabel klassenindeling klassenmidden klassenbreedte klassengrenzen deelgroepen 22: centrummaat spreidingsmaat modus, modale waarde spreidingsbreedte, variatiebreedte boxplot minimum maximum mediaan eerste kwartiel derde kwartiel kwartielafstand 23: soorten verdelingen: symmetrisch of scheef cumulatieve frequenties cumulatief frequentiepolygoon 24: verband tussen twee statistische variabelen kruistabel spreidingsdiagram en puntenwolk nominale en ordinale kwalitatieve variabelen Vaardigheden 21: een ruwe dataset indelen in klassen soorten variabelen onderscheiden histogrammen tekenen 22: de genoemde centrummaten en spreidingsmaten bepalen vanuit de ruwe data en vanuit een gegeven klassenindeling 23: soorten verdelingen herkennen cumulatieve frequentiepolygonen maken 24: kruistabellen maken en interpreteren spreidingsdiagrammen maken en interpreteren Opgave 58 Samenvatten Maak een samenvatting van dit onderwerp door bij elk van de genoemde begrippen een omschrijving of een voorbeeld te geven en bij elk van de genoemde vaardigheden een voorbeeld te geven. Vooral een overzicht van de meest voorkomende tabellen en diagrammen, de manier waarop je er gegevens uit afleest, en de situaties waarin je ze gebruikt, is erg nuttig. Sommige diagrammen moet je ook met de hand kunnen tekenen. Toetsen Opgave 59 Hieronder wordt een aantal situaties beschreven. Geef bij elke situatie aan over welke variabele hij gaat en op welke manier je de situatie zult weergeven met tabellen, diagrammen, kruistabellen, etc. Schrijf telkens de redenen op voor de keuze die je maakt. a) De percentages leerlingen van 16 jaar verdeeld over de verschillende schooltypen in een bepaald jaar. b) Het verloop van de percentages leerlingen van 16 jaar verdeeld over de verschillende schooltypen in de laatste 5 jaar. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 43
44 c) De door de politie gemeten snelheden van automobilisten op een bepaalde dag en plek binnen de bebouwde kom. d) De verdeling van de inkomens van de werknemers van een bepaald middelgroot bedrijf. e) De mening van je klasgenoten over het lesrooster dat ze hebben. f) Het verband tussen zithoogte en lichaamslengte bij mensen die bureauwerk doen. g) De tijd die jouw klasgenoten dagelijks doorbrengen voor de pc. Opgave 60 Deze twee boxplots laten de verdeling in de V.S. zien van de aanvangssalarissen van mensen die zijn afgestudeerd in computer science of in psychologie. De bedragen zijn in $ per jaar. a) In welke groep zit de persoon met het hoogste aanvangssalaris? Waaraan zie je dat het hier een uitschieter betreft? b) Als je uitschieters niet meerekent, hoeveel % van de mensen die in de computer science zijn afgestudeerd verdient dan meer dan welke afgestudeerde psycholoog ook? Om welke bedragen gaat het? c) Schat hoeveel procent van de afgestudeerde psychologen een lager aanvangssalaris heeft dan de slechtst betaalde computer scientist. Opgave 61 Je ziet hier een viertal histogrammen. Geef bij elk histogram aan of er sprake is van een gelijkmatige, een symmetrische, een scheve, en/of een tweetoppige verdeling. Geef bij elk histogram de modale klasse, de klasse waarin de mediaan zit en een schatting van het gemiddelde. A B C D CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 44
45 Opgave 62 Deze tabel geeft de leeftijden van het personeel van twee bedrijven. a) Verwerk de aantallen werknemers van beide bedrijven in een histogram van relatieve frequenties. b) Kun je iets zeggen over de leeftijdsopbouw van deze bedrijven? c) Teken de cumulatieve relatieve frequentiepolygonen bij deze gegevens in één figuur. d) Welke van beide bedrijven heeft naar verhouding het oudste personeel? e) Beide bedrijven willen fuseren. Werknemers vanaf 60 jaar kunnen gebruik maken van een afvloeiingsregeling. Hoeveel procent van de werknemers van het gefuseerde bedrijf kunnen daarvan gebruik maken? Opgave 63 Sommige autorijders en motorrijders raken bij een ongeluk betrokken. 12% daarvan zijn motorrijders. Van de auto- en motorrijders die bij een ongeluk betrokken waren houdt 10% enig letsel over. Die 10% is verdeeld in 8% voor de automobilisten en 2% voor de motorrijders. a) Het lijkt er op dat er meer mensen letsel ondervinden bij een ongeluk met een auto dan bij een ongeluk met een motor. Waarom is die conclusie voorbarig? b) Vul deze kruistabel in: voertuig letsel auto motor totaal niet wel totaal 100% c) Je wilt weten hoeveel procent van de ongelukken met een auto letsel hebben opgeleverd. Hoe moet je dan percenteren in deze kruistabel? d) Maak een nieuwe kruistabel waarmee je de percentages ongelukken met letsel voor de auto en de motor kunt vergelijken. Examenopgaven Opgave 64 Oversteken Men heeft onderzoek gedaan naar de loopsnelheden van voetgangers. Bij dit onderzoek zijn de voetgangers in 3 leeftijdsgroepen verdeeld, namelijk kinderen, volwassenen en ouderen. Met de gegevens uit het onderzoek heeft men een boxplot gemaakt voor de loopsnelheden van de groep ouderen. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 45
46 De snelheden die bij de boxplot vermeld zijn, zijn in meters per seconde. Meer gedetailleerde informatie over de groepen zie je in de volgende figuur. Op de verticale as staat een cumulatief percentage; dit houdt in dat afgelezen kan worden hoeveel procent van de mensen van de verschillende groepen met de aangegeven snelheid of een lagere snelheid loopt. Zo kun je bijvoorbeeld aflezen dat voor de groep ouderen bij een snelheid van 1 m/s het cumulatieve percentage bijna 70 is. Dus bijna 70% van de ouderen loopt met een snelheid van 1 m/s of langzamer. Aan de hand van onder andere deze gegevens wordt een model gemaakt voor de tijd die de mensen nodig hebben om een weg over te steken. Neem aan dat de loopsnelheden ook voor het oversteken van een weg gelden. We bekijken het oversteken van een 20 meter brede weg. Er wordt recht overgestoken, dus men loopt daarbij 20 m. a) Maak met behulp van de gegevens uit het boxplot met de loopsnelheden een boxplot voor de oversteektijden van ouderen. Licht je werkwijze toe. Tot nu toe hebben we alleen gekeken naar de tijd van oversteken zelf. Als je bij een weg aankomt, kun je niet altijd meteen oversteken; soms moet je een aantal seconden wachten. Deze wachttijd hangt samen met de drukte op de weg en de benodigde oversteektijd. De drukte op de weg wordt aangegeven met het aantal voertuigen dat per uur passeert (voertuigenintensiteit). Omdat ouderen in CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 46
47 het algemeen minder snel lopen, zal voor deze groep de benodigde oversteektijd en dus ook de wachttijd groter zijn dan bijvoorbeeld voor kinderen. Er is een model gemaakt voor de samenhang tussen oversteektijd, voertuigenintensiteit en verwachte wachttijd. In de volgende figuur is dat voor zes verschillende wachttijden in beeld gebracht. Uit deze figuur is bijvoorbeeld af te lezen dat volgens dit model bij een oversteektijd van 9 s en een voertuigenintensiteit van 700 voertuigen per uur rekening gehouden moet worden met een wachttijd van 15 s. b) Teken de grafiek die het verband aangeeft tussen de oversteektijd en de verwachte wachttijd bij een voertuigenintensiteit van 800. Teken de grafiek alleen voor wachttijden van 5 tot en met 30 s. We willen een beeld krijgen van de totale tijd die een rol speelt bij het oversteken van een weg van 20 m breed en een voertuigenintensiteit van 800 voertuigen per uur. We spreken dan over de somtijd. Als we iemands verwachte wachttijd en zijn oversteektijd optellen, krijgen we zijn somtijd. We bekijken nu de groep van volwassenen. De hoogste snelheid die in deze groep is waargenomen is 2,6 m/s. c) Wat is de langste somtijd en wat is de kortste somtijd van de 10% snelste volwassenen? Licht je antwoord toe. (Bron: havo examen wiskunde A 1994-II) Opgave 65 Vaders en zonen De Engelsman Karl Pearson was een van de grondleggers van de moderne statistiek. Hij heeft zich vaak bezig gehouden met statistiek over biologische onderwerpen. Ongeveer een eeuw geleden onderzocht hij, samen met zijn collega Alice Lee, of in Engeland zonen gemiddeld langer zijn dan hun vaders. Zij vergeleken de lengtes van 1064 zonen en hun vaders. De zonen studeerden allen aan een Londense universiteit. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 47
48 a) Is hier sprake van een aselecte steekproef? Licht je antwoord toe. In de figuur zie je een overzicht van de resultaten. Elke stip stelt één vaderzoon-paar voor. De lengte van de vader staat op de horizontale as, de lengte van de zoon op de verticale as. De lengtes zijn gegeven in inches (1 inch = 2,54 cm). In de figuur is een lijn getekend. Als een stip op deze lijn ligt, dan zijn de vader en de zoon precies even lang. We noemen een vader en zijn zoon ongeveer even lang als ze minder dan 2 inch in lengte verschillen. b) Teken in deze figuur het gebied waarin de punten liggen die horen bij vaders en zonen die ongeveer even lang zijn. Licht je werkwijze toe. c) Kun je met behulp van het getekende gebied concluderen dat de zonen gemiddeld langer zijn dan hun vaders? Licht je antwoord toe. Hier zie je een boxplot van de lengtes van de 1064 vaders. De vijf kenmerkende getallen van de boxplot staan erbij. CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 48
49 Hier vind je ook een lijst met de lengtes van alle 1064 zonen. De getallen in deze lijst staan op volgorde van grootte. Na iedere 10 getallen staat een streepje. Na iedere 50 getallen staat bij het streepje hoeveel getallen er tot daar staan. d) Teken de boxplot van de lengtes van de zonen. Schrijf de vijf kenmerkende getallen van de boxplot erbij. (Bron: havo examen wiskunde A 2003-I) CTWO havo wiskunde A Statistiek en kansrekening 2 Data en datasets verwerken 49
50 2 Data en datasets verwerken Antwoorden 2.0 Data voor onderzoek! Opgave 1 a) geslacht, geboortejaar, geboortemaand, gewicht, lengte, gemiddeld cijfer over alle vakken, aantal uren huiswerk per week, wiskunde A of B, gekozen profiel, met plezier naar school b) geslacht c) 2.1 Data presenteren! Opgave 2 a) 196 cm; 200 cm b) 165 cm en 168 cm komen beide 13 keer voor c)! Opgave 3 a) De meetgegevens zijn gesorteerd en het geslacht is met een kleur aangegeven b) Dezelfde antwoorden als bij opgave 2 Opgave 4 a) Kwalitatief: lievelingseten; kwantitatief: hoeveelheid zakgeld per maand b) Nee, want er wordt geen hoeveelheid mee aangegeven c) Eenvoudig te meten, nauwkeuriger of onnauwkeuriger heeft weinig zin d) Linker weegschaal: analoog en continu, elke meetwaarde kan worden afgelezen; rechterweegschaal: digitaal en discreet, het weergegeven gewicht worden afgerond (bijv. per 10 gram, of per 100 gram) e) De gemiddelde maandtemeratuur geeft één meetwaarde per maand, dus verspringt van maand tot maand en tussenliggende waarden hebben geen betekenis Opgave 5 geslacht: kwalitatief, m/v (of j/m, of 0=vrouw, 1=man) geboortejaar: kwantitatief, discreet, 1990 t/m 1994 (of 90 t/m 94) geboortemaand: kwalitatief, januari t/m december (of 1 t/m 12) gewicht: kwantitatief, continu, (ongeveer) 60 t/m 100 kg lengte: kwantitatief, continu, (ongeveer) 150 t/m 210 cm cijfergemiddelde : kwantitatief, continu, 1 t/m 10 cijfer voor wiskunde (heel cijfer): kwantitatief, discreet, 1 t/m 10 huiswerk (aantal uren per week): kwantitatief, discreet, 0 t/m 25 (?) wiskundegroep: kwalitatief, wisa-wisb (eventueel nog ±wisd) profiel: kwalitatief, CM-EM-NG-NT (en eventueel combinatieprofielen) plezier: kwalitatief, 1=nee, 2=weinig, 3=neutraal, 4=behoorlijk, 5=veel. Opgave 6 a) 165 cm, 13 b) 156 cm, 196 cm c) de meting van 196 cm ligt erg ver van de rest af d) de kleinste jongen is groter dan het kleinste meisje, de langste jongen is groter dan het langste meisje, de meest voorkomende lengte bij de jongens is groter dan die bij de meisjes; de jongens zijn over het algemeen groter dan de meisjes
51 2 Data en datasets verwerken Antwoorden Opgave 7 a) omdat de aantallen jongens (69) en meisjes (85) ongelijk zijn b) jongens: 2/69*100%! 2,9%; meisjes: 5/85*100%! 5,9% c) klopt d) jongens, met staafdiagram: 1,4+1,4+7,2+ +1,4+1,4 = 42,9! 43 (%) jongens, tellen in dotplot: 30/69*100%! 43,48%! 43% meisjes, met staafdiagram: 2,4 + 1,2 + 1,2 + 1,2 = 6 (%) meisjes, tellen in dotplot: 5/85*100%! 5,9%! 6% e) meisjes: (van 156 t/m 168 cm, dus) tussen 155 en 169 cm; jongens: (van 161 t/m 180 cm, dus) tussen 160 en 181 cm f) meisjes: (van 173 t/m 196 cm, dus ) tussen 172 en 197 cm; jongens: (van 185 t/m 200 cm, dus) tussen 184 en 201 cm! Opgave 8 a) ja; volgorde niet van belang; wel tussenruimte b) ja; volgorde wél van belang; geen tussenruimte c) geboortejaar: niet zo zinvol, omdat er maar 4 jaren voorkomen d) ja; volgorde wel van belang; wel tussenruimte e) - de dagelijkse reistijd naar school: kwantitatief, continu, volgorde belangrijk, afgerond op hele minuten, staafdiagram wel zinvol (geen tussenruimte) - het aantal lesuren per week: kwantitatief, discreet, volgorde belangrijk, niet afgerond, staafdiagram wel zinvol (tussenruimte mag) - de muziekvoorkeur: kwalitatief, volgorde niet belangrijk, staafdiagram wel zinvol (tussenruimte mag) - het belang van bewegingsonderwijs voor iedereen: kwalitatief, volgorde van belang, staafdiagram wel zinvol (tussenruimte mag) Opgave 9 a) aflezen: 7%; staafdiagram opgave 7: 3,5+3,5 = 7, klopt b) nee, want 182 cm bevindt zich in de klasse 180-<185 en je weet dus niet hoeveel van die klasse boven 182 zitten c) je krijgt een beter overzicht van de verdeling van de lengtes d) de ruwe data is niet meer zichtbaar en alleen schattingen voor waarden in klassen zijn nog mogelijk e) 155, 165, 175, etc (opmerking: te verdedigen is dat de klasse 160-<170 eigenlijk loopt van 159,5 tót 169,5 en dan is 164,5 het klassenmidden ) f) je krijgt steeds minder klassen en verliest daardoor nog meer van de precieze gegevens Opgave 10 a) geboortejaar: kwantitatief, discreet, 1910 t/m 2010 b) temperatuur op de noordpool in graden Celsius: kwantitatief, continu, -25 t/m (ongeveer) 0 c) een enquête met een driepuntsschaal: kwalitatief, waarden 1 t/m 3 d) gewicht van muizen in grammen: kwantitatief, continu, 1 (pasgeboren) t/m 60 gram e) toetscijfer: kwantitatief, discreet (nl. alleen cijfer met 1 decimaal), 1,0 1,1 1,2 1, ,9 10,0 f) profiel in bovenbouw HAVO: kwalitatief, CM-EM-NG-NT g) kwaliteit van een hotel, aantal sterren: kwalitatief, 1 t/m 3
52 2 Data en datasets verwerken Antwoorden Opgave 11 a) kwantitatief, continu b) 26 cm (of eigenlijk 26,4 cm) c) zinvol als in beide velden niet evenveel regenwormen zijn gemeten d) zie hieronder e)!"#$%"& ++#%+!&,-. ++#%+!&,-. '"$"#()'*,/#&0*. 1"!2&3 1"!2& : ;8< 387 =6< 3=8; ;83 > > :8= :63; 3=8; 4:8; 3< ; <8= 4764= &!"!!"#$%& &!"!!"#$%& %#"! %#"! %!"! %!"! $#"! $#"! $!"! $!"! #"! #"!!"!! %"# #"# '"# $$"# $("# $)"# %!"# %&"# %*"#!"!! %"# #"# '"# $$"# $("# $)"# %!"# %&"# %*"# Opgave 12 a) kwantitatief, discreet b) zie hiernaast c) d) 80% e) de grens van voldoende/onvoldoende valt dan in een klasse en de hoeveelheid onvoldoendes/voldoendes is dan niet meer af te lezen! Opgave 13 a) klassenbreedte 1,0; klassenmiddens 7,0 8,0 enz. (eigenlijk loopt de eerste klasse van 6,45 tot 7,45 dus klassenmidden 6,95; en dan 7,95; enz.) b) klassenbreedte 5; klassenmiddens 22,5 27,5 enz. c) klassenbreedte 50; klassenmidden 225,5 d) lengte, gewicht, gemiddelde cijfer, huiswerk
53 2 Data en datasets verwerken Antwoorden Opgave 14 a) kwantitatief, continu b) zie hiernaast c) d) 195/5001*100%! 3,9% (of 4%) e) 89/5001*100%! 1,8% (of 2%)! Opgave 15 a) 5; 2,5 b) nee, laatste 2 klassen zijn anders c) omdat je op die manier bij de verschillende prognoses ook de groei van de totale omvang van de Nederlandse bevolking kan zien en kunt vergelijken d) t.o.v. totaal: dan kun je ook zien hoe de verhouding mannen/vrouwen per leeftijdscategorie is afzonderlijk: je kunt voor beide sexes zien hoe de verdeling over de leeftijdscategorieën is e) de top van de grafiek van de vrouwen is breder dan bij de mannen f) categorie groen, Regional Communities, want dan is het bovenste deel van de grafiek het breedst in verhouding tot het onderste deel! Opgave 16 a) geslacht: kwalitatief leeftijd: kwantitatief, discreet sprint: kwantitatief, continu verspringen: kwantitatief, continu vergooien: kwantitatief, continu b) (om te vergelijken kun je eigenlijk beter relatieve frequenties gebruiken, maar omdat het verschil hier zo duidelijk is maakt het hier niet echt uit) c) de jongens gooien over het algemeen verder dan de meisjes jongen meisje Vergooien 200g [m] Freq % Freq % 5,0-9,9 0 0,0 1 2,5 10,0-14,9 0 0, ,0 15,0-19,9 3 9, ,0 20,0-24,9 7 21,2 9 22,5 25,0-29, ,3 2 5,0 30,0-34,9 6 18,2 0 0,0 35,0-39,9 5 15,2 0 0,0 40,0-44,9 1 3,0 0 0,0 Totaal
54 2 Data en datasets verwerken Antwoorden 2.2 Centrum en spreiding Opmerking vooraf: Bij het berekenen van de kwartielen is er in VU-Stat een optie of bij een oneven aantal berekeningen de mediaan bij het bepalen van Q 1 en Q 3 wel of niet moet meetellen. Bij de antwoorden is voor de optie mediaan telt mee gekozen; kies je voor de andere optie, dan zullen de antwoorden soms enigszins af kunnen wijken. Opgave 17 a) b) meisjes: 168 cm; jongens: 180 cm c) meisjes: van 156 t/m 196 cm, dus over 40 cm verspreid; jongens: van 161 t/m 200 cm, dus over 39 cm verspreid; maakt weinig uit d) mediaan blijft 168 cm; spreiding van 156 t/m 182 cm, dus nu over 26 cm verspreid en dus lijkt nu veel minder verspreid e) mediaan blijft 180 cm; spreiding van 161 t/m 194 cm, dus nu over 33 cm verspreid en dus lijkt nu veel minder verspreid f) meisjes: 165 cm; jongens: 180 cm g) die is er nu niet, want 165 en 168 cm komen dan beide even vaak het meest voor h) die is er nu niet, want 170, 180, 185 en 190 cm komen dan allemaal even vaak het meest voor Opgave 18 a) b) c) gemiddelde = 3080 (euro) d) zie het als een wip-wap met daarop de bolletjes als gewichtjes: als de grafiek bij het gemiddelde wordt ondersteund blijft het in evenwicht e) mediaan = 1200; nee f) het gemiddelde wordt 1200 en wordt dus veel lager; de mediaan blijft gelijk (en is nu wel gelijk aan het gemiddelde); het modale inkomen blijft gelijk
55 2 Data en datasets verwerken Antwoorden Opgave 19 a) jongens: 39 cm; meisjes: 40 cm b)... (zie opgave 17: bij weglating van de uitschieters naar boven is de spreidingsbreedte bij de meisjes wel veel kleiner) Opgave 20 a) van 161 t/m 176 cm b) 85 meisjes, dus 25% is 21 (of 22) meisjes; in boxplot vanaf langste meisje terugtellen geeft lengte 173 cm voor 21 e en 22 e leerling; dus Q 3 is 173 cm; het maximum is 196 cm; klopt c) jongens: ; meisjes: d) 75% (of eigenlijk écht langer dan 165 cm: 54 van de 85 meisjes, dus 63,5%) e) 25%; 25% (bij letterlijk nemen van tussen geeft dit andere waardes ) f) het derde kwarties van de meisjes is kleiner dan het eerste kwartiel van de jongens g) nee, alleen de grenzen kun je zien Opgave 21 a) dotplot 1: de dot van 25 verplaatsen naar 20 dotplot 2: de boxplot is al goed, dus meerdere mogelijkheden (bijv. de dot van 2 verplaatsen naar 1, 3 of 4) dotplot 3: de dot van 16 verplaatsen naar 15 b) Opgave 22 a) centrummaten: mediaan = 180; gemiddelde = 180,4; modus = 180 (cm) spreidingsmaten: spreidingsbreedte = = 39 (cm); kwartielafstand = =9 (cm) (mediaan en kwartielafstand) b) Q 1 = 176 en kwartielafstand = 9; 176 1,5 9 = 162,5; 161 is kleiner Q 3 = 185 en kwartielafstand = 9; ,5 9 = 198,5; 200 is groter dus het zijn beide uitschieters c) centrummaten: mediaan = 180; gemiddelde = 180,4; modus = 180 (cm) spreidingsmaten: spreidingsbreedte = = 31 (cm); kwartielafstand = =9 (cm) d) kwartielafstand niet en spreidingsbreedte wel e) in dit geval geen enkele (maar meestal het gemiddelde wel) f) ja: de uitschieters geven een vertekend beeld, dus het is beter ze weg te laten; nee: bij sommige soorten onderzoek kunnen deze uitschieters wel degelijk van belang zijn Opgave 23 a) je weet de werkelijke getallen niet; bijv. de eerste twee werknemers kunnen beide 400, maar ook beide 450 euro verdienen, of beide een ander verschillend loon b) klassenmiddens: ! ! ! = = 577(euro) c) je weet bijv. alleen dat de mediaan zit in de klasse 550-<600, maar de mediaan kan dus elke waarde in dit interval zijn; evenzo voor het minimum, maximum en de kwartielen
56 2 Data en datasets verwerken Antwoorden Opgave 24 a) de variabele profiel is niet kwantitatief b) er is geen ordening tussen de profielen, dus er is ook geen middelste c) d) het ligt eraan hoe je de profielen ordent Opgave 25 a) mediaan = 65 (kg); gemiddelde= 65,2 (kg) b) meerdere gewichten komen het vaakst voor, nl. 65 en 70 kg c) spreidingsbreedte = = 41 (kg) kwartielafstand = 70,5 58,5 = 12 (kg) d) centrummaat: gemiddelde (van 65,2 naar 64,8) spreidingsmaat: spreidingsbreedte (van 41 naar 32) e) nee f) van 49 t/m 58 kg g) 7 van de 69 jongens; dat is 7/69*100%! 10% Opgave 26 a) je weet de ruwe data niet meer; meisjes: in klasse 55-<60 jongens: in klasse 65-<70 b) zie hiernaast (eerste klasse loopt van 39,5 t/m 44,5 kg, dus klassenmidden is 42; etc.) c) je weet niet hoe de werkelijke waarnemingen over de klassen zijn verdeeld; jongens: gemiddelde! 65,8 (kg) meisjes: gemiddelde! 57,1 (kg) d) j: 65,8 versus 65,2 m: 57,1 versus 56,8 ja, ze wijken enigszins af gewicht jongens meisjes (kg) midden freq. freq Totaal Opgave 27 a) modaal: 1648 "; gemiddelde: 1854 "; boxplot zie hieronder b) modaal: 1800 "; gemiddelde: 2000 "; boxplot zie hieronder c) modaal: 1600 "; gemiddelde: 1807 "; boxplot zie hieronder
57 2 Data en datasets verwerken Antwoorden 27 c): 27 b): 27 a): vooraf: Opgave 28 a) er zijn meerdere polsslagen die het vaakst voorkomen, dus een echte modus is er niet; niet zinvol b) voor: 65,1; na: 75,7; ja c) voor: Q 1 = 59; mediaan = 64; Q 3 = 72 na: Q 1 = 68; mediaan = 74; Q 3 = 84 ja d) ja, want Opgave 29 Voor een bepaalde toets kun je maximaal 100 punten scoren. Hier zie je hoe een groep van 40 personen de toets heeft gemaakt a) 61,0 b) c) mediaan, want er zijn nogal wat uitschieters (maar omdat er toevallig ongeveer evenveel uitschieters naar boven als naar onderen zijn is hier het gemiddelde ook redelijk geschikt) d) de werkelijke metingen worden bij de berekening vervangen door de klassenmiddens en omdat de klassen breder zijn, kan elke meting meer afwijken van het midden van de klasse waarin het ligt Opgave 30 a) maandag; uitschieters hebben een te grote invloed b) zaterdag c) ongeveer 50% (net iets minder)
58 2 Data en datasets verwerken Antwoorden d) waarschijnlijk op de vrijdag, maar zeker weet je het niet (hoogst mogelijk aantal geboorten op maandag (ongeveer): 13* * * *520 = 23530; op vrijdag (ongeveer): 13* * *450+13*470 = 23000; dus theoretisch kan het op maandag net iets meer zijn, maar dit is zeer onwaarschijnlijk) e) de modus kan bijv. 425 zijn; als 425 geboorten op elke dag bijvoorbeeld 2 keer voor komt en elk ander aantal slechts 1 keer f) nee, het gemid. op vrijdag is zeker groter dan het gemiddelde op zondag vr: gemiddelde groter dan (13*420+13*430+13*450+13*470)/52! 440 zo: gemiddelde kleiner dan (13*385+13*405+13*420+13*440)/52! 412! Opgave 31 Sportprestaties a) gemiddelde! 21,82; mediaan = 20,0; modus = 16,0 spreidingsbr. = 40,0 5,0 = 35,0; kwartielafst. = 26,50 16,0 = 10,50 b) je hebt dan de precieze gegevens en metingen worden niet benaderd door een klassenmidden, dus is nauwkeuriger c)
59 2 Data en datasets verwerken Antwoorden 2.3 Verdelingen typeren Opgave 32 a) b) c) CM: gemiddelde! 6,5; mediaan = 6 EM: gemiddelde! 7,3; mediaan = 7 NG: gemiddelde! 7,5; mediaan = 7 NT: gemiddelde! 8,1; mediaan = 8 d) bij NT; ja, de staafjes liggen het meest gegroepeerd e) de staafjes aan de linkerzijde zijn duidelijk lager dan de staafjes rechts f) NG Opgave 33 a) (ongeveer) = 51, dus 51% b) (ongeveer) = 90, dus 90% c) zie hiernaast, waardes afgelezen uit histogram d) NG totaal: 2% cijfer kleiner of gelijk 5 e) zie hieronder f) zie hieronder &!! *+,+ -. -/ NG cijfer wis havo 3 cijfer freq. somfreq. (%) (%) @C354D:4;E146FGH %! $! #! "!! # ' $ ( % ) &! :;<46=>?@AB Opgave 34 IQ: redelijk symmetrisch, nogal wat uitschieters, gemtemp: scheef met staart links, dhagel: redelijk symmetrisch met uitschieters rechts, beetje scheef, eruptieduur: tweetoppig, d-10: erg scheef, met staart rechts, ook uitschieters rechts, Opgave 35 a) II b) I c) III
60 2 Data en datasets verwerken Antwoorden d) II; basketbal; veel lange mensen, de centers onder het bord en de kleintjes zijn de snelle spelverdelers, dribbelaars e) I; voor het tillen van zware gewichten is een duidelijk ideale lengte, waarbij dus langere of kortere sporters in het nadeel zijn f) I (en ook bij III zal het niet veel uitmaken) g) II Opgave 36 a) klassenbreedte 5, eerste klasse 150-<155 (ofwel van 149,5 tot 154,5), klassenmiddens 152, 157, b) 2%+6%+10%=18 c) zie hiernaast d) de meetwaardes zitten verdeeld over de hele klasse en de aangegeven somfrequenties worden pas bij de rechtergrens van die klasse gehaald e) zie hieronder f) zie hieronder g)! "#$%&'()*!+!,-)$$.! /! $&*0(.12!/! ! 5! 5! ! 9! 9! ! 8! :! ;5! 35! 3:! 3;5673;4! 34! <<! 3;4673:5! 93! 4=! 3:5673:4! 3>! ;<! 3:4673>5! 33! :=! 3>5673>4! :! >9! 3>467955! 4! >;! ! <! 355! ! 5! 355!, :; &!! *+,-./01234 *+,-./ *+,-./ %! $! #! "!! <6=/-63,> ?2; &'! &'' &$! &$' &(! &(' &%! &%' &)! &)' "!! "!' Opgave 37 a) beide histogrammen hebben geen duidelijke top aan een zijkant en/of staart b) c) nee, de stippen moeten boven de rechtergrenzen van de klassen staan, dus bij 4,5 5,5 6,5 etc., maar omdat cijfwis een discrete variabele is met alleen hele waarden, mag het toch wel; halve cijfers hebben hier geen betekenis; (beter was geweest wanneer de staafjes tussenruimte hadden) d) 40% Opgave 38
61 2 Data en datasets verwerken Antwoorden a) b) mediaan bij 50%; Q 1 bij 25% en Q 3 bij 75% Q 3 M Q 1 Je vindt dan (zie pijlen in bovenstaande grafiek): Jongens: Q 1! 176; Mediaan! 181,5; Q 3! 187,5 (cm) Meisjes: Q 1! 166; Mediaan! 168,5; Q 3! 174 (cm)! Opgave 39 a) alle huishoudens (lichtblauw): scheef met staart rechts paar met kinderen: scheef met staart rechts paar zonder kinderen: nog veel schever met lange staart rechts alleenstaande: symmetrisch met één top (klokvorm) b) lastig aflezen spreidingsbreedte alle huishoudens: ± euro paar met kinderen: ± euro paar zonder kinderen: ± euro alleenstaande: ± euro c) alle huishoudens, van klein naar groot: modaal mediaan gemiddelde paar met kinderen, van klein naar groot: modaal mediaan gemiddelde paar zonder kinderen, van klein naar groot: modaal mediaan gemiddelde (verder uit elkaar dan bij paar met kinderen, want schevere verdeling) alleenstaande: modaal, mediaan en gemiddelde ongeveer gelijk d) Opgave 40
62 2 Data en datasets verwerken Antwoorden a) zie hieronder b) de verdeling van 1995 heeft één top en die van 2005 heeft twee toppen. De linker top betreft de nieuwe instromers in het onderwijs c) klassenmiddens: 22,5 27, ,5 po 1995: gemiddelde! 40,5; po 2005: gemiddelde! 42,3 d) zie ook hieronder e) f) zie hieronder g) ).(/01234!"#$%%& ).(/01234 )"#$%%& %! $& $% # "! %!1111% ! "!11111"511115! &!11111&5 %! $& $% # "! %!1111% ! "!11111"511115! &!11111&5 ).(/01234!"#'((& ).(/01234 )"#'((& %! %! $& $& $% $% # # " "! %!1111% ! "!11111"511115! &!11111&5! %!1111% ! "!11111"511115! &!11111&5 '(()*+,- '(()*+,- '(()*+,- '(()*+,-! Opgave 41 Sportprestaties a) jongens: gemiddelde! 27,6; mediaan = 27,0; modus = 25,0 (m) jongens: spreidingsbreedte = 24; kwartielafstand = 7,5 (m) meisjes: gemiddelde! 17,1; mediaan = 16,5; modus = 16,0 (m) meisjes: spreidingsbreedte = 22,5; kwartielafstand = 5,75 (m)
63 2 Data en datasets verwerken Antwoorden b)! Opgave 42 Reactiesnelheden a)
64 2 Data en datasets verwerken Antwoorden 2.4 Relaties Opgave 43 a) 55 b) c) 55/85*100%! 64,7% d) 56; 56/69*100%! 81,2% e) 56/111*100%! 50,5%; het rechter diagram Opgave 44 a) zie hiernaast b) wisgroep geslacht A B Totaal j 18,84 % 81,16 % 100 % m 35,29 % 64,71 % 100 % Totaal 27,92 % 72,08 % 100 % c) ruim 29%; d) bij de jongens verschillen de percentages nog meer Opgave 45 a) 55/111*100%! 49,5% b) je splitst eerst in wisa en wisb en kijkt daarna naar het geslacht c) wisgroep geslacht A B Totaal j 30,23 % 50,45 % 44,81 % m 69,77 % 49,55 % 55,19 % Totaal 100 % 100 % 100 % d) ze zijn gelijk Opgave 46 a) beide variabelen zijn kwalitatief b) geslacht: volgorde niet van belang; bij plezier is de volgorde wel van belang Opgave 47 a) profiel is kwalitatief, nominaal b) van een aantal leerlingen is geen cijfer wiskundecijfer eind havo 3 bekend; dit is een onderzoek in havo-4 en elke leerling heeft (natuurlijk) een profiel gekozen
65 2 Data en datasets verwerken Antwoorden c) verticaal percenteren, want je wilt per profiel weten hoe de cijfers verdeeld zijn d) Aantal van leerling profiel cijfwis CM EM NG NT Eindtotaal 5 9,1% 2,4% 1,7% 1,9% 6 54,5% 14,3% 8,3% 7,3% 13,0% 7 42,9% 38,3% 17,1% 31,2% 8 27,3% 31,0% 36,7% 36,6% 34,4% 9 10,0% 36,6% 13,6% 10 4,8% 1,3% (leeg) 9,1% 4,8% 5,0% 2,4% 4,5% Eindtotaal 100% 100% 100% 100% 100% e) Opmerking: wanneer je met VU-Stat deze kruistabel maakt, dan worden de leerlingen zonder wiskunde-cijfer weggelaten en je krijgt dus ook andere getallen en percentages. profiel cijfwis Totaal Totaal Opgave 48 Nu horizontaal percenteren. (VU-Stat geeft weer andere waardes.) Aantal van leerling profiel cijfwis CM EM NG NT Eindtotaal 5 33,3% 33,3% 33,3% 100% 6 30,0% 30,0% 25,0% 15,0% 100% 7 37,5% 47,9% 14,6% 100% 8 5,7% 24,5% 41,5% 28,3% 100% 9 28,6% 71,4% 100% ,0% 100% (leeg) 14,3% 28,6% 42,9% 14,3% 100% Eindtotaal 7,1% 27,3% 39,0% 26,6% Opgave 49 a) minstens 4; één en dezelfde stip in de grafiek kan van meerdere personen zijn die toevallig dezelfde lengte en gewicht hebben b) je zou dat vermoeden kunnen krijgen door de grafiek c) ja; langere meisjes hebben over het algemeen een groter gewicht Opgave 50 nee profiel cijfwis Totaal 5 10,00 % 2,50 % 1,75 %. 6 60,00 % 15,00 % 8,77 % 7,50 % 7. 45,00 % 40,35 % 17,50 % 8 30,00 % 32,50 % 38,60 % 37,50 % ,53 % 37,50 % 10. 5,00 %.. Totaal 100 % 100 % 100 % 100 %
66 2 Data en datasets verwerken Antwoorden Opgave 51 a) tussen 51 en 70 kg b) lengte 178 cm c) licht statistich verband d) trek twee (evenwijdige) lijnen die de puntenwolk zo goed als insluiten; bij 198 cm lees je dan af: ongeveer tussen 68 en 97 kg (je kan hele andere waarden hebben, want je kan de twee lijnen op veel manieren trekken) Opgave 52 a) nee b) nee c) nee d) nee Opgave 53 a) er is an een statistisch verband; bij toenemende hoogte daalt de gemiddelde jaartemperatuur b) tussen 20 en 27 ºC c) tussen 2350 en 3100 m d) energiebedrijven, tuinders/boeren, Opgave 54 Kleurenblindheid kleurenblind niet kleurenblind totaal man vrouw totaal a) b) / 72 ofwel 90% c) 65 / 600 ofwel 11% d) vermoedelijk is er wel een statistisch verband: bij mannen is er een grotere kans op kleurenblindheid Opgave 55 Zomer Als het een warme, zonnige zomer is, dan worden er meer ijsjes verkocht en tevens ook meer zonnebrillen. Evenzo bij een slechte zomer zullen er minder ijsjes en minder zonnebrillen worden verkocht. Er is geen direct verband, want beiden zijn een gevolg van een andere onzichtbare variabele (gemiddelde zomertemperatuur of aantal zonuren) Opgave 56 Golf a) (ongeveer) 20% b) 100% c) die zit tussen 5% en 10% (?) d) die blijft dalen en gaat richting de 0% (maar zal nooit 0% worden)
67 2 Data en datasets verwerken Antwoorden! Opgave 57 Sportprestaties a) Verspringen [cm] Geslacht Totaal jongen. 3,03 % 21,21 % 57,58 % 18,18 % 100 % meisje 2,50 % 12,50 % 25,00 % 52,50 % 7,50 % 100 % Totaal Verspringen [cm] Geslacht Totaal jongen. 16,67 % 41,18 % 47,50 % 66,67 % meisje 100,00 % 83,33 % 58,82 % 52,50 % 33,33 % Totaal 100 % 100 % 100 % 100 % 100 % conclusie: jongens springen (over het algemeen) verder dan meisjes b) zie puntenwolk hiernaast; er lijkt sprake van een redelijk sterk statistisch verband; hoe sneller je bent op de sprint, hoe verder je springt Opgave 59 a) variabele: schooltype (BB, KB, GT, Havo, Vwo); weergave bijv. d.m.v. een tabel of histogram met relatieve frequenties b) variabelen: jaartal en schooltype (BB, KB, GT, Havo, Vwo); weergave bijv. d.m.v. een kruistabel met horizontaal de schooltype en verticaal het jaartal en dan horizontaal percenteren c) variabele: snelheid (in km/u); weergave bijv. d.m.v. een tabel of histogram met relatieve frequenties per snelheidsklasse d) variabele: inkomen (jaar- of maandloon in euro s); weergave bijv. d.m.v. een tabel of histogram met relatieve frequenties per inkomensklasse e) variabele: waardering lesrooster, bijvoorbeeld een 5-puntsschaal; weergave bijv. d.m.v. een tabel of histogram met relatieve frequenties per waardering f) variabelen: zithoogte (in cm) en lichaamslengte (in cm); weergave d.m.v. een puntenwolk g) variabele: tijd achter pc (in minuten); weergave d.m.v. een tabel of histogram met relatieve frequenties per tijdsklasse Opgave 60 a) $; het is een losse stip/kruisje in de boxplot b) 50%; meer dan $ c) (ongeveer) 70% Opgave 61 merk op: de klassen zijn 110-<120, 120-<130, etc. A: modale klasse: 140-<150; mediaan in klasse 140-<150; gemiddelde! 145 B: modale klasse: 160-<170; mediaan bij 150; gemiddelde! 150 C: modale klasse: 160-<170; mediaan in klasse 150-<160; gemiddelde! 150 D: geen modale klasse; mediaan in klasse 140-<150; gemiddelde! 145 sprint [m]
68 2 Data en datasets verwerken Antwoorden Opgave 62 a) zie hiernaast b) c) zie hieronder (merk op: de klassen horen eigenlijk allemaal even breed te zijn, maar met Excel lukt dat niet ) d) bedrijf B e) 4,9% (of 5%) +,-,./01232#4526,27012#89: &" &! %" %! $" $! #" #! "!! # "# "(,-./012'3 $" $(,-./012'4 #"'()'#* #*'()'$" $"'()'&! &!''()'"" ""'()'+! +!'()'+" %& %) ' "# & &!"#$%#!&!&#$%#'" '"#$%#() ()##$%#"" ""#$%#*) *)#$%#*".22401;< Opgave 63 Sommige autorijders en motorrijders raken bij een ongeluk betrokken. 12% daarvan zijn motorrijders. Van de auto- en motorrijders die bij een ongeluk betrokken waren houdt 10% enig letsel over. Die 10% is verdeeld in 8% voor de automobilisten en 2% voor de motorrijders. a) omdat er ook veel meer ongelukken met de auto gebeuren is niet direct duidelijk dat relatief gezien ook bij een groter deel daarvan letset optreedt; die 8% is van het totaal aantal letselgevallen b) Voertuig letsel auto motor Totaal niet 80% 10% 90% wel 8% 2% 10% totaal 88% 12% 100% c) verticaal percenteren d) Voertuig letsel auto motor Totaal niet 90,9% 83,3% 90% wel 9,1% 16,7% 10% totaal 100% 100% 100% Opgave 64 Oversteken De snelheden die bij de boxplot vermeld zijn, zijn in meters per seconde. Meer gedetailleerde informatie over de groepen zie je in de volgende figuur. Op de verticale as staat een cumulatief percentage; dit houdt in dat afgelezen kan worden hoeveel procent van de mensen van de verschillende groepen met de aangegeven snelheid of een lagere snelheid loopt. Zo kun je bijvoorbeeld
69 2 Data en datasets verwerken Antwoorden aflezen dat voor de groep ouderen bij een snelheid van 1 m/s het cumulatieve percentage bijna 70 is. Dus bijna 70% van de ouderen loopt met een snelheid van 1 m/s of langzamer. Aan de hand van onder andere deze gegevens wordt een model gemaakt voor de tijd die de mensen nodig hebben om een weg over te steken. Neem aan dat de loopsnelheden ook voor het oversteken van een weg gelden. We bekijken het oversteken van een 20 meter brede weg. Er wordt recht overgestoken, dus men loopt daarbij 20 m. afstand 20 a) snelheid =, dus oversteektijd = ; let op: de boxplot wordt tijd snelheid gespiegeld, want de grootste snelheid geeft de laagste oversteektijd. Voor de oversteektijden (in seconden) geldt: max = 20/0,30! 66,7; Q 3 = 20/0,75 = 26,7; Med = 20/0,90! 22,2; Q 1 = 20/1,05! 19,0; Min = 20/1,60! 12,5 b) oversteektijd (sec)
70 2 Data en datasets verwerken Antwoorden verwachte wachttijd oversteektijd c) uit 1 e grafiek: de 10% snelste volwassenen hebben snelheden tussen 2,0 en 2,6 m/s; de oversteektijden variëren dan tussen 10 en 7,7 seconden; aflezen 2 e grafiek: de bijbehorende wachttijden zijn ongeveer 27 en 13 seconden; dus de kortste somtijd is (ongeveer) ,7! 21 sec. en de langste somtijd is (ongeveer) = 37 sec. Opgave 65 Vaders en zonen a) de zonen zijn allemaal studenten van een Londense universiteit, dus ze zijn niet aselect uit de Engelse bevolking gekozen, dus geen aselecte steekproef b) tekenen van twee grenslijnen: de ene door (62,60) en (74,72) en de andere door (60,62) en (72,74); het gebied tussen deze twee grenslijnen is het gevraagde gebied c) Er staan meer stippen boven het gearceerde gebied (vorige vraag) dan eronder, dus er zijn veel zonen duidelijk langer dan hun vader en weinig duidelijk korter; (in het gebied tussen de getekende grenslijnen zijn de zonen net zo vaak groter als kleiner dan hun vader;) dus de zonen zijn gemiddeld langer d) min = 59,7; Q 1 = 66,9; mediaan = 68,6; Q 3 = 70,5; max = 78,
2 Data en datasets verwerken
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 3 Frequentieverdelingen typeren 3.6 Geïntegreerd oefenen In opdracht van: Commissie Toekomst Wiskunde Onderwijs 3 Frequentieverdelingen
2 Data en datasets verwerken
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 1 Data presenteren 1.4 Oefenen In opdracht van: Commissie Toekomst Wiskunde Onderwijs 1.4 Oefenen Opgave 9 Bekijk de genoemde dataset
2.3 Frequentieverdelingen typeren
2.3 Frequentieverdelingen typeren 2.3.1 Introductie Kijkend naar een datarepresentatie valt meestal al snel op hoe de verdeling van de tellingen/frequenties over de verschillende waarden eruitziet. Zitten
2.1.4 Oefenen. d. Je ziet hier twee weegschalen. Wat is het verschil tussen beide als het gaat om het aflezen van een gewicht?
2.1.4 Oefenen Opgave 9 Bekijk de genoemde dataset GEGEVENS154LEERLINGEN. a. Hoe lang is het grootste meisje? En de grootste jongen? b. Welke lengtes komen het meeste voor? c. Is het berekenen van gemiddelden
2 Data en datasets verwerken
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 4 Twee groepen vergelijken 4.4 Oefenen In opdracht van: Commissie Toekomst Wiskunde Onderwijs 4.4 Oefenen Voorbeeld Bekijk de dataset
GEGEVENS154LEERLINGEN
2.4.4 Oefenen Voorbeeld Bekijk de dataset GEGEVENS154LEERLINGEN nog een keer. Je wilt nagaan of leerlingen die wiskunde B kiezen beter waren in wiskunde in de onderbouw dan leerlingen die wiskunde A kiezen.
2 Data en datasets verwerken
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 1 Data presenteren 1.3 Representaties In opdracht van: Commissie Toekomst Wiskunde Onderwijs 1 Data presenteren 1.1 Introductie In
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken In opdracht van: Commissie Toekomst Wiskunde Onderwijs ctwo Utrecht 2009, SLO Utrecht 2014 Dit lesmateriaal is ontwikkeld in het kader
5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:
5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van
5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:
5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van
Havo A deel 1 H2 Statistiek - Samenvatting
Havo A deel 1 H2 Statistiek - Samenvatting Begrip 1. Staafdiagram Schetsje: zo ziet het er uit 2. Lijndiagram = polygoon 3. Cirkeldiagram = sectordidagram 4. Beeldiagram = pictogram 5. Stapeldiagram 6.
DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO
DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO Leerlingmateriaal 1. Doel van de praktische opdracht Het doel van deze praktische opdracht is om de theorie uit je boek te verbinden met de data
2. Data en datasets verwerken. Boekje 2 havo wiskunde A, domein E: Statistiek
2. Data en datasets verwerken Boekje 2 havo wiskunde A, domein E: Statistiek 1 Verantwoording 2015, SLO (nationaal expertisecentrum leerplanontwikkeling), Enschede Dit lesmateriaal is ontwikkeld in het
2. Data en datasets verwerken. Boekje 2 havo wiskunde A, domein E: Statistiek
2. Data en datasets verwerken Boekje 2 havo wiskunde A, domein E: Statistiek 1 Verantwoording 2015, SLO (nationaal expertisecentrum leerplanontwikkeling), Enschede Dit lesmateriaal is ontwikkeld in het
2. Data en datasets verwerken. Boekje 2 havo wiskunde A, domein E: Statistiek
2. Data en datasets verwerken Boekje 2 havo wiskunde A, domein E: Statistiek 1 Verantwoording 2015, SLO (nationaal expertisecentrum leerplanontwikkeling), Enschede Dit lesmateriaal is ontwikkeld in het
2. In de klassen 2A en 2B is een proefwerk gemaakt. Je ziet de resultaten in de frequentietabel. 2A 2B
1. (a) Bereken het gemiddelde salaris van de werknemers in de tabel hiernaast. (b) Bereken ook het mediale salaris. (c) Hoe groot is het modale salaris hier? salaris in euro s aantal werknemers 15000 1
DOEN! - Praktische Opdracht Statistiek 4 Havo Wiskunde A
DOEN! - Praktische Opdracht Statistiek 4 Havo Wiskunde A Docentenhandleiding 1. Voorwoord Doel van de praktische opdracht bij het hoofdstuk over statistiek 1 : Het doel van de praktische opdracht (PO)
Samenvattingen 5HAVO Wiskunde A.
Samenvattingen 5HAVO Wiskunde A. Boek 1 H7, Boek 2 H7&8 [email protected] Boek 2: H7. Verbanden (Recht) Evenredig Verband ( 1) Omgekeerd Evenredig Verband ( 1) Hyperbolisch Verband ( 2) Machtsverband
Paragraaf 5.1 : Frequentieverdelingen
Hoofdstuk 5 Beschrijvende statistiek (V4 Wis A) Pagina 1 van 7 Paragraaf 5.1 : verdelingen Les 1 Allerlei diagrammen = { Hoe vaak iets voorkomt } Relatief = { In procenten } Absoluut = { Echte getallen
3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625.
3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625. Absolute verandering = Aantal 2004 Aantal 1994 = 1625 3070 = -1445 Relatieve verandering = Nieuw Oud Aantal
Steelbladdiagram In een steelbladdiagram staan alle leerlingen genoemd. Je kunt precies zien waar Wouter staat.
2.1.3 Representaties In de voorbeelden kijken we steeds naar gewicht. Je gaat daarna zelf kijken naar de informatie over lengte en cijfergemiddelde. Voor alle opgaven geldt dat je deze zowel in de DWO
Overzicht statistiek 5N4p
Overzicht statistiek 5N4p EEB2 GGHM2012 Inhoud 1 Frequenties, absoluut en relatief... 3 1.1 Frequentietabel... 3 1.2 Absolute en relatieve frequentie... 3 1.3 Cumulatieve frequentie... 4 2 Centrum en spreiding...
HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf
HAVO 4 wiskunde A Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf 1. rekenregels en verhoudingen Ik kan breuken vermenigvuldigen en delen. Ik ken
STATISTIEK. Een korte samenvatting over: Termen Tabellen Diagrammen
STATISTIEK Een korte samenvatting over: Termen Tabellen Diagrammen Modus De waarneming die het meeste voorkomt. voorbeeld 1: De waarnemingen zijn 2, 3, 4, 5, 5, 5, 6, 6, 7 en 8. De waarneming 5 komt het
2 Data en datasets verwerken
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 2 Verbanden tussen data representaties 2.4 Oefenen In opdracht van: Commissie Toekomst Wiskunde Onderwijs 2 Verbanden tussen data representaties
8.1 Centrum- en spreidingsmaten [1]
8.1 Centrum- en spreidingsmaten [1] Gegeven zijn de volgende 10 waarnemingsgetallen: 1, 3, 3, 3, 4, 5, 6, 8, 8, 9 Het gemiddelde is: De mediaan is het middelste waarnemingsgetal als de getallen naar grootte
2.4 Twee groepen vergelijken
2.4 Twee groepen vergelijken 2.4.1 Introductie Zijn jongens langer dan meisjes? Hebben leerlingen met een NT-profiel in de derde klas een hoger cijfer voor wiskunde dan leerlingen met een CM-profiel? Is
Centrummaten en klassen vmbo-kgt34. CC Naamsvermelding 3.0 Nederland licentie.
Auteur VO-content Laatst gewijzigd Licentie Webadres 12 April 2016 CC Naamsvermelding 3.0 Nederland licentie http://maken.wikiwijs.nl/74220 Dit lesmateriaal is gemaakt met Wikiwijsleermiddelenplein. Wikiwijsleermiddelenplein
Centrummaten en klassen vmbo-kgt34
Auteur Laatst gewijzigd Licentie Webadres VO-content 30 august 2017 CC Naamsvermelding-GelijkDelen 4.0 Internationale licentie https://maken.wikiwijs.nl/74220 Dit lesmateriaal is gemaakt met Wikiwijs van
Samenvatting Wiskunde Samenvatting en stappenplan van hfst. 7 en 8
Samenvatting Wiskunde Samenvatting en stappenplan van hfst. 7 en 8 Samenvatting door N. 1410 woorden 6 januari 2013 5,4 13 keer beoordeeld Vak Methode Wiskunde Getal en Ruimte 7.1 toenamediagrammen Interval
Checklist Wiskunde A HAVO 4 2014-2015 HML
Checklist Wiskunde A HAVO 4 2014-2015 HML 1 Hoofdstuk 1 Ik weet hoe je met procenten moet rekenen: procenten en breuken, percentage berekenen, toename en afname in procenten, rekenen met groeifactoren.
1 a Partij is een kwalitatieve variabele, kindertal een kwantitatieve, discrete variabele. b,c
Hoofdstuk 8, Statistische maten 1 Hoofdstuk 8 Statistische maten Kern 1 Centrum- en spreidingsmaten 1 a Partij is een kwalitatieve variaele, kindertal een kwantitatieve, discrete variaele.,c d kindertal
Kerstvakantiecursus. wiskunde A. Rekenregels voor vereenvoudigen. Voorbereidende opgaven HAVO kan niet korter
Voorbereidende opgaven HAVO Kerstvakantiecursus wiskunde A Tips: Maak de voorbereidende opgaven voorin in een van de A4-schriften die je gaat gebruiken tijdens de cursus. Als een opdracht niet lukt, werk
TIP 10: ANALYSE VAN DE CIJFERS
TOETSTIP 10 oktober 2011 Bepaling wat en waarom je wilt meten Toetsopzet Materiaal Betrouw- baarheid Beoordeling Interpretatie resultaten TIP 10: ANALYSE VAN DE CIJFERS Wie les geeft, botst automatisch
Onderzoeksmethodiek LE: 2
Onderzoeksmethodiek LE: 2 3 Parameters en grootheden 3.1 Parameters Wat is een parameter? Een karakteristieke grootheid van een populatie Gem. gewicht van een 34-jarige man 3.2 Steekproefgrootheden Wat
HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen....
HAVO 4 wiskunde A Een checklist is een opsomming van de dingen die je moet kennen en kunnen.... 1. rekenregels en verhoudingen Ik kan breuken vermenigvuldigen en delen. Ik ken de rekenregel breuk Ik kan
S1 STATISTIEK. Tabellen & diagrammen Centrummaten & Spreiding
S1 STATISTIEK Tabellen & diagrammen Centrummaten & Spreiding TABELLEN & DIAGRAMMEN WELKE AUTO VIND JIJ HET MOOISTE? Kies 1,2,3,4 of 5 NUMMER 1 NUMMER 2 NUMMER 3 NUMMER 4 NUMMER 5 VERWERKING Tabel Cirkeldiagram
Antwoorden Hoofdstuk 1 Verschillen
Antwoorden Hoofdstuk 1 Verschillen 1a. Niet sterk, want het is gebaseerd op slechts één zomer. b. Vriendinnen volgen is een vorm van groepsgedrag. Waar heeft Anneke het bericht gelezen? In een kwaliteitskrant
META-kaart domein - Exponentieel verband havo4 wiskunde A H=bxg^t
META-kaart domein - Exponentieel verband havo4 wiskunde A H=bxg^t Welk verband zie ik tussen de gegeven informatie en wat er gevraagd wordt? Wat heb ik nodig? Heb ik de gegevens uit de tekst gehaald? Welke
2.2 Verbanden tussen datarepresentaties
2.2 Verbanden tussen datarepresentaties 2.2.1 Introductie In paragraaf 1 heb je een hele reeks aan datarepresentaties leren kennen. In deze paragraaf leer je welke verbanden er tussen deze representaties
Statistiek: Herhaling en aanvulling
Statistiek: Herhaling en aanvulling 11 mei 2009 1 Algemeen Statistiek is de wetenschap die beschrijft hoe we gegevens kunnen verzamelen, verwerken en analyseren om een beter inzicht te krijgen in de aard,
Inleiding Applicatie Software - Statgraphics
Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een
Netwerk, 4 Havo D, uitwerkingen Hoofdstuk 1, Statistische verwerking 1
Netwerk, 4 Havo D, uitwerkingen Hoofdstuk, Statistische verwerking Hoofdstuk Statistische verwerking Kern Populatie en steekproef a In Derbroek vonden + 6 ondervraagden de overlast ernstig tot zeer ernstig.
Vendorrating: statistische presentatiemiddelen
pag.: 1 van 6 Vendorrating: statistische presentatiemiddelen Hieronder bespreken we in het kort een aantal verschillende presentatievormen waarmee we vendorratingresultaten op een duidelijke manier kunnen
Stoeien met Statistiek
Stoeien met Statistiek Havo 4: Statistiek op grote datasets 2 Inhoudsopgave Achtergrondinformatie... 4 Docentenhandleiding... 5 Inleiding voor leerlingen... 6 Opdracht 1... 7 Opdracht 2... 8 Opdracht 3...
Praktische opdracht Wiskunde Statistiek
Praktische opdracht Wiskunde Statistiek Praktische-opdracht door R. 3948 woorden 5 december 2016 2,8 3 keer beoordeeld Vak Wiskunde Scoreformulier: Statistisch onderzoek havo 4 wiskunde A Namen groepsleden:
2. Data en datasets verwerken
2. Data en datasets verwerken Boekje 2 havo wiskunde A, domein E: Statistiek Uitwerkingen 1 Verantwoording 2015, SLO (nationaal expertisecentrum leerplanontwikkeling), Enschede Dit lesmateriaal is ontwikkeld
STATISTIEK OEFENOPGAVEN
STATISTIEK OEFENOPGAVEN 1. Bereken van elke serie getallen steeds de modus, het gemiddelde, de mediaan en de spreidingsbreedte. A. 3, 3, 4, 4, 4, 5, 5, 7, 8, 10. B. 2, 3, 3, 4, 4, 5, 8, 9, 11. C. 9, 3,
Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek
Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een klein kapitaaltje
Statistische variabelen. formuleblad
Statistische variabelen formuleblad 0. voorkennis Soorten variabelen Discreet of continu Bij kwantitatieve gegevens gaat het om meetbare gegeven, zoals temperatuur, snelheid of gewicht. Bij een discrete
Examen HAVO. Wiskunde A1,2
Wiskunde A1,2 Examen HAVO Hoger Algemeen Voortgezet Onderwijs Tijdvak 1 Donderdag 25 mei 13.30 16.30 uur 20 00 Dit examen bestaat uit 19 vragen. Voor elk vraagnummer is aangegeven hoeveel punten met een
Normale verdeling. Domein Statistiek en kansrekening havo A
Domein Statistiek en kansrekening havo A 4 Normale verdeling Inhoud 4.0 Een bijzondere verdeling 4.1 Gemiddelde en standaardafwijking 4.2 Normale verdeling 4.3 Rekenen met normale verdelingen 4.4 Steekproef
College 4 Inspecteren van Data: Verdelingen
College Inspecteren van Data: Verdelingen Inleiding M&T 01 013 Hemmo Smit Overzicht van deze cursus 1. Grondprincipes van de wetenschap. Observeren en meten 3. Interne consistentie; Beschrijvend onderzoek.
Beschrijvende statistiek
Duur 45 minuten Overzicht Tijdens deze lesactiviteit leer je op welke manier centrum- en spreidingsmaten je helpen bij de interpretatie van statistische gegevens. Je leert ook dat grafische voorstellingen
22-9-2010. Pieperproef. Praktische opdracht voor wiskunde Klas 2 Havo. 2H_Pieperonderzoek LEERLINGEN JvdB en HB.versie 2.0 1 van 8
Pieperproef Praktische opdracht voor wiskunde Klas 2 Havo 2H_Pieperonderzoek LEERLINGEN JvdB en HB.versie 2.0 1 van 8 Inhoudsopgave Benodigdheden blz. 3 Pieperonderzoek, De proef blz. 4 Uitwerking & Normering
A. Week 1: Introductie in de statistiek.
A. Week 1: Introductie in de statistiek. Populatie en steekproef. In dit vak leren we de basis van de statistiek. In de statistiek probeert men erachter te komen hoe we de populatie het beste kunnen observeren.
Populaties beschrijven met kansmodellen
Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.
4 HAVO wiskunde A HOOFDSTUK voorkennis 1. soorten verdelingen 2. de normale verdeling 3. betrouwbaarheidsintervallen 4. groepen en kenmerken
4 HAVO wiskunde A HOOFDSTUK 6 0. voorkennis 1. soorten verdelingen 2. de normale verdeling 3. betrouwbaarheidsintervallen 4. groepen en kenmerken 0. voorkennis Centrum- en spreidingsmaten Centrummaten:
extra sommen Statistiek en Kans
extra sommen Statistiek en Kans 1. Bepaal bij de volgende rijen de modus, de mediaan en het gemiddelde a. 1, 4, 2, 3, 5, 3, 6, 3 b. 12, 11, 13, 11, 12, 11, 12, 13, 11, 14, 75, 15 c. 1, 43, 12, 32, 43,
WISKUNDE A HAVO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0
WISKUNDE A HAVO VAKINFORMATIE STAATSEAMEN 2016 V15.7.0 De vakinformatie in dit document is vastgesteld door het College voor Toetsen en Examens (CvTE). Het CvTE is verantwoordelijk voor de afname van de
Hoofdstuk 2 : Grafische beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent
Hoofdstuk 2 : Grafische beschrijving van data Marnix Van Daele [email protected] Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Grafische beschrijving van data p. 1/35 Soorten meetwaarden
Factor = het getal waarmee je de oude hoeveelheid moet vermenigvuldigen om een nieuwe hoeveelheid te krijgen.
Samenvatting door een scholier 1569 woorden 23 juni 2017 5,8 6 keer beoordeeld Vak Methode Wiskunde Moderne wiskunde Wiskunde H1 t/m H5 Hoofdstuk 1 Factor = het getal waarmee je de oude hoeveelheid moet
Y = ax + b, hiervan is a de richtingscoëfficiënt (1 naar rechts en a omhoog), en b is het snijpunt met de y-as (0,b)
Samenvatting door E. 1419 woorden 11 november 2013 6,1 14 keer beoordeeld Vak Methode Wiskunde A Getal en ruimte Lineaire formule A = 0.8t + 34 Er bestaat dan een lineair verband tussen A en t, de grafiek
OEFENPROEFWERK HAVO A DEEL 2
OEFENPROEFWERK HAVO A DEEL 2 HOOFDSTUK 6 STATISTIEK EN BESLISSINGEN OPGAVE 1 Hieronder zijn vier boxplots getekend. a Welke boxplot hoort bij een links-scheve verdeling? Licht toe. b Hoe ligt bij boxplot
Voorbeelden van gebruik van 5 VUSTAT-apps
Voorbeelden van gebruik van 5 VUSTAT-apps Piet van Blokland Begrijpen van statistiek door simulaties en visualisaties Hoe kun je deze apps gebruiken bij het statistiek onderwijs? De apps van VUSTAT zijn
extra sommen Statistiek en Kans
extra sommen Statistiek en Kans 1. Bepaal bij de volgende rijen de modus, de mediaan en het gemiddelde a. 1, 4, 2, 3, 5, 3, 6, 3 b. 12, 11, 13, 11, 12, 11, 12, 13, 11, 14, 75, 15 c. 1, 43, 12, 32, 43,
Aardgasbaten. (b) Teken bij 1996 een cirkeldiagram (c) Teken bij de tabel een vlakdiagram
1. In figuur 1 zie je gegevens over de aardgasbaten in Nederland gedurende de periode 1985-1994. Je ziet zowel een staafdiagram als een frequentiepolygoon. Aardgasbaten figuur 1 (a) In welk jaar is de
4.1 Eigenschappen van de normale verdeling [1]
4.1 Eigenschappen van de normale verdeling [1] Relatief frequentiepolygoon van de lengte van mannen in 1968 1 4.1 Eigenschappen van de normale verdeling [1] In dit plaatje is een frequentiepolygoon getekend.
WISKUNDE C VWO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0
WISKUNDE C VWO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0 De vakinformatie in dit document is vastgesteld door het College voor Toetsen en Examens (CvTE). Het CvTE is verantwoordelijk voor de afname van de
Data analyse Inleiding statistiek
Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door
SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen
SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen
Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn
Statistiek: Spreiding en dispersie 6/12/2013 dr. Brenda Casteleyn dr. Brenda Casteleyn www.keu6.be Page 2 1. Theorie Met spreiding willen we in één getal uitdrukken hoe verspreid de gegevens zijn: in hoeveel
IJburgcollege Wiskunde A en C september 2017 Statistiek Opgavenboek 1 (noteer je uitwerkingen van de opdrachten in het Uitwerkingenboek 1)
IJburgcollege Wiskunde A en C september 2017 Statistiek Opgavenboek 1 (noteer je uitwerkingen van de opdrachten in het Uitwerkingenboek 1) 2. Herhaling Beschrijvende Statistiek. Old Faithful In Yellowstone
Inleiding tot de meettheorie
Inleiding tot de meettheorie Meten is het toekennen van cijfers aan voorwerpen. Koeien Koeien in een kudde, studenten in een auditorium, mensen met een bepaalde stoornis, leerlingen met meer dan 15 in
Statistiek inleiding 2 mavo
Auteur Laatst gewijzigd Licentie Webadres J van Remoortere 06 december 2013 CC Naamsvermelding 3.0 Nederland licentie https://maken.wikiwijs.nl/47815 Dit lesmateriaal is gemaakt met Wikiwijs van Kennisnet.
Statistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
Statistiek met Excel Schoolexamen en Uitbreidingsopdrachten 2 Inhoudsopgave Achtergrondinformatie... 4 Schoolexamen Wiskunde VWO: Statistiek met grote datasets... 5 Uibreidingsopdrachten vwo 5... 6 Schoolexamen
VOOR HET SECUNDAIR ONDERWIJS
VOOR HET SECUNDAIR ONDERWIJS Steekproefmodellen en normaal verdeelde steekproefgrootheden 5. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg
Les 1 Kwaliteitsbeheersing. Les 2 Kwaliteitsgegevens. Les 3 Introductie Statistiek. Les 4 Normale verdeling. Kwaliteit
Kwaliteit Les 1 Kwaliteitsbeheersing Introductie & Begrippen Monstername Les 2 Kwaliteitsgegevens Gegevens Verzamelen Gegevens Weergeven Les 3 Introductie Statistiek Statistische begrippen Statistische
IJburgcollege Wiskunde A en C september 2017 Statistiek Opgavenboek 1 (noteer je uitwerkingen van de opdrachten in het Uitwerkingenboek 1)
IJburgcollege Wiskunde A en C september 2017 Statistiek Opgavenboek 1 (noteer je uitwerkingen van de opdrachten in het Uitwerkingenboek 1) 2. Herhaling Beschrijvende Statistiek. Old Faithful In Yellowstone
Onderzoek. B-cluster BBB-OND2B.2
Onderzoek B-cluster BBB-OND2B.2 Succes met leren Leuk dat je onze bundels hebt gedownload. Met deze bundels hopen we dat het leren een stuk makkelijker wordt. We proberen de beste samenvattingen voor jou
College Week 4 Inspecteren van Data: Verdelingen
College Week 4 Inspecteren van Data: Verdelingen Inleiding in de Methoden & Technieken 2013 2014 Hemmo Smit Dus volgende week Geen college en werkgroepen Maar Oefententamen on-line (BB) Data invoeren voor
Samenvatting Tentamenstof. Statistiek 1 - Vakgedeelte
Samenvatting Tentamenstof Statistiek 1 - Vakgedeelte Naam: Thomas Sluyter Nummer: 1018808 Jaar / Klas: 1e jaar Docent Wiskunde, deeltijd Datum: 14 oktober, 2007 Voorwoord Het eerstejaars vak Statistiek
Examen HAVO en VHBO. Wiskunde A
Wiskunde A Examen HAVO en VHBO Hoger Algemeen Voortgezet Onderwijs Vooropleiding Hoger Beroeps Onderwijs HAVO Tijdvak 1 VHBO Tijdvak 2 Donderdag 25 mei 13.30 16.30 uur 20 00 Dit examen bestaat uit 19 vragen.
Hoe verwerk je gegevens met de Grafische Rekenmachine?
Hoe verwerk je gegevens met de Grafische Rekenmachine? Heb je een tabel met alleen gegevens? Kies STAT EDIT Vul L 1 met je gegevens (als de lijst niet leeg is, ga je met de pijltjes helemaal naar boven,
Rekenen met de normale verdeling (met behulp van grafisch rekentoestel)
Rekenen met de normale verdeling (met behulp van grafisch rekentoestel) In 1947 werd in opdracht van N.V. Magazijn De Bijenkorf een statistisch onderzoek verricht naar de lichaamsafmetingen van de Nederlandse
Gemiddelde: Het gemiddelde van een rij getallen is de som van al die getallen gedeeld door het aantal getallen.
Statistiek Modus De waarneming die het meeste voorkomt. voorbeeld 1: De waarnemingen zijn 2, 3, 4, 5, 5, 5, 6, 6, 7 en 8. De waarneming 5 komt het meeste (driemaal) voor, dus de modus is 5. (Kijk maar:
uitwerkingen voorbeeldexamenopgaven statistiek wiskunde A havo
uitwerkingen voorbeeldexamenopgaven statistiek wiskunde A havo uitwerkingen voorbeeldexamenopgaven statistiek wiskunde A havo - 5-6-205 lees verder Kijkcijfers maximumscore 4 Het toepassen van de formule
Didactiek van Informatieverwerking en Statistiek voor leerlingen van 12-16?
Didactiek van Informatieverwerking en Statistiek voor leerlingen van 12-16? Ontwikkeling van een module en boek voor de 2 e graads lerarenopleiding wiskunde. Informatieverwerking en Statistiek Gerard van
Programma : 1. Presentatie 2. H 5.1 Statistiek zelf gegevens verzamelen en ermee werken 3. Vragen over H4, formules
Programma : 1. Presentatie 2. H 5.1 Statistiek zelf gegevens verzamelen en ermee werken 3. Vragen over H4, formules 1 2 programma hw nagekeken en verbeterd? voorbereiden pw filmpjes wie zoekt ze op? vrijdag
Eindexamen wiskunde A havo 2000-I
Opgave 1 Seychellenzangers Seychellenzangers zijn kleine vogeltjes die nauwelijks kunnen vliegen. Rond 1968 kwamen ze alleen nog voor op het eilandje Cousin in de Indische Oceaan. Hun aantal was zo klein
Aardappelomzet in milj kg.
PERIODE STATISTIEK, COMBINATORIEK, Lineaire en Exponentiele functies. Voor al deze opdrachten geldt dat het werken met EXCEL van harte wordt aanbevolen. OPDRACHT 1 Aardappelen Uit onderzoek van de LandbouwUniversiteit
GEOGEBRAINSTITUUT. VlAANDEREN
GEOGEBRAINSTITUUT VlAANDEREN Statistiek met GeoGebra Roger Van Nieuwenhuyze Hoofdlector wiskunde HUB, lerarenopleiding Auteur VBTL, Die Keure Pedagogisch begeleider wiskunde VLP [email protected]
Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1
Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch
Leerstof voortentamen wiskunde A. 1. Het voortentamen wiskunde A
Leerstof voortentamen wiskunde A In dit document wordt de leerstof beschreven van het programma van het voortentamen wiskunde A op havo niveau te beginnen met het voortentamen van december 2017. Deze specificatie
G&R vwo A/C deel 2 8 De normale verdeling C. von Schwartzenberg 1/14. 3a 1 2
G&R vwo A/C deel 8 De normale verdeling C. von Schwartzenberg 1/14 1a Gemiddelde startgeld x = 1 100000 + 4 4000 + 3000 = 13100 dollar. 10 1b Het gemiddelde wordt sterk bepaald door de uitschieter van
VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert
VOOR HET SECUNDAIR ONDERWIJS Kansmodellen 4. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg . Een concreet voorbeeld.... Een kansmodel
