Statistiek met Excel. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14

Vergelijkbare documenten
Statistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14

Stoeien met Statistiek

ICT en grote datasets havo wiskunde A en vwo wiskunde A/C

Basisvaardigheden Microsoft Excel

Basisvaardigheden Microsoft Excel

DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

DOEN! - Praktische Opdracht Statistiek 4 Havo Wiskunde A

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf

Samenvattingen 5HAVO Wiskunde A.

VAARDIGHEDEN EXCEL. MEETWAARDEN INVULLEN In de figuur hieronder zie je twee keer de ingevoerde meetwaarden, eerst ruw en daarna netjes opgemaakt.

6. Reeksen

Grafieken in Word. Soort Leven 4,8 4,9 5,1 5,5 5,6 5,8 6,0 6,2 Annuïteiten 4,9 5,1 5,3 5,7 5,8 6,0 6,2 6,5

STATISTIEK. Een korte samenvatting over: Termen Tabellen Diagrammen

Een grafiek maken in Excel

2 Data en datasets verwerken

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

2 Data en datasets verwerken

In dit document staat beschreven hoe je de meetgegevens vanuit Coach kunt opslaan en later in kunt lezen in Excel en hier een grafiek van kunt maken.

Voorbeelden van gebruik van 5 VUSTAT-apps

Onderzoek. B-cluster BBB-OND2B.2

3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625.

SNEL WERKEN MET EXCEL

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen....

WERKOMGEVING... 3 INSTELLINGEN... 3 BASISVAARDIGHEDEN... 3 INVOEREN GEGEVENS... 3 OPMAAK... 3

INSTRUCT Samenvatting Basis PowerPoint, H6 SAMENVATTING HOOFDSTUK 6. Galerie voor diagrammen:

Gemiddelde: Het gemiddelde van een rij getallen is de som van al die getallen gedeeld door het aantal getallen.

Korte inleiding Excel

Checklist Wiskunde A HAVO HML

Docentenhandleiding. AaBeeCee-Digitaal. Rekenen met Excel

WISKUNDE A HAVO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0

Kerstvakantiecursus. wiskunde A. Rekenregels voor vereenvoudigen. Voorbereidende opgaven HAVO kan niet korter

GEGEVENS154LEERLINGEN

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Een formule is een berekening die jij zelf maakt in Excel. Een formule begint met het isgelijkteken en bevat celverwijzingen.

1 Inleiding. 1.1 Werkblad, rijen, kolommen en cellen Als je Excel opent, zie je het volgende scherm (de menubalk bovenin kan iets verschillen):

2 Data en datasets verwerken

Statistische variabelen. formuleblad

Handleiding Excel. bij. hoofdstuk 18 Cijfers in Orde Wageningse Methode

Overzicht statistiek 5N4p

Ben jij een Sherlock? Duik in StatLine, de databank van CBS. Leerlingenversie

5. Functies. In deze module leert u:

Grafieken tekenen met de computer

2.4 Twee groepen vergelijken

Hoe maak je een grafiek met Excel 1

2.1.4 Oefenen. d. Je ziet hier twee weegschalen. Wat is het verschil tussen beide als het gaat om het aflezen van een gewicht?

SNELLE INVOER MET EXCEL

Grafiek en dynamisch bereik

Een functie is een kant en klare formule. Via de knop Som in de groep Bewerken van het tabblad Start kun je een aantal veelgebruikte functies kiezen:

Grafieken in Excel2003

6. Absolute en relatieve celadressering

Grote hoeveelheid gegevens analyseren: draaitabellen

Basistechnieken Microsoft Excel in 15 minuten

Grafieken veranderen met Excel 2007

Maken van figuren in Excel

Beschrijvende statistiek

Praktische opdracht Wiskunde Statistiek

GEOGEBRA 4. R. Van Nieuwenhuyze. Hoofdlector wiskunde, lerarenopleiding HUB, Brussel. Auteur Van Basis tot Limiet.

GEOGEBRAINSTITUUT. VlAANDEREN

Leren werken met Excel en Tabellen maken

Grafieken maken met Excel

1. CTRL- en SHIFT-knop gebruiken om meerdere variabelen te selecteren

Basis Excel cursus 2013

Mini-theorie vooraf. Beelddiagram In een beelddiagram zijn de hoeveelheden aangegeven met figuurtjes

Cellen automatisch vullen

Verbanden 1. Doelgroep Verbanden 1

BESCHRIJVENDE STATISTIEK MET GEOGEBRA 4.0

Economische topper 4 Opdracht pag. 42 nr. 2

3 Cijfers in orde. Antwoorden- boekje. Met behulp van Excel. Stedelijk. Gymnasium. Nijmegen

Didactiek van Informatieverwerking en Statistiek voor leerlingen van 12-16?

1 DATABASE MANAGEMENT

Microsoft Excel 2013 Berekeningen

Samenvoegen met Word en Excel 2010

HET TEKENEN VAN EEN GRAFIEK MET EXCEL

Paragraaf 5.1 : Frequentieverdelingen

Ledenlijsten + etiketten maken

Inhoudsopgave Voorwoord 5 Nieuwsbrief 5 Introductie Visual Steps 6 Wat heeft u nodig? 6 De volgorde van lezen 7 Uw voorkennis

Excellerend Kwartaaltip

Het csv bestand gaan we nu inlezen in Coach. Open Coach; log in als docent; kies nieuwe activiteit ; meten. (Je hoeft geen meetpaneel te kiezen.

1. Het werken met een rekenblad: een inleiding

2.6 Spreadsheets met Excel

Een toekomst voor ieder kind.

TIP 10: ANALYSE VAN DE CIJFERS

Hoofdstuk 13: Sorteren & Filteren* 2010

10. Voorbeeld berekeningen maken met Excel

Excel. voor natuurkunde

Om een zo duidelijk mogelijk verslag te maken, hebben we de vragen onderverdeeld in 4 categorieën.

Aan de slag met AdminView

1. Exporteren Verschil Xls en Csv Het maken van een Csv bestand Sorteren in Excel Sorteren in Excel

ICT EN BRONNENONDERZOEK OEFENBOEK MS-EXCEL

Content tips & tricks

Coderen en analyseren van kwantitatieve data via Excel

De eerste stappen met de TI-Nspire 2.1 voor de derde graad

2 Data en datasets verwerken

Handleiding

De 10 e editie havo-vwo OB

Het uiterlijk lijkt erg op Word, een paar belangrijke verschillen geven we aan in de schermafdruk hieronder.

Samenvatting Wiskunde Samenvatting en stappenplan van hfst. 7 en 8

Computerlessen voor Senioren. Themacursus. Basis Excel. Uitgave Samenstelling: Lucien Delchambre Paul Derycke. Werken met mappen 1

Bovenin zie je de Hulpmiddelen voor grafieken met 3 tabbladen. Hiermee pas je de indeling en opmaak van de grafiek aan.

Transcriptie:

Statistiek met Excel 1

2

Inhoudsopgave Achtergrondinformatie... 4 Statistiek met Excel... 10 Het toepassen van de vaardigheden uit Statistiek met Excel op grote bestanden... 21 Verrijkingsopdrachten... 24 Verslag werken met grote datasets in HAVO4... 25 3

Achtergrondinformatie Auteurs Marc Bouman; e- mail: mbouman@vszutphen.nl Jossy Carmelia; e- mail: j.carmelia@osg- erasmus.nl Marian Gall; e- mail: m.gall@rsg- sneek.nl Bert Kraai; e- mail: bkraai@vszutphen.nl Jan Mostert; e- mail: j.mostert@wolfsbos.nl Eva Vermeulen; e- mail: e.vermeulen@annamaria.nl Yde van Wieren; e- mail: y.vanwieren@singelland.nl Inleiding In de voorlopig vastgestelde examenprogramma's Wiskunde A (Havo en VWO) en Wiskunde C (VWO) is het domein Statistiek uitgebreid, vanuit de wens om leerlingen beter voor te bereiden op vervolgstudies op HBO en Universitair niveau. De belangrijkste veranderingen zijn: 1. het domein Statistiek wordt ook bij het centraal examen getoetst; 2. de nadruk verschuift van reproductie van kennis en opgaven, naar inzicht en productieve vaardigheden; 3. leerlingen dienen statistische vaardigheden toe te kunnen passen bij grote datasets met behulp van ICT en deze praktische vaardigheden dienen getoetst te worden bij het schoolexamen. Probleemstelling werkgroep Statistiek Zwolle Voor de lespraktijk is al nieuw pilot lesmateriaal ontwikkeld. Hoewel dit lesmateriaal nog verder beproefd en bijgewerkt kan worden, heeft de werkgroep Zwolle haar aandacht gericht op: het aanleren en toetsen van statistische vaardigheden bij grote datasets met behulp van ICT. Daarbij kwamen de volgende vragen naar boven: 1. Welke statistische basiskennis is er nodig voordat een leerling aan de slag kan met statistiek op een grote dataset? 2. Welke statistische software is er beschikbaar voor het werken met grote datasets? Welk pakket leent zich voor gebruik in het voortgezet onderwijs? 3. Welke instructie hebben leerlingen nodig voor het gebruik van deze software? Welke zijn reeds beschikbaar? 4. Welke datasets zijn beschikbaar? Welke lenen zich voor gebruik in het voortgezet onderwijs? 5. Welke leerlijn kan het beste gekozen worden, over de leerjaren heen? 6. Hoe dient de lesstof didactisch opgebouwd te worden? Welke ervaringen (best practices) zijn beschikbaar? 7. Hoe kan de lesstof praktisch getoetst worden, zowel tussentijds als bij het schoolexamen? Doelstelling werkgroep Statistiek Zwolle Lesmateriaal ontwikkelen zodat leerlingen kunnen kennismaken met het werken met een grote dataset en docenten hier ervaring mee op kunnen doen. Doelgroep De werkgroep Statistiek Zwolle heeft besloten zich in eerste instantie te richten op Havo wiskunde A, om de volgende redenen: 4

a. Dit is de eerste groep leerlingen die in 2017 examen gaat doen in dit vernieuwde examenonderdeel Statistiek. b. Dit lesmateriaal kan waarschijnlijk ook gebruikt worden bij VWO wiskunde A/C. Mogelijk biedt het zelfs een basis om op door te bouwen. Verantwoording activiteiten en gemaakte keuzes 1. Benodigde basiskennis De werkgroep is van mening dat in de Havo- onderbouw de volgende statistische kennis en vaardigheden aan bod dienen te komen, om in de Havo- bovenbouw het gewenste niveau te kunnen bereiken: a. het verzamelen van statistische gegevens in een turfstaat, (cumulatieve) frequentietabel en kruistabel b. het zowel handmatig als met behulp van een eenvoudig ICT- programma (bv. Excel) weergeven van statistische gegevens in een dotplot, staafdiagram, histogram, cirkeldiagram, steelbladdiagram, lijndiagram, (relatieve) cumulatieve frequentiepolygoon, boxplot, puntenwolk c. de centrummaten gemiddelde, mediaan en modus. 2. Beschikbare statistische software De werkgroep heeft de volgende statistische software onderzocht: 1. VU Statistiek voor Windows. De nieuwste versie van VUStat is geschikt voor het werken met grote databestanden en kan Excel- bestanden te importeren. Voordeel: zeer gebruikersvriendelijk, werkt intuïtief. Nadeel: niet gratis (zie de site van VUSoft Amsterdam), wel een demoversie beschikbaar. 2. Excel. Het kan de meest voorkomende statistische berekeningen uitvoeren en grafieken en diagrammen weergeven. Voordeel: staat bij vrijwel alle scholen standaard geïnstalleerd op Windows PC's, dus 'gratis'. Nadeel: het maken van de diagrammen is bewerkelijk en soms gekunsteld (m.n. boxplot). 3. R. Open source software voor statistiek. De apart verkrijgbare R commander zorgt voor een menustructuur. Met de scripttaal kunnen tevens simulaties worden uitgevoerd. Voordeel: gratis, wordt bovendien op steeds meer vervolgopleidingen gebruikt. Nadeel: is vrij geavanceerd en voor Havo wiskunde A te hoog gegrepen (mogelijk wel geschikt voor VWO wiskunde D). 4. TI nspire. Deze opvolger van de TI- 84 beschikt over uitgebreide statistische functies. Nadeel: het intern geheugen van deze machine is nog onvoldoende voor het werken met grotere databestanden (beperkt aantal kolommen en rijen). Conclusies: 1. Zowel VUStat als Excel komen in aanmerking voor gebruik in het voortgezet onderwijs. 2. Het is wenselijk om het lesmateriaal zo te schrijven dat dit zoveel mogelijk onafhankelijk blijft van de te gebruiken software, omdat technische ontwikkelingen wellicht op korte termijn nieuwe alternatieven bieden (bv. smartphone). De werkgroep Zwolle heeft lesmateriaal ontwikkeld voor gebruik met Excel, zodat iedere school hier direct mee aan de slag kan. 5

3. Benodigde instructies leerlingen bij de software Bij het programma VUStat is nauwelijks instructie nodig voor het gebruik van de software. Als leerlingen vertrouwd zijn met de theoretische begrippen, diagrammen en rekentechnieken, zullen zij snel de verschillende mogelijkheden herkennen en onder de knie krijgen. Het programma Excel vraagt om meer instructie voor gebruik. Allereerst is het belangrijk om de inhoud van kolommen numeriek te coderen, anders kan Excel hier niet mee rekenen. Verder is het opletten geblazen bij het sorteren en selecteren van gegevens: hierbij worden gemakkelijk fouten gemaakt. Ook het aanmaken van diagrammen vereist iedere keer een (groot) aantal handelingen. En tenslotte is voor geavanceerdere statistische technieken een aparte invoegtoepassing vereist. De werkgroep Zwolle heeft er voor gekozen om een aparte instructie te ontwikkelen voor het gebruik van Excel. 4. Beschikbare datasets De werkgroep heeft aan een dataset de volgende eisen gesteld: tenminste 15 kolommen (variabelen) en tenminste 1000 records. Bij het zoeken naar een geschikte dataset hebben wij de volgende bronnen geraadpleegd: De oefenbestanden die meegeleverd worden bij installatie van het programma R. Deze bestanden zijn veel te klein en bovendien gericht op het volwassen Amerikaanse publiek. Daarnaast zijn er publieke sites die deels gratis en deels betaald datasets aanbieden. Dit vraagt nader onderzoek. Enkele voorbeelden: o CBS, http://www.cbs.nl/nl- NL/menu/informatie/onderwijs/home/default.htm, zie tevens bijlage. Deze site bevat een grote dataset over de beroepsbevolking voor gebruik in het voortgezet onderwijs, inclusief lesmateriaal. o KNMI, zie http://www.knmi.nl/klimatologie/. o Google Public Data, zie http://www.google.com/publicdata/directory met onder andere een doorverwijzing naar databases van Eurostat. o Amazon, zie http://aws.amazon.com/publicdatasets/. o http://opendatanederland.org/ o http://www.amsterdamopendata.nl/data?category=educatie- jeugd- diversiteit o http://www.kadaster.nl/web/themas/open- data.htm o https://twitter.com/opendatanl Uiteindelijk hebben wij besloten om zelf een dataset samen te stellen op basis van leerlinggegevens in Magister. Deze dataset sluit aan bij de belevingswereld van de leerlingen: het bevat immers gegevens over henzelf. Het maken van zo'n dataset bleek echter minder eenvoudig dan gedacht. Om te beginnen moesten persoonlijke gegevens en cijfergegevens apart worden gedownload en vervolgens weer worden gecombineerd. Omwille van de privacy zijn de gegevens in sommige kolommen versleuteld, zoals leerlingnummer en postcode. Verder bleek dat er een validatieslag nodig was, omdat er gegevens (met name cijfers) ontbraken. Conclusies: 1. Het door leerlingen zelf laten samenstellen van een grote dataset op basis van eigen onderzoek is te tijdrovend. Deze optie valt af. 2. De met statistische software meegeleverde oefendatasets zijn over het algemeen te klein. Ook deze optie valt af. 3. Datasets van onderzoeksbureaus en publieke instellingen zijn niet altijd bruikbaar voor het voortgezet onderwijs, omdat de thematiek niet altijd aansluit bij de belevingswereld van 6

leerlingen, of omdat er veel specifieke vakkennis vereist is. Daarnaast worden grotere datasets veelal tegen betaling aangeboden. 4. Het zelf samenstellen van een grote dataset op basis van binnen de school beschikbare gegevens is een behoorlijk tijdrovende klus. 5. Het bouwen van een dataset met behulp van simulaties biedt een reëel alternatief. De werkgroep Zwolle heeft er voor gekozen om de ontbrekende gegevens in de dataset met leerlinggegevens aan te vullen met gesimuleerde data. 5. Het kiezen van een leerlijn over de jaren heen Het is de mening van de werkgroep Zwolle dat het aanleren van praktische statistische vaardigheden het beste incrementeel kan plaatsvinden. Iedere loop in deze leerspiraal bestaat uit: 1. exploreren van een nieuwe onderzoeksvraag en dit vertalen naar statistisch onderzoek; 2. aanleren van statistische vaardigheden voor de analyse van gegevens, het benoemen van kengetallen en het weergeven van resultaten; 3. het praktisch uitvoeren van onderzoek, waaronder het leren gebruiken van statistische software; 4. het kritisch evalueren van de wijze waarop de gegevens zijn verzameld, geanalyseerd en gepresenteerd en tevens nagaan hoe valide en betrouwbaar de gevonden resultaten zijn. Als je dit uitzet op een horizontale tijdslijn, ontstaan als het ware golfbewegingen waarbij bij iedere loop van de spiraal (en bij iedere stap) start met divergeren en eindigt met convergeren: Het is belangrijk dat leerlingen deze manier van denken en werken aanleren. Dit kan bijvoorbeeld door het aanleren van praktische statistische vaardigheden over meerdere practica verdeeld over meerdere leerjaren aan te bieden. Een voorbeeld van een mogelijke leerlijn: 1. Basiskennis statistiek: turfstaten en frequentietabellen, gemiddelde/modus/mediaan, boxplot. Handmatig maken van eenvoudige diagrammen als lijn-, staaf- en cirkeldiagrammen. 2. Bij bestaande tabellen met een beperkt aantal rijen en kolommen maken van diagrammen en boxplots met behulp van Excel. 3. Zelf uitvoeren van een statistisch onderzoekje onder een beperkte populatie, de resultaten verzamelen in een (gecodeerde) tabel in Excel en weergeven m.b.v. diagrammen. Bewust maken van het belang van betrouwbaarheid van onderzoeksgegevens. Bewust maken wat het effect is een beperkte omvang van de populatie of de steekproef op de validiteit van conclusies. In plaats hiervan voorzichtig hypotheses leren formuleren en omvormen tot onderzoeksvragen. 4. Basiskennis normale verdeling: standaardafwijking, vuistregels, kansen en grenswaarden berekenen. 7

5. Basiskennis statistisch onderzoek: soorten variabelen (nominaal, ordinaal, interval, ratio), verschillende soorten onderzoeksvragen (frequentie, verschil, samenhang). 6. Starten met een bestaande dataset, formuleren van bijpassende onderzoeksvragen, formuleren van hypotheses, toetsen van deze hypotheses op basis van de beschikbare gegevens. 7. Starten met een eigen onderzoeksvraag, op zoek gaan naar een daarbij passende dataset (of het zelf samenstellen van een dataset door het combineren van bestaande tabellen, of zelf genereren van data met behulp van simulatie). Formuleren en toetsen van hypotheses. 6. Didactische opbouw van de lesstof Door de werkgroep Zwolle is het volgende ontwikkeld: 1. Basiscursus Excel voor het leren tekenen van diagrammen en boxplots. 2. Dataset leerlinggegevens met bijbehorende opdrachtenserie. Enkele tips uit de eerste pilots met dit lesmateriaal: Wissel theorie af met praktijk. Start bijvoorbeeld een blokuur met een stukje theorie, laat leerlingen vervolgens hiermee aan de slag gaan en sluit af met een reflectie op wat is geleerd. Bouw opdrachten op in moeilijkheidsgraad en vrijheidsgraad. Geef snelle leerlingen ook de gelegenheid om zelf variaties op opdrachten te bedenken en uit te voeren. Maak leerlingen zelf verantwoordelijk voor het uitzoeken van de technische details van Excel. Stel eventueel experts aan. Beperk je als docent tot de instructie vooraf, klassenmanagement tijdens het uitvoeren van de opdracht, beantwoorden van vakinhoudelijke vragen en klassengesprek aan het eind. Bewaak de voortgang door middel van een afvinklijst. 7. Het praktisch toetsen van de lesstof, zowel tussentijds als bij het schoolexamen Hierbij zijn door de werkgroep Zwolle de volgende werkwijzen toegepast: A. Eén school heeft de praktische opdrachten als afvinkonderdeel opgenomen. B. Een andere school heeft besloten om de uitwerkingen van leerlingen te waarderen met een cijfer op de volgende manier. Het basiscijfer van de opdracht is een 7, maar dat kan hoger of lager uitvallen. Dit heeft te maken met inzet, creativiteit en de uitwerking van de gemaakte opdrachten. Het is duidelijk dat dit onderdeel nog verdere uitwerking en beproeving in de praktijk behoeft. Vervolgstappen De werkgroep Zwolle heeft een eerste aanzet gegeven voor het ontwikkelen van lesmateriaal, zodat leerlingen kunnen kennismaken met het werken met een grote dataset en docenten hier ervaring mee op kunnen doen. Daarmee zijn we nog niet op het niveau dat wij de exameneisen volledig af kunnen dekken. Hiervoor zijn nog een aantal vervolgstappen nodig: de didactische lijn en opdrachten verder ontwikkelen in de praktijk, bijvoorbeeld t.a.v. de normale verdeling. de didactiek: hoe laat je leerlingen zoveel mogelijk zelf ontdekken, hoe monitor je als docent dit leerproces en welke mogelijkheden heb je om bij te sturen? het tussentijds toetsen van deze praktijkvaardigheid het ontwerpen van een praktisch schoolexamen ervaring opdoen met VU Statistiek, als alternatief voor Excel 8

VWO A/C: het zelfstandig opzetten en uitvoeren van onderzoek, het toetsen van hypothesen. Geraadpleegde bronnen Voorlopig vastgestelde examenprogramma's (juli 2013): http://www.leergangwiskunde.nl/docs/lesstof/algemeenvoorlopig%20vastgestelde%20exame nprogrammas%20nieuwe%20wiskunde_wijzigingen%20tov%20geaccordeerde%20versie%20j uli%202013.pdf Concept syllabi centraal examen 2017 (veldraadpleging oktober 2013): https://www.cve.nl/item/conceptsyllabi_wiskunde_a_b_en_c Pilot lesmateriaal http://www.leergangwiskunde.nl/documenten.html Workshop A5 (ledenvergadering NVvW) over steekproeven (Carel van de Giessen) https://www.nvvw.nl/16820/jaarvergaderingen/downloads- 2013 bevat tevens een proeflicentie VU Statistiek VU Statistiek is te bestellen via http://www.vusoft2.nl/ http://www.nrc.nl/nieuws/2012/02/14/statistiek- saai- cbs- cijfers- komen- tot- leven- op- een- kaart/ http://nieuws.hum.uu.nl/2013/02/18/utrecht- data- school- studenten- analyseren- grote- datasets- van- bedrijven- en- instellingen/ Bijlage Mailbericht 14 januari 2014 Wat leuk dat u in uw lesprogramma ook aandacht wil besteden aan het materiaal van het CBS! Voor scholen heeft het CBS een speciale website gemaakt met informatie: CBS in de klas (http://www.cbs.nl/nl- NL/menu/informatie/onderwijs/home/default.htm). Het Centrum voor Beleidsstatistiek kan alleen onder strikte voorwaarden data aan onderzoekers ter beschikking stellen en scholieren komen hiervoor niet in aanmerking (bovendien hangt er per onderzoek een behoorlijk prijskaartje aan). Op de website van CBS in de klas wordt wel speciaal voor leerkrachten en scholieren een groot databestand van de Enquête Beroepsbevolking ter beschikking gesteld. Het databestand en lesmateriaal kunt u hier downloaden: http://www.cbs.nl/nl- NL/menu/informatie/onderwijs/gereedschappen/wiskunde/databestand- ebb.htm. Op deze website staat daarnaast nog andere informatie die u mogelijk kunt gebruiken in uw lessen. Met vriendelijke groet, Ineke Bottelberghs Account manager microdataservices 9

Statistiek met Excel In deze basiscursus Statistiek met Excel maak je verschillende opdrachten over statistiek. In deze handleiding ga je aan de hand van gegevens een lijngrafiek,stapeldiagram, cirkeldiagram, spreidingsplot en een boxplot maken. Lees deze handleiding goed en volg de stappen precies zoals omschreven. Krijg je niet de grafiek zoals deze bedoeld is, wis de grafiek en start opnieuw. Zorg ervoor dat je het gemaakte bestand tussendoor opslaat onder je eigen naam op een voor jou bekende plaats, zodat je het later kunt inleveren. Gegevens 1 Maak de lijngrafiek, het stapeldiagram, het cirkeldiagram, spreidingsplot en het boxplot in het betreffende tabblad met gegevens 1. Figuur 1 1.Lijngrafiek Je gaat een lijngrafiek maken waarin het totale aantal leerlingen is uitgezet tegen het schooljaar. Dit gaat als volgt: Selecteer de gegevens die in de lijngrafiek moeten komen, dus de schooljaren en de totalen. Doe dit als volgt: Selecteer eerst de schooljaren. Houd [Ctrl] ingedrukt terwijl je vervolgens de totalen selecteert. Zie figuur 1. Ga naar Invoegen: Grafieken. Klik op lijn en kies lijn met gegevensmarkeringen. De lijngrafiek verschijnt en knip en plak deze naar het werkblad lijngrafiek. We gaan deze lijngrafiek verfraaien:! Op de lijngrafiek klikken en dan verschijnt Hulpmiddelen voor grafieken:indelingen! Gebruik deze indelingen om precies de volgende grafiek te krijgen door o.a. de astitels te benoemen, gegevenslabels in te voeren, rasterlijnen, 10

! De schaal kun je aanpassen door te dubbelklikken op de verticale as: as opmaken: minimum vast 600 en sluiten! Niet alle aantallen bij de punten zijn goed zichtbaar. Verplaats de aantallen door op het getal bij een punt te klikken en het getal te verslepen.! Zet in deze grafiek een lineaire trendlijn en maak deze op qua lijnkleur en lijnstijl! Je kunt de grafiek qua kleur nog verfraaien Na al deze handelingen moet je de volgende lijngrafiek (figuur 2) hebben: Totaal aantal leerlingen 800 780 780 760 740 Aantal 720 700 680 678 713 677 663 689 Totaal Linear (Totaal) 660 640 620 600 621 03-04 04-05 05-06 06-07 07-08 08-09 09-10 schooljaar Figuur 2 Sla het bestand op. 11

2.Stapeldiagram Je maakt als volgt een stapeldiagram:! Selecteer de gegevens die in het stapeldiagram komen(zie figuur 3). Figuur 3! Benoem de assen en zorg ervoor dat je het stapeldiagram krijgt,zoals in figuur 4. Aantal Aantal leerlingen 900 800 700 600 500 400 300 200 6e klas 5e klas 4e klas 3e klas 2e klas 1e klas 100 0 03-04 04-05 05-06 06-07 07-08 08-09 09-10 Schooljaar Figuur 4! Je kunt het stapeldiagram nog verfraaien qua kleur. 12

3. Cirkeldiagram Je maakt als volgt een cirkeldiagram voor het schooljaar 2009-2010:! Selecteer de gegevens die in het cirkeldiagram komen(zie figuur 5). Figuur 5! Benoem de titel en via indeling gegevenslabels kun je de gegevenslabels opmaken en in percentage laten tonen(zie figuur 6). Schooljaar 2009-2010 20% 17% 9% 17% 20% 17% 1e klas 2e klas 3e klas 4e klas 5e klas 6e klas Figuur 6 13

Parijs * Ga naar het werkblad: Parijs Hierin is het temperatuurverloop in Parijs in de maand maart van 2012 en 2013weergegeven. Verplaats je de aanwijzer naar beneden, dan verdwijnt de bovenste kop van het beeldscherm. Dat is te voorkomen. * Zet de aanwijzer in cel B3 * Ga naar Beeld: Blokkeren en kies titels blokkeren. 4.Spreidingsplot We gaan een spreidingsplot maken in het werkblad spreidingsplot bij de minimum temperatuur en het aantal mm neerslag. Zo zouden we bijvoorbeeld kunnen zien dat er meer neerslag valt als de minimum temperatuur laag is. * Selecteer de cellen C3 t/m C33 en E3 t/m E33. * Klik op invoegen en bij grafieken op spreiding. * Bij het menu indeling kun je verticale rasterlijnen aanzetten zodat je een beter beeld krijgt. * As titels maken: Labels, astitels. Zet horizontaal minimum temperatuur en verticaal neerslag. * Grafiektitel: Geef de grafiek de titel: neerslag bij minimum temperatuur. Formules in Excel Excel heeft de mogelijkheid om met kant- en- klare formules te werken. We noemen dit functies. Er zijn verschillende manieren om functies in te voeren: In dit onderdeel behandelen we enkele veel gebruikte functies. Voor dit onderdeel heb je het werkblad Parijs, Cijfers en Excellent nodig. Om in Excel een formule in te voeren moet je in de gewenste cel beginnen met het intikken van een =. Op deze manier kan Excel een formule herkennen. Gebruik de vulgreep: het vierkantje in de rechter benedenhoek van de cel. Als je er met de muis naar toe gaat verschijnt een zwart kruisje. Deze kun je verslepen,zodat je niet voor elke cel een formule hoeft in te tikken. Excel past de formule wel aan. Onderaan de tabel moet je de maandtotalen van het aantal uren zon en de neerslag uitrekenen * Zet in cel A35: Totaal * Ga naar D35 en dan naar Formules en klik op functie invoegen * Selecteer :SOM en druk op OK. * Nu kun je de cellen aangeven, waarvan de som moet worden berekend D3:D33 en druk op OK. * Met de knop kun je het aantal cijfers achter de komma veranderen (deze staat bij Start). Zorg dat je een cijfer achter de komma krijgt. * Bereken zo het totaal aantal uren zon en de neerslag in deze maand. 14

De functie GEMIDDELDE Ook het gemiddelde aantal uren zon kun je berekenen met een functie. * Zet in cel A36: Gemiddeld * Zet de aanwijzer in cel D36 * Klik op de knop f x (Functie plakken) of als die er niet is via menukeuze: Invoegen en f x Functie Je krijgt het volgende venster: * Selecteer het: GEMIDDELDE en druk op OK * Nu kun je de cellen aangeven, waarvan het gemiddelde moet worden berekend bij Getal 1 staat: D3:D35, verander dat in D3:D33 en druk op OK Het antwoord is 5,637097. Met de knop kun je het aantal cijfers achter de komma veranderen. Zorg dat in D36 nu 5,6 staat * Bereken op dezelfde manier het gemiddelde aantal mm neerslag, maar ook het gemiddelde van de maximum en minimum temperaturen Laat afronden op 1 decimaal. De functies MAX en MIN Je kunt ook het maximum en het minimum laten bepalen. Ook daarvoor kunnen we een functie gebruiken * Zet in cel A37: Maximum * Maak in cel B37 met f x de functie: = MAX(B3:B33) Ook de laagste temperatuur kun je met een functie bepalen. * Zet in cel A38: Minimum * Maak in cel C38 met f x een functie om de laagste temperatuur te bepalen. Van de andere gegevens moet je ook het maximum en minimum bepalen. 15

5. Boxplot Voor 2012 en 2013 ga je een boxplot maken van de maximum temperatuur. Daarvoor moet je eerst de kwartielen berekenen met de formule in het werkblad boxplot. * Maak in cel B2 met f x de functie: = KWARTIEL * Druk op OK * Op het blokje bij matrix klikken, naar het werkblad Parijs en B3:B33 selecteren * Enter en bij kwartiel 3 invullen * Druk op OK * Op dezelfde manier zet je de mediaan=kwartiel 2 in de tabel en kwartiel 1. * Max en min van de maximum temperatuur kun je kopiëren(die had je al). * Maak de tabel af met de kwartielen,mediaan,max/min van 2013 * Deze gegevens gaan we in een boxplot zetten: * Maak van de tabel een lijngrafiek met gegevensmarkeringen, dus met puntjes De volgende grafiek is het resultaat: 16

* Bij het ontwerpen kies je dan voor Rijen en kolommen omdraaien. * Je krijgt dan * Klik hier op een van de gegevenspunten en klik op de rechtermuisknop. Kies hier voor Gegevensreeks opmaken. Kies voor lijnkleur en vervolgens Geen lijn. Doe dat voor alle vijf lijnen afzonderlijk. * Als alle tussenlijnen zijn verwijderd, markeer je weer een gegevenspunt en kies in het menu Indeling voor Lijnen en vervolgens voor Hoog/laag lijnen. * Excel trekt nu twee verticale lijnen door de gegevens Door nu te kiezen voor Omhoog/omlaag balken voegt Excel boxen toe 17

* Wanneer je op de box gaat staan en op de rechtermuisknop klikt, krijg je een menu waarmee je de opmaak van de box kunt aanpassen. Kies hiervoor Dalingsbalk opmaken. Je kunt kiezen voor geen vulling * Sla deze boxplot op. Gegevensanalyse Je moet eerst Toolpak installeren en dat doe je als volgt: * Ga naar bestand, Dan naar opties vervolgens invoegtoepassingen,selecteer Analysis Toolpak zie hieronder * Druk op Start bij Beheren: Excel- invoegtoepassingen zie hierboven 18

* Bij invoegtoepassingen aanvinken Analysis Toolpak, dan Ok In de bovenste balk staat Gegevens, klik deze aan en klik op Gegevensanalyse. * Selecteer eerst B3 t/m E33 uit het werkblad Parijs * in de Gegevensanalyse Beschrijvende statistiek selecteren, dan ok, * Vink "Samenvattingsinfo" aan. * 19

Als je op ok drukt krijg je een overzicht van allerlei statistische gegevens. Voor ons zijn van belang het gemiddelde, de mediaan, de modus, de standaarddeviatie, enz. Voor dit overzicht wordt een nieuw tabblad aangemaakt. Noem deze "statistische gegevens. Sla het bestand op!! 20

Het toepassen van de vaardigheden uit Statistiek met Excel op grote bestanden Dataset Leerlinggegevens Jullie hebben de basiscursus Statistiek met Excel doorgewerkt. Hierin is nog geen sprake van grote datasets. Met kleine al voorbewerkte bestanden werd geoefend om met Excel deze gegevens grafisch te verwerken. Hierbij moest je al wel soms onderdelen van een wat uitgebreider databestand selecteren en apart zetten zodat je er mooie plaatjes mee kon maken. Om bij de onderstaande opdrachten telkens de juiste gegevens bij elkaar te krijgen kun je een kolom te selecteren en op kenmerken van deze kolom sorteren. Door dit na elkaar in een bepaalde volgorde te doen voor verschillende kolommen kun je de gewenste gegevens bij elkaar krijgen. Dit oplopend sorteren en aflopend sorteren staan in de menubalk van Excel. Maak telkens elke opdacht op een nieuw tabblad. Na het maken van een grafische voorstelling krijg je vaak wat vragen Zet de antwoorden op deze vragen onder de spreidingsplot op het tabblad. Op deze manier heb je een mooie tekst bij de gemaakte grafische voorstelling. Sla telkens het resultaat op. 21

Opdrachten Middelen die nodig zijn bij deze opdracht: Je krijgt een groot Excelbestand met de leerlinggegevens van een school. Met deze gegevens ga je aan de slag. Opdracht 1 Maak een spreidingsplot waarbij op de horizontale as de cijfers voor het vak Ned (Nederlands). staan en op de verticale as de cijfers voor het vak Eng (Engels). Doe dit voor klas 11. Selecteer de betreffende kolommen en kopiëer deze naar het tabblad opdracht 1. Benoem de assen en geef de grafiek een titel. Zet in de grafiek een lineaire trendlijn. Vragen: Waarom zou je zo n grafische voorstelling willen maken? Welke conclusie kun je trekken uit de grafische voorstelling die je hebt gemaakt? Opdracht 2 We gaan cirkeldiagrammen maken die de keuze voor de profielen laten zien. Maak een cirkeldiagram voor: havo jongens havo meisjes vwo jongens vwo meisjes Je krijgt dus 4 cirkeldiagrammen. Zorg dat de verschillende profielen telkens dezelfde kleuren krijgen Door eerst te selecteren op profiel, daarna op schooltype en tenslotte op geslacht, krijg je alle 16 soorten (categorieën) netjes bij elkaar om te verwerken. Bij deze selectievolgorde heb je alle havo jongens bij elkaar staan enz Ook andere volgordes van selectie leveren de verschillende groepen op, maar vaak niet zo netjes geordend. Ga dit na. De laatste ordening levert de hoofdordening M/V op, binnen de hoofdordening zie vervolgens de eerdere ordeningen terug komen, eerst havo/vwo en daarbinnen weer de profielen. De havo- jongens staan dus mooi bij elkaar. Als je de groepn bij elkaar hebt staan kun je tellen en een tabel maken waaruit je het cirkeldiagram laat ontstaan. Zoals je al eerder hebt gezien. Let er wel op dat bij het op volgorde zetten telkens de gehele rij (horizontaal) wordt meegenomen. Vragen: Waarom zou je zo n cirkeldiagram willen maken? Welke conclusie kun je trekken uit cirkeldiagrammen die je hebt gemaakt? Opdracht 3 Je hebt nu na opdracht 2 het data bestand zo geordend dat je voor elk van de 16 categorieën (bijvoorbeeld Havo- CM- M ) kunt berekenen wat de gegevens voor de boxplots zijn van de cijfers voor het vak Nederlands. Maak de boxplots voor de 8 Havo categorieën. Zet deze boxplots bij elkaar in één grafiek. Vragen: Waarom zou je zo n grafische voorstelling willen maken? Welke conclusie kun je trekken uit de grafische voorstelling die je hebt gemaakt? 22

Opdracht 4 Maak nu boxplots van de cijfers van de drie kernvakken: ne, eng, wi voor de leerjaren 1,2 en 3 Zet deze negen boxplots in één of meerdere figuren, maak zelf keuzes. Vragen: Waarom zou je zo n grafische voorstelling willen maken? Welke conclusie kun je trekken uit de grafische voorstelling die je hebt gemaakt? Zet telkens bij de figuren welke conclusie je kunt trekken uit jou gekozen figuur. Opdracht 5a In een boxplot verdeel je de reeks getallen in vier groepen met elk 25% van de getallen. Je hebt in het boekje Statistiek met Excel ook geleerd hoe je van een rij getallen de standaarddeviatie kunt berekenen. Veel frequentieverdelingen hebben een nette symmetrische klokvorm, zeker als het veel gegevens betreft. Voorbeelden daarvan zijn de verdeling van de lengtes van een grote groep mensen, de gewichten van volle pakken suiker, de inhoud van een grote groep colaflessen van dezelfde soort en maat, enzovoorts... Bij dit soort verdelingen kan de standaard deviatie kan gebruikt worden voor een indeling van de groep getallen in zes onderdelen: het gemiddelde geven we aan met μ en de standaarddeviatie met σ. Hier zie je een histogram van de lengtes van een groep soldaten op een bepaalde kazerne. De vuistregel voor de normale verdeling Grenzen ", μ- 2σ μ- 2σ "μ- σ μ - σ "μ μ# μ+σ μ+σ# μ+2σ μ+2σ, # % 2.5% 13.5% 34% 34% 13.5% 2,5% soldaten ",168 168-175 175-182 182-189 189-196 196,# Voor meer uitleg over de normale verdeling zie bv.: http://www.math4all.nl/website/view.php?page=overzichten/havo- 45- a&repo=m4a&item=introduction Voor de boxplot gelden de percentages 25% telkens precies omdat de boxplot zo is gemaakt. De onderverdeling m.b.v. de μ en de σ geldt ongeveer, maar steeds beter bij grotere bestanden. Vraag/opdracht : Bereken het gemiddelde en standaarddeviatie van de cijfers voor het vak Engels in het tweede leerjaar. En ga na of deze onderverdeling ook een beetje klopt voor de cijfers voor het vak Engels in het tweede leerjaar. Opdracht 5b Geef een schatting voor grenzen van de middelste 68% van de cijfers voor het vak Engels in het tweede leerjaar. Gebruik hierbij de systematiek uit opgave 5a. Geef een schatting van de grenzen voor de laagste 16% van de cijfers op het van Engels in het tweede leerjaar. 23

Verrijkingsopdrachten Opdracht A. Bereken m.b.v. Excel de gemiddelde cijfers per leerjaar voor het vak wiskunde uitgesplitst naar de verschillende schooltypen. Zet deze gegevens uit in een grafiek (grafieken), kies zelf hoe. Welke conclusie kun je hieruit trekken? Welke vraag komt er naar boven bij het zien van deze gemiddelden? Opdracht B. Op welke manier kun je de prestaties voor het vak wiskunde voor de jongens en de meisjes in beeld brengen? Voer je plan uit. Welke conclusies denk je te kunnen trekken? Opdracht C. Bereken m.b.v. Excel voor de verschillende vakken en leerjaren per schooltype de percentages onvoldoenden. Breng deze percentages in beeld. Maak eventueel verschillende plaatjes. Welke conclusies kun je trekken? Welke vraag komt er in je op bij het zien van de gegevens? 24

Verslag werken met grote datasets in HAVO4 In december ben ik gedurende zeven maal anderhalf uur bezig geweest om het materiaal uit te testen in mijn Havo 4 groep die bestond uit 36 leerlingen. De basiskennis van deze groep bestond uit kennis van Hoofdstuk 4 Wiskunde A deel 1 van de methode Getal en Ruimte. Binnen deze groep was voor 80% geen ervaring met Excel. De rest had een zeer beperkte kennis. Doelstelling: Ophalen en uitbreiden van de basisbegrippen statistiek. Aanbrengen basisvaardigheden Excel en speciale aandacht voor statistische functies in Excel Aanbrengen vaardigheden om binnen grote datasets elementair statistisch onderzoek te doen met behulp van Excel. Mijn lessen hadden steeds dezelfde structuur: 1. 10 minuten - Terughalen en samenvatten van de belangrijkste leerpunten tot dan toe. 2. 20 minuten - Plenaire behandeling van een specifiek item, bijvoorbeeld de boxplot, de normale verdeling, etc. 3. 50 minuten Zelfstandig /in tweetallen werken achter de PC. Hier was voor de leerlingen de mogelijkheid om zowel in tempo als in niveau te verschillen. Hier stuurde ik voornamelijk op in mijn begeleiding. Technische zaken (hoe doe je.) moesten ze met elkaar uitknobbelen en uitleggen aan elkaar. 4. 10 minuten Terugblik op de les. De laatste les hebben we besteed aan het bespreken van de opdrachtenserie over de grote dataset. Eerst in groepen van zes leren komen tot een gezamenlijk standpunt voor elke vraag. Deze werd door elke groep op het bord geschreven. Daarna hebben we klassikaal gekeken neer de verschillen in de standpunten en hierover gediscussieerd. Daarna was er tijd om alles in het schrift uit te werken en de lessen te evalueren. Opbrengsten: Lesonderdeel 1 en 2 Door met de klas een samenvatting in een onderwijsleergesprek te maken kreeg men zicht op de samenhang. De theorie werd gebruikt om te verfrissen en tevens om nieuwe theorie te behandelen. Hiervan werden aantekeningen gemaakt die thuis in het schrift werden uitgewerkt. Lesonderdeel 3 - Oefeningen werden afgetekend. Daarna mochten ze verder aan een volgende oefening. Lesonderdeel 4 Met hun feedback kon ik zo nodig aanpassingen maken in de leerlijn, bijvoorbeeld door een ander onderwerp te kiezen in lesonderdeel 2 voor de volgende dag. Het materiaal Het ontwikkelde materiaal voldeed uitstekend. Het was zelfsturend en de leerlingen konden er utstekend mee uit de voeten. Boxplots maken met Excel is gedoe maar juist daardoor leerzaam. De leerlingen krijgen zo ook zicht op wat eigenaardige zaken in het programma. Aan de laatste opdrachten verrijkingsopdrachten bij de grote dataset zijn de leerlingen niet meer toegekomen. Terugblik Persoonlijk ben ik erg tevreden. Mijn doelstellingen zijn gehaald. Enkele opmerkingen van de leerlingen: Ik heb veel geleerd over Excel. Het programma is handiger dan ik eerst dacht 25

De tweede oefening was veel moeilijker dan de eerste. Maar toen ik eenmaal doorhad hoe je in selecties kon tellen was het weer makkelijker. Excel is veel makkelijker om de mediaan en de kwadranten te berekenen dan je GR Dat grote bestand was verwarrend. Het waren gewoon te veel getallen om overzicht te krijgen. Het was fijn dat we zoveel samen konden werken. Vooral van anderen leer ik erg veel. Marc Bouman, Vrijschool Zutphen V.O. 26