1.2 Beschrijvende statistiek

Maat: px
Weergave met pagina beginnen:

Download "1.2 Beschrijvende statistiek"

Transcriptie

1 HOOFDSTUK INLEIDING 6 2 Beschrijvende statistiek 2 Variabelen en datatypen De methoden om systematisch empirische kennis te verwerven zijn in alle wetenschappen dezelfde We doen waarnemingen aan of experimenten met het object van onze studie en trachten er met mathematische en statistische methoden uitspraken over te doen, classificaties te maken en verbanden te zoeken De verzamelde gegevens kunnen zeer verschillend van aard zijn Neem bijvoorbeeld een groep 2K studenten We noteren naam (X 0 ), geboortejaar (X ), een aantal fysieke kenmerken zoals geslacht (X 2 ), kleur haar (X 3 ), kleur ogen (X 4 ), gewicht (X 5 ), lengte (X 6 ), een aantal studiekenmerken zoals studierichting (X 7 ), gemiddeld examencijfer in K (X 8 ), gemiddeld examencijfer bij het eindexamen HSO (X 9 ), en nog veel meer Deze gegevens kunnen we ordenen in een tabel van de vorm: X 0 X X 2 X 3 X 4 X 5 X 6 X 7 X 8 X 9 naam geboorte sexe haarkleur kleur ogen gewicht lengte studie gem K gem HSO jaar V=0 zwart=0 bruin=0 kg cm info=0 op 20 op 00 M= bruin= blauw= nat= blond=2 grijs=2 sch=2 rood=3 groen=3 bio=3 Jan Janssen Irma Douce Tabel : Een multivariate dataset De gegevens in deze tabel zijn zeer verschillend van aard De eerste kolom X 0 bevat een rij karakters, die de menselijke lezer associeert met de naam van een persoon maar die voor de statistische verwerking betekenisloos is De kolommen (of variabelen) X X 4 en X 7 hebben discrete waarden (duiden categorieën aan) maar alleen de waarden van X hebben een natuurlijke ordening, bij de anderen is de keuze van de waarden 0 of volledig arbitrair We noemen X 2 X 3 X 4 en X 7 daarom nominale variabelen of categorale variabelen en X een ordinale variabele De variabelen X 5 X 6 (lengte en gewicht) en X 8 X 9 (gemiddelde examencijfers) kunnen als continu beschouwd worden (eventueel binnen een gegeven interval) Er is echter een verschil tussen X 5 X 6 enerzijds en X 8 X 9 anderzijds De uitspraak dat een man gemiddeld 5% zwaarder is dan een vrouw of dat Jan 22 cm groter is dan Irma zijn zinvol, maar de uitspraak dat het gemiddelde examencijfer van Jan 50% beter is dan dat van Irma is nonsens Continue variabelen zoals X 8 X 9 noemen we interval variabelen en X 5 X 6 noemen we schalende variabelen of ratio variabelen Samenvattend, in de statistiek onderscheiden we de volgende datatypen: nominaal of categoraal ordinaal interval ratio of schalend de waarden duiden een klein aantal categorieën aan zonder natuurlijke ordening, er is een klein aantal waarden met een natuurlijk ordening, maar de verschillen hebben geen betekenis, de waarden variëren continu binnen een interval, de verschillen hebben een kwantitatieve betekenis, maar verhoudingen niet de waarden variëren continu en verschillen zowel als verhoudingen zijn zinvol In deze cursus zullen we vrijwel uitsluitend ratio variabelen gebruiken

2 7 Software 7 SPSS, Een summier overzicht van een aantal faciliteiten 7 Inleiding SPSS is een afkorting van Statistical Package for the Social Sciences Het wordt veel gebruikt en is al vrij lang op de markt De laatste versies zijn volledig menugestuurd en eenvoudig te gebruiken Het belangrijkste bij het gebruik van zo n pakket is, dat je weet wat een statistisch begrip of toets betekent en hoe hierbij de gegevens gebruikt worden Via de menu s wijst de rest zich dan vanzelf 72 Het werkblad (data editor) In het werkblad worden de gegevens geordend zoals weergegeven in tabel In de kolommen staan de waarnemingen behorende bij een variable In de rijen staan de gevallen ( cases ), de waarnemingen van de verschillende variabelen van eenzelfde persoon of object Links onderaan bevinden zich twee tabs met de namen data view en variable view Het eerste laat de waarnemingen zien en het tweede laat de gegevens over het type van de gebruikte variabelen zien De omschrijving van de variabelen in de variable view dient enerzijds om er voor te zorgen, dat het programma de gegevens in de data-editor goed interpreteert en er correct mee rekent en anderzijds ook om de gegevens voor de menselijke gebruiker leesbaar en overzichtelijk te presenteren De volgende gegevens over een variable worden in de variable view beschreven: naam: werknaam van de variable, maximaal 8 letters en cijfers, beginnend met een letter 2 type: getal, datum of string Een string is een rij karakters, je kunt er niet mee rekenen maar je kunt hem wel als nominale of ordinale variabele gebruiken een erop sorteren Een datum is een speciaal soort string met een eigen sorteervolgorde Een getal kun je gebruiken in een nominale of ordinale variabele (meestal gebruik je dan kleine gehele getallen 0,, 2, 3, ) en als ratio-variabele (reëel getal) Een reëel getal als π 4 arctan kun je neerschrijven als 3459 met decimale punt of komma of als mantisse exponent E+0 (scientific notation); met 5 decimalen heb je in het eerste geval 8 karakters nodig (plusteken, decimale punt of komma en 6 cijfers) en in het tweede geval 3 Je kunt ook de nauwkeurigere benadering invoeren SPSS zal deze bij berekeningen ook gebruiken, maar als je het aantal decimalen op 5 hebt staan ga je er in het datawindow nooit meer zien 3 width: aantal karakters dat neergeschreven wordt in het datawindow 4 decimals: als de variabele een getal is, dan kun je hier het aantal neer te schrijven decimalen opgeven 5 label: veld waarin je een uitgebreide omschrijving van je variabele kunt neerschrijven, zodat je ook volgend jaar nog weet wat de betreffende data voorstellen 6 missing: Bij een enquete gebeurt het vaak dat sommige velden niet ingevuld worden; bij het coderen van de data wordt dan vaak een speciaal karakter of getal (bv 9 of 99) gebruikt om dit aan te geven 7 columns align: breedte van het veld in dataview en alignering van de data 8 measure: datatype scale ordinal nominal zoals beschreven in 2 De inhoud van alle velden kun je aanpassen via een submenu dat je oproept door met de muis rechts in het veld te klikken (alleen bij naam en label kun je gewoon in het veld zelf tijpen) 73 Het FILE-menu Het file menu biedt drie mogelijkheden om een bestaande dataset te openen of een nieuwe te creëren: a New: Creëer een nieuw werkblad (data window) b Open: Open een reeds bestaande file Standaard is dit een SPSS-datafile ( sav), maar je kunt via deze weg ook een tekst-file ( txt) of een excel-file ( xls) openen door rechts in het menuveld files of type 53

3 7 Een summier overzicht van SPSS 54 te klikken en het gewenste type te selecteren In een tekst-file moeten de verschillende waarnemingen op een regel gescheiden zijn door tabs (of andere speciale karakters) Als de eerste regel van een Excel-file namen bevat, kan SPSS deze automatisch overnemen c Read ASCII Data: Importeer data uit een ASCII-file, een bestand met pure tekst en dus zonder font- en layout aanwijzingen SPSS zal de gebruiker vragen naar de namen van de variabelen en de wijze waarop de data moeten worden geïnterpreteerd Als je in je werkblad al een bestand in gebruik hebt, wordt dit verwijderd bij het openen van een nieuw Via het file-menu kun je een bestand bewaren (Save) of uitprinten 74 Aanmaken van kolommen en invoeren van data Bij het opstarten van SPSS verschijnt er op het scherm een werkblad (of data editor), mogelijk gevuld met data als je vertrekt van een bestaande file Iedere kolom (variabele) draagt een naam van maximaal 8 karakters Iedere rij (case) draagt een nummer Een cel is bepaald door zijn kolomnaam en zijn rijnummer De cursor wijst altijd naar een cel; rijnummer en kolomnaam ervan staan in de linker bovenhoek Een nieuwe kolom kan alsvolgt worden aangemaakt: a Door in een cel een getal te zetten De bijbehorende kolom krijgt dan het numerieke formaat (F83) van een decimaal getal met 3 cijfers na de komma (decimal point) en de (default) naam var0000x b Door in de variable view een nieuwe regel te vullen met naam en andere gegevens over een variabele zoals boven beschreven c Met Compute in het Transform menu, zie hieronder NB Punt (b) biedt je ook de mogelijkheid om de naam en de presentatie van een bestaande kolom te wijzigen 75 Wegen en selecteren van data Als je datakolom (variabele) X metingen bevat en een tweede datakolom N de aantallen van deze metingen (bv als X en N afkomstig zijn van een frequentietabel), dan kan je de data van X door SPSS laten wegen door de kolom N Hiertoe duid je deze kolom aan als frequency variable in het menu Data weight cases Als je rijen bij de statistische verwerking wilt uitsluiten, kun je dit doen via het menu Data select cases Een eenvoudige manier is om eerst een (extra) kolom met nullen en enen te maken 76 Transformatie van data Met Compute in het Transform menu kun je een nieuwe kolom (target variable) definiëren en de waarden erin berekenen via een formule, samengesteld uit namen van variabelen, getallen en standaard-operatoren ( voor machtsverheffing) en standaardfuncties Variabelen en functies selecteer je in hun menu s en importeer je in het compositie-venster door op de pijl te klikken Voorbeeld : Een kolom met n random getallen maak je door in het menu met Transform Compute een nieuwe kolom te definiëren en te vullen met de functie RVXXX( ), waar RV staat voor Random Variable, XXX de naam is van de gewenste verdeling en de parameters van die verdeling zijn, bv RVnormal(µ σ) als de getallen normaal N µ σ) verdeeld moeten zijn Je moet er wel eerst voor zorgen dat de n-de cel van een kolom een waarde heeft Voorbeeld 2: Een kolom met de rangnummers, 2, 3, maak je door eerst in Transform Compute een nieuwe kolom met waarden te maken en vervolgens hiervan via Transform Time Series een cumulatieve som te maken

4 7 Een summier overzicht van SPSS 55 In het help menu vind je onder keyword functions een overzicht van de beschikbare functies en in het bijzonder van verdelingsfuncties (Cumulative Distribution functions: Normaal, χn 2, t n, F m n, ) en inverse verdelingsfuncties (voor de berekening van quantielen) Met Sort Cases in het Data menu kun je een bestand sorteren Als je de mogelijkheid wilt hebben om de oorspronkelijke orde terug te krijgen, maak je eerst een kolom met rangnummers De oude orde kun je dan herstellen door op deze kolom te sorteren 77 Grafische weergave van de data Via het Graphs menu kun je onder andere een histogram, een boxplot, een scatterplot en normale P P-plots en Q Q-plots maken a Een histogram kun je op drie manieren maken, automatisch, interactief of manueel i Voor een automatisch histogram kies je het menu Graphs Histogram In het betreffende menu kies je de gewenste variabele en klikt op OK Helaas bevat het plaatje dat SPSS nu maakt een blunder! In plaats van de range, het interval tussen de kleinste en grootste waarde, op te delen wordt een groter interval opgedeeld Dit geeft een probleem als de data binnen een bepaald interval moeten liggen Als de data bv percentages zijn, moeten ze tussen 0 en 00 liggen; een klassenindeling in klassen , zoals SPSS maakt is onzin omdat negatieve waarden en waarden boven 00 niet voor mogen komen; effectief zijn de twee buitenste klassen dan 0 5 en en is hun lengte slechts de helft van de andere klassen Je kunt je histogram manueel aanpassen door de chart editor te openen (dubbel klikken op het histogram) en dan via het menu-item chart axis interval OK het veld Intervals: custom te selecteren en dan de gewenste waarden voor minimum, maximum en aantal klassen in te vullen ii Voor een interactief histogram kies je het menu Graphs Interactive Histogram In het pop-up menu kun je kiezen uit een twee- of driedimensionaal histogram; onder assign variables moet je de gewenste variabelen naar de assen slepen met je muis Onder histogram kun je de klassenindeling aanpassen In tegenstelling tot het voorgaande wordt hier wel een opdeling van de range voorgesteld als default iii Manueel kun je een histogram maken door via het menu Transform Compute de gewenste kolom met de functie RND (=round, afronden) af te beelden op de gewenste verzameling klassemiddens en dan een Barchart te maken RND rondt een reëel getal af naar het dichtstbijzijnde gehele getal, als k geheel en k 2 x k 2, dan RND(x k Als je de indeling in klassen a a d, a d a 2d, met klassebreedte d wilt maken, dan kun je de elementen van de kolom OudeCol op de klassemiddens a 2 d 3 a 2 d afbeelden (ga na!) met NieuwCol a d b In het Boxplot-menu heb je de mogelijkheden 0 5 RND OudeCol a d 5 simple clustered en groups of cases separate variables In het geval van groups heb je een aparte variabele (categorie) nodig die je dataset uitsplitst in deelgroepen Voor ieder van deze groepen wordt een aparte boxplot gemaakt Zie help keyword boxplots chart types voor details Uitschieters (data verder weg dan 5 maal het interkwartiel) worden apart getekend als rondjes en grove uitschieters (verder weg dan driemaal het interkwartiel) als sterretjes Een boxplot (in twee of drie dimensies) kun je ook maken via de interactieve weg Graphs Boxplot Interactive

5 7 Een summier overzicht van SPSS 56 c In een scatterplot van de variabelen X en Y worden de koppels x i y i uitgezet in het XY vlak om te zien of er een verband zou kunnen zijn tussen beide variabelen d P P en Q Q plots: Laat x i i n een gegeven gesorteerde dataset zijn met gemiddelde m, standaarddeviatie s en empirische verdelingsfunctie F X en laat Y N m s de best bijpassende normale verdeling zijn Een normale P P plot is een scatterplot van F X x i i n en de theoretische kans P Y i x i Een normale Q Q plot doet hetzelfde voor de quantielen van beide verdelingen Het is een hulpmiddel om te zien of een dataset (min of meer) normaal verdeeld is 78 Beschrijvende statistiek Via het menu Analyze descriptive statistics Explore vind je het meest uitgebreide overzicht van beschrijvende grootheden zoals gemiddelde, mediaan, modus, standaardafwijking, interkwartiel, range, scheefheid en kurtosis Kwartielen, het betrouwbaarheidsinterval met betrouwbaarheid α, uitschieters, boxplot en histogram kun je opvragen via submenu s statistics en plots Desgewenst kun je deze grootheden laten uitsplitsen naar factoren; als je bijvoorbeeld in tabel een BI voor mannen en vrouwen apart wilt hebben, dan geef je de variabele X 2 (sexe) als factor op Als je decielen of andere percentielen wilt hebben, moet je Analyze descriptive statistics Frequencies gebruiken en de gewenste percentielen invullen in het submenu statistics Als je een variabele wilt standaardiseren (Z X X S), moet je Analyze descriptive statistics Descriptives gebruiken NB Het menu-item crosstabs hoort niet onder beschrijvende statistiek thuis maar onder Nonparametric Tests 79 t-toetsen Te vinden in het menu Analyze Compare Means SPSS geeft als uitvoer de waarde van de toetsgrootheid, de overschrijdingskans Sig (of Significance level), het aantal vrijheidsgraden df en het (tweezijdig) betrouwbaarheidinterval CI (Confidence Interval) Standaard wordt de betrouwbaarheid op 95% gezet maar in het options submenu kun je deze zelf instellen SPSS doet altijd een tweezijdige toets Als je een eenzijdige toets wilt doen, moet je het niveau α verdubbelen om de goede grens voor het betrouwbaarheidsinterval te vinden De door SPSS berekende overschrijdingskans moet je delen door twee Maar je moet wel nagaan of de toetsgrootheid aan de goede zijde van het midden van het betrouwbaarheidsinterval van de tweezijdige toets ligt! a t-toets voor één groep: H 0 : µ µ 0 tegen H : µ µ 0 Selecteer in het One-Sample T Test menu een of meer toets-variabelen, geef de gepostuleerde waarde voor µ op in test value (dezelfde voor alle variabelen!) en kies desgewenst in de options een betrouwbaarheid verschillend van 95% b t-toets voor twee ongepaarde groepen: H 0 : µ µ 2 tegen H : µ µ 2 Zet de beide data-reeksen achtereen in een kolom en kies (of maak) een tweede kolom (de grouping variable) waarin (bv door een integer of 2) is aangegeven tot welke groep het betreffende gegeven behoort Dit mag een categorale variabele zijn, maar ook een reële variabele of een string-variabele Selecteer in het Independent-Samples T Test menu de toetsvariabele en de groeperende variabele Via de knop define groups kun je de twee waarden intijpen, die de te vergelijken groepen aanduiden Je kunt ook een splitsing maken door (bij een ordinale variabele) een cut point te kiezen Zoals het hoort, toetst SPSS eerst met een F-toets (Levene) of de varianties gelijk geacht mogen worden Vervolgens wordt er dan zowel een t-toets gedaan voor het geval, dat de varianties gelijk zijn, alsook een (benaderende) t-toets voor het geval, dat de hypothese van gelijke varianties wordt verworpen De keuze tussen beide resultaten wordt aan de gebruiker overgelaten

6 7 Een summier overzicht van SPSS 57 c t-toets voor twee gepaarde groepen: H 0 : µ µ 2 tegen H : µ µ 2 Zet de beide data-reeksen in twee kolommen, met overeenkomstige elementen op dezelfde rij Selecteer in het Paired-Samples T Test menu twee toets-variabelen door ze aan te klikken en transporteer ze naar het paired variables window door de pijl aan te klikken Desgewenst kun je zo meerdere paren voor een gepaarde t-toets selecteren Bij de uitvoer vinden we ook het gemiddelde en de standaarddeviatie van beide groepen apart en de correlatie ertussen; bovendien staat onder het hoofdje Sig de significantie (overschrijdingskans) van de hypothese dat deze correlatie nul is Als de correlatie niet significant is, kun je net zo goed een ongepaarde toets gebruiken 70 Toetsen met de χ 2 verdeling a χ 2 -toets op een kansverdeling: H 0 : n i ν i i n tegen H : n i ν i voor minstens één i, waar n i het gemeten aantal van groep i is en ν i het aantal op grond van de gepostuleerde verdeling Via het menu Analyze Nonparametric Tests Chi Square kun je een kolom opgeven met waargenomen frequenties (of een kolom met categorieën gewogen door een kolom met frequenties) Als de verwachte frequenties niet allemaal gelijk zijn, moet je deze in de goede volgorde manueel inbrengen of een syntax window gebruiken, zie 73 b Kruistabellen (contingency tables of crosstabs) Toets H 0 : gegevens in rijen en kolommen zijn onafhankelijk tegen H : er is afhankelijkheid tussen rijen en kolommen Een kruistabel zoals tabel 2 is (vrijwel altijd) een uittreksel van een groter bestand zoals tabel In SPSS kun je niets doen met de kruistabel van de vorm 2 en moet je werken met de primaire data zoals in tabel tabel Uittreksel uit een enquète aantal geslacht stemming 252 man voor 224 man tegen 248 vrouw voor 276 vrouw tegen 20 vrouw blanco 6 man blanco tabel 2 bijbehorende kruistabel man vrouw voor tegen blanco 6 20 In het menu Data weight cases duid je de kolom aantal aan als frequency variable zodat de andere kolommen met deze aantallen gewogen worden In het menu Analyze Descriptive Satistics crosstabs selecteer je de rij-variabele stemming en kolom-variabele geslacht (of andersom), in het Statistics submenu duid je aan dat je een (benaderende) toets met de Chi-kwadraat verdeling doet en in Cells duid je aan welke tussenresultaten je in je uitvoer wilt zien Als resultaat krijg je de waarde van de toetsgrootheid, het aantal vrijheidsgraden (df) en de overschrijdingskans (Sig) berekend met drie methoden, de oorspronkelijke methode van Pearson (zoals behandeld in de cursus), Pearsons methode met continuïteitscorrectie en de maximum likelihood methode

7 7 Een summier overzicht van SPSS 58 7 Regressie en correlatieanalyse Zet de data in kolommen X en Y In het menu Analyze regression linear selecteer je de onafhankelijke variabele (X) en de afhankelijke variabele (Y); in het submenu Statistics selecteer je de gewenste uitvoer en in het submenu Plots de gewenste scatterplots 72 De Kolmogorov-Smirnov toets Deze is te vinden in het menu Analyze Nonparametric tests -Sample K-S Je kunt toetsen of je data trekkingen uit een normale, uniforme, Poisson- of exponentiële verdeling zouden kunnen zijn SPSS berekent de tweezijdige overschrijdingskans, de parameter d n in formule (466), de grootste afwijkingen naar beneden en naar boven, en de K-S Z-waarde (=d n n ; het is de geobserveerde waarde van de teller in de breuk op de laatste regel van tabel 45) 73 Het Syntax Window SPSS is van oorsprong een command language; alle opdrachten worden door textcommando s gegeven Bovenop deze command language is een menu-systeem gebouwd, dat de commando s genereert en doorgeeft aan de SPSS-processor Als je via het menu een opdracht samenstelt kun je de equivalente commando s in de SPSS-programmeertaal zien in een syntax window, dat je creëert door je opdracht niet af te sluiten met het aanklikken van OK maar met paste; desgewenst kun je de opdracht aanpassen en (alsnog) uit laten voeren door in de menubalk de betreffende knop (met een klein naar rechts gericht driehoekje) aan te klikken In de meeste gevallen werkt het menu-systeem vrij goed, en hoef je je als gebruiker niets aan te trekken van die command language, maar soms is werken via een menu wel zeer onhandig Via een syntax window kun je dan je commando s bijsturen Een goed voorbeeld is de χ 2 -toets op een kansverdeling, als de kansen van de verschillende klassen niet alle dezelfde waarde hebben Als je volledig via het menu werkt, moet je de verwachte kansen (of waarden) een voor een intijpen maar dat is een methode uit het stenen tijdperk Je kunt echter ook via het menu (Analyze Nonparametric Tests Chi Square ) alle details opgeven behalve deze verwachte waarden en dan vervolgens via de knop paste een syntax window openen en hierin vervangen door verwachte waarden via een copy-paste operatie Als voorbeeld beschouwen we de data van het Rutherford-Geiger experiment (zie tabel 3 in 34) tabel 3 Het SPSS DataWindow voor het Rutherford-Geiger experiment aantal desintegraties per tijdsinterval aantal tijdsintervallen Poisson-kans als λ 3 87 desintgr aantalw thkans

8 Antwoorden op Oefeningen 83 Antwoorden op geselecteerde oefeningen 2a: 9/20 2b: 9/20 2c: kan niet 2d: kan niet 22a: 83/40 22b: 63/83 23a: b: c: 07 24a: /3 24b: /5 26a: 2/3 26b: /2 27: 24/64 28a: /36 28b: /36 28c: /36 28d: 9/36 28e: /5 28f: /36 29a: b: a: /6 22b: 5 22c: : : p p a: /6 25b: /32 25c: 5/6 26a: 09 26b: c: d: : p p : p p : : ja 22: neen 3a: p p b: p p a: b: c: 20 33a: b: : : p p : p p : / 38: 332% 39: 2 k 2n 2n k n 30a: /6 30b: 2/3 3: 2/3 32: 2/7 33: : a: 3/4 35b: /2 36b: c: : Z, p=2/3 38: 6 4: p p 2 p : p als m 8 43a: /000 43b: 36/000 43c: 27/000 43d: 432/000 43e: 504/000 44a: r!n r r!r 2! r n! 44b: n n r resp n 2 n r 44c: r r n n r 45: p r 6 q : 79 cent 47a: 9/25 47d: 06 47e: 0 en 28/25 47f: 47g: 0 en a: 25/4 48d: 063, e: 0 en 042, f: 38 48g: 0, 0, 46, a: b: 5 40: 4r π 4: 3/4 42b: exp c: λ 000u 42d: ln 2 λ 693u 42e: exp : f Z t λ 2 te λt t 0 E Z 2 λ Var Z 2λ 2 44: neen, P a: b: a: a2: a3: b: x 2 55b2: x 56: F X n 4 5 n E X 57a: b: : a: 9 59b: c: λ d: : f M t f X t F Y t f y t F X t 52a: 00 52b: c: a: b: c: : a: b: c: d: a: B 63b: A 64: a: E X n µ Var X n σ 2 n 65b: N µ σ n 66: a: 0374

9 Antwoorden op Oefeningen 84 67b: 304 cm 68a: f X t 0 63t 2π exp 2 logt t 0 68b: c: b: E Z 0 Var Z a: c ; als x 0 en y 0 F Z x y exp x 2 2 exp y 60b: F X x exp x 2 2 x 0 F Y y exp y ; onafhankelijk 60c: exp 3 en 2exp 6: f Z x y 2 als 0 x y f X x 2 2x 0 x f Y y 2y 0 y E Z 3 2 3, Var X Var Y 8 Covar X Y 36 ρ X Y 2 62: P X X 2 X 3 k m n n k k p k p 2 pm 3 als k 0 0 m 0 en k m n en anders nul p Cov X X 2 np p 2, ρ X X 2 p 2 p p2 ρ als p : f X x 0 x en nul elders f Z x y x als 0 x y en nul elders f Y y log y 0 y en nul elders 64: f r R Θ π 0 r en 0 ϕ 2π en nul elders 7a: b: : : 0368 en : : : 0368 en : 089 (beide) 78: 2/3 79: P N n n r p r q n r als n r P N n 0 als n r loga µ 70a: F Y a Φ σ a 0 en nul elders 70b: f Y a σ a 2π exp 2 loga µ σ 2 a 0 70c: E Y exp µ 2 σ 2 Var Y exp σ 2 exp 2µ σ 2 7a: b: c: a: X B P 2 72b: c: a: met Φ benaderd: 0954 (exact: 0925) 73b: : a: b: 84 75c: : f v x 2x 2 3 σ exp 2π 2 σ 2 x 2 x 0 f v x 0 x 0 ; E v 4σ 2π 8: [787, 03] 82: a: [339, 633] 83b: [288, 684] 84a: [9064, 0936] 84b: 64 85: [220, 22759] en [44, 934] 86: [0069, 00302] 87: d s d s ; d : x m y n ; s : σ m 88a: n n M 88b: m n Φ m n n α 2 α 2 89: 0 80: [6247, 9753] 8: [0708, 0732], neen 82: [00054, 0034] en [7478, 8522] 83: [00, 066] 9a: toetsgrootheid 732 ; H 0 aanvaarden als α 5% 9b: verwerpen als α 0% 92: toetsgrootheid t 5 6 ; H 0 verwerpen 93a: [32946, 33434] 93b: neen, zie BI 93c: χ 0 49 H 0 aanvaarden 94a: tweezijdig: toetsgrootheid 90 ; H 0 aanvaarden voor α 5% en α % Beter eenzijdig toetsen, H 0 : µ 20 H : µ 20 Als α 5%, H 0 verwerpen; als α %, H 0 aanvaarden 94b: α 94c: bij eenzijdige toets: (α 5%) ; (α %) 0a: Als σ Als σ onbekend, dan H 0 verwerpen 0b: α 0 2% 2 dan BI=[787, 03], H 0 aanvaarden α 2 Errata in de editie van 2002 Pag 5 formule (7) Het plusteken vervangen door een minteken: n s 2 f f x i n i n n i f 2 n n i f x i x i x f x 2 x i x 2 f ξ i 2 n f x n f f x 2 2 n n f f x 2 f x 2 s 2 x Pag 04 voorbeeld 42 De t-waarde t 3 09 van deze toets in combinatie met het aanvaardingsgebied! 665" geven de correcte beslissing omdat in beide het teken is omgedraaid Op grond van formules (446) en (449) zou er moeten staan: x 40 y t 50 #s$ % 40 % 50 & 3 09 met aanvaardingsgebied '( t 88) 0* 95! +', 665!! - - Pag 05 In de regel na formule (452) moet de F-verdeling één vrijheidsgraad in de teller hebben en m n 2 in de noemer De regel moet dus luiden: De overschrijdingskans is P F f met F F ) m/ n0 2 ; we verwerpen de nulhypothese op het niveau α als f F ) m/ n0 2) 0 α 7

7.1 SPSS, Een summier overzicht van een aantal faciliteiten

7.1 SPSS, Een summier overzicht van een aantal faciliteiten 7. Software 7.1 SPSS, Een summier overzicht van een aantal faciliteiten 7.1.1 Inleiding SPSS is een afkorting van Statistical Package for the Social Sciences. Het wordt veel gebruikt en is al vrij lang

Nadere informatie

Analyse van kruistabellen

Analyse van kruistabellen Analyse van kruistabellen Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-13 (deel2) van het statistiekboek wordt ingegaan op het analyseren van kruistabellen met behulp van SPSS. Met een kruistabel

Nadere informatie

Onderzoek. B-cluster BBB-OND2B.2

Onderzoek. B-cluster BBB-OND2B.2 Onderzoek B-cluster BBB-OND2B.2 Succes met leren Leuk dat je onze bundels hebt gedownload. Met deze bundels hopen we dat het leren een stuk makkelijker wordt. We proberen de beste samenvattingen voor jou

Nadere informatie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen

Nadere informatie

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as.

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as. Opdracht 6a ----------- Dichtheidskromme, normaal-kwantiel-plot Een nauwkeurige waarde van de lichtsnelheid is van belang voor ontwerpers van computers, omdat de elektrische signalen zich uitsluitend met

Nadere informatie

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel. Opdracht 2a ----------- Stamdiagrammen, histogrammen, tijdreeksgrafieken De Old Farmers Almanac vermeldt de groeiseizoenen voor de grote steden in de V.S., zoals gerapporteerd door het National Climatic

Nadere informatie

Verband tussen twee variabelen

Verband tussen twee variabelen Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf. Opdracht 10a ------------ t-procedures voor gekoppelde paren t-procedures voor twee onafhankelijke steekproeven samengestelde t-procedures voor twee onafhankelijke steekproeven Twee groepen van 10 leraren

Nadere informatie

1. CTRL- en SHIFT-knop gebruiken om meerdere variabelen te selecteren

1. CTRL- en SHIFT-knop gebruiken om meerdere variabelen te selecteren SPSS: Wist je dat (1) je bij het invoeren van de variabelen in het menu door de CTRL-knop ingedrukt te houden, meerdere variabelen kunt selecteren die niet precies onder elkaar staan? Met de SHIFT-knop

Nadere informatie

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie. Handleiding SPSS tabellen en kruistabellen In een paar stappen van spss data naar bruikbare informatie. A) Het openen van een databestand File \ open \ data Kies de naam van je databestand, bijvoorbeeld

Nadere informatie

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I Hieronder volgen de SPSS uitvoer en de antwoorden van de opgaven van Stap 7: Oefenen I. Daarnaast wordt bij elke opgave

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

Wat zijn de verschillen tussen SPSS 9 en SPSS 10?

Wat zijn de verschillen tussen SPSS 9 en SPSS 10? Wat zijn de verschillen tussen SPSS 9 en SPSS 10? 1.1 De data-editor / het definiëren van variabelen 1.2 Het openen van bestanden 1.3 Output lezen 1.4 Mogelijke problemen 1.1.1 De data-editor Het grootste

Nadere informatie

Fasen in het onderzoeksproces

Fasen in het onderzoeksproces Fasen in het onderzoeksproces Gegevensbestand Controleren gegevens Bewerken gegevens Analyseren gegevens Interpreteren resultaten Nieuwe vragen? ja Onderzoeksverslag 1 Bestand opmaken Variabelen definiëren:

Nadere informatie

Bij het maken van deze opgave worden de volgende vragen beantwoord:

Bij het maken van deze opgave worden de volgende vragen beantwoord: Opdracht 1a ----------- Introductie Bij het maken van deze opgave worden de volgende vragen beantwoord: Hoe start ik S-PLUS op? Hoe lees ik gegevens in vanuit een ASCII-bestand in een tabel? Hoe kan ik

Nadere informatie

gemiddelde politieke interesse van hoger opgeleide mensen)

gemiddelde politieke interesse van hoger opgeleide mensen) SPSS-oefening 2: Hypothesetoetsen Opgave Oefening 1 a) Het zijn onafhankelijke steekproeven. De scores voor politieke interesse zijn afkomstig van verschillende mensen aangezien elke persoon slechts in

Nadere informatie

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen? Opdracht 15a ------------ Spearman rangcorrelatie coefficient (non-parametrische tegenhanger van de Pearson correlatie coefficient) Wilcoxon symmetrie-toets (non-parametrische tegenhanger van de t-procedure

Nadere informatie

Basishandleiding SPSS

Basishandleiding SPSS Basishandleiding SPSS Elvira Folmer & Marieke ten Voorde SLO, Juli 2008 Deze handleiding is gebaseerd op SPSS 16.0 for Windows Inhoud 1 Het maken van een gegevensbestand in de Variable View... 4 2 Het

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Beknopte handleiding SPSS versie 18.0 1 van 28

Beknopte handleiding SPSS versie 18.0 1 van 28 Beknopte handleiding SPSS versie 18.0 1 van 28 Beknopte handleiding SPSS versie 18.0 2 van 28 Inhoudsopgave Inleiding...3 SPSS- tips...4 Kopiëren van datakenmerken...6 Van SPSS naar Excel...7 Opsturen

Nadere informatie

Vergelijken van twee groepen (SPSS)

Vergelijken van twee groepen (SPSS) Vergelijken van twee groepen (SPSS) Vergelijking van gemiddeldes van onafhankelijke steekproeven met gelijke varianties (dataset newspapers) In een onderzoek geven studenten aan hoeveel keer per week ze

Nadere informatie

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen Opdracht 3a ----------- Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen Voor de meting van de leesvaardigheid van kinderen wordt als

Nadere informatie

Opdracht 5a ----------- Kruistabellen

Opdracht 5a ----------- Kruistabellen Opdracht 5a ----------- Kruistabellen Aan elk van 36 studenten werd gevraagd of zij alcohol drinken, en zo ja, welke soort alcoholische drank de voorkeur heeft. Tevens werd voor elke student de leeftijd

Nadere informatie

Hoofdstuk 4. Beschrijvende statistiek. 4.1 Beschrijvende statistiek voor één variabele

Hoofdstuk 4. Beschrijvende statistiek. 4.1 Beschrijvende statistiek voor één variabele Hoofdstuk 4 Beschrijvende statistiek Alle commando s voor statistische berekeningen en analyse bevinden zich onder de optie Analyze in het hoofdmenu. Hieronder worden de verschillende commando s besproken

Nadere informatie

1. Introductie tot SPSS

1. Introductie tot SPSS 1. Introductie tot SPSS Wat is SPSS? SPSS is een statistisch computerprogramma dat door wetenschappers wordt gebruikt om gegevens te verzamelen, analyseren en te bewerken. Het wordt voornamelijk gebruikt

Nadere informatie

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek NB Voor de SPSS opgaven wordt alleen aangegeven hoe het door de opgave gevraagde resultaat kan worden bereikt. C. J. Verduin 11 december

Nadere informatie

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking Opdracht 9a ----------- t-procedures voor een enkelvoudige steekproef Voor de meting van de leesvaardigheid van kinderen wordt als toets de Degree of Reading Power (DRP) gebruikt. In een onderzoek onder

Nadere informatie

feb 2013 Instituut CMI SPSS les 2

feb 2013 Instituut CMI SPSS les 2 feb 2013 Instituut CMI SPSS les 2 Onderzoek toont aan.. Mobiele nieuwssites populairst onder 18-34 jarigen 18 tot 34 jarigen maken over de gehele dag het meest gebruik van mobiel internet. Dit blijkt uit

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding. Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding. Bij Excel denken de meesten niet direct aan een statistisch programma. Toch biedt Excel veel mogelijkheden tot statistische

Nadere informatie

Beschrijvende statistieken

Beschrijvende statistieken Elske Salemink (Klinische Psychologie) heeft onderzocht of het lezen van verhaaltjes invloed heeft op angst. Studenten werden at random ingedeeld in twee groepen. De ene groep las positieve verhaaltjes

Nadere informatie

Grafieken Cirkeldiagram

Grafieken Cirkeldiagram Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Toegepaste Statistiek, Week 6 1

Toegepaste Statistiek, Week 6 1 Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën

Nadere informatie

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren Hoofdstuk 18 Verbanden tussen variabelen vaststellen en interpreteren Analyse van verbanden Analyse van verbanden: bij de analyse van verbanden stel je vast of er een stabiel verband bestaat tussen twee

Nadere informatie

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding.

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding. Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding. SPSS is een alom gebruikt, gebruiksvriendelijk statistisch programma dat vele analysemogelijkheden kent. Voor HBO en universitaire

Nadere informatie

Moleculaire LevensWetenschappen stroom 1.2

Moleculaire LevensWetenschappen stroom 1.2 MLW Moleculaire LevensWetenschappen stroom 1.2 Methoden en Statistiek werkboek 2005-2006 Inhoudsopgave Blz. Rooster 1 Studiemateriaal 2 Werkvormen 2 Toetsing 2 Planningsgroep 2 Hoorcolleges 3 Werkcolleges

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

Oplossingen hoofdstuk Het milieubesef

Oplossingen hoofdstuk Het milieubesef Oplossingen hoofdstuk 3 1. Het milieubesef Eerst het hercoderen van item 3 en 5, via het commando Transform, Recode into different variables, nadien verschijnt het dialoogvenster Recode into Different

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014

SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014 SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014 Huidig kennis- en ervaringsniveau?????? Beginners Gevorderden 2 Inhoud 1. Wat doe

Nadere informatie

Statistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14

Statistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14 Statistiek met Excel Schoolexamen en Uitbreidingsopdrachten 2 Inhoudsopgave Achtergrondinformatie... 4 Schoolexamen Wiskunde VWO: Statistiek met grote datasets... 5 Uibreidingsopdrachten vwo 5... 6 Schoolexamen

Nadere informatie

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Hoofdstuk 3 : Numerieke beschrijving van data Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Numerieke beschrijving van data p 1/31 Beschrijvende

Nadere informatie

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek 2 deel A 30 minuten over statistisch toetsen Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014 Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie +

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek Opstarten & gegevens inlezen *Inlezen gegevens Via eerste scherm bij opening SPSS of via File; Open; Data. Opletten of namen van variabelen op de eerste rij staan ( Staat ) Opm.: Bij.TXT bestand altijd

Nadere informatie

Inleiding Applicatie Software - Statgraphics

Inleiding Applicatie Software - Statgraphics Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Oplossingen hoofdstuk 9

Oplossingen hoofdstuk 9 Oplossingen hoofdstuk 9 1. Bestaat er een verband tussen het geslacht en het voorkomen van dyslexie? Uit een aselecte steekproef van 200 leerlingen (waarvan 50% jongens en 50% meisjes) uit het basisonderwijs

Nadere informatie

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een klein kapitaaltje

Nadere informatie

Hoofdstuk 2 : Grafische beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Hoofdstuk 2 : Grafische beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Hoofdstuk 2 : Grafische beschrijving van data Marnix Van Daele Marnix.VanDaele@UGent.be Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Grafische beschrijving van data p. 1/35 Soorten meetwaarden

Nadere informatie

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen. Oplossingen hoofdstuk IX 1. Bestaat er een verband tussen het geslacht en het voorkomen van dyslexie? Uit een aselecte steekproef van 00 leerlingen (waarvan 50% jongens en 50% meisjes) uit het basisonderwijs

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

College 4 Inspecteren van Data: Verdelingen

College 4 Inspecteren van Data: Verdelingen College Inspecteren van Data: Verdelingen Inleiding M&T 01 013 Hemmo Smit Overzicht van deze cursus 1. Grondprincipes van de wetenschap. Observeren en meten 3. Interne consistentie; Beschrijvend onderzoek.

Nadere informatie

Beschrijvende statistiek

Beschrijvende statistiek Beschrijvende statistiek Beschrijvende en toetsende statistiek Beschrijvend Samenvatting van gegevens in de steekproef van onderzochte personen (gemiddelde, de standaarddeviatie, tabel, grafiek) Toetsend

Nadere informatie

Hoofdstuk 5. Dobbelen, echt en virtueel. > Maak in SPSS een nieuwe data-verzameling (File > New > Data). We gaan hier de

Hoofdstuk 5. Dobbelen, echt en virtueel. > Maak in SPSS een nieuwe data-verzameling (File > New > Data). We gaan hier de Hoofdstuk 5 Dobbelen, echt en virtueel 5.1 dobbelen In dit hoofdstukje gaan we de variabiliteit in een steekproef onderzoeken. Daarbij maken we gebruik van een beproefd stochastisch proces, nl het gooien

Nadere informatie

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens Hieronder wordt uitgelegd hoe alle analyses besproken in paragraaf 6.5 van

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn. Opdracht 12a ------------ enkelvoudige lineaire regressie Kan de leeftijd waarop een kind begint te spreken voorspellen hoe zijn score zal zijn bij een latere test op verstandelijke vermogens? Een studie

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

A. Week 1: Introductie in de statistiek.

A. Week 1: Introductie in de statistiek. A. Week 1: Introductie in de statistiek. Populatie en steekproef. In dit vak leren we de basis van de statistiek. In de statistiek probeert men erachter te komen hoe we de populatie het beste kunnen observeren.

Nadere informatie

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse 10.1 Eenwegs-variantieanalyse: Als we gegevens hebben verzameld van verschillende groepen en we willen nagaan of de populatiegemiddelden van elkaar verscihllen,

Nadere informatie

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie? Opdracht 13a ------------ Een-factor ANOVA (ANOVA-tabel, Contrasten, Bonferroni) Bij een onderzoek naar de leesvaardigheid bij kinderen in de V.S. werden drie onderwijsmethoden met elkaar vergeleken. Verschillende

Nadere informatie

Inleiding Statistiek met Statistica

Inleiding Statistiek met Statistica . LPT en Biotechnologie Noordelijke Hogeschool Leeuwarden Instituut Techniek Tesselschadestraat 1 8913 HB Leeuwarden tel: +31(0)58 96107 Inleiding Statistiek met Statistica.......... Een sterk instrument

Nadere informatie

TI83-werkblad. Vergelijkingen bij de normale verdeling

TI83-werkblad. Vergelijkingen bij de normale verdeling TI83-werkblad Vergelijkingen bij de normale verdeling 1. Inleiding Een normale verdeling wordt bepaald door de constanten µ en σ. Dit blijkt uit het voorschrift van de verdelingsfunctie van de normale

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf HAVO 4 wiskunde A Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf 1. rekenregels en verhoudingen Ik kan breuken vermenigvuldigen en delen. Ik ken

Nadere informatie

Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en empirische distributies

Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en empirische distributies Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en empirische distributies 6.. Uit een normaal verdeeld universum X met gemiddelde waarde µ = en standaardafwijking σ = worden 0 onafhankelijke steekproefwaarden

Nadere informatie

Oplossingen hoofdstuk 4

Oplossingen hoofdstuk 4 Oplossingen hoofdstuk 4 1.Welke uitslag komt overeen met percentiel 50? Dit is de uitslag 588. Blijft dit antwoord van toepassing indien elk blad (leaf) overeenkomt met 10 observaties? Ja. 2. Welke leeftijd

Nadere informatie

Appendix B Computeranalyse van kwantitatieve data

Appendix B Computeranalyse van kwantitatieve data Appendix B Computeranalyse van kwantitatieve data Ten behoeve van de analyse van kwantitatieve data worden verschillende programmapakketten gebruikt, zoals SAS (Statistical Analyzing System) en SPSS, naast

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan. Afdeling Wiskunde Volledig tentamen Statistics Deeltentamen 2 Statistics Vrije Universiteit 28 mei 2015 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen: opgaven 1,2,3,4. Cijfer=

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

[aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum]

[aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum] 6 Multiple response [aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum] 6.1 Inleiding Het komt regelmatig voor dat respondenten

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

BESCHRIJVENDE STATISTIEK MET GEOGEBRA 4.0

BESCHRIJVENDE STATISTIEK MET GEOGEBRA 4.0 ? BESCHRIJVENDE STATISTIEK MET GEOGEBRA 4.0 R. Van Nieuwenhuyze Hoofdlector wiskunde, lerarenopleiding HUB, Brussel. Auteur Van Basis tot Limiet. roger.van.nieuwenhuyze@skynet.be Roger Van Nieuwenhuyze

Nadere informatie

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur Kansrekening en statistiek WI22TI / WI25IN deel 2 2 februari 22, 4. 6. uur VOOR WI22TI: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad is niet toegestaan.

Nadere informatie

Akternatieve doorrekenen. 7.2 Tabellen

Akternatieve doorrekenen. 7.2 Tabellen 7.2 Tabellen Een tabel geeft een overzicht van de uitkomsten van een berekening voor verschillende waarden van een of meerdere variabelen. Excel kent twee soorten tabellen. Een eenzijdige en een tweezijdige

Nadere informatie

toetskeuze schema verschillen in gemiddelden

toetskeuze schema verschillen in gemiddelden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets week 5: het toetsen van

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

G0N11C Statistiek & data-analyse Project tweede zittijd

G0N11C Statistiek & data-analyse Project tweede zittijd G0N11C Statistiek & data-analyse Project tweede zittijd 2014-2015 Naam : Raimondi Michael Studierichting : Biologie Gebruik deze Word-template om een antwoord te geven op onderstaande onderzoeksvragen.

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur Kansrekening en statistiek wi2105in deel 2 27 januari 2010, 14.00 16.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na

Nadere informatie

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data An Carbonez Leuven Statistics Research Centre Katholieke Universiteit Leuven Voorstelling van de

Nadere informatie

Modelexamen Statistiek

Modelexamen Statistiek NUMMER :. NAAM STUDENT :.. Modelexamen Statistiek Een onderzoek bij 200 varkens leverde een pak informatie en gegevens op. Hierna zie je een voorbeeld van de eerste 20 varkens (dus dit moet je alleen als

Nadere informatie

6.8 Lijsten: oefeningen

6.8 Lijsten: oefeningen 6.8 Lijsten: oefeningen Opgaven 44.: Records zoeken Open het document "Autokosten". Klik in de lijst. Kies de opdracht 'Data - Formulier' [Data - Form]. Klik de knop 'Criteria' [Criteria]. Vul als zoekcriterium

Nadere informatie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: 5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van

Nadere informatie

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Kansverdelingen Inductieve statistiek met Geogebra 4.2 Kansverdelingen Inductieve statistiek met Geogebra 4.2 Brecht Dekeyser Pedic 20 november 2013 Gent 1 Inhoud Nieuw in Geogebra 4.2 Kansverdelingen: Berekeningen en grafische voorstellingen Manueel in rekenblad

Nadere informatie

waarin u gegevens in verschillende het wel goed doen Internet Opleidingscentrum

waarin u gegevens in verschillende het wel goed doen Internet Opleidingscentrum 8 Kruistabellen 8.1 Inleiding Stel dat u een rapport wilt maken dat het aantal verkochte producten per provincie laat zien. u kunt dan een rapport maken waarin u gegevens groepeert per provincie en/of

Nadere informatie

Toegepaste Statistiek, Week 3 1

Toegepaste Statistiek, Week 3 1 Toegepaste Statistiek, Week 3 1 In Week 2 hebben we toetsingstheorie besproken mbt een kwantitatieve (ordinale) variabele G, en met name over zijn populatiegemiddelde E(G). Er waren twee gevallen: Er is

Nadere informatie

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 1. Iemand kiest geblinddoekt 4 paaseitjes uit een mand met oneindig veel paaseitjes. De helft is melkchocolade, de andere

Nadere informatie

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS. Menu aansturing van SPSS voorbeeld in hoofdstuk 9 over multipele correspondentie (HOMALS) en niet-linaire principale componenten analyse (PRINCALS) van kenmerken van moorden Hieronder wordt uitgelegd hoe

Nadere informatie

4 Domein STATISTIEK - versie 1.2

4 Domein STATISTIEK - versie 1.2 USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum

Nadere informatie

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4. VERGELIJKINGSTOETSEN A. Vergelijken van varianties Men beschouwt twee steekproeven uit normaal verdeelde populaties: X, X,, X n ~ N(µ, σ ) Y, Y,, Y n

Nadere informatie

1 Inleiding. 1.1 Werkblad, rijen, kolommen en cellen Als je Excel opent, zie je het volgende scherm (de menubalk bovenin kan iets verschillen):

1 Inleiding. 1.1 Werkblad, rijen, kolommen en cellen Als je Excel opent, zie je het volgende scherm (de menubalk bovenin kan iets verschillen): INLEIDING EXCEL 1 INHOUD 1 Inleiding... 3 1.1 Werkblad, rijen, kolommen en cellen... 3 Cellen invullen... 5 Breedte van de kolommen en tekstterugloop... 5 1.2 Opmaak van de cellen... 6 Uitlijning... 6

Nadere informatie