G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing
|
|
- Frieda van der Velde
- 7 jaren geleden
- Aantal bezoeken:
Transcriptie
1 G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag te halen is het niet altijd noodzakelijk om alle elementen die in deze oplossing aangehaald worden te vermelden. 1 Dataset lengte 1. Bestudeer de verdeling van de variabele lengte voor enerzijds de mannen en anderzijds de vrouwen. (a) Numeriek mannen vrouwen gemiddelde mediaan modus standaarddeviatie IQR Tabel 1: Numerieke kenmerken van de verdeling van de lengte. Uit Tabel 1 blijkt dat de gemiddelde lengte van de mannen cm is, terwijl de mediaan 182 cm bedraagt. Als het gemiddelde en de mediaan dicht bij elkaar liggen, wijst dit op een symmetrische verdeling. Ook de modus (180 cm) ligt niet ver van het gemiddelde en de mediaan, wat het vermoeden van symmetrie alleen maar versterkt. Aangezien de normaalverdeling een symmetrische verdeling is, hebben we hier een eerste aanwijzing dat de lengte van de mannen wel eens normaal verdeeld zou kunnen zijn. Ook de spreidingsmaten geven informatie over de verdeling. De standaarddeviatie s voor de lengte van de mannen bedraagt 9.14 cm en de interkwartielafstand (IQR) 11 cm. Bij normaalverdeelde gegevens geldt de volgende eigenschap: IQR s Voor de lengte van de mannen vinden we dat IQR = 11 = Dit ligt niet s 9.14 zo heel ver af van 1.34, dus we kunnen zeker niet uitsluiten dat de lengte van 1
2 de mannen normaal verdeeld is op basis van de numerieke kenmerken van de gegevens. De gemiddelde lengte van de vrouwen is cm, de mediaan cm, en de modus 172 cm. Hoewel de modus nu iets meer afwijkt van de beide andere waarden, die wel heel dicht bij elkaar liggen, is dit nog geen indicatie voor het niet-symmetrisch zijn van de verdeling, en kan normaliteit van de gegevens dus niet uitgesloten worden. De standaarddeviatie van de lengte van de vrouwen is kleiner dan die van de lengte van de mannen, s is nu gelijk aan 7.13 cm. De IQR bedraagt 9.5 cm, zodat IQR = 9.5 = Dit ligt heel dicht bij wat men zou verwachten als de s 7.13 gegevens normaal verdeeld zijn, dus net zoals bij de mannen kunnen we ook voor de vrouwen besluiten dat de numerieke eigenschappen van de variabele lengte zeker niet uitsluiten dat deze normaal verdeeld is. Grafisch Zowel op het histogram voor de lengte van de mannen (Figuur 1(a)) als het histogram voor de lengte van de vrouwen (Figuur 1) merken we symmetrie op. Ook de klokvorm die men zou verwachten bij normaliteit komt hier duidelijk naar voor. (a) Figuur 1: Histogram voor de lengte van de (a) mannen; vrouwen. De QQ-plot volgt zowel voor de mannen (Figuur 2(a)) als voor de vrouwen (Figuur 2) min of meer een rechte lijn. Dit is nog een aanwijzing dat de gegevens uit een normaalverdeling komen. Bij de mannen zien we een iets betere rechte verschijnen dan bij de vrouwen, een deel van de verklaring zou kunnen zijn dat er van de mannen 6 gegevens meer beschikbaar zijn dan van de vrouwen. Op beide boxplots (Figuur 3) zien we weer de eerder opgemerkte symmetrie terug: het gemiddelde en de mediaan liggen dicht bij elkaar en beide staarten zijn ongeveer even lang. Bij de mannen zijn er 3 waarnemingen die niet meer binnen de snorhaar van de boxplot vallen, maar deze kunnen zeker niet als extreme uitschieters beschouwd worden. 2
3 (a) Figuur 2: QQ-plot voor de lengte van de (a) mannen; vrouwen. Figuur 3: Boxplots voor de lengte van de mannen en de vrouwen. (c) Formeel: Shapiro-Wilk test We onderzoeken nu op een formele manier of de variabele lengte normaal verdeeld is, zowel voor de mannen als voor de vrouwen. Eerst wordt de test uitgevoerd voor de lengte van de mannen, dit wil zeggen dat de hypothese H 0 : De lengte van de mannen is normaal verdeeld versus H 1 : De lengte van de mannen is niet normaal verdeeld getest wordt. De teststatistiek die gebruikt wordt is T = X µ 0 S/ met S de steekproefstandaarddeviatie. Onder H 0 geldt dat T een student t-verdeling heeft n met 3
4 n 1 vrijheidsgraden. De bijbehorende P-waarde wordt berekend door 2P (T > t ) te berekenen, waarbij t de waarde van de teststatistiek is. De waarde van de teststatistiek t is hier met bijbehorende P-waarde Deze P-waarde is zeker niet kleiner dan het opgelegde significantieniveau α = 0.05, dus er is geen reden om H 0 te verwerpen op dit significantieniveau. We mogen dus uitgaan van de veronderstelling dat de lengte van de mannen normaal verdeeld is. Ook voor de vrouwen volgen we dezelfde aanpak. Nu onderzoeken we dus de volgende hypothese: H 0 : De lengte van de vrouwen is normaal verdeeld versus H 1 : De lengte van de vrouwen is niet normaal verdeeld. De teststatistiek heeft de waarde met bijbehorende P-waarde Ook hier is de P-waarde zeker niet kleiner dan het opgelegde significantieniveau α = 0.05, dus weerom is er geen reden om H 0 te verwerpen op dit significantieniveau. We mogen dus uitgaan van de veronderstelling dat de lengte van de vrouwen normaal verdeeld is. (d) Besluit De variabele lengte is zowel voor de mannen als voor de vrouwen normaal verdeeld op significantieniveau α = Voor geen van beide groepen zitten er uitschieters in de data. 2. Is het aantal ondervraagden van een bepaald geslacht gerelateerd aan de studierichting van de ondervrager? We zoeken naar een verband tussen 2 discrete variabelen, namelijk geslacht en studierichting. De volgende hypothese wordt getest: H 0 : Er is geen verband tussen het geslacht van de ondervraagde en de studierichting van de ondervrager versus H 1 : Er is wel een verband tussen het geslacht van de ondervraagde en de studierichting van de ondervrager. De geobserveerde aantallen zijn gegeven in Tabel 2. Indien beide variabelen onafhankebiochemie biologie chemie geologie totaal mannelijk vrouwelijk totaal Tabel 2: Tabel met geobserveerde aantallen. lijk zouden zijn, kan men berekenen welke waarden men zou verwachten. Deze getallen zijn terug te vinden in Tabel 3. 4
5 biochemie biologie chemie geologie totaal mannelijk vrouwelijk totaal Tabel 3: Tabel met verwachte aantallen. Op het zicht zien we al dat de verwachte aantallen niet zo sterk afwijken van de geobserveerde. Formeel wordt dit bevestigd door het berekenen van het χ 2 -getal. χ 2 (geobserveerde waarde verwachte waarde) 2 -getal = = verwachte waarde alle cellen Uit de formule van het χ 2 -getal volgt dat hoe kleiner dit getal, hoe dichter de geobserveerde en verwachte waarden bij elkaar liggen. Het χ 2 -getal is hier behoorlijk klein, wat bevestigt wat we al zagen, namelijk dat er geen grote afwijkingen zijn tussen de geobserveerde en de verwachte waarden. De bijbehorende P-waarde is , veel groter dan het vooropgestelde significantieniveau α = 0.05, dus kunnen we H 0 niet verwerpen op significantieniveau α = Besluit: Het aantal ondervraagden van een bepaald geslacht is niet gerelateerd aan de studierichting van de ondervrager op significantieniveau α = Een recente studie stelt dat de gemiddelde lengte van de Vlaming cm is. Je weet echter niet of in die studie enkel mannen, enkel vrouwen of beide geslachten onderzocht werden. Tracht hierop een antwoord te vinden aan de hand van je gegevens. We testen de volgende hypothese H 0 : µ 0 = versus H 1 : µ (1) met µ 0 de echte gemiddelde lengte van de populatie, waarbij de populatie in het eerste geval de Vlaamse mannen is, in het tweede geval de Vlaamse vrouwen en in het laatste geval alle Vlamingen. Als de gegevens normaal verdeeld zijn, kunnen we gebruik maken van de t-test zoals beschreven in deel 1 van deze vraag. Geval 1: We weten al dat de lengte voor de mannen normaal verdeeld is. We mogen dus de t-test zoals eerder beschreven uitvoeren. De waarde t van de teststatistiek bedraagt 9.88 en de bijbehorende P-waarde is < Dat betekent dat we H 0 moeten verwerpen op significantieniveau α = 0.05, de studie werd niet op enkel mannen uitgevoerd. Geval 2: We weten ook dat de lengte voor de vrouwen normaal verdeeld is. We mogen dus weer de t-test uitvoeren. De waarde t van de teststatistiek bedraagt en de bijbehorende P-waarde is < Dat betekent dat we ook hier H 0 moeten verwerpen op significantieniveau α = 0.05, de studie werd niet op enkel vrouwen uitgevoerd. 5
6 (a) Figuur 4: (a) Histogram en boxplot voor de variabele lengte. Geval 3: Vooraleer we de hypothesetest mogen uitvoeren op de volledige dataset moeten we nagaan of de variabele lengte voor de mannen en de vrouwen samen normaal verdeeld is. Op het histogram in Figuur 4(a) zien de we dat de variabele lengte voor beide geslachten samen redelijk symmetrisch verdeeld is. Dit wordt ook bevestigd door de boxplot in Figuur 4. Bovendien zien we op de QQ-plot (Figuur 5) dat de gegevens uitgezet ten opzichte van standaardnormale kwantielen mooi op een rechte liggen. Op basis van deze grafieken lijkt het waarschijnlijk dat de variabele lengte voor beide geslachten samen normaal verdeeld is. Figuur 5: QQ-plot voor de lengte van de mannen en de vrouwen samen. Dit wordt bevestigd door de Shapiro-Wilk test. De waarde van de teststatistiek bedraagt en de bijbehorende P-waarde , dus er is geen reden om de normaliteitsassumptie te verwerpen op significantieniveau α = We kunnen dus hypothese (1) voor beide groepen samen testen met behulp van de t-test uit deel 1 van deze vraag. Als we de waarde van de teststatistiek berekenen, vinden we t = 1.78 en voor de bijbehorende P-waarde Dit is groter dan 6
7 het opgegeven significantieniveau α = 0.05, dus we mogen niet verwerpen dat er in de studie zowel mannen als vrouwen gebruikt werden. 2 Dataset eikel Kan je uit log(volume) de hoogte voorspellen? Als men de gegevens bekijkt, kan men opmerken dat er een uitschieter in de gegevens zit. Boom nummer 8 heeft een hoogte van 0.3 m, en een eikelvolume van 6.8 cm 3. Aangezien men van een boom van 30 cm hoog niet verwacht dat er eikels aan hangen, zou men deze waarneming beter als een uitschieter beschouwen. We vinden deze uitschieter ook terug rechts onderaan op de scatterplot in Figuur 6(a). Figuur 6 toont een scatterplot van de gegevens zonder de uitschieter. Op deze laatste scatterplot is er met wat goede wil een (a) Figuur 6: Scatterplot log(volume) versus hoogte (a) met en zonder uitschieter. licht stijgend verband tussen hoogte en log(volume) te zien. We verwachten dus dat we uit log(volume) de hoogte zullen kunnen voorspellen. Om dit te onderzoeken passen we lineaire regressie toe op de nieuwe dataset (zonder uitschieter): we fitten een lineair verband van hoogte in functie van log(volume). Het onderliggend model is dus hoogte i = a + b log(volume) i + ɛ i met ɛ i de onafhankelijke en normaal verdeelde foutentermen met gemiddelde 0 en constante variantie. De kleinstekwadratenmethode geeft als resultaat de rechte hoogte = log(volume). We onderzoeken nu of de helling in deze rechte significant verschilt van 0. Dit doen we door de volgende hypothese te testen: H 0 : b = 0 versus H 1 : b 0. 7
8 We vinden voor de waarde van de teststatistiek t = ˆb = 2.56, met bijbehorende P- s.e.(ˆb) waarde Deze P-waarde is kleiner dan α = 0.05, zodat we H 0 kunnen verwerpen. We kunnen hieruit besluiten dat b 0 en het is in dit geval dus zinvol om een lineaire regressie uit te voeren. Dat ook aan de modelonderstellingen voor lineaire regressie voldaan is (de foutentermen ɛ i zijn onafhankelijk, normaal verdeeld en hebben dezelfde varianties), blijkt uit Figuur 7, waarin we de residuen beschouwen als een benadering voor de foutentermen. Op de scatter- (a) Figuur 7: (a) Scatterplot van de gestandaardiseerde residuen; QQ-plot van de residuen. plot van de residuen in Figuur 7(a) zien we dat de residuen mooi verspreid liggen, er valt geen patroon te ontdekken. Dat wijst erop dat de foutentermen onafhankelijk zijn van elkaar en dezelfde variantie hebben. Uit de QQ-plot van de residuen (Figuur 7) blijkt ook dat de punten min of meer op een rechte liggen zoals we verwachten. Met andere woorden, de modelonderstellingen zijn correct. We kunnen dus besluiten dat de variabele hoogte op een lineaire manier uit de variabele log(volume) kan voorspeld worden, en wel op de volgende manier: hoogte = log(volume). Merk wel op dat het lineair verband niet zo sterk is, want R 2 = en dus redelijk klein. Dit wijst erop dat de punten erg verspreid liggen rond de rechte die het lineair verband uitdrukt, wat ook op de scatterplot in Figuur 6 te zien is. Men moet dus opletten met het maken van voorspellingen want ze zijn niet erg nauwkeurig. 8
G0N11C Statistiek & data-analyse Project tweede zittijd
G0N11C Statistiek & data-analyse Project tweede zittijd 2014-2015 Naam : Raimondi Michael Studierichting : Biologie Gebruik deze Word-template om een antwoord te geven op onderstaande onderzoeksvragen.
Nadere informatieHoofdstuk 7: Statistische gevolgtrekkingen voor distributies
Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatieHoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1
Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch
Nadere informatieInleiding Applicatie Software - Statgraphics
Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een
Nadere informatieInleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek
Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een klein kapitaaltje
Nadere informatie9. Lineaire Regressie en Correlatie
9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses
Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling
Nadere informatiePopulaties beschrijven met kansmodellen
Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.
Nadere informatieb) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte
Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38 2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen
Nadere informatieEXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015
EXAMEN : Basisbegrippen statistiek Examen 16 januari 2015 Oplossingen 1 Vraag 1 a) Leg in max. 3 lijnen uit wat een dichtheidsfunctie is en illustreer met 3 duidelijk verschillende voorbeelden. Een (kans)
Nadere informatieHOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES
HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen
Nadere informatieHOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN
HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN. Continue Verdelingen 1 A. De uniforme (of rechthoekige) verdeling Kansdichtheid en cumulatieve frequentiefunctie Voor x < a f(x) = 0 F(x) = 0 Voor a x
Nadere informatie4 Domein STATISTIEK - versie 1.2
USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum
Nadere informatieHoofdstuk 5 Een populatie: parametrische toetsen
Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie
Nadere informatieHoofdstuk 10: Regressie
Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.
Nadere informatieFeedback proefexamen Statistiek I 2009 2010
Feedback proefexamen Statistiek I 2009 2010 Het correcte antwoord wordt aangeduid door een sterretje. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Een derde van de mannen is
Nadere informatieLes 1: de normale distributie
Les 1: de normale distributie Elke Debrie 1 Statistiek 2 e Bachelor in de Biomedische Wetenschappen 18 oktober 2018 1 Met dank aan Koen Van den Berge Indeling lessen Elke bullet point is een week. R en
Nadere informatieExamen G0N34 Statistiek
Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium
Nadere informatieToegepaste Statistiek, Week 6 1
Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën
Nadere informatieGegevensverwerving en verwerking
Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie
Nadere informatieStatistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018
Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht
Nadere informatieInleiding statistiek
Inleiding Statistiek Pagina 1 uit 8 Inleiding statistiek 1. Inleiding In deze oefeningensessie is het de bedoeling jullie vertrouwd te maken met een aantal basisbegrippen van de statistiek, meer bepaald
Nadere informatieSOCIALE STATISTIEK (deel 2)
SOCIALE STATISTIEK (deel 2) D. Vanpaemel KU Leuven D. Vanpaemel (KU Leuven) SOCIALE STATISTIEK (deel 2) 1 / 57 Hoofdstuk 5: Schatters en hun verdeling 5.1 Steekproefgemiddelde als toevalsvariabele D. Vanpaemel
Nadere informatieStatistiek voor A.I. College 10. Donderdag 18 Oktober
Statistiek voor A.I. College 10 Donderdag 18 Oktober 1 / 28 Huffington Post poll verkiezingen VS - 12 Oktober 2012 2 / 28 Gallup poll verkiezingen VS - 15 Oktober 2012 3 / 28 Jullie - onderzoek Kimberly,
Nadere informatiestatviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4
statviewtoetsen 18/12/2000 Contents............................................................ 1 1 Statview toets, 2K WE, 30 mei 1995 2 1.1 Fitness-campagne................................................
Nadere informatieExamen Data Analyse II - Deel 2
Examen Data Analyse II - Deel 2 Tweede Bachelor Biomedische Wetenschappen 10 januari 2011 Naam....................................... 1. De systolische bloeddruk (in mmhg) van 21 mannen is weergegeven
Nadere informatieStatistiek I Samenvatting. Prof. dr. Carette
Statistiek I Samenvatting Prof. dr. Carette Opleiding: bachelor of science in de Handelswetenschappen Academiejaar 2016 2017 Inhoudsopgave Hoofdstuk 1: Statistiek, gegevens en statistisch denken... 3 De
Nadere informatieHoofdstuk 8 Het toetsen van nonparametrische variabelen
Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve
Nadere informatieLes 2: Toetsen van één gemiddelde
Les 2: Toetsen van één gemiddelde Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie & Biotechnologie 22 oktober 2018 Het statistisch testen van één gemiddelde is een veel voorkomende toepassing
Nadere informatieKansrekening en statistiek wi2105in deel 2 16 april 2010, uur
Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop
Nadere informatieHOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN
HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.
Nadere informatieCursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015
Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%
Nadere informatieVoorbeeldtentamen Statistiek voor Psychologie
Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij
Nadere informatieOefenvragen bij Statistics for Business and Economics van Newbold
Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd
Nadere informatieintroductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets
toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:
Nadere informatieOplossingen hoofdstuk 8
Count Count Oplossingen hoofdstuk 8 1. Plaats de volgende eigenschappen bij de gegeven verdelingen. De eigenschappen kunnen voorkomen bij meerdere verdelingen. Plaats bij elke eigenschap het hierbij horende
Nadere informatie11. Multipele Regressie en Correlatie
11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in
Nadere informatieStatistiek II. Sessie 5. Feedback Deel 5
Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :
Nadere informatieExponentiële Functie: Toepassingen
Exponentiële Functie: Toepassingen 1 Overgang tussen exponentiële functies en lineaire functies Wanneer we werken met de exponentiële functie is deze niet altijd gemakkelijk te herkennen. Daarom proberen
Nadere informatieWiskunde D Online uitwerking 4 VWO blok 5 les 3
Paragraaf 10 De standaard normale tabel Opgave 1 a Er geldt 20,1 16,6 = 3,5 C. Dit best wel een fors verschil, maar hoeft niet direct heel erg uitzonderlijk te zijn. b Er geldt 167 150 = 17. Dat valt buiten
Nadere informatieSPSS Introductiecursus. Sanne Hoeks Mattie Lenzen
SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen
Nadere informatie2 Data en datasets verwerken
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 3 Frequentieverdelingen typeren 3.6 Geïntegreerd oefenen In opdracht van: Commissie Toekomst Wiskunde Onderwijs 3 Frequentieverdelingen
Nadere informatieStatistiek voor A.I. College 12. Dinsdag 23 Oktober
Statistiek voor A.I. College 12 Dinsdag 23 Oktober 1 / 20 2 Deductieve statistiek Orthodoxe statistiek 2 / 20 3 / 20 Jullie - onderzoek Wivine Tijd waarop je opstaat (uu:mm wordt weergeven als uumm). Histogram
Nadere informatieExamen Statistiek I Feedback
Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 8 Donderdag 13 Oktober 1 / 23 2 Statistiek Vandaag: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 23 Stochast en populatie
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 10 Donderdag 20 Oktober 1 / 1 2 Statistiek Vandaag: Hypothese toetsen 2 / 1 3 / 1 Terzijde NU.nl 19 oktober 2011: Veel Facebookvrienden wijst op grotere hersenen. (http://www.nu.nl/wetenschap/2645008/veel-facebookvrienden-wijst-groterehersenen-.html)
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd
Nadere informatieCollege 4 Inspecteren van Data: Verdelingen
College Inspecteren van Data: Verdelingen Inleiding M&T 01 013 Hemmo Smit Overzicht van deze cursus 1. Grondprincipes van de wetenschap. Observeren en meten 3. Interne consistentie; Beschrijvend onderzoek.
Nadere informatieHoofdstuk 2: Verbanden
Hoofdstuk 2: Verbanden Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoofdstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze
Nadere informatieStatistiek voor A.I. College 2. Donderdag 13 September 2012
Statistiek voor A.I. College 2 Donderdag 13 September 2012 1 / 42 1 Beschrijvende statistiek 2 / 42 Extrapolatie 3 / 42 Verkiezingen 2012 4 / 42 Verkiezingen 2012 5 / 42 1 Beschrijvende statistiek Vandaag:
Nadere informatieStatistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef
Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,
Nadere informatieS0A17D: Examen Sociale Statistiek (deel 2)
S0A17D: Examen Sociale Statistiek (deel 2) 21 juni 2011 Naam : Jaar en studierichting : Lees volgende aanwijzingen eerst voor het examen te beginnen : Wie de vragen aanneemt en bekijkt, moet minstens 1
Nadere informatieExamen G0N34 Statistiek
Naam: Richting: Examen G0N34 Statistiek 7 juni 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium
Nadere informatieOnderzoek. B-cluster BBB-OND2B.2
Onderzoek B-cluster BBB-OND2B.2 Succes met leren Leuk dat je onze bundels hebt gedownload. Met deze bundels hopen we dat het leren een stuk makkelijker wordt. We proberen de beste samenvattingen voor jou
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 9 Dinsdag 18 Oktober 1 / 1 2 Statistiek Vandaag: Centrale Limietstelling Correlatie Regressie 2 / 1 Centrale Limietstelling 3 / 1 Centrale Limietstelling St. (Centrale
Nadere informatieEerst wordt ingegaan op de verschillende soorten data die we kunnen verzamelen en hoe datasets georganiseerd zijn.
HOOFDSTUK 1: DISTRIBUTIES Inleiding Statistiek is de wetenschap van kennis opdoen op basis van data. Data zijn numerieke (of kwalitatieve) beschrijvingen en gegevens van objecten om te bestuderen. Dit
Nadere informatieStatistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1
Statistiek II Sessie 1 Verzamelde vragen en feedback Deel 1 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 1 1 Staafdiagram 1. Wat is de steekproefgrootte? Op de horizontale as vinden we de respectievelijke
Nadere informatieZomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data
Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data An Carbonez Leuven Statistics Research Centre Katholieke Universiteit Leuven Voorstelling van de
Nadere informatieBeschrijvende statistiek
Duur 45 minuten Overzicht Tijdens deze lesactiviteit leer je op welke manier centrum- en spreidingsmaten je helpen bij de interpretatie van statistische gegevens. Je leert ook dat grafische voorstellingen
Nadere informatieStatistiek ( ) eindtentamen
Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op
Nadere informatie1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.
Oefentoets 1 1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Conditie = experimenteel Conditie = controle Sekse = Vrouw 23 33 Sekse = Man 20 36 Van
Nadere informatieGrafieken Cirkeldiagram
Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd
Nadere informatieHet gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.
Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. 1. (a) In de appendix van deze vraag, is een dataset gegeven met de corresponderende
Nadere informatieHiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16
modulus strepen: uitkomst > 0 Hiermee rekenen we de testwaarde van t uit: n 10 ttest ( x ) 105 101 3,16 n-1 4 t test > t kritisch want 3,16 >,6, dus 105 valt buiten het BI. De cola bevat niet significant
Nadere informatieHoofdstuk 12: Eenweg ANOVA
Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake
Nadere informatieLes 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018
Les 5: ANOVA Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie 28 november 2018 1 Gebaseerd op de slides van Koen Van den Berge Testen die we tot nu toe gezien hebben: Toetsen van
Nadere informatieHOOFDSTUK VII REGRESSIE ANALYSE
HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens
Nadere informatieRobuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid
Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De
Nadere informatieStatistiek: Stam-bladdiagram en boxplot 6/12/2013. dr. Brenda Casteleyn
Statistiek: Stam-bladdiagram en boxplot 6/12/2013 dr. Brenda Casteleyn dr. Brenda Casteleyn www.keu6.be Page 2 1. Theorie Stam-bladdiagram en boxplot zijn methoden om visueel een verdeling voor te stellen.
Nadere informatieNormale Verdeling Inleiding
Normale Verdeling Inleiding Wisnet-hbo update maart 2010 1 De Normale verdeling De Normale Verdeling beschrijft het gedrag van een continue kansvariabele x. Om kansen te berekenen, moet de dichtheidsfunctie
Nadere informatieHoofdstuk 3 Statistiek: het toetsen
Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.
Nadere informatieExamen Statistiek I Januari 2010 Feedback
Examen Statistiek I Januari 2010 Feedback Correcte alternatieven worden door een sterretje aangeduid. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Twee derden van de mannen
Nadere informatieOCBS Vereniging zonder winstoogmerk Ravensteinstraat 4 B 1000 BRUSSEL TRA 418 TOEPASSINGSREGLEMENT HERZIENING 1.
OCBS Vereniging zonder winstoogmerk Ravensteinstraat 4 B 1000 BRUSSEL www.ocab-ocbs.com TOEPASSINGSREGLEMENT TRA 418 Herz. 1 1997/1 TRA 418/1 1997 TOEPASSINGSREGLEMENT VAN HET BENOR-MERK IN DE SECTOR VAN
Nadere informatieStatistiek voor A.I.
Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het
Nadere informatieDH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009
Naam:... Voornaam:... DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Slechts één van de vier alternatieven is juist. Kruis het bolletje aan vóór het juiste antwoord. Indien je een meerkeuzevraag verkeerd
Nadere informatied. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as.
Opdracht 6a ----------- Dichtheidskromme, normaal-kwantiel-plot Een nauwkeurige waarde van de lichtsnelheid is van belang voor ontwerpers van computers, omdat de elektrische signalen zich uitsluitend met
Nadere informatieCollege 2 Enkelvoudige Lineaire Regressie
College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:
Nadere informatie6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.
Opgaven hoofdstuk 6 I Learning the Mechanics 6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. De random variabele x wordt tweemaal waargenomen. Ga na dat, indien de waarnemingen
Nadere informatieHerkansing eindtoets statistiek voor HBO
Herkansing 1A 1 Herkansing eindtoets statistiek voor HBO Schrijf de antwoorden op de vragen alleen op deze pagina s. Antwoorden geschreven op andere vellen papier worden niet meegenomen in de beoordeling.
Nadere informatie8. Analyseren van samenhang tussen categorische variabelen
8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde
Nadere informatiec Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6
c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 1. Iemand kiest geblinddoekt 4 paaseitjes uit een mand met oneindig veel paaseitjes. De helft is melkchocolade, de andere
Nadere informatieDEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO
DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO Leerlingmateriaal 1. Doel van de praktische opdracht Het doel van deze praktische opdracht is om de theorie uit je boek te verbinden met de data
Nadere informatieStatistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie
Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven
Nadere informatieStochastiek 2. Inleiding in de Mathematische Statistiek 1/19
Stochastiek 2 Inleiding in de Mathematische Statistiek 1/19 Herhaling H.1 2/19 Mathematische Statistiek We beschouwen de beschikbare data als realisatie(s) van een stochastische grootheid X.(Vaak een vector
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»
Nadere informatieCursus Inleidende Statistiek
Cursus Inleidende Statistiek Voor het Riza Door Aad Fioole Hetty Klavers Hans van Twuiver Werkdocument: Auteurs: 92011X (herziene versie) Hetty Klavers Hans van Twuiver Datum: augustus 1992 c t L4 a_61
Nadere informatieb. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.
Opdracht 12a ------------ enkelvoudige lineaire regressie Kan de leeftijd waarop een kind begint te spreken voorspellen hoe zijn score zal zijn bij een latere test op verstandelijke vermogens? Een studie
Nadere informatieVerklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?
Verklarende Statistiek: Toetsen Zat ik nou in dat kritische gebied of niet? Toetsen, Overzicht Nulhypothese - Alternatieve hypothese (voorbeeld: toets voor p = p o in binomiale steekproef) Betrouwbaarheid
Nadere informatieLes 5: ANOVA. Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 19 november 2018
Les 5: ANOVA Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie en Biotechnologie 19 november 2018 Toetsen van 2 gemiddeldes Het toetsen van twee gemiddeldes met ongekende variantie H 0 : µ X =
Nadere informatieDeeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013
Afdeling Wiskunde Volledig tentamen Algemene Statistiek Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen:
Nadere informatieModelexamen Statistiek
NUMMER :. NAAM STUDENT :.. Modelexamen Statistiek Een onderzoek bij 200 varkens leverde een pak informatie en gegevens op. Hierna zie je een voorbeeld van de eerste 20 varkens (dus dit moet je alleen als
Nadere informatieSPSS. Statistiek : SPSS
SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik
Nadere informatie2.3 Frequentieverdelingen typeren
2.3 Frequentieverdelingen typeren 2.3.1 Introductie Kijkend naar een datarepresentatie valt meestal al snel op hoe de verdeling van de tellingen/frequenties over de verschillende waarden eruitziet. Zitten
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen
Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen
Nadere informatieDe normale verdeling
De normale verdeling Les 2 De klokvorm en de normale verdeling (Deze les sluit aan bij paragraaf 8 en 9 van Binomiale en normale verdelingen van de Wageningse Methode) De grafische rekenmachine Vooraf
Nadere informatieLes 7-8: Parameter- en Vergelijkingstoetsen
Les 7-8: Parameter- en Vergelijkingstoetsen I Theorie : A. Algemeen :. Hypothese formuleren. H 0 : nul-hypothese H : alternatieve hypothese 2. teekproef nemen. x en 2 zijn te berekenen uit de steekproefresultaten.
Nadere informatie