Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.
|
|
- Frieda Verhoeven
- 7 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen. 2. Laat bij het uitvoeren van berekeningen zien hoe u aan een antwoord gekomen bent. Als u alleen een antwoord opschrijft en dat is fout, rest ons niets anders dan het geheel fout te rekenen. Opgave 1 Korte vragen (30 punten) Geef korte, ter zake doende antwoorden op de volgende vragen: a) Wat verstaan we onder overfitting? b) Omschrijf het probleem van multicollineariteit. c) Wat verstaan we onder een zuivere (unbiased) schatter? Wat is naast zuiverheid een tweede belangrijk kwaliteitskenmerk van een schatter? d) Waarom is lineaire regressie minder geschikt wanneer de te verklaren variabele (y) binair is? e) Omschrijf het principe van maximum likelihood schatten. f) Het Akaike Information Criterion (AIC) dat gebruikt wordt voor modelselectie bij lineaire regressie is: AIC = SSE + 2σ 2 p Leg uit welke rol SSE, σ 2 en p in deze expressie spelen, en waarom hun invloed (positief/negatief) op de totale AIC score intuitief plausibel is. 1
2 g) Stel we hebben een classificatieprobleem met 3 groepen en 10 variabelen. Hoeveel parameters moeten we in totaal schatten voor kwadratische discriminantanalyse? Hoeveel voor lineaire discriminantanalyse? h) Een alwetend wezen weet dat de populatieregressiecurve voor een niet nader te specificeren probleem gelijk is aan E(Y ) = x + 2x 2 Een onwetende onderzoeker overweegt drie modelspecificaties, te weten f 1 (x) = β 0 + β 1 x f 2 (x) = β 0 + β 1 x + β 2 x 2 f 3 (x) = β 0 + β 1 x + β 2 x 2 + β 3 x 3 Welk model heeft de grootste bias component van de gemiddelde voorspelfout (mean square error)? Welk model heeft de grootste variantie component van de gemiddelde voorspelfout? Welk model heeft naar verwachting de kleinste gemiddelde voorspelfout bij een steekproefgrootte van n = ? Leg uit. i) Wat wordt er beweerd in de Gauss-Markov stelling? j) Wat is het kenmerkende verschil tussen de functie-schatten (function estimation) benadering van classificatieproblemen, en de dichtheid-schatten (density estimation) benadering? Noem voor beide één techniek die volgens die benadering te werk gaat. Opgave 2 Lineaire Regressie (25 punten) Een stof die gebruikt wordt in biologisch en medisch onderzoek wordt per vliegtuig naar de afnemers vervoerd in dozen van 1000 ampullen. We hebben gegevens van 10 zendingen waarbij het aantal maal dat een doos van het ene vliegtuig in het andere is overgeladen (x) is vastgelegd, alsmede het aantal gebroken ampullen zoals vastgesteld bij aankomst op de eindbestemming (y). Deze gegevens zijn in onderstaande tabel weergegeven: i x i y i Op basis van deze waarnemingen schatten we het model y i = β 0 + β 1 x i + ε i Neem aan dat de gebruikelijke veronderstellingen van het lineaire regressiemodel van toepassing zijn. 2
3 a) Bereken de kleinste-kwadraten schattingen van β 0 en β 1. b) Geef een puntschatting van het verwachte aantal gebroken ampullen wanneer de doos één keer is overgeladen. Schat tevens de toename in het verwachte aantal gebroken ampullen wanneer de doos niet één maar twee keer wordt overgeladen. c) Geef een 95% betrouwbaarheidsinterval voor β 1. Leg uit hoe we dit interval dienen te interpreteren. d) Toets of er al dan niet een lineaire samenhang is tussen het aantal keren dat een doos wordt overgeladen (x) en het aantal gebroken ampullen (y), bij α = Geef de nulhypothese, de alternatieve hypothese, de beslissingsregel en de conclusie. e) Een consultant claimt dat wanneer de doos niet wordt overgeladen, het gemiddelde aantal gebroken ampullen zeker niet meer dan 9 is. Voer een geschikte toets uit om deze claim the verifiëren bij α = Geef de nulhypothese, de alternatieve hypothese, de beslissingsregel en de conclusie. f) Welk percentage van de variatie in het aantal gebroken ampullen wordt verklaard door de variatie in het aantal keer dat overgeladen wordt? g) In de volgende zending wordt er twee keer overgeladen. Geef een 99% voorspelinterval voor het aantal gebroken ampullen voor deze zending. Geef aan hoe het voorspelinterval geïnterpreteerd dient te worden. Opgave 3 Logistische Regressie (10 punten) Een Utrechtse gezondheidsinstelling stuurt folders naar inwoners, vooral ouderen, om ze aan te moedigen een griepprik te gaan halen ter bescherming tegen een verwachte griepepidemie. In een kleine studie is aan 50 willekeurig geselecteerde inwoners gevraagd of ze ook daadwerkelijk een griepprik gehaald hebben. Daarnaast zijn gegevens verzameld over hun leeftijd (x 1 ) en gezondheidsbewustzijn. De gegevens over het gezondheidsbewustzijn zijn gecombineerd tot een index (x 2 ). Een inwoner die een griepprik heeft gehad is gecodeerd met y = 1, en een inwoner die geen griepprik heeft gehad met y = 0. We schatten in eerste instantie het model E(y) = P (y = 1) = exp(β 0 + β 1 x 1 + β 2 x 2 ) 1 + exp(β 0 + β 1 x 1 + β 2 x 2 ) met behulp van maximum likelihood. Dit levert onder andere de volgende resultaten op (zie volgende bladzijde) 3
4 Coefficients: Value Std. Error (Intercept) leeftijd index Deviance: on 47 degrees of freedom a) We berekenen dat exp( ˆβ 1 ) = exp( ) Heeft dit getal een eenvoudige interpretatie? Leg uit. Iemand beweert dat de invloed van leeftijd op het al dan niet halen van een griepprik, afhangt van het gezondheidsbewustzijn van de betreffende persoon. We schatten daarom tevens het alternatieve model E(y) = P (y = 1) = exp(β 0 + β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 ) 1 + exp(β 0 + β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 )) met behulp van maximum likelihood. Dit levert de volgende resultaten op Coefficients: Value Std. Error (Intercept) leeftijd index leeftijd:index Deviance: on 46 degrees of freedom Hierbij bevat de rij leeftijd:index de resultaten voor de interactieterm x 1 x 2. b) We berekenen dat exp( ˆβ 1 ) = exp( ) 0.4. Heeft dit getal nog steeds een eenvoudige interpretatie? Leg uit. c) Bereken de AIC score van beide modellen en geef aan welk model op basis van die score de voorkeur geniet. d) Toets of de bewering dat de invloed van leeftijd afhangt van het gezondheidsbewustzijn door de data wordt gestaafd bij α = (Neem aan dat de steekproefomvang zodanig is, dat de asymptotische verdeling van de maximum likelihood schatters van toepassing is). 4
5 Opgave 4 Discriminantanalyse (25 punten) Gegeven is de trainingsverzameling X 1 = X 2 = waarbij X 1 drie waarnemingen van x = [x 1 x 2 ] T voor groep 1 bevat, en X 2 drie waarnemingen van x = [x 1 x 2 ] T voor groep 2. Bijvoorbeeld: de eerste waarneming van groep 1 heeft de waarden x 1 = 2 en x 2 = 12. De groepsgemiddelden zijn [ ] [ ] 3 4 x 1 = x 10 2 = 7 De gepoolde covariantiematrix is [ S = Neem verder aan dat de priorkansen van de twee groepen gelijk zijn, dat wil zeggen: π 1 = π 2. a) Schat de lineaire discriminantfuncties f 1 (x) en f 2 (x) voor groep 1 respectievelijk groep 2. b) Geef één lineaire classificatiefunctie voor dit probleem en maak een confusion matrix door die classificatiefunctie op de trainingsverzameling toe te passen. Wat is de in-sample of apparent error rate van de classificatiefunctie? c) Teken de grens tussen de gebieden die (volgens de classificatiefunctie die je bij b) hebt berekend) aan groep 1 respectievelijk groep 2 toebehoren in een spreidingsdiagram van de data. Is er een rechte lijn te vinden die een lagere apparent error rate heeft? d) Statistische discriminantanalyse is gebaseerd op de veronderstelling dat x normaal verdeeld is in iedere groep. Welke extra veronderstelling leidt tot lineaire discriminantfuncties? Lijkt deze veronderstelling op basis van de gegeven trainingsverzameling gerechtvaardigd? Motiveer uw antwoord. ] Zie achterkant voor laatste opgave! 5
6 Opgave 5 Een alternatieve schatter (10 punten) Stel dat u de helling van het regressiemodel Y i = β 0 + β 1 x i + ε i wil schatten. U heeft echter drie problemen: 1) u bent gestrand op een onbewoond eiland zonder rekenmachine, en 2) u heeft maar drie waarnemingen, en 3) u bent de formules van de kleinste-kwadraten schatters vergeten. U herinnert zich nog wel dat 2 punten een lijn bepalen, en besluit de waarnemingen 2 en 3 alsvolgt te middelen: y = y 2 + y 3 2 x = x 2 + x 3 2 De helling van de lijn die de punten (x 1, y 1 ) en (x, y ) met elkaar verbindt is b 1 = (y y 1 )/(x x 1 ) U besluit deze formule als schatter van β 1 te gebruiken. Neem verder aan dat de gebruikelijke veronderstellingen van het lineaire regressiemodel van toepassing zijn. a) Laat zien dat b 1 een lineaire schatter is. b) Laat zien dat b 1 een zuivere schatter van β 1 is. c) Bepaal de variantie van b 1. d) Is b 1 net zo goed als de kleinste-kwadraten schatter? Motiveer uw antwoord. EINDE 6
Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.
Herkansing Inleiding Intelligente Data Analyse Datum: 3-3-2003 Tijd: 14.00-17.00, BBL 508 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.
Nadere informatie9. Lineaire Regressie en Correlatie
9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)
Nadere informatieToets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:
Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan
Nadere informatieTentamen Biostatistiek 3 / Biomedische wiskunde
Tentamen Biostatistiek 3 / Biomedische wiskunde 25 maart 2014; 12:00-14:00 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau. Het
Nadere informatieHoofdstuk 10: Regressie
Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.
Nadere informatieHoofdstuk 5 Een populatie: parametrische toetsen
Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie
Nadere informatie11. Multipele Regressie en Correlatie
11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in
Nadere informatieCollege 2 Enkelvoudige Lineaire Regressie
College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:
Nadere informatieVrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.
Afdeling Wiskunde Volledig tentamen Statistics Deeltentamen 2 Statistics Vrije Universiteit 28 mei 2015 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen: opgaven 1,2,3,4. Cijfer=
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd
Nadere informatieToets deel 2 Data-analyse en retrieval Vrijdag 30 Juni 2017:
Toets deel 2 Data-analyse en retrieval Vrijdag 30 Juni 2017: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan
Nadere informatieTentamen Kansrekening en Statistiek MST 14 januari 2016, uur
Tentamen Kansrekening en Statistiek MST 14 januari 2016, 14.00 17.00 uur Het tentamen bestaat uit 15 meerkeuzevragen 2 open vragen. Een formuleblad wordt uitgedeeld. Normering: 0.4 punt per MC antwoord
Nadere informatieWiskunde B - Tentamen 2
Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk
Nadere informatieDeeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013
Afdeling Wiskunde Volledig tentamen Algemene Statistiek Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen:
Nadere informatieHertentamen Biostatistiek 3 / Biomedische wiskunde
Hertentamen Biostatistiek 3 / Biomedische wiskunde 2 juni 2014; 18:30-20:30 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau. Het
Nadere informatieTentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u
Technische Universiteit Delft Mekelweg 4 Faculteit Elektrotechniek, Wiskunde en Informatica 2628 CD Delft Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u Formulebladen, rekenmachines,
Nadere informatie6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.
Opgaven hoofdstuk 6 I Basistechnieken 6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling. x 0 2 4 6 p(x) ¼ ¼ ¼ ¼ a. Schrijf alle mogelijke verschillende steekproeven van n =
Nadere informatieHoofdstuk 3 Statistiek: het toetsen
Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en
Nadere informatieExamen G0N34 Statistiek
Naam: Richting: Examen G0N34 Statistiek 7 juni 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium
Nadere informatieKansrekening en statistiek wi2105in deel 2 16 april 2010, uur
Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop
Nadere informatieVoorbeeldtentamen Statistiek voor Psychologie
Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij
Nadere informatieStatistiek ( ) eindtentamen
Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op
Nadere informatieFeedback examen Statistiek II Juni 2011
Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven
Nadere informatieHet gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.
Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. 1. (a) In de appendix van deze vraag, is een dataset gegeven met de corresponderende
Nadere informatieHOOFDSTUK VII REGRESSIE ANALYSE
HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens
Nadere informatieKansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur
Kansrekening en statistiek WI22TI / WI25IN deel 2 2 februari 22, 4. 6. uur VOOR WI22TI: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad is niet toegestaan.
Nadere informatieHOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN
HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.
Nadere informatieOpgaven hoofdstuk 12 Enkelvoudige lineaire regressie
Opgaven hoofdstuk 12 Enkelvoudige lineaire regressie 12.1 Teken voor elk van de volgende gevallen de lijn die door de gegeven punten gaat. a. (1,1) en (5,5). b. (0,3) en (3,0) c. ( 1,1) en (4,2) d. ( 6,
Nadere informatieTentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van uur.
Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van 4.00 7.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen
Nadere informatieDH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009
Naam:... Voornaam:... DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Slechts één van de vier alternatieven is juist. Kruis het bolletje aan vóór het juiste antwoord. Indien je een meerkeuzevraag verkeerd
Nadere informatieHoofdstuk 12: Eenweg ANOVA
Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake
Nadere informatieb) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte
Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte
Nadere informatieToegepaste Statistiek, Dag 7 1
Toegepaste Statistiek, Dag 7 1 Statistiek: Afkomstig uit het Duits: De studie van politieke feiten en cijfers. Afgeleid uit het latijn: status, staat, toestand Belangrijkste associatie: beschrijvende statistiek
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek (2S390) op maandag ,
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek (2S390) op maandag 20-11-2000, 14.00-17.00 uur ƒbij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieExamen G0N34 Statistiek
Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium
Nadere informatieHOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES
HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatieVU University Amsterdam 2018, Maart 27
Department of Mathematics Exam: Voortgezette biostatistiek VU University Amsterdam 2018, Maart 27 c Dept. of Mathematics, VU University Amsterdam NB. Geef een duidelijke toelichting bij de antwoorden.
Nadere informatieHertentamen Voortgezette biostatistiek / Biomedische wiskunde
Hertentamen Voortgezette biostatistiek / Biomedische wiskunde 1 juni 2016; 18:30-20:30 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau.
Nadere informatieTentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.
Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses
Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen
Nadere informatiewerkcollege 6 - D&P9: Estimation Using a Single Sample
cursus 9 mei 2012 werkcollege 6 - D&P9: Estimation Using a Single Sample van frequentie naar dichtheid we bepalen frequenties van meetwaarden plot in histogram delen door totaal aantal meetwaarden > fracties
Nadere informatieZowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y
1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld
Nadere informatie6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.
Opgaven hoofdstuk 6 I Learning the Mechanics 6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. De random variabele x wordt tweemaal waargenomen. Ga na dat, indien de waarnemingen
Nadere informatieHoofdstuk 6 Twee populaties: parametrische toetsen
Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.
Nadere informatieKansrekening en statistiek wi2105in deel 2 27 januari 2010, uur
Kansrekening en statistiek wi2105in deel 2 27 januari 2010, 14.00 16.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie
Nadere informatieExamen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008
Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer
Nadere informatieStatistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie
Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven
Nadere informatieTentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven
Nadere informatieHerkansing eindtoets statistiek voor HBO
Herkansing 1A 1 Herkansing eindtoets statistiek voor HBO Schrijf de antwoorden op de vragen alleen op deze pagina s. Antwoorden geschreven op andere vellen papier worden niet meegenomen in de beoordeling.
Nadere informatieHoofdstuk 7: Statistische gevolgtrekkingen voor distributies
Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatieModelselectie. Lieven Clement. 2 de bach. in de Biologie, Chemie, Biochemie en Biotechnologie en Biomedische Wetenschappen
Modelselectie Lieven Clement 2 de bach. in de Biologie, Chemie, Biochemie en Biotechnologie en Biomedische Wetenschappen statomics, Ghent University lieven.clement@ugent.be 1/56 Automatische selectieprocedures
Nadere informatieExamen Kansrekening en Wiskundige Statistiek: oplossingen
Examen Kansrekening en Wiskundige Statistiek: oplossingen S. Vansteelandt Academiejaar 006-007 1. Een team van onderzoekers wil nagaan of een bepaald geneesmiddel Triptan meer effectief is dan aspirine
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op vrijdag 29-04-2004, 9-2 uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieWiskunde B - Tentamen 1
Wiskunde B - Tentamen Tentamen 57 Wiskunde B voor CiT vrijdag januari 5 van 9. tot. uur Dit tentamen bestaat uit 6 opgaven, formulebladen en tabellen. Vermeld ook uw studentnummer op uw werk en tentamenbriefje.
Nadere informatieMasterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA
Masterclass: advanced statistics Bianca de Greef Sander van Kuijk Afdeling KEMTA Inhoud Masterclass Deel 1 (theorie): Achtergrond regressie Deel 2 (voorbeeld): Keuzes Output Model Model Dependent variable
Nadere informatieFormuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i
Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de
Nadere informatie20. Multilevel lineaire modellen
20. Multilevel lineaire modellen Hiërarchische gegevens Veel fenomenen zijn ingebed in een bredere context. Variabelen kunnen dus ook hiërarchisch zijn, ingebed zijn in variabelen op hogere niveaus. Deze
Nadere informatieTentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april uur
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april 2009 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het
Nadere informatieTentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00
Tentamen Statistische methoden MST-STM 8 april 2, 9: 2: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop inleveren alstublieft.
Nadere informatieOefenvragen bij Statistics for Business and Economics van Newbold
Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd
Nadere informatieEIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009
EIND TOETS TOEGEPASTE BIOSTATISTIEK I 30 januari 2009 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 2 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.
Nadere informatiestatviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4
statviewtoetsen 18/12/2000 Contents............................................................ 1 1 Statview toets, 2K WE, 30 mei 1995 2 1.1 Fitness-campagne................................................
Nadere informatieStatistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3
Statistiek II Sessie 3 Verzamelde vragen en feedback Deel 3 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 3 1 Statismex en bloeddruk 1. Afhankelijke variabele: Bloeddruk (van ratio-niveau) Onafhankelijke
Nadere informatieLes 5: Analysis of variance
Les 5: Analysis of variance 2de bachelor in de chemie en biologie 14/11/2018 Jeroen Gilis Gebaseerd op slides Caroline De Tender Testen die we tot nu toe gezien hebben: Toetsen van één gemiddelde ten opzichte
Nadere informatieStatistiek voor A.I. College 14. Dinsdag 30 Oktober
Statistiek voor A.I. College 14 Dinsdag 30 Oktober 1 / 16 2 Deductieve statistiek Orthodoxe statistiek 2 / 16 Grootte steekproef Voorbeeld NU.nl 26 Oktober 2012: Helft broodjes döner kebab vol bacteriën.
Nadere informatieTentamen Voortgezette biostatistiek / Biomedische wiskunde
Tentamen Voortgezette biostatistiek / Biomedische wiskunde 27 maart 2015; 15:15-17:15 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau.
Nadere informatie+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.
STATISTIEK OPLOSSINGEN OEFENZITTINGEN 5 en 6 c D. Keppens 2004 5 1 (a) Zij µ de verwachtingswaarde van X. We moeten aantonen dat E[M i ] = µ voor i = 1, 2, 3 om te kunnen spreken van zuivere schatters.
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38 2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.
VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT
Nadere informatieStatistiek voor A.I.
Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het
Nadere informatie(c) Bepaal de kans dat de linker bedelaar van 10 voorbijgangers in totaal exact 420 ct ontvangt.
Tentamen Statistiek van Proefopzetten wi244st 4 juni 2007, 4.00 7.00 uur Toelichting. Een antwoord alleen is niet voldoende: er dient een motivatie, toelichting of berekening aanwezig te zijn. Gebruik,
Nadere informatieBerekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt
A. Effect & het onderscheidingsvermogen Effectgrootte (ES) De effectgrootte (effect size) vertelt ons iets over hoe relevant de relatie tussen twee variabelen is in de praktijk. Er zijn twee soorten effectgrootten:
Nadere informatieToetsen van hypothesen
Les 4 Toetsen van hypothesen We hebben tot nu toe enigszins algemeen naar grootheden van populaties gekeken en bediscussieerd hoe we deze grootheden uit steekproeven kunnen schatten. Vaak hebben we echter
Nadere informatieToegepaste Statistiek, Week 6 1
Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën
Nadere informatieStatistiek en Data Analyse Opgavenserie 3: Lineaire regressie
Statistiek en Data Analyse Opgavenserie 3: Lineaire regressie Inleveren: uiterlijk maandag 6 februari 16.00 bij Marianne Jonker (Kamer: R3.46) Afspraken De opdrachten maak je in tweetallen. Schrijf duidelijk
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»
Nadere informatieToetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen
M, M & C 7.3 Optional Topics in Comparing Distributions: F-toets 6.4 Power & Inference as a Decision 7.1 The power of the t-test 7.3 The power of the sample t- Toetsende Statistiek Week 5. De F-toets &
Nadere informatieStatistiek II. Sessie 4. Feedback Deel 4
Statistiek II Sessie 4 Feedback Deel 4 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 4 We hebben besloten de bekomen grafieken in R niet in het document in te voegen, dit omdat het document met
Nadere informatieTentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6
CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE Tentamen Wiskunde A Datum: 19 december 2018 Tijd: 13.30 16.30 uur Aantal opgaven: 6 Lees onderstaande aanwijzingen s.v.p. goed door voordat u met het tentamen begint.
Nadere informatieStochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18
Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 18 t-toetsen 2 / 18 Steekproefgemiddelde en -variantie van normale observaties Stelling. Laat X 1,..., X n o.o. zijn en N(µ, σ 2 )-verdeeld. Dan:
Nadere informatie1. Reductie van error variantie en dus verhogen van power op F-test
Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden
Nadere informatieStochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17
Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 17 Statistische toetsen 2 / 17 Toetsen - algemeen - 1 Setting: observatie X in X, model {P θ : θ Θ}. Gegeven partitie Θ = Θ 0 Θ 1, met Θ 0 Θ 1
Nadere informatieHet tentamen heeft 25 onderdelen. Met ieder onderdeel kan maximaal 2 punten verdiend worden.
Hertentamen Inleiding Kansrekening WI64. 9 augustus, 9:-: Het tentamen heeft 5 onderdelen. Met ieder onderdeel kan maximaal punten verdiend worden. Het tentamen is open boek. Boeken, nota s en een (eventueel
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) Avondopleiding. donderdag 6-6-3, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieE Y = ln(β 1 x) ln β 1 + β 2
Tentamen Statistische Methoden MST STM 1 april 2009, 9.00 12.00 uur Toelichting. Een antwoord alleen is niet voldoende: er dient een motivatie, toelichting of berekening aanwezig te zijn. Gebruik, tenzij
Nadere informatieFACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie
FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie Lineaire Algebra, tentamen Uitwerkingen vrijdag 4 januari 0, 9 uur Gebruik van een formuleblad of rekenmachine is niet toegestaan. De
Nadere informatieBijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14
Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 1314 Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 1314 Figuren en formules
Nadere informatieStochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17
Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 17 Betrouwbaarheidsgebieden 2 / 17 Idee Een schatter T voor een parameter θ geeft één punt in de parameterruimte Θ. I.h.a. zal T θ onder P θ,
Nadere informatieTentamen Biostatistiek 2 voor BMT (2DM50), op maandag 2 juli uur
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op maandag 2 juli 2012 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het gebruik
Nadere informatiewerkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek
cursus 23 mei 2012 werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen onderzoek streeft naar inzicht in relatie tussen variabelen bv. tussen onafhankelijke
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op dinsdag 5-03-2005, 9.00-22.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieTentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april 2013 14.00-17.00 uur
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april 2013 14.00-17.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het
Nadere informatieExamen Statistiek I Feedback
Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN
TECHNISCHE UNIVERSITEIT EINDHOVEN Tentamen Biostatistiek voor BMT (2S390) op 17-11-2003 U mag alleen gebruik maken van een onbeschreven Statistisch Compendium (dikt. nr. 2218) en van een zakrekenmachine.
Nadere informatieKansrekening en stochastische processen 2S610
Kansrekening en stochastische processen 2S610 Docent : Jacques Resing E-mail: j.a.c.resing@tue.nl http://www.win.tue.nl/wsk/onderwijs/2s610 1/28 Schatten van de verwachting We hebben een stochast X en
Nadere informatie