(c) Bepaal de kans dat de linker bedelaar van 10 voorbijgangers in totaal exact 420 ct ontvangt.

Maat: px
Weergave met pagina beginnen:

Download "(c) Bepaal de kans dat de linker bedelaar van 10 voorbijgangers in totaal exact 420 ct ontvangt."

Transcriptie

1 Tentamen Statistiek van Proefopzetten wi244st 4 juni 2007, uur Toelichting. Een antwoord alleen is niet voldoende: er dient een motivatie, toelichting of berekening aanwezig te zijn. Gebruik, tenzij anders voorgeschreven, voor toetsen een α van 5% en voor betrouwbaarheidsintervallen een betrouwbaarheid van 95%. Rapporteer bij toetsen altijd een p-waarde of een kritieke waarde. Alle deelvragen van vraag tot en met 5 tellen even zwaar. De laatste vraag is drie punten waard.. Hieronder is de verdeling gegeven van wat twee bedelaars van voorbijgangers ontvangen: niets, 20 ct of 50 ct: a P(X = a, Y = b) b Verder gegeven: E X = 23 en E X 2 = (a) Bepaal ρ(x, Y ), de correlatie tussen X en Y. (b) Bepaal Var ( ) X+Y 2. (c) Bepaal de kans dat de linker bedelaar van 0 voorbijgangers in totaal exact 420 ct ontvangt. 2. Een bepaalde soort komt voor in typen A, B en C, in de verhoudingen θ, 2θ resp. 3θ. Een steekproef van 60 levert 3 exemplaren van type A, 20 van type B en 27 van type C. Bepaal de maximum likelihood schatting voor θ. 3. De file plastic.dat bevat een zevental metingen van de sterkte θ van een nieuw type plastic. De metingen worden verondersteld normaal verdeeld te zijn met verwachting θ en variantie σ 2. (a) Wat is de definitie van betrouwbaarheidsinterval? Bepaal een 95% betrouwbaarheidsinterval voor θ. (b) Hoeveel metingen zijn er nodig om een 95% betrouwbaarheidsinterval van lengte hoogstens 0.4 te krijgen? Je mag hierbij aannemen dat σ 2 kleiner is dan De file lengtes.dat bevat data van 50 echtparen tussen de 20 en 40 jaar oud, met kinderen. De variabelen zijn LM en LV, de lengte in centimeters van respectievelijk de moeder en de vader, en LK (= Y ), de gemiddelde lengte van hun kinderen toen ze jaar werden. Beschouw het model Y i = β 0 +β LM i +β 2 LV i +ε i, waarbij we aannemen dat de ε i onafhankelijk N(0, σ 2 ) verdeeld zijn. (a) Fit het model aan de data en toets H 0 : β = β 2 = 0; geef hiervoor een bijbehorende ANOVA tabel.

2 (b) We willen weten of de lengte van de moeder meer invloed heeft op de lengte van de kinderen dan de lengte van de vader. Voer een hiervoor toepasselijke toets uit en rapporteer uw conclusie. (c) Er wordt twijfel geuit over de normaliteitsaanname. Geef hierover uw (gefundeerde) mening. (d) De coefficient of determination, R 2, is de verhouding SS model /SS totaal. Leg in woorden uit, wat deze coefficient betekent, en bepaal de ondergrens (van het kritieke gebied) voor deze grootheid. 5. Gegeven is de designmatrix 2 X = en de variantie van de meetfout σ 2 = 2. (a) Maak een schets van het gezamenlijke betrouwbaarheidsgebied van de parameters en laat zien welke criteria hiervan relevant zijn voor het evalueren van deze proefopzet. (b) We verwijderen de laatste meting behorende tot de bovenstaande designmatrix. Hoe groot zijn de factoren, waarmee de criteria uit de vorige deelvraag zijn veranderd? 6. We bekijken het systeem waar omzetting van metabolieten plaatsvindt. De flux, Y, van zo n omzetting hangt af van de concentratie x. Er zijn in de literatuur verschillende formuleringen bekend, om dit te beschrijven. ( )) x Model Lin : E Y = β 0 ( + β x 0 ( )) x + β2 Model Lin-Log : E Y = β 0 ( + β ln ( ) x + β β2 Model GMA : E Y = β 0 x 0 Hier is x 0 = 6 een gegeven referentie punt. β 0 > 0, in alle drie de modellen, is de flux bij het referentiepunt. β > 0 is een dimensieloze grootheid met dezelfde functie in de drie modellen. β 2 zou 0 moeten zijn volgens de theorie, maar is een toegevoegd als tuning parameter. Er zijn 5 metingen ter beschikking op het referentiepunt, met gemiddelde flux is Daarnaast zijn er 6 metingen gedaan op het interval x (3, 9). De geschatte meetfout is 3 %. De wetenschappers zien de modellen met β 0 = als eerste optie. Dit zijn de gegevens, geef een aanbeveling over het te gebruiken beste model en bijbehorende rapportage over dit model, en een toekomstig experiment. Het doel is om een model te hebben, dat de concentratie-flux relatie beschrijft in een zo groot mogelijk gebied rondom het referentiepunt. De PastiFit bestanden voor deze vraag zijn: ConcFlux.pfd en ConcFlux.pfm. x 0 2

3 Antwoorden a Merk op dat de verdeling symmetrisch is. Uit de gegevens volgt Var(X) = Var(Y ) = 90 (23) 2 = 38. Voorts E XY = (20 20) 0. + (20 50) 0. + (50 20) 0. + (50 50) 0. = 490, en dus Cov(X, Y) = E XY E X E Y = 490 (23) 2 = 39, waaruit volgt: ρ(x, Y ) = 39/38 = b We hadden gevonden Cov(X, Y) = 39. Dus geldt en Var(X + Y ) = Var(X) + Var(Y ) + 2Cov(X, Y) = = 684 ( ) X + Y Var = 2 4 Var(X + Y ) = = 7. Een alternatief om dit te beantwoorden is met het gebruik van [ ] X als stochas- Y tische vector: ( [/2 ] [ ]) X Var /2 = [ /2 /2 ] ([ ]) [ ] X /2 Var Y Y /2 = [ /2 /2 ] [ ] [ ] / /2 = 7. Hier zijn de resultaten van de eerste deelvraag gebruikt. c De uitkomst 420 kan alleen verkregen met 420 = De kans hierop, met als volgorde 8 maal 50, dan 20, dan niks, is P (X = 50) 8 P (X = 20) P (X = 0) = We moeten nog vermenigvuldigen met het aantal mogelijke volgorden, dit komt neer op de vraag: op hoeveel manieren kunnen we de positie van de 20 en de 0 kiezen, dan is 0 9 = 90. Ergo, de kans is De likelihood L(θ) is de kans op 3 exemplaren van type A, 20 van type B en 27 van type C, bij 60 trekkingen, als functie van θ, dus L(θ) = C θ 3 (2θ) 20 ( 3θ) 27, waabij de C staat voor het aantal volgorden waarop de gegeven uitkomst tot stand kan komen. Merk op dat moet gelden 0 θ /3. De loglikelihood: l(θ) = ln L(θ) = = ln C + 20 ln ln θ + 27 ln( 3θ), na enig vereenvoudigen en hergroeperen van termen. We zoeken het maximum van l(θ) bij een stationair punt. Eerst differentieren: en vervolgens l (θ) = 33 θ θ (kettingregel) l (θ) = 0 33( 3θ) = 8θ 33 = (8 + 99)θ, waaruit volgt θ = 33/ Omdat l (θ) dichtbij nul positief is en bij 33/80 van teken wisselt, is dit punt inderdaad een maximum. 3

4 3a Voor definitie zie boek, of het formuleblad! Het gemiddelde is x 7 = en de (steekproef)standaardafwijking s 7 =.2. T = ( X 7 θ)/(s 7 / 7) heeft een t(6)-verdeling; de gezochte kritieke waarde (SSORstat, of tabel B.2) is t 6,0.025 = Het 95% betrouwbaarheidsinterval wordt gegeven door ( ) x s7, x s7 = (27., 29.35) b Als σ bekend zou zijn, dan is het 95% betrouwbaarheidsinterval: ( ) ( ) σ σ σ σ x n z 0.025, x n + z = x n.96, x n +.96 n n n n met breedte 2.96 σ/ n, wat vanwege de aanname omtrent σ niet groter is dan / n, hetgeen we kleiner dan 0.4 proberen te maken. De steekproefgrootte n moet dus minstens /0.2 2 = zijn, dwz n 93 voldoet. N.B. Het is niet gezegd dat het resulterende betrouwbaarheidsinterval aan de eis voldoet, omdat we de steekproefstandaardafwijking gaan gebruiken in de formule voor het betrouwbaarheidsinterval. Is s 2 > 2 dan wordt het interval te breed. Niets aan te doen, dat moeten we dan maar zien. 4a We hebben n = 50, p = 3 en vinden SS res = , ˆβ 0 = 38.47, ˆβ = en ˆβ 2 = Wanneer we alleen een intercept fitten vinden we SS res = De waarde van de F-toetsingsgrootheid voor de hypothese H 0 : β = β 2 = 0 is dus t = ( )/ /47 = 4.375, uit de F(2, 47) halen we de p-waarde: Duidelijk verworpen. Dit is samengevat in de vereenvoudigde ANOVA tabel : Source Sum of Squares df Mean SoS F P-Value Model Error Total b We toetsen H 0 : β = β 2 versus H : β > β 2. Hiertoe maken we met PastiFit een 90% betrouwbaarheidsinterval voor β 2 β en vinden ( 0.35, 0.008). Dat betekent dat het toepasselijke eenzijdige 95% betrouwbaarheidsinterval voor β 2 β is:(, 0.008). Omdat 0 hierin zit verwerpen we H 0 niet. De p-waarde is ongeveer c Merk op dat de lengtes afgerond zijn op hele centimeters. Het effect hiervan is in de residuals-plot goed te zien. In het histogram van de residuen zit wel een plotselinge overgang (vooral gezien de grootte van de dataset), maar lijkt verder redelijk op een normale verdeling. De Kolmogorow-Smirnov toets geeft als p-waarde d De coefficient is de fractie door het model verklaarde variantie (in dit geval is R 2 = 58.54/ = ). De definitie is SS model R 2 = SS res + SS model Een aantal kandidaten hadden de ANOVA tabel genomen waar wordt getoetst H 0 : β 0 = 0, β = 0, β 2 = 0. Dit is dus onjuist 4

5 en de toetsing bij de ANOVA tabel wordt gedaan aan de hand van de toetsingsgrootheid T = SS model/(p ) F (p, n p). SS res /(n p) De toetsingsgrootheid moet voldoen aan een bepaalde ondergrens opdat het model β = β 2 = 0 wordt verworpen. Dit geeft een verhouding voor SS model en SS res en die kan in de definitie van R 2 worden ingevuld. Met de gegevens (p=3, n=50) vinden we die we invullen in SS model SS res = 2/47F 0.05 (2, 47) = 0.046, R 2 crit = SS model/ss res + SS model /SS res = Het is interessant om te zien, dat de praktische eis, die vaak genoemd wordt, dat R 2 dicht bij moet zijn, maar relatief is. Zelfs met een R 2 > mogen we al een model aannemen (of beter gezegd, niet niet verwerpen). Deze schijnbare tegenstelling valt te doorzien als we beseffen dat de toets antwoord geeft op de vraag of het model een significant deel van de variatie verklaard. Omdat n vrij groot is en p klein kan dit geconstateerd worden, ook al is de hoeveelheid door het model verklaarde variantie vrij klein. (Vergelijk dit met het toetsen van H 0 : p = 0.5 voor een munt. Als ik worpen doe dan zal H 0 vrijwel zeker verworpen worden als in werkelijkheid p = 0.503: de afwijking is misschien praktisch gesproken niet relevant, maar wordt bij deze steekproefgroot wel als statistisch significant aangemerkt. Bij dit aantal kunnen we hele kleine verschillen detecteren.) De R 2 is op te vatten als correlatie tussen de gemeten en de gefitte Y waarden, en geeft een indicatie van hoe bruikbaar het model is voor voorspellingen; het is ook op te vatten als een soort signaal/ruis verhouding. Het model is significant maar voor het doen van voorspellingen vrij slecht. 5a Noot: de matrix X was zodanig gekozen, dat de numerieke berekeningen zeer gemakkelijk waren. De covariantiematrix is [ ] (X t X) σ 2 4 = De schets is dus niet anders als een ellips met de hoofdassen in de richting van de twee parameterassen. De exacte formule is: [ ] [ 4 ] [ ] β β 7 0 β = χ 2 0 β 0.05(3) = 7.8 () 2 β ( ) 2 β2 + = 7.8 (2) 4 7 ( β 3. ) 2 + ( ) 2 β2 =, (3) 2.80 waar β verwijst naar de afwijking ten opzichte van de schatting. Dit is een ellips met als lengte van de hoofdassen 3. voor β en 2.80 voor β 2. Voor de 5

6 evaluatie van de proefopzet zijn dat de varianties van de twee parameters ( 4 7 en ); en het oppervlak van de ellips ( = 8.69). 5b Dit is een error propagation probleem. Ergo, de schatting wordt verkregen als de oplossing van de vergelijking X m ˆβ = Y, waar Xm de matrix X zonder de laatste rij. De covariantie matrix wordt gevonden als De bijbehorende ellips is X m ( ) X t m σ 2 = [ β β 2 ] [ [ ], ] [ ] β = χ 2 β 0.05(2) = Dit is een ellips, die gedeeltelijk gekanteld is. Er bestaat een negatieve correlatie tussen de twee parameters. De varianties (05 en 273) zijn een factor van respectievelijk 85 en 273 vergroot. Het oppervlak van de ellips is met een factor vergroot. 2 6 De inspiratie voor dit probleem kwam uit het artikel van J.J. Heijnen, 2005, Approximative Kinetic Formats Used in Metabolic Network Modeling, Biotechnology and Bioengineering, 9, , waar Tabel I een overzicht geeft van formuleringen. De eerste stap is om bij alle kandidaat modellen te beoordelen of zij adequaat zijn. Omdat de meetfout (3%) gegeven is wordt deze eerst aan de data een Error kolom toegevoegd PastiFit en ingevuld. De gevonden SS res heeft dan een χ 2 -verdeling, waarvoor een P-waarde wordt gevonden. Dit is samengevat in de volgende tabel. Er zijn drie sets van modellen, en binnen elke set zijn er twee of drie opties die hiërarchisch aan elkaar gerelateerd zijn volgens de beschrijving van de vraag. Model SS res p P-waarde bij SS res Lin-, β 0 = Lin-2, Lin-Log-, β 0 = 22.45, β 2 = Lin-Log-2, β 0 = Lin-Log GMA-, β 0 = 22.45, β 2 = GMA-2, β 0 = GMA Visuele inspectie van de data laat geen duidelijke structuur zien. De Kolmogorov- Smirnov test voor de normaalheid van de residuen geeft bij het potentieel slechtst passende model (Lin) een P-waarde van 0.86 en Alle overige P-waardes voor deze test zijn dichter bij. Aangezien er een set herhaalde metingen zijn, zou er een optie zijn om de Lack-of-Fit toets uit te voeren. Echter, deze toets is bedoeld voor het geval er geen kennis is over de variantie van de meetfout, want men vergelijkt in feite de 2 Men mag ook de ratio van de determinanten of beter de vierkantswortel hiervan (zie dictaat) geven van de twee opzetten. Dat is een factor 8.9. Hierin is niet meegenomen het verschil in term aan de rechterkant van de formules voor de ellips. 6

7 variatie in de herhaalde metingen met de overgebleven variatie in de residuen. Dit is hier niet het geval omdat de variantie van de meetfout gegeven is. De conclusie van deze testen op adequaatheid is, dat de Lin modellen afvallen. In het volgende stadium doen we modelvereenvoudiging voor elk van de twee overgebleven families van hiërarchische modellen. We doen voor de overgang van model Lin-Log- naar Lin-Log-2 de hypothese dat β 2 = 0. We vinden β 2 = 0.3 ± 0.2. Het is daarom duidelijk dat β 2 = 0 zich in het betrouwbaarheidsinterval (-0.3,0.36) bevindt. We behouden daarom model Lin-Log-. Zo ook vinden we het GMA- model als te kiezen model binnen de set van GMA modellen. De toepassing van de Bartlett toets op de overgebleven twee modellen levert met een P-waarde van geen verdere discriminatie op. We kiezen dan het model met de laagste SS res, omdat beide modellen hetzelfde aantal parameters hebben. De keuze ligt dus bij het Lin-Log- model. Bij de rapportage over dit lineaire (!) model is er dus maar één parameter te vermelden: β = ± Het betrouwbaarheidsgebied is (0.392,0.495). Er zijn een aantal redenen om nadere experimenten uit te voeren. Het domein is niets anders dan x > 0 3. De mogelijke redenen met hun resultaten zijn: Verifiëren van uitbijters. Dit speelt hier geen rol. Verbeteren van de schatting van de parameters van het beste model. Omdat er maar één parameter is, is dit eenvoudig te overzien. Dit kan met PastiFit uitgevoerd worden, maar van de formule is direct te zien, dat het afhangt van ln(x/x 0 ), die zo groot mogelijk dient te zijn. Het ligt dan ook voor de hand bij zo klein mogelijke waarde van de concentratie te meten 4. Het verifiëren van de modelvereenvoudiging. Het gaat hier eerst om de vraag of β 2 = 0. De optimale keuze voor het reduceren van de variantie in ˆβ 2 is door te meten bij zo laag mogelijke concentraties. Er zijn hier twee kandidaat modellen, Lin-Log- en GMA-, die statistisch eigenlijk niet te discrimineren zijn. Het te gebruiken discriminatiecriterium hier is D 2 (zie dictaat). Een plot in Excel laat zien, dat ook hier het de voorkeur heeft om bij zo laag mogelijke concentraties te meten. Enige verdere notities: In deze opgave is de meetfout gegeven. Er zijn kandidaten geweest, die dit niet hebben gezien, en dan andere opties hebben gevolgd: onbekende maar constante absolute of relatieve fout. In het geval, is de Lack-of-Fit 3 Men mag hier ook aannames doen, en bijvoorbeeld stellen, dat praktisch gezien gemeten wordt op bijvoorbeeld het interval (0,20). 4 Puriteinen zullen rekening houden met het feit dat de meetfout ook afhangt van te vinden flux. In de praktijk spelen nog andere zaken een rol. De meetfout is inderdaad vaak een vaste relatieve fout, maar bij kleine waarden van de response moet er rekening gehouden worden met een constant element en bestaat de meetfout uit twee componenten. 7

8 test relevant. De uitkomsten voor constante meetfout zouden ook anders zijn: bij modeladequaatheid valt geen enkel model af op basis van de Lackof-Fit of KS-test. Modelvereenvoudiging is eenvoudig: in alle drie de gevallen blijven alleen de modellen met β als te schatten parameter over. De Bartlett toets geeft een P-waarde van en geeft geen verdere discriminatie. Bij de ranking valt de eindkeuze bij het GMA model. met β = ± In bovenstaande wordt aangegeven dat de Lack-of-Fit toets hier hier niet gebruikt kan worden. Er is hier echter nog een interessante mogelijkheid, die in dit vak niet genoemd is, maar voor de volledigheid hier wordt vermeld. De Lack-of-Fit toets laat zien, dat SS res bestaat uit twee delen, een Lack-of-Fit gedeelte en een pure error gedeelte. Hier is het dus zo dat beide delen χ 2 -verdeling hebben. Bijvoorbeeld bij het model Lin-Log- is SS res = SS lof + SS pe = 3.45 = Uit SS lof χ 2 (6) en SS pe χ 2 (4) volgen P-waardes van respectievelijk en Dit model zou hier dus niet afvallen. Om uitbijters te detecteren passen we de LMS-methode toe. Als we dit bijvoorbeeld doen met het Lin-Log- model vinden we dat het eerste datapunt er uitspringt met een residu van 6, wat eigenlijk niet meer dan ongeveer 2 zou mogen zijn. Het is dus aan te bevelen om hier, x = 3, de meting te herhalen. Sommige kandidaten maakten de fout om het Lin model te zien als een vereenvoudiging van het Lin-Log model. Inderdaad, de naam is te vereenvoudigen, maar het zijn twee zeer eigen modellen, die niet in elkaar uit te schrijven zijn. Er wordt geconcludeerd dat het meten bij lage concentraties dicht bij het optimum is. Het gevonden model is in dit opzicht interessant, want bij x = x 0 exp( /β ) = wordt zero flux bereikt. Wij zijn dan zover buiten het geldigheidsgebied van de benaderingsformule, dat dit niet meer relevant is. Echter, dit geeft wel een orde van grootte van de concentratie, waarbij er voorzichtigheid in acht genomen moet worden. 8

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur Kansrekening en statistiek WI22TI / WI25IN deel 2 2 februari 22, 4. 6. uur VOOR WI22TI: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad is niet toegestaan.

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

Wiskunde B - Tentamen 1

Wiskunde B - Tentamen 1 Wiskunde B - Tentamen Tentamen 57 Wiskunde B voor CiT vrijdag januari 5 van 9. tot. uur Dit tentamen bestaat uit 6 opgaven, formulebladen en tabellen. Vermeld ook uw studentnummer op uw werk en tentamenbriefje.

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur Tentamen Kansrekening en statistiek wi205in 25 juni 2007, 4.00 7.00 uur Bij dit examen is het gebruik van een (evt. grafische rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u Technische Universiteit Delft Mekelweg 4 Faculteit Elektrotechniek, Wiskunde en Informatica 2628 CD Delft Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u Formulebladen, rekenmachines,

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen. Tentamen Inleiding Intelligente Data Analyse Datum: 19-12-2002 Tijd: 9.00-12.00, BBL 420 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

E Y = ln(β 1 x) ln β 1 + β 2

E Y = ln(β 1 x) ln β 1 + β 2 Tentamen Statistische Methoden MST STM 1 april 2009, 9.00 12.00 uur Toelichting. Een antwoord alleen is niet voldoende: er dient een motivatie, toelichting of berekening aanwezig te zijn. Gebruik, tenzij

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen. Herkansing Inleiding Intelligente Data Analyse Datum: 3-3-2003 Tijd: 14.00-17.00, BBL 508 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.

Nadere informatie

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31 Tentamen Statistische methoden 45STAMEY april, 9: : Studienummers: Vult u alstublieft op het MC formulier uw Delftse studienummer in; en op het open vragen formulier graag beide, naar volgend voorbeeld:

Nadere informatie

Tentamen Biostatistiek 3 / Biomedische wiskunde

Tentamen Biostatistiek 3 / Biomedische wiskunde Tentamen Biostatistiek 3 / Biomedische wiskunde 25 maart 2014; 12:00-14:00 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau. Het

Nadere informatie

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00 Tentamen Statistische methoden MST-STM 8 april 2, 9: 2: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop inleveren alstublieft.

Nadere informatie

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan. Afdeling Wiskunde Volledig tentamen Statistics Deeltentamen 2 Statistics Vrije Universiteit 28 mei 2015 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen: opgaven 1,2,3,4. Cijfer=

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18 Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 18 t-toetsen 2 / 18 Steekproefgemiddelde en -variantie van normale observaties Stelling. Laat X 1,..., X n o.o. zijn en N(µ, σ 2 )-verdeeld. Dan:

Nadere informatie

Herkansing eindtoets statistiek voor HBO

Herkansing eindtoets statistiek voor HBO Herkansing 1A 1 Herkansing eindtoets statistiek voor HBO Schrijf de antwoorden op de vragen alleen op deze pagina s. Antwoorden geschreven op andere vellen papier worden niet meegenomen in de beoordeling.

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur Kansrekening en statistiek wi2105in deel 2 27 januari 2010, 14.00 16.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na

Nadere informatie

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek cursus 23 mei 2012 werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen onderzoek streeft naar inzicht in relatie tussen variabelen bv. tussen onafhankelijke

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden

Nadere informatie

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Afdeling Wiskunde Volledig tentamen Algemene Statistiek Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen:

Nadere informatie

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Naam:... Voornaam:... DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Slechts één van de vier alternatieven is juist. Kruis het bolletje aan vóór het juiste antwoord. Indien je een meerkeuzevraag verkeerd

Nadere informatie

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur Tentamen Kansrekening en Statistiek MST 14 januari 2016, 14.00 17.00 uur Het tentamen bestaat uit 15 meerkeuzevragen 2 open vragen. Een formuleblad wordt uitgedeeld. Normering: 0.4 punt per MC antwoord

Nadere informatie

VU University Amsterdam 2018, Maart 27

VU University Amsterdam 2018, Maart 27 Department of Mathematics Exam: Voortgezette biostatistiek VU University Amsterdam 2018, Maart 27 c Dept. of Mathematics, VU University Amsterdam NB. Geef een duidelijke toelichting bij de antwoorden.

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Toegepaste Statistiek, Week 6 1

Toegepaste Statistiek, Week 6 1 Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën

Nadere informatie

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan

Nadere informatie

. Dan geldt P(B) = a. 1 4. d. 3 8

. Dan geldt P(B) = a. 1 4. d. 3 8 Tentamen Statistische methoden 4052STAMEY juli 203, 9:00 2:00 Studienummers: Vult u alstublieft op het meerkeuzevragenformulier uw Delftse studienummer in (tbv automatische verwerking); en op het open

Nadere informatie

Statistiek ( ) eindtentamen

Statistiek ( ) eindtentamen Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Inleveren: 12 januari 2011, VOOR het college Afspraken Serie 1 mag gemaakt en ingeleverd worden in tweetallen. Schrijf duidelijk je naam, e-mail

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Hertentamen Voortgezette biostatistiek / Biomedische wiskunde

Hertentamen Voortgezette biostatistiek / Biomedische wiskunde Hertentamen Voortgezette biostatistiek / Biomedische wiskunde 1 juni 2016; 18:30-20:30 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau.

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven

Nadere informatie

Toegepaste Statistiek, Dag 7 1

Toegepaste Statistiek, Dag 7 1 Toegepaste Statistiek, Dag 7 1 Statistiek: Afkomstig uit het Duits: De studie van politieke feiten en cijfers. Afgeleid uit het latijn: status, staat, toestand Belangrijkste associatie: beschrijvende statistiek

Nadere informatie

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte

Nadere informatie

Antwoordvel Versie A

Antwoordvel Versie A Antwoordvel Versie A Interimtoets Toegepaste Biostatistiek 13 december 013 Naam:... Studentnummer:...... Antwoorden: Vraag Antwoord Antwoord Antwoord Vraag Vraag A B C D A B C D A B C D 1 10 19 11 0 3

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. 1. (a) In de appendix van deze vraag, is een dataset gegeven met de corresponderende

Nadere informatie

Statistiek II. Sessie 5. Feedback Deel 5

Statistiek II. Sessie 5. Feedback Deel 5 Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :

Nadere informatie

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de

Nadere informatie

Inleiding Statistiek

Inleiding Statistiek Inleiding Statistiek Practicum 1 Op dit practicum herhalen we wat Matlab. Vervolgens illustreren we het schatten van een parameter en het toetsen van een hypothese met een klein simulatie experiment. Het

Nadere informatie

Voorbeeld regressie-analyse

Voorbeeld regressie-analyse Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke

Nadere informatie

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 13. Factor ANOVA De theorie achter factor ANOVA (tussengroep) Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 1. Onafhankelijke

Nadere informatie

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3 Statistiek II Sessie 3 Verzamelde vragen en feedback Deel 3 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 3 1 Statismex en bloeddruk 1. Afhankelijke variabele: Bloeddruk (van ratio-niveau) Onafhankelijke

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Hertentamen Biostatistiek 3 / Biomedische wiskunde

Hertentamen Biostatistiek 3 / Biomedische wiskunde Hertentamen Biostatistiek 3 / Biomedische wiskunde 2 juni 2014; 18:30-20:30 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau. Het

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17 Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 17 Betrouwbaarheidsgebieden 2 / 17 Idee Een schatter T voor een parameter θ geeft één punt in de parameterruimte Θ. I.h.a. zal T θ onder P θ,

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter. STATISTIEK OPLOSSINGEN OEFENZITTINGEN 5 en 6 c D. Keppens 2004 5 1 (a) Zij µ de verwachtingswaarde van X. We moeten aantonen dat E[M i ] = µ voor i = 1, 2, 3 om te kunnen spreken van zuivere schatters.

Nadere informatie

Antwoorden bij Testtheorie. Inleiding in de theorie van de psychologische test en zijn toepassingen, door P. J. D. Drenth en K.

Antwoorden bij Testtheorie. Inleiding in de theorie van de psychologische test en zijn toepassingen, door P. J. D. Drenth en K. Antwoorden bij Testtheorie. Inleiding in de theorie van de psychologische test en zijn toepassingen, door P. J. D. Drenth en K. Sijtsma Opmerking vooraf: Enkele docenten hebben ons laten weten dat zij

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 5 februari - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 9 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

Department of Mathematics Exam: Voortgezette biostatistiek / Biomedische wiskunde VU University Amsterdam 2017, Juni 7

Department of Mathematics Exam: Voortgezette biostatistiek / Biomedische wiskunde VU University Amsterdam 2017, Juni 7 Department of Mathematics Exam: Voortgezette biostatistiek / Biomedische wiskunde VU University Amsterdam 07, Juni 7 c Dept. of Mathematics, VU University Amsterdam NB. Geef een duidelijke toelichting

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 16 Donderdag 4 November 1 / 25 2 Statistiek Indeling: Schatten Correlatie 2 / 25 Schatten 3 / 25 Schatters: maximum likelihood schatters Def. Zij Ω de verzameling van

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2S390) op maandag 19-11-2001, 14.00-17.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten Deze week: Steekproefverdelingen Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen Cursusjaar 29 Peter de Waal Zuivere Schatters Betrouwbaarheidsintervallen Departement Informatica Hfdstk

Nadere informatie

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen M, M & C 7.3 Optional Topics in Comparing Distributions: F-toets 6.4 Power & Inference as a Decision 7.1 The power of the t-test 7.3 The power of the sample t- Toetsende Statistiek Week 5. De F-toets &

Nadere informatie

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling Monte Carlo simulatie In MW\Pharm versie 3.30 is een Monte Carlo simulatie-module toegevoegd. Met behulp van deze Monte Carlo procedure kan onder meer de betrouwbaarheid van de berekeningen van KinPop

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19 Stochastiek 2 Inleiding in de Mathematische Statistiek 1/19 Herhaling H.1 2/19 Mathematische Statistiek We beschouwen de beschikbare data als realisatie(s) van een stochastische grootheid X.(Vaak een vector

Nadere informatie

Tentamen Voortgezette Kansrekening (WB006C)

Tentamen Voortgezette Kansrekening (WB006C) WB6C: Voortgezette Kansrekening Donderdag 26 januari 212 Tentamen Voortgezette Kansrekening (WB6C) Het is een open boek tentamen. Gebruik van een rekenmachine of andere hulpmiddelen is niet toegestaan.

Nadere informatie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van

Nadere informatie

Toegepaste Statistiek, Week 3 1

Toegepaste Statistiek, Week 3 1 Toegepaste Statistiek, Week 3 1 In Week 2 hebben we toetsingstheorie besproken mbt een kwantitatieve (ordinale) variabele G, en met name over zijn populatiegemiddelde E(G). Er waren twee gevallen: Er is

Nadere informatie

Feedback examen Statistiek II Juni 2011

Feedback examen Statistiek II Juni 2011 Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten Stochastiek 2 Inleiding in the Mathematische Statistiek staff.fnwi.uva.nl/j.h.vanzanten 1 / 12 H.1 Introductie 2 / 12 Wat is statistiek? - 2 Statistiek is de kunst van het (wiskundig) modelleren van situaties

Nadere informatie

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 ANOVA in SPSS Hugo Quené hugo.quene@let.uu.nl opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 1 vooraf In dit voorbeeld gebruik ik fictieve gegevens, ontleend aan

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op vrijdag 29-04-2004, 9-2 uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Opgave 1: (zowel 2DM40 als 2S390)

Opgave 1: (zowel 2DM40 als 2S390) TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4 en S39) op donderdag, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamenopgaven Statistiek 2DD71: UITWERKINGEN 1. Stroopwafels a De som S van de 12 gewichten is X 1 + X 2 + + X 12. Deze is normaal

Nadere informatie

10. De simultane kansverdeling van twee stochasten X en Y is gegeven door de volgende (onvolledige) tabel: X / /4 1. d. 0 e.

10. De simultane kansverdeling van twee stochasten X en Y is gegeven door de volgende (onvolledige) tabel: X / /4 1. d. 0 e. Tentamen Statistische methoden MST-STM 1 april 2011, 9:00 12:00 Studienummers: Vult u alstublieft op het MC formulier uw Delftse studienummer in; en op het open vragen formulier graag beide, naar volgend

Nadere informatie

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit College 7 Regressie-analyse en Variantie verklaren Inleiding M&T 2012 2013 Hemmo Smit Neem mee naar tentamen Geslepen potlood + gum Collegekaart (alternatief: rijbewijs, ID-kaart, paspoort) (Grafische)

Nadere informatie

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA Masterclass: advanced statistics Bianca de Greef Sander van Kuijk Afdeling KEMTA Inhoud Masterclass Deel 1 (theorie): Achtergrond regressie Deel 2 (voorbeeld): Keuzes Output Model Model Dependent variable

Nadere informatie

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28 Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische

Nadere informatie

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2 Vraag 1. Voor welk van de onderstaande variabelen zal een placebo effect waarschijnlijk het grootst zijn? 1. Haarlengte. 2. Lichaamstemperatuur. 3. Mate van tevredenheid met de behandeling. 4. Hemoglobinegehalte

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van uur.

Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van 4.00 7.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Toetsen van hypothesen

Toetsen van hypothesen Les 4 Toetsen van hypothesen We hebben tot nu toe enigszins algemeen naar grootheden van populaties gekeken en bediscussieerd hoe we deze grootheden uit steekproeven kunnen schatten. Vaak hebben we echter

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1) Cursus Statistiek Hoofdstuk 4 Statistiek voor Informatica Hoofdstuk 4: Verwachtingen Cursusjaar 29 Peter de Waal Departement Informatica Inhoud Verwachtingen Variantie Momenten en Momentengenererende functie

Nadere informatie