Enkele vaardigheden in R

Maat: px
Weergave met pagina beginnen:

Download "Enkele vaardigheden in R"

Transcriptie

1 Enkele vaardigheden in R Dit document is een aanvulling op de Handleiding R die te vinden is op de website bij het vak Biostatistiek 2. De Handleiding is een algemene introductie, in dit document worden enkele specifieke vaardigheden toegelicht die je bij dit vak regelmatig zult moeten gebruiken. 1 Random getallen genereren (Zie ook de paragraaf Kansverdelingen en Toevalsgetallen uit de Handleiding R.) Regelmatig zul je random getallen moeten genereren uit een gegeven verdeling. Voor standaardverdelingen zijn hiervoor functies ingebouwd in R. Deze hebben allemaal dezelfde structuur: de naam van de functie is rdist, waarbij DIST vervangen moet worden door de naam van de verdeling. Voorbeelden zijn gegeven in de volgende tabel: binom binomiaal pois poisson geom geometrisch unif uniform exp exponentieel norm normaal Deze functies hebben allemaal als eerste argument n, het aantal random getallen dat uit de betreffende verdeling getrokken moet worden. De output is een vector ter lengte n. Je moet bij al deze functies ook nog een of meerdere andere argumenten opgeven, namelijk de parameters die de verdeling vastleggen. Kijk voor details in de help van de betreffende functie (type op de command line bijvoorbeeld help(rbinom)). Voorbeeld: de volgende twee commando s zijn equivalent: 1 randvec = rnorm(1000,3,2) 2 randvec = rnorm(n=1000,mean=3,sd=2) en hebben allebei als resultaat, dat de variabele randvec een vector is ter lengte 1000, waarin elk element een (onafhankelijke) trekking is uit de normale verdeling, met verwachting 3 en standaardafwijking 2 (dus let op: het derde argument is de standaardafwijking, niet de variantie!). Opmerking: Als je K random getallen wilt genereren uit de binomiale verdeling met parameters n en p, gebruik je de aanroep rbinom(n=k, size=n, prob=p). Het eerste argument n van de functie rbinom is dus niet de parameter van de binomiale verdeling! 2 Histogram maken Het histogram van een rijtje getallen (een vector) geeft inzicht in de verdeling van die getallen. Als de getallen trekkingen zijn uit eenzelfde kansverdeling, dan geeft het histogram een beeld van de bijbehorende kansdichtheidsfunctie. (Voor een onderbouwing van deze bewering, zie het dictaat dat hoort bij dit vak.) 1

2 Het histogram van een vector x kun je tekenen met de functie hist. Deze functie heeft, zoals blijkt uit help(hist), vele argumenten. De argumenten in tabel 1 zijn echter de belangrijkste. Tabel 1: Argumenten voor een histogram x breaks probability De vector waarvan je het histogram wilt zien (verplicht) Geeft aan waar de grenzen tussen de verschillende bins (histogramcategorieën) moeten komen. Kan een getal zijn: breaks=20 geeft aan dat R moet proberen om 20 bins te maken van gelijke breedte. Kan ook een vector zijn, dit zijn dan de grenzen van de bins. Als je breaks als een vector specificeert, moeten alle gegevens binnen de aldus gedefinieerde bins vallen. De aanroep hist(c(0,1,2,3,4),breaks=c(1,2,3)) zal bijvoorbeeld een foutmelding geven. Een true/false waarde, waarmee je kunt aangeven of de verticale as geschaald moet worden zodat de totale oppervlakte van de balkjes in het histogram gelijk is aan 1. Standaard gebruikt hist de instelling probability=false, dan geeft de verticale as aan hoeveel getallen uit de vector x er in de betreffende bin vallen. Als je een histogram maakt van trekkingen uit een kansverdeling, is de instelling probability=true meestal zinvoller, omdat je dan de kansdichtheidsfunctie in hetzelfde plaatje kunt tekenen en deze met het histogram kunt vergelijken. Een handigheidje: je mag namen van argumenten afkorten als het geen dubbelzinnigheid oplevert. Zo kun je het argument probability=true ook schrijven als prob=true. Voorbeeld: de volgende commando s produceren een histogram van 500 random trekkingen uit de exponentiële verdeling met parameter λ = 4. Er zijn 50 bins en de verticale as wordt geschaald zodat de oppervlakte 1 is. 1 randexp = rexp(500,rate=4) 2 hist(randexp, breaks=50, prob=true) In de praktijk weet je niet welke verdeling goed bij je data past. Indien je een idee hebt uit welke kansverdeling de getallen zijn getrokken, is het vaak zinvol om de kansdichtheidsfunctie en het histogram in hetzelfde figuur weer te geven. De dichtheidsfunctie is ddist (met DIST weer als boven; zie de Handleiding R). Als we zouden proberen te plotten met het commando plot, wordt het histogram weer verwijderd en wordt een nieuw assenstelsel getekend. Om de dichtheid weer te geven in hetzelfde assenstelsel als het histogram, geven we het low level commando lines. We krijgen dan als vervolg van het bovenstaande voorbeeld: 3 xpoints = seq(0,4,by=0.1) 4 ypoints = dexp(xpoints,rate=4) 5 lines(xpoints,ypoints) 2

3 3 Plots maken en beïnvloeden Met de functie-aanroep plot(x,y) wordt een nieuw assenstelsel aangemaakt. De vectoren x en y, die even lang moeten zijn, worden hierin tegen elkaar geplot als losse punten (x[i],y[i]). Een uitgebreide uitleg over plotten is opgenomen in de Handleiding R. Let bij het lezen van die handleiding met name op het verschil tussen het high level commando plot en het low level commando lines. Er zijn diverse opties die je extra mee kunt geven aan de functie plot, waarmee je de vorm van de plot kunt aanpassen. Zie hiervoor help(plot), help(par) en de Handleiding R. Een aantal veelgebruikte opties worden ook weergegeven in tabel 2. Tabel 2: Opties voor grafieken xlab="tekst" schrijft tekst langs de x-as ylab="tekst" schrijft tekst langs de y-as main="titel" schrijft de titel titel boven de plot xlim=c(-2,5) stelt het bereik van de x-as in van 2 tot 5 (analoog voor ylim) type=.. vertelt hoe de plot eruit moet zien: "l" verbindt de punten met lijnstukken, "p" tekent alleen punten (standaard voor plot), "b" tekent beide [zie help(plot) voor meer mogelijkheden] lty=.. regelt hoe een geplotte lijn wordt weergegeven. Mogelijke instellingen zijn "solid", "dashed", "dotted", "dotdash", "longdash", "twodash". pch=.. regelt de weergave van geplotte punten. Zie help(points), sectie pch values, voor de mogelijkheden. Deze opties kun je ook aan hist meegeven. In de help van hist kun je zien dat een aantal opties hier een standaardwaarde krijgt. 4 Simulatie In de statistiek gebruik je simulaties meestal om de verdeling van de een of andere grootheid te onderzoeken. In de opgavenseries zul je af en toe een simulatiestudie moeten uitvoeren. Hier wordt aan de hand van een voorbeeld uitgelegd hoe je dat kunt aanpakken. Als voorbeeld zullen we de verdeling onderzoeken van de stochast Y, die gedefinieerd is als n Y := X i, i=1 de som van n onafhankelijke stochastische grootheden X i (i = 1,..., n), waarbij de X i s alternatief verdeeld zijn met parameter p: er geldt P(X i = 1) = p en P(X i = 0) = 1 p. Uit de kansrekening is bekend dat Y zelf binomiaal verdeeld is met parameters n en p (ga dit na), maar we zullen dit voor nu even vergeten en de verdeling van Y door simulatie onderzoeken. We geven hier eerst de code van een geschikt simulatieprogramma voor dit probleem, en daarna lichten we de code regel voor regel toe. Hierbij wordt steeds aangegeven in 3

4 hoeverre de aanpak algemeen toepasbaar is. Na de bespreking wordt dan nog eens het algemene schema van een simulatieprogramma gegeven. Het doel van het simulatieprogramma is om verschillende realisaties van Y te genereren en op basis daarvan de verdeling te onderzoeken. Een geschikt programma voor het boven geschetste probleem is als volgt: 1 n = 25 #aantal Xi die we optellen 2 p = 0.3 #succeskans 3 M = 1000 #aantal random iteraties 4 resultaat = rep(0,m) 5 for( i in 1:M ) { 6 x = rbinom(n,1,p) 7 y = sum(x) 8 resultaat[i] = y 9 } 10 hist(resultaat,prob=true,breaks=seq(-0.5,n+0.5,by=1)) 11 xpunten = 0:n 12 ypunten = dbinom(xpunten,n,p) 13 lines(xpunten,ypunten,lty="dashed") In de regels 1 en 2 van dit programma worden de parameters van het probleem in variabelen opgeslagen. Het is verplicht om getalwaarden toe te kennen aan de parameters, maar welke waarde dat is, kun je zelf kiezen. Hier zijn de waarden n = 25 en p = 0.3 gekozen. Het is handig om de waarden op te slaan in variabelen, zodat je later de waarde van de parameters gemakkelijk kunt veranderen. De kern van het programma bevindt zich in de regels 6 t/m 8. In regel 6 wordt de variabele x gevuld met een vector ter lengte n; het i de element van deze vector bevat een realisatie van X i. In deze toepassing worden de realisaties van de n alternatief(p) verdeelde stochasten gegenereerd door gebruik te maken van de functie rbinom: er worden n trekkingen gegenereerd uit de binomiale verdeling met parameters 1 en p, wat precies de alt(p)-verdeling is. (n is dus niet een parameter van deze binomiale verdeling.) In regel 7 wordt de realisatie van Y = n i=1 X i berekend uit de realisaties van de X i s die zijn opgeslagen in de vector x. In regel 8 wordt deze opgeslagen in de vector resultaat, hierop komen we verderop terug. Het doel van de simulatie is om zeer veel realisaties van Y te genereren. In de regels 6 t/m 8 wordt steeds één realisatie gegenereerd, dus worden deze regels met de for lus M keer herhaald. In elke iteratie wordt de realisatie y opgeslagen in de i de positie van de vector resultaat. Door deze aanpak is aan het einde elke realisatie beschikbaar. De variabele resultaat moet van te voren wel gedefinieerd worden, anders zal regel 8 een foutmelding geven. Dit gebeurt op regel 4. Op deze regel wordt tevens genoeg geheugenruimte gereserveerd voor alle waarden die we in de for lus gaan opslaan in resultaat (de aanroep rep(0,m) geeft een vector met M nullen). Zouden we niet van te voren deze geheugenruimte reserveren, dan zou R in elke iteratie van de for lus de vector resultaat één element langer maken en daarvoor opnieuw geheugenruimte moeten vrijmaken, wat relatief veel tijd kost het programma wordt daardoor trager, wat vooral bij grote M te merken is. 4

5 Na de for lus bevat de vector resultaat M realisaties van de stochast Y. De verdeling van Y kan dan gevisualiseerd worden met behulp van een histogram. Hieroverheen kan dan ook de theoretisch bekende kansdichtheid van Y worden weergegeven. Dit gebeurt in de regels 10 t/m 13. (Merk op dat in regel 10 de breaks zo zijn gekozen dat er een aparte staaf in het histogram komt voor elke (integer)waarde die Y kan krijgen.) De vraag hoe de waarde van M te kiezen blijft over. Hoe groter M wordt gekozen, hoe beter het beeld is dat van de verdeling van Y verkregen wordt. Dus in beginsel moet M zo groot mogelijk worden genomen. De beperkende factor is de tijd die de computer nodig heeft om de simulatie-iteraties uit te voeren. Daarom moet M niet te groot worden gekozen. Het is dus de kunst om een goede waarde van M te kiezen; uiteraard hangt dit af van de toepassing. Begin bijvoorbeeld met M = 100 om je programma te testen. Daarna neem je M steeds groter, totdat je merkt dat het resultaat niet meer veel verandert. Samenvattend zul je dus in een simulatiestudie veelal de volgende structuur aanhouden: 1 #definitie variabelen 2 M = 1000 #aantal simulatie-iteraties 3 resultaat = rep(0,m) 4 for( i in 1:M ) { 5 # - genereer met een geschikte rdist een realisatie van een 6 # stochastische variabele 7 # - bereken de grootheid waarvan je de verdeling wilt onderzoeken, 8 # op basis van die realisatie 9 resultaat[i] = grootheid_die_je_berekend_hebt 10 } 11 hist(resultaat,prob=true) 5 Fitten 5.1 Lineaire regressie Met de functie lm kun je regressie toepassen voor een Lineair Model. Veronderstel dat we een n-tal waarnemingen (x i, y i ) hebben, waarvan de coördinaten zijn opgeslagen in vectoren x en y (de waarnemingen zijn dus (x[i], y[i])). Met lm kun je een kleinstekwadraten aanpassing aan de data laten uitvoeren, voor een model Y i = f(x i, θ) + e i, waarbij de stochastische storingstermen e i onafhankelijk zijn, verwachting 0 hebben en gelijke (maar onbekende) variantie σ 2. De functie f(x i, θ) moet lineair zijn in de parameters θ. Deze functie wordt in de aanroep van de R-functie lm gespecificeerd in het argument formula. De volgende voorbeelden dienen om het gebruik van formula toe te lichten. model Y i = α + βx i + e i Y i = α + β 1 x i + β 2 x 2 i + e i Y i = βx i + e i Y i = β 1 cos(x i ) + β 2 exp(w i ) + e i formula y ~ x y ~ x + x^2 y ~ -1 + x y ~ -1 + cos(x) + exp(w) 5

6 Een aantal verdere opmerkingen: De symbolen in formula kunnen ofwel wiskundige functies zijn, ofwel namen van variabelen. De vectoren x en y, en in het laatste voorbeeld ook w, moeten dus van te voren zijn gedefinieerd. Standaard neemt R een intercept (constante term) op in het model. Als je dit niet wilt, voeg je -1 toe aan de instelling van formula (lees dit als niet de intercept ). Voor de meeste resultaten die de functie lm uitvoert, zijn geen verdere aannames nodig over de precieze verdeling van de meetfouten e i. Waar wel extra aannames nodig zijn, neemt R aan dat de verdeling normaal is. Het model moet lineair zijn in de regressieparameters. Om een model te fitten dat niet lineair is in de parameters, moet je ofwel een transformatie uitvoeren om zo een lineair model te verkrijgen, ofwel de functie nls gebruiken om niet-lineaire regressie uit te voeren. Als je de functie lm aanroept vanaf de command line, wordt een deel van de output naar het scherm geschreven. Je kunt de output ook opvangen in een variabele, bijvoorbeeld door de aanroep z=lm(y~x). Dan bevat z een lijst met allerlei resultaten van de regressie, die zijn geplaatst in de elementen van de lijst. Het element genaamd element van de lijst z kan worden opgeroepen met z$ element. Nog meer informatie kun je krijgen met de aanroep sz=summary(z). De variabele sz bevat dan ook weer een lijst. Enkele elementen uit de lijsten z (de uitvoer van lm) en sz (de uitvoer van summary(z)), die je vaak zult gebruiken, zijn opgenomen in de volgende tabel. z$coefficients De kleinste-kwadratenschatters ˆθ voor de regressieparameters θ z$residuals De ongeschaalde residuen y i f(x i, ˆθ) sz$coefficients Een matrix met daarin voor elke regressieparameter: de kleinstekwadratenschatting, de standaardfout, de waarde van de toetsingsgrootheid van de t-toets voor de nulhypothese dat de parameter gelijk is aan 0, en de bijbehorende tweezijdige overschrijdingskans sz$residuals De geschaalde residuen w i (y i f(x i, ˆθ)), waarbij w i het opgegeven gewicht is van het i-de meetpunt (zie onder; als je geen gewichten sz$sigma hebt opgegeven is w i = 1) Schatting voor de standaardafwijking ˆσ: ˆσ 2 = 1 ni=1 n p w i (y i f(x i, ˆθ)) 2 (p is het aantal regressieparameters). sz$corr De correlatiematrix van de kleinste-kwadratenschatters voor de regressieparameters, alleen beschikbaar als je de aanroep sz=summary(z,corr=t) doet. Je mag de namen van de elementen afkorten, bijvoorbeeld tot z$coef. De helptekst over lm (type help(lm)) beschrijft welke zaken de variabele z nog meer zal bevatten; help(summary.lm) beschrijft het object sz. (Een handigheidje: als je op de command line typt z$ en daarna één- of tweemaal op de tab-toets drukt, worden alle mogelijke aanvullingen van dit commando weergegeven. Dit aanvullen van een commando met de tab-toets werkt ook voor alle andere R-commando s.) 6

7 Uitbreidingen en variaties Wanneer bekend is dat de varianties van de verschillende meetfouten niet allemaal hetzelfde zijn, kan een gewogen regressie worden uitgevoerd. Beschouw opnieuw het model Y i = f(x i, θ) + e i, met f weer een lineaire functie van de parameters θ, en de e i onafhankelijk verdeeld met verwachting 0 en ongelijke varianties σi 2. De σ i voldoen aan σ i = s i σ, met bekende s i en onbekende σ. (De verhouding tussen de σ i is dus bekend.) De kleinste kwadratenmethode wordt dan bijgesteld: er wordt een gewicht w i = 1/s 2 i aan het i de meetpunt toegekend. De grootheid n n ( ) w i (Y i f(x i, θ)) 2 Yi f(x i, θ) 2 = i=1 i=1 wordt geminimaliseerd naar θ. In R kan dit worden gedaan door het argument weights van de functie lm te specificeren. Heb je bijvoorbeeld vier metingen met bekende s i die zijn opgeslagen in een vector svector, dan geef je een commando als lm( y~x, weights=c(1/svector^2) ). In het standaard regressiemodel wordt aangenomen dat de meetfouten alle dezelfde variantie σ 2 hebben, die een onbekende waarde heeft. (In de zojuist beschreven gewogen regressie is de waarde van σ ook onbekend.) Om de waarde van een uitdrukking waar σ in voor komt te kunnen berekenen, wordt de waarde van σ geschat met ˆσ. In de situatie dat de variantie van de meetfouten wel bekend is, bijvoorbeeld door externe meting, is de procedure die R uitvoert dus niet correct. In deze situatie moet je de resultaten handmatig corrigeren. Daarvoor is het nodig om te weten hoe de resultaten afhangen van σ, en om te weten welke waarde R heeft berekend voor ˆσ. Dit laatste kun je vinden in de uitvoer van de functie summary (zie boven). Wanneer de varianties van de meetfouten bekend zijn, kan ook een chikwadraattoets worden uitgevoerd om de goodness of fit van de kleinste-kwadratenaanpassing te evalueren. De waarde van de toetsingsgrootheid wordt niet standaard door R berekend. Je kunt dit echter zelf doen door de som van de kwadraten van de residuen te berekenen met sum((z$residuals)^2), als z de output van lm bevat. (Bij een gewogen regressie sommeer je de kwadraten van de geschaalde residuen met de code sum((summary(z)$residuals)^2).) Met behulp van de functie pchisq kan dan de overschrijdingskans van de realisatie van U worden bepaald. s i 5.2 Niet-lineaire regressie Om te fitten met een modelfunctie f(x, θ) die niet-lineair is in de parameters, gebruik je de R-functie nls (nonlinear least squares). Als argument voor deze functie moet ook weer een formula worden opgegeven, waarmee de modelfunctie wordt gespecificeerd. Ook de parameters moeten hierin worden opgenomen. Wil men bijvoorbeeld de functie p exp( p x) aan de data fitten, dan gebruikt men formula=y~p*exp(-p*x). Opnieuw moeten de vectoren x en y van te voren zijn gedefinieerd. Bij de niet-lineaire kleinste-kwadratenmethode moeten startwaarden voor de parameters worden opgegeven. Dit doet men door het argument start op te geven. In het voorbeeldje hierboven kan het argument bijvoorbeeld worden start=list(p=0.5). Indien meerdere parameters zijn gebruikt in de modelfunctie, bijvoorbeeld alpha en xmin, dan worden de startwaarden bijvoorbeeld gespecificeerd als start=list(alpha=2.1,xmin=4). 7

8 De output van nls is niet, zoals wel bij lm, gemakkelijk te verwerken. Als je echter eerst de functie summary toepast op de output van nls, krijg je een lijst die je wel kunt lezen. Deze bevat bijvoorbeeld de parameter-matrix coefficients, en de vector residuals. Zie de help voor meer mogelijkheden. 8

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Inleveren: 12 januari 2011, VOOR het college Afspraken Serie 1 mag gemaakt en ingeleverd worden in tweetallen. Schrijf duidelijk je naam, e-mail

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven

Nadere informatie

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur Kansrekening en statistiek wi20in deel I 29 januari 200, 400 700 uur Bij dit examen is het gebruik van een (evt grafische rekenmachine toegestaan Tevens krijgt u een formuleblad uitgereikt na afloop inleveren

Nadere informatie

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur Tentamen Kansrekening en Statistiek MST 14 januari 2016, 14.00 17.00 uur Het tentamen bestaat uit 15 meerkeuzevragen 2 open vragen. Een formuleblad wordt uitgedeeld. Normering: 0.4 punt per MC antwoord

Nadere informatie

Set 3 Inleveropgaven Kansrekening (2WS20) Opgaven met sterretjes zijn lastiger dan opgaven zonder sterretje.

Set 3 Inleveropgaven Kansrekening (2WS20) Opgaven met sterretjes zijn lastiger dan opgaven zonder sterretje. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Set 3 Inleveropgaven Kansrekening (2WS2) 23-24 Opgaven met sterretjes zijn lastiger dan opgaven zonder sterretje.. Voetbalplaatjes. Bij

Nadere informatie

Opdracht 2. Deadline maandag 28 september 2015, 24:00 uur.

Opdracht 2. Deadline maandag 28 september 2015, 24:00 uur. Opdracht 2. Deadline maandag 28 september 2015, 24:00 uur. Deze opdracht bestaat uit vier onderdelen; in elk onderdeel wordt gevraagd een Matlabprogramma te schrijven. De vier bijbehore bestanden stuur

Nadere informatie

GEOGEBRA 4. R. Van Nieuwenhuyze. Hoofdlector wiskunde, lerarenopleiding HUB, Brussel. Auteur Van Basis tot Limiet. roger.van.nieuwenhuyze@skynet.

GEOGEBRA 4. R. Van Nieuwenhuyze. Hoofdlector wiskunde, lerarenopleiding HUB, Brussel. Auteur Van Basis tot Limiet. roger.van.nieuwenhuyze@skynet. ? GEOGEBRA 4 R. Van Nieuwenhuyze Hoofdlector wiskunde, lerarenopleiding HUB, Brussel. Auteur Van Basis tot Limiet. roger.van.nieuwenhuyze@skynet.be Roger Van Nieuwenhuyze GeoGebra 4 Pagina 1 1. Schermen

Nadere informatie

Statistiek en Data Analyse Opgavenserie 3: Lineaire regressie

Statistiek en Data Analyse Opgavenserie 3: Lineaire regressie Statistiek en Data Analyse Opgavenserie 3: Lineaire regressie Inleveren: uiterlijk maandag 6 februari 16.00 bij Marianne Jonker (Kamer: R3.46) Afspraken De opdrachten maak je in tweetallen. Schrijf duidelijk

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van

Nadere informatie

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u Technische Universiteit Delft Mekelweg 4 Faculteit Elektrotechniek, Wiskunde en Informatica 2628 CD Delft Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u Formulebladen, rekenmachines,

Nadere informatie

Inleiding Statistiek

Inleiding Statistiek Inleiding Statistiek Practicum 1 Op dit practicum herhalen we wat Matlab. Vervolgens illustreren we het schatten van een parameter en het toetsen van een hypothese met een klein simulatie experiment. Het

Nadere informatie

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur Kansrekening en statistiek WI22TI / WI25IN deel 2 2 februari 22, 4. 6. uur VOOR WI22TI: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad is niet toegestaan.

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Matlab-Introductie (les 1)

Matlab-Introductie (les 1) Matlab-Introductie (les 1) Wat is Matlab? MATLAB staat voor MATrix LABoratory. Opstarten van Matlab Dit hangt af van het onderligge systeem (Windows, Linux,...), Maar kortweg geldt bijna altijd: ga met

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (2WS4, dinsdag 17 juni 28, van 9. 12. uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een klein kapitaaltje

Nadere informatie

ALGEMENE STATISTIEK VOOR BWI COMPUTEROPGAVEN 2009/2010. A.W. van der Vaart en F. Bijma

ALGEMENE STATISTIEK VOOR BWI COMPUTEROPGAVEN 2009/2010. A.W. van der Vaart en F. Bijma ALGEMENE STATISTIEK VOOR BWI COMPUTEROPGAVEN 2009/2010 A.W. van der Vaart en F. Bijma 1 Algemene Instructies Het programma R is onder Windows beschikbaar. Je kunt R vinden in de lijst met programma s onder

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur. VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT

Nadere informatie

Project Dynamica: oefenopgaven met R

Project Dynamica: oefenopgaven met R Project Dynamica: oefenopgaven met R De onderstaande opgaven dienen in R gemaakt te worden; uitwerkingen hoeven niet ingeleverd te worden. Zie de website http://www.r-project.org/ voor R manuals. Start

Nadere informatie

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan. Afdeling Wiskunde Volledig tentamen Statistics Deeltentamen 2 Statistics Vrije Universiteit 28 mei 2015 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen: opgaven 1,2,3,4. Cijfer=

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening (2WS2, Vrijdag 23 januari 25, om 9:-2:. Dit is een tentamen met gesloten boek. De uitwerkingen van de opgaven dienen

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie

Nadere informatie

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur Kansrekening en statistiek WI05IN deel I 4 november 0, 4.00 7.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad wordt uitgereikt. Meerkeuzevragen Toelichting:

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

Inleiding Applicatie Software - Statgraphics

Inleiding Applicatie Software - Statgraphics Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een

Nadere informatie

1. Statistiek gebruiken 1

1. Statistiek gebruiken 1 Hoofdstuk 0 Inhoudsopgave 1. Statistiek gebruiken 1 2. Gegevens beschrijven 3 2.1 Verschillende soorten gegevens......................................... 3 2.2 Staafdiagrammen en histogrammen....................................

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

4 Domein STATISTIEK - versie 1.2

4 Domein STATISTIEK - versie 1.2 USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum

Nadere informatie

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1) Cursus Statistiek Hoofdstuk 4 Statistiek voor Informatica Hoofdstuk 4: Verwachtingen Cursusjaar 29 Peter de Waal Departement Informatica Inhoud Verwachtingen Variantie Momenten en Momentengenererende functie

Nadere informatie

. Dan geldt P(B) = a. 1 4. d. 3 8

. Dan geldt P(B) = a. 1 4. d. 3 8 Tentamen Statistische methoden 4052STAMEY juli 203, 9:00 2:00 Studienummers: Vult u alstublieft op het meerkeuzevragenformulier uw Delftse studienummer in (tbv automatische verwerking); en op het open

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

Hoofdstuk 2: Grafieken en formules

Hoofdstuk 2: Grafieken en formules Hoofdstuk 2: Grafieken en formules Wiskunde VMBO 2011/2012 www.lyceo.nl Hoofdstuk 2: Grafieken en formules Wiskunde 1. Basisvaardigheden 2. Grafieken en formules 3. Algebraïsche verbanden 4. Meetkunde

Nadere informatie

Toegepaste Wiskunde 2: Het Kalman-filter

Toegepaste Wiskunde 2: Het Kalman-filter Toegepaste Wiskunde 2: Het Kalman-filter 25 februari, 2008 Hans Maassen 1. Inleiding Het Kalman filter schat de toestand van een systeem op basis van een reeks, door ruis verstoorde waarnemingen. Een meer

Nadere informatie

Stochastische grafen in alledaagse modellen

Stochastische grafen in alledaagse modellen Stochastische grafen in alledaagse modellen Ionica Smeets en Gerard Hooghiemstra 27 februari 2004 Stochastische grafen zijn grafen waarbij het aantal kanten bepaald wordt door kansverdelingen. Deze grafen

Nadere informatie

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn. Opdracht 12a ------------ enkelvoudige lineaire regressie Kan de leeftijd waarop een kind begint te spreken voorspellen hoe zijn score zal zijn bij een latere test op verstandelijke vermogens? Een studie

Nadere informatie

1. De wereld van de kansmodellen.

1. De wereld van de kansmodellen. STATISTIEK 3 DE GRAAD.. De wereld van de kansmodellen... Kansmodellen X kansmodel Discreet model Continu model Kansverdeling Vaas Staafdiagram Dichtheidsfunctie f(x) GraJiek van f Definitie: Een kansmodel

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamenopgaven Statistiek 2DD71: UITWERKINGEN 1. Stroopwafels a De som S van de 12 gewichten is X 1 + X 2 + + X 12. Deze is normaal

Nadere informatie

HOVO statistiek November 2011 1

HOVO statistiek November 2011 1 Principale Componentenanalyse en hockeystick-short centring Principale Componentenanalyse bedacht door Karl Pearson in 1901 Peter Grünwald HOVO 31-10 2011 Stel we hebben een grote hoeveelheid data. Elk

Nadere informatie

Opgave 1: (zowel 2DM40 als 2S390)

Opgave 1: (zowel 2DM40 als 2S390) TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4 en S39) op donderdag, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Korte handleiding Maple bij de cursus Meetkunde voor B

Korte handleiding Maple bij de cursus Meetkunde voor B Korte handleiding Maple bij de cursus Meetkunde voor B Deze handleiding sluit aan op en is gedeeltelijk gelijk aan de handleidingen die gebruikt worden bij de cursussen Wiskunde 2 en 3 voor B. Er zijn

Nadere informatie

3.0 Voorkennis. Voorbeeld 1: Los op: 6x + 28 = 30 10x.

3.0 Voorkennis. Voorbeeld 1: Los op: 6x + 28 = 30 10x. 3.0 Voorkennis Voorbeeld 1: Los op: 6x + 28 = 30 10x. 6x + 28 = 30 10x +10x +10x 16x + 28 = 30-28 -28 16x = 2 :16 :16 x = 2 1 16 8 Stappenplan: 1) Zorg dat alles met x links van het = teken komt te staan;

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 8 Donderdag 13 Oktober 1 / 23 2 Statistiek Vandaag: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 23 Stochast en populatie

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS

VOOR HET SECUNDAIR ONDERWIJS VOOR HET SECUNDAIR ONDERWIJS Steekproefmodellen en normaal verdeelde steekproefgrootheden 5. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg

Nadere informatie

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten Deze week: Steekproefverdelingen Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen Cursusjaar 29 Peter de Waal Zuivere Schatters Betrouwbaarheidsintervallen Departement Informatica Hfdstk

Nadere informatie

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen Lesbrief: Correlatie en Regressie Leerlingmateriaal Je leert nu: -een correlatiecoëfficient gebruiken als maat voor het statistische verband tussen beide variabelen -een regressielijn te tekenen die een

Nadere informatie

vwo: Het maken van een natuurkunde-verslag vs 21062011

vwo: Het maken van een natuurkunde-verslag vs 21062011 Het maken van een verslag voor natuurkunde, vwo versie Deze tekst vind je op www.agtijmensen.nl: Een voorbeeld van een verslag Daar vind je ook een po of pws verslag dat wat uitgebreider is. Gebruik volledige

Nadere informatie

Wiskunde B - Tentamen 1

Wiskunde B - Tentamen 1 Wiskunde B - Tentamen Tentamen 57 Wiskunde B voor CiT vrijdag januari 5 van 9. tot. uur Dit tentamen bestaat uit 6 opgaven, formulebladen en tabellen. Vermeld ook uw studentnummer op uw werk en tentamenbriefje.

Nadere informatie

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Eindtentamen Kansrekening en Statistiek (WS), Tussentoets Kansrekening en Statistiek (WS), Vrijdag 8 april, om 9:-:. Dit is een tentamen

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (2S27), dinsdag 14 juni 25, 9. - 12. uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Eindexamen wiskunde B1-2 vwo 2006-II

Eindexamen wiskunde B1-2 vwo 2006-II Drinkbak In figuur staat een tekening van een drinkbak voor dieren. De bak bestaat uit drie delen: een rechthoekige, metalen plaat die gebogen is tot een symmetrische goot, een voorkant en een achterkant

Nadere informatie

Monte-Carlo simulatie voor financiële optieprijzen Studiepunten : 2

Monte-Carlo simulatie voor financiële optieprijzen Studiepunten : 2 1 INLEIDING 1 Monte-Carlo simulatie voor financiële optieprijzen Studiepunten : 2 Volg stap voor stap de tekst en los de vragen op. Bedoeling is dat je op het einde van de rit een verzorgd verslag afgeeft

Nadere informatie

Meten en experimenteren

Meten en experimenteren Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 3 oktober 006 Deel I Toevallige veranderlijken Steekproef Beschrijving van gegevens Histogram Gemiddelde en standaarddeviatie

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

Samenvatting Statistiek

Samenvatting Statistiek Samenvatting Statistiek De hoofdstukken 1 t/m 3 gaan over kansrekening: het uitrekenen van kansen in een volledig gespecifeerd model, waarin de parameters bekend zijn en de kans op een gebeurtenis gevraagd

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as.

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as. Opdracht 6a ----------- Dichtheidskromme, normaal-kwantiel-plot Een nauwkeurige waarde van de lichtsnelheid is van belang voor ontwerpers van computers, omdat de elektrische signalen zich uitsluitend met

Nadere informatie

Tentamen Kansrekening en Statistiek (2WS04), woensdag 30 juni 2010, van 9.00 12.00 uur.

Tentamen Kansrekening en Statistiek (2WS04), woensdag 30 juni 2010, van 9.00 12.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (WS4), woensdag 3 juni, van 9.. uur. Dit is een tentamen met gesloten boek. De uitwerkingen van de

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening (2WS2), Vrijdag 24 januari 24, om 9:-2:. Dit is een tentamen met gesloten boek. De uitwerkingen van de opgaven

Nadere informatie

Introductie in R. http://www.math.montana.edu/stat/tutorials/r-intro.pdf http://www.math.montana.edu/stat/docs/splus_notes.ps

Introductie in R. http://www.math.montana.edu/stat/tutorials/r-intro.pdf http://www.math.montana.edu/stat/docs/splus_notes.ps Introductie in R R is een programmeer taal met een groot aantal voorgeprogrammeerde statistische functies. Het is de open source versie van S-plus. Wij gebruiken R dan ook omdat het gratis is. Documentatie

Nadere informatie

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient Opdracht 4a ----------- Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient In 1738 werd in de haven van Stockholm voor een aantal landen voor elk land geregistreerd hoeveel schepen

Nadere informatie

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Afdeling Wiskunde Volledig tentamen Algemene Statistiek Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen:

Nadere informatie

WISKUNDE D HAVO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0

WISKUNDE D HAVO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0 WISKUNDE D HAVO VAKINFORMATIE STAATSEAMEN 2016 V15.7.0 De vakinformatie in dit document is vastgesteld door het College voor Toetsen en Examens (CvTE). Het CvTE is verantwoordelijk voor de afname van de

Nadere informatie

Modelleren C Appels. Christian Vleugels Sander Verkerk Richard Both. 15 juni 2010. 1 Inleiding 2. 3 Data 3. 4 Aanpak 4

Modelleren C Appels. Christian Vleugels Sander Verkerk Richard Both. 15 juni 2010. 1 Inleiding 2. 3 Data 3. 4 Aanpak 4 Modelleren C Appels Christian Vleugels Sander Verkerk Richard Both 15 juni 2010 Inhoudsopgave 1 Inleiding 2 2 Probleembeschrijving 2 3 Data 3 4 Aanpak 4 5 Deterministische aanpak 4 5.1 Populariteit van

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

TI83-werkblad. Vergelijkingen bij de normale verdeling

TI83-werkblad. Vergelijkingen bij de normale verdeling TI83-werkblad Vergelijkingen bij de normale verdeling 1. Inleiding Een normale verdeling wordt bepaald door de constanten µ en σ. Dit blijkt uit het voorschrift van de verdelingsfunctie van de normale

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Tentamen OGO Fysisch Experimenteren voor minor AP (3MN10)

TECHNISCHE UNIVERSITEIT EINDHOVEN. Tentamen OGO Fysisch Experimenteren voor minor AP (3MN10) TECHNISCHE UNIVERSITEIT EINDHOVEN Tentamen OGO Fysisch Experimenteren voor minor AP (3MN10) en Tentamen Inleiding Experimentele Fysica voor Combi s (3NA10) d.d. 31 oktober 2011 van 9:00 12:00 uur Vul de

Nadere informatie

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31 Tentamen Statistische methoden 45STAMEY april, 9: : Studienummers: Vult u alstublieft op het MC formulier uw Delftse studienummer in; en op het open vragen formulier graag beide, naar volgend voorbeeld:

Nadere informatie

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek cursus 23 mei 2012 werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen onderzoek streeft naar inzicht in relatie tussen variabelen bv. tussen onafhankelijke

Nadere informatie

Feedback proefexamen Statistiek I 2009 2010

Feedback proefexamen Statistiek I 2009 2010 Feedback proefexamen Statistiek I 2009 2010 Het correcte antwoord wordt aangeduid door een sterretje. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Een derde van de mannen is

Nadere informatie

Wiskunde De Normale en Binomiale Verdeling. Geschreven door P.F.Lammertsma voor mijn lieve Avigail

Wiskunde De Normale en Binomiale Verdeling. Geschreven door P.F.Lammertsma voor mijn lieve Avigail Wiskunde De Normale en Binomiale Verdeling Geschreven door P.F.Lammertsma voor mijn lieve Avigail Opmerkingen vooraf Wiskunde Pagina 2 uit 20 Opmerkingen vooraf Pak je rekenmachine, de TI-83, erbij en

Nadere informatie

Meten en experimenteren

Meten en experimenteren Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 6 oktober 009 Catherine De Clercq Statistische verwerking van gegevens Kursus statistiek voor fysici door Jorgen D Hondt

Nadere informatie

Deel 3 havo. Docentenhandleiding havo deel 3 CB

Deel 3 havo. Docentenhandleiding havo deel 3 CB Deel 3 havo De hoeveelheid leerstof is gebaseerd op drie lesuren per week. Met drie lesuren is het in ieder geval mogelijk om de basisstof van tien hoofdstukken door te werken, eventueel met de verkorte

Nadere informatie

Deze week: Schatten. Statistiek voor Informatica Hoofdstuk 6: Schatten. Voorbeeld Medicijnentest. Statistische inferentie

Deze week: Schatten. Statistiek voor Informatica Hoofdstuk 6: Schatten. Voorbeeld Medicijnentest. Statistische inferentie Deze week: Schatten Statistiek voor Informatica Hoofdstuk 6: Schatten Cursusjaar 2009 Peter de Waal Departement Informatica Statistische inferentie A Priori en posteriori verdelingen Geconjugeerde a priori

Nadere informatie

11. Eenvoudige programma s schrijven in Maxima

11. Eenvoudige programma s schrijven in Maxima 11. Eenvoudige programma s schrijven in Maxima We zullen in dit hoofdstuk een aantal eenvoudige Maxima programma s laten zien. 11.1. Aantal wortels van een vierkantsvergelijking Het onderstaande programma

Nadere informatie

Statistiek I Samenvatting. Prof. dr. Carette

Statistiek I Samenvatting. Prof. dr. Carette Statistiek I Samenvatting Prof. dr. Carette Opleiding: bachelor of science in de Handelswetenschappen Academiejaar 2016 2017 Inhoudsopgave Hoofdstuk 1: Statistiek, gegevens en statistisch denken... 3 De

Nadere informatie

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur Tentamen Kansrekening en statistiek wi205in 25 juni 2007, 4.00 7.00 uur Bij dit examen is het gebruik van een (evt. grafische rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

Grafieken, functies en verzamelingen. Eerst enkele begrippen. Grafiek. Assenstelsel. Oorsprong. Coördinaten. Stapgrootte.

Grafieken, functies en verzamelingen. Eerst enkele begrippen. Grafiek. Assenstelsel. Oorsprong. Coördinaten. Stapgrootte. Grafieken, functies en verzamelingen Eerst enkele begrippen Grafiek In een assenstelsel teken je een grafiek. Assenstelsel Een assenstelsel bestaat uit twee assen die elkaar snijden: een horizontale en

Nadere informatie

Examen VWO 2015. wiskunde C. tijdvak 2 woensdag 17 juni 13.30-16.30 uur. Bij dit examen hoort een uitwerkbijlage.

Examen VWO 2015. wiskunde C. tijdvak 2 woensdag 17 juni 13.30-16.30 uur. Bij dit examen hoort een uitwerkbijlage. Examen VWO 2015 tijdvak 2 woensdag 17 juni 13.30-16.30 uur wiskunde C Bij dit examen hoort een uitwerkbijlage. Dit examen bestaat uit 22 vragen. Voor dit examen zijn maximaal 79 punten te behalen. Voor

Nadere informatie

Formules Excel Bedrijfsstatistiek

Formules Excel Bedrijfsstatistiek Formules Excel Bedrijfsstatistiek Hoofdstuk 2 Data en hun voorstelling AANTAL.ALS vb: AANTAL.ALS(A1 :B6,H1) Telt hoeveel keer (frequentie) de waarde die in H1 zit in A1:B6 voorkomt. Vooral bedoeld voor

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

maplev 2010/7/12 14:02 page 277 #279

maplev 2010/7/12 14:02 page 277 #279 maplev /7/ 4: page 77 #79 Module 8 Benaderende en interpolerende functies Onderwerp Voorkennis Expressies Bibliotheken Bestanden Zie ook Continue en differentieerbare functies door gegeven punten; kleinste

Nadere informatie

( ) Hoofdstuk 4 Verloop van functies. 4.1 De grafiek van ( ) 4.1.1 Spiegelen t.o.v. de x-as, y-as en de oorsprong

( ) Hoofdstuk 4 Verloop van functies. 4.1 De grafiek van ( ) 4.1.1 Spiegelen t.o.v. de x-as, y-as en de oorsprong Hoofdstuk 4 Verloop van functies Met DERIVE is het mogelijk om tal van eigenschappen van functies experimenteel te ontdekken. In een eerste paragraaf onderzoeken we het verband tussen de grafieken van

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door

Nadere informatie

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) DATA STRUKTUUR Afhankelijke variabele: Eén kontinue variabele Onafhankelijke variabele(n): - één discrete variabele: één gecontroleerde factor - twee discrete variabelen:

Nadere informatie

FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie

FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie Lineaire Algebra, tentamen Uitwerkingen vrijdag 4 januari 0, 9 uur Gebruik van een formuleblad of rekenmachine is niet toegestaan. De

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19 Stochastiek 2 Inleiding in de Mathematische Statistiek 1/19 Herhaling H.1 2/19 Mathematische Statistiek We beschouwen de beschikbare data als realisatie(s) van een stochastische grootheid X.(Vaak een vector

Nadere informatie

V Kegelsneden en Kwadratische Vormen in R. IV.0 Inleiding

V Kegelsneden en Kwadratische Vormen in R. IV.0 Inleiding V Kegelsneden en Kwadratische Vormen in R IV.0 Inleiding V. Homogene kwadratische vormen Een vorm als H (, ) = 5 4 + 8 heet een homogene kwadratische vorm naar de twee variabelen en. Een vorm als K (,

Nadere informatie

Uitwerkingen Mei 2012. Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

Uitwerkingen Mei 2012. Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek Uitwerkingen Mei 2012 Eindexamen VWO Wiskunde C Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek I Tjing Opgave 1. Het aantal hoofdstukken in de I Tjing correspondeert met het totale aantal

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op maandag 5 januari 29 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie