R Statistiek II

Maat: px
Weergave met pagina beginnen:

Download "R Statistiek II"

Transcriptie

1 R Statistiek II Inhoudstafel BASIS... 3 Centrummaten p R EN DE MEETNIVEAUS P ORDENINGSTECHNIEKEN P GRAFISCHE VOORSTELLINGEN P SPREIDINGSMATEN P ASSOCIATIEMATEN P DE BIJZONDERE KANSVERDELINGEN De binomiale verdeling p De normale verdeling p De χ²-verdeling p De Student verdeling of t-verdeling p De F-verdeling p PUNTSCHATTINGEN P TOETSEN VAN HYPOTHESES... 9 Toetsen van hypothese betreffende een verwachting p Toetsen van hypothese betreffende twee verwachtingen p Onafhankelijke steekproeven Afhankelijke steekproeven p Hypothese toetsen betreffende twee varianties p Hypothese toetsen betreffende een proportie - p Het toetsen van de normaliteit p POWER P Power bij het toetsen van een hypothese betreffende een proportie p Power bij het toetsen van een hypothese betreffende een verwachting p Power bij het toetsen van een hypothese betreffende twee verwachtingen afhankelijke steekproeven p Power bij het toetsen van een hypothese betreffende twee verwachtingen onafhankelijke steekproeven p Power van de toets van H0: β1= 0 p

2 Om de power van een ANOVA test te berekenen p DE FUNCTIE lm P De R functie summary - p Meervoudige lineaire regressie p DE FUNCTIE aggregate P DE FUNCTIE aov P Summary(myAOV) p POST HOC MEERVOUDIGE VERGELIJKINGEN P ENKELVOUDIGE VARIANTIE-ANALYSE ALS EEN LINEAIR MODEL P PEARSON S CHI-SQUARED TEST P EFFECTGROOTTE W P

3 BASIS Vector aanmaken: naamvector <- gegevens > mydata <- data.frame(score, iq, motivatie, geslacht, roken, opleiding, gewicht, lengte) > mydata score iq motivatie geslacht roken opleiding gewicht lengte V Neen psy V Neen psy M Neen ped M Neen psy Specifieke kolom (variabele) aanhalen: $ > mydata$gewicht [1] [20] Geslacht van de n-de persoon opvragen: [n] > mydata$geslacht [10] [1] M Levels: M V Grootte van het data frame opvragen: dim 30 staat voor steekproefgrootte en 8 staat voor aantal variabelen. > dim(mydata) [1] 30 8 Sommatie: sum Vierkantswortel trekken: sqrt Om een getal af te ronden: round > pi [1] 3, > round(pi, 4) [1] 3,1416 Voorwaarde geven: == Bv. Vector aanmaken met lengte van de mannen > lengtem <- sportdata$lengte[sportdata$geslacht == "M"] Lengte van een vector opvragen: length > length(lengtem) [1] 94 Eerste zes regels van het data frame opvragen: head > head(mydata) score iq motivatie geslacht roken opleiding gewicht lengte V Neen psy V Neen psy V Neen psy M Neen psy M Ja psy V Neen ped

4 Centrummaten p. 19 Gemiddelde: mean > mean(c(12, 13, 15, 7, 2, 200, 19, 15, 14, 16, 19)) [1] Mediaan: median > median(c(10, 15, 13, 17)) [1] 14 Modus: met table > table(mydata$geslacht) M V V is de modus R EN DE MEETNIVEAUS P. 11 Zeggen dat de getallen als niet-numeriek beschouwd moeten worden: factor > Tramnummer <- factor( c(1, 21, 22, 4, 22, 1, 4) ) De data ordenen: levels, ordered = TRUE Levels zijn de verschillende waarden in de vector. Ordered = TRUE om te zeggen dat de levels in de juiste volgorde staan. > uitslag <- factor( c("brons", "zilver", "goud", "zilver"), levels = c("brons", "zilver", "goud"), ordered = TRUE) > uitslag [1] brons zilver goud zilver Levels: brons < zilver < goud Om niet-numerieke data om te zetten naar numerieke niveaus: as.numeric > as.numeric(uitslag) [1] ORDENINGSTECHNIEKEN P. 16 Frequentieverdeling: table > table(bloeddruk$dosis) = de verschillende levels in de vector = de frequentie van elk level Relatieve frequentieverdeling: prop.table > prop.table(table(mydata$opleiding)) ped psy soc Bivariate frequentieverdeling: table > table( mydata$geslacht, mydata$opleiding) ped psy soc M V

5 GRAFISCHE VOORSTELLINGEN P. 17 Taartdiagram: pie > pie(x = c(10, 18, 2), labels = c( ped, psy, soc )) of _ > pie(table(mydata$opleiding)) Lijndiagram of staafdiagram: barplot > barplot(table(mydata$motivatie)) Histogram: hist > hist(x = mydata$gewicht) Zelf aantal klassen bepalen van histogram: breaks > hist(x = mydata$gewicht, breaks = 4) Spreidingsdiagram: plot > plot(x = mydata$gewicht, y = mydata$lengte) 5

6 Zelf de lengte van de assen bepalen: xlim en ylim > plot(x = mydata$gewicht, y = mydata$lengte, xlim = c(0,100), ylim =c(100, 200)) Boxplot: boxplot > boxplot(mydata$iq) of > boxplot(mydata)

7 SPREIDINGSMATEN P. 21 Variatiebreedte: max(mydata$x) min(mydata$x) > max(mydata$iq) - min(mydata$iq) [1] 63 Interkwartiele afstand: IQR > IQR(myData$iq) [1] 21 ASSOCIATIEMATEN P. 24 Correlatiecoëfficiënt van Pearson r xy : cor > cor(mydata$gewicht, mydata$lengte) [1] Correlatiecoëfficiënt van Kendall of Kendall s τ: cor Maar! duidelijk maken dat je Kendall wilt: method = kendall > cor(sportdata$leeftijd, sportdata$gewicht, method = "kendall")q [1] DE BIJZONDERE KANSVERDELINGEN 1. De binomiale verdeling p. 55 X B(n, ) dbinom: P(X B(n, ) = x) =? x = k (aantal keer dat gebeurtenis A zich realiseert) size = n (aantal herhalingen van het toevalsproces) prob = (de kans dat A zich realiseert) > dbinom(x=0, size=4, prob=1/3) [1] pbinom: P(X B(n, ) q) =? Sommeert alle kansen aan de linkerkant van 10, 10 inbegrepen > pbinom(q=10, size=20, prob=1/3) [1] Wanneer je niet de linkerstaart, maar de rechterstaart wilt weten: lower.tail = FALSE (10 uitgesloten) > pbinom(q=10, size=20, prob=1/3, lower.tail = FALSE) [1] Dit is dus hetzelfde als > 1 - pbinom(q=10, size=20, prob=1/3) [1]

8 qbinom: het omgekeerde van qbinom P(X B(n, ) q) = p Berekent welke waarde van k een bepaalde kans heeft aan zijn linkerkant. > qbinom(p=0.90, size=20, prob=1/3) [1] De normale verdeling p. 57 X ~ N(, ²) Functie is symmetrisch. pnorm: P(X N(, ²) x ) =? q = x (in 2.5) mean = sd = pas op! In 2.5 gebruikt men ², dus dat moet eerst nog omgerekend worden > pnorm(q=8, mean=10, sd=2) [1] qnorm: P(X N(, ²)? ) = p > qnorm(p=0.5, mean=10, sd=2) [1] De χ²-verdeling p. 59 X 1 N(0,1), X 2 N(0,1),..., X l N(0,1) zijn onafhankelijke standaardnormale variabelen Y = X 1 + X X l χ l Functie is niet symmetrisch. pchisq: P(Y χ 2 x) =? 10 > pchisq(q=5, df=10) [1] qchisq: P(Y χ 2? ) = p 10 > qchisq(p=0.10, df=20) [1] De Student verdeling of t-verdeling p X N(0,1) en Y zijn twee onafhankelijke toevalsvariabelen. χ l X T = t l Y/l Functie is symmetrisch. pt: P(Y t 10 x) =? > pt(q=1.3, df=10) [1] qt: P(Y t 10? ) = p > qt(p=0.15, df=10) [1]

9 5. De F-verdeling p X χ l1 en Y χ l2 zijn twee onafhankelijke toevalsvariabelen. X/l 1 F = Y/l 2 F l1,l 2 Functie is niet symmetrisch. pf: P(Y F 10,3 x) =? > pf(q=2, df1=10, df2=3) [1] qf: P(Y F 10,3? ) = p > qf(p=0.2, df1=10, df2=3) [1] PUNTSCHATTINGEN P. 74 var: om sx 2 te berekenen Uitkomst is dus schatting van de variantie in de populatie, op basis van een steekproef (en niet variantie in de steekproef =snx 2 ) > var(mydata$iq) [1] s 2 = x sn 2 x n 1 n cov: om C OV xy te berekenen Uitkomst is dus schatting van de covariantie in de populatie, op basis van een steekproef (en niet covariantie in de steekproef) > cov(mydata$gewicht, mydata$lengte) [1] TOETSEN VAN HYPOTHESES Toetsen van hypothese betreffende een verwachting p. 97 is onbekend: t-toets voor één steekproef: t.test > t.test(x = mydata$iq, mu = 100, alternative = "greater", conf.level = 0.95) One Sample t-test data: mydata$iq t = , df = 29, p-value = 7.475e-07 alternative hypothesis: true mean is greater than percent confidence interval: Inf sample estimates: mean of x

10 Toetsen van hypothese betreffende twee verwachtingen p. 98 Onafhankelijke steekproeven 1 en 2 zijn gelijk maar onbekend: T-toets voor twee onafhankelijke steekproeven: t-test met var.equal = TRUE > tijdv <- sportdata$tijd[sportdata$geslacht == "V"] > tijdm <- sportdata$tijd[sportdata$geslacht == "M"] > t.test(x=tijdm, y=tijdv, alternative = "two.sided", conf.level = 0.95, var.equal = TRUE) Two Sample t-test data: tijdm and tijdv t = , df = 198, p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y Geen hypothese m.b.t. 1 en 2 Welch t-toets voor twee onafhankelijke steekproeven: t.test met var.equal = FALSE > t.test(x=tijdm, y=tijdv, alternative = "two.sided", conf.level = 0.95, var.equal = FALSE) Welch Two Sample t-test data: tijdm and tijdv t = , df = , p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y Afhankelijke steekproeven p. 102 Gewone one sample t-test, met verschil reeds uitgerekend (D = X 1 - X 2 ) > d <- rijfoutendata$rijfoutenmet - rijfoutendata$rijfoutenzonder > t.test(x=d, mu=0, alternative = "greater", conf.level = 0.95) One Sample t-test data: d t = , df = 39, p-value = alternative hypothesis: true mean is greater than 0 95 percent confidence interval: Inf sample estimates: mean of x 2 of (nog eenvoudiger)

11 paired t-test met paired = TRUE > t.test(x = rijfoutendata$rijfoutenmet, y = rijfoutendata$rijfoutenzonder, alternative = "greater", conf.level = 0.95, paired = TRUE) Paired t-test data: rijfoutendata$rijfoutenmet and rijfoutendata$rijfoutenzonder t = , df = 39, p-value = alternative hypothesis: true difference in means is greater than 0 95 percent confidence interval: Inf sample estimates: mean of the differences 2 Hypothese toetsen betreffende twee varianties p. 104 F-toets: var.test Om te testen of twee varianties identiek zijn. > var.test(x=tijdv, y=tijdm, alternative = "two.sided", conf.level = 0.95) F test to compare two variances data: tijdv and tijdm F = , num df = 105, denom df = 93, p-value = alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances Hypothese toetsen betreffende een proportie - p. 107 Enkel voor binomiale verdelingen. Enkel eenzijdige toets. Exacte binomiale toets: binom.test x = geobserveerde waarde n = aantal herhalingen van het proces p = proportie onder H 0 > binom.test(x=1, n=10, p=0.08, alternative = "greater") Exact binomial test data: 1 and 10 number of successes = 1, number of trials = 10, p-value = alternative hypothesis: true probability of success is greater than percent confidence interval: sample estimates: probability of success 0.1

12 Het toetsen van de normaliteit p. 108 Shapiro-Wilk toets: shapiro.test > shapiro.test(mydata$gewicht) Shapiro-Wilk normality test data: mydata$gewicht W = , p-value = Met de Shapiro-Wilk toets gaan we na of het plausibel is dat de toevalsvariabele gewicht normaal verdeeld is in de populatie, gezien de geobserveelde frequentieverdeling van gewicht in onze steekproef. POWER P. 117 Power bij het toetsen van een hypothese betreffende een proportie p. 117 Power van een exacte binomiale toets berekenen bij het toetsen van een hypothese betreffende een proportie: powerbinom p0 = proportie onder H 0 p1 = proportie onder H 1 > library("exactci") Loading required package: ssanv > powerbinom(n = 10, p0 = 0.08, p1 = 0.15, sig.level = 0.05, alternative = "one.sided") power and sample size for single binomial response n = 10 p0 = 0.08 p1 = 0.15 power = alternative = one.sided sig.level = 0.05 NOTE: use rejections in correct direction only Minimale steekproefgrootte om een power van 0.90 te bekomen? > powerbinom(power = 0.90, p0 = 0.08, p1 = 0.15, sig.level = 0.05, alternative = "one.sided") power and sample size for single binomial response n = 177 p0 = 0.08 p1 = 0.15 power = alternative = one.sided sig.level = 0.05 NOTE: use rejections in correct direction only

13 Power bij het toetsen van een hypothese betreffende een verwachting p. 123 power.t.test delta = onder H 0 - onder H 1 sd = standaarddeviantie s x > power.t.test(n=100, delta=1.5, sd=7.4, sig.level=0.05, alternative = "two.sided", type = "one.sample") One-sample t test power calculation n = 100 delta = 1.5 sd = 7.4 sig.level = 0.05 power = alternative = two.sided Power bij het toetsen van een hypothese betreffende twee verwachtingen afhankelijke steekproeven p. 126 Paired t test power calculation: power.t.test met type = paired > power.t.test(n=40, delta=3, sd=sd, sig.level = 0.05, alternative = "one.sided", type = "paired") Paired t test power calculation n = 40 delta = 3 sd = sig.level = 0.05 power = alternative = one.sided NOTE: n is number of *pairs*, sd is std.dev. of *differences* within pairs Power bij het toetsen van een hypothese betreffende twee verwachtingen onafhankelijke steekproeven p. 128 T-toets voor twee onafhankelijke steekproeven: t-test met var.equal = TRUE Voorwaarde: 1 = 2 Zie pg. 8 Relevant verschil zoeken en specifieke alternatieve hypothese opstellen. Wat is de power van de toets onder die specifieke alternatieve hypothese? pwr.t2n.test 1 2 d = schatting van de effectgrootte = spooled > library("pwr") > pwr.t2n.test(n1=length(con), n2=length(exp), d=1/2.1, sig.level = 0.05, alternative = "greater") t test power calculation n1 = 56 n2 = 119

14 d = sig.level = 0.05 power = alternative = greater Indien we twee steekproeven met dezelfde grootte willen trekken en we willen n weten: type = two.sample : > power.t.test(delta=1, sd=2.1, power = 0.95, sig.level = 0.05, alternative = "one.sided", type = "two.sample") Two-sample t test power calculation n = delta = 1 sd = 2.1 sig.level = 0.05 power = 0.95 alternative = one.sided NOTE: n is number in *each* group Power van de toets van H 0 : β 1 = 0 p. 157 Bij lineaire regressie. pwr.r.test r = waarde van de correlatiecoëfficient die je went te kunnen detecteren met een hoge kans > pwr.r.test(n=252, r= , sig.level=0.05) approximate correlation power calculation (arctangh transformation) n = 252 r = sig.level = 0.05 power = alternative = two.sided Om de power van een ANOVA test te berekenen p. 183 pwr.anova.test k = aantal groepen n = aantal individuen in elke groep f = effectgrootte f > pwr.anova.test(k=3, n=99, f= , sig.level=0.05) Balanced one-way analysis of variance power calculation k = 3 n = 99 f = sig.level = 0.05 power = NOTE: n is number in each group

15 DE FUNCTIE lm P. 146 Je gebruikt het argument formula om te zeggen welke variabelen je wilt analyseren. Lm(formula = afhankelijke variabele Y onafhankelijke variabele X) > lm(formula = gezondheid$uitgaven ~ gezondheid$duur) Call: lm(formula = gezondheid$uitgaven ~ gezondheid$duur) Coefficients: (Intercept) gezondheid$duur Regressielijn: (Intercept) = b 0 gezondheid$duur= b 1 De output is beperkt, maar achter de schermen heeft R veel andere dingen berekend. Om de uitkomst van die berekeningen te kunnen raadplegen, moet je een naam toekennen aan het resultaat van de berekeningen: > mylm <- lm(formula = gezondheid$uitgaven ~ gezondheid$duur) Om de schattingen van β 0 en β 1 op te vragen: coef > coef(mylm) (Intercept) gezondheid$duur Om de predicties y i op te vragen: fitted > fitted(mylm) Om de residuen op te vragen: residuals > residuals(mylm) Betrouwbaarheidsintervallen voor β 0 en β 1 : confint > confint(mylm, level = 0.95) 2.5 % 97.5 % (Intercept) gezondheid$duur

16 De R functie summary - p. 155 Informatie over de residuen, β 0 en β 1, modelselectie. en de standaard en aangepaste R² en resultaat van de > mylm <- lm(formula = gezondheid$uitgaven ~ gezondheid$duur) > summary(mylm) Call: lm(formula = gezondheid$uitgaven ~ gezondheid$duur) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <2e-16 *** gezondheid$duur <2e-16 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 250 degrees of freedom Multiple R-squared: 0.237, Adjusted R-squared: F-statistic: on 1 and 250 DF, p-value: < 2.2e-16 Meervoudige lineaire regressie p. 160 Om een meervoudig lineair model te toetsen: Lm(formula = [afhankelijke variabele] [lijst van de onafhankelijke variabelen, gescheiden door een +]) > mylm <- lm(formula = mydata$score ~ mydata$iq + mydata$gewicht) > summary(mylm) Call: lm(formula = mydata$score ~ mydata$iq + mydata$gewicht) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) * = β 0 mydata$iq = β 1 mydata$gewicht = β Signif. codes: 0 *** ** 0.01 * Residual standard error: 5.29 on 27 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 2 and 27 DF, p-value:

17 DE FUNCTIE aggregate P. 169 De personen in het data frame microbusiness zijn onderverdeeld in drie groepen: GeenMB, MBMetSteun en MBZonderSteun. > head(microbusiness) groep inkomenwijziging 1 GeenMB GeenMB GeenMB GeenMB GeenMB MBMetSteun Om gemiddelde van elke groep te berekenen: FUN = mean > aggregate(formula=microbusiness$inkomenwijziging ~ microbusiness$groep, FUN = mean) microbusiness$groep microbusiness$inkomenwijziging 1 GeenMB MBMetSteun MBZonderSteun 6455 Om schatting van de variantie te berekenen: FUN = var Om mediaan te berekenen: FUN = median DE FUNCTIE aov P.181 Om alle berekeningen m.b.t. de ANOVA in één keer uit te voeren. Net zoals bij de functie lm, berekent aov heel veel achter de schermen, maar je ziet ze niet allemaal. Je gebruikt het argument formula om R te zeggen welke variabelen je wil analyseren: > aov(formula = microbusiness$inkomenwijziging ~ microbusiness$groep) Call: aov(formula = microbusiness$inkomenwijziging ~ microbusiness$groep) Terms: microbusiness$groep Residuals Sum of Squares Deg. of Freedom Residual standard error: Estimated effects may be unbalanced Summary(myAOV) p. 182 > myaov <- aov(formula = microbusiness$inkomenwijziging ~ microbusiness$groep) > summary(myaov) Df Sum Sq Mean Sq F value Pr(>F) microbusiness$groep e Residuals e

18 POST HOC MEERVOUDIGE VERGELIJKINGEN P. 186 Pairwise.t.test om de techniek van de meervoudige vergelijkingen te gebruiken. Het aantal paarsgewijze vergelijkingen is 6, maar in plaats van 6 t-toetsen uit te voeren gebruiken we de functie pairwise.t.test die alle vergelijkingen in één keer doet. > pairwise.t.test(depressie$reactietijd, depressie$behandeling, p.adj = "bonf") Pairwise comparisons using t tests with pooled SD data: depressie$reactietijd and depressie$behandeling A B C B C 1.0e e-05 - D P value adjustment method: bonferroni ENKELVOUDIGE VARIANTIE-ANALYSE ALS EEN LINEAIR MODEL P. 194 Als we een variantie-analyse willen uitvoeren met behulp van lineaire regressie hoeven we eigenlijk niet zelf de hulpveranderlijken te definiëren. R doet het allemaal voor ons. Als we het commando lm(formula = depressie$reactietijd ~ depressie$behandeling) typen dan gaat R zien dat behandeling een factor is en R gaat dus automatisch hulpveranderlijken definieren. R gaat ervan uit dat je de GLM-restrictie wenst te gebruiken, met het eerste niveau als referentie, en R gaat dus Dummy-codering gebruiken, ook met het eerste niveau als referentie. > myaov <- lm(formula = depressie$reactietijd ~ depressie$behandeling) > summary(myaov) Call: lm(formula = depressie$reactietijd ~ depressie$behandeling) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** depressie$behandelingb * depressie$behandelingc e-08 *** depressie$behandelingd ** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 33 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 33 DF, p-value: 1.674e-07

19 PEARSON S CHI-SQUARED TEST P. 203 Om de Pearson s chi-squared test in een keer uit te voeren: chisq.test x = een tabel met de geobserveerde frequenties p = een vector met theoretische proporties > kans <- c(1/6, 1/6, 1/6, 1/6, 1/6, 1/6) > chisq.test(x=table(dobbelsteen), p=kans) Chi-squared test for given probabilities data: table(dobbelsteen) X-squared = 6.2, df = 5, p-value = EFFECTGROOTTE W P. 206 ES.w1 Staat in package pwr > dagen <- c(387,395,62,392,62,62,62,404) > kans <- dagen/sum(dagen) > kans1 <- c(0.26, 0.18, 0.01, 0.18, 0.01, 0.01, 0.08, 0.27) > library("pwr") > ES.w1(P0 = kans, P1 = kans1) [1]

Statistiek II. Sessie 4. Feedback Deel 4

Statistiek II. Sessie 4. Feedback Deel 4 Statistiek II Sessie 4 Feedback Deel 4 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 4 We hebben besloten de bekomen grafieken in R niet in het document in te voegen, dit omdat het document met

Nadere informatie

Statistiek II. Sessie 2. Verzamelde vragen en feedback Deel 2

Statistiek II. Sessie 2. Verzamelde vragen en feedback Deel 2 Statistiek II Sessie 2 Verzamelde vragen en feedback Deel 2 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 2 We hebben besloten de bekomen grafieken in R niet in het document in te voegen, dit omdat

Nadere informatie

Statistiek II. Sessie 6. Feedback Deel 6

Statistiek II. Sessie 6. Feedback Deel 6 Statistiek II Sessie 6 Feedback Deel 6 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 6 We hebben besloten de bekomen grafieken in R niet in het document in te voegen, dit omdat het document met

Nadere informatie

Samenvatting Statistiek II Studiejaar Mathilde Dieleman. Samenvatting statistiek II. Auteur: Mathilde Dieleman Studiejaar:

Samenvatting Statistiek II Studiejaar Mathilde Dieleman. Samenvatting statistiek II. Auteur: Mathilde Dieleman Studiejaar: Samenvatting statistiek II Auteur: Mathilde Dieleman Studiejaar: 2017 2018 Inhoudsopgave Hoofdstuk 2: Beschrijvende statistiek... 1 2.1.1 Centrummaten (pag. 31)... 1 2.2.2 Spreidingsmaten (pag. 34)...

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 7 juni 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

G0N11C Statistiek & data-analyse Project tweede zittijd

G0N11C Statistiek & data-analyse Project tweede zittijd G0N11C Statistiek & data-analyse Project tweede zittijd 2014-2015 Naam : Raimondi Michael Studierichting : Biologie Gebruik deze Word-template om een antwoord te geven op onderstaande onderzoeksvragen.

Nadere informatie

Statistiek in HBO scripties

Statistiek in HBO scripties Statistiek in HBO scripties Wim Krijnen Lector Analyse Technieken voor Praktijkonderzoek Lectoraat Transparante Zorgverlening Hanze University of Applied Sciences January 29, 2015 Wim Krijnen Lector Analyse

Nadere informatie

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30 Faculteit der Wiskunde en Informatica 2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30 Opgave 1: (5 x 6 = 30 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 1 noodzakelijk)

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Statistiek II. Sessie 5. Feedback Deel 5

Statistiek II. Sessie 5. Feedback Deel 5 Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

4 Domein STATISTIEK - versie 1.2

4 Domein STATISTIEK - versie 1.2 USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

Faculteit der Wiskunde en Informatica

Faculteit der Wiskunde en Informatica Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4), op woensdag 7 januari 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

Opgave 1: (zowel 2DM40 als 2S390)

Opgave 1: (zowel 2DM40 als 2S390) TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4 en S39) op donderdag, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op maandag 5 januari 29 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

Antwoordvel Versie A

Antwoordvel Versie A Antwoordvel Versie A Interimtoets Toegepaste Biostatistiek 13 december 013 Naam:... Studentnummer:...... Antwoorden: Vraag Antwoord Antwoord Antwoord Vraag Vraag A B C D A B C D A B C D 1 10 19 11 0 3

Nadere informatie

Gebruik van Correlatiecoëfficiënt in onderzoek

Gebruik van Correlatiecoëfficiënt in onderzoek Gebruik van Correlatiecoëfficiënt in onderzoek Wim Krijnen Lector Analyse Technieken voor Praktijkonderzoek Lectoraat Healthy Ageing, Allied Health Care and Nursing Hanze University of Applied Sciences

Nadere informatie

Hoofdstuk 1: Prolegomena en Data Manipulatie

Hoofdstuk 1: Prolegomena en Data Manipulatie HOOFDSTUK EXTRA Hoofdstuk 1: Prolegomena en Data Manipulatie 1.1: PROLEGOMENA - Statistiek, psychometrie en methodologie Psychometrie: bepaalt hoe de variabelen het best gemeten kunnen worden (vb attitude

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4 en 2S39) op maandag 2--27, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Voorblad bij tentamen

Voorblad bij tentamen Studentnaam: Studentnummer: Voorblad bij tentamen (in te vullen door de examinator) Vaknaam:Biostatistiek en Lineaire Algebra Vakcode: 2DM81 Datum: Begintijd:13.30 Eindtijd: 16.30 Aantal pagina s:2 voor

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4) woensdag 8 oktober 9, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven Statistisch

Nadere informatie

Feedback examen Statistiek II Juni 2011

Feedback examen Statistiek II Juni 2011 Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN Interim Toegepaste Biostatistiek deel december 2009 Versie A ANTWOORDEN C 2 B C A 5 C 6 B 7 B 8 B 9 D 0 D C 2 A B A 5 C Lever zowel het antwoordformulier als de interim toets in Versie A 2. Dit tentamen

Nadere informatie

Statistiek II. Feedbackbundel. Feedback Deel 7

Statistiek II. Feedbackbundel. Feedback Deel 7 Statistiek II Feedbackbundel Feedback Deel 7 VPPK Universiteit Gent 2017-2018 Feedback Q & A Oefensessie 2 Extra informatie - Power De power (kans dat we H 0 verwerpen indien deze fout is) is het paarse

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking Opdracht 9a ----------- t-procedures voor een enkelvoudige steekproef Voor de meting van de leesvaardigheid van kinderen wordt als toets de Degree of Reading Power (DRP) gebruikt. In een onderzoek onder

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid 65 56 83 68 64 47 59 63 93 65 75 68 68 51

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid 65 56 83 68 64 47 59 63 93 65 75 68 68 51 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 7 1. Een onderzoeker wil nagaan of de fitheid van jongeren tussen 14 en 18 jaar (laag, matig, hoog) en het geslacht (M, V) een

Nadere informatie

Feedback proefexamen Statistiek I 2009 2010

Feedback proefexamen Statistiek I 2009 2010 Feedback proefexamen Statistiek I 2009 2010 Het correcte antwoord wordt aangeduid door een sterretje. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Een derde van de mannen is

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op dinsdag 5-03-2005, 9.00-22.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 27 oktober 2010, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 27 oktober 2010, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4) woensdag 27 oktober 2, 9.-2. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

H7: Analysis of variance

H7: Analysis of variance H7: Analysis of variance Lieven Clement Statistiek: 2 de bach. in de Biochemie en Biotechnologie, Biologie, Biomedische Wetenschappen, en de Chemie statomics, Krijgslaan 281 (S9), Gent, Belgium lieven.clement@ugent.be

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2 Vraag 1. Voor welk van de onderstaande variabelen zal een placebo effect waarschijnlijk het grootst zijn? 1. Haarlengte. 2. Lichaamstemperatuur. 3. Mate van tevredenheid met de behandeling. 4. Hemoglobinegehalte

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

toetskeuze schema verschillen in gemiddelden

toetskeuze schema verschillen in gemiddelden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets week 5: het toetsen van

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

Eindtoets Toegepaste Biostatistiek

Eindtoets Toegepaste Biostatistiek Eindtoets Toegepaste Biostatistiek 2013-2014 29 januari 2014 Dit tentamen bestaat uit vier opgaven, onderverdeeld in 24 subvragen. Begin bij het maken van een nieuwe opgave steeds op een nieuw antwoordvel.

Nadere informatie

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28 Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische

Nadere informatie

Introductie tot de statistiek

Introductie tot de statistiek Introductie tot de statistiek Hogeschool Gent 04/05/2010 Inhoudsopgave 1 Basisbegrippen en beschrijvende statistiek 8 1.1 Onderzoek............................ 8 1.1.1 Data........................... 8

Nadere informatie

Toegepaste Biostatistiek CAST oefeningen 1

Toegepaste Biostatistiek CAST oefeningen 1 Toegepaste Biostatistiek CAST oefeningen 1 CAST Exercises CAST is een gratis online e-book (eigenlijk 3 e-books), met oefeningen. De link voor de site (http://cast.massey.ac.nz/collection_public.html)

Nadere informatie

KANSREKENEN EN VERDELINGEN REEKS 1

KANSREKENEN EN VERDELINGEN REEKS 1 KANSREKENEN EN VERDELINGEN REEKS 1 Moeilijkere oefeningen zijn aangegeven met een gevarendriehoek Niet elke regel met R-code zal je kunnen/moeten gebruiken Versie 18/07/2019 1. Verdelingsfunctie Het aantal

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek II voor TeMa (2S195) op maandag 8-5-26, 9.-12. uur Bij het tentamen mag gebruik worden gemaakt van een (grafisch)

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen Cursus Statistiek 2 Fellowonderwijs Opleiding Intensive Care UMC St Radboud, Nijmegen Cursus Statistiek 2 Steekproefgrootte en power berekening Vergelijken van gemiddelden (T-testen) Niet-parametrische

Nadere informatie

Uitvoer van analyses (SPSS 16) voor het Faalfeedback en Oriëntatie voorbeeld in hoofdstuk 7 (Herhaalde metingen) >

Uitvoer van analyses (SPSS 16) voor het Faalfeedback en Oriëntatie voorbeeld in hoofdstuk 7 (Herhaalde metingen) > Uitvoer van analyses (SPSS 6) voor het aalfeedback en Oriëntatie voorbeeld in hoofdstuk 7 (Herhaalde metingen) > ** Berekening van lineaire en kwadratische trendvariabele. Compute ylin = -.77678 * y +

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Onderzoek. B-cluster BBB-OND2B.2

Onderzoek. B-cluster BBB-OND2B.2 Onderzoek B-cluster BBB-OND2B.2 Succes met leren Leuk dat je onze bundels hebt gedownload. Met deze bundels hopen we dat het leren een stuk makkelijker wordt. We proberen de beste samenvattingen voor jou

Nadere informatie

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt A. Effect & het onderscheidingsvermogen Effectgrootte (ES) De effectgrootte (effect size) vertelt ons iets over hoe relevant de relatie tussen twee variabelen is in de praktijk. Er zijn twee soorten effectgrootten:

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) dinsdag 2-08-2003, 4.00-7.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine,

Nadere informatie

werkcollege 6 - D&P9: Estimation Using a Single Sample

werkcollege 6 - D&P9: Estimation Using a Single Sample cursus 9 mei 2012 werkcollege 6 - D&P9: Estimation Using a Single Sample van frequentie naar dichtheid we bepalen frequenties van meetwaarden plot in histogram delen door totaal aantal meetwaarden > fracties

Nadere informatie

Hoofdvraag. Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ?

Hoofdvraag. Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ? Hoofdvraag Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ? Data visualisatie (Grafieken, dashboards); Kwantitatieve analyse (cijfers, statistiek); Software Inzichten

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) Avondopleiding. donderdag 6-6-3, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op donderdag 0-03-2005, 4.00-7.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine,

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door

Nadere informatie

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen? Opdracht 15a ------------ Spearman rangcorrelatie coefficient (non-parametrische tegenhanger van de Pearson correlatie coefficient) Wilcoxon symmetrie-toets (non-parametrische tegenhanger van de t-procedure

Nadere informatie

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de

Nadere informatie

Voorblad bij tentamen

Voorblad bij tentamen Studentnaam: Studentnummer: Voorblad bij tentamen (in te vullen door de examinator) Vaknaam:Biostatistiek & Lineaire Algebra Vakcode: DM80 Datum: 14-4-015 Begintijd:13.30 Eindtijd: 16.30 Aantal pagina

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

laboratory for industrial mathematics eindhoven Endinet Regressie-analyse Energiekamer

laboratory for industrial mathematics eindhoven Endinet Regressie-analyse Energiekamer Endinet Regressie-analyse Energiekamer Laboratory for Industrial Mathematics Eindhoven Postbus 513 5600 MB Eindhoven tel.: 040 247 4875 fax: 040 244 2489 e-mail: lime@tue.nl WWW: http://www.lime.tue.nl

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie? Opdracht 13a ------------ Een-factor ANOVA (ANOVA-tabel, Contrasten, Bonferroni) Bij een onderzoek naar de leesvaardigheid bij kinderen in de V.S. werden drie onderwijsmethoden met elkaar vergeleken. Verschillende

Nadere informatie

werkcollege 6 - D&P10: Hypothesis testing using a single sample

werkcollege 6 - D&P10: Hypothesis testing using a single sample cursus huiswerk opgaven Ch.9: 1, 8, 11, 12, 20, 26, 36, 37, 71 werkcollege 6 - D&P10: Hypothesis testing using a single sample Activities 9.3 en 9.4 van schatting naar toetsing vorige bijeenkomst: populatie-kenmerk

Nadere informatie

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. 1. (a) In de appendix van deze vraag, is een dataset gegeven met de corresponderende

Nadere informatie

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf. Opdracht 10a ------------ t-procedures voor gekoppelde paren t-procedures voor twee onafhankelijke steekproeven samengestelde t-procedures voor twee onafhankelijke steekproeven Twee groepen van 10 leraren

Nadere informatie

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 ANOVA in SPSS Hugo Quené hugo.quene@let.uu.nl opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 1 vooraf In dit voorbeeld gebruik ik fictieve gegevens, ontleend aan

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op vrijdag 29-04-2004, 9-2 uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Oplossingen hoofdstuk XI

Oplossingen hoofdstuk XI Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij

Nadere informatie

Formules Excel Bedrijfsstatistiek

Formules Excel Bedrijfsstatistiek Formules Excel Bedrijfsstatistiek Hoofdstuk 2 Data en hun voorstelling AANTAL.ALS vb: AANTAL.ALS(A1 :B6,H1) Telt hoeveel keer (frequentie) de waarde die in H1 zit in A1:B6 voorkomt. Vooral bedoeld voor

Nadere informatie

Les 1: de normale distributie

Les 1: de normale distributie Les 1: de normale distributie Elke Debrie 1 Statistiek 2 e Bachelor in de Biomedische Wetenschappen 18 oktober 2018 1 Met dank aan Koen Van den Berge Indeling lessen Elke bullet point is een week. R en

Nadere informatie

11. Meerdere gemiddelden vergelijken, ANOVA

11. Meerdere gemiddelden vergelijken, ANOVA 11. Meerdere gemiddelden vergelijken, ANOVA Analyse van variantie (ANOVA) wordt gebruikt wanneer er situaties zijn waarbij er meer dan twee condities vergeleken worden. In dit hoofdstuk wordt de onafhankelijke

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Inleiding Applicatie Software - Statgraphics

Inleiding Applicatie Software - Statgraphics Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een

Nadere informatie

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Moore, McCabe & Craig: 3.3 Toward Statistical Inference From Probability to Inference 5.1 Sampling Distributions for

Nadere informatie

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE DEEL 3 INDUCTIEVE STATISTIEK INHOUD H 10: INLEIDING TOT DE INDUCTIEVE STATISTIEK H 11: PUNTSCHATTING 11.1 ALGEMEEN 11.1.1 Definities 11.1.2 Eigenschappen 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE 11.3

Nadere informatie

Verband tussen twee variabelen

Verband tussen twee variabelen Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en

Nadere informatie

Enkelvoudige lineaire regressie

Enkelvoudige lineaire regressie Enkelvoudige lineaire regressie Inleiding Dit hoofdstuk sluit aan op hoofdstuk I-9 van het statistiekboek. Er wordt hier steeds gesproken over het verband tussen één afhankelijke variabele Y en één onafhankelijke

Nadere informatie

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen. Oplossingen hoofdstuk IX 1. Bestaat er een verband tussen het geslacht en het voorkomen van dyslexie? Uit een aselecte steekproef van 00 leerlingen (waarvan 50% jongens en 50% meisjes) uit het basisonderwijs

Nadere informatie

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een klein kapitaaltje

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

Residual Plot for Strength. predicted Strength

Residual Plot for Strength. predicted Strength Uitwerking tentamen DS mei 4 Opgave Een uitwerking geven is hier niet mogelijk. Het is van belang het iteratieve optimaliseringsproces goed uit te voeren (zie ook de PowerPoint sheets): screening design

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur. VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT

Nadere informatie

Technische appendix bij DNBulletin Voor lagere werkloosheid is meer economische groei nodig. Variable Coefficient Std. Error t-statistic Prob.

Technische appendix bij DNBulletin Voor lagere werkloosheid is meer economische groei nodig. Variable Coefficient Std. Error t-statistic Prob. Technische appendix bij DNBulletin Voor lagere werkloosheid is meer economische groei nodig Schatting Okun s law; Nederland, periode 1979-2017 Variabelen Afhankelijke variabele UD= jaar op jaarmutatie

Nadere informatie

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data An Carbonez Leuven Statistics Research Centre Katholieke Universiteit Leuven Voorstelling van de

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2S390) op maandag 19-11-2001, 14.00-17.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie