Introductie tot de statistiek

Maat: px
Weergave met pagina beginnen:

Download "Introductie tot de statistiek"

Transcriptie

1 Introductie tot de statistiek Hogeschool Gent 04/05/2010

2 Inhoudsopgave 1 Basisbegrippen en beschrijvende statistiek Onderzoek Data Variabelen Meetniveau Beschrijvende technieken: 1 variabele Ordeningstechnieken Reductietechnieken Beschrijvende technieken: associatiematen Visualisatie Histogram Boxplot /77

3 2 Toevalsvariabelen en kansverdelingen Toevalsvariabelen Toevalsproces en gebeurtenis Toevalsvariabele Kansen Kansverdeling Discrete kansverdeling Continue kansverdeling Verwachting Variantie Kansverdelingen Binomiaal verdeling Normaalverdeling Standaardnormaalverdeling t-verdeling χ 2 -verdeling F-verdeling /77

4 3 Statistische Inferentie: toetsen en schatten De steekproevenverdeling De steekproevenverdeling voor X De steekproevenverdeling voor X (σ 2 ongekend) Intervalschatting Puntschatting Het betrouwbaarheidsinterval Opstellen van betrouwbaarheidsinterval Toetsen van hypotheses Nulhypothese Toetsingsgrootheid G Kies betrouwbaarheid (1 α) H 0 aanvaarden of verwerpen H 0 aanvaarden of verwerpen met p-waarde Toetsen van hypotheses One-sample t-test two-sample t-test /77

5 3.6.3 One-way analysis of variance (Anova) Categorische data-analyse Inleiding Categorische variabele Categorische variabele met 2 niveaus Categorische variabele met J 2 niveaus Categorische variabelen Wegs kruistabel: geobserveerde frequenties Test voor onafhankelijke variabelen Veralgemeend lineaire modellen Logistische regressie Poisson regressie Loglineaire analyse /77

6 5 Enkelvoudige Lineaire Regressie Inleiding doel Vergelijking van een rechte Het regressiemodel Structuur assumpties Onderzoeksvragen Parameters Toetsen van hypotheses De determinatiecoëfficiënt R Meervoudige Lineaire Regressie Structuur Onderzoeksvragen Parameters Toetsen van hypotheses /77

7 6.5 De determinatiecoëfficiënt R /77

8 1 Basisbegrippen en beschrijvende statistiek 1.1 Onderzoek Data verzamelen in een specifieke steekproef, representatief voor de populatie Data Data: p variabelen bij n observaties. Voorbeeld: 8/77

9 score iq motivatie geslacht werken M Neen V Ja M Ja V Neen M Neen V Neen M Ja V Neen V Neen V Neen 9/77

10 1.1.2 Variabelen Eigenschap die varieert: X scores zijn geobserveerde waarden van een variabele: x, vb. x 2 = Meetniveau Categorische variabelen: nominaal of ordinaal (vb geslacht) Continue variabelen: minstens interval niveau (vb iq) Opm. Likert-schaal: ordinaal, maar als continue beschouwd. 10/77

11 1.2 Beschrijvende technieken: 1 variabele Ordeningstechnieken frequentietabel relatieve frequentieverdeling geslacht geslacht freq. M 4 V 6 rel. freq. M 0.4 V /77

12 gegroepeerde frequentieverdeling score freq Reductietechnieken Maten van centrale tendentie 1. modus (mo x ): waarde met grootste frequentie (vb iq: 125) 2. mediaan: percentiel 50 (md x = P 50 ) (vb iq: 127.5) n 3. rekenkundig gemiddelde: x = 1 n x i vb x = = 12 i=1 12/77

13 Maten van spreiding 1. variatie of Sum of Squares: SS = n (x i x) 2 2. variantie: s 2 x = 1 n n (x i x) 2 i=1 i=1 vb s 2 x = (16 12)2 +(10 12) 2 +(11 12) (10 12) 2 10 = standaarddeviatie: s x = s 2 x vb s x = 9.2 = /77

14 1.3 Beschrijvende technieken: associatiematen 1. covariantie: lineaire samenhang n Cov x,y = 1 n (x i x)(y i ȳ) i=1 vb score en iq: Cov(x, y) = = correlatie: normaliseren van covariantie Cor x,y = r xy = Cov(x,y) sxs y vb score en iq: r xy = /77

15 15/77

16 1.4 Visualisatie Histogram X = [1, 10] 16/77

17 1.4.2 Boxplot min Q1 Q2 Q3 max min Q1: 25% van de observaties box: 50% van de observaties Q3 max: 25% van de observaties 17/77

18 Voorbeeld: X N(10, 1) 18/77

19 Voorbeeld: X F (1, 15) 19/77

20 Voorbeeld: X 1 N(10, 1),X 2 U(min(X 1 ), max(x 2 )) 20/77

21 2 Toevalsvariabelen en kansverdelingen 2.1 Toevalsvariabelen Toevalsproces en gebeurtenis toevalsproces: uitkomst is onvoorspelbaar Kop of munt gooien IQ meten bij een random gekozen persoon Gebeurtenis: deelverzameling van mogelijke uitkomsten voor een toevalsproces. Kop of munt gooien: {munt} IQ meten: meer dan /77

22 2.1.2 Toevalsvariabele Een toevalsvariabele of kansvariabele is een variabele waarvan de waarde in een toevalsproces onvoorspelbaar is. De kansvariabele score 2.2 Kansen De kans van een gebeurtenis A bij een toevalsproces wordt gedefiniëerd als de relatieve frequentie van deze gebeurtenis als we het toevalsproces oneindig veel keer zouden herhalen. P (A) = lim n f An 22/77

23 2.3 Kansverdeling Discrete kansverdeling Een toevalsvariabele is discreet indien de mogelijke waarden die de variabele kan aannemen een eindig (of telbaar) aantal vormen. vb ogen dobbelsteen, geslacht. De kansverdeling van een discrete kansvariabele geeft voor elke mogelijke waarde x i de kans aan dat deze waarde voorkomt: f X (x i ) = f(x i ) = P [X = x i ] 23/77

24 Voorbeeld: ogen dobbelsteen Ogen f(x i ) F (x i ) 1 1/6 1/6 2 1/6 2/6 3 1/6 3/6 4 1/6 4/6 5 1/6 5/6 6 1/6 6/6 De cumulatieve verdelingsfunctie F X (x i ) drukt de kans uit dat de waarde van de toevalsvariabele X in een toevalsproces kleiner is of gelijk aan x: F X (x i ) = P (X x i ) = x x i f(x i ) 24/77

25 2.3.2 Continue kansverdeling De kansverdeling bestaat niet: P [X = x] = 0. Daarom Kansdichheidsfunctie: 1. P [a x b] = b a f(x)dx 2. f(x) 0 voor alle x 3. f(x)dx = 1 De cumulatieve verdelingsfunctie: F X (x) = P (X x) = x f(t)dt Voorbeeld: De kans dat iemand kleiner of gelijk aan 80kg weegt: P (X 80) = /77

26 2.4 Verwachting Het gemiddelde van een toevalsvariabele X wordt de verwachting genoemd, E(X) of µ X. Discreet: E(X) = x i f(x i ) voorbeeld dobbelsteen: E(X) = 1/6(1) + 1/6(2) /6(6) = 3.5 Continue: E(X) = + xf(x)dx Eigenschappen: 1. E(a) = a 2. E(aX) = ae(x) 3. E(a + X) = a + E(X) 4. E(X ± Y ± Z) = E(X) ± E(Y ) ± E(Z) 5. X en Y onafhankelijk: E(XY ) = E(X)E(Y ) 26/77

27 2.5 Variantie De mate van spreiding van de verdeling van een kansvariabele X noemt men de variantie van X, Var(X) of σ 2 X. V ar(x) = E[X E(X)] 2 Eigenschappen: 1. V ar(a + X) = V ar(x) 2. V ar(ax) = a 2 V ar(x) 3. V ar(a) = 0 4. X en Y onafhankelijk: V ar(x ± Y ) = V ar(x) + V ar(y ) 5. X en Y afhankelijk: V ar(x ± Y ) = V ar(x) + V ar(y ) ± 2Cov(X, Y ) 27/77

28 2.6 Kansverdelingen Binomiaal verdeling X Binom(n, π) Kansverdeling: f(x) = ( ) n n! met = x!(n x)! x E(X) = nπ V ar(x) = nπ(1 π) ( n x ) π x (1 π) n x 28/77

29 29/77

30 2.6.2 Normaalverdeling X N(µ, σ 2 ) 1 f(x) = (2π) 1/2 σ exp{ 1 (x µ) 2 2 σ } 2 E(X) = µ V ar(x) = σ Standaardnormaalverdeling φ(x) N(0, 1) z = X µ σ 30/77

31 2.6.4 t-verdeling X t(ν) ν = aantal vrijheidsgraden χ 2 -verdeling X χ 2 (ν) ν = aantal vrijheidsgraden som van ν onafhankelijke gekwadrateerde z-scores 31/77

32 2.6.6 F-verdeling X F (ν 1, ν 2 ) ν 1 en ν 2 = vrijheidsgraden gebaseerd op ratio van twee χ 2 -verdelingen 32/77

33 3 Statistische Inferentie: toetsen en schatten 3.1 De steekproevenverdeling Hypotheses: betrekking op onbekende parameters van de populatie Statistiek of steekproefgrootheid: maat gebaseerd op de gegevens van de steekproef: S = f(x 1, X 2, X 3,..., X n ) Puntschatting: Gegeven S, schatten van parameter in de populatie? Intervalschatting: betrouwbaarheidsinterval Toetsen: geldigheid hypothese in de populatie? Steekproevenverdeling: verdeling van S 1, S 2,..., S n Standaardfout: op basis van steekproevenverdeling 33/77

34 Voorbeeld: n = 40, µ = 12, sd = 3 X = ˆµ = 12.00, ˆσ = /77

35 3.2 De steekproevenverdeling voor X Om de steekproevenverdeling voor X af te leiden doen we beroep op de centrale limietstelling. Gegeven n kansvariabelen X 1, X 2,..., X n allen onafhankelijk en afkomstig van dezelfde (willekeurige) verdeling met gemiddelde µ en variantie 0 < σ 2 < Stel: S n = X 1 + X 2 + X X n Indien n dan is S n normaal verdeeld met E(S n ) = nµ en V ar(s n ) = nσ 2 35/77

36 Gevolg 1: Stel X = S n n = X1+X2+X3+...+Xn n Indien n dan is X normaal verdeeld met E( X) = µ en V ar( X) = σ 2 /n Opmerkingen: Normaalverdeling goede benadering: Vanaf n > 30 Indien n 30 en oorspronkelijke scores zijn normaal verdeeld Voorbeeld: Geobserveerde steekproefgemiddelde X = σ standaardafwijking of standaardfout: 2 n = 9 40 = /77

37 Gevolg 2: Stel Z X = q X µ σ 2 n Indien n dan is Z X standaardnormaal verdeeld met E(Z X) = 0 en V ar(z X) = De steekproevenverdeling voor X (σ 2 ongekend) Vervangen van σ 2 door steekproefschatter s 2 in Z X = q X µ σ 2 n dan: t = q X µ s 2 n t t(ν) met ν = n 1 37/77

38 3.4 Intervalschatting Puntschatting De geschatte waarde ˆθ weerspiegelt: 1. de waarde θ in de populatie 2. de steekproeffout ε: ˆθ = θ + ε Het betrouwbaarheidsinterval Hoe smaller, hoe nauwkeurig de schatting Confidentie niveau: 100(1 α)%, met α = 0.05, α = 0.01 of... 38/77

39 3.4.3 Opstellen van betrouwbaarheidsinterval 1. Trek random steekproef 2. Puntschatting θ: ˆθ 3. Berekenen onder- en bovengrens: ondergrens = ˆθ ( g α/2 1 s) bovengrens = ˆθ + ( g α/2 1 s) % van de intervallen zal θ bevatten 39/77

40 3.5 Toetsen van hypotheses Nulhypothese Is populatieparameter θ gelijk aan vooropgestelde waarde θ 0? H 0 is de hypothese die effectief getoets wordt: H 0 : µ = 110 H a is de alternatieve hypothese: 1. tweezijdig: H a : µ linkszijdig: H a : µ < rechtszijdig: H a : µ > /77

41 3.5.2 Toetsingsgrootheid G 1. Verdeling G theoretische verdeling vb t, F, Verdeling van G onder de assumptie dat H 0 waar is Kies betrouwbaarheid (1 α) 1 α: conditionele kans om H 0 te aanvaarden op voorwaarde dat H 0 juist is α: significantieniveau is de conditionele kans om de nulhypothese te verwerpen op voorwaarde dat de nulhypothese juist is. 41/77

42 3.5.4 H 0 aanvaarden of verwerpen Tweezijdig toetsen: Bepaal kritische waarden g α/2 1 en g α/2 2 : P (G g α/2 1 ) = α/2 en P (G g α/2 2 ) = α/2 aanvaardingsgebied: g α/2 1 G g α/2 2 kritisch gebied: gebied buiten deze twee waarden 42/77

43 43/77

44 Eenzijdig toetsen: Bepaal kritische waarde g α : P (G g α ) = α OF P (G g α ) = α 44/77

45 45/77

46 3.5.5 H 0 aanvaarden of verwerpen met p-waarde Bereken kans dat onder de verdeling van G onder H 0 dat g of een waarde groter dan g zich voordoet. Eenzijdig: p = P (G g) of p = P (G g) Tweezijdig: p 2zijdig = 2 p 1zijdig 46/77

47 3.6 Toetsen van hypotheses One-sample t-test Gebruik: Nagaan of het gemiddelde van een continue variabele afwijkt van een gegeven waarde µ 0. assumpties: 1. Onafhankelijke observaties. 2. Normaalverdeelde observaties of een grote steekproef. H 0 : µ = µ 0 toetsingsgrootheid: t = q X µ s 2 n betrouwbaarheidsinterval: ondergrens = X ( t α/2 n 1 s/ n) 47/77

48 bovengrens = X + ( t α/2 n 1 s/ n) Voorbeeld: n = 100, x = 116 en s 2 = 400 H 0 : µ = 110, H a : µ 110 t = q X µ = s 2 20/ = n α = 0.05, t = +2 en 2, p = ondergrens = 116 ( ), bovengrens = ( ) 95% betrouwbaarheidsinterval is [112, 120], µ 0 ligt niet in dit interval. 48/77

49 3.6.2 two-sample t-test Gebruik: Nagaan of het gemiddelde van een continue variabele gelijk is in twee onafhankelijke populaties. assumpties: 1. Onafhankelijke observaties. 2. Normaalverdeelde observaties of een grote steekproef in elke groep. H 0 : µ 1 = µ 2 en varianties homogeen (σ 2 1 = σ 2 2 = σ) toetsingsgrootheid: t = ( q X 1 X 2) (µ 1 µ 2) s 2 pooled = (n1 1)s2 1 +(n2 1)s2 2 n 1+n 2 2 betrouwbaarheidsinterval: s 2 pooled ( 1 n n 2 ) ondergrens = ( X 1 X 2 ) ( t α/2 n 1+n 2 2 s ( X 1 X 2)) 49/77

50 bovengrens = ( X 1 X 2 ) + ( t α/2 n 1+n 2 2 s ( X 1 X 2)) Voorbeeld: n 1 = 4,n 2 = 6, x 1 = 14.75, x 2 = en s 2 pooled = 5.26 H 0 : µ A = µ B t = ( q X 1 X 2) (µ 1 µ 2) s 2 pooled ( 1 n = n ) 5.26( 1 2 α = 0.05, t = 2.306, p = ) = ondergrens = ( ) = bovengrens = ( ) = % betrouwbaarheidsinterval is [1.003, 7.831], (µ A µ B ) ligt niet in dit interval. 50/77

51 3.6.3 One-way analysis of variance (Anova) Gebruik: Nagaan of het gemiddelde van een continue variabele gelijk is in twee of meer (k) onafhankelijke populaties. Uitbreiding van de two-sample t-test assumpties: 1. Onafhankelijke observaties. 2. Normaalverdeelde observaties of een grote steekproef in elke groep. 3. Gelijke variantie in elke groep. principe: is de variate tussen (between) groepen groot indien vergeleken met de variatie binnen (within) groepen? within MSE = withinss n k = kp P n j (Y ij Ȳi)2 i=1 j=1 n k 51/77

52 between MSE = betweenss k 1 = kp P n j (Ȳi Ȳ )2 i=1 j=1 k 1 H 0 : µ 1 = µ 2 =..., µ k toetsingsgrootheid: F = betweenmse withinmse, met onder H 0 F (k 1, n k). 52/77

53 Voorbeeld: Data: Groep1 Groep2 Groep ȳ 1 = 2.1 ȳ 2 = 3 ȳ 3 = 4.5 ȳ = /77

54 Output: Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total /77

55 4 Categorische data-analyse 4.1 Inleiding Afhankelijke variabele: categorisch (nominaal of ordinaal) vb geslacht, opleidingsniveau aantallen, frequenties, proporties, percentages 55/77

56 4.2 1 Categorische variabele Categorische variabele met 2 niveaus Voorbeeld: Vrouwen Mannen Totaal Vrouwen Mannen Totaal De binomiaaltoets: H 0 : π = π 0 en stel π 0 = 0.56 H a : π < /77

57 P (X = x) = ( n x ) π x (1 π) n x De kans dat er( exact) 10 vrouwen zijn: 30 P (X = 10) = 0.56 x (1 0.56) = De kans dat er 11 vrouwen of minder zijn: P (X 11) = P (X = 0) + P (X = 1) P (X = 11) = p tweezijdig = = /77

58 Indien min nπ 0, n(1 π 0 ) > 5: benaderen via normaalverdeling z = z = x nπ nπ0(1 π 0) (1 0.56) = P (Z > 2.133) = Soms continuiteits-correctie: z = = (1 0.56) P (Z > 1.95) = /77

59 Categorische variabele met J 2 niveaus Voorbeeld: Klinische Bedrijfs Experimentele Totaal n j p j π j µ j (= n π j ) De Pearson chi-kwadraat toets: H 0 : p j = π j of n j = µ j, voor alle j. χ 2 = J (n j µ j) 2 µ j, met df = J 1. j=1 χ 2 2 = ( ) ( ) ( ) = , p < /77

60 4.3 2 Categorische variabelen Wegs kruistabel: geobserveerde frequenties Voorbeeld: Klinische Bedrijfs Experimentele Totaal geslaagd = geslaagd = Notatie: totaal Klinische Bedrijfs Experimentele Totaal geslaagd = 0 n 11 n 12 n 13 n 1+ geslaagd = 1 n 21 n 22 n 23 n 2+ totaal n +1 n +2 n +3 n 60/77

61 4.3.2 Test voor onafhankelijke variabelen Is er een verband tussen X en Y? Zo niet: statistisch onafhankelijk H 0 : π ij = πi+ π+j, voor alle i, j. H 0 : π i j = π+j, voor alle i, j. Onder H 0 : µ ij = nπij = n πi+ π+j. π i+ en π+j onbekend: ˆµ ij = np i+ p+j = n ni+ n +j n n = ni+n+j n. ˆµ ij : geschatte verwachte frequenties. 61/77

62 ˆµ 11 = = ˆµ 12 = = ˆµ 13 = = 8.73 ˆµ 21 = = ˆµ 22 = = ˆµ 23 = = Klinische Bedrijfs Experimentele Totaal geslaagd = geslaagd = totaal /77

63 χ 2 I J i=1 j=1 (n ij ˆµ ij) 2 ˆµ ij df = (I 1)(J 1) χ 2 = , df = 2, p = /77

64 4.4 Veralgemeend lineaire modellen Afhankelijke variabele is categorisch, maar meerdere predictoren Regressie, anova niet meer mogelijk Logistische regressie Afhankelijke variabele is dichotoom, of binair Alternatief: probit regressie Indien afhankelijke variabele meerdere niveaus: multinomiale regressie 64/77

65 4.4.2 Poisson regressie Afhankelijke variabele is een frequentie die een poisson verdeling volgt Aantal ongevallen/uur, Aantal klanten per dag, Loglineaire analyse Speciaal geval van poisson regressie Associatie tussen verschillende nominale variabelen in kaart brengen 65/77

66 5 Enkelvoudige Lineaire Regressie 5.1 Inleiding doel Modelleren van lineaire relatie tussen een afhankelijke variabele Y en een onafhankelijke variabele X X en Y gemeten op minstens interval niveau Lineaire regressie laat toe: 1. variatie in Y te verklaren in termen van variatie in X 2. Y te voorspellen op basis van X 3. nagaan of X een significante predictor is 66/77

67 5.1.2 Vergelijking van een rechte y = a + bx a = intercept: indien x = 0, dan y = a b = helling of slope: indien de waarde van x stijgt met één eenheid, dan stijgt de waarde van y met b 67/77

68 68/77

69 5.2 Het regressiemodel Structuur Y i = β 0 + β 1 X i + ε i, i = 1, 2,..., n β 0 en β 1 zijn de regressiecoëfficiënten ε i is de foutterm voor observatie i assumpties E(ε i ) = 0 E(Y i ) = β 0 + β 1 X 1i β 1 X pi V ar(ε i ) = σ 2 ε voor alle i V ar(y i ) = σ 2 ε i Cov(ε i, ε j ) = 0 voor alle i j 69/77

70 5.2.3 Onderzoeksvragen Wat is de bijdrage van X in het model? Is dit significant? H 0 : β 1 = 0 Hoeveel variantie in Y wordt verklaard door het model? H 0 = R 2 = 0, met R 2 =determinatiecoëfficiënt 70/77

71 5.3 Parameters Enkelvoudig regressiemodel telt drie vrije parameters: 1. de regressieconstante β 0 2. de regressiecoëfficiënt β 1 3. de variantie van de fouttermen σ 2 ε Schatten van parameters? Methode van kleinste kwadraten, maximum likelihood Minimaliseren van n (y i ŷ i ) 2, met ŷ i = b 0 + b 1 x i i=1 71/77

72 5.4 Toetsen van hypotheses H 0 : β 0 = 0: t = b0 β0 s b0 H 0 : β 1 = 0: t = b1 β1 s b1 Voorbeeld score en iq: met n 2 vrijheidsgraden met n 2 vrijheidsgraden B Std.Error t Sig constant iq ondergrens: b i ( t α/2 n 2 s b i ) bovengrens: b i + ( t α/2 n 2 s b i ) 72/77

73 5.5 De determinatiecoëfficiënt R 2 Nulmodel: Y i = β 0 + ε i b 0 = ȳ Total sum of squares (SST): E 0 = n (y i ȳ i ) 2 i=1 Residual sum of squares (SSE): E p = n (y i ŷ i ) 2 i=1 Regression sum of squares (SSR) = SST-SSE R 2 = E0 Ep E 0 0 < r 2 < 1 H 0 : R 2 = 0: F = (E0 Ep)/(df0 dfp) E p/df p Voorbeeld score en iq: R 2 = Model Sum of Squares df Mean Square F Sig. Regression Residual Total /77

74 6 Meervoudige Lineaire Regressie 6.1 Structuur Y i = β 0 + β 1 X 1i + β 2 X 2i β p X pi + ε i, i = 1, 2,..., n β 0,..., β 1 zijn de regressiecoëfficiënten ε i is de foutterm voor observatie i 6.2 Onderzoeksvragen Wat is de bijdrage van X p in het model? Is dit significant? H 0 : β p = 0 Hoeveel variantie in Y wordt verklaard door het model? H 0 = R 2 = 0, met R 2 =determinatiecoëfficiënt 74/77

75 6.3 Parameters Schatten van vrije parameters: Cfr. Enkelvoudige lineaire regressie 6.4 Toetsen van hypotheses H 0 : β p = 0: t = bp βp s bp met n p 1 vrijheidsgraden Voorbeeld score, iq en leeftijd: 75/77

76 score iq leeftijd B Std.Error t Sig constant iq leeftijd /77

77 6.5 De determinatiecoëfficiënt R 2 Nulmodel: Y i = β 0 + ε i b 0 = ȳ Total sum of squares (SST): E 0 = n (y i ȳ i ) 2 i=1 Residual sum of squares (SSE): E p = n (y i ŷ i ) 2 i=1 Regression sum of squares (SSR) = SST-SSE R 2 = E0 Ep E 0 0 < r 2 < 1 H 0 : R 2 = 0: F = (E0 Ep)/(df0 dfp) E p/df p Voorbeeld score, iq en leeftijd: R 2 = Model Sum of Squares df Mean Square F Sig. Regression Residual Total /77

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen

Nadere informatie

Statistiek II. Sessie 5. Feedback Deel 5

Statistiek II. Sessie 5. Feedback Deel 5 Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden

Nadere informatie

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,

Nadere informatie

Statistiek I Samenvatting. Prof. dr. Carette

Statistiek I Samenvatting. Prof. dr. Carette Statistiek I Samenvatting Prof. dr. Carette Opleiding: bachelor of science in de Handelswetenschappen Academiejaar 2016 2017 Inhoudsopgave Hoofdstuk 1: Statistiek, gegevens en statistisch denken... 3 De

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

4 Domein STATISTIEK - versie 1.2

4 Domein STATISTIEK - versie 1.2 USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamenopgaven Statistiek 2DD71: UITWERKINGEN 1. Stroopwafels a De som S van de 12 gewichten is X 1 + X 2 + + X 12. Deze is normaal

Nadere informatie

Formules Excel Bedrijfsstatistiek

Formules Excel Bedrijfsstatistiek Formules Excel Bedrijfsstatistiek Hoofdstuk 2 Data en hun voorstelling AANTAL.ALS vb: AANTAL.ALS(A1 :B6,H1) Telt hoeveel keer (frequentie) de waarde die in H1 zit in A1:B6 voorkomt. Vooral bedoeld voor

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

SOCIALE STATISTIEK (deel 2)

SOCIALE STATISTIEK (deel 2) SOCIALE STATISTIEK (deel 2) D. Vanpaemel KU Leuven D. Vanpaemel (KU Leuven) SOCIALE STATISTIEK (deel 2) 1 / 57 Hoofdstuk 5: Schatters en hun verdeling 5.1 Steekproefgemiddelde als toevalsvariabele D. Vanpaemel

Nadere informatie

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1 Statistiek II Sessie 1 Verzamelde vragen en feedback Deel 1 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 1 1 Staafdiagram 1. Wat is de steekproefgrootte? Op de horizontale as vinden we de respectievelijke

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

Feedback examen Statistiek II Juni 2011

Feedback examen Statistiek II Juni 2011 Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven

Nadere informatie

Feedback proefexamen Statistiek I 2009 2010

Feedback proefexamen Statistiek I 2009 2010 Feedback proefexamen Statistiek I 2009 2010 Het correcte antwoord wordt aangeduid door een sterretje. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Een derde van de mannen is

Nadere informatie

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet? Verklarende Statistiek: Toetsen Zat ik nou in dat kritische gebied of niet? Toetsen, Overzicht Nulhypothese - Alternatieve hypothese (voorbeeld: toets voor p = p o in binomiale steekproef) Betrouwbaarheid

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

. Dan geldt P(B) = a. 1 4. d. 3 8

. Dan geldt P(B) = a. 1 4. d. 3 8 Tentamen Statistische methoden 4052STAMEY juli 203, 9:00 2:00 Studienummers: Vult u alstublieft op het meerkeuzevragenformulier uw Delftse studienummer in (tbv automatische verwerking); en op het open

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3 Statistiek II Sessie 3 Verzamelde vragen en feedback Deel 3 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 3 1 Statismex en bloeddruk 1. Afhankelijke variabele: Bloeddruk (van ratio-niveau) Onafhankelijke

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter 5: Sampling Distributions 5.1: The

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Populatie: De gehele groep elementen waarover informatie wordt gewenst. Statistiek I Werkcollege 1 Populatie: De gehele groep elementen waarover informatie wordt gewenst. Steekproef: Gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te vergaren. Eenheden:

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE DEEL 3 INDUCTIEVE STATISTIEK INHOUD H 10: INLEIDING TOT DE INDUCTIEVE STATISTIEK H 11: PUNTSCHATTING 11.1 ALGEMEEN 11.1.1 Definities 11.1.2 Eigenschappen 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE 11.3

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur. VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28 Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische

Nadere informatie

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter. STATISTIEK OPLOSSINGEN OEFENZITTINGEN 5 en 6 c D. Keppens 2004 5 1 (a) Zij µ de verwachtingswaarde van X. We moeten aantonen dat E[M i ] = µ voor i = 1, 2, 3 om te kunnen spreken van zuivere schatters.

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

Deel I : beschrijvende statistiek

Deel I : beschrijvende statistiek HOOFDSTUK 1 TYPISCHE FOUTEN BIJ STATISTIEK Foute gegevens Fouten in berekening kans Foute interpretatie resultaten Statistiek : de wetenschap van het leren uit data & van het meten, controleren en communiceren

Nadere informatie

Oplossingen hoofdstuk XI

Oplossingen hoofdstuk XI Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Naam:... Voornaam:... DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Slechts één van de vier alternatieven is juist. Kruis het bolletje aan vóór het juiste antwoord. Indien je een meerkeuzevraag verkeerd

Nadere informatie

Samenvatting Statistiek

Samenvatting Statistiek Samenvatting Statistiek De hoofdstukken 1 t/m 3 gaan over kansrekening: het uitrekenen van kansen in een volledig gespecifeerd model, waarin de parameters bekend zijn en de kans op een gebeurtenis gevraagd

Nadere informatie

Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018

Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018 Les 5: ANOVA Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie 28 november 2018 1 Gebaseerd op de slides van Koen Van den Berge Testen die we tot nu toe gezien hebben: Toetsen van

Nadere informatie

Inleiding Applicatie Software - Statgraphics

Inleiding Applicatie Software - Statgraphics Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een

Nadere informatie

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur Tentamen Kansrekening en Statistiek MST 14 januari 2016, 14.00 17.00 uur Het tentamen bestaat uit 15 meerkeuzevragen 2 open vragen. Een formuleblad wordt uitgedeeld. Normering: 0.4 punt per MC antwoord

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Examen Statistiek I Januari 2010 Feedback

Examen Statistiek I Januari 2010 Feedback Examen Statistiek I Januari 2010 Feedback Correcte alternatieven worden door een sterretje aangeduid. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Twee derden van de mannen

Nadere informatie

Kanstheorie, -rekenen en bekende verdelingen

Kanstheorie, -rekenen en bekende verdelingen Kanstheorie, -rekenen en bekende verdelingen 1 Rekenregels kansrekenen Kans van de zekere gebeurtenis: P () = P (U) = 1 Kans van de onmogelijke gebeurtenis: P (;) = 0 Complementregel: P (A c ) = 1 P (A)

Nadere informatie

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt A. Effect & het onderscheidingsvermogen Effectgrootte (ES) De effectgrootte (effect size) vertelt ons iets over hoe relevant de relatie tussen twee variabelen is in de praktijk. Er zijn twee soorten effectgrootten:

Nadere informatie

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse 10.1 Eenwegs-variantieanalyse: Als we gegevens hebben verzameld van verschillende groepen en we willen nagaan of de populatiegemiddelden van elkaar verscihllen,

Nadere informatie

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 1. Iemand kiest geblinddoekt 4 paaseitjes uit een mand met oneindig veel paaseitjes. De helft is melkchocolade, de andere

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 5: Steekproevendistributies Hoofdstuk 5: Steekproevendistributies Inleiding Statistische gevolgtrekkingen worden gebruikt om conclusies over een populatie of proces te trekken op basis van data. Deze data wordt samengevat door middel

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38 2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

Antwoordvel Versie A

Antwoordvel Versie A Antwoordvel Versie A Interimtoets Toegepaste Biostatistiek 13 december 013 Naam:... Studentnummer:...... Antwoorden: Vraag Antwoord Antwoord Antwoord Vraag Vraag A B C D A B C D A B C D 1 10 19 11 0 3

Nadere informatie

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten Deze week: Steekproefverdelingen Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen Cursusjaar 29 Peter de Waal Zuivere Schatters Betrouwbaarheidsintervallen Departement Informatica Hfdstk

Nadere informatie

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een klein kapitaaltje

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur Kansrekening en statistiek WI22TI / WI25IN deel 2 2 februari 22, 4. 6. uur VOOR WI22TI: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad is niet toegestaan.

Nadere informatie

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data An Carbonez Leuven Statistics Research Centre Katholieke Universiteit Leuven Voorstelling van de

Nadere informatie

DEEL 1 Probleemstelling 1

DEEL 1 Probleemstelling 1 DEEL 1 Probleemstelling 1 Hoofdstuk 1 Van Probleem naar Analyse 1.1 Notatie 4 1.1.1 Types variabelen 4 1.1.2 Types samenhang 5 1.2 Sociaalwetenschappelijke probleemstellingen en hun basisformat 6 1.2.1

Nadere informatie

Samenvatting Statistiek II Studiejaar Mathilde Dieleman. Samenvatting statistiek II. Auteur: Mathilde Dieleman Studiejaar:

Samenvatting Statistiek II Studiejaar Mathilde Dieleman. Samenvatting statistiek II. Auteur: Mathilde Dieleman Studiejaar: Samenvatting statistiek II Auteur: Mathilde Dieleman Studiejaar: 2017 2018 Inhoudsopgave Hoofdstuk 2: Beschrijvende statistiek... 1 2.1.1 Centrummaten (pag. 31)... 1 2.2.2 Spreidingsmaten (pag. 34)...

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing M, M & C, Chapter 6, Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Use and Abuse

Nadere informatie

Statistiek II. Sessie 4. Feedback Deel 4

Statistiek II. Sessie 4. Feedback Deel 4 Statistiek II Sessie 4 Feedback Deel 4 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 4 We hebben besloten de bekomen grafieken in R niet in het document in te voegen, dit omdat het document met

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door

Nadere informatie

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Moore, McCabe & Craig: 3.3 Toward Statistical Inference From Probability to Inference 5.1 Sampling Distributions for

Nadere informatie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 9 Dinsdag 18 Oktober 1 / 1 2 Statistiek Vandaag: Centrale Limietstelling Correlatie Regressie 2 / 1 Centrale Limietstelling 3 / 1 Centrale Limietstelling St. (Centrale

Nadere informatie

Les 5: Analysis of variance

Les 5: Analysis of variance Les 5: Analysis of variance 2de bachelor in de chemie en biologie 14/11/2018 Jeroen Gilis Gebaseerd op slides Caroline De Tender Testen die we tot nu toe gezien hebben: Toetsen van één gemiddelde ten opzichte

Nadere informatie

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek 2 deel A 30 minuten over statistisch toetsen Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014 Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie +

Nadere informatie

Levende Statistiek. Een module voor Wiskunde D VWO. Jacob van Eeghen en Liesbeth de Wreede

Levende Statistiek. Een module voor Wiskunde D VWO. Jacob van Eeghen en Liesbeth de Wreede Levende Statistiek Een module voor Wiskunde D VWO Jacob van Eeghen en Liesbeth de Wreede Jacob van Eeghen en Liesbeth de Wreede, Leiden 2010 ctwo, Utrecht 2010 Dit lesmateriaal kan gebruikt worden voor

Nadere informatie

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1) Cursus Statistiek Hoofdstuk 4 Statistiek voor Informatica Hoofdstuk 4: Verwachtingen Cursusjaar 29 Peter de Waal Departement Informatica Inhoud Verwachtingen Variantie Momenten en Momentengenererende functie

Nadere informatie

Voorbeeld regressie-analyse

Voorbeeld regressie-analyse Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 15 Dinsdag 2 November 1 / 16 2 Statistiek Indeling: Filosofie Schatten Centraal Bureau voor Statistiek 2 / 16 Schatten Vb. Het aantal tenen plus vingers in jullie huishoudens:

Nadere informatie

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter

Nadere informatie

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4 statviewtoetsen 18/12/2000 Contents............................................................ 1 1 Statview toets, 2K WE, 30 mei 1995 2 1.1 Fitness-campagne................................................

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op dinsdag 5-03-2005, 9.00-22.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) Avondopleiding. donderdag 6-6-3, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie