DEEL 1: FUNDAMENTALE CONCEPTEN

Maat: px
Weergave met pagina beginnen:

Download "DEEL 1: FUNDAMENTALE CONCEPTEN"

Transcriptie

1 DEEL 1: FUNDAMENTALE CONCEPTEN Hoofdstuk 1: Introductiemateriaal 1.1 motivatie Correcte analyse gegevens + interpretatie resultaten zeer belangrijk! 1.2 Cursusmateriaal

2 Hoofdstuk 2: Wat is statistiek? 2.1 Voorbeeld Onderzoeksvraag: Hoe beïnvloedt behandeling de bloeddruk? Belangrijk om te weten hoe waarschijnlijk de geobserveerde verschillen plaatsvinden door PUUR TOEVAL. Heel onwaarschijnlijk: het verschil is het resultaat van de behandeling Waarschijnlijk: het verschil is te wijten aan toeval, er is geen evidentie voor een behandelingeffect. DOEL VAN DE STATSTIEK: Conclusies trekken over een populatie, gebaseerd op observaties van een willekeurige steekproef. POPULATIE Willekeurig STEEKPROEF Statistiek 2.1 Populatie versus willekeurige steekproef Populatie = Een hypothetische groep van huidige en toekomstige subjecten, met een specifieke conditie, over wie er conclusies getrokken worden. Steekproef = Subgroep van de populatie, waarvan men observaties zal nemen. RANDOMISATIE is belangrijk om de geobserveerde effecten in de steekproef te kunnen generaliseren naar de totale populatie. 2.3 Het doel van statistiek 2 zijdig: Beschrijvende statistiek = samenvatten en beschrijven van geobserveerde gegevens zodat de relevante aspecten duidelijk gemaakt worden. (vb. tabellen, grafieken, berekeningen van gemiddelden, ) Inferentiële statistiek = Bestuderen in welke mate geobserveerde trends/effecten veralgemeend kunnen worden tot een algemene (oneindige) populatie. Het vereist: o een sterke link tussen steekproef en populatie o correcte statistische methodologie o correcte interpretatie van de resultaten

3 Hoofdstuk 3: overzicht statistiek 3.1 Introductie A en B hebben dezelfde locatie, maar een andere spreiding. B en C hebben dezelfde spreiding, maar een andere locatie. 3.2 Metingen van locatie STEEKPROEFGEMIDDELDE X = X X n (heel gevoelig voor extreme waarden) n STEEKPROEFMEDIAAN de middelste observatie (niet gevoelig voor extreme waarden) STEEKPROEFMODUS de meest geobserveerde waarde (niet altijd informatief) Als er zich outliers (extreme waarden) in je gegevens bevinden: best steekproefmediaan gebruiken, zijn er geen outliers, dan gebruik je best het gemiddelde. Symmetrische verdelingen Scheve verdelingen Mediaan = gemiddelde Mediaan ǂ gemiddelde Positief scheef: gemiddelde > mediaan Negatief scheef: mediaan > gemiddelde GEMIDDELDE MEDIAAN ( het gemiddelde kan sterk beïnvloedt worden door extreme scores) 3.2 Metingen van spreiding Hoe gelijkend zijn de observaties? vb. Ze kunnen hetzelfde gemiddelde hebben, maar er kunnen meer extreme waarden zijn (de spreiding is groter) SPREIDING is een belangrijke parameter!

4 GEMIDDELDE AFWIJKING VAN HET GEMIDDELDE (X X) n GEMIDDELDE KWADRATIRSCHE AFWIJKING VAN HET GEMIDDELDE (heel gevoelig voor outliers) (X X)² n STEEKPROEFVARIANTIE (s²) (X X)² (heel gevoelig voor outliers) n-1 STANDAARDAFWIJKING VAN DE STEEKPROEF (s) (X X)² (heel gevoelig voor outliers) n-1 STEEKPROEFBEREIK (R) (heel gevoelig voor outliers, afhankelijk van steekproefgrootte n) max X min X INTERKWARTIEL BEREIK STEEKPROEF (IQR) max X min X (zonder 25% (niet gevoelig voor outliers, onafhankelijk van steekproefgrootte n: hoogste en 25% laagste waarden) want bij een grotere n, worden meer observaties weggelaten) Omdat we willen dat onze meting van spreiding een maat is voor de hoeveelheid variatie in de populatie, verkiezen w een meting die onafhankelijk is van de steekproefgrootte. Symmetrische verdelingen Scheve verdelingen STANDAARDAFWIJKING/DEVIATIE INTERKWARTIEL BEREIK (IQR) (de standaarddeviatie kan erg beïnvloed worden door extreme scores) 3.4 Percentages Traditioneel: Metingen worden samengevat door - een meting van de locatie EN - een meting van de spreiding. MAAR STEL: een dichotome/ binominale variabele (0 en 1) Van zodra de locatie gekend is (vb. gemiddelde), is ook de spreiding gekend vb. gemiddelde van 0.5: je weet dat de helft van de waarden 0 is en de helft van de waarden 1 Men rapporteert alleen het gemiddelde, geen maat van spreiding.

5 Hoofdstuk 4: Betrouwbaarheidsintervallen en hypothesetesten 4.1 Willekeurige variabiliteit Niet alle subjecten uit de steekproef hebben hetzelfde voordeel van de behandeling. Het resultaat mag niet overschat worden: een andere steekproef zou tot andere scores leiden. Interpretatie: het resultaat (X) is een schatting voor de populatieparameter (μ) VRAAG: Is het geobserveerde verschil significant zodat we kunnen concluderen dat de behandeling effectief is? ANTWOORD: Betrouwbaarheidsintervallen/ hypothesetesten Willekeurig POPULATIE STEEKPROEF Is μ verschillend van 0? Statistiek Geobserveerd verschil/ effect 4.2 Het betrouwbaarheidsinterval Een bepaalde steekproef leidt tot een geobserveerd verschil. (μ wordt hierop gebaseerd) Maar een andere steekproef zou leiden tot een ander geobserveerd verschil en zou dus zorgen voor een andere schatting van μ. Een betrouwbaarheidsinterval = een interval rond dit geobserveerd verschil (X) waarbij het waarschijnlijk is dat het interval de ongekende populatieparameter μ bevat. 95% betrouwbaarheidsniveau: traditioneel in biomedisch onderzoek. Smalle betrouwbaarheidsintervallen een hele precieze schatting van de ongekende populatieparameter μ. (hoge precisie) Brede betrouwbaarheidsintervallen hogere waarschijnlijkheid dat ze de populatieparameter μ bevatten. (hoog betrouwbaarheidsniveau) Hoe meer observaties (staakproefgrootte n neemt toe) Hoe smaller het interval Hoe meer precisie 100% betrouwbaarheidsinterval? Helemaal niet informatief. Bevat namelijk alle waarden: ]- ; + [ We kunnen nooit helemaal zeker zijn. 4.3 Interpretatie van het betrouwbaarheidsinterval Het interval bevat μ of bevat μ niet. ( Alles of niets situatie ) 95% betrouwbaarheidsinterval: het interval bevat heel waarschijnlijk μ (slechts 5 van de 100 gegevenssets leiden tot een interval dat μ niet bevat.)

6 4.4 Hypothesetesten μ is nooit gekend, maar we kunnen door onze steekproef wel iets leren over μ. Er is geen behandelingseffect: μ =0. Er is een behandelingseffect: als we met sterke evidentie kunnen aantonen dat μǂ0 MAAR het geobserveerde verschil kan ook te wijten zijn aan PUUR TOEVAL. De vraag is: Hoe waarschijnlijk is dat het geval? Als het heel onwaarschijnlijk is: het geobserveerde verschil wordt significant beschouwd en dus als resultaat van de behandeling/effect. De procedure om te beslissen of er significantie is dat de behandeling de oorzaak is van het geobserveerde verschil. = Hypothesetesten De onderzoeksvraag wordt geformuleerd in termen van: - de nulhypothese H 0 - de alternatieve hypothese H A H 0 : μ=0 H A : μ ǂ 0 Kunnen we H 0 verwerpen of niet (in functie van H A )? NEEN: nulhypothese wordt aanvaard, de behandeling was niet effectief JA: nulhypothese wordt verworpen ALS het gemiddelde μ te ver ligt van 0. (het effect is significant verschillend van 0, de behandeling was effectief) Hoe ver is te ver? Als het heel onwaarschijnlijk is dat het door puur toeval gebeurde. Als het resultaat niet is wat je verwacht te zien als μ 0 zou zijn. p-waarde: vertelt ons hoe extreem de observaties zijn in het geval dat de nulhypothese waar is. o Kleine p-waarde: zeer extreme waarden als H 0 juist is DUS we kunnen H 0 verwerpen o Grote p-waarde: de geobserveerde resultaten zijn perfect in lijn met wat men verwacht als H 0 juist zou zijn. DUS we verwerpen H 0 niet, maar accepteren de nulhypothese. Niveau van significantie α specifiëren, dit is typisch een lage waarde zoals 0.01, 0.05,0.10 Biomedisch onderzoek: α =0.05= 5% (Slechts foutief verwerpen van H 0 in minder dan 5 van de 100 experimenten.) p < α: H 0 verwerpen p > α of p = α: H 0 accepteren 4.5 Hypothesetesten versus betrouwbaarheidsintervallen Komen beide procedures altijd overeen? JA, als het niveau van significantie en betrouwbaarheid complementair zijn t.o.v. elkaar:

7 Niveau van significantie (α) Betrouwbaarheidsniveau (1-α) % % % H 0 accepteren op basis van hypothesetesten (met α = 0.05) H 0 bevindt zich wel in het 95% B.I. H 0 verwerpen op basis van hypothesetesten (met α = 0.05) H 0 bevindt zich niet in het 95% B.I. Alternatieve definitie van betrouwbaarheidsinterval: Een 95% betrouwbaarheidsinterval is de verzameling van al de nulhypothesen die binnen e en statistische test (met α = 0.05) aanvaardt zouden worden. Voordeel betrouwbaarheidsinterval: geeft indicatie over 1. grootte van het effect (effect size): behandelingsschatting μ 2. precisie van schatting: breedte van het interval BETROUWBAARDHEIDSINTERVALLEN MOETEN VERKOZEN WORDEN BOVEN STATISTISCHE TESTEN

8 Hoofdstuk 5: gebruik en misbruik van statistiek 5.1 Mogelijke fouten bij het nemen van beslissingen Absolute zekerheid over populatiekarakteristieken kan niet verkregen worden gebaseerd op een eindige steekproef van observaties. Je kan nooit 100% zeker zijn. Vb. α=0.05: je hebt 5% kans dat je H 0 verworpen hebt, terwijl er eigenlijk geen significant verschil is. OF α=0.98: je hebt 2% kans dat je H 0 niet verworpen hebt, terwijl er eigenlijk een significant verschil is. De kans is klein, maar ze bestaat wel. 5.2 Twee soorten fouten TESTRESULTAAT WERKELIJKHEID H 0 is juist H 0 is fout H 0 accepteren Geen fout Type II fout (β) H 0 verwerpen Type I fout (α) Geen fout Type I fout: H 0 is foutief verworpen = niveau van significantie α Biomedisch onderzoek: er is dus een kans van 5% op het maken van een type I fout. Type II fout: H 0 is foutief geaccepteerd Het maken van een type II fout kan enkel gecontroleerd worden door het nemen van voldoende grote steekproeven (Bij een gefixeerd α-niveau) Dat vraagt om berekeningen van de steekproefgrootte = power berekeningen (vermogen) Vermogen (power) = de waarschijnlijkheid van het correct verwerpen van H 0 = 1-β (met β= waarschijnlijkheid van het maken van een type II fout) 5.3 Multiple testen Elke keer als er een test wordt uitgevoerd, is er een waarschijnlijkheid α voor het maken van een type I fout. Hoe meer testen we uitvoeren, hoe groter de waarschijnlijkheid dat er een bepaald wordt door puur toeval. = probleem van multiple testen Significante resultaten bekomen uit meerdere testen (multiple testen) zijn vaak overschat. Altijd kijken naar het aantal experimenten dat men heeft uitgevoerd. (hoe groter het aantal, hoe groter de kans dat het foutief is)

9 5.4 Equivalentietesten H 0 : μ A = μ B H A : μ A ǂ μ B Vaak de conclusie bij niet-significant resultaat: beide groepen zijn identiek/ equivalent MAAR dat is foutief: niet-significantie zou niet geïnterpreteerd mogen worden als equivalentie. Dergelijke onderzoeken zoeken naar evidentie in de gegevens om effecten te kunnen aantonen. Wanneer we via dit soort onderzoeken equivalentie willen aanduiden, hopen we op het vinden van geen effect. Men hoopt dus, dat als er verschillen zijn, men deze niet ontdekt (m.a.w. een type II fout maakt). Dit impliceert dat equivalentie het best zou kunnen aangetoond worden door zo weinig mogelijk gegevens te verzamelen. Alternatieve conclusie: het experiment had niet genoeg power om te tonen dat er een effect aanwezig was. Als de test gebruikt kan worden om equivalentie aan te duiden, is het beste om kleine steekproeven te onderzoeken, aangezien zij een gebrek hebben aan power en daardoor de kans verhogen op het vinden van een niet-significant resultaat. OPLOSSING: H 0 en H A omdraaien om EQUIVALENTIE te kunnen bewijzen (Equivalentietesten = aantnen dat effecten voldoende klein zijn, om ze als klinisch verwaarloosbaar te kunnen beschouwen.) H 0 : μ A μ B > x H A : μ A μ B < of = x Met x = vooraf opgestelde constant, die de equivalentie aanduidt (hoef niet altijd 0 te zijn) 5.6 Significantie versus relevantie Het vermogen (power) van een test neemt toe als de steekproefgrootte n toeneemt. Elke effect, maakt niet uit hoe klein, zal vroeg of laat gevonden worden, als de steekproef maar groot genoeg is. Maar is het nodig om kleine verschillen te vinden? Het is belangrijk om significante resultaten niet te overschatten: de grootte van het effect is ook zeer belangrijk, het moet m.a.w. relevant zijn in de praktijk (klinisch) Vb. verbetering van 0.1 mmhg BD na behandeling: het is wel een significant verschil, maar in de praktijk ben je er niets mee (geen relevantie).

10 Hoofdstuk 6: Gegevensstructuren en types 6.1 Niveaus van complexiteit Één-steekproef probleem Steekproef voor een homogene populatie: 1 afhankelijke/ uitkomstvariabele: Y i met i= 1,,n Standaardprocedure: Berekening van gemiddelde/ mediaan (LOCATIEPARAMATERS) Berekening van standaardfouten/ interkwartielbereienk (VERSPREIDINGSPARAMETERS) twee-steekproef probleem Steekproef voor 2 subgroepen (subpopulaties) van een grotere populatie (vb. jongens meisjes, welgeen behandeling): Y gi met g= 1,2 en i= 1,..., n Onafhankelijke variabele heeft 2 niveaus (in dit geval): binair/ dichotoom Onderzoeksvraag: zijn de gemiddelden verschillend in de 2 populaties? Uitkomstvariabele = afhankelijke variabele voorspeller (predictor) = covariabele = onafhankelijke variabele Regressie Predictor (onafhankelijke variabele) kan een variabele zijn met meerdere niveaus. Vb. verschillende dosissen die toegediend worden Leidt tot een familie van modellen = regressiemodellen Y i = β 0 + β 1 x i + ε i met i= 1,,n Keuze van de statistische analyse is vooral gedreven door de afhankelijke variabele (meer dan door de onafhankelijke variabele): Lineaire regressie o Afhankelijke variabele = continue o Onafhankelijke variabele = continu, binair, categorisch of discreet Logistieke regressie o Afhankelijke variabele = binair o Onafhankelijke variabele = continu, binair, categorisch of discreet Meerdere onafhankelijke variabelen One way ANOVA Two way ANOVA Multi-way ANOVA Eenvoudige/enkelvoudige lineaire regressie multiple regressie Andere technieken (zoals logistieke regressie) gemakkelijk verlengt tot multiple covariabelen. Simpel in theorie, maar ze vereisen grote zorg:

11 Collineairiteit (op één rechte lijn gelegen) verkrijgt men enkel uit multiple covariabele modellen. Vaak zijn niet alle onafhankelijke variabelen op dezelfde voet Vaak is de relatie tussen een BLOOTSTELLING en een ZIEKTE interessant, terwijl een andere variabele alleen een STORENDE VARIABELE is. Verwarrende variabele Blootstelling Ziekte Interpretatie/ modelopbouw van (regressie)coëfficienten vereisen: - expertise - vakinhoudelijke kennis Meerdere afhankelijke variabelen Multivariate analyse: wanneer meerdere afhankelijke variabelen tegelijkertijd bestudeerd worden Multiple: meerdere onafhankelijke variabelen Multivariate: meerdere afhankelijke variabelen 6.2 Multivariate analyse = een set van technieken die toegepast worden wanneer er meer dan 1 afhankelijke variabele is. Associatie: concept van afhankelijkheid tussen 2 of meer variabelen Correlatie: een familie van metingen die berekend kunnen worden om associatie te bekomen (Pearson en Spearman correlatie) Voornamelijk voor categorische gegevens zijn er vele metingen van associatie voorgesteld als alternatieven voor correlatie. 6.3 Algemene multivariate instelling Houdt in: - Een set van afhankelijke variabelen - Een set van onafhankelijke variabelen Moeilijk te bestuderen 6.4 Andere gecorreleerde gegevens instellingen Multivariate instelling is slechts één van de gecorreleerde gegevens instellingen Je hebt ook nog (met meerdere afhankelijke variabelen): o Herhaalde metingen (meerdere metingen van dezelfde variabele bij hetzelfde subject) o Longitudinale gegevens (op dezelfde manier op verschillende tijdstippen, herhaaldelijk metingen om een ontwikkeling in kaart te brengen) o Spatiale gegevens (plaatsbepaald, bij risico) o Geclusterde gegevens (vb. gezin) Zijn zij gerelateerd tot mulivariate anaylse? Of zijn het speciale gevallen? JA EN NEEN

12 Univariaat: voor elk subject zijn is een meting gedaan Multivariaat: voor elk subject zijn meerdere metingen gedaan Ambigue: voor elke familie(unit) is een meting gedaan (meerdere subjecten, telkens dezelfde meting) 1 afhankelijke variabele elke unit/ familie bestaat uit meerdere waarden (niveaus) 6.9 Schematische representatie Y X Continu Binair Tellen Time-to-event Binair ANOVA X², fisher X², Kaplan Meier (contingentie/kruistabellen) Continu Lineaire Logistieke regressie Poisson regressie Cox PH, regressie Count - Geen wiskundige beperking ( binair: 2) - Kunnen niet negatief worden - Vb. epileptische aanvallen (aantal/week) Time-to-event - Overlevingstijd effect - Vb. kanker - Kunnen niet negatief zijn Doel: Schatting en inferentie

13 Hoofdstuk 7: Kruistabellen 7.1 Kruistabellen Voorbeeld 1 Twee variabelen: - Controlegroep behandelde groep - Postieve test (mislukking) negatieve test (succes) GROEP RESPONS Mislukking Succes Controlegroep 5 5 Experimentele groep 5 5 Geen verschil tussen de groepen Geen statistische analyse nodig Voorbeeld 2 GROEP RESPONS Mislukking Succes Controlegroep 50 0 Experimentele groep 0 5 Duidelijk verschil tussen de groepen Geen statistische analyse nodig Voorbeeld 3 RESPONS Mislukking Succes Controlegroep 8 2 GROEP Experimentele groep 5 5 Beslissing tussen significant/ niet-significant verschil is niet onmiddellijk duidelijk Verschil te wijten aan toeval of aan de behandeling?

14 7.2 Voorbeeld 1 Behandeling BESCHADIGING Ja Neen Controlegroep Experimentele groep (funarizine) Statistische vraag Vraag: Is er een verschil tussen beide groepen? Nulhypothese: H 0 : De beschadigingswaarschijnlijkheid is gelijk tussen beide groepen. H 0 : Er is geen associatie tussen behandeling en beschadiging 2 aspecten: - testprobleem - schattingsprobleem (het verschil tussen de beschadigingswaarschijnlijkheden in beide groepen + de meting van de associatie) 7.4 X² test voor kruistabellen Voordeel: duidelijke berekeningen + continue correctie gemakkelijk mogelijk Nadeel: De normale benadering tot de binaire kwantiteitenverdeling moet behouden worden 7.5 Voorbeeld 2 RESPONS GROEP I II Succes Mislukking O = geobserveerde waarden E = verwachte waarden Berekening van de verwachte waarden: H 0 : product en repsons zijn onafhankelijk. H 0 : de succesprobabiliteit is gelijk onder de verschillende groepen. 1 gelijke probabiliteit: p = (16+18)/ (20+30) = 34/50 = 0.68 Hoeveelheid successen: o Groep I: 20 x p = 20 x 0.68 = 13.6 o Groep II: 30 x p = 30 x 0.68 = 20.4

15 Hoeveelheid mislukkingen: o Groep I: 20 x (1-p) = 20 x 0.32 = 6.4 o Groep II: 30 x (1-p) = 30 x 0.32 = 9.6 Hoeveelheid successen + hoeveelheid mislukkingen binnen een groep = aantal individuen per groep Tabel verwachte waarden: RESPONS GROEP I II Succes Mislukking De gefluoresceerde aantallen (marginale aantallen) zijn gelijk aan de tabel van de geobserveerde waarden. Gemakkelijkere methode voor het berekenen van de verwachtte waarden: E ij = O i+ O +j n RESPONS GROEP I II Succes O 11 O 21 O 1+ Mislukking O 12 O 22 O 2+ O +1 O +2 O ++ Je hoeft ze niet allemaal te berekenen Je weet bijvoorbeeld als je 13.6 hebt, dat = 20.4 Als je alle geobserveerde waarden en verwachte waarden hebt, is het gewoon de formule invullen: alle tellers zijn gelijk Vrijheidsgraden Tabel van verwachte waarden: df = aantal marginale waarden (4) Tabel van geobserveerde waarden: df = aantal marginale waarden + 1 (5)

16 Kritische waarde X² bij α =0.05 is (De berekende waarde moet GROTER DAN OF GELIJK ZIJN) Conclusies voor het voorbeeld: < 3.84 H 0 niet verwerpen De succeswaarschijnlijkheden zijn niet significant verschillend o p I = 16/20 = 0.8 o p II = 18/30 = Waardigheid van de benadering Hoe groter de steekproefgrootte, hoe beter de normale benadering tot de binominale verdeling, en hoe beter de benadering tot de X 1 ² verdeling. BELANGRIJK: De verwachte waardencellen moeten > 5 of =5. Conservatieve regel, dus smalle afwijkingen zijn aanvaardbaar, maar men moet oppassen! 7.7 Fisher s exact test 2x2 tabellen Verwachte waardencellen < Voorbeeld 4 BEHANDELING Algemene tabel: CARCINOMEN ja neen Placebo Actief A C A+C B D B+D A+B C+D n Waarbij n = (A+B) + (C+D) = (A+C) + (B+D) Nulhypothese: onafhankelijkheid tussen rijen en kolommen. vb. onafhankelijkheid tussen randomisatie en carcinomen De marginale waarden zijn gekend: we kunnen p(a,b,c,d) berekenen P(A,B,C,D) = (A+B)! (C+D)! (A+C)! (B+D)! n! A! B! C! D!

17 We doen dit voor elke configuratie die op zijn minst even onwaarschijnlijk is als de geobserveerde. Som van alle overeenkomstige waarschijnlijkheden: o </= 0.05: nulhypothese verwerpen o > 0.05: nulhypothese niet verwerpen/ accepteren In dit voorbeeld: P = dus H 0 niet verwerpen Er is dus geen verschil tussen actieve behandeling en placebo. Stel dat p < 0.05 en we H 0 wel verworpen: Dat zou willen zeggen dat actieve therapie lijdt tot meer carcinomen Interpretatie is belangrijk!!!!!!! 7.8 Analyse van voorbeeld 1 Problemen met het aantal van de verwachte waarden: veiliger om Fisher Exact test te gebruiken p = (waarschijnlijkheid 2 tabellen opgeteld): H 0 verwerpen Methode p-waarde X² (zonder continuïteitscorrectie) X² (met continuïteitscorrectie) Fisher s exact test Analyse voorbeeld 3 Methode Statistiek p-waarde X² (zonder continuïteitscorrectie) X² (met continuïteitscorrectie) Fisher s exact test X² test versus Fisher s exact test X² test: gemakkelijk en betrouwbaar bij grote steekproeven. Fisher s exact test: gemakkelijk en betrouwbaar bij kleine steekproeven.

18 Hoofdstuk 8: Groepen met continue resultaten vergelijken: de t-test 8.1 Voorbeeld: captopril gegevens Onderzoeksvraag: Hoe beïnvloedt behandeling de bloeddruk? We willen weten hoe waarschijnlijk het geobserveerde verschil te wijten is aan toeval. Grote waarschijnlijkheid: H 0 niet verwerpen, er is geen behandelingseffect. Kleine waarschijnlijkheid: H 0 verwerpen, er is een behandelingseffect. 8.2 Verschil in bloeddruk Zelfde proefpersonen gepaarde observaties verschilscores maken 8.3 twee-steekproeven t-test/ ongepaarde t-test 2 onafhankelijke groepen Heterogeniteit binnen de groep zorgt voor minder precisie Nulhypothese: H 0 : μ A = μ B t = X A X B s/ n Uitbreidingen: - A en B hebben verschillende varianties - A en B hebben verschillende steekproefgroottes - Afhankelijke metingen gepaarde t-toets 8.4 Gepaarde t-test Beperktere toepasbaarheid: enkel bij gepaarde metingen o Hetzelfde subject gemeten op 2 verschillende tijdsmomenten o Gepaarde metingen voor hetzelfde subject o Tweelingen o Case-control gegevens o Split bloed steekproef Meer power: als paren positief gecorreleerd zijn Uitbreiding: meer dan 2 metingen herhaalde metingen analyse 8.5 t-test: slotbeschouwing Voorwaarde: o Ongepaarde t-test: Gegevens in elke groep moeten normaal verdeeld zijn. o Gepaarde t-test: Verschillen moeten normaal verdeeld zijn. Wat als dat niet het geval is? o Transformeren o Non-parametrische (rang-gebaseerde) test: minder efficiënt, maar meer robuust tegen niet- normaliteit.

19 Deel 2: Analyse van variantie en lineaire regressie Hoofdstuk 9: Introductie Uitgewerkt voorbeeld (zie dia s)

20 Hoofdstuk 10: enkelvoudige/ eenvoudige lineaire regressie 10.1 Introductie Correlatiecoëfficiënt r meet de lineaire relatie tussen 2 variabelen, x en y. Hoe deze relatie beschrijven? Construeren van een rechte lijn die de geobserveerde metingen het best past. Vergelijking rechte: y=β 0 = β 1 x met β 0 = intercept (waarde van y waarbij x=0) β 1 = richtingscoëfficient β 1 > 0 Positieve relatie tussen x en y. Hoe groter β 1, hoe sneller y toeneemt met x. β 1 < 0 Negatieve relatie tussen x en y. Hoe kleiner β 1, hoe sneller y afneemt met x De kleinste kwadraten methode Welk criterium moet voldaan worden om de best passende lijn te hebben? Als we β 0 en β 1 kennen, kunnen we voor elke observatie gebaseerd op de x-waarde, een voorspelbare waarde voor y berekenen: Ŷ i = β 0 + β 1 x i De voorspelling is goed als Ŷ i dicht bij Y i ligt, en zwak als ze er ver vanaf ligt. Als de rechte lijn de gegevens goed beschrijft verwachten we, voor de meeste punten, dat Ŷ i en Y i dicht bij elkaar liggen. Maat voor hoe dicht de gegevens bij de rechte liggen: Q = (Y i Ŷ i )² = [Y i (β 0 + β 1 x i )]² Andere rechten zorgen voor andere waarden voor Q. De rechte die het best de gegevens beschrijft is deze waarvoor Q het kleinste is. De kleinste kwadraten methode: berekent de waarden van β 0 en β 1 waarvoor Q zo klein mogelijk is. β 1 = (X X) (Y Y) β 0 = Y β 1 X (voorspelde waarden) (X X)² Kleinste kwadraat schattingen voor β 0 en β 1. REGRESSIELIJN: y= β 0 + β 1 x

21 Error/ fout die we maken als we voorspellen: e i = Y i Ŷ i = Y i (β 0 + β 1 x i ) RESIDU S e i > 0: de geobserveerde y ligt boven de regressielijn (onderschatting) e i = 0: de geobserveerde y ligt op de regressielijn e i < 0: de geobserveerde y ligt onder de regressielijn (overschatting) e i = 0: de punten boven de regressielijn zijn in evenwicht met de punten onder de regressielijn 10.3 Illustratie en interpretatie X-variabele = covariabele = onafhankelijke variabele Interpretatie: Y-variabele = respons = afhankelijke variabele Regressielijn: ADL = x MMSE Stel 2 groepen patiënten Groep 1: MMSE = 20, groep 2: MMSE = 21 (ze verschillen dus met 1 MMSE eenheid) We verwachten dat het verschil in ADL tussen beide groepen 0.30 gaat zijn, met de lagere score bij de groep met de hoogst MMSE (groep 2) DIT IS FOUT: we mogen niet concluderen dat een toename van MMSE met 1 eenheid bij een bepaalde patiënt leidt tot een afname van 0.30 ADL. (Dit is gemiddeld zo, maar de patiënten onderling kunnen afwijken) We kunnen geen longitudinale conclusies trekken uit een cross-sectioneel experiment Statistische inferentie Introductie p-waarden testen volgende hypothesen: H 0 : β 0 = 0 H 0 : β 1 = 0 H A : β 0 ǂ 0 H A : β 1 ǂ 0 Statistische inferenties (p-waarden, betrouwbaarheidsintervallen) wil een verklaring afleggen over de regressielijn die de gehele populatie omvat. Bepaalde voorwaarden moeten voldaan zijn: beschreven in regressiemodel Het eenvoudige lineaire regressiemodel In echte situaties zullen de punten nooit een perfect rechte lijn beschrijven, maar eerder een puntenwolk. Y i = β 0 + β 1 x i + ε i waarbij ε i aanduidt hoe ver een observatie boven/ onder de regressielijn ligt ε i = theoretische versie van de residu s e i ε i = errors/fouten, die volgens het regressiemodel normaal verdeeld zijn met een gemiddelde 0 en een (ongekende) variantie σ²

22 ε i ~ n (0,σ²) Het regressiemodel neemt aan: 1. Lineairiteit: Voor elke X, ligt het gemiddelde van de overeenkomstige Y op de regressielijn. 2. Normaliteit: Voor elke X, liggen de overeenkomstige Y-waarden symmetrisch rond de regressielijn. 3. Constante variantie: De voorpsellende fouten voor kleine X-waarden zijn niet groter/ kleiner dan de fouten voor grotere X-waarden. Fouten: Significantietest voor β0 en β1 Significantietest voor β 1 Als β 1 = 0 dan is: Y = β 0 + ε i (er is geen lineaire relatie tussen X en Y) Testen: H 0 : β 1 = 0 H A : β 1 ǂ 0 Is het geobserveerde verschil significant of is het verkregen door toeval? Onderzoeksvraag: Hoe groot is de waarschijnlijkheid dat we, bij toeval een verschil vinden (van een bepaalde grootte, hier bv ) als eigenlijk: β1 = 0.

23 Als β 1 = 0, is het heel onwaarschijnlijk dat β 1 = EN heel onwaarschijnlijk dat β 1 = p < α = 0.05 = 5% DUS het verschil is significant en β 1 ǂ 0. Het regressiemodel staat ook toe om betrouwbaarheidsintervallen op te stellen. Het interval bevat 0 niet: sterke evidentie dat β 1 ǂ 0. Significantietest voor β0 Analoog H 0 : β 0 = 0 H A : β 0 ǂ 0 In praktijk is men voornamelijk geïnteresseerd in de testen voor β 1. Testen en betrouwbaarheidsintervallen gelden enkel als de voorwaarden voor het regressiemodel voldaan zijn De ANOVA tabel Als we geen X-waarden hebben is de beste mogelijke voorspelling voor elke Y-waarde het steekproefgemiddelde Y. Maat van de fout (maar ook van de variabiliteit in Y) : som van de kwadraten (Y-Y)² Als we de geobserveerde X-waarden gebruiken is de voorspelling van elke Y-waarde gelijk aan: Ŷ= β 0 + β 1 x Maat voor de fout: som van de kwadraten (Y Ŷ)² = e² Aangezien dit leidt tot meer precisie: (Y Y)² >/ = (Y Ŷ)² (Y Y)² = (Y Ŷ)² + (Ŷ Y)² SSTO SSE SSR SSTO = Totale som van de kwadraten De totale error die gemaakt wordt bij het voorspellen van Y zonder de geobserveerde X-waarden in rekening te brengen. SSE = Error som van de kwadraten De error die gemaakt wordt door het voorspellen van Y bij het gebruik maken van observaties van X. SSR = Regressie som van de kwadraten De afname in error door het voorspellen van de Y-waarden met i.p.v. zonder gebruik te maken van de covariabelen (X-variabelen/waarden).

24 Een maat voor hoe goed de gegevenspunten (X,Y) overeenkomen met de regressielijn: R² = SSR SSTO 0 =/< R² =/< 1 R² = 0 o SSR = 0 o Alle Ŷ = Y o De regressielijn is plat o Equivalent met β 1 = 0 R² = 1 o SSE = 0 o Alle Y = Ŷ o Alle punten (X,Y) liggen op de regressielijn R² duidt aan welke fractie van de variabiliteit in Y kan verklaard worden door X R² is equivalent met r² (het kwadraat van de correlatie tussen X en Y) Illustratie + interpretatie Pearson correlatie: r = - R²

25 Hoofdstuk 11 : Model diagnostiek 11.1 Voorbeeld Onafhankelijke variabele (X) : ADL (afhankelijkheid van patiënt) Afhankelijke variabele (Y): lengte van verblijf Regressiemodel: lengte van verblijf (Y) = ADL Voor β 1 : p-waarde = (dus geen significante relatie tussen lengte van verblijf en ADL) R² = : ADL verklaard slechts 4% van de totale variabiliteit in de lengte van het verblijf.

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK 1 1. INLEIDING Parametrische statistiek: Normale Verdeling Niet-parametrische statistiek: Verdelingsvrij Keuze tussen de twee benaderingen I.

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

4 Domein STATISTIEK - versie 1.2

4 Domein STATISTIEK - versie 1.2 USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

Kun je met statistiek werkelijk alles bewijzen?

Kun je met statistiek werkelijk alles bewijzen? Kun je met statistiek werkelijk alles bewijzen? Geert Verbeke Biostatistisch Centrum, K.U.Leuven International Institute for Biostatistics and statistical Bioinformatics geert.verbeke@med.kuleuven.be http://perswww.kuleuven.be/geert

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28 Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Toegepaste Biostatistiek Wetenschappelijk Onderzoek

Toegepaste Biostatistiek Wetenschappelijk Onderzoek Toegepaste Biostatistiek Wetenschappelijk Onderzoek Geert Verbeke Biostatistisch Centrum, K.U.Leuven geert.verbeke@med.kuleuven.be http://perswww.kuleuven.be/geert verbeke Master Biomedische Wetenschappen

Nadere informatie

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,

Nadere informatie

Beschrijvende statistiek

Beschrijvende statistiek Beschrijvende statistiek Beschrijvende en toetsende statistiek Beschrijvend Samenvatting van gegevens in de steekproef van onderzochte personen (gemiddelde, de standaarddeviatie, tabel, grafiek) Toetsend

Nadere informatie

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter

Nadere informatie

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Kruis per vraag slechts één vakje aan op het antwoordformulier. Toets Stroom 1.2 Methoden en Statistiek tul, MLW 7 april 2006 Deze toets bestaat uit 25 vierkeuzevragen. Kruis per vraag slechts één vakje aan op het antwoordformulier. Vraag goed beantwoord dan punt voor

Nadere informatie

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data An Carbonez Leuven Statistics Research Centre Katholieke Universiteit Leuven Voorstelling van de

Nadere informatie

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden

Nadere informatie

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1 Statistiek II Sessie 1 Verzamelde vragen en feedback Deel 1 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 1 1 Staafdiagram 1. Wat is de steekproefgrootte? Op de horizontale as vinden we de respectievelijke

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3 Statistiek II Sessie 3 Verzamelde vragen en feedback Deel 3 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 3 1 Statismex en bloeddruk 1. Afhankelijke variabele: Bloeddruk (van ratio-niveau) Onafhankelijke

Nadere informatie

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16 modulus strepen: uitkomst > 0 Hiermee rekenen we de testwaarde van t uit: n 10 ttest ( x ) 105 101 3,16 n-1 4 t test > t kritisch want 3,16 >,6, dus 105 valt buiten het BI. De cola bevat niet significant

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

Statistiek II. Sessie 5. Feedback Deel 5

Statistiek II. Sessie 5. Feedback Deel 5 Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek 2 deel A 30 minuten over statistisch toetsen Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014 Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie +

Nadere informatie

Feedback examen Statistiek II Juni 2011

Feedback examen Statistiek II Juni 2011 Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Oefentoets 1 1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Conditie = experimenteel Conditie = controle Sekse = Vrouw 23 33 Sekse = Man 20 36 Van

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

Toegepaste data-analyse: oefensessie 2

Toegepaste data-analyse: oefensessie 2 Toegepaste data-analyse: oefensessie 2 Depressie 1. Beschrijf de clustering van de dataset en geef aan op welk niveau de verschillende variabelen behoren Je moet weten hoe de data geclusterd zijn om uit

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van

Nadere informatie

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages. MARGES EN SIGNIFICANTIE BIJ STEEKPROEFRESULTATEN. De marges van percentages Metingen via een steekproef leveren een schatting van de werkelijkheid. Het toevalskarakter van de steekproef heeft als consequentie,

Nadere informatie

Hoofdstuk 2: Verbanden

Hoofdstuk 2: Verbanden Hoofdstuk 2: Verbanden Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoofdstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd

Nadere informatie

Introductie tot de statistiek

Introductie tot de statistiek Introductie tot de statistiek Hogeschool Gent 04/05/2010 Inhoudsopgave 1 Basisbegrippen en beschrijvende statistiek 8 1.1 Onderzoek............................ 8 1.1.1 Data........................... 8

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur. VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT

Nadere informatie

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen M, M & C 7.3 Optional Topics in Comparing Distributions: F-toets 6.4 Power & Inference as a Decision 7.1 The power of the t-test 7.3 The power of the sample t- Toetsende Statistiek Week 5. De F-toets &

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent. Hoofdstuk 12 : Regressie en correlatie Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Regressie en correlatie p 1/26 Regressielijn Vraag : vind het

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 16 Donderdag 4 November 1 / 25 2 Statistiek Indeling: Schatten Correlatie 2 / 25 Schatten 3 / 25 Schatters: maximum likelihood schatters Def. Zij Ω de verzameling van

Nadere informatie

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Examen Kansrekening en Wiskundige Statistiek: oplossingen Examen Kansrekening en Wiskundige Statistiek: oplossingen S. Vansteelandt Academiejaar 006-007 1. Een team van onderzoekers wil nagaan of een bepaald geneesmiddel Triptan meer effectief is dan aspirine

Nadere informatie

Statistiek I Samenvatting. Prof. dr. Carette

Statistiek I Samenvatting. Prof. dr. Carette Statistiek I Samenvatting Prof. dr. Carette Opleiding: bachelor of science in de Handelswetenschappen Academiejaar 2016 2017 Inhoudsopgave Hoofdstuk 1: Statistiek, gegevens en statistisch denken... 3 De

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17 Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 17 Statistische toetsen 2 / 17 Toetsen - algemeen - 1 Setting: observatie X in X, model {P θ : θ Θ}. Gegeven partitie Θ = Θ 0 Θ 1, met Θ 0 Θ 1

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen

Nadere informatie

Wiskunde B - Tentamen 1

Wiskunde B - Tentamen 1 Wiskunde B - Tentamen Tentamen 57 Wiskunde B voor CiT vrijdag januari 5 van 9. tot. uur Dit tentamen bestaat uit 6 opgaven, formulebladen en tabellen. Vermeld ook uw studentnummer op uw werk en tentamenbriefje.

Nadere informatie

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Naam:... Voornaam:... DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Slechts één van de vier alternatieven is juist. Kruis het bolletje aan vóór het juiste antwoord. Indien je een meerkeuzevraag verkeerd

Nadere informatie

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 5: Steekproevendistributies Hoofdstuk 5: Steekproevendistributies Inleiding Statistische gevolgtrekkingen worden gebruikt om conclusies over een populatie of proces te trekken op basis van data. Deze data wordt samengevat door middel

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

toetskeuze schema verschillen in gemiddelden

toetskeuze schema verschillen in gemiddelden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets week 5: het toetsen van

Nadere informatie

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14 Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 1314 Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 1314 Figuren en formules

Nadere informatie

11. Meerdere gemiddelden vergelijken, ANOVA

11. Meerdere gemiddelden vergelijken, ANOVA 11. Meerdere gemiddelden vergelijken, ANOVA Analyse van variantie (ANOVA) wordt gebruikt wanneer er situaties zijn waarbij er meer dan twee condities vergeleken worden. In dit hoofdstuk wordt de onafhankelijke

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

Les 2: Toetsen van één gemiddelde

Les 2: Toetsen van één gemiddelde Les 2: Toetsen van één gemiddelde Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie & Biotechnologie 22 oktober 2018 Het statistisch testen van één gemiddelde is een veel voorkomende toepassing

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 9 Dinsdag 18 Oktober 1 / 1 2 Statistiek Vandaag: Centrale Limietstelling Correlatie Regressie 2 / 1 Centrale Limietstelling 3 / 1 Centrale Limietstelling St. (Centrale

Nadere informatie

Les 1: Waarschijnlijkheidrekening

Les 1: Waarschijnlijkheidrekening Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

1 Basisbegrippen, W / O voor waar/onwaar

1 Basisbegrippen, W / O voor waar/onwaar Naam - Toetsende Statistiek Rijksuniversiteit Groningen Lente Docent: John Nerbonne Tentamen di. 22 juni om 14 uur tentamenhal Belangrijke instructies 1. Schrijf uw naam & studentnummer hierboven, schrijf

Nadere informatie

Oplossingen hoofdstuk XI

Oplossingen hoofdstuk XI Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij

Nadere informatie

Formules Excel Bedrijfsstatistiek

Formules Excel Bedrijfsstatistiek Formules Excel Bedrijfsstatistiek Hoofdstuk 2 Data en hun voorstelling AANTAL.ALS vb: AANTAL.ALS(A1 :B6,H1) Telt hoeveel keer (frequentie) de waarde die in H1 zit in A1:B6 voorkomt. Vooral bedoeld voor

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995 Schriftelijk examen statistiek, data-analyse en informatica Maandag 29 mei 1995 Tweede jaar kandidaat arts + Tweede jaar kandidaat in de biomedische wetenschappen Naam: Voornaam: Vraa Kengetal g Blad 1

Nadere informatie

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit College 7 Regressie-analyse en Variantie verklaren Inleiding M&T 2012 2013 Hemmo Smit Neem mee naar tentamen Geslepen potlood + gum Collegekaart (alternatief: rijbewijs, ID-kaart, paspoort) (Grafische)

Nadere informatie

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen Cursus Statistiek 2 Fellowonderwijs Opleiding Intensive Care UMC St Radboud, Nijmegen Cursus Statistiek 2 Steekproefgrootte en power berekening Vergelijken van gemiddelden (T-testen) Niet-parametrische

Nadere informatie

Statistiek voor A.I. College 2. Donderdag 13 September 2012

Statistiek voor A.I. College 2. Donderdag 13 September 2012 Statistiek voor A.I. College 2 Donderdag 13 September 2012 1 / 42 1 Beschrijvende statistiek 2 / 42 Extrapolatie 3 / 42 Verkiezingen 2012 4 / 42 Verkiezingen 2012 5 / 42 1 Beschrijvende statistiek Vandaag:

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

Open en Gepersonaliseerd Statistiekonderwijs (OGS) Deliverable 1.1 Requirements

Open en Gepersonaliseerd Statistiekonderwijs (OGS) Deliverable 1.1 Requirements Open en Gepersonaliseerd Statistiekonderwijs (OGS) Deliverable 1.1 Requirements Sietske Tacoma, Susanne Tak, Henk Hietbrink en Wouter van Joolingen Inleiding Het doel van dit project is om een aantal vrij

Nadere informatie

Examen Statistiek I Januari 2010 Feedback

Examen Statistiek I Januari 2010 Feedback Examen Statistiek I Januari 2010 Feedback Correcte alternatieven worden door een sterretje aangeduid. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Twee derden van de mannen

Nadere informatie

Samenvatting Statistiek

Samenvatting Statistiek Samenvatting Statistiek De hoofdstukken 1 t/m 3 gaan over kansrekening: het uitrekenen van kansen in een volledig gespecifeerd model, waarin de parameters bekend zijn en de kans op een gebeurtenis gevraagd

Nadere informatie

Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)?

Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)? Vraag 1. Welk design bevat geen random assignment: a) Een design gebaseerd op matching b) Een design gebaseerd op blocking c) Een factorial design d) Elk van de hierboven genoemde designs Vraag 2. In een

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamenopgaven Statistiek 2DD71: UITWERKINGEN 1. Stroopwafels a De som S van de 12 gewichten is X 1 + X 2 + + X 12. Deze is normaal

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

SOCIALE STATISTIEK (deel 2)

SOCIALE STATISTIEK (deel 2) SOCIALE STATISTIEK (deel 2) D. Vanpaemel KU Leuven D. Vanpaemel (KU Leuven) SOCIALE STATISTIEK (deel 2) 1 / 57 Hoofdstuk 5: Schatters en hun verdeling 5.1 Steekproefgemiddelde als toevalsvariabele D. Vanpaemel

Nadere informatie

Feedback proefexamen Statistiek I 2009 2010

Feedback proefexamen Statistiek I 2009 2010 Feedback proefexamen Statistiek I 2009 2010 Het correcte antwoord wordt aangeduid door een sterretje. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Een derde van de mannen is

Nadere informatie