Examen Data Analyse II - Deel 2



Vergelijkbare documenten
G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Examen G0N34 Statistiek

Voorbeeldtentamen Statistiek voor Psychologie

Examen Statistiek II: Project

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Beschrijvend statistiek

Hoofdstuk 3 Statistiek: het toetsen

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Examen G0N34 Statistiek

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

9. Lineaire Regressie en Correlatie

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Behandeling van oudere patiënt met epilepsie. C.L.P. Deckers SEIN Zwolle

Inzet van games in de praktijk van het verpleeghuis. Hogeschool Zuyd, juni 2012

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Wiskunde B - Tentamen 1

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

Extra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Hoofdstuk 5 Een populatie: parametrische toetsen

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

Hoofdstuk 6 Twee populaties: parametrische toetsen

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

S0A17D: Examen Sociale Statistiek (deel 2)

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

herkansing Methoden van Onderzoek en Statistiek, 6 juli 2012 versie 1

Niet de hoogte, wel de oppervlakte. Aandachtspunten bij. - statistische technieken voor een continue veranderlijke

Kansrekening en Statistiek

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen HAVO. Wiskunde A1,2

Statistiek voor A.I.

DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO

Klantonderzoek: statistiek!

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen

15.1 Beslissen op grond van een steekproef [1]

Oplossingen hoofdstuk 9

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

Toetsen van Hypothesen. Het vaststellen van de hypothese

Les 1: de normale distributie

Les 1: Waarschijnlijkheidrekening

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Antwoordvel Versie A

Werkblad 1 Normale dichtheidsfunctie als benadering voor een klokvormig histogram

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19

TECHNISCHE UNIVERSITEIT EINDHOVEN

Kansrekening en Statistiek

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Examen VWO. Wiskunde A1,2 (nieuwe stijl)

Feedback rapport per huisarts

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Beschrijvende statistiek

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

mlw stroom 2.2: Biostatistiek en Epidemiologie

Opgave 1: (zowel 2DM40 als 2S390)

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Inleiding Applicatie Software - Statgraphics

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Eindexamen wiskunde A1-2 vwo 2004-I

Controleer linksonder of je een bestand hebt met records.

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Masterclass: statistical analysis 101. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april uur

Statistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14

Statistische variabelen. formuleblad

2. In de klassen 2A en 2B is een proefwerk gemaakt. Je ziet de resultaten in de frequentietabel. 2A 2B

Technologie: TI-Nspire CX CAS Niveau: beginner

17/04/ Epidemiologische studies. Children should not be treated as miniature men and women Abraham Jacobi

Feedback proefexamen Statistiek I

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6

Examen VWO wiskunde C. tijdvak 2 woensdag 17 juni uur. Bij dit examen hoort een uitwerkbijlage.

Samenvatting. J. Nachtegaal, S.E. Kramer, J.M. Festen (Amsterdam)

Kun je met statistiek werkelijk alles bewijzen?

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Studie type Populatie Patiënten kenmerken Interventie Controle Dataverzameling

Transcriptie:

Examen Data Analyse II - Deel 2 Tweede Bachelor Biomedische Wetenschappen 10 januari 2011 Naam....................................... 1. De systolische bloeddruk (in mmhg) van 21 mannen is weergegeven in volgende QQ-plot. Normal Q Q Plot Sample Quantiles 100 110 120 130 2 1 0 1 2 Theoretical Quantiles (a) Doe op basis van deze grafiek een uitspraak omtrent het al dan niet normaal verdeeld zijn van de systolische bloeddruk in deze populatie. (b) Vul volgende tabel aan met (een benadering van) de gevraagde waarde. Leg uit hoe u deze waarden gevonden hebt. Gemiddelde 114 Mediaan Standaarddeviatie 9.7 Eerste kwartiel Derde kwartiel Minimum Maximum 1

2 (c) Teken een boxplot van de gegevens. (d) Zijn er op basis van de boxplot outliers aanwezig? Leg uit. (e) In de volgende figuur ziet u twee histogrammen, welke hoort bij de gegevens? Motiveer uw antwoord. Histogram Histogram Frequency 0 1 2 3 4 5 Frequency 0 1 2 3 4 5 6 100 110 120 130 140 100 110 120 130 140

3 (f) Men definieert prehypertensie als een systolische bloeddruk tussen 120mmHg en 139mmHg. Als u mag veronderstellen dat de systolische bloeddruk normaal verdeeld is, schat de kans op prehypertensie in de populatie. 2. Anti-epileptica medicijnen (AED) kunnen een nadelige invloed hebben op de botmineraaldensiteit (BMD) en het metabolisme. In het artikel Bone health in young women with epilepsy after one year of antiepileptic drug monotherapy (Pack et al., Neurology 2008) wordt onderzocht of de invloed op de BMD bij vrouwen verschilt bij 4 anti-epileptica medicijnen (carbamazepine CBZ, lamotrigine LTG, phenytoin PHT en valproate VPA). De remodelleringsfase van een bot duurt ongeveer 3 maanden. Uit de groep premenopauzale vrouwen met epilepsie die al minstens 6 maanden 1 van de 4 AED innemen, werd een lukrake steekproef genomen. (a) Wat is een reden om patiënten te nemen die reeds minstens 6 maanden het medicijn innemen? (b) Is het belangrijk om leeftijd mee te nemen in het onderzoek als mogelijke confounder van het AED-effect in deze studie? Waarom wel of waarom niet? (c) Zou een andere type design hier meer geschikt zijn? Motiveer. In Table 2 staan de gegevens samengevat voor de botmineraaldensiteit op 3 plaatsen (Lumbar spine, Femoral neck, Total hip) voor de 4 behandelingsgroepen, gemeten

4 op 2 tijdstippen (bij start van de studie (baseline) en na 1 jaar). De lijnen die overeenkomen met Baseline Z score en 1-Year Z score laten we hier buiten beschouwing. (d) Beschouw de p-waarde bij de ANOVA-test uitgevoerd voor de baselinewaarden in de Lumbar spine. Waarom kiest men hier voor een ANOVA-test? Wat is de nulhypothese, alternatieve hypothese in dit geval en wat kan je besluiten op het 5% significantieniveau? (e) Stel dat je wilt nagaan of de gemiddelde botmineraaldensiteit in de lumbar spine na 1 jaar studie verschilt van deze bij de aanvang van de studie bij de LTG-behandeling. Welke test zou je hiervoor uitvoeren? Wat zijn de voorwaarden voor deze test? Als je bepaalde voorwaarden nog expliciet moet nagaan, geef dan aan met welke grafiek je dit kan doen. Geef de bijhorende teststatistiek en leid de gegevens die je hierbij nodig hebt, indien mogelijk, af uit de tabel. De test zelf hoef je niet uit te voeren. Stel dat je voor elke behandeling op de 3 botplaatsen wil nagaan of de gemiddelde BMD verschilt tussen baseline en 1 jaar later. Hoe zou je ervoor zorgen dat de globale kans op een Type I-fout 5% is? Leg uit. (f) Bereken, indien mogelijk, het 99%-betrouwbaarheidsinterval voor het gemiddeld

5 verschil in BMD na 1 jaar in de femoral neck tussen patiënten die CBZ innemen en patiënten die LTG innemen. Wat kan je hieruit besluiten? (g) Stel dat je wilt onderzoeken of de gemiddelde BMD in de total hip na 1 jaar studie groter is bij de PHT-behandeling dan bij de CBZ-behandeling. Welke steekproefgrootte heb je dan nodig bij beide groepen opdat deze test op het 5% significantieniveau een power van 90% heeft om een gemiddeld populatieverschil (PHT-CBZ) van 0.05 g/cm 2 te vinden? Hierbij mag je aannemen dat de populatievarianties gelijk zijn aan de steekproefvarianties en dat de 2 groepen even groot moeten zijn.

6 3. Om een bepaalde ziekte te detecteren, moet men een bloedtest ondergaan. De ervaring leert dat als iemand de ziekte heeft, er 75% kans is dat het resultaat van de test positief is. Voor iemand die de ziekte niet heeft, is er echter ook 5% kans dat het resultaat positief is. Men kan aantonen dat 5% van de bevolking drager is van de ziekte. (a) Wat is de conditionele kans dat iemand de ziekte heeft, als de bloedtest positief uitvalt? (b) Als het resultaat positief is, gebeurt er een tweede test. Voor personen die de ziekte niet hebben en met een positief resultaat op de eerste test, is deze steeds negatief; voor personen die de ziekte hebben en met een positief resultaat op de eerste test is er 95% kans op een positief resultaat op de tweede test. Wat is de conditionele kans dat iemand ziek is, als de tweede test negatief is en de eerste test positief was? 4. In het artikel The association between psoriasis, diabetes mellitus, and atherosclerosis in Israel: a case-control study (Shapiro et al., Journal of the American Academy of Dermatology 2007) onderzocht men o.a. het verband tussen psoriasis (een chronische huidaandoening) en diabetes mellitus. Hiertoe verzamelde men gegevens uit de Israëlische Maccabi Healthcare Services (MHS) database en gebruikte men een retrospectieve case-controledesign met 46 095 cases met psoriasis en een controlegroep van 1 579 037 personen. De gegevens staan samengevat in de volgende tabel: diabetes mellitus geen diabetes mellitus psoriasis 1 959 44 136 geen psoriasis 58 286 1 520 751 (a) Voer een test uit op het 5% significantieniveau om te onderzoeken of het hebben van diabetes mellitus en psoriasis onafhankelijk zijn. Formuleer duidelijke de nulhypothese en alternatieve hypothese. Ga tevens na of de voorwaarden voor deze test voldaan zijn. Wat is uw besluit?

7 (b) Schat, indien mogelijk, op basis van deze gegevens het relatief risico op psoriasis voor mensen met diabetis mellitus versus mensen zonder diabetes mellitus en formuleer de betekenis hiervan. (c) Schat, indien mogelijk, op basis van deze gegevens de odds ratio OR op psoriasis voor mensen met diabetis mellitus versus mensen zonder diabetes mellitus en formuleer de betekenis hiervan. (d) Bereken het 99% betrouwbaarheidsinterval van deze odds ratio op basis van de tabel en tracht hieruit een besluit te trekken. (e) Als men de verzamelde gegevens onderverdeelt volgens het geslacht van de patiënten, krijgen we de volgende tabellen:

8 Mannen diabetes mellitus geen diabetes mellitus psoriasis 1 013 22 018 geen psoriasis 30 655 735 718 Vrouwen diabetes mellitus geen diabetes mellitus psoriasis 946 22 118 geen psoriasis 27 631 785 033 Ga na of het geslacht een effect-modificator is. Indien dit niet het geval is, is er dan sprake van confounding door het geslacht? Leg uit.