Tentamen Biostatistiek 2 voor BMT (2DM50), op maandag 2 juli uur

Vergelijkbare documenten
Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 29 juni uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

Opgave 1: (zowel 2DM40 als 2S390)

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 27 oktober 2010, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Faculteit der Wiskunde en Informatica

Tentamen Biostatistiek 1 voor BMT (2DM40), op woensdag 12 november uur

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

Voorblad bij tentamen

Voorblad bij tentamen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek (2S390) op maandag ,

mlw stroom 2.1: Statistisch modelleren

Voorblad bij tentamen

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Statistiek ( ) eindtentamen

11. Multipele Regressie en Correlatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Hoofdstuk 8: Multipele regressie Vragen

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op maandag ,

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

Hoofdstuk 3 Statistiek: het toetsen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

Opgaven hoofdstuk 12 Enkelvoudige lineaire regressie

Verband tussen twee variabelen

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 3 februari 2012

Antwoordvel Versie A

Wiskunde B - Tentamen 1

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag ,

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

9. Lineaire Regressie en Correlatie

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Oplossingen hoofdstuk XI

Hoofdstuk 5 Een populatie: parametrische toetsen

College 7 Tweeweg Variantie-Analyse

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Tentamen Biostatistiek 3 / Biomedische wiskunde

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

Beschrijvende statistiek

Voorbeeldtentamen Statistiek voor Psychologie

Wiskunde B - Tentamen 2

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek I voor B (2S410) op woensdag 26 juni 2013, 9-12 uur.

1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Analyse van confounders en mediatoren. Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

STATISTIEK 2 VERSIE A MAT Tentamen Statistiek 2 (MAT-15403) Maandag 5 augustus 2013, uur

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

De correlatie kan opgevraagd worden via Analyze Correlate Bivariate en vervolgens maken we een keuze voor de variabelen. Dit levert als output op:

Kruis per vraag slechts één vakje aan op het antwoordformulier.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

College 6 Eenweg Variantie-Analyse

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

statistiek voor de psychologie deel 2: toetsen voor twee gemiddelden en toetsingstheorie

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

College 2 Enkelvoudige Lineaire Regressie

DATA-ANALYSEPLAN (20/6/2005)

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

Hoofdstuk 6 Twee populaties: parametrische toetsen

Data analyse Inleiding statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek I voor B (2S410) op , uur.

Sheets K&S voor INF HC 10: Hoofdstuk 12

antwoorden bij tentamen Statistiek

(slope in het Engels) en het snijpunt met de y-as, b 0

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

1 Basisbegrippen, W / O voor waar/onwaar

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

1. Reductie van error variantie en dus verhogen van power op F-test

Transcriptie:

Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op maandag 2 juli 2012 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het gebruik van boek, college-aantekeningen, laptop ed. is NIET toegestaan. De antwoorden dienen gemotiveerd, duidelijk geformuleerd en overzichtelijk opgeschreven te worden. Indien niet anders gespecificeerd geldt: toets met een onbetrouwbaarheid van 5%. Betrouwbaarheidsintervallen 95%. Er zijn 6 vraagstukken met in totaal 20 onderdelen. Elk onderdeel wordt gewaardeerd met 5 punten. Het eindcijfer wordt berekend door het totaal door 10 te delen. Aan het eind van dit tentamen zijn bijlagen met uitvoer van SPSS toegevoegd. Opgave 1: (3 x 5 = 15 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 1 noodzakelijk) Is een kleine dwarsdoorsnede van wervel L3 een risico-indicator voor het optreden van ischias, een zenuwpijn in de rug? Om dit te onderzoeken is de dwarsdoorsnede van wervel L3 bepaald bij een aantal personen met ischias en bij een aantal personen uit een controlegroep. Op basis van de resultaten zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlage 1. Gebruikte variabelen zijn: area L3 (dwarsdoorsnede L3 wervel) en group (1=ischias group, 2=control group). a. Voer op basis van de resultaten in bijlage 1 een Exploratieve Data Analyse uit. Vermeld relevante kentallen, beschrijf opvallende zaken en bespreek in hoeverre er sprake is van een Normale verdeling en/of van een symmetrische verdeling van de resultaten. b. Voer op basis van de resultaten in de bijlage 1 een t-toets uit om te bepalen of de dwarsdoorsnede van wervel L3 kleiner is voor de ischias-groep dan voor de controle groep. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling, significantie en conclusie. Indien meerdere toetsen van toepassing zijn beargumenteer dan welke toets de voorkeur verdient. c. Voer op basis van de resultaten in de bijlage 1 een parametervrije toets uit om te bepalen of de dwarsdoorsnede van wervel L3 kleiner is voor de ischias-groep dan voor de controle groep. Omschrijf het principe van de toets en vermeld hypothesen, significantie en conclusie. Beargumenteer welk van de twee toetsen, de t-toets of de parametervrije toets, je voorkeur heeft in dit geval. 2DM50 1

Opgave 2: (2 x 5 = 10 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 2 noodzakelijk) Leiden twee verschillende methoden, methode A en methode B, voor het vaststellen van hoge bloeddruk tot vergelijkbare resultaten? Om dit na te gaan wordt van een groep proefpersonen volgens beide methoden, methode A en methode B, vastgesteld of er sprake is van hoge bloeddruk. Resultaten zijn: Op basis van de resultaten zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlage 2. a. Voer op basis van de resultaten in bijlage 2 een Exploratieve Data Analyse uit naar een mogelijk verschil tussen beide methoden voor wat betreft het diagnosticeren van hoge bloeddruk. Is hier sprake van een onderzoekopzet met afhankelijke of met onafhankelijke data? b. Voer op basis van de resultaten in bijlage 2 een toets uit om te bepalen of er een verschil is tussen beide methoden in het diagnosticeren van hoge bloeddruk. Beargumenteer welke toets in dit geval van toepassing is en omschrijf het principe van de toets. Opgave 3: (2 x 5 = 10 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 3 noodzakelijk;) Om na te gaan of er een samenhang is tussen de bloedgroep van een persoon en het drager zijn van een specifiek antigen heeft men van een aselect gekozen groep van proefpersonen de bloedgroep bepaald en vastgesteld of ze al dan niet drager zijn van het betreffende antigen. Resultaten zijn: Op basis van de resultaten zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlage 3. a. Voer op basis van de resultaten in bijlage 3 een Exploratieve Data Analyse uit naar een mogelijke samenhang tussen bloedgroep en het al dan niet drager zijn van het specifieke antigen. b. Voer op basis van de resultaten in bijlage 3 een toets uit om te bepalen of er een samenhang is tussen bloedgroep en het al dan niet drager zijn van het betreffende antigen. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Indien meerdere toetsen van toepassing zijn beargumenteer dan welke toets de voorkeur verdient. 2DM50 2

Opgave 4: (5 x 5 = 25 punten) (Bij deze opgave is gebruik van resultaten uit de bijlagen 4a t/m 4c noodzakelijk) Om inzicht te krijgen in risicofactoren voor personen met chronische bronchitis (COPD) bepaalt men van een aantal proefpersonen met COPD de volgende kenmerken: x 1 : Body Mass Index (BMI, in kg/m 2 ), x 2 : arterieel zuurstof nivo (PaO2, in mm Hg), x 3 : arterieel koolzuur nivo (PaCO2, in mm Hg), x 4 : één-seconde geforceerd uitademingsvolume (FEV1, in %) en x 5 leeftijd (Age, in jaren). Met deze gegevens zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlagen 4a en 4b. a. Voer op basis van de resultaten in bijlage 4a een Exploratieve Data Analyse uit voor de gerapporteerde kenmerken: x 1 : Body Mass Index, x 2 : arterieel zuurstof nivo, x 3 : arterieel koolzuur nivo, x 4 : één-seconde geforceerd uitademingsvolume en x 5 leeftijd. Beschrijf opvallende zaken en besteed aandacht aan mogelijke samenhang tussen de variabelen. Om een mogelijke samenhang tussen de gerapporteerde kenmerken nader te onderzoeken zijn, in bijlage 4b, ook een aantal partiële correlatiecoëfficiënten gerapporteerd. b. Leg uit wat het verschil is tussen partiële correlatiecoëfficiënten, zoals vermeld in bijlage 4b, en de gewone (Pearson) correlatie coëfficiënten zoals vermeld in bijlage 4a. Vergelijk resultaten voor de gewone (Pearson) correlaties met resultaten voor de partiële correlaties en interpreteer mogelijke verschillen. Van de proefpersonen is ook het arteriële zuurstof verzadigingsnivo, y (SatO2), bepaald. Men is geïnteresseerd in een model om dit arteriële zuurstof verzadigingsnivo te kunnen voorspellen op basis van de eerder aangegeven kenmerken: x 1 : Body Mass Index, x 2 : arterieel zuurstof nivo, x 3 : arterieel koolzuur nivo, x 4 : éénseconde geforceerd uitademingsvolume en x 5 leeftijd. Op basis van de beschikbare gegevens is met een automatische modelselectie techniek een regressiemodel gefit. Resultaten staan in bijlage 4c. c. Welke automatische modelselectie techniek is hier gebruikt en hoe werkt deze in principe? Beschrijf de concrete stappen die tijdens dit selectieproces gezet zijn en specificeer het uiteindelijk geselecteerde model. d. Beoordeel met behulp van een adequate statistische toets de significantie van het uiteindelijk geselecteerde model als geheel. Vormt multicollineariteit een probleem? e. Welke aannamen zijn van toepassing op het gefitte regressiemodel? Beargumenteer op basis van de resultaten in bijlage 4c of aan deze aannamen voldaan lijkt te zijn. Opgave 5: (5 x 5 = 25 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 5 noodzakelijk) In hoe verre wordt de spieractiviteit in de dijspier beïnvloed door de hoek waaronder het kniegewricht staat? Om dit nader te onderzoeken selecteert men een aantal proefpersonen en wordt bij elk van hen de electromyografische spieractiviteit gemeten bij een viertal verschillende condities voor het kniegewricht, namelijk EMG10 (hoek 1-20 o ), EMG30 (hoek 21-40 o ), EMG50 (hoek 41-60 o ) en EMG70 (hoek 61-80 o ). Op basis van deze gegevens zijn een aantal analyses uitgevoerd welke vermeld zijn in bijlage 5. a. Van welk type experiment opzet (experimental setup) is bij het geschetste experiment sprake? Geef de structuur aan van de kwadratensom-opsplitsing voor dit model en vermeld welke termen bijdragen aan het modeleffect en welke aan de error. b. Geef een zo gedetailleerd mogelijk model om de waarneming y ik van proefpersoon k onder kniegewricht conditie i (1=EMG10, 2=EMG30, 3=EMG50 en 4=EMG70) te beschrijven in deze experiment opzet. Welke aannamen zijn van toepassing voor dit model? c. Voer op basis van de resultaten in bijlage 5 een Exploratieve Data Analyse uit. Beschrijf opvallende zaken en bespreek in hoeverre er sprake is van een symmetrische verdeling. Is er sprake van een gebalanceerde opzet? 2DM50 3

d. Bepaal op basis van de resultaten in de bijlage 5 of de kniegewricht conditie de electromyografische spieractiviteit beïnvloedt. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Indien meerdere toetsen van toepassing zijn, beargumenteer dan welke toets de voorkeur verdient! e. Voer op basis van de resultaten in bijlage 5 een parametervrije toets uit om te bepalen of de kniegewricht conditie de electromyografische spieractiviteit beïnvloedt. Omschrijf het principe van de toets en vermeld naam van de toets, hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Opgave 6: (3 x 5 = 15 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 6 noodzakelijk) Om het vetgehalte bij kinderen te bepalen beschikt men over drie verschillende methoden: een methode op basis van Röntgendiffractie (methode: XRay), een methode op basis van huidplooimeting (methode: HP) en een methode op basis van bioelectrische weerstand (methode: BioR). Om na te gaan of deze methoden tot vergelijkbare resultaten leiden voert men een onderzoek uit waarbij van een aantal jongens en meisjes (variabele gender: 0=girl, 1=boy) in de leeftijd tussen 4 en 10 jaar volgens elk van deze methoden het vetgehalte bepaald wordt. Op basis van de zo verkregen gegevens zijn een aantal analyses uitgevoerd welke vermeld staan in bijlage 6. a. Van welk type experiment opzet (experimental setup) is bij het geschetste experiment sprake? Geef de structuur aan van de kwadratensom-opsplitsing voor dit model en vermeld welke termen bijdragen aan het modeleffect en welke aan de error. Is er sprake van een gebalanceerde opzet? b. Bepaal op basis van de resultaten in de bijlage 6 welke within subject effecten en/of interacties significant zijn. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Beargumenteer of sphericiteit in dit geval een probleem is. Geef voor significante interacties een interpretatie! c. Bepaal op basis van de resultaten in de bijlage 6 welke between subject effecten en/of interacties significant zijn. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Beargumenteer of sphericiteit in dit geval een probleem is. Geef voor significante interacties een interpretatie! 2DM50 4

Bijlage 1 (opgave 1): Group = ischeas Group = control 2DM50 5

Bijlage 2 (opgave 2): volgorde: method A {No, Yes} volgorde: method B {No, Yes} 2DM50 6

Bijlage 3 (opgave 3): volgorde: antigen carrier {No, Yes} volgorde: bloodgroup {O, A, B, AB} 2DM50 7

Bijlage 4a (opgave 4a): Bijlage 4b (opgave 4b): Partial Correlations: Partial Correlations: vervolg bijlage 4 2DM50 8

Bijlage 4c (opgave 4 c t/m e): vervolg bijlage 4c 2DM50 9

Bijlage 4c vervolg (opgave 4 c t/m e): Scatterplot of Standardized Predicted Values versus Studentized Residuals Studentized Residuals Scatterplot of Standardized Predicted Values versus Studentized Residuals 2DM50 10

Bijlage 5 (opgave 5): EMG10 EMG30 EMG50 EMG70 Vervolg bijlage 5 2DM50 11

Bijlage 5 vervolg (opgave 5): {1=EMG10, 2=EMG30, 3=EMG50, 4=EMG70} 2DM50 12

Bijlage 6 (opgave 6): Vervolg bijlage 6 2DM50 13

Bijlage 6 Vervolg (opgave 6): (1=girl, 2=boy) (1=XRay, 2=HP, 3=BioR) BioR girl XRay HP HP XRay boy (1=girl, 2=boy) (1=XRay, 2=HP, 3=BioR) 2DM50 14