Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op maandag 2 juli 2012 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het gebruik van boek, college-aantekeningen, laptop ed. is NIET toegestaan. De antwoorden dienen gemotiveerd, duidelijk geformuleerd en overzichtelijk opgeschreven te worden. Indien niet anders gespecificeerd geldt: toets met een onbetrouwbaarheid van 5%. Betrouwbaarheidsintervallen 95%. Er zijn 6 vraagstukken met in totaal 20 onderdelen. Elk onderdeel wordt gewaardeerd met 5 punten. Het eindcijfer wordt berekend door het totaal door 10 te delen. Aan het eind van dit tentamen zijn bijlagen met uitvoer van SPSS toegevoegd. Opgave 1: (3 x 5 = 15 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 1 noodzakelijk) Is een kleine dwarsdoorsnede van wervel L3 een risico-indicator voor het optreden van ischias, een zenuwpijn in de rug? Om dit te onderzoeken is de dwarsdoorsnede van wervel L3 bepaald bij een aantal personen met ischias en bij een aantal personen uit een controlegroep. Op basis van de resultaten zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlage 1. Gebruikte variabelen zijn: area L3 (dwarsdoorsnede L3 wervel) en group (1=ischias group, 2=control group). a. Voer op basis van de resultaten in bijlage 1 een Exploratieve Data Analyse uit. Vermeld relevante kentallen, beschrijf opvallende zaken en bespreek in hoeverre er sprake is van een Normale verdeling en/of van een symmetrische verdeling van de resultaten. b. Voer op basis van de resultaten in de bijlage 1 een t-toets uit om te bepalen of de dwarsdoorsnede van wervel L3 kleiner is voor de ischias-groep dan voor de controle groep. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling, significantie en conclusie. Indien meerdere toetsen van toepassing zijn beargumenteer dan welke toets de voorkeur verdient. c. Voer op basis van de resultaten in de bijlage 1 een parametervrije toets uit om te bepalen of de dwarsdoorsnede van wervel L3 kleiner is voor de ischias-groep dan voor de controle groep. Omschrijf het principe van de toets en vermeld hypothesen, significantie en conclusie. Beargumenteer welk van de twee toetsen, de t-toets of de parametervrije toets, je voorkeur heeft in dit geval. 2DM50 1
Opgave 2: (2 x 5 = 10 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 2 noodzakelijk) Leiden twee verschillende methoden, methode A en methode B, voor het vaststellen van hoge bloeddruk tot vergelijkbare resultaten? Om dit na te gaan wordt van een groep proefpersonen volgens beide methoden, methode A en methode B, vastgesteld of er sprake is van hoge bloeddruk. Resultaten zijn: Op basis van de resultaten zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlage 2. a. Voer op basis van de resultaten in bijlage 2 een Exploratieve Data Analyse uit naar een mogelijk verschil tussen beide methoden voor wat betreft het diagnosticeren van hoge bloeddruk. Is hier sprake van een onderzoekopzet met afhankelijke of met onafhankelijke data? b. Voer op basis van de resultaten in bijlage 2 een toets uit om te bepalen of er een verschil is tussen beide methoden in het diagnosticeren van hoge bloeddruk. Beargumenteer welke toets in dit geval van toepassing is en omschrijf het principe van de toets. Opgave 3: (2 x 5 = 10 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 3 noodzakelijk;) Om na te gaan of er een samenhang is tussen de bloedgroep van een persoon en het drager zijn van een specifiek antigen heeft men van een aselect gekozen groep van proefpersonen de bloedgroep bepaald en vastgesteld of ze al dan niet drager zijn van het betreffende antigen. Resultaten zijn: Op basis van de resultaten zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlage 3. a. Voer op basis van de resultaten in bijlage 3 een Exploratieve Data Analyse uit naar een mogelijke samenhang tussen bloedgroep en het al dan niet drager zijn van het specifieke antigen. b. Voer op basis van de resultaten in bijlage 3 een toets uit om te bepalen of er een samenhang is tussen bloedgroep en het al dan niet drager zijn van het betreffende antigen. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Indien meerdere toetsen van toepassing zijn beargumenteer dan welke toets de voorkeur verdient. 2DM50 2
Opgave 4: (5 x 5 = 25 punten) (Bij deze opgave is gebruik van resultaten uit de bijlagen 4a t/m 4c noodzakelijk) Om inzicht te krijgen in risicofactoren voor personen met chronische bronchitis (COPD) bepaalt men van een aantal proefpersonen met COPD de volgende kenmerken: x 1 : Body Mass Index (BMI, in kg/m 2 ), x 2 : arterieel zuurstof nivo (PaO2, in mm Hg), x 3 : arterieel koolzuur nivo (PaCO2, in mm Hg), x 4 : één-seconde geforceerd uitademingsvolume (FEV1, in %) en x 5 leeftijd (Age, in jaren). Met deze gegevens zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlagen 4a en 4b. a. Voer op basis van de resultaten in bijlage 4a een Exploratieve Data Analyse uit voor de gerapporteerde kenmerken: x 1 : Body Mass Index, x 2 : arterieel zuurstof nivo, x 3 : arterieel koolzuur nivo, x 4 : één-seconde geforceerd uitademingsvolume en x 5 leeftijd. Beschrijf opvallende zaken en besteed aandacht aan mogelijke samenhang tussen de variabelen. Om een mogelijke samenhang tussen de gerapporteerde kenmerken nader te onderzoeken zijn, in bijlage 4b, ook een aantal partiële correlatiecoëfficiënten gerapporteerd. b. Leg uit wat het verschil is tussen partiële correlatiecoëfficiënten, zoals vermeld in bijlage 4b, en de gewone (Pearson) correlatie coëfficiënten zoals vermeld in bijlage 4a. Vergelijk resultaten voor de gewone (Pearson) correlaties met resultaten voor de partiële correlaties en interpreteer mogelijke verschillen. Van de proefpersonen is ook het arteriële zuurstof verzadigingsnivo, y (SatO2), bepaald. Men is geïnteresseerd in een model om dit arteriële zuurstof verzadigingsnivo te kunnen voorspellen op basis van de eerder aangegeven kenmerken: x 1 : Body Mass Index, x 2 : arterieel zuurstof nivo, x 3 : arterieel koolzuur nivo, x 4 : éénseconde geforceerd uitademingsvolume en x 5 leeftijd. Op basis van de beschikbare gegevens is met een automatische modelselectie techniek een regressiemodel gefit. Resultaten staan in bijlage 4c. c. Welke automatische modelselectie techniek is hier gebruikt en hoe werkt deze in principe? Beschrijf de concrete stappen die tijdens dit selectieproces gezet zijn en specificeer het uiteindelijk geselecteerde model. d. Beoordeel met behulp van een adequate statistische toets de significantie van het uiteindelijk geselecteerde model als geheel. Vormt multicollineariteit een probleem? e. Welke aannamen zijn van toepassing op het gefitte regressiemodel? Beargumenteer op basis van de resultaten in bijlage 4c of aan deze aannamen voldaan lijkt te zijn. Opgave 5: (5 x 5 = 25 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 5 noodzakelijk) In hoe verre wordt de spieractiviteit in de dijspier beïnvloed door de hoek waaronder het kniegewricht staat? Om dit nader te onderzoeken selecteert men een aantal proefpersonen en wordt bij elk van hen de electromyografische spieractiviteit gemeten bij een viertal verschillende condities voor het kniegewricht, namelijk EMG10 (hoek 1-20 o ), EMG30 (hoek 21-40 o ), EMG50 (hoek 41-60 o ) en EMG70 (hoek 61-80 o ). Op basis van deze gegevens zijn een aantal analyses uitgevoerd welke vermeld zijn in bijlage 5. a. Van welk type experiment opzet (experimental setup) is bij het geschetste experiment sprake? Geef de structuur aan van de kwadratensom-opsplitsing voor dit model en vermeld welke termen bijdragen aan het modeleffect en welke aan de error. b. Geef een zo gedetailleerd mogelijk model om de waarneming y ik van proefpersoon k onder kniegewricht conditie i (1=EMG10, 2=EMG30, 3=EMG50 en 4=EMG70) te beschrijven in deze experiment opzet. Welke aannamen zijn van toepassing voor dit model? c. Voer op basis van de resultaten in bijlage 5 een Exploratieve Data Analyse uit. Beschrijf opvallende zaken en bespreek in hoeverre er sprake is van een symmetrische verdeling. Is er sprake van een gebalanceerde opzet? 2DM50 3
d. Bepaal op basis van de resultaten in de bijlage 5 of de kniegewricht conditie de electromyografische spieractiviteit beïnvloedt. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Indien meerdere toetsen van toepassing zijn, beargumenteer dan welke toets de voorkeur verdient! e. Voer op basis van de resultaten in bijlage 5 een parametervrije toets uit om te bepalen of de kniegewricht conditie de electromyografische spieractiviteit beïnvloedt. Omschrijf het principe van de toets en vermeld naam van de toets, hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Opgave 6: (3 x 5 = 15 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 6 noodzakelijk) Om het vetgehalte bij kinderen te bepalen beschikt men over drie verschillende methoden: een methode op basis van Röntgendiffractie (methode: XRay), een methode op basis van huidplooimeting (methode: HP) en een methode op basis van bioelectrische weerstand (methode: BioR). Om na te gaan of deze methoden tot vergelijkbare resultaten leiden voert men een onderzoek uit waarbij van een aantal jongens en meisjes (variabele gender: 0=girl, 1=boy) in de leeftijd tussen 4 en 10 jaar volgens elk van deze methoden het vetgehalte bepaald wordt. Op basis van de zo verkregen gegevens zijn een aantal analyses uitgevoerd welke vermeld staan in bijlage 6. a. Van welk type experiment opzet (experimental setup) is bij het geschetste experiment sprake? Geef de structuur aan van de kwadratensom-opsplitsing voor dit model en vermeld welke termen bijdragen aan het modeleffect en welke aan de error. Is er sprake van een gebalanceerde opzet? b. Bepaal op basis van de resultaten in de bijlage 6 welke within subject effecten en/of interacties significant zijn. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Beargumenteer of sphericiteit in dit geval een probleem is. Geef voor significante interacties een interpretatie! c. Bepaal op basis van de resultaten in de bijlage 6 welke between subject effecten en/of interacties significant zijn. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Beargumenteer of sphericiteit in dit geval een probleem is. Geef voor significante interacties een interpretatie! 2DM50 4
Bijlage 1 (opgave 1): Group = ischeas Group = control 2DM50 5
Bijlage 2 (opgave 2): volgorde: method A {No, Yes} volgorde: method B {No, Yes} 2DM50 6
Bijlage 3 (opgave 3): volgorde: antigen carrier {No, Yes} volgorde: bloodgroup {O, A, B, AB} 2DM50 7
Bijlage 4a (opgave 4a): Bijlage 4b (opgave 4b): Partial Correlations: Partial Correlations: vervolg bijlage 4 2DM50 8
Bijlage 4c (opgave 4 c t/m e): vervolg bijlage 4c 2DM50 9
Bijlage 4c vervolg (opgave 4 c t/m e): Scatterplot of Standardized Predicted Values versus Studentized Residuals Studentized Residuals Scatterplot of Standardized Predicted Values versus Studentized Residuals 2DM50 10
Bijlage 5 (opgave 5): EMG10 EMG30 EMG50 EMG70 Vervolg bijlage 5 2DM50 11
Bijlage 5 vervolg (opgave 5): {1=EMG10, 2=EMG30, 3=EMG50, 4=EMG70} 2DM50 12
Bijlage 6 (opgave 6): Vervolg bijlage 6 2DM50 13
Bijlage 6 Vervolg (opgave 6): (1=girl, 2=boy) (1=XRay, 2=HP, 3=BioR) BioR girl XRay HP HP XRay boy (1=girl, 2=boy) (1=XRay, 2=HP, 3=BioR) 2DM50 14