TECHNISCHE UNIVERSITEIT EINDHOVEN Tentamen Biostatistiek voor BMT (2S390) op 23-11-2005 U mag alleen gebruik maken van een onbeschreven Statistisch Compendium (dikt. nr. 2218) en van een (eventueel grafisch) zakrekenmachine. De uitwerkingen van de opgaven dienen gemotiveerd, duidelijk geformuleerd en overzichtelijk opgeschreven te worden. Per onderdeel zijn 2 punten te behalen. Cijfer is het totaal aantal behaalde punten gedeeld door 4, met een maximum van 10 (er zijn 42 punten te behalen in totaal). 1. Dirk en Anne doen beide onafhankelijk van elkaar 10 keer een ingewikkeld experiment. Voor Dirk is de slagingskans 0.5 en voor Anne 0.6. (a) Wat is de kans dat Dirk meer dan 8 keer het experiment succesvol afrond? (b) Noem Z het totaal (dus die van Anne en Dirk opgeteld) aantal succesvolle experimenten. Wat is de standaarddeviatie van Z? (c) Nu doen ze beide het experiment 50 keer. Wat is de kans dat beide meer dan 25 successen boeken? (d) In dat grote experiment uit (c): wat is de kans dat Anne vaker succes heeft dan Dirk? (e) De opdrachtgever weet niet wie beter is in het uitvoeren van het experiment (hij weet de slagingskansen dus niet). Omdat het een duur experiment is, heeft hij maar budget voor 4 experimenten. Hij past de volgende strategie toe: beide doen eerst het experiment 1 keer. Als Dirk minimaal even vaak succes heeft als Anne dan mag hij de laatste 2 experimenten doen. Zo niet, dan doet Anne de laatste 2. Gegeven de slagingskansen zoals hierboven wat is de kans op in totaal 3 of meer succesvolle experimenten? 2. Bij pasgeboren baby s worden convulsies(stuipen) onderzocht met een vereenvoudigde methode van EEG. Men vermoedt dat het aantal stuipen bij baby s van vrouwen die antidepressiva gebruikten tijdens de zwangerschap verschilt van die van vrouwen die niet gebruikten. Het aantal convulsies binnen een vast tijdsinterval werd gemeten voor 10 respectievelijk 12 baby s uit beide populaties. Hierbij werd in de eerste instantie geen onderscheid gemaakt tussen korte en langdurige convulsies. De resultaten zijn weergegeven in Tabel 1 en de normal probability plots in Figuren a en b. met gebruik zonder gebruik 18 24 33 21 35 23 19 17 37 22 26 19 33 22 17 21 30 17 32 20 25 23 Table 1: Met vs zonder (a) Wat kunt u zeggen van de onderliggende populaties? 1
(a) (b) (b) Stel een hypothese op en voer een toets uit om te onderzoeken of het vermoeden uit bovenstaand verhaal juist zou kunnen zijn. Neem α = 0.1. (c) Naderhand blijkt dat de convulsies van groep met gebruik zijn gemeten met meetapparaat 1 en van groep zonder gebruik met apparaat 2. Men meet nogmaals de 10 baby s uit de groep met gebruik met beide apparaten. De resultaten zijn weergegeven in Tabel 2. Is er reden om aan te nemen dat apparaat 1 hogere waarden afgeeft dan apparaat 2? Stel een hypothese op en voer een geschikte toets uit met α = 0.05. (d) Vindt u het nodig de conclusies uit onderdeel b) te herzien? Zo ja, waarom? Wat is uw advies? 3. Een parachutist springt uit een vliegtuig. Hij wil landen op een eiland in zee. Dat eilandje is 1 bij 1 decameter groot (1 decameter = 10 meter). Dat eilandje ligt middenin een vlak van 2 bij 2 decameter (dat dus ook zee bevat) waarvan de parachutist zeker is dat hij in ieder geval daarin landt. De marges zijn dus 0.5 decameter, dus 5 meter. (a) Wat is de kans dat de parachutist op het eilandje landt, als er een uniforme verdeling geldt op het gehele valk van 2 bij 2? 2
baby apparaat 1 apparaat 2 1 24 17 2 31 25 3 16 13 4 17 20 5 28 22 6 15 10 7 31 23 8 30 30 9 15 16 10 33 27 Table 2: apparaat1 vs apparaat2 (b) Een meer realistische verdeling is f(x, y) = c (x 1) 2 (y 1) 4, waarbij de coördinaten (x,y) worden uitgedrukt in decameters tov de linksonderpositie van het 2 bij 2 vlak. Wat is c? (c) Wat is de kans dat de parachutist op de noordkant van het eiland belandt (dus 1 y 1.5)? (d) Bonusvraag: als je de kansdichtheid beschouwt, welke component van de wind is dan onvoorspelbaarder op het moment dat hij springt: die uit de noord-zuid (Y ) richting of die uit de oost-west richting (X)? Motiveer uw antwoord. 4. Men heeft 2 bloeddrukmeters tot de beschikking. Men denkt dat de 2e meter wellicht de neiging heeft hogere uitslagen te geven dan de eerste. In eerste instantie past men de 2 meters toe op dezelfde personen. t-test ------ Null hypothesis: mean = 0.0 Alternative: not equal Computed t statistic = -2.2014 P-Value = 0.0699673 Summary Statistics for App2 Summary Statistics for App1-App2 Count = 7 Count = 7 Average = 50.7143 Average = -3.0 Variance = 527.905 Variance = 13.0 Standard deviation = 22.9762 Standard deviation = 3.60555 Minimum = 29.0 Minimum = -7.0 Maximum = 100.0 Maximum = 4.0 Range = 71.0 Range = 11.0 Stnd. skewness = 2.21257 Stnd. skewness = 1.35499 Stnd. kurtosis = 2.65256 Stnd. kurtosis = 1.1728 3
(a) Stel de hypotheses op en toets deze bij α = 0.05 mbv bovenstaande gegevens. Ga hierbij uit van de normale verdeling. (b) Bereken die grens waarvoor we met 95% betrouwbaarheid kunnen zeggen dat de populatievariantie van de 2e meter (σ 2 2) eronder ligt. (c) Stel nu dat het ware verschil tussen de populatiegemiddeldes -2.0 is en dat men geen idee heeft welke meter hoger uit kan vallen dan de ander. Welke steekproefgrootte is dan noodzakelijk om een onderscheidingsvermogen van 0.9 te bereiken voor de toets bij α = 0.05? (d) Stel we gebruiken α = 0.1 in plaats van α = 0.05. Wordt de benodigde steekproef bij (c) dan groter of kleiner? Motiveer uw antwoord. 5. Korte vragen. Beargumenteer kort en bondig. (a) Waar of niet waar (2x)?: Stochasten A en B zijn ongecorreleerd. Dan zijn 2 A en 2 B ongecorreleerd. (tip: beschouw de punten (-1,1), (-1,-1),(2,0)) Stochasten A en B zijn onafhankelijk. Dan zijn 2 A en 2 B ongecorreleerd. (b) Men wil weten of defecten in een ader (zoals scheurtjes) op elke plaats met even grote kans(dichtheid) optreden. Stel de lengte van de ader op 1. We hebben geregistreerd hoe vaak defecten optreden in intervallen ter grootte 0.2. De data zijn als volgt: 0-0.2 0.2-0.4 0.4-0.6 0.6-0.8 0.8-1 6 7 4 8 10 Toets bij α = 0.05 of er inderdaad sprake is van de gestelde uniformiteit. (c) Juist of onjuist: als X een exponentiële verdeling volgt, dan doet 3X dat ook. (d) Tijdens de calibratie van een meetinstrument blijkt dat het instrument zuiver is en dat de standaarddeviatie van het meetinstrument gelijk aan 0.3 is. Wat is de kans op een gemiddelde afwijking groter dan 0.1 wanneer we 10 metingen doen? Nb. Bij de opgaven kunnen de volgende formules van nut zijn. P (A B) = P (A B) P (B) = P (B A)P (A) P (B) P (B) = P (B A)P (A) + P (B A )P (A ) X0 2 = k (O i E i ) 2 X 2 0 = i=1 k i=1 j=1 E i n = (n + 1)/2 r (O ij E ij ) 2 E ij d = µ µ 0 /(2 S p ) d = µ µ 0 /S 4
5