Business Administration / Bedrijfskunde Schriftelijk tentamen - UITWERKINGEN Algemeen Vak : Statistische Methoden Groep : niet van toepassing en Technieken Vakcode : BKB0019t Soort tentamen : gesloten boek Datum : 18 maart 2008 Tijd : 13.30-16.30 uur Docent(en) : dr J. van Dalen Aantal pagina s : 9 (incl. voorblad) Opmerkingen De uitwerkingen in dit formulier betreffen antwoordschetsen. Alternatieve formuleringen zijn niet bij voorbaat uitgesloten. De puntenverdeling die binnen de onderdelen wordt genoemd, is indicatief. Bij de precieze allocatie van punten wordt mee rekening gehouden met de kwaliteit van het gehele antwoord. Schoonheidsfoutjes in de uitwerkingen zijn niet uitgesloten. graag doorgeven. Nadruk en verdere verspreiding verboden 1 Eventuele missers
Vraag 1: Ontwikkeling vrachtprijzen tankers (a) Gevraagd: onderzoek positieve samenhang (H 1 ) tussen jaarlijkse vrachtprijzen van Aframax (A) en Suezmax (S) tankers; α is 1%. 1. H 0 : ρ S,A 0; H 1 : ρ S,A > 0 / 1 r 2. T = r 2 n 2 3. T t(n 2) = t(27 2) = t(25) 4. r >> 0.0, T obs >> 0 5. α=0.01 6. +t 25,0.01 = +2.485 / 7. T obs = 0.968 1 0.968 2 27 2 = 19.287 > +2.485 = +t 25,0.01 verwerp H 0 op α = 1%: de correlatiecoëfficiënt tussen de jaarlijkse vrachtprijzen van Suezemax en Aframax tankers is significant positief op een significantieniveau van 1%. (b) Gevraagd: (i) veronderstelling over populatie vrachtprijzen en (ii) alternatieve toetsgrootheid bij ernstig schenden veronderstelling. Uitvoeren van de toetsprocedure op basis van de Pearson correlatiecoëfficiënt vooronderstelt dat de steekproef is getrokken uit een gezamenlijk normaal verdeelde populatie van vrachtprijzen. (3 pnt) Als de veronderstelling van gezamenlijke normaliteit ernstig wordt geschonden kan men gebruik maken van de niet-parametrische toets op basis van de Spearman rangcorrelatie.(3 pnt) Opmerking: De Mann-Whitney toets is hier niet van toepassing, omdat (1) niet wordt gevraagd naar verschillen tussen gemiddelden (medianen) en (2) de steekproeven niet onafhankelijk zijn. Indien men al een verdelingsvrij alternatief voor een t-toets op gelijkheid van gemiddelden zoekt, dan zou de Wilcoxon signed ranks-test voor gepaarde steekproeven meer geëigend zijn. 2
(c) Gevraagd: (i) uitleg waarom een independent samples t-test hier niet geschikt is, en (ii) de waarde berekenen van de toetsgrootheid die wel geëigend is. (i) De independent samples t-test is niet geëigend is, omdat de deelpopulaties van vrachtprijzen van Suezmax en Aframax tankers niet onafhankelijk, maar afhankelijk zijn verdeeld. Per jaar zijn telkens twee observaties beschikbaar, van Suezmax en Aframax tankers. Onafhankelijkheid wordt bij de independent samples t-toets voorondersteld. (2 pnt) (ii) Vanwege de afhankelijkheid van de deelpopulaties moet de dependent samples t-test worden gebruikt. Bij het toetsen van gelijkheid van populatiegemiddelden is deze gedefinieerd als: T = (X S X A )/(S D / n), waarbij S D = S 2 D met S2 D = S2 S + S2 A 2r S,AS S S A. Het verschil tussen de steekproefgemiddelden bedraagt: X S X A = 19960.46-16658.83 = 3301.63. De variantie van het verschil tussen vrachtprijzen bedraagt: S 2 D = 12062.0652 + 8663.458 2 2 0.968 12062.065 8663.458 = 18238477.93 = 4270.653 2. De waarde van de toetsgrootheid volgt als: T = (X S X A )/(S D / n) = 3301.63/(4270.653/ 27) = 3301.63/821.888 = 4.017. (4 pnt) (d) Gevraagd: onderzoeken veronderstelling dat gemiddelde vrachtprijs Suezmax (S) tankers meer dan 1500 $/dag hoger ligt dan die van Aframax (A) tankers; α is 5%. 1. H 0 : µ S µ A 1500 (of µ D 1500); H 1 : µ S µ A > 1500 (of µ D > 1500) 2. T D = (X S X A µ D )/(S D / n) = (D 1500)/(S D / n) 3. T t(n 1) = t(27 1) = t(26) 4. X S X A >> 1500, T obs >> 0 5. α = 0.05 6. t 26,0.05 = 1.706 7. T obs = (3301.63 1500)/(4270.653/ 27) = 1801.63/821.888 = 2.192 > 1.706 verwerp H 0 op α = 5%: er is voldoende empirische ondersteuning voor de bewering dat het verschil tussen gemiddelde vrachtprijzen groter is dan 1500 $/dag bij een significantieniveau van 5%. Opmerking: indien men er voor had gekozen om de geschatte standaardfout over te nemen uit de opgave als 800 $/dag, dan is T obs = 1801.63/800 = 2.252 en volgt hetzelfde toetsresultaat (ten laste van 1 punt). 3
Vraag 2: Onderzoek CAO gemeenten (a) Gevraagd: berekenen ontbrekende waargenomen frequenties kruistabel zorg * leeftijd Crosstabulation leeftijd zorg jonger <=35 ouder >= 50 Total nee Observed 215 1037 1252 Expected 241.7 1010.3 1252.0 ja Observed 261 953 1214 Expected 234.3 979.7 1214.0 Total Observed 476 1990 2466 Expected 476.0 1990.0 2466.0 Een toelichting op berekening is gewenst: jong, bezorgd : 4325 0.11 0.548 = 261 (= 260.711) jong, niet bezorgd : 4325 0.11 0.452 = 215 (= 215.039) oud, bezorgd : 4325 0.46 0.479 = 953 (= 952.971) oud, niet bezorgd : 4325 0.46 0.521 = 1037 (= 1036.530) (b) Gevraagd: toets onafhankelijkheid bezorgdheid toename werkdruk en leeftijdsklasse; α is 1%. 1. H 0 : Zorg en Leeftijd zijn onafhankelijk verdeeld; H 1 : Zorg en Leeftijd zijn niet onafhankelijk verdeeld 2. Y = r c i=1 j=1 ( O ij E ij 0.5) 2 E ij 3. Y χ 2 (r 1)(c 1) = χ 2 (1 1) = χ 2 (1) 4. Y >> 0 5. α = 0.01 6. χ 2 1,0.01 = 6.635 7. Y obs = 7.132 > 6.635 verwerp H 0 op α=1%: de samenhang tussen zorg over werkdruk en leeftijdsklasse is significant bij een significantieniveau van 1% (p = 0.008). Let op: gebruik Yates continuïteits gecorrigeerde toetsgrootheid, keuze vrijheidsgraden, eenzijdige toetsing, en adequate conclusie naar aanleiding van resultaat in stap 7. Aftrek toepassing Pearson χ 2 -grootheid 2 punten. 4
(c) Gevraagd: (i) berekenen maatstaf φ; (ii) interpretatie φ in dit geval; en (iii) tekortschieten maatstaf φ voor willekeurige kruistabel. (i) De maatstaf φ wordt berekend als: φ = 7.407/2466 = 0.0548 (als men de Pearson grootheid gebruikt) of φ = 7.132/2466 = 0.0538 (als men de Yates grootheid gebruikt). (2 pnt) (ii) In het geval van een 2 2 tabel is φ gelijk aan de Pearson correlatiecoëfficiënt r toegepast op de twee betrokken (dummy)variabelen. Aangezien deze in absolute waarde altijd tussen 0 (geen samenhang) en 1 (perfecte samenhang) ligt, is de uitkomst van φ automatisch goed te interpreteren. Hier is de gevonden mate van samenhang φ = 0.054 = r dus gering mede als gevolg van het grote aantal observaties. (2 pnt) (iii) Bij grotere tabellen is φ niet meer gelijk aan r, en ligt zelfs niet meer noodzakelijk tussen 0 en 1. De interpretatie als correlatiecoëfficiënt gaat dan niet langer op. (2 pnt) (d) Gevraagd: minimaal gewenste steekproefomvang opdat te onderzoeken samenhang nog juist significant is op α gelijk aan 5%. In het algemeen geldt dat als de steekproefomvang k zo groot wordt dat dan ook de Pearson χ 2 -toetsgrootheid k zo groot wordt (allerlei steekproefvariatie buiten beschouwing latend). Een samenhang die juist significant is op α gelijk aan 5% heeft een uitkomst van de toetsgrootheid gelijk aan de kritieke waarde χ 2 1,0.05 = 3.841. Uitgaande van de huidige toetsresultaten betekent dit dat k Y obs = χ 2 1,0.05, zodat de vermenigvuldigingsfactor gelijk wordt aan k = χ 2 1,0.05 /Y obs. Dit komt uit op k = 3.841/7.407 = 0.5186 (in het geval van Pearson) of k = 3.841/7.132 = 0.5386 (in het geval van Yates). De minimaal gewenste steekproef is dus n = k 2466, hetgeen gelijk is aan 1278.78 1279 in het geval van Pearson, of 1328.09 1329 in het geval van Yates. De 2466 is de gebruikte steekproefomvang in deze situatie. 5
Vraag 3: Brandstofverbruik nieuwe automodellen (a) Gevraagd: beoordelen bewering dat toename gewicht (GW) met 100 kg leidt tot verhoging brandstofverbruik met meer dan 0.5l/100km; α is 1%. 1. H 0 : 100β GW 0.5 (of β GW 0.005) H 1 : 100β GW > 0.5 (of β GW > 0.005) 2. T = ( ˆβ GW β GW )/S ˆβ = GW ( ˆβ GW 0.005)/S ˆβ GW 3. T t(n K 1) = t(92 7 1) = t(84) 4. ˆβ GW >> 0.005, T obs >> 0 5. α = 0.01 6. +t 84,0.01 = +2.372 7. T obs = (0.008 0.005)/0.001 = 3.0 > +2.372 verwerp H 0 op 1%: er is voldoende empirische ondersteuning voor de bewering dat een stijging van het gewicht met 100 kg leidt tot een stijging van het brandstofverbruik met meer dan 0.5l/100km. (b) Gevraagd: (i) p-waarde resultaat rechtseenzijdige toets op positief effect productieregio (PL); en (ii) oordeel significantie toetsresultaat als wordt uitgegaan van een significantieniveau van 5%. De nul- en alternatieve hypothesen die worden getoetst, zijn te schrijven als H 0 : β PL 0, H 1 : β PL > 0 (niet gevraagd, wel nodig) (i) De p-waarde bij het toetsresultaat voor de genoemde hypothesen wordt gevonden als (4 pnt): P( ˆβ PL > ˆβ PL,obs H 0 ) = P(T > ˆβ PL,obs /S ˆβ PL ) = P(T >.311/.212 = 1.467) P(Z > 1.467) = 0.072 De kans 0.072 vindt men in de tabel voor de standaard normale verdeling tussen 0.072 en 0.071. (ii) Uitgaande van α gelijk aan 5%, is dit toetsresultaat niet significant (H 0 : geen positief effect, blijft gehandhaafd), aangezien p = 0.072 > 0.05 = α. (2 pnt) 6
(c) Gevraagd: (i) beoordelen significantie effect wielbasis (WB) op basis p- waarde en α gelijk aan 1.5%; (ii) (statistische) verklaring voor negatieve effect (i) Het geschatte effect van de wielbasis (Wielbas) op het brandstofverbruik is significant negatief ( ˆβ WB = -3.988, p=0.002). De p-waarde van het geschatte effect is kleiner dan het significantieniveau van de toets: p = 0.002 < 0.015 = α. (2 pnt) (ii) Brandstofverbruik hangt samen met het benodigde vermogen dat op haar beurt samenhangt met de grootte van de auto. Nu bevat het geschatte regressiemodel verschillende variabelen die dit aspect van volume weergeven: gewicht, aantal cilinders, cilinderinhoud, aantal passagiers en wielbasis. Deze variabelen zijn onderling sterk gecorreleerd (tol GW = 0.115, tol WB = 0.172, et cetera). Hier zou dus een multicollineariteitsprobleem kunnen zijn in de zin dat het effect van de wielbasis voor een belangrijk deel al door de andere volume-variabelen wordt weergegeven los dus van het geconstateerde significante effect van de wielbasis. Een tweede aanwijzing voor deze diagnose is het feit dat de Pearson correlatiecoëfficiënt van wielbasis en brandstofverbruik, zeg de samenhang voor opschonen, sterk positief is (r =.724). (2 2 pnt) (d) Gevraagd: Onderzoek veronderstelling dat gezamenlijke bijdrage van cilinderinhoud (CilInh, CI) en productieregio (ProdLand, PL) nihil is; α is 5% Uitvoeren toets op meervoudige restricties (partial F-test): 1. H 0 : β CI = β PL = 0; H 1 : β CI en β PL niet beide gelijk aan 0 2. F = (SSE R SSE U )/r SSE U /(n K 1) 3. F F(r, n K 1) = F(2, 84) 4. F >> 1 5. α = 0.05 6. F 2,84,0.05 = 3.10 (tussen 3.12 en 3.09) 7. (61.843 60.296)/2 F obs = = 0.7735/0.718 = 1.077 < 3.10 = 60.296/84 F 2,84,0.05 handhaaf H 0 op α gelijk aan 5%: de gezamenlijke bijdrage van cilinderinhoud en productieregio aan de verklaring van variatie van het brandstofverbruik is niet niet significant op 5%. Let op: formulering H 0 /H 1 ; keuze toetsgrootheid; vrijheidsgraden; interpretatie toetsresultaat; ten onrechte uitvoeren van niet-gevraagde toets op hele model is alsnog met 2 pnt gehonoreerd 7
Vraag 4: Schapruimte bakkerijproducten (a) Gevraagd: (i) grafische illustratie interactie-effect; en (ii) korte beschrijving van de aard en de mate van interactie. Beschrijving aard en mate interactie: de gemiddelde verkopen van reguliere displays op een bodem-positie, gelijk aan 62.9 per maand, hoger zijn dan verwacht op basis van de maandelijkse verkopen 55.7 van extra brede displays op een bodem-positie en het verdere verloop van de grafiek. Grafisch blijkt dit uit het feit dat de lijnen van de gemiddelde maandelijkse verkopen van reguliere en extra brede displays niet helemaal evenwijdig lopen. (2 3 pnt) (b) Gevraagd: onderzoek interactie-effect displayhoogte en displaybreedte op verkopen; α is 2.5%. 1. H 0 : γ 11 = γ 12 =... = γ 32 = 0; H 1 : niet alle interactie-effecten γ ij gelijk aan 0 2. F = MSB γ /MSW 3. F F((a 1)(b 1), n ab) = F((3 1)(2 1), 18 3 2) = F(2, 12) 4. F >> 1 5. α = 0.025 6. F 2,12,0.025 = 5.10 7. F obs = (152.658/2)/(75.767/12) = 76.329/6.314 = 12.089 > 5.10 verwerp H 0 : displayhoogte en displaybreedte hebben een significant interactie-effect op de maandelijkse verkopen bij een significantieniveau van 2.5%. 8
(c) Gevraagd: (i) 95%-betrouwbaarheidsinterval voor verschil verwachte maandelijkse verkopen van extra brede displays op midden-positie (E, M) en reguliere displays op bodem-positie (R, B); en (ii) beoordelen wijze van intervalschatten voor verschillen alle zes displaytypen (i) Een 95%-B.I. voor µ E,M µ R,B volgt als (4 pnt): 1 X E,M X R,B ± t n ab,α/2 MSW + 1 n E,M n R,B 78.9 62.9 ± t 12,0.025 1 6.314 3 + 1 3 16.0 ± 2.179 2 6.314 3 16.0 ± 4.471 (11.529; 20.471) (ii) Deze aanpak is wel geschikt voor het schatten van specifieke paarsgewijze verschillen, maar niet voor het gelijktijdig (simultaan) schatten van alle paarsgewijze verschillen tussen gemiddelden. Dit laatste vereist simultane betrouwbaarheidsintervalschattingen, zoals Tukey s HSD, die in het algemeen tot bredere (onnauwkeurigere) intervallen leiden. (2 pnt) (d) Gevraagd: (i) populatieregressiemodel verklaring maandelijkse verkopen op basis van de directe effecten van displayhoogte en displaybreedte; en (ii) parameterschattingen display-effecten. Vooraf te berekenen: dummyvariabelen voor de drie hoogtes, dbodem, dmidden, en dtop, en de twee breedtes, dregulier en dextra. Het gevraagde regressiemodel is dan te schrijven als (3 pnt): Demand = α + β 1 dmidden + β 2 dtop + β 3 dextra + ɛ, ɛ n(0, σ 2 ) waarbij dbodem en dregulier zijn weggelaten. Parameterschattingen display-effecten (3 pnt): ˆβ 1 = Demand M Demand B = 75.700 59.300 = 16.400 ˆβ 2 = Demand T Demand B = 50.333 59.300 = 8.967 ˆβ 3 = Demand E Demand R = 62.200 61.356 = 0.844 Opmerking: vanwege het gebalanceerde complete experimentele ontwerp zijn de factoren displayhoogte en displaybreedte onafhanklijk verdeeld. Dit heeft tot gevolg dat de geschatte display-effecten op dezelfde manier kunnen worden berekend als bij het schatten van afzonderlijke modellen voor displayhoogte en -breedte. 9