D..2. OEFENINGENREEKS 2 OEFENING Gegevens over de regenval (in cm) in South Bend (Indiana) over een periode van 30 jaar. Klasse K K f F f. 00 F. 00 n n 2,3 2, 3,7 3,7 3,4 3, 4 4,29 7,8 4, 4, 4 9 4,29 32,4,, 7 2 7,4,7, 2 8 7,4 4,29 7,8 7, 7 2 2 89,29 8,9 8, 2 27 7,4 9,43 9,0 9, 0 27 0 9,43 0, 0, 0 27 0 9,43,2, 28 3,7 00,00. Wat is de variatiebreedte (v) van deze frequentieverdeling als je kijkt naar de gegroepeerde data? Is dit gelijk aan de variatiebreedte die je kunt afleiden uit de ruwe data? Wat kan je uit de vergelijking van beide afleiden? v 2 2 0 v,9 2,84 9,07 Er is een klein verschil tussen beide variatiebreedtes: v > v. Hieruit kunnen we afleiden dat de variatiebreedte van de ruwe data (v ) iets nauwkeuriger is dan die van de gegroepeerde data (v ). 2. Aanvullen tabel. 3. Kies de gepaste maat voor centrale tendentie voor deze data. Geef duidelijk twee redenen aan waarom je voor die bepaalde maat gekozen hebt en geen andere. Modale klasse - geldig voor intervalschaal - niet gevoelig voor outliners BA PSYCH 203-204 Statistiek Oefeningenreeks 2
4. Geef bij benadering de mediaan en de interkwartielafstand a.d.h.v. grafische interpolatie (dus je kiest de juiste grafiek om te tekenen). Geef ook het typische kenmerk van deze spreidingsmaat en illustreer het met dit voorbeeld. 2 Relatieve cumulatieve frequentiecurve 00 7 0 2 0 0 2 4 8 0 2 4 Mediaan: md, F md " 4 0% " F md " Interkwartielafstand: Q P " P " 7, 4, 3 " 0% van de waarden liggen in de interkwartielafstand, slechts 2% liggen erbuiten, waardoor de interkwartielafstand niet gevoelig is voor outliners.. Geef bij benadering P " en P a.d.h.v. grafische interpolatie en beschrijf in woorden wat dit eigenlijk wil zeggen. P " 7, % van alle waargenomen waarden is kleiner dan 7,. P 7,9 88% van alle waargenomen waarden is kleiner dan 7,9. BA PSYCH 203-204 Statistiek Oefeningenreeks 2 2
OEFENING 2 Bivariate frequentietabel, met X # broers en Y # zussen Y 0 2 3 X 0 0 2 0 0 2 2 0 2 0 3 0 0 3 2 0 0 0 OEFENING 3 Bivariate frequentietabel, met X # maaltijden ( ) en Y fooi ( ) Y 0,0 0,0 0,7 0,8,00 X 4,0 0 0 0 0 4,2 0 0 0 0,79 0 0 0 0,24 0 0 0 0,3 0 0 0 0 x, y 0,74 s (x,) 0,272 0,79 s (x 0,74) 0,034 0,77. Maak een spreidingsdiagram van de gegevens. Fooi i.f.v. de maal9jd ( ),0 0,9 0,9 0,8 0,8 0,7 0,7 0, 0, 0, 0, 0,4 0,4 4 4,2 4, 4,7,2,,7,2,,7 BA PSYCH 203-204 Statistiek Oefeningenreeks 2 3
Juno KOEKELKOREN 2. Bereken, indien mogelijk, de covariantie en de correlatiecoëfficiënt 𝑟. 𝑐𝑜𝑣" 𝑥 𝑥 𝑦 𝑦 4,0,0 0,0 0,74 + 4,2,0 0,0 0,74 +,79,0 0,7 0,74 +,24,0 0,8 0,74 +,3,0,00 0,74. 0,24 + 0,88. 0,4 + 0,29. 0,0 + 0,74. 0, + 0,8. 0,2 0,24 + 0,232 + 0,0029 + 0,084 + 0,22. 0,8 0,334 𝑟" "#" ( (.,"#),"#$".,"#$) 0,94 3. Stel de vergelijking voor de regressierechte op: bereken de helling (regressiecoëfficiënt) en de constante (intercept) van de fooi 𝑌 op de prijs van de maaltijd 𝑋. 𝒀 𝒃𝟎 + 𝒃𝟏 𝑿 𝟎, 𝟒𝟒 + 𝟎, 𝟐𝟏𝑿,"#$ 𝑏 𝑟" 0,9. 𝑏 𝑦 𝑟" 𝑥 0,74 0,237., 0,43 BA PSYCH 203-204,"#$# 0,237 Statistiek Oefeningenreeks 2 4
OEFENING 4 Bivariate frequentietabel, met X leeftijd (in maanden) en Y lengte (in cm) Y 8 90 9 93 94 9 X 3 0 0 0 0 0 48 0 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 7 0 0 0 0 0 0 0 0 0 0 0 x y 9, s (x ) 0 7,74 s (x 9,) 3, 2,98. Maak een spreidingsdiagram van de gegevens. 9 Lengte i.f.v. de leecijd 94 Lengte (in cm) 92 90 88 8 84 30 3 40 4 0 0 Lee\ijd (in maanden) BA PSYCH 203-204 Statistiek Oefeningenreeks 2
Juno KOEKELKOREN 2. Bereken de covariantie en daarna de correlatiecoëfficiënt 𝑟 en interpreteer. 𝑐𝑜𝑣" 𝑥 𝑥 𝑦 𝑦 3 8 9, + 48 90 9, + 9 9, + 4 93 9, + 7 94 9, + 0 9 9,., + 3., + 0. 0, + 3., +. 2, + 9. 3, 82, + 4, + 0 + 4, + + 3,. 38 23 "# " " 0,994 𝑟" ( ". ", ) De trend van de grafiek is stijgend (𝑟" > 0). Daarenboven is 𝑟" aan de hoge kant waaruit we kunnen afleiden dat er een sterk verband bestaat tussen de leeftijd en de lengte van het kind. Grote positieve correlatie 3. Bereken de helling (regressiecoëfficiënt) en het intercept van de kleinste kwadrantenregressielijn van Sarah s lengte 𝑌 op leeftijd 𝑋. Stel de vergelijking op. 𝒀 𝒃𝟎 + 𝒃𝟏 𝑿 𝟎, 𝟑𝟖𝑿 + 𝟕𝟐, 𝟎𝟒 ", 𝑏 𝑟" 0,99. 𝑏 𝑦 𝑟" 𝑥 9, 0382. 72,03 " 0,382 4. Teken o.b.v. de gegevens die je hebt gekregen ook de best passende rechte op het spreidingsdiagram. Zie vraag. Hoeveel groeit Sarah gemiddeld per maand volgens deze regressierechte? Is dit meer of minder dan de gemiddelde meisjes van haar leeftijd als je weet dat zij gemiddeld cm per jaar groeien. 𝑆𝑎𝑟𝑎ℎ/𝑚𝑎𝑎𝑛𝑑 𝟎, 𝟑𝟖 𝑀𝑒𝚤𝑠𝚥𝑒/𝑚𝑎𝑎𝑛𝑑 " 𝟎, 𝟓 Sarah groeit minder dan de gemiddelde meisjes van haar leeftijd. BA PSYCH 203-204 Statistiek Oefeningenreeks 2
. Stel dat de lengte in mm wordt uitgedrukt. Wat is dan de covariantie en de correlatiecoëfficiënt van X en Y? Stel dat de lengte in mm wordt uitgedrukt en de leeftijd in jaren. Wat is dan de covariantie en de correlatiecoëfficiënt van X en Y? r " blijft in beide gevallen 0,99. Deze is namelijk onafhankelijk van de meeteenheid. cov " is wel gevoelig voor veranderingen in meeteenheid. cov cov x x 0 y y 2,3 x x 0 y y. 2 9,7 OEFENING Bivariate frequentietabel Y 7 X 0 2 2 y 7 0x + 7. Maak een spreidingsdiagram van de gegevens en zoek de vergelijking van de regressierechte, zonder berekening. y 8 7 4 3 2 0 Spreidingsdiagram 0 0 20 2 30 x y 7 0x + 7 BA PSYCH 203-204 Statistiek Oefeningenreeks 2 7
Juno KOEKELKOREN 2. Bereken de correlatie. 𝑥, 𝑦 7 𝑠 𝑠 𝑟" 33,33 𝑥 7 0 0 𝑐𝑜𝑣" 𝑥, 𝑥 𝑥 𝑦 𝑦 0, 7 7 +, 7 7 + 2, 7 7 + 2, 7 7. 0 0 4 "# " 0 3. Bereken de regressierechte van 𝑦 op 𝑥. 𝒀 𝒃𝟎 + 𝒃𝟏 𝑿 𝟕 + 𝟎𝑿 𝟕 𝑏 𝑟" 0 𝑏 𝑦 𝑟" 𝑥 7 0., 7 BA PSYCH 203-204 Statistiek Oefeningenreeks 2 8
OEFENING. Welke associatiemaat gebruik je best om het verband tussen die twee variabelen te analyseren? Waarom? Kendall s τ De aantrekkelijkheid van een persoon wordt geordend in een ordinale schaal. De enige associatiemaar die kan toegepast worden op variabelen van dit niveau is Kendall s τ. 2. Bereken Kendall s τ. Tabel: Individuele aantrekkelijkheid van echtparen Koppel Man Vrouw 9 7 2 3 4 3 3 4 2 7 Tabel: Paarsgewijze vergelijking van de scores Paar koppels Man Vrouw Product (,2) - - + (,3) - - + (,4) - - + (,) - - + (2,3) 0-0 (2,4) + - - (2,) + + + (3,4) + + + (3,) + + + (4,) + + + τ gemiddelde producten som producten # paren 7 0, 70 0 + > Kendall s τ > 0 er bestaat een stijgend verband BA PSYCH 203-204 Statistiek Oefeningenreeks 2 9
Juno KOEKELKOREN OEFENING 7 3 4 3 + 8 + 2. 𝒂𝒃,2,3 2. 𝒃 𝒂 niet gedefinieerd 2 3 + 8 + 2 3 3. 𝒃 𝒂 3,4, 4. 𝒂𝒄 niet gedefinieerd. 𝒄 𝒅 niet gedefinieerd. 𝒄 𝒅 7. 𝒅𝒄,,7,8 9. 𝟏 𝒅 𝒄 + 𝟏 𝒄,7,8,9 0. 𝑐 𝒄. (𝟏 𝒄)𝒅 40 + 4 + 70 + 88 22 7 8 8,9,0,,,, 8. 8 9 0 8 9 0 7 8 40 + 4 + 70 + 88 22 4 8 + 9 + 0 + 4 9, 30 + 42 + + 72 200 7 8 (30,3,42,48) 2 8,9,0, (208,234,20,28) BA PSYCH 203-204 Statistiek Oefeningenreeks 2 0
OEFENING 8 X tijd (in uren) Y afgelegde afstand (in km) Y b X + b Y 20(X 2) Afgelegde afstand i.f.v. de 9jd 200 0 00 0 0 2 4 8 20 22 24 OEFENING 9 X gewicht (in kg) Y # weken te vroeg geboren Y b X + b Y 0,X + 3,4 3, 3 2, 2 Gemiddelde geboortegwicht i.f.v. # weken te vroeg geboren, 0 2 4 8 0 BA PSYCH 203-204 Statistiek Oefeningenreeks 2
Juno KOEKELKOREN OEFENING 0 Frequentieverdeling voor de punten op een examen (op 20).. Gegroepeerde cumulatieve frequentiecurve: B & E 2. Spreidingsmaat d 𝑑 " " " 𝑑 𝑑. 0,2. 0,2 𝑑 𝑑 Spreidingsmaat d is toepasbaar bij variabelen van alle soorten schalen en is daarenboven niet gevoelig voor outliners. OEFENING Frequentieverdelingen voor de lengte (in cm) van leerlingen in het eerste leerjaar in school A en school B. School A 0 0 0 [0,70[ [70,80[ " 𝑑 𝑑 School B 𝑑 " " [80,90[ [90,00[ [00,0[ [0,20[ 0 [0,70[ [70,80[ [80,90[ [90,00[ [00,0[ [0,20[ " " BA PSYCH 203-204 " " " "# " " "# " ". "# " ". "# " Statistiek Oefeningenreeks 2 2
OEFENING 2 Frequentieverdelingen voor de afkomst van leerlingen in twee scholen (A en B). School A School B 40 30 20 0 0 00 80 0 40 20 0 d " " "# d ". " " " " " " "# d ". " " " " BA PSYCH 203-204 Statistiek Oefeningenreeks 2 3