Grafische voorstellingen Onderzoek omtrent de lonen. Wat is uw huidige loon. Streep het gepaste hokje aan. q 40 000-45 000 q 45 000-50 000 q 50 000-55 000 q 55 000-60 000 q 60 000-80 000 q 80 000-100 000 Loon categoriën 40-45 45-50 50-55 55-60 60-80 80-100 Aantal arbeiders 6 10 13 20 28 23 Aantal arbeiders 20 10 40 45 50 55 60 80 100 Loon (in 1000 F) 1
Loon categoriën 40-45 45-50 50-55 55-60 60-80 80-100 Aantal arbeiders 6 10 13 20 28 23 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 80-85 85-90 90-95 95-100 6 10 13 20 7 7 7 7 6 6 6 5 20 Aantal arbeiders 10 40 45 50 55 60 65 70 75 80 85 90 95 100 Loon (in 1000 F) De correcte histogram Aantal arbeiders Categorie breedte 4 2 40 45 50 55 60 80 100 Loon (in 1000 F) Deel I : Beschrijvende statistiek 2
Beschrijvende statistiek in de literatuur Ongeveer 80% van de artikels in The American Psychologist gebruiken beschrijvende statistiek. The unbearable automaticity of being. Deconstructing the essential father. The origins of sex differences in human behaviour. Taking time seriously: a theory of socioemotional selectivity. Is melk gevaarlijk voor de gezondheid? 80 % van de heroïneverslaafden hebben eerst soft drugs gebruikt. Het gebruik van soft drugs is dus een etappe op de weg naar heroïne. 80 % van de heroïneverslaafden hebben eerst melk gedronken. Het gebruik van melk is dus een etappe op de weg naar heroïne. 3
De interessante informatie is: De proportie van soft drugs gebruikers die later heroïneverslaafden worden De proportie van mensen die geen soft drugs hebben gebruikt en die heroïneverslaafden worden. Deel II : kansrekening Experiment Winst verlies Speelt of niet < 4 +2-0.50 q q < 4 +2-2 q q < 4 +2-10 q q < x +10-10 q q 4
Veralgemening Van een steekproef naar de populatie. Een nieuwe leermethode Resultaten 0 1 2 3 4 5 6 7 8 9 10 Aantal leerlingen 0 0 1 0 2 3 3 5 2 3 1 Het gemiddelde in de steekproef: (1 2) + (2 4) + (3 5) +... +(3 9) + (1 10) 20 = 6.55 Het gemiddelde in de gewone populatie, met de oude leermethode : 5.85 Deel III : Inductieve statistiek II. Basisch begrippen 5
Populatie en steekproef Volgens een onderzoek ervaart één persoon op tien op een dag of de andere een psychologische stoornis. Van de 120 onderzochte personen, 12 tenminste al één keer een psychologische stoornis hebben ervaren Van alle europeanen die in de tweede helft van de XXste eeuw geboren zijn, één op tien tenminste één keer heeft een psychologische stoornis of zal ervaren Op basis van een onderzoek met 120 proefpersonen kan men met een redelijke betrouwbaarheid tot de volgende schatting komen: van alle europeanen die in de tweede helft van de XXste eeuw geboren zijn, één op tien tenminste één keer heeft een psychologische stoornis of zal ervaren De nederlandse man is 1.82 meter lang (De Standaard) Meer dan 40% van de Afrikanen moeten het stellen met een inkomen dat lager ligt dan 1 dollar (De Morgen) Gevreesd wordt dat 10 procent van de Britse bedrijven door het virus is getroffen (De Standaard) Slimme tieners beginnen later aan seks dan tieners met een gemiddelde intelligentie (De Morgen) De meerderheid van de Belgen (54%) vindt dat België en Europa niet militair mogen tussenkomen als er na de aanslagen in de V.S. een oorlog volgt (De Standaard) 6
Definitie : De gehele groep objecten of personen waarover informatie wordt gewenst, wordt de populatie genoemd. Individuele leden van de populatie worden elementen genoemd. Een steekproef is een gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te vergaren. Variabele Een variabele is een eigenschap die bij de elementen van de populatie of van de steekproef variëert. Voorbeeld : loon van de arbeiders, score van de leerlingen, haar kleur, sociabiliteit, geslacht, Een variabele is numeriek of niet I.Q. : 60, 73, 87, 90, 108, 112, 127,... Loon : 45350, 51912, 58873, 67985, 73200, 135500,... geslacht : 0, 1 haar kleur : bruin, rossig, blond, zwart sociabiliteit : zeer sociaal, sociaal, asociaal,... geslacht : mannelijk, vrouwelijk 7
Een variabele is kwantitatief (loon, reactietijd, I.Q. (?) ) of kwalitatief (haar kleur, sociabiliteit, geslacht 0-1, geslacht m/v, ) continu (leeftijd, I.Q., loon, ) of discreet (aantal zusters en broeders, opleiding, ) Budget voor boeken Maandelijks budget voor boeken in 187 stedelijke huisgezinnen en 123 landelijke huisgezinnen 8
Stad 275 105 250 455 355 620 330 350 300 50 145 275 500 900 450 230 90 135 145 90 620 450 80 70 450 455 420 330 450 360 900 450 230 410 620 410 330 450 560 370 620 330 250 280 355 550 360 350 300 230 530 80 70 1490 20 420 520 350 260 420 620 315 350 455 750 220 330 350 300 210 275 105 330 275 410 330 410 340 410 455 500 355 620 500 355 620 135 145 90 80 260 105 215 350 355 330 365 410 350 500 900 540 235 330 350 620 315 450 560 70 275 145 500 900 540 230 190 235 145 420 560 530 80 70 450 560 420 330 520 410 620 330 250 1280 355 550 360 370 260 235 455 355 620 500 355 620 135 145 90 80 530 80 70 1230 20 420 520 350 260 360 215 105 250 500 455 650 215 350 300 50 620 330 340 510 720 220 210 350 300 110 220 330 350 55 355 625 330 Land 340 190 300 220 235 110 145 250 210 280 520 135 365 105 275 215 450 110 500 275 550 370 420 190 145 410 450 250 455 500 350 520 90 360 455 55 215 360 370 315 530 550 145 510 275 350 250 330 210 450 620 230 210 280 135 220 500 620 625 650 420 550 550 80 300 105 355 450 275 420 520 260 145 510 410 330 510 145 370 355 560 420 230 110 315 355 190 450 455 350 330 455 410 210 530 300 145 220 260 455 540 620 420 135 540 350 625 105 650 720 340 235 750 720 135 650 750 410 625 520 750 520 625 Ordeningstechnieken 9
Frequentieverdeling Budget Frequentie Budget Frequentie Budget Frequentie 20 2 260 4 510 1 50 2 275 5 520 3 55 1 280 1 530 3 70 5 300 5 540 2 80 6 315 2 550 2 90 4 330 14 560 4 105 4 340 2 620 12 110 1 350 12 625 1 135 3 355 9 650 1 145 6 360 4 720 1 190 1 365 1 750 1 210 2 370 2 900 4 215 3 410 7 1230 1 220 3 420 6 1280 1 230 4 450 8 1490 1 235 3 455 6 250 4 500 7 Frequentieverdeling van het budget voor boeken in stedelijke huisgezinnen Lijndiagram 20 Aantal huisgezinnen 10 500 1000 1500 Budget in F Lijndiagram van het budget voor boeken in stedelijke huisgezinnen 10
Gegroepeerde frequentieverdeling klasse frequentie [ 0-100 [ 20 [ 100-200 [ 15 [ 200-300 [ 29 [ 300-400 [ 51 [ 400-500 [ 27 [ 500-600 [ 22 [ 600-700 [ 14 [ 700-800 [ 2 [ 800-900 [ 0 [ 900-1000 [ 4 [ 1000-1100 [ 0 [ 1100-1200 [ 0 [ 1200-1300 [ 2 [ 1300-1400 [ 0 [ 1400-1500 [ 1 Gegroepeerde frequentieverdeling van het budget voor boeken in stedelijke huisgezinnen Aantal huisgezinnen 40 20 Budget in F/maand 0 11
Histogram Aantal huisgezinnen 40 20 Budget in F/maand 0 Histogram van de gegroepeerde frequentieverdeling van het budget voor boeken in stedelijke huisgezinnen. Minder klassen 100 Aantal huisgezinnen klasse frequentie [ 0-500 [ 142 [ 500-1000 [ 42 [ 1000-1500 [ 3 50 Budget in F/maand 0 500 1000 1500 12
Stad Platteland klasse frequentie [ 0-100 [ 20 [ 100-200 [ 15 Absolute [ 200-300 [ 29 [ 300-400 [ 51 [ 400-500 [ 27 [ 500-600 [ 22 [ 600-700 [ 14 [ 700-800 [ 2 [ 800-900 [ 0 [ 900-1000 [ 4 [ 1000-1100 [ 0 [ 1100-1200 [ 0 [ 1200-1300 [ 2 [ 1300-1400 [ 0 [ 1400-1500 [ 1 klasse frequentie [ 0-100 [ 3 [ 100-200 [ 19 [ 200-300 [ 24 [ 300-400 [ 23 [ 400-500 [ 19 [ 500-600 [ 20 [ 600-700 [ 10 [ 700-800 [ 5 [ 800-900 [ 0 [ 900-1000 [ 0 [ 1000-1100 [ 0 [ 1100-1200 [ 0 [ 1200-1300 [ 0 [ 1300-1400 [ 0 [ 1400-1500 [ 0 Relatieve 14% 15% 187 123 Relatieve en absolute frequenties Absolute frequentie : aantal elementen met een bepaalde waarde of in een bepaalde klasse Relatieve frequentie : proportie van elementen met een bepaalde waarde of in een bepaalde klasse Rel. freq. = absolute frequentie steekproefgrootte Om vergelijkingen tussen steekproeven met verschillende steekproefgrootten te doen moet men altijd de relatieve frequentie gebruiken. 13
Relatieve frequentieverdelingen Stad Platteland klasse relatieve frequentie in % [ 0-100 [ 11 [ 100-200 [ 8 [ 200-300 [ 16 [ 300-400 [ 27 [ 400-500 [ 14 [ 500-600 [ 12 [ 600-700 [ 7 [ 700-800 [ 1 [ 800-900 [ 0 [ 900-1000 [ 2 [ 1000-1100 [ 0 [ 1100-1200 [ 0 [ 1200-1300 [ 1 [ 1300-1400 [ 0 [ 1400-1500 [ 1 klasse relatieve frequentie in % [ 0-100 [ 2 [ 100-200 [ 15 [ 200-300 [ 20 [ 300-400 [ 19 [ 400-500 [ 15 [ 500-600 [ 16 [ 600-700 [ 8 [ 700-800 [ 4 [ 800-900 [ 0 [ 900-1000 [ 0 [ 1000-1100 [ 0 [ 1100-1200 [ 0 [ 1200-1300 [ 0 [ 1300-1400 [ 0 [ 1400-1500 [ 0 Histogrammen van de relatieve frequenties 30 20 10 Rel. frequentie in % Stad Platteland Budget in F/maand 0 14