Inleiding tot de meettheorie Meten is het toekennen van cijfers aan voorwerpen. Koeien Koeien in een kudde, studenten in een auditorium, mensen met een bepaalde stoornis, leerlingen met meer dan 15 in wiskunde, Meettechniek : tellen De grootte van twee kudden samen is de som van de grootten Absolute schaal 1
Lengte A B l A < l B Onmogelijk om te tellen. A B C l C = l A + l B Meettechniek : een meeteenheid kiezen en tellen. B 1cm 1cm 1cm 1cm 1cm 1cm l B = 6cm Ratio schaal De keuze van de meeteenheid is willekeurig. De omzetting van een meeteenheid naar een andere gebeurt door het vermenigvuldigen met een constante : centimeter naar meter : 0.01 centimeter naar millimeter : 10 centimeter naar duim : 0.3937 Andere voorbeelden : massa, spanning, oppervlakte,... 2
Tijd m 0 m 1 m 2 t 1 < t 2 Onmogelijk om te tellen, zelfs na de keuze van een meeteenheid. Meettechniek : een meeteenheid en een oorsprong kiezen. Dan tellen. De keuze van de meeteenheid en de oorsprong is willekeurig. De omzetting van een meeteenheid naar een andere gebeurt door het vermenigvuldigen met een constante a en het optellen van een constante b Brussel naar L.A. : a = 1 en b = -9 Christelijk naar moslim : a = 1.02 en b = -622 Andere voorbeelden : temperatuur,... Celsius naar Fahrenheit : a = 9/5 en b = 32 Interval schaal We kunnen niet twee ogenblikken samenbrengen zoals twee kudden of twee potloden. Maar we kunnen twee intervallen tussen ogenblikken samenbrengen. xz x y z tijd xy yz Het interval tussen twee ogenblikken wordt op een ratio schaal gemeten. Voorbeelden : leeftijd, reactietijd, duur van een taak,... 3
Gorillas We kunnen niet het overheersende karakter van twee gorillas samen definiëren. We kunnen ook niet het interval tussen twee gorillas definiëren. De waarden van de variabele overheersend karakter duiden slechts een volgorde aan. Ordinale schaal Meettechniek : ken de waarde 0 toe aan het eerste element in de volgorde. Dan 1 aan het tweede element, enz Speel gedrag 0 : alleen en speelt niet 1 : met 1 kind en speelt niet 2 : met >1 kinderen en speelt niet 3 : speelt alleen 4 : speelt met 1 kind 5 : speelt met >1 kinderen, Zelfs de volgorde is niet belangrijk : 4 is niet socialer dan 2. Meettechniek : geen Nominale schaal Voorbeelden : haar kleur, geslacht, beroep,... 4
Zinvolle en zinloze beweringen Een bewering is zinloos als ze afhankelijk is van de schaal (vergelijking van de gemiddelden van Tchmil en Spruch). Een bewering is zinvol als ze onafhankelijk is van de schaal (vergelijking van de medianen van Tchmil en Spruch). Absolute schaal Meettechniek : tellen. De oorsprong en de eenheid zijn vast. Geen andere schaal is mogelijk. Iedereen gebruikt dezelfde schaal. Alle beweringen zijn zinvol. Altijd discreet. 5
Ratio schaal Het is mogelijk de unie van twee of meer voorwerpen te vergelijken met een voorwerp. Meettechniek : eenheid kiezen en tellen. De oorsprong is vast. Aantal mogelijke schalen : oneindig. Omzetting van een schaal naar de andere : vermenigvuldiging met een constante. Altijd continu. Voorbeelden van zinvolle beweringen : x=2y, x y, x =1.5y n 1 x  x i =1.5 1  y j n y n x i =1 x =1.5y n y j =1 n 1 x  a x i = 1.5 1 a y j n x n y i =1 a 1 n x  x n i = 1.5a 1 x ny i =1 n y  j=1 n y  y j j =1 n 1 x  x n i =1.5 1  y x n j y i =1 n y j =1 x i = a x i en y j = a y j x =1.5 y Voorbeelden van zinloze beweringen : x=2, x > y-1, x = y +3 6
Waarom is x y-1 zinloos? x = 2cm, x y-1 x' = 20mm, x' < y'-1 y = 2.5cm y' = 25mm, Interval schaal Het is mogelijk intervallen tussen twee voorwerpen te vergelijken Het is mogelijk de unie van twee of meer intervallen te vergelijken met een interval. Meettechniek : eenheid en oorsprong kiezen, dan tellen. Aantal mogelijke schalen : oneindig. Omzetting van een schaal naar de andere : met een constante vermenigvuldigen en een constante toevoegen. Altijd continu. 7
Voorbeelden van zinvolle beweringen : x-y = 2 (z-w), x-y > z-w, x < y Voorbeelden van zinloze beweringen : x= 2y, md x = 3 md y, x = 0.5y Opmerking : regels zoals het gemiddelde mag met interval of ratio schalen gebruikt worden zijn niet geldig. Ordinale schaal Het is niet mogelijk intervallen tussen twee voorwerpen te vergelijken. De te meten voorwerpen zijn geordend. Meettechniek : de volgorde van de metingen moet dezelfde zijn als de volgorde van de voorwerpen. Aantal mogelijke schalen : oneindig. Omzetting van een schaal naar de andere : niet simpel. Voorbeelden van zinvolle beweringen : x > y, md x > md y, mo x < mo y Voorbeelden van zinloze beweringen : x-y = 2(z-w), s x s y, x < y 8
Verboden bewerkingen : Optellen en vermenigvuldigen. Nominale schaal De te meten voorwerpen zijn niet geordend. Meettechniek : geen. Aantal mogelijke schalen : oneindig. Omzetting van een schaal naar de andere : niet simpel. Voorbeelden van zinvolle beweringen : f 1 > f 2, f 1 + f 2 f 3 + f 4 Voorbeelden van zinloze beweringen : x > y, md x > md y, mo x < mo y Verboden bewerkingen : Optellen, vermenigvuldigen en vergelijken. 9
Ordeningstechnieken Ruwe data Een steekproef is een reeks elementen uit een populatie Voorbeeld : (Piet, Bart, Els) Bij elk element heeft de geobserveerde variabele een waarde. Voorbeeld : (1.70, 1.80, 1.70) Deze reeks bevat de (ruwe) data Deze reeks wordt vaak ten onrechte een steekproef genoemd. 10
Vector notatie Ê x 1 ˆ Kolomvector : x 2 Symbool : x x = : Ë x n Ê Ë x 1 x 2 : x n ˆ (x 1, x 2,, x n ) is het getransponeerde vector van x. Symbool : x T. Het is een rijvector. Het getransponeerde vector van een rijvector is een kolomvector. Dus, (x T ) T = x. De dimensie van de vector is n. Voorbeeld X = grootte van een persoon Ê 1.70ˆ x = 1.80 Ë 1.70 x duidt de data aan. De dimensie van x is 3. 11
Frequentieverdeling De verschillende geobserveerde waarden van de variabele X. zijn x 1, ẋ 2,, ẋ p p is het aantal verschillende waarden. Als de variabele tenminste van ordinale niveau is, dan is. x 1 de kleinste waarde en ẋ p de grootste waarde.. x = Ê. ˆ x 1 ẋ 2... Ë ẋ p Dimensie : p De frequenties van de verschillende geobserveerde waarden zijn f 1, f 2,, f p. f = Ê Ë f 1 f 2 : ˆ f p Een frequentieverdeling is een paar (ẋ, f) de vorm van een tabel gepresenteerd.. Voorbeeld : Ê 1.70 Ê x = Ë 1.80 ˆ f = 2ˆ Ë 1 Grootte Frequentie 1.70 2 1.80 1 en wordt vaak in 12
Gegroepeerde frequentieverdelingen Waarom groeperen? Een klasse is een verzameling van waarden. Elke waarde van de variabele moet zich in één en slechts één klasse bevinden. p klassen k 1, k 2,, k p met frequenties f 1, f 2,, f p. Ê k = Ë k 1 k 2 : k p ˆ Een gegroepeerde frequentieverdeling is een paar (k,f). Variabelen van tenminste ordinale niveau Om een klasse te definiëren, moeten we alleen zijn boven- en benedengrens bepalen. u i : bovengrens van klasse i. l i : benedengrens van klasse i. Voorbeeld Loon categorieën 40-45 45-50 50-55 55-60 60-80 80-100 Aantal arbeiders 6 10 13 20 28 23 k T = ( [40,45], ]45,50], ]50,55], ]55,60], ]60,80], ]80,100] ) f T = (6, 10, 13, 20, 28, 23) 13
Nog een voorbeeld Klasse Frequentie 0-4 (onvoldoende) 2 5 6 (voldoende) 5 7 8 (goed) 4 9-10 (uitstekend) 2 k T = ( [0, 4.5], ]4.5, 6.5], ]6.5, 8.5], ]8.5, 10] ) f T = (2, 5, 4, 2) Vuistregels voor het indelen in klassen Indien mogelijk, klassen met identieke breedte. Indien nodig, uiterste klassen voor outliers. 8 à 20 klassen. Handige grenzen. 14
Cumulatieve frequentieverdelingen F(x) : aantal elementen met een waarde kleiner dan of gelijk aan x.. x 1 < ẋ 2 < < ẋ k Stel dat x < F(x) = f 1 + f 2 + + f k Vector van cumulatieve frequenties : F T = ( F(ẋ 1), F(ẋ 2),, F(ẋ p) ).. x k+1 < < ẋ p Cumulatieve frequentieverdeling : (ẋ, F) Voorbeeld Resultaten van 20 leerlingen Resultaat 0 1 2 3 4 5 6 7 8 9 10 Frequentie 0 0 1 0 2 3 3 5 2 3 1 Cumulatieve frequentie 0 0 1 1 3 6 9 14 16 19 20. x T f T F T F(4) = 3 F(5) = 6 F(5.5) = 6 F(100) = 20 F(-5) = 0 15
Cumulatieve gegroepeerde fr.verdeling F(x) is ook nog het aantal elementen met een waarde kleiner dan of gelijk aan x. Klasse Frequentie [0, 4.5] 2 ]4.5, 6.5] 5 ]6.5, 8.5] 4 ]8.5, 10] 2 1/4 3/4 F(6.5) = 7 F(4.5) = 2 F(5.5) = 2 + (5 x1/2) = 4.5 F(5) = 2 + (5 x1/4) = 3.25 F(6) = 2 + (5 x3/4) = 5.75 4.5 5 5.5 6.5 uitslagen 1/2 1/2 Vector van cumulatieve frequenties : F T = (F(u 1 ), F(u 2 ),, F(u p ) ) Cumulatieve frequentieverdeling : (k,f) Voorbeeld Klasse Frequentie Cumulatieve frequentie [0, 4.5] 2 2 ]4.5, 6.5] 5 7 ]6.5, 8.5] 4 11 ]8.5, 10] 2 13 k f F 16
Relatieve frequenties Frequentie : aantal elementen met een bepaalde eigenschap, met een bepaalde waarde of in een bepaalde klasse. Natuurlijk getal. Relatieve frequentie : proportie van elementen met een bepaalde eigenschap, met een bepaalde waarde of in een bepaalde klasse. Rationaal getal tussen 0 en 1. Kan ook in % uitgedrukt worden. Voorbeeld : in een steekproef van 21 kinderen zijn er 6 dyslectisch kinderen. De frequentie van dyslektische kinderen is 6. De relatieve frequentie is 6/21 = 0.29 = 29%. Verschillende soorten relatieve frequentie : Gewone relatieve frequentie : f i n met f i de fr. van ẋ i Gegroepeerde relatieve frequentie : f i n met f i de fr. van k i Cumuatieve relatieve frequentie : cumulatieve frequentie van x. F(x) n met F(x) de 17
Relatieve frequentieverdelingen Een (cumulatieve, gegroepeerde) frequentieverdeling is een reeks waarden (of klassen) samen met de overeenkomende (cumulatieve) frequenties. Een (cumulatieve, gegroepeerde) relatieve frequentieverdeling is een reeks waarden (of klassen) samen met de overeenkomende (cumulatieve) relatieve frequenties. Vector notatie : a T = (a 1, a 2,, a k ) b is een getal. Ê ba 1 ˆ ba 2 ba = Scalaire vermenigvuldiging : Ë ba k Voorbeeld : a T = (5, -2, ϖ, 1/2) en b = 1/2. Ê 5 ˆ ba = 1-2 2 p Ë 1/ 2 Ê 2.5 ˆ -1 = p / 2 Ë 1/ 4 Laat f T = (f 1, f 2,, f p ) een vector van frequenties zijn. Ê f 1 / nˆ f n = 1 n f = f 2 / n : Ë f k / n is een vector van relatieve frequenties. 18
Een relatieve frequentieverdeling is een paar (ẋ, f n ) Een gegroepeerde rel. frequentieverdeling is een paar (k, f n ) Een cumulatieve rel. frequentieverdeling is een paar (ẋ, F n ) Een cumulatieve gegroepeerde rel. frequentieverdeling is een paar (k, F n ) Grafische voorstellingen Niet cumulatieve frequenties Lijndiagram, kolommendiagram, cirkeldiagram, histogram (relatief of niet). Cumulatieve frequenties Histogram (relatief of niet) 1.0 Relatieve frequentie 0.5 Uitslagen op wiskunde - Cumulatieve frequentiecurve 0 4.5 6.5 8.5 10 19
Cumulatieve frequentiecurve Niet gegroepeerde data F(x) is de cumulatieve frequentie van x. F(x) is een functie van x. Resultaat 0 1 2 3 4 5 6 7 8 9 10 Frequentie 0 0 1 0 2 3 3 5 2 3 1 Cumulatieve frequentie 0 0 1 1 3 6 9 14 16 19 20 Cumulatieve frequentie 20 15 10 5-2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12 Testuitslagen 20
Gegroepeerde data Cumulatieve frequentie 15 Klasse Frequentie Cumulatieve frequentie [0, 4.5] 2 2 ]4.5, 6.5] 5 7 ]6.5, 8.5] 4 11 ]8.5, 10] 2 13 10 5 Uitslagen op wiskunde -2-1 0 1 2 3 4 5 6 7 8 9 10 11 12 4.5 6.5 8.5 21