Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding Zie syllabus voor details 16 februari 2011 Catherine De Clercq
Statistische verwerking van gegevens Kursus statistiek voor fysici door Jorgen D Hondt In deze les wordt een samenvatting gegeven van de formules nodig in het practicum fysica Deel I: Toevallige veranderlijken Bronnen van onzekerheden Bepalen van de statistische onzekerheid op een grootheid Steekproef, histogram Karakterisatie van de steekproef: gemiddelde, variantie, standaarddeviatie Centrale limietstelling: normale of gaussische verdeling Herhaalde metingen: gemiddelde en variantie Deel II: Deel III: Deel IV: Voortplanten van statistische onzekerheden Lineair verband tussen 2 grootheden Bepalen beste rechte met methode der kleinste kwadraten iet lineaire problemen Presentatie van resultaten Aantal beduidende cijfers, afronden van getalwaarden Grafieken, tabellen, eenheden etc Experimentele Fysica 10-11 Verwerking van gegevens p2
Deel I Toevallige of stochastische veranderlijken Bronnen van onzekerheden Bepalen van de statistische onzekerheid: Steekproef Histogram Karakterisatie van de steekproef: gemiddelde, variantie en standaarddeviatie Centrale limietstelling: normale of gaussische verdeling Herhaalde metingen: gemiddelde en variantie Experimentele Fysica 10-11 Verwerking van gegevens p3
I. Toevallige veranderlijken experiment = meting van een bepaalde grootheid x uitgevoerd met een bepaald instrument volgens een bepaalde procedure Een experiment wordt meestal beïnvloed door verschillende factoren: vb bepaling verbruik van een auto, meten valversnelling Het resultaat t van een experiment is meestal nooit exact reproduceerbaar De verschillende waarnemingen of resultaten t van een experiment vertonen een spreiding Men noemt de grootheid x (het resultaat t van het experiment) een toevallige of stochastische veranderlijke Experimentele Fysica 10-11 Verwerking van gegevens p4
I. voorbeeld Ik meet het verbruik van mijn auto gedurende een jaar. Elke week noteer ik welke afstand ik afleg met een volle benzinetank. Welke van deze factiren beïnvloedt het verbruik van mijn auto IET? 1. Het gebied waar ik rij is soms vlak, soms heuvelachtig 2. Er wordt benzine getankt bij verschillende merken: ESSO, BP, 3. Ik rij soms sportief soms rustig 4. Er is soms tegenwind en soms geen wind Experimentele Fysica 10-11 Verwerking van gegevens p5
I. Onzekerheden op een grootheid Autoverbruik wordt elke week gemeten en men vindt verbruik ( l /100 km ) = 7, 2 7,3 7,1 6,9 7,5... De spreiding is het gevolg van toevallige factoren aast de waarde zelf is deze spreiding een even belangrijke informatie voor de buitenwereld a 100 metingen bekomt men bvb x= 7,3 ± 0,2 l /100 km ( ) De spreiding is te wijten aan de statistische onzekerheid op de meting?? Hoe schat men de statistische onzekerheid op een grootheid? Experimentele Fysica 10-11 Verwerking van gegevens p6
I. Bronnen van onzekerheden Statistische onzekerheden Te wijten aan toevallige fluctuaties in de metingen De onzekerheid op de conclusie uit de metingen verkleint wanneer men beschikt over een grotere steekproef Systematische ti onzekerheden Reproduceerbare metingen omwille van beperking meettoestel Bvb weegschaal meet tot op 0,01g nauwkeurig Reproduceerbare afwijkingen te wijten aan slecht afgesteld apparaat aat Bvb amperemeter meet systematisch te hoge stroom De metingen herhalen geeft geen betere nauwkeurigheid en geeft niet meer zekerheid over de conclusies uit de proef Blunders = fouten die niet ingeschat kunnen worden Experimentele Fysica 10-11 Verwerking van gegevens p7
I. Bepaling statistische onzekerheid: steekproef Om een grootheid met statistische onzekerheid te bepalen heeft men een steekproef nodig Men wil meestal uit het experiment een fysische grootheid bepalen, bvb de valversnelling Elk experiment wordt beïnvloed door verschillende willekeurige factoren Het is dus best om een groot aantal experimenten uit te voeren, at random (willekeurig) gekozen Dit is een steekproef waaruit men conclusies wenst te trekken over de fysische grootheid Men bekomt een verzameling gegevens {x 1,x 2,x 3, x n } Experimentele Fysica 10-11 Verwerking van gegevens p8
I. Karakterisatie steekproef a het uitvoeren van n experimenten beschikt men over een verzameling gegevens {x 1,x 2,x 3, x n } Men kan deze verzameling beschrijven met behulp van de volgende empirische grootheden : Het aantal gegevens Het steekproefgemiddelde: maat voor de locatie van de gegevens De steekproefvariantie en de -standaarddeviatie: maat voor de spreiding van de gegevens De gegevens worden vaak grafisch voorgesteld in een histogram Experimentele Fysica 10-11 Verwerking van gegevens p9
I. Histogram - inleiding Gegevens indelen in klassen men telt het aantal per klasse Het histogram geeft een eerste informatie over de uitkomst van het experiment: gemiddelde en spreiding, subklassen, De keuze van de breedte van de klassen hangt af van de nauwkeurigheid waarmee men de grootheid gemeten heeft, van het aantal gegevens Voorbeelden : Men meet de lengte van 100 houten staafjes van ongeveer 200mm Men meet de lengte van 1100 willekeurig gekozen mannen in Brussel Experimentele Fysica 10-11 Verwerking van gegevens p10
I. histogram: 100 metingen lengte balk in 10 klassen van elk 1mm breed in 4 klassen van elk 2,5mm breed Het histogram met 10 klassen geeft meer informatie over de spreiding van de steekproef dan het histogram met 4 klassen. Experimentele Fysica 10-11 Verwerking van gegevens p11
I. histogram: Lengte 1100 mannen In 60 klassen van 1cm In 10 klassen van 6cm In 300 klassen van 0,2cm Het histogram met 60 klassen geeft voldoende informatie over de structuur t van de steekproef en er zijn voldoende elementen in elke klasse. Het histogram met 10 klassen geeft te weinig informatie over de structuur. In het histogram met 300 klassen zijn er in sommige klassen te weinig elementen en is de spreiding binnen de klassen relatief te groot Experimentele Fysica 10-11 Verwerking van gegevens p12
I. Karakterisatie steekproef Een steekproef met n metingen wordt gekarakteriseerd door de volgende grootheden: Rekenkundig gemiddelde: 1 n kental van de locatie x schatting verwachtingswaarde μ n i = 1 = x i Steekproefvariantie: s = ( x x ) 2 kental van de spreiding i n 1 schatting variantie σ 2 i= 1 2 1 n Standaardafwijking of standaarddeviatie s = s 2 Experimentele Fysica 10-11 Verwerking van gegevens p13
I. Gemiddelde en standaarddeviatie Lengteverdeling van 100 staafjes van ongeveer 200mm Met de hand gezaagd => spreiding Gemiddelde waarde = 200mm Standaarddeviatie = 1mm Experimentele Fysica 10-11 Verwerking van gegevens p14
I. Centrale limietstelling voor een oneindig (heel groot) aantal metingen kan elke verdeling benaderd worden door de normale verdeling. M.a.w. de theorie van de onzekerheden mag gebaseerd worden op de normale verdeling Experimentele Fysica 10-11 Verwerking van gegevens p15
I. ormale of gaussische verdeling 1 gemiddelde waarde μ = positie standaardafwijking σ = spreiding Waarschijnlijkheids [0;0,45] verdeling f(x) ( x-μ ) 2-1 2 f x = e 2σ ( ) σ 2π 1 μ = lim x σ 2 1 i= 1 = lim i i= 1 i ( x μ ) 2 freque entie [-2;0,7] [0;1] [0;2,24] 24] Grootheid x Experimentele Fysica 10-11 Verwerking van gegevens p16
I. ormale of gaussische verdeling 2 68% van de metingen ligt in het interval [µ-σ, µ+σ] 95% van de metingen ligt in het interval [µ-2σ, µ+2σ] 99,7% van de metingen ligt in het interval [µ-3σ, µ+3σ] 1 - ( x-μ) 2 f ( x) = e 2σ σ π 2 2 Experimentele Fysica 10-11 Verwerking van gegevens p17
I. Centrale limietstelling Steekproef is nooit oneindig groot. Men benadert dus verwachtingswaarde μ door rekenkundig gemiddelde x variantie σ 2 door steekproefvariantie s 2 Voorbeeld : meting lengte staafjes met hand gezaagd ongeveer 200mm lang 100 of 10.000 metingen Experimentele Fysica 10-11 Verwerking van gegevens p18
I. metingen lengte staafjes 100 metingen 10.000 metingen + normale verdeling 196 198 200 202 204 lengte(mm) Het histogram met 10.000 metingen benadert goed een normale verdeling Experimentele Fysica 10-11 Verwerking van gegevens p19
I. Herhaalde metingen : gemiddelde met onzekerheid De metingen herhalen levert een resultaat met een kleinere statistische onzekerheid Wanneer men gelijkwaardige metingen uitvoert t van een grootheid x, {x i, i=1,}, dan zijn 1 het steekproefgemiddelde x = i = 1 2 de steekproefvariantie ( ) 2 Onzekerheid op het steekproefgemiddelde s x i 1 = xi x 1 2 2 s 2 s s sx = sx = met sx = x i= 1 ± Experimentele Fysica 10-11 Verwerking van gegevens p20
I. In de praktijk : juist of fout? 1. 10 metingen van de lengte van de staafjes met een bepaalde opstelling geeft een grotere onzekerheid dan 100 metingen 2. de statistische onzekerheid hangt af van de nauwkeurigheid van de toestellen 3. Als in de klas elke student 1 meting van de valversnelling uitvoert bekomen ze alle dezelfde onzekerheid 4. Student A die 50 experimenten in 5 uur uitvoert heeft in principe een beter resultaat dan student B die 20 experimenten uitvoert in 1 uur Experimentele Fysica 10-11 Verwerking van gegevens p21
I. voorbeeld: juist of fout? Twee studenten voeren de proef valversnelling uit. De gemiddelde waarde in België is g=9,81 m/s 2 De studenten t bekomen de volgende waarden g ( A ) = 10,0 ± 0,1 m s ( ) 2 g( B) = 9,85 ± 0,01 m s ( ) 2 1. Het resultaat van student A is in overeenstemming met de verwachting 2. Het resultaat t van student t B is in overeenstemming met de verwachting 3. Student A heeft een afwijking van de zwaartekracht wet ontdekt 4. student B heeft iets nieuws ontdekt Experimentele Fysica 10-11 Verwerking van gegevens p22
PAUZE Experimentele Fysica 10-11 Verwerking van gegevens p23
Deel II Voorplanten van statistische onzekerheden Experimentele Fysica 10-11 Verwerking van gegevens p24
II. Bewerkingen met toevallige variabelen De metingen uitgevoerd in een of meerdere experimenten zijn zelden zelf het eindresultaat waarin men geïnteresseerd is De proeven uitgevoerd in de fysica bestaan meestal uit metingen van verschillende grootheden, elk met een statistische onzekerheid Bewerkingen met die metingen leiden tot het eindresultaat verwerking van de gegevens Hoe moet men de statistische onzekerheid bepalen op het eindresultaat? Dit gebeurt d.m.v. voortplanting van onzekerheden Experimentele Fysica 10-11 Verwerking van gegevens p25
II. Voorbeeld: bepaling snelheid auto Voor één afstand x doen we metingen van de tijd t x keer Verband tussen de afstand en de tijd: x = v( t t ) + x veronderstel t = 0, x = 0 0 0 0 0 De snelheid wordt dan v = x t Vraag: wat is de onzekerheid op de snelheid? Experimentele Fysica 10-11 Verwerking van gegevens p26
II. Voorbeeld: bepaling snelheid auto We doen 100 metingen van de tijd t We maken een histogram van t Daaruit halen we de gemiddelde tijd met statistische onzekerheid s t Het juiste antwoord is t 1) t = ( 200 ± 1) s 2) t = 200 ± 3 s ( ) 3) t = 200,00 ± 0,1 s ( ) Tijd t (sec) Experimentele Fysica 10-11 Verwerking van gegevens p27
II. Voorbeeld: bepaling snelheid auto v = x t gemiddelde tijd met onzekerheid t 1 ti i= 1 = 1 1 i= 1 s = t ( t t ) 2 De afstand is gekend met een nauwkeurigheid s x Vraag: wat is de onzekerheid op de snelheid? i Experimentele Fysica 10-11 Verwerking van gegevens p28
II. Voorplanten van onzekerheden 1 beschouw een variabele z=f(u,v), een functie van 2 variabelen bvb snelheid als functie van afstand en gemiddelde tijd Voor elke meting van z geldt f( u, v ) i i i Voor metingen {z i, i=1,} bekomt men het gemiddelde z en de variantie Vraag is z =?? f ( uv, ) z = 2 1 z ( ) li z - z z σ = lim i Voor een lineair verband geldt deze relatie altijd Voor een niet-linear verband geldt deze relatie bij benadering. De functie f(u,v) wordt rond het gemiddelde gelineariseerd Experimentele Fysica 10-11 Verwerking van gegevens p29 i=1 2
II. Voorplanten van onzekerheden 2 Dit geschiedt door een ontwikkeling in Taylorreeks rond het punt ( u, v) f f f( u, v) = f( u, v) + ( u u) + ( v v) +... u v uv, uv, Termen van 2de en hogere orde worden verwaarloosd dus (z -z) i 2 f f ( u, ) (, ) i vi f u v ( ui u) + ( vi v) u uv f v ( ) 2,, uv 2 Experimentele Fysica 10-11 Verwerking van gegevens p30
II. Voortplanten van onzekerheden 3 De variantie op z wordt σ = z-z 2 1 z = lim i= 1 ( ) 2 i f f 1 lim ( ui u) u, v ( vi v) u, v + i= 1 u v 2 1 f 1 f = lim ( ) ( ) + lim ( ) ( ) u v 2 2 2 2 ui u vi v i= 1 i= 1 1 f f + 2lim ( u )( ) i u vi v i= 1 u v Experimentele Fysica 10-11 Verwerking van gegevens p31
II. Voortplanten van onzekerheden 4 resultaat 2 2 2 2 2 ( f z u ) v( f ) 2 f σ σ + σ + σ f uv u v u v Partieel afgeleiden van f(u,v) naar u en v σ 2 u = variantie van de verdeling van variabele u = kwadraat van onzekerheid op u De covariantie σ uv is nul voor niet gecorreleerde veranderlijken, wat in alle practica het geval is Experimentele Fysica 10-11 Verwerking van gegevens p32
II. Voorbeeld: bepaling snelheid auto x 100 keer De auto legt 100 keer een afstand van 4000m af We veronderstellen dat deze afstand exact gekend is We meten voor de gemiddelde tijd t = ( 200,0 ± 0,1) s Welke is de snelheid v met statistische ti ti onzekerheid? Antwoord : v = x σ x = 0 t 2 2 v 2 2 v 2 σ t s t σv σx( ) + σt ( ) x t σ v sv ( 20,0000 ± 0,01 01 ) ( 72,00 ± 0,04 04 ) v= ± m s = ± km h Experimentele Fysica 10-11 Verwerking van gegevens p33
Deel III Bepalen van de beste rechte door de metingen Methode van de kleinste kwadraten iet lineaire problemen Experimentele Fysica 10-11 Verwerking van gegevens p34
III. Een lineaire fysische wet Voorbeeld : bepaling veerconstante x 0 Een veer wordt opgehangen veer aan een punt men hangt achtereenvolgens verschillende massa s onderaan de veer x dit veroorzaakt een elongatie van de veer men meet de positie x van het onderste punt van de veer als functie van de massa m Massa m Experimentele Fysica 10-11 Verwerking van gegevens p35
III. Bepalen van de beste rechte - voorbeeld Fysische wet 30 25 20 15 10 5 0 x m 0 200 400 600 k x x mg 0 = 0 ( ) k = veerconstante g=valversnelling g x= m+x k vraag: wat is de veerconstante k voor deze veer? Of: welke is de beste schatting van k uit deze metingen? de beste schatting van k geeft de beste rechte door de meetpunten (m,x) Hoe bepaalt men de beste rechte door de meetpunten? Met de methode van de kleinste kwadraten. Experimentele Fysica 10-11 Verwerking van gegevens p36
III. Methode van de kleinste kwadraten 1 Met een steekproef van metingen {x i,y i ±σ i } schat men de beste rechte y=ax+b de beste schatting wordt bekomen door minimisatie van de χ 2 1 χ 1 = ( y [ ax + b] ) 2 2 2 i i i= 1 σ i Vb verloop van χ 2 als functie van parameter a(rico) χ2chi2 χ 30 25 20 15 10 5 0 minimum -4-3 -2-1 0 1 2 3 4 5 6 a rico a Experimentele Fysica 10-11 Verwerking van gegevens p37
positie(cm m) 30 25 20 15 10 5 0 III. Voorbeeld : de veer g x= m + x k 0 y = ax+ b = [ ax + b ] elongatie vd veer ifv massa χ y 0 100 200 300 400 500 massa(g) 1 ( ) 2 2 ( 2 i i ) i= 1 σ i y i x i i ± σ a b Experimentele Fysica 10-11 Verwerking van gegevens p38
III. Methode van de kleinste kwadraten 2 Het minimum van de χ 2 functie wordt bekomen door de partieel afgeleiden naar de parameters a en b gelijk aan nul te zetten 2 2 χ χ Parameters a,b a = 0, = 0 b van beste rechte Geeft een stelsel l met 2 vgl en 2 onbekenden a a x x x y 2 i i i i + b = 2 2 2 i= 1 σ i i= 1 σi i= 1 σi xi 1 yi + b = 2 2 2 σ σ σ i= 1 i i= 1 i i= 1 i a,b Oplossing naar a en b: zie syllabus formules (15),(16) Experimentele Fysica 10-11 Verwerking van gegevens p39
III. Schatting van onzekerheden op a,b Bvb a a 1 x y 1 x y = Δ i i i i 2 2 2 2 i= 1 σ i i= 1 σ i i= 1 σ i i= 1 σ i Onzekerheden op a en b worden bekomen door voortplanten van onzekerheden σ σ 2 2 a 2 a = σ i i= 1 yi 2 2 b 2 b = σ i i= 1 yy i σ Uitwerking:zie syllabus formules (17) en (18) a, σ b Experimentele Fysica 10-11 Verwerking van gegevens p40
III. Indien de fysische wet geen rechte volgt De methode van de kleinste kwadraten is steeds geldig. Men berekent de χ 2 en leidt af naar de parameters om het minimum te vinden. Dit kan uitgevoerd worden met de Mathematica fit functies. 2 1 1 2 2 Bvb voor valbeweging χ = ( y ) 2 i gti σ 2 i= 1 i Men kan het probleem ook lineariseren Bvb valbeweging: indien men t 2 ipv t als x variabele gebruikt bekomt men een rechte waarvan de richtingscoëfficient = g y = 1 g t 2 2 Experimentele Fysica 10-11 Verwerking van gegevens p41
Deel IV Presentatie van resultaten Aantal beduidende cijfers Afronden van getalwaarden Grafieken, tabellen, eenheden etc Experimentele Fysica 10-11 Verwerking van gegevens p42
Aantal beduidende cijfers Meest LIKSE cijfer ( 0) is meest beduidende cijfer Geen decimaal punt : minst beduidende cijfer is meest RECHTSE cijfer ( 0) Wel ldecimaal punt : : minst beduidende d d cijfer is meest RECHTSE cijfer, ook al is dit 0 Aantal beduidende cijfers = aantal tussen meest en minst beduidende cijfers 5280 : 3 beduidende cijfers 5280, : 4 beduidende cijfers 0,0094 : 2 beduidende cijfers 3,010 x 10 4 : 4 beduidende cijfers Experimentele Fysica 10-11 Verwerking van gegevens p43
Afronden van getalwaarden Resultaat van de proef: hoeveel beduidende cijfers moet men geven? Men rond eerst de onzekerheid op het resultaat t af tott 2 of 3 beduidende cijfers Men kiest de meest aangepaste eenheden, bvb keuze tussen 1,0mm (3 beduidende cijfers) 0,1cm (1 beduidend cijfer) Dan rondt men het resultaat zelf af tot hetzelfde aantal decimalen als de onzekerheid Experimentele Fysica 10-11 Verwerking van gegevens p44
Grafieken, tabellen, eenheden Tabellen en grafieken geven een duidelijk overzicht van de metingen gebruik ze! Grafiek: geef assen een naam en eenheden Kies de schaal zodanig dat de gegevens over het gehele gebied verspreid zijn Geef duidelijk de schalen aan van de assen Tabel: zet bovenaan de naam van de grootheid en de eenheden Vergeet eenheden niet bij het geven van resultaten van metingen en berekeningen Zet titels boven grafieken en tabellen Experimentele Fysica 10-11 Verwerking van gegevens p45