Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 6 oktober 009 Catherine De Clercq
Statistische verwerking van gegevens Kursus statistiek voor fysici door Jorgen D Hondt in de semester In deze les wordt een samenvatting gegeven van de formules nodig in het practicum fysica Deel I: Toevallige veranderlijken Bronnen van onzekerheden Bepalen van de statistische onzekerheid Steekproef, histogram Karakterisatie van de steekproef: gemiddelde, variantie, standaarddeviatie Centrale limietstelling: normale of gaussische verdeling Herhaalde metingen: gemiddelde en variantie Deel II: Voortplanten van statistische onzekerheden Deel III: Lineair verband tussen grootheden Bepalen beste rechte met methode der kleinste kwadraten iet lineaire problemen Deel IV: Presentatie van resultaten Aantal beduidende cijfers, afronden van getalwaarden Grafieken, tabellen, eenheden etc p
Deel I Toevallige of stochastische veranderlijken Bronnen van onzekerheden Bepalen van de statistische onzekerheid: Steekproef Histogram Karakterisatie van de steekproef: gemiddelde, variantie en standaarddeviatie Centrale limietstelling: normale of gaussische verdeling Herhaalde metingen: gemiddelde en variantie p3
I. Toevallige veranderlijken experiment = meting van een bepaalde grootheid x uitgevoerd met een bepaald instrument volgens een bepaalde procedure Een experiment wordt meestal beïnvloed door verschillende factoren: vb bepaling verbruik van een auto, meten valversnelling Het resultaat van een experiment is meestal nooit exact reproduceerbaar De verschillende waarnemingen of resultaten van een experiment vertonen een spreiding Men noemt de grootheid x (het resultaat van het experiment) een toevallige of stochastische veranderlijke p4
I. Bronnen van onzekerheden Statistische onzekerheden Te wijten aan toevallige fluctuaties in de metingen De onzekerheid op de conclusie uit de metingen verkleint wanneer men beschikt over een grotere steekproef Systematische onzekerheden Reproduceerbare metingen omwille van beperking meettoestel Bvb weegschaal meet tot op 0,0g nauwkeurig Reproduceerbare afwijkingen te wijten aan slecht afgesteld apparaat Bvb amperemeter meet systematisch te hoge stroom De metingen herhalen geeft geen betere nauwkeurigheid en geeft niet meer zekerheid over de conclusies uit de proef Blunders = fouten die niet ingeschat kunnen worden p5
I. Bepaling statistische onzekerheid: steekproef Men wil meestal uit het experiment een fysische grootheid bepalen, bvb de valversnelling Elk experiment wordt beïnvloed door verschillende willekeurige factoren Het is dus best om een groot aantal experimenten uit te voeren, at random (willekeurig) gekozen Dit is een steekproef waaruit men conclusies wenst te trekken over de fysische grootheid Men bekomt een verzameling gegevens {x,x,x 3, x n } p6
I. Karakterisatie steekproef a het uitvoeren van n experimenten beschikt men over een verzameling gegevens {x,x,x 3, x n } Men kan deze verzameling beschrijven met behulp van de volgende empirische grootheden : Het aantal gegevens Het steekproefgemiddelde: maat voor de locatie van de gegevens De steekproefvariantie en de -standaarddeviatie: maat voor de spreiding van de gegevens De gegevens worden vaak grafisch voorgesteld in een histogram p7
I. Histogram - inleiding Gegevens indelen in klassen men telt het aantal per klasse Het histogram geeft een eerste informatie over de uitkomst van het experiment: gemiddelde en spreiding, subklassen, De keuze van de breedte van de klassen hangt af van de nauwkeurigheid waarmee men de grootheid gemeten heeft, van het aantal gegevens Voorbeelden : Men meet de lengte van 00 houten staafjes van ongeveer 00mm Men meet de lengte van 00 willekeurig gekozen mannen in Brussel p8
I. histogram: 00 metingen lengte balk in 0 klassen van elk mm breed in 4 klassen van elk,5mm breed Het histogram met 0 klassen geeft meer informatie over de structuur van de steekproef dan het histogram met 4 klassen. p9
I. histogram: Lengte 00 mannen In 0 klassen van 6cm In 60 klassen van cm In 300 klassen van 0,cm Het histogram met 60 klassen geeft voldoende informatie over de structuur van de steekproef en er zijn voldoende elementen in elke klasse. Het histogram met 0 klassen geeft te weinig informatie over de structuur. In het histogram met 300 klassen zijn er in sommige klassen te weinig elementen. p0
I. Karakterisatie steekproef Een steekproef met n metingen wordt gekarakteriseerd door de volgende grootheden: Rekenkundig gemiddelde: kental van de locatie schatting verwachtingswaarde μ x n xi n i = = Steekproefvariantie: kental van de spreiding schatting variantie σ s = x x i n i= n ( ) Standaardafwijking of standaarddeviatie s = s p
I. Gemiddelde en standaarddeviatie Lengteverdeling van 00 staafjes van ongeveer 00mm Gemiddelde waarde = 00mm Standaarddeviatie = mm p
I. Centrale limietstelling voor een oneindig (heel groot) aantal metingen kan elke verdeling benaderd worden door de normale verdeling. M.a.w. de theorie van de onzekerheden mag gebaseerd worden op de normale verdeling Steekproef is nooit oneindig groot. Men benadert dus verwachtingswaarde μ door rekenkundig gemiddelde x variantie σ door steekproefvariantie s Voorbeeld : meting lengte staafjes 00 of 0.000 metingen p3
I. ormale of gaussische verdeling gemiddelde waarde μ standaardafwijking σ Variantie σ Waarschijnlijkheids verdeling f(x) f ( x) = e σ π μ = σ lim i= i= x - ( x-μ ) σ = lim ( x ) i μ i frequentie [-;0,7] [0;0,45] [0;] [0;,4] Grootheid x p4
I. ormale of gaussische verdeling 68% van de metingen ligt in het interval [µ-σ, µ+σ] 95% van de metingen ligt in het interval [µ-σ, µ+σ] 99,7% van de metingen ligt in het interval [µ-3σ, µ+3σ] ( x-μ) - ( ) f x = e σ σ π p5
I. metingen lengte staafjes 00 metingen 0.000 metingen + normale verdeling 96 98 00 0 04 lengte(mm) Het histogram met 0.000 metingen benadert goed een normale verdeling p6
I. Herhaalde metingen : gemiddelde met onzekerheid De metingen herhalen levert een resultaat met een kleinere statistische onzekerheid Wanneer men gelijkwaardige metingen uitvoert van een grootheid x, {x i, i=,}, dan zijn het steekproefgemiddelde de steekproefvariantie Onzekerheid op het steekproefgemiddelde s s s met s = = = x x x s x s = xi i= = xi x x i= ± ( ) s p7
Deel II Voorplanten van statistische onzekerheden p8
II. Bewerkingen met toevallige variabelen De metingen uitgevoerd in een of meerdere experimenten zijn zelden zelf het eindresultaat waarin men geïnteresseerd is De proeven uitgevoerd in de fysica bestaan meestal uit metingen van verschillende grootheden, elk met een statistische onzekerheid Bewerkingen met die metingen leiden tot het eindresultaat verwerking van de gegevens Hoe moet men de onzekerheid bepalen op het eindresultaat? Dit gebeurt d.m.v. voortplanting van onzekerheden p9
II. Voorbeeld: bepaling snelheid auto Voor één afstand doen we metingen van de tijd t Verband tussen de afstand en de tijd: x = v( t t ) + x veronderstel t = 0, x = 0 De snelheid wordt dan 0 0 0 0 We berekenen de gemiddelde tijd met onzekerheid als De afstand is gekend met een nauwkeurigheid s x Vraag: wat is de onzekerheid op de snelheid? v = x t t s t = = i= t i i= ( t t ) i p0
II. Voorplanten van onzekerheden beschouw een variabele z=f(u,v), een functie van variabelen bvb snelheid als functie van afstand en gemiddelde tijd Voor elke meting van z geldt Voor metingen {z i, i=,} bekomt men het gemiddelde z en de variantie σ = lim ( z z ) z =? fuv (,) Vraag is Voor een lineair verband geldt deze relatie altijd Voor een niet-linear verband geldt deze relatie bij benadering. De functie f(u,v) wordt rond het gemiddelde gelineariseerd z z = f( u, v ) i i i i= i? p
II. Voorplanten van onzekerheden Dit geschiedt door een ontwikkeling in Taylorreeks rond het punt ( u, v) f f f( u, v) = f( u, v) + ( u u) + ( v v) +... u v uv, uv, Termen van de en hogere orde worden verwaarloosd dus ( ) ( ) ( ) ( zi z) f ui, vi f u, v ( ui u) + ( vi v) u uv, v uv, f f p
II. Voortplanten van onzekerheden 3 De variantie op z wordt σ f f z = lim ( zi z ) lim ( ui u) u, v ( vi v) u, v i= + i= u v f f = lim ( ) ( ) + lim ( ) ( ) u v ui u vi v i= i= + lim ( ui u)( vi v) i= f u f v p3
II. Voortplanten van onzekerheden 4 resultaat ( f z u ) v( f ) f σ σ + σ + σ f uv u v u v Partieel afgeleiden van f(u,v) naar u en v σ u = variantie van de verdeling van variabele u = kwadraat van onzekerheid op u De covariantie σ uv is nul voor niet gecorreleerde veranderlijken, wat in alle practica het geval is p4
II. Voortplanten van onzekerheden 5 In hetgevalvan hetvoorbeeldkrijgenwedan: waarbij v = x t v v σ σ ( ) + σ ( ) x t v x t σ s, σ s, σ s t x x v v t resultaat v ± σ v p5
Deel III Bepalen van de beste rechte door de metingen Methode van de kleinste kwadraten iet lineaire problemen p6
Een lineaire fysische wet Voorbeeld : bepaling veerconstante Een veer wordt opgehangen aan een punt men hangt achtereenvolgens verschillende massa s onderaan de veer dit veroorzaakt een elongatie van de veer men meet de positie x van het onderste punt van de veer als functie van de massa m x 0 x Massa m veer p7
Bepalen van de beste rechte - voorbeeld Fysische wet g k( x x ) = mg of x = m+ x k k = veerconstante 0 0 x positie x(cm) elongatie vd veer ifv massa massa(g) g=valversnelling m vraag: wat is de veerconstante k voor deze veer? Of: welke is de beste schatting van k uit deze metingen? de beste schatting van k geeft de beste rechte door de meetpunten (m,x) Hoe bepaalt men de beste rechte door de meetpunten? Met de methode van de kleinste kwadraten. x 30 5 0 5 0 5 0 0 00 00 300 400 500 p8
Methode van de kleinste kwadraten Met een steekproef van metingen {x i,y i ±σ i } schat men de beste rechte y=ax+b de beste schatting wordt bekomen door minimisatie van de χ χ ( ) [ ] = y i axi + b i= σ i Vbverloopvan χ als functie van parameter a(rico) χ chi 30 5 0 5 0 5 0 minimum -4-3 - - 0 3 4 5 6 a rico a p9
Methode van de kleinste kwadraten Het minimum van de χ functie wordt bekomen door de partieel afgeleiden naar de parameters a en b gelijk aan nul te zetten χ a Geeft een stelsel met vgl en onbekenden a a Oplossing naar a en b: zie syllabus formules (5),(6) χ = 0, = 0 b x x x y i i i i + b = i= σ i i= σi i= σi x i i + b = i= σ i i= σi i= σi y Parameters a,b van beste rechte a,b p30
Schatting van onzekerheden op a,b Bvb a a x y x y = Δ i i i i i= σ i i= σi i= σi i= σi Onzekerheid op a en b wordt bekomen door voortplanten van onzekerheden σ σ a a = σ i i= yi b b = σ i i= yi Uitwerking:zie syllabus formules (7) en (8) p3
Indien de fysische wet geen rechte volgt De methode van de kleinste kwadraten is steeds geldig. Men berekent de χ en leidt af naar de parameters om het minimum te vinden. Dit kan uitgevoerd worden met de Mathematica fit functies. Bvb voor valbeweging χ = ( y ) i gti i= σ i Men kan het probleem ook lineariseren Bvb valbeweging: indien men t ipv t als x variabele gebruikt bekomt men een rechte waarvan de richtingscoëfficient = g y = gt p3
Deel IV Presentatie van resultaten Aantal beduidende cijfers Afronden van getalwaarden Grafieken, tabellen, eenheden etc p33
Aantal beduidende cijfers Meest LIKSE cijfer ( 0) is meest beduidende cijfer Geen decimaal punt : minst beduidende cijfer is meest RECHTSE cijfer ( 0) Wel decimaal punt : : minst beduidende cijfer is meest RECHTSE cijfer, ook al is dit 0 Aantal beduidende cijfers = aantal tussen meest en minst beduidende cijfers 580 : 3 beduidende cijfers 580, : 4 beduidende cijfers 0,0094 : beduidende cijfers 3,00 x 0 4 : 4 beduidende cijfers p34
Afronden van getalwaarden Resultaat van de proef: hoeveel beduidende cijfers moet men geven? Men rond eerst de onzekerheid op het resultaat af tot of 3 beduidende cijfers Men kiest de meest aangepaste eenheden, bvb keuze tussen,0mm (3 beduidende cijfers) 0,cm ( beduidend cijfer) Dan rond men het resultaat zelf af tot hetzelfde aantal decimalen als de onzekerheid p35
Grafieken, tabellen, eenheden Tabellen en grafieken geven een duidelijk overzicht van de metingen gebruik ze! Grafiek: geef assen een naam en eenheden Kies de schaal zodanig dat de gegevens over het gehele gebied verspreid zijn Geef duidelijk de schalen aan van de assen Tabel: zet bovenaan de naam van de grootheid en de eenheden Vergeet eenheden niet bij het geven van resultaten van metingen en berekeningen Zet titels boven grafieken en tabellen p36