Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 3 oktober 006
Deel I Toevallige veranderlijken Steekproef Beschrijving van gegevens Histogram Gemiddelde en standaarddeviatie ormale verdeling Fouten en onzekerheden p
Toevallige veranderlijken experiment = meting van een bepaalde grootheid x uitgevoerd met een bepaald instrument volgens een bepaalde procedure Een experiment wordt meestal beïnvloed door verschillende factoren: vb bepaling verbruik van een auto, meten valversnelling Het resultaat van een experiment is nooit exact reproduceerbaar De verschillende waarnemingen of resultaten van een experiment vertonen een spreiding Men noemt de grootheid x (het resultaat van het experiment) een toevallige of stochastische veranderlijke p3
Keuze van de steekproef Men wil meestal uit het experiment een fysische grootheid bepalen, bvb de valversnelling Elk experiment wordt beïnvloedt door verschillende willekeurige factoren Het is dus best om een groot aantal experimenten uit te voeren, at random (willekeurig) gekozen Dit is een steekproef waaruit men conclusies wenst te trekken over de fysische grootheid Men bekomt een verzameling gegevens {x,x,x 3, x n } p4
Beschrijving van gegevens a het uitvoeren van n experimenten beschikt men over een verzameling gegevens {x,x,x 3, x n } Men kan deze verzameling beschrijven via de volgende empirische grootheden : Aantal gegevens steekproefgemiddelde: maat voor de locatie van de gegevens Steekproefvariantie en standaardafwijking: maat voor de spreiding van de gegevens De gegevens worden vaak voorgesteld in een histogram p5
Histogram De gegevens worden ingedeeld in klassen Het histogram geeft een eerste informatie over structuren (pieken, uniform..) in de verdeling van gemeten grootheid De keuze van de breedte van de klassen hangt af van de nauwkeurigheid waarmee men de grootheid gemeten heeft, van het aantal gegevens Voorbeeld :men meet de lengte van een balk van 0 cm p6
00 metingen lengte balk mm lat in 0 klassen van elk mm in 4 klassen van elk,5mm Aantal metingen Lengte (mm) p7
Gemiddelde en standaarddeviatie Een steekproef wordt gekarakteriseerd door de volgende grootheden: Rekenkundig gemiddelde x n xi n i = = Variantie s = x x i n n i= ( ) Standaardafwijking of standaarddeviatie = s p8
s x p9
Indien de steekproef oneindig groot wordt dan volgt de verdeling van de gemeten grootheid een normale of gaussische verdeling met gemiddelde waarde µ standaardafwijking σ Variantie σ Waarschijnlijkheids verdeling f(x) f ( x) = e σ π ormale verdeling - ( x-µ ) σ frequentie Grootheid x p0
ormale verdeling 68% van de metingen ligt in het interval [µ-σ, µ+σ] 95% van de metingen ligt in het interval [µ-σ, µ+σ] 99,7% van de metingen ligt in het interval [µ-3σ, µ+3σ] p
ormale verdeling en steekproef Steekproef is nooit oneindig groot Men benadert Gemiddelde µ door rekenkundig gemiddelde x variantie σ door steekproefvariantie s Standaardafwijking σ = statistische onzekerheid op één meting van de grootheid Voorbeeld : meting lengte balk 00 of 0000 metingen p
00 en 0000 metingen lengte balk 00 metingen 0000 metingen + normale verdeling s s x x p3
Fouten en onzekerheden Statistische onzekerheden Te wijten aan toevallige fluctuaties in de metingen De onzekerheid op de conclusie uit de metingen verkleint wanneer men beschikt over een grotere steekproef Men spreekt vaak van statistische fout Blunders = fouten die niet ingeschat kunnen worden Systematische fouten Reproduceerbare fouten te wijten aan slecht afgesteld apparaat Bvb amperemeter meet systematisch te hoge stroom De metingen herhalen geeft geen betere nauwkeurigheid en geeft niet meer zekerheid over de conclusies uit de proef p4
Deel II Herhaalde metingen: gemiddelde en variantie Bewerkingen met stochastische veranderlijken Voorplanten van statistische onzekerheden p5
Een enkele meting Elk meetinstrument laat toe metingen uit te voeren met een bepaalde onzekerheid Bvb weegschaal meet op 0,0g nauwkeurig Bvb lat meet op mm nauwkeurig Voor de meetapparaten die in het practicum gebruikt zullen worden wordt de nauwkeurigheid gegeven in de syllabus of op het apparaat zelf otatie: x i ± s i bvb m = 50,00 ± 0,0 ( ) g p6
Herhaalde metingen De metingen herhalen levert een resultaat met een kleinere onzekerheid Wanneer men metingen uitvoert van een grootheid x, elk men een bepaalde onzekerheid s i x ± s ; i =, { } i i Dan zijn het gewogen gemiddelde en zijn variantie wx i i i= = en x= met gewichten i = w i wi i= i= x s w s i p7
Herhaalde metingen met zelfde fout Indien alle metingen dezelfde onzekerheid s bezitten (of hetzelfde gewicht) dan worden het gemiddelde en zijn onzekerheid i x x = x s = i= s Bvb 00 metingen van 00mm lange balk met lat met mm nauwkeurigheid geven: Elke meting : onzekerheid mm Gemiddelde : onzekerheid /0mm p8
Bewerkingen met toevallige variabelen De metingen uitgevoerd in een of meerdere experimenten zijn zelden zelf het eindresultaat waarin men geïnteresseerd is Eenvoudig geval: ik bepaal mijn gewicht door elke ochtend op de weegschaal te staan De proeven uitgevoerd in de fysica bestaan meestal uit metingen van verschillende grootheden, elk met een onzekerheid Bewerkingen met die metingen leiden tot het eindresultaat p9
Voorbeeld: bepaling valversnelling bepaling valversnelling g: laat een kogel vanop een hoogte vallen en meet de tijd tot die de grond raakt Metingen van hoogte y en tijd t, elk met een statistische onzekerheid Valbeweging y = y0 + v0t+ at met y0 = 0 en v0 = 0 De valversnelling g wordt g = y t Vraag: welke is de onzekerheid op g? p0
Voorplanten van onzekerheden Voor een groot aantal metingen geldt dat de onzekerheid op een enkele meting gelijk is aan de standaarddeviatie van de normale verdeling σ = lim i i= ( x x ) Voor f(u,v) = een functie van variabelen (bvb hoogte en tijd bij valversnelling) krijgt men σ f = lim ( f ) i f = f( u, v ) i= fi i i p
Voorplanten van onzekerheden De vraag is nu f = f(,)? u v Voor een lineair verband geldt deze relatie altijd Voor een niet-linear verband kan men de functie f rond het maximum van de multidimensionele waarschijnlijkheidsverdeling benaderen door een raakvlak Dit geschiedt door een ontwikkeling in Taylorreeks rond het punt ( u, v) f f f( u, v) = f( u, v) + ( u u) uv, + ( v v) uv, +... u v Termen van de en hogere orde worden verwaarloosd p
Voortplanten van onzekerheden 3 f u ( fi f ) ( ui u) u, v+ ( vi v) u, v Variantie op f wordt f v σ f f f lim ( ui u) u, v ( vi v) u, v + i= u v f f = lim ( ) ( ) + lim ( ) ( ) u v ui u vi v i= i= f f + lim ( ui u)( vi v) u v i= p3
Voortplanten van onzekerheden 4 ( f f u ) v( f ) f σ σ + σ + σ f uv u v u v Covariantie σ uv is nul voor niet gecorreleerde veranderlijken, wat in alle practica het geval is Voorbeeld: snelheid bepalen uit metingen van afstand x en tijd t Voor de steekproefvariantie geldt v = x t v v s s ( ) + s ( ) x t f x t v = v ± s v p4
Deel III Bepalen van de beste rechte door de metingen Methode van de kleinste kwadraten iet lineaire problemen p5
Een lineaire fysische wet Voorbeeld : bepaling veerconstante Een veer wordt opgehangen aan een punt men hangt achtereenvolgens verschillende massa s onderaan de veer dit veroorzaakt een elongatie van de veer men meet de positie x van het onderste punt van de veer als functie van de massa m positie(cm 30 5 0 5 0 5 0 elongatie vd veer ifv massa Blauw = Meetpunten Alle posities zijn gemeten met dezelfde onzekerheid 0 00 00 300 400 500 massa(g) p6
Bepalen van de beste rechte Fysische wet g kx = mg of x = m k k = veerconstante g=valversnelling x positie(cm elongatie vd veer ifv massa 30 5 0 5 0 5 0 0 00 00 300 400 500 massa(g) vraag: wat is de veerconstante k voor deze veer? Of: welke is de beste schatting van k uit deze metingen? de beste schatting van k geeft de beste rechte door de meetpunten (m,x) Hoe bepaalt men de beste rechte door de meetpunten? p7
Methode van de kleinste kwadraten Uit metingen {x i,y i ±σ i } schat men de beste rechte y=ax+b de beste schatting wordt bekomen door minimisatie van de χ χ = ( yi axi b ) i= σ i Vb verloop χ als functie van parameter a voor proef veer χ chi 30 5 0 5 0 5 0-4 -3 - - 0 3 4 5 6 rico a a p8
Mehtoden van de kleinste kwadraten Het minimum komt overeen met (partieel afleiden naar de parameters a en b) χ a χ = 0, = 0 b Algemene oplossing: zie cursus statistiek Indien alle metingen y i dezelfde onzekerheid σ y bezitten: eenvoudig stelsel van vgl en onbekenden Eerst de vergelijking oplossen naar b Deze oplossing substitueren in ste vergelijking geeft a Dit invullen in oplossing voor b p9
Oplossen van stelsel naar a en b stel δ = xi xi i= i= a = x y x y δ i i i i i= i= i= b= x y x x y δ i i i i i i= i= i= i= p30
Schatting van onzekerheden op a,b Voortplanten van onzekerheden op y i naar a,b σ σ a a = σ i i= yi b b = σ i i= yi σ i = σ y i In praktijk is onzekerheid σ y vaak niet gekend en kan berekend worden uit σ σ σ y = sy = ( yi axi b) i= a = σ y δ σ y b = xi δ i = p3
Fysische wet is geen rechte Methode van de kleinste kwadraten is steeds geldig zie cursus statistiek Men kan het probleem lineariseren Bvb valbeweging: indien men t ipv t als x variabele gebruikt bekomt men een rechte waarvan de richtingscoëfficient = g y = gt p3
Deel IV Presentatie van resultaten Aantal beduidende cijfers Afronden van getalwaarden Grafieken, tabellen, eenheden etc p33
Aantal beduidende cijfers Meest LIKSE cijfer ( 0) is meest beduidende cijfer Geen decimaal punt : minst beduidende cijfer is meest RECHTSE cijfer ( 0) Wel decimaal punt : : minst beduidende cijfer is meest RECHTSE cijfer, ook al is dit 0 Aantal beduidende cijfers = aantal tussen meest en minst beduidende cijfers 580 : 3 beduidende cijfers 580, : 4 beduidende cijfers 0,0094 : beduidende cijfers 3,00 x 0 4 : 4 beduidende cijfers p34
Afronden van getalwaarden Resultaat van de proef: hoeveel beduidende cijfers moet men geven? Men rond eerst de onzekerheid op het resultaat (de fout ) af tot of 3 beduidende cijfers Men kiest de meest aangepaste eenheden, bvb keuze tussen,0mm (3 bed cijfers) 0,cm ( bed cijfer) Dan rond men het resultaat zelf af tot hetzelfde aantal decimalen als de fout p35
Grafieken, tabellen, eenheden Tabellen en grafieken geven een duidelijk overzicht van de metingen gebruik ze! Grafiek: geef assen een naam en eenheden Kies de schaal zodanig dat de gegevens over het gehele gebied verspreid zijn Geef duidelijk de schalen aan van de assen Tabel: zet bovenaan de naam van de grootheid en de eenheden Vergeet eenheden niet bij het geven van resultaten van metingen en berekeningen Zet titels boven grafieken en tabellen p36