HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4. VERGELIJKINGSTOETSEN
A. Vergelijken van varianties Men beschouwt twee steekproeven uit normaal verdeelde populaties: X, X,, X n ~ N(µ, σ ) Y, Y,, Y n ~ N(µ, σ ) onafhankelijk onafhankelijk De X i zijn onafhankelijk van de Y j i, j Men wenst na te gaan of σ = σ
Vergelijken van varianties Om aan te tonen dat σ = σ maakt men gebruik van de stelling: ~ S ~ S σ σ ~ F n,n Onder de nulhypothese H 0 : σ = σ heeft men bijgevolg: ~ S ~ S ~ F n,n 3
Vergelijken van varianties Tweezijdige toets H 0 : σ H : σ = σ σ Aanvaardingsgebied: F [F α/, F -α/ ] Eénzijdige toetsen H 0 : σ H : σ = σ H 0 : σ = σ > σ H : σ < σ Aanvaardingsgebieden F [0, F -α ] F [F α, + [ 4
Vergelijken van varianties Voorbeeld Dezelfde kursus wordt gedoceerd aan afdelingen A en B. Mag men zeggen dat de variantie van afdeling A groter is dan deze van afdeling B indien voor de examenresultaten (die ~ N(µ,σ)) de volgende resultaten werden bekomen: ~ S A = 3 n A = 6 ~ S B = 0 n B = De toets moet op niveaus 5% en % uitgevoerd worden 5
Eénzijdige toets H 0 : σ H : σ A = σb A > σb en aanvaardingsgebied F 5,0 [0, F -α ] F = ~ S ~ S = 3 0 =,69 5%: Aanvaardingsgebied = [0, F 0,95 ] = [0 ;,0] en F =,69 [0 ;,0] H 0 aanvaarden %: Aanvaardingsgebied = [0, F 0,99 ] = [0 ; 3,09] en F =,69 [0 ; 3,09] ook hier H 0 aanvaarden 6
B. Vergelijken van gemiddelden Men beschouwt steekproeven genomen uit normaal verdeelde populaties met dezelfde (onbekende) standaarddeviatie σ X, X,, X n ~ N(µ, σ) Y, Y,, Y n ~ N(µ, σ) onafhankelijk onafhankelijk X i onafhankelijk van Y j i, j Nulhypothese H 0 : µ = µ 7
Vergelijken van gemiddelden Eerst maakt men een schatting van σ d.m.v. de gemengde variantie ~ S ~ ( ) ~ n S ( n ) S ~ + S = n + n Onder de nulhypothese H 0 : µ = µ heeft men: T = X Y ~ S + n n ~ t n + n 8
Vergelijken van gemiddelden Tweezijdige toets H 0 : µ = µ H : µ µ Aanvaardingsgebied: t [-t -α/, t -α/ ] Eenzijdige toetsen H 0 : µ = µ H 0 : µ = µ H : µ > µ H : µ < µ Aanvaardingsgebieden t ]-, t -α ] t [-t -α, + [ 9
Vergelijking van gemiddelden Opmerkingen. Om na te gaan of de varianties gelijk zijn kan men de vorige toets toepassen.. Voor grote steekproeven (n en n 30) kan men gebruik maken van de Z-toets: Z = X Y ~ ~ S S + n n ~ N(0, ) Dit resultaat is geldig voor willekeurige verdelingen voor populaties met een gelijke of met verschillende varianties. 0
Vergelijken van gemiddelden t-tests for independent samples of TREATMENT Number Variable of Cases Mean SD SE of Mean AGE TREATMENT 3 49.57 3.708.858 TREATMENT 7 48.359 3.00 3.0 Mean Difference =.688 Levene's Test for Equality of Variances: F=.000 P=.997 t-test for Equality of Means 95% Variances t-value df -Tail Sig SE of Diff CI for Diff ---------------------------------------------------------------- Equal.7 38.788 4.37 (-7.57,9.90) Unequal.7 35.34.787 4.9 (-7.546,9.884) ----------------------------------------------------------------
C. Vergelijken van gemiddelden bij gepaarde steekproeven Gepaarde Waarnemingen: Tot hiertoe waren de steekproeven niet verbonden en mocht er zelfs geen verband bestaan. Nu beschouwen we gepaarde steekproeven: met elke X i is een Y i geassocieerd, daaruit volgt n = n = n waarbij (X, Y ), (X, Y ),, (X n, Y n ) X, X,, X n ~ N(µ, σ ) en onafhankelijk Y, Y,, Y n ~ N(µ, σ ) en onafhankelijk
Vergelijken van gemiddelden bij gepaarde steekproeven Om na te gaan of µ = µ herleiden we dit tot een probleem met steekproef, door te stellen D i = X i - Y i zodat D i ~ N(µ, σ) met µ = µ - µ We voeren een parametertoets uit voor de nulhypothese H 0 : µ = 0 met T = D 0 ~ ~ t n- SD n n waar D = i= D i en ~ SD = i n = ( Di D) n n 3
Vergelijken van gemiddelden bij gepaarde steekproeven Voorbeeld Bij 0 patienten wordt de bloeddruk gemeten vóór en 6 uur na toediening van een geneesmiddel. We veronderstellen dat deze veranderlijke normaal verdeeld is. De volgende resultaten werden gemeten Patiënt 3 4 5 6 7 8 9 0 voor (X) 9 40 35 3 0 34 30 3 8 na (Y) 5 40 4 40 9 36 30 34 3 Ga na of het geneesmiddel de gemiddelde bloeddruk verandert (α=5% of %) 4
Vergelijken van gemiddelden bij gepaarde steekproeven Patiënt 3 4 5 6 7 8 9 0 D = X -Y 4 0-6 -9 - -7-0 -3-4 D = -,8 ~ S D = 4,844 ~ S D = 3,853 T = ~ D 0 = -,98 S D 5%: Aanvaardingsgebied = [ -t 0,975, + t 0,975 ] = [-,6 ; +,6] en T = -,98 [-, 6 ; +,6] H 0 verwerpen %: Aanvaardingsgebied = [ -t 0,995, + t 0,995 ] = [-3,49 ; +3,49] en T = -,98 [-3,49 ; +3,49] hier H 0 aanvaarden 5
Uitvoeren van een statistische toets Stap : Opstellen van een hypothese H 0 en H Stap : Constructie van een toetsveranderlijke (Hangt af van de nulhypothese) Stap 3: Bepaling van een aanvaardingsgebied (Hangt af van α) Stap 4: Nemen van de beslissing H 0 of H (of p-waarde) 6