Kansrekening en Statistiek

Vergelijkbare documenten
Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Kansrekening en Statistiek

Statistiek voor A.I.

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Kansrekening en Statistiek

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Toetsen van Hypothesen. Het vaststellen van de hypothese

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen

Statistiek voor A.I. College 6. Donderdag 27 September

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Kansrekening en Statistiek

. Dan geldt P(B) = a d. 3 8

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

15.1 Beslissen op grond van een steekproef [1]

Data analyse Inleiding statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Kansrekening en Statistiek

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Inleiding Applicatie Software - Statgraphics

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Lesbrief hypothesetoetsen

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Sheets K&S voor INF HC 10: Hoofdstuk 12

Kansrekening en Statistiek

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6

Samenvatting Statistiek

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

13.1 Kansberekeningen [1]

14.1 Kansberekeningen [1]

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Hoofdstuk 5: Steekproevendistributies

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Kansrekening en Statistiek

Tentamen Inleiding Kansrekening wi juni 2010, uur

Samenvatting Wiskunde A

Hoofdstuk 12: Eenweg ANOVA

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

4.1 Eigenschappen van de normale verdeling [1]

Examen Statistiek I Januari 2010 Feedback

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Inleiding Statistiek

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

WenS tweede kans Permutatiecode 0

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Oefeningen statistiek

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Transcriptie:

Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38

2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen 2 / 38

3 / 38

Normale verdeling Def. Een continue stochast X heeft een normale verdeling met gemiddelde µ en standaardafwijking σ als de dichtheidsfunctie deze vorm heeft: f (x) = 1 σ 2π e (x µ) 2 2σ 2. 4 / 38

Normale verdeling Def. Een continue stochast X heeft een normale verdeling met gemiddelde µ en standaardafwijking σ als de dichtheidsfunctie deze vorm heeft: f (x) = 1 σ 2π e (x µ) 2 2σ 2. Def. De standaard normale verdeling is de normale verdeling met gemiddelde 0 en standaardafwijking 1. De dichtheidsfunctie is: f (x) = 1 2π e x2 2. De verdeling wordt vaak aangeduid met P s. 4 / 38

Normale en binomiale verdeling Met de toename van n gaat de binomiale verdeling ( ) n p k (1 p) n k k steeds meer lijken op de normale verdeling met gemiddelde p en standaardafwijking p(1 p): P(a X b) steeds dichter bij b a 1 e (x p) p(1 p) 2π 2 2p(1 p) dx. 5 / 38

Het belang van de normale verdeling Veel verdelingen lijken op de normale verdeling. 6 / 38

Het belang van de normale verdeling Veel verdelingen lijken op de normale verdeling. De Centrale Limietstelling. 6 / 38

Normaliseren St. Als X een normale verdeling heeft met gemiddelde µ en standaardafwijking σ, dan heeft de stochast de standaard normale verdeling. X µ σ 7 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 7 en standaardafwijking 3. 8 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 7 en standaardafwijking 3. De kans dat X 8 is P(X 8) = P( X 7 3 8 7 3 ) = P(X 7 1 3 3 ). 8 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 7 en standaardafwijking 3. De kans dat X 8 is P(X 8) = P( X 7 3 8 7 3 ) = P(X 7 1 3 3 ). Uit tabel C.1 blijkt dat (afrondend op 2 decimalen) Dus P(X 8) = 0.3707. P s (z 1 3 ) = 0.3707. 8 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 7 en standaardafwijking 3. 9 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 7 en standaardafwijking 3. De kans dat X 5 is P(X 5) = P( X 7 3 5 7 3 ) = P(X 7 2 3 3 ). 9 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 7 en standaardafwijking 3. De kans dat X 5 is P(X 5) = P( X 7 3 5 7 3 ) = P(X 7 2 3 3 ). Uit tabel C.1 blijkt dat P s (z 2 3 ) = 0.2546. Dus P s (z 2 3 ) = 0.2546, en daarmee P s (z 2 ) = 1 0.2546 = 0.7454. 3 9 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 7 en standaardafwijking 3. De kans dat X 5 is P(X 5) = P( X 7 3 5 7 3 ) = P(X 7 2 3 3 ). Uit tabel C.1 blijkt dat P s (z 2 3 ) = 0.2546. Dus P s (z 2 3 ) = 0.2546, en daarmee P s (z 2 ) = 1 0.2546 = 0.7454. 3 Dus P(X 5) = 0.7454. 9 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 3 en standaardafwijking 2. 10 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 3 en standaardafwijking 2. Het 40 e percentiel is de waarde x waarvoor P(X x) = 0.4. Dat wil zeggen, de x waarvoor P( X +3 2 x+3 2 ) = 0.4. 10 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 3 en standaardafwijking 2. Het 40 e percentiel is de waarde x waarvoor P(X x) = 0.4. Dat wil zeggen, de x waarvoor P( X +3 2 x+3 2 ) = 0.4. Uit tabel C.1 blijkt dat (afrondend op 1 decimaal) P s (z 0.26) = 0.4, dus P s (z 0.26) = 0.4. 10 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 3 en standaardafwijking 2. Het 40 e percentiel is de waarde x waarvoor P(X x) = 0.4. Dat wil zeggen, de x waarvoor P( X +3 2 x+3 2 ) = 0.4. Uit tabel C.1 blijkt dat (afrondend op 1 decimaal) P s (z 0.26) = 0.4, dus P s (z 0.26) = 0.4. Daarmee P( X +3 2 0.26) = 0.4. 10 / 38

Normaliseren: toepassing Vb. Zij X een stochast met een normale verdeling met gemiddelde 3 en standaardafwijking 2. Het 40 e percentiel is de waarde x waarvoor P(X x) = 0.4. Dat wil zeggen, de x waarvoor P( X +3 2 x+3 2 ) = 0.4. Uit tabel C.1 blijkt dat (afrondend op 1 decimaal) P s (z 0.26) = 0.4, dus P s (z 0.26) = 0.4. Daarmee P( X +3 2 0.26) = 0.4. Het 40 e percentiel is dus x = 2 ( 0.26) 3 = 3.52. 10 / 38

Convergentie van het steekproefgemiddelde We zagen St. Als X een stochast is met E(X ) = µ en Var(X ) = σ 2 en het bijbehorende experiment wordt n maal herhaald, dan geldt E( X ) = µ Var( X ) = σ2 n. 11 / 38

Convergentie van het steekproefgemiddelde We zagen St. Als X een stochast is met E(X ) = µ en Var(X ) = σ 2 en het bijbehorende experiment wordt n maal herhaald, dan geldt E( X ) = µ Var( X ) = σ2 n. De volgende stellingen preciseren en versterken deze stelling. 11 / 38

De Markov ongelijkheid St. Zij X een stochast met P(X 0) = 1. Dan voor elk getal t > 0: P(X t) E(X ). t 12 / 38

De Markov ongelijkheid St. Zij X een stochast met P(X 0) = 1. Dan voor elk getal t > 0: P(X t) E(X ). t Bew. We bewijzen de stelling voor een discrete stochast met waarden x 1,..., x n. 12 / 38

De Markov ongelijkheid St. Zij X een stochast met P(X 0) = 1. Dan voor elk getal t > 0: P(X t) E(X ). t Bew. We bewijzen de stelling voor een discrete stochast met waarden x 1,..., x n. Dan E(X ) = n x i P(X = x i ) = x i P(X = x i ) + x i P(X = x i ). x i <t x i t i=1 12 / 38

De Markov ongelijkheid St. Zij X een stochast met P(X 0) = 1. Dan voor elk getal t > 0: P(X t) E(X ). t Bew. We bewijzen de stelling voor een discrete stochast met waarden x 1,..., x n. Dan E(X ) = n x i P(X = x i ) = x i P(X = x i ) + x i P(X = x i ). x i <t x i t i=1 Omdat alle waarden van X positief zijn volgt hieruit E(X ) x i P(X = x i ) tp(x = x i ) = tp(x t). x i t x i t 12 / 38

St. Voor elk getal t > 0: De Chebyshev ongelijkheid P( X E(X ) t) Var(X ) t 2. 13 / 38

St. Voor elk getal t > 0: De Chebyshev ongelijkheid P( X E(X ) t) Var(X ) t 2. Bew. Laat Y de stochast (X E(X )) 2 zijn. Dan P(Y 0) = 1 en E(Y ) = Var(X ). 13 / 38

St. Voor elk getal t > 0: De Chebyshev ongelijkheid P( X E(X ) t) Var(X ) t 2. Bew. Laat Y de stochast (X E(X )) 2 zijn. Dan P(Y 0) = 1 en E(Y ) = Var(X ). Uit de Markov ongelijkheid volgt: P( X E(X ) t) = P(Y t 2 ) E(Y ) t 2 = Var(X ) t 2. 13 / 38

St. Voor elk getal t > 0: De Chebyshev ongelijkheid P( X E(X ) t) Var(X ) t 2. Bew. Laat Y de stochast (X E(X )) 2 zijn. Dan P(Y 0) = 1 en E(Y ) = Var(X ). Uit de Markov ongelijkheid volgt: P( X E(X ) t) = P(Y t 2 ) E(Y ) t 2 = Var(X ) t 2. St. Voor elk getal t > 0: P( X E(X ) < t) 1 Var(X ) t 2. 13 / 38

De Wet van de Grote Getallen St. Voor een stochast X met verwachtingswaarde (gemiddelde) µ geldt voor elke ɛ > 0: lim P( X µ < ɛ) = 1. n 14 / 38

De Wet van de Grote Getallen St. Voor een stochast X met verwachtingswaarde (gemiddelde) µ geldt voor elke ɛ > 0: lim P( X µ < ɛ) = 1. n Bij toenemende n neemt de kans dat X dicht bij µ ligt toe. 14 / 38

De Wet van de Grote Getallen St. Voor een stochast X met verwachtingswaarde (gemiddelde) µ geldt voor elke ɛ > 0: lim P( X µ < ɛ) = 1. n Bij toenemende n neemt de kans dat X dicht bij µ ligt toe. 14 / 38

De Wet van de Grote Getallen St. Voor een stochast X met verwachtingswaarde (gemiddelde) µ geldt voor elke ɛ > 0: lim P( X µ < ɛ) = 1. n Bij toenemende n neemt de kans dat X dicht bij µ ligt toe. Bew. Laat σ 2 de variantie van X zijn. We zagen dat dan Dus volgt met Chebyshev: E( X ) = µ Var( X ) = σ2 n. 14 / 38

De Wet van de Grote Getallen St. Voor een stochast X met verwachtingswaarde (gemiddelde) µ geldt voor elke ɛ > 0: lim P( X µ < ɛ) = 1. n Bij toenemende n neemt de kans dat X dicht bij µ ligt toe. Bew. Laat σ 2 de variantie van X zijn. We zagen dat dan Dus volgt met Chebyshev: E( X ) = µ Var( X ) = σ2 n. P( X µ < ɛ) 1 σ2 nɛ 2. 14 / 38

De Wet van de Grote Getallen St. Voor een stochast X met verwachtingswaarde (gemiddelde) µ geldt voor elke ɛ > 0: lim P( X µ < ɛ) = 1. n Bij toenemende n neemt de kans dat X dicht bij µ ligt toe. Bew. Laat σ 2 de variantie van X zijn. We zagen dat dan Dus volgt met Chebyshev: E( X ) = µ Var( X ) = σ2 n. P( X µ < ɛ) 1 σ2 nɛ 2. Omdat lim n σ 2 nɛ 2 = 0 is de stelling bewezen. 14 / 38

De frequentistische interpretatie Bevestigt de Wet van de Grote Getallen de frequentistische interpretatie van het begrip kans? 15 / 38

De Chebyshev ongelijkheid: voorbeelden Vb. Kan door vaak een munt te gooien de kans dat het gemiddelde aantal keren dat kop gegooid wordt meer dan 0.3 afwijkt van 0.5, kleiner dan 0.01 worden? 16 / 38

De Chebyshev ongelijkheid: voorbeelden Vb. Kan door vaak een munt te gooien de kans dat het gemiddelde aantal keren dat kop gegooid wordt meer dan 0.3 afwijkt van 0.5, kleiner dan 0.01 worden? X is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X 0.5 0.3) 0.01. 16 / 38

De Chebyshev ongelijkheid: voorbeelden Vb. Kan door vaak een munt te gooien de kans dat het gemiddelde aantal keren dat kop gegooid wordt meer dan 0.3 afwijkt van 0.5, kleiner dan 0.01 worden? X is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X 0.5 0.3) 0.01. Met Chebyshev: P( X 0.5 0.3) 0.25 n(0.3) 2. 16 / 38

De Chebyshev ongelijkheid: voorbeelden Vb. Kan door vaak een munt te gooien de kans dat het gemiddelde aantal keren dat kop gegooid wordt meer dan 0.3 afwijkt van 0.5, kleiner dan 0.01 worden? X is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X 0.5 0.3) 0.01. Met Chebyshev: P( X 0.5 0.3) 0.25 n(0.3) 2. Dus P( X 0.5 0.3) 0.01 voor n 0.25 0.01(0.3) 2 = 2500 9. 16 / 38

De Chebyshev ongelijkheid: voorbeelden Vb. Kan voor elk willekeurig getal 0 < δ < 1 door vaak te gooien de kans dat het gemiddelde minder dan 0.01 afwijkt van 0.5, groter dan δ worden? 17 / 38

De Chebyshev ongelijkheid: voorbeelden Vb. Kan voor elk willekeurig getal 0 < δ < 1 door vaak te gooien de kans dat het gemiddelde minder dan 0.01 afwijkt van 0.5, groter dan δ worden? X is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X 0.5 < 0.01) δ. 17 / 38

De Chebyshev ongelijkheid: voorbeelden Vb. Kan voor elk willekeurig getal 0 < δ < 1 door vaak te gooien de kans dat het gemiddelde minder dan 0.01 afwijkt van 0.5, groter dan δ worden? X is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X 0.5 < 0.01) δ. Met Chebyshev: P( X 0.5 < 0.01) 1 0.25 n(0.01) 2. 17 / 38

De Chebyshev ongelijkheid: voorbeelden Vb. Kan voor elk willekeurig getal 0 < δ < 1 door vaak te gooien de kans dat het gemiddelde minder dan 0.01 afwijkt van 0.5, groter dan δ worden? X is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X 0.5 < 0.01) δ. Met Chebyshev: P( X 0.5 < 0.01) 1 0.25 n(0.01) 2. Daarmee P( X 0.5 < 0.01) δ voor n waarvoor 1 0.25 n(0.01) 2 δ. 17 / 38

De Chebyshev ongelijkheid: voorbeelden Vb. Kan voor elk willekeurig getal 0 < δ < 1 door vaak te gooien de kans dat het gemiddelde minder dan 0.01 afwijkt van 0.5, groter dan δ worden? X is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X 0.5 < 0.01) δ. Met Chebyshev: P( X 0.5 < 0.01) 1 0.25 n(0.01) 2. Daarmee P( X 0.5 < 0.01) δ voor n waarvoor 1 0.25 n(0.01) 2 δ. Dus n 2500 1 δ. 17 / 38

De Centrale Limietstelling St. Voor een stochast X met verwachtingswaarde (gemiddelde) µ en standaardafwijking σ geldt voor elke a dat lim P( X µ a) = P s (z a). n σ n 18 / 38

De Centrale Limietstelling St. Voor een stochast X met verwachtingswaarde (gemiddelde) µ en standaardafwijking σ geldt voor elke a dat lim P( X µ a) = P s (z a). n σ n Bij toenemende n benadert X de normale verdeling met gemiddelde µ en standaardafwijking σ n. 18 / 38

De Centrale Limietstelling St. Voor een stochast X met verwachtingswaarde (gemiddelde) µ en standaardafwijking σ geldt voor elke a dat lim P( X µ a) = P s (z a). n σ n Bij toenemende n benadert X de normale verdeling met gemiddelde µ en standaardafwijking σ n. De Centrale Limietstelling is een versterking en precisering van de Wet van de Grote Getallen. 18 / 38

De Centrale Limietstelling St. Voor een stochast X met verwachtingswaarde (gemiddelde) µ en standaardafwijking σ geldt voor elke a dat lim P( X µ a) = P s (z a). n σ n Bij toenemende n benadert X de normale verdeling met gemiddelde µ en standaardafwijking σ n. De Centrale Limietstelling is een versterking en precisering van de Wet van de Grote Getallen. Def. σ X = σ n is de standaardfout van het gemiddelde. 18 / 38

De Centrale Limietstelling: toepassing Vb. Zij X een stochast met E(X ) = 3 en Var(X ) = 4 waarvoor de verdeling onbekend is of moeilijk te berekenen. Er wordt gevraagd naar de kans dat het steekproef gemiddelde van een willekeurige steekproef ter grootte n = 10.000 kleiner is dan 2.95. 19 / 38

De Centrale Limietstelling: toepassing Vb. Zij X een stochast met E(X ) = 3 en Var(X ) = 4 waarvoor de verdeling onbekend is of moeilijk te berekenen. Er wordt gevraagd naar de kans dat het steekproef gemiddelde van een willekeurige steekproef ter grootte n = 10.000 kleiner is dan 2.95. Aangenomen wordt dat n groot genoeg is om de verdeling van X als een normale verdeling met verwachtingswaarde µ en standaardafwijking = 0.02 te beschouwen. 4 n = 2 100 19 / 38

De Centrale Limietstelling: toepassing Vb. Zij X een stochast met E(X ) = 3 en Var(X ) = 4 waarvoor de verdeling onbekend is of moeilijk te berekenen. Er wordt gevraagd naar de kans dat het steekproef gemiddelde van een willekeurige steekproef ter grootte n = 10.000 kleiner is dan 2.95. Aangenomen wordt dat n groot genoeg is om de verdeling van X als een normale verdeling met verwachtingswaarde µ en standaardafwijking = 0.02 te beschouwen. Daarmee: 4 n = 2 100 P( X 2.95) = P( X 3 0.02 ) 0.05 0.02 = P s(z 2.25) = P s (z 0.25). Met tabel C.1: P( X 2.95) = 0.0122. 19 / 38

Deductieve statistiek Op grond van data verkregen uit een steekproef conclusies trekken over de populatie. 20 / 38

Deductieve statistiek Benjamin Disreali en Mark Twain: There are three kinds of lies: lies, damned lies, and statistics. 21 / 38

Statistische toetsen Hypothese toetsen 22 / 38

Statistische toetsen Hypothese toetsen Schatten 22 / 38

Statistische toetsen Hypothese toetsen Schatten Maximum likelihood 22 / 38

Hypothese toetsen W.W. Rozeboom (1997) Null-hypothesis significance testing is surely the most bone-headedlly misguided procedure ever institutionalized in the rote training of science students. 23 / 38

Hypothese toetsen Typische toepassingen: Een medicijn wordt aan een groep patiënten toegediend en aan een controlegroep niet. Er moet besloten worden of het medicijn werkt of niet. 24 / 38

Hypothese toetsen Typische toepassingen: Een medicijn wordt aan een groep patiënten toegediend en aan een controlegroep niet. Er moet besloten worden of het medicijn werkt of niet. Een fabriek laat een gedeelte van een lading geproduceerde auto s testen op een defect. Er moet besloten worden of de lading goed genoeg is om bij de leverancier af te leveren. 24 / 38

Hypothese toetsen Typische toepassingen: Een medicijn wordt aan een groep patiënten toegediend en aan een controlegroep niet. Er moet besloten worden of het medicijn werkt of niet. Een fabriek laat een gedeelte van een lading geproduceerde auto s testen op een defect. Er moet besloten worden of de lading goed genoeg is om bij de leverancier af te leveren. De grootte van de schedels van enkele Egyptenaren uit de oudheid is bekend. Op grond van deze data wil men vaststellen of de gemiddelde grootte van de schedels van mensen in het oude Egypte gelijk is aan die van de huidige mens. 24 / 38

Hypothese toetsen Er zijn twee hypotheses waartussen besloten moet worden en er kunnen niet zoveel data verzameld worden dat de Wet van de Grote Getallen uitkomst biedt. 25 / 38

Hypothese toetsen: de hypotheses Def. Een hypothese H 0 wordt getest tegen een hypothese H a. 26 / 38

Hypothese toetsen: de hypotheses Def. Een hypothese H 0 wordt getest tegen een hypothese H a. H 0 is de nulhypothese en H a is de alternatieve hypothese. H a wordt ook wel H 1 genoemd. 26 / 38

Hypothese toetsen: de hypotheses Def. Een hypothese H 0 wordt getest tegen een hypothese H a. H 0 is de nulhypothese en H a is de alternatieve hypothese. H a wordt ook wel H 1 genoemd. De alternatieve hypothese is meestal de onderzoekshypothese, die alleen aangenomen (ondersteund) kan worden door de nulhypothese te verwerpen. 26 / 38

Hypothese toetsen: de hypotheses Def. Een hypothese H 0 wordt getest tegen een hypothese H a. H 0 is de nulhypothese en H a is de alternatieve hypothese. H a wordt ook wel H 1 genoemd. De alternatieve hypothese is meestal de onderzoekshypothese, die alleen aangenomen (ondersteund) kan worden door de nulhypothese te verwerpen. Over het algemeen is de nulhypothese de hypothese van geen verschil of geen onderscheid of geen relatie, en de test dient om aan te tonen dat er wel een verschil, onderscheid of relatie is. 26 / 38

Hypothese toetsen: de hypotheses - voorbeeld Vb. Een medicijn wordt aan een groep patiënten toegediend en aan een controlegroep niet. 27 / 38

Hypothese toetsen: de hypotheses - voorbeeld Vb. Een medicijn wordt aan een groep patiënten toegediend en aan een controlegroep niet. De nulhypothese is dat het gemiddelde aantal patiënten dat beter wordt in beide groepen gelijk is. De alternatieve hypothese is dat dat aantal in de controlegroep kleiner is. 27 / 38

Hypothese toetsen: de hypotheses - voorbeeld Vb. De grootte van de schedels van enkele Egyptenaren uit de oudheid is bekend. 28 / 38

Hypothese toetsen: de hypotheses - voorbeeld Vb. De grootte van de schedels van enkele Egyptenaren uit de oudheid is bekend. De nulhypothese is dat de gemiddelde grootte van de schedels van Egyptenaren in de oudheid gelijk is aan de gemiddelde grootte van de schedels van de huidige mens. De alternatieve hypothese is dat die lager is dan de huidige. 28 / 38

Hypothese toetsen: de hypotheses - voorbeeld Vb. Een fabriek laat een gedeelte van een lading geproduceerde auto s testen op een defect. De lading mag alleen bij de leverancier afgeleverd worden als niet meer dan 0.01% defect is. 29 / 38

Hypothese toetsen: de hypotheses - voorbeeld Vb. Een fabriek laat een gedeelte van een lading geproduceerde auto s testen op een defect. De lading mag alleen bij de leverancier afgeleverd worden als niet meer dan 0.01% defect is. De nulhypothese is dat niet meer dan 0.01% defect is. De alternatieve hypothese is dat dat meer is. 29 / 38

Hypothese toetsen: de hypotheses - voorbeeld Vb. Een fabriek laat een gedeelte van een lading geproduceerde auto s testen op een defect. De lading mag alleen bij de leverancier afgeleverd worden als niet meer dan 0.01% defect is. De nulhypothese is dat niet meer dan 0.01% defect is. De alternatieve hypothese is dat dat meer is. Hier gaan de hypotheses dus niet over wel/geen onderscheid, maar over het wel dan niet overschreiden van een numerieke grens. 29 / 38

Hypothese toetsen: de hypotheses De hypotheses die we gaan beschouwen zijn meestal van de vorm: 30 / 38

Hypothese toetsen: de hypotheses De hypotheses die we gaan beschouwen zijn meestal van de vorm: tweezijdig H 0 : µ = a H a : µ a 30 / 38

Hypothese toetsen: de hypotheses De hypotheses die we gaan beschouwen zijn meestal van de vorm: tweezijdig H 0 : µ = a H a : µ a linkszijdig H 0 : µ = a H a : µ < a 30 / 38

Hypothese toetsen: de hypotheses De hypotheses die we gaan beschouwen zijn meestal van de vorm: tweezijdig H 0 : µ = a H a : µ a linkszijdig H 0 : µ = a H a : µ < a rechtszijdig H 0 : µ = a H a : µ > a 30 / 38

Hypothese toetsen: de hypotheses - werkvoorbeeld Vb. Het gemiddelde cijfer voor genetica van 25 studenten biologie is bekend. Op grond van deze data wil men de volgende hypotheses over het gemiddelde cijfer µ voor genetica van de hele populatie (alle biologie studenten van de Universiteit Utrecht) toetsen: 31 / 38

Hypothese toetsen: de hypotheses - werkvoorbeeld Vb. Het gemiddelde cijfer voor genetica van 25 studenten biologie is bekend. Op grond van deze data wil men de volgende hypotheses over het gemiddelde cijfer µ voor genetica van de hele populatie (alle biologie studenten van de Universiteit Utrecht) toetsen: H 0 : µ = 7 H a : µ 7. 31 / 38

Hypothese toetsen: de hypotheses - werkvoorbeeld Vb. Het gemiddelde cijfer voor genetica van 25 studenten biologie is bekend. Op grond van deze data wil men de volgende hypotheses over het gemiddelde cijfer µ voor genetica van de hele populatie (alle biologie studenten van de Universiteit Utrecht) toetsen: H 0 : µ = 7 H a : µ 7. Dit is een tweezijdige toets. 31 / 38

Hypothese toetsen: criterium voor verwerpen H 0 Def. H 0 wordt verworpen of aangenomen (niet verworpen). 32 / 38

Hypothese toetsen: criterium voor verwerpen H 0 Def. H 0 wordt verworpen of aangenomen (niet verworpen). Als H 0 aangenomen wordt, wordt H a verworpen. 32 / 38

Hypothese toetsen: criterium voor verwerpen H 0 Def. H 0 wordt verworpen of aangenomen (niet verworpen). Als H 0 aangenomen wordt, wordt H a verworpen. Als H 0 verworpen wordt, wordt H a aangenomen. 32 / 38

Hypothese toetsen: criterium voor verwerpen H 0 Def. H 0 wordt verworpen of aangenomen (niet verworpen). Als H 0 aangenomen wordt, wordt H a verworpen. Als H 0 verworpen wordt, wordt H a aangenomen. Def. H 0 is waar en wordt aangenomen: correcte beslissing. H 0 is waar en wordt verworpen: fout van de 1 e soort. H a is waar en wordt aangenomen: correcte beslissing. H a is waar en wordt verworpen: fout van de 2 e soort. 32 / 38

Hypothese toetsen: criterium voor verwerpen H 0 Def. H 0 wordt verworpen of aangenomen (niet verworpen). Als H 0 aangenomen wordt, wordt H a verworpen. Als H 0 verworpen wordt, wordt H a aangenomen. Def. H 0 is waar en wordt aangenomen: correcte beslissing. H 0 is waar en wordt verworpen: fout van de 1 e soort. H a is waar en wordt aangenomen: correcte beslissing. H a is waar en wordt verworpen: fout van de 2 e soort. Def. Het significantieniveau is de kans op een fout van de 1 e soort en wordt aangeduid met α. 32 / 38

Hypothese toetsen: werkvoorbeeld Vb. Het gemiddelde cijfer voor genetica van 25 studenten biologie is bekend. µ is het gemiddelde cijfer voor genetica van alle studenten biologie van de UU. 33 / 38

Hypothese toetsen: werkvoorbeeld Vb. Het gemiddelde cijfer voor genetica van 25 studenten biologie is bekend. µ is het gemiddelde cijfer voor genetica van alle studenten biologie van de UU. H 0 : µ = 7 H a : µ 7. 33 / 38

Hypothese toetsen: werkvoorbeeld Vb. Het gemiddelde cijfer voor genetica van 25 studenten biologie is bekend. µ is het gemiddelde cijfer voor genetica van alle studenten biologie van de UU. H 0 : µ = 7 H a : µ 7. Fout van de 1 e soort: µ = 7, maar H 0 wordt verworpen. 33 / 38

Hypothese toetsen: werkvoorbeeld Vb. Het gemiddelde cijfer voor genetica van 25 studenten biologie is bekend. µ is het gemiddelde cijfer voor genetica van alle studenten biologie van de UU. H 0 : µ = 7 H a : µ 7. Fout van de 1 e soort: µ = 7, maar H 0 wordt verworpen. Fout van de 2 e soort: µ 7, maar H 1 wordt verworpen. 33 / 38

Hypothese toetsen: werkvoorbeeld Vb. Het gemiddelde cijfer voor genetica van 25 studenten biologie is bekend. µ is het gemiddelde cijfer voor genetica van alle studenten biologie van de UU. H 0 : µ = 7 H a : µ 7. Fout van de 1 e soort: µ = 7, maar H 0 wordt verworpen. Fout van de 2 e soort: µ 7, maar H 1 wordt verworpen. Als significantieniveau wordt 0.05 genomen. 33 / 38

Finis 34 / 38