HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN

Maat: px
Weergave met pagina beginnen:

Download "HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN"

Transcriptie

1 Toetsen van hypothesen 1 HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN 1. Inleiding Beslissingsregels Beslissen op grond van kritische grenzen Het α-risico Het β-risico Beslissen op grond van betrouwbaarheidsintervallen Beslissen op grond van overschrijdingskansen Beslissen op grond van andere beslissingsregels Toetsen omtrent µ via kritische grenzen Eenzijdig alternatief Eenzijdig alternatief Tweezijdig alternatief Uitbreidingen Steekproef uit een andere verdeling Ongekende variantie Toetsen omtrent µ via betrouwbaarheidsintervallen Eenzijdig alternatief Eenzijdig alternatief Tweezijdig alternatief Opmerkingen Toetsen omtrent µ via overschrijdingskansen Eenzijdig alternatief Eenzijdig alternatief Tweezijdig alternatief Opmerkingen Slotopmerkingen Oefeningen Toetsen i.v.m. proporties Toetsen i.v.m. varianties en/of standaardafwijkingen Verschil tussen gemiddelden en quotiënt varianties Toetsen i.v.m. correlatiecoëfficiënt Oefeningen...37

2 Toetsen van hypothesen 2 1. Inleiding In de vorige hoofdstukken gebruikten we schatters om (de) parameter(s) van een verdeling te benaderen. Via betrouwbaarheidsintervallen kregen we een idee van de gemaakte benaderingsfout. In dit hoofdstuk gebruiken we schatters en betrouwbaarheidsintervallen om uitspraken omtrent parameters te toetsen. We zullen tevens uitspraken en beweringen aangaande verdelingen toetsen. Beweringen over een parameter of een verdeling aanvaarden of verwerpen gebeurt meestal op basis van een steekproef en gaan bijgevolg steeds gepaard met een zeker risico. Dit risico wordt o.m. gemeten door de kans op een verkeerde beslissing. We vertrekken van de volgende voorbeelden. Voorbeeld 1 Een bakker en een molenaar komen overeen dat de molenaar zakken bloem zal leveren met een verwacht gewicht µ van tenminste 5 kg. Omdat technische (of andere) volmaaktheid niet bestaat zullen er afwijkingen voorkomen in het gewicht van de zakken bloem. We veronderstellen dat het gewicht van de zakken toevallig varieert en in dit voorbeeld gaan we ervan uit dat het gewicht normaal verdeeld is met verwacht gewicht µ en standaardafwijking σ =.5 kg, dit betekent: X ~ N(µ, σ² =.25). Bij elke levering wil de bakker nagaan of de molenaar de overeenkomst naleeft. De bakker wenst m.a.w. na te gaan of de molenaar werkte met µ 5 of werkte met µ < 5. De uitspraak die de bakker wenst te controleren noemen we de nulhypothese H. De niet gewenste uitkomst (µ < 5) noemen we het alternatief H a. De bakker moet nu kiezen tussen: H : µ µ = 5 H a : µ < µ = 5 Bij het nemen van een beslissing moet de bakker rekening houden met twee soorten risico. We bekijken daartoe het volgende schema. Op basis van een beslissingsregel van de bakker komen we terecht in één van de vier vakjes van het schema.

3 Toetsen van hypothesen 3 SCHEMA mogelijkheden de consument verwerpt H de consument verwerpt H niet de producent heeft gelijk en de nulhypothese H is correct foutieve beslissing type I fout (α) correcte beslissing de producent heeft ongelijk en de alternatieve hypothese geldt H a (H is vals) correcte beslissing foutieve beslissing type II fout (β) Het is enerzijds mogelijk dat de bakker de levering ten onrechte verwerpt: op basis van empirische evidentie meent de bakker dat H a geldt, maar in feite is H correct. Deze foutieve beslissing noemen we een fout van de eerste soort. Nu wordt de beslissing meestal genomen op basis van een steekproef en deze hangt af van toevallige omstandigheden. De kans op een fout van de eerste soort noteren we met α en noemen we het α-risico of het producentenrisico: α = P(H verwerpen H juist) De kans dat een dergelijke fout niet gemaakt wordt is 1 α en noemt men soms de betrouwbaarheid van de toets: 1 α = P(H niet verwerpen H correct) Het is anderzijds ook mogelijk dat de bakker de levering ten onrechte aanvaardt: de bakker denkt dat H geldt en dat hij de molenaar kan vertrouwen, maar in feite is de molenaar een bedrieger die goederen levert met µ < 5. In realiteit is H a correct. Deze foutieve beslissing noemen we een fout van de tweede soort. De kans op een dergelijke fout noteren we met β en noemen we het β-risico of het consumentenrisico. We noteren: β = P(H niet verwerpen H vals) De kans dat een dergelijke fout niet gemaakt wordt is 1 β en noemt men het onderscheidingsvermogen van de beslissingsregel. De kans om het bedrog te doorzien is dus gelijk aan: 1 β = P(H verwerpen H vals) Als de molenaar zwaar liegt en zakken bloem levert met een gemiddeld gewicht gelijk aan µ = 45, dan zullen we dit makkelijker ontdekken dan in het geval waarin de molenaar een kleine leugenaar is en bloem levert in zakken van gemiddeld µ = 49.9.

4 Toetsen van hypothesen 4 Het is m.a.w. gemakkelijker om een onderscheid te maken tussen 5 en 45 dan tussen 5 en Afhankelijk van de beslissingsregel die de bakker hanteert en afhankelijk van het (goed of slecht) karakter van de molenaar, zullen α en β andere waarden aannemen. Beide partijen hebben er alle belang bij dat deze kansen zo klein mogelijk zijn. Hoe kunnen we nu een goede beslissingsregel opstellen en formuleren? Voorbeeld 2 Een machine maakt spijkers waarvan de normlengte gelijk is aan 1 cm. Zowel té kleine als té grote spijkers zijn onbruikbaar. Op regelmatige tijdstippen zal men de productie van spijkers controleren om te kunnen kiezen tussen H : µ = µ = 1 en H a : µ µ = 1 Vanzelfsprekend geven beslissingsregels opnieuw aanleiding tot beide types van fouten. In vergelijking met voorbeeld 1 gaat het hier om een tweezijdig alternatief: afwijkingen aan beide zijden van de normlengte van 1 cm worden niet toegelaten. In voorbeeld 1 gaat het om een éénzijdig alternatief: de bakker zal niet boos zijn indien de zakken bloem méér dan het gemiddelde gewicht van 5 kg bevatten. Voorbeeld 3 Een wagenproducent beweert dat zijn wagens niet meer verbruiken dan 5 liter per 1 km. Om dit te controleren nemen we een steekproef en kiezen vervolgens tussen H : µ µ = 1 en H a : µ > µ = 1 In dit voorbeeld gaat het terug om een éénzijdig alternatief: een té groot verbruik zal voor de consumenten niet aanvaardbaar zijn.

5 Toetsen van hypothesen 5 2. Beslissingsregels Er zijn verschillende manieren om beslissingsregels te formuleren. We bekijken hier enkele beslissingsregels in de context van voorbeeld 1 over de bakker en de molenaar. Hier staan twee hypothesen tegenover elkaar: "De molenaar is eerlijk" (de nulhypothese) en "De door de molenaar gevulde zakken zijn lichter dan aangekondigd" (een alternatieve hypothese). De bakker wil op grond van gegevens beslissen of hij de nulhypothese zal verwerpen ten voordele van het alternatief. In het dagelijks leven worden de meeste beslissingen dikwijls impulsief en op subjectieve basis genomen worden. In statistiek zijn de meeste beslissingsregel gebaseerd op de resultaten van een steekproeftrekking. Via de steekproef bepaalt men een karakteristiek die vervolgens gebruikt wordt om te beslissen. De karakteristiek op basis van dewelke men zijn besluit neemt en fundeert noemt men meestal de toetsingsgrootheid. We illustreren verschillende beslissingsregels voor het voorbeeld van de bakker en de molenaar Beslissen op grond van kritische grenzen Een voorbeeld van een beslissingsregel is de volgende: uit elke lading neemt de bakker een staal van n = 16 zakken en hij bepaalt het steekproefgemiddelde X van deze 16 gevonden gewichten. Hij beslist nu als volgt: Hij kiest een kritische (of kritieke) grens K en beslist: als X < K, dan verwerpt hij H (en dus de lading) als X K, dan verwerpt hij H (en dus de lading) niet De toetsingsgrootheid is hier het steekproefgemiddelde X en de beslissingsregel is gebaseerd op de kritische grens K. Stel bijvoorbeeld K = Als we in een concrete steekproef vinden dat X gelijk is aan 49.65, dan verwerpen we de lading; als X = verwerpen we de lading niet. Bij de kritische grens K = 49.5 laat de bakker een afwijking toe van.5 kg. In dit geval zal de lading zowel bij X = als bij X = aangenomen worden. Vanzelfsprekend zal de keuze van de steekproefgrootte en de keuze van K het consumentenrisico en het producentenrisico beïnvloeden.

6 Toetsen van hypothesen Het α-risico We bepalen het α-risico voor deze beslissingsregel. We vinden α = P(H verwerpen H juist) = P( X < K µ = µ = 5) Uit de gegevens weten we dat X N(µ, σ² =.25) en bijgevolg dat X N(µ, σ² / n) Indien µ = µ = 5 vinden we X N(µ, σ² / n) en na standardiseren dus dat α = P( X < K µ = µ = 5) = P(Z < Voor K = 49.8 vinden we α = P( Z < K µ σ / / 4 n ) ) = P( Z < - 1.6) =.54 alfarisico bij K = ,5 3 2,5 2 1,5 1 alfa,5 49,4 49,6 49,8 5 5,2 5,4 5,6 Voor K = 49.5 vinden we α = P( Z < / 4 ) = P( Z < - 4) =.3 Voor andere kritische grenzen vinden we de volgende tabel en grafiek: K standardiseren alfa 5,5 49,95 -,4, ,9 -,8, ,85-1,2, ,8-1,6, ,75-2, ,7-2,4, ,65-2,8, ,6-3,2,687 49,55-3,6,159 49,5-4 3,17E-5

7 Toetsen van hypothesen 7 alfa-risico in functie van K,6,5,4 alfa,3,2,1 49,4 49,5 49,6 49,7 49,8 49,9 5 5,1 K Wanneer we vooraf een bepaald risico α vastleggen, dan kunnen we de bijhorende kritische grens bepalen via de vergelijking K µ α = P(Z < ) σ / n In de notatie die we in het vorig hoofdstuk gebruikten vinden we dat K µ σ / n = z α of K = µ z α σ/ n Het β-risico We bepalen nu eveneens het beta-risico bij deze beslissingsregel. We vinden β = P(H niet verwerpen H vals) = P( X K µ < µ ) Indien µ = µ a < µ dan vinden we X N(µ a, σ² / n) en na standaardiseren dat β = P( X K µ = µ a < µ ) = P( Z Bij K = en µ a = 49 vinden we grafisch: K µ σ / a n )

8 Toetsen van hypothesen 8,9,8,7,6,5,4,3,2,1 47,4 4 7,7 4 7,9 48,2 48,4 4 8,7 48,9 49,2 4 9,4 4 9,7 49,9 5,2 5,4 5,7 5,9 5 1,2 51,4 51,7 5 1,9 5 2,2 52,4 Voor K = en verschillende waarden van µ a vinden we de volgende tabel en grafiek: K = 49,75 µ(a) stand. beta 1 - beta 49,5 2,2275, ,55 1,6,54799, ,6 1,2,1157, ,65,8,211855, ,7,4,344578, ,75 1,14E-13,5,5 49,8 -,4,655422, ,85 -,8,788145, ,9-1,2,88493, ,95-1,6,94521, ,97725,2275 beta-risico in functie van µ(a) voor K = ,8 beta,6,4,2 49,4 49,5 49,6 49,7 49,8 49,9 5 µ(a) Naarmate de molenaar meer liegt daalt het beta-risico en stijgt het onderscheidend vermogen: er is een kleinere kans dat we de leugen niet ontdekken. Voor µ a < µ = 5

9 Toetsen van hypothesen 9 maar in de omgeving van µ = 5 vinden we dat β ongeveer gelijk is aan Dit is precies gelijk aan het alfa-risico van de beslissingsregel gebaseerd op K = Voor elke andere kritische grens K kunnen we een dergelijke tabel en grafiek maken. De relatie tussen β, K en µ a wordt gegeven door z β = K µ σ / a n of K = µ a + z β σ / n Opmerking Bemerk dat voor elke beslissingsregel met een vooraf gegeven α, het β-risico kan variëren tussen % en (1 α)%. Het is dus met dit soort beslissingsregels niét mogelijk om tegelijkertijd zowel α als β klein te houden. Wat men wél kan doen is het volgende: voor een vooraf gegeven α, β en µ a, kunnen we de vereiste steekproefgrootte bepalen! Uit K = µ - z α σ/ n en K = µ a + z β σ / n volgt immers dat µ - z α σ/ n = µ a + z β σ / n zodat (µ - µ a ) = (z α + z β )σ / n en dus n = (z α + z β )σ /(µ - µ a ) 2.2. Beslissen op grond van betrouwbaarheidsintervallen Een tweede beslissingsregel is gebaseerd op betrouwbare uitspraken. Uit elke lading neemt de bakker n = 16 zakken en hij bepaalt het steekproefgemiddelde X. De beslissingsregel luidt nu als volgt: Kies een gewenste betrouwbaarheid 1 α en construeer een (1 α)% b.b. voor µ als µ > b.b., dan verwerpen we H (en dus de lading) als µ b.b., dan verwerpen we H (en dus de lading) niet In ons voorbeeld is X ~ N(µ,.25). Wanneer we kiezen voor een 95% b.b., dan vinden we voor µ de volgende b.b.: µ X + z 5% σ/ n = X *.5/4 = X +.26 We vinden dus dat X +.26 groter is dan of gelijk aan de echte waarde van µ met een kans of betrouwbaarheid van 95 %. Stel nu dat we in een concrete steekproef de waarde X = 49.7 vinden. In dit geval vinden we als b.b. µ = We merken dat de vooropgestelde waarde van µ = 5 een onbetrouwbare waarde is! In dit geval verwerpen we bijgevolg de nulhypothese H.

10 Toetsen van hypothesen 1 Als we anderzijds in een concrete steekproef de waarde X = 49.9 vinden, dan vinden we als 95% b.b. voor µ de grens µ = In dit geval is de waarde die we vooropstellen in de nulhypothese (µ = 5) wel een betrouwbare waarde en verwerpen we H niet. Opmerking: verband met kritische grens. Bij deze beslissingsregel beslissen we om H te verwerpen van zodra µ > b.b. µ > X + z α σ/ n X < µ z α σ/ n Deze tweede beslissingsregel is dus equivalent met de beslissing om H te verwerpen op grond van de kritische grens K = µ z α σ/ n Deze kritische grens K = µ z α σ/ n noemen we daarom de 95% betrouwbare kritische grens. Het bepalen van α- en β-risico verloopt nu verder zoals in Beslissen op grond van overschrijdingskansen Bij deze aanpak verwerpt de bakker de lading als de steekproefresultaten niet voldoen aan zijn verwachtingen. Uit elke lading neemt de bakker n = 16 zakken en hij bepaalt de waarde van het steekproefgemiddelde X voor deze 16 gevonden gewichten. Indien X = , dan zal de bakker tevreden zijn en is het vrij evident dat hij niet zal twijfelen aan de goede trouw van molenaar. Als echter X = 49.9 < 5, dan zal de bakker misschien twijfelen aan de goede trouw van de molenaar. Als X = 49.6 < 5, dan zal de bakker grotere twijfels hebben: als de zakken echt gemiddeld µ = 5kg wegen, dan is een dergelijk steekproefresultaat niet geloofwaardig. De molenaar kan zich verweren en toevalsfactoren inroepen als verklaring voor de lage waarde van het steekproefgemiddelde: de molenaar beweert dat dit steekproefresultaat niet de regel, maar een uitzondering is. Om dit na te gaan veronderstelt de bakker dat de nulhypothese geldt en bepaalt de bakker de kans op een steekproefresultaat met een gemiddelde waarde X kleiner dan of gelijk aan Deze kans noemen we de overschrijdingskans van het steekproefresultaat. De bakker beslist dan als volgt: Hij kiest een toegelaten overschrijdingskans α en beslist als de overschrijdingskans < α, dan verwerpt hij H en dus de lading als de overschrijdingskans α, dan verwerpt hij H niet

11 Toetsen van hypothesen 11 Als in een concrete situatie de berekende OK (= overschrijdingskans) te klein is, dan is het gevonden concrete steekproefresultaat in het licht van de nulhypothese - onwaarschijnlijk. In dit geval zal de bakker de bewering (en dus de lading) van de molenaar verwerpen. We bepalen nu deze OK bij twee voorbeelden. (a )Veronderstel dat X = 49.9 < 5. We weten dat X ~ N(µ,.25) waaruit volgt dat X ~ N(µ,.25/16) Indien H correct is, dan is µ 5. In het slechtste geval is µ = 5 en dan vinden we X ~ N(5,.25/16). De OK van ons steekproefresultaat bedraagt (via standaardiseren) P( X 49.9) = P(Z (49.9 5)/.5/4) = P(Z -.8) =.2219 Indien µ = 5, dan krijgen we in ongeveer 22% van de gevallen een steekproefresultaat waarbij X Het is dus helemaal niet uitzonderlijk dat we een steekproefresultaat vinden waarbij X = (b) Veronderstel nu dat X = 49.6 < 5. Als H correct is dan is X ~ N(5,.25/16). De OK van ons steekproefresultaat is nu: P( X 49.6) = P(Z (49.6 5)/.5/4) = P(Z - 3.2) =.687 Indien µ = 5, dan is het heel onwaarschijnlijk dat we bij een steekproef van omvang n = 16 een steekproefresultaat vinden waarbij X De lading wordt bijgevolg verworpen. Afhankelijk van de keuze van α en ook van de steekproefomvang, zal de genomen beslissing bij deze beslissingsregel variëren. Opmerkingen. (1) De getallen -3.2 resp. -.8 die we berekenden noemen we de z-waarde van de gevonden steekproefresultaten X = 49.6 resp Wanneer µ = µ en X = x dan is de z-waarde gedefinieerd als z = z( x ) = x µ De gekozen toegelaten overschrijdingskans α noemt men soms het significantieniveau van de beslissingsregel. σ / n

12 Toetsen van hypothesen 12 (2) Verband met de vorige beslissingsregels De OK van x is gelijk aan OK = P(Z z-waarde H is correct). Bemerk nu dat H wordt verworpen P(Z z-waarde H is correct) α z-waarde -z α X µ σ / n -z α X µ z α σ/ n X + z α σ/ n µ De beslissing om H te verwerpen als de overschrijdingskans α overschreden wordt is dus equivalent met de beslissing om H te verwerpen als de waarde van het steekproefgemiddelde onder de kritische grens K = µ z α σ/ n ligt, en dus ook equivalent met de beslissing om H te verwerpen als µ boven de de (1 - α)% b.b. X z α σ/ n ligt Beslissen op grond van andere beslissingsregels De bovenstaande beslissingsregels (BR) waren telkens gebaseerd op het rekenkundig gemiddelde. We kunnen BR echter ook baseren op andere steekproefkarakteristieken zoals het maximum, de mediaan, bepaalde steekproefproporties, de empirische verdelingsfunctie. Een andere BR bestaat erin om getrapte beslissingen te nemen. Voorbeeld 1 Uit elke lading neemt de bakker een steekproef van grootte n = 5 en hij verdeelt de zakken in twee klassen: als het gewicht van een zak kleiner is dan 5, dan is dit een mislukking, zoniet is het een succes. Een beslissing wordt nu genomen op basis van het aantal successen (#S), en wel op de volgende manier

13 Toetsen van hypothesen 13 De bakker (beslisser) legt een kritische grens K vast en als #S < K, dan verwerpt hij H (en dus de lading) als #S K dan verwerpt hij H (en dus de lading)niet. Cijfervoorbeeld. Stel dat we de kritische grens K = 15 kiezen. Wanneer we in een concrete steekproef vinden dat #S = 17, dan verwerpen we H niet. Als we in een concrete steekproef vinden dat #S = 12, dan verwerpen we H wel. Ter illustratie bepalen we hier ook het α-risico van deze BR. Indien H correct is, dan is de kans op een succes p = P(X > 5) =.5. Bij een steekproef van omvang 5 is het aantal successen dus binomiaal verdeeld: #S BIN(n = 5, p =.5) Omdat n voldoende groot is benaderen we #S N(25, 12.5). We vinden nu (met CC) α = P(#S < K H correct) = P(#S < 15 µ = 5)= P(#S 14.5 µ = 5) Via de CLS vinden we dat α P(Z ( )/ 12.5) = P(Z -2.97) =.15. Varianten van beslissing volgens deze BR krijgen we door n anders te kiezen of door de kritieke grens K anders te kiezen. Voorbeeld 2 Uit elke lading neemt de bakker een steekproef van omvang n = 25 en bepaalt de empirische verdelingsfunctie EVF(x). Als EVF té veel afwijkt van de theoretische verdelingsfunctie TVF (dit is de verdelingsfunctie van de t.v. X ~ N(µ = 5,.25)), dan wordt de nulhypothese verworpen. We berekenen vervolgens D = max EVF(x) TVF(x) en een mogelijke BR luidt als volgt: De bakker (beslisser) legt een kritische grens K vast en beslist als D > K, dan verwerpt hij H (en dus de lading) als D K, dan verwerpt hij H (en dus de lading)niet. Voorbeeld 3 Een voorbeeld van een getrapte beslissingsregel is de volgende. We nemen een steekproef van n = 1 stuks en bepalen X Als X dan verwerpt de bakker de lading niet

14 Toetsen van hypothesen 14 Als X < 49.85, dan neemt hij een tweede steekproef van grootte n = 9 als voor deze tweede steekproef X 5, dan wordt de lading niet verworpen als voor deze tweede steekproef X < 5, dan wordt de lading verworpen Voorbeeld 4 We nemen geregeld steekproeven van omvang n = 1. Wanneer we in een dergelijke steekproef 4 keer na elkaar een gewicht vinden dat lager is dan 5, dan verwerpen we de lading.

15 Toetsen van hypothesen Toetsen omtrent µ via kritische grenzen We veralgemenen nu de situatie van het vorige voorbeeld Eenzijdig alternatief 1 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ < µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen een kritische grens K alsx K, dan wordt H verworpen alsx > K, dan wordt H niet verworpen De relatie tussen K en het α-risico wordt gegeven door de volgende relatie: K = µ z α σ / n Bij een gegeven α-risico luidt de BR via kritische grenzen als volgt: alsx K = µ z α σ / n, dan wordt H verworpen alsx > K = µ z α σ / n, dan wordt H niet verworpen Bij een gegeven kritische grens K bepalen we het β-risico als volgt: indien H a correct is en µ = µ a < µ, dan is X ~ N(µ a, σ² / n) en β = P( X > K µ = µ a ) = P(Z < K µ σ / We vinden ook de relatie tussen β, K en µ a : a n ) z β = K µ σ / a n of K = µ a + z β σ / n

16 Toetsen van hypothesen Eenzijdig alternatief 2 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ > µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen een kritische grens K alsx K, dan wordt H verworpen alsx < K, dan wordt H niet verworpen De relatie tussen K en het α-risico wordt gegeven door de volgende relatie: K = µ + z α σ / n Bij een gegeven α-risico luidt de BR via kritische grenzen als volgt: alsx K = µ + z α σ / n, dan wordt H verworpen alsx < K = µ + z α σ / n, dan wordt H niet verworpen Bij een gegeven kritische grens K bepalen we het β-risico als volgt. Indien H a correct is en µ = µ a < µ, dan is X ~ N(µ a, σ² / n) en vinden we β = P( X < K µ = µ a ) = P(Z < We vinden ook de relatie tussen β, K en µ a : K µ σ / a n ) z β = K µ σ / a n of K = µ a z β σ / n

17 Toetsen van hypothesen Tweezijdig alternatief Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ = µ en H a : µ µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen twee kritische grenzen K en L als L X K, dan wordt H niet verworpen alsx > K of als X < L, dan wordt H verworpen Omdat de normale verdeling symmetrisch is rond het gemiddelde µ, is het gebruikelijk om ook de kritische grenzen symmetrisch te kiezen. Men kiest gewoonlijk voor de kritische grenzen K, L = µ ± z α/2 σ / n Deze grenzen zijn gemakkelijk te onthouden en ze geven ook de relatie weer tussen het de grenzen K, L en het α-risico. Bij een gegeven α-risico luidt de BR via kritische grenzen dan als volgt: als µ z α/2 σ / n X µ + z α/2 σ / n, dan wordt H niet verworpen als X > µ + z α/2 σ / n of X < µ z α/2 σ / n, dan wordt H niet verworpen Bij gegeven kritische grenzen K en L bepalen we het β-risico als volgt: indien H a correct is en µ = µ a < µ, dan is X ~ N(µ a, σ² / n) en L µ a β = P(L X K µ = µ a ) = P( σ / n Wanneer K, L = µ ± z α/2 σ / n, dan vinden we Z µ µ β = P( a µ µ zα / 2 Z a + zα / 2 ) σ / n σ / n Cijfervoorbeeld K µ Flesjes parfum worden gevuld met een hoeveelheid X N(µ, σ² =.36). Het is van belang dat de inhoud van een flesje gemiddeld precies gelijk is aan 1 ml. We wensen daarom de volgende hypothesen te toetsen: H : µ = 1 H a : µ 1 σ / a n )

18 Toetsen van hypothesen 18 We nemen daartoe geregeld een steekproef van omvang n = 25 en berekenen X. De BR met een α-risico van 5% leidt tot de volgende kritische grenzen: K, L = µ ± z α/2 σ / n = 1 ± 1.96*.6/5 = 1 ±.2352 We beslissen dus: Als X , dan wordt H niet verworpen als X > of X < , dan wordt H niet verworpen We berekenen nu β en 1 β voor verschillende alternatieven: µ µ µ β = P( a µ zα / 2 Z a + zα / 2 ) σ / n σ / n 1 µ = P( a 1 µ Z a ).6 / 5.6 / 5 In functie van µ a vinden we de volgende tabel en grafiek: µ(a) beta 1-beta 99,4,1183, ,45,4354, ,5,13669, ,55,36727, ,6,84824, ,65,169367, ,7,294594, ,75,45895, ,8,615223, ,85,76484, ,9,86745, ,95,92989,711 1,954, ,5,92989,711 1,1,86745, ,15,76484, ,2,615223, ,25,45895, ,3,294594,7546 1,35,169367, ,4,84824, ,45,36727, ,5,13669,986331

19 Toetsen van hypothesen 19 onderscheidingsvermogen 1,9,8,7,6,5,4,3,2,1 9 9,4 9 9,5 9 9,6 9 9,7 9 9,8 9 9,9 1 1,1 1,2 1,3 1,4 1,5 1,6 µ(a) 3.4. Uitbreidingen Steekproef uit een andere verdeling Als de steekproef niet uit een normale maar uit een niet gepreciseerde verdeling komt, dan gelden de bovenstaande formules nog steeds op voorwaarde dat de steekproefomvang n voldoende groot is. Dank zij de CLS kunnen we de verdeling van X immers benaderen door een geschikte normale verdeling Ongekende variantie Als de variantie niet bekend is, dan vervangen we in de bovenstaande formules de onbekende variantie σ² door s 2. - Bij kleine steekproeven uit een normale verdeling vervangen we de z α - of z α/2 -waarde door een geschikte t n-1 -waarde. De kritieke grenzen zijn dan K = µ t n-1,α s / n K = µ + t n-1,α s / n K = µ ± t n-1,α/2 s / n - Bij grote steekproeven uit een arbitraire verdeling blijven de formules ongewijzigd: K = µ z α s / n K = µ + z α s / n K = µ ± z α/2 s / n

20 Toetsen van hypothesen 2 4. Toetsen omtrent µ via betrouwbaarheidsintervallen 4.1. Eenzijdig alternatief 1 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ < µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen een gewenste betrouwbaarheid 1 α en constureren de b.b. µ X + z α σ/ n als µ X + z α σ/ n, dan wordt H niet verworpen als µ > X + z α σ/ n, dan wordt H verworpen We merken dat H wordt verworpen enkel en alleen als µ > X + z α σ/ n en deze formule geldt enkel en alleen als X < µ - z α σ/ n. Deze grens is precies de kritische grens die we vonden in de vorige paragraaf! 4.2. Eenzijdig alternatief 2 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ > µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen een gewenste betrouwbaarheid 1 α en construeren de b.o. µ X z α σ/ n als µ X z α σ/ n, dan wordt H niet verworpen als µ < X z α σ/ n, dan wordt H verworpen We merken dat H wordt verworpen enkel en alleen als µ < X z α σ/ n en deze formule geldt enkel en alleen als X > µ + z α σ/ n Deze grens is precies de kritische grens die we vonden in de vorige paragraaf!

21 Toetsen van hypothesen Tweezijdig alternatief Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ = µ en H a : µ µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen een gewenste betrouwbaarheid 1 α en constureren het b.i. µ = X ± z α σ/ n als µ b.i, dan wordt H niet verworpen als µ b.i., dan wordt H verworpen Deze beslissingsregel kunnen we eveneens herformuleren als volgt: we verwerpen H niet enkel en alleen als X z α σ/ n µ X + z α σ/ n enkel en alleen als µ z α σ/ n X µ + z α σ/ n Dit zijn de kritische grenzen die we in de vorige paragraaf vonden Opmerkingen - Het is duidelijk dat beide (kritieke grens b.i.) methodes volledig equivalent zijn! - Als hulpmiddel voor het onthouden van het soort betrouwbaarheidsinterval we nodig hebben kunnen we gebruik maken van het volgende: bij een tweezijdig alternatief (µ µ ) bepalen we een b.i. voor µ bij een eenzijdig alternatief van de vorm µ > µ, bepalen we een b.o. voor µ bij een eenzijdig alternatief van de vorm µ < µ, bepalen we een b.b. voor µ - Wanneer we de variantie niet kennen, werken we met s en voor - kleine steekproeven uit een normale verdeling - met een geschikte t-waarde.

22 Toetsen van hypothesen Toetsen omtrent µ via overschrijdingskansen 5.1. Eenzijdig alternatief 1 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ < µ waarbij µ een gegeven getal is. Als BR hanteren we: We nemen een steekproef van omvang n en bepalen X We kiezen een maximaal toegelaten overschrijdingskans α Bij een concreet steekproefresultaat x berekenen we de z-waarde ervan z = z( x ) = x µ σ / n en de overschrijdingskans ervan: OK = P(Z < z) als OK α, dan wordt H niet verworpen als OK < α, dan wordt H verworpen De overschrijdingskans OK van z noemt men soms ook de P-waarde of Probability value van z Eenzijdig alternatief 2 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ > µ waarbij µ een gegeven getal is. We beslissen zoals in de vorige paragraaf: We nemen een steekproef van omvang n en bepalen X We kiezen een maximaal toegelaten overschrijdingskans α Bij een concreet steekproefresultaat x berekenen we de z-waarde ervan z = z( x ) = x µ σ / n en de overschrijdingskans ervan: OK = P(Z > z) als OK α, dan wordt H niet verworpen als OK < α, dan wordt H verworpen

23 Toetsen van hypothesen Tweezijdig alternatief Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ = µ en H a : µ µ waarbij µ een gegeven getal is. Als BR hanteren we: We nemen een steekproef van omvang n en bepalen X We kiezen een maximaal toegelaten overschrijdingskans α Bij een concreet steekproefresultaat x berekenen we de z-waarde ervan z = z( x ) = x µ σ / n en de overschrijdingskans ervan: OK = P( Z > z ) als OK α, dan wordt H niet verworpen als OK < α, dan wordt H verworpen Indien z >, dan kunnen we OK vereenvoudigen tot OK = 2*P(Z > z); indien z <, dan vinden we OK = 2*P(Z > -z) Voorbeeld Een firma van autobanden beweert dat hun product een levensduur heeft van gemiddeld minstens 5 km met σ = 1 3 km. Bij een onderzoek van n = 1 banden vinden we X = km. Is de bewering van de fabrikant houdbaar? Wij moeten hier onderzoeken of er een betekenisvolle afwijking is tussen de bewering van de fabrikant en ons vermoeden dat de levensduur gemiddeld lager is dan wat de fabrikant beweert. Wij toetsen H : µ µ = 5 vs H a : µ < 5 (In H plaatsten we de bewering van de fabrikant) a) via kritische grenzen. Wanneer α = 5 % vinden we K = µ - z α σ/ n = *13 /1 = Daar ons steekproefresultaat X = km < K, verwerpen we H. Ons steekproefresultaat wijst er op dat H niet houdbaar is. Opmerking. In het geval dat X = km verwerpen we H niet. b) via betrouwbare uitspraken. Wanneer α = 5 % vinden we als 95% b.b. de grens

24 Toetsen van hypothesen 24 µ X + z α σ / n = *13/1 = Daar µ = µ = 5 niet in dit betrouwbaar gebied ligt verwerpen we H. De waarde µ = 5 is immers onbetrouwbaar. Opmerking. Bij H : µ µ = 49 6 en H a : µ < 49 6 is µ = 49 6 wél een betrouwbare waarde en hebben we onvoldoende reden om H te verwerpen. c) via overschrijdingskansen. We vonden in onze steekproef van omvang n = 1 het steekproefgemiddelde We vinden als z-waarde z = ( )/(13/1) = De OK is dus OK = P(Z < ) =.1. Deze zeer kleine overschrijdingskans wijst erop dat H heel onwaarschijnlijk is Opmerkingen 1) Als de steekproef niet uit een normale verdeling komt, maar wel voldoende groot is, dan kunnen we dank zij de CLS dezelfde formules gebruiken. 2) Als de variantie niet gekend is, dan kan deze worden geschat door s 2. In plaats van de z-waarde berekenen we nu de t-waarde: t = t( x ) = x µ Bij grote steekproeven is t( X ) N(,1) en berekenen we via de standaardnormale verdeling de OK van de berekende t-waarde. We beslissen dan om H al dan niet te verwerpen. Bij kleine steekproeven uit een normale verdeling berekenen we de OK door gebruik te maken van t( X ) t n-1 en de t n-1 -verdeling. 3) De P-waarde van een steekproefresultaat is gelijk aan P t( x) t ). s / n ( < n 1 Voorbeeld De diameter van een knikker is normaal verdeeld en men beweert dat de gemiddelde diameter gelijk is aan µ = 4.4. Via een steekproef van omvang n = 1 vonden we X = 4.38 mm en s =.6 mm. We toetsen H : µ = 4.4 vs H a : µ < 4.4 * De 95% kritische grens is gelijk aan K = µ t n-1,5% s/ n = *.6/ 1 = = 4.36 Omdat X = 4.38 > K verwerpen we H niet.

25 Toetsen van hypothesen 25 * Een 95% b.b. voor µ wordt gegeven door µ X + t n-1,5% s/ n = = 4.42 Omdat µ = 4.4 een betrouwbare waarde is verwerpen we H niet. * De t-waarde van ons steekproefresultaat is t = x µ s / n = ( )/.6/ 1 = -1.5 Via de t 9 -verdeling vinden we OK = P(t 9 < -1.5) = 16% en we verwerpen H niet Slotopmerkingen 1) De drie werkwijzen leiden bij een gegeven steekproefgemiddelde X, α en µ steeds tot hetzelfde besluit. Alleen is de aanpak, de filosofie telkens lichtjes verschillend. - Bij de werkwijze gebaseerd op kritische grenzen bepalen we kritieke grenzen m.b.v. van µ en α. Pas op het laatste moment komt het steekproefresultaat X aan bod om een beslissing te nemen. Alle steekproefresultaten die een X geven die binnen de normen valt leiden tot het niet verwerpen van H. - Bij de werkwijze gebaseerd op b.i. bepalen we betrouwbare grenzen op basis van het steekproefresultaat X en α. Pas op het laatste ogenblik komt de waarde µ aan bod. Alle nulhypothesen van de vorm H : µ = µ waarbij µ b.i. zijn hypothesen die niet verworpen worden. Een betrouwbaarheidsinterval is m.a.w. de set van alle aanvaardbare nulhypothesen. - Bij de werkwijze gebaseerd op OK bepalen we de OK op basis van X en µ. Pas op het laatst ogenblik komt het significantieniveau α aan bod. Dit zorgt voor een zekere flexibiliteit: we zien precies voor welke α de nulhypothese wordt verworpen en voor welke α de nulhypothese niet wordt verworpen. 2) In de praktijk worden de drie aanpakken door elkaar gebruikt. Alleen kunnen we vaststellen dat voor de ene parameter veelal gewerkt wordt met OK en bij de andere parameters de voorkeur gaat naar b.i. of kritieke grenzen. In econometrie bijvoorbeeld is het gebruikelijk te werken met z- en t-waarden en de bijhorende OK of P-waarden.

26 Toetsen van hypothesen Oefeningen 1. We onderzochten de uitgaven van klanten in een fastfoodrestaurant. In een steekproef van omvang n = 12 klanten vonden we X = 9.7 en s = 3. Toets H : µ = 1 vs H a : µ < 1 voor a) α = 1%, b) α = 5% en c) α = 1%. Maak ook telkens een grafiek van β in functie van µ < Formuleer de BR gebaseerd op een steekproef van omvang 64 en op 99% kritieke grenzen bij de keuze tussen H : µ = 3 en H a : µ > 3. Bepaal ook het risico van type II indien eigenlijk µ = 31. (K = 37; β = 15.87%) 3. (Controlekaarten) Onder normale omstandigheden produceert een machine bollen met een diameter N(µ = 5.75mm, σ =.8mm). Om te controleren of de machine moet bijgesteld worden neemt men elke uur een steekproef van omvang n = 6 en berekent men het rekenkundig gemiddelde X van de gevonden diameters. a) Bepaal grenzen tussen dewelke X moet liggen met een betrouwbaarheid van 99%. De gevonden grenzen noemt men controlegrenzen. b) Wat is uw besluit indien we de volgende steekproefresultaten vinden: X = 5.74, X = 5.81, X = 5.62, X = Op de verpakking van koekjesdozen staat dat het gewicht gemiddeld gelijk is aan µ = 1 gram. Bij de controle van n = 2 dozen vonden we X = 995 gram en s = 25 gram. Klopt dat wat er op de verpakking staat? (α = 5%) 5. Bij een steekproef van omvang n = 72 arbeiders een bepaalde sector vond men een gemiddeld nettoloon van 1885 met s = 158. Mag men beweren dat de lonen in deze sector minstens 19 bedragen (α = 5% en α = 1%)? Bepaal het onderscheidend vermogen van de toets indien µ = 1895, µ = 189, µ = 1885.

27 Toetsen van hypothesen Toetsen i.v.m. andere parameters Wanneer we hypothesen toetsen omtrent parameters die geschat worden via een toetsingsgrootheid of schatter waarvan de verdeling gerelateerd is aan een N-verdeling, dan kunnen we steeds gebruik maken van een van de drie klassieke beslissingsregels (betrouwbare uitspraken, kritische grenzen, OK). Parameters in deze categorie zijn o.a. * proportie p en verschil tussen proporties (ongepaard) * verschil tussen gemiddelden (gepaard of ongepaard) * correlatiecoëfficiënten (via Fisher-eigenschap) * variantie (bij grote steekproeven) Bij het toetsen van hypothesen omtrent andere parameters (o.a. varianties, correlaties, quotiënt van varianties bij ongepaarde steekproeven) zullen we meestal gebruik maken van de methode gebaseerd op betrouwbaarheidsintervallen of van z-waarden, t-waarden en hun overschrijdingskansen. We illustreren verschillende mogelijkheden via een aantal goed gekozen cijfervoorbeelden Toetsen i.v.m. proporties Voorbeeld 1 In 1999 had één gezin op twee een kleurenprinter thuis. Uit nieuw onderzoek blijkt dat 33 van de 5 onderzochte gezinnen een kleurenprinter hebben. Is dit een betekenisvolle vooruitgang? Dit is een voorbeeld van een toets op proporties: H : p = p = 5 % (géén) vs H a : p > p = 5 % (wél vooruitgang) Bij een steekproef van omvang n = 5 vinden we pˆ = 66% a) Via b.o. We kiezen (bijvoorbeeld) α = 5% en construeren en 95% b.o. voor p. Met de benaderende formule vinden we p * (.66*.34) / 5 = =.55 Omdat p = p = 5% geen betrouwbare waarde is besluiten we (met een risico van α = 5%) dat er vooruitgang is! Voor een 99% b.o. vinden we p * (.66*.34) / 5 =.54. Opnieuw besluiten we dat er vooruitgang is (met een risico van α = 1%)

28 Toetsen van hypothesen 28 b) Via OK Aangezien de steekproef voldoende groot is berekenen we hier de t-waarde/z-waarde van het steekproefresultaat. We vinden t = z = pˆ p =.16/ 1/2 = 2.26 p (1 p ) / n We berekenen de OK (en mogen met de standaardnormale verdeling werken) en vinden OK = P(Z > 2.26) =.12 Bij α = 5% vinden we OK < α en verwerpen we H. Bij α = 1% vinden we OK > α en verwerpen H niet. Opmerking We komen tot verschillende besluiten omdat we bij het opstellen van de betrouwbare uitspraak de benadering pˆ N ( p, pˆ(1 pˆ) / n) gebruikten. Bij het berekenen van de OK maken we deze benadering niet. De methode via OK verdient dus de voorkeur. Voorbeeld 2 Bij de vorige verkiezingen behaalde partij K 19.5 % van de stemmen. Uit een enquête bij 118 personen vinden we dat 17.4 % de intentie hebben om voor partij K te stemmen. Is dit een betekenisvolle achteruitgang? (α = 5%). We toetsen hier H : p = 19.5 % (geen achteruitgang) vs H a : p < 19.5 % (wel achteruitgang) Hier is de z-waarde gelijk aan z = ( )/ (.195*( )/118) = met OK = P(Z < 1.69) = 4.5% Bij α = 5% verwerpen we H terwijl we bij α = 2.5% H niet verwerpen. Oefeningen 1. Bij n = 1 worpen met een muntstuk vonden we 53 keer de beeldzijde. a) Mogen we ervan uitgaan dat het muntstuk onvervalst is? Kies tussen H : p =.5 en H a : p >.5 voor bijvoorbeeld α = 5%. b) Bepaal β indien eigenlijk p =.51. c) Bepaal de steekproefgrootte om een onderscheid te kunnen maken tussen p =.5 en p =.55 indien we wensen dat α = β 5%.

29 Toetsen van hypothesen Via een steekproef van 15 lampen vonden we dat bij 11 lampen de levensduur meer bedroeg dan 14 u. Mogen we ervan uitgaan dat minstens 8% van de lampen deze eigenschap hebben? (α = 5% en ook OK) 3. Om een helderziende te controleren wordt het volgende experiment opgezet. In een kamer kiest een proefpersoon kaarten uit een kaartenboek. De helderziende is in een andere kamer en zegt telkens het kleur (rood of zwart) van de gekozen kaart. Bij 5 kaarten was de helderziende 32 keer correct. Is dit een betekenisvol resultaat? Toets H : p =.5 (gokken) vs H a : p >.5 (béter dan gokken) en kies α = 1%, α = 5% Toetsen i.v.m. varianties en/of standaardafwijkingen De toetsen die in deze paragraaf aan bod komen kunnen we enkel uitvoeren voor steekproeven uit een normale verdeling. Voorbeeld 1 Flesjes parfum worden door een machine gevuld met een hoeveelheid X ~ N(1, σ 2 ). Bij het productieproces is het van belang dat de variantie niet groter is dan.36. Om dit te controleren nemen we geregeld een steekproef en bekijken we de berekende steekproefvariantie s². Bij elke controle wensen we te kiezen tussen H : σ 2 =.36 vs H a : σ 2 >.36 In deze oefening werken we met een alfa-risico gelijk aan α= 5% en bekijken we de werkwijze voor een kleine steekproef en voor een grote steekproef. A. Uit een steekproef van omvang n = 21 vonden we s 2 =.64. Kritieke grenzen. Bij toetsen van hypothesen over varianties is het niet gebruikelijk om kritieke grenzen te bepalen. Betrouwbare uitspraken. We bepalen een 95% b.o. via de chikwadraat-verdeling met parameter 2. Omdat P((n 1)s²/σ² χ² 95%, 2 ) = 95% en χ² 95%, 2 = vinden we als 95% b.o. de grens σ² (n 1)s²/31.41 = 2*.64/31.41 =.41 We besluiten H te verwerpen. Overschrijdingskansen. Omdat (n 1)s²/σ² χ² n-1 vinden we P(s² >.64) = P(χ² 2 > 2*.64/.36) = P(χ² 2 > 35.5) =.17 vinden we: bij α = 5% verwerpen we H en bij α = 1% verwerpen we H niet.

30 Toetsen van hypothesen 3 Opmerking Het getal χ²(s²) = (n 1)s²/σ ² noemen we de chikwadraatwaarde van het steekproefresultaat s². B. Uit een steekproef van omvang n = 121 vonden we s 2 =.4. Overschrijdingskansen. Voor grote steekproeven vonden we vroeger dat s² N(σ², 2σ 4 /n). We berekenen de z-waarde van ons steekproefresultaat en vinden z = (.4.36)/ 2 *.36² / 121 =.86 De bijhorende OK is gelijk aan OK = P(Z >.86) = 19.5% We verwerpen H niet. Voorbeeld 2 Een bestaand productieproces produceert lampen met een gemiddelde levensduur die normaal verdeeld is met µ = 12 uren met standaardafwijking σ = 3. We onderzoeken een nieuw proces dat door de technische diensten als beter bestempeld wordt. Bij een steekproef van n = 1 lampen vond men X = 1265 en s = 31. a) Is de gemiddelde levensduur inderdaad hoger? (α = 5%) b) Is de standaardafwijking betekenisvol groter? (α = 5%) We gaan ervan uit dat het nieuwe procédé ook normaal verdeelde levensduren geeft. Hier moeten we twee hypothesen toetsen a) H : µ 12 (nieuwe procédé niet beter) H a : µ > 12 (nieuwe procédé beter) b) H : σ 3 (nieuwe procédé niet slechter) H a : σ > 3 (nieuwe procédé slechter) a) Uit de steekproefresultaten (grote steekproef!) vinden we t/z-waarde en OK t = z = ( )/(31/1) = 2.1 OK (via N(, 1)-verdeling) =.179 Besluit: we verwerpen H : het nieuwe procédé is betekenisvol beter! b) We herleiden het vraagstuk naar een vraagstuk over varianties. Via de steekproefresultaten bepalen we de OK van s² = 31². We vinden z = (31² - 3²)/ 2*3 4 / 1 =.48 en OK = P(Z >.48) = 31.5% We verwerpen H niet.

31 Toetsen van hypothesen 31 Voorbeeld 3 (Oefening) Een betonnen constructie moet kunnen weerstaan aan een (normaal verdeelde) druk van gemiddeld minstens 6 kg/cm 2 met een standaardafwijking van maximaal 3. Bij een steekproef van omvang n = 6 vond men X = 5 en s = 4. a) Is de afwijking t.o.v. het normgemiddelde betekenisvol? ( α = 1%) (Toets H : µ = 6 (voldoende) vs H a : µ < 6 (te laag)) b) Is de afwijking t.o.v. de normstandaardafwijking betekenisvol? (α = 5%) (Toets H : σ = 3 (norm) vs H a : σ > 3 (te hoog)) c) Werk ook telkens met OK. Voorbeeld 4 (Oefening) Op het etiket van naaigaren staat dat elk klosje gemiddeld 2 meter garen bevat met een standaardafwijking van 1.5 meter. We namen de proef op de som en maten de lengte van n = 2 klosjes. We vonden rekenkundig gemiddelde 195 en s = 3.7. Is de informatie op het etiket een correcte weergave van de realiteit (α = 5%)? (U mag ervan uitgaan dat de lengte normaal verdeeld is) 7.3. Verschil tussen gemiddelden en quotiënt varianties (varianties: enkel voor ongepaarde steekproeven uit normale verdelingen) Voorbeeld 1 Bij een onderzoek van een normaal verdeeld kenmerk bij twee onafhankelijke populaties vonden we: populatie 1: n = 5, X = 17 en s 1 = 1.18 populatie 2: m = 41, Y = 19 en s 2 = 1.64 a) Toets H : µ 1 = µ 2 vs H a : µ 1 < µ 2 (α = 5%) b) Toets H : σ 1 = σ 2 vs H a : σ 1 σ 2 (α = 1%) a) Dit is een voorbeeld van een toets omtrent het verschil tussen gemiddelden. We toetsen hier H : µ v = vs H a : µ v < waarbij µ v = µ 1 - µ 2 en we hanteren een α-risico van α = 5%. Omdat X Y N(µ v, σ² 1 /n + σ² 2 /m) kunnen we deze toets zonder probleem uitvoeren. We illustreren de drie werkwijzen.

32 Toetsen van hypothesen 32 * Kritische grenzen De 95% kritische grens is hier K = z 5% σ ² 1 σ ² + 2 n m De varianties schatten we met de s 2 -waarden en we vinden (n, m groot!) K = 1.64* 1.18² 1.64² + = 1.64*.357 = Besluit: omdat het verschil X Y aan = 2 < K, verwerpen we H. * Betrouwbare bovengrens voor µ v tussen de twee rekenkunidge gemiddelden gelijk is Als 95% b.b. vinden we µ v X Y + z 5% σ ² 1 σ ² + 2 n m Met de geschatte varianties vinden we µ v = 1.5. Besluit: omdat µ v = en onbetrouwbare waarde is verwerpen we H. * Overschrijdingskans De z-waarde van ons steekproefresultaat z = ( 2 ) / σ ² 1 σ ² + 2 n m X Y = 2 is gelijk aan Na het schatten van de varianties vinden we z = 2/.357 = De OK is gelijk aan P(Z < 6.54) is gelijk aan % < 5% en we verwerpen H. Opmerking De z-waarde van het steekproefresultaat is gelijk aan x y ( µ 1 µ 2 ) z = z( x, y ) = σ ² 1 σ ² + 2 n m Bij onbekende varianties werken we met de t-waarde: x y ( µ 1 µ 2 ) t = t( x, y ) = s² 1 s² 2 + n m Bij grote steekproeven berekenen we de OK met de standaardnormale verdeling. Bij kleine steekproeven berekenen we OK via ofwel de t n-1 -verdeling ofwel de t m-1 - verdeling. We gebruiken de t-verdeling die overeenstemt met de kleinste waarde van n of m. Bij deze waarde maken we immers de grootste benaderingsfout bij het benaderen van de variantie.

33 Toetsen van hypothesen 33 b) Dit is een toets i.v.m. het vergelijken van (ongepaarde) varianties. * Via betrouwbaarheidsintervallen Een 9% b.i. voor σ 2 1 /σ 2 2 vinden we via s 2 1 /s 2 2 en de F(49,4)-verdeling. Voor X F(49, 4) vinden we via de F(49, 4)- verdeling (met EXCEL) dat P(.61 X 1.66) = 9% Omdat s 2 1 /s 2 2 / σ 2 1 /σ 2 2 F(49, 4) vinden we achtereenvolgens.61 s 2 1 /s 2 2 / σ 2 1 /σ en s 2 1 /s 2 2 / 1.66 σ 2 1 /σ 2 2 s 2 1 /s 2 2 /.61 of.61* s 2 1 /s 2 2 σ 2 1 /σ * s /s 2 Invullen van de s²-waarden geeft het volgende 9% b.i.:.32 σ 2 1 /σ Daar het quotiënt 1 onbetrouwbaar is, verwerpen we H. * Via overschrijdingskansen We berekenen de F-waarde van het steekproefresultaat: F = F(s² 1, s² 2 ) = s 2 1 /s 2 2 /σ /σ 2 We herinneren dat F(s² 1, s² 2 ) F(n-1, m-1) = F(49, 4) In ons voorbeeld vinden we: indien H correct is, dan zijn de varianties gelijk en is de F- waarde gelijk aan F = s 2 1 /s 2 2 = (1.18)²/(1.64)² =.518 Met X F(49, 4) berekenen we P(X <.518) en vinden P(X <.518) =.144. Omdat deze OK kleiner is dan 1% verwerpen we H. Voorbeeld 2 (Oefening) Een consumentenorganisatie onderzocht de levensduur van twee types batterijen: type 1: n = 1, X = 118 en s 1 = 14 type 2: m = 11, Y = 116 en s 2 = 134 a) Toets H : µ 1 = µ 2 vs H a : µ 1 µ 2 (α = 1%) b) Toets H : σ 1 = σ 2 vs H a : σ 1 σ 2 (α = 5%) (Antwoord: a) H ; b) H ) Voorbeeld 3 Bij een bepaalde nieuwe behendigheidstest voerde men het volgende experiment uit. Een groep van 2 personen werd in twee deelgroepen (A en B) verdeeld van 1 personen. In groep A gaf men een tip en in groep B gaf men géén tip. Men telde dan het aantal mensen die de test konden uitvoeren binnen de voorziene tijd.

34 Toetsen van hypothesen 34 In groep A slaagden 64 mensen er in de test uit te voeren binnen de tijd en in groep B waren er 49 mensen die daarin slaagden. Mogen we stellen dat het geven van een tip ervoor zorgt dat een grotere proportie personen slagen in de test? (α = 5%) Hier toetsen we H : p A = p B (géén verschil) vs H a : p A > p B (verbetering) Dit is een toets over het verschil tussen proporties bij ongepaarde steekproeven: H : p A p B = vs H a : p A p B > Wij gebruiken hier (bijvoorbeeld) de toets gebaseerd op z/t-waarde en OK. We vinden t = * *.51 1 =.15/.69 = 2.16 OK = P(Z > 2.16) = 1.5% < α = 5% We verwerpen H. Voorbeeld 4 In de provincies West-Vlaanderen werden 3 kiesgerechtigden en in de provincie Oost- Vlaanderen werden 2 kiesgerechtigden gepeild naar hun opninie t.o.v. een nieuw wetsvoorstel. In W-Wl waren 56 % pro en in O-Vl waren er 48 % pro. a) Kunnen we stellen dat er een betekenisvol (α = 5%) verschil is? We toetsen H : p W p O = vs H a : p W p We vinden de z-waarde z = 1.75 met OK = 2P(Z > 1.75) = 8% en verwerpen H niet. b) Kunnen we stellen dat er in W-Vl betekenisvol (α = 5%) méér voorstanders zijn? We toetsen H : p W p O = vs H a : p W p > We vinden (opnieuw!) z = 1.75 met OK = P(Z > 1.75) = 4% < 5%. We verwerpen H. Voorbeeld 5 Om het effect van een nieuw medicijn te bepalen selecteert men 2 mensen met dezelfde ziekte en men verdeelt lukraak de 2 mensen in 2 groepen van elk 1. De mensen van groep A krijgen het medicijn. Afgezien hiervan worden de twee groepen op dezelfde manier behandeld. Later vinden we dat er bij groep A 75 mensen genezen zijn en dat bij groep B er 65 genezen zijn. Zorgde het medicijn voor een betekenisvolle verbetering? (α = 1%, 5% en 1%)

35 Toetsen van hypothesen Toetsen i.v.m. correlatiecoëfficiënt Voorbeeld 1 (F-toets) We onderzochten de relatie tussen de uitslagen (X, Y) voor twee vakken. Bij een steekproef van omvang n = 75 vonden we een steekproefcorrelatiecoëfficiënt r =.35. We wensen de volgende toets uit te voeren (α = 5%): H : ρ =.3 vs H a : ρ >.3 Omdat de Fishertranformatie stijgend is is deze toets volledig equivalent met H : F(ρ) = F(.3) vs H a : F(ρ) > F(.3) We voeren de toets uit op twee manieren * Via betrouwbare uitspraken. We vinden het 95% b.o. zoals vroeger: F(ρ) F(.35) z 5% (1/(n-3)) 1/ *.1178 = =.1721 Omdat F(.3) =.395 een betrouwbare waarde is, verwerpen we H niet. * We berekenen de OK van de z-waarde. We vinden z = (F(.35) - F(.3))/(1/n-3)) 1/2 =.47 OK = P(Z >.47) = 31.92% Deze grote OK leidt tot het niet verwerpen van H. Voorbeeld 2 (t-toets) Bij een steekproef van 1 pasgehuwde koppels noteerden we de leeftijd van de partners en vonden r =.15. Wijst dit steekproefresultaat op een betekenisvolle positieve correlatie (α = 5%)? We toetsen hier H : ρ = vs H a : ρ >. * We vinden een 95% ondergrens zoals vroeger: F(ρ) F(.15) z 5% (1/(n-3)) 1/ *.115 =.154 Omdat ρ = een betrouwbare waarde is verwerpen we H niet. * We berekenen de OK via de t-waarde (indien H geldt is ρ = en werken we immers met de t-transformatie!). We vinden t(r) = 1.52 met OK = P(t 98 > 1.52) = 6.7%. Met α = 5% verwerpen we H niet. Met α = 1% verwerpen we H wel. Voorbeeld 3 In atletiek is men geïnteresseerd in het verband tussen de startplaats (1 t.e.m. 8) en de plaats (1 t.e.m. 8) bij de uitslag. Bij 75 rennen vond men r =.31. Is dit resultaat betekenisvol groter dan? (α = 1%, 5%, 1%)

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen) Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen) 8.16. Men wenst H 0 : p 0.2 te testen tegenover H 1 : p 0.4 voor een binomiale distributie met n 10. Bepaal α en β als de testfunctie gegeven

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k) 11.0 Voorkennis Let op: Cumulatieve binomiale verdeling: P(X k) = binomcdf(n,p,k) Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k) Voorbeeld 1: Binomiaal kanseperiment

Nadere informatie

15.1 Beslissen op grond van een steekproef [1]

15.1 Beslissen op grond van een steekproef [1] 15.1 Beslissen op grond van een steekproef [1] Voorbeeld 1: Een vulmachine vult flessen met een inhoud van X ml. X is normaal verdeeld met μ = 400 en σ = 4 Er wordt een steekproef genomen van 40 flessen.

Nadere informatie

Toetsen van Hypothesen. Het vaststellen van de hypothese

Toetsen van Hypothesen. Het vaststellen van de hypothese Toetsen van Hypothesen Wisnet-hbo update maart 2008 1. en Het vaststellen van de hypothese De nulhypothese en de Alternatieve hypothese. Het gaat in deze paragraaf puur alleen om de formulering. Er wordt

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4.1 PARAMETERTOESTEN 1 A. Toetsen van het gemiddelde Beschouw een steekproef X 1, X,, X n van n onafhankelijke N(µ, σ) verdeelde kansveranderlijken Men

Nadere informatie

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16 modulus strepen: uitkomst > 0 Hiermee rekenen we de testwaarde van t uit: n 10 ttest ( x ) 105 101 3,16 n-1 4 t test > t kritisch want 3,16 >,6, dus 105 valt buiten het BI. De cola bevat niet significant

Nadere informatie

Examen Statistiek I Januari 2010 Feedback

Examen Statistiek I Januari 2010 Feedback Examen Statistiek I Januari 2010 Feedback Correcte alternatieven worden door een sterretje aangeduid. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Twee derden van de mannen

Nadere informatie

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen 8.1. Stel dat medisch onderzoek heeft uitgewezen dat als het gemiddelde nicotinegehalte van een sigaret 25 mg of meer bedraagt, de kans op longkanker

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Sheets K&S voor INF HC 10: Hoofdstuk 12

Sheets K&S voor INF HC 10: Hoofdstuk 12 Sheets K&S voor INF HC 1: Hoofdstuk 12 Statistiek Deel 1: Schatten (hfdst. 1) Deel 2: Betrouwbaarheidsintervallen (11) Deel 3: Toetsen van hypothesen (12) Betrouwbaarheidsintervallen (H11) en toetsen (H12)

Nadere informatie

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling. Opgaven hoofdstuk 6 I Basistechnieken 6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling. x 0 2 4 6 p(x) ¼ ¼ ¼ ¼ a. Schrijf alle mogelijke verschillende steekproeven van n =

Nadere informatie

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter. STATISTIEK OPLOSSINGEN OEFENZITTINGEN 5 en 6 c D. Keppens 2004 5 1 (a) Zij µ de verwachtingswaarde van X. We moeten aantonen dat E[M i ] = µ voor i = 1, 2, 3 om te kunnen spreken van zuivere schatters.

Nadere informatie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van

Nadere informatie

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK 1 1. INLEIDING Parametrische statistiek: Normale Verdeling Niet-parametrische statistiek: Verdelingsvrij Keuze tussen de twee benaderingen I.

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden

Nadere informatie

Toetsen van hypothesen

Toetsen van hypothesen Les 4 Toetsen van hypothesen We hebben tot nu toe enigszins algemeen naar grootheden van populaties gekeken en bediscussieerd hoe we deze grootheden uit steekproeven kunnen schatten. Vaak hebben we echter

Nadere informatie

7.1 Toets voor het gemiddelde van een normale verdeling

7.1 Toets voor het gemiddelde van een normale verdeling Hoofdstuk 7 Toetsen van hypothesen Toetsen van hypothesen is, o.a. in de medische en chemische wereld, een veel gebruikte statistische techniek. Het wordt vaak gebruikt om een gevestigde norm eventueel

Nadere informatie

Les 7-8: Parameter- en Vergelijkingstoetsen

Les 7-8: Parameter- en Vergelijkingstoetsen Les 7-8: Parameter- en Vergelijkingstoetsen I Theorie : A. Algemeen :. Hypothese formuleren. H 0 : nul-hypothese H : alternatieve hypothese 2. teekproef nemen. x en 2 zijn te berekenen uit de steekproefresultaten.

Nadere informatie

Hoofdstuk 4 BETROUWBAARHEIDSINTERVALLEN

Hoofdstuk 4 BETROUWBAARHEIDSINTERVALLEN Hoofdstuk 4 BETROUWBAARHEIDSINTERVALLEN 1. Inleiding...2 2. Een basisconstructie...3 2.1. Vertrekpunt: een normale verdeling...3 2.2. Vertrekpunt: andere verdeling...4 3. Betrouwbaarheidsintervallen voor

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie

Nadere informatie

Samenvatting Wiskunde A

Samenvatting Wiskunde A Bereken: Bereken algebraisch: Bereken exact: De opgave mag berekend worden met de hand of met de GR. Geef bij GR gebruik de ingevoerde formules en gebruikte opties. Kies op een examen in dit geval voor

Nadere informatie

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Statistiek voor A.I. College 10. Donderdag 18 Oktober Statistiek voor A.I. College 10 Donderdag 18 Oktober 1 / 28 Huffington Post poll verkiezingen VS - 12 Oktober 2012 2 / 28 Gallup poll verkiezingen VS - 15 Oktober 2012 3 / 28 Jullie - onderzoek Kimberly,

Nadere informatie

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. Opgaven hoofdstuk 6 I Learning the Mechanics 6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. De random variabele x wordt tweemaal waargenomen. Ga na dat, indien de waarnemingen

Nadere informatie

Zin en onzin van normale benaderingen van binomiale verdelingen

Zin en onzin van normale benaderingen van binomiale verdelingen Zin en onzin van normale benaderingen van binomiale verdelingen Johan Walrave, docent EHSAL 0. Inleiding Voordat het grafisch rekentoestel in onze school ingevoerd werd, was er onder de statistiekdocenten

Nadere informatie

Toegepaste Statistiek, Week 6 1

Toegepaste Statistiek, Week 6 1 Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën

Nadere informatie

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages. MARGES EN SIGNIFICANTIE BIJ STEEKPROEFRESULTATEN. De marges van percentages Metingen via een steekproef leveren een schatting van de werkelijkheid. Het toevalskarakter van de steekproef heeft als consequentie,

Nadere informatie

Inhoudsopgave. Deel I Schatters en toetsen 1

Inhoudsopgave. Deel I Schatters en toetsen 1 Inhoudsopgave Deel I Schatters en toetsen 1 1 Hetschattenvanpopulatieparameters.................. 3 1.1 Inleiding:schatterversusschatting................. 3 1.2 Hetschattenvaneengemiddelde..................

Nadere informatie

. Dan geldt P(B) = a. 1 4. d. 3 8

. Dan geldt P(B) = a. 1 4. d. 3 8 Tentamen Statistische methoden 4052STAMEY juli 203, 9:00 2:00 Studienummers: Vult u alstublieft op het meerkeuzevragenformulier uw Delftse studienummer in (tbv automatische verwerking); en op het open

Nadere informatie

Lesbrief hypothesetoetsen

Lesbrief hypothesetoetsen Lesbrief hypothesetoetsen 00 "Je gaat het pas zien als je het door hebt" Johan Cruijff Willem van Ravenstein Inhoudsopgave Inhoudsopgave... Hoofdstuk - voorkennis... Hoofdstuk - mens erger je niet... 3

Nadere informatie

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Populatie: De gehele groep elementen waarover informatie wordt gewenst. Statistiek I Werkcollege 1 Populatie: De gehele groep elementen waarover informatie wordt gewenst. Steekproef: Gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te vergaren. Eenheden:

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

Toetsen van hypothesen

Toetsen van hypothesen Toetsen van hypothesen 1 Het probleem 25 maart 2003 De busmaatschappij De Lijn heeft gemiddeld per dag 20000 reizigers in de stad Antwerpen. Tegenwoordig zijn er heel wat reizigers die proberen met de

Nadere informatie

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

DEZE PAGINA NIET vóór 8.30u OMSLAAN! STTISTIEK 1 VERSIE MT15303 1308 1 WGENINGEN UNIVERSITEIT LEERSTOELGROEP MT Tentamen Statistiek 1 (MT-15303) 5 augustus 2013, 8.30-10.30 uur EZE PGIN NIET vóór 8.30u OMSLN! STRT MET INVULLEN VN NM, REGISTRTIENUMMER,

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015 EXAMEN : Basisbegrippen statistiek Examen 16 januari 2015 Oplossingen 1 Vraag 1 a) Leg in max. 3 lijnen uit wat een dichtheidsfunctie is en illustreer met 3 duidelijk verschillende voorbeelden. Een (kans)

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17 Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 17 Statistische toetsen 2 / 17 Toetsen - algemeen - 1 Setting: observatie X in X, model {P θ : θ Θ}. Gegeven partitie Θ = Θ 0 Θ 1, met Θ 0 Θ 1

Nadere informatie

Samenvatting Statistiek

Samenvatting Statistiek Samenvatting Statistiek De hoofdstukken 1 t/m 3 gaan over kansrekening: het uitrekenen van kansen in een volledig gespecifeerd model, waarin de parameters bekend zijn en de kans op een gebeurtenis gevraagd

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 15 Dinsdag 2 November 1 / 16 2 Statistiek Indeling: Filosofie Schatten Centraal Bureau voor Statistiek 2 / 16 Schatten Vb. Het aantal tenen plus vingers in jullie huishoudens:

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 10 Donderdag 20 Oktober 1 / 1 2 Statistiek Vandaag: Hypothese toetsen 2 / 1 3 / 1 Terzijde NU.nl 19 oktober 2011: Veel Facebookvrienden wijst op grotere hersenen. (http://www.nu.nl/wetenschap/2645008/veel-facebookvrienden-wijst-groterehersenen-.html)

Nadere informatie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur Kansrekening en statistiek WI22TI / WI25IN deel 2 2 februari 22, 4. 6. uur VOOR WI22TI: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad is niet toegestaan.

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 13 Dinsdag 26 Oktober 1 / 24 2 Statistiek Indeling: Hypothese toetsen Filosofie 2 / 24 Hypothese toetsen 3 / 24 Hypothese toetsen: toepassingen Vb. Een medicijn wordt

Nadere informatie

Beschrijvend statistiek

Beschrijvend statistiek 1 Beschrijvend statistiek 1. In een school werd het intelligentiequotiënt gemeten van de leerlingen van het zesde jaar (zie tabel). De getallen werden afgerond tot op de eenheid. De berekeningen mogen

Nadere informatie

Les 1: Waarschijnlijkheidrekening

Les 1: Waarschijnlijkheidrekening Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het

Nadere informatie

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Statistiek voor A.I. College 12. Dinsdag 23 Oktober Statistiek voor A.I. College 12 Dinsdag 23 Oktober 1 / 20 2 Deductieve statistiek Orthodoxe statistiek 2 / 20 3 / 20 Jullie - onderzoek Wivine Tijd waarop je opstaat (uu:mm wordt weergeven als uumm). Histogram

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

SOCIALE STATISTIEK (deel 2)

SOCIALE STATISTIEK (deel 2) SOCIALE STATISTIEK (deel 2) D. Vanpaemel KU Leuven D. Vanpaemel (KU Leuven) SOCIALE STATISTIEK (deel 2) 1 / 57 Hoofdstuk 5: Schatters en hun verdeling 5.1 Steekproefgemiddelde als toevalsvariabele D. Vanpaemel

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

Formules Excel Bedrijfsstatistiek

Formules Excel Bedrijfsstatistiek Formules Excel Bedrijfsstatistiek Hoofdstuk 2 Data en hun voorstelling AANTAL.ALS vb: AANTAL.ALS(A1 :B6,H1) Telt hoeveel keer (frequentie) de waarde die in H1 zit in A1:B6 voorkomt. Vooral bedoeld voor

Nadere informatie

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4. VERGELIJKINGSTOETSEN A. Vergelijken van varianties Men beschouwt twee steekproeven uit normaal verdeelde populaties: X, X,, X n ~ N(µ, σ ) Y, Y,, Y n

Nadere informatie

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet? Verklarende Statistiek: Toetsen Zat ik nou in dat kritische gebied of niet? Toetsen, Overzicht Nulhypothese - Alternatieve hypothese (voorbeeld: toets voor p = p o in binomiale steekproef) Betrouwbaarheid

Nadere informatie

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Kruis per vraag slechts één vakje aan op het antwoordformulier. Toets Stroom 1.2 Methoden en Statistiek tul, MLW 7 april 2006 Deze toets bestaat uit 25 vierkeuzevragen. Kruis per vraag slechts één vakje aan op het antwoordformulier. Vraag goed beantwoord dan punt voor

Nadere informatie

Oplossingen hoofdstuk 7

Oplossingen hoofdstuk 7 Oplossingen hoofdstuk 7 1. X is normaal verdeeld met µ=5 en =2. Tussen welke grenzen liggen P Z z 0, 3 z 0, 52 P Z z 0, 7 z 0,52. a) 30, 70 De ondergrens is x30 5z30 2 50,52 2 3,96 De bovengrens isx 70

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen M, M & C 7.3 Optional Topics in Comparing Distributions: F-toets 6.4 Power & Inference as a Decision 7.1 The power of the t-test 7.3 The power of the sample t- Toetsende Statistiek Week 5. De F-toets &

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van uur.

Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van 4.00 7.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Les 1: Waarschijnlijkheidrekening

Les 1: Waarschijnlijkheidrekening Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur Tentamen Kansrekening en Statistiek MST 14 januari 2016, 14.00 17.00 uur Het tentamen bestaat uit 15 meerkeuzevragen 2 open vragen. Een formuleblad wordt uitgedeeld. Normering: 0.4 punt per MC antwoord

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Werkbladen 3 Terugzoeken

Werkbladen 3 Terugzoeken Werkbladen Terugzoeken We keren nu de vraag om. Bij een gegeven percentage (oppervlakte zoeken we de bijbehorende grenswaarde(n. Als voorbeeld zoeken we hoe groot een Nederlandse vrouw anno 97 moest zijn

Nadere informatie

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Statistiek voor A.I. College 14. Dinsdag 30 Oktober Statistiek voor A.I. College 14 Dinsdag 30 Oktober 1 / 16 2 Deductieve statistiek Orthodoxe statistiek 2 / 16 Grootte steekproef Voorbeeld NU.nl 26 Oktober 2012: Helft broodjes döner kebab vol bacteriën.

Nadere informatie

Beslissen op grond van een steekproef Hoofdstuk 15

Beslissen op grond van een steekproef Hoofdstuk 15 1 Beslissen op grond van een steekproef Hoofdstuk 15 1. a. Het gaat veel geld kosten voor de fabrikant als er te veel schuurmiddel gebruikt wordt. b. Bij een te laag gemiddelde zullen de klanten niet tevreden

Nadere informatie

Statistiek = leuk + zinvol

Statistiek = leuk + zinvol Statistiek = leuk + zinvol Doel 1: Doel : Doel 3: zie titel een statistisch onderzoek kunnen beoordelen een statistisch onderzoek kunnen opzetten een probleem vertalen in standaardmethoden gegevens verzamelen,

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 13 Dinsdag 1 November 1 / 26 2 Statistiek Vandaag: Power Grootte steekproef Filosofie 2 / 26 Power 3 / 26 Power Def. De power (kracht) van een hypothese toets is (1 β),

Nadere informatie

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995 Schriftelijk examen statistiek, data-analyse en informatica Maandag 29 mei 1995 Tweede jaar kandidaat arts + Tweede jaar kandidaat in de biomedische wetenschappen Naam: Voornaam: Vraa Kengetal g Blad 1

Nadere informatie

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Naam:... Voornaam:... DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Slechts één van de vier alternatieven is juist. Kruis het bolletje aan vóór het juiste antwoord. Indien je een meerkeuzevraag verkeerd

Nadere informatie

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing M, M & C, Chapter 6, Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Use and Abuse

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

Hoofdstuk 6 Hypothesen toetsen

Hoofdstuk 6 Hypothesen toetsen Hoofdstuk 6 Hypothesen toetsen ladzijde 144 1a X is aantal autokopers die merk A aanschaffen. X is Bin(100; 0,30) verdeeld. 0,30 3 100 = 30, naar verwachting zullen dus 30 autokopers merk A aanschaffen.

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur Kansrekening en statistiek wi2105in deel 2 27 januari 2010, 14.00 16.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

15.1 Beslissen op grond van een steekproef

15.1 Beslissen op grond van een steekproef 05 15 Exponenten Het toetsen van en logaritmen hypothesen 15.1 Beslissen op grond van een steekproef bladzijde 8 1 a Er wordt dan te veel schuurmiddel geleverd en dit kost geld. b Dan zit er te weinig

Nadere informatie

TOETSEN VAN HYPOTHESEN

TOETSEN VAN HYPOTHESEN TOETSEN VAN HYPOTHESEN 9 9.1 EEN TOETS VOOR DE POPULATIEPROPORTIE Probleem 1 Anna beweert bij hoog en bij laag dat door een dobbelsteen te schudden voor gebruik, je het resultaat in je voordeel kunt beïnvloeden.

Nadere informatie

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN. Continue Verdelingen 1 A. De uniforme (of rechthoekige) verdeling Kansdichtheid en cumulatieve frequentiefunctie Voor x < a f(x) = 0 F(x) = 0 Voor a x

Nadere informatie

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31 Tentamen Statistische methoden 45STAMEY april, 9: : Studienummers: Vult u alstublieft op het MC formulier uw Delftse studienummer in; en op het open vragen formulier graag beide, naar volgend voorbeeld:

Nadere informatie

Feedback examen Statistiek II Juni 2011

Feedback examen Statistiek II Juni 2011 Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven

Nadere informatie

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Examen Kansrekening en Wiskundige Statistiek: oplossingen Examen Kansrekening en Wiskundige Statistiek: oplossingen S. Vansteelandt Academiejaar 006-007 1. Een team van onderzoekers wil nagaan of een bepaald geneesmiddel Triptan meer effectief is dan aspirine

Nadere informatie

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse 10.1 Eenwegs-variantieanalyse: Als we gegevens hebben verzameld van verschillende groepen en we willen nagaan of de populatiegemiddelden van elkaar verscihllen,

Nadere informatie

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Afdeling Wiskunde Volledig tentamen Algemene Statistiek Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen:

Nadere informatie

Parametervrije toetsen

Parametervrije toetsen 1 Inleiding Parametervrije toetsen Edward Omey Februari 2007 In de klassieke toetsingstheorie worden meestal speci eke veronderstellingen gemaakt over de populatie(s) waaruit steekproeven afkomstig zijn.

Nadere informatie

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607 1. Om na te gaan of de gemiddelde bijdrage dezelfde is voor ziekenkas A en voor ziekenkas B heeft men op een toevallige wijze 30 personen geselecteerd waarvan 15 aangesloten zijn bij ziekenkas A en 15

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38 2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek 2 deel A 30 minuten over statistisch toetsen Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014 Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie +

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

Les 1: Waarschijnlijkheidrekening

Les 1: Waarschijnlijkheidrekening Medische statistiek 1 Les 1: Waarschijnlijkheidrekening I Theorie A Inleidende defenities V: de verzameling van alle mogelijke uitkomsten A,B,... : een gebeurtenis is een verzameling uitkomsten in V Q

Nadere informatie