Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1
Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch weergeven van data
Wat is Normaal? 3
Leerdoelen: wat is een normale verdeling voorbeelden van variabelen die normaal verdeeld zijn en van variabelen die niet normaal verdeeld zijn hoe een normale verdeling omgezet wordt in een standaard normale verdeling een score X omzetten in een standaardscore zx, en mbv de tabel de rechteroverschrijdingskans bepalen 4
De figuur is symmetrisch. Het gemiddelde µ (mu), de mediaan en de modus vallen samen. Mediaan: middelste waarnemingsgetal of gemiddelde van de middelste twee in een rangschikking naar grootte. Modus: Waarneming met de grootste frequentie (Modaal: het bijvoeglijk naamwoord van modus.) 5
Calton board
7
8
Gemiddelde µ (mu) Standaardafwijking v.h. gemiddelde σ (sigma) 9
Normale verdeling Standaardnormale verdeling Gemiddelde µ 0 Standaard afwijking (v.h. gemiddelde) σ 1 Elke normale verdeling wordt omgezet in een standaardnormale verdeling door : 1) (daardoor wordt gemiddelde 0) 2) (daardoor wordt standaardafwijking 1) De kansen die horen bij een bepaalde score veranderen hierdoor niet (alle waardes ondergaan dezelfde omzetting) Daarom kan met 1 tabel, de tabel voor de standaardnormale verdeling, voor elke waarde van een normaal verdeelde variable de kans > of < dan bepalen! 10
Rechteroverschrijdingskansen in de standaardnormale verdeling 11
12
Variatie ontstaat door toeval, maar is desondanks wetmatig te meten te voorspellen 13
Leerdoelen bereikt? Wat is een normale verdeling? voorbeelden van normaal- nietnormaal verdeelde variabelen? Hoe een normale verdeling omzetten in een standaard normale verdeling? Een score X omzetten in een standaardscore zx, en mbv de tabel de rechteroverschrijdingskans bepalen? 14
Hoe veel vertrouwen heb ik in de conclusie? Les 2 15
Wat is Normaal? 16
Vorige les: Normale verdeling met en Standaard normale verdeling en Omzetten waardes in standaardnormale waardes Kansen op > of < opzoeken tabel 17
Calton board
Vorige les: Normale verdeling met en Standaard normale verdeling en Omzetten waardes in standaardnormale waardes Kansen op > of < opzoeken tabel Maar. Hoe weet je nu of een serie waarneming normaal verdeeld is? 19
20
Leerdoel: met standaardnormaalpapier bepalen of een data set normaal verdeeld is Data set aanleggen (metingen doen) Metingen omzetten in een histogram en frequentie verdeling De gevonden frequentieverdeling uitzetten op standaardnormaalpapier En (als er een rechte lijn gevonden wordt) het gemiddelde en de SD uit de grafiek afleiden 21
Opdracht: Verzamel dertig metingen (bijv. peultjes, pinda s, mandarijen) Bepaal frequentie verdeling en cumulatieve frequentie Plot op standaardnormaal papier, bij rechte lijn bepaal en Bereken en voor n=5, n=10 en n=30 ( n is het aantal waarnemingen) 22
Leerdoelen bereikt? Histogram? Frequentieverdeling? Geplot op standaardnormaalpapier? Conclusie? en bepaald met grafische methode? en berekend voor n=5, 10 en 30? Conclusie? 23
Hoe veel vertrouwen heb ik in de conclusie? Les 3 alfa- en beta-fout 24
Les 1: Normale verdeling met en Standaard normale verdeling en Omzetten waardes in standaardnormale waardes Kansen op > of < opzoeken tabel 25
Les 2: Histogram Frequentieverdeling Geplot op standaardnormaalpapier Conclusie? en bepaald met grafische methode en berekend voor n=5, 10 en 30? Conclusie? 26
Wat is Waar? 27
Leerdoelen Kennen van de definities van alfa- en beta-fout Kunnen geven van voorbeelden van alfa- en beta-fout Grafisch kunnen weergeven van alfa- en beta fout De termen betrouwbaarheid en onderscheidend vermogen in eigen woorden kunnen uitleggen 28
Iemand is onschuldig totdat zijn schuld bewezen is Nul-hypothese: de verdachte is onschuldig Alternatieve-hypothese: de verdachte is schuldig 29
Werkelijkheid Beslissing vd rechtbank: Schuldig Nul hypothese verworpen Onschuldig Nul hypothese aanvaard Schuldig Alternatieve Hypothese waar Juiste conclusie Foute conclusie (bij gebrek aan bewijs; Power vd bewijslast onvoldoende) Onschuldig Nul hypothese waar Foute conclusie (gerechtelijke dwaling Betrouwbaarheid van de conclusie is te laag) Juiste conclusie 30
Fout van de eerste orde: concluderen dat er iets is wat er in werkelijkheid niet is / alfa-fout betrouwbaarheid geeft aan hoe groot/klein deze kans is Fout van de tweede orde: concluderen dat er iets niet is dat er in werkelijkheid wel is / beta-fout Onderscheidend vermogen geeft aan hoe groot/klein deze kans is 31
Werkelijkheid Beslissing Nul hypothese verworpen Middel werkt / wel verschil Alternatieve Hypothese waar Juiste conclusie Middel werkt niet / geen verschil Nul hypothese waar Foute conclusie Gevonden verschil berust zeer waarschijnlijk op toeval Nul hypothese aanvaard Foute conclusie Verschil niet statistisch significant door te kleine steekproef Juiste conclusie 32
33
Leerdoelen bereikt? de definities van alfa- en beta-fout? voorbeelden van? Grafisch weergeven van alfa- en beta fout? De termen betrouwbaarheid en onderscheidend vermogen in eigen woorden uitleggen? 34
Hoe veel vertrouwen heb ik in de conclusie? Les 4 Steekproeven, Toetsen en Grafische Weergave 35
Wat is Waar? 36
Leerdoelen: Wat is een steekproef Verband tussen steekproef grootte en nauwkeurigheid van een schatting Kunnen uitleggen wat het doel van statistische analyse van onderzoeksgegevens is Onderscheid maken tussen numerieke en categorische data En daarvoor geschikte grafische weergaves kiezen 37
Meer informatie.. beter beeld! 38
39
Meer onderscheidend vermogen bij - Kleine (standaardafwijking), bij grotere steekproefgootte - Bij groter verschil 40
Werkelijkheid Wel ziek 90 Niet ziek 10 Test uitslag Uitslag test: ziek Uitslag test: niet ziek 90 (0.999 * 90) 0 Gemist (0.001 *90) Vals alarm 0 (0.0001 * 10) 10 (0.9999 * 10) Test geschikt! 41
Werkelijkheid Test uitslag Uitslag test: ziek Wel ziek 1 ziek 1 (0.999 * 1) Niet ziek 9999 Vals alarm 10 (0.001 * 9999) Uitslag test: niet ziek Gemist 0 (0.001 *1) 9989 (0.999 * 9999) Zelfde test niet geschikt 42
Waarom data statistisch analyseren? conclusie Nulhypothese waar Alternatieve hypothese waar Werkelijkheid Nulhypothese waar Alternatieve hypothese waar Conclusie is juist Conclusie is fout (beta fout) Conclusie is fout (alfa fout) Conclusie is juist Om inzicht te krijgen hoe groot de kans op alfa- resp beta-fout is - Hoe geschik is onze onderzoeksmethode - Hoe betrouwbaar is onze conclusie 43
Numeriek : kan uitgedrukt worden in een getal, het gemiddelde kan bepaald worden Categorisch : een kenmerk (man/vrouw, politieke voorkeur) niet in een gemiddelde uit te drukken. Wel kan je aangeven welk % van een populatie in een bepaalde categorie valt Numeriek continue : kan (binnen een max en een min) alle waarden aan nemen. De kans op een bepaalde waarde is 0, maar alle kansen bij elkaar is 100% (vergelijk met een punt en afstand; een punt heeft geen lengte, maar alle punten bij elkaar maken een lijn van een bepaalde afstand) Discrete continue : kan bepaalde waarden aannemen maar niet de waarden daar tussen in. Voorbeeld de waarden 1, 2, 3, 4, 5 en 6 bij het gooien met een dobbelsteen. Het gemiddelde van een oneindig aantal worpen is 3,5, maar je kan met één dobbelsteen nooit 3,5 gooien. 44
Histogrammen en boxplots zijn geschikt voor grafische weergave van numerieke gegevens. 45
Cirkel- en staafdiagrammen zijn geschikt voor grafische weergave van categorische informatie. 46
Als iedere waarneming twee gegevens bevat dan is een spreidingsdiagram (scatterplot) een geschikte manier om de data grafisch weer te geven. 47
Leerdoelen bereikt? Steekproef? Verband steekproef grootte en nauwkeurigheid schatting? Doel van statistische analyse van onderzoeksgegevens? Verschil numerieke en categorische data? Geschikte grafische weergave? 48