Statistiek voor A.I.

Vergelijkbare documenten
Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 10. Dinsdag 16 Oktober

Kansrekening en Statistiek

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Kansrekening en Statistiek

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen

Kansrekening en Statistiek

Hoofdstuk 3 Statistiek: het toetsen

Statistiek voor A.I. College 9. Donderdag 11 Oktober

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Kansrekening en Statistiek

Statistiek voor A.I. College 2. Donderdag 13 September 2012

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Toetsen van hypothesen

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Statistiek voor A.I. College 6. Donderdag 27 September

Kansrekening en Statistiek

Hoofdstuk 12: Eenweg ANOVA

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Les 2: Toetsen van één gemiddelde

Voorbeeldtentamen Statistiek voor Psychologie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Oefenvragen bij Statistics for Business and Economics van Newbold

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Tentamen Voortgezette Kansrekening (WB006C)

Data analyse Inleiding statistiek

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Inhoudsopgave. Deel I Schatters en toetsen 1

Hoofdstuk 10: Regressie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

werkcollege 6 - D&P9: Estimation Using a Single Sample

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015

Deze week: Schatten. Statistiek voor Informatica Hoofdstuk 6: Schatten. Voorbeeld Medicijnentest. Statistische inferentie

Toetsen van Hypothesen. Het vaststellen van de hypothese

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Sheets K&S voor INF HC 10: Hoofdstuk 12

. Dan geldt P(B) = a d. 3 8

SOCIALE STATISTIEK (deel 2)

Data analyse Inleiding statistiek

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Les 1: Waarschijnlijkheidrekening

Samenvatting Statistiek

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

College 2 Enkelvoudige Lineaire Regressie

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Meetkunde en Lineaire Algebra

Inleiding Applicatie Software - Statgraphics

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Examen Statistiek I Feedback

Meetkunde en Lineaire Algebra

10. De simultane kansverdeling van twee stochasten X en Y is gegeven door de volgende (onvolledige) tabel: X / /4 1. d. 0 e.

variantie: achtergronden en berekening

15.1 Beslissen op grond van een steekproef [1]

3de bach HI. Econometrie. Volledige samenvatting. uickprinter Koningstraat Antwerpen A 11,00

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek (2S390) op maandag ,

Hoofdstuk 5: Steekproevendistributies

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

1. Statistiek gebruiken 1

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Transcriptie:

Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28

2 Deductieve statistiek Orthodoxe statistiek 2 / 28

3 / 28

Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het andere geslacht. Rechts: Aantal relaties tot nu toe. Histogram of JI Histogram of JII Frequency 0 2 4 6 8 10 12 Frequency 0 2 4 6 8 0.0 0.5 1.0 1.5 2.0 JI 0 1 2 3 4 JII Geen noemenswaardige correlatie tussen deze twee variabelen. 4 / 28

Jullie - onderzoek Tobias, Lody, Swen en Sander Horizontaal: Leeftijd. Verticaal: Aantal relaties tot nu toe. JII 0 1 2 3 4 18 20 22 24 26 JIII Correlatiecoëfficiënt: 0.61. 5 / 28

Jullie - onderzoek Tobias, Lody, Swen en Sander Horizontaal: Aantal keer verhuisd. Verticaal: Aantal relaties tot nu toe. JII 0 1 2 3 4 0 1 2 3 4 5 6 7 JIV Correlatiecoëfficiënt: 0.62. 6 / 28

2 Deductieve statistiek Vandaag : Hypothese toetsen Schatten 7 / 28

Hypothese toetsen 8 / 28

Hypothese toetsen: twee steekproeven Voorbeeld Een medicijn wordt aan een groep patiënten toegediend en aan een controlegroep niet. Er moet besloten worden of het medicijn werkt of niet. Men wil vaststellen of een zekere ziekte meer voorkomt onder Aziaten dan Afrikanen. Men wil vaststellen of het percentage defecte stofzuigers bij de ene fabriek groter is dan bij de andere. 9 / 28

Hypothese toetsen: twee steekproeven Definitie Een test naar de gelijkheid van de gemiddelden van twee populaties P 0 en P 1 heeft de volgende vorm. µ 1 en µ 2 zijn de gemiddelden van de populaties en σ 2 1 en σ 2 2 de varianties. X 1, X 2 zijn de gemiddelden van de twee steekproeven en s 2 1 en s 2 2 de varianties. De aanname dat σ 2 1 = σ 2 2 (die wel of niet gehanteerd kan worden) is de homogeniteit van variantie. De methode is hetzelfde als die voor het toetsen met 1 gemiddelde, alleen de verdelingen en hypothesen zelf hebben een andere vorm. 10 / 28

Hypothese toetsen: twee steekproeven Definitie De hypotheses zijn van de vorm tweezijdig H 0 : µ 1 µ 2 = 0 H a : µ 1 µ 2 linkszijdig H 0 : µ 1 µ 2 0 H a : µ 1 < µ 2 De statistiek is X 1 X 2. rechtszijdig H 0 : µ 1 µ 2 0 H a : µ 1 > µ 2 11 / 28

Hypothese toetsen: twee steekproeven Definitie Bij hypothese toetsen over het gemiddelden van twee populaties waarvan de varianties σ 2 bekend en gelijk zijn, wordt de verdeling van X 1 X 2 benaderd door een normale verdeling met gemiddelde en standaardafwijking σ X 1 X 2 = µ 1 µ 2 r σ 2` 1 n 1 + 1 n 2. σ X 1 X 2 is de standaardfout van het verschil. Wanneer de varianties gelijk maar onbekend zijn, wordt de verdeling van X 1 X 2 benaderd door een t-verdeling bij n 1 + n 2 2 vrijheidsgraden en gemiddelde µ 1 µ 2, en standaardafwijking r s X 1 X 2 = s 2` 1 + 1, n 1 n 2 waarbij s 2 de gezamenlijke schatting van de populatievariantie is: P n1 i=1 (X i1 X 1) 2 + P n 2 j=1 (X j2 X 2) 2. n 1 + n 2 2 12 / 28

Hypothese toetsen Voorbeeld 44 mannelijke en 44 vrouwelijke apen werd een pop en een speelgoedauto aangeboden. X 1 en X 2 zijn het percentage van de tijd dat de mannelijke en vrouwelijke apen met de pop speelden. De gevonden waardes zijn X 1 = 9 en X 2 = 11. De twee populaties zijn alle mannelijke en alle vrouwelijke apen op aarde. µ 1 en µ 2 zijn het percentage van de tijd dat alle mannelijke en vrouwelijke apen met de pop zouden spelen. Stel dat de variantie in speeltijd voor beide populaties bekend en gelijk aan 16% is. Er wordt linkszijdig getoetst: H 0 : µ 1 µ 2 0 H a : µ 1 < µ 2. Er geldt r 1 σ X 1 X 2 = 16` 44 + 1 r 16 2 = = 0.85. 44 44 Bij significatieniveau α = 0.1 is de standaard kritische waarde z kw = 1.282, want P s(z 1.282) = 0.1. De kritische waarde is dus (µ 1 µ 2) 1.282σ X 1 X 2 = 1.282 0.85 = 1.1. Het kritische gebied is (, 1.1] en de p-waarde van de statistiek is P(X 1 X 2 2 H 0) = P s(z 2.35) = 0.0094 < α. H 0 wordt verworpen: mannelijke apen spelen minder met poppen dan vrouwelijke apen. 13 / 28

Hypothese toetsen: vrouwelijk of mannelijk Voorbeeld Voelen mannelijke studenten KI aan de UU zich significant mannelijker dan vrouwelijke studenten zich vrouwelijk voelen (0=niet,5=zeer)? Als significantieniveau wordt 0.005 genomen. Aangenomen wordt dat de varianties van de populaties gelijk maar onbekend zijn. De hypotheses vormen een rechtszijdige toets: H 0 : µ 1 µ 2 0 en H a : µ 1 > µ 2. Er worden door Kimberly, Josca en Niels steekproeven X 1 uit de mannelijke en X 2 uit de vrouwelijke studenten genomen, beide ter grootte 9. X 1 = 3.11 en X 2 = 2.22. De statistiek is daarmee 3.11 2.22 = 0.98. Er wordt getoetst met een t-verdeling met 16 vrijheidsgraden: t kw = 2.921. De gezamenlijke schatting van de populatievariantie is: P n1 s 2 i=1 = (X i1 X 1) 2 + P n 2 j=1 (X j2 X 2) 2 = 0.65. n 1 + n 2 2 Dat geeft s X 1 X 2 = r s 2` 1 n 1 + 1 n 2 = 0.38. De kritische waarde is x kw = 2.921 0.38 = 1.11 en H 0 wordt niet verworpen. 14 / 28

Schatten 15 / 28

Schatten 16 / 28

Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden gemiddelde was 0.4%. Er werd hen ook gevraagd hoeveel % van de tijd zij liegen om iemands gevoelens te sparen. Het gevonden gemiddelde was 1%. Zijn deze data consistent? 17 / 28

Schatten Statistisch schatten wordt toegepast wanneer men de waarde van een parameter wil benaderen. Op grond van de statistiek van een steekproef wordt de corresponderende waarde van de populatie geschat/benaderd. Sommige schatters produceren meerdere waarden (vaak een interval) en sommige schatters produceren één waarde. Vraag: Hoe accuraat is de schatter? 18 / 28

Schatten: betrouwbaarheidsinterval Definitie Wanneer de standaardafwijking van de populatie σ bekend is dan is het betrouwbaarheidsinterval met betrouwbaarheidsniveau (1 α) op grond van een statistiek X van een steekproef ter grootte n: CI = (X z kw σ X, X + z kw σ X ), waarbij z kw de standaard kritische waarde bij significantieniveau α voor een tweezijdige toets op grond van de normale verdeling is. Wanneer de standaardafwijking van de populatie onbekend is dan is het betrouwbaarheidsinterval CI = (X t kw s X, X + t kw s X ). waarbij t kw de standaard kritische waarde bij significantieniveau α voor een tweezijdig toets op grond van de t-verdeling bij (n 1) vrijheidsgraden is. CI wordt ook wel het (1 α)100%-betrouwbaarheidsinterval genoemd. 19 / 28

Schatten Voorbeeld Bjorn, Alex en Rianne vonden in een steekproef ter grootte 25 een gemiddelde van 4.680 uren gamen per week gedurende collegeweken, waarbij s = 5.528. Histogram of EIII Frequency 0 2 4 6 8 10 12 0 5 10 15 20 EIII Het 95%-betrouwbaarheidsinterval is (4.680 2.064 5.528 5, 4.680 + 2.064 5.528 ) = (2.398, 6.962). 5 20 / 28

Schatten: betrouwbaarheidsinterval Stelling Voor alle steekproeven van een vaste grootte uit een populatie met gemiddelde µ waarvan het steekproefgemiddelde normaal verdeeld is, geldt dat 100(1 x)% van de 100(1 x)%-betrouwbaarheidsintervallen µ bevat en 100x% van de intervallen bevat µ niet. Bewijs µ ligt in het 100(1 x)%-betrouwbaarheidsinterval rond X als geldt dat µ z kw σ X < X < µ + z kw σ X. (1) Voor z kw geldt dat P s(z z kw ) = x. Omdat X normaal verdeeld is met 2 gemiddelde µ en standaardafwijking σ X volgt daaruit dat de kans op (1) gelijk aan (1 x) is. Merk op: Voordat de steekproef heeft plaatsgehad is de kans dat het 100(1 x)%-betrouwbaarheidsinterval µ bevat (1 x). Nadat de steekproef heeft plaatsgehad, is die kans 0 of 1: het betrouwbaarheidsinterval bevat µ niet of wel. 21 / 28

Antwoord op een vraag: liegen Voorbeeld Aan 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden gemiddelde was 0.4%. Aan een andere groep van 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen om iemands gevoelens te sparen. Het gevonden gemiddelde was 1%. Zijn die data 95% betrouwbaar, d.w.z. kunnen beide 95%-betrouwbaarheidsintervallen de ware gemiddeldes bevatten? Een 95% betrouwbaarheidsinterval op grond van de eerste steekproef, waarbij gegeven is dat s X = 0.0015, is CI 1 = (X t kw s X, X + t kw s X ) = (0.001, 0.007). Een 95% betrouwbaarheidsinterval op grond van de tweede steekproef, waarbij gegeven is dat s X = 0.0013, is CI 2 = (X t kw s X, X + t kw s X ) = (0.0074, 0.0126). Stel, Amerikanen liegen in werkelijkheid µ 1% van de tijd en liegen µ 2% van de tijd om iemands gevoelens te sparen. Dan moet gelden µ 1 µ 2. Omdat CI 2 rechts van CI 1 ligt kan het niet zo zijn dat beide intervallen de werkelijke gemiddeldes bevatten (CI i bevat µ i ). Het onderzoek is niet 95% betrouwbaar. 22 / 28

Schatten: zuivere schatters Definitie Als een parameter θ van een populatie benaderd/geschat wordt door een statistiek t, dan is t een zuivere schatter als E(t) = θ. Hierbij is E(t) de verwachtingswaarde van t op grond van alle steekproeven van een vaste grootte uit de populatie. 23 / 28

Schatten: zuivere schatters Stelling Zij X een stochast met verwachtingswaarde/gemiddelde µ en variantie σ 2. Dan geldt wanneer het bijbehorende experiment n maal herhaald wordt dat een zuivere schatter van µ en P n i=1 X n = X i n een zuivere schatter van σ 2 is. s 2 X = P n i=1 (X i X ) 2 n 1 Bewijs Gebruik dat voor alle onafhankelijke stochasten X en Y en elke constante c geldt: E(cX + Y ) = ce(x ) + E(Y ) en Var(cX + Y ) = c 2 Var(X ) + Var(Y ). Voor de variantie: E(s 2 X ) = E(P n i=1 nx (X i µ) 2 = i=1 nx (X i X ) 2 + n(x µ) 2. i=1 (X i X ) 2 ) = E( P n n 1 i=1 (X i µ) 2 ) E( n 1 n(x µ)2 ) = nσ2 σ2 = n 1 n 1 n 1 σ2. 24 / 28

Schatten: maximum likelihood schatters Definitie Zij Ω de verzameling van mogelijke waarden van een populatie parameter θ. Gegeven een steekproef met bijbehorende statistiek t is de likelihood van t gegeven θ Ω: P(t θ). De maximum likelihood schatter m.l.e. is de schatter die op grond van de steekproef die θ in Ω kiest waarvoor t de grootste likelihood heeft. De schatter wordt aangeduid met m(t): m(t) = argmax τ Ω P(t τ) Dus m(t) = θ impliceert P(t θ) = max τ Ω P(t τ). Merk op: Een m.l.e. hoeft niet uniek te zijn. 25 / 28

Schatten: maximum likelihood schatters Stelling Zij X de stochast behorende bij een Bernoulli experiment met kans op succes p. Dan geldt wanneer het bijbehorende experiment n maal herhaald wordt, dat het steekproefgemiddelde X ( ) de m.l.e. van p is: aantal maal succes totaal m(x 1... X n) = X. Stelling Zij X een normaal verdeelde stochast met gemiddelde µ en variantie σ 2. Dan geldt wanneer het bijbehorende experiment n maal herhaald wordt dat het steekproefgemiddelde X de m.l.e. van µ en P n i=1 (X i X ) 2 de m.l.e. van σ 2 is: P n i=1 m(x 1... X n) = X m(x 1... X n) = (X i X ) 2. n n 26 / 28

Schatten: keuzes Een zuivere schatter is niet noodzakelijk gelijk aan een m.l.e.: de zuivere schatter en de m.l.e. van de variantie van de populatie zijn respectievelijk P n i=1 (X i X ) 2 n 1 P n i=1 (X i X ) 2. n De eis van zuiverheid en de eis van maximum likelihood van een schatter ondersteunen de keuze om het gemiddelde van een populatie te benaderen met het steekproefgemiddelde op verschillende wijze. 27 / 28

Finis 28 / 28