Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Vergelijkbare documenten
Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Kansrekening en Statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Deze week: Verdelingsfuncties. Statistiek voor Informatica Hoofdstuk 5: Verdelingsfuncties. Bernoulli verdeling. Bernoulli verdeling.

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Tentamen Voortgezette Kansrekening (WB006C)

Kansrekening en stochastische processen 2DE18

Statistiek voor A.I. College 6. Donderdag 27 September

Medische Statistiek Kansrekening

Hoofdstuk 5. Toevalsveranderlijken en waarschijnlijkheidsdistributies. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Tentamen Kansrekening en Statistiek (2WS04), woensdag 30 juni 2010, van uur.

Voorbeeld 1. Statistiek voor Informatica Hoofdstuk 3: Stochastische Variabelen en Verdelingen. Voorbeeld 2A. Voorbeeld 1 (vervolg)

Deze week: Schatten. Statistiek voor Informatica Hoofdstuk 6: Schatten. Voorbeeld Medicijnentest. Statistische inferentie

Set 3 Inleveropgaven Kansrekening (2WS20) Opgaven met sterretjes zijn lastiger dan opgaven zonder sterretje.

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

Tentamen Inleiding Kansrekening 16 juni 2017, 14:00 17:00 Docent: Prof. dr. F. den Hollander

Tentamen Inleiding Kansrekening 9 juni 2016, 10:00 13:00 Docent: Prof. dr. F. den Hollander

Uitwerking Tentamen Inleiding Kansrekening 11 juni 2015, uur Docent: Prof. dr. F. den Hollander

Kansrekening en stochastische processen 2DE18

Kansrekening en stochastische processen 2S610

Gezamenlijke kansverdeling van twee stochasten

Tentamen Kansrekening (NB004B)

Kansrekening en Statistiek

Tentamen Inleiding Kansrekening wi juni 2010, uur

Set 2 Inleveropgaven Kansrekening (2WS20)

Tentamen Inleiding Kansrekening 25 juni 2009, uur Docent: F. den Hollander

OefenDeeltentamen 2 Kansrekening 2011/ Beschouw een continue stochast X met kansdichtheidsfunctie cx 4, 0 x 1 f X (x) = f(x) = 0, anders.

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31

Tentamen Statistische methoden MST-STM 1 juli 2010, 9:00 12:00

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Tentamen Inleiding Kansrekening 12 augustus 2010, uur Docent: F. den Hollander

Hoofdstuk 4: Aanvullende Begrippen (Extra Oefeningen)

b) Uit Bayes volgt, gebruik makend van onderdeel a) P (T V )P (V ) P (T ) = (0.09)(0.07)

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Zo geldt voor o.o. continue s.v.-en en X en Y dat de kansdichtheid van X + Y gegeven wordt door

Radboud Universiteit Nijmegen Heyendaalse weg 135

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions

Kansrekening en Statistiek

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

Examen Statistiek I Feedback

Kansrekening en Statistiek

Statistiek voor A.I. College 10. Dinsdag 16 Oktober

. Dan geldt P(B) = a d. 3 8

Opgaves Hoofdstuk 3: Toevalsveranderlijken en Distributiefuncties

Formules uit de cursus Waarschijnlijkheidsrekenen en statistiek

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

13.1 Kansberekeningen [1]

14.1 Kansberekeningen [1]

Hertentamen Inleiding Kansrekening 5 juli 2017, 14:00 17:00 Docent: Prof. dr. F. den Hollander

Tentamen Functies en Reeksen

Wiskundige Analyse II

Kanstheorie, -rekenen en bekende verdelingen

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

Inleiding Applicatie Software - Statgraphics

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Samenvatting Statistiek

UitwerkingenOefenQuiz Kansrekening 2009

10. De simultane kansverdeling van twee stochasten X en Y is gegeven door de volgende (onvolledige) tabel: X / /4 1. d. 0 e.

Wiskundige Analyse II

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

VOOR HET SECUNDAIR ONDERWIJS

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

Het tentamen heeft 25 onderdelen. Met ieder onderdeel kan maximaal 2 punten verdiend worden.

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

SOCIALE STATISTIEK (deel 2)

META-kaart vwo5 wiskunde A - domein Afgeleide functies

Kansrekening en Statistiek

Wiskunde B - Tentamen 2

Data analyse Inleiding statistiek

Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van uur.

Toegepaste Wiskunde 2: Het Kalman-filter

module SC 12 Inleiding Risicotheorie donderdag 7 november uur

1. De wereld van de kansmodellen.

Voorbehouden voor de correctoren Vraag 1 Vraag 2 Vraag 3 Vraag 4 Vraag 5 Totaal. Toets Kansrekenen I. 28 maart 2014

Statistiek voor A.I.

V.4 Eigenschappen van continue functies

Schrijf boven elk vel je naam, studentnummer en studierichting (W, N of I). Het is toegestaan een (grafische) rekenmachine te gebruiken.

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Statistiek voor A.I. College 5. Dinsdag 25 September 2012

Kansrekening en stochastische processen 2S610

Tentamen Inleiding Kansrekening 11 augustus 2011, uur

Statistiek voor A.I. College 4. Donderdag 20 September 2012

Transcriptie:

Cursus Statistiek Hoofdstuk 4 Statistiek voor Informatica Hoofdstuk 4: Verwachtingen Cursusjaar 29 Peter de Waal Departement Informatica Inhoud Verwachtingen Variantie Momenten en Momentengenererende functie Covariantie en Correlatie Steekproefgemiddelde Hfdstk 4: 1 / 59 Hfdstk 4: Inleiding 2 / 59 1 De discrete stochastische variabele X met verdeling: x -2 1 2 f x PX x.1.4.3.2 Verwachting gemiddelde: Tel elke mogelijke uitkomst mee met als gewicht de kans op die uitkomst: EX 2.1 +.4 + 1.3 + 2.2.5 Voor een eindige discrete stochast X met kansmassafunctie f is de verwachting gelijk aan: Definitie Verwachting van discrete stochast De verwachting Engels: expectation van een discrete stochast X met kansmassafunctie f is gedefinieerd als EX x x f x, mits deze reeks absoluut convergent is, d.w.z. x f x <. x Als deze reeks niet absoluut convergent is, dan is de verwachting van X niet gedefinieerd. EX x x f x De verwachting wordt soms ook wel gemiddelde Engels: mean genoemd. Hfdstk 4: Inleiding 3 / 59 Hfdstk 4: Verwachting Definitie 4 / 59

1 Vervolg Neem gx X 2 en bepaal EgX EX 2. De verdeling van Y X 2 is dan De verwachting van x -2 1 2 x 2 4 1 4 PX x.1.4.3.2 y 1 4 PY y.4.3.3 EX 2 EY.4 + 1.3 + 4.3 1.5 Dit kan ook rechtstreeks uit de tabel van X: Definitie Als X een discrete stochast is met kansmassafunctie f, dan is de verwachting van gx gedefinieerd als E gx x gx f x, mits deze reeks absoluut convergent is, d.w.z. gx f x <. x Als deze reeks niet absoluut convergent is, dan is de verwachting van gx niet gedefinieerd. EX 2 4.1 +.4 + 1.3 + 4.2 1.5 Hfdstk 4: Verwachting Definitie 5 / 59 Hfdstk 4: Verwachting Definitie 6 / 59 Neem een stochast X met kansmassafunctie f k gegeven door { 1 p p f k k, als k, 1, 2,...,, anders voor zekere p < 1. We kunnen berekenen dat E X p 1 p en ook bijvoorbeeld: E 2 X 21 p 2 p Definitie Verwachting van continue stochast Als X een continue stochast is met kansdichtheidsfunctie f, dan is de verwachting van X gedefinieerd als EX x f x dx mits deze integraal absoluut convergent is, d.w.z. x f x dx <. Als deze integraal niet absoluut convergent is, dan is de verwachting van gx niet gedefinieerd. Hfdstk 4: Verwachting Definitie 7 / 59 Hfdstk 4: Verwachting Definitie 8 / 59

Definitie Als X een continue stochast is met kansdichtheidsfunctie f, dan is de verwachting van gx gedefinieerd als E gx gx f x dx mits deze integraal absoluut convergent is, d.w.z. gx f x dx <. Als deze integraal niet absoluut convergent is, dan is de verwachting van gx niet gedefinieerd. 2 We hebben een continue stochastische variabele X met kansdichtheidsfunctie { 2x, if x 1, f x, anders. Vraag: Wat is de verwachting van X? Vraag: Wat is de verwachting van X? Hfdstk 4: Verwachting Definitie 9 / 59 Hfdstk 4: Verwachting Definitie 1 / 59 3 We hebben een continue stochast X met kansdichtheidsfunctie f x gelijk aan f x { c e x, als x,, anders. Vraag: Wat is de waarde van c? Als we c weten, dan kunnen we berekenen: E X x c e x dx 1 Als X, Y een continue stochastische vector is met simultane kansdichtheidsfunctie f, dan kunnen we ook de verwachting definiëren van gx, Y voor elke functie g : R 2 R: mits E gx, Y gx, y f x, y dx dy, gx, y f x, y dx dy < Iets soortgelijks kunnen we ook definiëren voor discrete stochastische vectoren, of voor gemengd discreet en continue stochastische vectoren. Hfdstk 4: Verwachting Definitie 11 / 59 Hfdstk 4: Verwachting Definitie 12 / 59

Neem een stochastische vector X, Y met kansdichtheidsfunctie { 1, als x 1, y 1, f x, y, anders. De verwachting van X 2 + Y 2 is EX 2 + Y 2 Vraag: bestaat EX, Y? 1 1 x 2 + y 2 f x, y dx dy x 2 + y 2 dx dy 2 3. Speciale gevallen Als X, Y een continue stochastische vector is met kansdichtheidsfunctie f x, y, dan is EX x f X x dx, waarbij f X x de marginale verdeling is van X. Bewijs EX x f x, y dx dy x f x, y dy dx x f X x dx Hfdstk 4: Verwachting Definitie 13 / 59 Hfdstk 4: Verwachting Definitie 14 / 59 Rekenregels Stochast X met kansmassafunctie:,3 Voor alle stochasten X en Y, waarvoor EX en EY bestaan, en voor alle a, b R geldt Ea X + b a EX + b EX + Y EX + EY,25,2,15,1,5, 1 2 3 4 5 6 7 8 9 1 Vraag: Hoe groot is EX, EX + 2, E2X? Hfdstk 4: Verwachting Rekenregels 15 / 59 Hfdstk 4: Verwachting Rekenregels 16 / 59

Bewijs Veronderstel, als voorbeeld, X en Y continu, met simultane kansdichtheid f x, y en marginale dichtheden f X x en f Y y: Ea X + b a x f x dx + a x + b f X x dx EX + Y x + y f x, y dx dy x f x, y dy dx + x f X x dx + b f x dx a EX + b y f x, y dx dy y f Y y dy EX + EY 4: Binomiale Verdeling Vaas met fractie p rode ballen en fractie 1 p blauwe ballen, Trek aselect n ballen met teruglegging. Benoem X het aantal getrokken rode ballen. We hebben in Hoofdstuk 3 gezien, dat X een binomiale verdeling Binn, p heeft. De kansmassafunctie is dus: n k p k 1 p n k, als k, 1, 2,..., n; f k, anders. Vraag: Wat is E X? Hfdstk 4: Verwachting Rekenregels 17 / 59 Hfdstk 4: Verwachting Rekenregels 18 / 59 Berekening Methode 1 Volgens de definitie van de verwachting is: E X n n n k PX k k p k 1 p n k k n k1 np k n k1 k k n! k!n k! pk 1 p n k n 1! k 1!n k! pk 1 1 p n k Neem nu l k 1 en m n 1. De uitdrukking voor E X wordt dan m m m np p l 1 p m l np PY l np l l voor een stochast Y Binm, p. l Hfdstk 4: Verwachting Rekenregels 19 / 59 Berekening Methode 2 Definieer n stochasten X 1,..., X n als volgt: 1, als de i-de bal rood is, X i, als de i-de bal blauw is. Alle X i zijn o.o. en PX i 1 p en PX i 1 p Hieruit volgt dat E X i p. Merk op dat X X 1 +... + X n zodat E X E X 1 +... + E Xn np. Hfdstk 4: Verwachting Rekenregels 2 / 59

Bewijs Twee variabelen Rekenregel Verwachting van product Als X 1,..., X n, onafhankelijke stochasten zijn, waarvoor alle afzonderlijke verwachtingen EX 1,..., EX n bestaan, dan geldt n E X i i1 n EX i. i1 Veronderstel dat twee o.o. stochasten X en Y een continue verdeling hebben, de simultane verdeling f is, en de afzonderlijke marginale verdelingen f X en f Y. Omdat de stochasten o.o. zijn, geldt voor alle x, y R 2 f x, y f X x f Y y Nu geldt dat E X Y gelijk is aan x y f x, y dx dy x y f X x f Y y dx dy x fx x y f Y y dx dy x f X x dx y f Y y dy EX EY Hfdstk 4: Verwachting Rekenregels 21 / 59 Hfdstk 4: Verwachting Rekenregels 22 / 59 Eigenschappen Let Op! EX + Y EX + EY geldt voor alle stochasten X en Y. EXY EXEY geldt alleen als X en Y onderling onafhankelijk zijn. Drie stochasten X 1, X 2 en X 3 zijn onderling onafhankelijk met E X i en E X 2 i 1, voor i 1, 2, 3. Vraag: Bereken: E X 2 1 X 2 4X 3 2 Als X een stochast is, en er bestaat een getal a, zodanig dat PX a 1, dan moet gelden EX a. Als geldt PX a 1 én EX a, dan moet gelden PX a 1. Bewijs Stel X is een discrete stochast met kansmassafunctie f. Uit PX a 1 volgt dan EX x x f x x f x a f x a Px a a x:x a x:x a Als EX a dan moet een gelijkheid zijn, en dit kan alleen als PX a 1. Hfdstk 4: Verwachting Rekenregels 23 / 59 Hfdstk 4: Verwachting Rekenregels 24 / 59

5 De volgende drie kansdichtheden geven alle hetzelfde gemiddelde..4.35.3.25.2.15 fx fx fx Definitie Variantie en Standaarddeviatie Als X een stochast is met verwachting µ EX, dan is de variantie van X gedefiniëerd als VarX E [ X µ 2], mits E[X µ 2 ] <. Als niet geldt dat E[X µ 2 ] <, dan is VarX niet gedefinieerd..1.5 De standaard deviatie van X is VarX, mits VarX bestaat. -1-5 5 1 Met de verwachting van een stochast kunnen we dus niet uitdrukken in welke mate de verdeling is uitgesmeerd over de reële getallen. Hiertoe hebben we een nieuw begrip nodig. De variantie en de standaard deviatie van een stochast X worden vaak aangegeven als σ 2 X, respectievelijk σ X of gewoon σ 2 en σ als duidelijk is welke stochast bedoeld wordt. Hfdstk 4: Variantie Inleiding 25 / 59 Hfdstk 4: Variantie Definitie 26 / 59 1 vervolg We hadden al berekend dat µ.5. 5 vervolg We kunnen aan dit voorbeeld zien dat VarX inderdaad een maat is voor de spreiding van de kansdichtheid x -2 1 2 PX x.1.4.3.2 x µ -2.5 -.5.5 1.5 x µ 2 6.25.25.25 2.25.4.35.3.25.2 fx fx fx σ 2 6.25.1 +.25.4 +.25.3 + 2.25.2 1.25 σ 1.118.15.1.5-1 -5 5 1 De waarden van VarX zijn 1, 4, en 9. We komen uitgebreid op deze soorten stochasten terug in Hoofdstuk 5. Hfdstk 4: Variantie Definitie 27 / 59 Hfdstk 4: Variantie Definitie 28 / 59

Eigenschappen en Rekenregels 1 VarX. 2 VarX dan en slechts dan als er een constante c bestaat waarvoor PX c 1. 3 Voor alle a, b R geldt VaraX + b a 2 VarX. 4 VarX EX 2 [ EX ] 2. Bewijs 1 en 2 Gebruik de eigenschap op pagina 24 Bewijs 3 Schrijf E ax + b uit. Bewijs 4 Schrijf VarX uit. Hfdstk 4: Variantie Definitie 29 / 59 Eigenschap Als X 1,..., X n onderling onafhankelijke stochastische variabelen zijn, dan geldt: VarX 1 +... + X n VarX 1 +... + VarX n. Bewijs: vb. voor n 2 Neem µ 1 E X 1 en µ2 E X 2. Er geldt: VarX 1 + X 2 E X 1 + X 2 µ 1 µ 2 2 VarX 1 + VarX 2 2E X 1 µ 1 X 2 µ 2 Aangezien X 1 en X 2 o.o. zijn, zijn ook X 1 µ 1 en X 2 µ 2 o.o.: E X 1 µ 1 X 2 µ 2 E X 1 µ 1 E X2 µ 2 Hieruit volgt: VarX 1 + X 2 VarX 1 + VarX 2 Hfdstk 4: Variantie Definitie 3 / 59 4 Binomiale verdeling Neem X en Y onafhankelijke stochasten. Vraag: Wat is VarX Y? De kansmassafunctie van de binomiale verdeling Binn, p was: { n k p k 1 p n k, als k, 1, 2,..., n; f k, anders. Wat is VarX? Berekening Neem, net als bij de berekening van EX, n onafhankelijke stochasten X 1,..., X n,. We zagen al eerder dat E X i p. Ook geldt: en dus E X 2 i p VarX i p p 2 p1 p Aangezien de X i s o.o. zijn, geldt nu: VarX VarX 1 +... + VarX n np1 p Hfdstk 4: Variantie Definitie 31 / 59 Hfdstk 4: Variantie Definitie 32 / 59

Momenten Momentengenererende functies Definitie Momenten Het k-de moment van een stochast X is gedefinieerd als de waarde van E X k. Het k-de moment bestaat dan en slechts dan als E X k <. Definitie Centrale momenten Als de verwachting van de stochast X gegeven is door µ, dan noemen we E X µ k het k-de centrale moment van X. Definitie MGF Voor een stochast X definiëren we de momenten genererende functie M.G.F. ψ als ψt E e tx, voor alle t R. Eigenschappen ψ E1 1. ψ EX. [ d ψ n n dt n E e tx ] t EX n. Hfdstk 4: Momenten en MGF Definitie 33 / 59 Hfdstk 4: Momenten en MGF Definitie 34 / 59 Eigenschappen en toepassing Eigenschap 1 Veronderstel dat X 1,..., X n o.o. stochasten zijn met m.g.f. s ψ i t E e tx, i 1,..., n. Neem Y X 1 +... + X n, dan geldt ψt n ψ i t. i1 Eigenschap 2: Uniciteit van MGF Als de m.g.f. s van twee stochasten X 1 en X 2 identiek zijn in een open interval rond t, dan zijn de kansverdelingen van X 1 en X 2 identiek. Eigenschap 1 Beschouw een stochast X die binomiaal verdeeld is met parameters n en p. X X 1 +... + X n, met X i Bernouilli verdeeld ψ i t Ee tx i pe t + 1 p ψt Ee tx pe t + 1 p n. Eigenschap 1+2 Beschouw stochast X binomiaal verdeeld met parameters n 1 en p en onafhankelijke Y binomiaal verdeeld met parameters n 2 en p, dan is X + Y binomiaal verdeeld met parameters n 1 + n 2 en p Hfdstk 4: Momenten en MGF Eigenschappen 35 / 59 Hfdstk 4: Momenten en MGF Eigenschappen 36 / 59

Gemiddelde en Mediaan We kunnen voor een stochast X twee grootheden berekenen die beide iets zeggen over het zwaartepunt of het middelpunt van de verdeling van die stochast. Als we even aannemen dat X continu verdeeld is, dan is de verwachting E X gedefinieerd als Stochast X met kansmassafunctie:,3,25,2 E X x f X x dx en de mediaan is gedefinieerd als die waarde m waarvoor,15,1,5, 1 2 3 4 5 6 7 8 9 1 PX m 1 2 en PX m 1 2. Vraag: Hoe groot is verwachting van X? Vraag: Hoe groot is de mediaan van X? Hfdstk 4: Gemiddelde en Mediaan Inleiding 37 / 59 Hfdstk 4: Gemiddelde en Mediaan Inleiding 38 / 59 Beschouw de volgende situatie. Stochast X: lengte willekeurige mannelijke student UU. Kansdichtheidsfunctie onbekend, Verwachting µ en de mediaan m van X wel bekend. We willen vóór we de lengte van een willekeurig gekozen student meten de waarde van X voorspellen. We willen bovendien de fout in de voorspelling minimaliseren. Hoe meten we de fout in de voorspelling? Procedure experiment 1 Geef een voorspellingswaarde d b.v. d 1.8m. 2 Doe het experiment en kijk wat de waarde van de stochast X wordt b.v. x 1.85m. 3 Het verschil x d is de voorspellingsfout. in dit geval dus.5m Let op: X d is een stochast! Definitie M.S.E. en M.A.E Als de waarde van een stochast X voorspeld wordt door de waarde d, dan heet E X d 2 de gemiddelde kwadratische fout Eng. Mean squared error M.S.E. van de voorspelling d, en E X d heet de gemiddelde absolute fout Eng. Mean absolute error M.A.E. van de voorspelling d. We kunnen nu bewijzen dat de M.S.E. is minimaal voor d µ, de M.A.E. is minimaal voor d m. Hfdstk 4: Gemiddelde en Mediaan Voorspellingsfout 39 / 59 Hfdstk 4: Gemiddelde en Mediaan Voorspellingsfout 4 / 59

Neem een stochast X met de volgende kansmassafunctie: x 1 2 3 4 5 6 7 f x 1 6 1 6 1 6 1 1 1 6 6 6 M.S.E. EX 3. dus M.S.E. minimaal voor d 3. M.A.E. Van de stochast X zit 5% van de kansmassa in de punten, 1, 2 en de overige 5% in 3, 5, 7. Voor elke waarde van d in het interval 2 d 3 geldt dus PX d 1 2 en PX d 1 2 Elke d in 2 d 3 is een mediaan van de verdeling en minimaliseert de M.A.E. Een importeur heeft een voorraad van 1 kazen gekocht waarvan hij het gemiddelde gewicht wil bepalen. De leverancier heeft verteld dat de variantie in het gewicht kleiner is dan.1 kg 2. Hij zou het gemiddelde gewicht als volgt kunnen benaderen. Meet het gewicht van een aantal kazen uit de voorraad. Neem het gemiddelde van de gemeten gewichten. Intuitie: Het berekende gemiddelde zal ongeveer gelijk zijn aan de verwachting verwachting het gemiddelde gewicht van alle 1 kazen. Hfdstk 4: Gemiddelde en Mediaan Voorspellingsfout 41 / 59 Hfdstk 4: Gemiddelde en Mediaan Steekproefgemiddelde 42 / 59 Steekproefgemiddelde Algemeen We herhalen n maal o.o. een experiment met een verdeling die gemiddelde µ en variantie σ 2 heeft. Dit levert n o.o. stochasten X 1,..., X n, die alle dezelfde verdeling met gemiddelde µ en variantie σ 2. Bereken 1 n X 1 + + X n. Definitie Steekproefgemiddelde We definiëren het steekproefgemiddelde X n als: X n 1 n X 1 +... + X n. Stelling Ongelijkheid van Chebyshev Stel X is een stochast waarvoor VarX bestaat. Voor elk getal t > geldt P X EX t VarX t 2 De ongelijkheid van Chebyshev geldt voor elke willekeurige stochast. Zo geldt bijvoorbeeld altijd P X µ X 3σ X 1 9 ongeacht de verdeling van X. Vraag: Hoe goed benadert dit steekproefgemiddelde µ? Hfdstk 4: Gemiddelde en Mediaan Steekproefgemiddelde 43 / 59 Hfdstk 4: Gemiddelde en Mediaan Ongelijkheden 44 / 59

Steekproefgemiddelde vervolg Er geldt voor elke stochast X E X n µ, Var X n σ 2 n. Met behulp van Chebyshev geldt voor elke t > : P X µ t VarX t 2 σ2 t 2, terwijl voor het steekproefgemiddelde X n geldt P X n µ t Var X n t 2 σ2 nt 2. Hfdstk 4: Gemiddelde en Mediaan Ongelijkheden 45 / 59 We hebben een stochast X waarvan we niet de verwachting µ weten, maar we weten wel de variantie σ 2 2. Vraag: Hoeveel steekproeven moeten we nemen, zodat het steekproefgemiddelde met kans.99 niet meer dan.1 afwijkt van het echte gemiddelde µ? We zoeken dus een waarde voor n zodat P X n µ >.1.1 We weten uit de ongelijkheid van Chebyshev dat zeker geldt: 2 P X n µ >.1.1 2 n Een n die voldoende groot is volgt uit 2.1 n.1 ofwel n 2.1.1 2 Hfdstk 4: Gemiddelde en Mediaan Ongelijkheden 46 / 59 We hebben het begrip variantie ingevoerd om kwantitatief de mate van spreiding van een verdeling uit te drukken. Vraag: Hoe drukken we uit in welke mate twee stochasten samenvallen of afhankelijk zijn? Definitie Covarantie Laat X en Y twee stochasten zijn, met E X µ X, E Y µ Y, VarX σ 2 X en VarY σ2 Y. De covariantie van X en Y engels: covariance, die genoteerd wordt als CovX, Y, is CovX, Y E X µ X Y µ Y. Als σx 2 < en σ2 Y <, dan bestaat de covariantie en is deze ook eindig. 6 We nemen twee stochasten X en Y met simultane kansdichtheid { x + y, als x 1 en y 1, f x, y, anders. Om CovX, Y te berekenen, moeten we eerst µ X en µ Y bepalen. Daarvoor hebben we de marginale verdelingen van X en Y nodig: f X x f x, ydy [xy + 12 ] y1 y2 x + 1 y 2 1 x + ydy voor x 1. Buiten het interval [, 1] is f X x. Hfdstk 4: Covariantie Definitie 47 / 59 Hfdstk 4: Covariantie Definitie 48 / 59

Hieruit volgt E X 1 x f X x dx [ 1 3 x3 + 1 ] 1 4 x2 7 12 1 x x + 1 dx 2 1 x 2 + 1 2 x dx Aangezien f x, y symmetrisch is in X en Y, geldt dat ook f Y y y + 1 2 en E Y 7 12. De covariantie is nu gelijk aan CovX, Y 1 1... x 7 y 7 x + ydxdy 12 12 Eigenschappen Neem X en Y stochasten met σ X < en σ Y < 1 CovX, Y E XY E X E Y. 2 VarX + Y VarX + VarY + 2 CovX, Y Bewijs 1 CovX, Y E X µ X Y µ Y E XY Xµ Y Yµ X µ X µ Y Bewijs 2 VarX + Y E X + Y µ X µ Y 2 E X µ X 2 + Y µ Y 2 + 2X µ X Y µ Y Hfdstk 4: Covariantie Definitie 49 / 59 Hfdstk 4: Covariantie Eigenschappen 5 / 59 6 Herh. Het is nu eenvoudiger om CovX, Y uit te rekenen. We wisten al dat E X 7 12, E Y 7 12 We rekenen nu uit en E XY 1 1 1 [ 1 3 x3 y + 1 2 x2 y 2 [ 1 6 y2 + 1 6 y3 ] y1 xyx + ydx dy y 1 3 CovX, Y 1 3 7 12 ] x1 dy x 2 1 144 1 1 3 y + 1 2 y2 dy Neem X en Y onafhankelijk, waarbij X uniform verdeeld is op [, 1] en Y uniform verdeeld op [3, 5]. Vraag: Hoe groot is CovX, Y? Hfdstk 4: Covariantie Eigenschappen 51 / 59 Hfdstk 4: Covariantie Eigenschappen 52 / 59

Van eigenschap 2 kunnen we ook nog een algemenere versie opschrijven: Als X 1,..., X n stochasten zijn met eindige varianties VarX i <, dan geldt: n Var X i i1 n VarX i + 2 i1 n i 1 Cov X i, X j i1 j1 Eigenschap Ongelijkheid van Schwarz Voor alle stochasten U en V geldt [ E UV ] 2 E U 2 E V 2. Als bovendien geldt dat E U 2 E V 2 <, dan geldt gelijkheid dan en slechts dan als er een getal t bestaat, waarvoor PU t V 1 of PV t U 1. Uit de Ongelijkheid van Schwarz gebruik U X µ X en V Y µ Y volgt [ CovX, Y ] 2 σ 2 X σ 2 Y. Hfdstk 4: Covariantie Eigenschappen 53 / 59 Hfdstk 4: Covariantie Eigenschappen 54 / 59 CovX, Y aanduiding voor de mate waarin X en Y gelijktijdig grote waarden aannemen. Als CovX, Y > dan betekent dit dat er waarden x voor X en y voor Y zijn, met een grote kansmassa/kansdichtheid f x, y waarvoor x > µx én y > µ Y, of x < µx én y < µ Y. Als CovX, Y < dan geldt juist dat x > µ X samengaat met y < µ Y, en x < µx samengaat met y > µ Y. De grootte van CovX, Y wordt bepaald door Samengaan van afwijkingen van µ voor X en Y, Het bereik van X, Het bereik van Y. Om de twee laatstgenoemde nadelen van de covariantie op te heffen definiëren we een genormeerde covariantie, de zogenaamde correlatie. Definitie Correlatie Laat X en Y twee stochasten zijn, met E X µ X, E Y µ Y, VarX σ 2 X < en VarY σ2 Y <. De correlatie van X en Y engels: correlation, die genoteerd wordt als ρx, Y, is ρx, Y CovX, Y σ X σ Y Hfdstk 4: Covariantie Eigenschappen 55 / 59 Hfdstk 4: Correlatie Definitie 56 / 59

Correlatie vervolg Aangezien CovX, Y σ X σ Y, volgt uit de definitie van correlatie dat ρx, Y CovX, Y σ X σ Y 1 ρx, Y 1. We noemen X en Y positief gecorreleerd als ρx, Y >, negatief gecorreleerd als ρx, Y <, ongecorreleerd als ρx, Y. Er geldt bovendien dat als ρ +1, dan X a Y + b voor een zekere a >, b R, als ρ 1, dan X a Y + b voor een zekere a <, b R. Hfdstk 4: Correlatie Definitie 57 / 59 6 Herh. We hadden al eerder gezien in 6 dat EX EY 7 1, en CovX, Y 12 144. De varianties σx 2 en σ2 Y volgen uit de marginale verdelingen van X en Y: 1 EX 2 x 2 x + 1 [ 1 dx 2 4 x4 + 1 6 x3] x1 5 x 12 en En dus σx 2 EX 2 EX 2 5 7 2 12 11 12 144 ρx, Y CovX, Y σ X σ Y 1 11 Hfdstk 4: Correlatie Definitie 58 / 59 Met de stof van Hoofdstuk 4 moet je kunnen: Begrijpen wat verwachting, variantie, steekproefgemiddelde, mediaan, momenten, momentengenererende functie, covariantie, en correlatie zijn. Deze begrippen uit kunnen rekenen, als de kansverdeling van een stochast of twee stochasten gegeven is. Het verband weten tussen M.S.E./M.A.E. en gemiddelde/mediaan. Een afschatting van een kans kunnen berekenen m.b.v. de ongelijkheid van Chebyshev. Het verband kennen tussen onafhankelijkheid en covariantie/correlatie. Hfdstk 4: Correlatie Definitie 59 / 59