Cursus Statistiek Hoofdstuk 4 Statistiek voor Informatica Hoofdstuk 4: Verwachtingen Cursusjaar 29 Peter de Waal Departement Informatica Inhoud Verwachtingen Variantie Momenten en Momentengenererende functie Covariantie en Correlatie Steekproefgemiddelde Hfdstk 4: 1 / 59 Hfdstk 4: Inleiding 2 / 59 1 De discrete stochastische variabele X met verdeling: x -2 1 2 f x PX x.1.4.3.2 Verwachting gemiddelde: Tel elke mogelijke uitkomst mee met als gewicht de kans op die uitkomst: EX 2.1 +.4 + 1.3 + 2.2.5 Voor een eindige discrete stochast X met kansmassafunctie f is de verwachting gelijk aan: Definitie Verwachting van discrete stochast De verwachting Engels: expectation van een discrete stochast X met kansmassafunctie f is gedefinieerd als EX x x f x, mits deze reeks absoluut convergent is, d.w.z. x f x <. x Als deze reeks niet absoluut convergent is, dan is de verwachting van X niet gedefinieerd. EX x x f x De verwachting wordt soms ook wel gemiddelde Engels: mean genoemd. Hfdstk 4: Inleiding 3 / 59 Hfdstk 4: Verwachting Definitie 4 / 59
1 Vervolg Neem gx X 2 en bepaal EgX EX 2. De verdeling van Y X 2 is dan De verwachting van x -2 1 2 x 2 4 1 4 PX x.1.4.3.2 y 1 4 PY y.4.3.3 EX 2 EY.4 + 1.3 + 4.3 1.5 Dit kan ook rechtstreeks uit de tabel van X: Definitie Als X een discrete stochast is met kansmassafunctie f, dan is de verwachting van gx gedefinieerd als E gx x gx f x, mits deze reeks absoluut convergent is, d.w.z. gx f x <. x Als deze reeks niet absoluut convergent is, dan is de verwachting van gx niet gedefinieerd. EX 2 4.1 +.4 + 1.3 + 4.2 1.5 Hfdstk 4: Verwachting Definitie 5 / 59 Hfdstk 4: Verwachting Definitie 6 / 59 Neem een stochast X met kansmassafunctie f k gegeven door { 1 p p f k k, als k, 1, 2,...,, anders voor zekere p < 1. We kunnen berekenen dat E X p 1 p en ook bijvoorbeeld: E 2 X 21 p 2 p Definitie Verwachting van continue stochast Als X een continue stochast is met kansdichtheidsfunctie f, dan is de verwachting van X gedefinieerd als EX x f x dx mits deze integraal absoluut convergent is, d.w.z. x f x dx <. Als deze integraal niet absoluut convergent is, dan is de verwachting van gx niet gedefinieerd. Hfdstk 4: Verwachting Definitie 7 / 59 Hfdstk 4: Verwachting Definitie 8 / 59
Definitie Als X een continue stochast is met kansdichtheidsfunctie f, dan is de verwachting van gx gedefinieerd als E gx gx f x dx mits deze integraal absoluut convergent is, d.w.z. gx f x dx <. Als deze integraal niet absoluut convergent is, dan is de verwachting van gx niet gedefinieerd. 2 We hebben een continue stochastische variabele X met kansdichtheidsfunctie { 2x, if x 1, f x, anders. Vraag: Wat is de verwachting van X? Vraag: Wat is de verwachting van X? Hfdstk 4: Verwachting Definitie 9 / 59 Hfdstk 4: Verwachting Definitie 1 / 59 3 We hebben een continue stochast X met kansdichtheidsfunctie f x gelijk aan f x { c e x, als x,, anders. Vraag: Wat is de waarde van c? Als we c weten, dan kunnen we berekenen: E X x c e x dx 1 Als X, Y een continue stochastische vector is met simultane kansdichtheidsfunctie f, dan kunnen we ook de verwachting definiëren van gx, Y voor elke functie g : R 2 R: mits E gx, Y gx, y f x, y dx dy, gx, y f x, y dx dy < Iets soortgelijks kunnen we ook definiëren voor discrete stochastische vectoren, of voor gemengd discreet en continue stochastische vectoren. Hfdstk 4: Verwachting Definitie 11 / 59 Hfdstk 4: Verwachting Definitie 12 / 59
Neem een stochastische vector X, Y met kansdichtheidsfunctie { 1, als x 1, y 1, f x, y, anders. De verwachting van X 2 + Y 2 is EX 2 + Y 2 Vraag: bestaat EX, Y? 1 1 x 2 + y 2 f x, y dx dy x 2 + y 2 dx dy 2 3. Speciale gevallen Als X, Y een continue stochastische vector is met kansdichtheidsfunctie f x, y, dan is EX x f X x dx, waarbij f X x de marginale verdeling is van X. Bewijs EX x f x, y dx dy x f x, y dy dx x f X x dx Hfdstk 4: Verwachting Definitie 13 / 59 Hfdstk 4: Verwachting Definitie 14 / 59 Rekenregels Stochast X met kansmassafunctie:,3 Voor alle stochasten X en Y, waarvoor EX en EY bestaan, en voor alle a, b R geldt Ea X + b a EX + b EX + Y EX + EY,25,2,15,1,5, 1 2 3 4 5 6 7 8 9 1 Vraag: Hoe groot is EX, EX + 2, E2X? Hfdstk 4: Verwachting Rekenregels 15 / 59 Hfdstk 4: Verwachting Rekenregels 16 / 59
Bewijs Veronderstel, als voorbeeld, X en Y continu, met simultane kansdichtheid f x, y en marginale dichtheden f X x en f Y y: Ea X + b a x f x dx + a x + b f X x dx EX + Y x + y f x, y dx dy x f x, y dy dx + x f X x dx + b f x dx a EX + b y f x, y dx dy y f Y y dy EX + EY 4: Binomiale Verdeling Vaas met fractie p rode ballen en fractie 1 p blauwe ballen, Trek aselect n ballen met teruglegging. Benoem X het aantal getrokken rode ballen. We hebben in Hoofdstuk 3 gezien, dat X een binomiale verdeling Binn, p heeft. De kansmassafunctie is dus: n k p k 1 p n k, als k, 1, 2,..., n; f k, anders. Vraag: Wat is E X? Hfdstk 4: Verwachting Rekenregels 17 / 59 Hfdstk 4: Verwachting Rekenregels 18 / 59 Berekening Methode 1 Volgens de definitie van de verwachting is: E X n n n k PX k k p k 1 p n k k n k1 np k n k1 k k n! k!n k! pk 1 p n k n 1! k 1!n k! pk 1 1 p n k Neem nu l k 1 en m n 1. De uitdrukking voor E X wordt dan m m m np p l 1 p m l np PY l np l l voor een stochast Y Binm, p. l Hfdstk 4: Verwachting Rekenregels 19 / 59 Berekening Methode 2 Definieer n stochasten X 1,..., X n als volgt: 1, als de i-de bal rood is, X i, als de i-de bal blauw is. Alle X i zijn o.o. en PX i 1 p en PX i 1 p Hieruit volgt dat E X i p. Merk op dat X X 1 +... + X n zodat E X E X 1 +... + E Xn np. Hfdstk 4: Verwachting Rekenregels 2 / 59
Bewijs Twee variabelen Rekenregel Verwachting van product Als X 1,..., X n, onafhankelijke stochasten zijn, waarvoor alle afzonderlijke verwachtingen EX 1,..., EX n bestaan, dan geldt n E X i i1 n EX i. i1 Veronderstel dat twee o.o. stochasten X en Y een continue verdeling hebben, de simultane verdeling f is, en de afzonderlijke marginale verdelingen f X en f Y. Omdat de stochasten o.o. zijn, geldt voor alle x, y R 2 f x, y f X x f Y y Nu geldt dat E X Y gelijk is aan x y f x, y dx dy x y f X x f Y y dx dy x fx x y f Y y dx dy x f X x dx y f Y y dy EX EY Hfdstk 4: Verwachting Rekenregels 21 / 59 Hfdstk 4: Verwachting Rekenregels 22 / 59 Eigenschappen Let Op! EX + Y EX + EY geldt voor alle stochasten X en Y. EXY EXEY geldt alleen als X en Y onderling onafhankelijk zijn. Drie stochasten X 1, X 2 en X 3 zijn onderling onafhankelijk met E X i en E X 2 i 1, voor i 1, 2, 3. Vraag: Bereken: E X 2 1 X 2 4X 3 2 Als X een stochast is, en er bestaat een getal a, zodanig dat PX a 1, dan moet gelden EX a. Als geldt PX a 1 én EX a, dan moet gelden PX a 1. Bewijs Stel X is een discrete stochast met kansmassafunctie f. Uit PX a 1 volgt dan EX x x f x x f x a f x a Px a a x:x a x:x a Als EX a dan moet een gelijkheid zijn, en dit kan alleen als PX a 1. Hfdstk 4: Verwachting Rekenregels 23 / 59 Hfdstk 4: Verwachting Rekenregels 24 / 59
5 De volgende drie kansdichtheden geven alle hetzelfde gemiddelde..4.35.3.25.2.15 fx fx fx Definitie Variantie en Standaarddeviatie Als X een stochast is met verwachting µ EX, dan is de variantie van X gedefiniëerd als VarX E [ X µ 2], mits E[X µ 2 ] <. Als niet geldt dat E[X µ 2 ] <, dan is VarX niet gedefinieerd..1.5 De standaard deviatie van X is VarX, mits VarX bestaat. -1-5 5 1 Met de verwachting van een stochast kunnen we dus niet uitdrukken in welke mate de verdeling is uitgesmeerd over de reële getallen. Hiertoe hebben we een nieuw begrip nodig. De variantie en de standaard deviatie van een stochast X worden vaak aangegeven als σ 2 X, respectievelijk σ X of gewoon σ 2 en σ als duidelijk is welke stochast bedoeld wordt. Hfdstk 4: Variantie Inleiding 25 / 59 Hfdstk 4: Variantie Definitie 26 / 59 1 vervolg We hadden al berekend dat µ.5. 5 vervolg We kunnen aan dit voorbeeld zien dat VarX inderdaad een maat is voor de spreiding van de kansdichtheid x -2 1 2 PX x.1.4.3.2 x µ -2.5 -.5.5 1.5 x µ 2 6.25.25.25 2.25.4.35.3.25.2 fx fx fx σ 2 6.25.1 +.25.4 +.25.3 + 2.25.2 1.25 σ 1.118.15.1.5-1 -5 5 1 De waarden van VarX zijn 1, 4, en 9. We komen uitgebreid op deze soorten stochasten terug in Hoofdstuk 5. Hfdstk 4: Variantie Definitie 27 / 59 Hfdstk 4: Variantie Definitie 28 / 59
Eigenschappen en Rekenregels 1 VarX. 2 VarX dan en slechts dan als er een constante c bestaat waarvoor PX c 1. 3 Voor alle a, b R geldt VaraX + b a 2 VarX. 4 VarX EX 2 [ EX ] 2. Bewijs 1 en 2 Gebruik de eigenschap op pagina 24 Bewijs 3 Schrijf E ax + b uit. Bewijs 4 Schrijf VarX uit. Hfdstk 4: Variantie Definitie 29 / 59 Eigenschap Als X 1,..., X n onderling onafhankelijke stochastische variabelen zijn, dan geldt: VarX 1 +... + X n VarX 1 +... + VarX n. Bewijs: vb. voor n 2 Neem µ 1 E X 1 en µ2 E X 2. Er geldt: VarX 1 + X 2 E X 1 + X 2 µ 1 µ 2 2 VarX 1 + VarX 2 2E X 1 µ 1 X 2 µ 2 Aangezien X 1 en X 2 o.o. zijn, zijn ook X 1 µ 1 en X 2 µ 2 o.o.: E X 1 µ 1 X 2 µ 2 E X 1 µ 1 E X2 µ 2 Hieruit volgt: VarX 1 + X 2 VarX 1 + VarX 2 Hfdstk 4: Variantie Definitie 3 / 59 4 Binomiale verdeling Neem X en Y onafhankelijke stochasten. Vraag: Wat is VarX Y? De kansmassafunctie van de binomiale verdeling Binn, p was: { n k p k 1 p n k, als k, 1, 2,..., n; f k, anders. Wat is VarX? Berekening Neem, net als bij de berekening van EX, n onafhankelijke stochasten X 1,..., X n,. We zagen al eerder dat E X i p. Ook geldt: en dus E X 2 i p VarX i p p 2 p1 p Aangezien de X i s o.o. zijn, geldt nu: VarX VarX 1 +... + VarX n np1 p Hfdstk 4: Variantie Definitie 31 / 59 Hfdstk 4: Variantie Definitie 32 / 59
Momenten Momentengenererende functies Definitie Momenten Het k-de moment van een stochast X is gedefinieerd als de waarde van E X k. Het k-de moment bestaat dan en slechts dan als E X k <. Definitie Centrale momenten Als de verwachting van de stochast X gegeven is door µ, dan noemen we E X µ k het k-de centrale moment van X. Definitie MGF Voor een stochast X definiëren we de momenten genererende functie M.G.F. ψ als ψt E e tx, voor alle t R. Eigenschappen ψ E1 1. ψ EX. [ d ψ n n dt n E e tx ] t EX n. Hfdstk 4: Momenten en MGF Definitie 33 / 59 Hfdstk 4: Momenten en MGF Definitie 34 / 59 Eigenschappen en toepassing Eigenschap 1 Veronderstel dat X 1,..., X n o.o. stochasten zijn met m.g.f. s ψ i t E e tx, i 1,..., n. Neem Y X 1 +... + X n, dan geldt ψt n ψ i t. i1 Eigenschap 2: Uniciteit van MGF Als de m.g.f. s van twee stochasten X 1 en X 2 identiek zijn in een open interval rond t, dan zijn de kansverdelingen van X 1 en X 2 identiek. Eigenschap 1 Beschouw een stochast X die binomiaal verdeeld is met parameters n en p. X X 1 +... + X n, met X i Bernouilli verdeeld ψ i t Ee tx i pe t + 1 p ψt Ee tx pe t + 1 p n. Eigenschap 1+2 Beschouw stochast X binomiaal verdeeld met parameters n 1 en p en onafhankelijke Y binomiaal verdeeld met parameters n 2 en p, dan is X + Y binomiaal verdeeld met parameters n 1 + n 2 en p Hfdstk 4: Momenten en MGF Eigenschappen 35 / 59 Hfdstk 4: Momenten en MGF Eigenschappen 36 / 59
Gemiddelde en Mediaan We kunnen voor een stochast X twee grootheden berekenen die beide iets zeggen over het zwaartepunt of het middelpunt van de verdeling van die stochast. Als we even aannemen dat X continu verdeeld is, dan is de verwachting E X gedefinieerd als Stochast X met kansmassafunctie:,3,25,2 E X x f X x dx en de mediaan is gedefinieerd als die waarde m waarvoor,15,1,5, 1 2 3 4 5 6 7 8 9 1 PX m 1 2 en PX m 1 2. Vraag: Hoe groot is verwachting van X? Vraag: Hoe groot is de mediaan van X? Hfdstk 4: Gemiddelde en Mediaan Inleiding 37 / 59 Hfdstk 4: Gemiddelde en Mediaan Inleiding 38 / 59 Beschouw de volgende situatie. Stochast X: lengte willekeurige mannelijke student UU. Kansdichtheidsfunctie onbekend, Verwachting µ en de mediaan m van X wel bekend. We willen vóór we de lengte van een willekeurig gekozen student meten de waarde van X voorspellen. We willen bovendien de fout in de voorspelling minimaliseren. Hoe meten we de fout in de voorspelling? Procedure experiment 1 Geef een voorspellingswaarde d b.v. d 1.8m. 2 Doe het experiment en kijk wat de waarde van de stochast X wordt b.v. x 1.85m. 3 Het verschil x d is de voorspellingsfout. in dit geval dus.5m Let op: X d is een stochast! Definitie M.S.E. en M.A.E Als de waarde van een stochast X voorspeld wordt door de waarde d, dan heet E X d 2 de gemiddelde kwadratische fout Eng. Mean squared error M.S.E. van de voorspelling d, en E X d heet de gemiddelde absolute fout Eng. Mean absolute error M.A.E. van de voorspelling d. We kunnen nu bewijzen dat de M.S.E. is minimaal voor d µ, de M.A.E. is minimaal voor d m. Hfdstk 4: Gemiddelde en Mediaan Voorspellingsfout 39 / 59 Hfdstk 4: Gemiddelde en Mediaan Voorspellingsfout 4 / 59
Neem een stochast X met de volgende kansmassafunctie: x 1 2 3 4 5 6 7 f x 1 6 1 6 1 6 1 1 1 6 6 6 M.S.E. EX 3. dus M.S.E. minimaal voor d 3. M.A.E. Van de stochast X zit 5% van de kansmassa in de punten, 1, 2 en de overige 5% in 3, 5, 7. Voor elke waarde van d in het interval 2 d 3 geldt dus PX d 1 2 en PX d 1 2 Elke d in 2 d 3 is een mediaan van de verdeling en minimaliseert de M.A.E. Een importeur heeft een voorraad van 1 kazen gekocht waarvan hij het gemiddelde gewicht wil bepalen. De leverancier heeft verteld dat de variantie in het gewicht kleiner is dan.1 kg 2. Hij zou het gemiddelde gewicht als volgt kunnen benaderen. Meet het gewicht van een aantal kazen uit de voorraad. Neem het gemiddelde van de gemeten gewichten. Intuitie: Het berekende gemiddelde zal ongeveer gelijk zijn aan de verwachting verwachting het gemiddelde gewicht van alle 1 kazen. Hfdstk 4: Gemiddelde en Mediaan Voorspellingsfout 41 / 59 Hfdstk 4: Gemiddelde en Mediaan Steekproefgemiddelde 42 / 59 Steekproefgemiddelde Algemeen We herhalen n maal o.o. een experiment met een verdeling die gemiddelde µ en variantie σ 2 heeft. Dit levert n o.o. stochasten X 1,..., X n, die alle dezelfde verdeling met gemiddelde µ en variantie σ 2. Bereken 1 n X 1 + + X n. Definitie Steekproefgemiddelde We definiëren het steekproefgemiddelde X n als: X n 1 n X 1 +... + X n. Stelling Ongelijkheid van Chebyshev Stel X is een stochast waarvoor VarX bestaat. Voor elk getal t > geldt P X EX t VarX t 2 De ongelijkheid van Chebyshev geldt voor elke willekeurige stochast. Zo geldt bijvoorbeeld altijd P X µ X 3σ X 1 9 ongeacht de verdeling van X. Vraag: Hoe goed benadert dit steekproefgemiddelde µ? Hfdstk 4: Gemiddelde en Mediaan Steekproefgemiddelde 43 / 59 Hfdstk 4: Gemiddelde en Mediaan Ongelijkheden 44 / 59
Steekproefgemiddelde vervolg Er geldt voor elke stochast X E X n µ, Var X n σ 2 n. Met behulp van Chebyshev geldt voor elke t > : P X µ t VarX t 2 σ2 t 2, terwijl voor het steekproefgemiddelde X n geldt P X n µ t Var X n t 2 σ2 nt 2. Hfdstk 4: Gemiddelde en Mediaan Ongelijkheden 45 / 59 We hebben een stochast X waarvan we niet de verwachting µ weten, maar we weten wel de variantie σ 2 2. Vraag: Hoeveel steekproeven moeten we nemen, zodat het steekproefgemiddelde met kans.99 niet meer dan.1 afwijkt van het echte gemiddelde µ? We zoeken dus een waarde voor n zodat P X n µ >.1.1 We weten uit de ongelijkheid van Chebyshev dat zeker geldt: 2 P X n µ >.1.1 2 n Een n die voldoende groot is volgt uit 2.1 n.1 ofwel n 2.1.1 2 Hfdstk 4: Gemiddelde en Mediaan Ongelijkheden 46 / 59 We hebben het begrip variantie ingevoerd om kwantitatief de mate van spreiding van een verdeling uit te drukken. Vraag: Hoe drukken we uit in welke mate twee stochasten samenvallen of afhankelijk zijn? Definitie Covarantie Laat X en Y twee stochasten zijn, met E X µ X, E Y µ Y, VarX σ 2 X en VarY σ2 Y. De covariantie van X en Y engels: covariance, die genoteerd wordt als CovX, Y, is CovX, Y E X µ X Y µ Y. Als σx 2 < en σ2 Y <, dan bestaat de covariantie en is deze ook eindig. 6 We nemen twee stochasten X en Y met simultane kansdichtheid { x + y, als x 1 en y 1, f x, y, anders. Om CovX, Y te berekenen, moeten we eerst µ X en µ Y bepalen. Daarvoor hebben we de marginale verdelingen van X en Y nodig: f X x f x, ydy [xy + 12 ] y1 y2 x + 1 y 2 1 x + ydy voor x 1. Buiten het interval [, 1] is f X x. Hfdstk 4: Covariantie Definitie 47 / 59 Hfdstk 4: Covariantie Definitie 48 / 59
Hieruit volgt E X 1 x f X x dx [ 1 3 x3 + 1 ] 1 4 x2 7 12 1 x x + 1 dx 2 1 x 2 + 1 2 x dx Aangezien f x, y symmetrisch is in X en Y, geldt dat ook f Y y y + 1 2 en E Y 7 12. De covariantie is nu gelijk aan CovX, Y 1 1... x 7 y 7 x + ydxdy 12 12 Eigenschappen Neem X en Y stochasten met σ X < en σ Y < 1 CovX, Y E XY E X E Y. 2 VarX + Y VarX + VarY + 2 CovX, Y Bewijs 1 CovX, Y E X µ X Y µ Y E XY Xµ Y Yµ X µ X µ Y Bewijs 2 VarX + Y E X + Y µ X µ Y 2 E X µ X 2 + Y µ Y 2 + 2X µ X Y µ Y Hfdstk 4: Covariantie Definitie 49 / 59 Hfdstk 4: Covariantie Eigenschappen 5 / 59 6 Herh. Het is nu eenvoudiger om CovX, Y uit te rekenen. We wisten al dat E X 7 12, E Y 7 12 We rekenen nu uit en E XY 1 1 1 [ 1 3 x3 y + 1 2 x2 y 2 [ 1 6 y2 + 1 6 y3 ] y1 xyx + ydx dy y 1 3 CovX, Y 1 3 7 12 ] x1 dy x 2 1 144 1 1 3 y + 1 2 y2 dy Neem X en Y onafhankelijk, waarbij X uniform verdeeld is op [, 1] en Y uniform verdeeld op [3, 5]. Vraag: Hoe groot is CovX, Y? Hfdstk 4: Covariantie Eigenschappen 51 / 59 Hfdstk 4: Covariantie Eigenschappen 52 / 59
Van eigenschap 2 kunnen we ook nog een algemenere versie opschrijven: Als X 1,..., X n stochasten zijn met eindige varianties VarX i <, dan geldt: n Var X i i1 n VarX i + 2 i1 n i 1 Cov X i, X j i1 j1 Eigenschap Ongelijkheid van Schwarz Voor alle stochasten U en V geldt [ E UV ] 2 E U 2 E V 2. Als bovendien geldt dat E U 2 E V 2 <, dan geldt gelijkheid dan en slechts dan als er een getal t bestaat, waarvoor PU t V 1 of PV t U 1. Uit de Ongelijkheid van Schwarz gebruik U X µ X en V Y µ Y volgt [ CovX, Y ] 2 σ 2 X σ 2 Y. Hfdstk 4: Covariantie Eigenschappen 53 / 59 Hfdstk 4: Covariantie Eigenschappen 54 / 59 CovX, Y aanduiding voor de mate waarin X en Y gelijktijdig grote waarden aannemen. Als CovX, Y > dan betekent dit dat er waarden x voor X en y voor Y zijn, met een grote kansmassa/kansdichtheid f x, y waarvoor x > µx én y > µ Y, of x < µx én y < µ Y. Als CovX, Y < dan geldt juist dat x > µ X samengaat met y < µ Y, en x < µx samengaat met y > µ Y. De grootte van CovX, Y wordt bepaald door Samengaan van afwijkingen van µ voor X en Y, Het bereik van X, Het bereik van Y. Om de twee laatstgenoemde nadelen van de covariantie op te heffen definiëren we een genormeerde covariantie, de zogenaamde correlatie. Definitie Correlatie Laat X en Y twee stochasten zijn, met E X µ X, E Y µ Y, VarX σ 2 X < en VarY σ2 Y <. De correlatie van X en Y engels: correlation, die genoteerd wordt als ρx, Y, is ρx, Y CovX, Y σ X σ Y Hfdstk 4: Covariantie Eigenschappen 55 / 59 Hfdstk 4: Correlatie Definitie 56 / 59
Correlatie vervolg Aangezien CovX, Y σ X σ Y, volgt uit de definitie van correlatie dat ρx, Y CovX, Y σ X σ Y 1 ρx, Y 1. We noemen X en Y positief gecorreleerd als ρx, Y >, negatief gecorreleerd als ρx, Y <, ongecorreleerd als ρx, Y. Er geldt bovendien dat als ρ +1, dan X a Y + b voor een zekere a >, b R, als ρ 1, dan X a Y + b voor een zekere a <, b R. Hfdstk 4: Correlatie Definitie 57 / 59 6 Herh. We hadden al eerder gezien in 6 dat EX EY 7 1, en CovX, Y 12 144. De varianties σx 2 en σ2 Y volgen uit de marginale verdelingen van X en Y: 1 EX 2 x 2 x + 1 [ 1 dx 2 4 x4 + 1 6 x3] x1 5 x 12 en En dus σx 2 EX 2 EX 2 5 7 2 12 11 12 144 ρx, Y CovX, Y σ X σ Y 1 11 Hfdstk 4: Correlatie Definitie 58 / 59 Met de stof van Hoofdstuk 4 moet je kunnen: Begrijpen wat verwachting, variantie, steekproefgemiddelde, mediaan, momenten, momentengenererende functie, covariantie, en correlatie zijn. Deze begrippen uit kunnen rekenen, als de kansverdeling van een stochast of twee stochasten gegeven is. Het verband weten tussen M.S.E./M.A.E. en gemiddelde/mediaan. Een afschatting van een kans kunnen berekenen m.b.v. de ongelijkheid van Chebyshev. Het verband kennen tussen onafhankelijkheid en covariantie/correlatie. Hfdstk 4: Correlatie Definitie 59 / 59