. Statistische modellerig Stappepla:. Succes?. Wat geregistreerd? 3. meerdere successe per eeheid? à Aatal successe? Max. #? JA Bi θ NEE Poisso λ JA: cotiu: Poisso of Exp λ à wachttijd? Komma? JA Exp λ NEE Geo θ NEE: discreet: Bi of Geo θ Eevoudige modelle: Naam Notatie π " of φ " μ " σ " Extra DISCREET Berouillie X~Ber θ) π " )=PX=)=θ μ " =θ σ " =θ-θ) succes= mislukkig=0 π " 0)=PX=0)=-θ familie verdelige va alle waardes va θ Biomiaal X~Bi,θ) π " k)=px=k)= ) θ) θ -) μ " =θ σ " =θ-θ) X=# successe i pogige statioair e statistisch oafh. Geometr. X~Geoθ) π " k)=px=k) = θ )- θ μ " = σ 0 " = -0 X=wachttijd tot eerste succes bij 0 Bi,θ) π " k)=kas op succes op k- de momet Poisso CONTINU Uiform X~Poissoλ) X~Ua,b) Normaal X~Nμ, σ ) Expoet. T~Expoλ) π " k)=px=k)= 3 )! e- φ " = φ " = voor a x b b a 0 aders H FG e- IJK L φ O t)= λe-q voor t 0 0 voor t < 0 φ O t)=pt t)=pt<t)=- e -Q μ " =λ σ " =λ λ=gemid # successe pr eeheid μ " = ABC σ " = A-C =sijput y-as C-A μ " =μ σ " =σ eigeschap trasformatie: als X~N μ, σ e Y=a+bX, da Y~Na+bμ, b σ ) maw μ O = σ O = trasf. ook ormaalverd.) λ=gemiddeld # successe per itervaleeheid μ O =gemiddelde wachttijd tot eerste succes Meerdere variabele, multivariaat x,y) Algemee altijd): π ",V x, y = π YZ[\V x π V y = π [ZY\" y π " x idem φ ",V x, y)) bij statistisch oafhakelijk: π ",V x, y = π " x π V y idem φ ",V x, y)) Bivariaat ormaal? X,Y) ~ Nμ, μ ; σ, σ, ρ) X~Nμ, σ ) e Y~Nμ, σ ) altijd: φ x,y x, y = - e Jρ πσ σ -ρ ) x-μ σ statistisch oafhakelijk φ x,y x, y = Complexe modelle: Megselmodelle: algemee: π " = λπ " ) + λ)π " ) ormaalmodel: B y-μ σ - ρx-μ )y-μ ) σ σ - e πσ σ e - H FG H x-μ σ B y-μ σ φ " = λφ ) ) " + λ)φ " X~λ N μ, σ ) + λ N μ, σ ) 5 parameters IJKH φ " x = λ LH + λ) Opm. ka meer da twee λ hebbe. som va λ va alle deelpopulaties moet gelijk zij aa elemet ka iet i beide deelpopulaties zitte Regressiemodelle: ekelvoudig: predictor) YIX=x l ~ N β + β x l, σ 3 parameters e - H FG Y p = β + β x p + E p met E p ~ N0, σ ) φ YIX=xj y = πσ e y β 0 +β x j ) σ meervoudig: Y p = β + β x p + β x p + E p met E p ~ N0, σ ) IJK L hiërarchisch: Y p) = β + β ) x p + E p met E p) ~ N0, σ ) e β ) ~ Nμ, τ ) Opm. ekelvoudig is deelfamilie va meervoudig elemete: Y variabele, X predictor, E foute, β regr.costate, basisiveau, β regr.gewicht, ivloed, idexe
. Keuze va statistieke Keuze va schatters: θ Aalogiemethode x voor μ " wat μ " = x p π " x p e x = x p p " x p ; s " voor σ " wat σ " = x μ " π " x p e s " = x x p " x p r "V voor ρ "V wat ρ "V = G I e r G I G "V = } I } I } ~}Q Kleiste kwadratemethode voor optimale lieaire voorspellig y p = b + b x p de gekwadrateerde stadaardfout va estimatie s V." = y ~}Q p y p miimaal make s y s y β 0 = b 0 = y-b x = y-r xy x β s = b = r xy x s x Maximum Likelihoodmethode de waarde va de parameter met grootste aaemelijkheid die waarde va λ waarva de L het grootst vb. de waarde va λ Poisso) à LX=a I λ= b) etc. Multivariaat idem: L X = a e X = b I λ = c iid: L X = a I λ = c LX = b I λ = c) Keuze va toetsstatistieke: Globale houdbaarheid: Goodess-of-fit va model: ABSOLUTE goodess of fit à Chi-kwadraat berekee Cat. X) O observed freq. = ) E verwachte freq. π " π x vauit model) va laatste + categorie: som va voorgaade) va modelle tov elkaar: RELATIEVE goodess of fit va twee geeste modelle M 0 e M X = O i E i E i Hoe kleier X hoe beter. à likelihoodratio vb.: M 0 : X~N 0, σ " e M : X~N μ ", σ " M 0 : Y p = β Ž + E p e M : Y p = β Ž + β x p + β x p + E p Specifieke hypothese toetse: TB: toetse of bepaalde waarde overeestemt met. X, ζ Y, T Y p. X Y, ζ Y-[, T Y-[ p. S Y, I p.3 r "V met Fz r "V e Fz - p.4 3. Bepale va de steekproeveverdelig va statistieke steekproeveverdelig: π O of φ O va ee statistiek:. verw. waarde ve verdelig zuiverheid). Stadaarddeviatie ve verdelig stadaardfout) 3. Voll. verdelig Methode: Eumeratief: alle mog.steekproeve opschrijve +: π O of φ O v statistiek T bep Voorw. e N klei) Simulatie: Deductief: Exact: ZTW, MTL of ZTL met N E X = μ x σ X = σ X met VESTAC of RAND-fuctie ) M obekede parameters via likeli. + likelihood va de geg. ) M obekede parameters via likeli. + likelihood va de geg. 3) LR=»!!) 4) -llr) L ¼H L ¼ )» H X: steekproefgemiddelde va steekproef ) Da: ZTL Da: Als X ~N μ σ X = σ x E X = μ x, σ x da x σ X = σ x N X~Nμ x, σ x ) ζ X ~N0, ) N Normale verdelig altijd ) Beadered: als X,X,.. iid ~N μ ", σ Y da X~N μ x, σ X e ζ X ~N0, ) hoe meer, hoe meer stad.ormaal voor grote waarde va : X μ X ~N 0, σ X e steekproefgemiddelde va grote steekproeve ) asympt.nverdeeld) X ~Nμ, σ X ) CENTRALE LIMIETSTELLING als X,X,.. iid ~Ber θ da geldt asympt.) X ~N θ, θ-θ) Pearso ~χ i: categorieë k: # obek. Param. E 5 da lim φ = φ χ df\i--k) M M lim φ - ) = lim φ-ª «H = φ r±\²) agaa of waarde bereked met - llr) verdacht is dus: P-lLR) ) volges ~χ TBp.4
4. Parameterschattig Putschattig: zo goed mogelijk de waarde va de parameter ZUIVER? θ is zuiver als E θ = θ e GGF = 0 GGF E θ-θ zo klei mogelijk UMVUE Eigeschap: E θ-θ = σ θ + E θ -θ met θ-θ = θ-e θ + E θ -θ uiform miimale variatie, afwijkig tusse θ e θ altijd beter da elke adere θ E θ-θ E θ * -θ hoe meer aar oeidig, hoe juister, dus fout wordt kleier. G hoe groter, hoe kleier σ Y maar a.s.a. lim σ 0  = 0 e lim EÄθÅ Æ = θ Itervalschattig: gebied waarva verwacht dat parameter eri ligt à betrouwbaarheidsiterval Tmi e Tlmax bepale zodat θ bie de iterval valt, mt ee BI T Çp, T ÇA" α: betrouwbaarheidscoëfficiet) P T mi θ T max = α Stappe: werke met pivotale groothede TB) ) pivotale grootheid truc Fzρ).. e.. omzette + daara Fz - Fz - ÐFzr)Ñ = r, FzÐFz - a)ñ = a, Fz - ÐFzρ)Ñ = ρ ) greze volges verdelig: α e -α e TB. 5. Hypothesetoetsig 3) uitwerke BI Stappe ) H O e H formulere ) T kieze TB p.5-6 3) steekproeveverdelig bepale TB p.5-6 4) T bepale voor D obs 5) p-waarde bepale Soortevoorbeelde Ekelvoudig ~Nμ ", σ " ) H Ó : μ = 0 H : μ, <, > 0 σ " geked T= Y Õ-Ö L ) Éé vs. Tweezijdig ~χ r±\- H Ó : σ " = 5 H : σ " 5 T= I G ) ~Bi, θ) H Ó : θ = 0.5 H : θ 0.5 Chi-kwadraat berekee X ~χ r±\- Samegesteld ~Nμ ", σ " ) H Ó : μ = 0 H : μ, <, > 0 σ " NIET geked T= Y Õ-Ö Ü Û ~t r±\- S Y va ) D ŽC} ) ~Nμ ", σ " ) ~Nμ V, σ V ) H Ó : μ Y = μ [ H : μ Y μ [ σ Y-[ geked vs Niet?TB p.6 ~Berθ ) ~Berθ ) Chi-kwadraat berekee X ~χ r±\- ~Nμ ", σ " )~Nμ V, σ V ) H Ó : σ Y σ [ H : σ Y > σ [ T= G Þ ~F Þ G r±.. TB p.6 als σ Y = σ [ da G Þ G = M : Y p = β Ž + E p M : Y p = β Ž + β x p + β x p + E p TBp.4 eestaart: p=pt ) of PT ) va H ) tweestaart: TD ŽC} )<Me: L kleist: p=*pt TD ŽC} )) TD ŽC} )>Me: R kleist: p=*pt TD ŽC} )) 6) p-waarde vergelijke met α à p α? 7) p < α: tegeevidetie sigificat: H Ó verwerpe p > α: tegeevidetie iet sigificat: H Ó aavaarde Beslissigsfoute H Ó is waar, maar verworpe: Type àkas = α H Ó is vals, maar aavaardt: Type àgreswaarde uit eerdere berekeig e da kas erva, MAAR i ware model T: llr) = l» ~χ» H) r±\- e da geobserveerde T i
Overige ogeorded georded iid: i statistisch oafhakelijk, id idetiek verdeeld zelfde π) waarde tabelleboekje: iet rekee da iterval, wel rekee da dichtste cumulatief rekee. vb. afstad tusse a e b. à Pa<x<b)?=Px<b)-Px<a) Autocorrelatie: Tϖ,ϖ,,ϖ) = r "å " åæh toets va statistische oafhakelijkheid Opl: oafhakelijke koppels x,y) e x,y), maar x e y iet oafhakelijk! Als X, X,, X id zij da is E X = E X = E X = E X eigeschap E S Y = - σ Y e S Y is GEEN zuivere schatter va σ Y Algemee rekeregels to remember a = a = a a - = A - C p\ x p = + + = A C A x p + y p = x p + y p a = a ab = a b a b = a b x = x x als x 0, x als x 0 b è ê = a a = b logaritmes: C log x = a b A = x a = a a x p = a x p p\ a = a a b = a + b ab a + b = a + b + ab a b)a + b) = a b Ekele veelgebruikte BI e α BI 90% α=0.0 mi. 0.050 = -,6449 max. 0,950 =,6449 BI 95% α=0.05 mi. 0.05 = -,9600 max. 0,975 =,9600 BI 99% α=0.0 mi. 0.005 = -,5758 max. 0,995 =,5758 Steekproef Populatie Gemiddelde Verwachte waarde Variatie Stadaard deviatie Z-score Voorspellig Covariatie Correlatie Trasform. Y=aX+b Z-score Somvar. freqx) px) cfreqx) Fx) x ², Pc Pc òò, D D ò, Q Q è Me " = Pc ô = D ô = Q x = x i = freqx p ) x p = p x p x p x p x)=0 Steier: x p c) = x p x) + x c s x = s " = s " = s " Z x x = x i-x x i - x) = s x " å -" å y p ~}Q = b + b x p + b x p s y.x = y i est -y i x i - x = s xy = x i-x)y i -y)= s "" = s " r xy =s ù " ùv) = Z x Z y r "" = fx) = ax + b s ±") = a s " s A"BC V = as "V x + y = x + y s "BV = s " + s V + s "V p x p x p x) b 0 = y-b x b = r xy * s y s x x i y i -xy = s xy s x s y r A"BC V = r xy r xy Zx) = 0 s ùi = Aatal successe Y i herhalige Ber): π kasmassafuctie) voor de proportie [ successe i herh. Als Y~Bi, θ) da μþ = E [ = E Y = θ = σ [ = 0-0 σ Þ < < 3 *-)? - > - > -3 < < è -? > > è a Ç a = a ÇB A ï A = aç- A C a Ç ) = a Ç a b = a b a ï = a Ç = A Kasmassa π " Dichtheid φ " φ " X = P a X x ² Me " μ X = E X = C π x x i *x i i = x - φ " x dx E X μ " = 0 E X c = E X μ " + μ " c σ x = E X-μ x σ " populatie s " steekproef S " steekproefver. σ ", s ", S " : i formule - B = x p μ " π x p = E X μ " σ " = σ " ζ x = X-μ x σ x Y ~}Q p = β + β x p + β x p σ xy = E X-μ x Y-μ y = E XY μ X μ Y σ "" = σ " id: σ "V = 0 ρ xy = σ ζx ζ y = σ xy σ x σ y ρ "" = id: ρ "V = 0 μ [ : E Y = a E X + b σ [ : σ AYBC = a σ Y σ AYBC V = aσ Y[ s "BV ü = s "ü + s Vü r "BV ü = } E X + Y = E X + E Y Iæ ý } Iæ } ý = μ "BV = μ " + μ V ρ AYBC V = ρ Y[ ρ Y[ μ û" = 0 σ û " = σ YB[ = σ Y + σ [ + σ Y[ var. Freqx,y) Rij: : p VZ"\"å y p ) kolom: p "ZV\Vå x p ) yix = x þ e xiy = y þ s VZ"\"å e s "ZV\Vå π ",V x p, y p ) φx, y) σ "BV ü = σ "ü + σ Vü rij: π [ZY\"å y p = F " å,v å kolom: π F " YZ[\Vå x p = F " å,v å å F V å μ YZ[\Vå = E XIY = y p = x p π YZ[\Vå x p σ YZ[\Vå = x p μ YZ[\Vå ) π YZ[\Vå x p = E X IY = y i E XIY = y i id: π x, y = π x π y π [ZY\"å = π V π YZ[\Vå = π "