Stochastische sterftemodellen op basis van mortality improvement factoren

Maat: px
Weergave met pagina beginnen:

Download "Stochastische sterftemodellen op basis van mortality improvement factoren"

Transcriptie

1 Stochastische sterftemodellen op basis van mortality improvement factoren Ryan Tjin ( ) Universiteit van Amsterdam, Faculteit Economie en Bedrijfskunde Bachelorscriptie Actuariële Wetenschappen Begeleider: Prof. dr. ir. M.H. Vellekoop

2 Abstract Sinds de 17 e eeuw is er sprake geweest van een aanzienlijke verbetering in de levensverwachting van de mens, hier lijkt geen eind te komen aan. Inzichten in sterfte zijn van cruciaal belang voor de staat, pensioenfondsen, verzekeraars en financiële instellingen. Daarom worden er al eeuwenlang sterftemodellen gemaakt, waarvan de meeste de de centrale sterftekans proberen te voorspellen. Er zijn een aantal onderzoeken die aan de hand van mortality improvement rates (MIR) bepaalde sterftetrends aantonen. Echter zijn er nauwelijks sterftemodellen die MIR proberen te voorspellen. Dit onderzoek heeft getracht de vraag te beantwoorden of de implementatie van mortality improvement rates leidt tot betere projecties van sterftedata. Om dit te onderzoeken zijn MIR geïmplementeerd in het klassieke Lee- Cartermodel. Het klassieke Lee-Cartermodel en zijn MIR implementatie zijn daarna met elkaar vergeleken door hun toekomstige projecties te vergelijken en backtests uit te voeren. Uit deze vergelijkingen is geen eenduidig antwoord op de onderzoeksvraag gekomen. Wel wordt het klassieke Lee-Cartermodel geprefereerd boven zijn MIR implementatie, omdat er bij het projecteren van MIR voor sommige leeftijden stijgende sterftekansen worden geprojecteerd. 1

3 Inhoud 1. Inleiding Sterftemodellen Het stochastische sterftemodel Mortality rates en mortality improvement rates Het gebruik van mortality improvement rates Onderzoeksopzet Data Het tijdsinterval Het leeftijdsinterval Fitten Het Lee-Cartermodel Het mortality improvement rate model Extrapolatie Resultaten en analyse Data beschouwing Projecties Backtesting Conclusie Appendix A R-implementatie A.1 Data A.2 Fitten van het Lee-Cartermodel A.3 Fitten van het MIR-model

4 A.3 Extrapolatie Appendix B: Backtest parameters Appendix C: Eenjarige sterftekansen 65-jarige mannen en vrouwen Bibliografie

5 1. Inleiding Sinds de 17 e eeuw is de levensverwachting van de mens bijna verdubbeld, vooral in de 20 e eeuw is er sprake geweest van een aanzienlijke verbetering. Volgens Pitacco, Denuit, Haberman en Olivieri (2009) worden de trends van de afgelopen eeuw door alle sterftemodellen onderschat. Daarnaast geven zij aan er nog geen bewijzen zijn waaruit blijkt dat de stijging van de levensverwachting af zal remmen. Deze constante verbetering en het uitblijven van het perfecte sterftemodel, brengt problemen met zich mee op onder andere sociaal, politiek en economisch niveau. Denk hierbij aan de huidige pensioensituatie waarin Nederland zich verkeert. Sterftemodellen zijn al eeuwen in ontwikkeling. Het zijn de modellen waarop sterftetafels worden gebaseerd, deze vormen samen met renteontwikkelingen de basis van de actuariële wetenschap. De eerste producten, die deze wetenschap als grondslag hadden, waren de lijfrenten die aan burgers uitgegeven werden door de overheid in de 17 e eeuw. Deze lijfrenten zijn het onderwerp van één van de eerste boeken die gerekend wordt tot de actuariële wetenschap, namelijk: "Waardije van Lyf-renten naer Proportie van Los-renten" van Johan de Witt uit Hierin beschreef hij hoe de waarde van een lijfrente berekend kan worden aan de hand van een lineair sterftemodel en een constante rente. Tegenwoordig zijn inzichten in sterfte niet alleen van cruciaal belang voor de staat, maar onder andere ook voor pensioenfondsen, verzekeraars en financiële instellingen bij het creëren en onderhouden van hun producten. Als pensioenfondsen bijvoorbeeld een sterftekans hebben berekend die hoger is dan de werkelijke sterftekans, dan zullen ook de werkelijke uitbetalingen hoger zijn dan de verwachte en maakt het fonds verlies. Daarnaast kunnen zij zonder goede sterfteprojecties geen goed beeld vormen van de risico s die zich voordoen. Het projecteren van sterftedata kan op veel verschillende manieren. Eén daarvan is het veel gebruikte generalized linear model (GLM), waarbij leeftijd en tijd covariaten zijn. Daarnaast zijn er de log-bilineaire modellen gebaseerd op het Lee- Cartermodel (Lee en Carter, 1992), waarbij, in tegenstelling tot GLM, alleen tijd een factor is. Op dit model zijn een aantal recente onderzoeken gebaseerd (Renshaw en Haberman, 2003). Een ander model, dat in deze scriptie centraal staat, is het sterftemodel dat gebaseerd is op mortality improvement rates (verder: MIR). Dit 4

6 model is afgeleid van de partiële afgeleide van de logaritmisch sterftekans naar tijd (Haberman en Renshaw, 2011). Het doel van deze scriptie is nieuwe inzichten te verschaffen over dit model en deze te programmeren zodat deze is te vergelijken met andere sterftemodellen. De centrale onderzoeksvraag luidt daarom: leidt de implementatie van mortality improvement factoren tot een betere projectie van sterftedata? Om de onderzoeksvraag te beantwoorden, wordt in hoofdstuk 2 de theorie over het MIR-model besproken. Daarna worden de voor- en nadelen van de implementatie van het model toegelicht. Ook komen de modellen aan bod welke zullen dienen als vergelijkingsmateriaal. Nadat de theorie is besproken, wordt in hoofdstuk 3 de opzet van het onderzoek uitgelegd. Daarna komt het gebruikte model aan bod in hoofdstuk 4 en hoe deze is geprogrammeerd in softwarepakket R. In hoofdstuk 5 worden de bevindingen weergegeven en vergeleken met andere onderzoeken. Uiteindelijk worden daar in hoofdstuk 6 conclusies uit getrokken. 2. Sterftemodellen In dit hoofdstuk worden mortality rates en mortality improvement rates toegelicht. Als eerste wordt besproken wat een stochastisch sterftemodel is. Vervolgens worden de definities voor MR en MIR besproken en wordt er afgesloten met mortality improvement factoren in de praktijk. 2.1 Het stochastische sterftemodel Het sterftemodel op basis van mortality improvement factoren is een stochastisch sterftemodel. De meeste sterftemodellen proberen een uitspraak te doen over de eenjarige sterftekans q! (of een afgeleide daarvan, bijvoorbeeld de centrale sterftekans) met als parameters de leeftijd x en de tijd t (of functies daarvan). Elk van deze modellen bestaat uit een deel met waargenomen sterftefrequenties of -kansen (het verleden) en een deel dat geprojecteerd moet worden (de huidige en toekomstige sterftekansen). De simpelste vorm van een sterftemodel is een extrapolatie met behulp van historische data. Hierbij worden de geobserveerde waarden als harde waarden beschouwd en zijn de geprojecteerde sterftekansen schattingen van deze harde waarden. Het stochastische sterftemodel ziet de historische data niet alleen als waarde, 5

7 maar kent deze een statische waarde toe. Elke geobserveerde waarde wordt gezien als een uitkomst van stochastische variabelen. Deze variabelen stellen samen de historische sterftekans voor. De geprojecteerde sterftekansen zijn daardoor ook uitkomsten van stochastische variabelen. Het voordeel hiervan is dat de uitkomst van het model niet alleen toekomstige sterftekansen geeft maar ook de kans-intervallen behorende bij deze sterftekansen. Doordat de historische data hiermee uitkomsten zijn geworden van willekeurige trekkingen van verscheidene variabelen, moeten er voor deze variabelen wel bepaalde aannames gemaakt worden. Daarnaast moet er een statistische methode worden bepaald welke de geprojecteerde data met de geobserveerde data verbindt (Pitacco et al. 2009). Daarna kan met behulp van de aannames en statistische methode een geschikte projectiemethode gekozen worden. Uiteindelijk wordt er een methode gekozen die de extrapolatie beëindigd. Samenvattend bevat de constructie van een stochastisch sterftemodel de volgende onderdelen welke terugkomen in hoofdstuk 3: 1. Dataselectie 2. Fitten 3. Extrapolatie 2.2 Mortality rates en mortality improvement rates De central rate of mortality (MR), de centrale sterftekans, is het aantal mensen van een bepaalde leeftijd die binnen een jaar sterven gedeeld door de gemiddelde populatie van die leeftijd in dat jaar. m x,t = d x,t e x,t (2.1) Mortality improvement is de vermindering van de centrale sterftekans van een bepaald jaar en het jaar ervoor. Mortality improvement rates worden normaal gesproken gedefinieerd als: z!,! = 1 m!,! /m!,!!! (2.2) De terugkoppeling van MIR en MR naar de eenjarige sterftekans volgt middels de volgende formule: q!,! 1 e!!!,! (2.3) 6

8 2.3 Het gebruik van mortality improvement rates Mortality improvement rates zijn al in een aantal onderzoeken gebruikt. Willets (2004) kijkt met behulp van MIR naar het cohorteffect in het Verenigd Koninkrijk. Het cohorteffect is de benoeming van het fenomeen dat de generatie die geboren is in de U.K. tussen 1925 en 1945 een significant hogere mortality improvement heeft dan de generaties die niet in dat interval zijn geboren. Baxter (2007) onderzoekt of er een minimumwaarde voor MIR te vinden is en wat de gevolgen van dien zijn. MIR wordt ook gebruikt door onder andere Society of Actuaries Group Annuity Valuation Table Task Force (1995) bij de constructie van hun sterftetafel, zij hebben hiervoor gekozen omdat MIR toekomstige verbetering van sterfte toestaat. MIR kent dus al verschillende toepassingen in de praktijk, echter is het modelleren en parametriseren van MIR maar in één artikel onderzocht en beschreven, namelijk Renshaw en Haberman (2011). Daarnaast is MIR nog niet toegepast bij het analyseren van Nederlandse sterftedata. 3. Onderzoeksopzet Om de centrale vraag te beantwoorden worden mortality improvement rates in een bestaand stochastisch sterftemodel geïmplementeerd. Het originele model en het nieuwe model worden vergeleken aan de hand van een aantal criteria en door middel van backtesting. Zodoende wordt er in dit hoofdstuk als eerste de gebruikte data besproken. Daarna wordt besproken hoe deze modellen worden gefit aan deze data en hoe zij worden geprojecteerd. 3.1 Data MR en MIR hebben als afhankelijke variabele de centrale sterftekans of een afgeleide daarvan, deze hangt af van het aantal doden en de exposure (formule 2.1). Daarom wordt er een dataset gebruikt die beide variabelen bevat. De gebruikte data betreft Nederlandse sterftedata voor mannen tot en met 2009, afkomstig uit de database van de Human Mortality Database (HMD), dit is een organisatie die populatiedata verzamelt van overheden en andere instanties. Voordat de data kan worden gebruikt, wordt er een selectie gemaakt van de en de leeftijden waarover wordt gemodelleerd. 7

9 3.1.1 Het tijdsinterval Het tijdsinterval dat wordt gebruikt om de modellen te fitten is van groot belang, voor zowel het voorspellen van toekomstige sterftedata als het backtesten van de gekozen modellen. Er is gekozen om de data van de 1900 tot 1950 buitenbeschouwing te laten, omdat de datakwaliteit niet ideaal is, de trend stabieler is in de na 1950 en om medische redenen. Tot ongeveer 1950 waren infectieziektes de hoofddoodsoorzaak, daarna zijn deze zo goed als verdwenen en werden kanker en hartkwalen de hoofddoodsoorzaken. Door de data uit deze periode niet mee te nemen in de berekeningen wordt het effect van de infectieziektes niet of nauwelijks meegenomen in de extrapolatie. De meeste onderzoeken zijn het eens met bovenstaande bewering, echter bestaat er geen uitsluitsel over welk interval er precies gebruikt moet worden. Baran en Pap (2007) zagen in hun onderzoek dat de dataset van 1989 tot 2003 verlaagde sterftekansen voorspelde, terwijl die op basis van de data van 1949 tot 2003 een verhoogde sterftekans voorspelde. Er zijn twee methodes bekend die assisteren in het kiezen van een juiste fit-periode, die van Denuit en Goderniaux (2005) en die van Booth et al. (2002). De eerste methode selecteert het interval waarop de κ! het beste benaderd wordt met een rechte lijn. Dit komt neer op het maximaliseren van de voorspellingswaarde R 2 van de lineaire regressie van κ!. De tweede methode minimaliseert de ratio tussen de gemiddelde afwijking van het model en de lineaire fit. Echter worden de bovenstaande methoden niet gebruikt in deze scriptie. Het vinden van de juiste kalibratieperiode is voor toekomstige projecties van zeer groot belang, maar voor het vergelijken van de modellen zal dit een minder grote rol spelen. Om een ruwe schatting te verkrijgen van een goede kalibratieperiode is er gekeken naar de vorm van de grafiek van de Nederlandse sterftekans voor mannen door de heen. De methodes van Denuit en Goderniaux (2005) en Booth et al. (2002) zijn beide opzoek naar een periode waarbij er een lineair tijdseffect optreedt, dit is ongeveer het geval vanaf Vanaf 1970 ziet men een daling in de sterftekansen van de Nederlandse mannen, daarom is ook alle data tot 1970 buitenbeschouwing gelaten. Het verloop van deze sterftekansen is te zien in Appendix C. 8

10 3.2.2 Het leeftijdsinterval Ook is het gebruik van alle leeftijden in de berekeningen niet ideaal, daarom is er gekozen om bepaalde leeftijden niet mee te nemen in het model. De groep mensen van 0 tot 20 jaar oud zijn uitgesloten, omdat hun sterftekans heel anders is dan voor andere leeftijden. Denk hierbij bijvoorbeeld aan de sterftekans van net geboren baby s of de verhoogde kans op ongelukken in de tiener. Voor mensen van 90 jaar en ouder is er vaak weinig data verkrijgbaar, als er niet voldoende data beschikbaar is kan dat leiden tot verkeerde resultaten. Als er bijvoorbeeld nog één persoon is van 105 jaar en hij of zij sterft in dat jaar, dan resulteert dat in een sterftekans van 100% voor een persoon van 105 jaar terwijl de werkelijke sterftekans dat natuurlijk niet hoeft te zijn. Bovenstaande redenen leiden tot het gebruik van data voor de leeftijden 20 tot en met 89 jaar. 3.2 Fitten De modellen op basis van MIR kunnen gemaakt worden met behulp van dezelfde methodieken als van MR. Voor het schatten van MR zijn er al veel modellen bedacht, een groot aantal hiervan zijn gebaseerd op het Lee-Cartermodel (LC). Het LC-model wordt gebruikt als basis voor het MIR-model en als vergelijking voor de resultaten. Hier is voor gekozen, omdat het LC-model volgens Gregorkiewicz en Plat (2006) en Cairns et al. (2009) beschikt over een aantal gunstige eigenschappen: het model is praktisch, makkelijk te implementeren, heeft weinig parameters en is algemeen geaccepteerd Het Lee-Cartermodel Het Lee-Cartermodel heeft de volgende vergelijking: ln( m!,! ) = α! + β! κ! + ε!,! (3.1) Hier wordt de logaritme van de centrale sterftekans gemodelleerd aan de hand van: α!, de gemiddelde geobserveerde ln m!,! per leeftijd x. β!, het leeftijdseffect. κ!, het tijdseffect. ε!,! de errorterm. 9

11 Het model kan niet met een standaardregressie geschat worden, want de alpha, bèta, kappa en de storingsterm zijn geen waargenomen waarden. Zij moeten eerst geschat worden aan de hand van de historische data. Voor het fitten van het Lee-Cartermodel aan de historische data wordt de Ordinary Least Squares (OLS) methode gebruikt. De OLS-methode vindt de waarden van alpha, bèta en kappa door de kwadratensom van het model te minimaliseren welke gegeven is door de volgende formule:!,! ln (μ! (t) α! β! κ(t))! (3.2) β! en κ! worden gevonden door middel van de Single Value Decomposition van de matrix ln µ x (t) α : ln μ! (t) α! = UDV! S is een matrix waarvan de kolommen de linker singular value vectoren zijn. U is een matrix met op de diagonaal de singular values. V! is de transpose van de matrix waarvan de kolommen de rechter singular value vectoren zijn. β! en κ! worden berekend met de uitkomsten van de Single Value Decomposition: β! =![!,!], de genormaliseerde eerste linker singular value vector.![!,!] κ! = V i, 1 U i, 1 D[1,1], de eerste rechter singular value maal de som van de eerste linker singular value maal de eerste singular value. Lee en Carter (1992) stellen voor om de κ! aan te passen naar het aantal doden en exposure, door de gevonden alpha en bèta in te vullen in de formule voor de centrale sterftekans (2.1) en vervolgens op te lossen naar κ! : x d x,t = e x,t e α x +β x κ t (3.3) Deze stap wordt achterwege gelaten ter simplificatie van het model Het mortality improvement rate model x In deze scriptie wordt gebruikgemaakt van geschaalde mortality improvement rates, omdat er in de oorspronkelijke definitie van MIR (2.2) een verschil zit tussen de tijd 10

12 van de teller en de noemer. De geschaalde versie uit Haberman en Renshaw (2011) heeft dat niet. Vanaf hier is MIR als volgt gedefinieerd: ( ) ( ) z x,t = 2 1 ˆm x,t / ˆm x,t 1 1+ ˆm x,t / ˆm x,t 1 (3.5) Dit resulteert in de volgende formule voor de geschatte MIR: z!,! = β! κ! (3.6) Als de centrale sterftekans groter wordt is z x,t negatief en als de centrale sterftekans kleiner wordt is positief. wordt gemodelleerd als de uitkomst van een random normaal verdeelde variabele. Vervolgens wordt deze net als het Lee-Cartermodel op twee verschillende manieren gefit met de historische data. De OLS-methode neemt aan dat MIR normaal verdeeld is: Z (x,t ) N ( η x,t,σ 2 ) Dan wordt er gefit door de kwadratensom te minimaliseren, dit komt neer op een sum of squared errors:!,!(z! (t) β! κ(t))! (3.7) β! en κ! worden gevonden door middel van de Single Value Decomposition van de matrix z! (t): z! (t) = UDV! β! =![!,!], de genormaliseerde eerste linker singular value vector.![!,!] κ! = V i, 1 U i, 1 D[1,1], de eerste rechter singular value maal de som van de eerste linker singular value maal de eerste singular value. 3.3 Extrapolatie z x,t z x,t Nadat de modellen gefit zijn aan de historische waarden wordt kappa gemodelleerd als een tijdreeks. Dit wordt gedaan met behulp van de standaard Box- Jenkinstechnieken. Dit komt neer op het fitten van een geschikt Autoregressief Geïntegreerd Bewegend Gemiddelde-tijdreeks (ARIMA) aan de verkregen waarden 11

13 van kappa. Het ARIMA(p,d,q) model beschrijft het verloop van de kappa tijdreeks aan de hand van zijn historie en schokken in de tijd. Het kiezen van de ARIMA parameters p, d en q wordt normaalgesproken gedaan met behulp van de autocorrelatie plots van de jaarlijkse verschillen van kappa. Bij elke projectie met een andere kalibratieperiode of leeftijdsinterval, moet er opnieuw een ARIMA model worden gefit. Verschillende kalibratieperioden of leeftijden leveren andere kappa s op en is er wellicht een ARIMA model, met andere parameters, die beter fit. Omdat dit een complex proces is, worden er in dit onderzoek functies gebruikt in het softwarepakket R die automatisch de parameters berekenen. Hoe dit exact gedaan wordt staat in appendix A sectie 3. Als er een geschikt ARIMA model is gevonden, worden er toekomstige kappa s geprojecteerd. De geprojecteerde waarden voor de logaritme van de mortality rates kunnen vervolgens worden berekend door de gefitte alpha en bèta uit sectie en de nieuwe kappa s in te vullen in formule 3.1. De geprojecteerde mortality improvement rates worden berekend door de bèta s uit sectie en de geprojecteerde kappa s in te vullen in formule Resultaten en analyse In dit hoofdstuk staan de resultaten van de in het vorige hoofdstuk genoemde onderzoeksmethode. Als eerste wordt de input data bekeken, vervolgens worden toekomstige projecties gemaakt en tot slot wordt er een backtest uitgevoerd. 4.1 Data beschouwing Zoals eerder genoemd wordt er gewerkt met sterftedata van Nederlandse mannen van 1970 tot en met In figuur 4.1 zijn de mortality improvement rates geplot voor de leeftijden 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80 en 85 tegenover de tijd. In de figuren zijn ook de gemiddelde mortality improvement rates per leeftijd geplot (de gestippelde grijze lijn). Als men plots bekijkt ziet men voornamelijk horizontale trends in de grafieken. In de één na laatste grafiek is ook de gemiddelde MIR geplot per leeftijd en ziet men een hogere gemiddelde MIR voor de leeftijden rond de 60. In de laatste grafiek is de standaardafwijking van geplot voor alle leeftijden, deze lijkt aftenemen tot leeftijd

14 Figuur 4.1 MIR, gemiddelde MIR en standaardafwijking MIR per leeftijd gem std leeftijden leeftijden In Figuur 4.2 zijn de mortality improvement rates geplot voor mensen met geboortedatum 1910, 1915, 1920, 1925, 1930, 1935, 1940, 1945, 1950, 1955, 1960 en 1965 tegenover de tijd. Hier ziet men dat de MIR bekeken vanuit cohorten met dezelfde geboortedatum ook voornamelijk horizontale trends vertonen. Daarnaast valt direct op dat voor het cohort met geboorte jaar 1920 negatieve MIR hebben voor bijna alle tussen 1970 en Daarnaast lijken de cohorten met een eerder geboortejaar minder spreiding te vertonen dan de cohorten met een later geboortejaar. 13

15 Figuur 4.2 MIR voor vaste geboorte Projecties De projecties voor toekomstige sterftekansen hebben de kalibratieperiode 1970 tot en met De gefitte parameters zijn geïllustreerd in figuur 4.3 voor zowel MR als MIR. Bij het klassieke Lee-Cartermodel zien de parameters eruit zoals verwacht. Bij het MIR-model ziet men een zwakke positieve trend in de kappa en de bèta. Dit duidt op een verbetering van sterfte door de heen en een sterkere verbetering voor oudere personen. 14

16 Figuur 4.3 Parameter plots voor Mortality Rates en Mortality Improvement Rates MR (LC) - Kappa MR (LC) - Beta MR (LC) - Alpha k(t) b(x) a(x) leeftijd leeftijd MIR - Kappa MIR - Beta k(t) b(x) leeftijd Voor beide modellen zijn de som van de gekwadrateerde errors berekend. Bij het LC-model is dit gedaan door het kwadraat te nemen van de geobserveerde mtx minus de gefitte waarden, bij MIR werd hetzelfde gedaan voor. Dit kwam uit op bij het LC-model en bij het MIR-model. Daarnaast zijn de gestandaardiseerde errors geplot in figuur 4.4. Deze zijn verkregen door van elke Figuur 4.4 Gestandaardiseerde errors geplot voor LC en MIR 15

17 error de gemiddelde error af te trekken en te delen door de standaard afwijking van de errors. Bij de errors in het LC-model ziet men dat de errors een kleine spreiding hebben bij hogere leeftijd, dit komt in mindere mate terug bij het MIR-model. Dit is consistent met wat er eerder te zien viel in de MIR plots in figuur 4.1. Zoals beschreven in het onderzoeksopzet zijn de kappa s van beide modellen geprojecteerd over 20 jaar middels ARIMA en ARMA tijdreeksen. Het klassieke LCmodel is geschat met een ARIMA(0,2,2) serie en het MIR-model is geschat met een ARIMA(1,0,0) serie (equivalent aan de ARMA(1) tijdreeks). De geautomatiseerde schattingen van de parameters voor de tijdreeksen staan in tabel 1 en de projecties in figuur 4.5. Voordat de mortality improvement rates vergeleken kunnen worden met de mortality rates, moeten zij eerst omgeschreven worden. De MIR zijn omgeschreven naar centrale sterftekansen met de inverse formule 3.5 en vervolgens worden deze en de geprojecteerde MR naar eenjarige sterftekansen herschreven met formule 2.3. Tabel 1 Tijdreeks coëfficiënten MR (LC) - ARIMA(0,2,2) MIR - ARIMA(1,0,0) with non- zero mean Coefficients: Coefficients: ma1 ma2 ar1 intercept s.e s.e sigma^2 estimated as 1.472: sigma^2 estimated as 4.102: log likelihood= log likelihood= AIC AIC AICc AICc BIC BIC

18 Figuur 4.5 Projectie van kappa voor MR en MIR met 80% en 95% betrouwbaarheidsinterval MR (LC) Kappa projectie met ARIMA(0,2,2) MIR Kappa projectie met ARIMA(1,0,0) Figuur 4.6 Projecties van, kalibratieperiode met MR blauw en MIR - rood e+00 6e

19 In figuur 4.6 staan de waargenomen eenjarige sterftekansen tot 2009, de projecties van MR en de projecties van MIR geplot voor een aantal leeftijden. Hier is te zien dat MIR over het algemeen hogere sterftekansen voorspelt in vergelijking met het LCmodel. Als er gekeken wordt naar het eindpunt van de projecties, dan voorspelt MIR een hogere sterftekans voor de leeftijden: 30, 47, 56, 57, 59 tot en met 89. Ook is het merkwaardig te noemen dat er MIR projecties zijn waarbij de geprojecteerde eenjarige sterftekansen een stijgende trend vertonen (figuur 4.1 leeftijd 20 en 35). Dit is tegenstrijdig met de verwachting dat de sterftekansen blijven dalen met de tijd. Hoewel een stijgende sterftekans niet heel waarschijnlijk is, kan hier niet over geoordeeld worden. De daadwerkelijke sterftekansen zijn immers nog niet bekend. 4.3 Backtesting Om eventueel uitsluitsel te geven over de voorspellende waarde van beide modellen, is er een backtest gedaan. De backtest heeft kalibratieperiode met projecties van Het LC-model is geprojecteerd met een ARIMA(3,1,0) tijdreeks met drift en het MIR-model is geprojecteerd met een ARIMA(3,0,0) tijdreeks. De parameter waarden staan in Appendix B. De projecties bij de backtest zijn net als de projecties uit sectie 4.2 sterk uiteenlopend. Om dit te illustreren staan in figuur 4.7 de MR en MIR projecties geplot tegenover de geobserveerde waarden voor leeftijden 40 en 80. Hier is duidelijk te zien dat de projectie voor leeftijd 40 van het MR-model beter is dan de projectie van het MIR- model en de projectie voor leeftijd 80 van het MIR-model beter is dan het MR-model. Ook ziet men de stijgende Figuur 4.7 Backtest projecties leeftijd 40 en 80. MR - blauw, MIR rood

20 sterftekans terugkomen, welke gezien zijn in sectie 4.2, voor de leeftijden 20, 21, 22, 31, 32, 35, 41, 43, 49,,57, 58, 59, 65, 67, 78 en 86. Dit fenomeen is geïllustreerd in figuur 4.8. Waar er bij de toekomstige projecties geen uitspraak gedaan kon worden over de juistheid van deze projecties, kan dat bij backtesting wel. In figuur 4.8 is voor elk van deze leeftijden duidelijk te zien dat er een neerwaartse trend is van de eenjarige sterftekansen, in tegenstelling tot wat de MIR-projecties zeggen. Bij het MR-model is er geen sprake van projecties met een stijgende sterftekans. Figuur 4.8 plots voor leeftijden waarbij het MIR-model stijgende sterftekansen voorspelt Naast de grafische vergelijking van de modellen wordt er gekeken naar de sum of squared errors van beide modellen. De uitkomsten zijn te vinden in tabel 2. De leeftijden met stijgende sterftekansen hebben een hogere SSE dan hun MR tegenhanger. Ook ziet men een stijging in de sum of squared errors naarmate de 19

21 Tabel 2 Sum of squared errors van de backtest Backtest met kalibratieperiode en projectieperiode Totale sse LC Totale sse MIR x sse LC sse MIR LC<MIR x sse LC sse MIR LC<MIR E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E

22 leeftijd hoger wordt. De SSE over alle leeftijden is voor het LC-model kleiner dan het MIR-model. Ook ziet men dat de SSE bij 48 van de 70 leeftijden kleiner is bij het klassieke Lee-Cartermodel. Daarnaast ziet men dat het MIR-model beter presteert bij leeftijden boven de 75, dit zou samen kunnen hangen met het feit dat er minder spreiding zit in de MIR voor hogere leeftijden (figuur 4.1) en het MIR-model dan wellicht beter fungeert. Als men kijkt naar de sum of squared errors per jaar ziet men dat deze met de tijd toeneemt bij beide modellen (figuur 4.9). Daarnaast is de SSE voor de modellen de eerste 6 jaar ongeveer gelijk, maar daarna is de SSE voor het MIR-model op 1 jaar na altijd hoger dan die van het MR-model. Figuur 4.9 Sum of squared errors van de backtest tegenover. SSE per jaar voor MR (blauw) en MIR (rood) SSE jaar Het vergelijken van de projecties van beide modellen middels backtesting geeft geen eenduidig antwoord op de vraag of de projecties van het Lee-Cartermodel met implementatie van MIR beter zijn dan die van het gewone Lee-Cartermodel. 5 Conclusie Dit onderzoek heeft getracht de vraag te beantwoorden of de implementatie van mortality improvement rates leidt tot betere projecties van sterftedata. Om dit te testen zijn geschaalde mortality improvement rates geïmplementeerd in het klassieke Lee- Carter model. Dit houdt in dat de tijds- en leeftijdseffecten, kappa en bèta, gefit zijn middels de Single Value Decomposition methode. Nadat de modellen gefit zijn, worden deze geprojecteerd met ARIMA tijdreeksen en uiteindelijk weer herschreven naar eenjarige sterftekansen. Het klassieke Lee-Cartermodel (MR-model) en het MIR- 21

23 model zijn vergeleken aan de hand van hun toekomstige projecties en middels backtesting. Bij het evalueren van de gefitte waarden van de mortality improvement rates lieten de standardized residuals geen abnormale dingen zien welke zouden kunnen duiden op een foutief model. Bij de toekomstige projecties kwam naar voren dat de MIR-projecties voor sommige leeftijden sterk verschillen met de MR-projecties. Ook zijn er projecties geconstateerd met toenemende eenjarige sterftekansen, welke tegen algemene verwachting ingaan. Het backtesten van het MIR-model is gedaan door te fitten over periode en te projecteren over periode Hier zag men eveneens uiteenlopende projecties en projecties waarbij het MIR-model stijgende sterftekans projecteert (waar de waargenomen waarden dalende sterftekansen lieten zien). Het vergelijken van de sum of squared errors van de modellen gaf geen uitsluitsel of de MIR-implementatie beter werkt dan de klassieke Lee-Cartermethode. Na het projecteren en backtesten van beide modellen kan er geen eenduidig antwoord gegeven worden of de implementatie van mortality improvement rates leidt tot betere projecties van sterftedata, omdat het MIR-model voor bepaalde leeftijden beter presteert dan het MR-model. Echter wordt het klassieke Lee-Cartermodel wel geprefereerd boven het MIR-model, omdat het MIR-model voor sommige leeftijden stijgende sterftekansen voorspelt. Of dit ook geldt voor andere sterftemodellen is een onderwerp voor vervolgonderzoek. 22

24 Appendix A R-implementatie De in hoofdstuk 3 gedefinieerde modellen en extrapolatiemethodes zijn geprogrammeerd in R, in deze appendix staat de belangrijkste gebruikte R-code met uitleg. A.1 Data De sterftedata van de Nederlandse mannen zijn afkomstig van de Human Mortality Database ( hier zijn de exposures en dodenaantallen te downloaden in.txt files welke geïmporteerd kunnen worden in R. A.2 Fitten van het Lee-Cartermodel Voor het fitten van het model aan de historische data definiëren we in R een nieuwe functie genaamd fitlc met als input de leeftijden, de, de bijbehorende exposures en het aantal doden. In deze functie worden de inputs gebruikt om alpha, bèta en kappa te berekenen aan de hand van de formules in hoofdstuk Als eerste worden de centrale sterftekans matrix en de logaritme ervan geconstrueerd met: mtxm=dtx/etx logmtxm=log(mtxm) Daarna worden de dimensies van de matrix opgeslagen in m en n: n=length(xv) m=length(yv) De berekening van alpha volgt door de vector alpha eerst aan te maken en van elke kolom de gemiddeldes van de logmtx matrix te nemen. alphav=array(0,n) for(j in 1:n){ alphav[j]=sum(logmtxm[,j])/m } Daarna wordt de matrix ln µ x (t) α aangemaakt en geconstrueerd. Vervolgens wordt hiervan de SVD berekend. logmtxminalpha=matrix(0,m,n) for(j in 1:n){ logmtxminalpha[,j]=logmtxm[,j]-alphav[j] } svdm=svd(t(logmtxminalpha),m,n) 23

25 Eerst worden de bèta en kappa vectoren aangemaakt en vervolgens worden de uitkomst van de SVD gebruikt zoals gezegd is in hoofdstuk om de waarden van bèta en kappa te berekenen. betav=array(0,n) betav=svdm$u[,1]/sum(svdm$u[,1]) kappav=array(0,m) kappav=svdm$v[,1]*sum(svdm$u[,1])*svdm$d[1] De gevonden alpha, beta, kappa, mtx-matrix en log(mtx)-matrix worden als output gegeven van de fitlc functie. A.3 Fitten van het MIR-model Het mortality improvement rate model is geprogrammeerd in de functie fitmir met als inputs de leeftijden, de, de exposures en het aantal doden. Als eerste worden de matrix met de centrale sterftekansen geconstrueerd en met formule 3.5 worden de mortality improvement rates uitgerekend, waarbij de MIR voor het eerste jaar gelijk worden gesteld aan 0. mtxm=dtx/etx qtx=1-exp(-mtxm) n=length(xv) m=length(yv) m=matrix(0,m,n) for(j in 1:n) { m[1,j]=0 for(i in 2:m){ m[i,j]=2*(1-mtxm[i,j]/mtxm[i1,j]) /(1+mtxm[i,1]/mtxm[i-1,j]) } } Hierna wordt de SVD berekend over deze matrix en worden de uitkomsten gebruikt om beta en kappa te berekenen: svdm=svd(t(m),m,n) betav=array(0,n) 24

26 betav=svdm$u[,1]/sum(svdm$u[,1]) kappav=array(0,m) kappav=svdm$v[,1]*sum(svdm$u[,1])*svdm$d[1] De gevonden alpha, bèta, kappa, mtx-matrix en -matrix worden als output gegeven van de fitmir functie. A.3 Extrapolatie Het extrapoleren met behulp van ARIMA tijdreeksen wordt gedaan met behulp van het forecast pakket. Deze moet eerst worden geladen (mits hij geïnstalleerd is) voordat hij gebruikt kan worden in R. > library(forecast) Extrapolatie in R wordt uitgelegd aan de hand van de code voor de functie fcmir de functie die projecties maakt voor mortality improvement rates. De projecties voor Lee-Carter volgen dezelfde methodologie. Deze functie heeft als input het gefitte MIR-model heeft en het aantal waarover men wilt projecteren. De functie slaat eerst het gefitte object op onder mirfit en bepaald hiervan de lengte van het gefitte interval en het aantal leeftijden. fcmir=function(mir,jaar){ mirfit=mir yr=jaar n=length(mirfit$x) m=length(mirfit$y) Vervolgens worden de ARIMA parameters bepaald van de gefitte kappa en wordt er een projectie gedaan met deze parameters. Dit gebeurd volgens de functies auto.arima en forecast.arima, afkomstig uit het forecast pakket. kappav.fit<-auto.arima(mirfit$kappa) kappav.pred<-forecast.arima(kappav.fit,h=yr) De geprojecteerde mortality improvement rates worden berekend door deze te vermenigvuldigen met de geschatet bèta s deze worden in de matrix fcm gestopt. 25

27 fcm=matrix(0,yr,n) for(j in 1:n){ for(i in 1:yr){ fcm[i,j]=mirfit$beta[j]*kappav.pred$mean[i] } } Deze matrix wordt herschreven naar mortality rates middels de inverse van formule 3.5 en wordt fcmtxm genoemd. De fcmtxm matrix wordt op zijn beurt omgeschreven naar eenjarige sterftekansen met formule 2.3 en opgeslagen in matrix fcqm fcmtxm=matrix(0,jaar,n) for(j in 1:n){ fcmtxm[1,j]=mirfit$mtx[m,j]*(2- fcm[1,j])/(2+fcm[1,j]) } for(j in 1:n){ for(i in 2:jaar){ fcmtxm[i,j]=fcmtxm[(i-1),j]*(2- fcm[i,j])/(2+fcm[i,j]) } } fcqm=1-exp(-fcmtxm) De functie geeft als output de projecteerde, mtx en matrix. Ook geeft de functie de ARIMA parameters en voorspellingen als output. Appendix B: Backtest parameters Tabel B.1 Kappa projectie van de backtest LC Kappa projectie met ARIMA(3,1,0) MIR Kappa projectie met ARIMA(3,0,0)

28 Tabel B.2 ARIMA parameters van de backtest MR (LC) - ARIMA(3,1,0) met drift MIR - ARIMA(3,0,0) with non- zero mean Coefficients: Coefficients: ar1 ar2 ar3 drift ar1 ar2 ar3 intercept s.e s.e sigma^2 estimated as : sigma^2 estimated as 1.173: log likelihood= log likelihood= AIC 55.8 AIC AICc AICc BIC BIC Appendix C: Eenjarige sterftekansen 65-jarige mannen en vrouwen. In onderstaand figuur zijn de eenjarige sterftekansen van 65 jarige mannen weergeven met de blauwe lijn en de eenjarige sterftekansen van 65 jarige vrouwen met de rode lijn. 27

29 Bibliografie Baxter, S.D. (2007). Should projections of mortality improvements be subject to a minimum value? British Actuarial Journal (13), Booth, H., Maindonald, J., and Smith, L. (2002). Applying Lee Carter under conditions of variable mortality decline. Population Studies (56), Brouhns, N., Denuit, M., Vermunt, J.K. (2002). A Poisson log-bilinear regression approach to the construction of projected life-tables. Insurance: Mathematics & Economics (31), Cairns, A.J.G., Blake, D., Dowd, K., Coughlan, G., Epstein, D., Ong, A., Balevich, I. (2009). A quantitative comparison of stochastic mortality models using data from England & Wales and the United States. North American Actuarial Journal (13-1), Denuit, M., and Goderniaux, A.C. (2005). Closing and projecting life tables using log-linear models. Bulletin of the Swiss Association of Actuaries (1), Gregorkiewicz F., Plat R. (2006). Stochastische prognosemodellen voor sterfte. De actuaris (juli), Haberman S., Renshaw A. (2011), Parametric mortality improvement rate modelling and projecting. Insurance: Mathematics and Economics (50), Lee, R.D., Carter, L. (1992). Modeling and forecasting the time series of US mortality. Journal of the American Statistical Association (87), Pitacco, E., Denuit, M., Haberman, S., Olivieri, A.M. (2009). Modeling Longevity Dynamics for Pensions and Annuity Business. Oxford, Oxford University Press. Renshaw, A.E., Haberman, S. (2003). Lee Carter mortality forecasting with age specific enhancement. Insurance: Mathematics & Economics (33), Society of Actuaries Group Annuity Valuation Table Task Force, (1995) group annuity mortality table and 1994 group annuity reserving table. Transactions of the Society of Actuaries (47), Willets, R.C. (2004). The cohort effect: insights and explanations. British Actuarial Journal (10),

Single and Multi-Population Mortality Models for Dutch Data

Single and Multi-Population Mortality Models for Dutch Data Single and Multi-Population Mortality Models for Dutch Data Wilbert Ouburg Universiteit van Amsterdam 7 Juni 2013 Eerste begeleider: dr. K. Antonio Tweede begeleider: prof. dr. M. Vellekoop Wilbert Ouburg

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

PE Bijeenkomst Prognosetafel AG2016

PE Bijeenkomst Prognosetafel AG2016 PE Bijeenkomst Prognosetafel AG2016 1 Inhoud 1. Datasets en Databewerking 2. Modelstructuur en eigenschappen 3. Correlaties 4. Vergelijking met AG2014 5. Gebruik: als (best estimate) statische prognosetafel

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan

Nadere informatie

Commissie Sterfte Onderzoek

Commissie Sterfte Onderzoek Prof.dr.ir. M.H. Vellekoop Drs. E.B.B. Kromme AAG Inhoud 1. Achtergrond: opdracht CSO en Werkgroep 2. Modelstructuur en eigenschappen 3. Gebruik: als (best estimate) statische prognosetafel als stochastische

Nadere informatie

Coherente prognose van levensverwachting in Nederland en andere Europese landen de Li&Lee benadering

Coherente prognose van levensverwachting in Nederland en andere Europese landen de Li&Lee benadering Coherente prognose van levensverwachting in Nederland en andere Europese landen de Li&Lee benadering 1 Leo van Wissen & Fanny Janssen Basiseenheid Demografie / Population Research Centre 2 Onderwerpen

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA Masterclass: advanced statistics Bianca de Greef Sander van Kuijk Afdeling KEMTA Inhoud Masterclass Deel 1 (theorie): Achtergrond regressie Deel 2 (voorbeeld): Keuzes Output Model Model Dependent variable

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Actuarieel Genootschap BIJLAGE. bij Prognosetafel AG

Actuarieel Genootschap BIJLAGE. bij Prognosetafel AG Actuarieel Genootschap BIJLAGE bij Prognosetafel AG2012-2062 BIJLAGE Sluiten van de periodetafel GBM/V 2005-2010. Katrien Antonio 23 juli 2012 1 Probleemstelling Sluiten van een periodetafel. De waargenomen

Nadere informatie

Prognosetafel AG2016 1

Prognosetafel AG2016 1 1 Agenda 15.00 15.20 uur Inleiding Prognosetafel AG2016 15.20 16.00 uur Technische toelichting Prognosetafel AG2016 16.00 16.30 uur Vragen 16.30 16.35 uur Uitreiking rapport 16.35 17.00 uur Pauze 17.00

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

Vragen en antwoorden inzake totstandkoming prognosetafel AG2016

Vragen en antwoorden inzake totstandkoming prognosetafel AG2016 Vragen en antwoorden inzake totstandkoming prognosetafel AG2016 Inleiding. Het Koninklijk Actuarieel Genootschap (AG) heeft in september 2016 een nieuwe prognosetafel AG 2016 uitgebracht. Dit is van belang

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

Tentamen Biostatistiek 3 / Biomedische wiskunde

Tentamen Biostatistiek 3 / Biomedische wiskunde Tentamen Biostatistiek 3 / Biomedische wiskunde 25 maart 2014; 12:00-14:00 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau. Het

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

Het blijkt dat dit eigenlijk alleen lukt met de exponentiële methode.

Het blijkt dat dit eigenlijk alleen lukt met de exponentiële methode. Verificatie Shen en Carpenter RDEC methodiek voor de karakterisering van asfaltvermoeiing; vergelijking van verschillende methoden voor het berekenen van de parameters. Jan Telman, Q-Consult Bedrijfskundig

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

Hoofdstuk 8: Multipele regressie Vragen

Hoofdstuk 8: Multipele regressie Vragen Hoofdstuk 8: Multipele regressie Vragen 1. Wat is het verschil tussen de pearson correlatie en de multipele correlatie R? 2. Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 30 januari 2009 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 2 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

Hertentamen Voortgezette biostatistiek / Biomedische wiskunde

Hertentamen Voortgezette biostatistiek / Biomedische wiskunde Hertentamen Voortgezette biostatistiek / Biomedische wiskunde 1 juni 2016; 18:30-20:30 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau.

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

laboratory for industrial mathematics eindhoven Endinet Regressie-analyse Energiekamer

laboratory for industrial mathematics eindhoven Endinet Regressie-analyse Energiekamer Endinet Regressie-analyse Energiekamer Laboratory for Industrial Mathematics Eindhoven Postbus 513 5600 MB Eindhoven tel.: 040 247 4875 fax: 040 244 2489 e-mail: lime@tue.nl WWW: http://www.lime.tue.nl

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek cursus 23 mei 2012 werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen onderzoek streeft naar inzicht in relatie tussen variabelen bv. tussen onafhankelijke

Nadere informatie

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 13. Factor ANOVA De theorie achter factor ANOVA (tussengroep) Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 1. Onafhankelijke

Nadere informatie

Hertentamen Biostatistiek 3 / Biomedische wiskunde

Hertentamen Biostatistiek 3 / Biomedische wiskunde Hertentamen Biostatistiek 3 / Biomedische wiskunde 2 juni 2014; 18:30-20:30 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau. Het

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. 1. (a) In de appendix van deze vraag, is een dataset gegeven met de corresponderende

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

3.2 Vectoren and matrices

3.2 Vectoren and matrices we c = 6 c 2 = 62966 c 3 = 32447966 c 4 = 72966 c 5 = 2632833 c 6 = 4947966 Sectie 32 VECTOREN AND MATRICES Maar het is a priori helemaal niet zeker dat het stelsel vergelijkingen dat opgelost moet worden,

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2S390) op maandag 19-11-2001, 14.00-17.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte

Nadere informatie

1. Orthogonale Hyperbolen

1. Orthogonale Hyperbolen . Orthogonale Hyperbolen a + b In dit hoofdstuk wordt de grafiek van functies van de vorm y besproken. Functies c + d van deze vorm noemen we gebroken lineaire functies. De grafieken van dit soort functies

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Prognosetafel AG2018 1

Prognosetafel AG2018 1 1 Welkom Corné van Iersel Sr beleidsmedewerker AG 2 AGENDA 14.30-15.00 uur Ontvangst 15.00-15.10 uur Opening 15.10-15.30 uur Presentatie totstandkoming AG2018 15.30-16.15 uur Presentatie technische onderbouwing

Nadere informatie

VU University Amsterdam 2018, Maart 27

VU University Amsterdam 2018, Maart 27 Department of Mathematics Exam: Voortgezette biostatistiek VU University Amsterdam 2018, Maart 27 c Dept. of Mathematics, VU University Amsterdam NB. Geef een duidelijke toelichting bij de antwoorden.

Nadere informatie

Netto hypotheekschuld positie

Netto hypotheekschuld positie Netto hypotheekschuld positie (Bank)spaar- en beleggingsdepots Auteur: Laura Oudman (Erasmus Universiteit Rotterdam) Onder begeleiding van: Erik Kole (Erasmus Universiteit Rotterdam) Liesbeth Noordegraaf-Eelens

Nadere informatie

FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie

FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie Lineaire Algebra, tentamen Uitwerkingen vrijdag 4 januari 0, 9 uur Gebruik van een formuleblad of rekenmachine is niet toegestaan. De

Nadere informatie

Oplossingen hoofdstuk XI

Oplossingen hoofdstuk XI Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen. Herkansing Inleiding Intelligente Data Analyse Datum: 3-3-2003 Tijd: 14.00-17.00, BBL 508 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.

Nadere informatie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van

Nadere informatie

P R O G N O S E T A F E L A G

P R O G N O S E T A F E L A G PROGNOSETAFEL 1 1 VOORWOORD De levensverwachting in Nederland is de laatste 50 jaar elk decennium met ongeveer 2 jaar toegenomen. Dit is een tendens die impact heeft op de samenleving op allerlei fronten.

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Lang leven in België: een nieuwe prognose

Lang leven in België: een nieuwe prognose LEUVENSE ECONOMISCHE STANDPUNTEN 2015/151 Katrien Antonio katrien.antonio@kuleuven.be Sander Devriendt sander.devriendt@kuleuven.be 30 juni 2015 Lang leven in België: een nieuwe prognose SAMENVATTING Het

Nadere informatie

Inhoud college 4 Basiswiskunde. 2.6 Hogere afgeleiden 2.8 Middelwaardestelling 2.9 Impliciet differentiëren 4.9 Linearisatie

Inhoud college 4 Basiswiskunde. 2.6 Hogere afgeleiden 2.8 Middelwaardestelling 2.9 Impliciet differentiëren 4.9 Linearisatie Inhoud college 4 Basiswiskunde 2.6 Hogere afgeleiden 2.8 Middelwaardestelling 2.9 Impliciet differentiëren 4.9 Linearisatie 2 Basiswiskunde_College_4.nb 2.6 Hogere afgeleiden De afgeleide f beschrijft

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op maandag 5 januari 29 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

Summary in Dutch 179

Summary in Dutch 179 Samenvatting Een belangrijke reden voor het uitvoeren van marktonderzoek is het proberen te achterhalen wat de wensen en ideeën van consumenten zijn met betrekking tot een produkt. De conjuncte analyse

Nadere informatie

Wetenschappelijk Instituut Volksgezondheid. Verwerking van gecensureerde waarden

Wetenschappelijk Instituut Volksgezondheid. Verwerking van gecensureerde waarden Wetenschappelijk Instituut Volksgezondheid Dienst Kwaliteit van medische laboratoria Verwerking van gecensureerde waarden 1 ste versie Pr. Albert (februari 2002) 2 de versie Aangepast door WIV (toepassingsdatum:

Nadere informatie

Domein A: Vaardigheden

Domein A: Vaardigheden Examenprogramma Wiskunde A havo Het eindexamen bestaat uit het centraal examen en het schoolexamen. Het examenprogramma bestaat uit de volgende domeinen: Domein A Vaardigheden Domein B Algebra en tellen

Nadere informatie

Machten, exponenten en logaritmen

Machten, exponenten en logaritmen Machten, eponenten en logaritmen Machten, eponenten en logaritmen Macht, eponent en grondtal Eponenten en logaritmen hebben alles met machtsverheffen te maken. Een macht als 4 is niets anders dan de herhaalde

Nadere informatie

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen. Tentamen Inleiding Intelligente Data Analyse Datum: 19-12-2002 Tijd: 9.00-12.00, BBL 420 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.

Nadere informatie

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt A. Effect & het onderscheidingsvermogen Effectgrootte (ES) De effectgrootte (effect size) vertelt ons iets over hoe relevant de relatie tussen twee variabelen is in de praktijk. Er zijn twee soorten effectgrootten:

Nadere informatie

Introductie Prognosetafel AG2014 Effect voorziening zeer beperkt, kostendekkende premie neemt wel toe

Introductie Prognosetafel AG2014 Effect voorziening zeer beperkt, kostendekkende premie neemt wel toe Introductie Effect voorziening zeer beperkt, kostendekkende premie neemt wel toe Op dit moment is de de overlevingstafel waarmee pensioenfondsen hun verplichtingen waarderen. Deze overlevingstafel houdt

Nadere informatie

Statistiek ( ) eindtentamen

Statistiek ( ) eindtentamen Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op

Nadere informatie

De arbeidsmarkt voor leraren po Regio Zeeland

De arbeidsmarkt voor leraren po Regio Zeeland De arbeidsmarkt voor leraren po 2015-2020 Regio datum 16 maart 2015 auteurs dr. Hendri Adriaens dr.ir. Peter Fontein drs. Marcia den Uijl CentERdata, Tilburg, 2015 Alle rechten voorbehouden. Niets uit

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

Koninklijk Actuarieel Genootschap AG2018

Koninklijk Actuarieel Genootschap AG2018 Koninklijk Actuarieel Genootschap P R O G N O S E - T A F E L AG2018 PROGNOSETAFEL AG2018 12 september 2018 1 colofon Uitgave Koninklijk Actuarieel Genootschap, Groenewoudsedijk 80, 3528 BK Utrecht telefoon:

Nadere informatie

De arbeidsmarkt voor leraren po Regio Zuid- en Oost-Gelderland

De arbeidsmarkt voor leraren po Regio Zuid- en Oost-Gelderland De arbeidsmarkt voor leraren po 2015-2020 Regio Zuid- en Oost-Gelderland datum 16 maart 2015 auteurs dr. Hendri Adriaens dr.ir. Peter Fontein drs. Marcia den Uijl CentERdata, Tilburg, 2015 Alle rechten

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

Verband tussen twee variabelen

Verband tussen twee variabelen Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Reële karakteristieken van beleggingscategorieën

Reële karakteristieken van beleggingscategorieën Reële karakteristieken van beleggingscategorieën Henk Hoek ORTEC Postbus 4074 3006 AB Rotterdam Max Euwelaan 78 Tel. +31 (0)10 498 6666 info@ortec.com www.ortec.com 6 november 2008 Inleiding: nominaal

Nadere informatie

Samenvatting. Analyses. Kostendekkende premie

Samenvatting. Analyses. Kostendekkende premie Samenvatting Op 14 juli 2015 heeft DNB aangekondigd dat zij de berekeningsmethodiek van de Ultimate Forward Rate (UFR), welke onderdeel vormt van de rekenrente waarmee pensioenfondsen hun verplichtingen

Nadere informatie

Hoofdstuk 2: Verbanden

Hoofdstuk 2: Verbanden Hoofdstuk 2: Verbanden Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoofdstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30 Faculteit der Wiskunde en Informatica 2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30 Opgave 1: (5 x 6 = 30 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 1 noodzakelijk)

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4) woensdag 8 oktober 9, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven Statistisch

Nadere informatie

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling Monte Carlo simulatie In MW\Pharm versie 3.30 is een Monte Carlo simulatie-module toegevoegd. Met behulp van deze Monte Carlo procedure kan onder meer de betrouwbaarheid van de berekeningen van KinPop

Nadere informatie

wiskunde A vwo 2019-II

wiskunde A vwo 2019-II OVERZICHT FORMULES Differentiëren naam van de regel functie afgeleide somregel s( x) f( x) g( x) s' ( x) f'x ( ) g'x ( ) verschilregel s( x) f( x) g( x) s' ( x) f'x ( ) g'x ( ) productregel px ( ) f( x)

Nadere informatie

De validiteit van het door het Actuarieel Genootschap ontwikkelde prognosemodel voor overlevingskansen

De validiteit van het door het Actuarieel Genootschap ontwikkelde prognosemodel voor overlevingskansen De validiteit van het door het Actuarieel Genootschap ontwikkelde prognosemodel voor overlevingskansen Rapport van de commissie van deskundigen 1. Inleiding De overlevingskansen binnen een populatie zijn

Nadere informatie

Deelrapport populatie-analyse collie korthaar

Deelrapport populatie-analyse collie korthaar Deelrapport populatie-analyse collie korthaar De genetische analyse van de stamboomgegevens van de Britse populatie van de korthaar Collie door de Britse Kennel Club is uitgevoerd met het uitgangspunt

Nadere informatie

CPB Notitie 20 december Arbeidsparticipatie. Bijlage. Uitgevoerd op verzoek van het ministerie van Sociale Zaken en Werkgelegenheid

CPB Notitie 20 december Arbeidsparticipatie. Bijlage. Uitgevoerd op verzoek van het ministerie van Sociale Zaken en Werkgelegenheid CPB Notitie 20 december 2018 Arbeidsparticipatie Bijlage Uitgevoerd op verzoek van het ministerie van Sociale Zaken en Werkgelegenheid Appendix bij CPB Notitie Arbeidsparticipatie Aanvullende figuren

Nadere informatie

Dit document maakt gebruik van bladwijzers.

Dit document maakt gebruik van bladwijzers. Dit document maakt gebruik van bladwijzers. NBA-handreiking 1116 Kader voor accountants bij de controle van de door pensioenfondsen in aanmerking genomen levensverwachting in verband met het beschikbaar

Nadere informatie

In dit college bekijken we een aantal technieken om integralen te bepalen van trigonometrische functies en van rationale functies.

In dit college bekijken we een aantal technieken om integralen te bepalen van trigonometrische functies en van rationale functies. 03 college 5: meer technieken In dit college bekijken we een aantal technieken om integralen te bepalen van trigonometrische functies en van rationale functies. Opmerking over de notatie. Net als in het

Nadere informatie

dr. Katrien Antonio en dr. Richard Plat AAG RBA

dr. Katrien Antonio en dr. Richard Plat AAG RBA dr. Katrien Antonio en dr. Richard Plat AAG RBA 1 Micro-Level Stochastic Loss Reserving Katrien Antonio (UvA) Richard Plat (Richard Plat Consultancy) 2 Agenda Introductie Schadereservering Huidige technieken

Nadere informatie

Toegepaste data-analyse: oefensessie 2

Toegepaste data-analyse: oefensessie 2 Toegepaste data-analyse: oefensessie 2 Depressie 1. Beschrijf de clustering van de dataset en geef aan op welk niveau de verschillende variabelen behoren Je moet weten hoe de data geclusterd zijn om uit

Nadere informatie

De arbeidsmarkt voor leraren po 2015-2020 Regio Utrecht

De arbeidsmarkt voor leraren po 2015-2020 Regio Utrecht De arbeidsmarkt voor leraren po 2015-2020 Regio datum 16 maart 2015 auteurs dr. Hendri Adriaens dr.ir. Peter Fontein drs. Marcia den Uijl CentERdata, Tilburg, 2015 Alle rechten voorbehouden. Niets uit

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Toegepaste Statistiek, Week 3 1

Toegepaste Statistiek, Week 3 1 Toegepaste Statistiek, Week 3 1 In Week 2 hebben we toetsingstheorie besproken mbt een kwantitatieve (ordinale) variabele G, en met name over zijn populatiegemiddelde E(G). Er waren twee gevallen: Er is

Nadere informatie

De arbeidsmarkt voor leraren po Regio Noord-Gelderland

De arbeidsmarkt voor leraren po Regio Noord-Gelderland De arbeidsmarkt voor leraren po 2015-2020 Regio Noord-Gelderland datum 16 maart 2015 auteurs dr. Hendri Adriaens dr.ir. Peter Fontein drs. Marcia den Uijl CentERdata, Tilburg, 2015 Alle rechten voorbehouden.

Nadere informatie

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn. Opdracht 12a ------------ enkelvoudige lineaire regressie Kan de leeftijd waarop een kind begint te spreken voorspellen hoe zijn score zal zijn bij een latere test op verstandelijke vermogens? Een studie

Nadere informatie

1. Levensverwachting: realisatie ten opzichte van verwachting

1. Levensverwachting: realisatie ten opzichte van verwachting Datum: 14 september 2016 Publicatie AG2016 Gemiddelde stijging van de voorziening circa 0,5%, de zuivere kostendekkende premie neemt gemiddeld toe met circa 0,8%. Op dit moment is de de overlevingstafel

Nadere informatie

Exponentiële Functie: Toepassingen

Exponentiële Functie: Toepassingen Exponentiële Functie: Toepassingen 1 Overgang tussen exponentiële functies en lineaire functies Wanneer we werken met de exponentiële functie is deze niet altijd gemakkelijk te herkennen. Daarom proberen

Nadere informatie

Meetkunde en Lineaire Algebra

Meetkunde en Lineaire Algebra Hoofdstuk 1 Meetkunde en Lineaire Algebra Vraag 1.1 Zij p en q twee veeltermfuncties met reële coëfficiënten en A een reële vierkante matrix. Dan is p(a) diagonaliseerbaar over R als en slechts dan als

Nadere informatie

Hoofdstuk 7 Het implementatieproces opnieuw bekeken: statistische exploratie

Hoofdstuk 7 Het implementatieproces opnieuw bekeken: statistische exploratie Het implementatieproces opnieuw bekeken: statistische exploratie 129 Hoofdstuk 7 Het implementatieproces opnieuw bekeken: statistische exploratie Inleiding De centrale vraag van het onderzoek is welke

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

De arbeidsmarkt voor leraren po Regio Drenthe / Overijssel

De arbeidsmarkt voor leraren po Regio Drenthe / Overijssel De arbeidsmarkt voor leraren po 2015-2020 Regio Drenthe / Overijssel datum 16 maart 2015 auteurs dr. Hendri Adriaens dr.ir. Peter Fontein drs. Marcia den Uijl CentERdata, Tilburg, 2015 Alle rechten voorbehouden.

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

Prospectieve sterftetafels met toepassing op marktconforme waarderingen

Prospectieve sterftetafels met toepassing op marktconforme waarderingen Faculteit Wetenschappen en Bio-ingenieurswetenschappen Prospectieve sterftetafels met toepassing op marktconforme waarderingen Proefschrift ingediend met het oog op het behalen van de graad van Gediplomeerde

Nadere informatie