Single and Multi-Population Mortality Models for Dutch Data

Vergelijkbare documenten
PE Bijeenkomst Prognosetafel AG2016

Commissie Sterfte Onderzoek

Prognosetafel AG2016 1

Statistiek in een rechtzaak

Stochastische sterftemodellen op basis van mortality improvement factoren

Prognosetafel AG2018 1

Moderne Bayesiaanse statistiek:

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

dr. Katrien Antonio en dr. Richard Plat AAG RBA

b) Uit Bayes volgt, gebruik makend van onderdeel a) P (T V )P (V ) P (T ) = (0.09)(0.07)

Deze week: Schatten. Statistiek voor Informatica Hoofdstuk 6: Schatten. Voorbeeld Medicijnentest. Statistische inferentie

Het tentamen heeft 25 onderdelen. Met ieder onderdeel kan maximaal 2 punten verdiend worden.

Kansrekening en Statistiek

Bayesiaans leren. Les 2: Markov Chain Monte Carlo. Joris Bierkens. augustus Vakantiecursus 1/15

Vragen en antwoorden inzake totstandkoming prognosetafel AG2016

Statistiek voor A.I.

P R O G N O S E T A F E L A G

Bayesiaans leren. Les 2: Markov Chain Monte Carlo. Joris Bierkens. augustus Vakantiecursus 1/15

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

Coherente prognose van levensverwachting in Nederland en andere Europese landen de Li&Lee benadering

Zo geldt voor o.o. continue s.v.-en en X en Y dat de kansdichtheid van X + Y gegeven wordt door

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Meervoudig toetsen met de horseshoe prior

A.F. Schilperoort. Polya tree priors. Bachelorscriptie. Scriptiebegeleider: prof.dr. A.W. van der Vaart. Datum Bachelorexamen: 9 Juni 2015

Actuarieel Genootschap BIJLAGE. bij Prognosetafel AG

OF (vermits y = dy. dx ) P (x, y) dy + Q(x, y) dx = 0

Bayesiaans leren. Les 1: Bayesiaanse statistiek. Joris Bierkens. augustus Vakantiecursus 1/14

Tentamen Voortgezette biostatistiek / Biomedische wiskunde

Bayes Factor voor samengestelde hypothesen

5S Simula)e spel Werkplekorganisa)e. Het 5S getallen spel

Regionale verschillen in extreme neerslag. 18 februari 2010 Rudmer Jilderda, Adri Buishand, Janet Wijngaard

Meetkunde en Lineaire Algebra

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

WPO Differentiaalmeetkunde I

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Vraagvoorspelling en bestelregels in de retail Een vergelijking tussen theorie en praktijk

Kansrekening en Statistiek

Hertentamen Biostatistiek 3 / Biomedische wiskunde

Deze week: Verdelingsfuncties. Statistiek voor Informatica Hoofdstuk 5: Verdelingsfuncties. Bernoulli verdeling. Bernoulli verdeling.

Samenvatting (in Dutch)

VU University Amsterdam 2018, Maart 27

Tentamen Statistische Thermodynamica MST 19/6/2014

Koninklijk Actuarieel Genootschap AG2016

Koninklijk Actuarieel Genootschap AG2016

OefenDeeltentamen 2 Kansrekening 2011/ Beschouw een continue stochast X met kansdichtheidsfunctie cx 4, 0 x 1 f X (x) = f(x) = 0, anders.

Toetsen van hypothesen

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

Hertentamen Voortgezette biostatistiek / Biomedische wiskunde

Lang leven in België: een nieuwe prognose

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Data analyse Inleiding statistiek

Schattingsmethodieken

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Samenvatting (Summary in Dutch)

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

We zullen de volgende modellen bekijken: Het M/M/ model 1/14

Samenvatting (Summary in Dutch)

De validiteit van het door het Actuarieel Genootschap ontwikkelde prognosemodel voor overlevingskansen

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

Meetkunde en Lineaire Algebra

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

9. Lineaire Regressie en Correlatie

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Faculteit Economie en Bedrijfskunde studiejaar

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Een gegeneraliseerde aanpak voor automatische foutlocalisatie. Sander Scholtus

Kansrekening en Statistiek

Hoofdstuk 6 Discrete distributies

Nieuwe inzichten voor ALM analyse naar aanleiding van de krediet crisis

Tentamen Biostatistiek 3 / Biomedische wiskunde

Wiskunde B - Tentamen 2

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Toegepaste Statistiek, Dag 7 1

Voorbeeldtentamen Statistiek voor Psychologie

Hertentamen Voortgezette biostatistiek / Biomedische wiskunde

Tabellen en Eenheden

1 WAAM - Differentiaalvergelijkingen

Monte Carlo Markov Chains voor Bayesiaanse statistiek

Kansrekening en Statistiek

4051CALC1Y Calculus 1

Stochastische Modellen in Operations Management (153088)

Voorbeelden van gebruik van 5 VUSTAT-apps

Kansrekening en Statistiek

Prestatie-analyse van zone-picking systemen

A network approach to interrelated insurance risk. Ted van der Aalst

Vragen die je wilt beantwoorden zijn:

Tentamen Simulaties van biochemische systemen - 8C110 3 juli uur

Omdat we de werkelijkheid altijd moeten vereenvoudigen ('stileren') hebben we te maken met het modelbegrip.

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

4.2 Mean Square Error

WAARSCHIJNLIJKHEID (EN) MODELLEREN

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Oriëntatie Econometrie Tijdreeksmodellen en Voorspellen. Marius Ooms. 23 April 2002, Amsterdam

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Koninklijk Actuarieel Genootschap AG2018

Data analyse Inleiding statistiek

Modellen en Simulatie Differentiaalvergelijkingen. Modellen en Simulatie. sleij101/ Program.

Transcriptie:

Single and Multi-Population Mortality Models for Dutch Data Wilbert Ouburg Universiteit van Amsterdam 7 Juni 2013 Eerste begeleider: dr. K. Antonio Tweede begeleider: prof. dr. M. Vellekoop Wilbert Ouburg 1 / 24

Agenda Sterftemodel Bayesiaanse aanpak: wat en waarom? Eén-populatie sterftemodellen - Klassieke één-populatie sterftemodellen - Bayesiaans één-populatie sterftemodel Multi-populatie sterftemodellen - Klassieke multi-populatie sterftemodellen - Bayesiaans multi-populatie sterftemodel Toepassingen Conclusies en verder onderzoek Wilbert Ouburg 2 / 24

Sterftemodel Definieer q x,t als de sterftekans op leeftijd x in jaar t Definieer µ x,t als de sterfte-intensiteit op leeftijd x in jaar t De relatie tussen beide grootheden is q x,t = 1 e µx,t Definieer kansvariabelen D x,t als het aantal sterftegevallen en E x,t als de risico-exposure Poisson Lee-Carter model is het uitgangspunt voor deze scriptie αx +βx κt D x,t Poi (E x,t µ x,t ) met µ x,t = e Wilbert Ouburg 3 / 24

Bayesiaanse statistiek Neem aan dat de parameters in het sterftemodel zelf een kansverdeling volgen, conditioneel op de beschikbare data Gebruik Bayes stelling: p(θ y) = p(θ)f (y θ) p(θ y) p(θ)f (y θ)dθ }{{} posterior p(θ) }{{} prior f (y θ) }{{} likelihood Simuleren uit de posterior verdeling kan via MCMC samplers, bijvoorbeeld Gibbs sampler en Metropolis-Hastings algoritme Wilbert Ouburg 4 / 24

Klassieke één-populatie sterftemodellen Sterftemodel Definitie Lee-Carter ln(µ x,t ) = α x + β x κ t Renshaw-Haberman ln(µ x,t ) = α x + β x (1) κ t + β x (2) Currie ln(µ x,t ) = α x + na 1 κ t + na 1 γ t x γ t x Mortality rates Dutch Males for age 65 Mortality rates Dutch Females for age 65 Mortality rate 0.000 0.005 0.010 0.015 0.020 0.025 0.030 0.035 Observed Lee Carter model (M1) Renshaw Haberman model (M2) Curie model (M3) Mortality rate 0.000 0.005 0.010 0.015 0.020 Observed Lee Carter model (M1) Renshaw Haberman model (M2) Curie model (M3) 1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 Wilbert Ouburg 5 / 24

Waarom een Bayesiaans sterftemodel? De Poisson likelihood en de tijdreeks voor de trend parameters in het Lee-Carter model worden tegelijk gemodelleerd Parameters worden geschat via simulaties gebaseerd op de onderliggende dataset en prior aanname Credibiliteitsintervallen worden automatisch gegenereerd en bevatten parameter onzekerheid Nieuwe sterftedata kan eenvoudig in het model worden verwerkt Bayesiaanse sterftemodellen zijn flexibel met ontbrekende data Wilbert Ouburg 6 / 24

Bayesiaans sterftemodel (1) Uitgangspunt is model van Czado, Delwarde, Denuit (Bayesian Poisson Log-Bilinear Mortality Projections, 2004) - Bayesiaans Lee-Carter model voor één populatie - Op basis van Nederlandse sterftestatistieken van het CBS - Ontbrekende details in artikel aangevuld in thesis - Eigen R-implementatie van het Bayesiaanse sterftemodel ontwikkeld - Uitkomsten op basis van 50.000 simulaties (burn-in periode van 10.000) Wilbert Ouburg 7 / 24

Bayesiaans sterftemodel (2) Poisson Lee-Carter model Prior kansverdelingen: αx +βx κt D x,t Poi (E x,t µ x,t ) met µ x,t = e ( κ NT Xγ, σ 2 κ Q 1) met lineaire trend γ en covariantiematrix σκq 2 1 ) β N M (0, σ 2 β I M e x Gamma (a x, b x ) met e x := e αx Hyperparameters γ, ρ, σ 2 κ en σ 2 β volgen ieder ook een prior verdeling Doel is om de posterior verdelingen van de (hyper)parameters, conditioneel op de dataset, af te leiden Wilbert Ouburg 8 / 24

Bayesiaans sterftemodel (3) Number of deaths D Mortality rates µ Parameters κ β α e Hyperparameters γ ρ σκ 2 σβ 2 Constants γ 0 Σ 0 σρ 2 a κ b κ a β b β a x b x Wilbert Ouburg 9 / 24

Bayesiaans sterftemodel (4) Posterior kansverdelingen: p (κ t θ \ {κ t }) Poisson Normaal (modelleren met MH-algoritme) p (βx θ \ {β x }) Poisson Normaal (modelleren met MH-algoritme) p (ex θ \ {e x }) Gamma (a x + D x,, b x + c x ) met c x := t E βx κt x,te en D x, := t D x,t Posterior verdelingen voor hyperparameters en verdere details in scriptie uitgewerkt Wilbert Ouburg 10 / 24

α β κ Bayesiaans sterftemodel (5) Parameteronzekerheid voor resp. α, β en κ voor Nederlandse mannen Bayesian α compared to Lee Carter estimates Bayesian β compared to Lee Carter estimates Bayesian κ compared to Lee Carter estimates 8 6 4 2 0 Credibility interval 0.005 0.5 0.995 LC 0.000 0.005 0.010 0.015 0.020 0.025 0.030 0.035 Credibility interval 0.005 0.5 0.995 LC 80 60 40 20 0 20 40 Credibility interval 0.005 0.5 0.995 LC 0 20 40 60 80 100 0 20 40 60 80 100 1950 1960 1970 1980 1990 2000 2010 Age Age Wilbert Ouburg 11 / 24

Bayesiaans sterftemodel (6) Parameteronzekerheid voor Nederlandse mannen (links) en vrouwen (rechts) Bayesian mortality rates compared to Lee Carter estimates for age 65 Bayesian mortality rates compared to Lee Carter estimates for age 65 Mortality rate 0.010 0.015 0.020 0.025 0.030 Credibility interval 0.005 0.5 0.995 LC Mortality rate 0.005 0.010 0.015 0.020 Credibility interval 0.005 0.5 0.995 LC 1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 Wilbert Ouburg 12 / 24

Multi-populatie sterftemodellen Sterftemodel waarin meerdere populaties simultaan worden gemodelleerd Interactie tussen populaties wordt meegenomen in het model Hoofdaanname De sterftekansen voor de populaties in het model divergeren niet over de tijd Toegepast op één gecombineerd model voor mannelijke en vrouwelijke sterfte in Nederland Wilbert Ouburg 13 / 24

Frequentist multi-populatie sterftemodellen Li & Lee (2005) introduceren multi-populatie variant van Lee-Carter model (cfr. CBS2012) ( ) ln m (i) x,t = α x (i) + B x K t + β x (i) κ (i) t + ɛ (i) x,t Central death rate, age 65 Dutch males Central death rate, age 65 Dutch females Central death rate 0.015 0.020 0.025 Multi population model Observed Single population model Central death rate 0.006 0.008 0.010 0.012 0.014 0.016 0.018 Multi population model Observed Single population model 1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 Wilbert Ouburg 14 / 24

Bayesiaans multi-populatiemodel (1) Uitgangspunt is model van Cairns et al. (Bayesian stochastic mortality modelling for two populations, 2011) Cairns et al. (2011) geven nauwelijks details over implementatie en hanteren Currie model Contributies scriptie: - Bayesiaans Lee-Carter model in Czado et al. (2005) gegeneraliseerd naar multi-populatie variant - Alle ontbrekende details in Cairns et al. in scriptie aangevuld - Eigen implementatie van het model in R ontwikkeld Wilbert Ouburg 15 / 24

Bayesiaans multi-populatiemodel (2) Definieer gemiddelde trendparameter R t = 1 2 en spread S t = κ (1) t κ (2) t Hoofdaanname Spread tussen populaties is mean-reverting ( ) κ (1) t + κ (2) t - Gerealiseerd via extra eis op parameters AR(1) model voor spread S t Neem ook correlatie tussen R t en S t mee via R t = µ + R t 1 + σ R Z t S t = ψ S S t 1 + c RS σ S Z t + σ R 1 c 2 RS Z t Wilbert Ouburg 16 / 24

Bayesiaans multi-populatiemodel (3) Number of deaths D (i) Mortality rates m (i) Parameters R κ (i) S β (i) α (i) e (i) ( ) Hyperparameters µ V 2 ψ S σ (i) 2 β Constants µ 0 σ µ Ψ ν σ 2 ψ a (i) β b (i) β a (i) x b x (i) Wilbert Ouburg 17 / 24

Bayesiaans multi-populatiemodel (4) Bayesian R credibility intervals Bayesian S credibility intervals R 60 40 20 0 20 40 Credibility interval 0.005 0.5 0.995 Observed S 30 20 10 0 10 20 Credibility interval 0.005 0.5 0.995 Observed 1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 Wilbert Ouburg 18 / 24

Bayesiaans multi-populatiemodel (5) Bayesian mortality rates compared to Lee Carter estimates for population 1, for age 65 Bayesian mortality rates compared to Lee Carter estimates for population 2, for age 65 Mortality rate 0.010 0.015 0.020 0.025 0.030 Credibility interval 0.005 0.5 0.995 LC Mortality rate 0.005 0.010 0.015 0.020 Credibility interval 0.005 0.5 0.995 LC 1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 Wilbert Ouburg 19 / 24

Bayesiaans multi-populatiemodel (6) Bayesian logµ (1) credibility intervals Bayesian logµ (2) credibility intervals log µ (1) 5.0 4.5 4.0 3.5 Credibility interval 0.005 0.5 0.995 LC log µ (2) 5.5 5.0 4.5 4.0 Credibility interval 0.005 0.5 0.995 LC 1960 1980 2000 2020 1960 1980 2000 2020 Wilbert Ouburg 20 / 24

Toepassingen Eén sterftemodel voor het tegelijkertijd modelleren van portefeuille en landelijke sterfte, inclusief de correlatie tussen deze populaties waarin sterfte uit meerdere landen tegelijk wordt gemodelleerd (bijvoorbeeld een Bayesiaans CBS2012 model) voor mannen- en vrouwensterfte voor sterfte in meerdere homogene risicogroepen (denk aan socio-economische status of rokers/niet-rokers) Wilbert Ouburg 21 / 24

Conclusies Model meet parameteronzekerheid vanwege Bayesiaanse aanpak Multi-populatie model zorgt ervoor dat correlatie tussen sterfte van de populaties in het model wordt meegenomen Credibiliteitsintervallen worden automatisch gegenereerd (immers MCMC methodiek) Kan worden toegepast voor de bepaling van parameteronzekerheid bij 99.5% VaR onder Solvency II voor het kort- en langlevenrisico Bayesiaanse aanpak in scriptie toegepast op Lee-Carter model, echter ook toepasbaar op andere modellen Wilbert Ouburg 22 / 24

Verder onderzoek Optimalisatie van de posterior verdelingen (opgelost) Forecasts voor multi-populatiemodel (opgelost) Model toepassen op landelijke en portefeuille-specifieke sterfte Bayesiaans sterftemodel voor meer dan twee populaties (in progress) Model toepassen op varianten van het Lee-Carter model Wilbert Ouburg 23 / 24

Vragen? Wilbert Ouburg 24 / 24