Single and Multi-Population Mortality Models for Dutch Data

Single and Multi-Population Mortality Models for Dutch Data Wilbert Ouburg Universiteit van Amsterdam 7 Juni 2013 Eerste begeleider: dr. K. Antonio Tweede begeleider: prof. dr. M. Vellekoop Wilbert Ouburg 1 / 24

Agenda Sterftemodel Bayesiaanse aanpak: wat en waarom? Eén-populatie sterftemodellen - Klassieke één-populatie sterftemodellen - Bayesiaans één-populatie sterftemodel Multi-populatie sterftemodellen - Klassieke multi-populatie sterftemodellen - Bayesiaans multi-populatie sterftemodel Toepassingen Conclusies en verder onderzoek Wilbert Ouburg 2 / 24

Sterftemodel Definieer q x,t als de sterftekans op leeftijd x in jaar t Definieer µ x,t als de sterfte-intensiteit op leeftijd x in jaar t De relatie tussen beide grootheden is q x,t = 1 e µx,t Definieer kansvariabelen D x,t als het aantal sterftegevallen en E x,t als de risico-exposure Poisson Lee-Carter model is het uitgangspunt voor deze scriptie αx +βx κt D x,t Poi (E x,t µ x,t ) met µ x,t = e Wilbert Ouburg 3 / 24

Bayesiaanse statistiek Neem aan dat de parameters in het sterftemodel zelf een kansverdeling volgen, conditioneel op de beschikbare data Gebruik Bayes stelling: p(θ y) = p(θ)f (y θ) p(θ y) p(θ)f (y θ)dθ }{{} posterior p(θ) }{{} prior f (y θ) }{{} likelihood Simuleren uit de posterior verdeling kan via MCMC samplers, bijvoorbeeld Gibbs sampler en Metropolis-Hastings algoritme Wilbert Ouburg 4 / 24

Klassieke één-populatie sterftemodellen Sterftemodel Definitie Lee-Carter ln(µ x,t ) = α x + β x κ t Renshaw-Haberman ln(µ x,t ) = α x + β x (1) κ t + β x (2) Currie ln(µ x,t ) = α x + na 1 κ t + na 1 γ t x γ t x Mortality rates Dutch Males for age 65 Mortality rates Dutch Females for age 65 Mortality rate 0.000 0.005 0.010 0.015 0.020 0.025 0.030 0.035 Observed Lee Carter model (M1) Renshaw Haberman model (M2) Curie model (M3) Mortality rate 0.000 0.005 0.010 0.015 0.020 Observed Lee Carter model (M1) Renshaw Haberman model (M2) Curie model (M3) 1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 Wilbert Ouburg 5 / 24

Waarom een Bayesiaans sterftemodel? De Poisson likelihood en de tijdreeks voor de trend parameters in het Lee-Carter model worden tegelijk gemodelleerd Parameters worden geschat via simulaties gebaseerd op de onderliggende dataset en prior aanname Credibiliteitsintervallen worden automatisch gegenereerd en bevatten parameter onzekerheid Nieuwe sterftedata kan eenvoudig in het model worden verwerkt Bayesiaanse sterftemodellen zijn flexibel met ontbrekende data Wilbert Ouburg 6 / 24

Bayesiaans sterftemodel (1) Uitgangspunt is model van Czado, Delwarde, Denuit (Bayesian Poisson Log-Bilinear Mortality Projections, 2004) - Bayesiaans Lee-Carter model voor één populatie - Op basis van Nederlandse sterftestatistieken van het CBS - Ontbrekende details in artikel aangevuld in thesis - Eigen R-implementatie van het Bayesiaanse sterftemodel ontwikkeld - Uitkomsten op basis van 50.000 simulaties (burn-in periode van 10.000) Wilbert Ouburg 7 / 24

Bayesiaans sterftemodel (2) Poisson Lee-Carter model Prior kansverdelingen: αx +βx κt D x,t Poi (E x,t µ x,t ) met µ x,t = e ( κ NT Xγ, σ 2 κ Q 1) met lineaire trend γ en covariantiematrix σκq 2 1 ) β N M (0, σ 2 β I M e x Gamma (a x, b x ) met e x := e αx Hyperparameters γ, ρ, σ 2 κ en σ 2 β volgen ieder ook een prior verdeling Doel is om de posterior verdelingen van de (hyper)parameters, conditioneel op de dataset, af te leiden Wilbert Ouburg 8 / 24

Bayesiaans sterftemodel (3) Number of deaths D Mortality rates µ Parameters κ β α e Hyperparameters γ ρ σκ 2 σβ 2 Constants γ 0 Σ 0 σρ 2 a κ b κ a β b β a x b x Wilbert Ouburg 9 / 24

Bayesiaans sterftemodel (4) Posterior kansverdelingen: p (κ t θ \ {κ t }) Poisson Normaal (modelleren met MH-algoritme) p (βx θ \ {β x }) Poisson Normaal (modelleren met MH-algoritme) p (ex θ \ {e x }) Gamma (a x + D x,, b x + c x ) met c x := t E βx κt x,te en D x, := t D x,t Posterior verdelingen voor hyperparameters en verdere details in scriptie uitgewerkt Wilbert Ouburg 10 / 24

α β κ Bayesiaans sterftemodel (5) Parameteronzekerheid voor resp. α, β en κ voor Nederlandse mannen Bayesian α compared to Lee Carter estimates Bayesian β compared to Lee Carter estimates Bayesian κ compared to Lee Carter estimates 8 6 4 2 0 Credibility interval 0.005 0.5 0.995 LC 0.000 0.005 0.010 0.015 0.020 0.025 0.030 0.035 Credibility interval 0.005 0.5 0.995 LC 80 60 40 20 0 20 40 Credibility interval 0.005 0.5 0.995 LC 0 20 40 60 80 100 0 20 40 60 80 100 1950 1960 1970 1980 1990 2000 2010 Age Age Wilbert Ouburg 11 / 24

Bayesiaans sterftemodel (6) Parameteronzekerheid voor Nederlandse mannen (links) en vrouwen (rechts) Bayesian mortality rates compared to Lee Carter estimates for age 65 Bayesian mortality rates compared to Lee Carter estimates for age 65 Mortality rate 0.010 0.015 0.020 0.025 0.030 Credibility interval 0.005 0.5 0.995 LC Mortality rate 0.005 0.010 0.015 0.020 Credibility interval 0.005 0.5 0.995 LC 1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 Wilbert Ouburg 12 / 24

Multi-populatie sterftemodellen Sterftemodel waarin meerdere populaties simultaan worden gemodelleerd Interactie tussen populaties wordt meegenomen in het model Hoofdaanname De sterftekansen voor de populaties in het model divergeren niet over de tijd Toegepast op één gecombineerd model voor mannelijke en vrouwelijke sterfte in Nederland Wilbert Ouburg 13 / 24

Frequentist multi-populatie sterftemodellen Li & Lee (2005) introduceren multi-populatie variant van Lee-Carter model (cfr. CBS2012) ( ) ln m (i) x,t = α x (i) + B x K t + β x (i) κ (i) t + ɛ (i) x,t Central death rate, age 65 Dutch males Central death rate, age 65 Dutch females Central death rate 0.015 0.020 0.025 Multi population model Observed Single population model Central death rate 0.006 0.008 0.010 0.012 0.014 0.016 0.018 Multi population model Observed Single population model 1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 Wilbert Ouburg 14 / 24

Bayesiaans multi-populatiemodel (1) Uitgangspunt is model van Cairns et al. (Bayesian stochastic mortality modelling for two populations, 2011) Cairns et al. (2011) geven nauwelijks details over implementatie en hanteren Currie model Contributies scriptie: - Bayesiaans Lee-Carter model in Czado et al. (2005) gegeneraliseerd naar multi-populatie variant - Alle ontbrekende details in Cairns et al. in scriptie aangevuld - Eigen implementatie van het model in R ontwikkeld Wilbert Ouburg 15 / 24

Bayesiaans multi-populatiemodel (2) Definieer gemiddelde trendparameter R t = 1 2 en spread S t = κ (1) t κ (2) t Hoofdaanname Spread tussen populaties is mean-reverting ( ) κ (1) t + κ (2) t - Gerealiseerd via extra eis op parameters AR(1) model voor spread S t Neem ook correlatie tussen R t en S t mee via R t = µ + R t 1 + σ R Z t S t = ψ S S t 1 + c RS σ S Z t + σ R 1 c 2 RS Z t Wilbert Ouburg 16 / 24

Bayesiaans multi-populatiemodel (3) Number of deaths D (i) Mortality rates m (i) Parameters R κ (i) S β (i) α (i) e (i) ( ) Hyperparameters µ V 2 ψ S σ (i) 2 β Constants µ 0 σ µ Ψ ν σ 2 ψ a (i) β b (i) β a (i) x b x (i) Wilbert Ouburg 17 / 24

Bayesiaans multi-populatiemodel (4) Bayesian R credibility intervals Bayesian S credibility intervals R 60 40 20 0 20 40 Credibility interval 0.005 0.5 0.995 Observed S 30 20 10 0 10 20 Credibility interval 0.005 0.5 0.995 Observed 1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 Wilbert Ouburg 18 / 24

Bayesiaans multi-populatiemodel (5) Bayesian mortality rates compared to Lee Carter estimates for population 1, for age 65 Bayesian mortality rates compared to Lee Carter estimates for population 2, for age 65 Mortality rate 0.010 0.015 0.020 0.025 0.030 Credibility interval 0.005 0.5 0.995 LC Mortality rate 0.005 0.010 0.015 0.020 Credibility interval 0.005 0.5 0.995 LC 1950 1960 1970 1980 1990 2000 2010 1950 1960 1970 1980 1990 2000 2010 Wilbert Ouburg 19 / 24

Bayesiaans multi-populatiemodel (6) Bayesian logµ (1) credibility intervals Bayesian logµ (2) credibility intervals log µ (1) 5.0 4.5 4.0 3.5 Credibility interval 0.005 0.5 0.995 LC log µ (2) 5.5 5.0 4.5 4.0 Credibility interval 0.005 0.5 0.995 LC 1960 1980 2000 2020 1960 1980 2000 2020 Wilbert Ouburg 20 / 24

Toepassingen Eén sterftemodel voor het tegelijkertijd modelleren van portefeuille en landelijke sterfte, inclusief de correlatie tussen deze populaties waarin sterfte uit meerdere landen tegelijk wordt gemodelleerd (bijvoorbeeld een Bayesiaans CBS2012 model) voor mannen- en vrouwensterfte voor sterfte in meerdere homogene risicogroepen (denk aan socio-economische status of rokers/niet-rokers) Wilbert Ouburg 21 / 24

Conclusies Model meet parameteronzekerheid vanwege Bayesiaanse aanpak Multi-populatie model zorgt ervoor dat correlatie tussen sterfte van de populaties in het model wordt meegenomen Credibiliteitsintervallen worden automatisch gegenereerd (immers MCMC methodiek) Kan worden toegepast voor de bepaling van parameteronzekerheid bij 99.5% VaR onder Solvency II voor het kort- en langlevenrisico Bayesiaanse aanpak in scriptie toegepast op Lee-Carter model, echter ook toepasbaar op andere modellen Wilbert Ouburg 22 / 24

Verder onderzoek Optimalisatie van de posterior verdelingen (opgelost) Forecasts voor multi-populatiemodel (opgelost) Model toepassen op landelijke en portefeuille-specifieke sterfte Bayesiaans sterftemodel voor meer dan twee populaties (in progress) Model toepassen op varianten van het Lee-Carter model Wilbert Ouburg 23 / 24

Vragen? Wilbert Ouburg 24 / 24