copula and vine Fedde Tolman DACE-PRA Fedde Tolman - copula and vine

Vergelijkbare documenten
Tentamen Biostatistiek 3 / Biomedische wiskunde

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Gezamenlijke kansverdeling van twee stochasten

Hoe goed is een raming?

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Tentamen Voortgezette Kansrekening (WB006C)

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

Department of Mathematics Exam: Voortgezette biostatistiek / Biomedische wiskunde VU University Amsterdam 2017, Juni 7

Kansrekening en Statistiek

Meten en experimenteren

werkcollege 6 - D&P9: Estimation Using a Single Sample

Hertentamen Biostatistiek 3 / Biomedische wiskunde

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Statistiek voor A.I. College 2. Donderdag 13 September 2012

Samenvatting (Summary in Dutch)

Examen Statistiek I Feedback

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Zo geldt voor o.o. continue s.v.-en en X en Y dat de kansdichtheid van X + Y gegeven wordt door

Meten en experimenteren

1. Statistiek gebruiken 1

Les 2 / 3: Meetschalen en Parameters

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

mlw stroom 2.1: Statistisch modelleren

Examenvragen Hogere Wiskunde I

Kansrekening en Statistiek

Statistiek voor A.I.

VU University Amsterdam 2018, Maart 27

Tentamen Voortgezette biostatistiek / Biomedische wiskunde

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

WI1708TH Analyse 3. College 2 12 februari Challenge the future

Inleiding Applicatie Software - Statgraphics

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

TECHNISCHE UNIVERSITEIT EINDHOVEN

WORKSHOP PRA. Introductie Bas Bloemers Risicomanager Ballast Nedam

Oefenvragen bij Statistics for Business and Economics van Newbold

FOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE. Toets Inleiding Kansrekening 1 8 februari 2010

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Kansrekening en Statistiek

Deze week: Schatten. Statistiek voor Informatica Hoofdstuk 6: Schatten. Voorbeeld Medicijnentest. Statistische inferentie

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Statistiek voor A.I. College 10. Donderdag 18 Oktober

OefenDeeltentamen 2 Kansrekening 2011/ Beschouw een continue stochast X met kansdichtheidsfunctie cx 4, 0 x 1 f X (x) = f(x) = 0, anders.

Kansrekening en stochastische processen 2DE18

Door Hans Waszink Drs. Hans Waszink AAG is eigenaar van Waszink Actuarieel Advies B.V.

De dynamica van een hertenpopulatie. Verslag 1 Modellen en Simulatie

Single and Multi-Population Mortality Models for Dutch Data

Meten en experimenteren

Hoe goed is een probabilistische kostenberekening? inhoud hoe goed is een probabilistische kostenberekening? AACE definitie fasen AACE

Set 3 Inleveropgaven Kansrekening (2WS20) Opgaven met sterretjes zijn lastiger dan opgaven zonder sterretje.

Zeldzame en extreme gebeurtenissen

Classification - Prediction

4 Domein STATISTIEK - versie 1.2

Indeterminisme en Waarschijnlijkheid In de Quantamechanica. 26 November 2014

(Isomorfie en) RELATIES

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

6.0 Voorkennis AD BC. Kruislings vermenigvuldigen: Voorbeeld: 50 10x ( x 1) Willem-Jan van der Zanden

Voorbeelden van gebruik van 5 VUSTAT-apps

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Data analyse Inleiding statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Uitwerking Tentamen Inleiding Kansrekening 11 juni 2015, uur Docent: Prof. dr. F. den Hollander

Hoofdstuk 5. Toevalsveranderlijken en waarschijnlijkheidsdistributies. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31

Uitwerkingen Tentamen Gewone Differentiaalvergelijkingen

Oriëntatie Econometrie Tijdreeksmodellen en Voorspellen. Marius Ooms. 23 April 2002, Amsterdam

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

Opgave 2: Simplex-algoritme - oplossing

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Macromodellen: Hoe verder?

Extrema van functies van meerdere variabelen

Hoofdstuk 2. Aanduiding 1: Aanduiding 2: Formule 1: Formule 2: s2 x = Formule 3: s x = Formule 4: X nieuw = X oud ± a betekent ook

WI1808TH1/CiTG - Lineaire algebra deel 1

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

3.2 Vectoren and matrices

2DD50: Tentamen. Tentamen: 26 januari 2016 Hertentamen: 5 april 2016

Probabilistisch ramen

Tentamen Kansrekening en Statistiek (2WS04), woensdag 30 juni 2010, van uur.

We zullen de volgende modellen bekijken: Het M/M/ model 1/14

Kanstheorie, -rekenen en bekende verdelingen

Lineair voor CT College 2a. Echelon vorm 1.2 Duncan van der Heul

. Dan geldt P(B) = a d. 3 8


Hertentamen Voortgezette biostatistiek / Biomedische wiskunde

Verwachte tijd tot verwachting (Engelse titel: Expected time till expectancy)

3.2 Kritieke punten van functies van meerdere variabelen

Hypothese toetsen en het switch-criterium

Het samenstellen van een multipele indicator index. Harry B.G. Ganzeboom ADEK UvS College 2 28 februari 2011

Afdeling Kwantitatieve Economie

Kansrekening en Statistiek

Overzicht. Eigenwaarden. Beurzen en afhankelijkheid. Eigenwaarden: Intro

Statistiek voor A.I. College 9. Donderdag 11 Oktober

Data analyse Inleiding statistiek

Functies van meer variabelen voor dummy s

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

Transcriptie:

copula and vine Fedde Tolman fedde.tolman@kiwa.com DACE-PRA 27-09-2018 1

doel sig-pra werkbare methode voor PRA data -> acceptabele hoeveelheid werk vs. nauwkeurigheid en betrouwbarheid eerdere lezingen model -> veel en uitgebreide software, dus er worden veel fouten gemaakt -> begrip van beginselen nodig onderwerp deze presentatie relevantie van PRA kosten van risicoanalyse en -berekening vs. opbrengst voornemen 2

stochast een stochastische variabele is een grootheid waarvan de waarde afhangt van toeval (G. stokhos = guess, aim, fixed target, erected pillar for archers to shoot at; PIE *stogh-, stegh- = to stick, prick, sting) beschrijving door kansfunctie dichtheid f(x) verdeling F(x) parameters (momenten) van een kansfunctie gemiddelde μ / stdaardafwijking σ / scheefheid / spitsheid, 3

meten of schatten van een stochast binair (twee-waardig) minimum maximum f discreet -> p schatten triangulair (drie-waardig) minimum modus maximum aanname: f driehoeksverdeling -> f hoeft niet geschat te worden beschrijving binair triangle variabelen x 1, x 2, x 1, x 2, x 3 kans p parameters μ, σ μ, σ 4

verdelingen van twee stochasten gezamenlijk (simultaan) f(x, y) partieel conditioneel f x (x y), f y (y x) marginaal f x (x), f y (y) 5

onderling verband tussen stochasten copula C twee stochasten F(x,y) = C(F x (x), F y (y)) f(x,y) = c(f x (x), f y (y)) meerdere stochasten F(x i, ) = C(F i (x i ) f(x i, ) = c(f i (x i ) C is vaak een moeilijke functie bepaalbare onder- en bovengrenzen (Fréchet Hoeffding) -> iteratieve convergentie 6

co-relatie ρ vereenvoudiging van copula: correlatie (soort parameter van de copula-functie) in principe enkel voor N(μ x, σ x, μ y, σ y, ρ xy ); andere verdelingen hebben andere parameters voor een x-y verband de correlatiecoëfficiënt ρ is de sterkte van dat verband 7

PRA stelling 1: Point Estimation Method (Emilio) Rosenblueth (1975) per 2 variabelen 3 2 waarden (i.p.v. 2x3 waarden) volledige correlatiematrix vergt echter ½n(n-1) paren f (x, y) y1 y2 y3 f y (y) x1 x2 x3 f x (x) f. (.) μ σ x y ρ 8

ρ ogenschijnlijk eenvoudiger maar lastiger te begrijpen dan c voorbeeld y = 3.0 + 0.5x ρ = 0.816 (Anscombe, 1973) 13 definities (Rodgers, Nicewander, The American Statistician, 1988) 9

correlation matrix P n stochastics n 2 matrix P requirements: -1 ρ ij 1 symmetrisch -> 1 n(n-1) cc 2 P is positief definite (4 equivalent definitions) x T Rx > 0 for any x 0. R has positive eigenvalues every principal determinant is positive (Sylvester) positive pivots in Gaussian elimination 10

normale en uniforme verdelingen 11

verschillende verdelingen 12

1 a c a 1 b c b 1 triangulatie partiele correlatie coefficient 3 variabelen, 3 relaties -> logische consistentie A>B, B>C -> A>C (niet vrij te kiezen) maar ook: A>B, A>C -> A-C ligt niet vast ab 1 a 2 1 b 2 c ab + 1 a 2 1 b 2 ρ xz y = c ab 1 a 2 1 b 2 13

homogene standaardafwijkingen σ en correlatiecoefficienten ρ x = a i x i σ 2 = a i a i ρ ij σ i σ j n 2 3 11 1 0,5 σ a σ ρ 2 = n 1 + n 1 ρ 1 n 1 0-1 -0,5 0 0,5 ρ 1 dus ρ = 0 en ρ = 1 zijn acceptabele extremen σ en P homogeen zijn weinig realistische aannamen 14

quasi-homogene σ en ρ blok- en banddiagonaalmatrices lege cellen bevatten consistente ρ fysieke structuur vervangen door correlatiestructuur 1 a a a a 1 a a a a 1 a a a a 1 b b b 1 b b b 1 c c 1 1 ρ ρ 1 ρ ρ 1 ρ ρ 1 ρ ρ 1 ρ ρ 1 ρ ρ 1 15

netwerk van variabelen, casusstructuur (Haff 2016) 16

conditionele correlatie, D-vine (Joe 1996) 17

D-vine (drawable-vine), Kraemer, Schepsmeier (2011) a 18

overblijvend probleem: hoe belangrijk zijn correlaties? numeriek n < σ 2 < n 2 a σ determinisme probabilisme It is pretty easy to be certain. One has only to be sufficiently vague. [Peirce (1839 1914), Collected Papers] empirisch, vaak onderscheiden in extremen rampen (bijv. Springtij 1953, Katherina 2005 / tsunami 2004, 2008 / brug Genua 2018 / grote projecten; meestal rampen, maar soms successen) financiele modellen normalen hier geen voorbeelden, enkele algemene stellingen Murphy (Finagle, Sod): anything that can go wrong will go wrong (at the worst possible time) Saaty: wisdom of the crowd: (uitmiddelen mee- en tegenvallers, onbewuste verbanden) 19

conclusies en stelling bereikte doelen PEM (point estimate model), simultane verdeling consistentie (positieve correlatiematrix) casusstructuur vervangen door correlatiestructuur triangulatie (vine) -> successievelijke voorwaardelijke correlatiecoefficienten toekomst: belang van ρ t.o.v. de 2 andere factoren van een risicobeschouwing: casusstructurering marginale verdelingen (min-modus-max, driehoeksverdeling ) probabilistiek en risico i.h.a. modellering van kosten en tijd is nogal primitief t.o.v. constructiemodellen (daar tenminste expliciete partiele factoren met soms impliciete correlatie, veiligheidsfactoren ) er zijn veel mislukte projecten en maar zo nu en dan een brug 20