Standaardisatiemethoden. 9 10Abby Israëls. Statistische Methoden (10003)



Vergelijkbare documenten
Tentamen van Wiskunde B voor CiT (151217) Tentamen van Statistiek voor BIT (153031) Vrijdag 27 januari 2006 van 9.00 tot uur

Toepassing: Codes. Hoofdstuk 3

Centraal Bureau voor de Statistiek Keten Economische Statistieken

Regeling theoretisch solvabiliteitscriterium levensverzekeraars Wft

Aanvullende Opgaven Inleiding Besliskunde II

Centraal Bureau voor de Statistiek Macro-economische Statistieken en Publicaties

Samenvatting Farmaco-epidemiologie april 2011

Publicatieblad van de Europese Unie. (Besluiten waarvan de publicatie voorwaarde is voor de toepassing)

Variantie-analyse (ANOVA)

Gegevensverwerving en verwerking

Uitwerkingen tentamen Statistiek 2 voor TeMa Maandag

Make or Buy? Een beslissing gebaseerd op de transactiekostentheorie. Martin Helmhout

PROTOCOL MONITORING ENERGIEBESPARING

Bronnen & Methoden bij Marktscan medischspecialistische zorg 2015

MEERJAREN OPBRENGSTEN VO 2013 TOELICHTING

ALCOHOLKENNIS DOORGESPEELD

Gemeentefonds verevent minder dan gedacht

Verslag Regeltechniek 2

Rekenen met rente en rendement

Centraal Bureau voor de Statistiek Keten Economische Statistieken

3.7.3 Welke meetinstrumenten zijn geschikt voor het vastleggen van motorische vaardigheden?

Ontvlechting van ICT vereist nieuwe samenwerking

Een levensloopregeling voor software

officiële bijdrage aan het CMMI. Jan Jaap Cannegieter

aantallen in van de prooiresten gewicht min of meer mogelijk, doch als de gebitsmaten van een groot aantal gevangen dat de gewichtsfaktor

BRUIKLEENREGELING MOBIELE TELEFOON 2008

Onderhoud en beheer van infrastructuur voor goederenvervoer

MRT/RT MKT/KT. Wormwielreductoren.

effectief inzetten? Bert Dingemans

Schatting van het aandeel verkeersdoden als gevolg van rijden onder invloed van alcohol

Ondersteuning en hulp bij leren

Uitgebreide aandacht warmtapwatersystemen. Door afnemende warmtevraag voor ruimteverwarming, neemt het belang van het

De Waarde van Toekomstige Kasstromen

Meten en experimenteren

is gelijk aan de open-klemmen spanning van het netwerk. De impedantie Z th

Regeling theoretisch solvabiliteitscriterium levensverzekeraars Wft

De methode tot bepaling van de x-factor voor de kwaliteitsconversietaak voor de tweede reguleringsperiode in formules

AÏerinzagelegging nu

Statica in een notendop

Toelichting advies gemeenteraad bij aanvraag aanwijzing als lokale publieke media-instelling

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Examen Neurale Netwerken (2L490), op woensdag 28 juni 2006, uur.

lus+ De klachtencommissie en de rol van de vertrouwenspersoon ongewenste omgangsvormen

i i Datzelfde aggregaat in een vorig jaar 0 stellen we voor door

7. Behandeling van communicatie en mondmotoriek

Bij een invalshoek i =(15.0 ± 0.5) meet hij r =(9.5 ± 0.5). 100%-intervallen. Welke conclusie kan de onderzoeker trekken?

Cats. Den Haag, ~ '' Kenmerk: DGB

De Collegereeks Statistiek. Stel je wilt wat weten over. Complexe begrippen: construct. Homogeniteit. Verder met. Statistiek

2 De correlatie tussen wel en niet chemokuren

Onderzoek naar de toepasbaarheid van Multi Level Factoren voor de premiestelling van een personenautoproduct

Onderzoeksmethoden en techieken I

Statistiek Hoorcollege 6. Variantie analyse. Variantie & Variatie 10/13/2009. σ X. De Collegereeks Statistiek

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

De standaardafwijking

Handreiking Behorende bij Verslag over de Uitvoering Abw, IOAW, IOAZ en WIK 2003

PROEFEXAMEN SOCIALE STATISTIEK

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

anwb.nl/watersport, de site voor watersporters

Kengetallen E-38 Pseudo-records

1 Rekenen met complexe getallen

De druk van het grondwater. De stroming van het grondwater. De stroming van het grondwater

Van beschrijvende naar verklarende statistiek

Stochastische loadflow. Beschrijving algoritme van de stochastische loadflow.

6. Behandeling van kinderen met spastische cerebrale parese gericht op verbetering van handvaardigheid

- 2 - Datum vergadenn Nota openbaar: ľľo 9. Verzoek toepassing regeling Rood voor Rood met gesloten beurs op de locatie Scharlebeltweg 1 te Nijverdal

Imputatie. Abby Israëls, Léander Kuijvenhoven, Jan van der Laan, Jeroen Pannekoek en Eric Schulte Nordholt. Statistische Methoden (201101)

1. In de hoofdstad van Ivoorkust, Yamoussoukro, meet men de lengte van 100 mannen (in cm) :

Heerhugowaard Stad van kansen

Pagina 1/13. Ons ACM/DE/2013/104033/224 kenmerk: Zaaknummer: /Methodebesluiten GTS vanaf 2014 Reguleringsmethode Gasunie Transport Services B.V.

ACCU-CHEK. Compact Plus. Gebruiksaanwijzing SYSTEEM VOOR DE BEPALING VAN BLOEDGLUCOSE

Bureau of lessenaar. Een onderzoek naar de meting van bureaucratie in onderwijsinstellingen. Definitief eindrapport

Onderzoeksmethoden en techieken I

Regressie en correlatie

zijn, kunnen we stellen dat de huidige analyses vooral toegespitst zijn op een ordergerichte situatie.

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

Integere programmering voor cyclische personeelsplanning

~~i~il' 1025 VS Amsterdam. Geacht bestuur,

Regressie en correlatie

Hoe te gokken als het moet

Appendix F: Het Snelheid-Wegdiagram, trekkracht en indicatie

Yield Management & Short Selling

Prijs ƒ 3.- "OCTllCO' HA AD

- X i ~ kansverdeling: N(µ A, σ 2 ) Y i ~ N(µ B, σ 2 ) (onafhankelijk) - X i ~ kansverdeling: F A (u)=p(x<u) Y i ~

Voorschriften voor MARS Documentversie 2.52

Gebruik van scannerdata van supermarkten in de consumentenprijsindex

De aan dit blad gehechte stukken zijn een afdruk van de oorspronkelijk ingediende beschrijving met conclusie(s) en eventuele tekeriing(en).

ARU. ;ijniv-ersitejt. e 3 ndhov ( ) TEM. niet uitleenbaar

Vaker een trein, da s pas fijn!?

Eerste herziening 2009 BEELDKWALITEITPLAN VROUWENHOF

UITWERKINGEN OPGAVEN HOOFDSTUK 10

Ter inzage gelegde v. Octrooiaanvrage Nr ,, Klaisse i 11?, h bd 7./ 119 bc 2), Int Cl. G' q-, n 33/16 f A 61 li 5/10.

GEMEENTE HELLEN DOORN lichand.: 1 FEB A1 B Stuk itreťw.: Werkpr.. Kopie aan: Archief' ü 1 N reeks/vlvcrtr.:

Tentamen vak 4S581, d.d. 13 april 2011 Chemie en Transport in Energie Conversie Processen

AUDIT FACILITY MANAGEMENT

RAADSINFORMATIEBRIEF 12R.00353

Afhaling. Afhaling van gefrankeerde zendingen 1. Collect & Send 2. ATH (Afhaling ten Huize) 3. Transport (Afhaling per vrachtwagen)

Hoe meten we segregatie in het onderwijs?

DETERGENTEN IN UW DAGELIJKS LEVEN

Verbetering van de houdbaarheid van slad.m.v. Verdan" behandeling 1964.

10 zijn ingesloten binnen, het gesloten koelsysteem. Indien evenwel

Aanbevolen literatuur

Transcriptie:

Standaardsatemethoden 9 10Abby Israëls Statstsche Methoden (10003) Den Haag/Heerlen, 2010

Verklarng van tekens. = gegevens ontbreken * = voorlopg cfer ** = nader voorlopg cfer x = gehem = nhl = (nden voorkomend tussen twee getallen) tot en met 0 (0,0) = het getal s klener dan de helft van de gekozen eenhed nets (blank) = een cfer kan op logsche gronden net voorkomen 2008 2009 = 2008 tot en met 2009 2008/2009 = het gemddelde over de aren 2008 tot en met 2009 2008/ 09 = oogstaar, boekaar, schoolaar enz., begnnend n 2008 en endgend n 2009 2006/ 07 2008/ 09 = oogstaar, boekaar enz., 2006/ 07 tot en met 2008/ 09 In geval van afrondng kan het voorkomen dat het weergegeven totaal net overeenstemt met de som van de getallen. Colofon Utgever Centraal Bureau voor de Statstek Henr Faasdreef 312 2492 J Den Haag repress Centraal Bureau voor de Statstek - Grafmeda Omslag TelDesgn, Rotterdam Inlchtngen Tel. (088) 570 70 70 Fax (070) 337 59 94 Va contactformuler: www.cbs.nl/nfoservce Bestellngen E-mal: verkoop@cbs.nl Fax (045) 570 62 68 Internet www.cbs.nl ISS: 1876-0333 Centraal Bureau voor de Statstek, Den Haag/Heerlen, 2010. Verveelvoudgng s toegestaan, mts het CBS als bron wordt vermeld. 6016510003 X-37

Inhoudsopgave 1. Inledng op het thema...4 2. Drecte standaardsate...9 3. Indrecte standaardsate...17 4. Regresse-analyse...23 5. Vergelkng van de methoden...29 6. Lteratuur...30 7. Blage 1. Toets op gelkhed van leeftdsspecfeke sterftekansen... 32 8. Blage 2. Toepassng standaardsate op sterftecfers.. 34 3

1. Inledng op het thema 1.1 Algemene beschrvng en leeswzer Vooral n de demografe en n de epdemologe s een veel voorkomend probleem het vergelken van utkomsten van populates de qua opbouw verschllen ten aanzen van achtergrondkenmerken. Een voorbeeld hervan s het vergelken van sterftecfers ten gevolge van hart- en vaatzekten voor populates met een verschllende leeftdsopbouw. Landen met een onge bevolkng zullen b een vergelkbare gezondhedszorg doorgaans een lager sterftecfer hebben dan landen met een veel oudere bevolkng. Het (bruto-)sterftecfer s dan geen goede ndcator voor de gezondhed van de burgers. as wanneer men controleert voor leeftdseffecten, door ndvduen slechts per leeftdsklasse met elkaar te vergelken, s een eerlke vergelkng mogelk. Men kan daartoe voor edere populate leeftdsspecfeke sterftecfers bepalen. Maar kan men ook gemddelden bepalen de voor leeftd gecorrgeerd zn, de zogenaamde gestandaardseerde sterftecfers 1 of gestandaardseerde gemddelden. Hervoor zn standaardsatemethoden ontwkkeld, waarb men onderschedt: 1. een doelvarabele (); 2. populates, nl. a) de met elkaar te vergelken populates, en b) een standaardpopulate (referentepopulate); 3. varabelen waar men naar standaardseert, de zogenaamde verstorende kenmerken ; 4. een doelfuncte (gemddelde, ) of doelparameter (verwachtng, µ = E( ) ). In het genoemde voorbeeld s het wel/net sterven aan een hart- of vaatzekte n een bepaalde perode en populate, en µ de achterlggende sterftekans. Verder zn de onderscheden landen de populates, waarb bvoorbeeld één specfek land als standaard kan worden genomen. Ten slotte s Leeftd (n klassen) de varabele waarnaar wordt gestandaardseerd. Doelvarabele kan een bnare (0/1) varabele zn, zoals geen/wel sterfte, maar ook een meer algemene kwanttateve varabele, zoals aarloon, of een frequentevarabele (bv. het aantal zwangerschappen). Het type varabele kan van belang zn b het bepalen van betrouwbaarhedsmarges of b het modelleren. Het s ook mogelk (alle scores ut) een frequenteverdelng te standaardseren. 1 Sterftecfers worden op het CBS gedefneerd als aantallen overledenen n een bepaalde perode per 1 000 of 10 000 nwoners. In dt rapport defnëren we een sterftecfer als het gemddeld aantal sterfgevallen per nwoner. 4

De standaardpopulate kan één van de onderscheden populates zn. Vaak wordt echter de verengng van de beschouwde populates als standaard genomen ( sompopulate ). Ook kan men een hypothetsche referentegroep als standaard nemen. Wl men verschllen tussen populates n de td volgen dan kan men een standaardaar ntroduceren. Zo heeft men bvoorbeeld de hypothetsche, d.w.z. vereenvoudgde, populate voor Europa 1950 en Europa 2000 geconstrueerd. Gestandaardseerd wordt naar verstorende varabelen, de een eerlke vergelkng van de doelfuncte voor verschllende populates n de weg staan. Mortaltetscfers en morbdtetcfers (prevalentes, of gemddeld aantal zorgcontacten) worden b het CBS vrwel altd gestandaardseerd naar leeftd en geslacht, of naar leeftd per geslacht. Maar voor het vergelken van verzumpercentages tussen verschllende groepen medewerkers, zal ook het schaalnveau van de medewerkers als een verstorng kunnen worden opgevat, waarvoor gecorrgeerd moet worden. Verstorende varabelen zn varabelen waarvan het effect op de doelvarabele (al lang) bekend s, en waarb men dt effect wl wegrekenen om overblvende effecten of veranderngen zchtbaar te maken. Omdat het beschrven van de standaardsate n algemene termen moezame formulerngen oplevert, wordt de beschrvng zoveel mogelk gedaan aan de hand van het voorbeeld van sterftecfers de naar leeftd gestandaardseerd moeten worden. Door het gebruk van formules wordt vanzelf de benodgde algemene utleg berekt. Standaardsate s al voor actuarële berekenngen n gebruk snds het mdden van de 18e eeuw (Kedng, 1987), toen de zakapanner en zelfs mechansche rekenhulpen nog net ter beschkkng stonden. Andere toepassngen van standaardsate zn sterftecfers naar doodsoorzaak, zoals reeds genoemd, aantal zekenhusopnamen, vruchtbaarhedscfers, besteedbaar nkomen voor verschllende doelgroepen (gecorrgeerd voor bvoorbeeld verschllen n grootte en samenstellng van het hushouden), etc. Er bestaan vanouds twee methoden om te standaardseren: drecte en ndrecte standaardsate. B drecte standaardsate (hoofdstuk 2) wordt voor edere populate de verdelng van de verstorende kenmerken b de standaardpopulate gebrukt. B ndrecte standaardsate wordt voor edere populate het sterftecfer vergeleken met het sterftecfer dat zou zn verkregen wanneer de leeftdsspecfeke sterftecfers gelk zouden zn aan de van de standaardpopulate (hoofdstuk 3). Ook met lneare regresse s het mogelk sterftecfers te corrgeren voor verstorende kenmerken. B sterftecfers lgt het voor de hand om dan logstsche regresse toe te passen, omdat Sterfte een bnare varabele s. Deze en andere vormen van regresse-analyse worden n hoofdstuk 4 besproken. Ook wordt de lnk gelegd met drecte en ndrecte standaardsate. Vanwege de eenvoud en het fet dat er voor standaardsate mnder gegevens nodg zn, werden oorspronkelk vooral drecte en ndrecte standaardsate gebrukt. In hoofdstuk 5 komen ten slotte enkele verbanden tussen de verschllende methoden aan bod. Vanzelfsprekend wordt n het rapport ngegaan op voor- en nadelen van de methoden n dverse stuates. 5

1.2 Afbakenng en relate met andere thema s Zoals beschreven, worden standaardsatemethoden veel gebrukt om sterftecfers van populates met elkaar te vergelken, waarb wordt gecorrgeerd voor verschllen n leeftdsopbouw. Men kan overlevngstafels (ze thema Overlevngstafels ut de Methodenreeks; Van der Meulen, 2009) als bassmateraal gebruken voor drecte en ndrecte standaardsate. Standaardsatemethoden hebben een sterke gelkens met samengestelde ndexcfers (ze thema Indexcfers ut de Methodenreeks; Van der Grent en De Haan, 2008). B bede onderwerpen gaat het om de presentate van samenvattngsmaten, waarb een wegng plaatsvndt over de categoreën van de verstorende kenmerken. We bespreken de gelkens n de deelparagrafen 2.5.1 en 3.5.1. 1.3 laats n het statstsch proces Men kan standaardsate als een nadere analyse van de data beschouwen. Op het CBS worden echter b veel gezondhedsstatsteken en sommge bevolkngsstatsteken standaard zowel ongestandaardseerde als gestandaardseerde resultaten gepublceerd, omdat presentate van alleen ongestandaardseerde cfers gauw tot verkeerde nterpretates kan leden. Berekenen van gestandaardseerde cfers s daardoor vaak een vast onderdeel van de output. 1.4 Defntes Begrp bruto-sterftecfer sterfterato standaardseren, standaardsate gestandaardseerd gemddelde gestandaardseerd sterftecfer drecte standaardsate ndrecte standaardsate CMF SMR Omschrvng aantal overledenen n een bepaalde perode per x aantal van de bevolkng. Voor x neemt men vaak 1, 1000 of 10000. In dt rapport nemen we x=1. quotënt van bruto-sterftecfer van onderzochte en standaardpopulate. corrgeren van gemddelden of totaalcfers voor de nvloed van verstorende kenmerken gemddelde na correcte voor de nvloed van verstorende kenmerken aangepast bruto-sterftecfer, door correcte voor de nvloed van verstorende kenmerken (voorbeeld van een gestandaardseerd gemddelde) methode waarb (sterfte)cfers van een populate worden toegepast op een standaardbevolkng. methode waarb een geobserveerd (bruto-sterfte)cfer wordt vergeleken met het (sterfte)cfer dat wordt verkregen door ut te gaan van leeftdsspecfeke sterftecfers van een externe populate. Comparatve Mortalty Fgure Standard Mortalty Rato 1.5 Algemene notate We gebruken het subscrpt voor de klassen van de varabele (verstorend kenmerk) waar men naar standaardseert (=1,,I), voor de beschouwde populates (=1,,J) en s voor de standaard- of referentepopulate. 6

Verder s n een bepaalde perode = aantal personen n leeftdsklasse, populate, D = sterfte (aantal doden) n leeftdsklasse, populate. Bovenstaande gegevens zn de bassgegevens van waarut de onderstaande kunnen worden afgeled: + = = omvang populate, q = / + = leeftdsverdelng voor populate, D + = D = sterfte (aantal doden) n populate, = D / = D = leeftdsspecfeke sterftecfer n (,) = gemddelde sterfte per nwoner n (,), = D + / + = D. = bruto-sterftecfer = gemddelde sterfte per nwoner n. Achter een sterftefracte kunnen we een sterftekans µ denken zó dat µˆ =. Het bruto-sterftecfer s een gewogen som van de leeftdsspecfeke sterftecfers. = q. (1.1) Voor de standaardpopulate wordt subscrpt n deze formules vervangen door s. Vaak kest men voor de standaardpopulate de verengng van alle populates (=1,..,J). In dat geval geldt D D+ s = D+ s = + s = + D =,,,. (1.2) s Wanneer de sterftecfers op een bepaalde perode slaan, kan voor de populateomvang bvoorbeeld het gemddelde over een aantal datums ut de perode worden genomen (bvoorbeeld het gemddelde van de bevolkng aan het begn van de perode en de aan het end van de perode), of de populate-omvang op de mddelste datum. raktsch gezen s het zelden nodg om precezer te werken, maar men kan ook defnëren als het aantal persoonsaren n een bepaalde perode, d.w.z. de som van de ndvduele rscoperoden voor alle personen, utgedrukt n aren. D s een geaggregeerde groothed. We kunnen de achterlggende varabele D (Sterfte) defnëren met de persoon als obecttype. D s dan een bnare varabele met waarden 1 (overleden) en 0 (net overleden), en D k de score op varabele D van ndvdu k ut leeftdsklasse en populate (k=1,, ). Meer algemeen kunnen we utgaan van een kwanttateve varabele met ndvduele scores k met k = 1,,. s dus gedefneerd als het gemddelde van deze ndvduele scores. Evenzo kunnen we zen als een aggregaat van ndvduele scores k. Als bnar s, geldt k = D k, omdat k 1. Standaardsatemethoden worden afgeled n termen van en, maar omdat ze vaak 7

worden toegepast op bnare varabelen, zullen we de meeste formules ook weergeven n termen van D en. Ten slotte defnëren we sterfterato s. De leeftdsspecfeke sterfterato voor populate ten opzchte van de standaardpopulate s s D / R == Ds / s s (=1,,I). (1.3) De bruto-sterfterato voor populate t.o.v. de standaardpopulate s s D / + +. R == D+ s / + s.s. (1.4) Gemakshalve laten we b deze rato s de subscrpten en s weg. Als gevolg van verschllende leeftdsverdelngen lgt de bruto-sterfterato R net per se tussen de maxmum- en mnmum-r n. Gestandaardseerde sterfterato s voldoen wel aan de es. Om wat meer vertrouwd met de notate te geraken geven we n tabel A (en B) van blage 2 een getallenvoorbeeld; ze kolommen (1)-(10). Op deze tabel zullen n de volgende hoofdstukken een aantal standaardsatemethoden worden toegepast. In paragraaf 2.4 wordt het oorspronkelke doel van de analyse utgelegd. De tabel bestrkt de perode 1979-1986. De aantallen overledenen (D en D s ) hebben dus betrekkng op een perode van acht aar. De populate-aantallen ( etc.) n deze tabel zn sommen van de aartotalen over deze acht aren, als benaderng van het aantal persoonsaren; we hadden n plaats hervan de gemddelden over de aren kunnen nemen. Het aartotaal n aar t s berekend als het gemddelde van de bevolkngsomvang op 1 anuar t en 1 anuar t+1. 8

2. Drecte standaardsate 2.1 Korte beschrvng B drecte standaardsate worden voor edere populate de leeftdsspecfeke sterftecfers gewogen met een standaard-leeftdsverdelng (leeftdsverdelng n de standaardpopulate).p.v. met de egen leeftdsverdelng zoals b het brutosterftecfer van formule (1.1). Dt ledt tot het drect gestandaardseerde sterftecfer voor populate : DIR q. (2.1) s Delen door het bruto-sterftecfer n de standaardpopulate ledt tot de zogenaamde Comparatve Mortalty Fgure 2 : CMF q q s s s q s s. (2.2) De CMF s dus een maat voor de verhoudng van de sterfte b populates en s, gecorrgeerd voor leeftd. Zowel het berekenen van formule (2.1) als (2.2) wordt drecte standaardsate genoemd. 2.2 Toepasbaarhed 1. De CMF stelt ons nstaat de sterfte n een populate te vergelken met de sterfte n de standaardpopulate. Omdat er een vaste standaard wordt gehanteerd, laten de CMF s ook toe om de sterftecfers n meerdere populates onderlng te vergelken; de noemers zn namelk gelk. B ndrecte standaardsate lgt dt vergelken van sterftecfers van verschllende populates moelker (hoofdstuk 3). Daarom heeft drecte standaardsate n het algemeen de voorkeur wanneer men de sterfte n bvoorbeeld meerdere landen of rego s met elkaar wl vergelken, of voor meerdere aren of dverse herkomstgroepen. 2. In formule (2.4) n paragraaf 2.3.1 zal worden getoond dat de CMF te schrven s als een gewogen gemddelde van de leeftdsspecfeke sterfterato s R ut (1.3), waarb wordt gewogen met de fracte doden n de standaardpopulate. Er bestaat een dscusse over het toepassen van drecte standaardsate wanneer de R onderlng sterk verschllen. Sommge auteurs vnden dat men zch n dat geval moet beperken tot het publceren van leeftdsspecfeke sterftecfers en dat slechts b redelk homogene R de CMF een znvolle samenvattngsmaat van de R s s. Anderzds zn we gewend om gemddelde scores te publceren 2 Verwarrend s dat sommgen de term Comparatve Mortalty Rate (CMR) gebruken voor het gemddelde van het bruto- en het drect gestandaardseerde sterftecfer. 9

(bvoorbeeld een bruto-sterftecfer), zonder dat dt verest dat edereen (of edere leeftdsklasse) dat gemddelde scoort. Dt geeft voor andere auteurs een rechtvaardgng voor het berekenen van een CMF, ook wanneer de R s onderlng aanzenlk verschllen. Maar men moet zch dan wel bewust zn van de nvloed de de gewchten van R op de utkomst hebben, en het s dan toch verstandg om ook de R te presenteren. Meer over voor- en nadelen van het bepalen van gestandaardseerde cfers vndt men n Fless (1973, hoofdstuk 13). 3. Het kezen van een vaste (net-stochastsche) of zeer grote standaardpopulate vergroot de nauwkeurghed van de CMF en vergemakkelkt de berekenng van standaardfouten (paragraaf 2.3.2). Vaak neemt men als standaard de verengng over alle populates =1,,J, d.w.z. over alle te beschouwen landen, rego s of peroden. Soms moet nternatonale overeenstemmng berekt worden over de keuze van een geschkte standaardpopulate. Op het CBS wordt drecte standaardsate ook toegepast b lange tdreeksen van mortaltets- en morbdtetscfers, waarb naast verschllende aren ook verschllende populates (bvoorbeeld herkomstgroepen) onderlng worden vergeleken, door te standaardseren naar leeftd (apart per geslacht, of samen); s dan dus een combnate van populate en aar. Er zn dan meer keuzen voor de standaardpopulate. Soms wordt gestandaardseerd naar de sompopulate (bvoorbeeld alle herkomstgroepen) n een te selecteren bassaar. Maar men kan ook kezen voor alleen standaardseren bnnen het aar (met elk aar de sompopulate van de herkomstgroepen van dat aar als standaard), zoals wordt gedaan b de standaardsate van husartscontacten, waar nog geen lange tdreeks s. 4. Toepassen van drecte standaardsate s af te raden wanneer voor één of meer leeftdsklassen q heel klen s en de bbehorende q s veel groter. = D / s dan op weng waarnemngen gebaseerd en telt toch zwaar mee n (2.1). De varantes van DIR en CMF, de n paragraaf (2.3.2) worden gegeven, worden daardoor zeer groot. In tabel B van blage 2 zouden we her al last mee krgen wanneer we de leeftdsklasse 65+ meenemen, maar zeker wanneer we deze klassen zouden utspltsen. De verhoudng q s /q s her gelk aan 9,95/0,16 = 63, hetgeen betekent dat de bdrage voor deze leeftdsklasse aan de standaardfout b drecte standaardsate 63 keer zo groot s als b het brutosterftecfer.s. Dt wordt nauwelks door de andere leeftdsklassen gecompenseerd. Vanzelfsprekend heeft naast de q-rato ook het aantal waarnemngen,, nvloed op de standaardfout. Het probleem kan zch ook voordoen voor landen met weng ouderen b een nternatonale vergelkng van sterftecfers. Vanwege het rsco op grote varantes moet men dan b drecte standaardsate zung zn met utspltsngen voor de hogere leeftdscategoreën, wanneer de q-rato daardoor sterk zou toenemen en het aantal waarnemngen ( ) gerng s. Om dezelfde reden moet men zung zn met het aantal verstorende kenmerken waarnaar men 10

standaardseert. In prncpe worden namelk alle nteractes tussen deze kenmerken meegenomen; ze herover paragraaf 4.5.1. Een CBS-praktkvoorbeeld s de LMR-statstek Landelke Medsche Regstrate, waar aantallen zekenhusopnamen naar herkomstland drect gestandaardseerd worden naar de leeftdsverdelng van de totale ederlandse bevolkng (per geslacht en totaal). Om toch betrouwbare gestandaardseerde cfers te verkrgen, beperkte men aanvankelk de populate tot 0-50-argen, en later (toen de allochtonenpopulate n oudere leeftdsgroepen gegroed was) tot 60 aar. Het kan ook voorkomen dat onbekend s, doordat sterftecfers net n edere populate per leeftdsklasse zn gegeven. In dat geval s drecte standaardsate onmogelk en beslut men vaak tot ndrecte standaardsate. 5. Standaardsate s net alleen toepasbaar op dummy-varabelen zoals wel/geen sterfte, maar ook op kwanttateve -varabelen. Zo s n Israëls en De Ree (1981) standaardsate toegepast voor een vergelkng van lonen tussen verschllende economsche bedrfstakken, waarb s gestandaardseerd naar leeftd en opledng van de werknemers. 2.3 Utgebrede beschrvng 2.3.1 Bepalng van de CMF Door vermengvuldgng van teller en noemer van formule (2.2) met +s kunnen we de CMF schrven als CMF = s s s = ( s D / ) D + s. (2.3) De noemer s nu het aantal doden n de standaardpopulate, en de teller het drect gestandaardseerde aantal doden n populate, d.. het aantal personen dat zou zn gestorven wanneer populate de leeftdsverdelng van de standaardbevolkng zou hebben. De CMF s ook te schrven als een gewogen som van de leeftdsspecfeke sterfterato s R met gewchten = D / D : w s s + s s ss R Ds R CMF = = = = ws R. (2.4) D s s s s We kunnen de CMF dus zen als een samenvattngsmaat voor de leeftdsspecfeke sterfterato s R, met gewchten w s evenredg aan D s. In paragraaf 2.2, tem 2, hebben we al vraagtekens gezet b het presenteren van de CMF wanneer de R te heterogeen zn. In paragraaf 3.5 tonen we de gelkens van formule (2.4) met het Laspeyres-prsndexcfer. s 11

2.3.2 Standaardfout van DIR en CMF DIR B het bepalen van de standaardfout van of CMF zn en s doorgaans bekende populate-aantallen en hebben dus varante nul. Ook wanneer het geschatte populate-aantallen of steekproefaantallen zouden zn, s het verdedgbaar om condtoneel op deze aantallen te werken. Het gaat mmers om vergelkng van sterftekansen. Ook de aantallen doden D en D +s (=1,,I) zn populatecfers. Maar sterftecfers D worden n het algemeen toch als stochastsch behandeld. Het al dan net sterven wordt dan gezen als het resultaat van een kansmechansme dat ook net anders had kunnen utvallen. Zo wordt aangenomen dat het aantal doden D bnomaal verdeeld s met parameters en sterftekans p, waardoor de varante van D gelk s aan 3 Var D ) p (1 = p ) (2.5) ( en de geschatte varante aan D D D var( D ) = (1 ) D (1 = ). (2.6) Wanneer de sterftekans klen s, d.w.z. D «(ofwel «1), s D b benaderng osson-verdeeld, waardoor Var ( D ) = p en var( D ) = D. Utgaande van de bnomale verdelng van D s de geschatte varante van het drect gestandaardseerde sterftecfer dr D 1 1 D 2 2 var( ) = var( q s ) = q s var( D ) (1 ) 2 q s D 2 =. (2.7) Herb s aangenomen dat de geschatte sterftecfers voor verschllende leeftdsklassen onafhankelk zn. Verkeersongelukken of epdemeën verstoren deze aanname, maar deze verstorng zal doorgaans relatef klen zn. Voor de varante van het gestandaardseerd aantal doden moeten we de varante ut (2.7) 2 met + s vermengvuldgen. De 95%-betrouwbaarhedsmarge van het drect gestandaardseerde sterftecfer s 1,96 keer de wortel ut (2.7), utgaande van de normale verdelng. Voor de varante van de CMF hebben we strkt genomen ook te maken met de stochastek van D +s ; ze formule (2.3). Deze stochastek wordt n de lteratuur verwaarloosd, omdat de standaardpopulate (veelal de sompopulate) haast altd zeer groot s. Chang (1984) stelt zelfs dat alleen D als stochastsch dent te worden beschouwd. De varanteschatter van de CMF volgens formule (2.2) wordt dus 3 We onderstrepen de stochastsche groothed D n de varanteformules, ter ondersched van de realsates D. 12

2 1 dr 1 D s var( CMF) = var( ) (1 ) 2 D 2 2 =. (2.8) D s + s Chang (1961, 1984) gaat b de varanteberekenngen ut van een ets andere stuate, namelk van overlevngstafels (Van der Meulen, 2009) waar geen sprake s van aarlkse sterfte, maar van het overlden n een bepaalde leeftdsklasse. Als een kwanttateve varabele s, moeten de varanteformules vanzelfsprekend worden aangepast. Voor wordt dan een theoretsche verdelng aangenomen, of wordt de varante geschat op grond van de waargenomen verdelng. Een voorbeeld hervan s te vnden n De He e.a. (2010). Voor het bepalen van het 95%-betrouwbaarhedsnterval van de CMF, kan men utgaan van normaltet van de CMF en 1,96 SE( CMF) 1,96 var( CMF) als marge hanteren. Omdat rato s asymmetrsch zn, raden Breslow en Day (1987) een log-transformate aan. Dt geeft 1,96SE{ln( CMF)} = 1,96{ SE( CMF)} / CMF als 95%-marge voor de natuurlke logartme van CMF, waarna va de e-macht het nterval kan worden teruggetransformeerd. Dezelfde transformate kan worden gebrukt voor het toetsen van CMF = 1. De toets of de CMF s van twee verschllende populates en ten opzchte van dezelfde standaardpopulate aan elkaar gelk zn s her eenvoudg ut af te leden (Breslow en Day, 1987). Deze toets komt er namelk op neer dat het quotënt van de twee gestandaardseerde sterftecfers (ofwel van de twee CMF s) gelk aan 1 s. Wanneer populate een deel s van de standaardpopulate, zoals het geval s wanneer de standaardpopulate de verengng s van alle beschouwde populates, dan kan men ets nauwkeurger toetsen door de sterfte n populate te vergelken met de n de verengng van de overge populates, s\; ze ule (1934). 2.4 Voorbeeld Voorbeeld 1. Sterftecfers Turkse en ederlandse mannen, 0-44 aar: drecte standaardsate In Hoogenboezem en Israëls (1990) zn analyses gedaan naar verschllen n sterftecfers tussen Turkse, Marokkaanse en ederlandse ngezetenen naar dverse doodsoorzaken n de aren 1979-1988. Aanledng daartoe waren vragen n de Tweede Kamer over de hoge sterfte onder Turkse en Marokkaanse knderen n ederland, vergeleken met autochtone leeftdsgenoten. In Hoogenboezem en Israëls (1990) s gekozen voor ndrecte standaardsate. In dt voorbeeld geven we ter vergelkng de resultaten van drecte standaardsate op de data van tabel A van blage 2, terwl we n paragraaf 3.4 de resultaten van ndrecte standaardsate bespreken. De data ut tabel A wken overgens ets af van de n Hoogenboezem en Israëls (1990); we beperken ons her tot de aren 1979-1986 en tot mannen < 45 aar. 13

Het drect gestandaardseerde sterftecfer volgens formule (2.1) s gelk aan 0,00137, dus 13,7 per 10.000 mensen; ze kolom (11) n tabel A van blage 2. De CMF volgens formule (2.2) s derhalve gelk aan 13,71/8,71 = 1,575; ze kolom (12). Vermengvuldgng van teller en noemer met s / 10.000 = 38 287 704 / 10.000 toont dat het drect gestandaardseerd aantal Turkse overledenen n de perode 1979-1986, de teller van formule (2.3), gelk s aan 52 501, wat 1,575 keer het aantal overleden ederlandse mannen van 33 336 s. Concluse s dat de sterfte onder Turkse mannen tot 45 aar rum 1½ keer zo groot s als b de autochtonen. Dat de extra sterfte net constant over de leeftdsklassen s, tonen de waarden van R n tabel A. B knderen s de sterfterato veel groter dan 1½. Zouden we de omgekeerde standaardsate hebben toegepast, d.w.z. de sterfte van ederlanders () vergelken met de Turken als standaard, dan geeft dt een CMF van 0,619. Dat verschlt slechts weng met de recproque van 1,575, maar dat s geen algemeenhed, omdat verschllende standaards worden gebrukt. We hadden ook de leeftdsklassen 45-65 en 65+ kunnen meenemen (tabel B). In dat geval hadden we een CMF gekregen van 0,611.p.v. 1,575! et alleen s de sterfte n de hogere leeftdsklassen b Turken lager dan b ederlanders, het zn ook de klassen de verut het grootste gewcht krgen, omdat daarn de meeste autochtonen overlden. Het aantal Turkse 65+-ers s zelfs zo gerng dat een verdere utspltsng naar doodsoorzaak net mogelk s, omdat de varante van de CMF per doodsoorzaak te zeer zou toenemen. Herom s n Hoogenboezem en Israëls (1990) ndrecte standaardsate toegepast (paragraaf 3.4) Utgaande van normaltet van de CMF, dan wordt het 95%-betrouwbaarhedsnterval voor CMF (1,462; 1,687), symmetrsch om 1,575. Gaan we ut van normaltet van de n(cmf), wat beter s, dan krgen we het asymmetrsche betrouwbaarhedsnterval (1,466; 1,692). Het verschl s gerng. Vanwege de klene sterftekansen mochten we aannemen dat de varabele Sterfte osson s verdeeld. 2.5 Egenschappen 2.5.1 Relate met het Laspeyres-prsndexcfer In het themarapport Indexcfers n de Methodenreeks (Van der Grent en De Haan, 2008) komt de volgende formule voor: t,0 L q q 0 0 p p t 0 w 0 p p t 0 w 0 I t,0. (2.9) t,0 Herb s L het Laspeyres-prsndexcfer n verslagperode t ten opzchte van t 0 bassperode 0, p de gemddelde prs van artkel n verslagperode t, q de geconsumeerde hoeveelhed van artkel n bassperode 0 en 14

w 0 t,0 q 0 p 0 t 0 / p / q p het gewcht van het enkelvoudge prsndexcfer 0 0 I p van artkel n het Laspeyres-prsndexcfer. Evenals b ons zn de q relateve bdragen (consumptepatronen voor artkelen.p.v. leeftdsverdelngen), en de w gewchten. Gemddelde przen p nemen de t,0 plaats n van leeftdsspecfeke sterftecfers, en ndex I de plaats van rato R, R. s De nterpretate van formules (2.9) en (2.4) s wel engszns verschllend. B ndexcfers gaat het er altd om gemddelde przen n twee peroden met elkaar te vergelken, waarb de przen worden gewogen met hoeveelheden q. De populates zn artkelen n twee peroden, waartussen een gemddelde prstoename wordt gedefneerd. B demografsche en gezondhedsstatsteken gaat het b standaardsate meestal om verschllen tussen populates op hetzelfde tdstp, maar b lange tdreeksen wordt op het CBS ust wel n de td gestandaardseerd, met de populate van een bassaar als standaard. Wanneer er meer dan twee populates b de analyse zn betrokken, s b prsndces altd sprake van een n de td geordende sere prsndexcfers; b standaardsate van populates op hetzelfde tdstp neemt men vaak de verengng van alle populates als standaardpopulate. B prsndexcfers zn zowel de gemddelde przen als de hoeveelheden stochastsch, tenz er sprake s van volledge waarnemng van przen en/of transactes. Indvdueel gemeten przen zn realsates van een kwanttateve varabele. B standaardsate voor sterfte of morbdtet zn de aantallen () meestal vast en s alleen sterfte een stochastsche varabele, de bovenden bnar s, wat de berekenng van betrouwbaarhedsntervallen vereenvoudgt. rzen kunnen ook n de rumte (tussen landen) worden vergeleken.p.v. n de td; meer hervoor n de laatste alnea van paragraaf 3.5.1. 2.5.2 Standaardseren van nomnale varabelen Tot nu toe was varabele D de bnare varabele Sterfte. Men kan gestandaardseerde gemddelden meer algemeen berekenen voor edere categore van een nomnale varabele met een multnomale verdelng; ze De Ree en Israëls (1982). er categore gelden dan dezelfde formules als voor wel/geen sterfte. Zo zn n Hoogenboezem en Israëls (1990) de formules ook toegepast op sterfte naar doodsoorzaak, al s daar utendelk gekozen voor ndrecte standaardsate (ze paragraaf 3.5.2 voor ndrecte standaardsate voor nomnale varabelen). Het s eenvoudg aan te tonen dat de drect gestandaardseerde sterftecfers per doodsoorzaak optellen tot het drect gestandaardseerde sterftecfer voor alle doodsoorzaken tezamen, en dat de CMF s per doodsoorzaak gewogen optellen, met het aantal doden n de standaardpopulate als gewchten. Immers ook de noemers van de CMF s per doodsoorzaak tellen op tot de noemer van de CMF voor de totale sterfte. 15

2.6 Kwaltetsndcatoren aast het berekenen van standaardfouten en toetsen (paragraaf 2.3.2), kan men de stabltet van de oplossng onderzoeken door een gevoelghedsanalyse ut te voeren. Zo kan men kken of de gestandaardseerde cfers bestand zn tegen het samenvoegen van leeftdsklassen. Wanneer dt tot grote verschllen ledt heeft men een probleem: de oplossng s dan kennelk nstabel. Een oplossng met meer klassen zal een grotere varante hebben, maar mnder vertekenng. De vertekenng s alleen meetbaar wanneer men van een bepaald model utgaat, bvoorbeeld een lnear verband tussen leeftd en de doelvarabele. Het s daarom net altd te bepalen of de mean square error (gemddelde kwadratsche afwkng) door samenvoegen van klassen toe- of afneemt. In de regel zal men besluten klassen samen te voegen wanneer de varante daardoor sterk afneemt. Het s verstandg om net alleen op geaggregeerd nveau de (gestandaardseerde) sterfte n populate met de n de standaardpopulate te vergelken, door de CMF en bbehorende marge te bepalen, maar om ook te toetsen of leeftdsspecfeke sterftekansen gelk zn, d.w.z. µ = µ s voor =1,,I. Ze voor deze toets blage 1. 16

3. Indrecte standaardsate 3.1 Korte beschrvng B ndrecte standaardsate berekent men de Standard Mortalty Rato (SMR), ook wel Standard Morbdty Rato genoemd, SMR q q s q s. (3.1) Het verschl met de CMF s dat n teller en noemer de gewchten q s zn vervangen door q. De teller s het bruto-sterftecfer van populate ; de noemer s het sterftecfer n populate wanneer de leeftdsspecfeke sterftecfers gelk zouden zn aan de van de standaardpopulate. De SMR geeft dus aan hoeveel doden er naar verhoudng meer of mnder n populate zn dan n de standaardpopulate wanneer deze de leeftdsverdelng van populate had gehad. 3.2 Toepasbaarhed We hebben gezen n paragraaf 2.2, tem 4, dat drecte standaardsate tot grote standaardfouten ledt, wanneer één of meer leeftdsspecfeke sterftecfers op klene aantallen berusten en desondanks sterk meewegen. Indrect standaardseren s her net gevoelg voor en verdent dan de voorkeur. Een tweede reden om ndrecte standaardsate toe te passen s wanneer drecte standaardsate net mogelk s omdat er benodgde gegevens ontbreken. Vaak zn de leeftdsspecfeke sterftecfers (ofwel het aantal overledenen D ) net voor alle populates bekend en kan men daarom de DIR net berekenen. B ndrecte standaardsate zn de leeftdsspecfeke sterftecfers alleen nodg voor de standaardpopulate, en de zn dan vaak wel gegeven. Samenvattend zen we dat het onbetrouwbaar zn of ontbreken van de leeftdsspecfeke sterftecfers reden s geen drecte standaardsate te gebruken. B ndrecte standaardsate wordt de sterfte per populate vergeleken met de n de standaardpopulate. Het onderlng vergelken van meerdere populates kan echter nterpretateproblemen geven. Drecte standaardsate s daarvoor geschkter, omdat daarb een vaste wegng wordt gebrukt, namelk de van de standaardpopulate. Meer herover n paragraaf 3.5. 3.3 Utgebrede beschrvng 3.3.1 Bepalng van de CMF We kunnen de SMR ook schrven als 17

SMR s D D s / s ( D / s ) D s. (3.2a) u s de teller het waargenomen aantal doden n populate, en de noemer het verwachte aantal doden n populate wanneer de sterftekans per leeftdsklasse gelk s aan de van de standaardpopulate. De SMR wordt daarom ook wel weergegeven als waarb SMR O E, (3.2b) O D staat voor observed count en E E s voor expected count, een meer gebrukte notate n de statstek. Fetelk s dt een utwerkng van een modelmatge aanpak, waarb een osson-model wordt aangenomen voor het aantal doden D met als verwachtng E E( D ) E( ). (3.3a) s De E ) zn parameters voor de leeftdsspecfeke sterfte, d.w.z. dat µ de ( sterftekans s voor personen ut cel (,), met als realsate. Breslow en Day (1975) veronderstellen een multplcatef model voor deze sterftekansen, E( ), (3.3b) waarb het effect s van leeftd op de sterftekans, en het effect van de populate. Dt multplcateve model gaat er dus vanut dat de sterftekansen geen nteracte Leeftd x opulate bevatten, wat betekent dat de waargenomen leeftdsspecfeke sterftecfers R redelk homogeen zn; ze heromtrent opmerkng 2 n paragraaf 2.2. Invullen van (3.3b) n (3.3a) betekent dat wordt aangenomen dat de kansvarabele D een osson-verdelng heeft met parameter ( ). Model (3.3) kan worden gezen als een osson-regresse (McCullagh en elder, 1989). Een specfeke schattng van de parameters ledt tot de SMR als schatter voor ; ze Breslow and Day (1975). We komen herop terug n deelparagraaf 4.5.2. Een alternateve schrfwze voor formule (3.2a), vergelkbaar met formule (2.4) voor de CMF, s met w * SMR s s s s R s w R *. (3.4). Dus evenals de CMF s de SMR een gewogen gemddelde van de leeftdsspecfeke rato s R, z het dat de gewchten ngewkkelder te nterpreteren zn. Het s dan ook net verwonderlk dat een aantal 18

prettge egenschappen de b drecte standaardsate gelden, b ndrecte standaardsate net gelden. We komen her n paragraaf 3.5 op terug. Een derde representate van de SMR s: 1 R SMR = = = = w R s / R 1 1 1 (3.5) met w D D+ = /. In paragraaf 3.5 tonen we de gelkens met het aascheprsndexcfer. Evenals b drecte standaardsate kan de rato (SMR.p.v. CMF) op het nveau van sterftecfers worden gebracht door vermengvuldgng met. s, het sterftecfer n de standaardpopulate: =. (3.6) IDIR SMR. s =. s q s IDIR wordt het ndrect gestandaardseerde sterftecfer genoemd. Evenzo ledt vermengvuldgng van de SMR met D +s tot het ndrect gestandaardseerde aantal doden n populate. Meestal beperkt men zch echter tot de SMR. De ndrect gestandaardseerde cfers leveren geen extra nterpretate op en worden wel IDIR ontraden. Fless (1973, p. 169) laat zen dat groter (of klener) kan zn dan alle, hetgeen onwenselk s. 3.3.2 Standaardfout van SMR We zouden kunnen aannemen dat D + bnomaal verdeeld s met parameters + en sterftekans p, met pˆ =. Sterftekansen verschllen echter sterk tussen leeftdsklassen. Daarom gaan we evenals n paragraaf 2.3.2 ut van een bnomale verdelng van D met parameters en p (=1,,I). Bnnen edere leeftdsklasse heeft edereen dan wel dezelfde sterftekans. Gebrukmakend van formule (2.5) s de varante van D + Var ( D ) = Var( D ) = Var( D ) = p (1 p ). (3.7) + De schatter hervan s D var( D + ) = (1 ) = D ( )1, (3.8) Dt ledt volgens formule (3.2a) tot D+ 1 D var( SMR ) = var( ) = D ( )1, (3.9) 2 E E 19

met E het verwachte (expected) aantal doden. Aangenomen wordt her dat E net stochastsch s, wat nhoudt dat D s als net-stochastsch wordt opgevat. Dt s te verdedgen wanneer men de zaak modelmatg bezet, zoals Breslow en Day doen (ze formule (3.3)), of wanneer de D s zo groot zn dat hun effect op de varante van de SMR te verwaarlozen s. Zonder de model-aanname zal de varante van SMR groter zn, omdat dan ook D s als stochastsch wordt beschouwd. Evenals b de drecte standaardsate worden de formules eenvoudger wanneer we aannemen dat D osson s verdeeld. Ut formule (3.9) volgt dat de varante van SMR dan gelk s aan SMR 2 /D +. Voor betrouwbaarhedsntervallen en voor het toetsen of SMR = 1 behoort men eerst een log-transformate op de SMR ut te voeren, net als b de CMF n paragraaf 2.4 (Breslow en Day, 1987). 3.4 Voorbeeld Sterftecfers Turkse en ederlandse mannen, 0-44 aar: ndrecte standaardsate We passen nu ndrecte standaardsate toe op tabel A van blage 2. De resultaten staan n de kolommen (13) en (14). Het aantal doden per 10.000 Turkse mannen,., was n de perode 1979-1986 gelk aan 14,6 (kolom 8). Dt s de teller van formule (3.1). De noemer, het sterftecfer per 10.000 Turkse mannen wanneer de leeftdsspecfeke sterftecfers gelk zouden zn aan de van de ederlandse mannen, s gelk aan 9,05 (kolom 13). De SMR voor Turkse mannen t.o.v. ederlandse mannen s dus gelk aan 14,6/9,05 = 1,616. Dat s ets hoger dan de CMF van 1,575 ut paragraaf 2.4. 4 Dat komt doordat er relatef meer Turken dan ederlanders ztten n de leeftdsklassen met hoge sterfterato s R, namelk de 1-14-argen; vergelk formules (2.2) en (3.1). (, IDIR het ndrect gestandaardseerde sterftecfer volgens formule (3.6), s gelk aan 1,616 x 8,7 x 10-4 = 0,00141, oftewel 14,1 doden per 10.000.) Het verschl met drecte standaardsate voor de populate tot 45 aar blkt dus net erg groot. B beperkng tot deze leeftd had dus ook drecte standaardsate kunnen worden toegepast. In Hoogenboezem en Israëls (1990) s voor ndrecte standaardsate gekozen, omdat drecte standaardsate tot grote standaardfouten zou hebben geled voor andere herkomstgroepen, met name voor Turkse en Marokkaanse vrouwen. Bovenden gng het om een vergelkng van butenlanders met ederlanders, en net tussen butenlanders onderlng, zoals n paragraaf 2.4 s utgelegd. Wanneer e alle leeftden beschouwt, volgens de ndelng van tabel B van blage 2, dan wkt drecte standaardsate wel sterk af van ndrecte standaardsate: CMF = 0,611 en SMR = 0,920. Dt verschl wordt veroorzaakt door het veel klenere aandeel van de leeftdscategoreën 45-64 en 65+ b Turkse t.o.v. ederlandse mannen. In de categoreën overleden relatef weng Turken. 4 Merk op dat bede gestandaardseerde sterftecfers klener zn dan het bruto-sterftecfer van 1,68 (kolom 10). Leeftd verklaart dus een deel van de hogere sterfte b Turkse mannen. 20

De omgekeerde standaardsate, d.w.z. de sterfte van ederlandse mannen () ten opzchte van de Turkse mannen als standaard, geeft een SMR van 0,635. Dat verschlt slechts weng met de recproque van 1,616, maar dat s geen algemeenhed, omdat verschllende standaards worden gebrukt. Utgaande van normaltet van de SMR, s het 95%-betrouwbaarhedsnterval voor SMR (1,507; 1,726), symmetrsch om 1,616. Gaan we ut van normaltet van de n(smr), wat beter s, dan krgen we het asymmetrsche betrouwbaarhedsnterval (1,510; 1,730). Het verschl s gerng. Vanwege de klene sterftekansen hebben we herb aangenomen dat de varabele Sterfte osson s verdeeld. 3.5 Egenschappen 3.5.1 Relate met het aasche-prsndexcfer In het themarapport Indexcfers n de Methodenreeks (Van der Grent en De Haan, 2008) komt de volgende formule voor: met q p t t 1 1 t t,0 t p = = = 0 0 w t q p p w t t,0 ( I ) 1 1 (3.10) t,0 het aasche-prsndexcfer n verslagperode t ten opzchte van bassperode 0, t p de gemddelde prs van artkel n verslagperode t, geconsumeerde hoeveelhed van artkel n verslagperode t en t t t w = q p / t q de t,0 t 0 het gewcht van het enkelvoudge prsndexcfer I = p / p van artkel n het aasche-prsndexcfer. We zen her de gelkens tussen de formules (3.10) en (3.5), analoog aan de n paragraaf 2.5 beschreven gelkens tussen de CMF en het Laspeyres-prsndexcfer. rzen kunnen ook n de rumte (tussen landen) worden vergeleken.p.v. n de td. Dergelke (nternatonale) koopkrachtparteten worden zowel met drecte als ndrecte standaardsate bepaald, waarna een gemddelde van bede wordt genomen, ets wat n het algemeen b standaardsatemethoden weng wordt toegepast, vermoedelk omdat het de nterpretate bemoelkt. q t p t 3.5.2 Standaardseren van nomnale varabelen In deelparagraaf 2.5.2 hebben we de stuate besproken waarn de totale sterfte gespltst wordt naar doodsoorzaak. er doodsoorzaak gelden dan dezelfde formules als voor sterfte totaal. Omdat b de SMR, net als b de CMF, zowel de tellers als de noemers over de doodsoorzaken optellen tot resp. teller en noemer voor alle doodsoorzaken tezamen, s ook de totale SMR een gewogen som van de SMR s per doodsoorzaak. De verwachte (expected) aantallen doden per doodsoorzaak vormen de gewchten. 21

3.5.3 Vergelkng SMR s van twee populates met de standaard In paragraaf 3.2 s al vermeld dat het onderlng vergelken van twee populates door mddel van ndrecte standaardsate problematsch s. Fless (1973, p. 161) geeft een voorbeeld van twee populates en met exact dezelfde leeftdsspecfeke sterftecfers, dus =, maar met verschllende leeftdsverdelngen. Dat ledt tot SMR{:s} SMR{ :s}; ze bvoorbeeld formule (3.4). Er s b ndrecte standaardsate dus geen volledge correcte voor leeftdsverschllen tussen de populates (Rothman, 1986). Maar n de praktk zn de verschllen doorgaans klen. De twee SMR s zn wel gelk wanneer s de verengng s van de populates en. Dan s mmers = = s en zn bede SMR s gelk aan 1. Algemener geldt dat wanneer / constant s, de verhoudng van de SMR s gelk s aan de constante. Formule (2.4) toont dat wanneer = wel altd geldt dat CMF{:s} = CMF{:s}, omdat een vaste standaard wordt gebrukt. 3.6 Kwaltetsndcatoren Ze paragraaf 2.6. 22

4. Regresse-analyse 4.1 Korte beschrvng B regresse-analyse wordt een afhankelke varabele geschreven als functe van één of meer verklarende varabelen. Veelal gebrukt men het lneare (addteve) regressemodel =Xß+. Voor edere n het model opgenomen X-varabele geeft de bbehorende ß-parameter de nvloed op, na correcte voor de nvloed van de overge X-varabelen op. omnale verklarende varabelen kunnen worden meegenomen door het creëren van dummy-varabelen. Met regresse-analyse kan men dus effecten voor elkaar corrgeren, dus ook het effect van een populate op het sterftecfer voor leeftdsnvloeden. Men kan ook gemddelden voor de populates berekenen, gecorrgeerd voor dergelke leeftdsnvloeden. Wanneer Leeftd en/of andere verstorende kenmerken n klassen worden ngedeeld, zouden we dt regresse-standaardsate kunnen noemen. Omdat de verklarende varabelen n klassen zn ngedeeld, kunnen we ook spreken van varante-analyse.p.v. regresse-analyse. Het gaat dan om een varante-analyse van Sterfte op Leeftd (klassen ) en opulate (klassen ). 4.2 Toepasbaarhed In het geval van meerdere verstorende kenmerken worden b drecte en ndrecte standaardsate automatsch alle nteractes tussen deze kenmerken meegenomen. Combnates van deze kenmerken kunnen als één (product)varabele worden opgevat. Regresse-analyse kan ook modellen zonder nteractes aan. Deze modellen zn veel zunger n het aantal parameters. Ook zouden kwanttateve X-varabelen (covaraten) n de regressevergelkng kunnen worden meegenomen. In de zn kan regresse-analyse meer dan standaardsate. Maar standaardsatemethoden zn voor ons doel (paragraaf 1.1) nzchtelker. Dt komt vooral doordat b drecte en ndrecte standaardsate edere populate rechtstreeks (paarsgews) met populate s wordt vergeleken en omdat daarb één leeftdsverdelng, of s, wordt gehanteerd. B regresse-standaardsate worden n het geval van een sompopulate alle (twee of meer) beschouwde populates gezamenlk geanalyseerd en zn de leeftdsverdelngen van alle populates van nvloed op het endresultaat. Dat dt mnder nzchtelk s, volgt al ut het fet dat er een nverse moet worden berekend om resultaten te verkrgen. Intuïtef lkt regresse-analyse dus op standaardsate, zoals ut paragraaf 4.1 blkt. In paragraaf 4.5 gaan we verder n op de vergelkng tussen regresse-analyse en standaardsate. Dan zen we dat drecte standaardsate dan overeenkomt met een gewogen vorm van regresse-analyse (paragraaf 4.5.1) Als alle nteractes worden meegenomen, kunnen de regresse-analyses geaggregeerd plaatsvnden, net als b drecte en ndrecte standaardsate. Het maakt dan dus net ut of de doelvarabele met scores k kwanttatef s of bnar 23

(dummy-varabele). In het laatste geval heeft men logstsche regresse als alternatef; ze paragraaf 4.5.2. 4.3 Utgebrede beschrvng We kunnen b de regresse-analyse enerzds utgaan van de stuate waarn de standaardpopulate s de verengng s van alle beschouwde populates, zodat formule (1.2) van toepassng s. Dt betekent dat alle populates onderlng worden vergeleken, maar mplcet ook worden vergeleken met hun complement s\. Anderzds kan populate s een externe populate zn waar populate geen onderdeel van s. In dat geval kan een regresse-analyse worden utgevoerd waarb alleen populate en s worden meegenomen, met s als sompopulate. In deze paragraaf gaan we qua notate ut van de eerste stuate, waardoor bvoorbeeld s de populate-omvang s n leeftdsklasse over alle populates. In paragraaf 4.4 tonen we een voorbeeld met de tweede stuate. Omdat regresse-analyse een ndvdueel model s, gebruken we her de notate op ndvdueel nveau, zoals reeds s ngevoerd n paragraaf 1.5. D s dus een dummyvarabele (Sterfte) met score D k =1 als ndvdu k ut leeftdsklasse en populate n de onderzoeksperode s overleden, en anders D k =0 (=1,,I; =1,,J). We kunnen de notate k gebruken n plaats van D k om de theore te generalseren tot kwanttateve varabelen. Zoals n paragraaf 1.5 s vermeld, geldt voor dummy varabelen dat = D, omdat k =1. k k Varante-analyse van op de kwaltateve varabelen Leeftd en opulate kan worden weergeven als Herb s L L k = Dk = β 0 + β X k + β X k + εk. (4.1) L X de dummy-varabele voor leeftdsklasse (of meer algemeen voor de e klasse van het verstorende kenmerk) en X voor de e L populate. Dus X = 1 als ndvdu k n de e L leeftdsklasse zt (en anders X = 0 ) en X = 1 als k tot de e populate hoort (en anders X = 0 ). Verder zn de ß s regressecoëffcënten en de ε k storngen. k Ter dentfcate van de parameters leggen we restrctes op. We nemen daarvoor de restrctes de b een multpele-classfcate-analyse 5 (MCA) worden toegepast: k k k 5 Multpele-classfcate-analyse (MCA) s een procedure van SSS de alleen n de syntaxmode kan worden utgevoerd, va het AOVA-commando. De MCA-parameters conform restrctes (4.2) en (4.3) kunnen echter ook achteraf eenvoudg worden herled ut een varante-analyse waarb andere restrctes zn gehanteerd. In paragraaf 4.4 wordt dt aan de hand van een voorbeeld toegelcht. 24

k L L L 0 (4.2) s en k 0. (4.3) Er s dus geen specfeke referentecategore, maar de parameters zn voor edere varabele (verstorend kenmerk en populate) gewogen gemddeld nul over de categoreën, waarb wordt gewogen met de frequentes. Door deze restrctes wordt ß 0 gelk aan µ, de verwachtng van het aantal doden, en zn de ß-parameters afwkngen hervan. We kunnen nu zen als de verwachte (gemddelde) score voor populate na correcte voor de verstorende kenmerken. De schatter hervan kunnen we beschouwen als het va regresse-analyse gestandaardseerde gemddelde (sterftecfer). Mnmalsate van k e 2 k e 2 ledt tot restrctes voor de parameterschatters, de kwadratensom van de resduen, L b en en (4.3). Herut volgt dat het algemeen gemddelde gelk s aan b de analoog zn aan (4.2) 1 ˆ s Ds Dk. (4.4) s k Het regresse-gestandaardseerd gemddelde sterftecfer kan nu worden gedefneerd als REGR ˆ b b. (4.5) s In plaats van ut te gaan van formule (4.1), de gebaseerd s op ndvduele waarnemngen, kunnen we de parameters ook schatten op geaggregeerd nveau, D L L X X. (4.6) waarb 1 k k. Mnmalsate van e 2 naar de parameters ledt onder dezelfde restrctes tot dezelfde parameterschatters. B regresse-analyse s het vr ongebrukelk om het gemddelde ˆ b een geschatte parameter op te tellen, terwl dat b gestandaardseerde gemddelden ust wel gebeurt. Bnnen SSS General Lnear Model bestaat een met (4.5) vergelkbare mogelkhed, nl. de procedure Estmated Margnal Means, maar dat s een weng brukbare opte. 25

4.4 Voorbeeld Sterftecfers Turkse en ederlandse mannen, 0-44 aar: regresse-standaardsate We passen regresse-analyse toe op twee populates: de Turkse mannen () en de ederlandse mannen (s). De sompopulate s derhalve s met totale omvang + s n leeftdsklasse. We gebruken hervoor de aantallen ut de kolommen (2) en (3) van tabel A; de kolommen (6) en (7) ut de tabel geven aan hoeveel van hen een score 1 hebben op de doelvarabele Sterfte; de anderen hebben score 0. Schattng van formule (4.1) onder de MCA-restrctes (4.2) en (4.3) geeft µˆ = + Turk DIR 0,000879 en β Turk = 0, 000548, zoals blkt ut kolom 1 van tabel 1. Het met regresse gestandaardseerde sterftecfer voor de Turkse mannen s dus gelk aan ˆ µ β = 0,00143. B drecte en ndrecte standaardsate vonden we respecte- IDIR velk = 0, 00137 en = 0, 00141, wat nauwelks scheelt. Merk op dat b ndrecte en regresse-analyse dezelfde gewchten worden gebrukt, d.w.z. dat alle ndvduen ut populate even zwaar meetellen (ze paragraaf 4.5.2). Alleen hebben we b de regresse-standaardsate n dt voorbeeld noodgedwongen ets andere overall-gewchten, omdat we her te maken hebben met de verengng van Turkse en ederlandse mannen + s. Omdat s groot s ten opzchte van maakt dat n dt voorbeeld weng ut. Tabel 1. arameterschatters voor regresse-standaardsate met als populates de Turkse mannen () en ederlandse mannen (s) Varabele arameterschatters 6 2 ˆ ˆ ˆ ˆ L sβ = + β = 0 β L 6 = β 2 = 0 = 1 = 1 (MCA-restrctes) (referentecategoreën) Constante term 0,000879 0,00162 Leeftd 0 0,003464 0,002720 1-4 -0,000358-0,001103 5-14 -0,000610-0,001355 15-24 -0,000151-0,000896 25-34 -0,000052-0,000797 35-44 0,000745 0 opulate Turken 0,000548 0,000556 ederlanders -0,000008 0 De laatste kolom van tabel 1 geeft de parameterschatters van een varante-analyse waarb de laatste categore van Leeftd en opulate worden weggelaten. Zoals n voetnoot 4 s vermeld, kunnen we de parameterschatters van de MCA-oplossng her eenvoudg ut berekenen. Dt kan door per varabele het met de aantallen personen 26

gewogen gemddelde van de parameters af te trekken, en de afgetrokken waarden vervolgens b de constante term weer op te tellen. Merk op dat de verschllen tussen geschatte parameters behorende b dezelfde varabelen n kolom 1 en 2 gelk zn. 4.5 Egenschappen 4.5.1 Drecte standaardsate en regresse In Israëls en De Ree (1981) wordt getoond dat het drect gestandaardseerde DIR sterftecfer kan worden verkregen als resultaat van een gewogen lneare regresse voor het geval we een aantal populates onderlng en met hun sompopulate s vergelken. Drecte standaardsate hanteert hetzelfde addteve model (4.6) als regresse-analyse, maar een andere verlesfuncte voor het schatten van de ß-parameters. Gemnmalseerd wordt e 2 n plaats van s e 2. Dt betekent dat de gekwadrateerde afwkngen 2 e net worden gewogen met hun werkelke celfrequentes, maar met de frequentes s ut de standaardpopulate. De restrctes ut (4.2) en (4.3) worden herdoor aangepast. Restrcte (4.3) wordt nu 0, hetgeen eenvoudg s te zen door te vervangen door s ; de gewchten hangen nu net meer van af. Met deze verlesfuncte en restrctes wordt de schatter voor gelk aan het drect gestandaardseerd gemddelde. Omdat b (ongewogen) regresse-analyse n het geval van een sompopulate s alle ndvduen even zwaar meetellen, heeft regresse-standaardsate klenere standaardfouten dan drecte standaardsate en ledt dus tot effcëntere schatters voor ß, nden het model geldt. Waar b regresse-standaardsate de parameters voor alle populates smultaan moeten worden geschat, kan dt b drecte standaardsate ook per populate gescheden. Dt maakt drecte standaardsate eenvoudger en doorzchtger. In het geval van een externe populate komt regresse-analyse met de bbehorende gewchten overeen met drecte standaardsate. 4.5.2 Indrecte standaardsate en regresse In tegenstellng tot drecte standaardsate hanteert ndrecte standaardsate als wegng van de sterftecfers, zoals te zen s n de formules van hoofdstuk 3. Alle ndvduen tellen dus even zwaar mee. In dt opzcht lkt ndrecte standaardsate dus meer dan drecte standaardsate op regresse-standaardsate. Anderzds s ndrecte standaardsate net gebaseerd op een addtef model voor de sterftekans, maar op een multplcatef model, zoals we hebben gezen n formule (3.3). We leten daar zen dat het model achter de SMR kan worden beschouwd als een multplcateve regresse van op de varabelen Leeftd en opulate. We kunnen formule (3.3b), E( ), analoog aan formule (4.1) en (4.6) noteren met 27