Centraal Bureau voor de Statistiek Centrum voor Beleidsstatistiek Documentatierapport Hoogst behaalde en hoogst gevolgde opleiding (HOOGSTEOPLTAB) Datum: 20 oktober 2014
Bronvermelding Publicatie van uitkomsten geschiedt door het onderzoeksbureau of de opdrachtgever op eigen titel. Verwijzing naar het CBS betreft uitsluitend het gebruik van de microdatabestanden. Dat wordt als volgt geformuleerd: Eigen berekening [naam onderzoeksbureau, c.q. opdrachtgever] op basis van bij het CBS beschikbaar gestelde microdatabestanden betreffende hoogste opleidingsgegevens van personen 2
Beschikbare bestanden: 120726 HOOGSTEOPLTAB 1999V1 t/m 2005V1; 120619 HOOGSTEOPLTAB 2006V1 t/m 2009V1; 120918 HOOGSTEOPLTAB 2010V1; 130924 HOOGSTEOPLTAB 2011V1; 141020 HOOGSTEOPLTAB 2012V1. In de Versiegeschiedenis wordt een chronologisch overzicht gegeven over dit onderwerp. De gebruiker dient rekening te houden met het volgende: De koppelsleutel voor personen is veranderd van SRTNUM en RIN naar RINPERSOONS en RINPERSOON. Het omzetten van de ene sleutel naar de andere wordt beschreven in het script koppelvariabelen gelijk zetten spss.sps voor de Remote Access en On-site gebruikers te vinden in de map \8_Utilities\Tools\. Let vooral op het omzetten van RIN naar RINPERSOON omdat RINPERSOON wordt weggeschreven mét voorloopnullen. De omschrijvingen en toelichtingen op de variabelen, referentiebestanden en codelijsten zijn voor de Remote Access en Onsite gebruikers te vinden in: \8_Utilities\Code_Listings\SSBcodelijsten \8_Utilities\Code_Listings\SSBreferentiebestanden \8_Utilities\Code_Listings\SSBtoelichtingen \8_Utilities\Code_Listings\SSBvariabelen. In verband met eventuele wijzigingen wordt de inhoud van deze mappen maandelijks geactualiseerd. In de map \8_Utilities\Code_Listings\SSBreferentiebestanden is specifiek voor alle opleidingsnummers met groeperingen het referentiebestand OPLEIDINGSNRREFVv beschikbaar. Om de kwaliteit van de uitkomsten te beoordelen wordt sterk aangeraden om de opleidingstool te gebruiken. Voor de Remote Access en On-site gebruikers te vinden op: \8_Utilities\Tools\Opleidingstool. In dit documentatierapport worden de begrippen OPLNIV en HOOGSTEOPLTAB door elkaar gebruikt. HOOGSTEOPLTAB is de opvolger van OPLNIV. Voor de persoonskenmerken en/of achtergronden dient u de beschikbare GBAbestanden te raadplegen. Deze staan in de catalogus van het Centrum voor Beleidstatistiek onder de thema s Bevolking of Sociaal Statistisch Bestand. Voor het aanvragen van deze bestanden geldt de gebruikelijke procedure. 3
4
Inhoudsopgave Bronvermelding... 2 Beschikbare bestanden:... 3 1. Inleiding... 7 2. Toelichting op de bestanden... 8 Onderwerp microdatabestand(en)... 8 Inhoud... 8 Eenheid en populatie... 8 Historie... 9 Bijzonderheden... 9 Het Stelsel van Sociaal-statistische Bestanden (SSB)... 11 3. Bestandsopbouw en toelichting... 12 Bestandsopbouw van dit onderwerp... 12 Toelichting op de variabelen... 13 Versiegeschiedenis... 14 5
6
1. Inleiding Het Centrum voor Beleidsstatistiek stelt, onder bepaalde voorwaarden, microdata (geanonimiseerde data op persoons-, bedrijfs- en/of adresniveau) ter beschikking voor onderzoek. Dit rapport beschrijft de inhoud en structuur over het onderwerp hoogste opleidingsgegevens van personen. Hoofdstuk 2 beschrijft in het algemeen de microdatabestanden zoals populatieafbakening en herkomst van de gegevens. In hoofdstuk 3 wordt allereerst de bestandsindeling gegeven. Daarnaast worden voor de categoriale variabelen alle mogelijke scores en hun betekenis opgesomd. Bij dit rapport is per bestand tot en met 2010 een bijlage met frequentietellingen beschikbaar. In deze bijlagen worden van de (semi-) continue variabelen de frequenties van de eerste en laatste vijf waarden gegeven. Met deze frequentietellingen kan tevens een beeld verkregen worden over de vullingsgraad van de verschillende variabelen, dat van belang kan zijn omdat niet altijd alle variabelen (volledig) gevuld zijn. 7
2. Toelichting op de bestanden Onderwerp microdatabestand(en) Dit onderwerp is afkomstig uit het Stelsel van Sociaal-statistische Bestanden (SSB). Inhoud Dit bestand bevat het opleidingsnummer van de hoogst behaalde en hoogst gevolgde opleiding op peilmoment, voor zover bekend uit diverse jaargangen van registers en Enquête Beroepsbevolking (EBB). De gegevens van peildatum laatste vrijdag van september van jaar JJJJ worden in grote lijnen ook representatief geacht voor de periode tot en met mei JJJJ+1. Verreweg de meeste opleidingsniveau-verhogingen vinden plaats in de periode juni-september JJJJ+1. Om uit opleidingsnummers opleidingsniveau en -richting (CBS-publicatie-indelingen, Standaard Onderwijs Indeling (SOI) of International Standard Classification of Education (ISCED)) te bepalen zijn SSB-referentieboeken beschikbaar. Zie \8_Utilities\Code_Listings\SSBreferentiebestanden. Er is ook een protocol beschikbaar waarin in een aantal stappen wordt uitgelegd hoe op statistisch verantwoorde wijze gebruik kan worden gemaakt van HOOGSTEOPLTAB. Onderdeel ervan is een SSB-tool om de relatieve onnauwkeurigheid van de uitkomst in een cel te bepalen. Zie: \8_Utilities\Tools\Opleidingstool. HOOGSTEOPLTAB heeft een veel hogere dekkingsgraad dan tot nu toe onder bronnen voor opleidingsniveau gebruikelijk was. Een groot voordeel is dat schattingen over het opleidingsniveau meestal betrouwbaarder zijn dan die uit de traditionele bronnen, met name wanneer het kleinere populaties betreft. Een ander pluspunt is dat het merendeel van de gegevens afkomstig is uit onderwijsregisters, en die staan bekend om hun goede kwaliteit. Een belangrijk doel van de onderwijsregistraties is immers toezicht van het Rijk op de doelmatigheid van de onderwijsuitgaven, en om die reden worden de gegevens aan strenge accountantscontroles onderworpen. Eenheid en populatie De doelpopulatie is de GBA-bevolking op peilmoment. HOOGSTEOPLTAB bevat alleen records van personen waarvan de hoogste opleiding bekend is. De informatie is voor een deel van de bevolking integraal en voor de overige personen op steekproefbasis. NB. Bij de serie HOOGSTEOPL's met JJJJ = 2006-2009 is gebruik gemaakt van GBAADRESBUS 2010V1, bij HOOGSTEOPL2010 is de GBAADRESBUS 2011V1 gebruikt. Omdat er inmiddels volgens een andere systematiek gewerkt wordt (met actuele en gecoördineerde versies van de GBAADRESBUS), kan het voorkomen dat: a) er personen in HOOGSTEOPL zitten die volgens de gecoördineerde versie op peilmoment niet tot de populatie van Nederland behoren, 8
b) er personen missen in HOOGSTEOPL waarvan we wel een niveau wisten, maar waarvan op het moment van samenstellen van de component niet bekend was dat ze tot de populatie van Nederland behoorden. Vanaf HOOGSTEOPLTAB 2011V1 wordt de GBA-populatie afgebakend met behulp van de gecoördineerde versie van de GBAADRESBUS (voor 2011 is dat GBAADRESBUS 2011V1). Omdat bij het bepalen van de gewichten ook gebruik gemaakt wordt van de GBAADRESBUS, kan het voorkomen dat de gewichten niet exact optellen tot de populatie, wanneer die wordt gedefinieerd op basis van de recentste (actuele) VRLGBAADRESBUS. Historie Dit bestand is beschikbaar voor peilmomenten ultimo september, vanaf 1999 t/m 2011. Geherstructureerd: 1999-2005 en gereviseerd: 2006-2009. Bijzonderheden HOOGSTEOPLTAB wordt samengesteld uit data van diverse onderwijsregistraties en een serie jaargangen van de Enquête Beroeps bevolking (EBB, vanaf 1996). De laatste decennia heeft het CBS de beschikking gekregen over steeds meer registers met inschrijvings- en diplomagegevens van door overheid bekostigde onderwijsinstellingen. Het betreft de volgende registraties: - CRIHO (centraal register van inschrijvingen in het hoger onderwijs, vanaf 1983 (wo)/1986 (hbo)) - ERR (examenresultatenregister voortgezet onderwijs (vanaf examenjaar 1999) - Onderwijsnummerbestanden voortgezet onderwijs (vanaf schooljaar 2003/ 04, middelbaar beroepsonderwijs (vanaf schooljaar 2004/ 05), volwasseneneducatie inclusief voortgezet algemeen volwassenenonderwijs (vanaf schooljaar 2005/ 06). - Bestanden van de studiefinanciering (WSF, vanaf 1995) - Bestanden met opleidingsgeschiedenissen zoals opgegeven door werkzoekenden bij het UWV WERKbedrijf (personen die ingeschreven stonden in 2010 of later). De informatie in dit bestand is alleen gebruikt voor opleidingen die gevolgd zijn in de periode voor de start van de onderwijsregisters en dan nog alleen wanneer er geen valide informatie beschikbaar is uit de EBB. Bij eerstegeneratieallochtonen is de informatie ook meegenomen wanneer die betrekking had op de periode voorafgaande aan zijn/haar eerste immigratie in Nederland. Aangezien met name de onderwijsregistraties nog niet zo heel lang bestaan, ontbreekt er helaas registerinformatie over veel oudere Nederlanders. Ook particuliere opleidingen vallen buiten het bereik van de onderwijsregisters. Daarnaast is van veel allochtonen die hun opleiding in het buitenland hebben gevolgd op dit moment onvoldoende betrouwbare registerinformatie beschikbaar. Dit betekent dat er voor het samenstellen van het Opleidingsniveaubestand een aanvullend beroep moet worden gedaan op de EBB. Anders 9
dan bij de onderwijsregistraties zijn de gegevens van de EBB alleen op steekproefbasis beschikbaar. Informatie uit een register of uit de EBB die met grote waarschijnlijkheid verouderd is, wordt niet gebruikt. Bijv. in het geval iemand is geënquêteerd in een EBB van een aantal jaren geleden en het zeer waarschijnlijk is dat die persoon inmiddels een hoger opleidingsniveau heeft bereikt. Wegens selectiviteit zijn de records in HOOGSTOPLTAB voorzien van een ophooggewicht, zodat de resultaten uit het bestand representatief zijn voor de hele Nederlandse bevolking en selecte subpopulaties. Voor nadere informatie zie \8_Utilities\Code_Listings\SSBvariabelen, GEWICHTHOOGSTEOPL.OMS. HOOGSTEOPLTAB 2012V1 is de eerste in de reeks jaargangen die tevens gebruik maakt van data uit de EBB's na herontwerp 2012. De EBB rapporteert voor de jaargangen na herontwerp een trendbreuk in de onderwijsniveaucijfers op gedetailleerder aggregatieniveau ten opzichte van eerdere jaargangen. Hoewel de EBB na herontwerp op dit moment slechts een relatief kleine bijdrage levert bij de vulling van HOOGSTEOPLTAB is enige invloed van die trendbreuk in 2012 onvermijdelijk. Daarnaast is de onderwijsniveau-indeling in de EBB door de globalere vraagstelling minder verfijnd dan in het verleden. Een onderscheid tussen 2-digit SOI-niveaus is daarom in de EBB niet altijd meer mogelijk. In het productieproces van HOOGSTEOPL wordt de opleiding met hoogste niveau geselecteerd op basis van SOI 2-digit niveau. Het is evident dat dit selectieproces enige hinder zal ondervinden van de verminderde nuance van de onderwijsniveaucategorieën van de EBB. Uit de resultaten komen aanwijzingen naar voren dat m.n. het aantal personen met hoogste opleidingsniveau SOI 42 hierdoor wat is gestegen ten koste van SOI 41 en SOI 43. In de 8-delige publicatie-indeling komt dit verschijnsel deels tot uiting in de meer dan trendmatige stijging van de categorie mbo2 en mbo3. Het effect op hoger aggregatieniveau van de publicatie-indeling is minder groot. HOOGSTEOPLTAB 2006V1 is de eerste in een nieuwe reeks na revisie. Een aantal belangrijke wijzigingen/verbeteringen bij revisie: - Er is gebruik gemaakt van opleidingsgeschiedenissen zoals bekend bij het UWV WERKbedrijf, om de dekking van het bestand te verbeteren voor met name ouderen en eerstegeneratieallochtonen. - Er is gebruik gemaakt van vervolgpeilingen (en niet alleen de eerste peiling) uit de EBB, zodat opleidingen die mensen afronden tijdens de periode dat ze geënquêteerd worden, worden meegenomen. Door de vernieuwde methodiek toegepast met ingang van revisie zijn cijfers uit jaargangen 1999 tot en met 2005 niet geheel vergelijkbaar met die uit latere jaargangen. Als je een publicatie-indeling van het CBS op het gebied van opleidingsniveau wilt gebruiken (bijvoorbeeld Lager-Middelbaar-Hoger), ga je als volgt te werk. 10
- Koppel aan OPLNRHB of OPLNRHG uit het OPLEIDINGSNR-refboek de variabele CTO (code type opleiding) - Koppel aan CTO uit het CTO-refboek een van de publicatie-indelingen. Zie het datamodel CTOREFVV onder 8_Utilities\Code_Listings\SSBreferentiebestanden; LET OP: voor het hoogst behaalde niveau en het hoogst gevolgde niveau zijn aparte variabelen beschikbaar! De reden is dat mensen die als hoogste opleiding een propedeusejaar gevolgd en evt. behaald hebben, vallen in de categorie bachelor/hoger bij hoogst gevolgd, maar in vwo/middelbaar bij hoogst behaald. NB. Er is een voorbeeldcatalogus beschikbaar. 0 t/m 14 jarigen die deel uitmaken van de GBA-bevolking zijn voor zover ze niet in de gebruikte registers voorkomen ook toegevoegd aan dit bestand. Voor alle 0 t/m 11 jarigen wordt opleidingsinformatie geïmputeerd, voor 12 t/m 14 jarigen alleen voor zover geen informatie beschikbaar is in de gebruikte onderwijsregistraties. Voor 0 t/m 14 jarigen, niet voorkomend in registers, wordt het opleidingsniveau 'bekend' verondersteld, op basis van een aantal aannames. Ten eerste wordt voor de hoogst behaalde opleiding van 0 t/m 11 jarigen een opleidingsnummer gehanteerd op kleuteronderwijsniveau (basisonderwijs groep 1-2); voor 12 t/m 14 jarigen een opleidingsnummer op niveau basisonderwijs groep 3-8. Wat betreft de hoogst gevolgde opleiding veronderstellen we het volgende: 0 t/m 5 jarigen kleuteronderwijs, 6 t/m 11 jarigen basisonderwijs groep 3-8 en 12 t/m 14 jarigen secundair onderwijs, eerste fase zonder nadere aanduiding. Voor geherstructureerde HOOGSTEOPL's met JJJJ = 1999-2005 is nog de oudere systematiek van imputatie toegepast, waarbij geen onderscheid werd gemaakt binnen het basisonderwijs. Het Stelsel van Sociaal-statistische Bestanden (SSB) Het SSB bevat gegevens over alle personen, banen en uitkeringen in Nederland die op microniveau aan elkaar relateerbaar zijn. Hiervoor zijn gegevens over personen uit registraties en enquêtes op microniveau gekoppeld en waar nodig consistent gemaakt. Een belangrijke doelstelling van het SSB is een gegevensbestand samen te stellen dat een samenhangende, consistente beschrijving geeft van een aantal aspecten van de bevolking van Nederland. Voor achtergrondinformatie over het SSB zie: SSB informatie. 11
3. Bestandsopbouw en toelichting Bestandsopbouw van dit onderwerp Onderstaand volgt een overzicht van alle variabelen. Nr. Variabele en omschrijving Form. 1 RINPERSOONS A1 Soort RINPERSOON 2 RINPERSOON A9 Samen met RINPERSOONS is dit de persoon 3 OPLNRHB A6 Opleidingsnummer hoogst behaalde opleiding 4 OPLNRHG A6 Opleidingsnummer hoogst gevolgde opleiding 5 GEWICHTHOOGSTEOPL DOT14.6 Ophooggewicht; 1.000000 als bron is registratie of GBA 0-14 12
Toelichting op de variabelen In deze paragraaf wordt van de categoriale variabelen de waarden en hun betekenis gegeven. RINPERSOONS R RINPERSOON WEL IN GBA 13
Versiegeschiedenis Bestandsnaam Reden 120619 HOOGSTEOPLTAB 2006V1 Eerste plaatsing 120619 HOOGSTEOPLTAB 2007V1 Eerste plaatsing 120619 HOOGSTEOPLTAB 2008V1 Eerste plaatsing 120619 HOOGSTEOPLTAB 2009V1 Eerste plaatsing 120726 HOOGSTEOPLTAB 1999V1 Eerste plaatsing 120726 HOOGSTEOPLTAB 2000V1 Eerste plaatsing 120726 HOOGSTEOPLTAB 2001V1 Eerste plaatsing 120726 HOOGSTEOPLTAB 2002V1 Eerste plaatsing 120726 HOOGSTEOPLTAB 2003V1 Eerste plaatsing 120726 HOOGSTEOPLTAB 2004V1 Eerste plaatsing 120726 HOOGSTEOPLTAB 2005V1 Eerste plaatsing 120918 HOOGSTEOPLTAB 2010V1 Eerste plaatsing 130924 HOOGSTEOPLTAB 2011V1 Eerste plaatsing 141020 HOOGSTEOPLTAB 2012V1 Eerste plaatsing 14