Stichting voor Economisch Onderzoek der Universiteit van Amsterdam MOA 2005: weging en correctie voor allochtonen zonder Internet Djoerd de Graaf Onderzoek in opdracht van Intelligence Group Amsterdam, juni 2005
Stichting voor Economisch Onderzoek der Universiteit van Amsterdam MOA 2005: weging en correctie voor allochtonen zonder Internet Djoerd de Graaf Onderzoek in opdracht van Intelligence Group Amsterdam, juni 2005
SEO-rapport nr. 811 ISSN 0926-2806 Copyright 2005 SEO Amsterdam. Alle rechten voorbehouden. Het is geoorloofd gegevens uit dit rapport te gebruiken in artikelen en dergelijke, mits daarbij de bron duidelijk en nauwkeurig wordt vermeld.
Inhoud Inleiding... 1 Correctie 1: representatief maken voor potentiële Nederlandse beroepsbevolking... 3 Correctie 2: representatief maken voor allochtonen met én zonder Internet... 5 Het effect van de correcties... 9 Technische bijlage... 11
1 Inleiding Ten behoeve van het Minderheden Onderzoek op de Arbeidsmarkt (MOA) zijn in 2005 opnieuw gegevens verzameld. Eind 2003, begin 2004 was de eerste meting. Destijds hebben 1343 allochtonen tussen de 15 en 64 jaar via Internet een vragenlijst ingevuld, waarbij de focus lag op jongeren tot en met 34 jaar. In 2005 zijn 1873 allochtonen tussen 15 en 35 jaar via Internet ondervraagd. Alleen de vier grootste groepen allochtonen in Nederland zijn ondervraagd: Turken, Marokkanen, Surinamers en Antillianen/Arubanen. Deze gegevens zijn niet zonder meer representatief voor alle allochtonen in Nederland tussen de 15 en 35 jaar in deze vier groepen. De verzamelde gegevens zijn, om representativiteit te bewerkstelligen, door middel van per respondent verschillende weegfactoren gecorrigeerd. In dit rapport worden de toegepaste correcties beschreven. Het verzamelen van gegevens via Internet heeft twee gevolgen voor de representativiteit van de data. Ten eerste is het bekend dat vooral jongeren en hoger opgeleiden en - in mindere mate - mannen gebruik maken van Internet. Dat heeft tot gevolg dat ouderen, lager opgeleiden en vrouwen ondervertegenwoordigd zijn in een internetsteekproef. Om een dergelijke steekproef representatief te maken voor heel Nederland dienen alle gegevens hiervoor te worden gecorrigeerd. Dit gebeurt door middel van weging. Ten tweede zijn er verschillende vragen gesteld over mediakanalen die kunnen worden gebruikt bij de oriëntatie op een nieuwe baan. Uiteraard behoort ook Internet tot de mogelijke mediakanalen. Als de (gewogen) gegeven antwoorden op deze vraag als representatief voor de allochtone Nederlandse bevolking zouden worden beschouwd, wordt het gebruik van het mediakanaal Internet overschat. Bovendien zullen andere kanalen ten gevolge van substitutie zeer waarschijnlijk worden onderschat. Bij deze vragen is de eerstgenoemde correctie dus niet toereikend. Zowel de jongeren als de ouderen en zowel de hoger als de lager opgeleiden in de steekproef zullen meer dan gemiddeld gebruik maken van Internet. Hetzelfde geldt voor zowel mannen als vrouwen in de steekproef. In dit geval dient dus te worden gecorrigeerd voor het ontbreken van allochtonen die geen toegang hebben tot Internet. Ook deze correctie heeft plaatsgevonden. Kortom, de gegevens zijn op twee manieren gecorrigeerd. - Correctie 1: representatief maken voor allochtone potentiële Nederlandse beroepsbevolking tussen 15 en 35 jaar. 1 - Correctie 2: representatief maken voor mensen met én zonder Internet. Beide correcties worden hieronder uitgebreid beschreven. 1 Op bladzijde 2 wordt de potentiële Nederlandse beroepsbevolking gedefinieerd.
3 Correctie 1: representatief maken voor potentiële Nederlandse beroepsbevolking De enquête is afgenomen onder drie groepen allochtone Nederlanders tussen de 15 en 35 jaar: scholieren en studenten, werkzamen in loondienst, en niet-werkzamen die (in de toekomst) weer willen werken. Deze drie groepen hebben de potentie om - nu of in de toekomst - tot de beroepsbevolking te behoren, oftewel zich voor tenminste 12 uur aan te bieden op de arbeidsmarkt. Intelligence Group definieert de drie groepen samen daarom als de allochtone potentiële Nederlandse beroepsbevolking tussen 15 en 35 jaar. De geënquêteerden zijn niet zonder meer als representatief te beschouwen voor de totale allochtone potentiële Nederlandse beroepsbevolking tussen 15 en 35 jaar. Vandaar dat het bestand met de 1873 respondenten is gewogen op vier bekende gegevens van de totale populatie: leeftijd, hoogst voltooide opleiding, etniciteit en geslacht. Dit zijn de cruciale gegevens voor de weging. Door de bevraging via Internet kunnen - zoals eerder gemeld - lager opgeleiden, ouderen en vrouwen ondervertegenwoordigd zijn in een steekproef. In Tabel 1 is per leeftijdscategorie, opleidingsniveau, etniciteit en geslacht het totaal aantal allochtonen in Nederland in 2002 weergegeven. Tabel 1 Totaal aantal allochtonen in Nederland per leeftijdscategorie en opleidingsniveau (in duizendtallen) hoogst voltooide opleiding en geslacht basisonderwijs/ vbo/ mavo mbo/havo/vwo hbo/wo leeftijd etniciteit man vrouw man vrouw man vrouw 15 t/m 24 Turken 20 22 6 5 0 1 Marokkanen 18 16 6 10 0 1 Surinamers 15 17 7 10 0 1 Antillianen/ Arubanen 6 6 3 3 1 1 25 t/m 34 Turken 21 26 12 9 2 3 Marokkanen 17 18 6 6 3 3 Surinamers 14 8 13 11 3 7 Antillianen/ Arubanen 6 5 4 4 2 3 Bron: Enquête beroepsbevolking 2002, CBS (2004). De gegevens in de bovenstaande tabel vormen de basis voor de wegingsprocedure. De respondenten krijgen een zodanige weegfactor, dat de gewogen Internetsteekproef dezelfde
4 Correctie 1 verdeling over de genoemde kenmerken heeft als de allochtone potentiële Nederlandse beroepsbevolking. Oudere respondenten met een laag opleidingsniveau, die in de Internetsteekproef ondervertegenwoordigd zijn, krijgen een relatief hoge weegfactor. Jongere respondenten met een hoog opleidingsniveau zijn wel goed vertegenwoordigd in de steekproef en krijgen een relatief lage weegfactor. Opvallend is dat ondanks de bevraging via Internet vrouwen juist oververtegenwoordigd zijn in de steekproef. 2 Dit geldt voor alle groepen allochtonen, met uitzondering van de Turken. Voor elke combinatie van leeftijd en opleidingsniveau zijn er bij de Marokkanen, Surinamers en Antillianen en Arubanen meer vrouwelijke dan mannelijke respondenten. Om hiervoor te corrigeren krijgen vrouwen met een bepaalde combinatie van leeftijd en opleidingsniveau een lagere weegfactor dan mannen in dezelfde leeftijdsklasse en met hetzelfde opleidingsniveau. In een technische bijlage is de berekening van de weegfactoren in algebraïsche vorm opgenomen. Bij de bovenstaande weging dienen drie kanttekeningen te worden geplaatst. - Het CBS houdt geen cijfers bij over de potentiële beroepsbevolking. De in Tabel 1 getoonde aantallen zijn CBS-cijfers over de gehele allochtone Nederlandse bevolking. Aangezien het hier cijfers over jongeren betreft, heeft het leeuwendeel de potentie om nu of in de toekomst tot de beroepsbevolking te behoren. De cijfers zijn daarom een goede benadering - kleine overschatting - van de allochtone potentiële Nederlandse beroepsbevolking. - De vragenlijst die de respondenten moesten invullen was in het Nederlands geschreven. De steekproef bestaat dus volledig uit allochtonen die de Nederlandse taal goed beheersen. Deze steekproef staat model voor de allochtone Nederlandse populatie, waarvan een deel de Nederlandse taal veel minder goed beheerst. Dat kan tot gevolg hebben dat bijvoorbeeld het percentage allochtonen dat via de krant op zoek gaat naar een nieuwe baan wordt overschat. Dit probleem wordt deels opgeheven, doordat in het MOA gekeken wordt naar jongeren tot en met 34 jaar. Van de allochtonen zijn deze jongeren de Nederlandse taal het beste machtig. - In de steekproef zijn ook respondenten aanwezig van 35 jaar. We veronderstellen dat deze allochtonen nauwelijks verschillen van 34-jarigen. Bij de correcties delen we deze respondenten daarom in bij de 34-jarigen. 2 Overigens is het bekend dat over het algemeen bij enquêtes meer vrouwen dan mannen responderen.
5 Correctie 2: representatief maken voor allochtonen met én zonder Internet Zoals vermeld, is Correctie 1 niet bij alle vragen toereikend. Bij enkele vragen over mediakanalen (waaronder Internet) is het gegeven dat alle respondenten toegang tot Internet hebben rechtstreeks van invloed op de gegeven antwoorden. Eind 2002 zijn voor het Arbeidsmarkt Gedragsonderzoek (AGO) ruim 17 duizend (vooral autochtone) Nederlanders via Internet nagenoeg dezelfde vragen over de mediakanalen gesteld als voor het MOA. 3 Naast deze Internetenquête is destijds een telefonisch onderzoek uitgevoerd. Er zijn 1873 mensen ondervraagd, van wie 395 zowel zakelijk als privé niet beschikken over een Internetaansluiting. Ook aan deze mensen zijn de belangrijkste vragen over de mediakanalen gesteld. De respondenten zonder een Internetaansluiting (telefonisch geënquêteerden) zijn met de respondenten met een Internetaansluiting (geënquêteerden via Internet) gecombineerd tot één steekproef. Met behulp van deze gecombineerde steekproef kan worden berekend hoe de antwoorden van de Internet-geënquêteerden dienen te worden gecorrigeerd voor de afwezigheid van de respondenten zonder Internet. Uitgaande van de veronderstelling dat de correctie voor allochtonen hieraan identiek is, kunnen deze cijfers worden gebruikt om de MOA-data te corrigeren. Correctie 2 bestaat uit 2 stappen. Ten eerste het gelijktrekken van de verhoudingen van beide steekproeven. Ten tweede het corrigeren voor vertekening in het mediakanaalgebruik. Stap 1 Bij het samenvoegen van de respondenten zonder en met een Internetaansluiting wordt uiteraard rekening gehouden met de relatief kleine omvang van de telefonische enquête. Mensen zonder Internet zijn immers ondervertegenwoordigd in de gecombineerde steekproef. Om hiervoor te corrigeren heeft net als bij Correctie 1 een weging plaatsgevonden. Respondenten zonder Internet hebben een zodanige weegfactor gekregen, dat ze voor meer dan 1 persoon meetellen. De weegfactoren zijn met behulp van recente gegevens over het bezit van een Internettoegang privé en/of op het werk of school bepaald. In Tabel 2 is per leeftijdscategorie en per opleidingsniveau het percentage Nederlanders met een Internettoegang weergegeven. 4 Zoals eerder beschreven zijn vooral 3 Het enige verschil is dat destijds in het AGO is gevraagd naar oriëntatie op de arbeidsmarkt via het mediakanaal Internet: anders dan via een vacaturesite/ bedrijvensite. In het MOA is dat mediakanaal vervangen door Internet: via e-mail service. 4 Voor het onderzoek is gebruik gemaakt van gegevens van Interview-NSS uit 2004. Deze cijfers worden vermarkt en mogen niet openbaar worden gemaakt. Bij wijze van voorbeeld geeft Tabel 2 het percentage ondervraagden uit de telefonische enquête met zakelijk of privé een Internetaansluiting weer. Deze steekproef was volkomen aselect en derhalve representatief.
6 Correctie 2 deze twee kenmerken het meest onderscheidend met betrekking tot het bezit van een Internetaansluiting. 5 Tabel 2 Percentage Nederlanders dat eind 2002 zakelijk of privé een Internetaansluiting had per leeftijdscategorie en opleidingsniveau n = 1873 hoogst voltooide opleiding leeftijd basisonderwijs v(m)bo/mavo mbo/havo/vwo hbo/wo 15 t/m 29 jaar 88% 83% 86% 91% 30 t/m 39 jaar 75% 65% 82% 96% 40 t/m 49 jaar 62% 74% 83% 94% 50 t/m 64 jaar 44% 40% 72% 88% Bron: telefonische enquête Intelligence Group (2003), bewerking SEO. Dergelijke gegevens - maar dan die (niet openbare) uit 2004 - vormen de basis voor de weging van de gecombineerde steekproef om te corrigeren voor de ondervertegenwoordiging van respondenten zonder Internet. In de steekproef krijgen de respondenten zonder Internetaansluiting een zodanige weegfactor dat het percentage respondenten met Internetaansluiting voor elke combinatie van leeftijd en opleiding overeenkomt met het percentage in de tabel. Voor de berekening van de weegfactoren in wiskundige vorm wordt verwezen naar de technische bijlage. Stap 2 Met behulp van de antwoorden van deze gecombineerde AGO-steekproef op de vragen over de mediakanalen is vervolgens berekend hoe de antwoorden van de respondenten van alleen de Internetenquête moeten worden gecorrigeerd. Ter illustratie van de berekening van Correctie 2 volgt nu de berekening voor één van de mediakanalen, namelijk dagblad/krant. In Tabel 3 is het percentage van de gecombineerde steekproef weergegeven dat aangeeft een dagblad/krant te gebruiken ter oriëntatie op een nieuwe baan. Opnieuw zijn de respondenten naar leeftijd en opleidingsniveau ingedeeld, aangezien ook bij deze vraag de antwoorden van leeftijd en opleiding kunnen afhangen. Op deze manier kan ook per leeftijdscategorie en opleidingsniveau een uitspraak worden gedaan over het gebruik van de verschillende mediakanalen. Hoger opgeleiden maken, zo blijkt uit Tabel 3, vaker dan gemiddeld gebruik van de krant in hun zoektocht naar een nieuwe baan en jongeren juist relatief weinig. 5 Het aantal waarnemingen liet niet toe om ook te wegen naar de (minst invloedrijke) factor geslacht. Voor de weging zijn overigens alleen de leeftijdscategorieën 15 t/m 29 en 30 t/m 39 jaar gebruikt. Aan de hand van de percentages in de laatstgenoemde categorie zijn de 30 t/m 35- jarigen gewogen.
representatief maken voor allochtonen met én zonder Internet 7 Tabel 3 Percentage van gecombineerde steekproef (zowel respondenten met als zonder een Internetaansluiting) dat gebruik maakt van een dagblad/ krant ter oriëntatie op een nieuwe baan hoogst voltooide opleiding leeftijd basisonderwijs/ vbo/mavo mbo/havo/vwo hbo/wo 15 t/m 29 jaar 47% 57% 59% 30 t/m 39 jaar 58% 65% 61% Bron: Internet- en telefonische enquête AGO, Intelligence Group (2003); bewerking SEO (2005) In Tabel 4 staan de percentages van alleen de Internetgeënquêteerden dat gebruik maakt van een dagblad/ krant ter oriëntatie op een nieuwe baan. Tabel 4 Percentage van Internetgeënquêteerden dat gebruik maakt van een dagblad/ krant ter oriëntatie op een nieuwe baan hoogst voltooide opleiding leeftijd basisonderwijs/ vbo/mavo mbo/havo/vwo hbo/wo 15 t/m 29 jaar 43% 54% 59% 30 t/m 39 jaar 54% 62% 59% Bron: Internetenquête AGO, Intelligence Group (2003); bewerking SEO (2005) Uit Tabel 3 valt af te lezen dat volgens de gecombineerde steekproef ongeveer 47% van de allochtonen tussen de 15 en 29 jaar met als hoogste opleiding mavo gebruik maakt van een dagblad/krant ter oriëntatie op een nieuwe baan. Volgens de Internetenquête (Tabel 4) is dit percentage 43%. Om te corrigeren voor de afwezigheid van respondenten zonder Internetaansluiting zal het percentage zoals verkregen met alleen de Internetgeënquêteerden dus moeten worden vermenigvuldigd met een factor 47/43. Voor elke combinatie van opleiding en leeftijd en voor elk mediakanaal zijn op deze manier de factoren uitgerekend. Dezelfde correcties zijn vervolgens toegepast op de MOA-steekproef. De berekende factoren voor de leeftijdscategorie 30 t/m 39 jaar zijn gebruikt om de cijfers over de allochtonen tussen 30 en 35 jaar te corrigeren.
9 Het effect van de correcties Hierboven is beschreven welke correcties zijn doorgevoerd om de Internetsteekproef representatief te maken voor de allochtone populatie tussen 15 en 35 jaar. Hiervoor is de steekproef gewogen en bovendien is voor sommige vragen een factor uitgerekend om te corrigeren voor de afwezigheid van mensen die niet over een Internetaansluiting beschikken. In Tabel 5 wordt getoond welke gevolgen deze correcties hebben voor het percentage respondenten tussen 15 en 35 jaar dat aangeeft gebruik te maken van enkele mediakanalen ter oriëntatie op een nieuwe baan. Bij deze antwoorden zijn beide correcties toegepast. Tabel 5 Het effect van de correcties op de percentages hoeveel allochtonen gebruik maken van enkele mediakanalen ter oriëntatie op een nieuwe baan Mediakanalen ter oriëntatie nieuwe baan ongecorrigeerd correctie 2 correctie 1 & 2 Advertentie in winkel/ etalage etc. 21% 23% 22% Binnenlopen/ bellen naar een bedrijf 21% 22% 22% Banenbeurs/ carrièrebeurs 23% 24% 19% Bedrijfspresentatie/ open dagen 11% 13% 13% Dagblad/ de krant 44% 46% 43% Gouden Gids/ telefoonboek 7% 9% 10% CWI (arbeidsbureau)/ KLIQ (reïntegratiebedrijf) 25% 30% 34% Het uitzendbureau 46% 45% 47% Huis-aan-huisblad/ lokale weekkrant 28% 30% 28% Interne vacature(s) 31% 35% 32% Internet: vacaturesite 65% 62% 54% Internet: bedrijvensite 42% 40% 35% Internet: e-mail service 36% 34% 31% Open sollicitatie 44% 45% 44% School 22% 24% 23% Teletekst 6% 7% 7% Vakblad/ tijdschrift 17% 18% 13% Bekenden/ netwerk 40% 42% 37% Werving & Selectie bureau 19% 20% 18% Bron: MOA, Intelligence Group (2005); bewerking SEO (2005) Bij vergelijking van de tweede ( ongecorrigeerd ) met de derde ( correctie 2 ) kolom van Tabel 5 is het verschil te zien tussen niet en wel corrigeren voor de afwezigheid van respondenten zonder Internetaansluiting. De percentages met de correctie zijn lager bij de drie vragen over het gebruik van Internet. In vrijwel alle andere gevallen zijn de percentages juist hoger. Precies wat verwacht kan worden. Degenen zonder Internetaansluiting zullen
10 Correctie 2 logischerwijs minder gebruik maken van Internetsites en dit compenseren door zich via andere mediakanalen te oriënteren op een nieuwe baan. Bij vergelijking van de vierde kolom met de derde kolom wordt duidelijk dat ook het representatief maken voor de allochtone potentiële Nederlandse beroepsbevolking de percentages corrigeert. Bij de vragen over Internet zien we nog een extra neerwaartse aanpassing in de percentages. Logisch, aangezien bijvoorbeeld de lager opgeleiden, die minder dan gemiddeld gebruik maken van Internet, een hoger gewicht hebben gekregen in de steekproef.
11 Technische bijlage In de hoofdtekst is beschreven hoe de weegfactoren van correctie 1 en correctie 2 zijn berekend. In deze bijlage zijn de berekeningen in algebraïsche vorm opgenomen. Correctie 1 sijkl = aantal respondenten in steekproef met leeftijd i, opleiding j, etniciteit k en geslacht l p ijkl = aantal personen in populatie met leeftijd i, opleiding j, etniciteit k en geslacht l 1 wijkl = weegfactor voor respondent met leeftijd i, opleiding j, etniciteit k en geslacht l i { 1, 2}, j { 1,..., 3}, k { 1,..., 4}, l { 1, 2} p 1 ijkl w ijkl = * sijkl i j k l i j k l s p ijkl ijkl Correctie 2: stap 1 offl ij = aantal offline respondenten in gecombineerde steekproef met leeftijd i en opleiding j onlij = aantal online respondenten in gecombineerde steekproef met leeftijd i en opleiding j percpop ij = percentage online personen in populatie met leeftijd i en opleiding j wij 2 = weegfactor voor respondent met leeftijd i en opleiding j i { 1, 2}, j { 1,..., 4} wij 2 = 1 als de respondent online is onlij (100 percpopij) 2 wij = * als de respondent offline is offl percpop ij ij