CIM Internet BEREIKSTUDIE METRIPROFIL. Methodologie. Januari 2009



Vergelijkbare documenten
CIM Internet BEREIKSTUDIE CIM METRIPROFIL. Methodologie. December 2009

CIM Internet BEREIKSTUDIE CIM METRIPROFIL. Methodologie. Juni 2010

Internet. Methodologie CIM METRIPROFIL 2011 Q1

CIM Internet BEREIKSTUDIE METRIPROFIL. Methodologie. Augustus 2008

BEREIKSTUDIE INTERNET METRIPROFIL Juli 2007

ONMEDIA. E-newsletter 13 maart 2013

Adrem Flash. E-newsletter 21 juni 2016

Adrem Flash. E-newsletter 11 september 2015

Verklaring inzake cookies

Handleiding enquetemaken.be

Technisch rapport kiesintentiemetingen

CIM MetriProfil een update van de profielcijfers

Onderzoektechnische verantwoording. Opinieonderzoek Solidariteit

Adrem Flash. E-newsletter 8 juni 2015

Het CIM. Algemene informa2e. Presenta2e PdB UBA 09/09/09. PPT dd 25/08/09

Case 4 Consultancy. 28 April F.J.H. Bastiaansen. D.A.J. van Boeckholtz. Minor Online Marketing

Gedrag & ervaringen van huishoudelijke afnemers op de vrijgemaakte Vlaamse energiemarkt VREG 13/09/2012

Adrem Flash. E-newsletter 31 augustus 2017

Adrem Flash. E-newsletter 19 februari 2016

Technisch rapport kiesintentiemetingen

CIM Radio Golf

E. We gebruiken uw gegevens ten slotte ook om te voldoen aan op de Jobwice B.V. rustende wet- en regelgeving.

Gedrag en ervaringen van huishoudelijke afnemers op de vrijgemaakte Vlaamse energiemarkt VREG - TECHNISCH RAPPORT

Adrem Flash. E-newsletter 23 augustus 2016

4 BEPALEN VAN GEWICHTEN

PERSBERICHT CIM 22/04/2015

INFORMED. by Febelmar. Berichtgeving over opinieonderzoek: 6 essentiële vragen

Wij maken op onze site, gebruik van cookies. Hieronder lees je alles over deze cookies en over ons privacy beleid.

Burgerpanel Horst aan de Maas - Meting 3

CIM MetriProfil een update van de profielcijfers

CIM INTERNETCIJFERS Augustus Oktober 2015

VERGELIJKENDE STUDIE VAN ALTERNATIEVE ONTWERPWAARDE SCHATTINGEN VAN SIGNIFICANTE GOLFHOOGTE

Publieke informatie door jou gepubliceerd. Berichten die je naar andere leden stuurt

VIMN (hierna ook wij, ons en onze ) is onderdeel van Viacom International Inc.

Wij zijn er van bewust dat u vertrouwen stelt in ons. Wij zien het dan ook als onze verantwoordelijkheid om uw privacy te beschermen

Kinderen in Nederland - Bijlage B Respons, representativiteit en weging

Werkinstructies voor de CQI Huisartsenposten

Technisch rapport kiesintentiemetingen

Deze cookieverklaring is van toepassing op System CSl ( en tot stand gekomen doormiddel van ACM.

(C) Uw gegevens worden geanalyseerd om de informatie en aanbiedingen zo veel mogelijk op uw interesse af te stemmen.

Adrem Flash. E-newsletter 14 juni 2017

Gedrag en ervaringen van professionele afnemers op de vrijgemaakte Vlaamse energiemarkt VREG - TECHNISCH RAPPORT

Internetpeiling ombuigingen

Plaatsen van berichten of reviews User ID, naam, inhoud van het bericht

CIM Radio Golf

Cookies Maar wat is nou een cookie? Waar worden cookies voor gebruikt? Noodzakelijk Functioneel Prestatie Targeting Afmelden cookies

Onderzoek Verplaatsingsgedrag Vlaanderen 4.3 ( )

Door onze website te gebruiken gaat u akkoord met het gebruik van cookies zoals beschreven in dit cookiebeleid.

DISCLAIMER GEBRUIKSVOORWAARDEN

Cookies beleid. Deze verklaring is als volgt opgebouwd:

Privacyverklaring a/s WORKS

innocent Cookie Beleid

Cookieverklaring Bel Group

Onderzoeksverantwoording Panel Fryslân

Het internet: van informeren tot activeren

Alles over cookies Knop: Verander hier je cookie-instellingen

Verklaring betreffende de bescherming van de persoonlijke levenssfeer

Dit is de privacy- en cookie policy van Sportaneous B.V. [i.o] ("Sportaneous"). Sportaneous is de

Radio Holland Group B.V. Cookie Policy websites NL

Jongeren en Gezondheid 2014 : Socio-demografische gegevens

Technisch rapport kiesintentiemetingen


1 Beschrijving van de activiteiten in de sector op basis van de Nace-Bel nomenclatuur

HANDLEIDING POSTSTUKREGISTRATIE

Technisch rapport kiesintentiemetingen

Werkinstructies voor de CQI Huisartsenzorg Overdag

Stap 1: Bepalen van het doel

Sinterklaas Privacy statement

Digitale (r)evolutie in België anno 2009

Begrippenlijst Anders Dit is onderzoek

Privacy & Cookie Statement

Tabel 2.1 Overzicht van de situatie op de arbeidsmarkt van de onderzochte personen op 30/06/97. Deelpopulatie 1996

Privacyverklaring laatste bijwerking op 21 November 2013

Het twee of meer planningssysteem ziet er als volgt uit wanneer de gebruiker is ingelogged.

Gezondheidsenquête, België Inleiding. Wetenschap ten dienste van Volksgezondheid, Voedselveiligheid en Leefmilieu.

Ons privacybeleid. Persoonsgegevens

Handleiding Resultaatmeetsysteem en Mezzedo

Performance Scan UWV.nl en Werk.nl in opdracht van FNV

Hoofdstuk 13. De omvang van een steekproef bepalen

Privacy & Cookie : KBCSAASFORCE.HOME-USE.EU

Technisch rapport kiesintentiemetingen

Gebruikershandleiding. e-kracht is ontwikkeld door:

Onderzoek over het spreken van het Frans door de inwoners van Vlaanderen

CIM INTERNET - TARIEVEN BELGIE

Ons Cookie Beleid. Cookies

Omnibusenquête deelrapport. Ter Zake Het Ondernemershuis

Cookie-beleid. Inleiding Over cookies

Privacyverklaring laatste bijwerking op 14 November 2013

Rapport Onderzoek Evenementenbeleid Kampen 2015

De methodologie van deze onderzoeksgolf kunt u raadplegen via de website van het CIM:

Omnibusenquête deelrapport. Zoetermeer FM

Privacy Statement Snippit

Groep voor de bescherming van personen in verband met de verwerking van persoonsgegevens. Aanbeveling 1/99

Privacy & Cookiestatement Privacy Statement Fenix Glas BV

Omnibusenquête deelrapport. Studentenhuisvesting

Werkinstructie Het opschonen van data bij schriftelijke en of online dataverzameling

Faq Droogsurfen Jeroen Devlieghere Ine Callebaut

Tabel 7. Gewichten die aan de dagen en maanden zijn toegekend om de steekproef representatiever te maken

Plus-kaart Privacyverklaring laatste bijwerking op 5 November 2013

Validatiecriteria voor Huurdersoordeel 2016

Transcriptie:

CIM Internet BEREIKSTUDIE METRIPROFIL Methodologie Januari 2009 CIM Centrum voor Informatie over de Media Terhulpsesteenweg 181 Bus 22-1170 Brussel Tel.: 32 2 661 31 50 - Fax: 32 2 661 31 69 e-mail: info@cim.be URL: http://www.cim.be

Inhoudstafel INHOUDSTAFEL... 1 DE TACTISCHE INTERNETSTUDIES VAN HET CIM... 2 1. METRIWEB... 2 2. METRIPLAN... 3 3. METRIPROFIL... 3 OPDRACHTGEVERS EN UITVOERDERS VAN DE STUDIE... 6 1. DE TECHNISCHE COMMISSIE INTERNET... 6 2. DE TECHNISCHE PARTNERS... 7 3. DE INTEKENAARS OP DE STUDIES... 7 DESIGN... 9 1. STEEKPROEFTREKKING... 9 2. VRAGENLIJST... 10 3. AANBIEDINGSWIJZE... 10 RESPONS... 12 GEGEVENSVERWERKING... 14 1. HERSTEL VAN ONVOLLEDIGE TIJDREEKSEN... 14 2. ASCRIPTIE VAN SURFVOLUME ALS MÉÉR DAN 1 PC WORDT GEBRUIKT... 18 3. CORRECTIE VAN SURFVOLUME ALS ER MÉÉR DAN 1 GEBRUIKER PER PC IS... 22 4. WEGING IN FUNCTIE VAN SURFVOLUMES IN HET UNIVERSUM... 24 5. WEGING IN FUNCTIE VAN SOCIO-DEMOGRAFIE VAN SURFERS IN PMP 2008... 28 6. EEN PROFIEL VOOR HET NETTOBEREIK EN VOOR DE BRUTOCONTACTEN... 31 DE SOCIO-DEMOGRAFISCHE VARIABELEN... 33 1. LEEFTIJD VAN DE BEVRAAGDE PERSOON... 33 2. BEROEP VAN DE BEVRAAGDE PERSOON... 34 3. BEROEPSSTATUUT VAN DE BEVRAAGDE PERSOON... 34 4. OPLEIDINGSNIVEAU VAN DE BEVRAAGDE PERSOON... 34 5. GEZINSGROOTTE EN LEEFTIJD HUISGENOTEN... 35 6. HET BEGRIP VVA... 35 7. HET BEGRIP VVI... 35 8. BEROEP VAN DE VVI... 36 9. BEROEPSSTATUUT VAN DE VVI... 36 10. OPLEIDINGSNIVEAU VAN DE VVI... 36 11. DE SOCIALE GROEPEN... 36 12. NIELSEN REGIO S... 36 13. PROVINCIES... 36 14. CIM WOONPLAATS... 37 15. TAAL VAN DE BEVRAAGDE PERSOON... 38 DE PUBLICATIE... 39 1. DEELNEMINGSVOORWAARDEN... 39 2. PUBLICATIEVOORWAARDEN... 39 3. TOEGANG TOT DE GEGEVENS... 39 4. LIJST VAN SITES, SECTIES, GROEPERINGEN DIE ENKEL IN DE TWEEDE GOLF DEELNAMEN... 40 5. LIJST VAN SITES, SECTIES EN GROEPERINGEN MET EEN VOLLEDIGE FICHE... 40 6. LIJST VAN SITES, SECTIES OF GROEPERINGEN MET GEREDUCEERDE FICHE... 44 7. LIJST VAN NIET GEPUBLICEERDE SITES, SECTIES OF GROEPERINGEN... 45 8. WIJZIGINGEN TEN OPZICHTE VAN DE VORIGE PUBLICATIE... 47 BIJLAGE 1. VRAGENLIJST... 52 BIJLAGE 2. NEW HABITAT CIM: LIJST VAN GEMEENTEN... 65 BIJLAGE 3. NEW CIM INWONER: LIJST VAN GEMEENTEN... 72 COLOFON... 84 1

De tactische Internetstudies van het CIM 1. Metriweb Sinds 2000 meet het CIM het bereik van Belgische en Luxemburgse internetsites. Het CIM gebruikt hiertoe noch de logfiles van de sites, noch actieve participatie van de surfers. Anders dan de eerste generatie site centric of user centric meetmethoden, is Metriweb gebaseerd op een automatisch en gecentraliseerd meetsysteem dat gebruik maakt van cookies en tags om alle deelnemende sites op identieke wijze te meten. De eerste maal dat een surfer met zijn internet browser een deelnemende site bezoekt, installeert het Metriweb systeem een cookie op zijn computer. Deze cookie bevat een unieke cijferreeks, nl. het tijdsinterval tussen 1/1/1970 en de creatie van de cookie uitgedrukt in microseconden. Dit laat toe om de browser te identificeren elke keer als daarna opnieuw een pagina bezocht wordt van gelijk welke deelnemende site. Metriwebcookies blijven gedurende één jaar bestaan, tenzij ze eerder door de gebruiker worden gewist. In dat laatste geval wordt bij een volgend bezoek een nieuwe cookie geïnstalleerd. Het Metriweb systeem vraagt op geen enkel moment een actieve inbreng van de surfers. Dat is wel het geval voor de webmasters van de deelnemende sites. Het systeem veronderstelt namelijk dat elke pagina van een deelnemende site gemerkt wordt met een CIM-tag, enkele lijnen Javascript code. Telkens dergelijke pagina wordt opgeroepen door een browser, wordt een voor de surfer onzichtbaar mini tekstbestand opgevraagd bij de Metriweb server. Indien de browser al over een Metriwebcookie beschikt, wordt dit gemeld aan de Metriweb server. Indien de browser nog geen CIM cookie heeft, wordt die afgeleverd door de browser samen met het tekstbestand. Alle deelnemende sites tonen het CIM logo en vermelden de volgende disclaimertekst: Telkens U een site bezoekt met dit logo, verzamelt het CIM, het Centrum voor Informatie over de Media, met behulp van een cookie, informatie via de pagina s die U raadpleegt (aantal page requests, visits, visitor,...). Die informatie wordt verzameld voor puur statistische doelstellingen en laat in geen geval toe U te identificeren. Voor meer informatie en om up-to-date resultaten van deze studie te consulteren, klik op het CIM-logo of ga naar http://www.cim.be. Dit systeem laat toe om per site ondubbelzinnig het aantal visitors te onderscheiden en te tellen aan de hand van de cookies. Merk op dat visitors hier gemakshalve gelijkgesteld worden met browsers. Daarnaast worden page requests geteld aan de hand van het aantal aanvragen van het tekstbestand. Bovendien wordt het aantal visits berekend, d.i. een reeks page requests binnen een site door één en dezelfde visitor zonder 30 opeenvolgende minuten inactiviteit. Al deze parameters worden voor alle deelnemende sites continu geüpdate en zijn via www.cim.be voor alle intekenaars toegankelijk. 2

Het aantal deelnemende sites is sinds de start in 2000 voortdurend toegenomen: - december 2000: 46 - december 2001: 103 - december 2002: 131 - december 2003: 196 - december 2004: 253 - december 2005: 299 - december 2006: 337 - december 2007: 360 - december 2008: 451 2. Metriplan Metriplan is geen aparte studie maar een afzonderlijke toepassing bij Metriweb. Deze toepassing laat toe de opbouw van het bereik van een site te berekenen over een periode van 7, 14, 21 of 28 dagen. Met Metriplan kan ook de duplicatie berekend worden tussen 2 of meer sites. Metriplan verschaft op die manier basisinformatie die essentieel is in mediaplanning. De resultaten zijn toegankelijk voor wie bijkomend een Metriplanabonnement neemt. 3. Metriprofil Metriweb telt alle bezoekers en alle pagina s die worden opgevraagd. Metriplan beschrijft de opbouw van het bereik en wijst op gemeenschappelijke bezoekers én het verschil in bereik tussen sites. Toch ontbreekt er nog een dimensie. Metriweb weet niet wie er precies schuil gaat achter een browser. De Metriweb-cookies kunnen ons niets leren over geslacht, leeftijd of andere socio-demografische kenmerken van de surfer terwijl die toch essentieel zijn in mediaplanning. Metriweb is daardoor fundamenteel verschillend van alle andere tactische studies van het CIM: daarin wordt vanuit een perfect gekende steekproef een extrapolatie gemaakt over het bereik van media in het universum. De paradox van Metriweb is dat het bereik van de sites in het universum zeer betrouwbaar gemeten wordt maar dat de socio-demografische realiteit hierachter onbekend blijft. Dit is de prijs die betaald wordt in een studie waarin de steekproef het universum is! Metriprofil werkt deze lacune weg door een brug te slaan tussen anonieme Metriweb visitors en mensen van vlees en bloed. Concreet wordt in Metriprofil regelmatig online een steekproef van Metriweb visitors bevraagd over hun internetinfrastructuur, hun surfgedrag en hun socio-demografische kenmerken. Aangezien op die manier voor de steekproef zowel het surfgedrag (Metriweb) als socio-demografische kenmerken (Metriprofil) gekend zijn, kan voor elke site met voldoende Metriprofilobservaties het profiel berekend worden. 3

Het voordeel van deze aanpak is tweeërlei: - de relatie tussen socio-demografische gegevens en surfgedrag wordt afgeleid uit het Metriweb systeem en is dus niet afhankelijk van de juiste herinnering, het correct invullen of welke andere actieve tussenkomst van de surfer ook, - de socio-demografische gegevens van persoon A die werd bevraagd naar aanleiding van een bezoek aan site X gelden ook voor site Y en Z als die ook door persoon A werden bezocht. Dat laatste is belangrijk voor kleinere sites: zij profiteren mee van de gegevens die verzameld worden op grotere sites. Op die manier wordt het ook voor hen economisch haalbaar om betrouwbare profielgegevens te verkrijgen. Deze aanpak veronderstelt dat voor verschillende problemen een oplossing wordt gevonden. 1. De representativiteit van Metriprofil Anders dan bij alle andere tactische CIM-studies, is er bij een online enquête géén strenge preselectie mogelijk van deelnemers. Het is dan ook onwaarschijnlijk dat dergelijke online enquête perfect representatief is. 2. Het multi-cookie probleem Wie regelmatig cookies verwijdert, wordt in het Metriweb systeem geregistreerd met verschillende, opeenvolgende cookies. Wanneer in Metriprofil een steekproef van Metriweb visitors worden bevraagd, worden deze surfers slechts met één cookie herkend. Door die onvolledige tijdreeks wordt hun profiel slechts met een deel van de werkelijk bezochte sites verbonden. Deze onderschatting én het feit dat surfers die cookies verwijderen misschien een afwijkend profiel hebben, kan resulteren in een vertekening van de socio-demografische profielen. Het multi-cookie probleem ontstaat overigens niet enkel door het verwijderen van cookies door de surfer. Ook cookies die aan het einde komen van hun normale levensduur, veroorzaken onvolledige observaties. 3. Het multi-pc probleem De term visitors in Metriweb verwijst naar een browser met een Metriwebcookie. Dat betekent dat het in Metriweb eigenlijk om bruto visitors gaat: wie op 2 verschillende plaatsen surft (bv.. thuis en op het werk), gebruikt 2 verschillende Metriwebcookies en wordt dus 2 keer geteld. Het is bekend dat er meer Metriwebcookies bestaan dan er surfers zijn in België. Het zou dan ook een grote stap vooruit zijn, als bruto visitors teruggebracht kunnen worden tot netto surfers, dat elke surfer m.a.w. slechts één keer geteld wordt. 4

4. Het multi-user probleem De term visitors in Metriweb verwijst naar een browser met een Metriweb-cookie. Iedereen die met deze browser en deze cookie surft, zal bijgevolg bijdragen tot de geobserveerde page request-keten. Dat is zeer vervelend want de sociodemografische gegevens van de persoon die de online-enquête invult, zal worden gebruikt bij berekening van het profiel van àlle sites die met deze Metriwebcookie bezocht werden. Als een moeder van 43 jaar de enquête invult en haar zoon van 12 jaar surft met hetzelfde Metriwebcookie op een kindersite, zal volgens Metriprofil (zonder correctie) een vrouw van 43 op een kindersite surfen. Voor elk van de bovenstaande problemen werd een oplossing uitgewerkt. Door de stap te zetten van de verzameling van profielgegevens in 7 dagen naar de modellering van Metriweb surfgegevens voor 28 dagen wordt bovendien de coherentie verzekerd tussen mediaplanning op deze steekproefgegevens en de gekende Metriwebvolumes van het universum. 5

Opdrachtgevers en uitvoerders van de studie 1. De Technische Commissie Internet De Technische Commissie Internet heeft de opdracht gegeven voor de realisatie van de Metriprofilstudie. Deze commissie werd opgericht in 1999. Op het ogenblik van publicatie, was de Commissie als volgt samengesteld: Voorzitter: Leden: Hugues REY Luc BOMANS Axel BROEKAERT Dominique CATRY Frank CHENAU Renaud DE LOMBAERT Jean-Michel DEPASSE Pierre DUBOIS Bruno DURDU Vincent GROSSEN Didier LEFEVRE Vincent PELERIN Stéphanie RADOCHITZKI Christophe ROUSSEAUX Noëlle STEVENS John WITTESAELE Binnen het CIM wordt het werk van de Technische Commissie Internet gecoördineerd door projectleider Philippe DEGUELDRE, hierbij bijgestaan door Rikkert VAN LOO en Oumar GUEYE. De functie van Algemeen Directeur wordt verzekerd door Stef PEETERS. De projectleider en zijn assistenten verzorgen ook de contacten met de intekenaars en bewaken, met het bureau voor software-ontwikkeling, de correcte uitvoering van alle technische vereisten door de intekenaars. 6

2. De technische partners Net zoals voor Metriweb gebeurt de dataverzameling en de data-analyse van Metriprofil door MetriWare. De publicatie van de Metriprofil resultaten gebeurt door het software ingenieursbureau DouWère (Luik). Complexe vragen inzake data-analyse werden opgelost in overleg met Carthage (Frankrijk). Dit instituut heeft voor deze editie van Metriprofil ook de weging van de gegevens uitgevoerd onder leiding van: Antoine TACONET 3. De intekenaars op de studies De tactische internetstudies die in deze publicatie aan bod komen, worden mee gefinancierd door onderstaande bedrijven. Enkel deze bedrijven hebben toegang tot de bereikcijfers die verband houden met deze publicatie. De technische partners hebben contractueel gezien niet het recht de gegevens aan derden door te geven. Bovendien zijn de leden van het CIM verplicht omzichtig met de gegevens om te springen en mogen zij deze uitsluitend gebruiken in het kader van hun normale commerciële activiteiten. Bedrijven die lid willen worden van het CIM kunnen daartoe alle nodige informatie bekomen bij de Permanente Structuur of onmiddellijk op de website www.cim.be. 7

Lijst intekenaars tactische internetstudies 2DEHANDS.NL LUDIBUNDUS 6 MINUTES PRESS MEDIA AD INFINITUM ADLINK INTERNET MEDIA MEDIAA ALL COMPUTER SERVICES MEDIAFIN ANT NETWORKS MICROSOFT ATHOME GROUP MINOC ONLINE AU FEMININ.COM MONSTER BELGIUM BE ON WEB MTV NETWORKS BELGIUM BE TV NATIONALE DIENST VOOR PROMOTIE VAN KINDERARTIKELEN BELGACOM SKYNET NET EVENTS BEWEB REGIE NETLOG BLUESTAR INTERACTIVE NETMEDIA EUROPE BOUWINDEX.BE NETSHOPPING CAR CHANNEL NOSTALGIE CEDRIC.NET NRJ BELGIQUE CHAT PASSE-PARTOUT CIM PRODUPRESS CLAIR DE LETTRE-FAMIDOO REGIONALE TV MEDIA (RTVM) CLUB BRUGGE K.V. RENDEZ-VOUS GROUP COBELFRA ROSSEL & CIE COMMUNICATION LAB ROULARTA MEDIA GROUP CONCENTRA UITGEVERSMAATSCHAPPIJ ROYAL SPORTING CLUB ANDERLECHT CONNECTIONS RTBF COUDIJZER MARC SA IPM CTR MEDIA SANOMA MAGAZINES BELGIUM DAILYMOTION SBS BELGIUM DE PARTICULIER A PARTICULIER BELGIQUE SENIORENNET DE PERSGROEP PUBLISHING SHERPA.BE DE VRIJE PERS SOFTSIGN DOCTISSIMO EDITION START MEDIA E-BUDDY STEPSTONE EDITIONS CINE-REVUE STUDIO100 EDITIONS DE L'AVENIR TATOOINE COMPUTER SYSTEMS (TCS) E-SANTE / E-GEZONDHEID TELEFUN FORTIS BANK TELENET FTV INTERNATIONAL THE BRUSSELS AIRPORT COMPANY GEZONDHEID THE PICKWICK PROJECT GOLAZO MEDIA TRUVO BELGIUM GUIDO TVI HACHETTE - EDITION VENTURES ULYN HI-MEDIA BELGIUM UNIVERSAL MUSIC I-CONSULTING UTOPOLIS BELGIUM IDE BERT TRADING EN CONSULTING (IBTC) V R T JIPPII MOBILE ENTERTAINMENT OY V.D.A.B. JOBAT VACATURE CV JOBS & CAREERS CV VANHAELWYN BRECHT K.RACING CLUB GENK 322 VBO - FEB KAPAZA! VIA MICHELIN KINEPOLIS GROUP VIVAT BELGIUM KMONET VLAAMSE MEDIA MAATSCHAPPIJ (VMMA) KOOPJESKRANT - J'ANNONCE VLAAMSE UITGEVERS MAATSCHAPPIJ (VUM) LIBERTY TV VNU MEDIA LIGUE DES FAMILLES VTB - VAB LIVIOS W3 INC. / DMIS LOCATIENET WEB SOLUTION WAY 8

Design 1. Steekproeftrekking UPDATE De huidige publicatie is gebaseerd op twee nieuwe golven: 2008-2 (16/06-22/06 2008) en 2008-3 (15/09-21/09 2008). Het onderzoek begint telkens op maandag 08:00 en niet om middernacht om eventuele problemen live op te sporen en te verhelpen. Van dan af doet elke gekende Metriweb visitor die voor het eerst na maandag 8:00 uur een Metriweb pagina opvraagt zonder het te weten mee aan de Metriprofil lottrekking. Een randomgenerator bepaalt voor elke Metriweb visitor die voor het eerst na maandag 8:00 uur gesignaleerd wordt, een toevallig cijfer tussen 1 en 35. Wie 35 trekt, krijgt op de volgende Metriwebpagina die hij of zij bezoekt, een uitnodiging om mee te doen aan het Metriprofilonderzoek. In deze individuele loterij heeft iedereen één kans op 35 om getrokken te worden. Er werd dus niét voor gekozen om systematisch elke 35ste surfer uit te nodigen. Dit veronderstelt immers één centrale telling op één centrale computer. De individuele loterij, daarentegen, kan uitgevoerd worden op verschillende servers zodat dezelfde kwaliteit van toevalstrekking gecombineerd wordt met een grotere bedrijfszekerheid. De sampling rate wordt gekozen in functie van de te bereiken steekproefgrootte en de duur van het onderzoek. Het is de bedoeling om per golf minimaal 8.000 bruikbare vragenlijsten te verkrijgen. Met bruikbaar wordt bedoeld: vragenlijsten die door inwoners van België volledig ingevuld werden en die de quality check en de validering van de bijhorende Metriwebcookies doorstaan. Als incentive werd een gemengd prijzenpakket met Win for Life biljetten, een mp3-speler, een gastronomisch diner en een wijn cadeau-cheque verloot Elke deelnemer kreeg na een eerste weigering, de uitnodiging nog maximaal 4 keer herhaald op een andere site, tijdens een ander dagdeel en eventueel op een andere dag. 9

2. Vragenlijst De Metriprofilvragenlijst bestaat uit drie modules: internetinfrastructuur en surfgedrag, socio-demografische kenmerken van de bevraagde persoon en de verantwoordelijke voor het inkomen, en surfactiviteiten. De volledige vragenlijst staat in Bijlage 1. Er werden geen wijzigingen aangebracht ten overstaan van de vorige publicatie Om medewerking te krijgen én te behouden in online onderzoek is tien minuten voor een niet-gerichte en ongevraagde online vragenlijst een groot maximum, vijf minuten het streefdoel. De mediaan doorlooptijd van 519 seconden (8min39sec) blijft binnen aanvaardbare grenzen. Het verlies van deelnemers bij de vragen inzake infrastructuur en surfgedrag was 4.8%, bij de socio-demografische vragen 6.5% en in het laatste deel, de surfactiviteiten 2.1%. Het totale verlies lag met 13.4% op hetzelfde niveau als bij de vorige publicatie (11,2%). Net als in de vorige golven werd de volledigheid van de socio-demografische informatie weerhouden als criterium om enquêtes als bruikbaar mee te nemen in de analyses. 3. Aanbiedingswijze De vragen worden sequentieel aangeboden in een scherm dat minder dan één kwart van een normaal computerscherm uitmaakt (zie illustratie hieronder). De surfer klikt met de muis op het juiste pijltje en de volgende vraag verschijnt. De surfer kan bovenaan rechts in een soort tijdsbalk zijn vooruitgang volgen en schatten hoeveel vragen er nog overblijven, aan de hand van de bewegende grijze balk. 10

Alle vragen zijn gesloten vragen op twee uitzonderingen na. De leeftijd wordt gevraagd aan de hand van een scroll down vak met jaartallen (zie hieronder links). De postcode wordt ingevuld in een vrij veld dat wel alleen de officiële postcodes toelaat (zie hieronder rechts). 11

Respons De gemiddelde respons in online onderzoek ligt lager dan in klassiek offline onderzoek. Bovendien is er in studies zoals Metriprofil geen controle op wie deelneemt: er wordt weliswaar een toevalssteekproef getrokken maar de surfers die meedoen hebben uiteindelijk zichzelf geselecteerd. De onzekerheid over de representativiteit is daardoor groot. Dit nadeel staat tegenover de lage kostprijs, de snelheid, gebruiksvriendelijkheid, en de rechtstreekse foutloze codering van resultaten. Internetpanels proberen de voordelen van online onderzoek te maximaliseren en de nadelen te minimaliseren. Metriprofil heeft hier niet voor gekozen. Voor deze studie wordt aan de basis een random selectie van surfers op Belgische websites gerekruteerd. Gezien het voorwerp van de studie het surfgedrag op deze sites is, valt het steekproefkader perfect samen met het universum. Dit is een zeldzame luxe maar verandert niets aan het feit dat surfers enkel na zelfselectie zullen deelnemen aan het onderzoek. De gevolgen voor de representativiteit van de steekproef worden verder besproken bij Dataverwerking. Hier staan we stil bij het niveau van de respons. Die kan op verschillende manieren gemeten en vergeleken worden. Een eerste meetpunt is het aantal mensen dat antwoordt op de eerste vraag Hoelang surft u al op het Internet. Een tweede logisch meetpunt is het aantal mensen dat antwoordt op de laatste vraag. Het verschil tussen beide is het aantal mensen dat afhaakt. Het werd hoger al besproken als een aanduiding van de mate waarin de surfers de vragenlijst vlot verteren. Daarnaast werd een derde meetpunt ingesteld: het aantal mensen dat alle vragen inzake internetinfrastructuur en surfgedrag, én alle socio-demografische vragen volledig heeft beantwoord. Dat er vragen ontbraken in het laatste deel over hun surfactiviteiten, is minder problematisch in een studie naar het sociodemografische profiel van Belgische internetsites. Het vierde meetpunt is het aantal bruikbare vragenlijsten waarvan de cookies worden meegenomen in de dataverwerking (zie verder). Een beperkt aantal enquêtes wordt afgekeurd tijdens de dataverificatieprocedure. De antwoorden tonen onoverkomelijke inconsistenties (bv. een 17-jarige met een doctoraat; een deelnemer van 106 jaar ) of verdachte reeksen repetitieve antwoorden (bv. eenzelfde antwoordcategorie op de 26 vragen over surfgedrag). In de praktijk is dit aantal zo klein dat het hier niet verder behandeld wordt. Wel belangrijk zijn de 4.20% antwoorden van buitenlandse residenten en de 1.09% enquêtes die ingevuld werden in cybercafés of nog elders. Zij worden niet weerhouden in de data-analyse. Buitenlandse residenten worden niet tot de doelgroep gerekend. 12

Enquêtes uit cybercafés kunnen enkel met sessiecookies geassocieerd worden en leveren daardoor nauwelijks bruikbare profielgegevens. Het ultieme vijfde meetpunt is het aantal interview-cookie combinaties die de dataverwerking doorstaan. Er zijn ook verschillende vergelijkingspunten mogelijk. In de bespreking van het verlies aan deelnemers tijdens de enquête werd logischerwijze het aantal mensen dat op de eerste vraag antwoordde als basis genomen. Het eerste vergelijkingspunt is evenwel het aantal mensen dat de uitnodiging zag. Het aantal volledige enquêtes gedeeld door het aantal uitnodigingen is de zuiverste basis voor het beoordelen van de globale respons. Er zijn echter twee factoren waarmee moet rekening gehouden worden bij de interpretatie van deze resultaten. Om te beginnen werd de uitnodiging tot maximum vijf keer getoond (telkens op een andere site en in een ander dagdeel). Het aantal verstuurde uitnodigingen (eerste lijn in de volgende tabel) is dus hoger dan het aantal uitgenodigde surfers (tweede lijn in de volgende tabel). Een tweede, belangrijkere complicatie is dat een poging tot presentatie van een uitnodiging niet altijd betekent dat de surfer de uitnodiging ook effectief ziet. Het klassiek voorbeeld is de site die gedurende een aantal dagen de overlayer onzichtbaar toont. Dat is zeer wel mogelijk omdat voor een effectieve uitnodiging de programmacode van Metriprofil perfect moet samenwerken met die van de site, en er op dat niveau veel misverstanden mogelijk zijn. Het aantal verstuurde uitnodigingen is dus een (over)schatting omdat niet alle storingen automatisch worden gedetecteerd. Uit de resultaten in de volgende tabel blijkt dat 8.12% van de uitgenodigde surfers bereid was om aan de vragenlijst te beginnen. Na selectie van Belgische enquêtes en de uitgebreide validering van de overeenkomstige Metriwebcookies (zie Gegevensverwerking ), leidde dit tot 21.688 of 6.9% bruikbare enquêtes. Eerste golf Tweede golf Verstuurde uitnodigingen 436.366 284% 442.737 274% Uitgenodigde Metriweb visitors 153.544 100% 161.567 100% Begonnen enquêtes 11597 7,6% 14033 8,7% Bruikbare Belgische enquêtes 10168 6,6% 12411 7,7% Weerhouden enquête-cookie combinaties 9806 6,4% 11862 7,3% 13

Gegevensverwerking Bij de situering van de tactische internetstudies in het eerste hoofdstuk werd er al op gewezen dat het profileren van Metriwebdata géén eenvoudige klus is. Het perfecte overzicht van wat er zich op Belgische sites afspeelt op het niveau van de browsers, page requests en visits laat zich niet eenvoudig omzetten in een profilering op mensenmaat. Om te beginnen moeten er oplossingen (of een modus vivendi) gevonden worden voor het multi-cookie probleem, het multi-pc probleem en het multi-user probleem. Daarna moet bekeken worden in welke mate de zelfselectie van de Metriprofil-steekproeven gecorrigeerd (lees: gewogen) moeten worden. Het is immers essentieel dat de steekproef een goede voorafbeelding is van het universum in termen van surfgedrag en socio-demografische kenmerken. Voor deze publicatie werd bijkomend de vraag geformuleerd of Metriprofilgegevens verzameld op 7 dagen mediaplanning op 28 dagen kunnen mogelijk maken. In dit hoofdstuk wordt beschreven welk antwoord deze publicatie biedt op al deze vragen. Vooraf herinneren we eraan dat het profiel van een persoon die de Metriprofil vragenlijst invult op site X ook wordt toegekend aan alle andere sites die deze persoon bezoekt binnen een referentieperiode van 28 dagen. Metriprofil laat toe om voor alle Belgische sites met voldoende observaties niet één maar twéé socio-demografische profielen te bepalen: een profiel van het nettobereik én een profiel van de brutocontacten, waarbij rekening wordt gehouden met het surfvolume van de bezoekers. 1. Herstel van onvolledige tijdreeksen De reconstuctrie van onvolledige tijdreeksen gebeurde in vijf stappen en was identiek aan de reconstructie bij de vorige publicatie. Allereerst werd net als bij de vorige publicatie eerst een technische analyse uitgevoerd. Die komt er op neer dat door de vergelijking van de Metriwebcookies met lokaal gegenereerde cookies in een groot aantal gevallen ondubbelzinnig de band kan geïdentificeerd worden tussen twee verschillende maar elkaar in de tijd opvolgende Metriwebcookies. Op die manier wordt het mogelijk om twee (of meer) cookies, waarvan vaststaat dat ze bij dezelfde browser horen, als het ware aan elkaar te rijgen. In een tweede stap werd nagegaan welke cookies, zonder enige ingreep, voor de volle 28 dagen bruikbaar waren. Daartoe werden alle dagen waarop een cookie actief was in kaart gebracht. In de volgende tabel (schema 1) worden enkele voorbeelden weergegeven. Elke lijn stelt een cookie voor en de 1 staat voor een dag waarop een cookie in Metriweb actief was. Daarnaast werd gekeken of een cookie ook actief was in week 5 (na de planningperiode) of in week 0 (voor de planningperiode) en of een cookie al voor de planningperiode gecreëerd werd. 14

Before Week 1 Week 2 Week 3 Week 4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 A 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 B 1 1 C 1 1 1 D 32d 1 1 1 1 E 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Wk 5 1 1 Schema 1 Als een Metriwebcookie maar enkele dagen wordt geobserveerd, rijst onmiddellijk de vraag wat er met de ontbrekende dagen aan de hand is. - Was de Metriweb visitor niet actief gedurende die dagen? - Werd in de loop van de onderzoeksperiode, volkomen terecht, een nieuwe cookie gecreëerd voor een nieuwe surfer, of voor een gekende surfer op een nieuwe computer? - Werd toevallig in die week de vervaldatum van de Metriwebcookie bereikt? - Of gaat het om een surfer die zijn Metriwebcookie verwijderd heeft omdat hij of zij regelmatig, of toevallig nu, zijn computer opschoont? In de eerste twee gevallen is er niets aan de hand. De Metriprofilgegevens zullen perfect de realiteit weergeven. De laatste twee gevallen zijn problematisch. Door de onvolledige tijdreeks wordt het profiel van cookie cleaners slechts met een deel van de werkelijk bezochte sites verbonden. Deze onderschatting én het feit dat surfers die cookies verwijderen misschien een afwijkend profiel hebben, kan resulteren in een vertekening van de socio-demografische profielen en een overschatting van het aantal nettobezoekers. Dat dit probleem de nodige aandacht verdient, mag blijken uit het feit dat twee op drie surfers verklaart cookies te verwijderen, ruim één op vier zegt dit minstens 1x per week te doen. In deze fase werd bekeken voor welke cookies de (in)activiteit voor alle 28 dagen bekend was: - omdat ze elke dag actief waren (voorbeeld A), - omdat ze minstens de eerste én de laatste dag van de planningperiode gezien werden (voorbeeld B), - omdat ze zowel in de week vóór als in de week ná de planningperiode actief waren (voorbeeld C), - ofwel in de week na de planningperiode actief waren en uit de creatiedatum van de Metriprofil cookie bleek dat ze vóór de planningperiode waren aangemaakt (32 dagen geleden in voorbeeld D). Die laatste drie voorwaarden impliceren immers dat ontbrekende dagen in de planningperiode ook echt dagen van inactiviteit waren. Alle dagen die op die manier gevalideerd kunnen worden, werden in de volgende tabel (schema 2) met groen aangeduid. 15

Daarnaast werd beslist om ook cookies, die gedurende minstens 80% van de planningperiode geobserveerd konden worden, zonder ingreep te valideren. Praktisch betekent dit dat cookies met minstens 22 dagen geobserveerde (in)activiteit goed gerekend werden (voorbeeld E). Before Week 1 Week 2 Week 3 Week 4 Wk 5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 A 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 B 1 1 C 1 1 1 1 D 32d 1 1 1 1 E 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Schema 2 1 In de derde fase werden de onvolledige cookies geanalyseerd met een algoritme dat toelaat om: - met grote waarschijnlijkheid onvolledige observatieweken als waar of vals te identificeren, - en vals onvolledige weken te vervolledigen met gegevens uit een nabije tijdsperiode van het Metriwebcookie zelf. Before Week 1 Week 2 Week 3 Week 4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 F 1 1 1 1 1 1 1 1 1 1 1 1 G 1 1 1 1 1 1 1 1 1 1 1 H 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 J 1 1 1 1 1 1 1 K 1 1 1 1 1 1 Wk 5 Schema 3 In de volgende gevallen werd een onvolledige week als juist aanvaard, d.w.z. dat alle lege dagen definitief als inactief worden gecategoriseerd (in de tabel aangeduid met lichtblauw, schema 3): - het aantal actieve dagen is gelijk aan het aantal dagen in een andere, volledig gevalideerde week uit de planningperiode (voorbeeld F: het aantal dagen in de onvolledige week 1 = het aantal dagen in de volledig gevalideerde week 3), - het aantal actieve dagen is gelijk aan het aantal dagen in een andere, volledig gevalideerde week uit de planningperiode plus of minus 1 (voorbeeld G: het aantal dagen in de onvolledige week 1 = het aantal dagen in de volledig gevalideerde week 3 min 1), - de geobserveerde dagen vallen allemaal in één week en hun aantal bedraagt minstens 5 (in voorbeeld H worden zaterdag en zondag daarom gelijkgesteld met inactieve dagen). 16

In alle andere gevallen werden de ontbrekende dagen vervangen door de corresponderende dagen uit een naburige week (in de tabel aangeduid met lichtblauw, schema 3): - als de ontbrekende dagen in het begin van de observatieperiode vielen, werden ze vervangen door dezelfde dagen uit de daaropvolgende week (in voorbeeld I werden dag 1 en 2 vervangen door de observaties van dag 8 en 9), - kwamen de ontbrekende dagen op het einde, dan werden ze vervangen door de corresponderende dagen uit de voorafgaande week (in de voorbeelden J en K werden dag 18, 19, 20 en 21 vervangen door resp. 11, 12, 13 en 14). Uit de voorbeelden blijkt al dat deze substitutie zowel inactieve als actieve dagen toevoegt. Voorbeeld I in de bovenstaande tabel (schema 3) toont aan dat sommige cookies door stap 3 vervolledigd worden. Andere cookies tellen nu weliswaar volledige, gevalideerde weken maar ook lege weken (twee in voorbeeld J en K; uitzonderlijk zelfs drie lege weken zoals in voorbeeld H). Deze procedure biedt géén oplossing voor cookies die slechts binnen één week werden geobserveerd en minder dan 5 gevalideerde dagen realiseerden. Zij werden geëlimineerd omdat de basis voor een geloofwaardige reconstructie op 28 dagen hier te klein is. In totaal werden om die reden 6.4% van de Metriprofil respondenten uit de eerste golf verwijderd, en 5.9% uit de tweede golf. In een vierde stap werden de lege, onbekende weken vervangen door volledige weken van dezelfde cookie. Om te vermijden dat de geobserveerde internetconsumptie kunstmatig wordt opgedreven, werd deze vervanging van volledige weken uitsluitend toegepast op cookies waarvan in de eerste stap (de correctie via lokale cookies) al was gebleken dat zij effectief gewist waren. Bovendien werd getracht om stereotype herhalingen zoveel mogelijk te vermijden door niet een naburige week te nemen maar een week die op grotere afstand lag: in voorbeeld F van de vorige tabel (schema 3) werd bijv. week 4 vervangen door een kopie van week 2. In de vijfde en laatste stap werden de resterende lege weken gelijkgesteld met inactieve dagen. 17

Het volgende overzicht toont de bijdrage van elke stap in de procedure tot de validering van volledige cookies (=28 dagen). De percentages werden berekend op het totale aantal weerhouden cookies, zonder de geëlimineerde cookies met minder dan 5 gevalideerde dagen. Complete cookies Base Step 2 Validation 28 days Step 3 Completion of weeks Step 4 Substitution empty weeks Step 5 Equation to inactive 1st Wave 26,5 70,7 73,4 75,1 100,0 2nd Wave 28,1 72,0 74,3 76,0 100,0 2. Ascriptie van surfvolume als méér dan 1 pc wordt gebruikt Wie thuis twee verschillende computers gebruikt en ook nog eentje op het werk, is binnen het Metriwebsysteem gekend als drie verschillende Metriwebvisitors. Als die persoon van op één van deze drie computers de Metriprofilvragenlijst invult, kan zijn profiel uitsluitend geassocieerd worden met de cookie van de pc van waarop hij of zij antwoordde (het multi-pc probleem). Dat is jammer. Er gaat kostbare informatie verloren door het ontbreken van de associatie met de twee andere cookies. Bovendien is het aantal visitors op die manier veel groter dan het netto aantal bezoekers. Het multi-pc probleem staat hierdoor een effectieve mediaplanning in de weg. Dit is geen marginaal probleem: in Metriprofil verklaren iets meer dan 6 op 10 surfers op méér dan één pc te surfen, ruim een kwart doet dat op minstens drie verschillende machines. Het multi-pc probleem is echter bijna volledig te herleiden tot complementair thuis én op het werk surfen. Méér dan de helft van de deelnemers verklaart niet alleen thuis maar ook op het werk te surfen. Het probleem is dus bijna volledig opgelost als we erin slagen om het ontbrekende surfgedrag van deze mensen in te vullen. Dat is perfect mogelijk met een klassieke ascriptieprocedure: - we zoeken mensen die de Metriprofil vragenlijst hebben ingevuld op het werk (donoren) en kennen hun werk-surfgedrag toe aan thuissurfers die sterk op hen lijken (de ontvangers), - omgekeerd zoeken we mensen die de Metriprofil vragenlijst thuis hebben ingevuld (donoren) en kennen hun thuis-surfgedrag toe aan werksurfers die sterk op hen lijken (de ontvangers). Op die manier reconstrueren we volledige surfers. 18

Dergelijke procedure is bekend binnen de CIM-studies. Ze wordt bv. traditioneel gebruikt om gegevens inzake productgebruik toe te kennen aan mensen die dat deel van de zelf in te vullen PMP vragenlijst niet hebben beantwoord. De kwaliteit van de oplossing staat of valt met de beschikbaarheid van goede relatievariabelen om donoren en ontvangers met elkaar in verband te brengen. Op basis van die relatievariabelen wordt een afstand berekend tussen alle donoren en alle ontvangers. In principe is de donor met de kleinste afstand de meest geschikte. Er moet echter ook rekening mee gehouden worden dat eenzelfde donor niet te vaak gebruikt wordt en dat de som van alle afstanden tussen de ontvangers en hun uiteindelijke donor zo klein mogelijk is. In de context van het multi-pc probleem worden een aantal relatievariabelen tussen donor en ontvanger op voorhand vastgelegd, voordat er sprake kan zijn van ascriptie: - beide moeten van hetzelfde geslacht zijn, - beide moeten dezelfde taal spreken, - als de éne de vragen thuis heeft beantwoord, moet de andere dit op het werk hebben gedaan of omgekeerd, - donor én ontvanger komen uit dezelfde Metriprofilgolf. Deze laatste voorwaarde vermijdt dat een donor uit juni samengaat met een ontvanger uit september. Het surfgedrag is in die periode zeer waarschijnlijk anders en bovendien zijn de deelnemende sites in het onderzoek niet volledig identiek. Voor een andere variabele werden de vrijheidsgraden sterk beperkt: Hoeveel % van alle tijd die u doorbrengt op het internet, surft u van op deze computer?. Idealiter is het percentage doorgebracht door een donor op de thuiscomputer (bv. 60%) perfect complementair met dat van de ontvanger op zijn of haar werkcomputer (bv. 40%). Toch is enige omzichtigheid geboden. We beschikken enkel over het antwoord op een semantische schaal met vijf niveaus, telkens toegelicht met een cijfermatige omschrijving: heel weinig (minder dan 10% van de tijd) een minderheid (tussen 10 en 39%) zowat de helft (tussen 40 en 59%) de meeste tijd (tussen 60 en 89%) bijna altijd (meer dan 90%) 19

Dat levert geen absolute waarheid. Bovendien wordt het aantal donoren op die manier mogelijk te sterk beperkt. Er moet immers voor elk van deze vijf niveaus 16 keer (geslacht x taal x werk/thuis x golf) een ascriptie uitgevoerd worden. Omdat er meer enquêtes worden ingevuld thuis dan op het werk, komt vooral het aantal werk-donoren onder druk te staan. Daarom is het beter om niet enkel donoren toe te laten die perfect complementair zijn maar ook donoren die één antwoordcategorie verschillen. In deze strategie mogen de donoren quasi complementair zijn. Wie m.a.w. zegt thuis een minderheid van de tijd te surfen (10 à 39%), krijgt potentieel een donor die bijna altijd (>90%), of de meeste tijd (60 à 89%), of zowat de helft van de tijd (40 à 59%) op het werk surft. Aan relatievariabelen is er in de Metriprofilvragenlijst geen gebrek. De antwoorden op ruim 30 vragen inzake internetinfrastructuur, internetactiviteiten en sociodemografische kenmerken werden omgezet in een waarde tussen 0 en 1 die logisch overeenstemt met het gegeven antwoordalternatief. Het verschil in waarde tussen het antwoord van de ontvanger en de potentiële donor bepaalt de afstand tussen beide. Voor de leeftijd werd niet het rekenkundig verschil als afstand genomen maar opnieuw een waarde tussen 0 en 1 die rekening houdt met de leeftijd van de ontvanger: op jonge leeftijd groeit de afstand sneller dan bij de ouderen (het verschil tussen een 15- en een 24-jarige is groter dan het verschil tussen een 45- en 54-jarige). De som van alle afstanden per vraag is de totale afstand tussen ontvanger en donor. Het zou echter niet logisch zijn als alle vragen even zwaar doorwogen bij de bepaling van de afstand tussen donoren en ontvangers. Daarom werden er 2 soorten gewichten gebruikt: A. De vermenigvuldigingscoëfficiënt Deze coëfficiënt geeft globale verschillen in belang aan. In deze ascriptie werd een coëfficiënt van 0,5 gegeven aan de frequentie waarmee thuis en op het werk gesurft wordt. Alle andere vragen kregen een coëfficiënt van 0,1. Dit betekent dat veel meer belang wordt gehecht aan de overeenkomst in frequentie van surfen dan aan alle andere vragen. 20

B. De delingscoëfficiënt Bij sommige vragen liggen de antwoorden zeer verspreid (bv. Hoe vaak gebruikt u internet om actueel nieuws te zoeken?). Bij andere vragen zijn de antwoorden zeer weinig verspreid (bv. Hoe vaak gebruikt u internet om online beleggingen te doen?). Dit wijst erop dat het om een zeer specifiek gedrag gaat en een overeenkomst tussen ontvanger en donor op dat vlak is dan ook belangrijker dan voor vragen met zeer verspreide antwoorden. Dat is de reden waarom de variantie in de antwoorden hier als delingscoëfficient gebruikt is. Hoe specifieker het gedrag, hoe kleiner de variantie van de antwoorden en delen met een kleine variantie leidt tot een groter getal dan delen met een grote variantie. Na de berekening van de afstanden, moest een algoritme gezocht worden om voor elke ontvanger de beste donor te kiezen. Zoals gezegd is in principe de donor met de kleinste afstand de meest geschikte maar moet er ook rekening worden gehouden met het totaal van alle afstanden (of de gemiddelde afstand) en het aantal keer dat een donor gebruikt wordt. Net als bij de vorige publicatie werd de ascriptie in één keer uitgevoerd. De afstand tussen ontvangers en donoren uit de 16 verschillende combinaties werd dusdanig hoog gezet dat ze nooit met elkaar verbonden konden worden. Elke keer dat een donor gebruikt werd, werd zijn afstand tot alle ontvangers vergroot met 35%. Daardoor wordt vermeden dat een donor te snel nog eens gebruikt wordt. In de volgende tabel wordt de distributie van de donoren weergegeven. In de linkse kolom staat het aantal keren dat een donor is gebruikt. In de volgende kolommen staat het aantal en het percentage donoren per frequentie van gebruik voor de eerste respectievelijk de tweede golf. Daaruit blijkt dat 83% van de donoren in de eerste golf en 93% in de tweede golf 1 tot 3 keer gebruikt wordt. Aan het andere eind van het spectrum staan 4% van de donoren in de eerste golf en minder dan 2% donoren in de tweede golf die 5 of 6 keer gebruikt worden. n Used Eerste golf Tweede golf 1 982 48,3% 1.413 50,8% 2 419 20,6% 672 24,2% 3 288 14,2% 501 18,0% 4 262 12,9% 165 5,9% 5 79 3,9% 24 0,9% 6 5 0,2% 6 0,2% 21

3. Correctie van surfvolume als er méér dan 1 gebruiker per pc is Het komt vaker voor: twee collega s op het werk delen een computer of vader, moeder en zoonlief gebruiken thuis dezelfde pc. Dit levert voor Metriprofil geen problemen als er op die computer verschillende gebruikersprofielen staan die ook daadwerkelijk gebruikt worden. Elke gebruiker heeft dan een eigen Metriwebcookie. Is dat niet het geval dan schuilt er achter één Metriwebcookie mogelijk 2 respectievelijk 3 personen met potentieel een totaal verschillend profiel. Dat wordt problematisch als alle sites verbonden met die ene Metriwebcookie, het profiel toegekend wordt van de persoon die toevallig de Metriprofil enquête invulde. In principe zijn er vier manieren om met het multi-user probleem om te gaan: - De gegevens van multi-user cookies/enquêtes worden niet gebruikt. Er zijn twee goede redenen om dit niet te doen. Op die wijze zou bijna een kwart van de gegevens in de vuilbak zou belanden. Bovendien is het vrijwel zeker dat de profielen van de multi-users geen toevallige doorsnee zijn van surfend België. Een saldo waarin bv. eenpersoonsgezinnen zwaar oververtegenwoordigd zou zijn, helpt niemand verder. - Voor de siteprofielen wordt enkel rekening gehouden met de surfgegevens van de sessie waarin de Metriprofil enquête werd ingevuld. Dit zou juist zijn als het zeker was dat slechts één gebruiker binnen één Metriweb sessie surft. Dat is zeker bij thuissurfers niet gegarandeerd. Bovendien wordt op die manier van een kwart van de steekproef tot 95% van het surfgedrag weggegooid en dat lijkt sterk op de eerste aanpak. - Indien gegevens bekend zijn over de andere gebruikers, kan het surfgedrag opgesplitst worden op basis van de probabiliteit dat site X door vader dan wel moeder bezocht wordt. Aan deze aanpak kleven opnieuw twee grote bezwaren. Ten eerste dreigen we hier in een cirkelredenering te belanden: de probabiliteit dat site X door vader dan wel moeder bezocht wordt, is juist het voorwerp van dit onderzoek. Ten tweede is het nog maar de vraag hoe bv. een probabiliteit van 65% dat vader site X bezoekt, 22% dat het moeder is, en 13% dat het de zoon was vertaald moet worden in een profielberekening (en later een planningtool). 22

- De volumegegevens worden gereduceerd tot de proportie van de totale surftijd op deze computer die de persoon die Metriprofil invult voor zijn rekening neemt. ls 50% van de surftijd op deze computer door vader opgebruikt (en vader heeft geantwoord op de Metriprofilvragen), dan wordt aan vader slechts 50% van de geobserveerde volumes op site X en Y toegekend. Dat lijkt eigenaardig: ofwel heeft vader site X bezocht ofwel niet, dus alle individuele volumes zijn wellicht fout? Toch is deze aanpak verdedigbaar. Ten eerste wordt het globale volume voor de bevraagde persoon teruggebracht tot een meer realistisch niveau. Ten tweede zouden de individuele fouten uitgevlakt moeten worden op het niveau van de steekproef: de ene keer zal vader onterecht geassocieerd worden met site X die eigenlijk bezocht werd door moeder, maar in een ander gezin wordt moeder misschien onterecht diezelfde site X geassocieerd terwijl eigenlijk de zoon de bezoeker was. De Technische Commissie heeft voor deze publicatie de laatste optie gekozen: het volume wordt gereduceerd tot de proportie van de totale surftijd op de pc die door de bevraagde persoon voor zijn rekening neemt. Technisch is het veruit de eenvoudigste oplossing. De reductie van de geobserveerde volumes beantwoordt beter aan de realiteit dan de oorspronkelijk geobserveerde volumes. Dat de individuele fouten uitgevlakt worden, veronderstelt wel dat multi-users op het niveau van de steekproef in werkelijkheid ongeveer in gelijke mate dezelfde sites bezoeken. Het is niet zeker dat deze veronderstelling voor iedere site in dezelfde mate opgaat maar dit lijkt een kleiner risico dan de fout die zou ontstaan door het multi-user probleem te negeren. Zoals bij de vorige publicatie werden gegevens van surfers die minder dan 20% van de surftijd op een computer voor hun rekening nemen, niet weerhouden. Het gaat om een beperkt percentage die in de exploitatiegegevens tot 'eigenaardige', kleine paginafragmenten aanleiding geven en die geen wezenlijke bijdrage leveren tot het profiel. 23

4. Weging in functie van surfvolumes in het universum Aangezien Metriweb een volledig beeld geeft van het universum, kan perfect worden nagegaan of de Metriprofil steekproeven representatief zijn. Dat is zonder meer het geval als het gaat om het Operating Systeem, de gebruikte Internet Browsers en bv. de spreiding van het surfen in de loop van de dag. Er zijn evenwel andere variabelen die mogelijk impact hebben op het profiel van de sites waarvoor de steekproef onvoldoende representativiteit bereikt. Die worden best gewogen. Dat is in deze studie gebeurd voor het globale surfvolume, de volumeverdeling weekdagen/weekend en het volume per type van site. Een eerste factor is het globale surfvolume. Unique Visitors die meedoen aan Metriprofil surfen meer dagen, bezoeken méér sites en vragen méér pagina s op dan de doorsnee Belgische Unique Visitor. Gezien de hoge correlatie tussen deze variabelen werd in de verdere analyse enkel het aantal opgevraagde pagina s gebruikt. Een tweede factor is de verdeling tussen surfen op weekdagen en surfen in het weekend. Het surfgedrag tijdens de week en in het weekend is niet noodzakelijk hetzelfde. Vandaar het belang van een correcte verhouding tussen beide in een profielstudie. De derde controlefactor is het type van site. Er zijn vanzelfsprekend verschillende typeringen van sites mogelijk. Voor deze weging werd een pragmatische indeling opgemaakt die zoveel mogelijk mikt op homogene groepen met vergelijkbare volumes page requests. - Webmail ; - buy + search (koopjessites, directories) ; - meet (chat en datingsites) ; - blog (blog of dagboek sites) ; - portal (enkel "homepage" en "other"; de secties werden naar hun inhoud geclassificeerd) ; - vortal + community (doelgroepensites: man, vrouw, kind, senioren, gamers, voetbalsupporters ) ; - news (nieuwssites van online of offline media zoals audiovisuele media of kranten) ; - business (b-to-b sites bv. CIM, MM ). Merk op dat deze weging zich afspeelt op het niveau van de cookies. Ze gebeurt afzonderlijk voor beide golven. Door seizoenseffecten is het surfgedrag immers niet noodzakelijk hetzelfde in alle onderzoeksperiodes. Bovendien varieert ook het aantal deelnemende sites. 24

Bij deze weging wordt tegelijk rekening gehouden met de correctie van het volume voor multi users (zie hoger): dit is de proportie van de totale surftijd op deze computer die de persoon die Metriprofil invulde voor zijn rekening neemt (1,00-0,75-0,50-0,25 of 0,05). Dit heeft tot gevolg dat de meeste gewichten kleiner zijn dan 1. Hierna volgt voor beide golven de tabel met de beginsituatie vóór weging ( observed ), de objectieven volgens het Metriwebuniversum ( target ), en tot slot het resultaat na weging met 50 iteraties ( result ). Daaronder staat de grafiek met de verdeling van de individuele gewichten. 25

First Wave observed target result Pages/week % % % 1-10 10,1 28,1 28,1 11-53 29,2 23,3 23,1 54-122 23,0 13,0 13,3 123-324 17,2 15,1 15,1 324+ 20,5 20,5 20,5 Week/WE % % % weekend 26,8 25,8 25,8 Type of site % % % Webmail 11,0 14,4 14,4 Buy/search 14,5 17,5 17,5 Meet 35,7 29,1 29,1 Blog 11,3 13,5 13,5 Portal 2,4 3,4 3,4 Vortal/Comm. 10,3 8,5 8,5 News 11,8 10,2 10,2 Business 3 3,5 3,5 26

Second Wave observed target result Pages/week % % % 1-10 9,6 28,4 28,4 11-53 29,5 23,4 23,4 54-122 21,7 13,1 13,1 123-324 19,1 15,1 15,1 324+ 20,0 20,0 20,0 Week/WE % % % weekend 28,4 27,4 27,4 Type of site % % % Webmail 10,8 13,2 13,2 Buy/search 15,8 18,0 18,0 Meet 34,6 30,3 30,3 Blog 12,4 12,7 12,7 Portal 2,1 3,1 3,1 Vortal Comm 8,2 8,2 8,2 News 11,2 9,9 9,9 Business 5,0 4,7 4,7 27

Zoals gezegd leidt de combinatie van de volumecorrectie met de correctie voor multi-users er toe dat de globale curve naar onder schuift. De volumecorrectie per cookie brengt de structuur van de steekproef in overeenstemming met de structuur van het universum. Met een tweede volumecorrectie per site werden de globale niveaus van Page Requests op één lijn gebracht met de niveaus die in Metriweb werden geobserveerd. Met een eenvoudige regel van drie werden, over alle personen heen, de volumes per site gecorrigeerd. 5. Weging in functie van socio-demografie van surfers in PMP 2008 Van een socio-demografische profileringstudie mag verwacht worden dat ze aan de basis representatief is voor het universum. Gezien de zelfselectie van de Metriprofilsteekproeven is een grondige controle van hun samenstelling en representativiteit zeker op zijn plaats. Een vertekening van de steekproef impliceert immers een vertekening van de siteprofielen. Om de socio-demografische representativiteit van de Metriprofilsteekproef te verbeteren wordt, een klassieke weging gebruikt, dit keer niet van Metriwebcookies maar van de Metriprofil personen. De Technische Commissie heeft beslist om daartoe het Totale Surfbereik van de laatste maanden uit de PMP 2008 als referentie te gebruiken. De personenweging van deze Metriprofil steekproeven is niet enkel een correctie voor socio-demografische afwijkingen: Gezien het feit dat de Metriprofil recrutering slechts 1 week duurt, wijkt de Metriprofilsteekproef af van het Metriwebuniversum over 28 dagen. Wie in Metriweb de volle vier weken gekend is, maakt 1/35 kans om in de Metriprofil week uitgenodigd te worden. Wie slechts één van de vier weken aanwezig is, maakt géén enkele kans om uitgenodigd te worden tenzij hij of zij toevallig in de Metriprofil week actief is: voor deze surfers is de kans op deelname slechts 1/35 x 1/4. Deze surfers met typisch een kleiner volume bezochte pagina's zijn bijgevolg ondervertegenwoordigd. In de modellering voor deze publicatie werd "het aantal gekende weken", net als alle andere socio-demografische variabelen in de weging ingebracht. Aangezien in beide golven de sampling rate identiek was (1/35), worden de verschillen in steekproefgrootte tussen de golven niet langer uitgevlakt: er wordt verondersteld dat zij verschillen in het universum weerspiegelen. 28