Wifi- en Bluetooth-tracking: Nauwkeurigheid en representativiteit Jasper Beernaerts



Vergelijkbare documenten
Percentage afwijkingen groter dan vijf decibel

4.2. Evaluatie van de respons op de postenquêtes. In dit deel gaan we in op de respons op instellingsniveau en op respondentenniveau.

Jongeren en Gezondheid 2014 : Socio-demografische gegevens

Gezondheidsenquête, België Inleiding. Wetenschap ten dienste van Volksgezondheid, Voedselveiligheid en Leefmilieu.

versie: 16 februari 2015

Jongeren en Gezondheid 2014 : Socio-demografische gegevens

Huishoudens die niet gecontacteerd konden worden

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Praktische tips voor succesvol marktonderzoek in de land- en tuinbouwsector

Tabel 2.1 Overzicht van de situatie op de arbeidsmarkt van de onderzochte personen op 30/06/97. Deelpopulatie 1996

FietsTelApp veelgestelde vragen

Positionering Nokia N76-1

Digitale (r)evolutie in België anno 2009

Rapport voor deelnemers M²P burgerpanel

Omnibusenquête deelrapport. Werk, zorg en inkomen

Uitgebreid eindwerkvoorstel Lokaliseren van personen en objecten met behulp van camera s

Autonoom vinden van een object met een quadcopter

PERSBERICHT Brussel, 22 december 2015

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Digitale (r)evolutie in België anno 2010.

Gedrag en ervaringen van professionele afnemers op de vrijgemaakte Vlaamse energiemarkt VREG - TECHNISCH RAPPORT

Omnibusenquête deelrapport. Zoetermeer FM

Populaties beschrijven met kansmodellen

3 Gemiddeld aantal afgelegde kilometer per persoon per dag (gaakpppd)

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Rapportage project 1.3 Uitvoering publieke domein

PERSBERICHT CIM 22/04/2015

Stap 1: Bepalen van het doel

Tabel 69: Verdeling van het gavpppd volgens geslacht en hoofdvervoerswijze. meerdere verplaatsingen heeft gemaakt.

Verslag consumentenonderzoek zorgsector Breda

Verdere evolutie van de geharmoniseerde werkloosheid in ruime zin

Eye tracking analyse van de visuele impact van windturbines in het landschap

4 HELP! IK HEB GEEN LOZE LEIDINGEN KABELS? POWERLINE VERBINDINGEN GEBRUIK VAN EEN WIFI REPEATER...

Aan de Voorzitter van de Tweede Kamer der Staten-Generaal Postbus EA DEN HAAG

De bepaling van de positie van een. onderwatervoertuig (inleiding)

Statistiekensynthese internet & e-government in Vlaanderen

Bijlage nr 10 aan ZVP BIJLAGE 10 LOKALE VEILIGHEIDS- BEVRAGING 2011

De belangrijkste conclusies die op basis van de tellingen in 2018 (in vergelijking met 2016) kunnen worden getrokken zijn:

Wageningen University (2012)

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

4. Resultaten. 4.1 Levensverwachting naar geslacht en opleidingsniveau

Privacyprotocol passantentellingen

Bottleball Onderzoeksverslag MovingMonsters. Uitgevoerd door Arno Classens

Uitzendarbeid: een oplossing voor vele transities

Jongeren en Gezondheid 2010 : Socio-demografische gegevens

Masterproeven Wireless & Cable Research Group (WiCa)

Voorwoord. Uitkomsten enquête

Omnibusenquête deelrapport. Studentenhuisvesting

Draagvlakmonitor huisvesting vluchtelingen. Rapportage derde meting juni 2016

Onderzoek Verplaatsingsgedrag Vlaanderen 4.3 ( )

Betreft: Voorstellen masterproeven Contactpersonen: Nick Cremelie Chris Poppe

EWMA Control Charts in Statistical Process Monitoring I.M. Zwetsloot

Beeld van het Europees Parlement in Nederland

Voorbeeldtentamen Statistiek voor Psychologie

1,9 miljoen Belgen hebben nog nooit een computer gebruikt; 2,6 miljoen Belgen hebben nog nooit op het internet gesurft.

Advies voor de implementatie van offline tracking technologieën voor de Nederlandse mode-industrie

Onderzoek mediagebruik Maastricht mei 2017

Rapport. Rapportage Bijzondere Bijstand 2013

Gedrag & ervaringen van huishoudelijke afnemers op de vrijgemaakte Vlaamse energiemarkt VREG 13/09/2012

Gegevensverwerving en verwerking

Privacy Protocol - CityTraffic

Gaan stemmen of niet gaan stemmen? (Uit: Kompas)

HOE WERKT HET VERSCHILLENDE MANIEREN VAN TELLEN, DE VOORDELEN & RESULTATEN

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Cliëntenonderzoek Wet maatschappelijke ondersteuning Gemeente Zutphen 2015

PRIVACY VERKLARING EN GEBRUIK VAN COOKIES I. PRIVACY VERKLARING

Departement industriële wetenschappen en technologie

Samenvatting. Audiovisuele aandacht in de ruimte

Autobiografisch geheugen in longitudinaal perspectief

Opzetten medewerker tevredenheid onderzoek

DoBeacon = 230V. Die app kunt u zelf maken met de door ons bijgeleverde tracking-api. Wij kunnen zelfs uw eigen logo op de DoBeacon plaatsen!

Kwaliteitsonderzoek begeleiding

Hoofdstuk 2: Kritisch reflecteren 2.1. Kritisch reflecteren: definitie Definitie: Kritisch reflecteren verwijst naar een geheel van activiteiten die

Voor meer informatie kunt u contact opnemen met Luk Joossens, Stichting tegen Kanker, tel.: 02/ , gsm:

Betreft: Voorstellen scripties Contactpersonen: Nick Cremelie Pascal Clarysse

Docentonderzoek binnen de AOS Bijeenkomst 8 Feedbackformulier bij het onderzoeksinstrument

Gedrag en ervaringen van huishoudelijke afnemers op de vrijgemaakte Vlaamse energiemarkt VREG - TECHNISCH RAPPORT

Samenvatting. Bezoekersonderzoek Magisch Maastricht 2016

EEN SIMULATIESTUDIE VAN DE SCHEDULE CONTROL INDEX

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn

WLAN EN LAN UITBREIDINGEN...

Omnibusenquête deelrapport millenniumdoelen. februari Opdrachtgever: Bedrijfsvoering,

BETER INZICHT IN DE OPENBARE RUIMTE. Slim meten is vooruit denken!

Bijlage: Toelichting gebruikte terminologie

Audio Listening. Page 1 of 5

Samenvatting. Exploratieve bewegingen in haptische waarneming. Deel I: de precisie van haptische waarneming

Beveiligingsaspecten van webapplicatie ontwikkeling met PHP

Auteurs: Baarda e.a. isbn:

Mobiele technologie zorgt ervoor dat je met een smartphone en tablet en draadloos op een laptop of computer kunt werken.

Statistische variabelen. formuleblad

Gedrag & ervaringen van professionele afnemers op de vrijgemaakte Vlaamse energiemarkt VREG 10/09/2013

Resultaten conjunctuurenquête 1 e halfjaar 2015

De fotogrammetrie bij het NGI

ALGEMENE DIRECTIE STATISTIEK EN ECONOMISCHE INFORMATIE PERSBERICHT 26 november 2010

WKK-barometer december. Zwartzustersstraat 16, bus Leuven

Een onderzoek naar GHB-gebruik onder 866 middelbare scholieren (12-19 jaar).

4 HELP! IK HEB GEEN LOZE LEIDINGEN KABELS? POWERLINE VERBINDINGEN GEBRUIK VAN EEN WIFI REPEATER...

Nederlandse samenvatting

Transcriptie:

FACULTEIT WETENSCHAPPEN Opleiding Geografie en Geomatica Master in de Geografie Wifi- en Bluetooth-tracking: Nauwkeurigheid en representativiteit Jasper Beernaerts Aantal woorden in tekst: 22 044 Promotor: Prof. Dr. N. Van de Weghe Begeleider: M. Versichele Academiejaar 2013 2014 Masterproef ingediend tot het behalen van de graad van Master in de Geografie Vakgroep Geografie

WOORD VOORAF Tijdens mijn opleiding Geografie kwam ik op verschillende momenten in aanraking met Bluetooth-tracking. Zo voerden we voor de vakken Inleiding tot Geografische Informatiewetenschap en Geografische Informatiewetenschap kleine onderzoeken uit met Bluetooth-scanners. Op deze manier werd mijn interesse opgewekt om zelf een steentje bij te dragen aan dit actuele en erg boeiende onderzoek. Graag maak ik van dit voorwoord dan ook gebruik om in de eerste plaats mijn promotor, Prof. Dr. Nico Van de Weghe, te bedanken voor de mogelijkheid die hij mij gaf om mijn onderzoek binnen het project dat hij opstartte uit te voeren. Hierbij wil ik ook mijn speciale dank betuigen aan Mathias Versichele die steeds bereid was mijn vele vragen te beantwoorden. Dankzij zijn expertise en ervaring in het opstellen en het interpreteren van de enquêtes en tracking van mobiele toestellen, verliep mijn onderzoek ongetwijfeld heel wat vlotter. Ik dank ook Roel Huybrechts voor de technische ondersteuning bij de ratiometingen, evenals Egbert Jaspers, Rob Wijnhoven en Kris Van Rens van ViNotion die bereid waren kosteloos telcamera s te leveren voor het onderzoek. Graag bedank ik ook de Stad Gent die het mogelijk maakte dit onderzoek uit te voeren. Verder wil ik alle personen bedanken die van dichtbij of veraf hebben meegewerkt aan mijn onderzoek, in het bijzonder mijn vrienden die me geholpen hebben bij het tellen van mensen tijdens de Gentse Feesten. Grote steun kreeg ik eveneens van mijn ouders en familieleden die me bijstonden in het zoeken naar oplossingen in moeilijke momenten. Mede dankzij hen heb ik me met veel voldoening kunnen verdiepen in Wifi- en Bluetooth-tracking, een passie die ik ongetwijfeld verder met me zal meedragen. Voorts wens ik alle lezers veel leesplezier. Jasper Beernaerts, 10 mei 2014 1

INHOUDSTAFEL 1.INLEIDING...5 1.1 Literatuurstudie.....5 1.1.1 Tracking...5 1.1.1.1 Plaatsbepalingstechnieken...7 1.1.2 Bluetooth...8 1.1.3 Wifi...8 1.1.4 Nauwkeurigheid 9 1.1.5 Representativiteit.......11 1.2 Probleemstelling...12 1.3 Doelstellingen...13 1.4 Onderzoeksvragen en hypothesen....14 1.4.1 Onderzoeksvragen...14 1.4.2 Hypothesen... 14 1.5 Structuur... 15 1.6 Belangrijkste resultaten en conclusies..16 2. METHODEN, MATERIALEN EN STUDIEGEBIED...17 2.1 Methoden en materialen...17 2.1.1 Enquête 17 2.1.2 Ratiometingen..22 2.1.2.1 Manuele metingen...22 2.1.2.2 Automatische metingen.... 24 2.2 Studiegebied. 25 3. RESULTATEN 27 3.1 Representativiteit.. 27 3.1.1 Algemeen. 27 3.1.1.1 Geslacht en leeftijd..27 3.1.1.2 Nationaliteit en verblijfplaats..27 3.1.1.3 Opleidingsniveau en beroepsstatuut...28 3.1.1.4 Aantal en type toestellen. 30 3.1.2 Bluetooth..32 3.1.2.1 Algemeen...32 3.1.2.2 Algemeen gebruik van Bluetooth..34 3.1.2.3 Detecteerbaarheid en geslacht....36 2

3.1.2.4 Detecteerbaarheid en leeftijd...36 3.1.2.5 Detecteerbaarheid en nationaliteit.......38 3.1.2.6 Detecteerbaarheid en woonplaats 39 3.1.2.7 Detecteerbaarheid en opleidingsniveau... 40 3.1.2.8 Detecteerbaarheid en beroepsstatuut.......41 3.1.2.9 Detecteerbaarheid en type toestel...42 3.1.2.10 Gebruik en kennis van Bluetooth......43 3.1.3 Wifi...44 3.1.3.1 Algemeen...44 3.1.3.2 Detecteerbaarheid en geslacht.....46 3.1.3.3 Detecteerbaarheid en leeftijd...47 3.1.3.3 Detecteerbaarheid en nationaliteit.......48 3.1.3.5 Detecteerbaarheid en woonplaats 48 3.1.3.6 Detecteerbaarheid en opleidingsniveau...49 3.1.3.7 Detecteerbaarheid en beroepsstatuut.......50 3.1.3.8 Detecteerbaarheid en type toestel 51 3.1.3.9 Gebruik en kennis van Wifi. 52 3.2 Nauwkeurigheid 53 3.2.1 Algemeen..53 3.2.2 Bluetooth... 53 3.2.2.1 Manuele metingen...53 3.2.2.2 Resultaten telcamera s.57 3.2.3 Wifi..60 3.2.3.1 Manuele metingen...60 3.2.3.2 Resultaten telcamera s.62 4. DISCUSSIE..64 4.1 Representativiteit..64 4.1.1 Bluetooth.. 64 4.1.1.1 Vergelijking met voorgaand onderzoek... 64 4.1.1.2 Type toestel..65 4.1.1.3 Gebruik van Bluetooth.67 4.1.2 Wifi... 67 4.1.2.1 Algemeen. 67 4.1.2.2 Type toestel..68 3

4.1.2.3 Gebruik van Wifi.69 4.2 Nauwkeurigheid...69 4.2.1 Algemeen.69 4.2.2 Bluetooth..71 4.2.3 Wifi..71 5. BESLUIT...73 6. REFERENTIELIJST 75 6.1 Publicaties.75 6.2 Internetbronnen. 78 7. BIJLAGEN...79 7.1 Bijlage 1: Resultaten enquête Gentse Feesten 2013. 79 4

1. INLEIDING Aangezien de interpretatie van Wifi- en Bluetooth-trackingdata een zekere technische achtergrondkennis van de lezer vereist, starten we met een literatuuroverzicht. Op deze manier kan de lezer stelselmatig kennis maken met de gehanteerde terminologie en methodologie. Het zal al snel duidelijk worden dat reeds er heel wat onderzoek is verricht naar het tracken van personen. Er zijn dan ook tal van commerciële en niet-commerciële toepassingen voor dergelijke activiteiten. 1.1 Literatuurstudie 1.1.1 Tracking Een groot aantal onderzoekers houdt zich al geruime tijd bezig met het volgen en analyseren van de bewegingen van personen. Waar men vroeger gebruik maakte van arbeidsintensieve methoden zoals het afnemen van enquêtes en het volgen van personen, ontstonden er in de 21e eeuw een groot aantal nieuwe technieken die voor dit onderzoek aangewend kunnen worden (Wolf et al., 2001). Het meest voor de hand liggende voorbeeld van dergelijke technologie is het volgen van een GPS (Global Positioning System)-signaal doorheen de tijd. Dit is het bekendste voorbeeld van navigatie met behulp van satellieten. Op die manier kunnen personen die zich te voet of met een auto verplaatsen gevolgd worden. Tracking met behulp van GPS heeft echter als gevolg dat, wanneer men niet geïnteresseerd is een gedetailleerde beschrijving van het spatio-temporeel traject van dat toestel, de data vereenvoudigd moeten worden. De positie van het toestel wordt met welbepaalde tussenpozen (het spatio-temporele interval) opgeslagen. Het vereenvoudigen van deze grote hoeveelheid informatie gaat echter vaak samen met het maken van subjectieve keuzes. Hieraan gekoppeld vereist de opslag van de ruwe data een grote hoeveelheid opslagruimte, die niet altijd voorhanden is. We zien hier echter een verbetering door de dalende prijzen van allerhande opslagmedia voor digitale gegevens. Wanneer men de GPS-locatie van personen doorheen de tijd wil volgen, is men genoodzaakt om GPS-ontvangers uit te delen en daarna terug in te zamelen voor analyse. De personen moeten dus actief participeren, wat de kans op het vinden van een representatieve groep testpersonen sterk verminderd. Een alternatieve methode is het doorsturen van gegevens naar een server via smartphone applicaties. In dat geval moet men wel over een internetverbinding beschikken. 5

Het gebruik van GPS-gegevens is tevens beperkt tot daar waar er een goede ontvangst is van deze signalen. Zo ontstaan er onnauwkeurigheden in de lokalisatie wanneer de ontvanger zich in een dichtbebouwde omgeving of binnen in een gebouw bevindt (Manodham et al., 2008). Zogenaamde multipath fouten ontstaan wanneer GPS-signalen voor het bereiken van de ontvanger, vertraagd worden door reflecties met objecten in de directe omgeving van de ontvanger (Zhong et al., 2008). Bovenstaande beperkingen maken van GPS-tracking een tijdrovende bezigheid. Daarboven is de haalbaarheid van tracking met behulp van GPS op mobiele toestellen begrensd door het erg hoge energieverbruik van de toepassing. Indien we personen willen volgen is het naargelang het onderzoek soms interessanter hun positie op een beperkt aantal punten op te meten. Zo is het soms belangrijker te weten welke weg een persoon op een kruispunt inslaat, dan op welke manier de persoon exact de weg tussen twee kruispunten in heeft afgelegd. Deze data kunnen verkregen worden door het installeren van sensoren op die plaatsen die van belang zijn voor het onderzoek. Hierbij kan men verschillende soorten signalen, die de toestellen die mensen bij zich dragen uitstralen (en ontvangen), detecteren. De 2 types die in deze masterproef zullen worden toegepast en vergeleken, worden hieronder verder besproken. Tegenwoordig is reeds een groot deel van de bevolking in het bezit van apparatuur (voornamelijk GSM s en smartphones, maar er is een toenemend aanbod van accessoires zoals draadloze hoofdtelefoons, printers en toetsenborden) dat in staat is Bluetooth- en Wifisignalen uit te zenden en te ontvangen (Aung et al., 2008). Dit feit, evenals de verschillende voordelen van deze technieken die later besproken zullen worden, onderbouwt de keuze voor Bluetooth-en Wifi-tracking in deze masterproef. In de literatuur is er geen sprake van wijdverspreide en algemeen aanvaarde software die bewegingsanalyses van trackingssessies toelaat. De GisMo-software die ontwikkeld werd door Mathias Versichele, postdoctoraal medewerker aan de Vakgroep Geografie van de Universiteit van Gent, is hier echter het vermelden waard. Dit programma werd onder andere gebruikt door Baeyens (2012), Claeys (2011), De Roeck (2011) en De Mûelenaere (2011) in hun thesisonderzoek. 6

De toepassingen van tracking zijn wijdverspreid. Zo is het mogelijk om dementerende bejaarden te volgen (Ruth et al., 2012), bedreigde diersoorten beter te beschermen (Walter et al., 2011) en zelfs massa-evenementen te beveiligen (Van de Weghe et al., 2013). 1.1.1.1 Plaatsbepalingstechnieken In de literatuur worden voor de plaatsbepaling door middel van signaalanalyse vijf technieken teruggevonden (Stook, 2011). De eerste techniek deelt de ruimte rondom de zogenaamde AP's (Access Points) die het signaal uitzenden op in zones. De locatie van het toestel wordt dan gegeven door de zone van het desbetreffende AP waarmee het in connectie staat (Stook, 2011). Deze techniek is beter bekend als Cell Identification. Een tweede methode (Angle of Arrival) bestaat uit het bepalen van de hoek tussen het Access Point en het toestel dat het signaal ontvangt. Hiervoor dient men wel te beschikken over een directionele antenne (Woo et al., 2011). De derde techniek is de Time of Arrival method (TOA) die de afstand tussen de zender en ontvanger bepaalt door het omrekenen van de tijd die het signaal nodig heeft om deze afstand af te leggen (Zhang et al., 2010). Een meer nauwkeurige variant van het bovenstaande procedé is de Time Difference of Arrival (TDOA) waarbij het zendtoestel en de ontvanger gesynchroniseerd zijn (Woo et al., 2011). De laatste methode is de analyse van de ontvangen signaalsterkte, beter bekend als RSS (Received Signal Strength) en wordt vaak gebruikt als fingerprinting. In de trainingsfase worden de verschillende signaalsterktes, ontvangen op verschillende mogelijke locaties, opgeslagen in een database. In de trackingfase worden de waargenomen sterktes dan vergeleken met deze opgeslagen waarden (Kolodziej & Hjelm, 2006). Een andere methode die bij RSS gebruikt wordt is de multilateratie via een eenvoudige regressie. 7

1.1.2 Bluetooth Bluetooth is een korte-afstands draadloze communicatietechnologie die gebruik maakt van de 2.4 GHz-band en die toelaat dat mobiele apparaten met elkaar communiceren (Tamura & Masuda, 2013). Doordat deze frequentie ook gebruikt wordt door andere technologieën zoals Wifi (zie onderdeel 1.1.3 Wifi) en microgolfovens, bestaat de kans dat interferentie en ruis ontstaan (Versichele et al., 2011). Dit probleem kan opgelost worden door het zogenaamde Frequency Hopping (FH), waarbij gekoppelde apparaten samen veranderen van kanaal (Seung-Hwan & Yong-Hwan, 2009). In het totaal zijn er 79 kanalen beschikbaar voor deze paarsgewijze frequentieveranderingen (Golmie et al., 2001). Het bereik van de Bluetoothtechnologie is afhankelijk van de klasse waar het toestel toe behoort. Er bestaan drie klassen, die een (theoretisch) bereik hebben van achtereenvolgens 100m, 10m en 1m. 1.1.3 Wifi Wifi is een draadloze communicatietechnologie ook bekend onder de naam WLAN (Wireless Local Area Network) die gebruik maakt van de IEEE 802.11 standaard voor draadloze communicatie (Agrawal et al., 2012). Wifi is een modulatietechniek van golflengtes binnen het bereik van 2.4 GHz. Er bestaan verschillende Wifi-standaarden. Onder de oudere varianten beschouwt men IEEE 802.11 a & b waarvan het bereik beperkt is tot 45 meter binnen gebouwen en 90 meter in open terrein. De nieuwe standaarden IEEE 802.11 g & n laten, naast een snellere gegevensoverdracht, een bereik van respectievelijk 91 en 182 meter toe (Ibrahim & Ibrahim, 2010). Lokalisatie van smartphones door middel van Wifi is energiezuinig, waardoor toestellen over langere periodes gevolgd kunnen worden (Zhang et al., 2012). Bij de meeste smartphones wordt voor de plaatsbepaling echter gebruik gemaakt van GPS en een ingebouwde accelerometer. Het probleem hierbij is dat dergelijke systemen een erg hoog energieverbruik hebben. De lokalisatie van een gebruiker op basis van Wifi kan gebeuren door analyse van metingen van de RSS (Received Signal Strength) ten opzichte van één of meerdere Access Points (AP). Dit zijn de punten vanwaar het Wifi-signaal dat de gebruiker ontvangt, verzonden wordt. Naarmate de ontvanger zich verder van het zendpunt bevindt, zal de signaalsterkte afnemen (Hossein & Soh, 2007). Op deze manier kan, door het combineren van signaalsterktes vanuit verschillende punten, een locatie toegewezen worden aan het toestel door middel van 8

trilateratie (Stook, 2011). Stook (2011) vermeldt tevens dat de fout van deze plaatsbepalingsmethode bij Wifi beperkt kan worden tot 1 m en maximaal 5 m zal bedragen. De fouten die hier optreden mogen, zeker in ongunstige omgevingen zoals steden met veel obstakels, evenwel niet onderschat worden. 1.1.4 Nauwkeurigheid De detectieratio van de opmetingen is de verhouding van het aantal gedetecteerde toestellen tot de totale populatie aan personen die zich door het bereik van de scanners verplaatst heeft gedurende een bepaalde periode. De stabiliteit van deze ratio doorheen de tijd en in de ruimte kan men interpreteren als de nauwkeurigheid van het inschatten van aantallen personen op basis van een draadloze technologie. We gaan er hierbij vanuit dat 1 gedetecteerd toestel overeenkomt met juist 1 persoon. De gedetecteerde personen hebben op hun toestel Bluetooth en/of Wifi aanstaan maar zijn er zich niet altijd bewust van dat deze eigenschappen zichtbaar zijn voor de buitenwereld. Gegevens over de nauwkeurigheid van de tracking zijn van cruciaal belang aangezien op basis van de opgemeten gegevens conclusies voor de gehele populatie getrokken worden. Het totaal aantal bezoekers van een evenement of tracking wordt berekend door deling van het aantal getraceerde toestellen door de nauwkeurigheid. Voor een evenement als de Gentse Feesten wordt het bezoekersaantal tegenwoordig nog afgeleid van proxies zoals de opgehaalde hoeveelheid huisvuil of het aantal verkochte vervoersbewijzen voor tram en bus (Verbeke et al., 2003). Sinds enkele jaren steunt men ook op de Bluetoothmetingen van de vakgroep Geografie van de Universiteit Gent voor de berekening van de bezoekersaantallen. Hierbij wordt de detectieratio genoteerd als een getal van 0 tot 1. Indien de detectieratio 0 bedraagt werd geen enkele persoon van de totale populatie gedetecteerd, bij een ratio van 1 veronderstellen we dat 100% van de aanwezige personen gedetecteerd werden. Een eenvoudige methode om de nauwkeurigheid van de tracking na te gaan is het manueel tellen van het aantal personen dat zich door een scangebied begeeft en vervolgens dit aantal te vergelijken met het aantal waargenomen toestellen binnen dat tijdsinterval. Belangrijk is achteraf de variatie van deze ratio na te gaan in tijd en ruimte. Deze methode werd reeds meermaals in het verleden toegepast. Zo stelde Claeys (2011) een nauwkeurigheid van 11,2 ± 1,8% vast op de Gentse feesten van 2010. Er is tevens de mogelijkheid om het aantal gedetecteerde toestellen te vergelijken met camerabeelden, zoals toegepast door Versichele et 9

al. (2012) tijdens de Ronde van Vlaanderen 2011 en het bijbehorende thesisonderzoek van Goudeseune (2012). Met behulp van deze techniek werd een nauwkeurigheid van 13,0 ± 2,3% vastgesteld. Tellingen met behulp van camera s zijn echter niet eenvoudig, aangezien de te bestuderen objecten zich moeten voortbewegen ten opzichte van een monotone, onveranderlijke achtergrond (Hou en Pang, 2011). Belangrijk onderzoek hierover werd geleverd door Dee en Velastin (2007). Bij tracking met behulp van camerabeelden kunnen er tevens problemen ontstaan in verband met de privacywetgeving wegens de mogelijkheid tot gezichtsherkenning. Een alternatieve methode die een sterke opmars kent is de detectie van personen door middel van een thermale sensor (Holden, 2011). Individuen worden geteld door de warmte die ze uitstralen in contrast met hun omgeving. In dit geval is er sprake van een overhead sensor, wat wil zeggen dat de sensor van bovenaf neerkijkt op de te tellen zone. Op plaatsen waar dit niet mogelijk is kan gebruik gemaakt worden van een horizontale infrarode straal. Wanneer een persoon doorheen de zone beweegt, zal hij de straal onderbreken, waardoor zijn passage gedetecteerd kan worden. Deze techniek wordt vaak toegepast in winkels, maar blijkt onbruikbaar in een erg drukke omgeving doordat een groot aantal personen zij aan zij voorbij de sensor kunnen wandelen (http://www.counttech.com, 16 mei 2013). In het geval van een gesloten evenement is het bepalen van de nauwkeurigheid heel wat eenvoudiger. Men kan in dat geval het aantal verkochte tickets vergelijken met het uniek aantal getelde toestellen op het evenement. Via deze techniek waren Delafontaine et al. (2012) in staat het bezoekersaantal tijdens de Horeca Expo in Gent van 2009 te vergelijken met het aantal unieke gedetecteerde toestellen (53 146 vs. 14 498). Hierbij bleek het handig een Bluetooth-sensor aan de in- en uitgangen te plaatsen, zodat elke bezoeker op zijn minst eenmaal waargenomen werd. Belangrijk echter om op te merken is dat bezoekers gedurende het evenement hun toestel aan of uit kunnen zetten. Vertrouwen op aantallen van metingen aan de ingang alleen volstaat dus mogelijk niet voor een goede evaluatie van de nauwkeurigheid. Bij het verwerken van de ruwe data dienen enkele filters gebruikt te worden om ervoor te zorgen dat enkel die personen waarover het onderzoek gaat, in de dataset opgenomen worden. Zo dienden Delafontaine et al. (2012) de standhouders, personen die slechts heel kort detecteerbaar waren en de personen die niet gedetecteerd werden aan de ingang en uitgang uit 10

de dataset te verwijderen. Indien een onderzoek gevoerd wordt naar de mobiliteit van voetgangers is het nuttig om signalen die verstuurd werden door laptops (gezien hun beperkte mobiliteit) en draadloze systemen van auto's niet op te nemen in de dataset. Dit is mogelijk doordat elk toestel een Class of Device code (COD code) doorstuurt, die vertelt tot welke categorie het toestel behoort. Het is dan ook van groot belang dat de detectieratio berekend wordt na het verwijderen van de irrelevante waarnemingen. 1.1.5 Representativiteit Het ontbreken van persoonsgegevens die gekoppeld kunnen worden aan de getraceerde toestellen bij Bluetooth- en Wifi-tracking kan zowel als een voor- als een nadeel gezien worden. Enerzijds laat het toe om, in overeenstemming met de privacywetgeving, toch data te verzamelen van potentieel de gehele populatie (Gehrmann et al.,2004). Indien de metingen gehouden worden in het algemeen belang, dienen de gevolgde personen hiervoor geen toestemming te geven. Dit is een belangrijk voordeel aangezien op deze manier het natuurlijk verplaatsingspatroon van de getraceerde individuen behouden blijft. Mensen hebben immers de neiging om van gedrag te veranderen als ze weten dat ze bekeken of gevolgd worden (http://www.sciencedaily.com, 3 april 2013). Dit fenomeen kan het onderzoek beïnvloeden. Het risico bestaat immers dat de personen waarbij de enquête afgenomen wordt, hun natuurlijk gedrag na afloop van de bevraging zullen veranderen. Anderzijds betekent dit dat er voor de onderzoekers geen persoonsgegevens beschikbaar zijn, wat het onmogelijk maakt de representativiteit van het onderzoek te waarborgen. Tijdens de Gentse Feesten van 2011 nam Baeyens (2011) tijdens een Bluetooth-tracking experiment een enquête af onder de bezoekers. De bedoeling hiervan was een beeld te krijgen van het type personen die op dat ogenblik gevolgd werden. De resultaten van dit onderzoek zijn, waarschijnlijk door een te uitgebreide vragenlijst, echter beperkt in hun gebruik. Slechts 153 personen bleken mee te willen werken aan de bevraging. In dit onderzoek werd vooral aandacht besteed aan de beweegredenen van de participanten om al dan niet hun Bluetooth-functie aan te schakelen. Gezien de beperkte grootte van de steekproef worden deze resultaten hier echter niet besproken. In de literatuur is weinig terug te vinden over de representativiteit van Bluetooth of Wifimetingen. Het is echter de vraag of de groep van gedetecteerde personen representatief is 11

voor de gehele populatie, of dat er sprake is van een zogenaamde self-selection bias. In dat geval worden personen met bepaalde karakteristieken over of onder gerepresenteerd in de trackingdata. Bij GPS-tracking, de populairste trackingsmethode, stelt dit probleem zich niet omdat de GPS-gegevens, mits toestemming van de proefpersonen, opgevraagd worden. De onderzoekers kunnen de representativiteit waarborgen door het nemen van een representatieve groep van proefpersonen in vergelijking met de gehele populatie. 1.2 Probleemstelling Bij het tracken van personen door middel van Bluetooth en Wifi wordt de locatie van een toestel met een uniek MAC-adres gevolgd doorheen de tijd. Het toestel kan hierbij niet gelinkt worden aan de persoon die het met zich meedraagt. Hierdoor kan niet gegarandeerd worden dat een representatieve steekproef van de totale populatie gevolgd wordt. Dit zorgt ervoor dat er onzekerheid bestaat over de mate waarop de vastgestelde bewegingen van toepassing zijn op de gehele populatie. Wanneer bijvoorbeeld voor marketingdoeleinden op een evenement personen getraceerd worden om een beeld te krijgen van de drukke en de minder drukke plaatsen, zal een vertekend beeld ontstaan indien blijkt dat 80% van de getraceerde personen mannen zijn, terwijl uit de ticketverkoop geweten is dat de verhouding mannen en vrouwen op het evenement ongeveer gelijk is. De voorgestelde drukte zal in dat geval niet overeenkomen met de werkelijke drukte, waardoor de marketinginspanningen niet optimaal zullen kunnen renderen. Het blijkt dus interessant om, mits toestemming van de betrokkenen, persoonsgegevens aan de getraceerde toestellen te koppelen om de representativiteit van de studie te waarborgen. Een tweede probleem is het bepalen van de omvang van de volledige populatie op basis van het aantal gemeten individuen. Uit eerder onderzoek (besproken in het onderdeel literatuurstudie) bleek dat ongeveer 10% van de bestudeerde doelgroep traceerbaar was door Bluetooth-sensoren. Omtrent de nauwkeurigheid van Wifi is nog niet voldoende onderzoek gebeurd om hier uitspraken over te doen. Om een idee te krijgen van de daadwerkelijke nauwkeurigheid van beide methoden, moeten de gemeten en getelde aantallen vergeleken worden. De nauwkeurigheid is dan de verhouding tussen de standaardafwijking en het gemiddelde van de detectieratio. Deze noemen we de RSE ofwel de Relative Standard Error. De stabiliteit van de tracking wordt bepaald door de variatie van de detectieratio naargelang 12

het tijdstip en de locatie van de metingen. Daarom zullen ratio s op verschillende locaties en tijdstippen bepaald moeten worden. Eerdere schattingen over de detectieratio blijken te schommelen rond de 10%, maar enkele recente trends doen vermoeden dat dit percentage niet altijd representatief is. Zo zijn de burgers, door openbare publicaties van de onderzoeken aangehaald in het literatuuroverzicht, zich tegenwoordig steeds meer bewust van het feit dat zij gevolgd kunnen worden. Dit zou ervoor kunnen zorgen dat zij er bewust voor kiezen om hun toestellen onzichtbaar te maken of om hun Wifi en/of Bluetooth uit te schakelen. Een ander probleem voor de nauwkeurigheid is het feit dat steeds meer besturingssystemen van smartphones (zoals bijvoorbeeld ios en Android) de zichtbare periode van het toestel beperken tot 120 seconden of tot de tijd die nodig is om het toestel te koppelen aan een ander apparaat. Door deze evoluties is het van belang de verandering van de representativiteit van Buetooth- en Wifi-metingen na te gaan doorheen de tijd. Het ontbreken van kennis over de verschillen in representativiteit en nauwkeurigheid van Bluetooth en Wifi kan gezien worden als het derde grote pijnpunt. Dit probleem ontstaat doordat de eerdere onderzoeken binnen dit gebied veelal focussen op slechts 1 trackingmethode en vaak geen doorgedreven representativiteits- en nauwkeurigheidsanalyses uitvoeren. Door het pas recente ontstaan van Bluetooth- en vooral Wifi-tracking zijn nog niet veel studies uitgevoerd kunnen worden, maar toch dienen we te weten welke van de twee technieken de meest betrouwbare resultaten oplevert. 1.3 Doelstellingen De eerste doelstelling is het genereren van betrouwbare cijfers omtrent de nauwkeurigheid en de representativiteit van Bluetooth- en Wifi-tracking tijdens deze concrete case van de 170 e editie van de Gentse Feesten. Er zal tevens gekeken worden naar de mate waarin deze verworven inzichten veralgemeenbaar zijn. Gezien het sterk specifieke karakter van de studie wordt dit echter als een minder concrete maar aanvullende doelstelling gezien. 13

Een derde belangrijke doelstelling is de vergelijking van de nauwkeurigheid en representativiteit tussen Wifi en Bluetooth. We kunnen nagaan of deze trackingmethodologieën eventueel gecombineerd gebruikt kunnen worden om een hogere nauwkeurigheid en representativiteit te bereiken. 1.4 Onderzoeksvragen en hypothesen 1.4.1 Onderzoeksvragen A) Wat is de nauwkeurigheid van Bluetooth-tracking en hoe is die veranderd doorheen de tijd in vergelijking met voorgaand onderzoek? B) In welke mate is de representativiteit van Bluetooth-tracking gewaarborgd? C) Wat is de nauwkeurigheid van Wifi-tracking? D) Wat is de representativiteit van Wifi-tracking? E) In welke mate zijn er verschillen in representativiteit en nauwkeurigheid tussen het traceren van Wifi- en Bluetooth-gebruikers? 1.4.2 Hypothesen A) Ik vermoed dat de detectieratio van Bluetooth-tracking gedaald is ten opzichte van eerder onderzoek. Ik ga er vanuit dat niet het gebruik van Bluetooth op zich, maar een daling van het percentage van Bluetooth-gebruikers die hun toestel op 'waarneembaar' instellen, hiervan de oorzaak zal zijn. Hierdoor kunnen we verwachten dat de nauwkeurigheid lager zal zijn dan bij voorgaand onderzoek. Gezien de verschillende categorieën personen die op verschillende tijdstippen verschillende pleinen op de Gentse Feesten bezoeken, wordt in dit geval een lage nauwkeurigheid (en dus een hoge variatie van de Bluetooth detectieratio doorheen de tijd) verwacht. B) Ik meen dat er zowel bij Bluetooth als bij Wifi-tracking erg grote problemen zijn omtrent de representativiteit. Er wordt verwacht dat in verhouding tot de daadwerkelijk aanwezige populatie, vooral een jonger publiek zal gevolgd worden. C) De detectieratio bij Wifi-tracking is hoger dan die van Bluetooth. Ik neem deze stelling aan, aangezien veel personen op hun smartphone de Wifi-functie aanzetten om zo mogelijk een gratis internetconnectie te maken met een onbeveiligd netwerk. Over de nauwkeurigheid 14

van Wifi-tracking is er te weinig voorgaand onderzoek om een gefundeerde hypothese te stellen. D) Zoals aangehaald bij de tweede hypothese verwachten we hier een lage representativiteit. E) Door het ontbreken van eerder onderzoek op dit vlak, is het niet eenvoudig hierover een voorspelling te maken. Een iets hogere detectieratio en nauwkeurigheid worden verwacht bij de Wifi-tracking in vergelijking met Bluetooth-tracking. 1.5 Structuur De Masterproef begon met een literatuurstudie gevolgd door een verduidelijking van de probleemstelling en doelstellingen. Hierna werden de onderzoeksvragen en hypothesen toegelicht. In het volgende onderdeel bespreken we, voor de lezers met beperkte tijd, reeds de belangrijkste resultaten en conclusies. In het tweede deel bespreken we de materialen en de methodiek die gebruikt werden voor dit onderzoek. Het studiegebied wordt hierbij ook kort toegelicht. In het derde en belangrijkste onderdeel worden de resultaten besproken. Hierbij worden de resultaten in verband met de representativiteit en de nauwkeurigheid apart behandeld. Bij de bespreking van de representativiteit overlopen we eerst enkele algemene resultaten van de steekproef. Deze omvatten een overzicht van de sociaal-demografische eigenschappen van de ondervraagde personen, evenals een overzicht van de aangetroffen toestellen. Vervolgens gaan we de verbanden tussen deze eigenschappen en het gebruik en de detecteerbaarheid van Bluetooth na. Hierna worden de resultaten voor Wifi op eenzelfde manier besproken. Het tweede grote deel van de resultaten bespreekt de nauwkeurigheid van de tracking tijdens de Gentse Feesten. In een algemeen onderdeel lichten we, zowel voor Bluetooth- als Wifitracking, de aantallen getelde en gemeten personen toe. Vervolgens bespreken we de nauwkeurigheid die vastgesteld werd bij Bluetooth-tracking. Hierbij bespreken we eerst de resultaten van de manuele metingen, gevolgd door de resultaten van telcamera s. Als laatste bespreken we ook de nauwkeurigheid bij Wifi-tracking. Ook hier splitsen we de resultaten op tot een onderdeel dat de manuele metingen bespreekt en een onderdeel dat de resultaten van de telcamera s verduidelijkt. 15

In het vierde deel voer ik een discussie van de gevonden resultaten, waarbij teruggekoppeld wordt naar eerder gevoerd onderzoek. De resultaten worden in een kritisch daglicht besproken en eventuele suggesties voor onderzoek in de toekomst worden aangereikt. Het vijfde deel bevat het algemeen besluit dat we uit dit onderzoek kunnen afleiden. Dit vormt dan ook het belangrijkste onderdeel voor een lezer met beperkte tijd. Na het besluit zijn de referentielijst en de bijlagen terug te vinden. 1.6 Belangrijkste resultaten en conclusies De belangrijkste resultaten voor de studie naar de representativiteit van Wifi- en Bluetoothtracking worden weergegeven in tabel 1. Indien de dataset niet voldoende groot was om over een aspect een statistisch uitsluitsel te geven werd dit aangeduid met een liggend streepje. Tabel 1: Belangrijkste resultaten representativiteit (bron: eigen verwerking) We konden concluderen dat de representativiteit van Bluetooth-tracking, net zoals bij eerdere studies, gewaarborgd was. Er werd enkel een afhankelijkheid gevonden tussen de detecteerbaarheid en het geslacht en, mits veralgemening, ook naargelang het opleidingsniveau. Bij Wifi-tracking werden grotere problemen gevonden (zie tabel 1). Hierdoor konden we besluiten dat de representativiteit van Wifi-tracking tijdens de Gentse Feesten 2013 niet gegarandeerd was. We dienen te benadrukken dat de gevonden resultaten zeker niet statisch zijn. In de paper worden mogelijke oorzaken voor verandering van deze besluiten in de nabije toekomst besproken. De resultaten van het onderzoek naar de nauwkeurigheid worden gepresenteerd in tabel 2. Een duidelijke daling van de Bluetooth detectieratio werd gevonden in vergelijking met 16

voorgaand onderzoek. We kunnen besluiten dat deze naar alle waarschijnlijkheid tussen de 5 en 10% gelegen was ten tijde van het onderzoek. Er werden tevens temporele fluctuaties teruggevonden waarmee in de toekomst rekening zal moeten gehouden worden om de nauwkeurigheid te garanderen. De resultaten van de nauwkeurigheid van Wifi-tracking waren wegens allerhande technische redenen minder betrouwbaar. Wat vaststaat is dat een hogere detectieratio werd vastgesteld (boven de 20%), maar dat de fluctuaties eveneens veel groter waren. Door deze grote standaardafwijkingen en soms onverklaarbare temporele fluctuaties konden we besluiten dat de Wifi-tracking op de Gentse Feesten niet nauwkeurig verliep. Tabel 2: Belangrijkste resultaten nauwkeurigheid (bron: eigen verwerking) 2. METHODEN, MATERIALEN EN STUDIEGEBIED 2.1 Methoden en materialen 2.1.1 Enquête Om de representativiteit van Bluetooth-tracking na te gaan werd tijdens de loop van het experiment (van 20 tot en met 29 juli 2013) een bevraging gehouden onder bezoekers van de Gentse Feesten. Deze bevraging gebeurde op verschillende locaties in de feestenzone en op alle dagen van de festiviteiten. Hoewel het moeilijk bleek passanten te overtuigen om mee te werken aan het onderzoek, werden in totaal 388 personen succesvol geënquêteerd. Tijdens de Gentse Feesten zelf werden 240 mensen bevraagd, maar om de resultaten van het onderzoek statistisch beter te kunnen onderbouwen werden begin februari 2014 extra (148) enquêtes afgenomen. Het totaal aantal bevraagde personen bedraagt dus 388. Voor het opstellen van de enquêtes, maakten we gebruik van de software SurveyToGo (http://www.dooblo.net, 2013). Met behulp van deze software kunnen op een efficiënte 17

manier gepersonaliseerde enquêtes afgenomen worden. Deze software is beschikbaar voor toestellen die draaien op Android en Windows. Voor het daadwerkelijk afnemen van de peiling maakten we gebruik van een tablet van het merk Samsung, ter beschikking gesteld door de vakgroep Geografie van de Universiteit Gent. Om het risico op informatieverlies te beperken werden de gegevens op geregelde tijdstippen doorgestuurd naar de server. De software registreerde voor elke bevraagde persoon ook de lengte-en breedtegraad van de locatie waar het onderzoek werd afgenomen. Op deze manier zijn we in staat om de locaties waar interviews afgenomen werden visueel voor te stellen (zie figuur 3). Gezien de beperkte informatie over toeristen en buitenlanders in voorbije onderzoeken omtrent Bluetoothtracking, zoals bijvoorbeeld het thesisonderzoek van Baeyens (2012), werd gepoogd een groter aantal buitenlanders aan te spreken. De taalbarrière zorgde er echter voor dat bij deze groep een aantal bevragingen vroegtijdig afgebroken dienden te worden. Deze werden dan ook niet opgenomen in dit onderzoek. De enquête bestaat uit dertig vragen en de vragen die aan een persoon werden gesteld verschilden naargelang de antwoorden die de persoon reeds gaf. Dit werd geprogrammeerd in de gebruikte software en vermeed het stellen van nodeloze vragen aan respondenten. Zo zal bij een persoon zonder mobiel toestel op zak niet gevraagd worden naar de specificaties van dit toestel. Een visuele weergave van de enquête en de opeenvolgende vragen wordt gegeven in de vorm van een stroomdiagram in figuur 1. In het eerste deel van de enquête werd gevraagd naar de persoonlijke gegevens van de respondent. Het geslacht, de leeftijd, nationaliteit en het land waarin de persoon woonachtig is werden samen met het opleidingsniveau en het beroepsstatuut opgenomen. Deze 6 vragen werden door alle respondenten beantwoord. Vervolgens werd het aantal mobiele toestellen dat de passant bijhad vastgesteld. Per toestel (GSM, smartphone, tablet, mp3-speler of oortje) werden de vragen in deel 2 overlopen. Wanneer er dus een persoon werd ondervraagd die geen enkel toestel bijhad, bedroeg de peiling slechts zeven vragen. Indien een voorbijganger echter meerdere toestellen op zak had werden heel wat meer dan 30 vragen gesteld. Dit verklaart de soms grote verschillen in duur van de enquêtes. 18

Figuur 1: Stroomdiagram enquête (bron: eigen verwerking) Deel 2 bestond zelf uit 2 grote onderdelen. Het eerste handelde over Bluetooth, het tweede over Wifi. De vragen hierbij waren nagenoeg dezelfde. Het type van het toestel werd genoteerd, evenals de aanwezigheid van de Bluetooth-functie op het toestel en of deze al dan niet aan stond. Wanneer de functie aangeschakeld was, werd tevens gevraagd of deze zichtbaar was voor het publiek. Indien de respondent dit toeliet gingen we de traceerbaarheid na met behulp van ons eigen smartphone. De verschillende stralingsbronnen uit de omgeving werden afgeschermd met behulp van een metalen (koekjes)doos (figuur 2). Respondenten die geen toestemming gaven voor deze controle werden uit het onderzoek geweerd. Aangezien we in dit onderzoek wilden nagaan in welke situaties de Bluetooth-functie gebruikt werd, en of de gebruiker hiervan op de hoogte was, werd bij elke vraag genoteerd of de ondervraagde al dan niet onmiddellijk het antwoord op de vraag wist. In het stroomdiagram (figuur 1) wordt deze extra vraag aangegeven door een rood balkje bij de vraag. Indien het toestel detecteerbaar was, werd nagegaan of de friendly name van het toestel aangepast was. 19