Van veel data, snelle computers en complexe modellen tot lerende machines

Maat: px
Weergave met pagina beginnen:

Download "Van veel data, snelle computers en complexe modellen tot lerende machines"

Transcriptie

1 Van veel data, snelle computers en complexe modellen tot lerende machines

2 Van veel data, snelle computers en complexe modellen tot lerende machines Rede uitgesproken bij de aanvaarding van het ambt van hoogleraar Machine Learning aan de Faculteit der Natuurwetenschappen, Wiskunde en Informatica van de Universiteit van Amsterdam op woensdag 29 januari 2014 door Max Welling

3 Dit is oratie 486, verschenen in de oratiereeks van de Universiteit van Amsterdam. Opmaak: JAPES, Amsterdam Foto auteur: Jeroen Oerlemans Universiteit van Amsterdam, 2014 Alle rechten voorbehouden. Niets uit deze uitgave mag worden verveelvoudigd, opgeslagen in een geautomatiseerd gegevensbestand, of openbaar gemaakt, in enige vorm of op enige wijze, hetzij elektronisch, mechanisch, door fotokopieën, opnamen of enige andere manier, zonder voorafgaande schriftelijke toestemming van de uitgever. Voorzover het maken van kopieën uit deze uitgave is toegestaan op grond van artikel 16B Auteurswet 1912 j het Besluit van 20 juni 1974, St.b. 351, zoals gewijzigd bij het Besluit van 23 augustus 1985, St.b. 471 en artikel 17 Auteurswet 1912, dient men de daarvoor wettelijk verschuldigde vergoedingen te voldoen aan de Stichting Reprorecht (Postbus 882, 1180 AW Amstelveen). Voor het overnemen van gedeelte(n) uit deze uitgave in bloemlezingen, readers en andere compilatiewerken (artikel 16 Auteurswet 1912) dient men zich tot de uitgever te wenden.

4 Mevrouw de rector magnificus, Mevrouw de decaan, Geachte leden van het curatorium, Beste collega s van het Instituut voor Informatica, Beste familie en vrienden, Zeer gewaardeerde toehoorders, 1 De dataficatie van onze samenleving Big Data ; de term kan u niet ontgaan zijn. Big data is de nieuwe goudmijn. Data mijnen is de activiteit die zijn waarde ontsluit. Zoals olie de industriële revolutie aandreef, zo is big data de nieuwe grondstof waarop de moderne economie draait. Jim Gray noemde data-gedreven wetenschappelijk onderzoek het vierde paradigma (na experiment, theorie en computer-gedreven simulatie). De datascope is de nieuwe telescoop en microscoop waarmee we verder en dieper kunnen kijken (zie figuur 2). Niet in de fysieke wereld, maar meer zoals in The Matrix in een digitale projectie van onze wereld, een wereld van nullen en enen. Het is duidelijk, de verwachtingen zijn hooggespannen. Is big data een big hype of stevenen we echt af op een maatschappij die gedomineerd wordt door data? En wat betekent die dataficatie van onze samenleving nu eigenlijk voor ons? 4

5 Eerst een paar feiten op een rijtje. De totale hoeveelheid data in de wereld wordt op dit moment geschat op ongeveer 4 zettabyte. Dat is 4,000,000,000, 000,000,000,000 = 4 x bytes. Als we er even van uitgaan dat de harde schijf in uw computer 500 gigabytes (= ½ terabyte = ½ x bytes) kan bevatten dan zijn dat dus 8 miljard harde schijven. Zeg even dat een harde schijf 5 cm dik is, dan zou de totale stapel harde schijven die alle data van de wereld bevat even hoog zijn als de afstand tussen de aarde en de maan. Figuur 1 De Square Kilometer Array (SKA) radio telescoop is misschien wel het wetenschappelijke experiment dat de grootste hoeveelheid data gaat opleveren in 2024: ongeveer 1 exabyte (10 18 bytes) per dag, ofwel een zettabyte per 3 jaar (zie figuur 1). Die data-tsunami komt er dus aan. Net zoals de snelheid waarmee computers kunnen rekenen iedere twee jaar verdubbelt (Moore s wet), zo verdubbelt ook de hoeveel data in iets minder dan twee jaar. De data-berg is zo groot dat het onmogelijk is om deze door mensen te laten inspecteren. We moeten dit dus aan slimme algoritmen overlaten. Maar hoe ontwerp je een slim algoritme? Dit is het domein van machine learning (vrij vertaald: kunstmatig leren), het onderwerp van mijn leerstoel. Naast sociologische oorzaken zijn er drie technologische redenen te bedenken waarom big data nu zo in de aandacht staat: 1. De data explosie VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 5

6 2. De enorme computerkracht 3. Sterk verbeterde algoritmen om deze data te analyseren. Het samenkomen van deze drie factoren gaat het eindelijk mogelijk maken om de hooggespannen verwachtingen over kunstmatige intelligentie uit de jaren 60 waar te maken. Misschien niet precies zoals we ons hadden voorgesteld met op mensen lijkende robots, maar op een manier die misschien nog wel veel verstrekkender is. Met digitale artsen die beter patiënten kunnen behandelen dan menselijke artsen. Met digitale advocaten die beter in staat zijn om u in een strafzaak te verdediging dan menselijk advocaten, met zelfrijdende auto s die geen ongelukken meer maken, met een digitale politie die heel efficiënt misdaad kan opsporen of kan voorkomen en ga zo maar door. Om een analogie van Vance Packard te gebruiken: een mes in de handen van een chirurg redt levens, maar datzelfde mes in de handen van een misdadiger neemt levens. Het zou dan ook naïef zijn om de gevaren van de dataficatie van onze samenleving te ontkennen: privacyschendingen, misbruik van persoonsgegevens, discriminatie, het trekken van verkeerde conclusies, de ontmenselijking van de zorg, de verdringing van arbeidsplaatsen door automatische systemen en ga zo maar door. Big data staat dus voor geweldige mogelijkheden maar tegelijkertijd ook voor niet te onderschatten gevaren. Deze ontwikkelingen tegen houden is een futiele strijd, analoog aan het tegenhouden van elektriciteit in de 19 e eeuw. Maar er voor zorgen dat de gevaren zoveel mogelijk worden onderkend en ondervangen is wel degelijk mogelijk en verdient onze volle aandacht. 2 Wat is mogelijk met big data? Om het concept big data wat minder abstract te maken laat ik eerst wat voorbeelden de revue passeren. Het eerste voorbeeld komt direct uit de praktijk. In 2013 ben ik met twee masterstudenten en een studiegenoot een nieuw bedrijfje begonnen, Scyfer, dat als doel heeft moderne state-of-the-art machine learning methoden te implementeren in het bedrijfsleven. Onze eerste klant was een grote Nederlandse bank die zijn klanten betere aanbiedingen wilde doen. Deze bank heeft miljoenen klanten en verwerkt miljoenen transacties per dag. Wanneer klanten op hun account inloggen krijgen ze een aanbieding te zien, een nieuwe hypotheek bijvoorbeeld. Er zijn een paar honderd van dat soort producten. Niet iedereen is geïnteresseerd in dezelfde producten. Piet, die 87 jaar oud is, hoeft waarschijnlijk geen nieuwe hypotheek op zijn huis, maar misschien wel hulp bij het beheren van zijn bankrekeningen. 6 MAX WELLING

7 De bank weet veel over iedere klant: leeftijd, geslacht, samenstelling gezin, inkomen, woonplaats, hoeveel en hoe grote transacties hij/zij in het verleden heeft gedaan enzovoort. Ook kent de bank eigenschappen van de mogelijke producten: prijs, type rekening, looptijd, enzovoort. Bovendien volgt de bank hoe een klant door de verschillende internetpagina s heen navigeert, en met name hoe hij/zij heeft gereageerd op eerdere aanbiedingen. Al deze informatie kan gebruikt worden om preciezere persoonsgerichte aanbiedingen te doen. Bijvoorbeeld, als Kees, een getrouwde man van 85, positief heeft gereageerd op een aanbieding van de bank om hem te helpen zijn geld te beleggen, dan heeft deze zelfde aanbieding ook een grote kans van slagen bij Piet van 87. U snapt nu misschien ook waarom supermarkten maar al te graag willen dat u die bonuskaart gebruikt. Nog een voorbeeld. Stel dat we alle medische gegevens van iedereen centraal beschikbaar hebben voor analyse. Dat wil zeggen, alle bezoekjes naar de dokter, de symptomen, de diagnose, de behandelingen en medicijnen, het eindresultaat van de behandeling, maar ook persoonlijke gegevens zoals gewicht, bloeddruk, suikergehalte, huidskleur, aantal kanker gevallen in de directe familie, en in het meest extreme geval ook de genetische informatie. Met al deze gegevens zouden we voor iedereen persoonlijk heel precies diagnoses kunnen stellen en medicijnen of therapieën aanbevelen. Anders dan nu het geval is kunnen we dan de werking van medicijnen zeer nauwkeurig bepalen: onder welke omstandigheden werkt welke cocktail van medicijnen het beste voor welke aandoening? Het is in deze zin dat we kunnen spreken van een datascope (figuur 2) als metafoor van de microscoop, die veel dieper kan doordringen in het woud van complexe relaties tussen persoonsgebonden medische eigenschappen, ziektes, medicijnen en/of therapieën en andere externe factoren zoals geografische locatie. Figuur 2 VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 7

8 Ten slotte een voorbeeld over veiligheid. In Los Angeles doet de politie aan predictive policing, ofwel het voorspellen waar de volgende golf aan criminaliteit zal plaatsvinden en deze voorkomen door er meer politieagenten te laten surveilleren. Dit blijkt mogelijk omdat er structuur zit in de manier waarop golven criminaliteit zich door een stad heen bewegen, niet veel anders dan de geografische verdeling van naschokken die volgen op een aardbeving. In Los Angeles heeft dit geleid tot een vermindering van 26% aan inbraken in het gebied waar deze techniek is toegepast. Recentelijk heeft ook de Nederlandse politie inbraakinformatie vrijgegeven via internet. Deze voorbeelden illustreren dat big data de potentie heeft om een eerlijkere, gemakkelijkere, veiligere en gezondere samenleving te creëren. Maar zo n krachtige technologie kan niet zonder gevaren zijn. Hierover meer in het volgende hoofdstuk. 3 Wat is gevaarlijk aan big data? Bij het lezen van de voorbeelden uit het vorige hoofdstuk bekroop u misschien al een unheimisch gevoel. Op welke manieren kan de datascope tegen ons gebruikt worden? Gaat de dataficatie van onze samenleving niet veel te ver? Leidt big data niet tot George Orwell s big brother? Laten we een aantal doemscenario s doornemen. Stel een verzekeringsmaatschappij weet de toekomstige centrale patiënten databank te hacken en krijgt toegang tot alle medische gegevens van alle Nederlanders. Daaruit kan zij een kans berekenen dat iemand binnen 10 jaar ernstig ziek wordt. Het zou dan heel verleidelijk zijn om deze mensen een verzekering te weigeren. Of neem het voorbeeld van predictive policing. Stel dat de politie, gebruik makende van sociale achtergrond, genetische informatie, crimineel verleden enz. op persoonlijk niveau kan voorspellen wat de kans is dat iemand in de toekomst een misdaad begaat. Mag de politie met die informatie iemand arresteren voordat hij/zij die misdaad begaat? Dit scenario is mooi verbeeld in de film Minority Report waar een politieafdeling wordt beschreven die zich bezig houdt met pre-crimes : misdaden die met grote zekerheid in de toekomst worden gepleegd. Ik denk dat de meesten onder ons het onwenselijk vinden om verdachten van toekomstige misdaden maar vast te arresteren. We zien dus dat privacyschendingen en het misbruik van gevoelige informatie op de loer liggen. Ik zie ook nog twee minder genoemde gevaren. Het eerste gevaar is dat we verkeerde conclusies gaan trekken uit data die gemakkelijk op internet te oogsten zijn. Stel we willen weten hoeveel mensen zich zorgen maken over privacy schendingen van de binnenlandse veiligheids- 8 MAX WELLING

9 dienst. Als we op internet zoeken vinden we heel veel bezorgde tweets, blogs, chats, enzovoort. De mensen die zich geen zorgen maken laten zich over het algemeen niet horen. Dit noemen we selectie bias, omdat de steekproef die we nemen niet representatief is voor de hele bevolking. In dit geval vergaren we vooral informatie van mensen die zich druk maken over het probleem en zich ook van dit soort moderne media bedienen. We moeten dus met het trekken van conclusies heel erg oppassen om niet ten prooi te vallen aan deze selectie bias. Ten slotte zie ik een reëel gevaar dat de kunstmatige intelligentie op den duur heel veel banen overbodig gaat maken. Zelfrijdende auto s zouden zomaar alle vrachtwagenchauffeurs hun baan kunnen ontnemen. Het standaardantwoord is altijd dat er weer nieuwe banen bijkomen, maar ik ben er niet zeker van dat dit in de toekomst zo zal blijven. Misschien moeten we er rekening mee houden dat we allemaal wat meer vrije tijd gaan krijgen, en er goed over nadenken hoe we onze samenleving daar naar gaan inrichten. Ik wil ook nog één misverstand noemen voordat ik dit hoofdstuk afsluit. Vaak hoor je dat met big data men alleen nog oog zou hebben voor voorspellingen (wat) en niet meer voor de onderliggende oorzaken (waarom). Dit wordt ook wel het correlatie (wat) versus causatie (waarom) probleem genoemd. Zoeken naar correlaties in plaats van oorzaken kan misschien een verleiding zijn, maar heeft niets met big data te maken. Meer data leidt altijd tot betere inzichten mits men de juiste vragen stelt. Met dezelfde data kan men proberen te voorspellen welke bevolkingsgroepen een grotere kans hebben om in de misdaad terecht te komen, maar kan men ook proberen te achterhalen waarom deze bevolkingsgroepen in de misdaad terechtkomen (bijvoorbeeld door een grotere werkeloosheid). De gulden regel is: meer data is altijd beter dan minder data mits je de goede vragen stelt en de goede algoritmen gebruikt. Concluderend: de datascope is een krachtig instrument waarmee we dieper inzicht kunnen krijgen in allerlei complexe problemen en relaties. Zoals altijd kunnen krachtige technologieën ook misbruikt worden. We moeten daarvoor oppassen en onze maatschappij via wetgeving zo inrichten dat die negatieve aspecten worden beteugeld en ondervangen. We mogen simpelweg niet toestaan dat verzekeringsmaatschappijen discrimineren op medische profielen. We hoeven ook niet toe te laten dat de politie preventief gaat arresteren. Door de snelle ontwikkelingen lopen we hier wellicht wat achter op de feiten, dus dit verdient onze volle aandacht. VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 9

10 4 De derde groeiwet De wet van Moore (Moore, 1965) stelt dat ruwweg iedere twee jaar de rekenkracht van computers verdubbelt, voornamelijk als gevolg van de miniaturisering van transitoren, zie figuur 3. Deze wet blijkt al sinds 1970 op te gaan. We zullen dit de eerste groeiwet (van Moore) noemen. Figuur 3 Bron: Intel De explosie van data blijkt ook aan eenzelfde wetmatigheid onderhevig. Ook hier geldt dat ruwweg iedere twee jaar de hoeveelheid data verdubbelt. We zullen dit de tweede (big data) groeiwet noemen. Ik stel hier dat er waarschijnlijk nog een derde groeiwet actief is. Deze derde wet beschrijft de exponentiële groei van de capaciteit van de modellen die onderzoekers gebruiken. Simpele modellen hebben maar een klein aantal vrijheidsgraden (ook wel parameters genoemd) terwijl complexe modellen heel veel vrijheidsgraden hebben. De taak van de onderzoeker is om de vrijheidsgraden zo te kiezen dat het resulterende model de geobserveerde data zo goed mogelijk beschrijft. Dit gebeurt automatisch via zogenaamde leeralgoritmen die in het vakgebied machine-learning worden ontwikkeld. 10 MAX WELLING

11 Tijdens mijn bezoek aan Google en Yahoo in 2012 vernam ik dat men daar nu modellen traint met meer dan 10 miljard parameters! Dit was ondenkbaar toen ik in 1998 tot het veld toetrad. Ik wil mezelf niet branden aan een precieze voorspelling van het aantal jaar dat nodig is voor een verdubbeling van de modelcapaciteit (het aantal vrije parameters), maar het zou me niks verbazen als dat ook rond de twee jaar is. Ter illustratie, in 1988 had het state-ofthe-art neurale netwerk NetTalk 18,000 parameters. Dat ijkpunt gecombineerd met de omvang van de hedendaagse modellen van 10 miljard parameters leidt tot een verdubbeling iedere één en een kwart jaar (maar dit getal moet met een flinke korrel zout worden genomen). In figuur 4 heb ik de exponentiële groei van het aantal parameters van neurale netwerken (zie hoofdstuk 7) geplot. Dit is een zogenaamde log-log plot, wat betekent dat een rechte lijn met exponentiële groei overeenkomt. Figuur 4 Het menselijk brein heeft ongeveer 100 triljoen synapsen. Synapsen reguleren het gemak waarmee één neuron zijn informatie doorgeeft aan zijn buurman. Synapsen zijn net als vrije parameters in een model aangezien het brein de sterkte van deze synapsen aanpast aan de nieuwe informatie die via de zintuigen binnenstroomt. Als we uitgaan van een verdubbeling iedere twee jaar dan VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 11

12 zal het nog 26 jaar duren voordat onze modellen hetzelfde aantal vrije parameters hebben als ons brein, zie figuur 4. Neuronen zijn hele langzame rekenaars: zij hebben tenminste één milliseconde nodig om een signaal door te geven. Als we ooit een kunstmatig brein bouwen met evenveel transistors en connecties als in het menselijk brein, dan zal deze misschien evenveel informatie kunnen bevatten als ons brein maar wel vele ordes van grootte sneller kunnen rekenen. Maar goed, aan dat laatste feit waren we eigenlijk al gewend. De derde groeiwet is in principe consistent met de eerste wet van Moore. We hebben immers exponentieel groeiende rekenkracht nodig om een exponentieel groeiend aantal parameters te leren. Maar de derde groeiwet lijkt niet consistent met de tweede groeiwet. De reden van deze paradox is dat de hoeveelheid nuttige informatie in data veel kleiner is dan de hoeveelheid data zelf. Figuur 5 We kunnen ons ruwe data voorstellen als gouderts, zie figuur 5. De nuttige informatie is dan het goud zelf dat uit de erts moet worden gewonnen met de 12 MAX WELLING

13 gereedschappen van de machine learning. Het overgebleven gruis komt overeen met nutteloze informatie, ofwel ruis. De term datamining kan dus vrij letterlijk worden geïnterpreteerd als het bevrijden van nuttige informatie uit data. 5 Nuttige informatie Claude Shannon introduceerde in 1949 een rigoureuze definitie van het concept informatie (Shannon, 1948). Men wint één bit aan informatie als men antwoord krijgt op één ja/nee vraag waarvan men daarvóór geen benul had van het antwoord. Bijvoorbeeld, Lieke gooit een munt op en laat niet zien of die kop of munt was gevallen. Nadat Lieke mij vertelt hoe het muntje was gevallen heb ik precies 1 bit aan informatie ingewonnen. Neem nu een plaatje met 100 pixels die de waarde 0 of 1 kunnen aannemen. Als alle pixels onafhankelijk van elkaar met een kans van een half de waarde 0 of 1 aannemen zeggen we dat het plaatje 100 bits aan informatie bevat (zie figuur 6-C). Figuur 6-A daarentegen bestaat helemaal uit pixels die allemaal de waarde 0 aannemen. Dit plaatje representeert veel minder dan 100 bits. Figuur 6 A B C We kunnen deze intuïtie preciezer maken door ons voor te stellen dat Sera het plaatje naar Eline moet sturen. Hoeveel bits heeft Sera nodig om alle informatie over te sturen? In het eerste geval heeft ze weinig keus: ze moet voor alle 100 pixels zeggen of ze de waarde 0 of 1 hadden, 100 bits dus. Maar in het tweede geval kan ze alle informatie in één zin stoppen: alle bits hebben waarde 0. Nu moet Sera natuurlijk wel deze zin opsturen en ook dat is informatie, maar de hoeveelheid bits is onafhankelijk van de grootte van het plaatje. De zin alle bits hebben waarde 0 noemen we het model. Dus in het eerste geval is er geen model dat ons kan helpen om het plaatje efficiënter te coderen, VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 13

14 terwijl in het tweede geval alle informatie met een heel simpel model kan worden beschreven. Echte data heeft een complexiteit die ergens tussen deze twee extremen in ligt, zoals in figuur 6-B. Gedeeltelijk kunnen we de informatie comprimeren door een model te gebruiken, maar er blijven ook een hoop bits nodig om de afwijkingen van dit model te beschrijven (pixel 12 is 1 i.p.v. de 0 die het model voorspelde). De informatie die niet met een model te vangen is noemen we de ruis. Deze informatie is niet nuttig in de zin dat we er niets mee kunnen voorspellen. De informatie die we met een model kunnen beschrijven is wel nuttig want daar kunnen we wel voorspellingen mee doen. Het is de taak van de modellenbouwer om de nuttige informatie te scheiden van de ruis, en deze op te slaan in de parameters van het model, zie figuur 7. Figuur 7 De hoeveelheid nuttige informatie groeit veel langzamer dan de totale hoeveelheid informatie in data. We observeren dus een afnemende meerwaarde aan informatie als we observaties toevoegen: het 1 miljoenste data-punt voegt veel minder voorspellende waarde toe dan het 100 e data-punt. De metafoor 14 MAX WELLING

15 van de goudmijn helpt ons dit weer te begrijpen: hoe langer we in dezelfde goudmijn graven naar goud hoe moeilijker het wordt het goud te delven. Immers, de grote brokken zijn er in het begin al uitgevist, en de mijn raakt op den duur uitgeput. We hebben de paradox nu dus scherp voor ogen. Ondanks het feit dat de hoeveelheid ruwe data exponentieel groeit (de tweede groeiwet), groeit de hoeveel nuttige informatie in die data veel langzamer. Waarom groeit de complexiteit (het aantal vrije parameters) van modellen dan toch exponentieel (de gepostuleerde derde groeiwet)? De huidige modellen lijken dus een enorme overcapaciteit te hebben om de hoeveelheid nuttige informatie in de data op te slaan. Modellen met zo n overcapaciteit lopen het gevaar om te overfitten. Ze gaan proberen deze overcapaciteit te vullen met ruis (de informatie zonder voorspellende waarde). En helaas kunnen modellen die overfitten minder goed voorspellen. Ik heb deze conclusie in figuur 8 samengevat. Figuur 8 In de metafoor van de goudmijn komt dit neer op de volgende situatie. Om het goud op te slaan heb ik een enorme silo aangeschaft. Maar deze silo is veel te groot, namelijk groot genoeg om niet alleen het goud maar ook alle gouderts in op te slaan. De machines die de silo vullen hebben de neiging de silo helemaal vol te storten, wat betekent dat er naast het pure goud ook een hoop gruis in de silo terechtkomt. Een grote silo is niet alleen duur, door de aanwezigheid van het gruis is het ook moeilijk om bij het goud te komen. VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 15

16 6 Overfitting Het begrip overfitten is het centrale concept in machine learning. Men kan het zich voorstellen als een geheugen dat te goed werkt. Stel je voor dat je 1000 plaatjes van verschillende stoelen te zien krijgt. Iemand met een perfect geheugen onthoudt alle details van alle stoelen. Als we hem een plaatje van een stoel laten zien die hij al eens eerder heeft gezien dan roept hij tevreden: dat is een stoel! Maar laat je hem een plaatje zien van een stoel die iets anders is dan één van die 1000 voorbeelden, dan raakt hij in de war. Iemand met een slechter geheugen probeert eigenschappen te vinden die alle stoelen gemeen hebben: een leuning, een zitvlak, poten etc. Bij het zien van de nieuwe stoel herkent hij deze eigenschappen en concludeert dus dat dit ook een stoel moet zijn. Een goed model moet dus alleen de essentiële eigenschappen onthouden, en de rest vergeten. (Dat het generaliseren van kennis te maken heeft met slim vergeten is goed nieuws voor een hoop vergeetachtigen zoals ikzelf.) Op eenzelfde manier kan een computer ook heel makkelijk onthouden wat je er instopt. Maar dit is heel wat anders dan een computer die goed kan generaliseren naar nieuwe input en goed kan voorspellingen kan doen. Goede modellen zoeken naar nuttige informatie: abstracte concepten om de data te beschrijven. Het concept stoel is natuurlijk zo n abstractie. We zijn continue bezig met nieuwe concepten te formuleren om de wereld om ons heen beter te begrijpen. Een concept is niets meer dan het extraheren van de nuttige informatie en het vergeten van ruis. Leren is dus equivalent aan abstraheren en conceptualiseren, aan het wegfilteren van de ruis en aan het comprimeren van de data zodat alleen nuttige informatie achterblijft. Om te kunnen leren moeten we aannames maken. In het voorbeeld hierboven waren onze aannames dat leuningen en zitvlakken belangrijke eigenschappen zijn die een stoel definiëren. Deze aannames noemen we inductieve bias. Je leest nog wel eens dat iemand een nieuw leeralgoritme heeft verzonnen dat aannamevrij is. Neem van mij aan dat dit onzin is. Er zijn altijd verborgen aannames. Zonder aannames kan je niet generaliseren. De lakmoestest voor een goed model is zijn voorspelkracht. Alleen goede modellen kunnen voorspellingen doen op nieuwe, nooit eerder geziene data. Maar test een model nooit op de data die het al eerder heeft gezien, want het onthouden van data is geen kunst. Voorspellen is ook wat ons brein doet. Als de voorspellingen goed zijn merk je niks, maar als ze eens een keer falen dan merk je wel degelijk dat je onbewust een voorspelling deed. Een goed voorbeeld is die keer dat je het melkpak uit de koelkast pakte en je arm ineens omhoogschoot. Je voorspelling omtrent de hoeveel melk in dat melkpak zat er naast en je spieren hadden zich te hard aangespannen. 16 MAX WELLING

17 Maar waarom leidt overfitten eigenlijk tot verminderde voorspelkracht? We illustreren dit eerst met figuur 9. We willen een curve door de punten trekken om hun relatie zo goed mogelijk te beschrijven. Als we een rechte lijn trekken (2 vrije parameters) dan is de bias groot en de fit dus slecht. Als we een heel flexibele curve gebruiken met heel veel vrije parameters dan gaat de curve precies door alle punten maar de fit is intuïtief toch ook erg slecht omdat we niet verwachten dat de niet geobserveerde punten op deze curve zullen liggen. Het optimum zit ergens in het midden. Figuur 9 Om de relatie tussen overfitten, inductieve bias en voorspelkracht verder te verduidelijken neem ik even aan dat de dataset met N datapunten die wij tot onze beschikking hebben er maar één uit vele mogelijke datasets met N datapunten is. We stellen ons het model dat we leren voor als een pijl die we in een roos willen schieten, zie de figuur 10. Schieten we in de roos dan is het model perfect, schieten we er flink naast dan is het een slecht model met weinig voorspelkracht. Als we een heel simpel model gebruiken (met heel weinig vrije parameters) dan maken we impliciet sterke aannames (een sterke inductieve bias). Deze bias kan natuurlijk precies goed zijn, maar in het algemeen is de wereld veel ingewikkelder dan we met een simpel model kunnen bevatten. We zullen dus in alle waarschijnlijkheid flink naast de roos schieten en slechte voorspellingen doen. We noemen dit underfitten. Als we ons nu voorstellen dat we ook de beschikking hadden over nog 100 andere datasets met N datapunten, en we trainen ons simpele model ook met deze 100 andere datasets dan krijgen we 100 verschillende voorspellingen. De pijlen komen dus op verschillende plekken terecht. Maar omdat het model zo simpel is, verandert er ook niet veel aan de voorspellingen, en de pijlen landen ongeveer in hetzelfde gebied. Dit correspondeert met de rode kruisjes op het linkerbord in figuur 10. We zeggen dat de variantie klein is. VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 17

18 Figuur 10 Nu het omgekeerde geval: een model met heel veel vrije parameters. De inductieve bias is nu klein want we kunnen hele complexe functies beschrijven. Maar als we kijken naar de variatie die ontstaat als we het model trainen op de 100 verschillende datasets van ieder N datapunten, dan zien we een enorm verschil: de variantie is groot. Dit correspondeert met de rode kruisjes op het rechterbord in figuur 10. Dit komt omdat het algoritme nu zelfs de kleinste details van de dataset probeert te fitten. Het fit dus de ook de ruis die geen enkele voorspelkracht heeft. Het model lijdt aan overfitting. Overfitting is dus equivalent aan een grote variantie in de voorspellingen. De conclusie is dus dat zowel underfitten en overfitten leiden tot slechte voorspellingen. Zoals zo vaak in het leven, moeten we op zoek naar de gulden middenweg. De filosofie dat we het simpelste model moeten kiezen dat de data nog goed beschrijft heet ook wel Occam s scheermes. Maar de realiteit is iets ingewikkelder want het is niet duidelijk hoe goed nog goed genoeg is; complexere modellen fitten immers de trainingsdata beter. Maar er zijn gelukkig goede methoden ontwikkeld om toch de juiste balans te vinden. Terug naar de paradox. De derde groeiwet laat zien dat onderzoekers juist wel hele complexe modellen gebruiken. Hoe vermijden ze dan toch overfitten? Een hele elegante methode, die gebaseerd is op de wijsheid van de menigte zal ik nu uitleggen. 18 MAX WELLING

19 7 Wijsheid van de menigte Probeer het volgende experiment eens thuis. Stel u wilt de hoogte van de Eiffeltoren weten. Vraag dan aan 101 mensen (of een ander oneven aantal mensen) om deze waarde te schatten, ongeacht of ze er veel of weinig vanaf denken te weten. Ze mogen niet met elkaar overleggen. Sorteer alle schattingen van klein naar groot en gebruik de 51e schatting (de middelste schatting) als je antwoord. Wat blijkt? Bijna altijd levert deze procedure een heel precies antwoord op, bijna net zo precies als de beste schatting uit het rijtje (maar je weet natuurlijk niet van te voren wat de beste schatting is). In de volksmond heet dit de wijsheid van menigte. Wat nog beter blijkt te werken is als je de menigte laat gokken met geld. Mensen die heel zeker zijn van hun antwoord zijn bereid veel geld in te zetten en hun stem weegt dan ook zwaarder mee in het gewogen gemiddelde. Je kan hier aan meedoen op websites die prediction markets worden genoemd. De filosofie is niet heel anders dan die van de aandelenmarkt waar mensen aandelen kopen en verkopen en zo heel precies gezamenlijk de werkelijke waarde van een bedrijf bepalen. In het vakgebied machine learning bestaat een analoge methode om betere voorspellingen te bewerkstelligen. We laten nu niet mensen maar algoritmen voorspellingen doen en nemen net zoals hierboven is beschreven de middelste waarde of het gemiddelde van alle voorspellingen. Vaak zien we dat hoe meer verschillende algoritmen meedoen, des te beter deze gecombineerde voorspelling wordt. Dit fenomeen werd heel duidelijk toen het Amerikaanse bedrijf Netflix een competitie uitschreef waar de winnaar maar liefst 1 miljoen dollar kon winnen. De participanten moesten het recommender systeem van Netflix dat films aan klanten aanbeveelt met tenminste 10% verbeteren. Het bleek een enorm succes. Meer dan twintigduizend teams streden drie jaar lang en VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 19

20 verbeterde uiteindelijk Netflix s eigen systeem met meer dan 10%. Wat bleek? Het winnende team had meer dan 200 verschillende modellen getraind en hun voorspellingen op een slimme manier gecombineerd. De wijsheid van de menigte had gezegevierd. Deze methode noemen we ensemble learning in machine learning (Breiman, 1996). Het is niet heel moeilijk om te begrijpen waarom deze methode zo succesvol is. We gaan hiervoor weer even terug naar het verhaal over bias en variantie. Als we een heleboel modellen trainen die allemaal heel flexibel zijn dan hebben die modellen een kleine bias maar een grote variantie. Maar als deze modellen onafhankelijke voorspellingen doen, dan is er voor de fout die model A maakt ook een model B dat precies de omgekeerde fout maakt, en de fouten vallen tegen elkaar weg als we de voorspellingen middelen. Middelen vermindert dus de variantie en helpt tegen overfitten. Dit fenomeen is duidelijk te zien in figuur 10. De twee blauwe kruisjes stellen het gemiddelde voor van alle rode kruisjes. In het rechterplaatje waar de modellen overfitten zien we duidelijk dat het gemiddelde blauwe kruisje veel dichter bij de roos zit dan de rode kruisjes. We hebben nu een sterk argument in handen om de paradox van de derde wet op te lossen. We kunnen best heel grote flexibele modellen trainen, als we daarna maar door het middelen van de voorspellingen het overfitten tegengaan. Dit is een vorm van regularisatie, wat neer komt op het verkleinen van de capaciteit van een model, zodat de ruis er niet in past. Het alsof je een dubbele bodem in je silo legt: van buiten ziet de silo er nog steeds even groot uit, maar er past toch niet meer zoveel in. Er zijn ook andere methoden om een model te regulariseren. Bijvoorbeeld, we kunnen proberen ervoor te zorgen dat voor iedere voorspelling maar een klein deel van het model mag worden geactiveerd (dit heet sparsity ), of we kunnen eisen dat een model nog steeds goed werkt als we de data een klein beetje veranderen (dit heet robustness ). De conclusie is dus dat we wel degelijk hele complexe modellen met heel veel vrije parameters kunnen trainen als we er maar op de één of andere manier voor zorgen dat die overcapaciteit wordt weggeregulariseerd. We hebben vrij abstract over modellen gesproken tot dusver. Maar wat is nou een goed voorbeeld van een model dat we willekeurig complex kunnen maken? In het volgende hoofdstuk zal ik het neurale netwerk verder uitlichten. Dit model heeft een interessante geschiedenis omdat het aan de wieg stond van het vakgebied kunstmatige intelligentie, vervolgens twee keer in diskrediet is geraakt en nu opnieuw reïncarneert onder de naam deep learning. 20 MAX WELLING

21 8 Deep learning, de derde generatie kunstmatige neurale netwerken Kunstmatige neurale netwerken zijn zo oud als het vak kunstmatige intelligentie zelf. McCulloch and Pitts (McCulloch & Pitts, 1943) bedachten als eersten in 1943 een model dat in grote lijnen nog steeds overeenkomt met wat we vandaag de dag verstaan onder de term neuraal netwerk. Het model is een versimpeling van de echte neuronen en synapsen die ons brein bevolken. Volgens deze abstractie is een neuron een schakelaar die aan gaat als er genoeg signaal binnenkomt van andere, naburige neuronen. Als een neuron aangaat, zal het ook weer een signaal doorsturen naar zijn buren, enzovoort. Neuronen zijn verbonden met elkaar via synapsen. Als de synaptische verbinding sterk is zal het signaal tussen twee neuronen versterkt worden. Door nu de sterkte van deze synapsen aan te passen zodat het netwerk als geheel betere voorspellingen gaat doen kunnen we het netwerk trainen met data. Rond 1970 raakten de neurale netwerken voor het eerst in diskrediet doordat misschien wel de meest beroemde onderzoeker in de kunstmatige intelligentie uit die tijd, Marvin Minsky (samen met Seymore Papert) een boek schreef (Minsky & Papert, 1969) dat neurale netwerken zwaar bekritiseerde. Volgens hen waren neurale netwerken niet flexibel genoeg om moeilijke problemen op te lossen. Maar hun kritiek betrof alleen neurale netwerken met twee lagen neuronen. In 1986 echter ontstond er een hernieuwde interesse in neurale netwerken doordat Rumelhart, Hinton & Williams (Rumelhart, Hinton, & Williams, 1986) en onafhankelijk LeCun (LeCun, 1987) een algoritme heruitvonden dat al eerder in 1974 door Werbos (Werbos, 1974) was gepubliceerd. Met dit algoritme, backpropagation, konden onderzoekers nu voor het eerst neurale netwerken met drie lagen neuronen trainen. Soms noemen mensen deze heropstanding de ReNNaissance (waar NN voor neurale netwerken staat). Helaas ging het weer mis rond 1995 toen Vladimir Vapnik de support vector machines uitvond. Dit model kon ook ingewikkelde niet lineaire relaties modelleren, maar met als groot voordeel dat het leeralgoritme maar één (en dus reproduceerbaar) antwoord kon opleveren. Neurale netwerken convergeerden vaak naar heel verschillende modellen afhankelijk van hoe je het leeralgoritme startte. (Dit noemen we lokale minima). Het probleem daarvan is niet zozeer dat deze verschillende modellen slecht zijn, maar meer dat je niets theoretisch kan bewijzen over hoe het netwerk zich gedraagt in nieuwe situaties. Dat kon wel met de support vector machines en dus verdwenen de neurale netwerken opnieuw in de la. VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 21

22 Maar recent zijn ze aan hun tweede comeback begonnen in een nieuw deep learning jasje. Waar de eerste generatie neurale netwerken maar twee lagen neuronen hadden, kwam de tweede generatie niet verder dan drie lagen neuronen. Het probleem was dat het backpropagation algoritme dat de vrije parameters aanpast om het model te verbeteren niet door meer dan twee lagen kon penetreren: alle aanpassingen werden minuscuul klein. Maar rond 2005 kwam Geoffrey Hinton met nieuwe ideeën om netwerken met vele lagen te kunnen trainen (Hinton, Osindero, & Teh, 2006) (zie figuur 11). Voordat hij het neurale netwerk met backpropagation trainde stapelde hij eerst een aantal netwerken met twee lagen boven op elkaar. Hij trainde die lagen los van elkaar waarbij de output van één laag de input van de laag erboven vormde. Bovendien gebruikte hij in deze fase nog niet het backpropagation algoritme maar een algoritme dat gebruik kan maken van ongelabelde data (bijvoorbeeld een foto van een stoel zonder dat erbij wordt verteld dat het een stoel betreft) dat in veel grotere hoeveelheden voorhanden is. Een andere belangrijke ontwikkeling is dat onderzoekers gebruik gingen maken van GPUs (graphics cards) die oorspronkelijk waren ontwikkeld voor game-computers, en zo veel meer computerkracht tot hun beschikking hadden. De eerste groeiwet (van Moore) schoot dus te hulp om de neurale netwerken weer nieuw leven in te blazen. Figuur 11 Bron: Google 22 MAX WELLING

23 Het probleem van de lokale minima werd niet opgelost en het is nog steeds heel moeilijk om performance garanties af te leiden, maar de nieuwe technologie bleek zo goed te werken dat diepe neurale netwerken vele competities begonnen te winnen. Na jaren van marginale verbeteringen (een paar procent per jaar) in automatische spraakherkenning waren het de diepe neurale netwerken die ineens voor 30% verbetering zorgden. Maar de successen gingen verder dan alleen spraakherkenning. Deep learning is ook het beste algoritme gebleken in beeldherkenning (welke objecten zijn aanwezig in deze foto?) en protein prediction (welke eigenschappen heeft een eiwit?). Deze wapenfeiten hebben ervoor gezorgd dat bedrijven zoals Microsoft, Google, Apple, Yahoo! en IBM zich op deze technologie hebben gestort. De Chinese tegenhanger van Google, Baidu, heeft recentelijk zelfs een heel instituut opgericht in Silicon Valley dat zich louter met deep learning bezighoudt. En zeer recentelijk, in December 2013 tijdens een machine learning conferentie (NIPS) die ik mede heb georganiseerd, kondigde Mark Zuckerberg van Facebook aan dat hij de deep learning guru Yann LeCun had ingehuurd om zijn nieuwe AI-lab te gaan leiden. Deep learning is misschien wel het mooiste voorbeeld van een methode waar de drie groeiwetten samenwerken. De huidige modellen hebben tientallen miljarden vrije parameters en worden op miljoenen Youtube videoclips getraind, gebruik makende van duizenden computers. Zoals ik al eerder heb uitgelegd lijken dat veel te veel parameters voor de hoeveelheid nuttige informatie die we verwachten te vinden in de data. Maar de trainingsalgoritmen worden moedwillig gefrustreerd in het leren van de parameterwaarden via regularisatie om op die manier de capaciteit van het model te beperken en overfitten te voorkomen. Op dit moment representeren de diepe neurale netwerken de absolute state-of-the-art in mijn vakgebied. 9 Citizen science Machine learning is niet alleen iets voor de experts. Er is een toenemende trend te ontwaren waarin de gewone burger participeert in de activiteiten van het vak, bewust of onbewust. In dit hoofdstuk zal ik daar wat meer over vertellen. In 2003 beschreef Luis von Ahn (Von Ahn & Dabbish, 2004) dat in dat jaar gamers over de hele wereld negen miljard uur het spelletje Solitaire hadden gespeeld. Ter vergelijking: het bouwen van de Empire State Building kostte 9 miljoen manuren (6.8 uur Solitaire online), en het bouwen van het Panama kanaal 20 miljoen manuren (minder dan een dag Solitaire online). Wat een VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 23

24 verkwisting!? Von Ahn bedacht dat we de wetenschap een enorme dienst zouden kunnen bewijzen als we ook maar een klein deel van die inspanning zouden kunnen kanaliseren. En dus bedacht hij een label game om de objecten in foto s te identificeren. Eén van de eerste label games was ESP waar twee anoniemen participanten hetzelfde plaatje voorgeschoteld kregen en allebei objecten die in dat plaatje aanwezig waren moesten benoemen. (Er was ook een blacklist van objecten die al door eerdere deelnemers waren benoemd). Als ze hetzelfde object gelijktijdig benoemden kregen ze punten. Het vernuft van dit spelletjes was dat de deelnemers vaker hetzelfde object benoemden dan ze zelf verwachtten en dus dachten dat ze een soort buitenzintuigelijke band met elkaar hadden! In de tussentijd waren ze natuurlijk gewoon bezig (gratis) de objecten van een foto te benoemen en zo de wetenschap een dienst te bewijzen. Een ander creatief voorbeeld in deze sfeer ontwikkeld door dezelfde persoon zijn recaptcha s waar je een stukje tekst moet intikken voordat je een website op mag. Ook hier digitaliseer je een stukje gescande tekst zonder dat je er erg in hebt. Het idee om mensen op heel grote schaal in te zetten voor maar een heel klein beetje financiële compensatie heeft ook zijn intrede gedaan in de gedaante van crowdsourced marketplaces, een andere vorm van citizen science. Het bekendste voorbeeld is Amazon s Mechanical Turk. Als je een simpele maar tijdrovende taak hebt dan kan je deze online als een vragenlijst presenteren aan enorme hoeveelheden Turkers in de hele wereld. Het antwoord op elke vraag is een paar cent waard, maar voor sommigen in minder welvarende landen kan dat toch oplopen tot een aardige zakcent. Het gaat ook vrijwel altijd om taken waar mensen heel goed in zijn maar computers (nog) niet. In zekere zin gebruiken computers dus de denkkracht van het menselijk brein om zelf slimmer te worden. Interessant genoeg zien we dus een soort omdraaiing van de rollen van mens en computer: in plaats van mensen die de rekenkracht van computers gebruiken, gebruiken computers hier de denkkracht van menselijke breinen Computers en mensen raken steeds meer vervlochten met elkaar. Ze vullen elkaar aan in de taken waarin ze goed zijn: mensen met hun intuïtie, creativiteit en begrip van de wereld, computers met hun extreme rekensnelheid. Crowdsourcing heeft zich ook op een ander niveau gemanifesteerd. Toen Netflix zijn eerste competitie uitschreef (zie hoofdstuk 7) bedacht de webservice Kaggle dat dit wel eens een goed model zou kunnen zijn om de data-science problemen die bij bedrijven spelen via online competities aan te pakken. Tegen soms enorme geldbedragen (oplopend tot wel 3 miljoen dollar!) proberen duizenden teams de beste voorspellingen te realiseren. Dit idee bleek succesvol: vele honderden competities zijn ondertussen tot een goed 24 MAX WELLING

25 einde gebracht. Niet alleen experts in gevestigde instituten kunnen deelnemen, ook de enthousiasteling in een schuur in ergens in Siberië kan zo n competitie winnen. Maar citizen science zal veel verder gaan dan de voorbeelden die ik hierboven heb beschreven. Big data vormt de nieuwe economische pijler waaraan eenieder met energie en talent kan meedoen. Steden zoals Chicago en New York evenals de Amerikaanse overheid zetten een groot deel van hun data online in de hoop dat anderen hier toepassingen omheen zullen bouwen. Een bedrijf als Ford wil bijvoorbeeld sensordata uit auto s online zetten om zo enthousiastelingen uit te dagen nieuwe toepassingen te ontwikkelen die op hun beurt Ford s auto s weer aantrekkelijker maken. Deze ontwikkelingen vormen een unieke kans voor wetenschappers om uit hun ivoren torens te klimmen en de interactie aan te gaan met burger en bedrijf. Door het ontwikkelen en vrij beschikbaar stellen van gebruikersvriendelijke en nuttige software kan de brug tussen wetenschapper en burger misschien wel beter dan ooit tevoren worden geslagen. Een recente revolutie in het onderwijs vormt misschien nog wel de belangrijkste pijler onder deze brug en sluit naadloos aan bij de ontwikkelingen die ik in dit hoofdstuk heb beschreven. De MOOC, ofwel massive open online course staat voor gratis onderwijs voor de massa s. Hierover meer in het volgende hoofdstuk. 10 Onderwijs In 2011 schreef het McKinsey Global Institute het volgende in haar rapport Big data: The next frontier for innovation competition, and productivity (Manyika, et al., 2011): A significant constraint on realizing value from big data will be a shortage of talent, particularly of people with deep expertise in statistics and machine learning. In 2012 kopte de Harvard Business Review met de volgende titel (Davenport & Patil, 2012): Data Scientist: The Sexiest Job of the 21st Century. De conclusie mag duidelijk zijn: we gaan een toename zien in het aantal banen en hopelijk het aantal studenten in dit vakgebied. Universiteiten staan voor de belangrijke taak om genoeg data-wetenschappers op te leiden en zo het gat te dichten dat dreigt te ontstaan tussen vraag een aanbod op deze arbeidsmarkt. Ik denk dat de UvA uniek is gepositioneerd om hier een vooraanstaande rol te spelen. Ten eerste zal de eventuele fusie tussen UvA en VU nieuwe mogelijkheden VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 25

26 scheppen op het gebied van onderwijs en onderzoek. Ik hoop dat in de discussie over het onderwijs aan de nieuwe Amsterdam Faculty of Science het vak data science een belangrijke rol krijgt toebedeeld. We doen onszelf tekort als we deze kans niet aangrijpen om data science central van Nederland te worden. Het gloednieuwe Data Science Research Center, dat een gezamenlijk initiatief van de UvA en VU is kan hier een belangrijke rol in gaan vervullen. Maar we moeten verder kijken dan de studenten die zich aanmelden bij de poorten van de universiteit. We moeten ook de enthousiaste burger en bedrijfsvoerder bedienen en hen zo betrekken bij de mogelijkheden die de big data revolutie te bieden heeft. Ik zie dan ook een heel belangrijke rol weggelegd voor MOOCs om dit doel te bereiken. Een MOOC ( massive open online course ) is een cursus die gratis online wordt aangeboden en die soms door wel 100,000 studenten tegelijk wordt gevolgd. Studenten helpen elkaar via online chatrooms met opgaven, hun examens worden automatisch nagekeken en de aandachtspunten kunnen voor iedere student individueel worden geïdentificeerd via zogenaamde recommender systemen (zie hoofdstuk 7). Ook het onderwijs wordt zo data science. Het is dan ook niet voor niets dat de twee grootste MOOC instituten (Udacity en Coursera) spin-offs zijn van machine learning medewerkers op Stanford University. Wat de uiteindelijke impact van MOOCs zal zijn moet nog blijken, maar deze ontwikkeling dwingt ons ook om onze eigen rol als docenten nog eens flink onder de loep te nemen. Worden wij dadelijk ook door onze eigen MOOCs verdrongen, net zoals Wikipedia in het verleden de klassieke encyclopedie grotendeels verving? Wat wordt de rol van de docent, de expert en 26 MAX WELLING

27 het kennis instituut? Allemaal dringende vragen die ons de komende tijd onvermijdelijk gaan bezighouden. 11 Machine learning, een gouden toekomst Ik heb dit moment aangegrepen om mijn vakgebied beter voor het voetlicht brengen. Gevoed door exponentiële groei van rekenkracht en data is de complexiteit van modellen zelf ook explosief gegroeid. Zozeer zelfs dat de overcapaciteit van hedendaagse modellen, ondanks de enorme datasets, alleen maar lijkt toe te nemen. Deze paradox levert interessante inzichten op, namelijk dat een combinatie van complexe modellen en regularisatie in de context van big data heel succesvol blijkt in de praktijk. Tegen deze achtergrond doe ik mijn onderzoek dat zich richt op het ontwikkelen van complexe, statistisch goed gefundeerde modellen en de bijbehorende big data leeralgoritmen. Figuur 12 Machine learning is de laatste jaren heel snel in populariteit gegroeid. Figuur 12 laat zien dat het aantal bezoekers van de grootste machine learning confe- VAN VEEL DATA, SNELLE COMPUTERS EN COMPLEXE MODELLEN 27

28 rentie, NIPS, ook aan een exponentiële groeiwet onderhevig is! Ik vermoed dat de onderliggende oorzaak gezocht moet worden in het feit dat we steeds vaker toepassingen van de kunstmatige intelligentie zien in het dagelijkse leven. Apple s Siri op onze iphone begrijpt wat we zeggen, Amazon begrijpt wat voor boeken we willen lezen, navigatie systemen leiden ons feilloos naar onze bestemming enzovoort. Over nog veel geavanceerdere technologie kan men al lezen op het internet: Star Trek s universal translator wordt werkelijkheid in een nieuw systeem van Microsoft dat gesproken zinnen kan begrijpen, vertalen en dan weer in een andere taal uitspreken; IBM s Watson verslaat de beste menselijke tegenstander in het spel Jeopardy waar taal op een heel hoog niveau begrepen moet worden, zelfsturende auto s rijden al rond in Californië en Nevada enzovoort. Deze zichtbare vooruitgang inspireert een grote groep jong talent met een rijke fantasie voor wat er allemaal nog meer mogelijk is. Een van die talenten is ontegenzeggelijk de CEO van Facebook, Mark Zuckerberg. Tijdens zijn bezoek aan de grootste conferentie in machine learning (NIPS) droeg hij zijn visie uit over het ontwikkelen van een persoonlijke theory of mind voor elke Facebookgebruiker. Gezien de enorme hoeveelheden data en rekenkracht die Facebook tot zijn beschikking heeft, is dit op de lange termijn misschien niet eens zo n heel onrealistische idee. Maar willen we dit wel? Dankzij Edward Snowden weten we nu dat dit soort informatie gemakkelijk in handen van overheden kan vallen. Naast grote beloften zijn er dus ook grote gevaren. Hoe kunnen wij onze privacy waarborgen in een tijd dat computermodellen onze innerlijke drijfveren misschien wel beter doorgronden dan wijzelf? Hoe kunnen wij voorkomen dat een zeer gedetailleerde prognose van onze gezondheid onze verzekeringspolis gaat beïnvloeden? Hoe kunnen we voorkomen dat we preventief worden gearresteerd als we een genetische aanleg voor terroristische activiteiten blijken te hebben? Dit zijn aspecten van machine learning en big data waar we de komende tijd ons hoofd over moeten breken. We moeten een balans vinden tussen wat kan en wat wenselijk is. Ik heb er een groot vertrouwen in dat dat lukt. Ik voorzie een gouden toekomst voor mijn vakgebied. 12 Dankwoord Voordat ik mijn verhaal afsluit wil ik graag een aantal mensen bedanken. Allereerst wil ik het College van Bestuur van de Universiteit van Amsterdam, en het bestuur van de Faculteit der Natuurwetenschappen, Wiskunde en Informatica en in het bijzonder de decaan van de faculteit bedanken voor het in mij gestelde vertrouwen. 28 MAX WELLING

Van veel data, snelle computers en complexe modellen tot lerende machines

Van veel data, snelle computers en complexe modellen tot lerende machines Van veel data, snelle computers en complexe modellen tot lerende machines Van veel data, snelle computers en complexe modellen tot lerende machines Rede uitgesproken bij de aanvaarding van het ambt van

Nadere informatie

AI & Big Data bij Defensie

AI & Big Data bij Defensie AI & Big Data bij Defensie Max Welling Universiteit van Amsterdam, AMLAB, QUVA Canadian Institute for Advanced Research (CIFAR) Co-founder Scyfer Overzicht Machine Learning & Deep Learning 101 Toepassingen

Nadere informatie

Mevrouw de rector magnificus, mevrouw de decaan, geachte collega s, geachte studenten, gewaardeerde toehoorders.

Mevrouw de rector magnificus, mevrouw de decaan, geachte collega s, geachte studenten, gewaardeerde toehoorders. 1. Oratie Mevrouw de rector magnificus, mevrouw de decaan, geachte collega s, geachte studenten, gewaardeerde toehoorders. Ik heb heel wat predikanten in mijn familie, en heb mijn opa heel wat keren op

Nadere informatie

Neurale Netwerken en Deep Learning. Tijmen Blankevoort

Neurale Netwerken en Deep Learning. Tijmen Blankevoort Neurale Netwerken en Deep Learning Tijmen Blankevoort De toekomst - Internet of Things De toekomst - sluiertipje Je gezondheid wordt continue gemonitored Je dieet wordt voor je afgestemd -> Stroomversnelling

Nadere informatie

math inside Model orde reductie

math inside Model orde reductie math inside Model orde reductie Model orde reductie Met het voortschrijden van de rekenkracht van computers en numerieke algoritmen is het mogelijk om steeds complexere problemen op te lossen. Was het

Nadere informatie

Leven met angst voor ernstige ziektes

Leven met angst voor ernstige ziektes Leven met angst voor ernstige ziektes Van A tot ggz De boeken in de reeks Van A tot ggz beschrijven niet alleen oorzaak, verloop en behandeling van de onderhavige problemen, maar geven ook antwoord op

Nadere informatie

Kunstmatige Intelligentie

Kunstmatige Intelligentie Kunstmatige Intelligentie Wat is kunstmatige intelligentie? Wat is de impact van artificial intelligence? Gaan we alle problemen hiermee oplossen? Coen Boot Industry Lead Education, Abecon Kunstmatige

Nadere informatie

Machinaal leren, neurale netwerken, en deep learning

Machinaal leren, neurale netwerken, en deep learning Machinaal leren, neurale netwerken, en deep learning Prof. dr. Tom Heskes KNAW-symposium Go en machinale intelligentie 11 oktober, 2016 Inhoud Inleiding - Supervised, reinforcement, unsupervised leren

Nadere informatie

Artificiële Intelligentie En De Menselijke Maatschappij

Artificiële Intelligentie En De Menselijke Maatschappij Artificiële Intelligentie En De Menselijke Maatschappij door : Carlo Tijmons CMGT1A docent: Maaike Harbers datum: 08-07-016 vak: Filosofie 01-3: Ons Brein en Bewustzijn Abstract De film Her is wat mij

Nadere informatie

Wij zijn Kai & Charis van de Super Student en wij geven studenten zin in de toekomst.

Wij zijn Kai & Charis van de Super Student en wij geven studenten zin in de toekomst. Hallo, Wij zijn Kai & Charis van de Super Student en wij geven studenten zin in de toekomst. Dat is namelijk helemaal niet zo makkelijk. Veel studenten weten nog niet precies wat ze willen en hoe ze dat

Nadere informatie

De chip: hoe iets piepkleins een ware wereldrevolutie veroorzaakte

De chip: hoe iets piepkleins een ware wereldrevolutie veroorzaakte De chip: hoe iets piepkleins een ware wereldrevolutie veroorzaakte Gilbert Declerck, CEO IMEC Imke Debecker, Outreach Communications Katrien Marent, Corporate Communications Director Zonder de uitvinding

Nadere informatie

Smart Vision! Van Neuroscience naar Deep Learning (en terug) Sander Bohté CWI Life Sciences VIA AwesomeIT, April 10th 2015

Smart Vision! Van Neuroscience naar Deep Learning (en terug) Sander Bohté CWI Life Sciences VIA AwesomeIT, April 10th 2015 Smart Vision! Van Neuroscience naar Deep Learning (en terug) Sander Bohté CWI Life Sciences VIA AwesomeIT, April 10th 2015 Deep Learning SIR EDMUND / 28 MAART 2015 Braaf, computer De Facebooks en Googles

Nadere informatie

Artificial Intelligence. Tijmen Blankevoort

Artificial Intelligence. Tijmen Blankevoort Artificial Intelligence Tijmen Blankevoort Een intelligente revolutie Live spraak vertaling (Skype 2015) Zelfrijdende auto s (Meerdere bedrijven) Jeopardy winst (IBM 2013) Professioneel Go (Google 2016)

Nadere informatie

Als je een keer over het grind loopt, kijk dan eens naar beneden en pak een steen die jou aanspreekt. Bewaar deze en teken hem op de tafel na.

Als je een keer over het grind loopt, kijk dan eens naar beneden en pak een steen die jou aanspreekt. Bewaar deze en teken hem op de tafel na. ISBN 978-94-026-0104-6 NUR 770 2016 Tekst en illustraties: Guusje Slagter 2016 Nederlandstalige uitgave: Aerial Media Company bv, Tiel 1ste druk Omslagontwerp: Teo van Gerwen/Guusje Slagter Omslagillustratie:

Nadere informatie

6,4. Werkstuk door een scholier 1810 woorden 11 maart keer beoordeeld

6,4. Werkstuk door een scholier 1810 woorden 11 maart keer beoordeeld Werkstuk door een scholier 1810 woorden 11 maart 2002 6,4 349 keer beoordeeld Vak Techniek Computer De computer bestaat al 360 jaar. Dat is iets wat de meeste mensen niet verwachten, want ze denken dat

Nadere informatie

Autisten uit de kast. Binnen het bedrijf gebruik ik vaak een neutralere term, maar u begrijpt waar het over gaat: schaamte en angst.

Autisten uit de kast. Binnen het bedrijf gebruik ik vaak een neutralere term, maar u begrijpt waar het over gaat: schaamte en angst. Tekst, uitgesproken op het Jaarlijkse Congres van de Nederlandse Vereniging voor Autisme, 7 & 8 oktober 2011 (respectievelijk 1300 & 1200 bezoekers). www.autisme.nl -------------------------------------------------------

Nadere informatie

LAAT JE BEDRIJF GROEIEN DOOR HET INZETTEN VAN JE NETWERK!

LAAT JE BEDRIJF GROEIEN DOOR HET INZETTEN VAN JE NETWERK! LAAT JE BEDRIJF GROEIEN DOOR HET INZETTEN VAN JE NETWERK! In dit E-book leer je hoe je door het inzetten van je eigen netwerk je bedrijf kan laten groeien. WAAROM DIT E-BOOK? Veel ondernemers beginnen

Nadere informatie

Geldwisselprobleem van Frobenius

Geldwisselprobleem van Frobenius Geldwisselprobleem van Frobenius Karin van de Meeberg en Dieuwertje Ewalts 12 december 2001 1 Inhoudsopgave 1 Inleiding 3 2 Afspraken 3 3 Is er wel zo n g? 3 4 Eén waarde 4 5 Twee waarden 4 6 Lampenalgoritme

Nadere informatie

2 Ik en autisme VOORBEELDPAGINA S

2 Ik en autisme VOORBEELDPAGINA S 2 Ik en autisme In het vorige hoofdstuk is verteld over sterke kanten die mensen met autisme vaak hebben. In dit hoofdstuk vertellen we over autisme in het algemeen. We beginnen met een stelling. In de

Nadere informatie

Social Media Recruitment. Een strategisch en praktisch adviesrapport. Auteur : Jacco Valkenburg Datum : 18 april 2010 Versie : 3

Social Media Recruitment. Een strategisch en praktisch adviesrapport. Auteur : Jacco Valkenburg Datum : 18 april 2010 Versie : 3 Social Media Recruitment Een strategisch en praktisch adviesrapport Auteur : Jacco Valkenburg Datum : 18 april 2010 Versie : 3 2 Inhoud: Social Media Recruitment...3 Enorm bereik, feiten en cijfers...fout!bladwijzer

Nadere informatie

Lineair-en Circulair denken. (Be-)invloed (-ing) op individu, bedrijfsleven, economie, onderwijs, technologie.

Lineair-en Circulair denken. (Be-)invloed (-ing) op individu, bedrijfsleven, economie, onderwijs, technologie. Lineair-en Circulair denken (Be-)invloed (-ing) op individu, bedrijfsleven, economie, onderwijs, technologie. Lineair-en Circulair denken (Be-)invloed (-ing) op individu, bedrijfsleven, economie, onderwijs,

Nadere informatie

Cloud Computing. Cloud Computing. Welkom allemaal hier op het science park.

Cloud Computing. Cloud Computing. Welkom allemaal hier op het science park. Cloud Computing Cloud Computing Het Telraam van de Toekomst of Hoe Hyves en Battlefield 2 het Rekenen veranderen... Floris Sluiter Adviseur bij SARA Het Telraam van de Toekomst of Hoe Hyves en Battlefield

Nadere informatie

Inhoud. Waarom jij niet zonder de acht randvoorwaarden van de pitch methode kunt. Het belang van Social Media voor je bedrijf. Wij zijn!

Inhoud. Waarom jij niet zonder de acht randvoorwaarden van de pitch methode kunt. Het belang van Social Media voor je bedrijf. Wij zijn! Inhoud Waarom jij niet zonder de acht randvoorwaarden van de pitch methode kunt. Het belang van Social Media voor je bedrijf. 1-2 3 Wij zijn! Inge Kaptein - Sinds 2012 communicatieadviseur Het spectrum

Nadere informatie

Weten vraagt meer dan meten

Weten vraagt meer dan meten Weten vraagt meer dan meten Weten vraagt meer dan meten Hoe het denken verdwijnt in het regime van maat en getal Christien Brinkgreve, Sanne Bloemink en Eric Koenen AUP Dit project werd financieel ondersteund

Nadere informatie

Strategische personeelsplanning objectief onderbouwen met People Analytics

Strategische personeelsplanning objectief onderbouwen met People Analytics Strategische personeelsplanning objectief onderbouwen met People Analytics Na het lezen van deze white paper weet u: Wat een strategische personeelsplanning (SPP) is Hoe organisaties veranderen door automatisering

Nadere informatie

Dit boek heeft het keurmerk Makkelijk Lezen gekregen. Wilt u meer weten over dit keurmerk kijk dan op de website: www.stichtingmakkelijklezen.nl.

Dit boek heeft het keurmerk Makkelijk Lezen gekregen. Wilt u meer weten over dit keurmerk kijk dan op de website: www.stichtingmakkelijklezen.nl. Chatten Dit boek heeft het keurmerk Makkelijk Lezen gekregen. Wilt u meer weten over dit keurmerk kijk dan op de website: www.stichtingmakkelijklezen.nl. Colofon Een uitgave van Eenvoudig Communiceren

Nadere informatie

MEE Nederland. Raad en daad voor iedereen met een beperking. Moeilijk lerend. Uitleg over het leven van een moeilijk lerend kind

MEE Nederland. Raad en daad voor iedereen met een beperking. Moeilijk lerend. Uitleg over het leven van een moeilijk lerend kind MEE Nederland Raad en daad voor iedereen met een beperking Moeilijk lerend Uitleg over het leven van een moeilijk lerend kind Moeilijk lerend Uitleg over het leven van een moeilijk lerend kind Inhoudsopgave

Nadere informatie

Inhoudsopgave van de gehele gids:

Inhoudsopgave van de gehele gids: Inhoudsopgave van de gehele gids: 1. Inleiding 2. De rol van werk 3. Talent 3.1 Wat is talent en toptalent? 3.2 Hoe ontstaat een talent? 4. Talent ontdekking: Ontdek je talenten 4.1 Waaraan herken je een

Nadere informatie

Toos Mennen. Risicovoeten in de medisch pedicurepraktijk

Toos Mennen. Risicovoeten in de medisch pedicurepraktijk Risicovoeten in de medisch pedicurepraktijk Risicovoeten in de medisch pedicurepraktijk ISBN 978-90-368-0302-1 2015 Bohn Stafleu van Loghum, onderdeel van Springer Media BV Alle rechten voorbehouden. Niets

Nadere informatie

Het stappenplan om snel en goed iets nieuws in te studeren

Het stappenplan om snel en goed iets nieuws in te studeren Studieschema voor goed en zelfverzekerd spelen Page 1 of 5 Het stappenplan om snel en goed iets nieuws in te studeren Taak Een nieuw stuk leren zonder instrument Noten instuderen Opname beluisteren Notenbeeld

Nadere informatie

Ik weet dat het soms best wel allemaal wat ingewikkeld kan lijken.

Ik weet dat het soms best wel allemaal wat ingewikkeld kan lijken. WELKOM Bedankt om dit gratis e-book te downloaden! J Ik weet dat het soms best wel allemaal wat ingewikkeld kan lijken. Als anderen vertellen over de hosting van hun website, en updates doen en backups

Nadere informatie

De patiënt als partner

De patiënt als partner De patiënt als partner De patiënt als partner De zoektocht van het UMC St Radboud Onder redactie van Lucien Engelen Houten 2012 Ó 2012 UMC St Radboud Alle rechten voorbehouden. Niets uit deze uitgave mag

Nadere informatie

6,9. Spreekbeurt door een scholier 1336 woorden 4 oktober keer beoordeeld. Nederlands

6,9. Spreekbeurt door een scholier 1336 woorden 4 oktober keer beoordeeld. Nederlands Spreekbeurt door een scholier 1336 woorden 4 oktober 2016 6,9 28 keer beoordeeld Vak Nederlands Spreekbeurt Facebook Facebook is een online, gratis sociaalnetwerksite. Het hoofdkantoor van het bedrijf

Nadere informatie

Evaluatie PvKO Mastersessie 10 april 2014

Evaluatie PvKO Mastersessie 10 april 2014 Verwachting en aanbeveling Evaluatie PvKO Mastersessie 10 april 2014 Heeft de PvKO Mastersessie aan jouw verwachting voldaan? Toelichting: De link met Big Data was me niet echt duidelijk, titel dekte de

Nadere informatie

Uiteindelijk gaat het om het openbreken van macht

Uiteindelijk gaat het om het openbreken van macht Uiteindelijk gaat het om het openbreken van macht Als hoogleraar Publieke Innovatie aan de Universiteit Utrecht onderzoekt Albert Meijer vernieuwing in de publieke sector. Open Overheid en Open Data maken

Nadere informatie

PeerEducatie Handboek voor Peers

PeerEducatie Handboek voor Peers PeerEducatie Handboek voor Peers Handboek voor Peers 1 Colofon PeerEducatie Handboek voor Peers december 2007 Work-Wise Dit is een uitgave van: Work-Wise info@work-wise.nl www.work-wise.nl Contactpersoon:

Nadere informatie

Inhoud. Neuronen. Synapsen. McCulloch-Pitts neuron. Sigmoids. De bouwstenen van het zenuwstelsel: neuronen en synapsen

Inhoud. Neuronen. Synapsen. McCulloch-Pitts neuron. Sigmoids. De bouwstenen van het zenuwstelsel: neuronen en synapsen Tom Heskes IRIS, NIII Inhoud De bouwstenen van het zenuwstelsel: neuronen en synapsen Complex gedrag uit eenvoudige elementen McCulloch-Pitts neuronen Hopfield netwerken Computational neuroscience Lerende

Nadere informatie

1 3 N u t t i g e LinkedIn Tips. Haal direct meer uit je netwerk!

1 3 N u t t i g e LinkedIn Tips. Haal direct meer uit je netwerk! 1 3 N u t t i g e LinkedIn Tips Haal direct meer uit je netwerk! Inleiding Allereerst wil ik u bedanken voor het downloaden van dit e-book. Na weken van voorbereiding kunnen we dan nu eindelijk dit e-book

Nadere informatie

Sociale psychologie en praktijkproblemen

Sociale psychologie en praktijkproblemen Sociale psychologie en praktijkproblemen Sociale psychologie en praktijkproblemen van probleem naar oplossing prof. dr. A.P. Buunk dr. P. Veen tweede, herziene druk Bohn Stafleu Van Loghum Houten/Diegem

Nadere informatie

HEY WAT KAN JIJ EIGENLIJK GOED? VERKLAP JE TALENT IN 8 STAPPEN

HEY WAT KAN JIJ EIGENLIJK GOED? VERKLAP JE TALENT IN 8 STAPPEN E-blog HEY WAT KAN JIJ EIGENLIJK GOED? VERKLAP JE TALENT IN 8 STAPPEN In talent & groei Het is belangrijk om je talent goed onder woorden te kunnen brengen. Je krijgt daardoor meer kans om het werk te

Nadere informatie

Verslag van een ervaringsdeskundige. Nu GAP-deskundige.

Verslag van een ervaringsdeskundige. Nu GAP-deskundige. Burn out Verslag van een ervaringsdeskundige. Nu GAP-deskundige. Ik was al een tijd druk met mijn werk en mijn gezin. Het viel mij zwaar, maar ik moest dit van mezelf doen om aan de omgeving te laten zien

Nadere informatie

Doorbreek je belemmerende overtuigingen!

Doorbreek je belemmerende overtuigingen! Doorbreek je belemmerende overtuigingen! Herken je het dat je soms dingen toch op dezelfde manier blijft doen, terwijl je het eigenlijk anders wilde? Dat het je niet lukt om de verandering te maken? Als

Nadere informatie

In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen.

In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen. Leerlijn programmeren In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen. Deze leerlijn is opgebouwd aan de

Nadere informatie

OBSERVATIE. Hoe kom je in een creatieve mindset? De observatie van een kunstenaar en hoe hij aan zijn creativiteit komt. Robbert Kooiman G&I 1-C

OBSERVATIE. Hoe kom je in een creatieve mindset? De observatie van een kunstenaar en hoe hij aan zijn creativiteit komt. Robbert Kooiman G&I 1-C OBSERVATIE Hoe kom je in een creatieve mindset? De observatie van een kunstenaar en hoe hij aan zijn creativiteit komt Robbert Kooiman G&I 1-C Contents Inleiding... 2 Covert of Overt... 2 Analyse... 3

Nadere informatie

HET BELANGRIJKSTE OM TE WETEN OM MEER ZELFVERTROUWEN TE KRIJGEN

HET BELANGRIJKSTE OM TE WETEN OM MEER ZELFVERTROUWEN TE KRIJGEN HET BELANGRIJKSTE OM TE WETEN OM MEER ZELFVERTROUWEN TE KRIJGEN Gratis PDF Beschikbaar gesteld door vlewa.nl Geschreven door Bram van Leeuwen Versie 1.0 INTRODUCTIE Welkom bij deze gratis PDF! In dit PDF

Nadere informatie

Hoe ga ik dit verwerken? (Begrip maken) Dit volume is goed, dit moet ik zo houden.

Hoe ga ik dit verwerken? (Begrip maken) Dit volume is goed, dit moet ik zo houden. Wie Citaat feedback Wat? (Interpreteren) Hoe ga ik dit verwerken? (Begrip maken) Wat & waarom? (Vervolg vraag) Goed volume in je stem. Het volume van mijn stem is zodanig dat de informatie goed te horen

Nadere informatie

Futurist Gerd Leonhard over technologie en de mensheid

Futurist Gerd Leonhard over technologie en de mensheid Futurist Gerd Leonhard over technologie en de mensheid Terwijl de titel van zijn nieuwste boek Technology vs. Humanity een strijd tussen mens en robot doet verwachten, is futurist Gerd Leonhards visie

Nadere informatie

Waar blijft de minister

Waar blijft de minister INTERVIEW Robots en intelligentie Waar blijft de minister van ICT? Door Bettina Gelderland Sociale robots, drones, zelfrijdende auto s Er komt een nieuwe generatie robots aan: slimmer, flexibeler en socialer.

Nadere informatie

INLOGLES LEERLINGEN ELO Voortgezet Onderwijs

INLOGLES LEERLINGEN ELO Voortgezet Onderwijs INLOGLES LEERLINGEN ELO Voortgezet Onderwijs Inhoudsopgave Inleiding 3 Lesplan 4 Voorafgaand aan de les 5 Les opzet 6 Start met inloggen 7 Welke vragen kunt u verwachten 8 Technische problemen 9 Malmberg

Nadere informatie

Luisteren: muziek (B2 nr. 3)

Luisteren: muziek (B2 nr. 3) OPDRACHTEN LUISTEREN: MUZIEK www.nt2taalmenu.nl nt2taalmenu is een website voor mensen die Nederlands willen leren én voor docenten NT2. Iedereen die Nederlands wil leren, kan gratis online oefenen. U

Nadere informatie

Inleiding CUSTOMER TOUCH MODEL. Is het mogelijk klanten zo goed te kennen dat je kunt voorspellen wat ze gaan kopen voordat ze dat zelf weten?

Inleiding CUSTOMER TOUCH MODEL. Is het mogelijk klanten zo goed te kennen dat je kunt voorspellen wat ze gaan kopen voordat ze dat zelf weten? Inleiding Is het mogelijk klanten zo goed te kennen dat je kunt voorspellen wat ze gaan kopen voordat ze dat zelf weten? Er zijn geruchten dat Amazon een dergelijke gedetailleerde kennis van haar klanten

Nadere informatie

Gezond eten: Daar heb je een leven lang lol van!

Gezond eten: Daar heb je een leven lang lol van! Gezond eten: Daar heb je een leven lang lol van! Opgedragen aan Julia, Floris en Maurits. Gezond eten: Daar heb je een leven lang lol van! EEN VROLIJK BOEK VOOR KINDEREN WAARMEE ZIJ HUN OUDERS KUNNEN LEREN

Nadere informatie

Wat kan klantcontact met kunstmatige intelligentie?

Wat kan klantcontact met kunstmatige intelligentie? 13 oktober 2016 Wat kan klantcontact met kunstmatige intelligentie? De gemiddelde smartphone van nu is al viermaal zo krachtig als de computers die nodig waren om in 1969 de Apollo11- raket op de maan

Nadere informatie

Drie domeinen als basis voor onze toekomstige veiligheid De genoemde trends en game changers raken onze veiligheid. Enerzijds zijn het bedreigingen, anderzijds maken zij een veiliger Nederland mogelijk.

Nadere informatie

ESSAY. Hoe kan Oxford House efficiënter online communiceren naar zijn potentiele opdrachtgevers? Essay. Lexington Baly 1592180

ESSAY. Hoe kan Oxford House efficiënter online communiceren naar zijn potentiele opdrachtgevers? Essay. Lexington Baly 1592180 ESSAY Hoe kan Oxford House efficiënter online communiceren naar zijn potentiele opdrachtgevers? Essay Lexington Baly 1592180 Seminar: Dream Discover Do Essay Docent: Rob van den Idsert Effectief gebruik

Nadere informatie

Spelend leren, leren spelen

Spelend leren, leren spelen Spelend leren, leren spelen een werkboek voor kinderen en ouders Rudy Reenders, Wil Spijker & Nathalie van der Vlugt Spelend leren, een werkboek voor kinderen en ouders leren spelen Rudy Reenders, Wil

Nadere informatie

Belbin Teamrollen Vragenlijst

Belbin Teamrollen Vragenlijst Belbin Teamrollen Vragenlijst Lindecollege 2009 1/ 5 Bepaal uw eigen teamrol. Wat zijn uw eigen teamrollen, en die van uw collega s? Deze vragenlijst kan u daarbij behulpzaam zijn. Zeven halve zinnen dienen

Nadere informatie

Zien, doen én verbeelden

Zien, doen én verbeelden Zien, doen én verbeelden Amsterdam, juni 2018 Beste Judea Pearl, Net in de week dat ik jouw zeer interessante The Book of Why. The New Science of Cause and Effect las, verscheen er bij ons in de kranten

Nadere informatie

GELOOFWAARDIGHEID is de sleutel tot succesvolle interne communicatie. April 2012. Concrete tips voor effectieve interne communicatie

GELOOFWAARDIGHEID is de sleutel tot succesvolle interne communicatie. April 2012. Concrete tips voor effectieve interne communicatie GELOOFWAARDIGHEID is de sleutel tot succesvolle interne communicatie April 2012 Concrete tips voor effectieve interne communicatie Amsterdam, augustus 2012 Geloofwaardige interne communicatie Deze white

Nadere informatie

Snellezen. Ter illustratie

Snellezen. Ter illustratie Snellezen De minor Media en Cultuur die ik aan de UvA ga volgen vanaf 2 februari vraagt nogal wat leeswerk. Sterker nog een cursus snellezen werd ons sterk aangeraden om te volgen voordat je naar de UvA

Nadere informatie

U in het middelpunt Die migraine hè Levenservaring verzilveren

U in het middelpunt Die migraine hè Levenservaring verzilveren Welzijn op recept Welkom bij SWOA. Uw huisarts heeft u met ons in contact gebracht. De dokter kan u op dit moment geen passende behandeling (meer) bieden. Toch voelt u zich niet lekker, of heeft u pijn.

Nadere informatie

Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation.

Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Author: Witsenburg, Tijn Title: Hybrid similarities : a method to insert relational information

Nadere informatie

De Sleutel tot het benutten van potentie

De Sleutel tot het benutten van potentie De Sleutel tot het benutten van potentie Wat is potentie eigenlijk? Een snelle blik in een woordenboek levert de volgende resultaten op: het kunnen; dat waartoe iemand of iets toe in staat is; vermogen.

Nadere informatie

Werkboek Het is mijn leven

Werkboek Het is mijn leven Werkboek Het is mijn leven Het is mijn leven Een werkboek voor jongeren die zelf willen kiezen in hun leven. Vul dit werkboek in met mensen die je vertrouwt, bespreek het met mensen die om je geven. Er

Nadere informatie

Samenvatting. Clay Shirky Iedereen Hoofdstuk 4 Eerst publiceren, dan filteren. Esther Wieringa - 0817367 Kelly van de Sande 0817383 CMD2B

Samenvatting. Clay Shirky Iedereen Hoofdstuk 4 Eerst publiceren, dan filteren. Esther Wieringa - 0817367 Kelly van de Sande 0817383 CMD2B Samenvatting Clay Shirky Iedereen Hoofdstuk 4 Eerst publiceren, dan filteren Esther Wieringa - 0817367 Kelly van de Sande 0817383 CMD2B Deze samenvatting gaat over hoofdstuk 4; eerst publiceren dan filteren,

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

De Keukentafel Uitdaging

De Keukentafel Uitdaging De Keukentafel Uitdaging MAG HET WAT RUSTIGER AAN DE KEUKENTAFEL Gemaakt in het kader van het Swing project Een cliëntproces; tools voor samenwerking Door Nic Drion Aan de keukentafel Aan de keukentafel

Nadere informatie

B a s S m e e t s w w w. b s m e e t s. c o m p a g e 1

B a s S m e e t s w w w. b s m e e t s. c o m p a g e 1 B a s S m e e t s w w w. b s m e e t s. c o m p a g e 1 JE ONBEWUSTE PROGRAMMEREN VOOR EEN GEWELDIGE TOEKOMST De meeste mensen weten heel goed wat ze niet willen in hun leven, maar hebben vrijwel geen

Nadere informatie

Mens en machine. Amsterdam, februari Beste Hannah Fry,

Mens en machine. Amsterdam, februari Beste Hannah Fry, Mens en machine Amsterdam, februari 2019 Beste Hannah Fry, Miljarden mensen zijn tegenwoordig via machines met elkaar verbonden. De digitale revolutie heeft de wereld de laatste decennia fundamenteel veranderd

Nadere informatie

Research context: van venster naar poort Onderdeel: context

Research context: van venster naar poort Onderdeel: context Research context: van venster naar poort Onderdeel: context Naam: Zoë Tabak Klas: GAR1D Vak: Research Leraar: Harald Warmelink Datum: 15-3-2015 Inleiding Naar aanleiding van de eerste discussies binnen

Nadere informatie

copyright 2010 Blinker BV

copyright 2010 Blinker BV copyright 2010 Blinker BV H1 Ik wil u beter leren kennen... 2 H2 Start van de relatie: kennismaken... 3 H3 Personalisatie: altijd weten wie ik ben... 4 H4 Profielverrijking: weten wat mij interesseert...

Nadere informatie

Onderzoek Stress. 5 Juni 2014. Over het 1V Jongerenpanel

Onderzoek Stress. 5 Juni 2014. Over het 1V Jongerenpanel Onderzoek Stress 5 Juni 2014 Over het onderzoek Aan dit online onderzoek, gehouden van 20 mei tot en met 5 juni 2014 in samenwerking met 7Days, deden 2.415 jongeren mee. Hiervan zijn er 949 scholier en

Nadere informatie

HET SCHAAKSPEL OPGELOST Cees Timmer

HET SCHAAKSPEL OPGELOST Cees Timmer HET SCHAAKSPEL OPGELOST Cees Timmer HOOFDSTUK 1: INLEIDING Onder deze provocerende titel wordt een niet al te technische uitleg gegeven hoe je het schaakspel oplost. Het schaakspel oplossen wil zeggen

Nadere informatie

HANDIG ALS EEN HOND DREIGT

HANDIG ALS EEN HOND DREIGT l a n d e l i j k i n f o r m a t i e c e n t r u m g e z e l s c h a p s d i e r e n HANDIG ALS EEN HOND DREIGT OVER HOUDEN VAN HUISDIEREN HIER LEES JE HANDIGE INFORMATIE OVER HONDEN DIE DREIGEN. JE KUNT

Nadere informatie

Intuïtief Website Stappen Plan voor een Doorlopende Stroom Klanten

Intuïtief Website Stappen Plan voor een Doorlopende Stroom Klanten Intuïtief Website Stappen Plan voor een Doorlopende Stroom Klanten 2015 Annie Massop Hart en Ziel Marketing - Alle rechten voorbehouden - 1 Inleiding Dit stappenplan sluit aan op de workshop Hoe je intuïtief

Nadere informatie

Ik-Wijzer Ik ben wie ik ben

Ik-Wijzer Ik ben wie ik ben Ik ben wie ik ben Naam: Lisa Westerman Inhoudsopgave Inleiding... 3 De uitslag van Lisa Westerman... 7 Toelichting aandachtspunten en leerdoelen... 8 Tot slot... 9 Pagina 2 van 9 Inleiding Hallo Lisa,

Nadere informatie

Wat is jouw verhaal?

Wat is jouw verhaal? E E N E - B O O K V A N L E T T E R S & C O N C E P T S Wat is jouw verhaal? Passie en plezier overbrengen in een notendop Storytelling Verhalen vertellen is een belangrijk onderdeel van ons leven. Het

Nadere informatie

Ouderschap in Ontwikkeling

Ouderschap in Ontwikkeling Ouderschap in Ontwikkeling Ouderschap in Ontwikkeling. De kracht van alledaags ouderschap. Carolien Gravesteijn Ouderschap in Ontwikkeling. De kracht van alledaags ouderschap. Carolien Gravesteijn Ouderschap

Nadere informatie

Spreekbeurt hoogbegaafdheid.

Spreekbeurt hoogbegaafdheid. Spreekbeurt hoogbegaafdheid. Wat is hoogbegaafdheid eigenlijk? Hoogbegaafdheid is eigenlijk dat je slimmer geboren bent dan andere kinderen. Dat kan je meten met een IQ test. IQ is de afkorting van intelligentiequotiënt.

Nadere informatie

Shimon Whiteson over robotica in de zorg We willen een sociaalvaardige robot maken

Shimon Whiteson over robotica in de zorg We willen een sociaalvaardige robot maken MAGAZINE winter 2013-2014 8 Shimon Whiteson over robotica in de zorg We willen een sociaalvaardige robot maken Nu al kan een robot namens iemand die ziek thuis op de bank zit naar bijvoorbeeld school of

Nadere informatie

Get In Shape! Stoere mannen werken in de zorg!

Get In Shape! Stoere mannen werken in de zorg! Get In Shape! Stoere mannen werken in de zorg! Samenvatting concept Het concept bevat een reclame die ingaat op de handelingen binnen het werk en het imago van negatief naar positief omvormt en een dag

Nadere informatie

Begeleide interne stage

Begeleide interne stage Ik, leren en werken Begeleide interne stage Deel 2 Colofon Uitgeverij: Edu Actief b.v. 0522-235235 info@edu-actief.nl www.edu-actief.nl Auteur: Marian van der Meijs Inhoudelijke redactie: Titel: Ik, leren

Nadere informatie

8. Complexiteit van algoritmen:

8. Complexiteit van algoritmen: 8. Complexiteit van algoritmen: Voorbeeld: Een gevaarlijk spel 1 Spelboom voor het wespenspel 2 8.1 Complexiteit 4 8.2 NP-problemen 6 8.3 De oplossing 7 8.4 Een vuistregel 8 In dit hoofdstuk wordt het

Nadere informatie

AN IMMERSIVE SOUND EXPERIENCE LESBRIEF VOOR DOCENTEN VOORAFGAAND AAN DE VOORSTELLING

AN IMMERSIVE SOUND EXPERIENCE LESBRIEF VOOR DOCENTEN VOORAFGAAND AAN DE VOORSTELLING AN IMMERSIVE SOUND EXPERIENCE LESBRIEF VOOR DOCENTEN VOORAFGAAND AAN DE VOORSTELLING INTRODUCTIE (5 MIN.) Bekijk met de klas de trailer van Listen Up!: http://www.youtube.com/watch?time_continue=4&v=lvcslkmauje

Nadere informatie

www.nexttalent.nl > Inkijkexemplaar

www.nexttalent.nl > Inkijkexemplaar > Inkijkexemplaar Inhoudsopgave: 1. Inleiding 2. De rol van werk in een leven 3. Wat ben je, wat kun je, wat wil je? 4. Waar vind je die baan? 5. Talentontwikkeling & Flow Copyright 2011, Martijn Leonard,

Nadere informatie

Groeikansen met (big) data. Workshop 26 november 2014

Groeikansen met (big) data. Workshop 26 november 2014 Groeikansen met (big) data Workshop 26 november 2014 Overal data 2 Overal data Verdergaande digitalisering 3,6 device per persoon 51% gebruikt tablet Bijna 90% dagelijks internet Internet of Things 3 Maar

Nadere informatie

INLOGLES SCHOOLPORTAAL / ELO mbo

INLOGLES SCHOOLPORTAAL / ELO mbo INLOGLES SCHOOLPORTAAL / ELO mbo Inhoudsopgave Inleiding 3 Lesplan 4 Voorafgaand aan de les 5 Les opzet 6 Start met inloggen 7 Welke vragen kunt u verwachten 10 Technische problemen 11 Malmberg s-hertogenbosch

Nadere informatie

Wat maakt je zo boos?

Wat maakt je zo boos? Shari Klein en Neill Gibson Wat maakt je zo boos? 10 stappen om boosheid te transformeren naar een win-win situatie. Een presentatie van de ideeën van Geweldloze Communicatie en hoe je ze kunt toepassen

Nadere informatie

HET VERTROUWEN IN INSTITUTIES NEEMT AF, MENSEN ZOEKEN VERTROUWEN BIJ ELKAAR Het vertrouwen in instituties zoals de media, vakbonden, grote

HET VERTROUWEN IN INSTITUTIES NEEMT AF, MENSEN ZOEKEN VERTROUWEN BIJ ELKAAR Het vertrouwen in instituties zoals de media, vakbonden, grote HET VERTROUWEN IN INSTITUTIES NEEMT AF, MENSEN ZOEKEN VERTROUWEN BIJ ELKAAR Het vertrouwen in instituties zoals de media, vakbonden, grote ondernemingen, de Tweede Kamer en de regering neemt af. Waarop

Nadere informatie

1 Delers 1. 3 Grootste gemene deler en kleinste gemene veelvoud 12

1 Delers 1. 3 Grootste gemene deler en kleinste gemene veelvoud 12 Katern 2 Getaltheorie Inhoudsopgave 1 Delers 1 2 Deelbaarheid door 2, 3, 5, 9 en 11 6 3 Grootste gemene deler en kleinste gemene veelvoud 12 1 Delers In Katern 1 heb je geleerd wat een deler van een getal

Nadere informatie

NaïS Zine #B2P LINKEDIN DAGTRAINING. Nieuw. Vanaf volgende maand geven wij een gastblogger een podium! Als eerste;

NaïS Zine #B2P LINKEDIN DAGTRAINING. Nieuw. Vanaf volgende maand geven wij een gastblogger een podium! Als eerste; N A Ï S 2 0 1 7 I S S U E N O. 3 T I J D E L I J K G R A T I S NaïS Zine LINKEDIN N E D E R L A N D E R S O M A R M E N L I N K E D I N #B2P Z Ó O N D E R S C H E I D T J E J E D I E N S T V E R L E N

Nadere informatie

In deze les. Het experiment. Hoe bereid je het voor? Een beetje wetenschapsfilosofie. Literatuuronderzoek (1) Het onderwerp.

In deze les. Het experiment. Hoe bereid je het voor? Een beetje wetenschapsfilosofie. Literatuuronderzoek (1) Het onderwerp. In deze les Het experiment Bart de Boer Hoe doe je een experiment? Hoe bereid je het voor? De probleemstelling Literatuuronderzoek Bedenken/kiezen experimentele opstelling Bedenken/kiezen analysevorm Hoe

Nadere informatie

Ik en de maatschappij. Online

Ik en de maatschappij. Online Ik en de maatschappij Online Colofon Uitgeverij: Edu Actief b.v. 0522-235235 info@edu-actief.nl www.edu-actief.nl Auteur: Mieke Lens Inhoudelijke redactie: Ina Berlet Eindredactie: Daphne Ariaens Titel:

Nadere informatie

Laat zien en vertel, dat is het motto van

Laat zien en vertel, dat is het motto van Geef een presentatie en doe dat vooral met tekeningen Dan Roam, Visueel presenteren - Het ontwerpen van presentaties die overtuigen, Vakmedianet, 260 blz., ISBN 978 94 6276 016 5. Het doel van de presentator

Nadere informatie

Doe de Booest Check Zet de 1e stappen om jouw praktijk te laten groeien en er een echte onderneming van te maken.

Doe de Booest Check Zet de 1e stappen om jouw praktijk te laten groeien en er een echte onderneming van te maken. Doe de Booest Check Zet de 1e stappen om jouw praktijk te laten groeien en er een echte onderneming van te maken. ü Yes ü No ü Yes ü No Krijg een contstante stroom klanten en verhoog je inkomen ü No Auteurs

Nadere informatie

Cursus Onderwijs en ICT. bloggen met Wordpress

Cursus Onderwijs en ICT. bloggen met Wordpress Cursus Onderwijs en ICT Deel 21 (versie 1.0 NL 27-04-2011) bloggen met Wordpress door Serge de Beer Inleiding Zelf ben ik niet zo n blogger. Niet dat ik het niet heb geprobeerd trouwens. Al regelmatig

Nadere informatie