Predictieve modellen - overzicht

Vergelijkbare documenten
INZET VAN MACHINE LEARNING

Minder Big data Meer AI.

MACHINE LEARNING. Een egocentrische presentatie door een data scientist van Axians. Michel van Gelder Data Scientist bij Axians

Continuous Learning in Computer Vision S.L. Pintea

AI en Software Testing op de lange termijn

Een foto zegt meer dan duizend woorden

Neurale Netwerken en Deep Learning. Tijmen Blankevoort

Data Mining: Classificatie

Inhoud. Neuronen. Synapsen. McCulloch-Pitts neuron. Sigmoids. De bouwstenen van het zenuwstelsel: neuronen en synapsen

Tentamen Kunstmatige Intelligentie (INFOB2KI)

Hoe AI kan ingezet worden voor de analyse van asbesthoudende daken

Machinaal leren, neurale netwerken, en deep learning

Datagedreven sturen, en hoe dan ZGW?

Wat is nieuw in Enterprise Guide

Kunstmatige Intelligentie (AI) Hoofdstuk 18.7 van Russell/Norvig = [RN] Neurale Netwerken (NN s) voorjaar 2016 College 9, 19 april 2016

AI introductie voor testers

A Data Driven Journey Pieter de Kok RA AANJAGER CONEY. 31 oktober 2018

Met de Glazen Bol naar. Doelgerichter BWT Toezicht

Het computationeel denken van een informaticus Maarten van Steen Center for Telematics and Information Technology (CTIT)

Living Labs : NFI & RvdK Samen onderweg naar meer grip op data. JenV I-tour presentatie 24 april 2018

De valkuilen die je moet voorkomen om van predictive maintenance een succes te maken

On-line beheer van lekken op drinkwaternetten Leakex. Daniel Van Damme

Veilige en efficiënte inspectie van het spoor Inzending Hendrik Lorentz Data Science Prijs

Divide & Conquer: Verdeel en Heers vervolg. Algoritmiek

Vandaag. Uur 1: Differentiaalvergelijkingen Uur 2: Modellen

Architectuur en Artificial Intelligence

Bestrijd illegale houtkap en red het regenwoud met HANA

De toekomst van data science in het waterdomein.

Ontsluiten van gesproken documenten. Arjan van Hessen

Vier de zomer met KPS!

Whitepaper Intelligente PIM oplossingen

Eenparige rechtlijnige beweging

Transparanten bij het vak Inleiding Adaptieve Systemen: Introductie Machine Leren. M. Wiering

Problemen herformuleren Leerlingen drukken de probleemstelling uit in eigen woorden.

Sinds de jaren 70 zijn wetenschappers bezorgd om de vervuiling van onze oceanen door allerhande plastiek afval. De laatste 10 jaar loopt het echt uit

November December Jan Meskens / Onderzoek

Eenparige rechtlijnige beweging

Personiceren van stemmen met Deep Learning

Analyse, nowcasting, forecasting & control

IN 4 STAPPEN NAAR EEN DATAGEDREVEN ORGANISATIE ALLES WAT JE MOET WETEN VOOR EEN SUCCESVOLLE DATA TRANSFORMATIE

Trends in organiseren

Projectdocument Pretty Fly for an AI

Handleiding BRIO - BRIOplus. S&R Scheduling. Pagina 1 van 8

Hogeschool1. Aanbevelen van content op social networking sites

Welkom! GertJan Coolen

1 Complexiteit. of benadering en snel

Vakgroep CW KAHO Sint-Lieven

Automatische Overgangen instellen

Opvolging van wintersmogepisodes - OVL voorspellingsmodel

EVGN 11. Gebruik van statistische instrumenten door de taxateur

Informatie- Gestuurd. Handhaven. Pilot Uitkeringsfraude

Het MaDeSi project: Maintenance Decision Support & Simulation. Wim Lammen (NLR) AMC Seminar, Amsterdam 8 november 2017

URBAN SCIENCE. Professor Nanda Piersma Michael Hogenboom

Conclusies en aanbevelingen standaardisatie. Danny Vandenbroucke

End-to-End testen: de laatste horde

Meting zonnepaneel. Voorbeeld berekening diodefactor: ( ) Als voorbeeld wordt deze formule uitgewerkt bij een spanning van 7 V en 0,76 A:

Welke reken-wiskundige bagage heb je nodig om volwaardig te kunnen participeren in de maatschappij?

1. Programmeerblokken

Tentamen Data Mining. Algemene Opmerkingen. Opgave L. Korte vragen (L6 punten) Tijd: 14:00-17:00. Datum: 4januai20l6

Classification - Prediction

In deze les. Het experiment. Hoe bereid je het voor? Een beetje wetenschapsfilosofie. Literatuuronderzoek (1) Het onderwerp.

De weg naar de zelfrijdende auto s: Waar staan we nu (eigenlijk echt)? Prof. Dr. Marieke H. Martens

HOOFDSTUK VII REGRESSIE ANALYSE

VIATA nieuwe generatie online apotheek

Nationaal verkeerskundecongres 2018

11. Multipele Regressie en Correlatie

APPENDIX 3. Visueel voetmodel ter simulatie van voetkinematica aan de hand van planetaire drukdata (Friso Hagman)

Deze landbouwimpactstudie beschrijft het studiegebied uit Figuur 1. pagina 1 van 8

HET POLICY LAB. Tjerk Timan. ScienceWorks 25 mei 2018

Waternet Datalab. KI in de praktijk. KI in de watersector, 25 juni 2019 Alex van der Helm

MiCAT Planner. De toekomst van CMM programmatie. Mitutoyo BeNeLux. Showroom België/Belgique Hogenakkerhoekstraat Kruibeke

Optimalisatie van de eerste klinische studies in bi ondere patie ntengroepen: op weg naar gebruik van semifysiologische

Data Driven Defensie. Kooy Symposium 2016 AI en Big Data. Prof.dr. Paul C. van Fenema. Nederlandse Defensie Academie

Koptekst 08/06/2016. Overheid moet gevaren big-data analyses beperken.

Dutch summary. Nederlandse samenvatting. Een bijdrage aan de grijp-puzzel

Tentamen in2205 Kennissystemen

Tentamen in2205 Kennissystemen

Artificial Intelligence. Tijmen Blankevoort

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

TestNet voorjaarsevent 15 mei Testen met AI. Op weg naar een zelflerende testrobot. TestNet werkgroep Testen met AI. Sander Mol Marco Verhoeven

Uitleg van de Hough transformatie

In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen.

Bij het maken van deze opgave worden de volgende vragen beantwoord:


Enkele voorbeelden volstaan. Zie verder de Help-file van Matlab.

Het classificeren van hoortoestel modaliteiten m.b.v. een Big Data benadering: Latent Class Trees analyse

VAN HET PROGRAMMEREN. Inleiding

AN0021-NL. Een trigger- en actieregel maken. Overzicht. Een Trigger- en actieregel creëren

Oplossingen hoofdstuk 8

smartops people analytics

Op weg naar betere forecasting voor huurauto s optimalisatie. Door Maxim Ivashkov

Modeluitwerking Tentamen Computationele Intelligentie Universiteit Leiden Informatica Vrijdag 11 Januari 2013

wystack Case Study Sensight: online, real-time inzicht in gevalideerde sensor-gegevens. #big-data, #internet-of-things, #cloud

PET/MKT/001 - DATAMINER VERANTWOORDELIJKHEDEN I.V.M. INFORMATIEBEVEILIGING EN VERANTWOORD SPEL

What s new versie 3.35 P6 van 19/12/2018

Kunstmatige Intelligentie

Smart Vision! Van Neuroscience naar Deep Learning (en terug) Sander Bohté CWI Life Sciences VIA AwesomeIT, April 10th 2015

Presteren ijverige studenten beter? De complexe relatie tussen studentkenmerken, studietijd en studieresultaat.

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Methodologie voor het gebruik van Dynamic Line Rating in de capaciteitsberekening

Transcriptie:

Predictieve modellen - overzicht 08-01-2018 Jochem Grietens Verhaert Alexander Frimout Verhaert

1 AI voor lichtcontrole Het doel is om de verlichting van de Vlaamse snelweg slimmer te maken met behulp van A.I. technologie. Concreet hebben we historische en real-time van verschillende bronnen alsook de logs van de effectieve lichtsturing. Het Turing project heeft als doel deze, expertkennis en contextgegevens samen te gebruiken om een model te maken dat de de sturing van de verlichting volledig of gedeeltelijk automatiseert. Zo n systeem wordt een model genoemd en berekend een gewenste sturing uit de inkomende input gegevens. In dit geval neemt het model de inputs zoals lokale weersinformatie, vriesdiepte-metingen, road-usage,... om een storingssignaal naar de licht lussen te sturen. In onderstaande afbeelding werd een vereenvoudigde voorstelling gemaakt van het soort systeem dat we trachten te bekomen. We zien het concurrent model onderaan centraal dat allerhande input krijgt en als output een signaal naar de sturings cabine stuurt die op haar beurt de verlichtingslus aanstuurt. In dit project is het belangrijk rekening te houden met een context waar het model niet volledig autonoom kan werken en nog overschreven kan worden in noodgevallen of door een extern opgelegde planning. Deze vereiste moet weerspiegeld worden in de uiteindelijke architectuur.

2 Model distributie Een belangrijke overweging in de modelkeuze en architectuur design is de distributie van de modellen. Ter illustratie stellen we 3 vereenvoudigde cases voor. Case 1 : Master model Eén master model neemt als input de globale en alle lokale over heel het land. Als output geeft het model een sturend commando voor elke loop. Zulk een model biedt weinig controle en overzicht tijdens ontwikkeling en onderhoud. Wij raden een modulaire approach aan zoals in Case 2 en 3.

3 Case 2: Lokaal model niet uniek Elke lus krijgt een eigen model maar dit model is identiek voor elke lus. Het model is dus hetzelfde voor elke lus, het verschil is dat elke instantie van het model de unieke lokale krijgt die overeenkomt met de lus die het hoort te controleren. De voordelen van deze verdeling zijn dat het makkelijker te ontwikkelen en onderhouden is. Er is minder historische nodig om zelflerende algoritmes te gebruiken om het model te.

4 Case 3: Lokaal model uniek Case 3 is gelijkaardig aan case 2 met het verschil dat elk model uniek is. Elk model is ontwikkeld voor de specifieke lus en bijhorende locatie. Het unieke voordeel aan dit systeem is dat de intelligentie uniek is aan de lokatie. Dit kan positief zijn voor performantie. De keerzijde is dat de ontwikkeling en het onderhoud oploopt. Er is ook een hogere vereiste van voldoende representatieve voor elk

5 model. Data Het model zal verschillende input bronnen gebruiken tijdens ontwikkeling en operatie. In het voorbeeldschema in bovenstaande afbeelding werden enkele voorbeelden genomen van het type dat gebruikt kan worden. In de onderstaande paragrafen worden enkele opmerkingen gemaakt over hoe om te gaan met deze. Deze lijst is niet exhaustief maar enkel illustratief om aan te tonen welke accenten belangrijk zijn bij de interactie tussen model en input. Datum/Tijd Datum en tijd in standaard formaat. Het is belangrijk dat het model de dag van het jaar en de tijd in de dag kent. Het is mogelijk om additionele informatie te voorzien zoals een feestdagen kalender. Road usage (live )

6 Data die komt van lussen, camera's en dergelijke en de real-time drukte op de baan aangeeft. Men kan verwachten dat er een variërend aantal van deze inputs zijn per licht-regel-lus. Bij voorkeur heeft een model hetzelfde aantal inputs voor elke licht-regel-lus. Om de input te standaardiseren over alle modellen/regel-lussen zijn er verschillende opties. 2 Voorstellen: Data aggregeren tot één "drukte-metric" die samengesteld is uit de verschillende metingen De X kortst bijzijnde/toegewezen lussen gebruiken als input van het model. Hier is X een constante voor alle lussen. Local traffic forecast & reporting Elke lus is toegewezen aan een specifieke regio. Er kunnen verschillende variabelen gedefinieerd worden voor de relevante metrieken: zichtbaarheid, kans op file, filelengte, gemiddelde snelheid,... Local weather forecast/station Elke lus is toegewezen aan een specifieke regio. Er kunnen verschillende variabelen gedefinieerd worden voor de relevante metrieken: zichtbaarheid, schemer, bewolking, mist, kans op neerslag,... Vries diepte De bodemtemperatuur en vries-diepte wordt gemeten. Zoals bij de road-usage- kan men verwachten dat er een variërend aantal van deze inputs zijn per regel-lus. Dezelfde maatregelen kunnen hier getroffen worden. A.I. model types Er zijn verschillende soorten modellen die verschillen in performantie,, transparantie, vereiste rekenkracht, intelligentie en graad van autonomie. De uiteindelijke selectie van het juiste model kan pas gemaakt worden wanneer de use case en technical volledig duidelijk zijn. Daarnaast is de aard en kwaliteit van de beschikbare van zeer groot belang voor de keuze van het model en kan enkel een vergelijkende studie op echte gebruikt worden om een finale selectie te maken op basis van performantie. In deze tekst wordt een aanzet gegeven om a-priori inzicht te krijgen in de kanshebbende modellen.

7 We maken een onderscheid tussen 2 soorten modellen. Expert-systems zijn modellen gebaseerd op kennis van deskundigen en domeinkennis. Machine learning-modellen nemen een -gedreven aanpak waarbij gegevens worden gebruikt om optimale modellen te leren. In wat volgt worden enkele modeltypes voorgesteld. Deze lijst in niet exhaustief en dient aangevuld te worden. De voorgestelde modellen zijn gelijk in dat ze gestandaardiseerde inputgegevens aannemen, hier bewerkingen op uitvoeren en als uitgang de lussen sturen. De modellen verschillen op verschillende manieren: Expert systemen worden opgesteld op basis van kennis die bij experten aanwezig is en kan vertaald worden naar regels in de vorm van if-the rules. Zelflerende algoritmes, leren op basis van historische het gewenste gedrag. Verder verschillen de algoritmes in: : De hoeveelheid/kwaliteit en aard van de die nodig is om het algoritme te ontwikkelen. #input parameters: Modellen verschillen in de hoeveelheid input die ze kunnen verwerken. gevoeligheid: De algoritmes verschillen in de hoeveelheid die ze kunnen verwerken én de hoeveelheid ruis die op de aanwezig mag zijn. Transparantie/interpreteerbaarheid: een transparant algoritme laat zich door mensen lezen, zo kan de mens begrijpen hoe een bepaalde output berekend werd. Daar tegenover staan black-box algoritmes die vaak goede resultaten geven maar hun werking laat zich moeilijk interpreteren. : De rekenkracht die nodig is om de voorspellingen in real time te maken. : De rekenkracht die nodig is om het model te tijdens ontwikkeling.

8 Expert systemen In expertsystemen gebruiken we domeinkennis en expertkennis om een model te bouwen dat de gemeten invoergegevens omzet in gewenste outputs. We gaan ervan uit dat we enig begrip hebben van de relaties tussen inputs en outputs en dat we ze kunnen coderen in regels of wiskundige functies. Expert systemen niet erg gesofisticeerd maar kunnen goede resultaten leveren. Expert systemen kunnen ook driven zijn wanneer tijdens ontwikkeling een analyse gebeurd op de historische waarvan de inzichten omgezet worden in regels en functies in het model. If-then rules Regels worden geïmplementeerd op basis van expert kennis. If-then rules expert kennis + validatie beperkt tot het menselijk overzicht over de input ok in het geval dat men dit voorziet in tijdens implementati e n.a. Laag Belief networks Belief networks kunnen opgesteld worden op basis van expert kennis of zelflerend zijn of een combinatie van beide voorstellen. Een verdere beschrijving wordt gegeven onder de machine learning modellen. Machine learning models Met machine learning methodes worden optimale relaties tussen input en gewenste output geleerd op basis van historische. Een machine learning algoritme wordt tijdens de ontwikkeling getrained op de historische. Het wordt daarna in het veld gebruikt door real time te verwerken en een voorspelling te maken van de gewenste. Zelflerende algoritmes kunnen slechts leren van de beschikbare. Dit wil zeggen dat het belangrijk is dat het gewenste gedrag reeds in de historische terug te vinden is of door een

9 expert kan aangeleverd worden. Indien dit niet het geval is het aangeraden expert systemen te ontwikkelen of alternatieven te onderzoeken. Rule learning systems Regels worden geleerd op basis van voorbeeld waar gewenst gedrag vertoond wordt. Rule learning systems minimaal avers Laag Laag Decision trees Beslissingsbomen worden geleerd op basis van voorbeeld waar gewenst gedrag vertoond wordt. Decision trees minimaal avers Laag Laag Random forests Verschillende beslissingsbomen worden geleerd. Bij inferentie hebben alle bomen een stem om te bepalen welk het uiteindelijke antwoord wordt(ensemble models). Forests zijne en

10 verbetering omdat ze minder label-noise gevoelig zijn dan enkelvoudige decision trees. Het leren gebeurd op basis van voorbeeld waar gewenst gedrag vertoond wordt. Random forests minimaal Beperkte noise ok Matig Laag Laag Support vector machines Alle klassen/acties/output-labels worden gescheiden door lineaire of niet-linaire scheidingsvlakken op basis van support vectors, dit zijn vectors bestaande uit de input variabelen die het meest bepalend zijn voor de scheiding tussen verschillende klassen. Het leren gebeurd op basis van voorbeeld waar gewenst gedrag vertoond wordt. Support vector machines extensieve set Beperkte noise ok - resisten in sommige gevallen. Matig Neurale Er wordt een verband gezocht tussen de gewenste ingang en uitgang door een aaneenschakeling van bewerkingen die "neuronen" genoemd worden. Het leren gebeurd op basis van voorbeeld waar gewenst gedrag vertoond wordt.

11 (shallow) neurale extensieve set Beperkte noise ok Laag medium medium (diepe) Neurale feed-forward neurale en convolutionele neurale Er wordt een verband gezocht tussen de gewenste ingang en uitgang door een aaneenschakeling van bewerkingen die "neuronen" genoemd worden. Diepe neurale vormen ele lagen van deze neuronen waardoor ze zeer complexe verbanden kunnen aanleren. Het leren gebeurd op basis van voorbeeld waar gewenst gedrag vertoond wordt. (deep) Neurale feedforward neurale recurrente neurale big big big ideaal voor ideaal voor ideaal voor resistent Black-box resistent Black-box resistent Black-box

12 Deze hebben een geheugen component in de neuronen waardoor makkelijk gewerkt kan worden met die varieert in de tijd. Belangrijke gebeurtenissen in een vroeger tijdstip worden naamlijk "onthouden in neuronen" om te gebruiken in de huidige output berekening. Belief networks Belief networks leren kansverdelingen op grafische weergaven van kansverdelingen. In deze grafische weergaven kunnen veronderstellingen over causaliteit vervat worden. Belief networks laten toe de kans te berekenen dat een bepaald scenario zich zal voordoen onder de kennis van andere variabelen. Het leren gebeurd op basis van voorbeeld waar gewenst gedrag vertoond wordt. Expert kennis kan ook toegevoegd worden aan deze algoritmen. Belief networks big en/of expert kennis en/of statistische proceskennis Hangt af van implementa tie Laag - Overzicht If-then rules Zelflerende algoritmes expert kennis + validatie beperkt tot het menselijk overzicht over de input ok in het geval dat men dit voorziet tijdens implementa tie n.a. Laag

13 Rule learning systems Decision trees Random forests Support vector machines (shallow) neurale (deep) Neurale feedforward neurale recurrente neurale minimaal minimaal minimaal extensieve set extensieve set big big big avers Laag Laag avers Laag Laag ideaal voor ideaal voor ideaal voor Beperkte noise ok Matig Laag Laag Beperkte noise ok - resisten in sommige gevallen. Matig Beperkte noise ok Laag medium medium resistent Black-box resistent Black-box resistent Black-box

14 reinforcemen t learning Q - learning deep reinforcemen t learning Belief networks big - leert al doende big - leert al doende big - leert al doende big en/of expert kennis en/of statistische proceskennis Black-box Beperkte noise ok Black-box resistent Black-box Depends on implementa tion Laag -