Over Machines die Leren. Luc De Raedt Dept. Computerwetenschappen



Vergelijkbare documenten
Waarmaken van Leibniz s droom

LESSEN VOOR DE EENENTWINTIGSTE EEUW

Workflow en screenshots Status4Sure

Classification of triangles

Afstanden in Sociale Netwerken. Frank Takes Open Dag Informatica 30 november 2012

Cover Page. The handle holds various files of this Leiden University dissertation

Handleiding beheer lijst.hva.nl. See page 11 for Instruction in English

Security Les 1 Leerling: Marno Brink Klas: 41B Docent: Meneer Vagevuur

COGNITIEVE DISSONANTIE EN ROKERS COGNITIVE DISSONANCE AND SMOKERS

Maillijsten voor medewerkers van de Universiteit van Amsterdam

2019 SUNEXCHANGE USER GUIDE LAST UPDATED

Digital municipal services for entrepreneurs

Machinaal leren, neurale netwerken, en deep learning

MyDHL+ Van Non-Corporate naar Corporate

Preschool Kindergarten

SAMPLE 11 = + 11 = + + Exploring Combinations of Ten + + = = + + = + = = + = = 11. Step Up. Step Ahead

9 daagse Mindful-leSs 3 stappen plan training

Bijlage 2: Informatie met betrekking tot goede praktijkvoorbeelden in Londen, het Verenigd Koninkrijk en Queensland

De combinatie van verrijkingen, machine learning en crowd sourcing

Intelligente Spelen. Pieter Spronck. TouW Informatica Symposium, Open Universiteit, Universiteit van Tilburg

User Centred Development! UCD Werkcollege blok 1 week 4

open standaard hypertext markup language internetprotocol transmission control protocol internet relay chat office open xml

Innovatief monitoren van sportvelden. 31 mei 2018

Technologie als nieuwe wetenschap Lezing voor KIVI-NIRIA sectie Filosofie en technologie

Faculteit TEW Masterjaar Academiejaar : Masterproef TEW BK/EB/HI(B)/SEW

Voorzorg is niet onredelijk. WF Passchier Gezondheidsraad en Universiteit Maastricht

Eye Feature Detection Towards Automatic Strabismus Screening

Introductie in flowcharts

FOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE. Toets Inleiding Kansrekening 1 8 februari 2010

Adam Marciniec, Grzegorz Budzik Zaborniak

Disclosure belangen spreker

Vrijgeven van volledige gedetailleerde technische cookies

Summary 124

Engels op Niveau A2 Workshops Woordkennis 1

Automating the cockpit. Constructing an autonomous, human-like flight bot in a simulated environment

OUTDOOR HD BULLET IP CAMERA PRODUCT MANUAL

Quick scan method to evaluate your applied (educational) game. Validated scales from comprehensive GEM (Game based learning Evaluation Model)

General info on using shopping carts with Ingenico epayments

Online request form for requesting articles, books and / or theses: Erasmus MC - employees

Relationele Databases 2002/2003

SPID Azimuth antenna rotator Type: RAK

Four-card problem. Input

AI en Data mining. Van AI tot Data mining. dr. Walter Kosters, Universiteit Leiden. Gouda woensdag 17 oktober

Remote sensor series

L.Net s88sd16-n aansluitingen en programmering.

Never trust a bunny. D. J. Bernstein University of Illinois at Chicago. Tanja Lange Technische Universiteit Eindhoven

Relationele Databases 2002/2003

Naps raise productivity levels at work De voordelen van middagdutjes zijn verbeterde cognitieve vaardigheden

Neurale Netwerken en Deep Learning. Tijmen Blankevoort

B A S I S K E N NI S R F I D

L.Net s88sd16-n aansluitingen en programmering.

Ik ben Pedro De Bruyckere!

Innovaties in de chronische ziekenzorg 3e voorbeeld van zorginnovatie. Dr. J.J.W. (Hanneke) Molema, Prof. Dr. H.J.M.

LinkedIn Profiles and personality

DALISOFT. 33. Configuring DALI ballasts with the TDS20620V2 DALI Tool. Connect the TDS20620V2. Start DALISOFT

Halma Bot: Monte Carlo versus Alpha-Beta

Concept of Feedback. P.S. Gandhi Mechanical Engineering IIT Bombay

Today s class. Digital Logic. Informationsteknologi. Friday, October 19, 2007 Computer Architecture I - Class 8 1

BIM 4.2. (VLAIO) BIM e-commerce

BIM Mythes. 'Broodje BIM' in het kader van Bouwlokalen Marcel van Bavel Léon van Berlo Hans Hendriks Dik Spekkink

Software Processen. Ian Sommerville 2004 Software Engineering, 7th edition. Chapter 4 Slide 1. Het software proces

ALGORITMIEK: answers exercise class 7

Interaction Design for the Semantic Web

Artificial Intelligence. Tijmen Blankevoort

Kikkers en Heilige Koeien UvAConext & standaarden voor het primaire onderwijs en onderzoek proces

The colour of a pixel in a bit map picture can be presented in different ways. For this assignment, we distinguish two categories:

ZELF DENKENDE WEBSHOP

it600 Smart Home Range

Landelijk Diabetes Congres 2016

Opleiding PECB IT Governance.

0515 DUTCH (FOREIGN LANGUAGE)

Wordt educatief videomateriaal in Nederland vaak ondertiteld? Welke vormen van ondertitelen zijn mogelijk?

Relatie tussen Persoonlijkheid, Opleidingsniveau, Leeftijd, Geslacht en Korte- en Lange- Termijn Seksuele Strategieën

Whitepaper Intelligente PIM oplossingen

De toekomst van arbeid? LIVING TECHNOLOGY. Maarten van Riemsdijk. The way we are living is changed fundamentally

Kennerschap en juridische haken en ogen. Vereniging van Nederlandse Kunsthistorici Amsterdam, 10 juni 2016 R.J.Q. Klomp

STRESS CORROSION CRACKING OF WELDED JOINTS OF Al-Mg ALLOYS

Joos Vandewalle. wiskunde voor iedereen

Academisch schrijven Inleiding

De Samenhang tussen Dagelijkse Stress, Emotionele Intimiteit en Affect bij Partners met een. Vaste Relatie

Travel Survey Questionnaires

De causale Relatie tussen Intimiteit en Seksueel verlangen en de. modererende invloed van Sekse en Relatietevredenheid op deze relatie

Cambridge Assessment International Education Cambridge International General Certificate of Secondary Education. Published

(1) De hoofdfunctie van ons gezelschap is het aanbieden van onderwijs. (2) Ons gezelschap is er om kunsteducatie te verbeteren

THE ART OF INTEGRATION Rens Verweij, VICE Sophie Schade, Kantar Millward Brown

Het is geen open boek tentamen. Wel mag gebruik gemaakt worden van een A4- tje met eigen aantekeningen.

SPID Azimuth antenna rotator Type: BIG-RAK

z x 1 x 2 x 3 x 4 s 1 s 2 s 3 rij rij rij rij

WHS Autochartist. Van start gaan met WHS Autochartist. De markttrend voorspellen De grafiek voor ontwikkelende chart patronen laten zoeken

Data Mining: Classificatie

Ervaringen met begeleiding FTA cursus Deployment of Free Software Systems

Interactive Grammar leert de belangrijkste regels van de Engelste spelling en grammatica aan.

Open source VoIP Networks

HET ADRES VOOR AL UW RVS

Geheugenstrategieën, Leerstrategieën en Geheugenprestaties. Grace Ghafoer. Memory strategies, learning styles and memory achievement

Het classificeren van hoortoestel modaliteiten m.b.v. een Big Data benadering: Latent Class Trees analyse

bij Kinderen met een Ernstige Vorm van Dyslexie of Children with a Severe Form of Dyslexia Ans van Velthoven

2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren.

04/11/2013. Sluitersnelheid: 1/50 sec = 0.02 sec. Frameduur= 2 x sluitersnelheid= 2/50 = 1/25 = 0.04 sec. Framerate= 1/0.

Transcriptie:

Over Machines die Leren Luc De Raedt Dept. Computerwetenschappen

De Kunstmatige Intelligentie 1956: de eerste meeting rond kunstmatige intelligentie in Dartmouth de kernvraag: Kunnen we intelligente machines bouwen? John McCarthy

Intelligentie Heeft veel aspecten en facetten Het onderzoek richt zich meestal op deelproblemen Wij : machinaal leren Kunnen machines leren? Kunnen we lerende machines bouwen?

Overzicht A. Wat is machinaal leren? B. Waarom is het interessant? C. Hoe werkt het? D. Waar leidt dit alles toe? Toekomstverwachtingen

A. Wat is Machinaal Leren?

Machinaal Leren Een machine leert wanneer zijn performantie (zijn prestaties) op een bepaalde taak verbetert met ervaring

Dammen Arthur Samuel Dammen http://www.cs.ualberta.ca/~chinook/project/legacy.html

Dammen Machine = computerprogramma Taak = dammen Performantie = percentage gewonnen partijen Ervaring = gespeelde partijen

Spam

Spam Machine = e-mail programma, spamfilter Taak = e-mails classificeren Performantie = nauwkeurigheid van classificaties Ervaring = voorbeelden van spam en niet-spam

Recommender Systeem

Recommender Systeem Machine = website (en programma) Taak = boeken aanbevelen Performantie = behaalde omzet Ervaring = voorbeelden van voorbije aankopen

Machinaal Leren Een machine leert wanneer zijn performantie (zijn prestaties) op een bepaalde taak verbetert met ervaring

B. Waarom Machinaal Leren?

Waarom? Kunstmatige intelligentie Machinaal leren is gewoon erg praktisch sommige programma s (software) kunnen niet met de hand geprogrammeerd worden analyse van data (data mining) Inzicht in de aard van het leren en het verwerven van kennis welke wetten gelden voor lerende systemen? cognitieve wetenschappen en wetenschapsfilosofie

Data Mining Machinaal leren analyseert gegevens/ervaring Nauw verwant met data mining zoekt naar nieuwe nuttige kennis in mogelijk complexe datasets Data mining is erg populair Het is makkelijk om data te genereren maar moeilijk om ze te interpreteren We are drowning in data but starving for knowledge

C. Hoe werkt het?

Principes van Leren Een functie wordt geleerd Dammen f( ) = 9-13 P( Q(,9-13) = kans dat zet gespeeld wordt,9-13) = verwachte beloning Spam f(e-mail) = spam of geen spam Recommender systeem f(boek) = (geordende) verzameling boeken

Dammen De Ervaring leren uit voorbeelden goede/slechte zetten uit tekstboeken of van damleraar? leren uit imitatie (Eng. behavioral cloning) imiteer de wereldkampioen leren uit beloningen het AI probleem in het klein speel het spel, beloning = gewonnen stukken/partijen

Drie Leertechnieken 1. Het leren uit beloningen 2. Het leren van associaties 3. Het leren van beslissingsbomen + toepassingen en inzichten

C. Hoe werkt het? 1. Leren uit beloningen

Donald Michie s Menace Donald Michie (2007) Menace (1961) Machine Educable Noughts And Crosses Engine

O X O O X O X aan Zet X X X Kies doosje op basis van huidige positie Voer de zet uit Menace 287 luciferdoosjes Kies at random een parel uit het doosje Slide naar Johannes Fuernkranz

Menace Machine = 287 luciferdoosjes + parels Codeert probabilistische functie P(doosje, kleur) geeft kans weer op zet Leren van functie Q (s, a) = R(s, a) + γ s P (s s, a) max a Q (s, a ) bij verlies: bewaar alle gebruikte parels bij winst: stop gebruikt parels terug en voeg extra parel van zelfde kleur toe Richard Belmann Q (s, a) =R(s, a)+γ s P (s s, a) max a Q (s,a )

Exploratie versus Exploitatie Exploratie : de ruimte van mogelijke strategieën voldoende doorzoeken Exploitatie : de geleerde kennis zoveel mogelijk gebruiken Two armed-bandit probleem

Leren uit Beloningen Toepassingen in Games

AI en Games AI is meer dan Spelletjes Die worden vooral gebruikt omdat ze makkelijk te controleren omgevingen opleveren Tal van andere toepassingen robotica, controle, internet,... Robocup

C. Hoe werkt het? 2. Leren van associaties

Spam-filter

Associaties Welke producten worden frequent samen gekocht? 4/5=80% 4/5=80% 4/5=60%

Associaties 4/5=80% 3/5=60% ALS DAN met KANS 60% 80% = 75%

Toepassingen Dit zijn lokale patronen, ze zeggen iets over sommige gegevens Marketing, o.a. supermarkt, bank,... Data mining in wetenschappelijke domeinen Analyse van (sociale) netwerken

Structuur-Activiteits-Relaties Figuur: Siegfried Nijssen Interpreteerbare kennis/patronen

C. Hoe werkt het? 3. Leren van beslissingsbomen

Classificatie en Regressieproblemen Classificatie voorspel de klasse Regressie bvb. spam of niet spam bij e-mail voorspel een numerieke waarde bvb. de temperatuur morgen Belangrijkste probleem in machinaal leren en data mining Tal van technieken; wij: beslissingbomen

Illustratie fortis dexia kbc... Bel20 nee nee nee... stijgt nee nee ja... daalt ja nee nee... stijgt nee ja ja... daalt ja ja nee... daalt nee ja nee... stijgt nee ja nee... stijgt ja nee nee... stijgt nee nee ja... daalt Kan ik voorspellen of de BEL 20 morgen stijgt of daalt? performantie = nauwkeurigheid

Een Beslissingsboom nee dexia ja kbc fortis stijgt daalt stijgt daalt

Een Illustratie Gegeven de vorm Voorspel de kleur rond hol driehoek klasse nee nee nee groen nee nee ja rood ja nee nee groen nee ja ja rood ja ja nee rood nee ja nee groen nee ja nee groen ja nee nee groen nee nee ja rood

nee? ronde?? driehoek holle ja groen rood groen rood

Beslissingsbomen Essentieel : nauwkeurigheid geleerde boom (schatten a.d.h.v. test-data -- hangt ook af van kenmerken) criterium selectie kenmerken is essentieel (entropie) interpreteerbaarheid geleerde boom Heel wat alternatieve methodes (o.a. probabilistische modellen) Toepassingen in allerlei domeinen: medisch, financieel, wetenschappelijk, marketing, engineering, controle,...

D. Toekomstverwachtingen

Verschillende Domeinen Wetenschap Robot Scientist Engineering & Control Darpa Grand Challenge Activiteitsherkenning Sociale Netwerken analyse

Wetenschap In heel wat domeinen : machinaal leren, data mining, essentieel bvb. bioinformatics & computerlinguïstiek De toekomst? The Robot Scientist (King et al. Nature 2004)

De Robot Scientist Kunstmatige intelligentie toegepast op de wetenschap zelf Kunnen machines wetenschappelijke werk verrichten?

Robot Scientist (2004) Domein van microbiologie pathway rond gist (Saccharomyces cerevisiae); Experimenten opzetten om hypothesen te testen, te verfijnen, te bevestigen Werd geautomatiseerd Vergelijking met doctoraatstudenten Nature 2004

Discussie Geen gevaar voor jobverlies in de wetenschap Het gaat om minder creatieve taken Wel? Meer tijd vrij voor creatieve kant wetenschap Nieuwe vragen en antwoorden voor wetenschapsfilosofie? Donald Gillies, AI and Scientific Method, 1996

Darpa Grand Challenge Stanley -- Stanford Team o.l.v. Sebastian Thrun

Leren door Imitatie Voor sommige taken kan men geen controle programma s schrijven met de hand De DARPA Grand Challenge sommige controle programma s geleerd o.a. classificatie terrein en snelheid bepalen. Zie YOUTUBE: Sebastian Thrun -- Google Talks -- Grand Challenge

Leren door Imitatie Snelheid Sebastian Slide Sebastian Thrun

Leren door Imitatie Sebastian Stanley Snelheid Sebastian en Stanley Slide Sebastian Thrun Bestuur de wagen een tijdje Registreer waarden sensoren & snelheid Leer een functie die sensorwaardes afbeeldt op acties

Leren Terrein Slide en video Sebastian Thrun

Activiteitsherkenning their utility as general purpose day-to-day activity recognizers. Given that producing each Electronica sensoren GPS, GSM, Smart Phone, video, PDA, RFID,... bevatten informatie over gebruik en 1 cm gebruikers Kan die gebruikt worden om de gebruiker te assisteren? However, this profusion of options has not translated into an activity inferencing system capable of recognizing large numbers of day-to-day activities in natural environments. A key underlying problem is that no existing combination of sensors and feature selector has been shown to detect robustly the features necessary to distinguish between thousands of activities. For instance, objects used during activities have long been thought to be a crucial discriminator. However, existing object recognition and tracking systems [6] tend not to work very well when applied to a large variety of objects in unstructured environments. Activity recognition systems based on tracking objects therefore tend to be customized for particular environments and objects, and restricted in customized detector is itself a research task, the goal of general-purpose recognition has not surprisingly remained unattained. A new class of small, wireless sensors to individual objects seems likely to provide a practical means of detecting objects used in many day-to-day activities [3, 4]. Given this stream of objects, recent work has shown that even simple symbolic inference techniques are sufficient for tracking the progress of these activities. Detecting Object Use with RFID-Based Sensing Intel Research Figure 3 Radio Frequency Identification tags (left). A tagged toothbrush and toothpaste (right). A passive Radio Frequency Identification (RFID [1]) tag is a postage-stamp-sized wireless, battery free transponder that, when interrogated (via radio) by an ambient reader, returns a unique identifier (see Figure 2). Each tag consists of an antenna, some protocol logic and optional non-volatile memory. Tags use the energy of the interrogating signal to return a 64 to 128-bit identifier unique to each tag, and when applicable, data stored in on-tag memory. Short-range tags, which are inductively coupled, have a 2 to 30 cm range, whereas long-range backscatter based tags have a 1 to 10 m range. Tags are available off the shelf for less than 50 cents a tag. Short range readers are priced in the Francois Bremond

Mogelijke Toepassingen Ondersteuning gebruikers Calo Project -- automatische office assistent? Smart phones -- automatisch instellen Shopping -- niets vergeten, juiste prijs? Transport -- juiste bus? Intelligent huis -- fornuis uitgezet? Surveillatie allerhande -- assistentie ouderen Ondersteuning bij job -- bvb. hulp rapportering agent of verpleegster

Netwerken I1 P1 A1 P2 P4 P3 Internet Sociaal Bibliografisch Wetenschappelijk Communicatie...

Sociale Netwerken Heel wat informatie over personen en hun relaties beschikbaar informeel: kring van kennissen, vrienden, collega s en familie. vandaag de dag: websites zoals Facebook, LinkedIn, Netlog,... het grote verschil Men beschikt over informatie over IEDEREEN in het netwerk Data kan geanalyseerd worden en gebruikt voor o.a. aanbevelingen, marketing

Analyse van Netwerken Voor bvb. aanbevelingen / marketing Facebook: nieuwe kennissen; LinkedIn: jobs; Commercieel: nieuwe producten Interessante problemen Wie een product eerst aanbevelen? Verspreiding? Koopt iemand het product? Classificatie. Welke relaties bestaan er tussen personen? Wie zijn de autoriteiten, de hubs?

Data Mining en Privacy Analyse activiteiten en sociale netwerken gevaar voor privacy, misbruiken, fouten,... combinatie informatie op verschillende sociale netwerken Het data mining onderzoekt ook privacy preserving technieken Het grote probleem is natuurlijk de beschikbaarheid van bepaalde informatie

Besluit Machines kunnen leren en hebben interessante toepassingen; veelbelovend ook in de toekomst

Referenties Youtube: Winning the Darpa Grand Challenge, Google Talks, Sebastian Thrun ook artikels in o.a. Scientific American, Robot Scientist (Aberystwyth), Ross D. King artikels in Wired, Nat. Geographic, etc. Dammen en andere spelletjes -- http://www.cs.ualberta.ca/~games/ Activiteitsleren bvb. via Wikipedia -- Activity Recognition

Basiswerken Stuart Russel en Peter Norvig. Artificial Intelligence: A Modern Approach, 2de uitgave, Prentice Hall, 2002. Tom Mitchell, Machine Learning, McGraw-Hill, 1997. Ian Witten en Eibe Frank. Data Mining. Morgan Kaufmann: Practical Machine Learning Algorithms and Tools, 2de uitgave, Morgan Kaufmann, 2005.