Big Data Dr. Franc Grootjen Artificial Intelligence, Radboud Universiteit f.grootjen@ai.ru.nl Uit het nieuws (NOS, 28 april) Overheid moet gevaren big-data analyses beperken. Het analyseren van grote hoeveelheden gegevens van burgers kan voordelen bieden, maar brengt ook gevaren met zich mee. Er kan fraude mee worden opgespoord en misdrijven worden opgelost, maar als de overheid niet oppast, is de vrijheid van burgers in het geding, stelt de Wetenschappelijke Raad voor het Regeringsbeleid. Combineren van gegevens bedreigt de privacy Voe0ekst 1
Big Data Heeft een nieuwe vorm van verwerking nodig (Gartner) Groot volume, grote snelheid, grote variatie aan gegevens Uitdagingen: Analyse Verkrijgen Conserveren, opslaan Zoeken, bevragen Delen Transporteren Visualiseren Privacy Big Data vs DataScience Nuance verschil Om marketing redenen vaak door elkaar gebruikt Big Data: verzamelen, beheren, transporteren DataScience: analyseren, modelleren, extractie Beleidstechnisch krijgt verzamelen vaak de voorkeur op analyseren, modelleren. Waarom? Dat kunnen we goed Bang voor vernieuwing Niet de boot willen missen Voe0ekst 2
Big Data en AI Waarom nieuwe verwerkingsmethoden? Gigantische hoeveelheid data Real-time oplossingen Chaotisch Ongestructureerd Niet lineair Waarom dan Artificial Intelligence? Mensen zijn in staat op grote hoeveelheden data real-time te verwerken. Hierbij is de data vaak chaotisch ongestructureerd en niet lineair Big Data en AI Kunnen we van menselijke cognitie leren? Focus van AI in Nijmegen Patroon herkening Neurale networken Deep Belief Networks Voe0ekst 3
Linda 31 jaar Single Erg extrovert Erg slim Heeft filosofie gestudeerd Begaan met sociale rechtvaardigheid Tegen Discriminatie Tijdens studie deelgenomen aan anti kernwapen demonstraties Kunt u zich een beeld vormen over Linda? Stellingen over Linda A. Verzekeringsagent B. Boekwinkelmedewerker en actief yogabeoefenaar C. Actief feministe D. Bankbediende E. Sociaalpsychiatrisch werker F. Bankbediende en actief feministe Wat past het beste bij Linda? Maak een volgorde op waarschijnlijkheid! Voe0ekst 4
Vraag Wie heeft optie F (Bankbediende en actief feministe) hoger op het lijstje staan dan optie D (Bankbediende)? Wie heeft actief feministe (C) hoog staan? Had ik daar iets over gezegd? Rationele denkfout en stereotype afleiding Stereotypen en vooroordelen Stereotype: link tussen groepslidmaadschap en kennis Bijvoorbeeld: hardrocker en lang haar (stereotype kennis) Vooroordeel (gerelateerd) link tussen een groep en een bepaald positef/negatief gevoel Bijvoorbeeld: skinhead en angst Interessant voor beroepen die een eerlijk oordeel moeten vormen over mensen: Politie Rechter Negatief gedrag van een lid van een groep kan gegeneraliseerd worden naar de groep als geheel Voe0ekst 5
Stereotypen en vooroordelen Is het erg om (als mens) ze te hebben? Nee! We hebben wel hersens gekregen om er verstandig mee om te gaan! Willen we deze menselijke eigenschappen omzetten naar kunstmatig intelligente systemen? En kunnen we er dan nog verstandig mee omgaan? Voorbeeld Criminele loopbaan Intensive care UVW uitkeringsfraude Voe0ekst 6
Problemen Onderzoek toont aan dat mensen die ijs eten een significant grotere kans hebben om diezelfde dag te verdrinken. Problemen Veel Big Data oplossingen geven een resultaat, maar zijn in principe een Black Box. We weten niet waarom het systeem het resultaat geeft Maakt dat uit? Voe0ekst 7
Big Data de hype Veel bedrijven/organisaties zien het nut van Big Data Als er niets uit komt: need more data Omgaan met Big Data is niet triviaal Niet het uitproberen van een dumpload aan Machine Learning techniques Kaggle Domein expertise Feature selectie/preparatie Overtraining Test/training set besmetting Big Data Mijn conclusies: Veelbelovend Veel uitdagingen Met beleid gebruiken Bij essentiële zaken, verklarende systemen gebruikten en verantwoordelijkheid niet bij de machine leggen Voe0ekst 8