Data Mining: Inleiding
|
|
- Leen van Wijk
- 8 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Data Mining: Inleiding docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining 2II15: Data mining en kennissystemen Lessen: maandag 7de en 8ste uur in Auditorium 16 Docent: Toon Calders ( t.calders@tue.nl HG 7.82a ) Studeerwijzer: Boek: Tan, Steinbach, Kumar: Introduction to datamining
2 2II15: Data mining en kennissystemen Evaluatie: 20% Uitdieping: kort verslag en presentatie 40% Groepsopdracht 40% Tentamen 2II15: Data mining en kennissystemen Uitdieping: Lezen en begrijpen van een onderzoeksartikel Kort rapport (ongeveer 2 A4 tjes) Korte presentatie
3 2II15: Data mining en kennissystemen Groepsopdracht: Groepjes van 3 a 4 personen Zelfstandig analyseren van een dataset Gebruik makend van bestaande algoritmes In praktijk brengen van de theorie Uitgebreide beschrijving binnenkort in studiewijzer
4 Overzicht: Inleiding tot data mining Waarom data mining? Wat is data mining? Het volledige knowledge discovery proces. De data mining taken. Samenvatting Overzicht: Inleiding tot data mining Waarom data mining? Wat is data mining? Het volledige knowledge discovery proces. De data mining taken. Samenvatting
5 Waarom data mining? Explosieve groei aan beschikbare data: petabytes nieuwe technologie (streepjescode, RFID, ) grotere opslagcapaciteit Waarom data mining? Ook veel wetenschappelijke data Beschikbaar satellietbeelden astronomische gegevens micro-arrays
6 Waarom data mining? We are drowning in data, but starving for knowledge! Doel van data mining = automatisch analyseren Jiawei Han 4,000,000 3,500,000 3,000,000 The Data Gap 2,500,000 2,000,000 1,500,000 1,000, ,000 0 Total new disk (TB) since Number of analysts Overzicht: Inleiding tot data mining Waarom data mining? Wat is data mining? Het volledige knowledge discovery proces. De data mining taken. Samenvatting
7 Wat is data mining? Data mining (knowledge discovery from data) Extractie van interessante (niet-triviale, impliciete, vooraf ongekende en mogelijk bruikbare) patronen of kennis uit grote hoeveelheden data Alternatieve benamingen Knowledge discovery (mining) in databases (KDD), knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, business intelligence, etc. Data Dredging Torturing the data until they confess If you keep trying, eventually you will succeed.
8 Huidige toepassingen Data analyse en decision support Markt-analyse en management Risico-analyse en management Fraude detectie en de detectie van vreemde patronen (outliers) Andere toepassingen Tekst en Web mining (nieuwsgroepen, , elektronische documenten) Stream data mining Bioinformatica and bio-data analyse Vb. 1: Markt analyse & management Data: transacties van betaalkaarten, klantenkaarten, kortingbonnen, klachten, plus (publieke) lifestyle studies Target marketing Zoek groepen van klanten met gelijkaardige karakteristieken Bepaal het koopgedrag over de tijd van klanten Vind associaties tussen produkten, voorspel op basis van associatie
9 Vb. 2: Fraude detectie & vreemde patronen Autoverzekering: ring of collisions Witwassen van geld: Verdachte geldtransacties Zorgverzekering Professionele patienten, cirkels van doorverwijzingen Onnodige medische testen Vb. 2: Fraude detectie & vreemde patronen Telecommunicaties: telefoon-kaart fraude Maak model van belgedrag: bestemming van het gesprek, duur, tijdstip, weekdag. Analyseer patronen die afwijken van het standaardgedrag. Belastingsfraude Belgische FOD Financien maakt gebruik van data mining om verdachte belastingsaangiftes te identificeren.
10 Overzicht: Inleiding tot data mining Waarom data mining? Wat is data mining? Het volledige knowledge discovery proces. De data mining taken. Samenvatting Knowledge discovery (KDD) Proces Data mining het hart van het knowledge discovery proces Relevant Data voor de taak Data Mining Evaluatie Data Warehouse Selectie Opschonen Data integratie Databanken
11 Overzicht: Inleiding tot data mining Waarom data mining? Wat is data mining? Het volledige knowledge discovery proces. De data mining taken. Samenvatting De data mining taken Klassificatie [Voorspellend] Regressie [Voorspellend] Deviatie Detectie [Voorspellend] Clustering [Descriptief] Associatie regels ontdekken [Descriptief] Sequentiele patronen ontdekken [Descriptief]
12 Voorspellende methods (predictive tasks) Voorspellende methodes Gebruik een aantal variabelen om de waarde van een doel-attribuut te voorspellen. Classificatie Regressie Deviatie Detectie Descriptieve Methodes Descriptieve Methodes Vind begrijpbare patronen die de data beschrijven. Clusters Association Regels Sequentiele Patronen
13 10 10 De data mining taken Classificatie [Voorspellend] Regressie [Voorspellend] Deviatie Detectie [Voorspellend] Clustering [Descriptief] Associatie regels ontdekken [Descriptief] Sequentiele patronen ontdekken [Descriptief] Classificatie categorisch Tid Refund Marital Status categorisch Taxable Income continu Cheat klasse Refund Marital Status Taxable Income Cheat 1 Yes Single 125K No 2 No Married 100K No 3 No Single 70K No 4 Yes Married 120K No 5 No Divorced 95K Yes 6 No Married 60K No 7 Yes Divorced 220K No 8 No Single 85K Yes 9 No Married 75K No 10 No Single 90K Yes No Single 75K? Yes Married 50K? No Married 150K? Yes Divorced 90K? No Single 40K? No Married 80K? Training Set Leer Classifier Test Set Model
14 Classificatie Soorten modellen: beslissingsboom regel-gebaseerd nearest neighbor neuraal netwerk Beslissingsboom refund yes no Cheat = no married yes no Cheat = no Cheat = yes
15 Classificatie: toepassing Sky Survey Catalog Doel: Voorspel de klasse (ster of melkweg) van objecten, vooral onduidelijke, gebaseerd op telescoop beelden (Palomar observ.) beelden met een resolutie van 23,040 x 23,040 pixels Aanpak: Segmenteer de beelden. Meet eigenschappen van het beeld (features) - 40 per segment. Modeleer de klassen gebaseerd op deze features. From [Fayyad, et.al.] Advances in Knowledge Discovery and Data Mining, 1996 Classificeren van melkwegen Courtesy: Early Klasses: Fases in het ontstaan Intermediate Attributen: beeld features, lichtgolven Late Grootte van de dataset: 72 miljoen sterren, 20 miljoen melkwegen Object catalog: 9 GB Beelden Databank: 150 GB
16 Classificeren van melkwegen Succesverhaal: 16 nieuwe high red-shift quasars werden ontdekt; dit zijn objecten ver verwijderd en moeilijk zichtbaar! Met het blote oog zou de analyse jaren geduurd hebben De data mining taken Klassificatie [Voorspellend] Regressie [Voorspellend] Deviatie Detectie [Voorspellend] Clustering [Descriptief] Associatie regels ontdekken [Descriptief] Sequentiele patronen ontdekken [Descriptief]
17 Regressie Voorspel de waarde van een gegeven continue variabele gebaseerd op de waarden van andere variabelen. Veel bestudeerd in statistiek (lineaire regressie, niet-lineaire regressie) Regressie Voorbeelden: Voorspel de verkoopscijfers van een neiuw produkt gebaseerd op de hoeveelheid geld besteed aan reclamecampagnes. Voorspel windsnelheden op basis van windrichting, luchtdruk, weersomstandigheden, etc. Voorspel de koers van een aandeel op basis van voorgaande koersgegevens.
18 De data mining taken Klassificatie [Voorspellend] Regressie [Voorspellend] Deviatie Detectie [Voorspellend] Clustering [Descriptief] Associatie regels ontdekken [Descriptief] Sequentiele patronen ontdekken [Descriptief] 3. Deviatie detectie/anomalieen Ontdek significante afwijkingen van het normale gedrag Toepassingen: Fraude met kredietkaarten Network Intrusies ontdekken
19 De data mining taken Classificatie [Voorspellend] Regressie [Voorspellend] Deviatie Detectie [Voorspellend] Clustering [Descriptief] Associatie regels ontdekken [Descriptief] Sequentiele patronen ontdekken [Descriptief] Clustering Gebaseerd op Euclidische afstand in 3D. Intracluster afstanden minimaliseren Intercluster afstanden maximaliseren
20 Clustering: Toepassing 1 Clusteren van documenten: Doel: Vind groepen van documenten Clustering: Toepassing 1 Clusteren van documenten: Doel: Vind groepen van documenten gebaseerd op de woorden die voorkomen in de verschillende documenten. Aanpak: Identificeer frequente termen in de documenten. Maak een similarity measure gebaseerd op de frequenties van de verschillende termen. Gebruik: Information Retrieval kan hiervan gebruik maken om zoekresultaten per cluster weer te geven.
21 De data mining taken Klassificatie [Voorspellend] Regressie [Voorspellend] Deviatie Detectie [Voorspellend] Clustering [Descriptief] Associatie regels ontdekken [Descriptief] Sequentiele patronen ontdekken [Descriptief] Associatie regels Gegeven een verzameling records die elk een aantal items bevatten, vind regels die associaties tussen verzamelingen produkten beschrijven TID Items 1 Brood, Cola, Melk 2 Bier, Brood 3 Bier, Cola, Luier, Melk 4 Bier, Brood, Luier, Melk 5 Cola, Luier, Melk Regels: {Melk} --> -->{Cola} {Luier, Melk} Melk} --> -->{Bier}
22 Association regels: toepassingen Marketing en promoties: Stel dat volgende regel ontdekt werd: {Tortilla chips, } --> {dipsaus} Association regels: toepassingen Marketing en promoties: Stel dat volgende regel ontdekt werd: {Tortilla chips, } --> {dipsaus} dipsaus als consequent => Kan gebruikt worden om te bepalen welke produkten de verkoop van dipsaus stimuleren. Chips als antecedent => Welke produkten zullen invloed ondervinden van het verwijderen van Chips uit het assortiment? Chips als antecedent en dipsaus als consequent => Kan gebruikt worden om te zien welke produkten er samen met chips moeten verkocht worden om dipsaus te promoten
23 De data mining taken Klassificatie [Voorspellend] Regressie [Voorspellend] Deviatie Detectie [Voorspellend] Clustering [Descriptief] Associatie regels ontdekken [Descriptief] Sequentiele patronen ontdekken [Descriptief] 6. Sequentiele Patronen Gegeven een verzameling sequenties, zoek temporele afhankelijkheden tussen verschillende events. (A B) (C) (D E) In telecommunicatie (alarm logs), (Inverter_Problem Excessive_Line_Current) (Rectifier_Alarm) --> (Fire_Alarm) In sequenties van verkoopsdata, (Schoenen) (Racket, bal) --> (kleding)
24 Sequentiele Patronen: Toepassingen Veel gebruikt in bio-informatica! identificeer genen in DNA-sequenties Ontdekken van inbraken in netwerken Leer patronen te identificeren die vaak geassocieerd zijn met inbraken in het netwerk Uitbreidingen naar het spatio-temporele domein sequentie van locaties van GSMs voorspel volgende positie om hand-over efficienter te maken Monitoren van het verkeer Overzicht: Inleiding tot data mining Waarom data mining? Wat is data mining? Het volledige knowledge discovery proces. De data mining taken. Samenvatting
25 Samenvatting Data mining is nuttig: Wanneer de hoeveelheid data te groot is om manueel geanalyseerd te worden Als er vele mogelijke hypotheses zijn Data mining biedt aan: Verzameling tools om modellen en patronen te herkennen Intelligente zoek-technieken Resultaten van data mining: Samenvatting van de data Onverwachte patronen Model
Data Mining: Classificatie
Data Mining: Classificatie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht Wat is classificatie? Leren van een beslissingsboom. Problemen
Nadere informatieData Mining: Data kwaliteit, Preprocessing
Data Mining: Data kwaliteit, Preprocessing docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Herhaling: definitie Data Mining is: Extractie van interessante
Nadere informatieData mining Van boodschappenmandjes tot bio-informatica
Data mining Van boodschappenmandjes tot bio-informatica Walter Kosters Informatica, Universiteit Leiden donderdag 6 april 2006 http://www.liacs.nl/home/kosters/ 1 Wat is Data mining? Data mining probeert
Nadere informatieAI en Data mining. Van AI tot Data mining. dr. Walter Kosters, Universiteit Leiden. Gouda woensdag 17 oktober
AI en Data mining Van AI tot Data mining dr. Walter Kosters, Universiteit Leiden Gouda woensdag 17 oktober 2007 www.liacs.nl/home/kosters/ 1 Wat is Data mining? Data mining probeert interessante en (on)verwachte
Nadere informatie2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren.
1. Veronderstel dat je als datamining consultant werkt voor een Internet Search Engine bedrijf. Beschrijf hoe datamining het bedrijf kan helpen door voorbeelden te geven van specifieke toepassingen van
Nadere informatieData Mining: Classificatie
Data Mining: lassificatie docent: dr. Toon alders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Vorige les lassificatie: Het groeperen van objecten in voorgedefinieerde
Nadere informatieUitwerking Tentamen Datamining (2II15) 26/06/09
Uitwerking Tentamen Datamining (2II15) 26/06/09 1. (3p) (Clustering) Welke van de volgende uitspraken zijn correct? Voor de correcte uitspraken: leg uit, voor de incorrecte: geef een tegenvoorbeeld. (a)
Nadere informatieOplossingen Datamining 2II15 Juni 2008
Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:
Nadere informatieDatamining: Graven in gegevens
Datamining: Graven in gegevens Business Intelligence in de praktijk Jasper Lansink CMG Noord Nederland - Advanced Technology Agenda Business Intelligence Datamining theorie Datamining in de praktijk management
Nadere informatieTentamen Data Mining
Tentamen Data Mining Algemene Opmerkingen Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. Laat bij het uitvoeren van berekeningen zien hoe je aan een antwoord gekomen bent.
Nadere informatieData Mining: Clustering
Data Mining: Clustering docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Wat is clustering? Het onderverdelen van de objecten in een database in homogene
Nadere informatieBusiness Analytics bij. Zilveren Kruis. Rob Konijn Data Scientist Kenniscentrum. 12 mei 2016
Business Analytics bij Zilveren Kruis Rob Konijn Data Scientist Kenniscentrum Zilveren Kruis 12 mei 2016 Introductie Rob Konijn - Business Analytics (toen nog BWI) 2002-2008 - Phd VU (Wojtek Kowalczyk/Bert
Nadere informatieData Mining. Arno Siebes
1 X Data Mining Arno Siebes U en Databases 1 X Elke Nederlander zit in honderden databases: door uw bonuskaart weet AH precies wat U eet; elke keer dat U pint weet de bank waar U hoeveel geld uitgeeft;
Nadere informatieContinuous Learning in Computer Vision S.L. Pintea
Continuous Learning in Computer Vision S.L. Pintea Continuous Learning in Computer Vision Natura non facit saltus. Gottfried Leibniz Silvia-Laura Pintea Intelligent Sensory Information Systems University
Nadere informatieData driven. Het plan naar data driven business door advanced analytics Business.
Data driven. Het plan naar data driven business door advanced analytics Business. Analytics: uw data slim gebruiken en zo uw business optimaliseren! Marijn Uilenbroek BIA Consultant, Sogeti BI & Analytics
Nadere informatieTestNet voorjaarsevent 15 mei Testen met AI. Op weg naar een zelflerende testrobot. TestNet werkgroep Testen met AI. Sander Mol Marco Verhoeven
TestNet voorjaarsevent 15 mei 2018 Testen met AI Op weg naar een zelflerende testrobot TestNet werkgroep Testen met AI Sander Mol Marco Verhoeven De aanleiding: AI tool speelt breakout Tool ziet alleen
Nadere informatieTentamen Data Mining. Algemene Opmerkingen. Opgave L. Korte vragen (L6 punten) Tijd: 14:00-17:00. Datum: 4januai20l6
Tentamen Data Mining Datum: 4januai2l6 Tijd: 4: - 7: Algemene Opmerkingen e Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. o Laat bij het uitvoeren van berekeningen zien hoeje
Nadere informatieOLAP.
OLAP joost.vennekens@kuleuven.be Toepassingen Waarom? Trouwe klanten belonen Gegevens verzamelen Facebook model Waarom? Grote databank Produkten Produkten - winkels Produkten - produkten Klanten Klanten
Nadere informatieCover Page. The handle http://hdl.handle.net/1887/29754 holds various files of this Leiden University dissertation
Cover Page The handle http://hdl.handle.net/1887/29754 holds various files of this Leiden University dissertation Author: Cao, Lu Title: Biological model representation and analysis Issue Date: 2014-11-20
Nadere informatieLiving Labs : NFI & RvdK Samen onderweg naar meer grip op data. JenV I-tour presentatie 24 april 2018
Living Labs : NFI & RvdK Samen onderweg naar meer grip op data JenV I-tour presentatie 24 april 2018 1 Agenda Deel I - door Jannie RvdK Intermezzo filmpje I-plan JenV Deel II door Femke en Xandra NFI KInD
Nadere informatieTransformatie en Innovatie bij KPN Finance
Transformatie en Innovatie bij KPN Finance Digital Finance; Disruptie of Noodzakelijke ontwikkeling? Selectie van gepresenteerde slides Bart Meussen September 2017 Agenda 1 2 KPN 3 Digital 4 Digital De
Nadere informatieOnline marketing. De weg naar online succes. Presentatie door: Eelke Kuipers
Online marketing De weg naar online succes Presentatie door: Eelke Kuipers Inhoud Wat is online marketing? Internet strategie Marketing middelen - Zoekmachine marketing - Social media - E-mailmarketing
Nadere informatieOnline marketing. De weg naar online succes. Presentatie door: Eelke Kuipers
Online marketing De weg naar online succes Presentatie door: Eelke Kuipers Inhoud Wat is online marketing? Internet strategie Marketing middelen - Zoekmachine marketing - Social media - E-mailmarketing
Nadere informatieAnomaliedetectie en patroonherkenning
Digitale overheid van de Toekomst, 28 september 2016 Anomaliedetectie en patroonherkenning binnen de loonaangifteketen Dr. Ralph Foorthuis Voorstelrondje Werkervaring Sr. enterprise architect bij UWV Werkzaam
Nadere informatieWhitepaper. Personal Targeting Platform. De juiste content Op het juiste moment Aan de juiste persoon
Whitepaper Personal Targeting Platform De juiste content Op het juiste moment Aan de juiste persoon Introductie 2 Geïntegreerde personalisering 2 Het opbouwen van een profiel 2 Segmenteren en personaliseren
Nadere informatieClassification - Prediction
Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training
Nadere informatie10 december 2014 Data-analyse en fraudedetectie. Wendy Schierboom
10 december 2014 Data-analyse en fraudedetectie Wendy Schierboom 2 Fraude bij organisaties Er kan worden gesproken over interne en over externe fraude Interne fraude - Verduistering van geld en goederen
Nadere informatieBIG DATA. 4 vragen over Big Data
4 vragen over Big Data Dit ebook geeft in het kort antwoorden op 4 vragen omtrent Big Data. BIG DATA Wat is Big Data? Hoe zet ik een Big Data Strategie op? Wat is het verschil tussen Big Data en BI? Wat
Nadere informatieProces to model en model to execute
Proces to model en model to execute Een end-to-end (bedrijfs)proces (figuur 1) is het geheel van activiteiten die zich, op een bepaalde plaats door een bepaalde rol, in bepaalde volgorde opvolgen en waarvan
Nadere informatieDATA MINING (TI2730-C)
Technische Universiteit Delft Elektrotechniek, Wiskunde en Informatica Secties: Pattern Recognition & Bioinformatics & Multimedia Signal Processing DATA MINING (TI2730-C) Schriftelijk (her)tentomen. Dinsdag
Nadere informatieNovember December 2011. Jan Meskens / Onderzoek
Jan Meskens / Onderzoek 1 Wat is "Predictive Analytics"? Historische en/of huidige data Voorspellingen over de toekomst 2 Toepassing: fraudebestrijding Opsporen fraude met aanrijdingsformulieren [SAS]
Nadere informatieVan innovatie naar productie
Van innovatie naar productie Data lab Data Factory Innoveren Ontdekken Creativiteit Produceren Borgen Beheersbaarheid Big Data Innovatie Aanpak Data lab Data Factory Top 3 Van waardevol idee naar waarde
Nadere informatieURBAN SCIENCE. Professor Nanda Piersma Michael Hogenboom
URBAN SCIENCE Professor Nanda Piersma Michael Hogenboom Nanda Piersma Hogeschool van Amsterdam (HvA) Centrum Wiskunde & Informatica (CWI) URBAN TECHNOLOGY SOLUTIONS FOR SUSTAINABLE, LIVEABLE AND CONNECTED
Nadere informatieBig Data in de praktijk. Kjeld v.d. Schaaf
Big Data in de praktijk Kjeld v.d. Schaaf Wat is big data eigenlijk? Wat is Big Data eigenlijk? De vier V s Volume Velocity Variety Veracity Complexiteit samenhang meetwijze Compleetheid domeinkennis Big
Nadere informatieHet classificeren van hoortoestel modaliteiten m.b.v. een Big Data benadering: Latent Class Trees analyse
Het classificeren van hoortoestel modaliteiten m.b.v. een Big Data benadering: Latent Class Trees analyse Simon Lansbergen & Wouter Dreschler Motivatie // Introductie 1. Veel verschillende hoortoestellen,
Nadere informatieWorkshop Wearables en Datamining: de grenzen en mogelijkheden voor personalisatie van de zorg
Workshop Wearables en Datamining: de grenzen en mogelijkheden voor personalisatie van de zorg dr. ir. Egge van der Poel dr. Liseth Tjin-Kam-Jet - Siemons Aniek Lentferink, MSc 27 mei 2016 Workshop Wearables
Nadere informatiePosthogeschoolvorming rond Enterprise Content Management Business Process Management Service Oriented Architectures
Informatiebeheer: een nieuw tijdperk Posthogeschoolvorming rond Enterprise Content Management Business Process Management Service Oriented Architectures Programma voorjaar 2010 Zoals eerder vermeld, bestaat
Nadere informatiewaarin de op dit moment relevante bron data als ook de analyse technieken worden geintegreerd.
129 Samenvatting Bioinformatica is een interdisciplinair onderzoeksveld waarbij methoden uit de computer wetenschappen, wiskunde en statistiek worden gebruikt met het specifieke doel betekenis te geven
Nadere informatieDe kracht van data. Onderwerpen. Even voorstellen Data verzamelen Data bewerken Data gebruiken Een casus: IFFR Aan de slag.. Vragen en antwoorden
De kracht van data Onderwerpen Even voorstellen Data verzamelen Data bewerken Data gebruiken Een casus: IFFR Aan de slag.. Vragen en antwoorden 2 1 Waarom verzamel je data? Weten, evalueren, controleren
Nadere informatieData gedreven innoveren, hoe doe je dat?
Data gedreven innoveren, hoe doe je dat? 1990 Database Marketing 2000 Customer Intelligence 2010 BI & Data Warehouses Today: Big Data Analytics About me Data Science Advanced Business Intelligence Big
Nadere informatieSecurity Intelligence for TLD Operators. Moritz Müller SIDN Relatiedag, 1 december 2016, Utrecht
Security Intelligence for TLD Operators Moritz Müller SIDN Relatiedag, 1 december 2016, Utrecht Assets van een TLD Operator Domeinnamen Registrant informatie Registrar informatie Registratiesysteem (DRS)
Nadere informatieMaster Software Engineering. Inhoud, begeleiding, tentamen dr. Anda Counotte Docent en mentor
Master Software Engineering Inhoud, begeleiding, tentamen dr. Anda Counotte Docent en mentor Thema Software Architectuur Design Patterns (DP) ir. Sylvia Stuurman, dr.ir. Harrie Passier en dr. Bastiaan
Nadere informatieStijn Hoppenbrouwers en Tom Heskes. Onderzoeksmethoden (vervolg)
Stijn Hoppenbrouwers en Tom Heskes Onderzoeksmethoden 1 Operationaliseren Dataverzameling Data analyse Onderzoeksplan schrijven Onderzoeksmethoden 2 Specifieke onderzoeksmethoden die ingezet (kunnen) worden
Nadere informatieSmart Maintenance. Het realiseren van een intelligente Maintenance inrichting door het slim gebruik van Data analytics
Smart Maintenance Het realiseren van een intelligente Maintenance inrichting door het slim gebruik van Data analytics 05-10-2016 Maintenance meets service logistiek 05-10-2016 Kasper Groenbroek Siebrand
Nadere informatieOpinion Mining. Johan Stortelder s Onderzoeksplan masterscriptie. Mei 2006
Onderzoeksplan masterscriptie Mei 2006 Johan Stortelder s0355593 johanstortelder@student.ru.nl Probleemstelling Inleiding is een methode waarmee automatisch meningen (opinies) uit teksten kunnen worden
Nadere informatiePosthogeschoolvorming rond Enterprise Content Management Business Process Management Service Oriented Architectures
Informatiebeheer: een nieuw tijdperk Posthogeschoolvorming rond Enterprise Content Management Business Process Management Service Oriented Architectures Programma najaar 2008 Zoals eerder vermeld, bestaat
Nadere informatieKoptekst 08/06/2016. Overheid moet gevaren big-data analyses beperken.
Big Data Dr. Franc Grootjen Artificial Intelligence, Radboud Universiteit f.grootjen@ai.ru.nl Uit het nieuws (NOS, 28 april) Overheid moet gevaren big-data analyses beperken. Het analyseren van grote hoeveelheden
Nadere informatieZELF DENKENDE WEBSHOP
ZELF DENKENDE WEBSHOP ARTIFICIAL INTELLIGENCE PANGAEA Digital Agency - Regulusweg 5 Den Haag - 088-6 123456 - hello@png.nl - www.webshop.ai OPBOUW PRESENTATIE WAT IS AI EN WAT GEBEURT ER IN DE WERELD VAN
Nadere informatieInhoud. Neuronen. Synapsen. McCulloch-Pitts neuron. Sigmoids. De bouwstenen van het zenuwstelsel: neuronen en synapsen
Tom Heskes IRIS, NIII Inhoud De bouwstenen van het zenuwstelsel: neuronen en synapsen Complex gedrag uit eenvoudige elementen McCulloch-Pitts neuronen Hopfield netwerken Computational neuroscience Lerende
Nadere informatieMACHINE LEARNING. Een egocentrische presentatie door een data scientist van Axians. Michel van Gelder Data Scientist bij Axians
MACHINE LEARNING Een egocentrische presentatie door een data scientist van Axians Michel van Gelder Data Scientist bij Axians 1 MICHEL VAN GELDER Data Scientist Axians 2 A day in the life of.. 3 MACHINE
Nadere informatieAdVISHE: Assessment of the Validation Status of Health- Economic Decision Models
AdVISHE: Assessment of the Validation Status of Health- Economic Decision Models Pepijn Vemer, George van Voorn, Isaac Corro Ramos, Maiwenn Al, Talitha Feenstra Rationale In theorie: Doe alles! Een model
Nadere informatieMISSING DATA van gatenkaas naar valide uitkomsten
MISSING DATA van gatenkaas naar valide uitkomsten Sander M.J. van Kuijk Afdeling Klinische Epidemiologie en Medical Technology Assessment sander.van.kuijk@mumc.nl Inhoud Masterclass Theorie over missing
Nadere informatieEducational dataforensics
Educational dataforensics NVE congres 23 november 2017 Kees Boonman, Sebastiaan de Klerk, Sanette van Noord, Arnold Brouwer Wie zijn wij. Sebastiaan de Klerk (ex:plain) Sanette van Noord (Universiteit
Nadere informatieRadboudumc online: Hoe stel je de patiënt centraal in een omnichannel oplossing? Mobile Healthcare Event 24 november 2017 Yno Papen
Radboudumc online: Hoe stel je de patiënt centraal in een omnichannel oplossing? Mobile Healthcare Event 24 november 2017 Yno Papen Inleiding Het Radboudumc is een vooruitstrevend en innovatief universitair
Nadere informatieBig Data bij de Rabobank
Big Data bij de Rabobank Platform Klantgericht Ondernemen, 19 sept 2012 Marcel Kuil en Hilde van Hulten Onderwerpen Big Data bij Rabobank; Wat en waarom? Roadmap Aanleiding Doelstelling Aanpak Inrichting
Nadere informatieInformatiebeheer: een nieuw tijdperk
Informatiebeheer: een nieuw tijdperk Posthogeschoolvorming rond Enterprise Content Management Business Process Management Service Oriented Architectures Programma voorjaar 2011 Zoals vermeld in de algemene
Nadere informatieSelf Service BI. de business
BI in de praktijk Self Service BI Breng de kracht van BI naar de business Luc Alix Sogeti Nederland B.V. Redenen voor Business Intelligence Sneller kunnen beslissen 42 % Beter kunnen beslissen 42 % Concurrentieel
Nadere informatieBegrippenlijst Inzicht in de wereld van big data, marketing en analyse
Begrippenlijst Inzicht in de wereld van big data, marketing en analyse 4orange, 13 oktober 2015 Hogehilweg 24 1101 CD Amsterdam Zuidoost www.4orange.nl 2 Inhoud Achtergrond & Aanleiding... 3 A... 3 B...
Nadere informatieOntwerp van Informatiesystemen
1ste bach HIB Ontwerp van Informatiesystemen Prof. Verelst Q www.quickprinter.be uickprinter Koningstraat 13 2000 Antwerpen 112 2,50 Online samenvattingen kopen via www.quickprintershop.be Table of Contents
Nadere informatieFrom business transactions to process insights. BPM Round Table, TU/e 26 mei 2014
From business transactions to process insights BPM Round Table, TU/e 26 mei 2014 Agenda 1 2 3 4 Korte introductie Process mining in de audit Enkele voorbeelden Uitdagingen & de toekomst 1 Korte introductie
Nadere informatiePosthogeschoolvorming rond Enterprise Content Management Business Process Management Service Oriented Architectures
Informatiebeheer: een nieuw tijdperk Posthogeschoolvorming rond Enterprise Content Management Business Process Management Service Oriented Architectures Programma voorjaar 2008 Zoals eerder vermeld, bestaat
Nadere informatieVoorbereiden van de Data. Ngi 12-11-2014. Ronny Mans
Voorbereiden van de Data Ngi 12-11-2014 Ronny Mans Van heterogene bronnen naar process mining resultaten Extract, Transform, and Load (ETL) optioneel bron ETL bron ETL ETL warehouse bron grofkorrelige
Nadere informatieParking Surveillance. foreground/background segmentation - objectherkenning. Examen Beeldverwerking Pieter Vancoillie
Parking Surveillance foreground/background segmentation - objectherkenning Examen Beeldverwerking Pieter Vancoillie Doel van het (deel)project Uit beelden van een camera voetgangers, fietsers en auto s
Nadere informatieMEER AMBACHT DAN FABRIEK Data-Analyse en Process Mining Support www.coney.nl
MEER AMBACHT DAN FABRIEK Data-Analyse en Process Mining Support www.coney.nl DE TOOLS DIE WIJ GEBRUIKEN DATA- ANALYSE TOOLS DATA- ANALYSE SUPPORT PROCESS MINING TOOLS PROCESS MINING SUPPORT DATA- ANALYSE
Nadere informatieInformatiebeheer: een nieuw tijdperk
Informatiebeheer: een nieuw tijdperk Posthogeschoolvorming rond Enterprise Content Management Business Process Management Service Oriented Architectures Programma voorjaar 2011 De module bestaat uit 10
Nadere informatieBegrippenlijst Inzicht in de wereld van big data, marketing en analyse
Begrippenlijst Inzicht in de wereld van big data, marketing en analyse 4orange, 2017 Hogehilweg 24 1101 CD Amsterdam Zuidoost www.4orange.nl 2 Inhoud Achtergrond & Aanleiding... 3 A... 3 B... 3 C... 3
Nadere informatiesmartops people analytics
smartops people analytics Introductie De organisatie zoals we die kennen is aan het veranderen. Technologische ontwikkelingen en nieuwe mogelijkheden zorgen dat onze manier van werken verandert. Waar veel
Nadere informatieCreatie, toepassing en evaluatie: door marketeers en klantcontactmedewerkers. We focussen hier op Vraag, Analyse en Data terugkoppelen.
Marketing Intelligence voor beginners Workshop door Sara Oomen (EMC Cultuuronderzoeken) en Jildiz Heddes (zelfstandig data-analist) Congres Podiumkunsten 2014 WAT Marketing Intelligence is het stelselmatig
Nadere informatieHet ALICE Project: Beeldbellen voor ouderen
Het ALICE Project: Beeldbellen voor ouderen Paul Dijkgraaf (ThuisConnect) Eindhoven, 23 Juni 2011 Advanced Lifestyle Improvement system & new Communication Experience Het ALICE Project 5 Partners uit 3
Nadere informatieMobiele marketing. Hoe mobiele apparaten de rol van marketing veranderen. E. de Haan M.Sc. Rapport RUGCIC-2015-03 ISBN 978-90-367-8258-6
Mobiele marketing Hoe mobiele apparaten de rol van marketing veranderen E. de Haan M.Sc. Rapport RUGCIC-2015-03 ISBN 978-90-367-8258-6 CIC 2 Inhoudsopgave Samenvatting pag. 6 Mobiele ontwikkelingen pag.
Nadere informatieSamenvatting (in Dutch)
Samenvatting (in Dutch) Geordende latente klassen modellen voor nonparametrische itemresponstheorie Een geordend latente klassen model kan als een nonparametrisch itemresponstheorie model beschouwd worden.
Nadere informatieHet gebruik van data binnen Tax PwC Eric Dankaart November 2016
www.pwc.nl Eric Dankaart November 2016 Agenda Digitalisering en de data explosie Waarom is data voor Tax interessant? 1. Meer data, meer data-analyse 2. Invloed op wet- en regelgeving 3. Wat betekent dit
Nadere informatieHoe weet ik op voorhand wie mij als eerste (en laatste!) betaalt?
Hoe weet ik op voorhand wie mij als eerste (en laatste!) betaalt? Rob Berting Strategic Development Director Turning Small Pieces of Data in Big Decisions Small Small Data, Big Decisions 20/10/2016 Rob
Nadere informatieTlnt S.F.F. (Bas) van Odenhoven BSc. Jr. Engineer F-16 Avionica
Tlnt S.F.F. (Bas) van Odenhoven BSc. Jr. Engineer F-16 Avionica Hedendaagse Command & Control (C2) systemen dragen zorg voor het ontvangen, verwerken en weergeven van sensordata. Op basis van de projectie
Nadere informatieOpleiding Data Science
Opleiding Data Science IT Academy Noord-Nederland zet zich in voor een krachtige ICT-arbeidsmarkt in het Noorden. Samen groeien. Data Scientist Beroep van de toekomst Op 4 maart 2019 start de vijfde editie
Nadere informatieCover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation.
Cover Page The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Author: Witsenburg, Tijn Title: Hybrid similarities : a method to insert relational information
Nadere informatieBijlage 1: het wetenschappelijk denk- en handelingsproces in het basisonderwijs 1
Bijlage 1: het wetenschappelijk denk- en handelingsproces in het basisonderwijs 1 Bijlage 1: Het wetenschappelijk denk- en handelingsproces in het basisonderwijs: Stadium van het instructie model Oriëntatiefase
Nadere informatieSafety analytics, een nieuwe toekomst voor preventie? 15 maart 2011 Limburghal Genk
BEHAVIORAL SAFETY Safety analytics, een nieuwe toekomst voor preventie? door Luk Smeyers, managing director & partner inostix, Human Capital Intelligence 15 maart 2011 Limburghal Genk PreBes vzw Diestersteenweg
Nadere informatieComputer Vision: Hoe Leer ik een Computer Zien?
Computer Vision: Hoe Leer ik een Computer Zien? Michael H.F. Wilkinson Instituut voot Wiskunde en Informatica Rijksuniversiteit Groningen 27 April 2006 Overzicht 1 of 19 Wat is Computer Vision? Wat zijn
Nadere informatieCreative Marketing College 1, Zomer 2010 Jaar 2 CUSTOMER INSIGHTS. Saskia Best
Creative Marketing College 1, Zomer 2010 Jaar 2 CUSTOMER INSIGHTS Saskia Best Veranderende wereld Dat weten jullie nu ook wel Het draait om Connectie, Dialoog... http://www.youtube.com/watch?v=wmlkckr45g0&feature=player_embedded
Nadere informatieVan big data naar smart data. Stappenplan voor B2B leadgeneratie.
Van big data naar smart data. Stappenplan voor B2B leadgeneratie. Van big data naar smart data Door big data te verzamelen en om te zetten in werkelijk bruikbare smart data creëert u nieuwe inzichten,
Nadere informatieInleiding Wat zijn paradata en welke data voor welk gebruik. verzamelen?
Inleiding Wat zijn paradata en welke data voor welk gebruik Ann Carton verzamelen? Discussiemiddag paradata, Nederlandstalig Platform voor Survey-Onderzoek Brussel, 11 maart 2010 Wat zijn paradata? Data»Gegevens
Nadere informatieBestrijd illegale houtkap en red het regenwoud met HANA
Bestrijd illegale houtkap en red het regenwoud met HANA Expertum NL, RFCx, SAP Dirk Kemper en Eline Bangert 14 Mei 2019 Oktober 2017 - SAP Run Live Truck Doel: App voor de rangers - Prototype binnen 5
Nadere informatieDATAMODELLERING BEGRIPPENBOOM
DATAMODELLERING BEGRIPPENBOOM Inleiding In dit whitepaper wordt de datamodelleervorm begrippenboom inclusief de begrippenlijst beschreven. Deze modelleervorm staat in verhouding tot een aantal andere modelleervormen.
Nadere informatieInforValue. Laat de waarde van Informatie uw bedrijfsdoelstellingen versterken. Informatie Management
Laat de waarde van Informatie uw bedrijfsdoelstellingen versterken Informatie Informatie on Demand Referentie Architectuur Informatie Technologie is belangrijk voor Informatie. Uw organisatie heeft stabiele
Nadere informatieChapter 7 Samenvatting
Chapter 7 Samenvatting Het zit in de menselijke natuur om patronen te ontdekken in data. Mensen en dieren leren van de omgeving en bouwen zo kennis en intelligentie op. Methoden om theorie uit data af
Nadere informatieA Data Driven Journey Pieter de Kok RA AANJAGER CONEY. 31 oktober 2018
A Data Driven Journey Pieter de Kok RA AANJAGER CONEY 31 oktober 2018 MIJN DATA REIS 1994 HBO ACCOUNTANCY SCRIPTIE EDI AND CHANGING ROLE OF AUDITOR MIJN DATA REIS 1995 MIJN DATA REIS 1999 RA STUDIE AFSTUDEER
Nadere informatieHOE STIMULEER JE HET GEBRUIK VAN INTRANET?
AANTAL SLIDES 39 HOE STIMULEER JE HET GEBRUIK VAN INTRANET? 36 TIPS & TRICKS 02 39 VEEL ORGANISATIES ZETTEN HET INTRANET IN OM DE INTERNE COMMUNICATIE IN GOEDE BANEN TE LEIDEN. DE VOORDELEN ZIJN EVIDENT.
Nadere informatieBreng uw socialmedia-prestaties naar een hoger niveau met krachtige socialmedia-analyses
LexisNexis Social Analytics MOGELIJK GEMAAKT POWERED DOOR BY Breng uw socialmedia-prestaties naar een hoger niveau met krachtige socialmedia-analyses Met deze tool kunnen bedrijven en PR- en marketingbureaus
Nadere informatieBusiness Process Management
Business Process Management Prof. dr. Manu De Backer Universiteit Antwerpen Katholieke Universiteit Leuven Hogeschool Gent Wat is een bedrijfsproces? Een verzameling van (logisch) gerelateerde taken die
Nadere informatieTime series analysis. De business controller wilt graag de prognoses weten voor de volgende vier key metrics :
Time series analysis In deze casus laten wij u zien wat er mogelijk is met behulp van predictive analytics op het gebied van tijdreeksanalyse. Tijdreeksanalyse is een nuttig hulpmiddel bij het analyseren
Nadere informatieIn 5 stappen naar het perfecte dashboard. 21 november 2017
In 5 stappen naar het perfecte dashboard 21 november 2017 De magisch 2 e stap Hoi! Gwyneth Ouwehand SSA lead consultant Usability expert Cor Bonda SSA consultant Data scientist Herken je dit? Informatieproducten
Nadere informatieHoofdvraag. Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ?
Hoofdvraag Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ? Data visualisatie (Grafieken, dashboards); Kwantitatieve analyse (cijfers, statistiek); Software Inzichten
Nadere informatieNEDERLANDSE SAMENVATTING
NEDERLANDSE SAMENVATTING Analyse van chromosomale afwijkingen in gastrointestinale tumoren In het ontstaan van kanker spelen vele moleculaire processen een rol. Deze processen worden in gang gezet door
Nadere informatieHoe kijken we naar het DNA van een patiënt?
Hoe kijken we naar het DNA van een patiënt? Ies Nijman UMC Utrecht Dept of Genetics, Centre for Molecular Medicine Center for Personalized Cancer Treatment (CPCT), Hartwig Medical Foundation 1994 DNA sequenties,
Nadere informatieData fusion & Geo-psychographical database
Data fusion & Geo-psychographical database Pascal van Hattum University Utrecht Differentiated marketing Target customers as individually as possible Sell the same product or service, but change the marketing
Nadere informatieAanpak van criminele markten en geld
Dag van de ondermijning Aanpak van criminele markten en geld 16 april 2019 dr. Bernd Veldman RA Programma presentatie Datamining (kansen en valkuilen) Samenwerking met ketenpartners (wat kan wel en niet
Nadere informatieLittle RFI D. Wim de Rooij. Nedap N.V.
RFI D Little Wim de Rooij Nedap N.V. 2 Intro Toekomst Wat en Hoe Schoenen en Kleding case RFI D Smaken Privacy EPC Wanneer - Wat 3 Intro RFI D 4 Kennis van Technologie Kennis en begrip van de business
Nadere informatietwee partijen zijn. Aangezien het bij data mining gaat om grote hoeveelheden data is het belangrijk om praktische oplossingen te hebben.
Samenvatting Deze thesis handelt over privacy preserving data mining. Data mining is een tak van de wetenschap waarin men grote hoeveelheden data onderzoekt met de bedoeling er bepaalde patronen in te
Nadere informatieSamenvatting. J. Nachtegaal, S.E. Kramer, J.M. Festen (Amsterdam)
Samenvatting Associatie tussen gehoorverlies en psychosociale gezondheid bij 18 tot 70 jarigen: eerste resultaten van de Nationale Longitudinale Studie naar Horen (NL-SH). J. Nachtegaal, S.E. Kramer, J.M.
Nadere informatie