Datamining: Graven in gegevens



Vergelijkbare documenten
Betekent SOA het einde van BI?

Real Time Monitoring & Adaptive Cyber Intelligence SBIR13C038

Onderzoeksdata in het UMCU. Michiel Vuurboom Aafke Jongsma Robert Veen

Data Governance van visie naar implementatie

Toekomstbestending maken van selectie tool Rekening houdend met strikte privacy wetgeving

Begrippenlijst Inzicht in de wereld van big data, marketing en analyse

Living Labs : NFI & RvdK Samen onderweg naar meer grip op data. JenV I-tour presentatie 24 april 2018

Incore Solutions Learning By Doing

Haaglanden Medisch Centrum

Business Intelligence. Toepassing BI Database en Datawarehouse BI proces BI Organisatie Implementatie BI

Meten is weten: Inzicht krijgen in de opbrengsten van jouw inspanningen in de buurt

Historische informatie in een Spatial Dynamisch Data Warehouse. Wil de Jong Enterprise Architect

Begrippenlijst Inzicht in de wereld van big data, marketing en analyse

Nationale Controllersdag juni Financial Control Framework Van data naar rapportage

Data at your fingertips

DEEL I KENNISMANAGEMENT: INLEIDING EN TOEPASSINGSGEBIEDEN

Data driven. Het plan naar data driven business door advanced analytics Business.

Magnutude 2012 Efficient BI. 18 september Joost de Ruyter van Steveninck

Presentatie Rapportage Met SAP Business Objects

Workshop voorbereiden Authentieke instructiemodel

Testen en BASEL II. Dennis Janssen. Agenda. Wat is BASEL II? Testen van BASEL II op hoofdlijnen

Conclusie: voor elke organisatie die dit nastreeft is het goed besturen en beheersen van de bedrijfsprocessen

occurro Vertrouwt u uw gegevens? BI wordt volwassen Kasper de Graaf 31 maart 2009 De kracht van BI en Architectuur in de praktijk - Centraal Boekhuis

2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren.

Curriculum Vitae Ishak Atak. Naam : Ishak Atak Roepnaam : Ishak. Woonplaats : Utrecht Geboorte datum :

Self Service BI. de business

De Marketeer is niet meer; leve de Geomarketeer! Over de integratie van lokatie in marketing

ONDERZOEK DOEN. HENK LINDEMAN Naam Datum

Maximale inwonerstevredenheid. Overheid 360º. Daniël Prins (VeloA) Maarten van der Hoek (Exxellence)

Medical Intelligence in de praktijk

Sneller en nauwkeuriger begroten in de zorg met LucaNet

E-resultaat aanpak. Meer aanvragen en verkopen door uw online klant centraal te stellen

Big Data en DUO. We swim in a sea of data and the sea level is rising rapidly. G. Brink Programmamanager Ir. J.W. van Veen Enterprise Architect

SURF SIS-conferentie

OP KOERS NAAR EEN DATAGEDREVEN ORGANISATIE?

Jan W. Veldsink Msc

HET SUCCES VAN QLIKVIEW. Breda, 31 augustus 2011 Leon de Ridder, UNIT4

Laag Vaardigheden Leerdoelen Formulering van vragen /opdrachten

De kracht van BI & Architectuur

Business & IT Alignment deel 1

Data mining Van boodschappenmandjes tot bio-informatica

Afstudeeropdracht bachelor informatica

Enterprise warehouse architectuur Het definiëren van een informatiearchitectuur in de praktijk.

STUDIEDAG. Projectmatig werken in lokale overheden LEUVEN 27 oktober 2011

Opgaven - De intelligente organisatie 3 e editie

Value Based Health Care Zorg voor Verbetering

Examenprogramma Associatie Praktijkdiploma Vakopleiding Payroll Services IV Geldig m.i.v. 1 januari 2011

Business Intelligence White Paper

Agile in Projecten minimalisme of strak pak? Richard Weber PMP

De Taxonomie van Bloom Toelichting

sturen om tot te komen Rijnconsult Business Review

STAKEHOLDERS. Hoe gaan we daar mee om? Jacques van Unnik Manager Personnel Certification & Training 3 december 2015 BUSINESS ASSURANCE

case Het enterprise warehouse van Centraal Boekhuis architectuur Bedrijfsdoelen vertalen in de datastructuur

Open data in de Drechtsteden

Data-analyse en boekhoudsoftware voor de MKB-accountant in een breder perspectief

Big Data en het CBS. Enkele voorbeelden. Piet Daas, May Offermans, Martijn Tennekes, Alex Priem, Paul van den Hurk

Microsoft s platform voor projectorganisaties. EPM 2007 en straks Wil Jansen Gwen Schilte

SAP Risk-Control Model. Inzicht in financiële risico s vanuit uw SAP processen

Cloud Computing, een inleiding. ICT Accountancy & Financials congres 2013: Cloud computing en efactureren. Jan Pasmooij RA RE RO: jan@pasmooijce.

Data Quality Een vereiste voor elke datagedreven organisatie

Hoe de strijd tussen Marketing en Verkoop oplossen?

Inkopen van ICT. Inkopen Complexe Techniek? 31 maart Karin van IJsselmuide. Kennismanager/trainer Nevi Inkoopacademie

Technische keuzes Management Informatie Systeem MeanderGroep

Klantgericht communiceren met donateurs

AMC Seminar 2011 Faciliteren van AM besluitvorming. Robert van Grunsven, Consultant

Metadata mogelijkheden, ambities en praktijk

Kennisalliantie Inclusie & Technologie. Leendert Bos Harry de Boer

De essentie van de nieuwe ISO s. Dick Hortensius, NEN Milieu & Maatschappij

Plan van aanpak, 17 september 2014

Peter de Haas

Het gebruik van data binnen Tax PwC Eric Dankaart November 2016

Business Intelligence in Lier

Case Closed. Foto: Roy Beusker

Big Data en de officiële statistiek Enkele voorbeelden

Social Media Strategie Plan

Samenwerking Medical Intelligence. UMC Utrecht Hyleco Nauta, Directeur Directie Informatie & Technologie

Break out. Klantbeleving geoptimaliseerd met Process Mining

SAP Customer Success Story Farmaceutica Retail & distributie Multipharma. Meer daadkracht dankzij gestroomlijnde BI-oplossingen

Het Nieuwe Werken betekent creatief reizen (Case UWV)

Market Scan introduceert M.T.V.: één Portal voor al uw Management Tools Volmachten!

Anomaliedetectie en patroonherkenning

BIM: impact op duurzame gebouwen

RAIview maakt objectieve beoordeling in de zorg mogelijk

Kennis Management. Tele Train. Grensverleggend klantcontact

Kerngegevens MBO. gemeenschappelijke taal van ELO naar studenten administratie. Gebruikersdag Woensdag 26 mei 2010.

Snel en eenvoudig besparen bij BPV. Ad Geluk; Colo Frans Bergmans; ROC Eindhoven Xaverius van Hien; ROC Eindhoven

Profiel Manfred Dousma

Transcriptie:

Datamining: Graven in gegevens Business Intelligence in de praktijk Jasper Lansink CMG Noord Nederland - Advanced Technology

Agenda Business Intelligence Datamining theorie Datamining in de praktijk

management rapportage fraude-detectie HOLAP datamining decision support multidimensionale databases MOLAP datamarts operational datastore MIS ROLAP balanced scorecards KDD datawarehouse kennismanagement transformatie metadata OLAP EIS MDBMS 1-to-1 marketing

Wat is Business Intelligence? MOLAP KDD datamining Analyse ROLAP HOLAP OLAP transformatie datawarehouse Gegevens datamarts operational verzamelen datastores MDBMS fraude-detectie 1-to-1 marketing een voortdurend kennismanagement zoekproces Beheer naar kennis en planmatig uitgevoerd en inzicht over metadata het bedrijf Bedrijfsvoering management rapp. balanced scorecards decision EIS support MIS

Waarom Business Intelligence? Steeds meer gegevens, steeds minder informatie Uitbuiten verborgen informatie en kennis Juiste informatie, juiste plek, juiste tijd Snellere besluitvorming 24-uurs economie Time-to-market Concurrentiedruk Optimalisering bedrijfsvoering When I receive the financial reports, I am either happy or upset, but hardly am I smarter

Perspectieven Kennis Informatie Data

Incrementele aanpak Pilot Evaluatie Definitie Analyse Eerste Increment Ontwerp Invoering Test Bouw Tweede Increment

Agenda Business Intelligence Datamining theorie Wat is datamining? De technieken Randvoorwaarden Toepassingen Datamining in de praktijk

Datamining: definitie Datamining is de non-triviale extractie van impliciete, voorheen onbekende en nuttige kennis uit data

Datamining: definitie Datamining is de non-triviale extractie van impliciete, voorheen onbekende en nuttige kennis uit data

Datamining: definitie Datamining is de non-triviale extractie van impliciete, voorheen onbekende en nuttige kennis uit data

Datamining: definitie Datamining is de non-triviale extractie van impliciete, voorheen onbekende en nuttige kennis uit data

Datamining: definitie Datamining is de non-triviale extractie van impliciete, voorheen onbekende en nuttige kennis uit data

Datamining: definitie Datamining is de non-triviale extractie van impliciete, voorheen onbekende en nuttige kennis uit data

Technieken Methode Visualisatie Statistiek Beslissingsbomen Neurale netwerken Genetische algoritmen

Methode B.v. SEMMA van SAS Institute Sample Explore Modify Model Assess dataset bepalen, steekproef gegevens verkennen gegevens aanpassen analyseren en modelleren evalueren resultaten

Beslissingsbomen 1000 groep F G 48% 52% 48% 52% 350:150 130:370 500 Varkens F G 70% 30% 35% 15% 500 Geen Varkens F G 26% 74% 13% 37% 60:40 290:110 2:48 128:322 100 Buiten Conc. gebied F G 60% 40% 6% 4% 400 Conc. gebied F G 72% 28% 29% 11% 50 Kippen F G 4% 96% 0% 5% 450 Geen Kippen F G 28% 72% 13% 32% 5:0 5 0-10 Runderen F G 100% 0% 0% 0% 195:105 300 11-20 Runderen F G 65% 35% 20% 10% 90:5 95 > 20 Runderen F G 95% 5% 9% 0%

Neuraal netwerken

Randvoorwaarden Interactie met primaire proces Kwaliteit en beschikbaarheid gegevens = Datawarehouse Expertise Materie-deskundigheid Gegevensdeskundigheid Datamining-deskundigheid

Gebruik datawarehouse Datamining eisen wijken af van toepassingen zoals management informatie en database marketing Nog groter belang schone gegevens Platte gegevens i.p.v. berekende gegevens Eventueel relevante gegevens afleiden Vooral numerieke gegevens bruikbaar Numerieke gegevens classificeren

Toepassingen Direct marketing door Customer profiling Winkel-layout Aandelen-koers analyse Risico-analyse Performance-optimalisatie Frequent flyer acties Fraude detectie

Agenda Business Intelligence Datamining theorie Datamining in de praktijk

De probleemstelling Hoe/waaraan herken je een agrariër die de wet overtreedt? Waarom is dat belangrijk? 100.000+ agrariërs en agrarische bedrijven Steeds complexere regelgeving Beperkte controle capaciteit Non-conformisten controleren en pakken Conformisten impliciet controleren

De context Ministerie van LNV Bureau Heffingen => Uitvoering Algemene Inspectie Dienst (AID) => Handhaving Mestwetgeving Beperken mestproductie en milieuvervuiling Registratie mestproductierechten Aangifte mestproductie Overproductie? Betalen! Systematiek vergelijkbaar met belastingdienst

De handhaving Controles op 4 niveaus: Accountantscontrole (in doelgroep zelf) Administratieve verwerking Bureau Heffingen Datamining: Selecteren verdachte relaties Controle (desk, fysiek) door AID Doel: Niveau handhaving moet vergelijkbaar zijn met belastingdienst (gemiddelde controle 1x per 6 jaar) Geen extra controleurs nodig

Het concept: Dataminingwiel Datawarehouse Extraheren van dataset uit DW Dataset Verwerken controleresultaten in DW MINEN Kennis Gegevens Controleresultaten Analysemodel Uitvoeren van controles Vertalen van analysemodel in controlespecificaties Selecties van bedrijven

De incrementele aanpak Incrementen van 8 weken 8 incrementen gedefinieerd t/m juni 2000 3 paralleltrajecten Datawarehouse realisatie Aansturing / analyse / modellering Datamining (2 dataminers) Per increment: Vaste stappen / producten / interactie tussen trajecten Beschikbare gegevens opgedeeld Additionele onderwerpen bepaald

Visualisatie (1) Histogram: Aantal hectare vs. Aantal varkens => geen verband

Visualisatie (2) Histogram: Kilogram mest vs. Aantal varkens => Verband

Statistiek (1) Regressie: Aantal hectare vs. Aantal varkens => Geen verband

Statistiek (2) Regressie: Kilogram mest vs. Aantal varkens => Verband

De uitdagingen (organisatorisch) Inrichten van het gehele proces Hoe blijft het wiel draaien? Voorbereiden van de organisatie Datamining is geen bedreiging Kennis vergaring en vertaling naar datamining Business Intelligence, Kennis management Vinden van goede dataminers

De uitdagingen (m.b.t. gegevens) Integratie van twee bronnen (relatiebeheer!) Vervuiling gegevens Voldoen aan regels der statistiek Bepaling fraude begrip Verkrijgen minebare gegevens Veranderende brongegevens Is er wel wat te vinden?

Vragen