Anomaliedetectie en patroonherkenning

Vergelijkbare documenten
Business Analytics bij. Zilveren Kruis. Rob Konijn Data Scientist Kenniscentrum. 12 mei 2016

Data driven. Het plan naar data driven business door advanced analytics Business.

0. Probleemstelling. 1. Uitgangspunten

Workshop CBS data. Dennis Ramondt

Informatiebeveiliging

DATAMODELLERING TOEPASSEN DATA ANALYTICS

DATA MANAGEMENT Manuel Zafirakis. Actuarial Presales Consultant SunGard. Data Optimisatie.

Open Overheid & Open data

Vluchtelingen in Nederland Stromen op de arbeidsmarkt Linda Muller, Jeroen van den Tillaart en Caroline van Weert

Masterclass Technology Trend Monitoring

UWV GegevensDiensten, de gegevensspecialist

MACHINE LEARNING. Een egocentrische presentatie door een data scientist van Axians. Michel van Gelder Data Scientist bij Axians

INZET VAN MACHINE LEARNING

Introductie ArchiMate

Wetgeving in verbinding

Living Labs : NFI & RvdK Samen onderweg naar meer grip op data. JenV I-tour presentatie 24 april 2018

Officiële uitgave van het Koninkrijk der Nederlanden sinds Beleidsregels UWV gebruik polisgegevens 2018

Waternet Datalab. KI in de praktijk. KI in de watersector, 25 juni 2019 Alex van der Helm

Tweemeting Uitstroomdoelstelling re-integratieondersteuning Voorlopige cijfers 2006 en eerste halfjaar 2007

CaseMaster RP ResellerProfiling

De werking van de. Adri Dokter op persoonlijke titel

From business transactions to process insights. BPM Round Table, TU/e 26 mei 2014

De geïntegreerde architectuur van Informatie- en Operationele Techniek. Jurg Bremmer (sr. Consultant - )

Nanda Vissers. Persoonlijke gegevens

Documentatierapport Koppeltabel inkomstenverhouding identificatie met baanrug identificatie (KOPPELTABELIKVIDBAANRUGIDTAB)

Self Service BI. de business

Het classificeren van hoortoestel modaliteiten m.b.v. een Big Data benadering: Latent Class Trees analyse

Minor Data Science (NIOC april)

Mijn kennismaking met SAP BusinessObjects Cloud

Beleidsregels UWV gebruik polisgegevens

SRG-uitstroom Conclusie

Agenda. UWV Gegevensdiensten Dienstverlening Samenwerking Loonaangifteketen BLAU. 30 november, Accountmanagement Gegevensdiensten, Peter Greve.

Convenant inzake de samenwerking op grond van art. 64 Wet SUWI

Historische informatie in een Spatial Dynamisch Data Warehouse. Wil de Jong Enterprise Architect

ICT HAALBAARHEIDS -TOETS UWV. 21 juni Voor de digitale economie

Data Analyse. Maakt de kracht van data analyse(s) real-time beschikbaar voor schadeafhandelingen

Titel Uw processen transparant met SAP Process Mining.

Aan het werk met re-integratieondersteuning

De toekomst van data science in het waterdomein.

Regels zonder overlast, eindrapport van de Commissie administratieve lasten, p IV 2

B l u e D o l p h i n

Peter de Haas

Big Data en Testen samen in een veranderend speelveld. Testnet 10 april 2014 Paul Rakké

A Data Driven Journey Pieter de Kok RA AANJAGER CONEY. 31 oktober 2018

Microdata Services. Documentatie Minimumloonklasse van banen van werknemers (MLKLASSEBUS)

Mijn belangrijkste kwaliteiten zijn analyseren, procesinnovaties, communicatie en aanpakken.

Datamining voor iedereen. Rob van der Veer

Thomas Boeschoten.

Re-integratie door Keerpunt. Effectiviteit bij het voorkomen van WGA-instroom en ervaringen van werkgevers

Documentatierapport Loongegevens, gewerkte uren en dagen per inkomstenverhouding (NPOLISSTATLINEBUS)

Robotic Process Automation. 19 februari 2019

Datamining: Graven in gegevens

Op zoek naar onderzoek in Vlaanderen? 5 principes om een portaalsite te bouwen. FELNET studiedag milieu in formatie uitformatie, 20 oktober 2016

Met de Glazen Bol naar. Doelgerichter BWT Toezicht

Microdata Services. Documentatie Gemeente Standplaats van de banen in december (GEMEENTESTPLTAB)

Verlonen van 00 Uitkering W.G.A.

Migratieachtergrond van werknemers in Nederland naar bedrijfstak en regio, december 2016 pilot Barometer culturele diversiteit

AI en Data mining. Van AI tot Data mining. dr. Walter Kosters, Universiteit Leiden. Gouda woensdag 17 oktober

Microdataservices. Documentatierapport Minimumloonklasse van banen van werknemers (MLKLASSEBUS)

De gemeente in de toekomst V R I J D A G 2 9 J U N I

Rapport Credit Management Software Presentatie: Marcel Wiedenbrugge

IBM Analytics Summit 2017

Informatie sociale verzekeringen naar sectoren

De invloed van IT op de taken van de publieke controller

Architectuur bij DNB. Voor NORA gebruikersraad. Martin van den Berg, Gert Eijkelboom, 13 maart 2018

Transformatie en Innovatie bij KPN Finance

De loonaangifte en haar toekomst. Jouke Sjaardema

Na afloop van het loonjaar worden de loonkostenvoordelen afgerekend aan de hand de ingediende loonaangiften.

Jaarplan Loonaangifteketen 2015 Versie 1.0 Uit de schaduw van de keteneigenaren

Robotic Process Automation

11 Toetsen van projecten op enterprise architectuur

Whitepaper. Personal Targeting Platform. De juiste content Op het juiste moment Aan de juiste persoon

Uw salarisadministratie uitbesteden Managed Payroll Services

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Minimumloonklasse van banen van werknemers (MLKLASSEBUS)

Een extra reden om mij aan te nemen. De voordelen voor uw toekomstige werkgever als u een WAO-, WIA-, WAZ- of Wajong-uitkering heeft of heeft gehad

Grip op datakwaliteit van AAT tot Z. Kasper Kisjes, Rijkswaterstaat

Open Data Estafette Duurzame Energie, 11 juni 2014, Amersfoort

Documentatierapport Kwantitatieve gegevens van banen (POLISIKOBUS)

Big Data en het CBS. Enkele voorbeelden. Piet Daas, May Offermans, Martijn Tennekes, Alex Priem, Paul van den Hurk

Curriculum Vitae Ishak Atak. Naam : Ishak Atak Roepnaam : Ishak. Woonplaats : Utrecht Geboorte datum :

Aan het werk met re-integratieondersteuning

Jong en oud op de arbeidsmarkt,

Nationale DenkTank 2014 Big Data Academy

De WGA-verzekering voor AGF Groothandel

Uitwerking proefexamen 1 - BKL 2015/ module Arbeidsrecht en Sociale Zekerheid

Microdata Services. Documentatie Maandbedragen van personen met een Ziektewetuitkering (ZWPERSOONMNDBEDRAGBUS)

Testen van Datawarehouses en Informa2e. Kan het 2x zo snel, 2x zo goedkoop en 2x zo volledig?

Technische keuzes Management Informatie Systeem MeanderGroep

Smar t Buildings met behulp van Azure IoT

Enterprise Connectivity. Marnix van Bo. TU Delft Elek Software Architect 20 jaar ervarin ontwikkeling

SR MARKETING ANALYST EMEA

Curriculum Afkortingen Bachelor Informatica Propedeuse Postpropedeuse Start Vervolg Afsluiting 60,0 Gebonden keuze (8,6 EC) Afsluiting

UWV Controleert. uwv.nl werk.nl. Wat kan ik verwachten? Meer informatie

DATAMODELLERING BEGRIPPENBOOM

Hello, are we your marketing analytics partner?

Centrum voor Beleidsstatistiek en Microdata Services

Zo controleert de belasting dienst uw loonaangifte. Overheid controleert vaker en uitgebreider

Big Data bij de Rabobank

Aan het werk met re-integratieondersteuning

Process management aan het werk Business discovery als motor achter waarde creatie. Hans Somers Programmamanager B/CA Gegevens, Belastingdienst

Transcriptie:

Digitale overheid van de Toekomst, 28 september 2016 Anomaliedetectie en patroonherkenning binnen de loonaangifteketen Dr. Ralph Foorthuis

Voorstelrondje Werkervaring Sr. enterprise architect bij UWV Werkzaam bij CIOO en Gegevensdiensten: Gegevensregisters, portalen, informatiebeveiliging, integratie, IV-beleid Informatieanalist en architect bij het CBS Statistische systemen en processen, waaronder de CPI, Demografie en Energie Diverse opdrachten bij overige organisaties Academisch Promotieonderzoek Project Compliance with Enterprise Architecture en diverse andere publicaties Studies Informatiekunde + Communicatiewetenschap Data analytics 2

Over UWV Algemeen UWV draagt zorg voor de uitvoering van de werknemersverzekeringen, zoals de WW, WIA, WAO, WAZ, Wazo en Ziektewet. Daarnaast biedt UWV arbeidsmarkt- en gegevensdiensten en medische keuringen. Gegevens en systemen zijn cruciaal voor de primaire processen De meeste processen vereisen veel gegevens over burgers en bedrijven. UWV heeft diverse systemen met gegevensverzamelingen, waaronder: De Polisadministratie Materies- en betalingssystemen van divisie Uitkeren Systemen voor medische keuringen en werkbemiddeling Systemen voor BI en data analyse Verder: webportalen, workflowsystemen, HR-systemen, etc. UWV 3

Loonaangifteketen Ongeveer 20 miljoen inkomstenverhoudingen (o.a. salarisstrookje ) Ongeveer 150 miljard euro per jaar aan premieheffingen Grootste inkomstenbron voor staatskas Doelen: Gegevens, Gemak, Geld 4

Loonaangifteketen en proces datakwaliteit XML Poort XSD -controles CML -controles Inhoudings - plichtige LA -Software HLP Software Ontwikkelaar Belastingdienst UWV Jaarwerk Splitsing (N-C) KUB Polis Jaarwerk Tijd Politiek Signalering module Polis Wet en regelgeving Aanpassingen akkoord Afstemming tussen Belastingdienst, UWV, OSWO en SWO s Wijzigingsvoorstellen TOO OOO Belastingdienst jaarovergang UWV AOL LMO Kernteam akkoord 5

Gegevenskwaliteit Productioneel Loonaangifteproces AGL-team Queries, kwaliteitskenmerken, rapportages Rule-based checks Veel domeinkennis vereist Anomaly detection experiment Experiment met state-of-the-art technieken om autonoom vreemde en afwijkende cases in de data te identificeren Unsupervised learning Statistische checks Weinig domeinkennis vereist Data analytics 6

Typen analysetechnieken Classificatie Associatie analyse Regressie / PLS / path analysis Clustering Beschrijven/samenvatten Anomaliedetectie Identificatie en afleiden Sequentiedetectie Netwerkanalyse Tekst en audiovisuele mining Complexe ad hoc selectie en transformatie Correctie en imputatie Simulatie Datavisualisatie Data analytics 7

Anomaly detection Zoeken naar afwijkende gevallen m.b.v. slimme technieken. De afwijking kan het resultaat zijn van uiteenlopende oorzaken en kan o.a. wijzen op incorrecte data. Ook bekend als outlier detection of novelty detection. Toepassingsgebieden: Datakwaliteit Fraudedetectie Foutdetectie Security Procesmonitoring Bouw van statistische modellen Change point detection Data analytics 8

Aanpak Uitproberen diverse analytics technieken, zowel uit klassieke statistiek als machine learning Steekproef uit de Polisadministratie met PLM (Parametriseerbare Lever Module) Geanonimiseerde data Tools: voornamelijk R & RStudio Data analytics 9

Resultaten eerste experimenten A. Polis Snapshot Anomaly detection met diverse technieken Visualisatie Complexe ad hoc selectie en transformatie Data analytics 10

Resultaten eerste experimenten B. Polis time series Anomaly detection met diverse technieken Visualisatie Complexe ad hoc selectie en transformatie Data analytics 11

(Vervolg van de presentatie bestaat uit een sequentie van 3D animaties)

Hiding in multidimensionality Anomalieën (outliers) die niet gevonden kunnen worden met een enkele variabele. Er zijn meerdere variabelen nodig om de afwijking van het patroon te detecteren.

Loonaangifte view

Loonaangifte 4D

Loonaangifte anomalieën

Loonaangifte anomalieën

Belangrijkste conclusies Er bestaan diverse bruikbare technieken voor geavanceerde anomaly detection. Zowel numerieke als categoriale variabelen. Vooral handig voor exploratieve analyses en in situaties waarin men nog weinig diepe domeinkennis heeft. Er bleek een grote overlap te zijn tussen de regels die je met anomaly detection zou afleiden, en de bestaande controles in de Loonaangifte. Datavisualisatie is essentieel. Aandachtspunten zijn omvang van de dataset, aard van de data, high-dimensionality. Belangrijk om functionele kennis te hebben van achterliggende algoritmen. Data analytics 18