Financial Crime Analytics Zoeken naar het onbekende IBO 39 Johan ten Houten, 10 September 2014
Introductie Johan ten Houten 52 jaar oud, getrouwd, 3 kinderen, 1 hond Wild van skiën, wijn en koken Grote passie voor data en technische toepassingen. NFI, afdeling computer onderzoek Informatiebeveiliging bij OOV Sinds 9 jaar bij Deloitte Forensics, E- Discovery and Financial Crime Analytics
Financial Crime is van alle tijd
Het zoeken naar fraude is een niet triviale taak, waarbij de daders steeds andere methodes weten te vinden om nauwkeurig ontworpen systemen te ontwijken.
Effectieve detectie van fraude is niet (alleen) gebaseerd op opspring van vaststaande patronen. 2014 Deloitte The Netherlands
Beschikbare technieken voor detectie van fraude
Zelflerend Risico Classificatie model Request Classification Segment Control Follow-up Determine Small sample Rejected request Validated request Low risk Rest population Undetermined Klant Informatie Classificatie model Medium risk Larger sample Rejected request Validated request Rest population Undetermined High risk Full population Rejected request Validated request Bekende zaken Nieuwe zaken
Machine learning / Classificeren Kunnen we op basis van (deze) voorbeelden Bepalen (voorspellen) wat dit is:?
Machine Learning Parameters van een algoritme inregelen totdat een gewenste reactie bereikt is. Parameters worden ingeregeld door middel van training met voorbeeld dossiers. Machine learning maakt het mogelijk om niet lineaire verbanden te creëren. Hoe meer voorbeelden, hoe beter het algoritme geleerd kan worden.
In de praktijk Samen met specialisten bepalen wat een mogelijke indicator is van fraude daar waar mogelijk met behulp van extra informatie. Type indicatoren: Horizontale indicatoren: afwijking door een sprong in de tijd Verticale indicatoren: afwijking van gemiddelde Lokale indicatoren: afwijking van lokaal gemiddelde checking credit savings employ ment installment commitme personal other residenc property other existing num depen own foreign status duration credit history purpose amount status years nt status parties e since magnitude age loans housing credits job dents telephone worker class 'critical/other -2011.00 6 existing credit' radio/tv 1169 0 49 4 'male single' none 4 'real estate' 67 none own 2 skilled 1 yes yes good 'female div/dep/mar 198.00 48 'existing paid' radio/tv 5951 62 3 2 ' none 2 'real estate' 22 none own 1 skilled 1 none yes bad 'critical/other 'unskilled 0.00 12 existing credit' education 2096 31 22 2 'male single' none 3 'real estate' 49 none own 1 resident' 2 none yes good furniture/equ guaranto -3386.00 42 'existing paid' ipment 7882 91 13 2 'male single' r 4 'life insurance' 45 none 'for free' 1 skilled 2 none yes good -946.00 'delayed 24 previously' 'new car' 4870 88 36 3 'male single' none 'no known 4 property' 53 none 'for free' 2 skilled 2 none yes bad 'no known 'unskilled 0.00 36 'existing paid' education 9055 0 9 2 'male single' none 4 property' 35 none 'for free' 1 resident' 2 yes yes good furniture/equ 0.00 24 'existing paid' ipment 2835 526 20 3 'male single' none 4 'life insurance' 53 none own 1 skilled 1 none yes good 'high qualif/self 117.00 36 'existing paid' 'used car' 6948 95 3 2 'male single' none 2 car 35 none rent 1 emp/mgmt' 1 yes yes good 'male 'unskilled 0.00 12 'existing paid' radio/tv 3059 22998 12 2 div/sep' none 4 'real estate' 61 none own 1 resident' 1 none yes good
Training (inregelen van het model) Neem bekende aanvragen waarvan je weet of ze goed of fout zijn. Train een model met deze aanvragen net zolang totdat het model de voorbeelden juist kan herkennen. Gebruik deel van training voorbeelden om model onafhankelijk te toetsen.
Validatie False negative False positive Voorspeld Werkelijk Drempel
Scoring Na zetten van drempels en acceptatie Gebruik het getrainde model om aanvragen te scoren Real-time één voor één. In bulk einde van de maand. Over gehele populatie. 0,01 0,03 0,11 0,21 0,27... 0,96
0 4 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84 88 92 96 100 % of records Resultaat van Model Gebaseerd op een populatie met geschat 2% fraude. 50 45 40 35 30 Low risk Medium Risk High Risk 25 20 15 10 5 0 Score
Effectieve bestrijding Financiële Fraude Risico beheersing van onbekende risico s toepasbaar in veel gebieden Veel data nodig Systeem moet regelmatig bijgewerkt worden False Positives / False Negatives Niet alleen machine learning combineer met SNA, Rules en Profiling Gebruik het model om processen te verbeteren - ga van patronen naar oorzaken Zoek niet alleen naar fouten, ook naar goede dingen. Let op met overfitting onvoldoende data verkeerde statistiek privacy 2014 Deloitte The Netherlands
Vragen? jtenhouten@deloitte.nl http://linkedin.com/jtenhouten 2014 Deloitte The Netherlands
Deloitte refers to one or more of Deloitte Touche Tohmatsu Limited, a UK private company limited by guarantee ( DTTL ), its network of member firms, and their related entities. DTTL and each of its member firms are legally separate and independent entities. DTTL (also referred to as Deloitte Global ) does not provide services to clients. Please see www.deloitte.nl/about for a more detailed description of DTTL and its member firms. Deloitte provides audit, tax, consulting, and financial advisory services to public and private clients spanning multiple industries. With a globally connected network of member firms in more than 150 countries and territories, Deloitte brings world-class capabilities and high-quality service to clients, delivering the insights they need to address their most complex business challenges. Deloitte s more than 200,000 professionals are committed to becoming the standard of excellence. This communication contains general information only, and none of Deloitte Touche Tohmatsu Limited, its member firms, or their related entities (collectively, the Deloitte network ) is, by means of this communication, rendering professional advice or services. No entity in the Deloitte network shall be responsible for any loss whatsoever sustained by any person who relies on this communication. 2014 Deloitte The Netherlands