November December Jan Meskens / Onderzoek

Maat: px
Weergave met pagina beginnen:

Download "November December 2011. Jan Meskens / Onderzoek"

Transcriptie

1 Jan Meskens / Onderzoek 1

2 Wat is "Predictive Analytics"? Historische en/of huidige data Voorspellingen over de toekomst 2

3 Toepassing: fraudebestrijding Opsporen fraude met aanrijdingsformulieren [SAS] 3

4 Toepassing: marketing Gepersonaliseerde reclamefolder [Colruyt] 4

5 Toepassing: ehealth intensieve zorgen Nierfalen binnen de 3 dagen? Kans op ontsteking? Hoe lang op de afdeling blijven? UZ Gasthuisberg [Ramon et al.] 5

6 Toepassing: landbouw Slacht de dieren die volgend jaar het minste melk zullen geven [Witten et al.] 6

7 In deze infosessie Deel 1 Wat is predictive analytics? Courante predictieve modellen Toepassingen van deze modellen Deel 2 Predictive analytics tools Predictive analytics cases Wat hebben we geleerd? 7

8 In deze infosessie Deel 1 Wat is predictive analytics? Courante predictieve modellen Toepassingen van deze modellen Deel 2 Predictive analytics tools Predictive analytics cases Wat hebben we geleerd? 8

9 Data warehouse Database Descriptive analytics Machine learning Statistics AI Predictive analytics Data mining 9

10 Data Mining Descriptive analytics Predictive analytics Data Statistiek, Database & DW, Machine learning & AI 10

11 Data Mining Descriptive analytics Predictive analytics Data Statistiek, Database & DW, Machine learning & AI 11

12 Descriptive analytics: verklaar het verleden Taart diagram & histogram Kolom diagram 12

13 Descriptive analytics: verklaar het verleden Line chart Gemiddelde, ANOVA, t-test, standaard afwijking, Scatter plot matrix Beschrijvende statistiek 13

14 Data Mining Descriptive analytics Predictive analytics Data Statistiek, Database & DW, Machine learning & AI 14

15 Predictive analytics: voorspel de toekomst Typische dataset: X 1 X 2 X 3 X 4 X 5 Y Onafhankelijke variabele(n) (Predictor variabelen(n)) Afhankelijke variabele(n) (Target variabele(n)) 15

16 Predictive analytics: voorspel de toekomst Fraude met aanrijdingsformulieren: Datum Schad e Plaats Fraude? YES YES NO Onafhankelijke variabele(n) (Predictor variabelen(n)) Afhankelijke variabele(n) (Target variabele(n)) 16

17 Predictive analytics: voorspel de toekomst X 1 X 2 X 3 X 4 X 5 Predictief Model f(x1,,x5) = y Y Bv. model bij fraude met aanrijdingsformulieren: f(datum,schade,plaats, ) = YES/NO 17

18 Predictive analytics vs. expert knowlegde Predictief model Model wordt uit de data gehaald Business rules Model wordt door expert gemaakt 18

19 Expert driven business rules Eenvoudige regel Complexere regel 19

20 Expert driven rules opstellen vaak onmogelijk Data zeer complex Meer dan twee dimensies Moeilijk om patronen manueel te definieren Wordt opgelost met predictive analytics! 20

21 Predictive analytics project aanpak 4. Feedback 3. Interpretatie en evaluatie 2. Predictive modeling 1. Voorbereiden data Kennis over de toekomst Data D1 D2 D3 D4 D5 Dataset Predictief model 21

22 Data voorbereiding Analyseren Welke variabelen? Verdeling data? Betekenis data? Data kwaliteit? Data Extraheren en omvormen D1 D2 D3 D4 Data Dataset 22

23 Predictive analytics project aanpak 4. Feedback 3. Interpretatie en evaluatie 2. Predictive modeling 1. Voorbereiden data Kennis over de toekomst Data D1 D2 D3 D4 D5 Dataset Predictief model 23

24 Predictive model opbouwen (=training) Input Output X 1 X 2 X 3 X 4 X 5 A 0,1 3 Yes 200 B 0,4 5 Yes 150 Trainingsdataset Y 2 4 Trainingsalgoritme vh predictief model Predictief model f(input) = output Accuraatheid % 24

25 Accuraatheid van het predictief model Confusion matrix: Predicted TRUE Predicted FALSE Actually TRUE Actually FALSE % True Positive (TP) % False Positive (FP) % False Negative (FN) % True Negative (TN) Accuraatheid = TP + TN 25

26 Interpretatie confusion matrix is belangrijk! Actually CANCER Actually NO CANCER Predicted CANCER % True Positive (TP) % False Positive (FP) Predicted NO CANCER % False Negative (FN) % True Negative (TN) Moet zo laag mogelijk zijn! 26

27 Is een predictief model generaliseerbaar? Hoe gedraagt het model zich bij data trainingsdata model accuraatheid Gaat enkel over trainingsdata Te optimistisch over performantie van het model 27

28 Naïve oplossing: trainingsdata opsplitsen Data Train: model leren Test: generaliseerbaarheid berekenen Probleem: 50% training, 50% test reduceert training set enorm 28

29 Oplossing: "cross validation" Data opslitsen in k delen (folds) k-1 trainingssets, 1 testset Train Test Test Test 29

30 Predictive analytics project aanpak 4. Feedback 3. Interpretatie en evaluatie 2. Predictive modeling 1. Voorbereiden data Kennis over de toekomst Data D1 D2 D3 D4 D5 Dataset Predictief model 30

31 Interpretatie en evaluatie model output X 1 X 2 X 3 X 4 X 5 A 0,1 2 Yes 200 B 0,7 6 Yes 150 A 0,2 8 No 300 Y??? Interpretatie Nieuwe data Predictief model Waarde van variabele Y 31

32 Predictive analytics project aanpak 4. Feedback 3. Interpretatie en evaluatie 2. Predictive modeling 1. Voorbereiden data Kennis over de toekomst Data D1 D2 D3 D4 D5 Dataset Predictief model 32

33 Feedback Output correct? Predictief model Waarde van variabele Y Model update Correct: JA/NEE 33

34 Feedback Fraude onderzoek Predictief model Fraude Model update Fraude: Ja/Nee 34

35 Predictive analytics project aanpak 4. Feedback 3. Interpretatie en evaluatie 2. Predictive modeling 1. Voorbereiden data Kennis over de toekomst Data D1 D2 D3 D4 D5 Dataset Predictief model 35

36 5 predictieve modellen Statistics Clustering Association rules Decision trees Neural networks 36

37 5 predictieve modellen Statistics Clustering Association rules Decision trees Neural networks 37

38 Statistische modellen Geen beschrijvende statistiek zoals gemiddelde, standaard afwijking, histogrammen, Wel voorspellende statistiek: Regressie analyse 38

39 Regressie analyse Simpele lineare regressie: y i = a + b. x i + r Multiple lineaire regressie: y i = b 0 + b 1. x 1 + b 2. x b m. x m + r i Non-lineaire regressie: polynomiale regressie, logistische regressie 39

40 Simpele lineare regressie met R Temp Pres

41 Simpele lineare regressie met R 41

42 Simpele lineare regressie met R Fitten lineaire functie 2 Plotten Temp~Lpres 3 Lijn weergeven van functie m1 42

43 Simpele lineare regressie met R Lage concentratie Hoge concentratie 43

44 Simpele lineare regressie met R Concentration Velocity

45 Simpele lineare regressie met R??? ytrans = conc/vel ytrans = a + b. conc Transformatie 45

46 Non-Lineare Regressie in R 46

47 5 predictieve modellen Statistics Clustering Association rules Decision trees Neural networks 47

48 Clustering 48

49 Clustering: K-Means algoritme Input: aantal clusters N 49

50 Clustering: K-Means algoritme Input: aantal clusters N 1. Kies N random cluster centra 50

51 Clustering: K-Means algoritme Input: aantal clusters N 1. Kies N random cluster centra 2. Verdeel in clusters 51

52 Clustering: K-Means algoritme Input: aantal clusters N 1. Kies N random cluster centra 2. Verdeel in clusters 52

53 Clustering: K-Means algoritme Input: aantal clusters N 1. Kies N random cluster centra 2. Verdeel in clusters 3. Bepaal N nieuwe cluster centra 53

54 Clustering: K-Means algoritme Input: aantal clusters N 1. Kies N random cluster centra 2. Verdeel in clusters 3. Bepaal N nieuwe cluster centra 4. N clusters gevonden 54

55 Clustering voorbeeld: IRIS dataset Iris setosa Iris versicolor Iris virginica 55

56 Clustering voorbeeld: IRIS dataset Sepallength Sepalwidth Petallength Petalwidth Class Setosa Setosa Versicolor Versicolor Viriginica Virginica Virginica 56

57 57

58 Voorspellen met Clustering Sepallength Sepalwidth Petallength Petalwidth Class ? ? ? 58

59 59

60 5 predictieve modellen Statistics Clustering Association rules Decision trees Neural networks 60

61 Association Rules ID milk bread butter beer Voorbeeld: Associaties tussen aankopen {Butter, Bread} => {Milk} {Milk} => {Bread} IF (Butter AND Bread) THEN Milk IF Milk THEN Bread 61

62 Association Rules {Butter, Bread} => {Milk} Antecedent Support: Hoeveel keer (in %) komt het antecedent voor? Consequent Confidence: Hoeveel keer (in %) volgt de consequent op de antecedent? 62

63 {Bread} => {Milk} ID milk bread butter beer Support: 3/5 = 60% Confidence: 2/3 = 66,7% 63

64 Associaties met het Apriori Algoritme Input: minimum support N 1 Bepaal support van elk element ID Support {Milk} 0,4 {Bread} 0,6 {Butter} 0,4 {Beer} 0,2 2 Schrap elementen met support < N 64

65 Associaties met het Apriori Algoritme Input: minimum support N ID Support {Milk} 0,4 {Bread} 0,6 {Butter} 0,4 {Beer} 0,2 3 4 Breid associaties uit met 1 element en bepaal support ID Support {Milk,Bread} 0,4 {Milk,Butter} 0,2 {Bread,Butter} 0,2 Schrap elementen met support < N 5 Herhaal tot er geen associaties met support >= N gevonden worden 65

66 Association rules in bankgegevens met SPSS Kinderen Auto Spaar rekening Lopende rekening Hypotheek PEP Leeftijd Geslacht Regio Inkomen Getrouwd 66

67 67

68 5 predictieve modellen Statistics Clustering Association rules Decision trees Neural networks 68

69 Decision trees Outlook Temp. Hum. Wind Play? Sunny F N Sunny T N Overcast F Y 69

70 Decision trees met Weka Sepallength Sepalwidth Petallength Petalwidth Class Setosa Setosa Versicolor Versicolor Viriginica Virginica Virginica 70

71 71

72 Decision trees in R > iris <- read.table("c:/iris.csv",header=t,sep=",") 1 Inlezen data 72

73 Decision trees in R > iris <- read.table("c:/iris.csv",header=t,sep=",") > fit <- rpart(class~sepallength+sepalwidth+petallength+petalwidth, data=iris,method="class") 2 Fitten decision tree 73

74 Decision trees in R > iris <- read.table("c:/iris.csv",header=t,sep=",") > fit <- rpart(class~sepallength+sepalwidth+petallength+petalwidth, data=iris,method="class") > plot(fit, uniform=true, main="iris tree") > text(fit, use.n=true, all=true, cex=.8) 3 Plotten resultaat 74

75 Decision trees in R > iris <- read.table("c:/iris.csv",header=t,sep=",") > fit <- rpart(class~sepallength+sepalwidth+petallength+petalwidth, data=iris,method="class") > plot(fit, uniform=true, main="iris tree") > text(fit, use.n=true, all=true, cex=.8) > pred <- predict(fit, newdata=data,type="class") > mc <-table(iris$class,pred) > print(mc) Iris-setosa Iris-versicolor Iris-virginica Iris-setosa Iris-versicolor Iris-virginica > err <- mc[1,2]+mc[1,3]+mc[2,1]+mc[2,3]+mc[3,1]+mc[3,2] > 1 - err/length(iris$class) [1] 0.96 > 4 Evalueren resultaat 75

76 Decision trees in R 76

77 5 predictieve modellen Statistics Clustering Association rules Decision trees Neural networks 77

78 Biologische vs. artificiele neurale netwerken I N P U T S O U T P U T S Synapse (verbinding) Neuron 78

79 Input layer I N P U T S O U T P U T S Hidden layers Output layer 79

80 Multi-Layer Perceptron (MLP) Node x1 x2 Verbinding x1 * w1 w1 w2 w3 x2 * w2 + x3 * w3 σ(u) u σ x3 80

81 Neurale netwerken in SPSS Sepallength Sepalwidth Petallength Petalwidth Class Setosa Setosa Versicolor Versicolor Viriginica Virginica Virginica 81

82 82

83 Association rules Statistics Decision trees Clustering Neural networks Makkelijke interpretatie Moeilijke interpretatie 83

84 Welk model is het beste: ROC Curve A > B > C Sensitivity: true positive rate 1-Specifity: false negative rate Predicted TRUE Predicted FALSE Actually TRUE Actually FALSE % True Positive (TP) % False Positive (FP) % False Negative (FN) % True Negative (TN) 84

85 Welk model is het beste: ROC Curve 85

86 In deze infosessie Deel 1 Wat is predictive analytics? Courante predictieve modellen Toepassingen van deze modellen Deel 2 Predictive analytics tools Predictive analytics cases Wat hebben we geleerd? 86

87 In deze infosessie Deel 1 Wat is predictive analytics? Courante predictieve modellen Toepassingen van deze modellen Deel 2 Predictive analytics tools Predictive analytics cases Wat hebben we geleerd? 87

88 Tools per analyse methode Scripting Form-based Visual programming S+ WEKA R Matlab Octave SPSS Modeler SAS Enterprise Miner Oracle Data Miner TIBCO Spotfire Miner Open source Commercial 88

89 Tools per analyse methode Scripting Form-based Visual programming S+ WEKA R Matlab Octave SPSS Modeler SAS Enterprise Miner Oracle Data Miner TIBCO Spotfire Miner Open source Commercial 89

90 S+ R Implementaties van de statistische programmeertaal "S" Commercieel Command shell Biedt ook forms aan die de shell afschermen Open source Command shell 90

91 Tree fitten in R vs. S+ R S+ 91

92 Matlab Mathworks Wiskundige omgeving Sterk in data visualisatie! Functionaliteit verpakt in "toolboxes" Toolboxes voor neurale netwerken, databases, statistics, Command line en forms Octave = OS alternatief 92

93 Tools per analyse methode Scripting Form-based Visual programming S+ WEKA R Matlab Octave SPSS Modeler SAS Enterprise Miner Oracle Data Miner TIBCO Spotfire Miner Open source Commercial 93

94 Weka Waikato Environment for Knowledge Analysis Open source tool van de Universiteit van Waikato Java Zeer veel algoritmes ter beschikking 94

95 Tools per analyse methode Scripting Form-based Visual programming S+ WEKA R Matlab Octave SPSS Modeler SAS Enterprise Miner Oracle Data Miner TIBCO Spotfire Miner Open source Commercial 95

96 Visual programming Tibco Spotfire Miner IBM SPSS Modeler Oracle Data Miner SAS Enterprise Miner 96

97 Gevolgd traject met deze tools Eerste stappen met predictive analytics Algoritmes leren kennen Parameters tunen Kleine datasets Lage instap (free) 97

98 Gevolgd traject met deze tools Eerste stappen met predictive analytics Eerste projecten Algoritmes met meer leren kennen data Visual programming Parameters tunen Methodes om data te Kleine datasets filteren, cleanen, Lage instap combineren, (free) Lage leercurve om algoritmes en data te koppelen Kunnen veel data formaten aan 98

99 Gevolgd traject met deze tools Eerste stappen met predictive analytics Eerste projecten Algoritmes met meer leren kennen data Parameters tunen Geavanceerd Methodes gebruik om data te Kleine datasets filteren, cleanen, Lage instap combineren, (free) Lage leercurve om algoritmes en data Scripting te koppelen Scripts zijn makkelijker Kunnen uitbreidbaar veel data ivgl met visual programming formaten aan De nodige extra functionaliteit kan geprogrammeerd worden Blijft een persoonlijke keuze: programmeren vs. modelleren Visual programming 99

100 Predictive analytics initiatieven SMALS CASE 1: Strijd tegen de sociale fraude CASE 2: Traceerbaarheid 100

101 Predictive analytics initiatieven SMALS CASE 1: Strijd tegen de sociale fraude CASE 2: Traceerbaarheid 101

102 Strijd tegen de sociale fraude: verhogen van de efficientie van de inspecties! predictive analytics potentiele fraude gevallen confirmed fraud? inspectiediensten RSZ 102

103 Predictive modeling bij sociale fraude Doel: frauduleuze associaties tussen bedrijven herkennen. Oplossing: Association rules met het apriori algoritme Fraud No fraud Failliet 103

104 Association rules? {Butter, Bread} => {Milk} Antecedent Support: Hoeveel keer (in %) komt het antecedent voor? Consequent Confidence: Hoeveel keer (in %) volgt de consequent op de antecedent? 104

105 Association rules met Apriori Apriori Dimona Repertorium Rules: { } => {F} { } => {NF} { } => {F} { } => {F} Dataset Support % / Confidence % 105

106 Fraude opsporen met deze association rules Confidence Nieuwe data Mogelijke fraude { { { } => {F} } => {F} } => {F} 100% 99,8% 95% Association rules geordend volgens confidence 106

107 Geimplementeerd in SPSS Documentatie noodzakelijk! 107

108 Status case "sociale fraudebestrijding" Eerste resultaten veel belovend! Fraude = zoeken naar uitzonderingen Alle data is nodig > 50 miljoen records Performantie problemen op "gewone Pc" Migreren naar zwaardere servers 108

109 Predictive analytics initiatieven SMALS CASE 1: Strijd tegen de sociale fraude CASE 2: Traceerbaarheid 109

110 Traceerbaarheid Wat is de impact van een beleidsmaatregel op variabele Y? Resultaat na invoering maatregel Resultaat als maatregel niet ingevoerd was (y) (y') Impact van een maatregel (y - y') 110

111 Traceerbaarheid Wat is de impact van een beleidsmaatregel op variabele Y? y Invoeren nieuwe maatregel y??? y' tijd y' berekenen we met Predictive Analytics Zonder invoering maatregel Na invoering maatregel Impact maatregel 111

112 Traceerbaarheid Wat is de impact van een beleidsmaatregel op variabele Y? X X 2 X 3 X 4 Y old a a c c d 1 d e e d 2 X 1 X 2 X 3 X 4 Y a a c e 4 a a c e 5 Chronologische dataset Data voor maatregel Invoering nieuwe maatregel! Data na maatregel 112

113 Berekenen Y' zonder invoering maatregel 1. Bereken predictief model bij data voor maatregel X 1 X 2 X 3 X 4 a a c d d e e d Predictief model Y old Pas model toe op data na de maatregel om Y' te bekomen X 1 X 2 X 3 X 4 a a c e a a c e Predictief model Y'

114 Berekenen impact maatregel Resultaat na invoering maatregel Resultaat als maatregel niet ingevoerd was (y) (y') Impact van een maatregel (y - y') Gevonden dmv "Predictive Analytics"! 114

115 Wat hebben we geleerd van deze predictive analytics cases? Voorbereiden van data neemt veel tijd in beslag 115

116 Predictive analytics project aanpak 4. Feedback 3. Interpretatie en evaluatie 2. Predictive modeling 1. Voorbereiden data Kennis over de toekomst Data D1 D2 D3 D4 D5 Dataset Predictief model 116

117 Data voorbereiding is een interdisciplinair proces Verschillende rollen nemen deel Business expert(s) Data quality expert(s) Database expert(s) Predictive analytics expert(s) Data warehouse expert(s) 117

118 Wat hebben we geleerd van deze predictive analytics cases? Predictive analytics is geen "black box" 118

119 Predictive Analytics als een "black box" Beste predictief model Data Predictive Analytics tool 119

120 Mogelijk in tools als SPSS en SAS Kan zeer lang duren (meerdere dagen) Trage feedback loop Betere optie: Predictive analytics kennis intern opbouwen Zelf meeredeneren 120

121 Wat hebben we geleerd van deze predictive analytics cases? Bouw predictive analytics projecten gradueel uit 121

122 Predictive analytics is geen magische oplossing Start met kleinschalige predictive analytics experimenten Bouw groter project uit Gradueel interesse wekken van potentiele stakeholders 122

123 Wat hebben we geleerd van deze predictive analytics cases? My name is Predictive Analyst 123

124 Specifieke rol nodig voor predictive analytics! Analytics kennis Business kennis IT kennis Communicatie!! 124

125 Aanbevolen literatuur 125

126 Aanbevolen literatuur Interactief overzicht van meest courante datamining technieken! 126

127 Vragen? Deel 1 Predictive analytics aanpak Courante predictieve modellen Toepassingen van deze modellen Deel 2 Predictive analytics tools Predictive analytics cases Wat hebben we geleerd? 127

Slim Onderhoud Voorkomen lekkages en onnodige kosten. Seminar Datagestuurd Woningonderhoud

Slim Onderhoud Voorkomen lekkages en onnodige kosten. Seminar Datagestuurd Woningonderhoud Slim Onderhoud Voorkomen lekkages en onnodige kosten Seminar Datagestuurd Woningonderhoud Ralf Putter Business Consultant John Ciocoiu Technisch Consultant Data & Analytics Slim Onderhoud Value case Project

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

INZET VAN MACHINE LEARNING

INZET VAN MACHINE LEARNING INZET VAN MACHINE LEARNING VOORSTELLEN INHOUD Context wat is de staat van de verzekeringsindustrie? Machine Learning - wat is het eigenlijk en is het nieuw? Toepassingen waar wordt ML met succes toegepast?

Nadere informatie

Oplossingen Datamining 2II15 Juni 2008

Oplossingen Datamining 2II15 Juni 2008 Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:

Nadere informatie

Living Labs : NFI & RvdK Samen onderweg naar meer grip op data. JenV I-tour presentatie 24 april 2018

Living Labs : NFI & RvdK Samen onderweg naar meer grip op data. JenV I-tour presentatie 24 april 2018 Living Labs : NFI & RvdK Samen onderweg naar meer grip op data JenV I-tour presentatie 24 april 2018 1 Agenda Deel I - door Jannie RvdK Intermezzo filmpje I-plan JenV Deel II door Femke en Xandra NFI KInD

Nadere informatie

Hoe AI kan ingezet worden voor de analyse van asbesthoudende daken

Hoe AI kan ingezet worden voor de analyse van asbesthoudende daken Hoe AI kan ingezet worden voor de analyse van asbesthoudende daken Earth Observation Data Sciences www.vlaanderen.be/informatievlaanderen www.vito.be Workshop: Asbestinventarisatie en analyse Weerslag

Nadere informatie

Predictieve modellen - overzicht

Predictieve modellen - overzicht Predictieve modellen - overzicht 08-01-2018 Jochem Grietens Verhaert Alexander Frimout Verhaert 1 AI voor lichtcontrole Het doel is om de verlichting van de Vlaamse snelweg slimmer te maken met behulp

Nadere informatie

2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren.

2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren. 1. Veronderstel dat je als datamining consultant werkt voor een Internet Search Engine bedrijf. Beschrijf hoe datamining het bedrijf kan helpen door voorbeelden te geven van specifieke toepassingen van

Nadere informatie

MACHINE LEARNING. Een egocentrische presentatie door een data scientist van Axians. Michel van Gelder Data Scientist bij Axians

MACHINE LEARNING. Een egocentrische presentatie door een data scientist van Axians. Michel van Gelder Data Scientist bij Axians MACHINE LEARNING Een egocentrische presentatie door een data scientist van Axians Michel van Gelder Data Scientist bij Axians 1 MICHEL VAN GELDER Data Scientist Axians 2 A day in the life of.. 3 MACHINE

Nadere informatie

AI en Software Testing op de lange termijn

AI en Software Testing op de lange termijn AI en Software Testing op de lange termijn Is het een appel? Traditioneel programmeren AI Kleur = rood, groen, geel Vorm = rond Textuur = glad Artificial Intelligence Machine Learning Methods Technologies

Nadere informatie

Data Mining: Classificatie

Data Mining: Classificatie Data Mining: Classificatie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht Wat is classificatie? Leren van een beslissingsboom. Problemen

Nadere informatie

Tentamen Kunstmatige Intelligentie (INFOB2KI)

Tentamen Kunstmatige Intelligentie (INFOB2KI) Tentamen Kunstmatige Intelligentie (INFOB2KI) 30 januari 2014 10:30-12:30 Vooraf Mobiele telefoons dienen uitgeschakeld te zijn. Het tentamen bestaat uit 7 opgaven; in totaal kunnen er 100 punten behaald

Nadere informatie

Neurale Netwerken en Deep Learning. Tijmen Blankevoort

Neurale Netwerken en Deep Learning. Tijmen Blankevoort Neurale Netwerken en Deep Learning Tijmen Blankevoort De toekomst - Internet of Things De toekomst - sluiertipje Je gezondheid wordt continue gemonitored Je dieet wordt voor je afgestemd -> Stroomversnelling

Nadere informatie

Inhoud. Neuronen. Synapsen. McCulloch-Pitts neuron. Sigmoids. De bouwstenen van het zenuwstelsel: neuronen en synapsen

Inhoud. Neuronen. Synapsen. McCulloch-Pitts neuron. Sigmoids. De bouwstenen van het zenuwstelsel: neuronen en synapsen Tom Heskes IRIS, NIII Inhoud De bouwstenen van het zenuwstelsel: neuronen en synapsen Complex gedrag uit eenvoudige elementen McCulloch-Pitts neuronen Hopfield netwerken Computational neuroscience Lerende

Nadere informatie

Datamining: Graven in gegevens

Datamining: Graven in gegevens Datamining: Graven in gegevens Business Intelligence in de praktijk Jasper Lansink CMG Noord Nederland - Advanced Technology Agenda Business Intelligence Datamining theorie Datamining in de praktijk management

Nadere informatie

Hoofdvraag. Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ?

Hoofdvraag. Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ? Hoofdvraag Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ? Data visualisatie (Grafieken, dashboards); Kwantitatieve analyse (cijfers, statistiek); Software Inzichten

Nadere informatie

Vertrouwen en verbinden. R Huizinga en J Ciocoiu KPN Consulting

Vertrouwen en verbinden. R Huizinga en J Ciocoiu KPN Consulting Vertrouwen en verbinden R Huizinga en J Ciocoiu KPN Consulting Data: driver voor digitale transformatie Digitalisering aanjager van data management. Data management is aanjager van digitalisering. Van

Nadere informatie

Business Analytics bij. Zilveren Kruis. Rob Konijn Data Scientist Kenniscentrum. 12 mei 2016

Business Analytics bij. Zilveren Kruis. Rob Konijn Data Scientist Kenniscentrum. 12 mei 2016 Business Analytics bij Zilveren Kruis Rob Konijn Data Scientist Kenniscentrum Zilveren Kruis 12 mei 2016 Introductie Rob Konijn - Business Analytics (toen nog BWI) 2002-2008 - Phd VU (Wojtek Kowalczyk/Bert

Nadere informatie

Bestrijd illegale houtkap en red het regenwoud met HANA

Bestrijd illegale houtkap en red het regenwoud met HANA Bestrijd illegale houtkap en red het regenwoud met HANA Expertum NL, RFCx, SAP Dirk Kemper en Eline Bangert 14 Mei 2019 Oktober 2017 - SAP Run Live Truck Doel: App voor de rangers - Prototype binnen 5

Nadere informatie

Tentamen Data Mining

Tentamen Data Mining Tentamen Data Mining Algemene Opmerkingen Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. Laat bij het uitvoeren van berekeningen zien hoe je aan een antwoord gekomen bent.

Nadere informatie

2 2. STATISTICA Data Management

2 2. STATISTICA Data Management Overzicht Opleidingen Pagina 1. STATISTICA Introductie 2 2. STATISTICA Data Management 3 3. Grafische Data Analyse in STATISTICA 4 4. Introductie statistische Concepten en Methoden 5 5. Introductie STATISTICA

Nadere informatie

Opleiding Data Science

Opleiding Data Science Opleiding Data Science IT Academy Noord-Nederland zet zich in voor een krachtige ICT-arbeidsmarkt in het Noorden. Samen groeien. Data Scientist Beroep van de toekomst Op 4 maart 2019 start de vijfde editie

Nadere informatie

Data mining Van boodschappenmandjes tot bio-informatica

Data mining Van boodschappenmandjes tot bio-informatica Data mining Van boodschappenmandjes tot bio-informatica Walter Kosters Informatica, Universiteit Leiden donderdag 6 april 2006 http://www.liacs.nl/home/kosters/ 1 Wat is Data mining? Data mining probeert

Nadere informatie

Kunstmatige Intelligentie (AI) Hoofdstuk 18.7 van Russell/Norvig = [RN] Neurale Netwerken (NN s) voorjaar 2016 College 9, 19 april 2016

Kunstmatige Intelligentie (AI) Hoofdstuk 18.7 van Russell/Norvig = [RN] Neurale Netwerken (NN s) voorjaar 2016 College 9, 19 april 2016 AI Kunstmatige Intelligentie (AI) Hoofdstuk 18.7 van Russell/Norvig = [RN] Neurale Netwerken (NN s) voorjaar 2016 College 9, 19 april 2016 www.liacs.leidenuniv.nl/ kosterswa/ai/ 1 Hersenen De menselijke

Nadere informatie

twee partijen zijn. Aangezien het bij data mining gaat om grote hoeveelheden data is het belangrijk om praktische oplossingen te hebben.

twee partijen zijn. Aangezien het bij data mining gaat om grote hoeveelheden data is het belangrijk om praktische oplossingen te hebben. Samenvatting Deze thesis handelt over privacy preserving data mining. Data mining is een tak van de wetenschap waarin men grote hoeveelheden data onderzoekt met de bedoeling er bepaalde patronen in te

Nadere informatie

Artificial Intelligence. Tijmen Blankevoort

Artificial Intelligence. Tijmen Blankevoort Artificial Intelligence Tijmen Blankevoort Een intelligente revolutie Live spraak vertaling (Skype 2015) Zelfrijdende auto s (Meerdere bedrijven) Jeopardy winst (IBM 2013) Professioneel Go (Google 2016)

Nadere informatie

Het classificeren van hoortoestel modaliteiten m.b.v. een Big Data benadering: Latent Class Trees analyse

Het classificeren van hoortoestel modaliteiten m.b.v. een Big Data benadering: Latent Class Trees analyse Het classificeren van hoortoestel modaliteiten m.b.v. een Big Data benadering: Latent Class Trees analyse Simon Lansbergen & Wouter Dreschler Motivatie // Introductie 1. Veel verschillende hoortoestellen,

Nadere informatie

Wat is nieuw in Enterprise Guide

Wat is nieuw in Enterprise Guide Enterprise Guide 42 4.2 Lieve Goedhuys Copyright 2009 SAS Institute Inc. All rights reserved. Wat is nieuw in Enterprise Guide Vereenvoudigde interface Gebruikersinterface i Project recovery Conditionele

Nadere informatie

DATA MINING (TI2730-C)

DATA MINING (TI2730-C) Technische Universiteit Delft Elektrotechniek, Wiskunde en Informatica Secties: Pattern Recognition & Bioinformatics & Multimedia Signal Processing DATA MINING (TI2730-C) Schriftelijk (her)tentomen. Dinsdag

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

EEN LEAR N I NG ANALYTICS S ER VI CE JOHAN JEUR ING

EEN LEAR N I NG ANALYTICS S ER VI CE JOHAN JEUR ING EEN LEAR N I NG ANALYTICS S ER VI CE JOHAN JEUR ING INTRODUCTIE De opdrachtgever voor dit project is Johan Jeuring, van het departement Informatica van de Universiteit Utrecht, namens het projectteam van

Nadere informatie

Python voor dataanalyse

Python voor dataanalyse Python voor dataanalyse 5 De reden dat deze cursus gebruik maakt van Python is dat deze taal in technisch-wetenschappelijke kringen steeds vaker gebruikt wordt. Vooral voor het visualiseren en analyseren

Nadere informatie

Uitwerking Tentamen Datamining (2II15) 26/06/09

Uitwerking Tentamen Datamining (2II15) 26/06/09 Uitwerking Tentamen Datamining (2II15) 26/06/09 1. (3p) (Clustering) Welke van de volgende uitspraken zijn correct? Voor de correcte uitspraken: leg uit, voor de incorrecte: geef een tegenvoorbeeld. (a)

Nadere informatie

Data driven. Het plan naar data driven business door advanced analytics Business.

Data driven. Het plan naar data driven business door advanced analytics Business. Data driven. Het plan naar data driven business door advanced analytics Business. Analytics: uw data slim gebruiken en zo uw business optimaliseren! Marijn Uilenbroek BIA Consultant, Sogeti BI & Analytics

Nadere informatie

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15) KWANTITATIEF TESTEN experimenteel ontwerp (MIT 14) statistische analyse (MIT 15) tips Google Wikipedia MIT 14, 15 stats.stackexhchange.com ander onderzoek dat lijkt op het jouwe experimenteel ontwerp kwantitatieve

Nadere informatie

Verschillende softwaresystemen

Verschillende softwaresystemen Verschillende softwaresystemen 4orange, 2016 Hogehilweg 24 1101 CD Amsterdam Zuidoost www.4orange.nl 2 Verschillende software systemen CRM, Leadmanagement CRM Lead management tools Microsoft Dynamics CRM,

Nadere informatie

Tentamen in2205 Kennissystemen

Tentamen in2205 Kennissystemen TECHNISCHE UNIVERSITEIT DELFT Faculteit Elektrotechniek, Wiskunde en Informatica Tentamen in2205 Kennissystemen 21 Januari 2010, 14:0017:00 Dit tentamen heeft 5 meerkeuzevragen in totaal goed voor 10 punten

Nadere informatie

DATAMODELLERING TOEPASSEN DATA ANALYTICS

DATAMODELLERING TOEPASSEN DATA ANALYTICS DATAMODELLERING TOEPASSEN DATA ANALYTICS Inleiding In dit whitepaper wordt een toepassingsgebied beschreven voor datamodellering. Een toepassing is een werkveld op het vlak van architectuur of modellering

Nadere informatie

Selenium IDE Webdriver. Introductie

Selenium IDE Webdriver. Introductie Selenium IDE Webdriver Het Wielsem 10, 5231 BW s- Hertogenbosch, telefoon 073-6409311 e- mail info@testwork.nl internet http://www.testwork.nl 1 Inhoudsopgave 1 Inhoudsopgave... 2 2 Selenium IDE... 3 3

Nadere informatie

AI introductie voor testers

AI introductie voor testers AI introductie voor testers De basis van deep learning TestNet werkgroep Testen met AI Martin van Helden Sander Mol Introductie Artificial Intelligence (AI) is anders dan traditioneel programmeren. Traditioneel

Nadere informatie

Data-gedreven prestaties verbeteren: de toekomst van ons adviesvak. November 2017

Data-gedreven prestaties verbeteren: de toekomst van ons adviesvak. November 2017 Data-gedreven prestaties verbeteren: de toekomst van ons adviesvak November 2017 Inhoudsopgave 1. HofP Digital Impact 2. Zeer korte intro in advanced analytics & de rol van de (interne) adviseur 3. Een

Nadere informatie

Data Mining: Inleiding

Data Mining: Inleiding Data Mining: Inleiding docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining 2II15: Data mining en kennissystemen Lessen: maandag 7de en 8ste uur in Auditorium

Nadere informatie

Hoe goed is een test?

Hoe goed is een test? Hoe goed is een test? 1.0 het ideale plaatje Als we een test uitvoeren om te ontdekken of iemand ziek is hebben we het liefst een test waarbij de gezonde en de zieke groepen duidelijk gescheiden zijn.

Nadere informatie

Open Source Analytics

Open Source Analytics Thema Business Intelligence Aantrekkelijke aanvullingen op standaard BI-implementaties Open Source Analytics Jos van Dongen In een BI-special mag een artikel over Open Source BI-tools natuurlijk niet ontbreken.

Nadere informatie

De geïntegreerde architectuur van Informatie- en Operationele Techniek. Jurg Bremmer (sr. Consultant - )

De geïntegreerde architectuur van Informatie- en Operationele Techniek. Jurg Bremmer (sr. Consultant - ) De geïntegreerde architectuur van Informatie- en Operationele Techniek Jurg Bremmer (sr. Consultant - ) Welkom Agenda Introductie Informatie architectuur Voorbeelden Aanpak Discussie Jurg Bremmer sr. Consultant

Nadere informatie

Disclosure Belangen Spreker

Disclosure Belangen Spreker 1 Geen (potentiële) belangenverstengeling Disclosure Belangen Spreker Voor bijeenkomst mogelijk relevante relaties: Sponsoring of onderzoeksgeld - Honorarium of andere (financiële ) vergoedingen Aandeelhouder

Nadere informatie

Masterproeven 2012-2013 Wireless & Cable Research Group (WiCa)

Masterproeven 2012-2013 Wireless & Cable Research Group (WiCa) Masterproeven 2012-2013 Wireless & Cable Research Group (WiCa) Aanbevelingssystemen Vakgroep Informatietechnologie Onderzoeksgroep WiCa WiCa Wireless 13 onderzoekers Cable 3 onderzoekers Fysische laag

Nadere informatie

Informatie- Gestuurd. Handhaven. Pilot Uitkeringsfraude

Informatie- Gestuurd. Handhaven. Pilot Uitkeringsfraude Pilot Uitkeringsfraude Informatie- Gestuurd Handhaven InformatieGestuurd Handhaven GBI Ooit Gezamenlijke Backoffice Inkomen Nu Gemeentelijke Basisprocessen Inkomen 2 het IGH-model InformatieGestuurd Handhaven

Nadere informatie

Zelftest Java concepten

Zelftest Java concepten Zelftest Java concepten Document: n0838test.fm 22/03/2012 ABIS Training & Consulting P.O. Box 220 B-3000 Leuven Belgium TRAINING & CONSULTING INLEIDING BIJ DE ZELFTEST JAVA CONCEPTEN Om de voorkennis nodig

Nadere informatie

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data An Carbonez Leuven Statistics Research Centre Katholieke Universiteit Leuven Voorstelling van de

Nadere informatie

Data gedreven innoveren, hoe doe je dat?

Data gedreven innoveren, hoe doe je dat? Data gedreven innoveren, hoe doe je dat? 1990 Database Marketing 2000 Customer Intelligence 2010 BI & Data Warehouses Today: Big Data Analytics About me Data Science Advanced Business Intelligence Big

Nadere informatie

Veilige en efficiënte inspectie van het spoor Inzending Hendrik Lorentz Data Science Prijs

Veilige en efficiënte inspectie van het spoor Inzending Hendrik Lorentz Data Science Prijs Veilige en efficiënte inspectie van het spoor Inzending Hendrik Lorentz Data Science Prijs Clemens Schoone (Inspectation), Huub van den Broek (CQM) Nederland heeft het drukst bereden spoornet van Europa.

Nadere informatie

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15) KWANTITATIEF TESTEN experimenteel ontwerp (MIT 14) statistische analyse (MIT 15) tips Google Wikipedia MIT 14, 15 stats.stackexchange.com ander onderzoek dat lijkt op het jouwe experimenteel ontwerp kwantitatieve

Nadere informatie

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel. Opdracht 2a ----------- Stamdiagrammen, histogrammen, tijdreeksgrafieken De Old Farmers Almanac vermeldt de groeiseizoenen voor de grote steden in de V.S., zoals gerapporteerd door het National Climatic

Nadere informatie

Een foto zegt meer dan duizend woorden

Een foto zegt meer dan duizend woorden Een foto zegt meer dan duizend woorden Open Circle Solutions Inhoud 3 4 6 8 9 10 Beeldherkenning Hoe werkt het De mogelijkheden van beeldherkenning OCS beeldherkenning 6-stappenplan Beeldherkenning op

Nadere informatie

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA Masterclass: advanced statistics Bianca de Greef Sander van Kuijk Afdeling KEMTA Inhoud Masterclass Deel 1 (theorie): Achtergrond regressie Deel 2 (voorbeeld): Keuzes Output Model Model Dependent variable

Nadere informatie

Toegang tot HiSPARC gegevens jsparc bibliotheek Data retrieval 3.1 Downloaden van data

Toegang tot HiSPARC gegevens jsparc bibliotheek Data retrieval 3.1 Downloaden van data Data analyse HiSPARC Data retrieval A.P.L.S. de Laat 1 Toegang tot HiSPARC gegevens De data opslag van HiSPARC meetgegevens gebeurt op het Nikhef en bestaat uit een paar databases. Als eerst is er de ruwe

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

URBAN SCIENCE. Professor Nanda Piersma Michael Hogenboom

URBAN SCIENCE. Professor Nanda Piersma Michael Hogenboom URBAN SCIENCE Professor Nanda Piersma Michael Hogenboom Nanda Piersma Hogeschool van Amsterdam (HvA) Centrum Wiskunde & Informatica (CWI) URBAN TECHNOLOGY SOLUTIONS FOR SUSTAINABLE, LIVEABLE AND CONNECTED

Nadere informatie

Zelftest Informatica-terminologie

Zelftest Informatica-terminologie Zelftest Informatica-terminologie Document: n0947test.fm 01/07/2015 ABIS Training & Consulting P.O. Box 220 B-3000 Leuven Belgium TRAINING & CONSULTING INTRODUCTIE Deze test is een zelf-test, waarmee u

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

A Data Driven Journey Pieter de Kok RA AANJAGER CONEY. 31 oktober 2018

A Data Driven Journey Pieter de Kok RA AANJAGER CONEY. 31 oktober 2018 A Data Driven Journey Pieter de Kok RA AANJAGER CONEY 31 oktober 2018 MIJN DATA REIS 1994 HBO ACCOUNTANCY SCRIPTIE EDI AND CHANGING ROLE OF AUDITOR MIJN DATA REIS 1995 MIJN DATA REIS 1999 RA STUDIE AFSTUDEER

Nadere informatie

User Profile Repository Testrapportage kwaliteit

User Profile Repository Testrapportage kwaliteit CatchPlus User Profile Repository Testrapportage kwaliteit Versie 1.1 User Profile Repository Testrapportage kwaliteit Versie: 1.1 Publicatiedatum: 20-4-2012 Vertrouwelijk GridLine B.V., 2012 Pagina 1

Nadere informatie

Nationale DenkTank 2014 Big Data Academy

Nationale DenkTank 2014 Big Data Academy Big Data Academy Achtergrond en uitwerking Big Data Academy (BDA) Management Summary Oplossing [Twintig] deelnemers waarvan [80%] masterstudenten en PhD s en[20%] werknemers die voldoen aan de voorkenniseisen

Nadere informatie

Tentamen Data Mining. Algemene Opmerkingen. Opgave L. Korte vragen (L6 punten) Tijd: 14:00-17:00. Datum: 4januai20l6

Tentamen Data Mining. Algemene Opmerkingen. Opgave L. Korte vragen (L6 punten) Tijd: 14:00-17:00. Datum: 4januai20l6 Tentamen Data Mining Datum: 4januai2l6 Tijd: 4: - 7: Algemene Opmerkingen e Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. o Laat bij het uitvoeren van berekeningen zien hoeje

Nadere informatie

Chapter 7 Samenvatting

Chapter 7 Samenvatting Chapter 7 Samenvatting Het zit in de menselijke natuur om patronen te ontdekken in data. Mensen en dieren leren van de omgeving en bouwen zo kennis en intelligentie op. Methoden om theorie uit data af

Nadere informatie

In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen.

In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen. Leerlijn programmeren In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen. Deze leerlijn is opgebouwd aan de

Nadere informatie

Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016

Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016 Artificial Intelligence in uw dagelijkse praktijk Hilversum, 22 September 2016 Agenda 09:30 Welkom en introductie 09:35 Artificial Intelligence, al meer dan 50 jaar een actief onderzoeksgebied Jaap van

Nadere informatie

HET POLICY LAB. Tjerk Timan. ScienceWorks 25 mei 2018

HET POLICY LAB. Tjerk Timan. ScienceWorks 25 mei 2018 HET POLICY LAB Tjerk Timan ScienceWorks 25 mei 2018 SAMENVATTING Het Policy Lab doet gecontroleerde experimenten voor het ontwikkelen van data gedreven beleid zodat beleidsmakers veilig kunnen experimenteren

Nadere informatie

Het Kloppend Marketing Autohart BIG Auto Data. Kijkje in onze keuken

Het Kloppend Marketing Autohart BIG Auto Data. Kijkje in onze keuken Het Kloppend Marketing Autohart BIG Auto Data Kijkje in onze keuken Kwaliteit boven ALLES De datakwaliteit top-10: 1. Filteren = met minder MEER doen 2. Altijd maximaal 1x dezelfde fout maken 3. Niks Black

Nadere informatie

The best of both worlds D O O R J E R O E N L I J Z E N G A EN E M I E L H E I N S B R O E K

The best of both worlds D O O R J E R O E N L I J Z E N G A EN E M I E L H E I N S B R O E K The best of both worlds D O O R J E R O E N L I J Z E N G A EN E M I E L H E I N S B R O E K Het nieuwe toverwoord: Datascience Using automated methods to analyze massive amounts of data and to extract

Nadere informatie

Safety analytics, een nieuwe toekomst voor preventie? 15 maart 2011 Limburghal Genk

Safety analytics, een nieuwe toekomst voor preventie? 15 maart 2011 Limburghal Genk BEHAVIORAL SAFETY Safety analytics, een nieuwe toekomst voor preventie? door Luk Smeyers, managing director & partner inostix, Human Capital Intelligence 15 maart 2011 Limburghal Genk PreBes vzw Diestersteenweg

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

Statistiekcursus aan het Gymnasium

Statistiekcursus aan het Gymnasium Statistiekcursus aan het Gymnasium Hannes Stoppel Max-Planck-Gymnasium Gelsenkirchen Duitsland (Bewerking: L. Sialino en S. Biesheuvel) Niveau VWO-Leerlingen die de basis van de statistiek kennen. Kennis

Nadere informatie

AI en Data mining. Van AI tot Data mining. dr. Walter Kosters, Universiteit Leiden. Gouda woensdag 17 oktober

AI en Data mining. Van AI tot Data mining. dr. Walter Kosters, Universiteit Leiden. Gouda woensdag 17 oktober AI en Data mining Van AI tot Data mining dr. Walter Kosters, Universiteit Leiden Gouda woensdag 17 oktober 2007 www.liacs.nl/home/kosters/ 1 Wat is Data mining? Data mining probeert interessante en (on)verwachte

Nadere informatie

Gemeente Rotterdam TNO Ministerie van OCW Ministerie van BZK. Rotterdamse Data Science Analyse Jeugd

Gemeente Rotterdam TNO Ministerie van OCW Ministerie van BZK. Rotterdamse Data Science Analyse Jeugd Gemeente Rotterdam TNO Ministerie van OCW Ministerie van BZK Rotterdamse Data Science Analyse Jeugd 20-5-2019 Rotterdam Groeit: evidentie en interactie Potentie van de stad waarmaken: kansrijk, veilig

Nadere informatie

Whitepaper. Personal Targeting Platform. De juiste content Op het juiste moment Aan de juiste persoon

Whitepaper. Personal Targeting Platform. De juiste content Op het juiste moment Aan de juiste persoon Whitepaper Personal Targeting Platform De juiste content Op het juiste moment Aan de juiste persoon Introductie 2 Geïntegreerde personalisering 2 Het opbouwen van een profiel 2 Segmenteren en personaliseren

Nadere informatie

Continuous Learning in Computer Vision S.L. Pintea

Continuous Learning in Computer Vision S.L. Pintea Continuous Learning in Computer Vision S.L. Pintea Continuous Learning in Computer Vision Natura non facit saltus. Gottfried Leibniz Silvia-Laura Pintea Intelligent Sensory Information Systems University

Nadere informatie

Toekomstbestending maken van selectie tool Rekening houdend met strikte privacy wetgeving

Toekomstbestending maken van selectie tool Rekening houdend met strikte privacy wetgeving Toekomstbestending maken van selectie tool Rekening houdend met strikte privacy wetgeving Kurt.Merchiers@colruytgroup.com Functioneel Analist Roel.Van.Assche@sas.com Consultant Agenda Vervanging van de

Nadere informatie

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens Hieronder wordt uitgelegd hoe alle analyses besproken in paragraaf 6.5 van

Nadere informatie

Minor Data Science (NIOC april)

Minor Data Science (NIOC april) Minor Data Science 2015-2016 (NIOC 2015-23 april) Tony Busker, Jan Kroon en Sunil Choenni (Instituut voor Communicatie, Media- en Informatietechnologie, Hoegeschool Rotterdam) Sunil Choenni en Mortaza

Nadere informatie

Training statistiek NEN-689. Blok 2 Software voor: (1) Statistisch toetsen van werkplekmetingen (2) Boxplot voor rapport

Training statistiek NEN-689. Blok 2 Software voor: (1) Statistisch toetsen van werkplekmetingen (2) Boxplot voor rapport Training statistiek NEN-689 Blok 2 Software voor: (1) Statistisch toetsen van werkplekmetingen (2) Boxplot voor rapport 1 Eisen software voor statistische toetsing van meetseries 1. OEL-compliance test

Nadere informatie

Base24 database suite

Base24 database suite Base24 database suite Introductie De Base24 database suite is een zeer geavanceerde database oplossing die ontworpen is voor de management, opslag, inzage en uitwisseling van medische informatie zoals

Nadere informatie

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as.

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as. Opdracht 6a ----------- Dichtheidskromme, normaal-kwantiel-plot Een nauwkeurige waarde van de lichtsnelheid is van belang voor ontwerpers van computers, omdat de elektrische signalen zich uitsluitend met

Nadere informatie

Vandaag. Uur 1: Differentiaalvergelijkingen Uur 2: Modellen

Vandaag. Uur 1: Differentiaalvergelijkingen Uur 2: Modellen Vandaag Uur 1: Differentiaalvergelijkingen Uur 2: Modellen Diferentiaalvergelijkingen Wiskundige beschrijving van dynamische processen Vergelijking voor y(t): grootheid die in de tijd varieert Voorbeelden:

Nadere informatie

Voorspel uw toekomstige. afzet met Sales & Operations Planning. Rene van Luxemburg. Ilja Kempenaars

Voorspel uw toekomstige. afzet met Sales & Operations Planning. Rene van Luxemburg. Ilja Kempenaars Voorspel uw toekomstige Rene van Luxemburg Ilja Kempenaars afzet met Sales & Operations Planning Break-out sessie Break-out sessie S.&.O.P. & Forecasting Forecast Pro applicatie Effectief? Ja! Duur? Nee!

Nadere informatie

Smart Maintenance. Het realiseren van een intelligente Maintenance inrichting door het slim gebruik van Data analytics

Smart Maintenance. Het realiseren van een intelligente Maintenance inrichting door het slim gebruik van Data analytics Smart Maintenance Het realiseren van een intelligente Maintenance inrichting door het slim gebruik van Data analytics 05-10-2016 Maintenance meets service logistiek 05-10-2016 Kasper Groenbroek Siebrand

Nadere informatie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen

Nadere informatie

Data Mining: Classificatie

Data Mining: Classificatie Data Mining: lassificatie docent: dr. Toon alders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Vorige les lassificatie: Het groeperen van objecten in voorgedefinieerde

Nadere informatie

Functionaliteiten 4orange Connect

Functionaliteiten 4orange Connect Functionaliteiten 4orange Connect 4orange, 2014 Hogehilweg 24 1101 CD Amsterdam Zuidoost www.4orange.nl 2 4orange Connect: de nieuwste release van FileFrame 4orange Connect is de nieuwste release van FileFrame.

Nadere informatie

Verband tussen twee variabelen

Verband tussen twee variabelen Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en

Nadere informatie

Technologie: TI-Nspire CX CAS Niveau: beginner

Technologie: TI-Nspire CX CAS Niveau: beginner Introductie : Statistiek met de TI-Nspire CX CAS Met de TI-Nspire hebben we een groot aantal statistische functies tot onze beschikking die het rekenwerk binnen de beschrijvende statistiek vergemakkelijken.

Nadere informatie

Minder Big data Meer AI.

Minder Big data Meer AI. Minder Big data Meer AI. Minder Big data, meer AI. Marijn uilenbroek BI & Analytics consultant Utrecht, 1 november 2016 BI&A symposium 2016 Minder Big data meer AI 2 BI&A symposium 2016 Minder Big data

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

MISSING DATA van gatenkaas naar valide uitkomsten

MISSING DATA van gatenkaas naar valide uitkomsten MISSING DATA van gatenkaas naar valide uitkomsten Sander M.J. van Kuijk Afdeling Klinische Epidemiologie en Medical Technology Assessment sander.van.kuijk@mumc.nl Inhoud Masterclass Theorie over missing

Nadere informatie

Van HR reporting naar HR analytics. @ VOCAP Park Inn Radisson, Leuven

Van HR reporting naar HR analytics. @ VOCAP Park Inn Radisson, Leuven Van HR reporting naar HR analytics @ VOCAP Park Inn Radisson, Leuven Dr. Jeroen Delmotte Chief Scientist & Co-Founder Dinsdag 29 september 2015 Programma 1. Voorstelling 2. Wat is HR Analytics? 3. HR is

Nadere informatie

Anomaliedetectie en patroonherkenning

Anomaliedetectie en patroonherkenning Digitale overheid van de Toekomst, 28 september 2016 Anomaliedetectie en patroonherkenning binnen de loonaangifteketen Dr. Ralph Foorthuis Voorstelrondje Werkervaring Sr. enterprise architect bij UWV Werkzaam

Nadere informatie

Inleiding Programmeren 2

Inleiding Programmeren 2 Inleiding Programmeren 2 Gertjan van Noord November 26, 2018 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te

Nadere informatie