Data Mining: Clustering

Maat: px
Weergave met pagina beginnen:

Download "Data Mining: Clustering"

Transcriptie

1 Data Mining: Clustering docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Wat is clustering? Het onderverdelen van de objecten in een database in homogene groepen. Input: Relatie R(A,, A n ) Output: { C,, C n } met C,, C n R Criterium: Gelijkenis binnen groep is groter dan gelijkenis tussen objecten van verschillende groepen.

2 Wat is clustering? Intra-cluster afstanden minimaliseren Inter-cluster afstanden maimaliseren Toepassingen van cluster analse Begrijpen Groepeer gerelateerde documenten, genen, stocks, Samenvatten 4 Reduceer de grootte van de dataset; individuele punten worden samengevat door hun cluster Discovered Clusters Applied-Matl-DOWN,Ba-Network-Down,-COM-DOWN, Cabletron-Ss-DOWN,CISCO-DOWN,HP-DOWN, DSC-Comm-DOWN,INTEL-DOWN,LSI-Logic-DOWN, Micron-Tech-DOWN,Teas-Inst-Down,Tellabs-Inc-Down, Natl-Semiconduct-DOWN,Oracl-DOWN,SGI-DOWN, Sun-DOWN Apple-Comp-DOWN,Autodesk-DOWN,DEC-DOWN, ADV-Micro-Device-DOWN,Andrew-Corp-DOWN, Computer-Assoc-DOWN,Circuit-Cit-DOWN, Compaq-DOWN, EMC-Corp-DOWN, Gen-Inst-DOWN, Motorola-DOWN,Microsoft-DOWN,Scientific-Atl-DOWN Fannie-Mae-DOWN,Fed-Home-Loan-DOWN, MBNA-Corp-DOWN,Morgan-Stanle-DOWN Baker-Hughes-UP,Dresser-Inds-UP,Halliburton-HLD-UP, Louisiana-Land-UP,Phillips-Petro-UP,Unocal-UP, Schlumberger-UP Industr Group Technolog-DOWN Technolog-DOWN Financial-DOWN Oil-UP Clusters van neerslag in Australia

3 Notie Cluster is vaak ambigu Hoeveel clusters? 6? Of? Misschien 4? Tpes van clusterings Een clustering is een verzameling clusters Hiërarchische en partitionele clusterings. { C,, C n } is een Partitional Clustering: C i C j = {} voor alle i < j n Hiërarchische clustering: C i C j = {} of C i C j = C i of C i C j = C j voor alle i < j n

4 Partitionele Clustering Originele punten Partitionele clustering Hiërarchische Clustering p p p p4 p p p p4 Traditionele Hiërarchische Clustering Traditioneel Dendrogram p p p p4 p p p p4 Niet-traditionele Hiërarchische Clustering Niet-traditioneel Dendrogram

5 Clustering Algoritmes K-means en varianten Densit-based clusterings Hierarchische clusterings K-means Clustering Partitionele clustering benadering Elke cluster wordt geassocieerd met een centroid (centraal punt) Elk punt gaat naar de cluster met de dichtstbijzijnde centroid Aantal clusters K moet vooraf gespecifieerd worden

6 K-Means Clustering Veronderstelling: We hebben een afstandsmaat op D en we kunnen van een verzameling punten S het centrum bepalen centroid(s). Input: constante K, database D, afstandsmaat d Output: Partitie {C,, C K } van D zodanig dat: i {,, K}: C i : j {,, K}: i j d(,centroid(c i )) d(, centroid(c j )) (Elk punt is dichter bij z n eigen centroid dan bij elke andere centroid) K-Means Clustering

7 K-means: Voorbeeld Iteration K-means: Voorbeeld Iteration Iteration Iteration Iteration 4 Iteration 5 Iteration

8 Belang van een goede keuze van de initiële centroids.5 Originele Punten Optimale Clustering Sub-optimale Clustering Belang van een goede keuze van de initiële centroids Iteration

9 Belang van een goede keuze van de initiële centroids Iteration Iteration Iteration Iteration 4 Iteration Problemen bij de selectie van initiële pntn Als er K echte clusters zijn, is de kans relatief klein dat we in elke echte cluster een punt hebben: Als alle echte clusters grootte n hebben: Bijvoorbeeld, als K =, dan is de kans slechts =!/ =.6 (!!) Soms komt dit nog goed tijdens het algoritme, soms ook niet.

10 Oplossingen voor dit probleem Meerdere runs Helpt, maar de kansen zijn erg laag Gebruik ander algoritme om clusters te vinden en gebruik deze als input voor K-means Selecteer meer dan K initiele centroids Selecteer achteraf de verst van elkaar gelegen clusters Postprocessing Beperkingen van K-means K-means heeft problemen als de clusters te erg verschillen qua grootte de clusters te erg verschillen qua densiteit De clusters geen bolvorm hebben De data outliers bevat De dimensionaliteit van de data hoog is

11 Beperkingen: verschillende groottes Originele punten K-means ( Clusters) Beperkingen: verschillende densiteit Originele punten K-means ( Clusters)

12 Beperkingen: geen bolvorm Originele punten K-means ( Clusters) Oplossingen voor de beperkingen Originele punten K-means Clustering Een oplossing is K veel groter nemen dan het veronderstelde aantal clusters Achteraf worden dicht bij elkaar gelegen clusters samengevoegd

13 Oplossingen voor de beperkingen Originele punten K-means Clustering Oplossingen voor de beperkingen Originele punten K-means Clustering

14 Clustering Algoritmes K-means en varianten Densit-based clusterings Hiërarchische clusterings Densit-based clustering

15 Densit-based clustering DBSCAN DBSCAN is hierop gebaseerd Input: een afstandsmaat d een dataset D Getallen µ en ε Output: Een partitionering { C,, C n } van D zodat: Voor alle punten, die voldoen aan volgende voorwaarde geldt dat ze in dezelfde cluster zitten: { z d(,z) ε } µ en { z d(,z) ε } µ en d(,) ε

16 Densit-based clustering: DBSCAN ε -densiteit van een punt = aantal punten binnen straal ε Een punt is een (ε, µ) -core punt indien er meer dan µ punten zijn binnen een straal ε Een (ε, µ) -border punt heeft minder dan µ punten binnen straal ε, maar ligt binnen een straal ε van ten minste een core punt Alle andere punten worden ruis punten genoemd. Densit-based clustering: DBSCAN Een punt is (ε, µ)-densit-reachable vanuit punt indien er een sequentie c,, c k van (ε,µ)-core punten bestaat zodanig dat: d(,c ) ε i {,, n-} : d(c i,c i+ ) ε d(c n,) ε Opmerking: berekening van alle paren (,) zodat (ε, µ)-densit-reachable vanuit een core punt = berekenen van transitieve afsluiting.

17 DBSCAN: Core, Border, en Ruis Punten DBSCAN Algorithm. Elimineer de ruis punten. i=. Zolang er core punten zijn die nog niet aan een cluster zijn toegekend: Neem een willekeurig nog niet toegekend core point c C i = { is (ε,µ)- densit reachable vanuit c, is nog niet toegekend} i := i+ 4. Return { C,, C i- }

18 Voorbeeld: DBSCAN Eerste punt wordt geselecteerd Alle punten die densitreachable zijn worden aan de cluster toegevoegd Tweede selectie Tweede cluster wordt gevormd Derde selectie en constructie van de cluster DBSCAN: Core, Border and Noise Points Originele punten Punt tpes: core, border en noise ε =, µ = 4

19 Waneer werkt DBSCAN goed? Originele punten Clustering Resistent voor ruis Kan clusters met verschillende vormen en groottes aan Wanneer werkt DBSCAN niet goed? Originele punten (µ =4, ε = 9.75) Variërende densiteit Hoog dimensionele data (µ =4, ε = 9.9)

20 DBSCAN: Bepalen van ε en µ Voor punten binnen een cluster is de afstand tot hun k-de buur ongeveer gelijk Ruis punten hebben hun k-de buur op veel grotere afstand Dus, plot de cumulatieve distributie van de afstand tussen alle punten en hun k-de buur. DBSCAN: Bepalen van ε en µ

21 Conclusies Clustering is het onderverdelen van de objecten in een database in homogene groepen Notie van een cluster is ambigu Twee partitieve algoritmes K-Means DBSCAN Conclusies K-Means Aantal clusters K gegeven Elk punt ligt dichter bij z n eigen cluster center dan bij de centra van de andere clusters DBSCAN Gebaseerd op dichtheid Twee punten op korte afstand in dichtbevolkt gebied moeten tot dezelfde cluster behoren Aantal clusters niet op voorhand bepaald Clustering-algoritmes scoren slecht in hoogdimensionele data

Data Mining: Classificatie

Data Mining: Classificatie Data Mining: Classificatie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht Wat is classificatie? Leren van een beslissingsboom. Problemen

Nadere informatie

Data Mining: Data kwaliteit, Preprocessing

Data Mining: Data kwaliteit, Preprocessing Data Mining: Data kwaliteit, Preprocessing docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Herhaling: definitie Data Mining is: Extractie van interessante

Nadere informatie

Uitwerking Tentamen Datamining (2II15) 26/06/09

Uitwerking Tentamen Datamining (2II15) 26/06/09 Uitwerking Tentamen Datamining (2II15) 26/06/09 1. (3p) (Clustering) Welke van de volgende uitspraken zijn correct? Voor de correcte uitspraken: leg uit, voor de incorrecte: geef een tegenvoorbeeld. (a)

Nadere informatie

2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren.

2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren. 1. Veronderstel dat je als datamining consultant werkt voor een Internet Search Engine bedrijf. Beschrijf hoe datamining het bedrijf kan helpen door voorbeelden te geven van specifieke toepassingen van

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

Inleiding Adaptieve Systemen Hoofdstuk 5: Ongesuperviseerd Leren

Inleiding Adaptieve Systemen Hoofdstuk 5: Ongesuperviseerd Leren Inleiding Adaptieve Systemen Hoofdstuk 5: Ongesuperviseerd Leren Cursusjaar 2017-2018 Gerard Vreeswijk β-faculteit, Departement Informatica en Informatiekunde, Leerstoelgroep Intelligente Systemen 21 maart

Nadere informatie

Oplossingen Datamining 2II15 Juni 2008

Oplossingen Datamining 2II15 Juni 2008 Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:

Nadere informatie

d(w j, x i ) d(w l, x i ) Voorbeeld

d(w j, x i ) d(w l, x i ) Voorbeeld Transparanten bij het vak Inleiding Adaptieve Systemen: Unsupervised Leren/ Self organizing networks. M. Wiering Unsupervised Learning en Self Organizing Networks Leerdoelen: Weten wat unsupervised learning

Nadere informatie

Mogelijkheden en keuzes bij het clusteren van onderwijsdata

Mogelijkheden en keuzes bij het clusteren van onderwijsdata 1 Mogelijkheden en keuzes bij het clusteren van onderwijsdata Hanneke van der Hoef Matthijs J Warrens ORD Nijmegen 14 juni 2018 2 Mogelijkheden en keuzes bij het clusteren van onderwijsdata Overzicht Clusteranalyse

Nadere informatie

Tentamen Data Mining. Algemene Opmerkingen. Opgave L. Korte vragen (L6 punten) Tijd: 14:00-17:00. Datum: 4januai20l6

Tentamen Data Mining. Algemene Opmerkingen. Opgave L. Korte vragen (L6 punten) Tijd: 14:00-17:00. Datum: 4januai20l6 Tentamen Data Mining Datum: 4januai2l6 Tijd: 4: - 7: Algemene Opmerkingen e Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. o Laat bij het uitvoeren van berekeningen zien hoeje

Nadere informatie

Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation.

Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Author: Witsenburg, Tijn Title: Hybrid similarities : a method to insert relational information

Nadere informatie

Tentamen Data Mining

Tentamen Data Mining Tentamen Data Mining Algemene Opmerkingen Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. Laat bij het uitvoeren van berekeningen zien hoe je aan een antwoord gekomen bent.

Nadere informatie

Inleiding Adaptieve Systemen Hoofdstuk 5: Ongesuperviseerd Leren

Inleiding Adaptieve Systemen Hoofdstuk 5: Ongesuperviseerd Leren Inleiding Adaptieve Systemen Hoofdstuk 5: Ongesuperviseerd Leren Cursusjaar 2014-2015 Gerard Vreeswijk β-faculteit, Departement Informatica en Informatiekunde, Leerstoelgroep Intelligente Systemen 17 juni

Nadere informatie

twee partijen zijn. Aangezien het bij data mining gaat om grote hoeveelheden data is het belangrijk om praktische oplossingen te hebben.

twee partijen zijn. Aangezien het bij data mining gaat om grote hoeveelheden data is het belangrijk om praktische oplossingen te hebben. Samenvatting Deze thesis handelt over privacy preserving data mining. Data mining is een tak van de wetenschap waarin men grote hoeveelheden data onderzoekt met de bedoeling er bepaalde patronen in te

Nadere informatie

Data Mining: Classificatie

Data Mining: Classificatie Data Mining: lassificatie docent: dr. Toon alders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Vorige les lassificatie: Het groeperen van objecten in voorgedefinieerde

Nadere informatie

Data Mining: Inleiding

Data Mining: Inleiding Data Mining: Inleiding docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining 2II15: Data mining en kennissystemen Lessen: maandag 7de en 8ste uur in Auditorium

Nadere informatie

2WO12: Optimalisering in Netwerken

2WO12: Optimalisering in Netwerken 2WO12: Optimalisering in Netwerken Leo van Iersel Technische Universiteit Eindhoven (TU/E) en Centrum Wiskunde & Informatica (CWI) 27 februari 2014 http://homepages.cwi.nl/~iersel/2wo12/ [email protected]

Nadere informatie

Benaderingsalgoritmen

Benaderingsalgoritmen Benaderingsalgoritmen Eerste hulp bij NP-moeilijkheid 1 Herhaling NP-volledigheid (1) NP: er is een polynomiaal certificaat voor jainstanties dat in polynomiale tijd te controleren is Een probleem A is

Nadere informatie

Figuur 7.21: Het Voronoi diagram van zes supermarkten, genummerd 1 t/m 6.

Figuur 7.21: Het Voronoi diagram van zes supermarkten, genummerd 1 t/m 6. Samenvatting. Voronoi diagrammen. Stel je alle supermarkten in een stad voor. De stad is te verdelen in sectoren door naar de dichtstbijzijnde supermarkt te kijken: alle mensen die wonen in de sector van

Nadere informatie

Parking Surveillance. foreground/background segmentation - objectherkenning. Examen Beeldverwerking Pieter Vancoillie

Parking Surveillance. foreground/background segmentation - objectherkenning. Examen Beeldverwerking Pieter Vancoillie Parking Surveillance foreground/background segmentation - objectherkenning Examen Beeldverwerking Pieter Vancoillie Doel van het (deel)project Uit beelden van een camera voetgangers, fietsers en auto s

Nadere informatie

Divide & Conquer: Verdeel en Heers vervolg. Algoritmiek

Divide & Conquer: Verdeel en Heers vervolg. Algoritmiek Divide & Conquer: Verdeel en Heers vervolg Algoritmiek Algoritmische technieken Vorige keer: Divide and conquer techniek Aantal toepassingen van de techniek Analyse met Master theorem en substitutie Vandaag:

Nadere informatie

Tentamen combinatorische optimalisatie Tijd:

Tentamen combinatorische optimalisatie Tijd: Tentamen combinatorische optimalisatie 26-05-2014. Tijd: 9.00-11.30 Tentamen is met gesloten boek. Beschrijf bij elke opgave steeds het belangrijkste idee. Notatie en exacte formulering is van minder belang.

Nadere informatie

3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625.

3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625. 3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625. Absolute verandering = Aantal 2004 Aantal 1994 = 1625 3070 = -1445 Relatieve verandering = Nieuw Oud Aantal

Nadere informatie

SQL Aantekeningen 3. Maarten de Rijke [email protected]. 22 mei 2003

SQL Aantekeningen 3. Maarten de Rijke mdr@science.uva.nl. 22 mei 2003 SQL Aantekeningen 3 Maarten de Rijke [email protected] 22 mei 2003 Samenvatting In deze aflevering: het selecteren van tuples, operaties op strings, en aggregatie functies. Verder kijken we naar iets

Nadere informatie

Omtrent het begrip cluster is er geen eenduidige consistente definitie beschikbaar.

Omtrent het begrip cluster is er geen eenduidige consistente definitie beschikbaar. Clusteranalyse - E. Omey - AJ 2006-2007 1 Clusteranalyse E. Omey 1. Inleiding In verschillende sociale, politieke en ecnomische systemen zoals onderwijs en overheid en bedrijfswereld kunnen we structuren

Nadere informatie

Data Mining: similariteit en visuele data exploratie

Data Mining: similariteit en visuele data exploratie Data Mining: similariteit en visuele data exploratie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht: wat zagen we vorige les? Data karakteristieken

Nadere informatie

Recommender Systems voor het realtime aanbieden van nieuwssecties. Thomas Janssen

Recommender Systems voor het realtime aanbieden van nieuwssecties. Thomas Janssen Recommender Systems voor het realtime aanbieden van nieuwssecties Thomas Janssen 23 januari 2007 1 Voorwoord Deze scriptie is geschreven ter afsluiting van mijn Bachelor voor de studie Informatica aan

Nadere informatie

Functies deel 1. Vijfde college

Functies deel 1. Vijfde college 3 Functies deel 1 Vijfde college 1 Ch.3 Functions and Algorithms Hoofdstuk 3 uit Schaum gaat over functies en algoritmen. Het gedeelte over algoritmen ( 3.8 en 3.9) komt uitgebreid aan de orde bij toekomstige

Nadere informatie

Import N@Tschool! via NatSync. Presentatie René Merx School voor de Toekomst

Import N@Tschool! via NatSync. Presentatie René Merx School voor de Toekomst Import N@Tschool! via NatSync Presentatie René Merx School voor de Toekomst Samenvatting N@TSchool accounts, groepen en memberships IMS Global N@TConnect NatSync Configuratiebestand Verdere ontwikkelingen

Nadere informatie

WETENSCHAPPEN Oefeningen. LES 2 - Gebogen vlak op basis van een wiskundig bepaalde curve in Grasshopper. Tobias Labarque Rinus Roelofs Matthias Dziwak

WETENSCHAPPEN Oefeningen. LES 2 - Gebogen vlak op basis van een wiskundig bepaalde curve in Grasshopper. Tobias Labarque Rinus Roelofs Matthias Dziwak WETENSCHAPPEN Oefeningen LES 2 - Gebogen vlak op basis van een wiskundig bepaalde curve in Grasshopper Tobias Labarque Rinus Roelofs Matthias Dziwak STAP 1 : Panel Opmerking : je hoeft het Panel blok niet

Nadere informatie

Kettingbreuken. 20 april 2010 1 K + 1 E + 1 T + 1 T + 1 I + 1 N + 1 G + 1 B + 1 R + 1 E + 1 U + 1 K + E + 1 N 1 2 + 1 0 + 1 A + 1 P + 1 R + 1 I + 1

Kettingbreuken. 20 april 2010 1 K + 1 E + 1 T + 1 T + 1 I + 1 N + 1 G + 1 B + 1 R + 1 E + 1 U + 1 K + E + 1 N 1 2 + 1 0 + 1 A + 1 P + 1 R + 1 I + 1 Kettingbreuken Frédéric Guffens 0 april 00 K + E + T + T + I + N + G + B + R + E + U + K + E + N 0 + A + P + R + I + L + 0 + + 0 Wat zijn Kettingbreuken? Een kettingbreuk is een wiskundige uitdrukking

Nadere informatie

Software Processen. Ian Sommerville 2004 Software Engineering, 7th edition. Chapter 4 Slide 1. Het software proces

Software Processen. Ian Sommerville 2004 Software Engineering, 7th edition. Chapter 4 Slide 1. Het software proces Software Processen Ian Sommerville 2004 Software Engineering, 7th edition. Chapter 4 Slide 1 Het software proces Een gestructureerd set van activiteiten nodig om een software systeem te ontwikkelen Specificatie;

Nadere informatie

Rekenen: Meten groep 4 en hoger. Het leren van simpele weegopdrachten.

Rekenen: Meten groep 4 en hoger. Het leren van simpele weegopdrachten. Activiteit 7 Lichtste en zwaarste Sorteer algoritmes Samenvatting Computers worden vaak gebruikt om lijsten in een bepaalde volgorde te zetten, bijvoorbeeld namen in alfabetische volgorde, e-mails of afspraken

Nadere informatie

4orange Connect. 4orange, 2015. Hogehilweg 24 1101 CD Amsterdam Zuidoost www.4orange.nl

4orange Connect. 4orange, 2015. Hogehilweg 24 1101 CD Amsterdam Zuidoost www.4orange.nl 4orange Connect 4orange, 2015 Hogehilweg 24 1101 CD Amsterdam Zuidoost www.4orange.nl 2 Inhoud Inhoud... 2 1. Achtergrond... 3 2) Browsen... 4 3) Scheduler... 4 4) Frequenties en kruistabellen... 4 5)

Nadere informatie

Extra opgaven hoofdstuk 11

Extra opgaven hoofdstuk 11 Extra opgaven hoofdstuk Opgave Van een landbouwbedrijf zijn de input- en outputrelaties in onderstaande tabel weergegeven. We veronderstellen dat alleen de productiefactor arbeid varieert. Verder is gegeven

Nadere informatie

REVEALING SPATIAL AND TEMPORAL PATTERNS FROM FLICKR SANDER VAN DER DRIFT

REVEALING SPATIAL AND TEMPORAL PATTERNS FROM FLICKR SANDER VAN DER DRIFT REVEALING SPATIAL AND TEMPORAL PATTERNS FROM FLICKR SANDER VAN DER DRIFT TOENEMENDE ZORGEN OVER TOERISME EEN SELECTIE VAN RECENTE NIEUWS ARTIKELEN Toeristentrekker Amsterdam bezwijkt onder populariteit

Nadere informatie

Werkblad Cabri Jr. Rotaties

Werkblad Cabri Jr. Rotaties Werkblad Cabri Jr. Rotaties Doel Het onderzoeken van de eigenschappen van een rotatie in het platte vlak, in het bijzonder de relatie tussen origineel en beeld. Inleiding Een rotatie is één van de vier

Nadere informatie

Gegevens invullen in HOOFDLETTERS en LEESBAAR, aub. Belgische Olympiades in de Informatica (duur : maximum 1u15)

Gegevens invullen in HOOFDLETTERS en LEESBAAR, aub. Belgische Olympiades in de Informatica (duur : maximum 1u15) OI 2010 Finale 12 Mei 2010 Gegevens invullen in HOOFDLETTERS en LEESBAAR, aub VOORNAAM NAAM :................................................ SCHOOL :............................................................

Nadere informatie

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan

Nadere informatie

Zelftest Inleiding Programmeren

Zelftest Inleiding Programmeren Zelftest Inleiding Programmeren Document: n0824test.fm 22/01/2013 ABIS Training & Consulting P.O. Box 220 B-3000 Leuven Belgium TRAINING & CONSULTING INLEIDING BIJ DE ZELFTEST INLEIDING PROGRAMMEREN Deze

Nadere informatie

VOLG Buitengewoon Input Output

VOLG Buitengewoon Input Output VOLG Buitengewoon Input Output INPUT Welke onderdelen? - Vaste testen : eigen testen, geïmporteerde LVS testen, Testen met resultaat leeftijd, testen met resultaat procent. - AVI - AVI Cito - Sociogram

Nadere informatie

2.9 Het adolescentieonderzoek 69 2.10 Opgaven 72

2.9 Het adolescentieonderzoek 69 2.10 Opgaven 72 Inhoud Hoofdstuk 1 Design en analyse 11 1.1 Specificatie van designs 13 1.2 Definities 14 1.3 Het verschil tussen een afhankelijke variabele en een niveau van een within-subjectfactor 19 1.4 Kiezen van

Nadere informatie

Hoofdstuk 13: Sorteren & Filteren* 2010

Hoofdstuk 13: Sorteren & Filteren* 2010 Hoofdstuk 13: Sorteren & Filteren* 2010 13.0 Inleiding Spreadsheets bieden meer grip op gegevens. De twee beste manieren om meer grip te krijgen, is door de gegevens te sorteren of door bepaalde waarden

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

IQ4E Roadshow. Presentatie. Resilient. Conformity to Guidelines. & Standards

IQ4E Roadshow. Presentatie. Resilient. Conformity to Guidelines. & Standards IQ4E Roadshow Resilient Conformity to Guidelines Presentatie & Standards KLAAR VOOR WIJZIGINGEN FLEXIBEL KLEINE AFMETINGEN SOFT ADRESSING UITBREIDBAAR MAKKELIJK TOEPASBAAR SCHAALBAAR TOEGEVOEGDE WAARDE

Nadere informatie

Oefening 4.3. Zoek een positief natuurlijk getal zodanig dat de helft een kwadraat is, een derde is een derdemacht en een vijfde is een vijfdemacht.

Oefening 4.3. Zoek een positief natuurlijk getal zodanig dat de helft een kwadraat is, een derde is een derdemacht en een vijfde is een vijfdemacht. 4 Modulair rekenen Oefening 4.1. Merk op dat 2 5 9 2 = 2592. Bestaat er een ander getal van de vorm 25ab dat gelijk is aan 2 5 a b? (Met 25ab bedoelen we een getal waarvan a het cijfer voor de tientallen

Nadere informatie

Opfrisdocument elektronische aangifte

Opfrisdocument elektronische aangifte Opfrisdocument elektronische aangifte Inleiding: Omdat wij regelmatig vragen krijgen over de elektronische aangifte, hebben wij e.e.a. maar eens voor u op een rijtje gezet. Uitgangspunt van dit document

Nadere informatie

Programmeren A. Genetisch Programma voor het Partitie Probleem. begeleiding:

Programmeren A. Genetisch Programma voor het Partitie Probleem. begeleiding: Programmeren A Genetisch Programma voor het Partitie Probleem begeleiding: Inleiding Het Partitie Probleem luidt als volgt: Gegeven een verzameling van n positieve integers, vindt twee disjuncte deelverzamelingen

Nadere informatie

Stochastic Approximation: Sturen in een veranderende wereld

Stochastic Approximation: Sturen in een veranderende wereld Stochastic Approximation: Sturen in een veranderende wereld Rianne Lurvink BWI werkstuk Begeleider: Sandjai Bhulai vrije Universiteit amsterdam Faculteit der Exacte Wetenschappen Studierichting Bedrijfswiskunde

Nadere informatie

Les 1: de normale distributie

Les 1: de normale distributie Les 1: de normale distributie Elke Debrie 1 Statistiek 2 e Bachelor in de Biomedische Wetenschappen 18 oktober 2018 1 Met dank aan Koen Van den Berge Indeling lessen Elke bullet point is een week. R en

Nadere informatie

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel. Opdracht 2a ----------- Stamdiagrammen, histogrammen, tijdreeksgrafieken De Old Farmers Almanac vermeldt de groeiseizoenen voor de grote steden in de V.S., zoals gerapporteerd door het National Climatic

Nadere informatie

Data-analyse in de praktijk D E T O E PA S S I N G B I J V I S S E R & V I S S E R A C C O U N TA N T S - B E L A S T I N G A D V I S E U R S

Data-analyse in de praktijk D E T O E PA S S I N G B I J V I S S E R & V I S S E R A C C O U N TA N T S - B E L A S T I N G A D V I S E U R S Data-analyse in de praktijk D E T O E PA S S I N G B I J V I S S E R & V I S S E R A C C O U N TA N T S - B E L A S T I N G A D V I S E U R S Agenda Plaats in de praktijk Toepassing in audit De werkvloer

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Genetische algoritmen in Java met JGAP

Genetische algoritmen in Java met JGAP Genetische algoritmen in Java met JGAP Inleiding JGAP, uitgesproken als "jee-gep", is een framework voor het implementeren van genetische algoritmen en het gebruik ervan in Java. Genetische algoritmen

Nadere informatie

ALGEMENE STATISTIEK VOOR BWI COMPUTEROPGAVEN 2009/2010. A.W. van der Vaart en F. Bijma

ALGEMENE STATISTIEK VOOR BWI COMPUTEROPGAVEN 2009/2010. A.W. van der Vaart en F. Bijma ALGEMENE STATISTIEK VOOR BWI COMPUTEROPGAVEN 2009/2010 A.W. van der Vaart en F. Bijma 1 Algemene Instructies Het programma R is onder Windows beschikbaar. Je kunt R vinden in de lijst met programma s onder

Nadere informatie

Anomaliedetectie en patroonherkenning

Anomaliedetectie en patroonherkenning Digitale overheid van de Toekomst, 28 september 2016 Anomaliedetectie en patroonherkenning binnen de loonaangifteketen Dr. Ralph Foorthuis Voorstelrondje Werkervaring Sr. enterprise architect bij UWV Werkzaam

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19 Stochastiek 2 Inleiding in de Mathematische Statistiek 1/19 Herhaling H.1 2/19 Mathematische Statistiek We beschouwen de beschikbare data als realisatie(s) van een stochastische grootheid X.(Vaak een vector

Nadere informatie

DEC SDR DSP project 2017 (2)

DEC SDR DSP project 2017 (2) DEC SDR DSP project 2017 (2) Inhoud: DSP software en rekenen Effect van type getallen (integer, float) Fundamenten onder DSP Lezen van eenvoudige DSP formules x[n] Lineariteit ( x functie y dus k maal

Nadere informatie

Getallensystemen, verzamelingen en relaties

Getallensystemen, verzamelingen en relaties Hoofdstuk 1 Getallensystemen, verzamelingen en relaties 1.1 Getallensystemen 1.1.1 De natuurlijke getallen N = {0, 1, 2, 3,...} N 0 = {1, 2, 3,...} 1.1.2 De gehele getallen Z = {..., 4, 3, 2, 1, 0, 1,

Nadere informatie

NBB.Stat Jaarrekeningen. Gebruikershandleiding Statistieken uit de jaarrekeningen (Balanscentrale)

NBB.Stat Jaarrekeningen. Gebruikershandleiding Statistieken uit de jaarrekeningen (Balanscentrale) NBB.Stat Jaarrekeningen Gebruikershandleiding Statistieken uit de jaarrekeningen (Balanscentrale) NBB.Stat Gebruikershandleiding Statistieken uit de jaarrekeningen (Balanscentrale) 2. Inhoudsopgave 1 INLEIDING...

Nadere informatie

SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014

SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014 SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014 Huidig kennis- en ervaringsniveau?????? Beginners Gevorderden 2 Inhoud 1. Wat doe

Nadere informatie

Recognition and Detection of Objects Using Visual and Textual Cues S. Karaoğlu

Recognition and Detection of Objects Using Visual and Textual Cues S. Karaoğlu Recognition and Detection of Objects Using Visual and Textual Cues S. Karaoğlu Samenvatting Met dit proefschrift richten we onze aandacht op object herkenning en detectie voor een beter begrip in afbeeldingen.

Nadere informatie

Data mining Van boodschappenmandjes tot bio-informatica

Data mining Van boodschappenmandjes tot bio-informatica Data mining Van boodschappenmandjes tot bio-informatica Walter Kosters Informatica, Universiteit Leiden donderdag 6 april 2006 http://www.liacs.nl/home/kosters/ 1 Wat is Data mining? Data mining probeert

Nadere informatie

Helden van de wiskunde: L.E.J. Brouwer Brouwers visie vanuit een logica-informatica perspectief

Helden van de wiskunde: L.E.J. Brouwer Brouwers visie vanuit een logica-informatica perspectief Helden van de wiskunde: L.E.J. Brouwer Brouwers visie vanuit een logica-informatica perspectief Herman Geuvers Radboud Universiteit Nijmegen Technische Universiteit Eindhoven 1 Helden van de wiskunde:

Nadere informatie

Uitleg van de Hough transformatie

Uitleg van de Hough transformatie Uitleg van de Hough transformatie Maarten M. Fokkinga, Joeri van Ruth Database groep, Fac. EWI, Universiteit Twente Versie van 17 mei 2005, 10:59 De Hough transformatie is een wiskundige techniek om een

Nadere informatie

Elliptische krommen en digitale handtekeningen in Bitcoin

Elliptische krommen en digitale handtekeningen in Bitcoin Elliptische krommen en digitale handtekeningen in Bitcoin Bas Edixhoven Universiteit Leiden KNAW Bitcoin symposium Deze aantekeningen zal ik op mijn homepage plaatsen. Bas Edixhoven (Universiteit Leiden)

Nadere informatie

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen Opdracht 3a ----------- Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen Voor de meting van de leesvaardigheid van kinderen wordt als

Nadere informatie

Pythoncursus. week 2. cs.ru.nl/pythoncursus

Pythoncursus. week 2. cs.ru.nl/pythoncursus Pythoncursus week 2 Algoritmes Een algoritme is een eindige reeks instructies die vanuit een gegeven begintoestand naar een beoogd doel leiden. - Wikipedia Een probleem stapsgewijs oplossen While-loops

Nadere informatie

Gegevens invullen in HOOFDLETTERS en LEESBAAR, aub. Belgische Olympiades in de Informatica (duur : maximum 1u15 )

Gegevens invullen in HOOFDLETTERS en LEESBAAR, aub. Belgische Olympiades in de Informatica (duur : maximum 1u15 ) OI 2010 Finale 12 Mei 2010 Gegevens invullen in HOOFDLETTERS en LEESBAAR, aub VOORNAAM :....................................................... NAAM :..............................................................

Nadere informatie

Sampling Raster Data using Points or Polygons

Sampling Raster Data using Points or Polygons Sampling Raster Data using Points or Polygons QGIS Tutorials and Tips Author Ujaval Gandhi http://google.com/+ujavalgandhi Translations by Dick Groskamp This work is licensed under a Creative Commons Attribution

Nadere informatie

waarin u gegevens in verschillende het wel goed doen Internet Opleidingscentrum

waarin u gegevens in verschillende het wel goed doen Internet Opleidingscentrum 8 Kruistabellen 8.1 Inleiding Stel dat u een rapport wilt maken dat het aantal verkochte producten per provincie laat zien. u kunt dan een rapport maken waarin u gegevens groepeert per provincie en/of

Nadere informatie

Customer Insights Center & VODW onderzoeksrapport CIC 2. Wat is Customer Intelligence (CI) en wat is het belang daarvan?

Customer Insights Center & VODW onderzoeksrapport CIC 2. Wat is Customer Intelligence (CI) en wat is het belang daarvan? Competing on analytics Status quo van Customer Intelligence in Nederland Prof.dr. P.C. Verhoef Prof.dr. J.C. Hoekstra Dr. H. van der Scheer Met ondersteuning van L. de Vries In samenwerking met VODW Marketing

Nadere informatie

RISICOANALYSE IN RELATIE MET PL EN SIL

RISICOANALYSE IN RELATIE MET PL EN SIL RISICOANALYSE IN RELATIE MET PL EN SIL Gijsbert Heenck Functional Safety Engineer 20 september 2017 Practical Safety Event 1 20 september 2017 Practical Safety Event 2 RISICOBEOORDELING EEN PLICHT 20 september

Nadere informatie

Nascholing Algoritmisch Denken. Martin Bruggink Renske Smetsers

Nascholing Algoritmisch Denken. Martin Bruggink Renske Smetsers Nascholing Algoritmisch Denken Martin Bruggink Renske Smetsers Speerpunten bijeenkomst #2 Praktische bijeenkomst Hele ontwikkelcyclus doorlopen Algoritme ontwerpen Flowchart Code Reflectie Programma tweede

Nadere informatie

3. Structuren in de taal

3. Structuren in de taal 3. Structuren in de taal In dit hoofdstuk behandelen we de belangrijkst econtrolestructuren die in de algoritmiek gebruikt worden. Dit zijn o.a. de opeenvolging, selectie en lussen (herhaling). Vóór we

Nadere informatie

bovenaanzicht zijaanzicht vooraanzicht origineel

bovenaanzicht zijaanzicht vooraanzicht origineel Buigen Mesh; Buigen bovenaanzicht zijaanzicht vooraanzicht origineel De buigfunctie kan alleen toegepast worden op vormen en meshes. Om andere objecten te kunnen buigen, dan moet men deze zodanig de-groeperen

Nadere informatie

Nut en Noodzaak van impact meting 21 september 2010

Nut en Noodzaak van impact meting 21 september 2010 Nut en Noodzaak van impact meting 21 september 2010 Dr. Karen Maas Impactmeting Er wordt heel veel over gesproken, zowel in bedrijfsleven als bij overheden, NGO s en NPO s. Veel discussie: nut en noodzaak

Nadere informatie

Operationaliseren van variabelen (abstracte begrippen)

Operationaliseren van variabelen (abstracte begrippen) Operationaliseren van variabelen (abstracte begrippen) Tabel 1, schematisch overzicht van abstracte begrippen, variabelen, dimensies, indicatoren en items. (Voorbeeld is ontleend aan de masterscriptie

Nadere informatie