Data Mining: Clustering
|
|
|
- Janne Coppens
- 9 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Data Mining: Clustering docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Wat is clustering? Het onderverdelen van de objecten in een database in homogene groepen. Input: Relatie R(A,, A n ) Output: { C,, C n } met C,, C n R Criterium: Gelijkenis binnen groep is groter dan gelijkenis tussen objecten van verschillende groepen.
2 Wat is clustering? Intra-cluster afstanden minimaliseren Inter-cluster afstanden maimaliseren Toepassingen van cluster analse Begrijpen Groepeer gerelateerde documenten, genen, stocks, Samenvatten 4 Reduceer de grootte van de dataset; individuele punten worden samengevat door hun cluster Discovered Clusters Applied-Matl-DOWN,Ba-Network-Down,-COM-DOWN, Cabletron-Ss-DOWN,CISCO-DOWN,HP-DOWN, DSC-Comm-DOWN,INTEL-DOWN,LSI-Logic-DOWN, Micron-Tech-DOWN,Teas-Inst-Down,Tellabs-Inc-Down, Natl-Semiconduct-DOWN,Oracl-DOWN,SGI-DOWN, Sun-DOWN Apple-Comp-DOWN,Autodesk-DOWN,DEC-DOWN, ADV-Micro-Device-DOWN,Andrew-Corp-DOWN, Computer-Assoc-DOWN,Circuit-Cit-DOWN, Compaq-DOWN, EMC-Corp-DOWN, Gen-Inst-DOWN, Motorola-DOWN,Microsoft-DOWN,Scientific-Atl-DOWN Fannie-Mae-DOWN,Fed-Home-Loan-DOWN, MBNA-Corp-DOWN,Morgan-Stanle-DOWN Baker-Hughes-UP,Dresser-Inds-UP,Halliburton-HLD-UP, Louisiana-Land-UP,Phillips-Petro-UP,Unocal-UP, Schlumberger-UP Industr Group Technolog-DOWN Technolog-DOWN Financial-DOWN Oil-UP Clusters van neerslag in Australia
3 Notie Cluster is vaak ambigu Hoeveel clusters? 6? Of? Misschien 4? Tpes van clusterings Een clustering is een verzameling clusters Hiërarchische en partitionele clusterings. { C,, C n } is een Partitional Clustering: C i C j = {} voor alle i < j n Hiërarchische clustering: C i C j = {} of C i C j = C i of C i C j = C j voor alle i < j n
4 Partitionele Clustering Originele punten Partitionele clustering Hiërarchische Clustering p p p p4 p p p p4 Traditionele Hiërarchische Clustering Traditioneel Dendrogram p p p p4 p p p p4 Niet-traditionele Hiërarchische Clustering Niet-traditioneel Dendrogram
5 Clustering Algoritmes K-means en varianten Densit-based clusterings Hierarchische clusterings K-means Clustering Partitionele clustering benadering Elke cluster wordt geassocieerd met een centroid (centraal punt) Elk punt gaat naar de cluster met de dichtstbijzijnde centroid Aantal clusters K moet vooraf gespecifieerd worden
6 K-Means Clustering Veronderstelling: We hebben een afstandsmaat op D en we kunnen van een verzameling punten S het centrum bepalen centroid(s). Input: constante K, database D, afstandsmaat d Output: Partitie {C,, C K } van D zodanig dat: i {,, K}: C i : j {,, K}: i j d(,centroid(c i )) d(, centroid(c j )) (Elk punt is dichter bij z n eigen centroid dan bij elke andere centroid) K-Means Clustering
7 K-means: Voorbeeld Iteration K-means: Voorbeeld Iteration Iteration Iteration Iteration 4 Iteration 5 Iteration
8 Belang van een goede keuze van de initiële centroids.5 Originele Punten Optimale Clustering Sub-optimale Clustering Belang van een goede keuze van de initiële centroids Iteration
9 Belang van een goede keuze van de initiële centroids Iteration Iteration Iteration Iteration 4 Iteration Problemen bij de selectie van initiële pntn Als er K echte clusters zijn, is de kans relatief klein dat we in elke echte cluster een punt hebben: Als alle echte clusters grootte n hebben: Bijvoorbeeld, als K =, dan is de kans slechts =!/ =.6 (!!) Soms komt dit nog goed tijdens het algoritme, soms ook niet.
10 Oplossingen voor dit probleem Meerdere runs Helpt, maar de kansen zijn erg laag Gebruik ander algoritme om clusters te vinden en gebruik deze als input voor K-means Selecteer meer dan K initiele centroids Selecteer achteraf de verst van elkaar gelegen clusters Postprocessing Beperkingen van K-means K-means heeft problemen als de clusters te erg verschillen qua grootte de clusters te erg verschillen qua densiteit De clusters geen bolvorm hebben De data outliers bevat De dimensionaliteit van de data hoog is
11 Beperkingen: verschillende groottes Originele punten K-means ( Clusters) Beperkingen: verschillende densiteit Originele punten K-means ( Clusters)
12 Beperkingen: geen bolvorm Originele punten K-means ( Clusters) Oplossingen voor de beperkingen Originele punten K-means Clustering Een oplossing is K veel groter nemen dan het veronderstelde aantal clusters Achteraf worden dicht bij elkaar gelegen clusters samengevoegd
13 Oplossingen voor de beperkingen Originele punten K-means Clustering Oplossingen voor de beperkingen Originele punten K-means Clustering
14 Clustering Algoritmes K-means en varianten Densit-based clusterings Hiërarchische clusterings Densit-based clustering
15 Densit-based clustering DBSCAN DBSCAN is hierop gebaseerd Input: een afstandsmaat d een dataset D Getallen µ en ε Output: Een partitionering { C,, C n } van D zodat: Voor alle punten, die voldoen aan volgende voorwaarde geldt dat ze in dezelfde cluster zitten: { z d(,z) ε } µ en { z d(,z) ε } µ en d(,) ε
16 Densit-based clustering: DBSCAN ε -densiteit van een punt = aantal punten binnen straal ε Een punt is een (ε, µ) -core punt indien er meer dan µ punten zijn binnen een straal ε Een (ε, µ) -border punt heeft minder dan µ punten binnen straal ε, maar ligt binnen een straal ε van ten minste een core punt Alle andere punten worden ruis punten genoemd. Densit-based clustering: DBSCAN Een punt is (ε, µ)-densit-reachable vanuit punt indien er een sequentie c,, c k van (ε,µ)-core punten bestaat zodanig dat: d(,c ) ε i {,, n-} : d(c i,c i+ ) ε d(c n,) ε Opmerking: berekening van alle paren (,) zodat (ε, µ)-densit-reachable vanuit een core punt = berekenen van transitieve afsluiting.
17 DBSCAN: Core, Border, en Ruis Punten DBSCAN Algorithm. Elimineer de ruis punten. i=. Zolang er core punten zijn die nog niet aan een cluster zijn toegekend: Neem een willekeurig nog niet toegekend core point c C i = { is (ε,µ)- densit reachable vanuit c, is nog niet toegekend} i := i+ 4. Return { C,, C i- }
18 Voorbeeld: DBSCAN Eerste punt wordt geselecteerd Alle punten die densitreachable zijn worden aan de cluster toegevoegd Tweede selectie Tweede cluster wordt gevormd Derde selectie en constructie van de cluster DBSCAN: Core, Border and Noise Points Originele punten Punt tpes: core, border en noise ε =, µ = 4
19 Waneer werkt DBSCAN goed? Originele punten Clustering Resistent voor ruis Kan clusters met verschillende vormen en groottes aan Wanneer werkt DBSCAN niet goed? Originele punten (µ =4, ε = 9.75) Variërende densiteit Hoog dimensionele data (µ =4, ε = 9.9)
20 DBSCAN: Bepalen van ε en µ Voor punten binnen een cluster is de afstand tot hun k-de buur ongeveer gelijk Ruis punten hebben hun k-de buur op veel grotere afstand Dus, plot de cumulatieve distributie van de afstand tussen alle punten en hun k-de buur. DBSCAN: Bepalen van ε en µ
21 Conclusies Clustering is het onderverdelen van de objecten in een database in homogene groepen Notie van een cluster is ambigu Twee partitieve algoritmes K-Means DBSCAN Conclusies K-Means Aantal clusters K gegeven Elk punt ligt dichter bij z n eigen cluster center dan bij de centra van de andere clusters DBSCAN Gebaseerd op dichtheid Twee punten op korte afstand in dichtbevolkt gebied moeten tot dezelfde cluster behoren Aantal clusters niet op voorhand bepaald Clustering-algoritmes scoren slecht in hoogdimensionele data
Data Mining: Classificatie
Data Mining: Classificatie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht Wat is classificatie? Leren van een beslissingsboom. Problemen
Data Mining: Data kwaliteit, Preprocessing
Data Mining: Data kwaliteit, Preprocessing docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Herhaling: definitie Data Mining is: Extractie van interessante
Uitwerking Tentamen Datamining (2II15) 26/06/09
Uitwerking Tentamen Datamining (2II15) 26/06/09 1. (3p) (Clustering) Welke van de volgende uitspraken zijn correct? Voor de correcte uitspraken: leg uit, voor de incorrecte: geef een tegenvoorbeeld. (a)
2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren.
1. Veronderstel dat je als datamining consultant werkt voor een Internet Search Engine bedrijf. Beschrijf hoe datamining het bedrijf kan helpen door voorbeelden te geven van specifieke toepassingen van
Classification - Prediction
Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training
Inleiding Adaptieve Systemen Hoofdstuk 5: Ongesuperviseerd Leren
Inleiding Adaptieve Systemen Hoofdstuk 5: Ongesuperviseerd Leren Cursusjaar 2017-2018 Gerard Vreeswijk β-faculteit, Departement Informatica en Informatiekunde, Leerstoelgroep Intelligente Systemen 21 maart
Oplossingen Datamining 2II15 Juni 2008
Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:
d(w j, x i ) d(w l, x i ) Voorbeeld
Transparanten bij het vak Inleiding Adaptieve Systemen: Unsupervised Leren/ Self organizing networks. M. Wiering Unsupervised Learning en Self Organizing Networks Leerdoelen: Weten wat unsupervised learning
Mogelijkheden en keuzes bij het clusteren van onderwijsdata
1 Mogelijkheden en keuzes bij het clusteren van onderwijsdata Hanneke van der Hoef Matthijs J Warrens ORD Nijmegen 14 juni 2018 2 Mogelijkheden en keuzes bij het clusteren van onderwijsdata Overzicht Clusteranalyse
Tentamen Data Mining. Algemene Opmerkingen. Opgave L. Korte vragen (L6 punten) Tijd: 14:00-17:00. Datum: 4januai20l6
Tentamen Data Mining Datum: 4januai2l6 Tijd: 4: - 7: Algemene Opmerkingen e Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. o Laat bij het uitvoeren van berekeningen zien hoeje
Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation.
Cover Page The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Author: Witsenburg, Tijn Title: Hybrid similarities : a method to insert relational information
Tentamen Data Mining
Tentamen Data Mining Algemene Opmerkingen Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. Laat bij het uitvoeren van berekeningen zien hoe je aan een antwoord gekomen bent.
Inleiding Adaptieve Systemen Hoofdstuk 5: Ongesuperviseerd Leren
Inleiding Adaptieve Systemen Hoofdstuk 5: Ongesuperviseerd Leren Cursusjaar 2014-2015 Gerard Vreeswijk β-faculteit, Departement Informatica en Informatiekunde, Leerstoelgroep Intelligente Systemen 17 juni
twee partijen zijn. Aangezien het bij data mining gaat om grote hoeveelheden data is het belangrijk om praktische oplossingen te hebben.
Samenvatting Deze thesis handelt over privacy preserving data mining. Data mining is een tak van de wetenschap waarin men grote hoeveelheden data onderzoekt met de bedoeling er bepaalde patronen in te
Data Mining: Classificatie
Data Mining: lassificatie docent: dr. Toon alders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Vorige les lassificatie: Het groeperen van objecten in voorgedefinieerde
Data Mining: Inleiding
Data Mining: Inleiding docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining 2II15: Data mining en kennissystemen Lessen: maandag 7de en 8ste uur in Auditorium
2WO12: Optimalisering in Netwerken
2WO12: Optimalisering in Netwerken Leo van Iersel Technische Universiteit Eindhoven (TU/E) en Centrum Wiskunde & Informatica (CWI) 27 februari 2014 http://homepages.cwi.nl/~iersel/2wo12/ [email protected]
Benaderingsalgoritmen
Benaderingsalgoritmen Eerste hulp bij NP-moeilijkheid 1 Herhaling NP-volledigheid (1) NP: er is een polynomiaal certificaat voor jainstanties dat in polynomiale tijd te controleren is Een probleem A is
Figuur 7.21: Het Voronoi diagram van zes supermarkten, genummerd 1 t/m 6.
Samenvatting. Voronoi diagrammen. Stel je alle supermarkten in een stad voor. De stad is te verdelen in sectoren door naar de dichtstbijzijnde supermarkt te kijken: alle mensen die wonen in de sector van
Parking Surveillance. foreground/background segmentation - objectherkenning. Examen Beeldverwerking Pieter Vancoillie
Parking Surveillance foreground/background segmentation - objectherkenning Examen Beeldverwerking Pieter Vancoillie Doel van het (deel)project Uit beelden van een camera voetgangers, fietsers en auto s
Divide & Conquer: Verdeel en Heers vervolg. Algoritmiek
Divide & Conquer: Verdeel en Heers vervolg Algoritmiek Algoritmische technieken Vorige keer: Divide and conquer techniek Aantal toepassingen van de techniek Analyse met Master theorem en substitutie Vandaag:
Tentamen combinatorische optimalisatie Tijd:
Tentamen combinatorische optimalisatie 26-05-2014. Tijd: 9.00-11.30 Tentamen is met gesloten boek. Beschrijf bij elke opgave steeds het belangrijkste idee. Notatie en exacte formulering is van minder belang.
3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625.
3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625. Absolute verandering = Aantal 2004 Aantal 1994 = 1625 3070 = -1445 Relatieve verandering = Nieuw Oud Aantal
SQL Aantekeningen 3. Maarten de Rijke [email protected]. 22 mei 2003
SQL Aantekeningen 3 Maarten de Rijke [email protected] 22 mei 2003 Samenvatting In deze aflevering: het selecteren van tuples, operaties op strings, en aggregatie functies. Verder kijken we naar iets
Omtrent het begrip cluster is er geen eenduidige consistente definitie beschikbaar.
Clusteranalyse - E. Omey - AJ 2006-2007 1 Clusteranalyse E. Omey 1. Inleiding In verschillende sociale, politieke en ecnomische systemen zoals onderwijs en overheid en bedrijfswereld kunnen we structuren
Data Mining: similariteit en visuele data exploratie
Data Mining: similariteit en visuele data exploratie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht: wat zagen we vorige les? Data karakteristieken
Recommender Systems voor het realtime aanbieden van nieuwssecties. Thomas Janssen
Recommender Systems voor het realtime aanbieden van nieuwssecties Thomas Janssen 23 januari 2007 1 Voorwoord Deze scriptie is geschreven ter afsluiting van mijn Bachelor voor de studie Informatica aan
Functies deel 1. Vijfde college
3 Functies deel 1 Vijfde college 1 Ch.3 Functions and Algorithms Hoofdstuk 3 uit Schaum gaat over functies en algoritmen. Het gedeelte over algoritmen ( 3.8 en 3.9) komt uitgebreid aan de orde bij toekomstige
Import N@Tschool! via NatSync. Presentatie René Merx School voor de Toekomst
Import N@Tschool! via NatSync Presentatie René Merx School voor de Toekomst Samenvatting N@TSchool accounts, groepen en memberships IMS Global N@TConnect NatSync Configuratiebestand Verdere ontwikkelingen
WETENSCHAPPEN Oefeningen. LES 2 - Gebogen vlak op basis van een wiskundig bepaalde curve in Grasshopper. Tobias Labarque Rinus Roelofs Matthias Dziwak
WETENSCHAPPEN Oefeningen LES 2 - Gebogen vlak op basis van een wiskundig bepaalde curve in Grasshopper Tobias Labarque Rinus Roelofs Matthias Dziwak STAP 1 : Panel Opmerking : je hoeft het Panel blok niet
Kettingbreuken. 20 april 2010 1 K + 1 E + 1 T + 1 T + 1 I + 1 N + 1 G + 1 B + 1 R + 1 E + 1 U + 1 K + E + 1 N 1 2 + 1 0 + 1 A + 1 P + 1 R + 1 I + 1
Kettingbreuken Frédéric Guffens 0 april 00 K + E + T + T + I + N + G + B + R + E + U + K + E + N 0 + A + P + R + I + L + 0 + + 0 Wat zijn Kettingbreuken? Een kettingbreuk is een wiskundige uitdrukking
Software Processen. Ian Sommerville 2004 Software Engineering, 7th edition. Chapter 4 Slide 1. Het software proces
Software Processen Ian Sommerville 2004 Software Engineering, 7th edition. Chapter 4 Slide 1 Het software proces Een gestructureerd set van activiteiten nodig om een software systeem te ontwikkelen Specificatie;
Rekenen: Meten groep 4 en hoger. Het leren van simpele weegopdrachten.
Activiteit 7 Lichtste en zwaarste Sorteer algoritmes Samenvatting Computers worden vaak gebruikt om lijsten in een bepaalde volgorde te zetten, bijvoorbeeld namen in alfabetische volgorde, e-mails of afspraken
4orange Connect. 4orange, 2015. Hogehilweg 24 1101 CD Amsterdam Zuidoost www.4orange.nl
4orange Connect 4orange, 2015 Hogehilweg 24 1101 CD Amsterdam Zuidoost www.4orange.nl 2 Inhoud Inhoud... 2 1. Achtergrond... 3 2) Browsen... 4 3) Scheduler... 4 4) Frequenties en kruistabellen... 4 5)
Extra opgaven hoofdstuk 11
Extra opgaven hoofdstuk Opgave Van een landbouwbedrijf zijn de input- en outputrelaties in onderstaande tabel weergegeven. We veronderstellen dat alleen de productiefactor arbeid varieert. Verder is gegeven
REVEALING SPATIAL AND TEMPORAL PATTERNS FROM FLICKR SANDER VAN DER DRIFT
REVEALING SPATIAL AND TEMPORAL PATTERNS FROM FLICKR SANDER VAN DER DRIFT TOENEMENDE ZORGEN OVER TOERISME EEN SELECTIE VAN RECENTE NIEUWS ARTIKELEN Toeristentrekker Amsterdam bezwijkt onder populariteit
Werkblad Cabri Jr. Rotaties
Werkblad Cabri Jr. Rotaties Doel Het onderzoeken van de eigenschappen van een rotatie in het platte vlak, in het bijzonder de relatie tussen origineel en beeld. Inleiding Een rotatie is één van de vier
Gegevens invullen in HOOFDLETTERS en LEESBAAR, aub. Belgische Olympiades in de Informatica (duur : maximum 1u15)
OI 2010 Finale 12 Mei 2010 Gegevens invullen in HOOFDLETTERS en LEESBAAR, aub VOORNAAM NAAM :................................................ SCHOOL :............................................................
Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:
Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan
Zelftest Inleiding Programmeren
Zelftest Inleiding Programmeren Document: n0824test.fm 22/01/2013 ABIS Training & Consulting P.O. Box 220 B-3000 Leuven Belgium TRAINING & CONSULTING INLEIDING BIJ DE ZELFTEST INLEIDING PROGRAMMEREN Deze
VOLG Buitengewoon Input Output
VOLG Buitengewoon Input Output INPUT Welke onderdelen? - Vaste testen : eigen testen, geïmporteerde LVS testen, Testen met resultaat leeftijd, testen met resultaat procent. - AVI - AVI Cito - Sociogram
2.9 Het adolescentieonderzoek 69 2.10 Opgaven 72
Inhoud Hoofdstuk 1 Design en analyse 11 1.1 Specificatie van designs 13 1.2 Definities 14 1.3 Het verschil tussen een afhankelijke variabele en een niveau van een within-subjectfactor 19 1.4 Kiezen van
Hoofdstuk 13: Sorteren & Filteren* 2010
Hoofdstuk 13: Sorteren & Filteren* 2010 13.0 Inleiding Spreadsheets bieden meer grip op gegevens. De twee beste manieren om meer grip te krijgen, is door de gegevens te sorteren of door bepaalde waarden
9. Lineaire Regressie en Correlatie
9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)
IQ4E Roadshow. Presentatie. Resilient. Conformity to Guidelines. & Standards
IQ4E Roadshow Resilient Conformity to Guidelines Presentatie & Standards KLAAR VOOR WIJZIGINGEN FLEXIBEL KLEINE AFMETINGEN SOFT ADRESSING UITBREIDBAAR MAKKELIJK TOEPASBAAR SCHAALBAAR TOEGEVOEGDE WAARDE
Oefening 4.3. Zoek een positief natuurlijk getal zodanig dat de helft een kwadraat is, een derde is een derdemacht en een vijfde is een vijfdemacht.
4 Modulair rekenen Oefening 4.1. Merk op dat 2 5 9 2 = 2592. Bestaat er een ander getal van de vorm 25ab dat gelijk is aan 2 5 a b? (Met 25ab bedoelen we een getal waarvan a het cijfer voor de tientallen
Opfrisdocument elektronische aangifte
Opfrisdocument elektronische aangifte Inleiding: Omdat wij regelmatig vragen krijgen over de elektronische aangifte, hebben wij e.e.a. maar eens voor u op een rijtje gezet. Uitgangspunt van dit document
Programmeren A. Genetisch Programma voor het Partitie Probleem. begeleiding:
Programmeren A Genetisch Programma voor het Partitie Probleem begeleiding: Inleiding Het Partitie Probleem luidt als volgt: Gegeven een verzameling van n positieve integers, vindt twee disjuncte deelverzamelingen
Stochastic Approximation: Sturen in een veranderende wereld
Stochastic Approximation: Sturen in een veranderende wereld Rianne Lurvink BWI werkstuk Begeleider: Sandjai Bhulai vrije Universiteit amsterdam Faculteit der Exacte Wetenschappen Studierichting Bedrijfswiskunde
Les 1: de normale distributie
Les 1: de normale distributie Elke Debrie 1 Statistiek 2 e Bachelor in de Biomedische Wetenschappen 18 oktober 2018 1 Met dank aan Koen Van den Berge Indeling lessen Elke bullet point is een week. R en
b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.
Opdracht 2a ----------- Stamdiagrammen, histogrammen, tijdreeksgrafieken De Old Farmers Almanac vermeldt de groeiseizoenen voor de grote steden in de V.S., zoals gerapporteerd door het National Climatic
Data-analyse in de praktijk D E T O E PA S S I N G B I J V I S S E R & V I S S E R A C C O U N TA N T S - B E L A S T I N G A D V I S E U R S
Data-analyse in de praktijk D E T O E PA S S I N G B I J V I S S E R & V I S S E R A C C O U N TA N T S - B E L A S T I N G A D V I S E U R S Agenda Plaats in de praktijk Toepassing in audit De werkvloer
G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing
G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag
Genetische algoritmen in Java met JGAP
Genetische algoritmen in Java met JGAP Inleiding JGAP, uitgesproken als "jee-gep", is een framework voor het implementeren van genetische algoritmen en het gebruik ervan in Java. Genetische algoritmen
ALGEMENE STATISTIEK VOOR BWI COMPUTEROPGAVEN 2009/2010. A.W. van der Vaart en F. Bijma
ALGEMENE STATISTIEK VOOR BWI COMPUTEROPGAVEN 2009/2010 A.W. van der Vaart en F. Bijma 1 Algemene Instructies Het programma R is onder Windows beschikbaar. Je kunt R vinden in de lijst met programma s onder
Anomaliedetectie en patroonherkenning
Digitale overheid van de Toekomst, 28 september 2016 Anomaliedetectie en patroonherkenning binnen de loonaangifteketen Dr. Ralph Foorthuis Voorstelrondje Werkervaring Sr. enterprise architect bij UWV Werkzaam
Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19
Stochastiek 2 Inleiding in de Mathematische Statistiek 1/19 Herhaling H.1 2/19 Mathematische Statistiek We beschouwen de beschikbare data als realisatie(s) van een stochastische grootheid X.(Vaak een vector
DEC SDR DSP project 2017 (2)
DEC SDR DSP project 2017 (2) Inhoud: DSP software en rekenen Effect van type getallen (integer, float) Fundamenten onder DSP Lezen van eenvoudige DSP formules x[n] Lineariteit ( x functie y dus k maal
Getallensystemen, verzamelingen en relaties
Hoofdstuk 1 Getallensystemen, verzamelingen en relaties 1.1 Getallensystemen 1.1.1 De natuurlijke getallen N = {0, 1, 2, 3,...} N 0 = {1, 2, 3,...} 1.1.2 De gehele getallen Z = {..., 4, 3, 2, 1, 0, 1,
NBB.Stat Jaarrekeningen. Gebruikershandleiding Statistieken uit de jaarrekeningen (Balanscentrale)
NBB.Stat Jaarrekeningen Gebruikershandleiding Statistieken uit de jaarrekeningen (Balanscentrale) NBB.Stat Gebruikershandleiding Statistieken uit de jaarrekeningen (Balanscentrale) 2. Inhoudsopgave 1 INLEIDING...
SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014
SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014 Huidig kennis- en ervaringsniveau?????? Beginners Gevorderden 2 Inhoud 1. Wat doe
Recognition and Detection of Objects Using Visual and Textual Cues S. Karaoğlu
Recognition and Detection of Objects Using Visual and Textual Cues S. Karaoğlu Samenvatting Met dit proefschrift richten we onze aandacht op object herkenning en detectie voor een beter begrip in afbeeldingen.
Data mining Van boodschappenmandjes tot bio-informatica
Data mining Van boodschappenmandjes tot bio-informatica Walter Kosters Informatica, Universiteit Leiden donderdag 6 april 2006 http://www.liacs.nl/home/kosters/ 1 Wat is Data mining? Data mining probeert
Helden van de wiskunde: L.E.J. Brouwer Brouwers visie vanuit een logica-informatica perspectief
Helden van de wiskunde: L.E.J. Brouwer Brouwers visie vanuit een logica-informatica perspectief Herman Geuvers Radboud Universiteit Nijmegen Technische Universiteit Eindhoven 1 Helden van de wiskunde:
Uitleg van de Hough transformatie
Uitleg van de Hough transformatie Maarten M. Fokkinga, Joeri van Ruth Database groep, Fac. EWI, Universiteit Twente Versie van 17 mei 2005, 10:59 De Hough transformatie is een wiskundige techniek om een
Elliptische krommen en digitale handtekeningen in Bitcoin
Elliptische krommen en digitale handtekeningen in Bitcoin Bas Edixhoven Universiteit Leiden KNAW Bitcoin symposium Deze aantekeningen zal ik op mijn homepage plaatsen. Bas Edixhoven (Universiteit Leiden)
Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen
Opdracht 3a ----------- Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen Voor de meting van de leesvaardigheid van kinderen wordt als
Pythoncursus. week 2. cs.ru.nl/pythoncursus
Pythoncursus week 2 Algoritmes Een algoritme is een eindige reeks instructies die vanuit een gegeven begintoestand naar een beoogd doel leiden. - Wikipedia Een probleem stapsgewijs oplossen While-loops
Gegevens invullen in HOOFDLETTERS en LEESBAAR, aub. Belgische Olympiades in de Informatica (duur : maximum 1u15 )
OI 2010 Finale 12 Mei 2010 Gegevens invullen in HOOFDLETTERS en LEESBAAR, aub VOORNAAM :....................................................... NAAM :..............................................................
Sampling Raster Data using Points or Polygons
Sampling Raster Data using Points or Polygons QGIS Tutorials and Tips Author Ujaval Gandhi http://google.com/+ujavalgandhi Translations by Dick Groskamp This work is licensed under a Creative Commons Attribution
waarin u gegevens in verschillende het wel goed doen Internet Opleidingscentrum
8 Kruistabellen 8.1 Inleiding Stel dat u een rapport wilt maken dat het aantal verkochte producten per provincie laat zien. u kunt dan een rapport maken waarin u gegevens groepeert per provincie en/of
Customer Insights Center & VODW onderzoeksrapport CIC 2. Wat is Customer Intelligence (CI) en wat is het belang daarvan?
Competing on analytics Status quo van Customer Intelligence in Nederland Prof.dr. P.C. Verhoef Prof.dr. J.C. Hoekstra Dr. H. van der Scheer Met ondersteuning van L. de Vries In samenwerking met VODW Marketing
RISICOANALYSE IN RELATIE MET PL EN SIL
RISICOANALYSE IN RELATIE MET PL EN SIL Gijsbert Heenck Functional Safety Engineer 20 september 2017 Practical Safety Event 1 20 september 2017 Practical Safety Event 2 RISICOBEOORDELING EEN PLICHT 20 september
Nascholing Algoritmisch Denken. Martin Bruggink Renske Smetsers
Nascholing Algoritmisch Denken Martin Bruggink Renske Smetsers Speerpunten bijeenkomst #2 Praktische bijeenkomst Hele ontwikkelcyclus doorlopen Algoritme ontwerpen Flowchart Code Reflectie Programma tweede
3. Structuren in de taal
3. Structuren in de taal In dit hoofdstuk behandelen we de belangrijkst econtrolestructuren die in de algoritmiek gebruikt worden. Dit zijn o.a. de opeenvolging, selectie en lussen (herhaling). Vóór we
bovenaanzicht zijaanzicht vooraanzicht origineel
Buigen Mesh; Buigen bovenaanzicht zijaanzicht vooraanzicht origineel De buigfunctie kan alleen toegepast worden op vormen en meshes. Om andere objecten te kunnen buigen, dan moet men deze zodanig de-groeperen
Nut en Noodzaak van impact meting 21 september 2010
Nut en Noodzaak van impact meting 21 september 2010 Dr. Karen Maas Impactmeting Er wordt heel veel over gesproken, zowel in bedrijfsleven als bij overheden, NGO s en NPO s. Veel discussie: nut en noodzaak
Operationaliseren van variabelen (abstracte begrippen)
Operationaliseren van variabelen (abstracte begrippen) Tabel 1, schematisch overzicht van abstracte begrippen, variabelen, dimensies, indicatoren en items. (Voorbeeld is ontleend aan de masterscriptie
